Probabilidad y Estadística
Short Description
Descripción: Introduccion a Estadistica...
Description
Probabilidad y Estadística Estadística Es un conjunto de métodos para planear estudios y experimentos, obtener datos y luego organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en los datos. [TRIOLA, MARIO F. Estadística. 2009] La Estadística es la ciencia que se encarga de recoger, organizar e interpretar los datos. Es la ciencia de los datos. [GORGAS GARCÍA, Javier. ESTADÍSTICA BÁSICA, 2009] La Estadística es la Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de propiciar la toma de decisiones más eficaz. [LIND DOUGLAS. ESTADÍSTICA APLICADA A LOS NEGOCIOS Y ECONOMÍA, 2008] Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas. [DRAE, 2014] Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades. [DRAE, 2014] En la vida diaria somos bombardeados continuamente por datos estadísticos: encuestas electorales, economía, deportes, datos meteorológicos, calidad de los productos, audiencias de TV. Necesitamos una formación básica en Estadística para evaluar toda esta información. Pero la utilidad de la Estadística va mucho más allá de estos ejemplos. La Estadística es fundamental para muchas ramas de la ciencia desde la medicina a la economía.
Tipos de Estadística La estadística descriptiva está formada por procedimientos empleados para resumir y describir las características importantes de un conjunto de mediciones. La rama de la estadística que presenta técnicas para describir conjuntos de mediciones se denomina estadística descriptiva. Seguramente has visto estadísticas descriptivas en numerosas formas: gráficas de barras, gráficas de pastel y gráficas de líneas presentadas
por un candidato político; tablas numéricas en el periódico; o el promedio de cantidad de lluvia informado por el pronosticador del clima en la televisión local. Las gráficas y resúmenes numéricos generados en computadoras son comunes en nuestra comunicación de todos los días. La estadística inferencial está formada por procedimientos empleados para hacer inferencias acerca de características poblacionales, a partir de información contenida en una muestra sacada de esta población. Si el conjunto de mediciones es toda la población, sólo es necesario sacar conclusiones basadas en la estadística descriptiva. No obstante, podría ser demasiado costoso o llevaría demasiado tiempo enumerar toda la población. Quizá enumerar la población la destruiría. Por éstas y otras razones, quizá sólo se tenga una muestra de la población que, al verla, usted desee contestar preguntas acerca de la población en su conjunto. La rama de la estadística que se ocupa de este problema se llama estadística inferencial. El objetivo de la estadística inferencial es hacer inferencias (es decir, sacar conclusiones, hacer predicciones, tomar decisiones) acerca de las características de una población a partir de información contenida en una muestra.
Estadística descriptiva La aplicación del tratamiento estadístico tiene dos fases fundamentales: 1. Organización y análisis inicial de los datos recogidos. 2. Extracción de conclusiones válidas y toma de decisiones razonables a partir de ellos. Los objetivos de la Estadística Descriptiva son los que se abordan en la primera de estas fases. Es decir, su misión es ordenar, describir y sintetizar la información recogida. En este proceso será necesario establecer medidas cuantitativas que reduzcan a un número manejable de parámetros el conjunto (en general grande) de datos obtenidos. La realización de gráficas (visualización de los datos en diagramas) también forma parte de la Estadística Descriptiva dado que proporciona una manera visual directa de organizar la información. La finalidad de la Estadística Descriptiva no es, entonces, extraer conclusiones generales sobre el fenómeno que ha producido los datos bajo estudio, sino solamente su descripción (de ahí el nombre).
¿Por qué es importante estudiar Estadística? La primera razón consiste en que la información numérica prolifera por todas partes. Revise los periódicos (USA Today), revistas de noticias (Time, Newsweek, U.S. News y World Report), revistas de negocios (BusinessWeek, Forbes), revistas de interés general (People), revistas para mujeres (Ladies, Home Journal o Elle) o revistas deportivas (Sports Illustrated, ESPN The Magazine), y quedará abrumado con la cantidad de información numérica que contienen. Una segunda razón estriba en que las técnicas estadísticas se emplean para tomar decisiones que afectan la vida diaria. Es decir que éstas influyen en su bienestar. Una tercera razón radica en que el conocimiento de sus métodos facilita la comprensión de la forma en que se toman decisiones y proporciona un entendimiento más claro de cómo le afectan. Sin importar el empleo o carrera que vayas a elegir, usted encarará la necesidad de tomar decisiones en las que saber hacer un análisis de datos resultará de utilidad. Con el fin de tomar una decisión informada, será necesario llevar a cabo lo siguiente: 1. Determinar si existe información adecuada o si requiere información adicional. 2. Reunir información adicional, si se necesita, de manera que no se obtengan resultados erróneos. 3. Resumir los datos de manera útil e informativa. 4. Analizar la información disponible. 5. Obtener conclusiones y hacer inferencias al mismo tiempo que se evalúa el riesgo de tomar una decisión incorrecta. En suma, existen por lo menos tres razones para estudiar estadística: 1. Los datos proliferan por todas partes. 2. Las técnicas estadísticas se emplean en la toma de decisiones que influyen en su vida 3. Sin importar la carrera que elijas, tomarás decisiones profesionales que incluyan datos. Una comprensión de los métodos estadísticos permite tomar decisiones con mayor eficacia. “Se cometen muchos menos errores usando datos inadecuados que cuando no se utilizan datos.” Charles Babbage (1792-1871)
Datos Estadísticos y Escalas de Medicion Tipos de datos En la materia de estadística se trata principalmente de utilizar datos muestrales para hacer inferencias sobre una población completa. Debemos saber y entender las definiciones de dato, datos, población, muestra, parámetro y estadístico, ya que son básicas y fundamentales. También necesitamos reconocer la diferencia entre datos cuantitativos y datos cualitativos. Parámetro es una medición numérica que describe algunas características de una población. Ejemplo: En la ciudad de Nueva York hay 3250 botones para caminar, que los peatones emplean en las intersecciones de tránsito. Se descubrió que el 77% de dichos botones no funciona (según datos del artículo “For Exercise in New York Futility, Push Button”, de Michael Luo, New York Times). La cifra del 77% es un parámetro porque está basada en la población de todos los 3250 botones para peatones.
Estadístico es una medición numérica que describe algunas características de una muestra. Ejemplo: Con base en una muestra de 877 ejecutivos encuestados, se encontró que el 45% de ellos no contrataría a alguien con un error ortográfico en su solicitud de empleo. Esta cifra del 45% es un estadístico, ya que está basada en una muestra y no en la población completa de todos los ejecutivos.
Datos son las observaciones recolectadas (como mediciones, géneros, respuestas de encuestas). Algunos conjuntos de datos consisten en números (como alturas de 66 y 72 pulgadas); mientras que otros son no numéricos (como los colores de ojos verde y café). Los términos datos cuantitativos y datos cualitativos suelen utilizarse para distinguir entre ambos tipos.
Variable Estadística Se entiende por variable estadística al símbolo que representa al dato objeto de nuestro estudio de los elementos de la muestra y que puede tomar un conjunto de valores. Las variables cuantitativas consisten en números que representan conteos o mediciones, que cuantifican un elemento de una población. Variable cuantitativa: Los pesos de las supermodelos. La altura o velocidad de un móvil.
Cuando se trabaja con datos cuantitativos, es importante utilizar las unidades de medida apropiadas, como dólares, horas, pies, metros, etcétera. La NASA perdió su Mars Climate Orbiter de $125 millones cuando la sonda se estrelló debido a que el programa de control tenía los datos de aceleración en unidades inglesas, pero ellos incorrectamente consideraron que estaban en unidades métricas. Los datos cualitativos (o categóricos o de atributo) se dividen en diferentes categorías que se distinguen por algunas características no numéricas, son aquellos que no podemos representar numéricamente y describen cualidades, es una variable que clasifica o describe a un elemento de una población Datos cualitativos: El género (hombre/mujer) de atletas profesionales. Uno color o el estado civil de una persona.
En el caso de que estemos tratando con datos cuantitativos, las variables estadísticas pueden clasificarse en: Las variable discretas resultan cuando el número de valores posibles es un número finito o un número que “puede contarse” (es decir, el número de valores posibles es 0, 1, 2, etcétera). Variables discretas: El número de huevos que ponen las gallinas son datos discretos porque representan conteos.
Las variables continuas (numéricas) resultan de un infinito de posibles valores que corresponden a alguna escala continua que cubre un rango de valores sin huecos, interrupciones o saltos. Variables continuas: Las cantidades de leche que producen las vacas son datos continuos porque son mediciones que pueden tomar cualquier valor
dentro de un continuo. Durante un intervalo de tiempo dado, una vaca puede producir 2.343115 galones de leche, porque la vaca no está restringida a cantidades discretas de 0, 1, 2, 3, 4 o 5 galones.
Tipos de variable
Cualitativas
Cuantitativas
- Marca de PC - Estado Civil
Discretras
Continuas
- Color de Cabello
- Hijos de familia - Fueras de lugar en partido de futbol - Aparatos de TV que se poseen
- Monto del Impuesto sobre la Renta - Peso de un estudiante - Altura de arboles en escuela
Niveles de medición (escalas de medición) Los datos se clasifican por niveles de medición. El nivel de medición de los datos rige los cálculos que se llevan a cabo con el fin de resumir y presentar los datos. Existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. La medición más baja, o más primaria, corresponde al nivel nominal. La más alta, o el nivel que proporciona la mayor información relacionada con la observación, es la medición de razón.
Nivel nominal En el caso del nivel nominal de medición, las observaciones acerca de una variable cualitativa sólo se clasifican y cuentan. No existe una forma particular para ordenar las etiquetas. La clasificación de los seis colores de las lunetas de chocolate de leche M&M constituye un ejemplo del nivel nominal de medición. Simplemente se clasifican las lunetas por color. No existe un orden natural. Es decir, no presenta primero las lunetas cafés, las anaranjadas o las de cualquier color. El género representa otro ejemplo del nivel nominal de medición. Suponga que hace un conteo de los estudiantes que entran a un partido de futbol con credencial e informa cuántos son hombres y cuántas mujeres. Podría presentar primero a los hombres o a las mujeres. Para el nivel nominal, la medición consiste en contar. En resumen, los datos de nivel nominal poseen las siguientes propiedades: 1. Las categorías de datos se encuentran representadas por etiquetas o nombres. 2. Aun cuando las etiquetas se codifiquen con números, las categorías de datos no tienen ningún orden lógico. En una variable cualitativa caracteriza (describe o identifica) a un elemento de una población. Para los datos resultantes de una variable nominal, las operaciones aritméticas no sólo carecen de sentido sino que tampoco se puede asignar un orden a las categorías. 1. Sí/no/indeciso: Respuestas de sí, no e indeciso en una encuesta 2. Colores: Los colores de los automóviles conducidos por estudiantes universitarios (rojo, negro, azul, blanco, magenta, púrpura, etcétera)
Puesto que los datos nominales carecen de orden y no tienen un significado numérico, no se deben utilizar para hacer cálculos. En ocasiones se asignan números a las distintas categorías (especialmente cuando los datos se codifican para utilizarse en computadoras), pero estos números no tienen un significado computacional real y cualquier promedio que se calcule carece de sentido.
Nivel ordinal El nivel inmediato superior de datos es el nivel ordinal, representa una posición, o clasificación, ordenada. Las propiedades del nivel ordinal de los datos son las siguientes: 1. Las clasificaciones de los datos se encuentran representadas por conjuntos de etiquetas o nombres (alto, medio, bajo), las cuales tienen valores relativos. 2. En consecuencia, los valores relativos de los datos se pueden clasificar u ordenar. En la encuesta de clientes de una peluquería, la variable “nivel de satisfacción” es un ejemplo de variable ordinal, ya que presenta una
clasificación ordenada: “muy satisfecho” está antes que “satisfecho”, que se encuentra antes que “algo satisfecho”.
Nivel de Intervalo El nivel de intervalo de medición es el nivel inmediato superior. Incluye todas las características del nivel ordinal, pero, además, la diferencia entre valores constituye una magnitud constante. En resumen, si las distancias entre los números tienen sentido, aunque las razones no, entonces tiene una escala de intervalo de medición. Las propiedades de los datos de nivel de intervalo son las siguientes: 1. Las clasificaciones de datos se ordenan de acuerdo con el grado que posea de la característica en cuestión. 2. Diferencias iguales en la característica representan diferencias iguales en las mediciones. El nivel de intervalo de medición es, por ejemplo: la temperatura. Suponga que las temperaturas altas durante tres días consecutivos en Puente de Ixtla son de 28, 31 y 34 grados Celsius. Estas temperaturas se clasifican fácilmente, aunque, además, es posible determinar la diferencia entre ellas, gracias a que un grado representa una unidad de medición constante.
Nivel de Razón Todos los datos cuantitativos son registrados en el nivel de razón de la medición. El nivel de razón es el más alto. Posee todas las características del nivel de intervalo, aunque, además, el punto 0 tiene sentido y la razón entre dos números es significativa. En resumen, las propiedades de los datos de nivel de intervalo son las siguientes: 1. Las clasificaciones de datos se ordenan de acuerdo con la cantidad de características que poseen. 2. Diferencias iguales en la característica representan diferencias iguales en los números asignados a las clasificaciones. 3. El punto cero representa la ausencia de características y la razón entre dos números es significativa. La escala de razón de medición incluye salarios, unidades de producción, peso, cambios en los precios de las acciones, la distancia entre sucursales y la altura. El dinero ilustra bien el caso. Si tiene cero dólares, entonces no tiene dinero. El peso constituye otro ejemplo. Si el cuadrante de la escala de un dispositivo correctamente calibrado se ubica en 0, entonces hay una ausencia total de peso.
Niveles de Medición
Nominal
Ordinal
Intervalo
Razon
Los datos solo se clasifican
Los datos se ordenan
Diferencia significativa entre valores
Punto 0 significativo y razon entre valores
- Numeros de camiseta de jugadores - Marca de Automovil
- Su numero de lista en clase. - Posicion de los equipos en el mundial de futbol
- Temperatura - Talla
- Numero de pacientes atendidos. - Numero de llamadas realizadas
Población y muestra Una meta común e importante de la materia de la estadística es la siguiente: aprender acerca de un grupo grande examinando los datos de algunos de sus miembros. En dicho contexto, los términos muestra y población adquieren importancia. Se denomina población al conjunto completo de elementos, con alguna característica común, que es el objeto de nuestro estudio. Esta definición incluye, por ejemplo, a todos los sucesos en que podría concretarse un fenómeno o experimento cualesquiera. Una población puede ser finita o infinita. Los habitantes de un país, los planetas del Sistema Solar, las estrellas en la Vía Láctea, son elementos de una población finita. Sin embargo, el número de posibles medidas que se puedan hacer de la velocidad de la luz, o de tiradas de un dado, forman poblaciones infinitas.
Cuando, aunque la población sea finita, su número de elementos es elevado, es necesario trabajar con solo una parte de dicha población. A un subconjunto de elementos de la población se le conoce como muestra.
Si se quiere estudiar las propiedades de las estrellas en nuestra Galaxia, no tendremos la oportunidad de observarlas todas; tendremos que conformarnos con una muestra representativa.
Al número de elementos de la muestra se le llama tamaño de la muestra. Es fácil adelantar que para que los resultados de nuestro estudio estadístico sean fiables es necesario que la muestra tenga un tamaño mínimo. El caso particular de una muestra que incluye a todos los elementos de la población es conocido como censo.
EJEMPLO Un estudiante de estadística está interesado en determinar “algo” sobre el valor promedio en pesos ($) de los automóviles que pertenecen al cuerpo docente de nuestra universidad. Cada uno de los términos que acabamos de describir puede identificarse en esta situación. 1. La población es la colección de todos los automóviles que pertenecen a todos los miembros del cuerpo docente de nuestra universidad. 2. Una muestra es cualquier subconjunto de esa población. Por ejemplo, los automóviles que pertenecen a los profesores del departamento de matemáticas integran a la muestra. 3. La variable es el “valor en pesos” de cada automóvil individual. 4. Un dato es el valor en pesos de un automóvil en particular. El automóvil del Dr. Maldonado, por ejemplo, está valuado en $125,000 pesos. 5. Los datos serían el conjunto de valores que corresponden a la muestra obtenida ($9,400; $8,700; $15,950…).
6. El parámetro sobre el que se está buscando información es el valor “promedio” de todos los automóviles de la población. 7. El estadístico que encontrará es el valor “promedio” de todos los automóviles de la muestra. EJERCICIO 1. Parámetro y estadístico. ¿Cuál es la diferencia entre un parámetro y un estadístico? 2. Datos cualitativos y cuantitativos. ¿Cuál es la diferencia entre los datos cualitativos y los datos cuantitativos? 3. Datos discretos y continuos. ¿Cuál es la diferencia entre los datos discretos y los datos continuos? 4. Datos continuos y cuantitativos. Si un experimento produce datos que son de naturaleza continua, ¿los datos también deben ser cuantitativos o pueden ser cualitativos? Determine si el valor dado es un estadístico o un parámetro. 5. Tamaño de la familia. Se selecciona una muestra de hogares y el número promedio (media) de personas por familia es de 2.58 (según datos de la Oficina censal estadounidense). 6. Política. En la actualidad, el 42% de los gobernadores de las 50 entidades de Estados Unidos son demócratas. 7. Titanic. En un estudio de los 2223 pasajeros del Titanic, se encontró que 706 sobrevivieron cuando se hundió. 8. Audiencia televisiva. Se selecciona una muestra de estadounidenses y se descubre que la cantidad de tiempo promedio (media) que ven la televisión es de 4.6 horas al día. Determine si los valores dados provienen de un conjunto de datos discretos o continuos. 9. Experimento de correo. En el problema del capítulo se señaló que cuando se enviaron 50 cartas como parte de un experimento, tres de ellas llegaron a la dirección indicada. 10. Botones para peatones. En la ciudad de Nueva York hay 3250 botones para cruzar, que los peatones presionan en las intersecciones de tránsito, y 2500 de ellos no funcionan (según datos del artículo “For Exercise in New York Futility, Push Button”, de Michael Luo, New York Times). 11. Peso de peniques. El peso promedio de los peniques o centavos que actualmente se acuñan en Estados Unidos es de 2.5 gramos.
12. Propiedad de armas. En una encuesta realizada con 1059 adultos, se encontró que el 39% de ellos tienen armas en sus hogares (basado en una encuesta Gallup). Identifique a) la muestra y b) la población. Además, determine si la muestra parece ser representativa de la población. 13. Proyecto de investigación. Un científico político selecciona al azar a 25 de los 128 senadores que actualmente conforman el Congreso, y luego calcula la cantidad de tiempo que han prestado servicio. 14. Nivel de audiencia de Nielsen. Durante el juego del Súper Tazón, una encuesta de 5108 hogares elegidos al azar revela que el 44% de ellos tienen sus televisores sintonizados en el juego (según datos de Nielsen Media Research). 15. Propiedad de armas. En una encuesta Gallup de 1059 adultos seleccionados al azar, el 39% respondió que “sí” cuando se les preguntó “¿tiene un arma en su casa?” 16. Encuesta por correo. Una estudiante de posgrado de la Universidad del Estado realiza un proyecto de investigación sobre la comunicación. Ella envía por correo una encuesta a los 500 adultos que conoce, y les pide que respondan y regresen por correo la siguiente pregunta: “¿Prefiere utilizar el correo electrónico o el correo ordinario (el servicio postal)?” Ella recibe 65 respuestas, y 42 de ellas indican una preferencia por el correo ordinario.
Recoleccion y organizacion de datos estadísticos Recuerda que al grupo de técnicas utilizadas para describir un conjunto de datos se les denominó estadística descriptiva. En otras palabras, la estadística descriptiva se encarga de organizar datos con el fin de mostrar la distribución general de éstos y el lugar en donde tienden a concentrarse, además de señalar valores de datos poco usuales o extremos. El primer procedimiento a estudiar para organizar y resumir un conjunto de datos es una tabla de distribución de frecuencias. Cuando trabajamos con grandes conjuntos de datos, a menudo es útil organizarlos y resumirlos al construir una tabla de distribución de frecuencias, una distribución de frecuencias nos ayuda a entender la naturaleza de la distribución de un conjunto de datos.
Distribución de frecuencias (o tabla de frecuencias) lista valores de los datos (ya sea de manera individual o por grupos de intervalos), junto con sus frecuencias (o conteos) correspondientes. Cada año se otorgan Óscares a la mejor actriz y al mejor actor. En la tabla se presenta una lista con las edades de los galardonados en el momento de la ceremonia de entrega de los premios. Las edades aparecen en orden, empezando con la primera ceremonia de los Premios de la Academia en 1928. Las edades (en años) aparecen en orden, empezando con la primera ceremonia de premiación. Mejores actrices 22 37 28 30 26 29 35 33 29 40 39 29 43 35 34 41 33 31 26 80 42 26 25 33
63 24 38 27 34 74 29 35
32 38 54 31 27 33 33 35
26 25 24 38 37 50 35 28
31 29 25 29 42 38 45
27 41 46 25 41 61 49
27 30 41 35 36 21 39
28 35 28 60 32 41 34
Mejores actores 44 41 62 38 34 32 41 38 42 49 35 47 44 62 43 40 42 36 51 32 42 46 40 36
52 40 52 31 42 76 54 47
41 43 51 47 48 39 52 29
34 56 35 37 49 53 37 43
34 41 30 57 56 45 38
52 39 39 42 38 36 32
41 49 41 45 60 62 45
37 57 44 42 30 43 60
Tabla 1. Premios de la Academia: Edades de las mejores actrices y los mejores actores
Conceptos básicos de tablas de distribución de frecuencias Los conceptos fundamentales de una distribución de frecuencias son: el número de clases o categorías en que se agruparan los datos; el intervalo o ancho nominal de clase, delimitado por los valores mínimo y máximo aceptables en cada clase, y la frecuencia o número de elementos de cada clase.
Clase A B C D E F
Límite Límite Frecuencia inferior superior 21 30 28 31 40 30 41 50 12 51 60 2 61 70 2 71 80 2
La Tabla 2, es una distribución de frecuencias que resume las edades de las actrices ganadoras del premio Óscar de la tabla 1. La frecuencia de una clase en particular es el número de valores originales que caen en esa clase.
Tabla 2. Distribución de frecuencias: Edades de las mejores actrices ganadoras del premio Oscar ©
Por ejemplo, la primera clase de la tabla 2 tiene una frecuencia de 28, que indica que 28 de las edades originales están entre los 21 y los 30 años inclusive.
Los límites de clase inferiores son las cifras más pequeñas que pueden pertenecer a las diferentes clases. Los límites de clase inferiores de la tabla 2 son 21, 31, 41, 51, 61 y 71
Los límites de clase superiores son las cifras más grandes que pueden pertenecer a las diferentes clases. Los límites de clase superiores de la tabla 2 son 30, 40, 50, 60, 70 y 80
Las fronteras de clase son las cifras que se utilizan para separar las clases, pero sin los espacios creados por los límites de clase. En la ilustración 1 se muestran los espacios creados por los límites de clases de la tabla 2. En la ilustración 1 se percibe con facilidad que los valores 30.5, 40.5, . . . , 70.5 están en el centro de esos espacios, y a tales cifras se les conoce como fronteras de clase. Las dos fronteras de clase desconocidas (que en la ilustración 1 se indican con signos de interrogación) se identifican fácilmente al seguir el patrón establecido por las otras fronteras de clase de 30.5, 40.5, . . . , 70.5. La frontera de clase inferior es 20.5, y la frontera de clase superior es 80.5. Las fronteras de clase serán muy útiles cuando elaboremos una gráfica llamada histograma. La lista completa de las fronteras de clase es 20.5, 30.5, 40.5, 50.5, 60.5, 70.5 y 80.5.
Ilustración 1. Fronteras de clase.
Las marcas de clase son los puntos medios de las clases. (Las marcas de clase de la tabla 2 son 25.5, 35.5, 45.5, 55.5, 65.5 y 75.5). Las marcas de clase se calculan sumando el límite de clase inferior con el límite de clase superior, y dividiendo la suma entre 2. La anchura de clase es la diferencia entre dos límites de clase inferiores consecutivos o dos fronteras de clase inferiores consecutivas. (La anchura de clase de los datos de la tabla 2 es 10).
Procedimiento para construir una distribución de frecuencias Las distribuciones de frecuencias se construyen por las siguientes razones: 1. Es posible resumir conjuntos grandes de datos, 2. se logra cierta comprensión sobre la naturaleza de los datos, y 3. se tiene una base para construir gráficas importantes (como los histogramas, que se estudiarán más adelante en este mismo bloque). Muchos usos de la tecnología nos permiten obtener distribuciones de frecuencias de manera automática, sin necesidad de tener que hacerlas manualmente; no obstante, a continuación se presenta el procedimiento básico: 1. Recopilación de datos, que pueden ser todos los datos de un grupo o población en estudio y la obtención de una muestra. 2. Clasificación de los datos de menor a mayor, lo cual puede ser opcional, pero sin duda siempre ayuda tener los datos ordenados.
3. Decida el número de clases que desea, el cual se recomienda debe estar entre 5 y 20. También puede determinarse, por ejemplo, en función de la raíz cuadrada del número de datos, si el número de datos es menor de 200, si fuese mayor puede usarse la raíz cubica. 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = √𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 4. Calcular el tamaño exacto del ancho de clase
View more...
Comments