Estadística Descriptiva
11
5.º Bachillerato - Grupo Tacaná IGER
Estadística 11
© Instituto Guatemalteco de Educación Radiofónica, iger. Es una obra producida por el Departamento de Redacción y Diseño, para el Instituto Guatemalteco de Educación Radiofónica, IGER. 11 avenida 18-45, Ciudad Nueva, zona 2 Ciudad de Guatemala. PBX: 2412 6666 Fax: 2412 6704 Correo electrónico:
[email protected] Página web: www.iger.edu.gt Segunda edición 2016 Impreso en IGER talleres gráficos
Código: 1111124201 ISBN 9789929614123
Reservados todos los derechos. Queda rigurosamente prohibida la reproducción total o parcial de este material educativo, por cualquier medio o procedimiento, sin la autorización del Instituto Guatemalteco de Educación Radiofónica, IGER. Según artículo 42 de la Constitución Política de Guatemala que se refiere a la autoría.
Índice
Índice........................................................................................................................................................................................................ I ¡Bienvenida y bienvenido! .......................................................................................................................................... 1
Semana 1
¿Qué es la estadística? ........................................................................................................................................ 13 ¡Para comenzar! Registros estadísticos de los antepasados................................................................................................. 14 Lectura: Censos..................................................................................................................................................................................... 15 El mundo de la estadística............................................................................................................................................................. 17 1. ¿Qué es la estadística?.......................................................................................................................................................... 17 2. Las fuentes de información................................................................................................................................................. 18 3. La pregunta de investigación y la hipótesis.................................................................................................................. 19 4. La unidad de análisis.............................................................................................................................................................. 21 5. Las variables.............................................................................................................................................................................. 22
5.1 Las variables tienen categorías............................................................................................................................... 22
5.2 Clasificación de las variables.................................................................................................................................... 25
Vocabulario básico............................................................................................................................................................................. 26 Ejercicio guiado................................................................................................................................................................................... 26 Autocontrol........................................................................................................................................................................................... 27 Navegue en la red.............................................................................................................................................................................. 30 Revise su aprendizaje....................................................................................................................................................................... 30
Estadística Descriptiva − Índice
I
Semana 2
Conceptos básicos de estadística ........................................................................................................ 31 ¡Para comenzar! Repasemos los conceptos básicos de la semana 1.................................................................................. 32 Lectura: ¿Cómo realizar una encuesta?........................................................................................................................................ 33 El mundo de la estadística ............................................................................................................................................................. 34 1. Clasificación de las variables................................................................................................................................................ 34
1.1 Clasificación de las variables cualitativas................................................................................................................. 34
1.2 Clasificación de las variables cuantitativas.............................................................................................................. 36
2. Población..................................................................................................................................................................................... 37 3. Muestra........................................................................................................................................................................................ 38
3.1 Tamaño de la muestra..................................................................................................................................................... 39
3.2 Selección de la muestra................................................................................................................................................. 40
4. Muestreo aleatorio.................................................................................................................................................................. 41
4.1 Muestreo no aleatorio.................................................................................................................................................... 42
Vocabulario básico.............................................................................................................................................................................. 43 Resumen 43 Ejercicio guiado.................................................................................................................................................................................... 44 Autocontrol............................................................................................................................................................................................ 45 Revise su aprendizaje........................................................................................................................................................................ 46
Semana 3
¿Cómo seleccionar una muestra? ......................................................................................................... 47 ¡Para comenzar! Midiendo la felicidad......................................................................................................................................... 48 Lectura: ¿Cómo realizar una encuesta? (segunda parte)........................................................................................................ 49 El mundo de la estadística.............................................................................................................................................................. 50 1. Repasando conceptos básicos............................................................................................................................................ 50 2. Formas de seleccionar una muestra (continuación de la semana 2)................................................................... 51
2.1 Muestreo por conglomerados o racimos................................................................................................................ 51
2.2 Muestro estratificado...................................................................................................................................................... 53
2.3 Objetivo de selección de una muestra..................................................................................................................... 54
2.4 Inferencia estadística....................................................................................................................................................... 55
2.5 Estadístico y parámetro.................................................................................................................................................. 56
Vocabulario básico.............................................................................................................................................................................. 57 Resumen 57 Ejercicio guiado.................................................................................................................................................................................... 58
II
IGER − Tacaná
Autocontrol........................................................................................................................................................................................... 59 Navegue en la red.............................................................................................................................................................................. 60 Revise su aprendizaje....................................................................................................................................................................... 60
Semana 4
Tablas estadísticas........................................................................................................................................................ 61 ¡Para comenzar! Comparando una parte con el todo........................................................................................................... 62 El mundo de la estadística............................................................................................................................................................. 63 1. El cálculo de porcentajes...................................................................................................................................................... 63
1.1 Como una fracción....................................................................................................................................................... 63
1.2 Con el símbolo %.......................................................................................................................................................... 64
Ejercicio guiado................................................................................................................................................................................... 66 2. Tablas estadísticas................................................................................................................................................................... 67
2.1 Elementos de las tablas.............................................................................................................................................. 68
Vocabulario básico............................................................................................................................................................................. 71 Resumen ............................................................................................................................................................................................. 71 Autocontrol........................................................................................................................................................................................... 72 Navegue en la red.............................................................................................................................................................................. 74 Revise su aprendizaje....................................................................................................................................................................... 74
Semana 5
Cálculo de porcentajes en tablas ......................................................................................................... 75 ¡Para comenzar! Jóvenes y tecnología......................................................................................................................................... 76 El mundo de la estadística............................................................................................................................................................. 77 1. Tablas de porcentajes............................................................................................................................................................ 77 2. Cálculo de porcentajes en tablas estadísticas.............................................................................................................. 80 Vocabulario básico ............................................................................................................................................................................ 83 Resumen ............................................................................................................................................................................................. 83 Autocontrol .......................................................................................................................................................................................... 84 Navegue en la red ............................................................................................................................................................................. 86 Revise su aprendizaje ...................................................................................................................................................................... 86
Estadística Descriptiva − Índice
III
Semana 6
Gráficas estadísticas ................................................................................................................................................. .87 ¡Para comenzar! Sistema de coordenadas cartesianas........................................................................................................... .88 El mundo de la estadística.............................................................................................................................................................. .90 1. Gráficas estadísticas................................................................................................................................................................ .90
1.1 Diagrama de barras...................................................................................................................................................... .90
1.2 Diagrama de líneas....................................................................................................................................................... .93
1.3 Diagrama de sectores, circular o pastel................................................................................................................ .95
Vocabulario básico.............................................................................................................................................................................. .98 Resumen .............................................................................................................................................................................................. .98 Autocontrol............................................................................................................................................................................................ .99 Navegue en la red............................................................................................................................................................................... .100 Revise su aprendizaje........................................................................................................................................................................ .100
Semana 7
Distribución de frecuencias ( T ) ............................................................................................................... .101 ¡Para comenzar! Elementos de un cuadro para variables cuantitativas.......................................................................... .102 El mundo de la estadística ............................................................................................................................................................. .103 1. Distribución de frecuencias.................................................................................................................................................. .103 2. Construcción de una distribución de frecuencias....................................................................................................... .105 Ejercicio guiado.................................................................................................................................................................................... .106 Vocabulario básico.............................................................................................................................................................................. .109 Resumen .............................................................................................................................................................................................. .109 Autocontrol............................................................................................................................................................................................ .110 Navegue en la red............................................................................................................................................................................... .112 Revise su aprendizaje........................................................................................................................................................................ .112
Semana 8
Repaso: semanas 1 a 5 ........................................................................................................................................ .113 ¡Para comenzar! .................................................................................................................................................................................. .115 Lectura
............................................................................................................................................................................................. .116
Ejercicio guiado ................................................................................................................................................................................... .118 Revise su aprendizaje ....................................................................................................................................................................... .124 Orientaciones sobre la prueba parcial ..................................................................................................................................... .124
IV
IGER − Tacaná
Semana 9
Distribución de frecuencias ( TT )
......................................................................................................... .125
¡Para comenzar! Elementos de un cuadro para una variable cuantitativa .................................................................... .126 Lectura: Monitoreo de la Canasta Básica Alimentaria............................................................................................................ .127 El mundo de la estadística ............................................................................................................................................................. .128 1. Tablas estadísticas para variables cuantitativas............................................................................................................ .128
1.1 Columna de frecuencias acumuladas.................................................................................................................... .128
1.2 Columna de frecuencias relativas............................................................................................................................ .130
1.3 Columna de porcentajes............................................................................................................................................. .132
1.4 Columna de porcentajes acumulados................................................................................................................... .133
Vocabulario básico.............................................................................................................................................................................. .134 Resumen .............................................................................................................................................................................................. .134 Ejercicio guiado.................................................................................................................................................................................... .135 Autocontrol............................................................................................................................................................................................ .136 Navegue en la red............................................................................................................................................................................... .138 Revise su aprendizaje........................................................................................................................................................................ .138
Semana 10
Medidas de tendencia central .......................................................................................................... .139 ¡Para comenzar! Jerarquía de las operaciones aritméticas................................................................................................... .140 Lectura: Costo promedio de la Canasta Básica Alimentaria................................................................................................. .142 El mundo de la estadística.............................................................................................................................................................. .143 1. Medidas de tendencia central o promedios.................................................................................................................. .143
1.1 Media aritmética............................................................................................................................................................ .143
1.2 Mediana............................................................................................................................................................................ .145 1.3 Moda.................................................................................................................................................................................. .147 Vocabulario básico.............................................................................................................................................................................. .148 Resumen .............................................................................................................................................................................................. .148 Autocontrol............................................................................................................................................................................................ .149 Navegue en la red............................................................................................................................................................................... .154 Revise su aprendizaje........................................................................................................................................................................ .154
Estadística Descriptiva − Índice
V
Semana 11
Medidas de dispersión o variabilidad ...................................................................................... .155 ¡Para comenzar! Repasemos la media aritmética.................................................................................................................... .156 Lectura: Exactitud y precisión ¡Significan cosas un poco distintas!..................................................................................... .157 El mundo de la estadística.............................................................................................................................................................. .158 1. Medidas de dispersión o variabilidad.............................................................................................................................. .158
1.1 ¿Qué indican las medidas de dispersión o variabilidad?............................................................................... .159
1.2 Rango................................................................................................................................................................................. .159
1.3 Desviación estándar..................................................................................................................................................... .161
Vocabulario básico.............................................................................................................................................................................. .163 Resumen .............................................................................................................................................................................................. .164 Autocontrol............................................................................................................................................................................................ .164 Navegue en la red............................................................................................................................................................................... .166 Revise su aprendizaje........................................................................................................................................................................ .166
Semana 12
Repaso: semanas 6 a 11 ................................................................................................................................... .167 Ejercicio guiado.................................................................................................................................................................................... .169 Revise su aprendizaje........................................................................................................................................................................ .176 Orientaciones sobre la prueba parcial...................................................................................................................................... .176
Semana 13
Medidas de posición ................................................................................................................................................... .177 ¡Para comenzar! Repasemos cómo se calcula la mediana.................................................................................................... .178 Lectura: Percentil de talla y peso..................................................................................................................................................... .179 El mundo de la estadística.............................................................................................................................................................. .181 1. Medidas de posición............................................................................................................................................................... .181 1.1 Percentiles........................................................................................................................................................................ .182 1.2 Deciles................................................................................................................................................................................ .184 1.3 Cuartiles............................................................................................................................................................................ .185 Vocabulario básico.............................................................................................................................................................................. .186 Resumen .............................................................................................................................................................................................. .186 Ejercicio guiado.................................................................................................................................................................................... .187 Autocontrol............................................................................................................................................................................................ .188 Navegue en la red............................................................................................................................................................................... .190 Revise su aprendizaje........................................................................................................................................................................ .190
VI
IGER − Tacaná
Semana 14
Números índice ................................................................................................................................................... .191 ¡Para comenzar! Repaso el cálculo de proporciones y porcentajes.................................................................................... .192 Lectura: Países consumidores del café guatemalteco.............................................................................................................. .193 El mundo de la estadística.............................................................................................................................................................. .194 1. Números índice......................................................................................................................................................................... .194
1.1 Índice de precios............................................................................................................................................................ .194
1.2 Índice de cantidad......................................................................................................................................................... .197
Vocabulario básico.............................................................................................................................................................................. .200 Resumen .............................................................................................................................................................................................. .200 Autocontrol............................................................................................................................................................................................ .201 Navegue en la red............................................................................................................................................................................... .202 Revise su aprendizaje........................................................................................................................................................................ .202
Semana 15
Probabilidades ...................................................................................................................................................... .203 ¡Para comenzar! Suerte: no todo es encontrar un trébol de cuatro hojas....................................................................... .204 Lectura: ¿Lloverá hoy?......................................................................................................................................................................... .205 El mundo de la estadística.............................................................................................................................................................. .206 1. Probabilidades........................................................................................................................................................................... .206 1.1 Probabilidad a priori..................................................................................................................................................... .208
1.2 Probabilidad empírica.................................................................................................................................................. .209
1.3 Pribobilidad subjetiva.................................................................................................................................................. .210
2. Experimentos estadísticos.................................................................................................................................................... .211
2.1 Experimentos simples.................................................................................................................................................. .211
2.2 Experimentos compuestos......................................................................................................................................... .212
Vocabulario básico.............................................................................................................................................................................. .213 Resumen .............................................................................................................................................................................................. .213 Ejercicio guiado.................................................................................................................................................................................... .214 Autocontrol............................................................................................................................................................................................ .215 Navegue en la red............................................................................................................................................................................... .216 Revise su aprendizaje........................................................................................................................................................................ .216
Estadística Descriptiva − Índice
VII
Semana 16
Prácticas de estadística
.......................................................................................................................... .217
¡Para comenzar! Estadística en la vida cotidiana..................................................................................................................... .218 Lectura: Violencia intrafamiliar ha subido 439 %..................................................................................................................... .219 El mundo de la estadística.............................................................................................................................................................. .220 1. La violencia intrafamiliar........................................................................................................................................................ .220 Autocontrol............................................................................................................................................................................................ .221 Revise su aprendizaje........................................................................................................................................................................ .230
Semana 17
Repaso: semanas 1 a 16
................................................................................................................................... .231
Ejercicio guiado.................................................................................................................................................................................... .233 Revise su aprendizaje........................................................................................................................................................................ .244 Orientaciones sobre la prueba final........................................................................................................................................... .244 Claves
.............................................................................................................................................................................................. .245
Bibliografía ............................................................................................................................................................................................ .255 Distribución de logros de aprendizaje..................................................................................................................................... .256
VIII
IGER − Tacaná
¡Bienvenida y bienvenido! Tiene en sus manos el libro del curso de Estadística Descriptiva del grupo Tacaná (quinto grado de bachillerato). Consta de diecisiete semanas en las que se desarrollarán tres competencias del Currículo Nacional Base (CNB). Pero, antes de entrar al detalle de las competencias de este curso, echemos una mirada a la portada. ¡Empecemos! La imagen de la portada se asemeja a nuestro planeta, la Tierra. Nuestro propósito es que este libro le provea de todas las herramientas, para que usted se sienta parte de este mundo que se ha dado en llamar mundo global, y que cada día es más cercano gracias a la tecnología informática y las relaciones internacionales. El libro incluye imágenes que hacen alusión a las competencias. Son invitaciones a trabajar con nuestras herramientas de estadística. En la portada aparece una computadora que representa las nuevas tecnologías para el procesamiento de los datos. En este curso aprenderemos cómo comunicarnos con números. Otra imagen distintiva es la del grupo de personas; con ello queremos resaltar la importancia de la persona, del grupo y de la comunidad porque vivimos en sociedad y necesitamos conocer datos sobre nosotros mismos y nuestro entorno para tomar decisiones informadas.
Estadística Descriptiva − ¡Bienvenida y bienvenido!
1
¿Cómo alcanzará las competencias que se tratan de desarrollar? Nos enfocaremos en tres competencias específicas. Al inicio de cada semana, se indica qué se propone lograr. Para saber si ha alcanzando el desarrollo de las competencias, el Currículo Nacional Base propone indicadores de logro que en nuestro libro usted mismo evaluará en el cuadro Revise su aprendizaje, el cual se encuentra al final de cada semana. Estos indicadores o criterios son como un termómetro que mide su desempeño en cada competencia. Iremos avanzando paso a paso. Vaya fijándose qué secciones del libro hacen posible que usted desarrolle las competencias que presentamos a continuación.
Competencia 1 Utiliza la información obtenida por medio de la aplicación de diferentes procedimientos estadísticos descriptivos en la toma de decisiones.
Sección de libro ¡Para comenzar!
2
3
4
5
7
8
9 10 11 12 13 14 15 16 17
X
X
X X X X X
El mundo de la X X X X X X X estadística
X X X
X X X X X
Lectura
X X X X
6
X X X
X X X
X
X X X
X X
Vocabulario básico
X X X X X X X
X X X
X X X X X
Resumen
X X X X X X
X X X
X X X X X
X X X X X X X
X X X
X X X X X
Autocontrol
IGER − Tacaná
1
X X
Ejercicio guiado
2
Semana
Competencia 2
Interpreta la información estadística de diferentes fuentes para enriquecer su labor.
Sección de libro
Semana 1
2
3
¡Para comenzar!
4
5
Lectura
X
Autocontrol
Sección de libro
X X X
X X X
X X
X X X
X X
Semana 1
2
3
4
5
X
6
7
8
9 10 11 12 13 14 15 16 17
X
X X
Ejercicio guiado
Navegue en la red
9 10 11 12 13 14 15 16 17
X X X X X
El mundo de la X estadística
Autocontrol
8
X X
Ejercicio guiado
Utiliza la tecnología disponible en el análisis estadístico en la toma de decisiones.
7
X
El mundo de la estadística
Competencia 3
6
X
X X
X X X X
X X X X X X
X X X X X
Estadística Descriptiva − ¡Bienvenida y bienvenido!
3
Con su esfuerzo, podrá conquistar estas competencias a través de tres tipos de contenidos: ü Declarativos: Los contenidos declarativos le aportarán el conocimiento de los distintos aspectos teóricos y conceptuales propios del área de estadística. ü Procedimentales: Como indica su nombre, los contenidos procedimientales se desarrollarán a base de ejercicios, procedimientos o análisis de tablas, gráficas y otros datos numéricos en los cuales pueda demostrar el dominio y la puesta en práctica de los contenidos declarativos. ü Actitudinales: Los contenidos actitudinales son todo aquello que tiene que ver con su actitud ante el estudio y ante la vida, en general.
¡Conozcamos nuestro libro! Comienza con un índice de contenidos generales y termina con las claves o soluciones de los ejercicios. Usar las claves con responsabilidad le permitirá desarrollar autonomía en su aprendizaje. Cada semana contiene varias secciones. Además, hay otros apartados que se van intercalando en algunas secciones. Hagamos un recorrido:
4
IGER − Tacaná
Portada
30 % 15 %
La portada de cada semana, como la del periódico, indica el número de la semana y anuncia el título del tema que estudiará.
50 %
5%
1
Debajo del título verá este apartado. Le servirá de ruta para saber qué encontrará: lectura, contenidos y actividades. Se presentan tres secciones. ca?
¿Qué es la estadísti ¿Qué encontrará esta
semana? s de los antepasados
Registros estadístico Censos
?
¿Qué es la estadística
Logros de la semana
Esta semana logrará:
ística. n y el uso de la estad Conocer el orige de información. es fuent las ar Evalu esis. de investigación e hipót Plantear preguntas
A continuación aparecen los logros o resul tados que alcanzará al finalizar el estudio de cada semana.
les. Clasificar las variab
Estadística Descriptiva
− Semana 1
13
Para comenzar Esta sección tiene por objetivo introducirlo en el tema que se tratará en la semana, para ello presenta contenidos de cómo se utilizan los cálculos estadísticos o repasos de los contenidos de la semana anterior. Un pequeño repaso del contenido ya visto le ayudará a establecer la relación con el conocimiento nuevo. Esperamos que el contenido de esta sección le ayude a refrescar y reforzar el contenido ya aprendido y comenzar el aprendizaje de la semana con entusiamo.
¡Para comenzar!
os os de los antepasad Registros estadístic
y propósitos, ística con distintos fines se ha usado la estad , se han Desde la antigüedad que comenzó a usarse r la fecha exacta en antes de y aunque es difícil indica los años 2500 y 2000 entre que, n indica eran que s para saber cuántas encontrado pruebas censo aban efectu ya los chinos Cristo, los egipcios y as. era el estado de las mism sus posesiones y cuál él? El libro ¿ha escuchado sobre que se llama Números, . Dios le dice En la Biblia hay un libro de abandonar Egipto Israel, hizo Moisés después lea de los hijos de habla del censo que al de toda la asamb gener censo todos los un de res a Moisés: "Haz as los nomb , describiendo por cabez por familias y por linajes Israel". en armas de io servic varones aptos para el contar ron la estadística para os usaron y perfecciona De igual forma, los roman imperio y su cultura. izarlas, al extender su sus propiedades y organ rollaron un incas en Perú desar ente americano, los nados con Así también en el contin todos los datos relacio muy exacto, que incluía sistema de registro micas y la las actividades econó datos Los ción. pobla cantidad de los quipus. Los se conservaban en cuerdas gruesas quipus eran unas ban varios hilos de las cuales colga s, que servían de diferentes colore tos objetos o para representar distin ción. En estos integrantes de la pobla nudos que hilos de colores se hacían tas cantidades. representaban distin antigüedad los En Guatemala, en la el desarrollo de abuelos obser varon ndo el tiempo conta fueron y la milpa raban hasta que desde que la semb on registrar nacía la planta y así lograr de 15 días. que tarda alrededor los 90 días y se Se tienen elotes a 130 y 150 días. cosecha maíz, entre
¡A trabajar!
las Escriba tres ideas sobre
14
s.
ístico los antiguos maya
ron llevar registro estad
que imagina que pudie
IGER − Tacaná
Estadística Descriptiva − ¡Bienvenida y bienvenido!
5
Lectura
Lectura
Como vimos al inicio, la estadística se utiliza para la elaboración de censos.
En las lecturas encontrará información adicional sobre recolección de información o lectura de tablas que le ayudarán a conocer diferentes procedimientos estadísticos.
Censos de Los censos son la principal fuente de datos demográficos, es decir, de población o de habitantes un lugar. Por la gran cantidad de información que manejan, dan una fotografía de la población. un Esto significa que describen estadísticamente las poblaciones humanas consideradas desde de punto de vista cuantitativo, o de números. Son la fuente primaria de las estadísticas básicas población que son necesarias para fines gubernamentales y aspectos de planificación económica y social. Se usan, por ejemplo: • • •
Como base para el análisis y la evaluación demográfica. Para proyectar, establecer y desarrollar políticas de gobierno. Para hacer estimaciones de las distintas variables captadas en el censo.
•
Como "marco muestral", o sea de "muestras", que son la parte significativa del total, usadas para hacer encuestas. Como referencia para las estadísticas continuas (vitales), es decir, las que se hacen por varios periodos seguidos. Para determinar los sistemas electorales de un país.
•
Otros propósitos.
• •
Requisitos
a Auspicio oficial: Se llama así cuando el censo es auspiciado ―o sea, financiado― y llevado y cabo por el Gobierno nacional, con la cooperación de las autoridades regionales, provinciales decir municipales. En España, Chile o Guatemala, el organismo responsable es el Ine, que quiere Instituto Nacional de Estadística. Territorio definido: En este caso, los censos deben tener un área territorial definida con precisión. de tipo Implica una división político – administrativa de la región y todas aquellas herramientas cartográfico ―de mapas― que aseguren una completa captación de información, sin omisiones ni duplicidades.
Universalidad: El censo es exacto y cabal, es decir sin duplicaciones ni omisiones. para reSimultaneidad: Los censos pueden servir para el recuento exacto de la población total y Por ello, lacionar los datos de la población con un momento o periodo de tiempo bien definido. y un generalmente, se fija una fecha para el levantamiento censal y además casi siempre una hora a momento determinado, que se denomina "momento censal". Este momento se señala a menudo que namedia noche y sirve de línea cronológica ―es decir, de tiempo―, que separa a las personas el censo. cen o mueren después. De este modo determina claramente quienes deben figurar o no en gran Periodicidad: Se da si los censos se realizan en intervalos regulares. La periodicidad tiene importancia para determinar las tendencias demográficas.
Estadística Descriptiva − Semana 1
15
El mundo de la estadística Este libro lo dedicaremos al cálculo e interpretación de gráficas, tablas y promedios, además de otros modelos que son importantes para la información y toma de decisiones.
El mundo de la estadística 1. Gráficas estadísticas
ión en largas e que cuando se ofrece informac Como sabemos, es frecuent más probable es de grandes explicaciones, lo columnas de números o a través Algunas personas parecen no ensión. incompr o apatía provocar aburrimiento, pero podrían estadística presentada en tablas, tener interés en la información les presenta en forma gráfica. prestarle mucha atención si se los datos de una entre relación la n proyecta que Las gráficas tienen la ventaja de clases de gráficas, una tabla. Aunque hay muchas forma más clara y directa que de gráficas. Estas son: en este libro se verán tres tipos
Los contenidos se presentan siguiendo este orden:
• • •
• introducción al tema,
1.1 Diagrama de barras
• definición o explicación,
rápida de datos iona una ilustración sencilla y El diagrama de barras nos proporc a puede ser categorías. Este tipo de diagram que pueden dividirse en varias diagrama vertical que se usa el r construi a remos horizontal o vertical. Aprende con más frecuencia. de una tabla. claro que toda gráfica parte En primer lugar, debemos tener mos la tabla con el diagrama de barras, utilizare Para empezar a familiarizarnos
• ejemplos y
siguiente.
• ejercicios para practicar lo aprendido.
Tabla 1 la, 2013 donde vive y sexo. Guatema Población ocupada por el área Mujer Hombre Área donde vive
Aproveche el espacio vacío para hacer sus anotaciones, escribir ideas importantes, etc.
IGER − Tacaná
Urbano metropolitano
21.4 %
18.8 %
Resto urbano
31.5 %
29.9 %
Rural nacional
47.1 %
51.3 %
Total nacional
100 %
100 % Fuente: IneI 2 – 2013 Ine
la gráfica de describen a continuación, haremos Siguiendo los pasos que se s ocupados. barras con los datos de hombre
90
6
Diagrama de barras Diagrama de líneas Diagrama circular, o pastel
IGER − Tacaná
Ejercicio guiado Antes de realizar el autocontrol revise los ejemplos siguientes. A. La maestra de 4.º primaria registró las siguientes calificaciones del examen de Ciencias Naturales que aplicó a sus 25 estudiantes.
49
29
53
54
74
27
30
85
11
28
12
78
86
69
92
36
83
34
39
51
50
60
50
60
54
Ejercicio guiado
Siga los pasos descritos anteriormente. •
Calcular la amplitud total = dato mayor – dato menor
•
Decidir cuántas clases va a tener. Si se aplica la fórmula:
Amplitud total = 92 – 11 = 81
No. clases = 1 + 3.3 • log 25 = 1 + 3.3 (1.3979) = 5.61
Sabemos que la fórmula recomienda 5 o 6 clases, por lo tanto debemos decidirnos por el número que sea más fácil de utilizar. Es más fácil 5 que 6, entonces decidimos utilizar 5 clases o intervalos. •
Dividir la amplitud total entre el número de clase. Tamaño de clase =
106
En esta sección se le presentarán ejercicios completos, tomados de la vida real, los cuales se van resolviendo paso a paso para que usted comprenda mejor los temas estudiados y realice los ejercicios del autocontrol con mayor dominio sobre la materia.
81 = 16.2 5
•
Decidir el tamaño de clase aproximando el valor obtenido anteriormente. Se busca el más fácil y próximo al valor obtenido. En este caso, es mejor tomar 15. No hay ningún problema si se toma 16, pero resulta más fácil hacer cálculos con el número 15. Recuerde lo siguiente: todos los números que se obtienen son una guía y no valores absolutos. El criterio a utilizar es tomar aquellos que faciliten el trabajo.
•
Decidir dónde iniciar la distribución. Como el número más pequeño es 11, se puede iniciar en 10. No existe ningún problema si se inicia en 11, pero es más fácil trabajar si se inicia, en este caso, en 10.
IGER − Tacaná
Vocabulario básico amplitud: tamaño numérico que existe entre los intervalos.
Vocabulario básico
clase o intervalo: conjunto de valores entre dos límites dados.
amplitud: tamaño numérico que existe entre los intervalos.
Vocabulario básico El vocabulario básico presenta las palabras nuevas, pero de uso estadístico, que se utilizan en la semana. Conózcalas y aprenda su significado y aplicación. De esta manera se le facilitará la práctica de la estadística.
exponente: también llamado potencia, es el número al cual se eleva la base para ser multiplicada por
dos límites dados. clase o intervalo: conjunto de valores entre sí misma.
la base para ser multiplicada por exponente: también llamado potencia, es el número al cual se eleva frecuencia: número de elementos comprendidos en un intervalo de una distribución determinada. sí misma.
de una distribución intervalo en unes que elevar un número, llamado base, para obtener otro número al que haydeterminada. el exponente logaritmo: frecuencia: número de elementos comprendidos
determinado. El cálculo de logaritmos es la operación inversa a la exponenciación de la base del
elevar un número, llamado base, para obtener otro número logaritmo: es el exponente al que hay que logaritmo. a la exponenciación de la base del determinado. El cálculo de logaritmos es la operación inversa logaritmo.
Resumen
Resumen
estadísticos de tabla, de datos en forma organización, organización, en forma de tabla, de datos estadísticos es una de frecuencias distribución La distribución de frecuencias es una La con que aparecen los datos en cada intervalo. agrupados; en la tabla se muestra la frecuencia agrupados; en la tabla se muestra la frecuencia con que aparecen los datos en cada intervalo. evitar listar uno por uno. AdeLos intervalos se utilizan para agrupar cantidades de números y de números y evitar listar uno por uno. Adecantidades a las agrupar que parapreguntas Los intervalos se utilizan se hacen más, al realizar una encuesta es preferible utilizar intervalos cuando y otros. salario, edad utilizar intervalos cuando se hacen preguntas que a las peso, es preferible ejemplo:una encuesta por realizar más, al personas no les gusta responder directamente,
Resumen
personas no les gusta responder directamente, por ejemplo: peso, salario, edad y otros.
elementos: clase o intervalo y La distribución de frecuencias se compone básicamente de dos se van a considerar para la distribución de frecuencia. Es necesario conocer cuántosLaintervalos distribución de frecuencias se compone básicamente de dos elementos: clase o intervalo y frecuencias, no deberían ser menos de 5 ni más de 20. de
El resumen es una herramienta de re paso para fijar y recordar conocimientos. Contiene los conceptos básicos y fórmulas matemáticas de los cálculos estadísticos aprendidos en la semana.
frecuencia. Es necesario conocer cuántos intervalos se van a considerar para la distribución frecuencias, no deberían ser menos de 5 ni más de 20. Para calcular una distribución de frecuencias: dato menor. 1. Calcule la amplitud total = dato mayor una distribución de frecuencias: Para –calcular 2. Decida el tamaño del intervalo y dónde iniciar la distribución.
mayor – dato menor. dato 1. Calcule la amplitud total = la fórmula:
aplicando 3. Divida la amplitud entre el número de clases decidido o calcule
el tamaño del intervalo y dónde iniciar la distribución. 2. Decida 1 + 3.3 • log n. Número de clases =
que el intervalo según el elementos entre y distribuya clases decidido o calcule aplicando la fórmula: númeroalde la amplitud Divida los 4. Elabore un cuadro con los intervalos 3. pertenezcan. el 5. Haga el recuento de casos o datos en cada intervalo y complete
Número de clases = 1 + 3.3 • log n.
cuadro.
4. Elabore un cuadro con los intervalos y distribuya los elementos según el intervalo al que pertenezcan. Estadística Descriptiva − Semana 8
121
5. Haga el recuento de casos o datos en cada intervalo y complete el cuadro.
Estadística Descriptiva − Semana 7
109
Estadística Descriptiva − ¡Bienvenida y bienvenido!
7
Autocontrol El autocontrol es su autoevaluación. Le ayudará a saber qué aprendió, cómo lo aprendió y qué debe mejorar. Las actividades tocan los temas estudiados y por consiguiente los logros de la semana. El autocontrol tiene ejercicios que evalúan conceptos teóricos, y prácticos pero sobre todo son ejercicios que le ayudarán a comprender las diversas aplicaciones de la estadística.
Autocontrol Actividad 1
Lea la informac
ión que contiene
la tabla y reali
ce las actividad
Comportamie
es que se indic
an abajo.
Tabla 1 tismo por depa rtamento. Guat (fragmento) emala, 2012
nto del analfabe
Código
Departamen to
01 02 03
s de Población
23 014
503 037
Jalapa
159 091
176 312 2012 con base
Porcentaje de analfabetismo
12 071
202 560
Quiché
Fuente: Proye ccione
141 674
99 058
Sacatepéquez
05
Población analfabeta
2 188 776
El Progreso
04
Total
Población de 15 años y más
Guatemala
42 634
en el XI Censo
de Población
2002, Ine y Result 1. Calcule el Proceso de Alfabe ados finales del porcentaje de tización, Año analfabetismo 2002 anótelo en el para cada uno espacio correspo de los departam ndiente en la entos presenta tabla. dos y
Recuerde la fórm
ula:
Para el caso de
% = n • 100 N
N = 2 188 776
Responda: 2. ¿Cuál depa rtam
ento tiene el
3. ¿Qué depa rtamento 4. ¿Cuál depa rtam
mayor número de
tiene el menor
ento tiene el
72
Guatemala:
n = 141 674
población de
15 años o más
?
número de pob
mayor porcenta je
lación de 15 años
o más?
de analfabetism
o?
IGER − Tacan
á
Actividad 3
Navegue en la red
Resuelva el ejercicio, calculando el porcentaje de población de hombres. Tabla 3 Población por sexo. Guatemala, 2012
Internet es un recurso que ya no puede quedar fuera de la vida de un estudiante. Esta sección le sugiere páginas de internet en las que encontrará datos estadísticos sobre diferentes aspectos de Guatemala. Visite los portales electrónicos y familiarícese con los datos que presentan pues estos le podrán servir no solo para repasar la materia sino también para elaborar algún proyecto de utilidad El porcentaje de población de mujeres se calculó dividiendo el número de mujeres, que es 7 729 269 entre el total de la población que es 15 082 831, y se multiplicó por 100. en su comunidad. Sexo
Población
Porcentaje
mujer
7 729 269
51.25 %
hombre
7 353 562
Total
15 082 831
100 %
Fuente: http://www.datosmacro.com/demografia/poblacion/guatemala
7 729 269 = 0.5125 15 082 831
0.5125 • 100 = 51.25 %
Ahora, calcule el porcentaje de población de hombres y coloque el dato en la casilla correspondiente.
Navegue en la red... Ministerio de Agricultura, Ganadería y Alimentación (Maga)
Revise su aprendizaje
Tómese su tiempo para responder, es su autoaprendizaje. Recuerde que puede recurrir a su tutor a distancia. El encargado del círculo de estudio o su orientador voluntario podrán informarle como comunicarse con su tutor.
8
IGER − Tacaná
Revise su aprendizaje Marque con un cheque Después de estudiar...
Después de hacer una tarea, es bueno reflexio nar sobre nuestro desempeño. Para eso, al final de la semana, encontrará este cuadro en el que puede verificar si alcanzó los logros.
El Maga presenta el Informe Semanal del Comportamiento de precios de los principales productos agropecuarios en el mercado de mayoreo de Guatemala y precios internacionales. Visite: www.maga.gob.gt/precios-agricolas
74
la casilla que mejor indique su rendimiento.
Calculo porcentajes utilizando la fracción y el símbolo %. Utilizo los elementos de una tabla estadística. Analizo la información presentada en forma de porcentajes en una tabla estadística.
IGER − Tacaná
logrado
en proceso
no logrado
Libro, clase radial y círculo de estudio ¡Su equipo de trabajo! El libro, con ser una buena herramienta, no lo es todo. Para que usted alcance el nivel de competencia deseado, nuestro sistema pone a su disposición: el libro, la clase radial y la invitación a participar en un círculo de estudio.
• El libro cumple cuatro funciones: a. Texto, en el que encuentra la información y el desarrollo de los contenidos a estudiar. b. Pizarrón, para que durante la clase radial subraye ideas importantes o realice distintas actividades. c. Cuaderno de trabajo, con ejercicios para practicar lo aprendido. d. Herramienta de autoevaluación, cuando resuelve su autocontrol cada semana.
• La clase radial tiene como función principal explicar y facilitar la comprensión de los temas tratados en el libro. Recuerde que puede grabar las clases radiales en una memoria de teléfono o puede adquirir un CD con estas clases grabadas. Pregunte cómo hacerlo al encargado del círculo de estudio o a su orientador voluntario. Grabar las clases radiales es optativo, pero puede ayudarle.
• El círculo de estudio es el lugar para compartir y aprender juntos. Aproveche estos recursos y apóyese en personas de su comunidad para resolver sus dudas. Recuerde que siempre puede consultar sobre los temas que le resulten difíciles a su tutor a distancia.
Estadística Descriptiva − ¡Bienvenida y bienvenido!
9
Nuestra metodología paso a paso Para facilitar su aprendizaje y aprovechar más y mejor el estudio cada semana, siga estos pasos. ¡No se salte ninguno!
1
Lea el contenido de la semana
2
Escuche la clase radial
Leer el contenido nos permite tener una idea general del tema: qué sabemos, con qué lo relacionamos, etc. Este primer contacto también nos hará caer en la cuenta del esfuerzo a realizar para aprender lo nuevo y nos pondrá “en onda” para la clase radial.
Con los 5 sentidos La clase radial es nuestra maestra. De ahí que el programa se llame "El Maestro en Casa". Las maestras y maestros locutores explican el contenido, proponen ejercicios y otros ejemplos para ampliar el tema.
3
Después de la clase radial, su trabajo personal Estudio y autocontrol Finalizada la clase radial es el momento de su trabajo personal. Distribuya su tiempo: es mejor un poco cada día, que todo la víspera.
4
Consulte sus dudas Un estudiante inteligente sabe cuándo pedir ayuda Consulte los temas que no le han quedado claros en otros libros, en internet, con familiares o amigos. Seguro que encontrará personas dispuestas a ayudarle.
5
Participe en un círculo de estudio Aprender juntos Póngase de acuerdo con otros estudiantes y organicen un círculo de estudio. Soliciten la ayuda de alguna persona voluntaria de la comunidad. Eso les ayudará a resolver dudas y reforzar lo aprendido. Además, tendrán la oportunidad de intercambiar aprendizajes, ideas y sentimientos. Recuerde que siempre puede acudir a su tutor asignado.
10
IGER − Tacaná
¿Cómo aprovechar mejor su estudio? • Busque un lugar cómodo y con buena iluminación. Es importante que se aleje del ruido y de las distracciones. • Elija un horario para trabajar y estudiar. La constancia y la disciplina son sus mejores compañeras de estudio. • Lea con atención las instrucciones de los ejercicios antes de resolverlos. • Consulte sus dudas con otras personas de su comunidad que puedan ayudarle.
Estadística Descriptiva − ¡Bienvenida y bienvenido!
11
Notas: Escriba aquí sus inquietudes, descubrimientos o dudas para compartir en el círculo de estudio.
12
IGER − Tacaná
30 % 15 % 5%
50 %
1 ¿Qué es la estadística? ¿Qué encontrará esta semana?
Registros estadísticos de los antepasados
Censos
¿Qué es la estadística?
Esta semana logrará: Conocer el origen y el uso de la estadística. Evaluar las fuentes de información. Plantear preguntas de investigación e hipótesis. Clasificar las variables.
Estadística Descriptiva − Semana 1
13
¡Para comenzar! Registros estadísticos de los antepasados Desde la antigüedad se ha usado la estadística con distintos fines y propósitos, y aunque es difícil indicar la fecha exacta en que comenzó a usarse, se han encontrado pruebas que indican que, entre los años 2500 y 2000 antes de Cristo, los egipcios y los chinos ya efectuaban censos para saber cuántas eran sus posesiones y cuál era el estado de las mismas. En la Biblia hay un libro que se llama Números, ¿ha escuchado sobre él? El libro habla del censo que hizo Moisés después de abandonar Egipto. Dios le dice a Moisés: "Haz un censo general de toda la asamblea de los hijos de Israel, por familias y por linajes, describiendo por cabezas los nombres de todos los varones aptos para el servicio de armas en Israel". De igual forma, los romanos usaron y perfeccionaron la estadística para contar sus propiedades y organizarlas, al extender su imperio y su cultura. Así también en el continente americano, los incas en Perú desarrollaron un sistema de registro muy exacto, que incluía todos los datos relacionados con las actividades económicas y la cantidad de población. Los datos se conservaban en los quipus. Los quipus eran unas cuerdas gruesas de las cuales colgaban varios hilos de diferentes colores, que servían para representar distintos objetos o integrantes de la población. En estos hilos de colores se hacían nudos que representaban distintas cantidades. En Guatemala, en la antigüedad los abuelos observaron el desarrollo de la milpa y fueron contando el tiempo desde que la sembraban hasta que nacía la planta y así lograron registrar que tarda alrededor de 15 días. Se tienen elotes a los 90 días y se cosecha maíz, entre 130 y 150 días. ¡A trabajar! Escriba tres ideas sobre las que imagina que pudieron llevar registro estadístico los antiguos mayas.
14
IGER − Tacaná
Lectura Como vimos al inicio, la estadística se utiliza para la elaboración de censos.
Censos Los censos son la principal fuente de datos demográficos, es decir, de población o de habitantes de un lugar. Por la gran cantidad de información que manejan, dan una fotografía de la población. Esto significa que describen estadísticamente las poblaciones humanas consideradas desde un punto de vista cuantitativo, o de números. Son la fuente primaria de las estadísticas básicas de población que son necesarias para fines gubernamentales y aspectos de planificación económica y social. Se usan, por ejemplo: • Como base para el análisis y la evaluación demográfica. • Para proyectar, establecer y desarrollar políticas de gobierno. • Para hacer estimaciones de las distintas variables captadas en el censo. • Como "marco muestral", o sea de "muestras", que son la parte significativa del total, usadas para hacer encuestas. • Como referencia para las estadísticas continuas (vitales), es decir, las que se hacen por varios periodos seguidos. • Para determinar los sistemas electorales de un país. • Otros propósitos.
Requisitos Auspicio oficial: Se llama así cuando el censo es auspiciado ―o sea, financiado― y llevado a cabo por el Gobierno nacional, con la cooperación de las autoridades regionales, provinciales y municipales. En España, Chile o Guatemala, el organismo responsable es el Ine, que quiere decir Instituto Nacional de Estadística. Territorio definido: En este caso, los censos deben tener un área territorial definida con precisión. Implica una división político – administrativa de la región y todas aquellas herramientas de tipo cartográfico ―de mapas― que aseguren una completa captación de información, sin omisiones ni duplicidades. Universalidad: El censo es exacto y cabal, es decir sin duplicaciones ni omisiones. Simultaneidad: Los censos pueden servir para el recuento exacto de la población total y para relacionar los datos de la población con un momento o periodo de tiempo bien definido. Por ello, generalmente, se fija una fecha para el levantamiento censal y además casi siempre una hora y un momento determinado, que se denomina "momento censal". Este momento se señala a menudo a media noche y sirve de línea cronológica ―es decir, de tiempo―, que separa a las personas que nacen o mueren después. De este modo determina claramente quienes deben figurar o no en el censo. Periodicidad: Se da si los censos se realizan en intervalos regulares. La periodicidad tiene gran importancia para determinar las tendencias demográficas.
Estadística Descriptiva − Semana 1
15
Ventajas La información obtenida cumpliendo estos requisitos puede presentarse por unidades administrativas ―departamentos, municipios, etcétera― u otras unidades de estratificación, cualquiera sea su tamaño, de manera que se pueden obtener datos de áreas pequeñas ―un barrio, un caserío, etcétera―. Otra ventaja es que la información sirve de punto de referencia para las estadísticas continuas, es decir, aquellas que describen cómo ha evolucionado una población. Por otro lado, el censo es el único procedimiento utilizable para saber sobre fenómenos que ocurren con poca frecuencia.
Desventajas Los censos son caros. El coste es alto, tanto por los esfuerzos humanos como materiales. Es decir, hacer un censo exige el empleo de una gran cantidad de recursos de personal, financieros y materiales. También es necesaria una vasta organización que abarque todo el universo que se va a investigar, procurando evitar omisiones y duplicaciones. A veces, hay demora en la obtención de resultados. En algunos casos, la información que se obtiene puede ser de inferior calidad (mayores errores) a la que se obtendría si la investigación se realizara por muestreo, es decir escogiendo una muestra (seleccionando un grupo significativo) y no haciendo la investigación con toda la población. Tomado de: http://goo.gl/1lsSfS
Ejercicio 1
Investigue en qué años fueron realizados los dos últimos censos en Guatemala.
16
IGER − Tacaná
El mundo de la estadística 1. ¿Qué es la estadística? La estadística es un conjunto de métodos para recolectar datos, organizarlos, interpretarlos y llegar a conclusiones con base en ellos. Es una rama de la matemática que surgió por la necesidad de los gobernantes de conocer, por ejemplo, cuántos habitantes tenía una ciudad o región, calcular la producción, sus territorios, estimar el tiempo que tardaban en terminar sus construcciones, establecer los impuestos y luego registrar ordenadamente toda esta información. La palabra estadística viene de la palabra alemana Staat, que significa estado o gobierno, pues este es el responsable de representar, describir y comparar la situación de cada región a su cargo. Actualmente se considera que el fundador y organizador de la estadística fue el alemán Godofredo Achenwall (1719 – 1772), profesor y economista de la Universidad de Leipzig, Alemania. Con el tiempo, la estadística ha ido evolucionando: • Originalmente se usó para contar la población de un país o las propiedades o bienes del Estado o de los gobiernos. • Más adelante, se ampliaron sus funciones y se empezó a usar para calcular las probabilidades de ganar en los juegos de azar (ruleta, dados, etcétera). • Actualmente es una ciencia que se aplica a muchas actividades humanas: desde las cuentas que llevan en una tienda, hasta las de una empresa o institución muy grande, una industria, cooperativa, escuela y muchas más. En general, la estadística se puede definir como la aplicación de la matemática al conjunto de técnicas que se utilizan en el procesamiento o análisis de datos. Se utiliza la matemática para elaborar promedios, tablas y gráficas con el fin de resumir y analizar los datos para una mejor toma de decisiones.
Ejercicio 2
Responda: ¿En qué actividades de la vida diaria utiliza la estadística?
Estadística Descriptiva − Semana 1
17
2. Las fuentes de información La información estadística puede obtenerse directamente de la realidad, es decir, de encuestas, cuestionarios, mediciones y observaciones directas. Estas se llaman fuentes primarias de información. También podemos obtener información estadística de cuadros, gráficas, tablas e investigaciones realizadas por otras personas. Estas se llaman fuentes secundarias de información. A continuación, se le proporcionan algunos sitios públicos donde puede encontrar información de fuentes secundarias: • Ine: http://www.ine.gob.gt/ • Biblioteca del Banco de Guatemala: http:// goo.gl/OFams0 • Biblioteca de la Universidad de San Carlos de Guatemala: http://goo.gl/cB5f8q • Secretaría de Planificación y Programación de la Presidencia, Segeplan: http://www.segeplan. gob.gt/2.0/
Ejercicio 3
Lea el siguiente caso e identifique las fuentes primarias y las fuentes secundarias de investigación. Haití es el país con mayor incidencia de tuberculosis en América. El sistema de vigilancia de tuberculosis es de importancia en la detección de casos y en generar información que apoye el control de esta enfermedad. La evaluación (del sistema de vigilancia) se llevó a cabo usando la guía de evaluación de sistemas de vigilancia de salud pública. Para la recolección de datos, se aplicó un cuestionario a los médicos y dirigentes de instituciones clave. Además se revisó el protocolo de vigilancia y del Programa Nacional de tuberculosis de agosto 2010. Fragmento adaptado del artículo elaborado por Fenelon Natael y Dely Patrick
1. Fuentes primarias: 2. Fuentes secundarias:
18
IGER − Tacaná
3. La pregunta de investigación y la hipótesis La estadística en la actualidad se usa en diversas actividades. Seguramente, ha visto que los productos empacados que se venden en las tiendas tienen fecha de vencimiento, o que algunos productos como las bombillas tienen impreso en el empaque el tiempo de vida útil o de funcionamiento. Las empresas tienen que realizar una investigación estadística para determinar cuánto durará cada producto. Cuando se quiere planificar una investigación lo primero que hay que determinar es cuál es el problema que se desea investigar. Este problema se puede escribir en forma de pregunta o como una afirmación. Por ejemplo, en el caso de la leche envasada en tetrapack, la pregunta de investigación podría ser: ¿cuánto tiempo tarda en descomponerse el primer litro de leche luego de ser empacado?
Otros ejemplos de pregunta de investigación pueden ser: a. ¿Qué quiere la mayoría de estudiantes: construcción de una cancha de fútbol o de basquetbol? b. ¿Qué porcentaje de estudiantes opina que el atol de la refacción tiene buen sabor? La pregunta, como puede verse, debe aclarar lo que se quiere estudiar. Luego de plantear la pregunta, se debe dar una respuesta tentativa o posible, a la cual se le llama hipótesis. Las hipótesis se plantean basándose en las experiencias que uno ha tenido. Por ejemplo, si se sabe que en la comunidad nadie tiene pelotas de basquetbol y nadie juega basquetbol, entonces la hipótesis puede ser:
La mayoría de estudiantes prefiere la construcción de una cancha de fútbol.
Estadística Descriptiva − Semana 1
19
La hipótesis también se plantea basándose en una observación general de alguna situación, por ejemplo, si cuando se reparte el atol un poco más de la mitad del grupo lo toma con gusto, la hipótesis puede ser:
El 60 % de estudiantes opina que el atol de la refacción tiene buen sabor.
Como vemos, una hipótesis bien planteada responde a la pregunta de investigación. Pero, además, debe ser enunciada de una forma que se facilite demostrarla. En el caso de las canchas, la forma como se planteó la hipótesis sugiere preguntar a los estudiantes: ¿Quiénes están a favor de la construcción de una cancha de fútbol? y ¿quiénes están a favor de una de basquetbol? En el caso de estatura entre hombres y mujeres, se puede preguntar ¿quiénes son más altos, las mujeres o los hombres de la escuela? Una hipótesis podría ser: Las mujeres son más altas que los hombres. La anterior hipótesis me indica que para probarla debemos medir la estatura de hombres y mujeres y comparar las estaturas promedio. 165 cm
160 cm
155 cm
En una investigación que solo pretende describir un fenómeno, no es necesaria la hipótesis. A partir de la pregunta e hipótesis (si es necesaria) se puede pensar en cómo utilizar la estadística.
Ejercicio 4
Se quiere saber cuál es el precio del dólar estadounidense el día de hoy. 1. Escriba una hipótesis: 2. ¿Cuál sería una fuente primaria? 3. ¿Cuál sería una fuente secundaria?
20
IGER − Tacaná
4. La unidad de análisis La unidad de análisis es el objeto o cosa que se va a estudiar. Para entenderlo, veremos el siguiente ejemplo: En la aldea Pipiltepeque Abajo hay una cooperativa de familias que se dedican a la producción de miel. • Si se quiere saber qué cantidad de miel producen los panales, la unidad de análisis será "panal", el panal es lo que vamos a estudiar. • Si se va a medir la cantidad de miel que produce una abeja, la unidad de análisis sería "abeja", es a la abeja a la que vamos a estudiar. • Siguiendo con el ejemplo, si se va a hacer una encuesta sobre la opinión que tienen los apicultores sobre el sabor de la miel, la unidad de análisis sería: "apicultor". • Si se quiere saber el número de apicultores por comunidad habitada, la unidad de análisis sería "comunidad".
¿Sabía que las personas que crían abejas se llaman apicultores? El nombre apicultor viene de la palabra latina apis, que significa abeja.
• Si se quiere saber el ingreso familiar, la unidad de análisis sería: "familia". Mientras que si se quiere saber el ingreso de los padres de familia, ¿cuál sería la unidad de análisis? Sería: "padre de familia".
Ejercicio 5
Lea los siguientes casos e identifique la posible unidad de análisis. 1. El Centro de Enfermedades Respiratorias evaluó a 200 niños menores de tres años que han padecido ataques de asma en los últimos seis meses. 2. El Ministerio de Agricultura, Ganadería y Alimentación (Maga) determinó que el 95 % de las abejas de un apiario estaba saludable. 3. El Maga determinó que el 70 % de las plantas de café de un cafetal tenía roya. 4. El Maga determinó que el 60 % de los cafetales tenía roya.
Estadística Descriptiva − Semana 1
21
5. Las variables De la unidad de análisis "familia" podemos estudiar varias características, tales como: ingreso, número de integrantes de la familia, tipo de casa que tiene, edad del padre, escolaridad del padre, escolaridad de la madre, etcétera. Cada una de estas características se denomina variable. Variable es la característica que se estudia de una unidad de análisis. Las variables que se estudian son las que necesitamos para tomar decisiones.
De la unidad de análisis "panal" podemos estudiar las variables: número de abejas, calidad de miel, cantidad de miel, etcétera.
5.1 Las variables tienen categorías Cuando se habla de variables hay que distinguir dos elementos, a saber: La variable en sí y las categorías de la variable. Las categorías son los valores que la variable puede tomar o que el investigador le asigna. Estas categorías las define el investigador. Para la unidad de análisis apicultor, podemos estudiar las variables: sexo, nivel de escolaridad, número de panales que tiene el apicultor, número de botellas de miel que produce el apicultor y calidad de la miel que produce el apicultor, estas cuentan con las siguientes categorías: • Sexo del apicultor. Tiene las categorías: hombre y mujer, o sea dos (2) categorías. Unidad de análisis
Variable
Categorías Hombre
Apicultor
Sexo
2 categorías Mujer
22
IGER − Tacaná
• Nivel de escolaridad del apicultor. Las categorías podrían ser: sin estudios formales, nivel primario incompleto, nivel primario completo, nivel básico, nivel diversificado. O sea cinco (5) categorías. Unidad de análisis
Variable
Categorías Sin estudios formales Nivel primario incompleto
Apicultor
Nivel de escolaridad
Nivel primario completo
5 categorías
Nivel básico Nivel diversificado
• Estado civil del apicultor. Las categorías pueden ser: soltero, casado, unido, viudo. O sea tres (3) categorías. Unidad de análisis
Variable
Categorías Soltero
Apicultor
Estado civil
Casado o unido
3 categorías
Viudo
• Número de botellas de miel que produce el apicultor. Las categorías podrían ser diez (10), veinte (20), veinticinco (25), etcétera. Varias categorías. Unidad de análisis
Variable
Categorías 10
Apicultor
Número de botellas de miel
20 25
Varias categorías
Etc.
Estadística Descriptiva − Semana 1
23
• Calidad de la miel que vende el apicultor. Las categorías pueden ser: buena, regular, mala. O sea, tres (3) categorías. Unidad de análisis
Variable
Categorías Buena
Apicultor
Calidad de la miel
Regular
3 categorías
Mala
• Número de panales del apicultor. Las categorías podrían ser: 4, 6, 10, etcétera. Varias categorías. Unidad de análisis
Variable
Categorías 4
Apicultor
Número de panales
6 10
Varias categorías
Etc.
Ejercicio 6
Lea los siguientes casos e identifique posibles unidades de análisis y su variable: 1. En la aldea Chan Chan, el 5 % de los niños menores de 10 años no sabe leer ni escribir. a. Unidad de análisis: b. Variable: 2. En la aldea El Chiltepe, el 75 % de las vacas produce más de 4 litros de leche por día. a. Unidad de análisis: b. Variable: 3. En la academia de mecanografía, 4 de cada 5 alumnos escriben más de 50 palabras por minuto. a. Unidad de análisis: b. Variable:
24
IGER − Tacaná
5.2 Clasificación de las variables Las variables puede ser de dos tipos: cualitativas y cuantitativas. Variables cualitativas Son las que describen características a las que no se pueden asignar números en la investigación. Aquí se depende de lo que digan las personas a las que se investiga. Las variables sexo (hombre, mujer), escolaridad (sin estudios formales, nivel primario incompleto, nivel primario completo, etc.) y calidad de la miel (buena, regular o mala) son variables cualitativas. Variables cuantitativas Son las que describen características que sí se pueden medir utilizando números. La principal característica de las variables cuantitativas es que están dadas en unidades de medición, como metros, libras, litros, horas, etc. Por ejemplo: número de panales, cantidad de producción de miel, etcétera.
Ejercicio 7
Hay variables que se pueden medir en forma cualitativa y cuantitativa. Por ejemplo: si se pregunta el tamaño de un terreno, la respuesta grande, mediano o pequeño se refiere a una variable cualitativa; pero si la respuesta es en número de cuerdas, brazadas, tareas, manzanas, metros cuadrados, etc., se refiere a una variable cuantitativa. Marque con una "x" si las variables son cualitativas, cuantitativas o ambas.
Variable
Cualitativa
Cuantitativa
1. Película favorita 2. Tamaño de la casa 3. Metros cuadrados de construcción 4. Largo de un vestido 5. Sabor de helado
Estadística Descriptiva − Semana 1
25
Vocabulario básico categoría: son los valores que la variable puede tomar o que el investigador le asigna. Por ejemplo, en la variable estatura las categorías pueden ser alto y bajo; en la variable temperatura del agua líquida, la categoría podría ser cualquier temperatura entre 0 y 100 grados Celsius. censo: colección de datos de cada elemento de una población. Por ejemplo, cuando el gobierno hace un censo de población, recoge los datos que le interesa conocer de todos los habitantes. Estos datos pueden ser edad, sexo, ingresos, nivel de escolaridad y otros. hipótesis: luego de plantear la pregunta se debe dar una respuesta tentativa o posible, a esta se le llama hipótesis. pregunta de investigación: cuando se quiere planificar una investigación lo primero que hay que determinar es cuál es el problema que se desea investigar. Este problema se puede escribir en forma de pregunta y entonces es la pregunta de investigación. unidad de análisis: es lo que se va a estudiar. Por ejemplo, si se quiere saber sobre la producción de huevos, la unidad de análisis puede ser la gallina o el gallinero, dependiendo de si se quiere conocer la producción de la gallina o de todas las gallinas del gallinero. variable: son características de interés sobre cada elemento individual de una población o muestra, por ejemplo, la edad de una persona, su peso o su estatura.
Ejercicio guiado Tomando el ejemplo de la miel, haremos un repaso del contenido visto en la semana, utilizando la variable cuantitativa. El apiario de la cooperativa de la aldea Pipiltepeque Abajo posee 140 colmenas y produce miel para exportación. Este año tiene un pedido de 270 galones de miel. Las familias de la cooperativa son las encargadas del cuidado de los apiarios y de sacar la miel de los panales. La miel que venden no es mezclada con otros ingredientes sino es miel pura, por lo que su calidad es excelente. Por experiencia los productores saben que una colmena produce un máximo de 2.5 galones, un mínimo de 1.7 galones y un promedio estimado de 2 galones de miel. 1. Recordemos que la pregunta de investigación se refiere al problema que queremos investigar, puede plantearse como afirmación o pregunta. Ya que este ejemplo es sobre la variable cuantitativa, tenemos que tomar en cuenta que la pregunta será sobre características que se pueden medir cuantitativamente; es decir, con números.
26
IGER − Tacaná
2. La hipótesis nos dará una respuesta posible a nuestra pregunta de investigación. La hipótesis la basamos en nuestra experiencia, conocimiento y observación. La forma en que se plantea la hipótesis nos debe facilitar demostrarla. 3. La unidad de análisis es el objeto o cosa que se va a estudiar. 4. Las variables son las características que se estudian de una unidad de análisis. Si son variables cualitativas, se debe recordar que no se pueden medir con números, como el género, calidad, sabor, color, gustos, etc. Si son variables cuantitativas, se debe recordar que son las que se pueden medir, como las libras, metros, litros, pulgadas, lotes, cantidad de personas, toneles, botellas, cajas, etcétera. En este caso revisamos la variable cuantitativa. 5. Las categorías son los valores que la variable puede tomar o que se le asignan. Para cada variable, se pueden encontrar múltiples categorías. Pregunta de investigación: Hipótesis: Unidad de análisis:
¿Logrará el apiario producir 270 galones de miel? El apiario producirá 270 galones de miel El apiario
Variable cuantitativa:
Cantidad producida
Categorías:
270 galones de miel
Autocontrol Actividad 1 Utilizando el ejemplo anterior, trabaje con la variable cualitativa. 0. La pregunta de investigación podría ser:
¿Qué calidad de miel se produce en el apiario?
1. Elabore una hipótesis que responda a la pregunta: 2. Defina cuál es la unidad de análisis: 3. Escriba la o las variables que va a estudiar: 4. Escriba las categorías de cada variable: Estadística Descriptiva − Semana 1
27
Actividad 2 Veamos la siguiente noticia del año 2010 sobre el precio del tomate. Escriba una pregunta de investigación, hipótesis, unidad de análisis, variables (definir qué tipo de variable se usa) y categorías de cada variable.
28
IGER − Tacaná
Fuente: Prensa Libre, 21 diciembre 2010
1. Escriba una pregunta de investigación. 2. Elabore una hipótesis que responda a la pregunta. 3. Defina cuál es la unidad de análisis. 4. Escriba la o las variables que va a estudiar. 5. Escriba las categorías de cada variable. 6. Clasifique a cada variable como cualitativa o cuantitativa. Estadística Descriptiva − Semana 1
29
Actividad 3 Complete el siguiente crucigrama. 1
2
3
4
5
Horizontales
Verticales
3. Tipo de variable que no se mide con números.
1. Valores que puede tomar una variable.
4. Característica que se estudia en una unidad de análisis.
2. Respuesta tentativa a una pregunta de investigación.
5. Tipo de variable que sí se mide con números.
3. Es el estudio en toda la población.
Navegue en la red Instituto Nacional de Estadística (Ine) El Instituto Nacional de Estadística (Ine) es la institución encargada de recopilar, producir, analizar y difundir estadísticas confiables. En su base de datos se encuentran estadísticas sociodemográficas, económicas, ambientales y de seguridad y justicia. Si necesita obtener datos estadísticos sobre cualquier lugar poblado del país, visite la página: www.ine.gob.gt
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
30
la casilla que mejor indique su rendimiento.
Conozco el origen y el uso de la estadística. Evalúo las fuentes de información. Planteo preguntas de investigación e hipótesis. Clasifico las variables. IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
2 Conceptos básicos de estadística ¿Qué encontrará esta semana?
Repasemos los conceptos básicos de la semana 1
¿Cómo se hace una encuesta?
Clasificación de las variables, población, muestra y muestreo aleatorio
Esta semana logrará: Clasificar las variables cualitativas y cuantitativas. Determinar la población o universo de una investigación. Seleccionar una muestra.
Estadística Descriptiva − Semana 2
31
¡Para comenzar! Repasemos los conceptos básicos de la semana 1 La semana pasada vimos los elementos que deben tomarse en cuenta para realizar una investigación. El primer paso es definir adecuadamente el problema que va a investigarse. Este se puede plantear a través de una afirmación o pregunta de investigación. El siguiente paso es plantear una posible respuesta a la pregunta de investigación, esa posible respuesta se conoce como hipótesis. Otros elementos que son parte de la investigación estadística son: la unidad de análisis, las variables y las categorías de la variable. También es importante saber clasificar una variable como cualitativa o cuantitativa. Veamos un ejemplo: Un examen de matemática se entrega a un grupo de estudiantes para saber el conocimiento que tienen acerca de la suma. La pregunta de investigación es: ¿Qué tanto saben sumar los estudiantes? Como se mencionó la semana anterior, la hipótesis no siempre es necesaria. Se plantea una hipótesis únicamente cuando se quiere demostrar algo, en este caso no se quiere demostrar nada, sino únicamente medir el conocimiento de los estudiantes. Hipótesis: Unidad de análisis: Variable cuantitativa: Categorías:
No es necesaria Estudiantes Punteo en el examen Calificaciones de 0 a 100
La variable es cuantitativa porque las categorías se representan con números. Para reflexionar: Si no conozco una cosa, la investigaré. Louis Pasteur
32
IGER − Tacaná
Lectura ¿Cómo realizar una encuesta? La encuesta es una herramienta muy utilizada en todas las disciplinas sociales, que permite recolectar gran cantidad de datos. Esta técnica de investigación sirve, entre otras cosas, para recabar información comparable sobre las opiniones de una cantidad importante de personas.
Elaboración de encuestas El primer paso para organizar una encuesta es elaborar con claridad qué queremos averiguar y cuáles son los objetivos de nuestra investigación. En un segundo momento hay que definir, en función de los objetivos, a quiénes queremos encuestar. Esto es el universo. Si este universo es muy grande se selecciona una muestra, que es un grupo significativo del universo, o total. Luego de plantear los objetivos y decidir con qué muestra se va a realizar la encuesta, el tercer paso es la confección del cuestionario. Este debe elaborarse a partir de los objetivos de la investigación. Debemos procurar que las preguntas que formulemos no se superpongan, estén bien ordenadas y puedan ser claramente entendidas por los encuestados. También es importarte tener en cuenta el tamaño del cuestionario. Es posible que uno demasiado corto no nos brinde la información necesaria para nuestros objetivos, pero una lista muy larga de preguntas hace difícil mantener el nivel de interés en los encuestados. Si el encuestador solo pide al encuestado hacer una marca para indicar cuál fue la opción elegida, el cuestionario se llama "estructurado". La marca puede ser, por ejemplo, una X en la casilla de respuesta a la pregunta o afirmación del cuestionario. El cuestionario “estructurado” simplifica el análisis de los datos. También se simplifica el análisis cuando el entrevistado debe elegir solo una de las opciones propuestas en el cuestionario. Siempre hay que incluir, además, una opción para los que no saben qué contestar o no quieren hacerlo, conocida como “no sabe/no contesta”. Por otra parte, es importante que las primeras preguntas brinden información sobre algunas características de los encuestados, como sexo, edad, nivel de instrucción u otras que sean importantes para la investigación. Una pequeña introducción que contengan quiénes somos y por qué estamos haciendo la encuesta facilita el trabajo, ya que genera confianza y nos resultará más fácil obtener la información que buscamos. Al finalizar la encuesta hay que despedirse amablemente del encuestado y comprobar que tenemos los datos de contacto de la institución visitada, por ejemplo, una fábrica o una escuela donde se realiza la investigación. Tomado de:http://goo.gl/rREuV4
Estadística Descriptiva − Semana 2
33
El mundo de la estadística 1. Clasificación de las variables Las variables se clasifican en cualitativas y cuantitativas: • Cualitativas son las que tienen categorías con nombres o que no se pueden medir. • Cuantitativas son las que tienen categorías que son números y que se pueden sumar, restar, etc.
1.1 Clasificación de las variables cualitativas Las variables cualitativas se dividen en nominales y ordinales. a. Variables nominales
Una variable se clasifica como nominal cuando las categorías son diferentes, sin ninguna relación unas con otras y no tienen un orden.
Ejemplo 1 Variable: sexo. Categorías: mujer y hombre. • La categoría hombre es diferente de mujer. No se puede establecer ningún ordenamiento o nivel de mayor a menor. Ejemplo 2 Variable: departamento donde vive. Categorías: Guatemala, Escuintla, Baja Verapaz, Jutiapa, etc. • Cada uno de los departamentos es diferente al otro. Si se trata solo de indicarlo, ninguno es más importante o menos importante. Otras variables que se clasifican como nominales son: estado civil, religión, profesión, tipo de trabajo, etc.
Ejercicio 1
Circule solo los números de los ejemplos de variables nominales. 1. Los ingresos mensuales de un grupo de personas.
4. Clasificación por apellidos.
2. Personas ordenadas según su edad.
5. Medidas de un terreno.
3. El estado civil de las personas.
34
IGER − Tacaná
b. Variables ordinales
Una variable se clasifica como ordinal cuando se puede establecer un orden en las categorías estableciendo que una es "más" que la otra.
Ejemplo 1 Variable: orden de llegada a la meta. Categorías: Una competencia deportiva.
Ejemplo 2 Variable: tamaño de los árboles. Categorías: árbol grande, árbol mediano, árbol pequeño.
Ejemplo 3 Variable: calificación en matemática. Categorías: sobresaliente, muy bueno, bueno, regular.
Ejemplo 4 Variable: calidad de miel. Categorías: buena, regular, mala.
Ejercicio 2
Circule solo los números de los ejemplos de variables ordinales. 1. Afiliación a un partido político. 2. Las notas de una prueba de evaluación. 3. Estatura. 4. Llegada a la meta en una competencia. 5. Clasificación del servicio de un hotel.
Estadística Descriptiva − Semana 2
35
1.2 Clasificación de las variables cuantitativas Las variables cuantitativas se clasifican en discretas y continuas. a. Variables discretas
La variable discreta es la que toma valores puntuales, es decir, que no incluye otros valores intermedios entre dos valores específicos. Ejemplo: Los alumnos en cada sección de primer grado de primaria de la escuela.
Variable: número de alumnos. Categoría: sección A: 15, sección B: 18, sección C: 22. b. Variables continuas
Una variable continua es la que puede tomar infinitos valores comprendidos en un intervalo. Ejemplo: La estatura de un niño desde que cumple 3 años hasta que cumple 4 años.
Variable: estatura. Categoría: 96.5 a 99.14 cm. Ahora veamos un esquema sobre la clasificación de las variables: Variables cualitativas Variable nominal
Variable ordinal
Ejemplo variable: sexo
Ejemplo variable: calificación en matemática
Categoría de la variable: hombre – mujer
Categoría de la variable: sobresaliente, muy bueno, bueno, regular
Variables cuantitativas
36
IGER − Tacaná
Variable discreta
Variable continua
Ejemplo variable: alumnos
Ejemplo variable: estatura
Categoría de la variable: sección A: 15, sección B: 18, sección C: 22
Categoría de la variable: 96.5 a 99.14 cm
2. Población Cuando se trabaja con estadísticas hay que definir otros dos elementos importantes: la población y la muestra. La población es el conjunto de todas las unidades de análisis que nos dan la información que necesitamos. Se debe definir bien qué elementos pertenecen a la población para no incluir elementos que no interesan a la investigación que estamos haciendo. También se le llama universo.
Recuerde que las unidades de análisis no son solamente personas sino puede ser cualquier elemento que se va a estudiar.
Ejemplo: Si queremos saber cuánta miel producen los apicultores del municipio de Jacaltenango, solo incluiremos en la población a los apicultores de Jacaltenango y a ningún otro apicultor de los municipios cercanos.
Ejercicio 3
Un ejemplo de población son todos los maestros y maestras de Guatemala. Escriba otros tres ejemplos de población. 1. 2. 3.
Estadística Descriptiva − Semana 2
37
3. Muestra La muestra es un subconjunto de la población. La muestra debe ser representativa, esto quiere decir que las características presentes en la población deben estar representadas en la muestra.
80 % > 10 o más colmenas
20 % < 10 o más colmenas
Ejemplo: Si el 20 % de los apicultores de Jacaltenango tiene menos de 10 colmenas y el 80 % tiene 10 o más colmenas, la muestra debe ser también aproximadamente un 20 % con menos de 10 colmenas y un 80 % con más de 10 colmenas. La proporción entre población y muestra se debe mantener.
Ejercicio 4
Si queremos realizar una encuesta a todas las personas nacidas en Guatemala antes de 1990, nos resultará imposible debido al gran número de ellas, entonces elegiremos una muestra. Escriba otros tres ejemplos de muestra. 1. 2. 3.
38
IGER − Tacaná
3.1 Tamaño de la muestra ¿Cómo determinar el tamaño adecuado de una muestra? En estadística, la muestra debe contar con el número necesario de elementos para que dé la información necesaria para generalizar los resultados.
¿Cuántos elementos de muestra se necesitan? Si no se conoce el número de elementos de la población, estadísticamente se necesitan aproximadamente 400 elementos de muestra en general. Si se conoce el número de elementos de la población, se puede utilizar la siguiente fórmula.
n=
Donde:
0.25 • N 0.000625 • N + 0.25
N es el número de elementos de la población n es el tamaño de la muestra 0.25 y 0.000625 son constantes, para la selección de muestras.
Ejemplo: Queremos saber cuánta miel producen los apicultores de Jacaltenango que tienen abejas Apis Mellifica Subsp Ligustica. Por lo tanto, nuestra población son solo los productores que crían esta especie de abeja. Entonces, si el 40 % de los apicultores de Jacaltenango tiene abejas Apis Mellifica Subsp Ligustica, en la muestra deben estar representados aproximadamente en un 40 %. Por lo que suponiendo que tenemos una población de 50 apicultores, según la fórmula se necesita una muestra de 44 apicultores, como se muestra a continuación:
n=
0.25 • N 0.000625 • N + 0.25
=
0.25 • 50 0.000625 • 50 + 0.25
= 44
Estadística Descriptiva − Semana 2
39
3.2 Selección de la muestra 1. Sesgo (según el Drae): torcido, cortado o situado oblicuamente. 2. Error: diferencia entre el valor “real” y el obtenido en la investigación. 3. Sesgo: error “torcido”. Que se comete en un solo sentido.
Una vez definido el tamaño de la muestra, el siguiente paso es elegir el método de muestreo, esto quiere decir que debemos indicar cómo vamos a obtener la muestra. Este es un paso muy importante ya que si escogemos la muestra de manera incorrecta podemos echar a perder la investigación, pues la información obtenida no representaría las características de la población. Por ejemplo, si yo quiero saber la estatura promedio de los alumnos de primaria de la escuela, pero a la hora de elegir la muestra escojo solamente alumnos de primer grado porque son los que me quedan más cerca, estoy introduciendo un sesgo en la medición y voy a obtener una altura menor al promedio real, pues solo medí a los alumnos más pequeños.
Una forma para evitar el sesgo es tomar las muestras aleatoriamente. La palabra aleatorio significa "con igual probabilidad", y cuando se hace una muestra que es aleatoria significa que "todos los elementos de la población tienen la misma probabilidad de formar parte de la muestra". Un ejemplo es cuando organizamos grupos de trabajo y le decimos a las personas que se numeren del 1 al 5 (o según el número de grupos que necesitemos). Los grupos se forman aleatoriamente, pues las personas no deciden con anticipación a cuál grupo pertenecer; por lo tanto, cualquier persona tiene la misma probabilidad de pertenecer al grupo 1, 2, 3, 4, etc.
40
IGER − Tacaná
4. Muestreo aleatorio Existen varios métodos de muestreo aleatorio, esta semana veremos dos: l
Muestreo aleatorio simple
l
Muestreo aleatorio sistemático
Además, hablaremos del muestreo no aleatorio. a. Muestreo aleatorio simple y números aleatorios Es difícil realizar un muestreo perfectamente aleatorio. Si la población no es demasiado grande, el procedimiento normal consiste en numerarla y luego seleccionar la muestra eligiendo los elementos en una tabla de números aleatorios. Una tabla de números aleatorios es un conjunto de números enteros del 0 al 9, usualmente generada por computadora y que tiene como característica que todas las cifras aparecen en proporciones aproximadamente iguales y sin ninguna tendencia en su agrupación. Este es un ejemplo de tabla que contiene números aleatorios.
Col. Nº22
Col. Nº23
Col. Nº24
Col. Nº25
Col. Nº26
Col. Nº27
Col. Nº28
A
B
C
A
B
C
A
B
C
A
B
C
A
B
C
A
B
C
A
B
C
12 11 17 01 10 30 02 23 21 22 28 19 27 15 16 03 06 09 14 13 04 18 26 29 20 05 25 24 08 07
0,051 0,068 0,089 0,091 0,100 0,121 0,166 0,179 0,187 0,205 0,230 0,243 0,267 0,283 0,352 0,377 0,397 0,409 0,465 0,499 0,539 0,560 0,575 0,756 0,760 0,847 0,872 0,874 0,911 0,946
0,032 0,980 0,309 0,371 0,709 0,744 0,058 0,529 0,051 0,543 0,688 0,001 0,990 0,440 0,089 0,648 0,769 0,428 0,406 0,651 0,972 0,747 0,892 0,712 0,920 0,925 0,891 0,135 0,215 0,065
26 03 29 13 24 18 11 09 06 22 20 21 08 27 07 28 16 04 17 05 02 30 14 15 19 23 10 12 01 25
0,051 0,053 0,100 0,102 0,110 0,114 0,123 0,138 0,194 0,234 0,274 0,331 0,346 0,382 0,387 0,411 0,444 0,515 0,518 0,539 0,623 0,637 0,714 0,730 0,771 0,780 0,924 0,929 0,937 0,974
0,187 0,256 0,159 0,465 0,316 0,300 0,208 0,182 0,115 0,480 0,107 0,292 0,085 0,979 0,865 0,776 0,999 0,993 0,827 0,620 0,271 0,374 0,364 0,107 0,552 0,662 0,888 0,204 0,714 0,398
08 16 11 21 18 17 26 01 12 03 10 05 25 27 24 20 06 07 09 13 22 04 19 02 29 14 23 30 28 15
0,015 0,068 0,118 0,124 0,153 0,190 0,192 0,237 0,283 0,286 0,317 0,337 0,441 0,469 0,473 0,475 0,557 0,610 0,617 0,641 0,664 0,668 0,717 0,776 0,777 0,823 0,848 0,892 0,943 0,975
0,521 0,994 0,400 0,565 0,158 0,159 0,676 0,030 0,077 0,318 0,734 0,844 0,336 0,786 0,237 0,761 0,001 0,238 0,041 0,648 0,291 0,856 0,232 0,504 0,548 0,223 0,264 0,817 0,190 0,962
02 16 26 11 07 05 14 18 28 06 15 10 24 22 27 19 21 17 09 30 03 08 12 23 20 01 29 25 04 13
0,039 0,061 0,068 0,073 0,123 0,126 0,161 0,166 0,248 0,255 0,261 0,301 0,363 0,378 0,379 0,420 0,467 0,494 0,620 0,623 0,625 0,651 0,715 0,782 0,810 0,841 0,862 0,891 0,917 0,958
0,005 0,599 0,054 0,812 0,649 0,658 0,189 0,040 0,171 0,117 0,928 0,811 0,025 0,792 0,959 0,557 0,943 0,225 0,081 0,106 0,777 0,790 0,599 0,093 0,371 0,726 0,009 0,873 0,264 0,990
16 01 04 22 13 20 05 10 02 07 30 06 12 08 18 19 03 15 09 14 26 29 25 24 27 21 28 13 11 17
0,026 0,033 0,088 0,090 0,114 0,136 0,138 0,216 0,233 0,278 0,405 0,421 0,426 0,471 0,473 0,510 0,512 0,640 0,665 0,680 0,703 0,739 0,759 0,803 0,842 0,870 0,906 0,948 0,956 0,993
0,102 0,886 0,686 0,602 0,614 0,576 0,228 0,565 0,610 0,357 0,273 0,807 0,583 0,708 0,738 0,207 0,329 0,329 0,354 0,884 0,622 0,394 0,386 0,602 0,491 0,435 0,367 0,367 0,142 0,989
21 17 10 05 06 07 16 08 13 02 25 28 20 14 26 27 12 29 23 22 18 11 01 04 19 03 30 09 24 15
0,050 0,085 0,141 0,154 0,164 0,197 0,215 0,222 0,269 0,288 0,333 0,348 0,362 0,511 0,540 0,587 0,603 0,619 0,623 0,624 0,670 0,711 0,790 0,813 0,843 0,844 0,858 0,929 0,931 0,939
0,925 0,403 0,624 0,157 0,841 0,013 0,363 0,520 0,477 0,012 0,633 0,710 0,961 0,989 0,903 0,643 0,745 0,895 0,333 0,076 0,904 0,253 0,392 0,611 0,732 0,511 0,289 0,199 0,263 0,947
29 07 25 09 10 03 23 13 20 05 26 30 17 02 27 14 12 28 21 22 16 06 04 08 15 19 18 01 11 24
0,042 0,105 0,115 0,126 0,205 0,210 0,234 0,266 0,305 0,372 0,385 0,422 0,453 0,460 0,461 0,483 0,507 0,509 0,583 0,587 0,689 0,727 0,731 0,807 0,833 0,896 0,916 0,948 0,976 0,978
0,039 0,293 0,420 0,612 0,144 0,054 0,533 0,799 0,603 0,223 0,111 0,315 0,783 0,916 0,841 0,095 0,375 0,748 0,804 0,993 0,339 0,298 0,814 0,983 0,757 0,464 0,384 0,610 0,799 0,633
Otra forma de obtener números aleatorios es a través de una calculadora científica en la función Ran#, que normalmente están en la tecla del punto decimal. Y la forma más fácil es con el programa de computación Excel, utilizando la función ALEATORIO.
Estadística Descriptiva − Semana 2
41
b. Muestreo aleatorio sistemático Este es otro método de muestreo aleatorio. Este método es especialmente conveniente cuando tenemos elementos que aparecen consecutivamente, es decir uno tras otro. Por ejemplo: las personas usuarias que llegan a una fila a comprar un boleto de bus extraurbano. El procedimiento básicamente consiste en dividir el número de elementos de la población (todas las personas usuarias del bus) entre el número de elementos de la muestra (muestra de las personas usuarias de bus) y este resultado es la cantidad de elementos que vamos a contar antes de incluir un nuevo elemento en la muestra. Ejemplo: Si se tiene 50 personas usuarias del bus y se necesitan 10 elementos de muestra, se divide 50 entre 10 y nos da como resultado 5, entonces se va a seleccionar una de cada 5 personas usuarias del bus, es decir que se selecciona la 5, la 10, la 15, etc.
50 personas usuarias del bus
10 elementos de muestra
1 de cada 5 personas
El único cuidado que hay que tener con este método es que puede generar un sesgo que se da en procesos cíclicos. Por ejemplo, si en una fábrica que produce pachas se elabora una pacha defectuosa cada 8 unidades, este método puede no detectarlo o puede generar una muestra con todos los elementos defectuosos.
4.1 Muestreo no aleatorio Algunas veces es posible utilizar una forma de muestreo no aleatorio y obtener buenos resultados, este método de muestreo se llama "por conveniencia". Por ejemplo, si alguien quiere investigar el precio de las tortillas en la ciudad puede obtener muy buenos resultados muestreando las tortillerías de su barrio. Para poder utilizar este tipo de muestreo adecuadamente, el investigador debe poseer gran experiencia y tiene que explicar claramente en el informe de investigación cómo seleccionó la muestra y las características.
42
IGER − Tacaná
Vocabulario básico muestra: es un subconjunto del universo. muestra aleatoria: es una muestra en la que sus elementos se seleccionan al azar. población o universo: es el conjunto de todas las unidades de análisis que nos dan la información que necesitamos. variable continua: es la variable que puede tomar infinitos valores comprendidos en un intervalo. variable discreta: es la variable que toma valores puntuales, es decir que no incluye otros valores intermedios entre dos valores específicos. variable nominal: es cuando una variable presenta categorías diferentes, sin ninguna relación unas con otras y sin un orden. variable ordinal: es una variable que permite establecer un orden o secuencia en las categorías.
Resumen Las variables se clasifican como cuantitativas y cualitativas. • Cualitativas son las que describen características que no se pueden medir. Se clasifican en nominales y ordinales. • Cuantitativas son las que describen características que sí se pueden medir. Se clasifican en discretas y contínuas. La población es el conjunto de todas las unidades de análisis que nos dan la información que necesitamos. Debido a dificultades para incluir a toda la población en una investigación, se selecciona una muestra, es decir, un subconjunto de la población. La muestra debe ser representativa, esto quiere decir que las características presentes en la población deben estar representadas en la muestra. Existen varios métodos para seleccionar la muestra, entre ellos: • Muestreo aleatorio simple, para lo cual se utiliza una tabla de números aleatorios, utilizando la función Ran# en la calculadora o la función ALEATORIO en el programa Excel de computación. • Muestreo aleatorio sistemático, que se utiliza cuando los elementos aparecen consecutivamente, es decir, uno tras otro. Se realiza seleccionando un determinado número, según el tamaño de la muestra. • Muestreo no aleatorio o por conveniencia, según las facilidades que se presenten para la investigación. Se requiere mucha experiencia para seleccionar una muestra confiable.
Estadística Descriptiva − Semana 2
43
Ejercicio guiado El 60 % de muelles está deteriorado en Sololá Al menos el 60 por ciento de los más de 500 muelles, que hay en la orilla del lago de Atitlán, Sololá, están deteriorados o dañados, debido a la falta de mantenimiento y al fuerte oleaje que hay por la crecida de ese manto acuático, denunciaron vecinos, quienes pidieron a las autoridades arreglos inmediatos de estas estructuras para evitar tragedias. Prensa Libre, 5 abril 2014
Pregunta de investigación: Hipótesis: Unidad de análisis: Variable: Categorías: Variable cualitativa: Variable nominal: Población: Muestra:
¿Qué porcentaje de muelles está deteriorado en el lago de Atitlán? Más del 50 % de los muelles del lago de Atitlán está deteriorado El muelle (lo que se estudia es el muelle) El deterioro (por medio de la observación, se mide el deterioro del muelle) Deteriorado, no deteriorado Es cualitativa, porque a las categorías se les dio un nombre La variable deterioro tiene dos categorías diferentes; por eso es nominal El universo, o sea, todos los muelles del lago de Atitlán No la describe la noticia
Se quiere hacer una investigación acerca de lo que opinan los visitantes a Santa Catarina Palopó sobre el estado del muelle. Para hacerlo, el encuestador entrevista a uno de cada cinco turistas y le pregunta si considera que el muelle está en buen o mal estado.
Pregunta de investigación:
¿Qué opinan los turistas que llegan a Santa Catarina Palopó sobre el estado del muelle?
Hipótesis:
Más del 50 % de los turistas opina que el muelle se encuentra en mal estado
Unidad de análisis:
44
IGER − Tacaná
Turista
Variable:
Opinión sobre el estado del muelle (observe que la variable es la opinión y no el estado en sí del muelle) La variable es cualitativa a nivel nominal
Variable nominal:
Es el universo, o sea, todos los turistas que utilizan el muelle de Santa Catarina
Población:
La muestra es el grupo de turistas conformado por uno de cada cinco turistas entrevistados. (La muestra se seleccionó en forma aleatoria sistemática)
Muestra:
Autocontrol Actividad 1 Resuelva el siguiente crucigrama.
1
2
3
4
5 6
7
8
9
10
Horizontales 3. Al azar. 4. Diferencia entre valor real y obtenido. 7. Ejemplo de variable nominal. 8. Muestreo que se realiza al tomar uno de n elementos seleccionados. 9. Subconjunto tomado de la población. 10. Variable que solo toma valores enteros. Verticales 1. Conjunto de unidades de análisis que dan información en la investigación. 2. Sinónimo de población. 5. Ejemplo de variable continua. 6. Error que se comete en un solo sentido.
Estadística Descriptiva − Semana 2
45
Actividad 2 Se quiere determinar cuánto gastan las familias de turistas que llegan al balneario Los Chorros, en San Pedro Pinula, Jalapa. Para hacerlo, el investigador le pide a los dueños de los restaurantes que se encuentran instalados en el lugar que contabilicen cuánto es lo que gastan las familias que llegan y de cuántas personas se compone el grupo. (Esta es una forma de hacerlo. Otra sería preguntarles directamente a los turistas). Llevar el control: lo harán con todas las familias de turistas que lleguen durante la Semana Santa del presente año ya que es el momento en que el investigador puede hacer la investigación. 1. Pregunta de investigación: 2. Hipótesis: 3. Unidad de análisis: 4. Variable: 5. Categorías de la variable: 6. ¿La variable es cualitativa o cuantitativa? ¿Por qué? 7. ¿La variable es nominal, ordinal o cuantitativa? ¿Por qué? 8. ¿Cuál es la población o universo? 9. ¿Cuál es la muestra? 10. ¿Cómo se seleccionó la muestra: de forma aleatoria o no aleatoria?
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
46
la casilla que mejor indique su rendimiento.
Clasifico las variables cualitativas y cuantitativas. Determino la población o el universo de una investigación. Selecciono una muestra.
IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
3 ¿Cómo seleccionar una muestra? ¿Qué encontrará esta semana? Midiendo la felicidad ¿Cómo realizar una encuesta? (segunda parte) Muestreo por conglomerados y muestreo estratificado
Esta semana logrará: Conocer los pasos para realizar una encuesta. Aplicar el uso de muestreo por conglomerados. Aplicar el uso de muestreo estratificado. Diferenciar entre estadística descriptiva y estadística inferencial. Reconocer si un dato es un estadístico o un parámetro.
Estadística Descriptiva − Semana 3
47
¡Para comenzar! Midiendo la felicidad
¡A trabajar! Si pudiera medir la felicidad, ¿qué le gustaría saber? Para ello, responda las preguntas siguientes. 1. ¿Qué es la felicidad?
2. ¿Qué variables podríamos considerar?
3. ¿Qué tipo de muestra escogeríamos?
4. ¿Qué significa el texto de la imagen?
48
IGER − Tacaná
Lectura ¿Cómo realizar una encuesta? (segunda parte) • Para realizar una encuesta, elijan un asunto de interés que esté comentando la gente, es decir, un asunto de opinión pública. • Busquen artículos en periódicos y revistas para contar con más información sobre el tema que van a investigar. • Planteen los objetivos de la investigación. Definan cuál va a ser el universo. Para fines prácticos pueden elegir a los habitantes de la ciudad o el barrio donde viven. • Indiquen cuántas encuestas van a pasar y cómo van a seleccionar a los encuestados. Les conviene elegir un número de 100 casos. Como se trata de una muestra no probabilística, sus resultados no representarán al universo. • Elaboren el cuestionario. En primer lugar, elaboren una serie de preguntas que les permitan conocer las características de los encuestados, como la edad o el sexo. Dividan las edades en, por lo menos, tres grupos. Por ejemplo: menos de 20 años, entre 21 y 40 años, más de 41 años. Hagan lo mismo con otra característica que hayan seleccionado por ser relevante para su investigación, como por ejemplo el sexo de los encuestados: hombres o mujeres. Luego redacten las preguntas que les permitan conocer la opinión de los encuestados sobre el tema elegido. Recuerden poner todas las opciones posibles de respuesta en cada una y no olviden el NS/NC (no sabe/no conoce). • Analicen los datos, presenten los resultados en gráficos y redacten un pequeño informe. En el informe deben consignar los objetivos del trabajo, el método de encuesta utilizado, los datos obtenidos (explicaciones y gráficos) y las conclusiones. Tengan en cuenta que, aunque hayan encuestado a varias personas, los resultados no pueden generalizarse, o sea aplicarse a toda la población. Sin embargo, sirven para sacar conclusiones provisorias. Tomado de: http://goo.gl/cXGvaK
Estadística Descriptiva − Semana 3
49
El mundo de la estadística 1. Repasando conceptos básicos En la vida, algunas veces se presentan oportunidades para realizar investigaciones. Los temas varían y la investigación podría ser sobre productos como alimentos, artículos para belleza, calzado, medicina. En otras ocasiones, podría ser sobre aspectos sociales como los índices de empleo, ingresos, educación, salud y otros muchos más. La estadística se utiliza en investigaciones de diferente tipo para ordenar y procesar datos, lo cual permite analizarlos de mejor manera. Sirve para los conteos más simples, pero también para los más complejos. Cuanto más y mejor la comprendamos, mejores usos podremos darle. La estadística es muy importante, porque proporciona información respaldada, que la hace confiable. La información está respaldada porque se basa en estudios objetivos; es decir, en los que no entra la opinión del investigador, ni sus consideraciones subjetivas. De acuerdo con lo visto la semana pasada, en una investigación se parte de la pregunta de investigación para luego elaborar la hipótesis, que es una posible respuesta a la pregunta. Hay otros elementos que son importantes para el trabajo de la estadística: la unidad de análisis, las variables y las categorías de la variable (recordemos que es importante saber clasificar una variable como cualitativa o cuantitativa). Ejemplo: Se aplica un examen de matemática a un grupo de 25 estudiantes de la Eorm de El Pajar. Los estudiantes fueron elegidos por el método de muestreo aleatorio simple. El examen va a medir el nivel de conocimiento del tema suma. Pregunta de investigación: Hipótesis: Variable:
¿Cuánto saben los estudiantes sobre la suma?
No es necesaria Conocimiento; puede trabajarse con el nombre de: Porcentaje de conocimiento Punteo en el examen l
l
Categorías: Clasificación o tipo de variable: Población: Muestra: Método de muestreo:
50
IGER − Tacaná
Calificaciones de 0 a 100 Cuantitativa: las categorías se representan por números Todos los estudiantes de la Eorm de El Pajar Los 25 estudiantes La muestra se seleccionó en forma aleatoria simple
2. Formas de seleccionar una muestra
(continuación de la semana 2)
Como vimos la semana anterior, la muestra puede ser obtenida en forma aleatoria simple y forma aleatoria sistemática. Esta semana veremos dos nuevos métodos de muestreo aleatorio: • Muestreo por conglomerados • Muestreo estratificado
2.1 Muestreo por conglomerados o racimos ¿Qué es un conglomerado? Un conglomerado es una sección o grupo formado por diversos elementos. Este método también se conoce como muestreo por racimos o cúmulos. Para la muestra se necesita contar con una población que se quiere investigar. La población puede estar conformada por personas, animales u objetos.
¿Cómo se realiza un muestreo por conglomerados? Para realizar un muestreo por conglomerados o racimos, primero se divide el área de la población en secciones o conglomerados, luego se seleccionan aleatoriamente algunos de estos conglomerados, utilizando para la muestra todos los elementos de los conglomerados seleccionados. Ejemplo: • Se puede dividir a toda la población de ciudadanos (por ejemplo, población de Guatemala) en diferentes conglomerados (que pueden ser los departamentos del país). • Se selecciona una serie de conglomerados de acuerdo con lo que interesa para la investigación. Esta selección se hace por medio de un muestreo aleatorio simple o sistemático. • Cuando se tienen los conglomerados seleccionados (podría ser los departamentos del país seleccionados al azar), se debe incluir, por ejemplo, a todos los estudiantes de primaria como elementos de la muestra.
Cuando las poblaciones que se quiere investigar son muy grandes, una forma más barata y fácil de obtener las muestras es por grupos o conglomerados.
Estadística Descriptiva − Semana 3
51
Ejemplo: Para hacer una investigación sobre una plantación de aguacates, se puede seleccionar por el método de muestreo aleatorio simple, lo que implicaría elegir aguacates al azar por toda la plantación. Pero también se pueden seleccionar árboles de aguacate al azar en toda la plantación como un conglomerado, en el cual todos los aguacates de cada árbol seleccionado son parte de la muestra. Este método facilitaría el muestreo para este caso. Si se quiere investigar cuántos pasajeros transportan las líneas de bus extraurbano diariamente, el trabajo se puede realizar con una muestra aleatoria simple o aleatoria sistemática, ya que la población de buses es grande. Si se usa como método la muestra por conglomerado utilizando el muestreo aleatorio simple, se seleccionan al azar empresas de buses de todas las que existen en Guatemala. Todos los buses de cada empresa seleccionada son entonces parte de la muestra.
Ejercicio 1 La directora de la escuela de niñas “La Aurora” desea conocer cuántas niñas de la comunidad no asisten a clases. La comunidad tiene 900 hogares distribuidos en 7 caseríos. Debido a la falta de fondos, planea realizar una encuesta y necesita conocer el tamaño de su muestra. 1. ¿Qué debe tomar en cuenta para realizar una muestra aleatoria? 2. ¿Qué debe tomar en cuenta para realizar una muestra por conglomerados? 3. ¿Qué tipo de muestra le recomendaría a la directora para realizar la encuesta y por qué?
52
IGER − Tacaná
2.2 Muestreo estratificado ¿Qué es estratificado? La palabra estratificado viene de estratificación, término que se refiere a la clasificación de una población en diferentes estratos o niveles. Un estrato o nivel tiene características que lo diferencian del resto de niveles. La principal función al establecer estratos o niveles es clasificar elementos, circunstancias o fenómenos. ¿Cómo se realiza un muestreo estratificado? Para realizar un muestreo estratificado o por estrato, se divide a la población en grupos de características homogéneas o similares que interesan para la investigación. • Si lo que se quiere investigar son los salarios en Guatemala, la variable sería salario.
Para establecer la muestra, se dividen los grupos por sus características: salario alto, salario medio y salario bajo. Cada uno de estos grupos es un estrato.
• De cada estrato se selecciona una muestra. Ejemplo: Si se quiere obtener el peso de todos los estudiantes de una escuela, se puede dividir a los estudiantes en dos estratos: hombres y mujeres. De cada grupo (estrato) se selecciona una muestra al azar por medio del muestreo aleatorio simple.
La principal diferencia entre el muestreo por conglomerados y el muestreo estratificado es que en el primero pasan a formar parte de la muestra todos los elementos que conforman el conglomerado; en cambio, en el muestreo estratificado se muestrean los estratos y se toman solamente algunos elementos de cada estrato como parte de la muestra.
Estadística Descriptiva − Semana 3
53
2.3 Objetivo de selección de una muestra El objetivo de utilizar una muestra es facilitar el proceso de investigación, ya que trabajar con las poblaciones totales (universo) puede ser muy difícil o imposible por las siguientes razones: • La cantidad de elementos que forman la población. • El acceso a los elementos que forman la población. • Los recursos necesarios para realizar las pruebas. • En algunas ocasiones, realizar las pruebas implica la destrucción del elemento que se va a analizar. Por ejemplo, si se tiene un lote de baterías y se quiere saber la duración promedio de ellas, para saber la duración hay que ponerlas a funcionar hasta que su carga se agote. Esto es, se pierde la batería, se destruye la batería. Si se quiere saber la cantidad de agua que tienen los botes, hay que abrirlos y medir con instrumentos más finos la cantidad de agua, esto es se "destruye" el bote porque ya no se puede vender. • Otras razones. Si en el momento de realizar una investigación se encuentra con alguna de las dificultades anteriores, lo recomendable es trabajar con una muestra. Si se quiere conocer alguna característica de una población, por ejemplo el número de huevos que ponen las gallinas que tiene una familia, en una comunidad determinada, lo que se puede hacer es medir cuántos huevos ponen las gallinas en la comunidad, es decir toda la población de gallinas. Hacer esta investigación en todo el universo (todas las gallinas) no es problema en este caso, porque la población no es tan grande y es fácilmente accesible. Sin embargo, en muchas ocasiones las poblaciones son demasiado grandes, por ejemplo cuando se quiere calcular la producción de huevos por gallina a nivel nacional. En estos casos, los elementos de la población tampoco son fácilmente accesibles.
Tiene, entonces, sentido obtener una muestra, ya que el objetivo de seleccionarla es poder hacer generalizaciones acerca de la población de la que se obtuvo, sin necesidad de estudiar toda la población o universo.
54
IGER − Tacaná
2.4 Inferencia estadística La inferencia estadística estudia cómo obtener conclusiones generales para toda la población a partir del estudio de una muestra. Asimismo estudia el nivel de confianza de los resultados obtenidos. Veamos el siguiente caso: Estamos realizando una investigación en la que se desea conocer el peso de los alumnos que estudian en el nivel básico en los institutos del municipio de Sololá. Si los resultados de esta investigación nos dicen que la media de peso de 25 estudiantes (o sea, de una muestra) es de 100 libras, se puede decir que la media de todos los estudiantes del nivel básico del municipio es aproximadamente 100 libras. En este caso estamos generalizando las 100 libras de la muestra y aplicando el resultado a la población total, o sea al universo. A esta generalización se le denomina, en estadística, inferencia.
Lago de Atitlán
Muestra: 25 estudiantes
Medida del peso: 100 lb
Inferencia estadística del peso de los estudiantes de básico en Sololá: 100 libras.
Estadística Descriptiva − Semana 3
55
2.5 Estadístico y parámetro De los datos obtenidos en la muestra se pueden obtener promedios (si la variable es cuantitativa) o porcentajes (si la variable es cualitativa). Cuando el promedio o porcentaje se obtiene de la muestra, se le llama estadístico o estadígrafo. Un estadístico es una medición numérica que describe alguna característica de una muestra. Si el promedio o porcentaje se refiere a toda la población se le denomina parámetro. Un parámetro es una medición numérica que describe alguna característica de una población.
Variable cualitativa: contaminado o no Población
82 ríos de Guatemala
Muestra
15 ríos
Ríos contaminados
70 ríos
Ríos contaminados
12 ríos
Parámetro (obtenido de la población)
85 % de los ríos contaminados
Estadístico o estadígrafo (obtenido de la muestra)
80 % de los ríos contaminado
Ejemplo: La diferencia entre un estadístico y un parámetro es de dónde se obtiene. Cuando se obtienen datos y solo se describen los resultados que se encontraron, se utilizan los modelos de estadística descriptiva. Si el objetivo es generalizar la muestra aplicando los resultados a la población total, los modelos que se utilizan son de estadística inferencial.
Variable cuantitativa: plantas de café con roya
56
Población
300 municipios
Muestra
10 municipios
Municipios con café
50 000 árboles con roya
Con roya
3000 árboles
Parámetro
167 (promedio de árboles con roya por municipio)
Estadístico o estadígrafo
Promedio de 300 árboles con roya por municipio
IGER − Tacaná
Vocabulario básico estadístico: es la medida obtenida de una muestra con el objetivo de estimar o inferir características de una población o modelo estadístico. estrato: conjunto de elementos con determinados caracteres comunes, que se diferencian de otros conjuntos. inferencia estadística: es el proceso de sacar conclusiones de una población, basándonos en los resultados obtenidos de una muestra. muestreo por conglomerados: es un muestreo aleatorio donde cada conglomerado de muestreo comprende a varias unidades. La muestra se obtiene seleccionando conglomerados por un método de muestreo aleatorio simple. muestreo estratificado: es aquel en el que se divide la población en subpoblaciones o estratos, de acuerdo con criterios que pueden ser importantes en el estudio o investigación. Posteriormente se realiza un muestreo aleatorio simple de cada estrato. parámetro: es una medida que representa una característica de una población.
Resumen Otros métodos de muestreo aleatorio son: muestreo por conglomerados o racimos y muestreo estratificado. El muestreo por conglomerados se realiza primero dividiendo la población en secciones o conglomerados y luego, seleccionando los conglomerados al azar. Se utiliza como muestra todos los elementos de los conglomerados seleccionados. El muestreo estratificado requiere que primero se clasifique la población en estratos o clases según las características que interesan para la investigación. Luego, se selecciona una muestra de cada estrato. Este método se utiliza cuando es difícil trabajar con la población total. La inferencia estadística estudia cómo obtener conclusiones generales para toda la población a partir del estudio de una muestra. Asimismo, estudia el nivel de confianza de los resultados obtenidos. El promedio o porcentaje obtenido de una muestra se llama estadístico o estadígrafo. Un estadístico es una medición numérica que describe alguna característica de una muestra. Si el promedio o porcentaje se refiere a toda la población se le denomina parámetro. Un parámetro es una medición numérica que describe alguna característica de una población.
Estadística Descriptiva − Semana 3
57
Ejercicio guiado Antes de iniciar los ejercicios, repase los conceptos con estos ejemplos. A. Se quiere estudiar qué piensan los habitantes de la aldea Chan Chan sobre la construcción de una hidroeléctrica en su comunidad. Para hacerlo seleccionan 30 casas de la comunidad, en una de cada 5 se hace la pregunta: ¿está usted de acuerdo con que se construya la hidroeléctrica? Pregunta de investigación: Hipótesis: Unidad de análisis: Variable:
¿Qué porcentaje de personas de la comunidad está de acuerdo con la construcción de la hidroeléctrica? Más del 50 % no está de acuerdo con la construcción de la hidroeléctrica Habitantes de la comunidad Acuerdo o no con construcción de hidroeléctrica
Tipo de variable:
Cualitativa (tiene dos categorías: acuerdo, no acuerdo)
Nivel de medida:
Nominal
Población: Muestra: Tipos de muestra:
Todos los habitantes de la comunidad Los habitantes de las casas seleccionadas a quienes se hizo la pregunta Se seleccionó sistemáticamente (se eligió una de cada 5 casas), y por conglomerados (se obtuvo grupos de personas, en cada casa). El porcentaje (%) es un estadístico porque se obtuvo de una muestra
Como el objetivo es determinar el grado de acuerdo de toda la comunidad, se utilizará estadística inferencial. B. El Comude del municipio de San Manuel Chaparrón, Jalapa, desea conocer el ingreso salarial de los jefes(as) de hogar del municipio. Tanto del área rural como urbana, se seleccionan 50 hogares (total 100), utilizando números aleatorios. Pregunta de investigación: Hipótesis: Unidad de análisis: Variable: Tipo de variable: Población: Muestra: Tipos de muestra: Selección de muestra:
¿Cuál es el ingreso salarial promedio de los jefes(as) de hogar del municipio? El ingreso salarial promedio es mayor a Q2,500.00 mensuales Jefe(a) de hogar Ingreso salarial o salario Cuantitativa Jefes(as) de hogar del municipio de San Manuel Chaparrón Los 100 jefes(as) de hogar seleccionados (observe que no son los hogares) La población se dividió en dos estratos: urbano y rural Aleatoria simple (números aleatorios)
El dato que se obtendrá es un estadígrafo o estadístico (se obtendrá de la muestra). Se utilizará estadística inferencial. (Se quiere saber el salario de los jefes(as) de hogar del municipio a partir de la muestra).
58
IGER − Tacaná
Autocontrol Actividad 1 Se hará una investigación sobre la calidad de café producido en las fincas de más de una manzana en el municipio de San Antonio la Paz. El café se clasificará como: muy bueno, bueno, regular y malo. Para hacerlo se seleccionan 30 fincas que se encuentran a no más de 10 km del casco urbano, por ser las de más fácil acceso. 1. Pregunta de investigación: 2. Hipótesis: 3. Unidad de análisis: 4. Variable: 5. ¿La variable es cualitativa o cuantitativa? ¿Por qué? 6. ¿La variable es nominal, ordinal o cuantitativa? ¿Por qué? 7. ¿Cuál es la población? 8. ¿Cuál es la muestra? 9. El porcentaje de muy bueno, bueno, regular y malo, ¿es un estadístico o un parámetro? 10. ¿Qué tipo de estadística se utilizará?
Actividad 2 En una investigación sobre la cantidad de leche que dan las vacas en la aldea San Francisco Jocotal se encontró que el promedio de la muestra seleccionada fue de 19 litros diarios. La muestra se seleccionó contando una de cada 10 vacas que se encontraban pastando en los corrales de la aldea. 1. Pregunta de investigación: 2. Hipótesis: 3. Unidad de análisis: 4. Variable: 5. ¿La variable es cualitativa o cuantitativa? ¿Por qué? Estadística Descriptiva − Semana 3
59
6. ¿Cuál es la población? 7. ¿Cuál es la muestra? 8. ¿Cómo se seleccionó la muestra? 9. El promedio de 19 litros, ¿es un estadístico o un parámetro? 10. ¿Qué tipo de estadística se utilizará?
Navegue en la red... Ministerio de Educación (Mineduc) El Ministerio de Educación recolecta periódicamente datos de todos los establecimientos educativos del país (oficiales, privados, municipales y por cooperativa), de todos los niveles educativos (primaria, secundaria y diversificado). El procesamiento de la información recolectada provee al Ministerio de Educación y usuarios en general, información actualizada, confiable y oportuna, para la toma de decisiones, entrega de servicios de apoyo, definición de políticas y diseño de planificación de la educación nacional. Si desea conocer datos sobre el estado de la educación en Guatemala, visite la página del Ministerio de Educación: www.mineduc.gob.gt
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
60
la casilla que mejor indique su rendimiento.
Conozco los pasos para realizar una encuesta. Aplico el uso de muestreo por conglomerados. Aplico el uso de muestreo estratificado. Diferencio entre estadística descriptiva y estadística inferencial. Reconozco si un dato es un estadístico o un parámetro. IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
4 Tablas estadísticas ¿Qué encontrará esta semana? Comparando una parte del todo Las tablas estadísticas
Esta semana logrará: Calcular porcentajes utilizando la fracción y el símbolo %. Utilizar los elementos de una tabla estadística. Analizar la información presentada en forma de porcentajes en una tabla estadística.
Estadística Descriptiva − Semana 4
61
¡Para comenzar! Comparando una parte con el todo •
¿Sabía que la población en Guatemala creció 2.44 % entre 2011 y 2012?
•
¿Sabía que en 2012 se registraron 388 440 nacimientos en la República de Guatemala, 4.0 % más que en 2011?
•
¿Sabía que del total de la población, el 48.8 % son hombres y el 51.2 % son mujeres?
•
¿Sabía que a nivel nacional el porcentaje de población que se identifica como indígena es el 40 %?
¿Qué tienen en común los datos presentados? Los datos anteriores tienen en común que están presentados en forma de porcentaje.
¡A trabajar! A. Según los datos anteriores, responda las siguientes preguntas. 1. ¿Qué tipo de información obtiene de las cifras anteriores? 2. ¿Cree que sería más fácil comprender los temas tratados con cifras totales, por el número de mujeres y hombres que viven en Guatemala? B. Ahora le toca a usted. Muchos comercios anuncian descuentos del 10 %, 25 % u otros, ¿cómo sabe usted cuánto tiene que pagar por un artículo si no le dan el precio con la rebaja?
62
IGER − Tacaná
El mundo de la estadística 1. El cálculo de porcentajes El uso de porcentajes es muy común en nuestro lenguaje cotidiano. Es frecuente, durante el periodo electoral, leer en los periódicos que un determinado candidato tiene el 30 % de preferencia del público, mientras que otro solamente el 20 %. También es común ver que una tienda ofrece el precio de los artículos, rebajando un 15 %, o que si pagamos al contado nos harán un descuento del 10 %. Ahora bien, cuando un comercio ofrece un descuento del 15 %, entendemos que de cada Q100.00 del valor de lo adquirido nos descontarán Q15.00. Pero si lo que adquirimos no cuesta Q100.00, sino solamente Q50.00, ¿qué cantidad exacta nos descontarán? En las páginas siguientes aprenderemos a realizar estos cálculos. Las cifras de porcentaje son útiles para facilitar las comparaciones entre dos o más números. El porcentaje es una operación matemática que consiste en dividir el todo en cien partes iguales y de esas partes tomar las que cuentan con las características que nos interesa estudiar. El porcentaje suele representarse principalmente de dos maneras: 5 y con el símbolo de porcentaje: 5 %. Ambas representan 100 la misma operación.
Como una fracción:
Ahora estudiaremos ambas formas con más detalle.
1.1 Como una fracción En la representación de fracción, el denominador es siempre 100 y representa las 100 partes en que se dividió la cantidad original; el numerador, que puede ser cualquier número, indica cuántas de estas cumplen con la condición que estamos estudiando. Ejemplo: 1 de cada 100
1 ( 100 ) personas se enferma del estómago cada mes.
Ejercicio 1
Un estudio realizado en Guatemala demostró que 72 de cada 100 hogares urbanos cuentan con señal de televisión por cable. Escriba la cifra en forma de fracción:
Estadística Descriptiva − Semana 4
63
1.2 Con el símbolo % Otra forma de representar el porcentaje es con el símbolo %. En este caso solo se indica el número de partes que cumplen con la condición de estudio. Ejemplo: El 2 % de los jóvenes en Guatemala ingresa a la universidad. El ejemplo anterior significa que solo 2 de cada 100 estudiantes ingresan a la universidad. Por lo tanto, también podemos representar esta cifra como fracción: 2 100 Otro ejemplo: el 40 % de vendedores de algodones usan uniforme. 40 , lo que significa que del total de 100 vendedores (100) solo 40 usan uniforme. Este dato puede representarse como
La fórmula para calcular porcentajes es la siguiente: Si se tiene un grupo de N elementos (N representa el total de elementos) y n cumple con la condición de interés (n representa a los que cuentan con la característica que se quiere estudiar), el porcentaje se calcula utilizando la fórmula:
n % = N • 100
Ejemplo: Se tiene un grupo de 50 personas reunidas para una actividad y se necesita que 40 ayuden a preparar el salón. ¿Qué porcentaje se necesita que ayude a preparar el salón? • Para aplicar la fórmula se utilizan los valores: N = 50
n = 40
• La aplicación sería de la siguiente manera: %=
40 • 100 = 0.8 • 100 = 80 % 50
Se necesita que el 80 % ayude a preparar el salón.
64
IGER − Tacaná
Ejemplo: Si se tiene una muestra de 175 personas y de ellas 62 son mujeres, ¿qué porcentaje representan las mujeres? • Para aplicar la fórmula se utilizan los valores: • La aplicación sería de la siguiente manera:
N = 175
n = 62
62 % = 175 • 100 = 0.3543 • 100 = 35.43 %
Las mujeres representan el 35.43 % de la muestra.
Ejemplo: En un terreno se tienen 1500 plantas de maíz, de las cuales 375 están afectadas con mancha de asfalto. ¿Qué porcentaje de plantas de maíz están afectadas? •
Para aplicar la fórmula se utilizan los valores:
• La aplicación sería de la siguiente manera:
N = 1500 %=
n = 375
375 • 100 = 0.25 • 100 = 25 % 1500
El 25 % de las plantas está afectado con la mancha de asfalto.
Ejercicio 2
1. Calcule el porcentaje (%), con los datos siguientes: N = 275 y n = 110 2. Si una plantación de mango tiene 2000 árboles y de ellos 150 no dieron fruto este año, ¿qué porcentaje de árboles no dio fruto?
Estadística Descriptiva − Semana 4
65
Ejercicio guiado
Lea la siguiente noticia que apareció en un periódico del país. Luego, corrobore las operaciones para saber cómo se estableció el porcentaje que indica el título de la noticia.
Fuente: elPeriódico, 3 mayo 2014
Resolvamos el ejercicio siguiendo estos pasos. 1. Encontramos la diferencia entre el valor de las facturas de 2014 y 2013. 2. Dividimos el valor de la diferencia entre el valor de la factura de 2013. 3. Multiplicamos la diferencia por 100.
904.20 – 801.60 = 102.60 102.60 = 0.12799 ≈ 0.128 801.60 0.128 • 100 = 12.8 %
La diferencia del valor de la factura de 2013 y 2014 es del 12.8 %.
66
IGER − Tacaná
2. Tablas estadísticas Una tabla es una representación de datos ordenados e identificados en filas y columnas. Las tablas permiten presentar gran cantidad de datos de forma ordenada y comprensible. En casi cualquier documento en el que se manejen datos numéricos como precios, salud, ingresos, población, desarrollo humano, ventas, etcétera, es muy probable encontrar tablas. Las tablas estructuran los datos en filas y columnas, como se puede apreciar en el siguiente ejemplo: Tabla 1 Población por departamento. Guatemala, 2013
Filas
Departamento
Población según INE
Guatemala
3 257 616
Huehuetenango
1 204 324
Alta Verapaz
1 183 241
San Marcos
1 070 215
Quiché
1 019 290
Quetzaltenango
826 143
Escuintla
731 326
Petén
687 192
Chimaltenango
648 627
Suchitepéquez
524 059
Totonicapán
506 537
Sololá
464 005
Jutiapa
453 369
Izabal
434 378
Chiquimula
388 115
Santa Rosa
360 268
Jalapa
336 484
Sacatepéquez
329 947
Retalhuleu
318 319
Baja Verapaz
28 453
Zacapa
22 881
El Progreso
163 537
TOTAL
14 958 326
Número y título
Fuente
Fuente: Ine
Columna
Estadística Descriptiva − Semana 4
67
2.1 Elementos de las tablas Las tablas también se conocen como cuadros. Es importante tomar en cuenta que cuando se realiza un trabajo en el que se presentan tablas o cuadros, siempre se debe decidir qué secciones va a contener. a. Número de tabla
En un documento, todas las tablas deben ser numeradas correlativamente para que sea fácil identificarlas. Para identificarlas se pueden utilizar números o letras, tal como aparece en el ejemplo de la página anterior.
b. Título de la tabla
Toda tabla lleva un título que debe contestar a las preguntas: qué, cómo, dónde y cuándo. El título de la tabla anterior contesta a las preguntas siguientes: • ¿Qué? Es una tabla de población. Los números que contiene la tabla corresponden a la población de cada departamento. • ¿Cómo? Son las variables que están en la tabla; en este caso, departamentos de Guatemala. • ¿Dónde? Se refiere al lugar en donde se dieron los datos, en este caso, Guatemala. • ¿Cuándo? Se refiere a la fecha, año, mes o época en que se dieron los datos; en este caso, 2013.
c. Fuente
Para que la información de una tabla tenga credibilidad, es muy importante indicar de dónde se obtuvieron los datos. Usualmente se escribe la palabra "fuente" y luego se indica de dónde se obtuvo la información. En el ejemplo anterior, la fuente es el Instituto Nacional de Estadística (Ine).
Algunas veces, los datos provienen de encuestas que realiza el investigador. En estos casos, se coloca como fuente una explicación como la siguiente: "Elaboración propia con datos de encuesta".
d. Títulos de fila y columna
Son los textos que describen los contenidos de las filas o columnas. En el ejemplo anterior, los títulos de columna son "Departamento" y "Población según Ine" y el nombre de cada departamento es el título de fila.
e. Celdas de información
68
IGER − Tacaná
Las celdas de información contienen los datos (por ejemplo, el número de habitantes).
Ejemplo: El Ine realiza periódicamente una encuesta de condiciones de vida a nivel nacional. En esta encuesta se recoge la información siguiente: • La procedencia del encuestado, es decir, si es habitante del área urbana o rural. • La situación económica del encuestado, si pertenece a alguna de las siguientes categorías: no pobre o pobre extremo. Estos datos se agrupan por procedencia y categoría. Luego, se calculan como porcentajes. Toda esta información se presenta en una tabla como la siguiente: Tabla 2 Porcentaje de habitantes por nivel de pobreza y área. Guatemala. 2006 Rural
Pobreza
Urbano
Total
Cantidad
Porcentaje
Cantidad
Porcentaje
Cantidad
Porcentaje
No pobre
1337
18.38 %
2600
35.73 %
3937
54.11 %
Pobre extremo
671
9.22 %
97
1.33 %
768
10.55 %
Fuente: Instituto Nacional de Estadística
Los datos del ejemplo anterior son reales y se obtuvieron de una encuesta del Ine del año 2006.
Elementos de la tabla: Número de tabla: Título: Unidad de análisis Variables: Categorías: Lugar y año de la encuesta: Fuente:
2 Porcentaje de habitantes por nivel de pobreza y área. Guatemala. 2006 Personas No pobre, pobre extremo Área urbana o rural Guatemala, 2006 Instituto Nacional de Estadística (Ine)
Estadística Descriptiva − Semana 4
69
Análisis de la tabla Los datos de una tabla sirven para realizar análisis sobre la información que se presenta. Con respecto a la información de la Tabla 2, del total de personas entrevistadas, en el área rural la mayoría está registrada en la categoría “no pobre” y en el área urbana, también la mayoría está registrada en la categoría “no pobre”. De todos los entrevistados, el 54.11 % son “no pobres” y un 10.55 % son “pobres extremos”.
Ejercicio 3
De las estimaciones y proyecciones de población del Instituto Nacional de Estadística (Ine) se obtienen los siguientes datos para el departamento de Jutiapa: del total de la población, el 47.0 % son hombres y 53.0 % son mujeres. Los habitantes son mayoritariamente del área rural, debido a que el 67.3 % de las personas habitan en esa área. 1. Con los datos de sexo, complete la siguiente tabla: Tabla 1. Porcentaje de habitantes por sexo. Jutiapa, 2002 Sexo
Porcentaje
Mujer Hombre Fuente: Instituto Nacional de Estadística
2. Con los datos del área donde viven las personas, complete la siguiente tabla.
Tabla 2. Porcentaje de habitantes por área donde habita. Jutiapa, 2002 Área
Porcentaje
Rural Urbana Fuente: Instituto Nacional de Estadística
70
IGER − Tacaná
Vocabulario básico celda: espacio en una tabla que contiene cada dato. columna: conjunto de datos presentados en las celdas en línea vertical de una tabla. fila: conjunto de datos presentados en las celdas en línea horizontal de una tabla. fuente: datos sobre la fuente de información, es decir, indica de dónde se obtuvieron los datos presentados en la tabla. porcentaje: parte proporcional de un número en relación a cien unidades. tabla estadística: conjunto de datos presentados en filas y columnas que contienen valores para cada variable. título de la tabla: nombre de la tabla con información sobre qué, cómo, cuándo y dónde de los datos presentados.
Resumen Las cifras de porcentaje son útiles para facilitar las comparaciones entre dos o más cantidades. El porcentaje es una operación matemática que consiste en dividir el todo en cien partes iguales y de esas partes tomar las que cuentan con las características que interesa estudiar.
(
)
5 El porcentaje suele representarse principalmente de dos maneras, como fracción 100 y con el símbolo % (5 %). La tabla es una representación gráfica que permite comprender los datos de manera más fácil por estar ordenados e identificados en filas y columnas. Los elementos de las tablas son: número de la tabla, título, títulos de fila y columna, celdas de información y fuente.
Estadística Descriptiva − Semana 4
71
Autocontrol Actividad 1 Lea la información que contiene la tabla y realice las actividades que se indican abajo. Tabla 1 Comportamiento del analfabetismo por departamento. Guatemala, 2012 (fragmento) Total Código
Departamento
01
Población de 15 años y más
Población analfabeta
Guatemala
2 188 776
141 674
02
El Progreso
99 058
12 071
03
Sacatepéquez
202 560
23 014
04
Quiché
503 037
159 091
05
Jalapa
176 312
42 634
Porcentaje de analfabetismo
Fuente: Proyecciones de Población 2012 con base en el XI Censo de Población 2002, Ine y Resultados finales del Proceso de Alfabetización, Año 2002
1. Calcule el porcentaje de analfabetismo para cada uno de los departamentos presentados y anótelo en el espacio correspondiente en la tabla. Recuerde la fórmula:
n % = N • 100
Para el caso de Guatemala: N = 2 188 776 n = 141 674
Responda: 2. ¿Cuál departamento tiene el mayor número de población de 15 años o más? 3. ¿Qué departamento tiene el menor número de población de 15 años o más? 4. ¿Cuál departamento tiene el mayor porcentaje de analfabetismo?
72
IGER − Tacaná
5. ¿Cuál departamento tiene el menor porcentaje de analfabetismo? 6. ¿Coincide el departamento con mayor población y el de mayor porcentaje de analfabetismo? ¿Por qué? 7. Después de realizar este ejercicio, escriba su opinión respecto a la utilidad del uso de los porcentajes.
Actividad 2 Le presentamos las cifras de población ocupada en el país por grupo étnico. Lea la tabla y responda las preguntas planteadas. Tabla 2 Población ocupada por grupo étnico. Guatemala, 2013 Grupo étnico
Población ocupada
Porcentaje
Indígena
2 404 595
41.38 %
No indígena
3 406 598
58.62 %
Total
5 811 193
100 % Fuente: Ine
1. De la población ocupada, ¿qué grupo étnico tiene mayor porcentaje? 2. De la población ocupada, ¿qué porcentaje corresponde a los no indígenas? 3. ¿Coincide este resultado con el que usted pensaba antes de leer el cuadro? 4. ¿Qué utilidad tienen los porcentajes en este cuadro? 5. ¿Los porcentajes dan la misma información que las variables cuantitativas? Estadística Descriptiva − Semana 4
73
Actividad 3 Resuelva el ejercicio, calculando el porcentaje de población de hombres. Tabla 3 Población por sexo. Guatemala, 2012 Sexo
Población
Porcentaje
Mujer
7 729 269
51.25 %
Hombre
7 353 562
Total
15 082 831
100 %
Fuente: http://www.datosmacro.com/demografia/poblacion/guatemala
El porcentaje de población de mujeres se calculó dividiendo el número de mujeres, que es 7 729 269 entre el total de la población que es 15 082 831, y se multiplicó por 100. 7 729 269 = 0.5125 15 082 831
0.5125 • 100 = 51.25 %
Ahora, calcule el porcentaje de población de hombres y coloque el dato en la casilla correspondiente.
Navegue en la red... Ministerio de Agricultura, Ganadería y Alimentación (Maga) El Maga presenta el Informe Semanal del Comportamiento de precios de los principales productos agropecuarios en el mercado de mayoreo de Guatemala y precios internacionales. Visite: www.maga.gob.gt/precios-agricolas
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
74
la casilla que mejor indique su rendimiento.
Calculo porcentajes utilizando la fracción y el símbolo %. Utilizo los elementos de una tabla estadística. Analizo la información presentada en forma de porcentajes en una tabla estadística. IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
5 Cálculo de porcentajes en tablas ¿Qué encontrará esta semana?
Jóvenes y tecnología
Cálculo de porcentajes en tablas estadísticas
Esta semana logrará: Analizar datos de porcentajes presentados en tablas. Calcular porcentajes con datos de una tabla. Elaborar tablas con porcentajes.
Estadística Descriptiva − Semana 5
75
¡Para comenzar! Jóvenes y tecnología En una encuesta realizada en el año 2011, se preguntó a jóvenes acerca de la utilidad de las redes sociales. Los datos obtenidos indican que el 78 % utiliza las redes sociales para comunicación con amistades y apenas el 22 % para hacer tareas o trabajos con fines de estudio. Y usted, ¿qué usos le da al Internet? Intente expresarlo en porcentajes. En Guatemala, el 68.9 % de los jóvenes de 15 a 29 años tiene un celular. Sin embargo, en este sector de la población podemos notar diferencias según el género y el grupo étnico. Veamos: El 73.5 % de los hombres cuenta con un celular, mientras que en el caso de las mujeres solo el 65.4 % tiene uno. Por otra parte, entre la población indígena solo el 58 % cuenta con celular, mientras que en la población no indígena el porcentaje aumenta a 74.6 %.
¡A trabajar! 1. ¿Por qué cree que las redes sociales son tan populares entre los jóvenes? 2. ¿Por qué más hombres que mujeres tienen un celular? 3. ¿Por qué menos personas indígenas tienen celular en comparación con personas no indígenas? 4. Reflexione sobre cómo conocer estos datos estadísticos podría ser útil para mejorar la disponibilidad de celulares entre mujeres y personas indígenas.
76
IGER − Tacaná
El mundo de la estadística 1. Tablas de porcentajes Antes de poner manos a la obra, hay que recordar que las tablas están formadas por columnas, filas y celdas. En primer lugar, podremos observar las columnas de una tabla si pasamos nuestra vista en sentido vertical; es decir, de arriba hacia abajo (â). Al hacer este ejercicio veremos claramente las columnas, justo como se colocan las columnas en las construcciones de las casas, edificios, palacios, etc. Cada columna se utiliza para agrupar información de distinto tipo de manera ordenada. Así se facilita la comprensión de los datos que nos servirán para realizar cálculos y luego análisis. En segundo lugar, las filas contienen información colocada de forma horizontal ( à ), es decir, de la misma manera que se ven las filas de niños y niñas en las escuelas o los surcos de las siembras. Por último, las celdas serían como los ladrillos de una pared, en este caso esa pared es nuestra tabla. Con las celdas se forman las columnas y las filas, cada una contiene un dato, como por ejemplo: edad, sexo, nombre, cantidad, porcentaje, entre otros. No olvide que en las tablas debemos hacer una suma con los datos numéricos de cada columna para calcular los totales, pues esta información es necesaria para el cálculo de porcentajes. Ahora sí, manos a la obra: vea cómo se calculan los porcentajes en una tabla. Para calcular los porcentajes de las celdas que forman una tabla se utiliza la siguiente fórmula:
%=
Valor de la celda • 100 Total
Estado civil
Entrevistados
Porcentaje
Soltero
256
49.14 %
Casado
156
29.94 %
Viudo
56
10.75 %
Divorciado
38
7.29 %
Unido
15
2.88 %
Total
521
100 %
En las próximas páginas aprenderemos cómo aplicar esta fórmula para obtener porcentajes en una tabla. Estadística Descriptiva − Semana 5
77
Ejercicio 1
Para ir entendiendo mejor, pasemos a la práctica. A continuación, le presentamos información tomada de la página de Empresarios por la Educación (www.empresariosporlaeducacion.org). Lea las tablas que se encuentran a continuación y trate de identificar los elementos de las tablas que ya hemos estudiado.
1.
2.
3.
4.
5.
78
IGER − Tacaná
Ejercicio 2
Lea la tabla que aparece a continuación. Observe que los datos están presentados únicamente en porcentajes para facilitar la comparación entre las variables. Tabla 2: Desempeño graduandos por carrera en Lectura y Matemática (todos los sectores) Año 2005 2006 2007 2008 2009 2010 2011 2012
Desempeño
Bachillerato
Magisterio
Perito
Secretariado
Técnico
Lectura
Matemática
Lectura
Matemática
Lectura
Matemática
Lectura
Matemática
Lectura
Logro
17.3%
26.5%
15.6%
8.2%
12.8%
14.9%
13.7%
5.1%
11.0%
Matemática
19.0%
No logro
82.8%
73.5%
84.4%
91.8%
87.2%
85.1%
86.3%
94.9%
89.1%
81.0%
Logro
30.9%
9.4%
14.6%
2.4%
24.6%
4.1%
18.7%
0.7%
30.5%
3.1%
No logro
69.1%
90.6%
85.4%
97.6%
75.4%
95.9%
81.3%
99.3%
69.5%
96.9%
Logro
17.9%
8.4%
9.2%
2.4%
13.5%
3.4%
8.8%
1.3%
15.7%
3.9%
No logro
82.1%
91.6%
90.8%
97.6%
86.5%
96.6%
91.3%
98.7%
84.3%
96.1%
Logro
14.5%
6.1%
8.0%
1.0%
8.9%
1.7%
6.6%
0.6%
0.0%
0.0%
No logro
85.5%
93.9%
92.0%
99.0%
91.1%
98.3%
93.4%
99.4%
100.0%
100.0%
Logro
9.6%
3.3%
4.5%
0.5%
5.8%
0.7%
4.2%
0.1%
9.5%
0.0%
No logro
90.4%
96.7%
95.5%
99.5%
94.2%
99.3%
95.8%
99.9%
90.5%
100.0%
Logro
25.0%
7.8%
18.5%
1.7%
21.2%
2.8%
15.5%
0.6%
25.7%
5.4%
No logro
75.0%
92.2%
81.5%
98.3%
78.8%
97.2%
84.5%
99.4%
74.4%
94.6%
Logro
26.2%
10.5%
19.8%
3.7%
22.8%
6.0%
18.8%
1.2%
26.7%
9.5%
No logro
73.8%
89.6%
80.2%
96.3%
77.2%
94.0%
81.2%
98.8%
73.3%
90.5%
Logro
26.8%
9.8%
20.1%
4.1%
25.2%
6.6%
18.8%
1.2%
27.3%
9.5%
No logro
73.2%
90.2%
79.9%
95.5%
74.8%
93.4%
81.2%
81.2%
72.7%
90.5%
Fuente: http://www.empresariosporlaeducacion.org/es/estadisticas.php
Analice los datos de la tabla, responda la pregunta y complete la tabla. 1. ¿Cuál es la unidad de análisis? 2. Con la información de la tabla anterior, incluya en el cuadro siguiente las categorías de análisis. Le proporcionamos las variables. Variable
Categorías
Carrera Pruebas de evaluación Año de las pruebas Desempeño
Estadística Descriptiva − Semana 5
79
2. Cálculo de porcentajes en tablas estadísticas Analicemos paso a paso cómo calcular porcentajes en tablas estadísticas. Ejemplo 1: Según la Encuesta de Condiciones de Vida 2006 del Instituto Nacional de Estadística, en una muestra de 7276 encuestados se obtuvieron estos datos: 3937 no pobres, 768 pobres extremos y 2571 pobres no extremos. 1. Organizar la información en una tabla, es decir en filas y columnas, incluyendo sus títulos y el cálculo del total. Nivel de pobreza
Cantidad
No pobres
3937
Pobres extremos
768
Pobres no extremos
2571
Total
7276
2. Calcular los porcentajes, para calcular el porcentaje de cada celda se divide cada dato entre el valor total, en este caso 7276, ya que constituye el 100 %. Por esta razón, en la tabla que está al final de la página agregamos otra columna titulada porcentaje y comprobamos que al sumar los porcentajes obtendremos el 100 %. Entonces utilizando la fórmula que ya conocemos, los resultados quedarían así:
80
IGER − Tacaná
Para la primera celda
%=
3937 • 100 = 0.5411 • 100 = 54.11 % 7276
Para la segunda celda
%=
768 • 100 = 0.1056 • 100 = 10.56 % 7276
Para la tercera celda
%=
2571 • 100 = 0.3533 • 100 = 35.33 % 7276
Nivel de pobreza
Cantidad
Porcentaje
No pobres
3937
54.11 %
Pobres extremos
768
10.56 %
Pobres no extremos
2571
35.33 %
Total
7276
100 %
3. Colocar el título y la fuente de la tabla, datos importantes para indicar de qué se trata la información que se está utilizando, qué variables se detallan, cuándo sucedieron los datos, en qué país, departamento, municipio o aldea y por último de dónde obtuvimos la información, ya sea de una institución, encuesta, etc. Tabla 2 Habitantes por nivel de pobreza y porcentajes. Guatemala, 2006 Nivel de pobreza
Cantidad
Porcentaje
No pobres
3937
54.11 %
Pobres extremos
768
10.56 %
Pobres no extremos
2571
35.33 %
Total
7276
100 %
Fuente: Instituto Nacional de Estadística
Ejemplo 2: A continuación encontrará el cuadro de población ocupada según el sexo, edad, grupo étnico, posición en el hogar y estado conyugal:
Fuente: Instituto Nacional de Estadística
Estadística Descriptiva − Semana 5
81
Como podemos observar, el cuadro de la página anterior contiene bastante información. Entonces para empezar haremos una tabla, tomando únicamente la variable "sexo" del total de la población nacional. Entonces, siguiendo los pasos vistos, primero se extrae la información que interesa, se ordena en filas y columnas, se calcula el total de hombres y mujeres, se agrega una columna titulada Porcentaje, se aplica la fórmula, se anotan los resultados con el símbolo de porcentaje y finalmente se coloca el título y la fuente de la tabla. Tabla Personas ocupadas por sexo y porcentaje. Guatemala, 2013 Sexo
Total nacional
Porcentaje
Hombre
3 750 099
64.53 %
Mujer
2 061 094
35.47 %
Total
5 811 193
100 % Fuente: Instituto Nacional de Estadística
Recuerde que las fórmulas únicamente sirven para hacer los cálculos, pero no se colocan en el cuadro o la tabla, solo los resultados seguidos del símbolo %.
Ejercicio 3 A. Tomando como referencia datos del cuadro de la página anterior, calcule porcentajes. Lea la tabla y responda: 1. Según el estado conyugal, ¿cuál grupo tiene mayor cantidad de población ocupada? 2. ¿Cuál grupo de población ocupada de jefe(a) de hogar es mayor, el urbano metropolitano o el rural? B. Complete la tabla con la variable edad por población urbana y rural. Se le proporciona un formato. Tabla 1 Población ocupada por grupo de edad y área. Guatemala, 2013 Grupos de edad
Urbana
Porcentaje
Rural
Porcentaje
15 a 24 años 25 años y más Total Fuente: Instituto Nacional de Estadística
82
IGER − Tacaná
Vocabulario básico celda: es la unidad básica de una tabla, donde se introducen datos, valores y fórmulas. columna: celdas ubicadas en forma vertical en una tabla. fila: celdas ubicadas en forma horizontal en una tabla. fuente: se refiere al lugar o institución de donde se obtuvieron los datos. Si usted recopiló los datos, entonces la fuente debe decir: elaboración propia. porcentaje: expresa la proporción de unidades de cada cien. título: el título debe indicar qué, cómo, dónde y cuándo se obtuvieron los datos presentados. El título también contiene el número que la tabla tiene dentro del informe o investigación, según el orden en que aparece.
Resumen El porcentaje es útil para comparar cantidades. En algunas tablas estadísticas se presentan las cantidades totales acompañadas de los porcentajes para que podamos compararlas y comprender los datos de manera más rápida y sencilla. Para calcular los porcentajes dentro de una tabla, se aplica la siguiente fórmula:
Valor de la celda %= • 100 Total Valor de la celda %= • 100 Total
Estadística Descriptiva − Semana 5
83
Autocontrol Actividad 1 1. A continuación se presentan los datos de la población infantil y juvenil de la aldea El Tablón. Calcule el porcentaje de personas de cada edad. Tabla 1 Población infantil y juvenil de la aldea El Tablón Edad
Cantidad
0–3
15
4–7
17
8 – 11
22
12 – 15
23
16 – 19
23
Porcentaje
Fuente: Elaboración propia
2. La tabla que se presenta a continuación muestra la cantidad de vehículos nuevos vendidos en Guatemala en el primer semestre de 2010. Con los datos de esta tabla calcule los porcentajes. Tabla 2 Venta de vehículos nuevos en Guatemala. Enero – Junio 2010 Marca
Cantidad
Kia
950
Nissan
915
Mazda
706
Hyundai
1121
Toyota
2290
Porcentaje
Fuente: Superintendencia de Bancos
84
IGER − Tacaná
Actividad 2 Lea los casos siguientes y realice las actividades. 1. Un catedrático de química aplicó la prueba parcial a los estudiantes. Estos fueron los resultados: 27 alumnos aprobaron y 12 reprobaron.
Encuentre el porcentaje para cada caso y escríbalo en la columna de la tabla siguiente. Tabla 3 Resultados en la prueba de Química Resultados
Cantidad
Aprobados
27
Reprobados
12
Total
39
Porcentaje
Fuente: Elaboración propia
a. Porcentaje de estudiantes aprobados: b. Porcentaje de estudiantes reprobados: 2. La clase de 3.º primaria de la escuela "El Saber" hará una excursión al zoológico La Aurora. Antes de subir al bus, la maestra cuenta a los alumnos que tienen permiso de sus padres para hacer esta visita. Necesita saber cuántos niños y cuántas niñas irán para no perderlos de vista en el zoológico. Esto es importante, pues no a todos los alumnos de esa clase realizarán la visita. El conteo dio como resultado:
Niñas: 15
Niños: 12
Elabore una tabla tomando en cuenta el sexo de los estudiantes. Luego, calcule el porcentaje de cada grupo. Tabla 6 Niños y niñas que asistirán al zoológico Sexo de los estudiantes
a. Porcentaje de niñas:
Cantidad
Porcentaje
b. Porcentaje de niños:
Estadística Descriptiva − Semana 5
85
Lea el siguiente caso y elabore una tabla con los datos solicitados. 3. En la gasolinera de Don Julio se vendió en una semana: 90 galones de diesel, 120 galones de gasolina regular, 80 galones de gasolina súper.
Tipo de combustible
Cantidad
Porcentaje
Porcentaje de combustible vendido: a. Diesel: b. Gasolina regular: c. Gasolina súper:
Navegue en la red... Ministerio de Salud Pública y Asistencia Social (Mspas) El Ministerio de Salud cuenta con el Sistema de Información Gerencial en Salud (Sigsa), que recolecta datos sobre la situación de salud en el país, los cuales organiza y analiza para generar información que garantice la salud de los habitantes. Visite la página: goo.gl/4R7gZg
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
86
la casilla que mejor indique su rendimiento.
Analizo datos de porcentajes presentados en tablas. Calculo porcentajes con datos de una tabla. Elaboro tablas con porcentajes.
IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
6 Gráficas estadísticas ¿Qué encontrará esta semana?
Sistema de coordenadas cartesianas
Gráficas estadísticas
Esta semana logrará: Localizar puntos en un sistema de coordenadas cartesianas. Utilizar la información de las tablas para construir diagramas de barras, de líneas y circulares. Calcular grados para elaborar un diagrama circular. Valorar el uso de gráficas para presentar datos estadísticos.
Estadística Descriptiva − Semana 6
87
¡Para comenzar! Sistema de coordenadas cartesianas Las coordenadas cartesianas toman su nombre en honor a René Descartes (1596 – 1650), matemático, filosófo y físico francés, considerado como uno de los intelectuales más destacados de la revolución científica. Descartes fue el primero en usar un plano cartesiano, cuya función es ubicar cualquier punto en un plano. Un sistema de coordenadas cartesianas se compone de dos líneas perpendiculares, que forman cuatro áreas llamadas cuadrantes. El punto en donde se juntan o intersecan las dos líneas se denomina origen y se
cuadrante II
cuadrante I
0 cuadrante III
cuadrante IV
representa con el cero (0). De manera que los números positivos se encuentran hacia la derecha y hacia arriba del origen y los números negativos hacia la izquierda y hacia abajo del origen. Por esta razón, las dos líneas o ejes son rectas numéricas. y 10 8
positivas
6 4 2 –14 –12 –10 –8 –6 –4 –2 –2 negativas
–4 –6
2
4
6 8 10 12 14
x
Origen (0,0)
–8 –10
La línea que va en dirección horizontal, se denomina eje x y la línea que va en dirección vertical se denomina eje y. De esta cuenta, las coordenadas cartesianas señalan un punto que se compone de dos coordenadas, y se representa (x, y).
88
IGER − Tacaná
Es así que el primer número indica la cantidad de unidades que es necesario desplazarse en el eje horizontal (x) y lo mismo sucede con el segundo número, pero en el eje vertical ( y). De modo que para localizar el punto (2, 6), será necesario desplazarse al número 2 del eje (x) u horizontal y al número 6 del eje ( y) o vertical. Por lo tanto, si las coordenadas cartesianas están compuestas por números positivos, el punto se localizará en el primer cuadrante. Sin embargo, los números de las coordenadas cartesianas pueden ser negativos, de modo que será necesario desplazarse hacia la izquierda y hacia abajo. En este aspecto, debemos tener claro que para las representaciones estadísticas, se utilizará únicamente el cuadrante que tiene ambos valores positivos (primer cuadrante). Veamos otros puntos representados gráficamente: • El punto (–6, 4), en primer lugar localizamos menos 6 hacia la izquierda y 4 hacia arriba. • El punto (8, –8), se localiza el 8 hacia la derecha y –8 hacia abajo. y 10 8 (– 6, 4)
6
(2, 6)
4 2
–14 –12 –10 –8 –6 –4 –2 –2
2
4
6 8 10 12 14
x
–4 –6 –8
(8, –8)
–10
¡A trabajar! y
En el siguiente sistema de coordenadas, localice los puntos:
10 8 6 4
a. (– 5, – 3) b. (– 6, – 6) c. (5, 8)
2 –14 –12 –10 –8 –6 –4 –2 –2
2
4
6 8 10 12 14
x
–4 –6 –8 –10
Estadística Descriptiva − Semana 6
89
El mundo de la estadística 1. Gráficas estadísticas Como sabemos, es frecuente que cuando se ofrece información en largas columnas de números o a través de grandes explicaciones, lo más probable es provocar aburrimiento, apatía o incomprensión. Algunas personas parecen no tener interés en la información estadística presentada en tablas, pero podrían prestarle mucha atención si se les presenta en forma gráfica. Las gráficas tienen la ventaja de que proyectan la relación entre los datos de una forma más clara y directa que una tabla. Aunque hay muchas clases de gráficas, en este libro se verán tres tipos de gráficas. Estas son: • Diagrama de barras • Diagrama de líneas • Diagrama circular, o pastel
1.1 Diagrama de barras El diagrama de barras nos proporciona una ilustración sencilla y rápida de datos que pueden dividirse en varias categorías. Este tipo de diagrama puede ser horizontal o vertical. Aprenderemos a construir el diagrama vertical que se usa con más frecuencia. En primer lugar, debemos tener claro que toda gráfica parte de una tabla. Para empezar a familiarizarnos con el diagrama de barras, utilizaremos la tabla siguiente. Tabla 1 Población ocupada por el área donde vive y sexo. Guatemala, 2013 Área donde vive
Hombre
Mujer
Urbano metropolitano
21.4 %
18.8 %
Resto urbano
31.5 %
29.9 %
Rural nacional
47.1 %
51.3 %
Total nacional
100 %
100 % Fuente: Inei 2 – 2013 Ine
Siguiendo los pasos que se describen a continuación, haremos la gráfica de barras con los datos de hombres ocupados.
90
IGER − Tacaná
• Elaborar un sistema de coordenadas con los ejes positivos. En el eje x se colocarán las áreas y en el eje y los porcentajes.
Porcentaje
Gráfica 1 Porcentaje de ocupación por área. Guatemala, 2013
Área
Fuente: Inei 2-2013 Ine
• Colocar los nombres de las categorías en el eje x y las frecuencias en el eje y, utilizando espacios de igual tamaño.
Gráfica 1 Porcentaje de ocupación por área. Guatemala, 2013 48 44 40 36 32 28 24 20
Urbano metropolitano
Resto urbano
Rural nacional
Fuente: Inei 2-2013 Ine
Estadística Descriptiva − Semana 6
91
• Colocar una barra a cada categoría, tomando en cuenta que la altura de cada una deberá coincidir con su valor correspondiente en la tabla.
Así el urbano metropolitano deberá ascender hasta el 21.4 %, el resto urbano hasta el 31.5 % y así sucesivamente. Lo mejor es colocarlo siguiendo un orden, que puede ser alfabético, de mayor a menor o como el investigador/a considere que es más conveniente.
No olvide que tanto la gráfica como los ejes deben llevar títulos que expliquen de forma clara y simple la información representada en ella. Tome en cuenta que no es necesario colocarle los números correspondientes a cada barra. Observe estos elementos en el diagrama de barras que se muestra a continuación: Gráfica 1 Porcentaje de hombres ocupados por área. Guatemala, 2013 48 47.1 %
44 40 36 32
31.5 %
28 24 20
21.4 %
Urbano metropolitano
Resto urbano
Rural nacional
Fuente: Inei 2-2013 Ine
• Interpretación: en el diagrama, se observa con claridad que los hombres tienen un porcentaje mayor de ocupación en el área rural, y en el área urbano metropolitano se encuentra el menor porcentaje de ocupación.
Ejercicio 1
Utilice la tabla 1 para realizar en su cuaderno el diagrama de barras con los datos de mujeres ocupadas, siguiendo los pasos que ya vimos. Puede utilizar este espacio para anotaciones previas.
92
IGER − Tacaná
1.2 Diagrama de líneas El diagrama de líneas se utiliza principalmente cuando se quiere mostrar cómo se comporta una variable a través del tiempo, pues más que diferencias, este tipo de gráfica muesta continuidad. Por ello, es muy útil para representar puntajes ordinales y por intervalos. Veamos el siguiente ejemplo: Tabla 8 Precio del dólar estadounidense en quetzales. Guatemala, marzo 2013 a marzo 2014 Mes
Precio del dólar (en Q)
marzo 2013
7.81
abril 2013
7.80
mayo 2013
7.78
junio 2013
7.82
julio 2013
7.82
agosto 2013
7.85
septiembre 2013
7.91
octubre 2013
7.95
noviembre 2013
7.87
diciembre 2013
7.85
enero 2014
7.80
febrero 2014
7.75
marzo 2014
7.73 Fuente: Banguat
Para realizar la gráfica debemos: • Elaborar un sistema de coordenadas con los ejes positivos, al igual que el diagrama de barras. • Colocar los valores en el eje ( y) o vertical. Para lo cual es necesario identificar cuál es el valor menor y cuál el mayor, en este caso el menor es 7.73 y el mayor es 7.95. De manera que el eje (y) deberá abarcar esos valores en su numeración. Para que se vea mejor la gráfica es conveniente colocar valores que terminen en cero. En este caso puede ser desde 7.70 hasta 8.00. Lo importante es que los valores mayor y menor estén contenidos en este eje. Estadística Descriptiva − Semana 6
93
• Colocar el título de la gráfica y de los ejes, de modo que la gráfica quede así (como se puede observar, el precio es mayor en octubre de 2013): Gráfica 2 Precio del dólar estadounidense en quetzales. Guatemala. Marzo 2013 a marzo 2014 8.00 7.95
7.95
7.91
7.90 7.85 7.80
7.87
7.85 7.81
7.80
7.82
7.85
7.82
7.80
7.78
7.75
7.75
7.73
7.70 mar – 13 abr – 13 may – 13 jun – 13 jul – 13
ago – 13 sep – 13 oct – 13 nov – 13 dic – 13
ene – 14 feb – 14 mar – 14
Fuente: Banguat
Ejercicio 2
Con los datos siguientes elabore un diagrama de líneas en su cuaderno. Los datos son del cambio porcentual de precios al consumidor, 11.83 significa que ese mes aumentó 11.83 % con respecto a un mes base. Mes
Cambio porcentual de precios al consumidor
marzo 2013
11.83
abril 2013
12.02
mayo 2013
12.32
junio 2013
13.02
julio 2013
13.36
agosto 2013
13.52
septiembre 2013
13.85
octubre 2013
13.82
noviembre 2013
14.33
diciembre 2013
14.68
enero 2014
14.97
febrero 2014
15.20
marzo 2014
15.46 Fuente: Inei 2-2013 Ine
94
IGER − Tacaná
1.3 Diagrama de sectores, circular o pastel El diagrama de sectores es uno de los métodos gráficos más simples, dado que parece un pastel redondo cortado en pedazos que juntos suman el 100 por ciento. Esta gráfica es muy útil para visualizar las diferentes frecuencias con respecto a un total. Los pasos para construir son: • Elaborar una tabla, al igual que las otras gráficas se parte de una tabla, por lo tanto leamos la información del cuadro siguiente: Tabla 9 Número de personas según el nivel de pobreza. Guatemala, 2006 Nivel de pobreza
Cantidad
No pobres
3937
Pobres extremos
768
Pobres no extremos
2571
Total
7276
Fuente: Instituto Nacional de Estadística (Ine), Encuesta Nacional de Condiciones de Vida 2006 (Encovi 2006)
• Averiguar qué porcentaje corresponde a cada una de las cantidades. Por lo tanto, tenderemos que dividir 3937 (cantidad) entre 7276 (total) y multiplicarlo por 100, que da como resultado 54.11 %. Luego, corresponde hacer lo mismo con las otras cantidades. Nivel de pobreza
Cantidad
Porcentaje
No pobres
3937
54.11 %
Pobres extremos
768
10.55 %
Pobres no extremos
2571
35.34 %
Total
7276
100.00 %
• Calcular cuántos grados le corresponde a cada porcentaje, aplicando la fórmula siguiente: No. de grados =
No. de grados =
% de categoría • 360 100
% de categoría • 360 54.11 • 360 = = 194.796 ≈ 195 grados 100 100
Estadística Descriptiva − Semana 6
95
Le agregamos una columna a la tabla en la que escribimos los grados. Nivel de pobreza
Cantidad
Porcentaje
Grados
No pobres
3937
54.11 %
195
Pobres extremos
768
10.55 %
38
Pobres no extremos
2571
35.34 %
127
Total
7276
100.00 %
360
Tome en cuenta que la suma de los grados puede dar un número diferente de 360 por las aproximaciones que se dan, lo cual no indica ningún problema. Para trazar cada sector hay que utilizar un transportador. • Trazar una circunferencia y colocar una línea base en cualquier dirección.
• Colocar el transportador y medir hacia arriba los grados; en este primer caso, 195.
• Trazar la línea a los 195 grados y mover el transportador hacia la nueva línea base y medir los siguientes grados, (38). Como solo hay tres categorías, la última quedará con 127 grados, porque la suma es 360.
96
IGER − Tacaná
Finalmente con todos los elementos la gráfica queda de este modo. No debemos olvidar que toda tabla y gráfica debe indicar su fuente. Gráfica 9 Personas en los diferentes niveles de pobreza. Guatemala, 2006
Pobres no extremos 35.34 %
Pobres no Pobres extremos extremos 35% 10.55 % Pobre
No pobres 54%
No pobres 54.11 %
Fuente: Inei 2 – 2013 Ine
• Interpretación, como se puede observar el 45.89 % (35.34 + 10.55) de las personas en Guatemala están en algún nivel de pobreza.
Ejercicio 3
Complete la tabla y elabore un diagrama de sectores con los datos siguientes.
Población ocupada por grupos étnicos Grupo étnico
Cantidad de personas
Indígena
2 404 595
No indígena
3 406 598
Porcentaje
Total Fuente: Inei 2 – 2013 Ine
Estadística Descriptiva − Semana 6
97
Vocabulario básico diagrama de barras: gráfica que utiliza barras, en posición horizontal o vertical, para representar gráficamente un conjunto de datos o valores. diagrama de líneas: gráfica que une mediante líneas los puntos de una serie de datos para mostrar el comportamiento de una variable a través del tiempo. diagrama circular: gráfica en forma de círculo que muestra la proporción de los datos o variables respecto a un todo. gráfica: tipo de representación de datos, generalmente numéricos, en forma de líneas, volúmenes, figuras y superficies que facilitan la visualización y comparación de datos. sistema de coordenadas cartesianas: plano compuesto por dos líneas perpendiculares que se cortan entre sí formando un punto de origen. Sirve para trazar puntos en un plano.
Resumen Un sistema de coordenadas cartesianas está compuesto por dos líneas perpendiculares que se cruzan en un punto de origen, formando cuatro cuadrantes, con números positivos hacia la derecha y hacia arriba y números negativos hacia la izquierda y hacia abajo. Las gráficas son la representación visual de una tabla de datos. Los tres tipos más comunes de gráficas son: diagrama de barras, diagrama de líneas y diagrama circular o pastel. El diagrama de barras se realiza asignando las variables al eje (x) y los porcentajes en el eje ( y). A continuación, se determina el alto, si las barras son verticales, o el largo, si las barras son horizontales, según el valor de cada dato a representar. El diagrama de líneas se elabora a partir de una tabla conteniendo una serie histórica de datos en la que cada dato se representa por un punto. Luego, se unen todos los puntos con una línea. El diagrama circular se elabora a partir de una tabla de frecuencia y representa el porcentaje de cada dato respecto al total. Para dibujar el sector o porción que representa cada dato, se utiliza la siguiente fórmula: No. de grados =
98
IGER − Tacaná
% de categoría • 360 100
Autocontrol Actividad 1 Elabore en su cuaderno las tablas necesarias para realizar los diagramas solicitados en cada inciso. Lea con atención la información. 1. En la Encuesta Nacional de Condiciones de Vida 2006 (Encovi 2006) se le preguntó a los entrevistados si la casa donde vivían era propia o no. Los datos en la tabla reflejan qué contestaron las personas entrevistadas a la pregunta anterior.
La gráfica debe tener todos los elementos: títulos (general, ejes y sectores), fuente, etc. Realice: • diagrama de barras • diagrama de sectores Tabla 1 Tenencia de habitación Régimen de tenencia
Hogares
Casa no propia
1841
Casa propia
5435
Total
7276
2. En la Encuesta Nacional de Condiciones de Vida 2006 (Encovi 2006) se determinó si donde vivía la mayoría de personas, era área rural o urbana. Los datos en la tabla reflejan qué contestaron las personas entrevistadas a la pregunta anterior.
Realice las gráficas solicitadas, recuerde que debe tener todos los elementos: títulos (general, ejes y sectores), fuente, etc. • diagrama de barras • diagrama de sectores
Tabla 2 Área donde viven las personas entrevistadas Área
Hogares
Rural
3852
Urbana
3424
Total
7276
3. En un aula de la escuela El Porvenir asiste la siguiente cantidad de estudiantes: 15 mujeres y 17 hombres.
Con la información proporcionada realice en su cuaderno los diagramas indicados. • diagrama de barras • diagrama de sectores
Estadística Descriptiva − Semana 6
99
Navegue en la red... Instituto Guatemalteco de Turismo (Inguat) El Instituto Guatemalteco de Turismo (Inguat) es la institución encargada de fomentar y promover el desarrollo turístico de Guatemala a nivel nacional e internacional. El turismo genera empleos e ingresos para muchos guatemaltecos, en la forma de prestación de servicios de hoteles, restaurantes, transporte, así como elaboración de artesanías, entre otros. El turismo además permite el ingreso de divisas, es decir moneda de otros países. Debido a la importancia del turismo en la economía nacional, el Inguat lleva registros estadísticos sobre la oferta hotelera, el ingreso de turistas al territorio nacional, los tipos de viajeros que nos visitan, de dónde vienen y el dinero que dejan en el país. Si desea conocer más datos sobre el turismo nacional e internacional, visite la página electrónica: www.inguat.gob.gt/estadisticas.php
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
100
la casilla que mejor indique su rendimiento.
Localizo puntos en un sistema de coordenadas cartesianas. Utilizo la información de las tablas para construir diagramas de barras, de líneas y circulares. Calculo grados para elaborar un diagrama circular. Valoro el uso de gráficas para presentar datos estadísticos.
IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
7 Distribución de frecuencias ( I ) ¿Qué encontrará esta semana? Elementos de un cuadro para variable cuantitativa Uso de intervalos en encuestas Distribución de frecuencias
Esta semana logrará: Diferenciar los tipos de tablas según los datos que presentan. Elaborar tablas con datos cuantitativos. Construir una distribución de frecuencias.
Estadística Descriptiva − Semana 7
101
¡Para comenzar! Elementos de un cuadro para variables cuantitativas La recolección de datos constituye la materia prima con que se trabaja en los cálculos estadísticos, por lo tanto resulta muy importante la forma en que organizamos la información pues por lo general se analiza gran cantidad de datos. En varias situaciones de la vida cotidiana como, por ejemplo, los artesanos transforman la madera, el barro, el metal y otros materiales en muebles, floreros, esculturas, etc.; también cuando cocinamos, después de varios procedimientos los alimentos crudos se convierten en platos apetitosos que se sirven en la mesa. A través de un proceso similar, las investigadoras e investigadores con la ayuda de "recetas" llamadas fórmulas y técnicas, intentan transformar la información recolectada en resultados que les permitan probar sus hipótesis y ampliar sus conocimientos. Entonces, ¿qué hacer para transformar gran cantidad de datos en un resumen fácil de entender? Si los datos son cualitativos, podemos construir una tabla como las que aprendimos en la semana 6. Ejemplo: Sexo
Cantidad
Hombres
10
Mujeres
20
Total
30
Si los datos son cuantitativos, podemos construir una distribución de frecuencias en forma de tabla de intervalos. Ejemplo:
102
IGER − Tacaná
Clase
Frecuencia
0–1
5
2–3
8
4–5
10
6–7
6
Total (n)
29
El mundo de la estadística 1. Distribución de frecuencias La distribución de frecuencias es una organización, en forma de tabla, de datos estadísticos agrupados; en la tabla se muestra la frecuencia con que aparecen los datos en cada intervalo. Se utiliza cuando se tienen datos cuantitativos, tales como calificaciones, peso, estatura, edad, salario o cualquier dato que pueda expresarse de forma numérica. Al igual que las tablas para variables cualitativas, está formada por columnas y filas. La primera columna contiene las clases o intervalos y la segunda muestra cuántos datos hay en cada intervalo, es decir, la frecuencia. Veamos un ejemplo para entender mejor. Se aplica un examen a 126 estudiantes y se construye la distribución de frecuencias para las calificaciones. • Elaborar un cuadro compuesto por dos columnas. La primera columna deberá llevar el título "clase o intervalo" y la segunda "frecuencia f", como se observa en el cuadro siguiente: 10 clases o intervalos
Primera fila o clase
Quinta fila o clase
Clase o intervalo
Frecuencia f
0–9
10
10 – 19
15
20 – 29
16
30 – 39
12
40 – 49
18
50 – 59
16
60 – 69
15
70 – 79
10
80 – 89
9
90 – 99
5
Total (n)
126
Estadística Descriptiva − Semana 7
103
Ahora, analicemos detenidamente la información del cuadro anterior y pongamos atención a los aspectos siguientes: •
Los datos cuantitativos de la primera fila indican que 10 (frecuencia) estudiantes obtuvieron calificaciones entre 0 y 9 puntos. Por lo tanto, la frecuencia indica la cantidad de veces que se repite un dato en una clase o intervalo.
•
La quinta fila se puede interpretar como 18 (frecuencia) estudiantes obtuvieron calificaciones entre 40 y 49.
¿Cuántos estudiantes obtuvieron calificaciones entre 60 y 69?
•
Con respecto a las clases o intervalos, conviene aclarar que cada clase tiene dos límites, el límite inferior y el límite superior. Si revisamos la primera clase del cuadro, el límite inferior es 0 y el superior es 9. En la quinta fila el límite inferior es 40 y el superior es 49.
¿Cuál es el límite inferior en la última clase? superior?
•
Otro elemento importante es la amplitud del intervalo, es decir, el tamaño del intervalo. Para calcularlo, se resta el límite superior menos el límite inferior de la clase y se le suma 1. Ejemplo: La amplitud de la primera clase es 9 – 0 + 1 = 10, la amplitud de la quinta clase es 49 – 40 + 1 = 10. ¿Cuál será la amplitud de la última clase?
•
Como puede observar, todas las clases tienen una amplitud de clase 10. Las distribuciones de frecuencias se construyen con igual amplitud. Existen casos especiales en donde la amplitud de clase no es igual, pero este tema no se tratará en este curso.
y ¿cuál es el límite
Lectura Uso de intervalos en encuestas Cuando se hace una encuesta hay preguntas que es mejor hacerlas utilizando intervalos. Estas preguntas son las que a las personas no les gusta responder, por ejemplo, edad. Es mejor poner rangos de edad, por ejemplo de 0 a 9 años, de 10 a 19, de 20 a 29, etc. Otra pregunta sensible es el salario, a las personas no les gusta decir cuánto ganan, por eso es mejor dar intervalos de salario, esto mejora la obtención de datos. En ambos casos las variables son cuantitativas, por eso es que se utilizan intervalos. Responda: ¿Para qué otras variables será necesario utilizar intervalos?
104
IGER − Tacaná
2. Construcción de una distribución de frecuencias Uno de los procedimientos para construir una distribución de frecuencias es el siguiente: • Calcular la amplitud total de los datos = dato mayor – dato menor • Decidir cuántas clases se utilizarán. Sobre este aspecto, se recomienda utilizar no menos de 5 clases o intervalos, ni más de 20. Existen fórmulas para ayudar a decidir en cuántas clases se hará la distribución de frecuencias: No. clases = 1 + 3.3 • log n
En donde n es el número de datos que se tienen. El logaritmo (log) se calcula utilizando una calculadora científica.
•
Dividir la amplitud total entre el número de clases decidido, para obtener un tamaño de clase aproximado.
• Decidir el tamaño de clase o intervalo aproximando el valor obtenido anteriormente. • Decidir dónde iniciar la distribución. Lo único importante es que las clases deben contener al número más pequeño y al número más grande. No necesariamente se debe iniciar en ellos. • Escribir las clases colocando el número del límite inferior seguido de un guión y luego el número del límite superior del intervalo. • Hacer el recuento de cuántos números contiene cada clase. Observación: de una serie de datos se pueden obtener distintas distribuciones de frecuencias. No hay una sola solución. Lo importante es que cumpla con la regla de no menos de 5 ni más de 20 y que todas las clases sean iguales.
Ejercicio 1
Escriba con sus palabras qué significa cada concepto: 1. Intervalo: 2. Límite inferior: 3. Límite superior: 4. Amplitud de intervalo: 5. Amplitud total:
Estadística Descriptiva − Semana 7
105
Ejercicio guiado Antes de realizar el autocontrol revise los ejemplos siguientes. A. La maestra de 4.º primaria registró las siguientes calificaciones del examen de Ciencias Naturales que aplicó a sus 25 estudiantes.
49
29
53
54
74
27
30
85
11
28
12
78
86
69
92
36
83
34
39
51
50
60
50
60
54
Siga los pasos descritos anteriormente. • Calcular la amplitud total = dato mayor – dato menor Amplitud total = 92 – 11 = 81 • Decidir cuántas clases va a tener. Si se aplica la fórmula:
No. clases = 1 + 3.3 • log 25 = 1 + 3.3 (1.3979) = 5.61
Sabemos que la fórmula recomienda 5 o 6 clases, por lo tanto debemos decidirnos por el número que sea más fácil de utilizar. Es más fácil 5 que 6, entonces decidimos utilizar 5 clases o intervalos.
• Dividir la amplitud total entre el número de clase. Tamaño de clase =
81 = 16.2 5
• Decidir el tamaño de clase aproximando el valor obtenido anteriormente.
Se busca el más fácil y próximo al valor obtenido. En este caso, es mejor tomar 15. No hay ningún problema si se toma 16, pero resulta más fácil hacer cálculos con el número 15. Recuerde lo siguiente: todos los números que se obtienen son una guía y no valores absolutos. El criterio a utilizar es tomar aquellos que faciliten el trabajo.
• Decidir dónde iniciar la distribución.
106
IGER − Tacaná
Como el número más pequeño es 11, se puede iniciar en 10. No existe ningún problema si se inicia en 11, pero es más fácil trabajar si se inicia, en este caso, en 10.
• Colocar las clases en un cuadro como el siguiente:
Clases
Recuento
Frecuencias
10 – 24 25 – 39 40 – 54 55 – 69 70 – 85 86 – 100
• Hacer el recuento de cuántos números contiene cada clase.
Para hacer el recuento de una forma más fácil, observe cuál es el primer número de la tabla y vea que es 49, este valor se asigna en la clase 40 – 54. En la casilla correspondiente se coloca una rayita.
No importa el orden en que se realice.
El segundo número es 27 y cae en el intervalo entre 25 y 39, por lo que en la casilla de recuento se coloca una rayita.
El tercer número es 12 que cae en la primera clase, se coloca una rayita en la casilla recuento y así sucesivamente.
Finalmente el cuadro queda así:
Clases
Recuento
Frecuencias
10 – 24
ll
2
25 – 39
lllll ll
7
40 – 54
lllll ll
7
55 – 69
lll
3
70 – 85
llll
4
86 – 100
ll
2
Total
25
Estadística Descriptiva − Semana 7
107
B. La empresa de jugos "Tomatón" vendió las siguientes unidades durante una promoción que duró 20 días.
Con los siguientes datos se elabora una distribución de frecuencias. 8
1
8
6
0
0
8
9
6
7
3
7
4
7
2
4
0
5
7
1
Siga los pasos descritos anteriormente. • Calcular la amplitud total = dato mayor – dato menor Amplitud total = 9 – 0 = 9 Decidir cuántas clases va a tener.
Aplicar la fórmula de número de clases 1 + 3.3 log 20 = 1 + 3.3 • (1.301) = 5.29
Sabemos que la fórmula recomienda 5 o 6 clases, de modo que debemos decidirnos por el número que sea más fácil de utilizar. En este caso resulta más fácil utilizar 5 que 6 clases, entonces nos decidimos por 5.
• Dividir la amplitud total entre el número de clase. 8 = 1.6 5 • Decidir el tamaño de clase aproximando el valor obtenido anteriormente. Tamaño de clase =
El valor de clase que mejor se aproxima es 2.
• Decidir dónde iniciar la distribución.
Como el número más pequeño es 0, se inicia en 0, ya que no hay otra posibilidad.
• Colocar las clases en un cuadro como el siguiente y hacer los recuentos necesarios para completarlo. Clases
Recuento
Frecuencias
0a1
lllll
5
2a3
ll
2
4a5
lll
3
6a7
lllll l
6
8a9
llll
4
Total
108
IGER − Tacaná
20
Vocabulario básico amplitud: tamaño numérico que existe entre los intervalos. clase o intervalo: conjunto de valores entre dos límites dados. exponente: también llamado potencia, es el número al cual se eleva la base para ser multiplicada por sí misma. frecuencia: número de elementos comprendidos en un intervalo de una distribución determinada. logaritmo: es el exponente al que hay que elevar un número, llamado base, para obtener otro número determinado. El cálculo de logaritmos es la operación inversa a la exponenciación de la base del logaritmo.
Resumen La distribución de frecuencias es una organización, en forma de tabla, de datos estadísticos agrupados; en la tabla se muestra la frecuencia con que aparecen los datos en cada intervalo. Los intervalos se utilizan para agrupar cantidades de números y evitar listar uno por uno. Además, al realizar una encuesta es preferible utilizar intervalos cuando se hacen preguntas que a las personas no les gusta responder directamente, por ejemplo: peso, salario, edad y otros. La distribución de frecuencias se compone básicamente de dos elementos: clase o intervalo y frecuencia. Es necesario conocer cuántos intervalos se van a considerar para la distribución de frecuencias, no deberían ser menos de 5 ni más de 20. Para calcular una distribución de frecuencias: 1. Calcule la amplitud total = dato mayor – dato menor. 2. Decida el tamaño del intervalo y dónde iniciar la distribución. 3. Divida la amplitud entre el número de clases decidido o calcule aplicando la fórmula: Número de clases = 1 + 3.3 • log n. 4. Elabore un cuadro con los intervalos y distribuya los elementos según el intervalo al que pertenezcan. 5. Haga el recuento de casos o datos en cada intervalo y complete el cuadro.
Estadística Descriptiva − Semana 7
109
Autocontrol Actividad 1 A continuación encontrará una serie de casos sobre datos estadísticos. Se le pide realizar una distribución de frecuencias para cada uno de ellos en el espacio correspondiente. 1. En el hospital regional tienen los datos del número de medicinas que toman al día los pacientes en su unidad de emergencia. 19
22
19
20
2
16
14
1
17
2
16
21
7
23
24
6
15
9
11
6
21
11
25
1
14
2. Una organización tiene los datos de sus beneficiarios en 25 comunidades.
110
IGER − Tacaná
159
125
233
220
215
227
170
153
193
207
136
143
109
238
196
175
163
230
166
109
233
214
208
202
202
3. La carnicería "Cárnicos, S.A." lleva el registro del peso de las piezas que ha comprado en los últimos 25 días. 15
113
119
105
59
29
55
97
90
94
59
60
106
104
11
10
43
50
67
119
79
83
95
54
36
4. Una empresa registra cuántos clientes ha recibido diariamente durante la campaña publicitaria que realizó en los últimos 25 días. 87
84
27
21
1
26
3
44
41
25
24
8
74
23
100
83
16
37
29
59
48
49
75
99
58
Estadística Descriptiva − Semana 7
111
5. El Ministerio de Comunicaciones lleva el registro de los kilómetros de carreteras arreglados durante los últimos 25 meses de gestión. 81
88
87
83
86
83
88
89
84
86
88
90
90
86
82
89
90
82
88
82
81
87
87
82
87
Navegue en la red... Instituto Nacional de Ciencias Forenses de Guatemala (Inacif) EI Instituto Nacional de Ciencias Forenses de Guatemala (Inacif) es la institución encargada de apoyar al sistema judicial aplicando métodos científicos que aporten pruebas objetivas a la investigación criminal. Por ello, llevan registros de los casos que atienden: pruebas de laboratorio, evaluaciones psicológicas y psiquiátricas, necropsias, o sea, estudio científico de cadáveres, y otras labores relacionadas con la resolución de casos criminales. Si desea conocer más sobre la labor del Inacif, visite la página electrónica: www.inacif.gob.gt
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
112
la casilla que mejor indique su rendimiento.
Diferencio los tipos de tablas según los datos que presentan.
Elaboro tablas con datos cuantitativos. Construyo una distribución de frecuencias.
IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
8 Repaso: semanas 1 a 5 Esta semana logrará: Repasar los contenidos de las semanas 1 a 5. Resolver los ejercicios del repaso para evaluarse en la prueba parcial. Prepararse bien para la prueba de evaluación.
Estadística Descriptiva − Semana 8
113
Querida y querido estudiante: Se aproxima la prueba parcial y debe prepararse adecuadamente. A continuación ejercitaremos contenidos de la semana 1 a la 5. Para aprovechar este repaso, le damos estas recomendaciones. • Haga un plan de lo que estudiará cada día y trate de cumplirlo. Dedique más tiempo a los temas que le resulten difíciles. • Busque un lugar tranquilo, iluminado y silencioso para estudiar. • Lea los resúmenes de cada semana y escriba las ideas más importantes en su cuaderno. • Escuche la clase radial. Sus maestros locutores le acompañarán en este repaso y le ayudarán a resolver algunos ejercicios. • Compruebe que haya realizado bien los autocontroles. Si tiene dudas, vuelva a leer las semanas, ahí encontrará explicaciones y ejemplos. Recuerde que puede consultar sus dudas con su tutor.
¿Cómo será la prueba de evaluación? La prueba parcial evalúa los mismos contenidos y de la misma forma en que los ha trabajado semana a semana. • Cuando resuelva ejercicios y problemas debe dejar escrito el procedimiento. Muy importante: cada serie contiene instrucciones exactas de lo que debe realizar en cada apartado, así como la valoración asignada. Si usted se prepara con tiempo y dedicación, el resultado será satisfactorio.
114
IGER − Tacaná
¡Para comenzar! Recordando lo estudiado en las semanas anteriores, en esta ocasión haremos ejercicios con el fin de repasar: el planteamiento de preguntas de investigación, hipótesis o posibles respuestas, la identificación de unidades de análisis, las variables y sus categorías, listas, tablas estadísticas y cálculo de porcentajes. Como veremos a continuación, en los periódicos, revistas, libros o en el trabajo diario, es frecuente encontrar cuadros o tablas que contienen la información de interés distribuida en columnas y filas, con palabras o frases en forma de títulos, encabezamientos y notas que aclaran el significado de los datos y su origen. ¡A trabajar! Busque en un periódico, libro o revista la presentación de datos estadísticos. Analice la información y responda lo que se le pide. 1. ¿Cuál es la pregunta de investigación? 2. ¿Cuál sería la posible hipótesis? 3. Identifique las unidades de análisis. 4. Identifique las variables. 5. Identifique las categorías. 6. Si tiene una tabla o gráfica, identifique las partes.
Estadística Descriptiva − Semana 8
115
Lectura La información que se presenta a continuación fue tomada de la página de estadísticas del Mineduc y el cuadro de la página siguiente presenta datos de avance de la educación en Guatemala. Léalos y haga un comentario en las líneas que se le ponen para el efecto tomando en cuenta algunos de los siguientes aspectos: • ¿Cuál habrá sido la pregunta de investigación que se planteó el Mineduc en este caso? • ¿Habrá sido necesario plantear una hipótesis? ¿Cuál podría ser? • ¿Cuál es la unidad de análisis o el objeto de estudio? • ¿Cuáles son las variables que se midieron?
Comentario
116
IGER − Tacaná
Informe de Progreso Educativo: Guatemala 2002
Comentario
Estadística Descriptiva − Semana 8
117
Ejercicio guiado El Ine realizó la encuesta Enei 2 – 2013 (Encuesta Nacional de Empleo e Ingresos) en toda Guatemala a personas de 15 años o más. Se midieron muchas variables, entre ellas sexo y área donde vive la población ocupada. La entrevista se aplicó a 3 750 099 hombres y a 2 061 094 mujeres. A nivel nacional, el 21.4 % de los hombres y el 18.8 % de las mujeres ocupadas están en el área urbano metropolitano. El 31.5 % de hombres y el 29.9 % de mujeres están en el resto urbano, y el 47.1 % de hombres y 51.3 % de mujeres están en el área rural nacional. ¿Cuál fue la pregunta de investigación? ¿Cuál es el nivel de empleo por sexo y área en la República de Guatemala? ¿Qué hipótesis se planteó en este caso? Con base en la experiencia, observación u otros estudios, ¿qué podría predecirse? El mayor nivel de empleo se encuentra en los hombres del área rural nacional. ¿Cuál fue la unidad de análisis? Identifiquemos qué se está estudiando: la persona. ¿Qué variables se estudiaron? De la unidad de análisis, ¿qué características o aspectos se midieron? Son dos variables: a. Sexo b. Área donde vive ¿Las variables son cualitativas o cuantitativas? Veamos si las variables corresponden a nombres de las características de la unidad de análisis o datos numéricos, es decir cantidades: las dos variables son cualitativas. ¿En qué nivel de medida están las variables? Verifiquemos si las variables se diferencian unas de otras o expresan diferentes niveles de una misma categoría: las dos son nominales. ¿Cuál es la población? Esta información corresponde a las características de la unidad de análisis u objeto de estudio: personas ocupadas de Guatemala con 15 años o más.
118
IGER − Tacaná
¿Cuál es la muestra? En este caso sería el total de personas entrevistadas o encuestadas: las 5 811 193 personas entrevistadas. ¿Cómo se seleccionó la muestra? El texto no lo dice, pero normalmente es aleatoria. Además fue estratificada por área y sexo. ¿Los datos obtenidos son estadísticos o parámetros? Son estadísticos por haber sido obtenidos de una muestra. ¿Qué tipo de estadística se utiliza? Estadística descriptiva, porque solamente describe información acerca de la muestra y no hace generalizaciones al total de la población. Tabla 3 Población ocupada por el área donde vive y sexo. Guatemala, 2013 Área donde vive
Hombre
Mujer
Urbano metropolitano
21.4 %
18.8 %
Resto urbano
31.5 %
29.9 %
Rural nacional
47.1 %
51.3 %
Total nacional
100 %
100 % Fuente: Inei 2 – 2013 Ine
Interpretación de la tabla El cuadro muestra que a nivel nacional el porcentaje de mujeres ocupadas es mayor en el área rural nacional y que el porcentaje de hombres ocupados es mayor que las mujeres en las áreas urbano metropolitano y resto urbano.
Estadística Descriptiva − Semana 8
119
Ejercicio 1
Con la información que contiene la encuesta realice las actividades que se indican abajo. El Ine realizó la encuesta Enei 2 – 2013 (Encuesta Nacional de Empleo e Ingresos) en toda Guatemala a personas de 15 años o más. Se midieron muchas variables, entre ellas: el nivel educativo de las personas. Se obtuvieron los datos siguientes: • 1 163 518 personas indicaron tener ningún nivel educativo • 1 319 151 la primaria incompleta • 1 010 221 primaria completa • 883 664 secundaria incompleta • 1 001 712 secundaria completa • 1 078 451 superior incompleta • 164 364 superior completa 1. Pregunta de investigación: 2. Hipótesis: 3. Unidad de análisis: 4. Variable que se va a estudiar: 5. La variable es cualitativa o cuantitativa: 6. En qué nivel de medida están las variables: 7. Con los datos realice una tabla que presente la información dada. Se le proporciona espacio en la página siguiente. Debe contener todos los elementos de las tablas estadísticas que hemos estudiado: • título • encabezados
120
IGER − Tacaná
• fuente • totales
• año • porcentajes
• lugar • etc.
En este espacio, elabore la tabla solicitada.
Ejercicio 2
Con la información que contiene la encuesta realice las actividades que se indican abajo. El Ine realizó la encuesta Enei 2 – 2013 (Encuesta Nacional de Empleo e Ingresos) en toda Guatemala a personas de 15 años o más. Se midieron muchas variables, entre ellas la jornada laboral. A nivel nacional se obtuvieron los datos siguientes: 10.3 % trabaja menos de 20 horas a la semana, 35.6 % entre 20 y 40 horas, 30.1 % entre 41 y 48 horas y el 24 % más de 48 horas a la semana. 1. Pregunta de investigación: 2. Hipótesis: 3. Unidad de análisis:
Estadística Descriptiva − Semana 8
121
4. Variable que se va a estudiar: 5. La variable es cualitativa o cuantitativa: 6. En qué nivel de medida están las variables: 7. Con los datos, elabore la tabla que presente la información obtenida. Debe contener todos los elementos de la tabla estadística que hemos estudiado: • • • •
título fuente año lugar
• • • •
encabezados totales porcentajes etc.
En este espacio elabore la tabla solicitada.
122
IGER − Tacaná
Ejercicio 3
Busque en cualquier periódico o revista información que contenga datos, ya sea cantidades o porcentajes. Con esa información, realice las actividades siguientes. 1. Pregunta de investigación: 2. Hipótesis: 3. Unidad de análisis: 4. Variable que se va a estudiar: 5. La variable es cualitativa o cuantitativa: 6. En qué nivel de medida están las variables: 7. Realice, en su cuaderno, la tabla que represente la información obtenida del ejercicio anterior. Debe contener todos los elementos de la tabla estadística que hemos estudiado: • • • •
título fuente año lugar
• • • •
encabezados totales porcentajes etc.
Estadística Descriptiva − Semana 8
123
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
logrado
la casilla que mejor indique su rendimiento.
en proceso
no logrado
Repaso los contenidos de las semanas 1 a 5. Resuelvo los ejercicios del repaso para evaluarme en la prueba parcial. Me preparo bien para la prueba de evaluación.
Orientaciones sobre la prueba parcial Esté atento a los contenidos y fecha de su próxima prueba parcial. Prepárese para su prueba parcial de Estadística Descriptiva. Le presentamos algunas recomendaciones que pueden ayudarle a la hora del examen.
Grupo: Tacaná Prueba: Primera
Al recibir la prueba, y antes de empezar a resolverla, escriba su nombre, número de carné, número de círculo y fecha. Lea atentamente las instrucciones antes de contestar. Si tiene duda, consulte a su orientador(a).
Materia: Estadística Descriptiva A – 2016
Nombre: Carné: Círculo de estudio Nº:
TACANÁ
Punteo:
Fecha:
i serie.
1 punto cada respuesta correcta. Total 6 puntos. INSTRUCCIONES: Marque con una "x" el cuadro que corresponde al resultado correcto. 1. En Estadística las variables pueden ser de dos tipos.
cualitativas y cuantitativas categorías y análisis hipótesis y censo
No se "atasque" en ningún ejercicio. Empiece por las preguntas que sepa mejor y le quedará más tiempo para pensar en las que tenga dudas. Al finalizar su examen, relea todas sus respuestas y vea si algo se le pasó por alto. Presente su prueba limpia y ordenada. ¡ánimo! El resultado de su examen será el producto de su esfuerzo.
124
IGER − Tacaná
30 % 15 % 5%
50 %
9 Distribución de frecuencias (II) ¿Qué encontrará esta semana? Elementos de un cuadro para variable cuantitativa Monitoreo de la Canasta Básica Alimentaria
Tablas estadísticas para variables cuantitativas
Esta semana logrará: Conocer los elementos de un cuadro para variable cuantitativa. Identificar los productos que conforman la Canasta Básica Alimentaria. Calcular e interpretar la frecuencia acumulada, la frecuencia relativa y los porcentajes acumulados en una tabla estadística.
Estadística Descriptiva − Semana 9
125
¡Para comenzar! Elementos de un cuadro para una variable cuantitativa Recordemos los dos elementos principales de un cuadro para una variable cuantitativa, que estudiamos en la semana 7. Una distribución de frecuencias se compone básicamente de 2 aspectos: 1. clases (llamadas también intervalos), y 2. frecuencias. Observemos las dos columnas que forman el siguiente cuadro: Primera fila o clase
Quinta fila o clase
Clase o intervalo
Frecuencia f
0–9
10
10 – 19
15
20 – 29
16
30 – 39
12
40 – 49
18
50 – 59
16
60 – 69
15
70 – 79
10
80 – 89
9
90 – 99
5
Total
126
¡A trabajar! Lea el cuadro anterior y responda las preguntas siguientes. 1. ¿Cuántas clases hay? 2. ¿Cuántos casos o datos hay en total?
126
IGER − Tacaná
Lectura Monitoreo de la Canasta Básica Alimentaria El Instituto Nacional del Estadística (Ine) monitorea constantemente los precios de los bienes y servicios básicos que los guatemaltecos necesitamos para nuestro diario vivir. Uno de los más importantes es la Canasta Básica Alimentaria (Cba), que está conformada por 26 productos que son los que, al menos, debe consumir una familia de 5.38 miembros para satisfacer sus necesidades energéticas y proteícas y tener una alimentación sana. El siguiente cuadro muestra el costo de adquisición de la Canasta Básica Alimentaria (Cba) en marzo de 2014.
Lea la tabla y analice lo que se le solicita.
Fuente: Ine 2014
Compare el consumo de alimentos de su familia con el listado de productos de la Canasta Básica Alimentaria. ¿Consume más o menos productos? Anote el número de productos que su familia consume.
Estadística Descriptiva − Semana 9
127
El mundo de la estadística 1. Tablas estadísticas para variables cuantitativas A continuación veremos qué información se puede obtener en una distribución de frecuencias.
1.1 Columna de frecuencias acumuladas En primer lugar, recordemos que la distribución de frecuencias es muy utilizada en estadística debido a que nos permite conocer el número de casos o datos que corresponde a cada clase o intervalo. Sin embargo, a veces es importante y necesario conocer cuántos casos caen por debajo o por encima de cierta puntuación. De manera que esta información se obtiene con los cuadros de frecuencias acumuladas. Entonces, podemos afirmar que resulta conveniente presentar frecuencias de una manera acumulada cuando se busca localizar la posición de un caso en relación con la actuación total de un grupo. Para entender mejor, pasemos de la teoría a la práctica. Con la información que describe el cuadro que se encuentra en la página siguiente, conteste mentalmente las preguntas a continuación y compare su respuesta: • ¿Cuántos casos hay entre 0 y 9? Si su respuesta es 10, está correcta. • ¿Cuántos casos hay entre 10 y 19? Si su respuesta es 15, está correcta. • ¿Cuántos casos hay entre 0 y 19?
Para responder esta pregunta, simplemente debemos sumar los casos que hay entre 0 y 9 con los que hay entre 10 y 19, lo cual da como resultado 25.
• ¿Cuántos casos hay entre 0 y 29? El procedimiento que debe seguir será el siguiente: 10 + 15 + 16 = 41. Este es un ejemplo de frecuencia acumulada. Como pudimos observar, la frecuencia acumulada es la suma o "acumulación" de las frecuencias anteriores hasta el intervalo que analizamos. Esta frecuencia responde la pregunta: ¿cuántos casos hay entre el límite inferior de la primera clase y el límite superior de la clase que estamos tratando? Una forma práctica de calcular las frecuencias acumuladas consiste en sumar la frecuencia acumulada de una clase con la frecuencia de la clase siguiente, en el sentido que indican las flechas que aparecen en el cuadro de la página siguiente. La frecuencia acumulada la representaremos con una F mayúscula.
128
IGER − Tacaná
Clase o intervalo
Frecuencia ( f )
Frecuencia acumulada (F)
0–9
10
10
10 – 19
15
25
20 – 29
16
41
30 – 39
12
53
40 – 49
18
71
50 – 59
16
87
60 – 69
15
102
70 – 79
10
112
80 – 89
9
121
90 – 99
5
126
Total
126
a. ¿Cuántos casos caen entre 0 y 69?
102
b. ¿Cuántos casos caen entre 0 y 89?
121
c. ¿Cuántos casos caen entre 0 y 99?
126
10 + 15
102 + 10
Al final, la suma debe dar el mismo número que el total de casos.
Por lo tanto, las frecuencias acumuladas nos permiten visibilizar de forma inmediata cuántos casos están comprendidos en varias clases o intervalos agrupados de diferente forma, dependiendo de los objetivos de nuestra investigación.
Ejercicio 1
A continuación encontrará una tabla con datos sobre el estado civil de los jefes(as) de familia de la comunidad El Zacatillo. Responda las preguntas que se le plantean. Estado civil Frecuencia ( f ) Frecuencia acumulada Soltero
5
5
Casado
40
45
Unido
20
65
Total
65
1. ¿Cuántos solteros y casados hay? 2. ¿Cuántos solteros y unidos hay? 3. ¿Funcionan las frecuencias acumuladas para tablas con variable cualitativa?
Estadística Descriptiva − Semana 9
129
1.2 Columna de frecuencias relativas Las frecuencias relativas nos indican la relación que existe entre la frecuencia y el total. Por ejemplo, supongamos que usted logró un puntaje de 85 en un examen de estadística. Para determinar exactamente qué tan alta fue su nota, podría ser de ayuda comparar su nota con los puntajes del resto del grupo. Analicemos: • ¿Lograron la mayoría de los estudiantes puntajes de 85? Si fue así, su calificación podría considerarse no muy alta. • O, ¿la mayoría de los estudiantes obtuvo puntajes de entre 60 y 70 puntos? Si fue así, un puntaje de 85 puede ser una calificación muy alta. Entonces, con la ayuda de la distribución de frecuencias relativas podemos hacer comparaciones precisas entre cualquier caso individual y el grupo donde este ocurre. Representamos la frecuencia relativa como fi Por otra parte, la frecuencia relativa se utiliza para calcular porcentajes y número de grados para un diagrama circular o de pastel.
Fórmula de la frecuencia relativa Las frecuencias relativas se calculan utilizando la fórmula siguiente: fi =
frecuencia total
Si tomamos la tabla de la página anterior, observamos que para la primera clase su frecuencia relativa sería: fi =
10 = 0.0793 126
Siguiendo con la tabla de la página anterior, la frecuencia relativa para la segunda clase sería: fi =
130
IGER − Tacaná
15 = 0.1190 126
Ejercicio 2
Para practicar lo aprendido, calcule las frecuencias relativas de las siguientes celdas. 1. Calcule y aproxime a cuatro decimales. 2. Al finalizar, la suma de la columna de frecuencia relativa debe dar 1 o valores cercanos a 1, por las aproximaciones. Clase o intervalo
Frecuencia ( f )
0–9
10
10 – 19
15
20 – 29
16
30 – 39
12
40 – 49
18
50 – 59
16
60 – 69
15
70 – 79
10
80 – 89
9
90 – 99
5
Total
126
Frecuencia relativa ( fi )
Notas:
Estadística Descriptiva − Semana 9
131
1.3 Columna de porcentajes La columna de porcentajes se calcula multiplicando la frecuencia relativa por 100, esto es, % = fi • 100. Otra forma de calcular es correr el punto decimal dos posiciones hacia la derecha. Veamos un ejemplo. Examinemos los valores de la primera clase o intervalo: • Para la primera clase el porcentaje sería 7.93 • Para la segunda clase el porcentaje sería 11.90 • La suma debe dar 100 o valores cercanos a 100, debido a las aproximaciones
132
IGER − Tacaná
Clase o intervalo
Frecuencia
Frecuencia relativa ( fi )
Porcentaje
0–9
10
0.0794
7.94 %
10 – 19
15
0.1190
11.90 %
20 – 29
16
0.1270
12.70 %
30 – 39
12
0.0952
9.52 %
40 – 49
18
0.1429
14.29 %
50 – 59
16
0.1270
12.70 %
60 – 69
15
0.1190
11.90 %
70 – 79
10
0.0794
7.94 %
80 – 89
9
0.0714
7.14 %
90 – 99
5
0.0397
3.97 %
Total
126
1
100 %
1.4 Columna de porcentajes acumulados La columna de porcentajes acumulados se calcula e interpreta de la misma manera que las frecuencias acumuladas. Pongamos atención al ejemplo siguiente. El porcentaje de la primera clase (0 – 9) es 7.93, a esta cifra le sumamos el porcentaje de la segunda clase: 7.93 + 11.90 = 19.83 Al total del porcentaje acumulado de la segunda clase le sumamos el porcentaje de la tercera clase, así: 19.83 + 12.69 = 32.52 Y así sucesivamente hasta completar todas las clases dando un total aproximado a 100.
Clase o intervalo Frecuencia ( f )
Frecuencia relativa ( fi )
Porcentaje
Porcentaje acumulado
0–9
10
0.0794
7.94 %
7.94 %
10 – 19
15
0.1190
11.90 %
19.84 %
20 – 29
16
0.1270
12.70 %
32.54 %
30 – 39
12
0.0952
9.52 %
42.06 %
40 – 49
18
0.1429
14.29 %
56.35 %
50 – 59
16
0.1270
12.70 %
69.05 %
60 – 69
15
0.1190
11.90 %
80.95 %
70 – 79
10
0.0794
7.94 %
88.89 %
80 – 89
9
0.0714
7.14 %
96.03 %
90 – 99
5
0.0397
3.97 %
100 %
Total
126
1
100 %
a. ¿Qué porcentaje de datos caen entre 0 y 39?
42.06 %
b. ¿Qué porcentaje de casos caen entre 0 y 79?
88.89 %
c. ¿Qué porcentaje de datos caen entre 0 y 99?
100 %
d. ¿Qué valor deja el 69 % de casos más pequeños?
59 Estadística Descriptiva − Semana 9
133
Vocabulario básico frecuencia: medida que permite conocer el número de casos que corresponden a cada clase o intervalo. frecuencia acumulada: es la suma de frecuencias de determinado número de intervalos. frecuencia relativa: muestra la relación entre la frecuencia del intervalo y el total. porcentaje: estimación de la frecuencia relativa en relación a cien. porcentaje acumulado: suma de los porcentajes de determinado número de intervalos.
Resumen La frecuencia acumulada es la suma o "acumulación" de las frecuencias anteriores hasta el intervalo que analizamos. Se calcula a partir de una tabla de frecuencias. 1. La frecuencia acumulada del primer intervalo es igual a la frecuencia del mismo. 2. Se calcula la frecuencia acumulada del segundo intervalo, así:
frecuencia acumulada del 1º intervalo + frecuencia del 2º intervalo
3. Se continúa de igual manera, sumando la frecuencia acumulada del intervalo anterior a la frecuencia del intervalo que queremos conocer hasta llegar al último intervalo. El monto de la última frecuencia acumulada debe ser igual que el total de las frecuencias. La frecuencia relativa se calcula también tomando como base una tabla. La frecuencia relativa de cada intervalo se calcula aplicando esta fórmula: fi =
frecuencia total
En una tabla de frecuencias, el porcentaje de cada intervalo se calcula multiplicando por 100 la frecuencia relativa de cada intervalo. El porcentaje acumulado se calcula de manera similar a la frecuencia acumulada: 1. El porcentaje acumulado del primer intervalo es igual al porcentaje del mismo. 2. Se calcula el porcentaje del segundo intervalo, así: porcentaje acumulado del 1º intervalo + porcentaje del 2º intervalo 3. Se continúa de igual manera, sumando el porcentaje acumulado del intervalo anterior al porcentaje del intervalo que queremos conocer hasta llegar al último intervalo. El monto del porcentaje acumulado debe aproximarse al 100 %.
134
IGER − Tacaná
Ejercicio guiado Ejemplo 1 Observe las tablas y los datos siguientes. Lea con atención las preguntas, respóndalas mentalmente y compruebe sus respuestas. Clase o intervalo
Frecuencia ( f )
Frecuencia acumulada (F)
10 – 24
2
2
25 – 39
7
9
40 – 54
7
16
55 – 69
3
19
70 – 85
4
23
86 – 100
2
25
Total
25
a. ¿Cuántos casos caen entre 10 y 69?
19
b. ¿Cuántos casos hay entre 10 y 85?
23
c. ¿Cuántos casos hay entre 10 y 100?
25
Ejemplo 2 Observe las tablas y los datos siguientes. Lea con atención las preguntas, respóndalas mentalmente y compruebe sus respuestas. Clase o intervalo
Frecuencia ( f )
Frecuencia acumulada (F)
0–1
5
5
2–3
2
7
4–5
3
10
6–7
6
16
8–9
4
20
Total
20
a. ¿Cuántos casos caen entre 0 y 3?
7
b. ¿Cuántos casos hay entre 0 y 7?
16
c. ¿Cuántos casos hay entre 0 y 9?
20 Estadística Descriptiva − Semana 9
135
Autocontrol Actividad 1 Interprete la tabla siguiente y responda las preguntas a continuación. Clases
Frecuencia Frecuencia ( f ) acumulada (F)
Frecuencia relativa ( fi )
Porcentaje
Porcentaje acumulado
0–1
5
5
0.25
25 %
25 %
2–3
2
7
0.10
10 %
35 %
4–5
3
10
0.15
15 %
50 %
6–7
6
16
0.30
30 %
80 %
8–9
4
20
0.20
20 %
100 %
Total
20
1.00
100
1. ¿Qué porcentaje de casos caen entre 0 y 7? 2. ¿Qué porcentaje de casos caen entre 0 y 9? 3. ¿Qué porcentaje de casos caen entre 0 y 3? 4. ¿Qué valor deja el 50 % de casos más pequeños?
Actividad 2 A. En la tabla siguiente, realice los cálculos de frecuencia acumulada, frecuencia relativa, porcentaje y porcentaje acumulado. Luego, responda las preguntas. Clases
Frecuencia Frecuencia ( f ) acumulada (F)
0–1
12
2–3
15
4–5
19
6–7
25
8–9
22
10 – 11
10
Total
103
Frecuencia relativa ( fi )
Porcentaje
Porcentaje acumulado
1. ¿Qué porcentaje de casos caen entre 0 y 7? 2. ¿Qué porcentaje de casos caen entre 0 y 3? 3. ¿Qué porcentaje de casos caen entre 0 y 11? 4. ¿Qué valor deja el 50 % de casos más pequeños (buscar el más próximo)?
136
IGER − Tacaná
B. Complete la tabla siguiente y responda las preguntas que están a continuación. Clases
Frecuencia Frecuencia Frecuencia ( f ) acumulada (F) relativa ( fi )
0–9
23
10 – 19
69
20 – 29
63
30 – 39
69
40 – 49
34
50 – 59
35
60 – 69
43
70 – 79
67
80 – 89
24
90 – 99
51
Total
478
Porcentaje
Porcentaje acumulado
1. ¿Qué porcentaje de casos caen entre 0 y 49? 2. ¿Qué porcentaje de casos caen entre 0 y 69? 3. ¿Qué porcentaje de casos caen entre 0 y 99?
4. ¿Qué valor deja el 50 % de casos más pequeños (buscar el más próximo)? C. Complete la tabla siguiente y responda las preguntas a continuación. Clases
Frecuencia Frecuencia Frecuencia ( f ) acumulada (F) relativa ( fi )
0 – 19
29
20 – 39
25
40 – 59
37
60 – 79
10
80 – 99
9
Total
110
Porcentaje
Porcentaje acumulado
1. ¿Qué porcentaje de casos caen entre 0 y 39? 2. ¿Qué porcentaje de casos caen entre 0 y 79? 3. ¿Qué porcentaje de casos caen entre 0 y 99?
4. ¿Qué valor deja el 50 % de casos más pequeños (buscar el más próximo)?
Estadística Descriptiva − Semana 9
137
D. Al preguntar la edad a 100 estudiantes universitarios, se obtienen los resultados siguientes. Clases
Frecuencia Frecuencia Frecuencia ( f ) acumulada (F) relativa ( fi )
15 – 19
20
20 – 24
40
25 – 29
10
30 – 34
8
35 – 39
12
40 – 44
5
45 – 49
5
Total
100
Porcentaje
Porcentaje acumulado
1. ¿Cuántos estudiantes tienen edades entre 15 y 29 años? 2. ¿Cuántos estudiantes tienen edades entre 15 y 44 años? 3. ¿Qué porcentaje de estudiantes tienen entre 15 y 29 años? 4. ¿Qué porcentaje de estudiantes tienen entre 35 y 39 años? 5. ¿Entre qué edades está el 60 % de los estudiantes más jóvenes?
Navegue en la red... Organismo Judicial (OJ) Es el ente encargado de administrar justicia en el país a través de los diferentes juzgados, tribunales de justicia y salas de apelaciones. El OJ pone a disposición del público datos estadísticos organizados según la materia judicial, la ubicación geográfica, la instancia y el órgano judicial de los procesos judiciales, audiencias, sentencias y resoluciones. Para conocer más del sistema de justicia guatemalteco, visite: www.oj.gob.gt/estadisticaj
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
138
la casilla que mejor indique su rendimiento.
Conozco los elementos de un cuadro para variable cuantitativa. Identifico los productos que conforman la Canasta Básica Alimentaria. Calculo e interpreto la frecuencia acumulada, la frecuencia relativa y los porcentajes acumulados en una tabla estadística. IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
10 Medidas de tendencia central ¿Qué encontrará esta semana?
Jerarquía de las operaciones aritméticas
Costo promedio de la Canasta Básica Alimentaria
Medidas de tendencia central o promedios
Esta semana logrará: Reconocer la jerarquía de las operaciones matemáticas. Calcular la media aritmética, la mediana y la moda. Interpretar la aplicación de la media aritmética, la mediana y la moda en situaciones de la vida real.
Estadística Descriptiva − Semana 10
139
¡Para comenzar! Jerarquía de las operaciones aritméticas ¿Será que cuando realizamos operaciones aritméticas combinadas obtenemos siempre el mismo resultado? Hagamos la prueba. Para ello efectúe las siguientes operaciones iniciando con la suma y luego la multiplicación. Luego, cambie el orden de las operaciones, realice primero la multiplicación y luego la suma: • 2 + 3 • 5 = • 3 • 5 + 2 = ¿Cómo es posible obtener resultados tan distintos? La diferencia en los resultados se debe a que en la primera operación no se tomó en cuenta la jerarquía o el orden de las operaciones aritméticas, mientras que en la segunda sí.
Orden en que se deben realizar las operaciones Las operaciones aritméticas se realizan siguiendo un orden determinado, pues al decir que el orden es jerárquico, esto significa que se hacen primero unas operaciones y luego otras. Ahora veamos cuál es el orden o la jerarquía a la hora de realizar este tipo de operaciones:
Primera jerarquía Potencias y raíces 53 = 125 √4 = 2
Segunda jerarquía Multiplicaciones y divisiones 6 • 4 = 24 25 = 5 5
Tercera jerarquía Sumas y restas 2+6=8 7–2=5
140
IGER − Tacaná
Cuando se realizan operaciones con diferente jerarquía, según el orden que hemos visto se deben realizar: • Primera jerarquía: potencias y raíces • Segunda jerarquía: multiplicaciones y divisiones • Tercera jerarquía: sumas y restas Ejemplo: 2 + 5 • 3, la multiplicación es de segunda jerarquía y la suma de tercera, esto implica que se debe hacer primero la multiplicación y luego la suma, así: 2 + 5 • 3 = 2 + 15 = 17 Ejemplo: 4 • 2 + 6 • 3 = 8 + 18 = 26
Cuando se tienen varias operaciones de la misma jerarquía, se realizan de izquierda a derecha en el orden en que aparezcan. 25 ÷ 5 • 4 ÷ 2 • 3 = 5 • 2 • 3 = 30 Ejemplo: Si hay operaciones de distinta jerarquía se sigue el orden siguiente: se realizan primero las operaciones de la jerarquía mayor y luego las de la siguiente.
25 ÷ 5 + 3 • 4 – 6 ÷ 2 = 5 + 12 – 3 = 14
Las operaciones encerradas en los óvalos son de la misma jerarquía y se realizan primero.
¡A trabajar! Resuelva las siguientes operaciones aritméticas. 1. 5 • 3 • 2 ÷ 6 + 2 • 3 ÷ 6 • 2 + 6 • 3 ÷ 18 =
2. 18 ÷ 6 • 3 + 4 ÷ 2 • 2 + 15 ÷ 5 • 3 =
Estadística Descriptiva − Semana 10
141
Lectura Costo promedio de la Canasta Básica Alimentaria En primer lugar, recordemos que la distribución de frecuencias es muy utilizada en estadística debido a que nos permite conocer el número de casos que corresponde a cada clase o intervalo. Sin embargo, a veces es importante y necesario conocer cuántos casos caen por debajo o quedan por encima de cierta puntuación. De manera que esta información se obtiene con los cuadros de frecuencias acumuladas. Por ejemplo, sobre el costo de la Canasta Básica Alimentaria.
Año 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Fuente: Elaboración propia con datos de Ine, Historial de la Cba
Hue
costa sur. En el artículo leemos sobre los valores medios, este término se refiere a promedios.
Entonces, cuando la lectura se refiere a que el costo de la canasta básica en el año 2000 en promedio fue de Q1,182.20 significa que unos meses el costo de la canasta básica fue más alto (que el costo establecido como promedio) y otros meses el costo fue más bajo.
142
IGER − Tacaná
El mundo de la estadística 1. Medidas de tendencia central o promedios En muchos campos de investigación científica y también en múltiples situaciones de la vida cotidiana, se utiliza el término “promedio” para hacer preguntas como: ¿cuál es el promedio de las calificaciones de los alumnos y alumnas de bachillerato? ¿cuál es el ingreso promedio que reciben los campesinos en el corte de caña?, ¿cuántos accidentes automovilísticos diarios ocurren en promedio como resultado del consumo de alcohol en la ciudad de Guatemala? El promedio es una forma útil de describir a un grupo en su totalidad, pues consiste en encontrar un número único que represente “lo promedio” o lo “típico” de ese conjunto de puntajes. Este valor se conoce como medida de tendencia central, ya que por lo general se localiza hacia el centro o el medio de un conjunto de datos o puntajes cuantitativos en el que la mayoría de los puntajes tienden a concentrarse. En resumen, lo que pretenden las medidas de tendencia central es representar por medio de un solo número a todo el conjunto de datos. Las medidas de tendencia central o promedios se llaman así porque son valores que buscan un centro, y buscan un centro por ser este un valor representativo. En este libro estudiaremos tres medidas de tendencia central que se calculan para variables cuantitativas, y son las siguientes: • Media aritmética • Mediana • Moda
1.1 Media aritmética La media aritmética es la medida de tendencia central que más se utiliza, debido a que toma en cuenta todos los datos del conjunto analizado. Sin embargo, tiene el problema que su resultado se ve afectado cuando el conjunto de datos contiene valores muy diferentes (grandes o pequeños). Más adelante veremos un ejemplo. La media aritmética tiene varios nombres, tales como: media, promedio aritmético o simplemente promedio. Las tres medidas que están en la lista anterior son promedios, pero cuando se dice promedio comúnmente se hace referencia a la media aritmética. Entonces, ¿cuál es la definición de media aritmética? La media aritmética se define como la suma de todos los datos, dividida entre el número total de elementos de la muestra.
Estadística Descriptiva − Semana 10
143
Esta definición se puede escribir utilizando la fórmula siguiente: X = Ʃx N Donde:
•
El símbolo X es el símbolo que representa a la media de una muestra y se lee X barra.
•
El símbolo Ʃx se lee suma de los datos, y
•
N es el número de elementos de una muestra.
Vayamos de la teoría a la práctica. Se tiene el número de ventas realizadas en 10 días: 2, 6, 5, 8, 6, 9, 7, 6, 5, 6. X=
60 2+6+5+8+6+9+7+6+5+6 = =6 10 10
Como se puede observar la media es 6, dado que el valor que representa a todos los números es el 6. Esto quiere decir que en promedio se hicieron 6 ventas diarias.
Ejercicio 1
Un vendedor ambulante tiene que visitar casas y llevar un estricto control de lo que vende. Después de una semana de trabajo, este ha sido el resultado: Días de la semana Número de casas visitadas Ventas realizadas lunes
50
23
martes
60
45
miércoles
45
12
jueves
60
47
viernes
35
19
Calcule: 1. En promedio, ¿qué número de casas visitó el vendedor en una semana? 2. En promedio, ¿cuántas ventas hizo el vendedor por día en esta semana?
144
IGER − Tacaná
1.2 Mediana La mediana es la medida que se utiliza cuando hay valores extremos, es decir valores muy grandes o muy pequeños comparados con la mayoría de datos. Entonces, ¿cuál es la definición de mediana? La mediana es el dato que deja el 50 % de datos por debajo o por encima de él. Se puede decir también que en un conjunto ordenado de menor a mayor, el 50 % de casos son menores o mayores que la mediana. Para poder calcular la mediana, primero se deben ordenar los datos de menor a mayor. Si no se les ordena habría una mediana para cada ordenamiento, lo cual no es correcto. La fórmula que se utiliza para calcular el lugar que ocupa la mediana es: Me = N + 1 2 en donde: •
Me es el símbolo de la mediana
•
N es el número de elementos de la muestra y
•
1 y 2 son constantes
En la mediana se pueden presentar dos casos: •
Si el número de datos es impar:
Ejemplo: Se tiene la cantidad de botellas de leche que producen 11 vacas en un tiempo determinado. 12, 16, 15, 18, 16, 19, 17, 16, 15, 16, 18 Datos ordenados: Se ordenan los datos de menor a mayor.
Se aplica la fórmula.
12 15 15 16 16 16 16 17 18 18 19
12 Me = 11 + 1 = =6 2 2
La mediana ocupa el lugar número 6, al contar la Me = 16.
12, 15, 15, 16, 16, 16, 16, 17, 18, 18, 19,
Como puede observar, deja 5 datos debajo y 5 arriba de él.
12, 15, 15, 16, 16, 16, 16, 17, 18, 18, 19
Estadística Descriptiva − Semana 10
145
•
Si el número de datos es par:
Ejemplo: Se tiene la cantidad de botellas de leche que producen 10 vacas en un tiempo determinado. 12, 17, 15, 18, 16, 18, 17, 15, 16, 18 Datos ordenados: Se ordenan los datos de menor a mayor.
12 15 15 16 16 17 17 18 18 18
Al aplicar la fórmula.
11 Me = 10 + 1 = = 5.5 2 2
Quiere decir que está entre el quinto y el sexto dato.
12, 15, 15, 16, 16, 17, 17, 18, 18, 18
Como está entre dos datos, se calcula la media aritmética de ellos. En este caso.
X =
33 16 + 17 = = 16.5 2 2
La mediana es 16.5 En ambos casos, se interpreta que si se tienen 11 vacas, la mitad produce menos de 16.5 botellas de leche; si se tienen 10 vacas, la mitad produce más de 16.5 botellas de leche.
Ejercicio 2
Lea el siguiente caso y responda la pregunta. Un grupo de 11 niños Scouts tiene las siguientes edades: 14, 8, 8, 12, 8, 12, 10, 12, 8, 13 y 7 años. 1. Ordene las edades de los niños de menor a mayor. 2. Calcule la mediana y explique a partir de qué edad están los niños más pequeños.
146
IGER − Tacaná
1.3 Moda Para obtener la moda, simplemente buscamos el dato que se repite con más frecuencia en una distribución. Por lo tanto, podemos definir que la moda es el dato que más se repite. Se utiliza cuando se necesita un promedio rápido. Se le puede llamar moda o modo. Ejemplo: Preste atención a la serie de datos. 12, 18, 15, 18, 16, 17, 16, 15, 17, 18 El dato que más se repite es el 18, por lo tanto la moda es el 18. Si hay dos datos que se repiten en igual número, se dice que es bimodal. A menos que se quiera saber cuántas modas tiene un conjunto de datos, se dice que si tiene tres o más, no hay moda. Ejemplo: Se tiene el número de helados que se vendió cada día durante 25 días.
11
12
14
14
18
19
20
21
21
22
22
22
23
31
31
32
35
36
37
39
43
46
46
47
48
Suma 710 Media aritmética 28.4 Mediana 23 Moda 22
Interpretación: La suma indica el número total de helados vendidos en los 25 días. La media aritmética indica que en promedio se vendieron 28 helados por día. La mediana indica que el 50 % de los días se vendió menos de 23 helados. La moda se interpreta como que 22 es el número de helados que se vendieron durante más días.
Estadística Descriptiva − Semana 10
147
Ejemplo: Se tiene el salario que se pagó en una semana a 20 empleados de una finca. 106
114
194
201
232
233
242
281
327
332
351
353
412
424
434
446
450
465
468
485
Suma 6550 Media aritmética 327.50 Mediana 341.50 Moda No hay Interpretación: La suma indica el total pagado a los 20 empleados. La media aritmética indica el salario promedio de los empleados: Q327.50. La mediana, que el 50 % de ellos gana menos de Q341.50. No hay moda (ningún salario se repite).
Vocabulario básico media aritmética: es la suma de todos los datos, dividida entre el número total de elementos de la muestra. Comúnmente es llamada promedio. mediana: es el dato que deja el 50 % de datos por debajo o por arriba de él. moda: es el dato que más se repite en una distribución.
Resumen La media artimética, la mediana y la moda son tres medidas de tendencia central. La media aritmética también llamada "promedio" se define como la suma de todos los datos, dividida entre el número total de elementos de la muestra. La mediana se utiliza cuando se tienen datos muy grandes o muy pequeños comparados con la mayoría de datos. Para calcular la mediana, primero se deben ordenar los datos de menor a mayor y luego aplicar la siguiente fórmula: X = Ʃx N El resultado es el lugar que ocupa la mediana en la serie de datos ordenada. Si la serie de datos es impar, se calcula la media aritmética de los datos más cercanos. La moda es el dato que más se repite en una frecuencia de distribución.
148
IGER − Tacaná
Autocontrol Actividad 1 Le proponemos que realice las actividades que aparecen en las últimas filas de las tablas haciendo los cálculos necesarios y luego escriba la interpretación de los resultados. Le sugerimos que primero realice una tabla similar en hojas aparte o en su cuaderno y ordene los datos. 1. Se tiene la producción de leche de 40 vacas en una semana, la primera vaca produjo 90 litros de leche en una semana, la segunda 88 litros, etc. 90
88
59
95
92
69
75
98
99
74
52
58
57
98
92
83
59
70
92
53
83
53
59
75
86
94
74
76
85
86
75
68
53
84
86
89
83
87
96
63
Suma Media aritmética Mediana Moda Interpretación:
Estadística Descriptiva − Semana 10
149
2. Un profesor de matemática aplica un examen parcial sobre 100 puntos y sus alumnos obtienen los siguientes resultados.
34
78
47
31
75
72
81
46
65
77
82
72
88
64
28
15
72
42
16
63
67
76
83
32
72
58
59
78
63
53
59
84
55
51
18
Suma Media aritmética Mediana Moda
Interpretación:
150
IGER − Tacaná
3. El Ministerio de Educación aplica una evaluación diagnóstica de 50 preguntas a 40 estudiantes de primero básico. Este es el número de respuestas correctas de la evaluación.
43
40
35
42
26
48
36
46
49
38
49
40
39
32
37
48
44
45
40
44
25
42
25
35
38
41
26
47
42
47
44
35
35
33
29
33
33
47
40
50
Suma Media aritmética Mediana Moda
Interpretación:
Estadística Descriptiva − Semana 10
151
4. En una finca de mango se calcula el peso (en kilogramos) de los mangos producidos por cada árbol de una plantación de 40. Los datos le ayudarán a saber si la producción llena los requerimientos exigidos para la exportación.
232
151
169
238
209
195
158
243
194
204
245
239
181
211
152
226
219
206
127
247
128
140
196
137
149
167
196
174
227
169
158
174
136
174
135
211
195
133
246
218
Suma Media aritmética Mediana Moda
Interpretación:
152
IGER − Tacaná
5. Se tiene el número de automóviles que pasaron por El Rancho en el lapso del mediodía (de 12 a 14 h) durante 50 días.
97
96
95
77
76
75
97
95
85
84
79
77
79
79
82
84
89
87
98
79
92
79
94
96
86
87
75
75
85
96
75
75
84
81
79
80
100
89
95
86
77
86
99
91
92
96
98
99
77
84
Suma Media aritmética Mediana Moda
Interpretación:
Estadística Descriptiva − Semana 10
153
6. El entrenador de un equipo de fútbol desea conocer cuántas sentadillas hace cada uno de los 20 futbolistas de su equipo, en un lapso de 30 segundos. 5
8
6
3
4
2
2
10
3
6
9
8
6
3
4
0
9
5
1
0
Suma Media aritmética Mediana Moda Interpretación:
Navegue en la red... Banco de Guatemala (Banguat) En la sección de publicaciones del Banguat, podrá encontrar una serie de libros que explican temas económicos variados, pero también puede aprovechar para visitar el Museo Numismático, que explica la evolución de la moneda guatemalteca, así como la colección de obras de arte en la pinacoteca. Puede visitar: http://www.banguat.gob.gt/
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
154
la casilla que mejor indique su rendimiento.
Reconozco la jerarquía de las operaciones matemáticas. Calculo la media aritmética, la mediana y la moda. Interpreto la aplicación de la media aritmética, la mediana y la moda en situaciones de la vida real.
IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
11 Medidas de dispersión o variabilidad ¿Qué encontrará esta semana?
Repasemos la media aritmética
Exactitud y precisión
Medidas de dispersión o variabilidad
Esta semana logrará: Diferenciar entre exactitud y precisión. Calcular el rango, la desviación media y la desviación estándar. Valorar el uso de la media y la desviación estándar para la toma de decisiones.
Estadística Descriptiva − Semana 11
155
¡Para comenzar! Repasemos la media aritmética Recordemos cómo calcular la media aritmética, ya que es la medida de tendencia central más utilizada. Sabemos que la media puede obtenerse sumando un conjunto de puntajes y dividiendo ese resultado entre el número total de puntajes del conjunto. A continuación se muestra un ejemplo práctico: Se tiene el número de ventas realizadas en 10 días: 6, 8, 9, 7, 4, 8, 6, 7, 7, 4
X=
66 6+8+9+7+4+8+6+7+7+4 = = 6.6 10 10
Resultado: el promedio de ventas en 10 días fue de 6.6 ventas.
¡A trabajar! Lea el siguiente caso y calcule la media aritmética en su cuaderno. Doña Toya es propietaria de una pequeña tienda de la colonia La Ladrillera en el municipio de Rabinal. Ella escribe el total de sus ventas diarias en un cuaderno. La semana pasada anotó lo siguiente: Día
Monto de la venta
lunes
Q145.95
martes
Q230.10
miércoles
Q45.60
jueves
Q56.60
viernes
Q42.25
sábado
Q356.20
domingo
Q134.75
El promedio en sus ventas fue de:
156
IGER − Tacaná
Lectura Exactitud y precisión ¡Significan cosas un poco distintas! Exactitud La exactitud es lo cerca que el resultado de una medición está del valor verdadero. Precisión La precisión es lo cerca que los valores medidos están unos de otros. Ejemplos de exactitud y precisión:
Exactitud Precisión alta
Baja exactitud Precisión baja
Alta exactitud Precisión alta
Así que, si está jugando al fútbol y siempre le da al poste izquierdo en lugar de marcar gol, ¡entonces no es exacto, pero es preciso! Sesgo ¡Que no le engañe la precisión! Si medimos algo varias veces y los valores están cerca unos de otros, pueden estar todos equivocados si hay "sesgo". Un sesgo es un error sistemático (pasa siempre) que hace que todas las medidas estén desviadas en una cierta cantidad. Ejemplos de sesgos: Un balanza marca "1 kg" cuando no hay ningún peso encima. Siempre mide su altura con zapatos de suelas altas. Un cronómetro que se detiene medio segundo después de pulsar el botón. Tomado de: Pierce, Rod. "Exactitud y precisión" Disfruta Las Matemáticas. Ed. Rod Pierce. 5 Oct 2011. 12 Jun 2014 http://www.disfrutalasmatematicas.com/datos/exactitud–precision.html
Estadística Descriptiva − Semana 11
157
El mundo de la estadística 1. Medidas de dispersión o variabilidad En las semanas anteriores estudiamos algunas medidas de tendencia central, sin embargo, a pesar de que la moda, la mediana y la media describen el comportamiento de los datos en una distribución de frecuencias, la información que nos brindan es limitada. ¿En qué sentido? Las medidas de tendencia central nada nos dicen sobre la forma en que están diseminados o dispersos los datos con relación a la tendencia central, ni tampoco sobre la separación o cercanía entre los datos del conjunto. Por lo tanto, este vacío de información nos podría conducir a obtener conclusiones erróneas y tomar decisiones equivocadas. Veamos un ejemplo para entender mejor. Supongamos que se ha encontrado que, en la ciudad de Guatemala, los plomeros y los profesores universitarios tienen el mismo ingreso anual medio de Q24,000.00. ¿Indicaría este dato que las dos distribuciones de ingresos son iguales? No necesariamente. Puede encontrarse que a lo largo del año, los ingresos de los profesores son regulares porque reciben un sueldo fijo, mientras que los plomeros algunos meses cuentan con ingresos muy bajos e incluso nulos, y en determinados momentos sus ingresos aumentan marcadamente. Con base en lo anterior, podemos observar que además de una medida de tendencia central, necesitamos un índice que nos muestre cómo están distribuidos los puntajes, es decir, qué tanto se alejan o acercan los datos del centro de la distribución estudiada. En una palabra, necesitamos lo que se conoce comúnmente como medidas de dispersión o variabilidad. Volviendo al ejemplo anterior, podríamos decir que la distribución de ingresos de los profesores tiene menor variabilidad que la distribución de ingresos de los plomeros.
Ejercicio 1
Circule el conjunto de números que están más separados entre sí. 1. 5, 6, 6, 7, 9, 10 2. 5, 30, 35, 40, 50, 100
158
IGER − Tacaná
1.1 ¿Qué indican las medidas de dispersión o variabilidad? Las medidas de dispersión nos indican qué tan separados están los datos entre sí y con respecto al valor central. Esta información es de vital importancia, ya que para describir cómo se comporta un conjunto de datos no solo se necesita un valor representativo de ellos, sino también se necesita un valor representativo de cómo se separan del conjunto. A continuación se presentan dos círculos con (x) dentro de ellos, estas (x) representan datos. ¿En cuál de los dos círculos están más juntos los datos (x)? Círculo A
x x
x
x x x
x
x
Círculo B
x x
x x
x
x x x xx x x x x
x Como se puede observar en el círculo B, los datos están más juntos. Pero ¿qué pasa si en lugar de (x) tenemos números? Es más difícil ver a simple vista qué tan separados están entre sí y con respecto a la media aritmética. Por eso es necesario calcular un número que nos indique la dispersión de los valores o datos. En este libro estudiaremos solamente dos medidas de dispersión: • Rango, conocido también como amplitud total o recorrido • Desviación estándar
1.2 Rango El rango es la distancia que hay entre el valor mayor y el valor menor. La fórmula que se utiliza para calcularlo es: R = dato mayor – dato menor Ejemplo: El tiempo, en minutos, que tardaron 10 corredores en llegar a la meta fue: 12, 18, 15, 18, 16, 17, 16, 15, 17 y 19 Como vemos, el valor mayor es 19 y el menor es 12. Sustituyendo los valores en la fórmula quedaría: R = 19 – 12 = 7 La diferencia entre el que llegó en primer lugar y el último fue de 7 minutos. Estadística Descriptiva − Semana 11
159
Ejemplo: Se tienen dos apiarios de aproximadamente 2000 abejas por colmena. Se estudia la cantidad de miel que producen en 11 cajas de cada apiario y se obtienen los siguientes datos en kilogramos. Apiario
Cantidad de miel
San Diego 4.1 Los Ángeles
3.8 4.05 3.8 3.91
4
4.02 3.9 3.25 4.92 3.25 3.9
Promedio
Rango
4.5
3.5
4.6
4.3 4.22
4.07
1.1
4.8
3.9
4.8 3.12 4.91
4.07
1.8
Se observó que los dos apiarios tienen igual promedio de producción, pero al medir el rango, queda claro que el apiario Los Ángeles tiene una dispersión mayor, lo que quiere decir que hay más variabilidad en la producción de miel de ese apiario. Esta información podría ser muy valiosa para los productores de miel, ya que si investigan cuáles son las causas de las irregularidades en la producción, podrían obtener mejores resultados. En general, cuanto más alto sea el valor del rango, mayor será la variabilidad. Esta comparación solo tiene sentido cuando la variable es la misma medida y utiliza los mismos parámetros. La desventaja del rango es que solo toma en cuenta dos valores: el mayor y el menor. Entonces, qué ocurre al tener una serie de datos como la siguiente: 2, 3, 5, 6, 2, 3, 5, 6, 8, 6, 1000 Como se puede observar, un dato hace que el rango sea 998, número que no concuerda con la variabilidad de la mayoría de los datos, esto significa que no es representativo. Por la razón anterior, se estudiará otra medida que toma en cuenta todos los datos, no solo el mayor y el menor.
Ejercicio 2
La temperatura en el departamento de San Marcos durante los últimos cinco días fue: Día de la semana
lunes
Temperatura
29 oC
martes miércoles 27 oC
Conteste las siguientes preguntas: 1. ¿Cuál es la temperatura más alta registrada? 2. ¿Cuál es la temperatura más baja registrada? 3. ¿Cuál es el rango de la temperatura en San Marcos?
160
IGER − Tacaná
28 oC
jueves
viernes
24 oC
22 oC
1.3 Desviación estándar La desviación estándar se define como la media cuadrática de las distancias con respecto a la media aritmética y la representamos con la letra griega sigma (σ). Esto quiere decir que se calcula la distancia que hay entre cada valor y con estas diferencias se calcula la media cuadrática. La razón de usar la media cuadrática es que al elevar al cuadrado las distancias, se convierten en positivos los valores negativos. La fórmula que se utiliza para la desviación estándar es: σ= Donde: • •
Ʃd2 N
Ʃd 2 = Suma de los cuadrados de las desviaciones
N = número de casos
Ejemplo: Preste atención a la tabla del apiario San Diego y observe cómo se obtiene la distancia entre cada valor y la mediana, también la distancia al cuadrado. Se calcula de la siguiente manera: 4.1 – 4.07 = 0.03
Promedio
San Diego
4.1
3.8
4.05
3.8
3.91
4
4.5
3.5
4.6
4.3
4.22
4.07
distancia entre cada valor y la media
0.03
–0.27
–0.02
–0.27
–0.16
–0.07
0.43
–0.57
0.53
0.23
0.15
suma
distancia al 0.0009 0.0729 0.0004 0.0729 0.256 0.0049 0.1849 0.3249 0.2809 0.0529 0.0225 cuadrado
1.2741
Sustituimos los valores en la fórmula. σ=
1.2741 = 0.11583 = 0.3403 11
Ahora hacemos lo mismo con la tabla del apiario Los Ángeles. 4.2 – 4.07 = – 0.05
Promedio
Los 4.02 3.9 3.25 4.92 3.25 3.9 4.8 3.9 4.8 3.12 4.91 Ángeles distancia entre cada –0.05 –0.17 –0.82 –0.85 –0.82 –0.17 0.73 –0.17 0.73 –0.95 0.84 valor y la media distancia al 0.0025 0.0289 0.6724 0.7225 0.6724 0.0289 0.5329 0.0289 0.5329 0.9025 0.7056 cuadrado
σ=
4.07 suma 4.8304
4.8304 = 0.4391 = 0.6627 11
Se observa que la desviación estándar de Los Ángeles es mayor, lo que implica una mayor variabilidad en la producción de miel. Estadística Descriptiva − Semana 11
161
Ejemplo: Se quiere saber el peso promedio, mediana, moda, rango y desviación estándar de 100 granos de café seco y el número de granos secos que contiene 10 gramos de café. Los datos son como sigue: Peso de 100 granos secos Número de granos secos en 100 gramos
11.40 12.60
793
646
13.0
653
13.90 11.90 13.10 13.50 13.30 12.70 13.70 14.70 14.60
625
743
658
648
632
777
681
629
Respuesta Media Mediana
Moda
Rango
Desviación estándar
Peso de 100 granos secos
13.20
13.20
No hay
3.30
0.94
Número de granos secos en 100 gramos
676.50
650.50
No hay
168.00
57.40
La media y la desviación estándar en la toma de decisiones Caso 1 Un profesor de cuarto primaria aplica el examen de matemática a sus estudiantes, con las calificaciones obtiene una media de 93 y una desviación estándar de 3. ¿Qué quiere decir esto? En primer lugar debemos tener claro que la media de 93 significa que el grupo de estudiantes alcanzó el 93 % de los objetivos y una desviación estándar de 3 significa que los resultados obtenidos en el examen de matemática están muy parejos, que casi no hay variabilidad entre las notas de los estudiantes. Una decisión que se podría tomar es que ya está aprendido el tema y es adecuado continuar enseñando los siguientes temas. Caso 2 El profesor del ejemplo anterior, aplica el segundo examen de matemática y con las calificaciones obtiene una media de 35 y una desviación estándar de 4. ¿Qué quiere decir esto? El grupo de estudiantes evaluado alcanzó el 35 % de los objetivos y una desviación estándar de 4 significa que los resultados están muy parejos, que no hay casi variabilidad en las notas obtenidas por los alumnos en el examen.
162
IGER − Tacaná
633
Una conclusión que se puede sacar es que no está aprendido el tema, que la metodología no funcionó. Por lo tanto, toma la decisión de dar una retroalimentación para lograr que los estudiantes aprendan el tema. Caso 3 El profesor de matemática aplica un tercer examen y obtiene una media de 73 y desviación estándar de 20. ¿Qué quiere decir esto? El grupo de estudiantes evaluado alcanzó el 73 % de los objetivos. La desviación estándar de 20 significa que los resultados obtenidos en el examen fueron muy disparejos, lo cual nos indica que hay mucha variabilidad en las notas, pues hay calificaciones muy altas y también muy bajas. Una decisión que se podría tomar sería cambiar la metodología para mejorar el rendimiento de los alumnos que obtuvieron notas bajas, utilizando como referencia los métodos de estudio de los que salieron bien en el examen. No olvide que por lo general la media y la desviación estándar se pueden interpretar solo si tenemos un patrón predefinido. Ejemplo: Si una plantación de café da un promedio de 20 gramos de peso en 100 granos secos, ¿se podría decir que los granos están muy pesados? En este sentido es importante tener claro que en este caso la estadística no explica las causas del exceso o del déficit del peso de los granos, sino que únicamente brinda información para tomar decisiones e investigar las causas que dan origen a los puntajes obtenidos.
Vocabulario básico desviación estándar: mide el grado de dispersión de los datos respecto al promedio. exactitud: cercanía al resultado de un valor real. media aritmética: medida de tendencia central más utilizada. Es el resultado de la sumatoria de un conjunto de datos dividido dentro del número total de datos del conjunto. medida de dispersión: indican qué tan separados están los datos entre sí y con respecto al valor central. precisión: cercanía entre sí de valores medidos. sesgo: error sistemático que produce que todas las medidas se desvíen en cierta cantidad.
Estadística Descriptiva − Semana 11
163
Resumen Las medidas de dispersión indican qué tan separados están los datos entre sí y con respecto al valor central. El rango y la desviación estándar son medidas de dispersión. El rango se calcula encontrando la diferencia entre el valor mayor y el valor menor. Cuanto más alto sea el valor del rango, mayor será la variabilidad. R = dato mayor – dato menor La desviación estándar indica con mayor precisión cuánto se aleja o se acerca un conjunto de datos a la media. Para calcularla, se aplica la siguiente fórmula: σ=
Ʃd2 N
Autocontrol Actividad 1 A continuación encontrará varias series de datos, en su cuaderno, ordene los datos de forma ascendente y encuentre las medidas de dispersión que se indican en cada numeral.
1.
14
14
13
15
10
14
14
La media =
La mediana =
El rango =
La desviación estándar =
2.
113
185
157
133
168
102
184
La mediana =
El rango =
La desviación estándar =
IGER − Tacaná
12
17
11
20
190
136
La moda =
La media =
164
18
195
136
143
La moda =
3.
5
19
9
15
1
19
19
La media =
La mediana =
El rango =
La desviación estándar =
4.
8
6
0
6
7
0
3
La mediana =
El rango =
La desviación estándar =
90
66
74
72
53
92
64
La mediana =
El rango =
La desviación estándar =
187
174
101
167
81
146
194
La mediana =
El rango =
La desviación estándar =
12
11
10
12
15
13
6
7
7
3
10
6
7
65
92
82
89
95
100
199
15
14
La moda =
La media =
7.
1
La moda =
La media =
6.
18
La moda =
La media =
5.
11
98
196
82
La Moda =
15
La media =
La mediana =
El rango =
La desviación estándar =
15
13
14
La moda =
Estadística Descriptiva − Semana 11
165
Actividad 2 Lea y resuelva el siguiente caso en su cuaderno. La productividad de bolas de panela de dos trapiches durante una semana es como sigue: Días de la semana
Trapiche La Colmena
Trapiche El Azucarado
lunes martes miércoles jueves viernes sábado domingo
77 77 50 57 66 63 52
116 120 117 98 91 77 89
1. Calcule la media aritmética de producción de bolas de panela para cada trapiche. 2. Calcule la desviación estándar de producción de cada trapiche. 3. ¿Cuál trapiche produce, en promedio, más bolas de panela? 4. ¿Cuál trapiche tiene una producción “más pareja”?
Navegue en la red... Procuraduría de los Derechos Humanos (Pdh) Es la institución encargada de velar y defender el respeto a los derechos humanos, dando especial atención a la víctima. Para realizar su trabajo cuenta con 16 Defensorías, entre ellas: de la Mujer, de la Juventud, de los Pueblos Indígenas, de la Niñez y la Adolescencia y del Derecho a la Alimentación, a las cuales pueden acudir las personas a solicitar consejo y presentar denuncias. En consecuencia, la Oficina del Procurador de los Derechos Humanos realiza pronunciamientos, declaraciones, resoluciones e informes; para ello en ocasiones, se basa en estadísticas, que puede encontrar en: www.pdh.org.gt/investigacion–en–ddhh
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
166
la casilla que mejor indique su rendimiento.
Diferencio entre exactitud y precisión. Calculo el rango, la desviación media y la desviación estándar. Valoro el uso de la media y la desviación estándar para la toma de decisiones. IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
12 Repaso: semanas 6 a 11 Esta semana logrará: Repasar los contenidos de las semanas 6 a 11. Resolver los ejercicios del repaso para evaluarse en la prueba parcial. Prepararse bien para la prueba de evaluación.
Estadística Descriptiva − Semana 12
167
Querida y querido estudiante: Se aproxima la prueba parcial y debe prepararse adecuadamente, repasando los contenidos de la semana 6 a la 11. Para aprovechar este repaso, le damos estas recomendaciones. • Haga un plan de lo que estudiará cada día y trate de cumplirlo. Dedique más tiempo a los temas que le resulten difíciles. • Busque un lugar tranquilo, iluminado y silencioso para estudiar. • Lea los resúmenes de cada semana y escriba las ideas más importantes en su cuaderno. • Escuche la clase radial. Sus maestros locutores le acompañarán en este repaso y le ayudarán a resolver algunos ejercicios. • Compruebe que haya realizado bien los autocontroles. Si tiene dudas, vuelva a leer las semanas, ahí encontrará explicaciones y ejemplos. Recuerde que puede consultar sus dudas con su tutor.
¿Cómo será la prueba de evaluación? La prueba parcial evalúa los mismos contenidos y de la misma forma en que los ha trabajado semana a semana. Cuando resuelva ejercicios y problemas debe dejar escrito el procedimiento. Muy importante: cada serie contiene instrucciones exactas de lo que debe realizar en cada apartado, así como la valoración asignada. Si usted se prepara con tiempo y dedicación, el resultado será satisfactorio.
168
IGER − Tacaná
Ejercicio guiado Recordemos que cada día se amplían los campos de aplicación de la estadística, ¿por qué? Es común que cuando hablamos de estadística aparezcan en nuestra mente imágenes de muchos números apilados en tablas, con cantidades de cifras relativas a nacimientos, tipos de cambio, accidentes, impuestos, poblaciones, ingresos, deudas, créditos, etc. Sin embargo, como hemos visto, la estadística es mucho más que solo números apilados y gráficas atractivas. La estadística es una ciencia tan antigua como la escritura y es auxiliar de muchas ciencias, como la economía, la medicina, la ingeniería, la administración del gobierno, entre otras. Si reflexionamos un poco, nos daremos cuenta de que la ausencia de la estadística conllevaría a un caos generalizado que dejaría a la humanidad sin información vital a la hora de tomar decisiones importantes. Por lo tanto, esta semana haremos un repaso de lo aprendido en las semanas anteriores. Para comenzar, se incluye un ejemplo que servirá de guía: Para el año 2012, el Ine presentó el cuadro que se muestra en la página siguiente, el cual describe la cantidad de víctimas del ramo penal por departamento que tiene como fuente el Organismo Judicial. Pregunta de investigación: Hipótesis: Unidad de análisis: Variables: Tipo de variable: Nivel de medida de variable: Población Muestra: Forma de selección de muestra: Tipos de datos: Tipos de estadística que usa:
¿Cómo se presentan el total de delitos en general, cometidos en Guatemala a nivel nacional y por departamentos para el año 2012? El departamento de Guatemala es donde mayor cantidad de delitos se ha cometido. Delito Número de delitos cometidos por departamento. Cualitativa: departamento donde se cometió el delito. Cuantitativa: número de delitos. Cuantitativa: número de delitos. Los delitos cometidos en toda Guatemala. No la describe la noticia. No hay muestra, ya que son todos los delitos registrados y sobre eso se hará la descripción. Son parámetros, por ser obtenidos de una población. Estadística descriptiva, ya que los cálculos ofrecen información sobre la población estudiada y no hace inferencias a otra población.
Estadística Descriptiva − Semana 12
169
Tabla 1. Delitos cometidos según departamento en el año 2012. Departamento
Delitos cometidos
Guatemala
3156
El Progreso
547
Sacatepéquez
297
Chimaltenango
859
Escuintla
606
Santa Rosa
1077
Sololá
841
Totonicapán
548
Quetzaltenango
2062
Suchitepéquez
1840
Retalhuleu
826
San Marcos
1161
Huehuetenango
1225
Quiché
889
Baja Verapaz
619
Alta Verapaz
1698
Petén
536
Izabal
753
Zacapa
535
Chiquimula
983
Jalapa
595
Jutiapa
1223
Total país
22 876 Fuente: Ine, 2012
170
IGER − Tacaná
Interpretación del cuadro En el cuadro y gráfica se puede observar que el departamento en donde más delitos se cometieron fue Guatemala, mientras que Sacatepéquez es el departamento en donde se cometieron delitos en menor cantidad. Con la información de la tabla se deberá realizar una gráfica de barras. Gráfica 1 Número de delitos por departamento. Guatemala, 2012. 3500
Número de delitos
3000 2500
Mayor cantidad
2000 1500 Menor cantidad 1000 500
s o a a a é n u z z z z la al lá a o o sa ala res án ngo ul ap pa apa Peté zab ue hule arco ang uich ue ang uint lap tiap Ro Solo cap m a q q g a I ac r e im Ja r l u a é é c o t n i n n e J Q Z t M e a u r s p p a e t e e n V n V q P E t n i lt te to ite alt Re ja Gu Sa El ta ue Sa za Ch ca To ch im Ba Al et eh Sa Su u Ch Qu H
Departamento
Fuente: Ine – OJ
Calcular la media, mediana y moda de delitos. Media
1040
Mediana
850
Moda
No hay
En promedio, se cometen 1040 delitos por departamento. Los departamentos que se encuentran arriba de la media en delitos son: Guatemala, Santa Rosa, Quetzaltenango, Suchitepéquez, San Marcos, Huehuetenango, Alta Verapaz y Jutiapa. El 50 % de los departamentos tienen menos de 850 delitos. Estadística Descriptiva − Semana 12
171
Ejercicio 1
Con los datos siguientes, realice el mismo análisis que se mostró en el ejemplo anterior. Tabla 2 Nacimientos por departamento. 2013. Departamento
Nacimientos
Guatemala
65 920
El Progreso
4202
Sacatepéquez
7004
Chimaltenango
15 755
Escuintla
16 401
Santa Rosa
9478
Sololá
10 051
Totonicapán
12 239
Quetzaltenango
20 265
Suchitepéquez
13 920
Retalhuleu
8158
San Marcos
30 193
Huehuetenango
37 732
Quiché
29 359
Baja Verapaz
7889
Alta Verapaz
34 119
Petén
15 510
Izabal
10 404
Zacapa
6132
Chiquimula
10 954
Jalapa
9556
Jutiapa
11 836
Total país
387 077 Fuente: Ine
172
IGER − Tacaná
Pregunta de investigación: Hipótesis: Unidad de análisis: Variables: Tipo de variable: Nivel de medida de variable: Población Muestra: Forma de selección de muestra: Tipos de datos: Tipos de estadística que usa:
En hojas aparte, realice una gráfica de barras con la información de la tabla. Luego, calcule e interprete las tres medidas de tendencia central que ya hemos estudiado, las cuales se enumeran en el cuadro siguiente: Media Mediana Moda
Interpretación
Estadística Descriptiva − Semana 12
173
Ejercicio 2
Un grupo de economistas está analizando el impacto social y económico que tiene la migración de las mujeres en Guatemala. A continuación se presentan algunos datos sobre el nivel educativo que tienen las migrantes. Tabla 3 Nivel educativo de mujeres guatemaltecas migrantes de 15 a 24 años de edad. Nivel educativo
Porcentaje
Ninguno
1.10 %
Primaria
36.00 %
Básico
24.50 %
Diversificado
35.70 %
Universitario
1.10 %
Ignorado
1.60 % Fuente: Elaboración propia
Basándose en la tabla anterior, razone una pregunta de investigación y complete lo siguiente: Pregunta de investigación:
Hipótesis:
Unidad de análisis:
Variables:
Tipo de variable:
Nivel de medida de variable:
Tipos de estadística que usa:
174
IGER − Tacaná
En hojas aparte, realice una gráfica circular con la información de la tabla. Luego calcule e interprete las tres medias de tendencia central que ya hemos estudiado, las cuales se enumeran en el cuadro siguiente: Media Mediana Moda
Interpretación
Comentarios En este espacio puede escribir sus dudas o comentarios sobre las actividades realizadas.
Estadística Descriptiva − Semana 12
175
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
logrado
la casilla que mejor indique su rendimiento.
en proceso
no logrado
Repaso los contenidos de las semanas 6 a 11.
Resuelvo los ejercicios del repaso para evaluarse en la prueba parcial.
Me preparo bien para la prueba de evaluación.
Orientaciones sobre la prueba parcial Esté atento a los contenidos y fecha de su próxima prueba parcial. Prepárese para su prueba parcial de Estadística Descriptiva. Le presentamos algunas recomendaciones que pueden ayudarle a la hora del examen.
Grupo: Tacaná Prueba: Parcial Primera
Al recibir la prueba, y antes de empezar a resolverla, escriba su nombre, número de carné, número de círculo y fecha.
Materia: Estadística Descriptiva A-2014 A – 2016
Nombre: Carné: Círculo Círculo de de estudio estudio Nº: Nº:
TACANÁ
Punteo:
Fecha: Fecha:
i serie . 1 punto cada i serie . Total 5 puntos.
Lea atentamente las instrucciones antes de contestar. Si tiene duda, consulte a su orientador(a).
respuesta correcta. Total 6 puntos. INSTRUCCIONES: Rellene círculo corresponde al resultado INSTRUCCIONES: Realice unael gráfica deque barras con los datos siguientes.correcto. En Estadística las variables 62 pueden ser 1. 1. Matrimonios en Guatemala 104 73 124 de dos tipos. Año
2009
2010
y cuantitativas. 78cualitativas 286 84 253 80 750 categorías y análisis. 2012 2013 hipótesis y censo.
2011
No se "atasque" en ningún ejercicio. Empiece por las preguntas que sepa mejor y le quedará más tiempo para pensar en las que tenga dudas. Al finalizar su examen, relea todas sus respuestas y vea si algo se le pasó por alto. Presente su prueba limpia y ordenada. ¡ánimo! El resultado de su examen será el producto de su esfuerzo.
176
IGER − Tacaná
30 % 15 % 5%
50 %
13 Medidas de posición ¿Qué encontrará esta semana?
Repasemos cómo se calcula la mediana
Percentil talla y peso
Medidas de posición
Esta semana logrará: Calcular la mediana. Conocer el uso de percentiles de talla y peso para estimar el estado nutricional de los niñas. Calcular e interpretar percentiles, deciles y cuartiles.
Estadística Descriptiva − Semana 13
177
¡Para comenzar! Repasemos cómo se calcula la mediana Como recordará, la fórmula que utilizamos para calcular el lugar de la mediana es: N+1 Me = 2 Donde: • • •
Me es el símbolo de la mediana N es el número de elementos de la muestra y 1 y 2 son constantes
Veamos dos ejemplos, el primero con la cantidad de datos impar y el segundo con la cantidad de datos par. Si el número de datos es impar: Un ganadero tiene 9 vacas que producen la cantidad de litros de leche en un tiempo determinado. 12, 17, 15, 18, 16, 19, 17, 16, 15 • Se ordenan los datos de menor a mayor. • Se aplica la fórmula. La mediana ocupa el lugar número 5, al contar la Me = 16.
Como puede observar, el dato 16 deja 4 datos debajo y 4 datos arriba de él.
Si el número de datos es par: • Se ordenan los datos de menor a mayor. • Al aplicar la fórmula.
Datos ordenados: 12 15 15 16 16 17 17 18 19 Me =
9+1 10 = =5 2 2
12, 15, 15, 16, 16, 16, 17, 18, 19
12, 15, 15, 16, 16, 16, 17, 18, 19
Datos ordenados: 12 15 15 16 16 17 17 18 19 20 11 Me = 10 + 1 = = 5.5 2 2
Quiere decir que está entre el quinto y el sexto dato.
12, 15, 15, 16, 16, 17, 17, 18, 19, 20
Como está entre dos datos, se calcula la media aritmética de ellos. En este caso.
X =
33 16 + 17 = = 16.5 2 2
La mediana es 16.5, esto significa que la mitad de las vacas produce menos de 16.5 litros de leche, y la otra midad más de 16.5 litros.
178
IGER − Tacaná
Lectura Percentil de talla y peso El percentil de un bebé o un niño es un dato que se obtiene de la comparación de la medida de longitud, peso o perímetro craneal de un bebé o un niño con las medidas tomadas a un gran número de bebés o niños de la misma edad. Uso de las gráficas de percentiles y curvas de crecimiento estándar Las gráficas de percentiles y las curvas de crecimiento estándar son una ayuda muy importante a la hora de detectar anomalías en el desarrollo normal de un niño. Dichas anomalías pueden detectarse observando las desviaciones que se produzcan en las diversas medidas que se le toman al bebé o al niño de forma periódica. Pero además es necesario disponer de datos estadísticos de medidas en una cantidad suficiente de niños sanos para poder compararlas con las medidas recién tomadas. Y eso es, precisamente, lo que son las gráficas de percentiles: datos estadísticos que ayudan a detectar desviaciones en el desarrollo del niño. Interpretación de un percentil "N" de longitud Si el niño está en un percentil "N" de longitud, eso quiere decir que estadísticamente dicho niño es más largo (o alto) que el (N) % de los niños de su edad y más bajo que el (100 – N) % de los niños de su edad. Ejemplo: si el niño está en un percentil 40 de longitud, estadísticamente dicho niño es más largo (o alto) que el 40 % de los niños de su edad, y más bajo que el 60 % de los niños de su edad. ¿Cuándo se considera que una desviación es importante? Esta pregunta no tiene una respuesta sencilla y en este caso es mucho mejor preguntar al pediatra. Por ejemplo, que un niño esté en el percentil 98 de longitud no significa, en principio, que haya ningún problema. Pero si además el niño está en el percentil 2 de peso, entonces quizá podría haber un problema de desnutrición. Ocurre lo mismo si el niño no es demasiado largo, por ejemplo un percentil 20, y en cambio está en el percentil 90 de peso. Podría haber un caso de sobrepeso. Esto último, en cualquier caso, es algo que debe juzgar el pediatra. Origen de los datos estadísticos Para obtener un número de datos suficientemente relevante, se han hecho varios estudios en los que se ha medido a un gran número de niños a lo largo del tiempo. Los dos estudios más importantes son los siguientes: 1. Estudio realizado por la Organización Mundial de la Salud entre 1997 y 2003. Dicho estudio se realizó con 8500 niños de 0 a 5 años de diferentes países (India, Brasil, EE. UU. Oman, Noruega y Ghana), alimentados solo con leche materna en los primeros meses de vida. 2. Estudio realizado por la fundación Faustino Orbegozo Eizaguirre entre 2000 y 2001. Este estudio se realizó con niños de 0 a 18 años con mezcla de alimentación con leche materna y biberón. Los pediatras de algunas de las comunidades autónomas en España utilizan los datos de la fundación Faustino Orbegozo Eizaguirre. Otros utilizan ya los datos de la Organización Mundial de la Salud. Tomado de: https://goo.gl/d8fTNs
Estadística Descriptiva − Semana 13
179
Preste atención a la tabla siguiente. Peso para la edad niñas. Percentiles (nacimiento a 5 años)
Fuente: Patrones de crecimiento infantil de la Oms
Cuando las madres o los padres llevan a sus hijas e hijos a consulta, la enfermera, la doctora o el doctor siempre los pesan y miden. Si alguna vez ha realizado esta visita o acompañado a alguien a hacerla, se habrá dado cuenta de que el doctor marca estos datos en una gráfica similar a la que se le presenta arriba. En la gráfica los doctores marcan el peso y talla de las niñas y niños. Esta es una forma fácil de saber en qué percentil se encuentran y conocer su estado de salud y desarrollo. Por ejemplo, en la gráfica anterior que muestra el peso de las niñas se interpreta de esta manera:
180
IGER − Tacaná
Estado nutricional
Indicador peso/edad
Normal
Zona comprendida entre el percentil 15 y el percentil 85
Riesgo de desnutrición
Zona comprendida entre el percentil 3 y el percentil 15
Desnutrición crónica
Zona comprendida por debajo del percentil 3
El mundo de la estadística 1. Medidas de posición Las medidas de posición tienen la propiedad de dividir la distribución de puntajes en grupos de cien (percentiles), diez (deciles) y cuatro (cuartiles). En general las medidas de posición indican el porcentaje de casos que quedan debajo o son más pequeños que un número determinado. En este libro estudiaremos tres medidas de posición: • Percentiles • Deciles • Cuartiles La mediana también se puede clasificar en este tipo de medidas. Para entender mejor qué nos indican las medidas de posición analicemos un ejemplo: supongamos que usted logró un puntaje de 80 en un examen de estadística. Para determinar exactamente qué tan bien lo ha hecho, podría ser de ayuda saber cómo se compara con los puntajes de otras compañeras o compañeros de la clase que hayan tomado el mismo examen. ¿Logró la mayoría de estudiantes puntajes del orden de 80 y 90? Si fue así, su propia calificación puede no ser muy alta. O, ¿la mayoría del resto de alumnos recibió un puntaje del orden de 60 y 70? Si fue así, un puntaje de 80 puede muy bien estar entre las notas más altas de su clase. Por lo tanto, en este caso necesitamos un solo número que nos indique qué porcentaje de alumnos se ubica por debajo de 80. Si un puntaje de 80 tiene un percentil de 95, entonces el 95 % de estudiantes en este curso de estadística recibieron una calificación en el examen más baja de 80 puntos. Esto significa que solamente un 5 % de los alumnos sacó notas arriba de 80 puntos.
Ejercicio 1
Lea el siguiente caso y responda la pregunta planteada. La enfermera del Centro de Salud pesó y talló a todos los niños de preprimaria de la escuela Río Arriba. La enfermera le informó a la mamá del niño José Salazar que su hijo tiene la estatura correspondiente al percentil 30. Explique a la mamá de José qué significa este dato.
Estadística Descriptiva − Semana 13
181
1.1 Percentiles Como su nombre lo indica, los percentiles dividen la serie de datos en 100 partes, y se define como el número que deja un X % de casos que se ubican debajo de él. Ejemplo: En una serie de datos ordenados de menor a mayor se calcula de la siguiente manera: 5
6
7
8
9
15
15
17
22
22
Se quiere calcular el percentil 60, esto es, el dato que deja un 60 % de casos debajo de él. Paso 1. Conozcamos la fórmula para calcularlo. Px = Donde:
• • • •
X(N) 100
Px es la posición del percentil X representa el percentil a buscar N es el número de datos 100 es constante
Paso 2. Sustituimos los valores aplicando la fórmula del percentil que se requiere buscar, en este caso 60 (X) para un total de 10 puntajes (N). P60 =
60(10) 600 = =6 100 100
Paso 3. Según el resultado, debemos buscar la posición del percentil 60 en los datos ordenados. Por lo tanto, al buscar el dato que ocupa el sexto lugar que es 15. 5
6
7
8
9
15
15
17
22
22
Paso 4: Interpretación, el dato 15 deja un 60 % de casos debajo de él, lo cual nos indica que el dato 15 tiene 60 % de casos o valores menores que él.
182
IGER − Tacaná
Otro ejemplo: Para poner en práctica lo aprendido, con los mismos datos calculemos el percentil 20, siguiendo los cuatro pasos ya vistos, como se muestra a continuación: Paso 1. Copiamos la fórmula para el cálculo del percentil. Px =
X(N) 100
Paso 2. Sustituimos los valores en la fórmula para el cálculo del percentil. P20 =
20(10) 200 = =2 100 100
Paso 3. De acuerdo al resultado, buscamos entre los datos ordenados el segundo dato, que es 6. 5
6
7
8
9
15
15
17
22
22
Paso 4. Interpretación, el dato 6 deja un 20 % de casos debajo de él, por lo tanto el dato 6 tiene 20 % de datos menores que él.
Ejercicio 2
Calcule e interprete las medidas de posición solicitadas en las series siguientes. 1.
Serie A: 5
5
8
9
10
8
6
5
12
15
18
18
21
25
25
• Percentil 36 = • Percentil 18 = 2.
Serie B: 10
30
33
• Percentil 50 = • Percentil 25 =
Estadística Descriptiva − Semana 13
183
1.2 Deciles Los deciles separan el grupo de datos en 10 partes. Esto significa que si se tiene un decil 3, quiere decir que deja el 30 % de casos debajo de él. Un decil 8 quiere decir que es el dato que deja un 80 % de datos debajo de él. Si hacemos una comparación podemos observar que el decil 3 es equivalente al percentil 30 y el decil 8 es equivalente al percentil 80. Ejemplo: En una serie de datos ordenados de menor a mayor se quiere calcular el decil 8. 4
6
9
10
12
14
18
21
22
24
Paso 1. Se aplica la fórmula, que como se verá es equivalente a la de los percentiles. La diferencia es que se divide entre 10 y los números X solo pueden ser hasta 10. Dx =
X(N) 10
Paso 2. Al sustituir los valores en la fórmula para calcular el decil 8 de la serie anterior, nos queda el resultado siguiente: D8 =
8(10) 80 = =8 10 10
Paso 3. Por último, con base en el resultado buscamos el dato que ocupa el lugar 8 y se tiene que es 21. Por lo tanto el dato 21 deja el 80 % de datos debajo de él. 4
6
9
10
12
14
18
21
22
24
Paso 4: Interpretación, esto nos permite interpretar que el dato 21 tiene 80 % de datos menores que él.
Ejercicio 3
Calcule el decil 3 y el decil 8 de la siguiente serie de datos. 10
• D3 = • D8 =
184
IGER − Tacaná
12
15
18
18
21
25
25
30
33
1.3 Cuartiles Los cuartiles separan los datos en cuatro partes, de modo que, como su nombre lo indica, solo hay cuartiles del 1 al 4. El cuartil 1 deja un 25 % de casos debajo de él, el cuartil 2 deja un 50 % de casos debajo de él (la mediana), y el cuartil 3 deja un 75 % de casos debajo de él. ¿Cómo se realiza el cálculo de cuartiles? Ejemplo: La distancia, en metros, que recorre un grupo de estudiantes para llegar a la escuela está representada en la tabla 25
28
36
40
52
64
84
86
99
100
112
116
Paso 1. Utilizamos la fórmula de los cuartiles. Qx =
X(N) 4
Paso 2. Sustituimos los valores para calcular el cuartil 3 de la serie anterior. Q3 =
36 3(12) = =9 4 4
Paso 3. Buscamos el dato que ocupa el lugar 9 y se tiene que corresponde a 99. 25
28
36
40
52
64
84
86
99
100
112
116
Paso 4: Interpretación, esto indica que el 75 % de los estudiantes recorre menos de 99 metros para llegar a la escuela.
Ejercicio 4
Tome como base la tabla del ejercicio 3 y calcule el cuartil 2 e interprete el resultado. • Q2 = • Interpretación =
Estadística Descriptiva − Semana 13
185
Vocabulario básico cuartiles: los cuartiles separan los datos en cuatro partes, de modo que el cuartil 1 deja un 25 % de casos debajo de él, el cuartil 2 deja un 50 % de casos debajo de él (la mediana), y el cuartil 3 deja un 75 % de casos debajo de él. decil: separa el grupo de datos en 10 partes e indica el porcentaje de casos situados debajo del decil en análisis. medidas de posición: indican el porcentaje de casos que quedan debajo o son menores que un número determinado. La mediana también es una medida de posición. percentil: divide la serie de datos en 100 partes y define el porcentaje de casos que se ubican debajo del percentil en análisis.
Resumen Para calcular medidas de posición debemos: ordenar los datos de menor a mayor, seleccionar la fórmula correspondiente, sustituir los datos, buscar el dato que ocupa la posición obtenida e interpretar el resultado. Las fórmulas de las medidas de posición son: Percentil Donde:
• • • •
Decil Donde:
• •
Dx es la posición del decil X representa el decil a buscar
•
N es el número de datos
•
10 es constante
• •
Qx es la posición del cuartil X representa el cuartil a buscar
•
N es el número de datos
•
4 es constante
Cuartil Donde:
186
Px es la posición del percentil X representa el percentil a buscar N es el número de datos 100 es constante
IGER − Tacaná
Px =
X(N) 100
Dx =
X(N) 10
Qx =
X(N) 4
Ejercicio guiado Se quiere saber el peso de 100 granos de café seco y el número de granos secos que hay en 100 gramos de café, con las medidas de posición siguientes: • Percentil 25 • Decil 5 • Cuartil 3 Los datos que se muestran en la tabla corresponden al peso y número de granos secos de café. Peso de 100 granos secos Número de granos secos en 100 gramos
11.40
12.60
13.00
13.90
11.90
13.10
13.50
14.30
12.70
13.70
14.70
14.60
793
646
653
625
743
458
648
632
777
681
629
633
Antes de realizar los cálculos es imprescindible ordenar los datos de menor a mayor. Percentil 25 Peso de 100 granos secos Número de granos secos en 100 gramos
Cuartil 3
Decil 5
11.40
11.90
12.60
12.70
13.00
13.10
13.30
13.50
13.70
13.90
14.60
14.70
625
629
632
633
646
648
653
658
681
743
777
793
Percentil 25 P25 =
25(12) 300 = =3 100 100
El percentil 25 se encuentra en la posición 3, a la cual le corresponde un peso de 12.60 gramos y 632 granos secos de café. Decil 5
D5 =
5(12) 60 = =6 10 10
El decil 5 se encuentra e la posición 6, a la cual le corresponde un peso de 13.10 gramos y 648 granos secos de café. Cuartil 3
Q3 =
36 3(12) = =9 4 4
El cuartil 3 se encuentra en la posición 9, a la cual le corresponde un peso de 13.70 gramos y 681 granos secos de café.
Estadística Descriptiva − Semana 13
187
Autocontrol Actividad 1 A continuación encontrará varias series de datos, para cada serie calcule los percentiles, deciles y cuartiles, que se le piden. 1.
14
20
14
13
15
10
14
14
18
12
17
11
157
133
168
102
184
198
136
143
190
136
9
15
1
19
19
11
18
1
6
7
6
7
0
3
7
3
10
6
7
8
• Percentil 35 • Percentil 88 • Decil 3 • Decil 8 • Cuartil 1 2.
113
135
• Percentil 16 • Percentil 42 • Decil 6 • Decil 5 • Cuartil 1 3.
5
19
• Percentil 90 • Percentil 64 • Decil 4 • Decil 1 • Cuartil 3 4.
6
0
• Percentil 36 • Percentil 44 • Decil 4 • Decil 9 • Cuartil 4
188
IGER − Tacaná
5.
90
66
74
72
53
92
64
65
92
82
89
85
101
167
81
145
194
98
196
120
100
199
10
12
15
13
15
11
13
14
15
14
515
698
685
39
28
62
54
34
54
27
43
33
41
39
28
62
54
34
54
27
• Percentil 60 • Percentil 40 • Decil 1 • Decil 9 • Cuartil 4 6.
187
174
• Percentil 22 • Percentil 96 • Decil 5 • Decil 3 • Cuartil 2 7.
12
11
• Percentil 30 • Percentil 80 • Decil 6 • Decil 8 • Cuartil 3 8.
719
684
• Percentil 90 • Percentil 50 • Decil 4 • Decil 5 • Cuartil 2 9.
89
27
• Percentil 64 • Percentil 36 • Decil 10 • Decil 8 • Cuartil 1 Estadística Descriptiva − Semana 13
189
10. La finca de café "Sol Alto" desea conocer los percentiles, deciles y cuartiles de: • 100 granos secos de café. • Número de granos secos que hay en 100 gramos de café.
Para ello se le proporcionan los siguientes datos: Peso de 100 granos secos
11.40
12.60
13.00
13.90
11.90
13.10
13.50
14.30
12.70
13.70
14.70
14.60
793
646
653
625
743
658
648
632
777
681
629
633
Número de granos secos en 100 gramos
Calcule e interprete: • Percentil 80 • Percentil 50 • Decil 9 • Cuartil 3
Navegue en la red... Instituto Guatemalteco de Seguridad Social (Igss) El Instituto Guatemalteco de Seguridad Social es una entidad autónoma que tiene como objetivo proteger la salud y vejez de los trabajadores afiliados ofreciendo atención médica, hospitalaria, tratamientos terapéuticos y asistencia a la vejez y viudez. En su página electrónica encontrará información sobre las características de sus afiliados y los servicios que han prestado. Lo invitamos a buscar más información en: www.igssgt.org/informes.php
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
190
la casilla que mejor indique su rendimiento.
Calculo la mediana. Conozco el uso de los percentiles de talla y peso para estimar el estado nutricional de las niñas. Calculo e interpreto percentiles, deciles y cuartiles.
IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
14 Números índice ¿Qué encontrará esta semana?
Repaso del cálculo de proporciones y porcentajes
Países consumidores del café guatemalteco
Números índice
Esta semana logrará: Calcular proporciones y porcentajes. Calcular e interpretar los números índice de precios y de cantidad.
Estadística Descriptiva − Semana 14
191
¡Para comenzar! Repaso el cálculo de proporciones y porcentajes En primer término para el cálculo de proposiciones debemos utilizar la fórmula siguiente: Proporción =
número de elementos que cumplen con la condición total de elementos
Con el resultado obtenido en el cálculo de la proporción, estamos listos para calcular el porcentaje, utilizando la fórmula siguiente: Porcentaje = proporción • 100 Para no quedarnos con la teoría, pasemos a la práctica. Ejemplo: En la clase de tercero básico del instituto de Chugüexá en total hay 35 alumnos, de estos 15 son mujeres y el resto hombres. ¿Cuál es el porcentaje de mujeres? Proporción = 15 = 0.4286 35 Luego, aplicamos la fórmula del porcentaje como sigue: Porcentaje = 0.4286 • 100 = 42.86 % Como resultado obtenemos que el 42.86 % de los estudiantes son mujeres. Ejemplo: En la cooperativa Setul tienen 1500 plantas de café en un terreno y han observado que 375 de ellas tienen roya. ¿Cuál es el porcentaje de plantas con roya? Proporción =
375 = 0.25 1500
Porcentaje = 0.25 • 100 = 25 % El resultado indica que el 25 % de las plantas tienen roya.
¡A trabajar! Calcule los porcentaje que le solicitan. 1. En un día llegan a solicitar sus antecedentes policiacos 1500 personas, 300 de ellas tienen antecedentes. ¿Qué porcentaje tiene antecedentes? 2. En la escuela de la aldea El Serinal hay 450 niños, de los cuales 245 son mujeres. ¿Qué porcentaje de los alumnos son mujeres?
192
IGER − Tacaná
Lectura Países consumidores del café guatemalteco EXPORTACION REALIZADA DE CAFE DE GUATEMALA COSECHA 2013-2014 ABRIL 2014 MERCADO MIEMBRO-OIC *
PAIS DE DESTINO
QUINTAL ORO
SACO DE 60 KILOS
PRECIO TOTAL US$
PRECIO PROMEDIO US$ X qq ORO 162.46
ALEMANIA
22,560
17,296
3,665,026.06
BELGICA
48,680
37,321
7,619,363.50
2,700
2,070
286,965.00
825
632
1 1 1 ,5 8 1 .2 5
COSTA RICA ECUADOR EL SALVADOR
280
214
4 7 ,7 7 7 .4 3
2,888
2,214
435,195.54
201,919
154,804
32,091,537.71
FINLANDIA
3,105
2,380
492,340.51
FRANCIA
3,315
2,541
523,561.48
428
328
1 2 0 ,7 4 3 .1 0
21,045
16,134
3,278,443.33
NORUEGA
6,845
5,247
1,165,917.45
PAISES BAJOS
1,628
1,248
243,369.75
PORTUGAL
1 ,2 7 5
977
2 2 6 ,1 4 5 .6 3
REINO UNIDO
4,088
3,134
653,907.60
RUMANIA
825
632
1 7 5 ,3 1 2 .5 0
SUECIA
869
666
1 8 5 ,7 0 5 .6 3
2,933
2,248
488,745.75
593
454
9 9 ,4 2 0 .0 0
ESPAÑA ESTADOS UNIDOS DE AMERICA
GRECIA ITALIA
SUIZA TURQUIA
SUB-TOTAL
326,796
250,544
156.52 106.28 135.25 170.80 150.72 158.93 158.56 157.94 282.44
155.78 170.34 149.54 177.37 159.98 212.50 213.82 166.67
167.80 158.85
51,911,059.21
MERCADO NO MIEMBRO-OIC PAIS DE DESTINO AUSTRALIA
QUINTAL ORO
SACO DE 60 KILOS
PRECIO TOTAL US$
PRECIO PROMEDIO US$ X qq ORO 187.79
3,300
2,530
619,740.30
35
27
6 ,5 1 1 .3 4
30,507
23,388
4,726,547.26
COREA, REP. DE (SUR)
8 ,2 4 6
6 ,3 2 2
1 ,4 0 6 ,9 1 8 .2 5
FEDERACION DE RUSIA
1 ,2 9 8
995
2 4 0 ,3 0 7 .5 0
HONG KONG
418
320
7 0 ,1 4 0 .4 0
ISLANDIA
408
313
1 0 2 ,0 0 0 .0 0
51,087
39,167
8,289,330.68
JORDANIA
1 ,2 3 8
949
1 8 6 ,1 7 7 .7 5
MALASIA
BELICE CANADA
JAPON
5,775
4,427
1,008,645.00
MARRUECOS
413
316
7 3 ,8 7 8 .7 5
NUEVA ZELANDIA
413
316
6 4 ,3 5 0 .0 0
1 ,1 2 5
862
1 9 0 ,1 8 1 .2 5
375
287
6 3 ,3 7 5 .0 0
SUDÁFRICA, REP. DE
1 ,6 6 5
1 ,2 7 6
2 8 3 ,5 3 7 . 1 3
TAIWAN
3,068
2,352
526,584.79
REPUBLICA POPULAR CHINA SINGAPUR
187.00 154.94 170.63 185.21 167.91 250.00 162.26 150.45 174.66 179.10 156.00 169.05 169.00 170.29
SUB-TOTAL
109,368
83,849
17,858,225.39
171.62 163.29
TOTAL
4 3 6 ,1 6 5
3 3 4 ,3 9 3
6 9 , 7 6 9 ,2 8 4 . 6 1
159.96
Fuente: Depto. de comercialización – Anacafé * Oic: Organización Internacional del Café
Responda las preguntas. 1. ¿A qué país exporta más café Guatemala? 2. ¿Cuál es la diferencia en el precio de café entre Alemania y Australia?
Estadística Descriptiva − Semana 14
193
El mundo de la estadística 1. Números índice La teoría de los números índice ha sido desarrollada principalmente para el estudio de las variaciones de los precios, ya que estos indicadores son utilizados para medir el aumento o disminución de precios y el poder adquisitivo del dinero, es decir, si por ejemplo hoy en día con Q100.00 podemos adquirir la misma cantidad de bienes y servicios que hace 20 años, ¿usted que opina? Sin embargo, la utilidad de los números índice no se limita al estudio de precios, sino que se aplica a todos los campos de la actividad humana en los que se puede observar y cuantificar estadísticamente. Si bien es cierto que en el campo de la economía se utilizan en mayor medida los números índice, ya que existen números índice de salarios, de producción, de comercio exterior, entre otros.
¿Cómo podemos definir qué es un número índice? Un número índice es aquel que dice cuánto ha cambiado una variable a través del tiempo. Lo importante es que se defina claramente un momento inicial (momento base) y el momento actual. Por lo tanto, los números índice constituyen una técnica para analizar y comparar un conjunto de datos en distintos momentos del tiempo y del espacio, es decir en lugares diferentes. En este libro estudiaremos dos tipos: • Índice de precios • Índice de cantidad
1.1 Índice de precios Estos números índice nos proporcionan los datos numéricos de evolución de las magnitudes de precio en las fases de la producción y comercialización de bienes y servicios. En términos generales el índice de precios se calcula así: Índice de precios =
precio actual • 100 precio momento base
Ejemplo: El precio de la libra de fresa en enero 2014 era de Q2.50 y en junio del mismo año aumentó a Q3.00. Al aplicar la fórmula de índice de precios tenemos: Índice de precios =
194
IGER − Tacaná
3.00 • 100 = 1.2 • 100 = 12 % 2.50
Para comprender la variación en el precio de la fresa hacemos la resta siguiente: 120 % – 100 % = 20 % Interpretación: El resultado indica que el precio de la fresa aumentó en un 20 % en los meses de enero a junio del año 2014.
Otro ejemplo: El precio del tomate en enero 2014 fue de Q3.50 la libra y en junio fue de Q3.00, ¿cuál es el número índice? Para averiguarlo, aplicamos la fórmula. Índice de precios =
3.00 • 100 = 0.8571 • 100 = 85.71 % 3.50
Hagamos la resta para determinar la variación en el precio. 85.71 % – 100 % = –14.29 % Interpretación: El signo negativo indica que el precio del tomate disminuyó un 14.29 % Debemos tener presente que el precio del tomate, de la fresa o de cualquier otro producto no es el mismo en todos los puntos de venta, por lo que para calcular el precio se debe calcular la media aritmética de distintos puntos de venta. Si se quiere calcular el cambio de precio de varios productos a la vez se calcula con la fórmula siguiente: Índice de precios =
Ʃ precio actual
Ʃ precio momento base
• 100
Ejemplo: En el siguiente cuadro aparecen los precios de varios productos durante enero y junio de 2014. Producto
Precio en enero 2014
Precio en junio 2014
Tomate
Q2.50
Q5.00
Papa
Q3.00
Q4.00
Maíz
Q2.75
Q2.80
Frijol
Q1.85
Q2.05
Total
Q10.10
Q13.85
Estadística Descriptiva − Semana 14
195
El número índice se calcula con los totales de los precios y aplicando la fórmula de índice de precios: Índice de precios =
13.85 • 100 = 1.37 • 100 = 137 % 10.10
Al igual que en los casos anteriores, para saber la variación en los precios restamos: 137 % – 100 % = 37 % Los precios de los productos aumentaron 37 % de enero a junio de 2014.
Ejercicio 1
Resuelva el caso que se le presenta a continuación. Haga los cálculos en hojas aparte o en su cuaderno. Don Raúl vende verduras en su tienda y para conocer las variaciones de precios, lleva el siguiente registro. Producto
Precio del producto antes del invierno
Precio del producto a los tres meses del invierno
Tomate (libra)
Q6.00
Q3.00
Maíz (libra)
Q4.00
Q6.00
Frijol (libra)
Q6.00
Q3.00
Fresa (libra)
Q3.00
Q6.00
Elote (bandeja de 4)
Q3.00
Q4.00
Total
Q22.00
Q22.00
1. Calcule e interprete el cambio de precio de cada producto antes del invierno y a los tres meses después del invierno. Interpretación: 2. Calcule e interprete el cambio de precio de todos los productos de antes del invierno y a los tres meses del invierno. Interpretación:
196
IGER − Tacaná
En resumen, existen dos formas para realizar los cálculos del número índice de precios, veamos cuáles son: • De forma individual para cada producto • De forma conjunta, para toda una serie de productos Sin embargo, es necesario tener cuidado con la unidad de medida que se utiliza antes y después para evitar errores o equivocaciones.
1.2 Índice de cantidad Los números índice de cantidad son similares a los utilizados para medir las variaciones de los precios, con la diferencia de que los números índice de cantidad se centran en conocer la evolución de la cantidad, volumen o producción, por lo que la fórmula que se utiliza es bastante parecida. Observe y compare con la fórmula de número índice de precios. Índice de cantidad =
cantidad actual • 100 cantidad momento base
Practiquemos con unos ejemplos siguiendo los pasos. Ejemplo: En la finca “El Morrito” se contrataron 175 trabajadores en enero, luego para el mes de junio la planilla de trabajadores alcanzó la cantidad de 225. ¿En qué porcentaje se incrementó el número de trabajadores? Paso 1. Aplicamos la fórmula: Índice de cantidad =
225 • 100 = 1.2857 • 100 = 128.57 % 175
Paso 2. Hagamos la resta: 128.57 % – 100 % = 28.57 % Paso 3. Interpretamos el resultado: De enero a junio hubo un aumento del 28.57 % en la planilla de empleados.
Estadística Descriptiva − Semana 14
197
Otro ejemplo: En enero se inscribieron 130 estudiantes en la escuela de la aldea La Vaquita. En la actualidad (mes de junio) hay 124. ¿En qué porcentaje ha variado el número de estudiantes? Paso 1. Aplicamos la fórmula: Índice de cantidad =
124 • 100 = 0.9538 • 100 = 95.38 % 130
Paso 2. Hagamos la resta: 95.38 % – 100 % = – 4.62 % Paso 3. Interpretamos el resultado: Como el resultado es negativo significa que hubo una disminución del 4.62 % de estudiantes con respecto a los inscritos al inicio del año. Continuando con el ejemplo anterior. Si la cantidad de estudiantes en el mes de octubre es de 120, ¿en qué porcentaje ha variado el número? Paso 1. Aplicamos la fórmula: Índice de cantidad =
120 • 100 = 0.9231 • 100 = 92.31 % 130
Paso 2. Hagamos la resta: 92.31 % – 100 % = –7.69 % Paso 3. Interpretamos el resultado: Hubo una disminución del 7.69 % de estudiantes con respecto a los que asistieron al inicio del año. Recuerde lo siguiente: • Cuando se calculan números índice es importante estar seguro sobre cuál es la base, ya que la interpretación se hace con respecto a este dato. • Si el resultado obtenido en el cálculo de números índice es negativo quiere decir que hubo una disminución y, por el contrario, si el resultado es positivo, significa que hubo un aumento.
198
IGER − Tacaná
Ejercicio 2
Resuelva el caso que se le presentan a continuación. La directora de la escuela Monte Azul le muestra los datos de los alumnos inscritos, los que asisten al inicio y al finalizar el año 2015. Con la información de la tabla realice en su cuaderno los cálculos solicitados. Sección
Alumnos inscritos
Alumnos que asistieron
Alumnos al finalizar el año
A
41
43
40
B
55
52
53
C
33
38
35
D
36
40
38
E
49
42
45
Total
214
215
211
1. Calcule e interprete en porcentaje la diferencia de estudiantes con base en la sección con mayor y menor cantidad de estudiantes inscritos. 2. Calcule e interprete el porcentaje de aumento o disminución de estudiantes con base en los que asistieron al inicio y los inscritos. 3. Calcule e interprete el porcentaje de aumento o disminución de estudiantes con base en inscritos y la cantidad al finalizar el año. 4. Calcule e interprete el porcentaje de aumento o disminución de estudiantes con base en los que asistieron al inicio y al finalizar el año.
Estadística Descriptiva − Semana 14
199
Vocabulario básico índice de precios: proporciona los datos numéricos de evolución de las magnitudes de precios en las fases de la producción y comercialización de bienes y servicios. índice de cantidad: mide la evolución de la cantidad, volumen o producción de cualquier objeto, persona o situación. números índice: son indicadores que miden la variación, aumento o disminución, en diferentes momentos. proporción: comparación entre el número de casos en una categoría con el tamaño del número de casos totales.
Resumen Los cálculos del número índice de precios, se puede realizar de dos maneras: • De forma individual para cada producto • De forma conjunta, para toda una serie de productos Para calcular el número índice de precios de un producto se utiliza la siguiente fórmula: precio actual • 100 precio momento base
Índice de precios =
Para el cálculo del número índice de precios de varios productos, se utiliza la siguiente fórmula: Índice de precios =
Ʃ precio actual
Ʃ precio momento base
• 100
Para calcular el número índice de cantidad se utiliza esta fórmula: Índice de cantidad =
cantidad actual • 100 cantidad momento base
Si el resultado obtenido en el cálculo de números índice es negativo, quiere decir que hubo una disminución y, por el contrario, si es positivo, quiere decir que hubo un aumento. Recuerde que cuando se calculan números índice es importante estar seguro sobre cuál es la base, ya que la interpretación se hace con respecto a ese dato.
200
IGER − Tacaná
Autocontrol Actividad 1 Realice lo que se le pide en cada ejercicio. 1. Una computadora costaba Q5,500.00 en 1990. En 2016 cuesta Q4,500.00. Calcule el número índice de precios e interprete el resultado.
Respuesta:
2. El costo de tres productos de la Canasta Básica en dos momentos del año es: Producto
Costo en enero
Costo en octubre
Frijol
Q4.35
Q5.50
Arroz
Q4.25
Q5.00
Maíz
Q3.85
Q4.50
Total
Q12.45
Q15.00
• ¿Cuánto cambió el precio del arroz de enero a octubre? • ¿Cuánto cambió el precio de los productos en conjunto?
Respuesta: Estadística Descriptiva − Semana 14
201
3. El 20 de septiembre de 2015 el dólar estadounidense se cotizaba a Q7.65, mientras que el 5 de octubre del mismo año se cotizó a Q7.72.
¿Cómo cambió el precio del dólar de septiembre a octubre?
Respuesta:
Navegue en la red... Asociación Nacional del Café (Anacafé) Es una institución privada cuyo objetivo es fortalecer la economía del país a través de la producción y exportación del café, para lo cual ofrece asistencia técnica a productores de café y promueve el consumo de la bebida por medio de capacitaciones a baristas. En su página electrónica encontrará información sobre los precios y exportaciones del café. Si quiere estar al día con los precios internacionales del café o el tipo de cambio del dólar, visite: www.anacafe.org
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
202
la casilla que mejor indique su rendimiento.
Calculo proporciones y porcentajes. Calculo e interpreto números índice de precios y de cantidad.
IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
15 Probabilidades ¿Qué encontrará esta semana?
Suerte: no todo es encontrar un trébol de cuatro hojas
¿Lloverá hoy?
Probabilidades
Esta semana logrará: Reconocer el uso de las probabilidades en la vida diaria. Calcular probabilidades a priori, empíricas y subjetivas. Calcular probabilidades simples y compuestas.
Estadística Descriptiva – Semana 15
203
¡Para comenzar! Suerte: no todo es encontrar un trébol de cuatro hojas A veces, cuando me quedo abstraído escuchando conversaciones ajenas —sí, soy de los que viven también pendientes de lo que ocurre a nuestro alrededor y, además de mi propia vida, me interesa bucear en caladeros ajenos por puro placer—, compruebo cómo los tópicos acuñados se apropian de muchas conversaciones. Uno de los que más se repiten últimamente, quizás por aquello de vivir en tiempos de crisis económica, es el de la suerte o si fulanito está tocado por la diosa fortuna, ya sea en el trabajo, en sus relaciones o en el amor. El éxito se puede definir como la capacidad que tenemos a lo largo de nuestra existencia de aprovechar las oportunidades. Y tiene su intriga, porque por una parte está determinada por la toma de decisiones adecuadas, pero por otra —y no menos importante— por la cantidad de situaciones a las que nos podemos enfrentar. En definitiva, y reduciendo el asunto a estas dos variables, podemos decir que es una cuestión de probabilidades. Pero no se trata de un juego de suma cero —la suma de las dos variables ha de resultar siempre la misma—, por lo tanto lo que nos puede granjear el éxito precisamente es aumentar esas probabilidades. O lo que viene a ser lo mismo, cuantos más boletos tengamos en la rifa, mayores posibilidades de ganar el pavo tendremos. Aun así, hay que acertar —en el momento preciso y oportuno— y la naturaleza es pródiga en mostrarnos que el azar resulta determinante en la evolución, así que no merece la pena insistir por ese camino. Quedémonos con el significado humano de esta palabra. La suerte o su contrario —en sentido coloquial— es un invento de nuestra especie que nada tiene que ver con la ciencia, sino más bien con la superstición. Pero como ya sabemos que los humanos somos especialistas en desviarnos de las líneas rectas y adoptar como favoritas a las curvas, para los que creen en la suerte, desde una perspectiva puramente científica o estadística hay que tener en cuenta, en primer lugar, que sólo quien intenta algo podrá tener éxito y que —como ya hemos reseñado— cuantas más veces intentemos lograr cualquier cosa, más cerca estaremos de alcanzar el premio. Que por mucho que nos toque alguien con la varita, sencillamente es un mero problema de cálculo de probabilidades. Lo demás, como ocurre con la magia, lo dejamos para los prestidigitadores. Eduardo Costas, catedrático de Genética Adaptado de goo.gl/RSo92n
204
IGER − Tacaná
Lectura ¿Lloverá hoy? La meteorología es la ciencia que estudia el estado del tiempo y el clima. Sin embargo, nunca se puede estar completamente seguro de una predicción, por eso es que se utilizan los porcentajes y las probabilidades, estos nos dan una estimación aproximada sobre si lloverá o estará soleado. Con la ayuda de Google, podemos encontrar pronósticos del clima para nuestra región. Veamos dos ejemplos para Guatemala:
Fuente: weather.com
Fuente: weather.com
Estadística Descriptiva – Semana 15
205
El mundo de la estadística 1. Probabilidades
La probabilidad es uno de los temas más apasionantes en el campo de las matemáticas, sin embargo, como veremos esta semana, por su utilidad en todas las esferas del quehacer humano también ha resultado ser un tema central en el campo de la estadística. ¿Sabe qué significa probabilidad? La probabilidad es una proporción que se ocupa de medir cuantitativamente, o en otras palabras, calcular la cantidad exacta de posibilidades de que un suceso o evento ocurra. La probabilidad nació como un intento de responder a varias preguntas que surgían de los juegos de azar. Muchos fenómenos de la naturaleza se comportan en forma aleatoria, es decir que su resultado se escapa a nuestro control y por lo tanto se le atribuye al azar. Por ejemplo: ¿lloverá hoy?, ¿tendremos una buena cosecha este año?, si lanzamos una moneda ¿saldrá cara o escudo?, ¿llegaré a tiempo a mi trabajo?, etc. Y con eso se hace la pregunta, ¿cuál es la probabilidad de que llueva hoy?, ¿cuál es la probabilidad de que llegue a tiempo a mi trabajo? Estas preguntas tienen respuesta en función del azar. Esto significa que no podemos saber con seguridad qué resultado obtendremos, no tenemos forma de saber si algo sucederá o no realmente. Con fines de estudio, trabajaremos primero un vocabulario y luego se describirá cómo se calculan los distintos tipos de probabilidades. El vocabulario puede variar de un autor a otro, de forma que a continuación les expondremos los términos explicados de forma más sencilla.
206
IGER − Tacaná
Casos posibles o espacio muestral Esto es sinónimo de las categorías de una variable. Contesta a la pregunta: ¿cuáles son los posibles casos? Cada caso es equivalente a la categoría de la variable. Veamos los siguientes ejemplos: • ¿Cuál es la probabilidad de que al seleccionar un estudiante sea mujer? Los posibles casos son hombre, mujer, o lo que es lo mismo, las posibles categorías son hombre y mujer. • ¿Cuál es la probabilidad de que llueva? Los posibles casos son que sí llueva o que no llueva. Casos favorables Es el caso que se espera o se desea. En la pregunta: ¿cuál es la probabilidad de que llueva? El caso favorable sería que sí llueva. • Si se lanza una moneda de 25 centavos, los casos posibles son cara o escudo. El caso favorable sería el que defina quien lanzó la moneda, por ejemplo, que caiga cara. • Se tiene una lista de números para una rifa en la escuela, esta lista tiene 100 números y se compra un número. ¿Cuál es la probabilidad de sacarse el premio? Los casos posibles son los 100 números y el caso favorable sería el número que se compró. Con esta nueva información podemos volver a definir el concepto de probabilidad. La probabilidad es una rama de la matemática que se ocupa de medir la posibilidad de que una acción tenga un determinado resultado. La probabilidad se mide con un número que va de 0 (caso imposible) hasta 1 (caso cierto), aunque para fines de mejor entendimiento se puede expresar como un porcentaje, esto es, una probabilidad de 0.75 se puede expresar como una probabilidad del 75 %. Existen tres tipos de probabilidades: 1. A priori 2. Empírica 3. Subjetiva
Estadística Descriptiva – Semana 15
207
1.1 Probabilidad a priori La probabilidad a priori se basa en el conocimiento previo de los casos posibles, si se tiene esta información, se calcula la probabilidad utilizando la siguiente fórmula: probabilidad de ocurrencia =
número de casos favorables número total de casos posibles
Ejemplo: Si sabemos que hay 12 mujeres y 15 hombres en una clase, ¿cuál es la probabilidad de seleccionar una mujer para que pase a explicar al pizarrón un tema? probabilidad de ocurrencia =
12 = 0.4444 • 100 = 44.44 % 27
Interpretación: La probabilidad de seleccionar una estudiante mujer al azar del grupo es de un 44.44 % Otro ejemplo: Tenemos un dado y queremos saber cuál es la probabilidad de que salga un número par. probabilidad de ocurrencia = 3 = 0.5 • 100 = 50 % 6 Un dado tiene 6 caras de las cuales se tienen 3 números pares (2, 4 y 6), por lo que sustituimos los valores en la fórmula y obtenemos un resultado de 50 %. Interpretación: La probabilidad de obtener un número par al tirar un dado es del 50 %.
Ejercicio 1
Resuelva el siguiente ejercicio de probabilidad. En el aula de 1.º básico del Instituto Acatán hay 20 estudiantes mujeres y 15 estudiantes hombres. 1. ¿Cuál es la probabilidad de que al seleccionar a un estudiante sea mujer? 2. ¿Cuál es la probabilidad de que al seleccionar a un estudiante sea hombre?
208
IGER − Tacaná
1.2 Probabilidad empírica La probabilidad empírica se basa en los datos observados y no en el conocimiento previo. Ejemplo: Se aplica una encuesta en una escuela con 500 estudiantes sobre el gusto de algún sabor de agua gaseosa y se obtiene que de los 60 encuestados, 15 prefieren agua de cola. Hacemos en la escuela la siguiente pregunta: ¿cuál es la probabilidad de que al seleccionar un estudiante este prefiera agua gaseosa de cola? Para calcular la probabilidad se utiliza la misma fórmula: probabilidad de ocurrencia = 15 = 0.25 • 100 = 25 % 60 Interpretación: La probabilidad de seleccionar un estudiante que prefiera refresco de cola es de un 25 %. Recuerde, en la probabilidad a priori el número total de casos posibles se conocen de antemano, mientras que en la probabilidad empírica el número de casos posibles se conoce después de contar a través de una encuesta, porque son datos observados en la realidad y no datos conocidos de antemano.
Ejercicio 2
Lea el caso siguiente y resuelva las preguntas. En una maquila se observa que de los 150 pantalones que se confeccionaron en los últimos días, 5 tienen algún defecto. 1. ¿Cuál es la probabilidad de que al seleccionar un pantalón de la producción este tenga algún defecto?
2. Si ahora 15 pantalones tuvieran algún defecto, ¿cuál sería la probabilidad de que al seleccionar un pantalón de la producción este tenga algún defecto?
Estadística Descriptiva – Semana 15
209
1.3 Probabilidad subjetiva La probabilidad subjetiva varía porque depende de la forma de pensar, puntos de vista, gustos, etc. de la persona que responde la pregunta. Ejemplo: Días antes del Mundial, un grupo de amigos discuten sobre la probabilidad de que España pase o no a la segunda ronda. Este grupo de amigos estiman que España tiene una probabilidad muy pequeña de pasar a la segunda ronda en el Mundial. Otro ejemplo: ¿Cuál es la probabilidad de que llueva en la cabecera de Jutiapa? Según algunos observadores, las probabilidades aumentan si el volcán Suchitán tiene o no nubes sobre él.
Ejercicio 3
Lea la historia siguiente y resuelva lo que se le pide. Hoy fue a ver a su amigo Leonidas al hospital. Leonidas cruzó la calle justo cuando el semáforo estaba cambiando a rojo y una moto lo atropelló. "No calculé bien", dice adolorido. ¿Qué fue lo que Leonidas no calculó? Antes de cruzar la calle, Leonidas "creyó" tener la habilidad y tiempo suficientes para cruzar la calle. Todos los días, constantemente, hacemos cálculos de probabilidad sobre eventos a futuro. Lo invitamos a que escriba tres casos en los que ha utilizado la probabilidad en su vida diaria. Caso 1.
Caso 2.
Caso 3.
210
IGER − Tacaná
2. Experimentos estadísticos Un experimento es un procedimiento por el cual se trata de comprobar o descubrir algo. En estadística, se realizan para conocer la probabilidad de que suceda algún evento. Hay diferentes tipos de experimentos, nosotros estudiaremos los siguientes: simples y compuestos, los primeros a su vez se dividen en independientes y dependientes.
2.1 Experimentos simples Un experimento simple es aquel que no se puede descomponer y solo involucra un evento o suceso. Estos experimentos simples pueden ser independientes o dependientes, veamos: • Independientes: sucesos o eventos que no tienen relación entre sí; la ocurrencia de un experimento no afecta la ocurrencia del otro.
Por ejemplo, si se lanza un dado varias veces, cada resultado obtenido es independiente de los demás porque cada lanzamiento no influye en las probabilidades de los demás.
• Dependientes: se dice que un experimento es dependiente cuando la ocurrencia de uno sí afecta los resultados de los experimentos que le siguen. Por ejemplo, si tenemos una tómbola de bingo con 5 bolas rojas, 2 azules y 1 negra: Si sacamos una primera pelotita, ¿cuál es la probabilidad de que sea roja? Tenemos 8 bolas de las cuales 5 son rojas, entonces, 5 = 0.625 • 100 = 62.5 % 8 Al hacer los cálculos decimos que tenemos 62.5 % de probabilidades de que la primera bola sea roja. Ahora, si sacamos una segunda pelotita, ¿cuál es la probabilidad de que sea roja si la anterior fue roja también? Como vemos a simple inspección, la probabilidad de este segundo experimento depende del color de la primera bola que sacamos la primera vez. Puesto que quedarían 4 bolas rojas de un total de 7, entonces, 4 ≈ 0.5714 • 100 = 57.14 % 7 La probabilidad de que la segunda bola sea roja si la primera fue también roja es del 57.14 %; nos damos cuenta que el resultado del primer experimento influye en el resultado del segundo, por tanto, se dice que son dependientes.
Estadística Descriptiva – Semana 15
211
2.2 Experimentos compuestos Los experimentos compuestos son los que están formados por dos o más experimentos simples, por tanto, se dice que involucran varios eventos o sucesos. Un experimento compuesto se puede realizar con experimentos simples tanto dependientes como con independientes. La probabilidad de estos sucesos se calcula multiplicando la probabilidad de los eventos implicados: probabilidad de A y B = probabilidad de A • probabilidad de B Entenderemos mejor con unos ejemplos. Continuemos con el caso de la tómbola; si deseamos saber la probabilidad de que la primera bola sea roja y la segunda sea azul, aplicamos la fórmula: probabilidad de roja = 5 = 0.625 8 2 probabilidad de azul = ≈ 0.2857 7 Como la probabilidad de la bola azul es el segundo evento, solamente quedan 7 en la tómbola, es por eso que se divide entre 7. probabilidad de roja y azul = 0.625 • 0.2857 = 0.1786 • 100 = 17.86 % Al concluir con este experimento compuesto obtenemos que la probabilidad de que salga primero una bola roja y luego una azul es del 17.86 %.
Analicemos otro ejemplo más para entenderlo mejor. Si tenemos 3 monedas de un quetzal, ¿cuál es la probabilidad de que al lanzar una por una, todas caigan "cara"? 1 = 0.5 2 1 probabilidad de cara de la segunda moneda = = 0.5 2 1 probabilidad de cara de la tercera moneda = = 0.5 2 probabilidad de cara de la primera moneda =
probabilidad de que todas salgan cara = 0.5 • 0.5 • 0.5 = 0.125 • 100 = 12.5 % Si lanzamos las tres monedas, la probabilidad de que todas caigan en "cara" es del 12.5 %.
212
IGER − Tacaná
Vocabulario básico caso favorable: es el caso que se espera o se desea. espacio muestral: sinónimo de las categorías de una variable, contesta a la pregunta: ¿cuáles son los posibles casos? probabilidad: cálculo de la cantidad exacta de posibilidades de que un suceso o evento ocurra.
Resumen La probabilidad mide la posibilidad de que un suceso o evento ocurra. Existen tres tipos de probabilidades: a priori, empírica y subjetiva. La probabilidad a priori se basa en el conocimiento previo de los casos posibles. Se aplica la siguiente fórmula. probabilidad de ocurrencia =
número de casos favorables número total de casos posibles
La probabilidad empírica se basa en los datos observados. Para calcularla se aplica la siguiente fórmula: probabilidad de ocurrencia =
número de casos favorables número total de casos posibles
La probabilidad subjetiva depende de la forma de pensar, puntos de vista, gustos, etc. de la persona que responde la pregunta. En estadística, un experimento refiere al proceso para conocer la probabilidad de que suceda algún evento. Un experimento simple es aquel que no se puede descomponer y solo involucra un evento o suceso. • Independientes: sucesos o eventos que no tienen relación entre sí; la ocurrencia de un experimento no afecta la ocurrencia del otro. • Dependientes: se dice que un experimento es dependiente cuando la ocurrencia de uno sí afecta los resultados de los experimentos que le siguen. Los experimentos compuestos son los que están formados por dos o más experimentos simples, por tanto, se dice que involucran varios de eventos o sucesos. Se utiliza formula: probabilidad de A y B = probabilidad de A • probabilidad de B
Estadística Descriptiva – Semana 15
213
Ejercicio guiado Luego de conocer los tres tipos de probabilidad que estudiaremos en este libro, a priori, empírica y subjetiva, compare los siguientes ejemplos para entender mejor. Ejemplo: Se hace un estudio en una gasolinera y se observa la cantidad gastada en gasolina. Obtienen los siguientes datos: 25 personas gastan Q100.00; 15 gastan Q50.00 y 10 gastan Q10.00 ¿Qué tipo de probabilidad usó? Respuesta: Se utilizó probabilidad empírica ya que los datos se obtuvieron de la observación de la realidad. Ejemplo 2: ¿Cuál es la probabilidad de que el próximo cliente gaste Q100.00? probabilidad de ocurrencia = 25 = 0.5 • 100 = 50 % 50 Respuesta: La probabilidad de que el próximo cliente gaste Q100 es del 50 %. Ejemplo 3: En la gasolinera "La bendición" se observó que 40 clientes consumen gasolina súper y 20, gasolina regular. ¿Cuál es la probabilidad de que el próximo cliente consuma gasolina súper? ¿Qué tipo de probabilidad se utiliza? Empírica, porque los datos se obtienen de la realidad. probabilidad de ocurrencia = 40 = 0.6666 • 100 ≈ 66.67 % 60 Respuesta: La probabilidad de que el próximo cliente consuma gasolina súper es del 66.67 %. Ejemplo 4: El gerente de una gasolinera dice que la probabilidad de que suba la gasolina en la próxima semana es de un 69 % por los problemas en el Medio Oriente. ¿Qué tipo de probabilidad se utiliza? Respuesta: Se utilizó probabilidad subjetiva, ya que la predicción se realiza con base en la forma de pensar del gerente de la gasolinera.
214
IGER − Tacaná
Autocontrol Actividad 1 Lea los siguientes casos y resuelva los cálculos de probabilidad que se le solicitan. 1. Juanita compró 15 de los 56 números de la rifa de la escuela. ¿Cuál es la probabilidad de que Juanita gane?
2. En una bolsa hay 10 fichas blancas y 5 fichas negras. • ¿Cuál es la probabilidad de sacar al azar una ficha negra? • ¿Cuál es la probabilidad de sacar al azar una ficha blanca?
3. Tenemos una caja con 5 bolas azules, 9 bolas rojas y 3 bolas blancas Realice el cálculo de probabilidad en los casos que se detallan a continuación: • Salga una bola azul. • Salga una bola azul y luego una roja. • Salgan dos bolas blancas. • Salga una bola roja, luego, una blanca y luego, una azul.
4. La probabilidad de que funcione el teléfono comunitario es de un 59 % y la probabilidad de que funcione el teléfono de la tienda "El Cielito" es de un 75 %. ¿Cuál es la probabilidad de que, en un momento dado, funcionen los dos teléfonos?
5. ¿Cuál es la probabilidad de que llueva hoy en su comunidad?
Estadística Descriptiva – Semana 15
215
6. En una encuesta que se realizó con 100 personas de la comunidad Pipiltepeque Abajo, se encontró que 25 personas están muy preocupadas por la mancha de asfalto en la milpa, 35 están poco preocupadas y el resto no están preocupadas. ¿Cuál es la probabilidad de que al seleccionar una persona esta esté muy preocupada?
Navegue en la red... Instituto Nacional de Sismología, Vulcanología, Meteorología e Hidrología (Insivumeh) Es una institución técnica y científica que realiza estudios y monitoreos de las condiciones geofísicas del país apoyando los sistemas de alerta a desastres. En su página electrónica puede encontrar informes y mapas sobre eventos sismológicos y volcánicos, pronósticos del tiempo y registros históricos de las condiciones metereológicas del país. Lo invitamos a ingresar a la página electrónica y conocer los parámetros de cada estación metereológica que funciona en el país: www.insivumeh.gob.gt/estacionesmet.html
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
216
la casilla que mejor indique su rendimiento.
Reconozco el uso de las probabilidades en la vida diaria. Calculo probabilidades a priori, empíricas y subjetivas. Calculo probabilidades simples y compuestas.
IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
16 Prácticas de estadística ¿Qué encontrará esta semana?
Estadística en la vida cotidiana
Violencia intrafamiliar en Guatemala
Actividades de repaso de contenidos
Esta semana logrará: Reflexionar sobre el uso de la estadística en la vida cotidiana. Dimensionar la problemática de la violencia intrafamiliar en Guatemala. Repasar los conceptos básicos de estadística, elaboración de diagramas, cálculo de porcentaje, mediana, desviación estándar y números índice.
Estadística Descriptiva − Semana 16
217
¡Para comenzar! Estadística en la vida cotidiana Generalmente pensamos que la estadística es difícil y no tiene uso en la vida cotidiana; que la estadística es un tema para matemáticos, políticos y científicos o para el Ine. Pues bien, como usted ha podido apreciar a lo largo de estas semanas, la estadística es una ciencia de aplicación práctica que, en efecto, tiene mucha utilidad en diferentes campos del conocimiento. Por ejemplo: las ciencias sociales la utilizan para conocer los patrones de vida y comportamiento de las poblaciones. A la economía le permite conocer los niveles de interrelación entre múltiples parámetros macro y microeconómicos. En las ciencias médicas permite conocer la evolución de enfermedades, patrones de propagación de virus y grado de eficacia de los medicamentos. Las ciencias naturales emplea la estadística para describir modelos termodinámicos y las ciencias políticas para medir el grado de avance de índices de desarrollo humano y eficacia de aplicación de políticas públicas. La estadística es la ciencia que se encarga de la recopilación de datos sobre un fenómeno, acontecimiento o situación; datos que son organizados para facilitar su análisis y que nos ayudan a descubrir patrones para conocer o reconocer el impacto de ciertos factores en la vida individual, social o laboral. A todos nos es de utilidad la estadística, por ejemplo, en algo tan sencillo como sacar el promedio de nuestras notas para conocer qué probabilidad tenemos de aprobar una materia; llevar el registro de los productos que consumimos en casa, para determinar nuestro presupuesto y saber cada cuánto debemos comprar ciertos productos y establecer la variación del precio de los mismos.
¡A trabajar! Ahora que conoce mejor qué tipos de cálculos se realizan con la estadística y sus aplicaciones, le proponemos que escriba qué uso podrá dar a este conocimiento al terminar el bachillerato.
218
IGER − Tacaná
Lectura Lea con atención la nota sobre la violencia intrafamiliar en Guatemala publicada en Prensa Libre el 18 de Julio de 2014.
Violencia intrafamiliar ha subido 439 % En 439 por ciento se incrementó la cantidad de denuncias por violencia intrafamiliar desde el 2004 al 2013, según un informe del Instituto Nacional de Estadística (INE), lo que, según expertos, demuestra que en el hogar hay mayor número de víctimas. Por A. Orozco y S. Castro 18 de Julio de 2014
El documento refiere que la tasa de denuncia en el país es de 24 por cada 10 mil habitantes, que el 90 por ciento de víctimas que se atreven a quejarse son mujeres, y el otro 10 por ciento, hombres. Los departamentos con mayor crecimiento de denuncias son El Progreso, con 70 por cada 10 mil habitantes, y Sacatepéquez, con 54 por cada 10 mil, mientras los de menos quejas son Quiché, con 7 por cada 10 mil, y Escuintla, con 11 por cada 10 mil. Causas del problema El consumo de bebidas alcohólicas y patrones aprendidos en la casa están estrechamente relacionados con la violencia intrafamiliar, expuso Elizabeth Quiroa, secretaria presidencial de la Mujer, durante el acto, celebrado en el Palacio Nacional de la Cultura. “Gran parte de los ingresos se gastan en bebidas alcohólicas. Los procesos de violencia empiezan por discusiones que se intensifican por el consumo de alcohol”, afirmó. Según Quiroa, el ejemplo que se les da a los hijos con escenas de violencia y maltrato marca sus vidas, por lo que en el futuro pueden ser agresores o víctimas de esa violencia. María Machicado, representante de Onu Mujeres en Guatemala, señaló que
las estadísticas presentadas por el INE demuestran que es en el hogar donde ocurren más casos de violencia. Machicado refirió que en algunos lugares la violencia intrafamiliar puede considerarse “normal”, por lo que no se denuncia. Según el Ine, unos 18 mil 800 niños son víctimas colaterales. Más quejas La violencia física y psicológica son las formas más denunciadas, y los casos, según los registros, ocurren entre el domingo y lunes, así como en las quincenas de cada mes. Además, las indígenas y amas de casa son quienes más padecen los abusos. "La mayoría de mujeres en Guatemala no tienen acceso a presentar una denuncia porque no conocen sus derechos, no tienen la oportunidad de movilizarse hacia los lugares donde pueden denunciar. Las mujeres mayas siguen siendo víctimas de violencia silenciosa", afirmó Quiroa. El Ine recabó los datos con información del Ministerio Público, la Policía Nacional Civil y el Organismo Judicial y prevé que sea una base para crear políticas que permitan la prevención. Tomado de: http://goo.gl/4P2Zi6
Estadística Descriptiva − Semana 16
219
El mundo de la estadística Esta semana repasaremos varios de los conceptos trabajados a lo largo de este curso. Esto nos permite conocer cómo se aplica la estadística a distintos aspectos de la realidad. Si tiene dudas para resolver los ejercicios de esta semana, le proponemos volver a leer los temas presentados en las semanas anteriores. También puede consultar con sus compañeras y compañeros, el tutor del círculo de estudio y el tutor virtual. ¡Adelante!
1. La violencia intrafamiliar La violencia intrafamiliar es un problema que afecta a muchas mujeres en el país, y en consecuencia, al hogar completo. El artículo. 1 de la Ley para Prevenir, Sancionar y Erradicarla la Violencia Intrafamiliar, Decreto 97-96, establece que: La violencia intrafamiliar, constituye una violación a los Derechos Humanos, […] debe entenderse como cualquier acción u omisión que de manera directa o indirecta causare daño o sufrimiento físico, sexual, psicológico o patrimonial, tanto en el ámbito público como en el privado, a persona integrante del grupo familiar, por parte de parientes o conviviente o exconviviente, cónyuge o excónyuge o con quien se haya procreado hijos o hijas.
El Instituto Nacional de Estadística, Ine, y la oficina del Procurador de los Derechos Humanos llevan registros de las denuncias de violencia intrafamiliar y las ponen a disposición del público para que la sociedad guatemalteca conozca las características de esta problemática. Esta semana haremos varios ejercicios teniendo como tema principal la violencia intrafamiliar.
220
IGER − Tacaná
Autocontrol Actividad 1 Lea la información que se presenta en la siguiente tabla. Tabla 1 Denuncias de violencia intrafamiliar por mes de registro; país, Escuintla y Quetzaltenango. Año 2013 Mes
Total país
Escuintla
Quetzaltenango
Porcentaje país
enero
3049
89
180
8.43 %
febrero
2967
121
150
8.20 %
marzo
2813
106
161
7.78 %
abril
3492
125
164
9.65 %
mayo
3323
109
182
9.19 %
junio
3045
122
187
8.42 %
julio
3317
86
197
9.17 %
agosto
3124
88
196
8.64 %
septiembre
2920
111
204
8.07 %
octubre
2882
122
193
7.97 %
noviembre
2772
98
142
7.66 %
diciembre
2466
101
109
6.82 %
Total
36 170
1278
2065
100 %
Porcentaje Escuintla
Porcentaje Quetzaltenango
Fuente: Ine, 2013
Realice lo solicitado en cada inciso. 1. ¿Cuál es la población?
Estadística Descriptiva − Semana 16
221
2. Utilice los datos totales del país para elaborar un diagrama de líneas, en este espacio.
3. En su cuaderno calcule los porcentajes de cada mes para los departamentos de Escuintla y Quetzaltenango. Luego, trasládelos a la tabla 1. 4. ¿Qué mes presenta mayor porcentaje de denuncias en Quetzaltenango? 5. En el mes de agosto, ¿qué departamento tiene menos denuncias? 6. En su cuaderno calcule el número índice de enero a febrero para todo el país, Escuintla y Quetzaltenango, en forma individual. Analice los resultados y explique las diferencias. 7. ¿En qué mes hay mayor denuncias en el país, Escuintla y Quetzaltenango?
222
IGER − Tacaná
8. ¿Qué mes presenta el menor número de denuncias en todo el país? 9. En este espacio calcule el promedio y la desviación estándar de denuncias mensuales en Escuintla. Escriba los resultados.
Actividad 2 Una encuesta realizada entre mujeres que sufren violencia intrafamiliar en el municipio de Chiantla, Huehuetenango, plantea a las víctimas si han presentado denuncias a la Policía Nacional Civil sobre la violencia que han sufrido. De 567 mujeres encuestadas, 125 mujeres dicen que han presentado denuncias.
¿Qué porcentaje de las víctimas han presentado denuncias?
Estadística Descriptiva − Semana 16
223
Actividad 3 Una encuesta realizada a mujeres del departamento de Zacapa reveló el número de mujeres víctimas de violencia intrafamiliar por municipio. A continuación se le presentan los datos recolectados en 8 municipios del departamento. Lea la tabla y realice los cálculos que le solicitan. Tabla 2 Mujeres víctimas de violencia intrafamiliar por municipio del departamento de Zacapa.
Municipios
Número de víctimas
Zacapa
500
Estanzuela
300
San Diego
250
Usumatlán
354
Teculután
333
Río Hondo
410
Gualán
378
La Unión
234
Fuente: Elaboración propia con base en encuesta.
1. En promedio, ¿cuántas denuncias por violencia intrafamiliar presentan las mujeres de 8 municipios del departamento de Zacapa?
Respuesta:
2. ¿Cuál es la desviación estándar de denuncias por violencia intrafamiliar presentadas en 8 municipios del departamento de Zacapa?
Respuesta:
224
IGER − Tacaná
3. Analice los datos obtenidos en los incisos 1 y 2. Escriba la interpretación de los datos sobre la media y la desviación estándar de las denuncias por violencia intrafamiliar presentadas en 8 municipios del departamento de Zacapa. 4. ¿Cuáles son los municipios cuyas denuncias por violencia intrafamiliar están arriba de la media?
Actividad 4 A continuación se le presentan los datos del Ine sobre la cantidad de denuncias de violencia intrafamiliar durante el año 2013, por mes, en el departamento de Chiquimula. Los datos se muestran en la tabla siguiente. Tabla 3 Denuncias por violencia intrafamiliar presentadas en el departamento de Chiquimula. Año 2013.
Mes
Número de denuncias
Porcentaje
enero
28
6.26 %
febrero
32
7.16 %
marzo
30
6.71 %
abril
47
10.51 %
mayo
38
8.50 %
junio
31
6.93 %
julio
48
10.74 %
agosto
49
10.96 %
septiembre
35
7.83 %
octubre
42
9.40 %
noviembre
42
9.40 %
diciembre
25
5.59 %
Total
447
100 % Fuente: Ine, 2013 Estadística Descriptiva − Semana 16
225
Responda a las preguntas planteadas, realice los cálculos y diagramas que se le solicitan.
1. ¿Cuál es la pregunta de investigación? 2. ¿Cuál es la hipótesis? 3. ¿Cuál es unidad de análisis? 4. ¿Cuál es la variable? 5. ¿Es la variable cualitativa o cuantitativa? 6. ¿Cuál es la población? 7. ¿Cuál es la muestra?
226
IGER − Tacaná
8. ¿El valor obtenido es un estadístico o un parámetro? 9. Realice una gráfica de barras que muestre las denuncias por mes.
10. Realice una gráfica de sectores que muestre las denuncias por mes.
Estadística Descriptiva − Semana 16
227
11. ¿Qué porcentaje de denuncias corresponde al mes de diciembre? 12. ¿Cuál es el mes con mayor porcentaje de denuncias? 13. ¿Cuál es el mes con menor porcentaje de denuncias? 14. ¿Cuál es el promedio de denuncias por mes en Chiquimula? 15. ¿Cuál es la desviación estándar de denuncias por mes en Chiquimula? 16. Compare los datos de violencia intrafamiliar de Chiquimula con los de Escuintla (Actividad 1). Interprete los resultados y escriba sus conclusiones. 17. Calcule el número índice del cambio de número de denuncias entre enero y julio (cambio de semestre). Interprete y escriba el resultado.
228
IGER − Tacaná
Actividad 5 La maestra de la sección A de primer grado de primaria de la Escuela Nacional Tipo Federación "Salomón Carrillo Ramírez", de Jutiapa pregunta a sus alumnos si conocen dónde queda la aldea Pipiltepeque Abajo. La sección fue seleccionada utilizando números aleatorios. Con la información presentada responda las siguientes preguntas. 1. ¿Cuál sería la pregunta de investigación? 2. Escriba una hipótesis. 3. ¿Cuál es la unidad de análisis? 4. ¿Cuál es la variable? 5. ¿Cuáles son las categorías de la variable? 6. ¿Es la variable cualitativa o cuantitativa? 7. ¿En qué nivel de medida está la variable? Estadística Descriptiva − Semana 16
229
8.
¿Cuál es la población?
9.
¿Cuál es la muestra?
10. ¿Cómo se seleccionó la muestra? 11. ¿Qué tipo estadística se utilizó? 12. ¿Es el valor obtenido un estadístico o un parámetro?
Revise su aprendizaje
Después de estudiar...
Marque con un cheque
230
la casilla que mejor indique su rendimiento.
Reflexiono sobre el uso de la estadística en la vida cotidiana. Dimensiono la problemática de la violencia intrafamiliar en Guatemala. Repaso los conceptos básicos de estadística, elaboración de diagramas, cálculo de porcentajes, mediana, desviación estándar y números índice. IGER − Tacaná
logrado
en proceso
no logrado
30 % 15 % 5%
50 %
17 Repaso: semanas 1 a 16 Esta semana logrará: Comprender la utilidad del repaso. Realizar todos los ejercicios. Practicar la aplicación de todas las fórmulas estadísticas. Interpretar los resultados de los datos obtenidos. Dominar los contenidos del curso de Estadística Descriptiva.
Estadística Descriptiva − Semana 17
231
Querida y querido estudiante: Hemos llegado al final del curso de Estadística Descriptiva del grupo Tacaná. Es el momento de prepararse para la prueba final. Para ello, repasaremos los contenidos de las semanas uno a la dieciséis. Tenga en cuenta que esta semana contiene ejercicios completos en los que se desarrollarán todos los conceptos aprendidos durante este curso. Antes de iniciar con estos ejercicios, le recomendamos repasar los contenidos de las semanas anteriores. Al terminar, no olvide evaluar su proceso de aprendizaje con el cuadro final.
Además, le daremos estas sugerencias La prueba evalúa los mismos contenidos y de la misma forma en que los ha trabajado semana a semana. • Elabore su propio resumen de cada semana. Verá como al escribir sus conocimientos le será más fácil recordarlos. • Escuche la clase radial. Sus maestros locutores le acompañarán en este repaso y le ayudarán a resolver algunas actividades. • Anote todo lo que no le quede claro. Acuda a su orientador o a su tutor para resolver sus dudas. También puede consultarnos por correo electrónico. Nuestra dirección es:
[email protected] • Estudie y practique con los ejercicios de esta semana. No olvide anotar las fórmulas en una hoja de papel, así le será más fácil consultarlas. • Lea las orientaciones para la prueba final y acuda al examen con seguridad y confianza.
232
IGER − Tacaná
Ejercicio guiado A continuación se le presenta un ejercicio guiado, siga los pasos uno a uno y resuelva los ejercicios en su cuaderno, de esta manera repasará el contenido de las semanas 1 a la 16. Luego, proceda a responder los ejercicios de repaso 1 y 2. Caso: Un consultor de la Ong "Fundación para el Desarrollo Integral de Guatemala (Fundesi)" realizó una investigación sobre la opinión de los jefes de familia de la aldea Chan Chán en Zacapa, acerca de la necesidad de hacer un puente en lugar de un badén o una zanja, para evitar las correntadas del río en invierno, también preguntó sobre cuánto se podría invertir en la construcción del puente. La investigación arrojó los siguientes datos: 20 de los 35 jefes de familia opinaron que sí es necesaria la construcción del puente. Las respuestas respecto al monto de la inversión que hay que hacer se encuentran en la tabla siguiente. Los datos están en miles de quetzales (647 sería Q647,000.00). 501
591
628
698
700
508
615
640
651
747
500
528
603
664
763
547
539
617
658
779
522
598
647
677
781
541
565
644
710
799
530
571
675
701
742
Pregunta de investigación:
¿Cuál es la opinión de los jefes de familia sobre la necesidad de construir un puente y el presupuesto necesario para construirlo?
Hipótesis:
1. Más del 50% de los jefes de familia opinan que sí hay que hacer el puente. 2. La inversión es mayor que Q600,000.00
Unidad de análisis: Variables:
Jefe(a) de familia 1. Opinión sobre construcción del puente. 2. Monto de la inversión para construir el puente.
Estadística Descriptiva − Semana 17
233
Tipo de variable: Nivel de medida de variable:
1. Opinión sobre construcción del puente es cualitativa. 2. Monto de la inversión para la obra es cuantitativa. 1. Opinión sobre construcción del puente es nominal. 2. Cantidad de inversión para el puente es continua.
Ahora, con los datos de la tabla de la página anterior debemos realizar las actividades siguientes: 1. Representar en una gráfica circular la opinión de los jefes de hogar sobre la construcción del puente. 2. Elaborar una distribución de frecuencias. Para la primera actividad debemos realizar una tabla con los porcentajes y luego elaboramos la gráfica circular: Tabla 1 Opinión de jefes de familia sobre construcción de puente. Aldea Chan Chán, 2014 Opinión sobre construcción de puente
Cantidad
Porcentaje
Sí
20
57 %
No
15
43 %
Total
35
100 %
Gráfica 1 Opinión de jefes de familia sobre construcción de puente. Aldea Chan Chán, 2014
No 43 % Sí 57 %
Fuente: Elaboración propia con datos de encuesta
234
IGER − Tacaná
Para la segnda actividad, se nos pide elaborar una distribución de frecuencias con los montos de inversión:
Intervalos
Frecuencia Frecuencia ( f ) acumulada (F)
Porcentaje
Porcentaje acumulado
500 – 549
9
9
25.71 %
25.71 %
550 – 599
4
13
11.43 %
37.14 %
600 – 649
7
20
20 %
57.14 %
650 – 699
6
26
17.14 %
74.29 %
700 – 749
5
31
14.29 %
88.57 %
750 – 799
4
35
11.43 %
100 %
Total
35
100 %
Luego, calculamos la media aritmética, la mediana, la moda, la desviación estándar, el percentil 75 y el cuartil 1. Media aritmética
633.7
Mediana
640
Moda
No hay
Desviación estándar
86.21
Percentil 75
698
Cuartil 1
547
Interpretación: debemos recordar que los datos están en miles de quetzales. La media del monto de inversión que los comunitarios calculan es necesaria para construir el puente es de aproximadamente Q633,700.00; con este monto queda comprobada la hipótesis que establecía que el monto de la inversión era mayor a Q600,000.00 • El 50 % de los jefes de familia opina que la inversión debe ser de Q640,000.00 o menos. • El 25 % de los jefes de familia opina que la inversión debe ser de Q547,000.00 o menos. • El 75 % de los jefes de familia opina que la inversión debe ser de Q698,000.00 o menos. En promedio, la inversión se separa de los Q633,700.00 en Q86,210.00, lo cual puede ser una variación muy grande.
Estadística Descriptiva − Semana 17
235
¿Cuál es la probabilidad de que, al seleccionar un hogar para pasar la encuesta, el jefe de familia opine que no hay necesidad de construir un puente? Calculamos la probabilidad tomando en cuenta los datos de opinión de los jefes de familia. De un total de 35 jefes de familia, 15 dijeron no estar de acuerdo con la construcción del puente. Probabilidad =
15 ≈ 0.4286 = 42.86 % 35
Ejercicio 1
Lea el caso siguiente y resuelva lo que se solicita. Un investigador desea saber qué frutas prefieren los habitantes de la aldea El Chiltepe, y la cantidad de porciones de fruta que consumen a la semana. Para conocer los datos planea llevar a cabo una encuesta. Si la aldea El Chiltepe tiene 6000 habitantes, ¿qué cantidad de elementos de muestra se necesitan? Retroceda un poco y consulte la fórmula que se encuentra en la semana 2. Reescriba la fórmula:
Realice el cálculo del tamaño de la muestra:
Al aplicar la fórmula se encuentra que el tamaño de la muestra debe ser de 375 personas. Para facilitar el ejercicio, se aplica la encuesta únicamente a 38 personas (10 % de los necesarios) y se obtienen los siguientes datos: •
10 prefieren la piña.
•
15 prefieren el melón.
•
8 prefieren las uvas.
•
El resto prefieren alguna otra fruta.
236
IGER − Tacaná
La cantidad de porciones de fruta que las personas de la muestra consumen a la semana es la siguiente:
1.
19
14
18
19
6
23
26
30
8
27
19
26
30
24
9
15
26
28
4
19
20
21
26
11
21
20
11
27
4
27
4
4
3
10
25
30
30
20
Razone y complete lo siguiente:
Pregunta de investigación:
Hipótesis:
Unidad de análisis:
Variables:
Tipo de variable:
Nivel de medida de variable:
Tipos de estadística que usa:
Estadística Descriptiva − Semana 17
237
2. Con los datos sobre la fruta preferida de los encuestados, elabore una tabla que presente los porcentajes de la información obtenida. (Debe contener todos los elementos correspondientes.)
3. Elabore una gráfica de pastel utilizando los datos de la tabla anterior. Si no le es suficiente el espacio, puede hacerlo en hojas aparte.
4. Ahora, utilizando las respuestas de los encuestados elabore una distribución de frecuencias. Realice los cálculos en su cuaderno y escriba las respuestas en el cuadro que se le proporciona. Intervalos
238
IGER − Tacaná
Frecuencia Frecuencia ( f ) acumulada (F)
Porcentaje
Porcentaje acumulado
5. Luego, calcule la media aritmética, la mediana, la moda, la desviación estándar, el decil 7 y el cuartil 1. Realice los cálculos en su cuaderno y escriba las respuestas en el cuadro que se le proporciona. Media aritmética Mediana Moda Desviación estándar Decil 7 Cuartil 1
6. Escriba la interpretación de los datos anteriores. 7. ¿Cuál es la probabilidad de que al seleccionar una persona, prefiera la piña? 8. ¿Cuál es la probabilidad de que al seleccionar una persona, prefiera las uvas? 9. ¿Cuál es la probabilidad de que al seleccionar una persona, prefiera alguna otra fruta?
Estadística Descriptiva − Semana 17
239
Ejercicio 2
Lea el caso siguiente y realice las actividades que se solicitan. En el primer semestre de 2014, una empresa de agroservicios realizó una encuesta con agricultores para conocer su opinión sobre cuál creen que es el mejor insecticida contra la mosca del Mediterráneo. El número de usuarios del insecticida es de 3500 y calculan una muestra del 10.26 % al aplicar la fórmula. Calcule nuevamente la muestra y compruebe el resultado:
Los datos que se obtienen de la encuesta son los siguientes. Se entrevista a cerca de un 8.5 % de los 359, es decir, se tienen 31 entrevistados: •
15 prefieren Insecticida GF – 1201 NF Naturalyte.
•
10 prefieren Insecticida Intrepid* 24 SC.
•
El resto no utiliza insecticidas.
Las cantidades, en mililitros por galón de agua, recomendadas como dosis por los 31 entrevistados son: 3
43
5
45
22
40
2
22
48
21
48
3
13
45
24
38
13
9
6
26
44
42
3
37
26
40
13
8
15
46
6
1
Datos hipotéticos con fines de estudio.
240
IGER − Tacaná
1. Razone y complete lo siguiente: Pregunta de investigación: Hipótesis: Unidad de análisis: Variables: Tipo de variable: Nivel de medida de variable: Tipos de estadística que usa:
2. Con los datos de la tabla anterior elabore un cuadro que presente la información obtenida. (Debe contener todos los elementos correspondientes).
3. Elabore una gráfica de barras utilizando los datos del cuadro anterior. Si el espacio es corto, puede trabajar en hojas aparte. Recuerde incluir todos los elementos de una gráfica.
Estadística Descriptiva − Semana 17
241
4. Ahora, utilizando las respuestas de los encuestados, elabore una distribución de frecuencias. Realice los cálculos en su cuaderno y escriba las respuestas en el cuadro que se le proporciona.
Intervalos
Frecuencia Frecuencia ( f ) acumulada (F)
Porcentaje
Porcentaje acumulado
5. Luego, calcule la media aritmética, la mediana, la moda, la desviación estándar, el decil 3 y el cuartil 3. Realice los cálculos en su cuaderno y escriba las respuestas en el cuadro que se le proporciona. Media aritmética Mediana Moda Desviación estándar Decil 3 Cuartil 3
6. Escriba la interpretación de los datos anteriores.
242
IGER − Tacaná
7. ¿Cuál es la probabilidad que al seleccionar una persona ésta prefiera Insecticida GF-120* NF Naturalyte?
Ejercicio 3
En el segundo semestre de 2014, se realizó una segunda encuesta sobre insecticidas y se obtuvo que el 25 % de los agricultores ya no usa ningún insecticida. Compare esta información con los datos de la primera encuesta y resuelva lo que se le pide. 1. ¿Ha aumentado o ha disminuido el uso de insecticida y qué % de insecticida se usó con respecto al primer semestre (primera encuesta)? 2. Si en el primer semestre del año 2013, el % de quienes no usaron insecticida fue del 15 %, ¿ha aumentado o disminuido y qué % de insecticida se usó en el segundo semestre 2014 con respecto al año 2013?
Estadística Descriptiva − Semana 17
243
Revise su aprendizaje Marque con un cheque
logrado
la casilla que mejor indique su rendimiento.
en proceso
no logrado
Después de estudiar...
Comprendí la utilidad del repaso. Realicé todos los ejercicios. Practiqué la aplicación de todas las fórmulas estadísticas. Interpreto los resultados de los datos obtenidos. Domino los contenidos del curso de Estadística Descriptiva.
Orientaciones sobre la prueba final ¡Llegó el momento de la prueba! Ya está listo para su prueba final de Estadística Descriptiva. Le presentamos las últimas recomendaciones que pueden ayudarle a la hora del examen.
Grupo: Tacaná Prueba: Final Primera
Al recibir la prueba, y antes de empezar a resolverla, escriba su nombre, número de carné, número de círculo y fecha.
Materia: Estadística Descriptiva A-2014 A – 2016
Nombre: Carné: Círculo Círculo de de estudio estudio Nº: Nº:
TACANÁ
Punteo:
Fecha: Fecha:
i serie 1 puntocada cadarespuesta respuestacorrecta. correcta.Total Total86puntos. puntos. i serie . 2. puntos
Lea atentamente las instrucciones antes de contestar. Si tiene duda, consulte a su orientador(a).
INSTRUCCIONES: el de círculo que corresponde al resultado INSTRUCCIONES: DeRellene la series datos siguientes, calcule la media ycorrecto. la mediana. Estadística las 11, variables 1. 1. 3, En 7, 9, 1, 2, 6, 4, 10, 19, 3 pueden ser de dos tipos.
cualitativas y cuantitativas. Media categorías y análisis. Mediana hipótesis y censo.
No se "atasque" en ningún ejercicio. Empiece por las preguntas que sepa mejor y le quedará más tiempo para pensar en las que tenga dudas. Al finalizar su examen, relea todas sus respuestas y vea si algo se le pasó por alto. Presente su prueba limpia y ordenada. ¡ánimo! El resultado de su examen será el producto de su esfuerzo.
244
IGER − Tacaná
Claves
Estadística CienciasDescriptiva Naturales − Claves
245
Semana 1
Semana 2
¡A trabajar!
Ejercicio 1
Algunos ejemplos pueden ser: Número de habitantes, número de personas que trabajaban en la construcción, pago de impuestos, etc.
Ejercicio 1 En 1994 el X Censo Nacional de Población y V de Habitación. En 2002 el XI Censo Nacional de Población y VI de Habitación.
Ejercicio 2 Las respuestas pueden variar. Se presentan unos ejemplos: Para planificar presupuestos, número de alumnos que se inscribirán en la escuela, estimar variaciones de precios, y otros.
Ejercicio 3 1. Cuestionario a médicos y dirigentes de instituciones clave. 2. El sistema de vigilancia de salud pública.
Ejercicio 4 1. El precio del dólar estadounidense para el día de hoy es de Q7.80 2. Preguntar en los bancos del sistema o a los cambistas. 3. Los periódicos.
Ejercicio 5 1. 2. 3. 4.
Niños Abejas Plantas de café Cafetales
Ejercicio 6 1. 2. 3.
a. Niños b. Saben o no saben leer y escribir a. Vaca b. Producción de leche por día a. Alumno b. Palabras que escribe por minuto
Ejercicio 7 1. Cualitativa 2. Cualitativa y cuantitativa 3. Cualitativa y cuantitativa 4. Cualitativa 5. Cuantitativa
246
IGER − Tacaná Utatlán
3. El estado civil 4. Clasificación por apellidos
Ejercicio 2 3. Estatura si se mide como alto, normal y bajo. 4. Llegada a la meta en una competencia. 5. Clasificación del servicio de un hotel (excelente, bueno, regular, malo).
Ejercicio 3 Las respuestas pueden variar. Unos ejemplos son: Todos los maestros y maestras de la comunidad, los panales de la comunidad, los hogares del municipio.
Ejercicio 4 Las respuestas pueden variar. Unos ejemplos son: 1. Población: todos los maestros y maestras de la comunidad. Muestra: maestros y maestras de la escuela. 2. Población: todos los panales de la comunidad. Muestra: panales de un propietario. 3. Población: todos los hogares del municipio. Muestra: hogares de una aldea.
Semana 3 ¡A trabajar! Las respuestas pueden variar. Algunos ejemplos pueden ser: 1. Una sensación de paz y armonía. 2. Episodios de tristeza, las actividades que me producen felicidad, etc. 3. Grupo de adultos de una comunidad, jóvenes, niños, etc. 4. Una familia feliz.
Ejercicio 1 1. Determinar el número de elementos de la muestra utilizando la fórmula. 2. En este caso se tienen 7 caseríos, por lo tanto tiene 7 conglomerados. 3. Por conglomerados y aleatoria sistemática. Porque resultaria complicado realizar una muestra en cada caserío.
Semana 4
Semana 5
¡A trabajar!
¡A trabajar!
A. 1. La composición de la población en Guatemala. 2. No, porque los porcentajes dan cifras globales respecto a un solo número. B. No se puede saber, se necesita conocer primero el precio total, luego calcular el porcentaje y restarlo del precio total.
Las respuestas variarán de acuerdo a la opinión de cada estudiante. Le presentamos los ejemplos siguientes: 1. Las redes sociales permiten a los jóvenes una forma de comunicación a bajo precio sin importar las distancias. 2. Los varones trabajan y tienen dinero personal para gastar en un celular. 3. La población no indígena tiene mayores ingresos para adquirir un celular. 4. Las compañías telefónicas podrían implementar planes de telefonía celular especiales para mujeres y personas indígenas.
Ejercicio 1 72/100 o 72 100
Ejercicio 2
1. % = 110 = 0.4 • 100 = 40 % 275 2. % = 150 • 100 = 0.075 • 100 = 7.5 % 2000
Ejercicio 3 1. Mujer: 53 % Hombre: 47 % 2. Rural: 67.3 % Urbana: 32.7 %
Ejercicio 1 1. Columna 2. Título 3. Título de columna 4. Fila 5. Fuente
Ejercicio 2 1. Estudiantes 2. Variable
Categorías
Carrera
bachillerato, magisterio, perito, secretariado y técnico.
Pruebas de evaluación
Lectura y Matemática.
Año de las pruebas
2005 a 2012
Desempeño
Logro, no logro.
Ejercicio 3 A. • Casado o unido • Rural B.
Tabla 2 Población ocupada por grupo de edad y área. Guatemala 201 Grupo de edad
Urbana
Porcentaje
Rural
Porcentaje
15 a 24 años
710 336
23.12 %
829 390
30.28 %
25 años y más
2 362 131
76.88 %
1 909 306
69.72 %
Total
3 072 467
100 %
2 738 696
100 % Fuente: Ine
Estadística CienciasDescriptiva Naturales − Claves
247
Semana 6
Semana 7
¡A trabajar!
Lectura
y
Respuestas distintas. Le damos algunos ejemplos: Salarios, ingresos, producción, etc.
10 (5, 8)
8 (– 6, 6)
Ejercicio 1
6 4 2
–14 –12 –10 –8 –6 –4 –2 –2 (–5, –3) –4
2
4
6 8 10 12 14
x
–6 –8 –10
Ejercicio 1
Gráfica 2 Porcentaje de mujeres ocupadas por área. Guatemala, 2013.
60.0 % 50.0 %
51.3 %
40.0 % 30.0 % 18.8 %
0.0 %
Ejercicio 2 18.00 %
Resto urbano
Rural nacional Fuente: Inei 2 – 2013
Gráfica 3 Cambio porcentual de precios al consumidor. Guatemala, mar – 2013 a mar – 2014
16.00 % 14.00 % 12.00 % 10.00 % 6.00 % 4.00 %
Las disposiciones sobre la investigación variarán de acuerdo a cada estudiante. Le damos los ejemplos siguientes: 1. ¿Qué nivel educativo tienen las personas ocupadas en Guatemala? 2. La mayor parte de las personas ocupadas en Guatemala solamente tienen estudios del nivel primario. 3. Residentes de Guatemala que están ocupados o empleados. 4. Nivel educativo 5. Cualitativa 6. Ordinal, ya que lleva un orden ascendente (primaria, secundaria, universidad, etc). 7. Tabla 1 Escolaridad de personas ocupadas en Guatemala.
2.00 % 0.00 %
¡A trabajar!
Ejercicio 1
10.0 %
Urbano metropolitano
Semana 8 Las respuestas variarán de acuerdo al reportaje encontrado por cada estudiante. Revise que las respuestas concuerden con los datos estadísticos presentados.
29.9 %
20.0 %
1. Rango de valores. 2. Valor inferior del intervalo. 3. Valor superior del intervalo. 4. Tamaño del intervalo. 5. Distancia entre el valor mayor y el valor menor del conjunto de datos.
Porcentaje
Ninguno
Personas ocupadas 1 163 518
17.57 %
Porcentaje acumulado 17.57 %
Primaria incompleta
1 319 151
19.92 %
37.50 %
Primaria completa
1 010 221
15.26 %
52.75 %
883 664
13.35 %
66.10 %
Secundaria completa
1 001 712
15.13 %
81.23 %
Superior incompleta
1 078 451
16.29 %
97.52 %
164 364
2.48 %
100 %
6 621 081
100 %
Nivel de escolaridad ene – 13
mar – 13 may – 13 jun – 13 ago – 13 oct – 13
nov – 13 ene – 14 mar – 14 abr – 14
Fuente: Inei 2 – 2013
Ejercicio 3
Gráfica 4 Porcentaje de población ocupada por etnia. Guatemala, 2013
Secundaria incompleta
Superior completa Total No indígena 58.62 %
Indígena 41.38 %
Fuente: Inei 2 – 2013
248
IGER − Tacaná Utatlán
Fuente: Ine
Ejercicio 2 Las disposiciones sobre la investigación variarán de acuerdo a cada estudiante. Le damos los ejemplos siguientes: 1. ¿Cuántas horas a la semana trabaja una persona ocupada en Guatemala?
Semana 10 2. Una persona ocupada en Guatemala trabaja 40 horas a la semana en promedio. 3. Residentes de Guatemala que están empleados. 4. Horas trabajadas por semana. 5. Cuantitativa 6. Nominal Tabla 2 Horas laboradas por semana de personas ocupadas en Guatemala. Horas laboradas
Porcentaje
Porcentaje acumulado
0 a 20
10.30 %
10.30 %
21 a 40
35.60 %
45.90 %
41 a 48
30.10 %
76.00 %
48 en adelante
24.00 %
100 %
Total
100 %
Fuente: Ine
Ejercicio 3
¡A trabajar! 1. 8 2. 22
Ejercicio 1
1. 50 casas 2. 29.2 ventas esta semana
Semana 11 ¡A trabajar! Q144.49
Respuestas distintas de acuerdo al artículo o reportaje usado por el estudiante. Revise que las respuestas concuerden con la información estadística.
Ejercicio 1
Semana 9
Ejercicio 2
2 1. 29 oC 2. 22 oC 3. 7 oC
¡A trabajar! 1. 10 2. 126
Lectura Las respuestas son personales y pueden variar. Ejemplo: Menos productos: maíz, frijol, sal, azúcar, aceite, arroz, tomate, cebolla, café, pan, papas (11 productos).
Ejercicio 1 1. 45 2. 25 3. Como no hay un orden único, habrá una columna de frecuencia acumulada para cada orden.
Ejercicio 2 Clase o intervalo
Frecuencia ( f )
0–9 10 – 19 20 – 29 30 – 39 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99 Total
10 15 16 12 18 16 15 10 9 5 126
Frecuencia relativa 0.0794 0.1190 0.1270 0.0952 0.1429 0.1270 0.1190 0.0794 0.0714 0.0397 1.0000 Estadística CienciasDescriptiva Naturales − Claves
249
Semana 12 Ejercicio 1
Ejercicio 2
Pregunta de investigación:
¿Cuántos nacimientos ocurren en cada departamento de Guatemala? Como es una investigación de estadística descriptiva no necesita hipótesis
Hipótesis:
Unidad de análisis: Departamento Variables:
Nacimientos por departamento
Tipo de variable:
Cuantitativa
Nivel de medida de variable:
Nominal
Población
¿Cuál es el nivel educativo de las mujeres migrantes de 15 a 24 años de edad?
Hipótesis:
La mayoría de mujeres migrantes solo ha estudiado la primaria
Unidad de análisis:
La mayoría de mujeres migrantes solo ha estudiado la primaria
Variables:
La república de Guatemala No hay muestra porque se tomó la totalidad de nacimientos por departamento
Muestra
Pregunta de investigación:
Nivel educativo
Tipo de variable:
Cualitativa porque estudia el nivel educativo
Nivel de medida de variable:
Nominal
Tipo de estadística que usa:
Descriptiva
Forma de seleccón Por conglomerados o racimos de la muestra Parámetro porque representa una característica de la población
Tipo de datos Tipo de estadística que usa:
Gráfica Escolaridad de mujeres migrantres de 15 a 24 años de edad.
Descriptiva
Ignorado 2%
Gráfica Nacimientos por departamento, 2013. 70 000
Diversificado 36 %
60 000
Primaria 36 %
50 000 40 000 30 000
Universitario 1%
20 000
Básico 24 %
Ninguno 1%
17 612 12 038
Moda
No hay
Jalapa
Jutiapa
Zacapa
Chiquimula
Petén
Izabal
Alta Verapaz
Quiché
Media Mediana
Baja Verapaz
Huhuetenango
Retalhuleu
San Marcos
Suchitepéquez
Quetzaltenango
Sololá
Totonicapán
Escuintla
Santa Rosa
Sacatepéquez
Chimaltenango
Guatemala
0
El Progreso
10 000
Interpretación Las respuestas pueden variar. Un ejemplo es: En promedio hay 17 612 nacimientos por departamento, el dato que se encuentra a la mitad es 12 038 y no hay al menos dos departamentos con igual número de nacimientos.
250
IGER − Tacaná Utatlán
Media
16.67 %
Mediana
30.1 %
Moda
1.10 %
Interpretación Las respuestas pueden variar. Un ejemplo es: Hay una media de 16.67 % de mujeres migrantes entre 15 y 24 años y que el mayor porcentaje de mujeres migrantes solo ha cursado el nivel primario.
Semana 13
Semana 14
Ejercicio 1
¡A trabajar!
La redacción variará, la idea principal debe mantenerse: Este dato significa que el 30 % de los niños son más pequeños que José. Por lo tanto el 70 % de los niños son más altos que José.
1. 20 % 2. 54.44 %
Lectura
Ejercicio 2
1. Estados Unidos 2. La diferencia es de US$ 25.33
1. P36 = 5 P18 = 5
Ejercicio 1
2. P50 = 18 P25 = 12
Ejercicio 3 D3 = 15 D8 = 25
Ejercicio 4 Q2 = 18 Indica que el 50 % de los datos son menores a 18.
1. Tomate: 3 6 = 0.5 = 50. El tomate bajó 50 %. 6 = 1.5 = 150. El maíz subió 50 %. Maíz: 4 Frijol: 3 = 0.5 = 50. El frijol bajó 50 %. 6 6 Fresa: = 2 = 200. La fresa subió 100 %. 3 Elote: 4 = 1.33 = 133. El elote subió 33 %. 3 2. Suma del producto antes de invierno: Q22.00 Suma de producto después del invierno: Q22.00 Interpretación: Los productos en su conjunto no han variado desde antes del invierno a después del invierno. Esto se debe a que unos subieron y otros bajaron.
Ejercicio 2
1. 55 = 1.66, es decir, 166.67 %. 33 La sección B tiene la mayor cantidad de alumnos inscritos (55), y la sección C tiene la menor cantidad (33). La sección B tiene un 66.67 % más de alumnos que la sección C. 2. 215 = 1.0047, es decir, 100.47 %. 214 La cantidad de alumnos que asistieron al inicio fue un 0.47 % mayor que los que se inscribieron. 3. 211 = 0.9860, es decir, 98.60 %. 214 La cantidad de alumnos que asistieron hasta el final del año es un 1.40 % menor respecto a los inscritos. 4. 211 = 0.9814, es decir, 98.14 %. 215 La cantidad de estudiantes que asistieron hasta finalizar el año es un 1.86 % menor respecto a los que asistieron en el inicio.
Estadística CienciasDescriptiva Naturales − Claves
251
Semana 15
Semana 17
Ejercicio 1
Ejercicio 1
1. 0.57, es decir, 57 %. 2. 0.43, es decir, 43 %.
n=
Ejercicio 2
Según la fórmula, la muestra debería ser de 375 datos.
1. 5 = 0.0333, es decir, 3.33 %. 150
0.25 • 6000 0.25 • N = = 375 0.000625 • N + 0.25 0.000625 • 6000 + 0.25
La probabilidad de seleccionar un pantalón con defecto es de 3.33 %.
Pregunta de inves- ¿Cuál es la fruta que prefieren los tigación: habitantes de la aldea El Chiltepe? Los habitantes de El Chiltepe prefieren la Hipótesis: piña.
2. 15 = 0.1, es decir, 10 %. 150
Unidad de análisis: Habitante
La probabilidad de seleccionar un pantalón con defecto es de 10 %.
Ejercicio 3 Las respuestas pueden variar. Le damos algunos ejemplos: Probabilidad de ganarse el premio de la rifa, probabilidad de que no suceda una inundación, probabilidad de heredar una enfermedad.
Semana 16
1. Porciones de fruta consumidas por semana. 2. Fruta que prefieren los habitantes. 1. Cuantitativa Tipo de variable: 2. Cualitativa Nivel de medida de 1. Discreta variable: 2. Nominal Tipo de estadística Descriptiva que usa: Variables:
Tabla 1 Fruta preferida, aldea El Chiltepe. Guatemala, 2014. Fruta preferida Habitantes Porcentaje Piña Melón Uvas Otra fruta Total
¡A trabajar!
La respuesta puede variar. Le presentamos algunos ejemplos: Conocer el promedio de producción de determinado producto, establecer el rendimiento promedio y la desviación estándar de cada trabajador.
10 15 8 5 38
26.32 % 39.47 % 21.05 % 13.16 % 100 % Fuente: Datos hipotéticos
Gráfica 1 Porcentaje de la preferencia de frutas. Aldea El Chiltepe, 2014.
Otra fruta 13.16 %
Piña 26.32 %
Uvas 21.05 % Melón 39.47 %
252
IGER − Tacaná Utatlán
Intervalos
frecuencia
0–5 6 – 10 11 – 15 16 – 20 21 – 25 26 – 30 Total
5 4 4 8 5 12 38
frecuencia porcentaje porcentaje acumulada acumulado 5 13.16 % 13.16 % 9 10.53 % 23.68 % 13 10.53 % 34.21 % 21 21.05 % 55.26 % 26 13.16 % 68.42 % 38 31.58 % 100 % 100 %
Media
18.53
Mediana
20
Moda
4, 19, 26, 30
Desviación estándar
8.74
Decil 7
26
Cuartil 1
10
Cuadro 1 Insecticida preferido por agricultores para combatir la mosca del Mediterráneo. Guatemala, 2014.
Cada habitante de la aldea El Chiltepe consume, en promedio, 18.53 porciones de fruta a la semana. El 50 % de los habitantes de la aldea come menos de 20 porciones a la semana. La cantidad de porciones consumidas se separa de la media en 8.74, en promedio. El 70 % de los habitantes consumen menos de 26 porciones a la semana y el 25 % consume menos de 10 porciones en el mismo periodo. 10 = 0.2632 • 100 = 26.32 % 38 La probabilidad de que prefiera la piña es del 26.32 %.
Insecticida preferido
Cantidad
GF – 120 NF
15
Intrepid* 24 SC
10
No utiliza
6
Total
31 Fuente: Datos hipotéticos
Gráfica 2 Insecticida preferido para la Mosca del Mediterráneo. Guatemala, 2014. 16 14 12 10 8 6
8 = 0.2105 • 100 = 21.05 % 38 La probabilidad de que prefiera las uvas es del 21.05 %.
4 2 0
Ejercicio 2 n=
0.25 • 3500 0.25 • N = = 358.97 0.000625 • N + 0.25 0.000625 • 3500 + 0.25
No utiliza
Intrepid* 24 SC
GF – 120 NF
5 = 0.1316 • 100 = 13.16 % 38 La probabilidad de que prefiera alguna otra fruta es del 13.16 %.
Intervalos
frecuencia
0–9 10 – 19 20 – 29 30 – 39 40 – 49 Total
9 4 6 2 10 31
frecuencia porcentaje porcentaje acumulada acumulado 9 29.03 % 29.03 % 13 12.90 % 41.94 % 19 19.35 % 61.29 % 21 6.45 % 67.74 % 31 32.26 % 100 % 100 %
Según la fórmula, la muestra debería ser de 359 datos. ¿Cuál es el mejor insecticida contra Pregunta de invesla mosca del Mediterráneo según los tigación: agricultores? El mejor insecticida contra la mosca del Hipótesis: Mediterráneo es Intrepid* 24 SC Unidad de análisis: Agricultor Variables: Tipo de variable:
1. Insecticida preferido 2. Dosis recomendada de insecticida por galón de agua. 1. Cualitativa 2. Cuantitativa 1. Nominal 2. Continua
Nivel de medida de variable: Tipo de estadística Descriptiva que usa:
Media
24.39
Mediana
22
Moda
3
Desviación estándar
16.57
Decil 7
40
Cuartil 1
8
Los agricultores aconsejan, en promedio, 24.39 mililitros de insecticida por cada galón de agua, esta sería la dosis recomendada. El 50 % de los agricultores aconseja un mínimo de 22 mililitros de insecticida por galón de agua. La dosis que más se repitió fue de 3 mililitros por galón. Estadística CienciasDescriptiva Naturales − Claves
253
En promedio, la diferencia de aplicación de insecticida entre agricultores es de 16.57 mililitros por galón de agua. El 70 % recomienda utilizar menos de 40 mililitros de insecticida; el 25 % recomienda emplear menos de 8 mililitros. 15 = 0.4839 • 100 = 48.39 % 31 La probabilidad de que un agricultor escogido al azar prefiera utilizar insecticida GF – 120 NF
Ejercicio 3
1. Primer semestre de 2014, 6 = 0.1935 • 100 = 19.35 % 31 En el primer semestre, un 19.35 % de agricultores no utilizaban insecticida, en tanto que en el segundo semestre, un 25 % de campesinos no emplearon insecticidas. Esto muestra una disminución del 5.65 % en el uso de venenos. 2. Si en el primer semestre de 2013, un 15 % de campesinos no utilizaban insecticidas y en el segundo semestre del 2014 un 25 % de agricultores no los usaba, esto muestra una caída del 10 % en el uso de estas sustancias.
254
IGER − Tacaná Utatlán
Bibliografía ANDERSON, R., D. Sweeney y T. Williams. Estadística para administración y economía. Cengage Learning, editores. 10ª. edición. México, 2008. Centro de Investigaciones Económicas Nacionales. Informe de Progeso Educativo Guatemala. CIEN, Guatemala, 2002. Fenelon, N. y D. Patrick, “Evaluación del sistema de vigilancia epidemiológica de la tuberculosis pulmonar, Provincia Noroeste Haití, diciembre 2011” en Revista de la Universidad del Valle, 26, 2013: 69-73. IGER. Estadística. Primer semestre. Grupo Tacaná. IGER. Guatemala, 2012. Instituto Nacional de Estadística. Índice de precios al consumidor –IPC- y costo de la Canasta Básica Alimentaria y Vital. Julio 2014, Base diciembre 2010. INE, Guatemala, agosto 2014. LEVIN, RUBIN, BALDERAS DEL VALLE, GÓMEZ. Estadística para administración y economía. 8ª. edición. Pearson Prentice-Hall. México, 2008. RAYMUNDO, L. Canasta básica en Guatemala. Diagnóstico, tendencias, monitoreo. CEIBA. Guatemala, 2012.
Páginas web consultadas Acosta, D. “¿Cómo se hace una encuesta?” En http://materialdecomunicacion.blogspot.com/2008/06/ cmo-se-hace-una-encuesta.html. Consultado el 05/04/014 CELADE. División de Población de la CEPAL. Fondo Indígena. Sistema de Indicadores Sociodemográficos de Poblaciones y Pueblos Indígenas. http://celade.cepal.org/redatam/PRYESP/SISPPI/Webhelp/censos. htm. Consultado el 05/04/2014. Instituto de Sismología, Vulcanología, Meteorología e Hidrología. www.insivumeh.gob.gt Empresarios por la Educación. www.empresariosporlaeducacion.org/es/estadisticas.php Ministerio de Educación. www.mineduc.gob.gt Wikipedia, La enciclopedia libre. “Percentil de talla y peso” en http://es.wikipedia.org/wiki/Percentil_de_ talla_y_peso. Consultado el 29/05/2014.
Estadística Descriptiva − Bibliografía
255
Distribución de logros de aprendizaje Estos son los contenidos y los logros que se evaluarán en la prueba parcial y en la final del curso de Estadística Descriptiva. Esté pendiente del calendario de evaluación.
FECHA
CONTENIDOS Y LOGROS
PÁGINAS
Semana 1
¿Qué es la estadística? • Conocer el origen y el uso de la estadística. • Evaluar las fuentes de información. • Plantear preguntas de investigación e hipótesis. • Clasificar las variables.
13 – 30
Semana 2
Conceptos básicos de estadística • Clasificar las variables cualitativas y cuantitativas. • Determinar la población o universo de una investigación. • Seleccionar una muestra.
31 – 46
Semana 3
¿Cómo seleccionar una muestra? • Conocer los pasos para realizar una encuesta. • Aplicar el uso de muestreo por conglomerados. • Aplicar el uso de muestreo estratificado. • Diferenciar entre estadística descriptiva y estadística inferencial. • Reconocer si un dato es un estadístico o un parámetro.
47 – 60
Semana 4
Tablas estadísticas • Calcular porcentajes utilizando la fracción y el símbolo %. • Utilizar los elementos de una tabla estadística. • Analizar la información presentada en forma de porcentajes en una tabla estadística.
61 – 74
Semana 5
Cálculo de porcentajes en tablas • Analizar datos de porcentajes presentados en tablas. • Calcular porcentajes con datos de una tabla. • Elaborar tablas con porcentajes.
75 – 86
Semana 6
Gráficas estadísticas • Localizar puntos en un sistema de coordenadas cartesianas. • Utilizar la información de tablas para construir diagramas de barras, de líneas y circulares. • Calcular grados para elaborar un diagrama circular. • Valorar el uso de gráficas para presentar datos estadísticos.
87 – 100
256
IGER − Tacaná Utatlán
FECHA
CONTENIDOS Y LOGROS
PÁGINAS
Semana 7
Distribución de frecuencias ( I ) • Diferenciar los tipos de tablas según los datos que presentan. • Elaborar tablas con datos cuantitativos. • Construir una distribución de frecuencias.
101 – 112
Semana 8
Repaso semanas 1 a 5 • Repasar los contenidos de las semanas 1 a 5. • Resolver los ejercicios del repaso para evaluarse en la prueba parcial. • Prepararse bien para la prueba de evaluacion.
113 – 124
PRIMERA PRUEBA PARCIAL (50 puntos) Se evalúa de la semana 1 a la 8.
Semana 9
Distribución de frecuencias (II) • Conocer los elementos de un cuadro para variable cuantitativa. • Identificar los productos que conforman la Canasta Básica Alimentaria. • Calcular e interpretar la frecuencia acumulada, la frecuencia relativa y los porcentajes acumulados en una tabla estadística.
125 – 138
Semana 10
Medidas de tendencia central • Reconocer la jerarquía de las operaciones matemáticas. • Calcular la media aritmética, la mediana y la moda. • Interpretar la aplicación de la media aritmética, la mediana y la moda en situaciones de la vida real.
139 – 154
Semana 11
Medidas de dispersión o variabilidad • Diferenciar entre exactitud y precisión. • Calcular rango, la desviación media y la desviación estándar. • Valorar el uso de la media y la desviación estándar para la toma de decisiones.
155 – 166
Semana 12
Repaso: semanas 6 a 11 • Repasar los contenidos de las semanas 6 a 11. • Resolver los ejercicios del repaso para evaluarse en la primera prueba parcial. • Prepararse bien para la prueba de evaluación.
167 – 176
Medidas de posición • Calcular la mediana. • Conocer el uso de percentiles de talla y peso para estimar el estado nutricional de las niñas. • Calcular e interpretar percentiles, deciles y cuartiles
177 – 190
Semana 13
Estadística Descriptiva − Distribución de logros de aprendizaje
257
FECHA
CONTENIDOS Y LOGROS
PÁGINAS
Semana 14
Números índice • Calcular proporciones y porcentajes. • Calcular e interpretar los números índice de precios y de cantidad.
191 – 202
Semana 15
Probabilidades • Reconocer el uso de las probabilidades en la vida diaria. • Calcular probabilidades a priori, empíricas y subjetivas. • Calcular probabilidades simples y compuestas.
203 – 216
Semana 16
Prácticas de estadística • Reflexionar sobre el uso de la estadística e la vida cotidiana. • Dimensionar la problemática de la violencia intrafamiliar en Guatemala. • Repasar los conceptos básicos de estadística, elaboración de diagramas, cálculo de porcentaje, mediana, desviación estándar y números índice.
217 – 230
Semana 17
Repaso: semanas 1 a 16 • Comprender la utilidad del repaso. • Realizar todos los ejercicios. • Practicar la aplicación de todas las fórmulas estadísticas. • Interpretar los resultados de los datos obtenidos. • Dominar los contenidos del curso de Estadística Descriptiva.
231 – 244
EVALUACIÓN FINAL (50 puntos) Se evalúa de la semana 9 a la 17.
258
IGER − Tacaná Utatlán