Estadística para Comunicadores
Short Description
Descripción: Cuaderno de Trabajo...
Description
Estadística para Comunicadores
PREGRADO
AUTOR
:
Silvia Gutiérrez Flores
TÍTULO
:
Material de enseñanza
FECHA
:
Agosto 2016
CURSO
:
Estadística para comunicadores
CODIGO
:
MA470
ÁREA
:
Ciencias
CICLO
:
2016- 02
Estadística para Comunicadores
Estadística para Comunicadores
3
Contenido
Unidad 1. Estadística Descriptiva ................................................................................. 6 La Estadística y su clasificación ........................................................................................................ 6 Conceptos básicos............................................................................................................................. 7 Técnicas de recolección de datos ..................................................................................................... 11 Registro administrativo (RRAA) ................................................................................................... 11 Variable .......................................................................................................................................... 14 Escalas de medición ........................................................................................................................ 18 Parámetro y estadístico ................................................................................................................... 25 Presentación tabular y gráfica de variables ...................................................................................... 33 Variable cualitativa ....................................................................................................................... 34 Variable cuantitativa discreta ........................................................................................................ 35 Variable cuantitativa continua ....................................................................................................... 36 Medidas de Tendencia Central ........................................................................................................ 38 Media ........................................................................................................................................... 39 Mediana ....................................................................................................................................... 41 Moda ............................................................................................................................................ 44 Forma de la distribución de los datos .............................................................................................. 47 Medidas de posición: Cuantiles ....................................................................................................... 49 Medidas de variabilidad o dispersión .............................................................................................. 53 Varianza ....................................................................................................................................... 53 Desviación estándar ...................................................................................................................... 54 Coeficiente de variación ............................................................................................................... 56 Rango ........................................................................................................................................... 58 Rango intercuartil (RIC) ............................................................................................................... 58 Tabulaciones cruzadas .................................................................................................................... 64 Gráfico de barras comparativas ..................................................................................................... 67 Gráfico de barras apiladas ............................................................................................................. 70 Gráfico de barras apiladas al 100% ............................................................................................... 71
Unidad 2. Muestreo ..................................................................................................... 78 Censo ............................................................................................................................................. 79 Muestreo ........................................................................................................................................ 79 Muestreo probabilístico .................................................................................................................. 81 Muestreo aleatorio simple ............................................................................................................. 81 Muestreo estratificado................................................................................................................... 89 Muestreo sistemático .................................................................................................................. 101
Unidad 3. Probabilidad y variable aleatoria .............................................................115 Experimento no aleatorio o determinístico .................................................................................... 115 Probabilidad ............................................................................................................................... 116
Estadística para Comunicadores
4
Eventos mutuamente excluyentes ................................................................................................ 116 Axiomas de la probabilidad ........................................................................................................ 117 Definición clásica de probabilidad .............................................................................................. 117 Probabilidad condicional ................................................................... ¡Error! Marcador no definido. Variable aleatoria .......................................................................................................................... 125 Variable aleatoria continua: Distribución normal......................................................................... 126
Unidad 4. Inferencia Estadística................................................................................140 Nivel de confianza ........................................................................................................................ 140 Margen de error ............................................................................................................................ 140 Estimación por intervalo ............................................................................................................... 141 Distribución t-Student ................................................................................................................. 143 Intervalo de confianza para la media poblacional ..................................................................... 144 Tamaño de muestra para estimar la media de una población ........................................................ 150 Intervalo de confianza para la proporción poblacional ................................................................. 155 Tamaño de muestra para estimar una proporción poblacional ...................................................... 160 Prueba de Hipótesis ...................................................................................................................... 167 Tipos de errores .......................................................................................................................... 167 Pasos a seguir en una Prueba de Hipótesis ..................................................................................... 168 Prueba de hipótesis para la media poblacional .......................................................................... 168 Prueba de hipótesis para una proporción poblacional ................................................................... 175 Prueba de hipótesis para dos varianzas poblacionales .................................................................. 186 Prueba de hipótesis para la diferencia de medias poblacionales ................................................... 193 Prueba de hipótesis para dos medias poblacionales: Muestras dependientes ................................ 199 Prueba de hipótesis para dos proporciones poblacionales ............................................................ 209
Unidad 5. Regresión Lineal y Correlación ................................................................223 Análisis de Regresión lineal simple y de Correlación .................................................................... 223 El diagrama de dispersión ........................................................................................................... 224 La ecuación de la recta estimada ................................................................................................. 225 El método de mínimos cuadrados. ............................................................................................... 226 Validando el modelo ................................................................................................................... 232 Supuestos de la Regresión Lineal ................................................................................................ 232 Coeficiente de determinación y de no determinación .................................................................... 233 Coeficiente de correlación ............................................................................................................. 234
Estadística para Comunicadores
Unidad 1 Conceptos básicos Medidas descriptivas Tablas de contingencia
LOGRO: Al término de la Unidad 1, el estudiante aplica las estadísticas descriptivas participando activamente en la solución de problemas.
Temas de la unidad:
Definición de población, muestra, unidad elemental Dato y observación. Variables, tipos y escalas de medición. Parámetros y estadísticos. Medidas de tendencia central y concepto de asimetría. Medidas de posición y medidas de dispersión. Tablas de doble entrada y gráficos comparativos.
5
Estadística para Comunicadores
Unidad 1. Estadística Descriptiva La Estadística y su clasificación
Estadística Es una ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, organizar, presentar y analizar datos. La finalidad y utilidad es describir, numérica o gráficamente, al conjunto de datos, así como también realizar inferencias entendidas como generalizaciones de lo medido, de manera que se puedan obtener conclusiones adecuadas. Es una herramienta útil para la toma de decisiones.
• Son métodos y técnicas de recolección, caracterización, resumen y presentación que permite describir las características de un conjunto de datos. • Comprende el uso de gráficos, tablas e indicadores para el análisis. • Existen diversos tipos de gráficos adecuados a los tipos de variables que se desean representar.
• Son métodos y técnicas que hacen posible estimar una o más características de una población o tomar decisiones referentes a la población basados en el resultado de muestras seleccionadas al azar. • Estas conclusiones no tienen que ser totalmente válidas, pueden tener cierto margen de error, por eso se dan con una medida de confiabilidad o probabilidad.
Estadística Descriptiva
Estadística Inferencial
6
Estadística para Comunicadores
7
Conceptos básicos Población •Es el conjunto de todos los elementos de interés en un determinado estudio. •Pueden ser personas, animales, objetos, conceptos, entre otros. de los cuales sacamos conclusiones a partir de una o más características observables de naturaleza cualitativa o cuantitativa. •Suele llamarse población objetivo porque se selecciona en función al objetivo de estudio.
Muestra •Es una parte representativa de la población que se selecciona adecuadamente para su análisis y así obtener información acerca de la población de la que proviene. •En estadística se suele trabajar con muestras representativas, es decir, que son elegidas de forma aleatoria.
Unidad elemental •Es el objeto sobre el cual se hace el conjunto de mediciones •También se le denomina unidad de análisis, unidad estadística, caso o elemento. •En estudios longitudinales, de series de tiempo, la unidad elemental es la unidad de tiempo. Por ejemplo, un día, un mes, un año, etc.
Dato •Es la respuesta o el resultado de medir una característica de una unidad elemental.
Observación •Es el conjunto de datos de una unidad elemental •En una base de datos, una observación es el registro completo de cada unidad elemental.
8
Estadística para Comunicadores
Ejemplo El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación se presenta parte de la base de datos:
N° Edad
Género
País de procedencia
Precio dispuesto Número de a pagar por acompañantes habitación por viaje (en dólares)
Criterio de selección del hotel
1 2
25 35
Masculino Femenino
Inglaterra Argentina
80 60
0 2
Limpieza del dormitorio Precio
3
45
Masculino
Francia
115
3
Buena calidad de las toallas y sábanas
4 5 6
65 72 28
Masculino Femenino Masculino
Francia Francia Estados Unidos
45 55 65
0 1 2
Precio Amigable y cordial staff de empleados Precio
7
45
Femenino
Estados Unidos
60
1
Precio
8 9 10
85 25 35
Masculino Masculino Femenino
China Inglaterra Francia
70 65 45
2 3 1
Precio Limpieza del dormitorio Precio
115
20
Masculino
Estados Unidos
55
2
Amigable y cordial staff de empleados
a. Determine la población, la muestra y la unidad elemental.
Población
Todos los huéspedes extranjeros que se hospedaron en el hotel la Posada entre enero y mayo del presente año.
Muestra
115 huéspedes extranjeros que se hospedaron en el hotel la Posada entre enero y mayo del presente año.
Elemento
Un huésped extranjero que se hospedó en el hotel la Posada entre enero y mayo del presente año.
b. De la base de datos, proporcione un ejemplo de dato y uno de observación. Dato
65 años
Observación
65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio.
Estadística para Comunicadores
9
Ejercicios 1. El diario nacional “Al Día” tiene 360 empleados, de los cuales el 36% son mujeres y el 44,2% son solteros. En un estudio realizado a 105 empleados elegidos al azar se encontró que la edad promedio en el grupo era de 31,2 años, el 27,3% estudió en provincias, 66 de estos trabajadores tienen a lo más 5 hijos y que 13 de ellos ganan más de 1650 soles mensuales. Identifique según el enunciado: población, muestra y unidad elemental.
Población
Muestra
Unidad elemental
2. Se quiere estimar el porcentaje de universitarios limeños que trabajan. Determine la población, la muestra y la unidad elemental.
Población
Muestra
Unidad elemental
3. En el Día Internacional de las trabajadoras del Hogar, un diario de la capital publicó el siguiente párrafo: “… En toda Lima Metropolitana existen 313 608 mujeres mayores de 14 años que ejercen la labor de trabajadoras del hogar, el 82% labora en hogares del sector socioeconómico A, la mayoría no cuenta con seguro social, la jornada laboral promedio es de 12,3 horas diarias y el sueldo promedio de la doméstica es de 455 soles mensuales…” Identifique a partir del enunciado anterior la población, la muestra y la unidad elemental.
Población
Muestra
10
Estadística para Comunicadores
Unidad elemental
4. Una empresa tiene un total de 51 trabajadores y ha registrado información acerca del ingreso mensual (en soles) y de los años cumplidos en la empresa. Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Ingreso (en soles) 2300 2800 2400 2500 2300 2100 1700 2000 2200 2100 1700 2500 2800 2400 1700 2400 2200
Años en la empresa 5 11 4 2 3 2 2 0 7 4 0 2 13 9 1 9 10
Nº 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
Ingreso (en soles) 2100 2100 1800 2000 2100 1900 2000 2300 2000 1700 1900 2000 2400 1700 1700 2400 2500
Años en la empresa 13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13
Nº 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51
Ingreso (en soles) 2400 1700 2500 1700 2400 2400 1900 1700 2100 2000 2000 2500 1700 2500 1700 2600 1600
Años en la empresa 16 0 12 3 17 16 7 1 6 5 3 13 0 19 3 19 1
Identifique a partir del enunciado la población, la unidad elemental y proporcione un ejemplo de dato y un ejemplo de observación:
Población
Unidad Elemental
Dato
Observación
Estadística para Comunicadores
11
Técnicas de recolección de datos La forma de obtener la información original de las unidades elementales que componen la población a investigar puede ser efectuada a través de:
un censo, una encuesta o un registro administrativo.
• Se llama Censo cuando se recolecta la información de todas las unidades de la población. • El método para recolectar los datos de toda la población es a través de una encuesta y es necesario que se especifique el espacio y el tiempo al que se refiere el recuento.
• Es un instrumento de recolección de datos. • Este instrumento se puede aplicar a la población o a la muestra. • Es llevada a cabo generalmente a través de algún cuestionario que puede ser por teléfono, virtual o a través de un encuestador.
Censo
Encuesta
Se prefiere el uso de la encuesta en vez de un censo principalmente por dos razones: costo y tiempo.
Registro administrativo (RRAA) El registro administrativo, junto con las encuestas y los censos, forma una de las tres fuentes clásicas de datos estadísticos. La diferencia con las otras dos estriba en su carácter de fuente secundaria (no porque el dato se halla resumido) sino porque el estadístico o investigador no la toma directamente ni bajo criterios metodológicos propios de la investigación que adelanta sino debido a criterios normativos que lleva la institución pública dueña del registro. Sin embargo, el registro administrativo posee propiedades que hacen que pueda convertirse en dato estadístico a un bajo costo y sin perder los requisitos de calidad del dato estadístico. Actualmente el registro administrativo forma parte de la infraestructura estadística nacional mínima de los países pero ha sido descuidada en los países latinoamericanos.
Estadística para Comunicadores
12
Definición de Registro Administrativo Así, los RRAA son …”información referida a una unidad individual –persona física, hogar, empresa, etc. – que ha sido diseñada, recogida y mantenida por una determinada administración pública con el propósito de controlar y/o tomar decisiones relativas a esa unidad individual.”. Begoña (2006). Los RRAA pueden ser privados también, de hecho gran cantidad de información agropecuaria, petrolera, económica, etc., tiene como fuente RRAA procedentes de corporaciones privadas. SO: Begoña Sanz Diez. (2006) Algunas reflexiones sobre el marco legal para la utilización de la información administrativa con fines estadísticos. Instituto de Estudios Fiscales. Madrid 2006 Citado por: Casanova, Hugo Delfín. Los Registros Administrativos: Sus ventajas y desventajas. Sus diferencias frente a las encuestas y los censos [Internet]. Versión 4. Knol. 2009 ago 17. Disponible (URL: http://knol.google.com/k/hugo-delfín-casanova/los-registrosadministrativos/wm2h942t9vjr/5.) Existen oficinas públicas que llevan registros administrativos para sus propios fines. Por ejemplo:
los Registros Civiles registran nacimientos, casamientos o defunciones, el Ministerio de Educación que lleva registros sobre matrícula de alumnos o deserción escolar, la Aduana que registra las importaciones y exportaciones.
Los registros administrativos constituyen la forma más económica de obtener información estadística. Sin embargo, esta información se obtiene tal como está disponible. Los fines del registro administrativo no siempre coinciden con los de nuestra investigación. Por ejemplo, se puede consultar las páginas web de las siguientes instituciones:
Ministerio de Educación. http://minedu.gob.pe/ Ministerio de Salud http://www.minsa.gob.pe/ Superintendencia Nacional de Aduanas y de Administración Tributaria SUNAT http://www.sunat.gob.pe/ Registro Nacional de Identificación y Estado Civil http://www.reniec.gob.pe/ Instituto Nacional de Estadística e Informática INEI. http://www.inei.gob.pe/
Estadística para Comunicadores
Ministerio de Trabajo y Promoción del Empleo. http://www.mintra.gob.pe Infocorp/Equifax: http://www.equifax.com/home/es_pe
Empresa de investigación de mercados Ipsos Perú: http://www.ipsos.pe/
13
14
Estadística para Comunicadores
Variable
Variable Se define así a una característica que presentan los elementos de una población y que puede asumir diferentes valores cuando se realiza su medición
Variables
Variables cualitativas Son aquellas variables que al ser medidas quedan expresadas por etiquetas o nombres que se utilizan para identificar una característica o atributo.
cuantitativas
Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para identificar una característica o atributo. Estas a su vez pueden clasificarse en discretas o continuas.
Variable
Variable
cuantitativa
cuantitativa
discreta
continua
Las mediciones de este tipo de variable son el resultado del conteo, es decir, los valores que puede tomar son números enteros (finitos o infinitos)
Las mediciones de este tipo de variable pueden ser decimales o fracciones; es decir, para dos valores cualesquiera, siempre se podrá encontrar un tercer valor entre los dos primeros.
15
Estadística para Comunicadores
Variable Cuantitativa
Cualitativa
Distrito de residencia
discreta
Grado de instrucción
Número de capacitacio nes realizadas en el año
Número de errores cometidos en la redacción de un informe
Cuantitativa continua
Tiempo que demora una llamada telefónica (en minutos)
Ingreso mensual (en soles)
Ejemplo El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación se presenta parte de la base de datos:
N° Edad
Género
País de procedencia
Precio dispuesto Número de a pagar por acompañantes habitación por viaje (en dólares) 80 0
Criterio de selección del hotel
1
25
Masculino
Inglaterra
2
35
Femenino
Argentina
60
2
Limpieza del dormitorio Precio
3 4
45 65
Masculino Masculino
Francia Francia
115 45
3 0
Buena calidad de las toallas y sábanas Precio
5
72
Femenino
Francia
55
1
Amigable y cordial staff de empleados
6
28
Masculino
Estados Unidos
65
2
Precio
7 8
45 85
Femenino Masculino
Estados Unidos China
60 70
1 2
Precio Precio
9 10
25 35
Masculino Femenino
Inglaterra Francia
65 45
3 1
Limpieza del dormitorio Precio
115
20
Masculino
Estados Unidos
55
2
Amigable y cordial staff de empleados
16
Estadística para Comunicadores
Identifique el tipo de variable que se presenta en la base de datos. Variable
Tipo de variable
Edad
Cuantitativa continua
Género
Cualitativa
País de procedencia
Cualitativa
Precio dispuesto a pagar por habitación, en dólares
Cuantitativa continua
Número de acompañantes por viaje
Cuantitativa discreta
Criterio de selección del hotel
Cualitativa
Ejercicios 1. Clasifique las siguientes variables de acuerdo a su tipo: Variable Tiempo de servicio de los empleados de un medio de comunicación. Nivel educacional de los empleados de una radio. Lugar de nacimiento de los empleados de una editorial. Orden de llegada de los reporteros a una entrevista. Número de diarios defectuosos que salen de la línea de producción del diario “Mi País”. Ingreso mensual (en soles) de los trabajadores de una empresa publicitaria.
Tipo de variable
17
Estadística para Comunicadores
2. Se desea conocer la opinión sobre el servicio que brinda el transporte “Metropolitano de Lima”. Para llevar a cabo este estudio se aplicó una encuesta, el primer trimestre del año 2014, a 300 personas del sexo femenino que utilizaron dicho medio de transporte en horario pico. Después de procesar las encuestas se obtuvieron los siguientes resultados: El 65% opinó que el servicio es bueno, el 30% que es regular y el resto manifestó que es deficiente. El 45% utiliza la línea A, el 30% la línea B y el resto la C. El 60% manifestó que es muy lenta la recarga de la tarjeta “Bus Card”. La edad promedio es de 42,5 años con una desviación estándar de 2,3 años. El 50% demora a lo más 25 minutos en llegar a su destino. El 85% usa el servicio como máximo 4 veces al día. a. Del enunciado anterior identifique: población, muestra, unidad elemental.
Población
Muestra
Elemento
b. Identifique las variables en estudio e indique su tipo. Variables
Tipo de variable
Estadística para Comunicadores
18
Escalas de medición La medición de una variable consiste en asignar un valor a la característica observada. Por ejemplo, si la característica observada es el género de las personas, al clasificar a una persona como de sexo femenino, le asignamos un valor, y hacemos una medición de la característica. El proceso de medición utiliza diversas escalas: nominal, ordinal, intervalo y razón.
• Sólo permite asignar un nombre, etiqueta o valor al elemento sometido a medición. • Los números que se puedan asignar a las propiedades de los elementos se utilizan sólo como etiquetas con la finalidad de clasificarlos. • Con esta escala no tiene sentido realizar operaciones aritméticas.
Nominal
• Además de asignar un nombre o etiqueta y establecer un orden entre los elementos, esta escala permite calcular diferencias entre los números asignados a las mediciones (el intervalo entre observaciones que se expresa en términos de una unidad fija de medida). • Los datos son numéricos.
Intervalo
• Los datos son etiquetas y además el orden es significativo. • Los datos se pueden ordenar en forma ascendente o descendente, de tal manera que puedan expresar grados de la característica medida.
Ordinal
• Los datos tienen todas las propiedades de los datos de intervalo y el cociente de los dos valores es significativo. • Tiene un punto cero absoluto, es decir, el cero indica la ausencia de la característica medida. • Se puede realizar las operaciones aritméticas a los números asignados.
Razón
Estadística para Comunicadores
19
Estadística para Comunicadores
Ejercicio
20
21
Estadística para Comunicadores
Ejemplo El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación se presenta parte de la base de datos:
N° Edad
Género
País de procedencia
Precio dispuesto Número de a pagar por acompañantes habitación por viaje (en dólares)
Criterio de selección del hotel
1 2
25 35
Masculino Femenino
Inglaterra Argentina
80 60
0 2
Limpieza del dormitorio Precio
3
45
Masculino
Francia
115
3
Buena calidad de las toallas y sábanas
4 5 6
65 72 28
Masculino Femenino Masculino
Francia Francia Estados Unidos
45 55 65
0 1 2
Precio Amigable y cordial staff de empleados Precio
7
45
Femenino
Estados Unidos
60
1
Precio
8 9 10
85 25 35
Masculino Masculino Femenino
China Inglaterra Francia
70 65 45
2 3 1
Precio Limpieza del dormitorio Precio
115
20
Masculino
Estados Unidos
55
2
Amigable y cordial staff de empleados
Identifique el tipo y la escala de medición de cada una de las variables que se presenta en la base de datos. Variable
Tipo de variable
Escala de medición
Cuantitativa continua
Razón
Género
Cualitativa
Nominal
País de procedencia
Cualitativa
Nominal
Precio dispuesto a pagar por habitación, en dólares
Cuantitativa continua
Razón
Número de acompañantes por viaje
Cuantitativa discreta
Razón
Cualitativa
Nominal
Edad
Criterio de selección del hotel
22
Estadística para Comunicadores
Ejercicios 1. Indique el tipo y la escala de medida que corresponde a cada una de las siguientes variables. Variable
Tipo de variable
Escala de medida
Edad Marca de automóvil Número de personas a favor de la pena de muerte Ventas anuales (en dólares) Tamaño de bebida (pequeño, mediano, grande) Método de pago (efectivo, cheque, tarjeta de crédito) Grado de un miembro del ejército (soldado raso, sargento, cabo, etc.). 2. Los clientes que se suscriben a la revista “Buena Vida” deben llenar un formato con información personal. Clasifique cada uno de los datos solicitados indicando el tipo de variable y su respectiva escala de medida. Variable Profesión
Distrito de residencia Ingreso mensual familiar (en soles) Grado de instrucción
Tipo de variable
Escala de medida
23
Estadística para Comunicadores
Número telefónico
Estado civil Gasto semanal en alimentos (en soles) Centro laboral
3. Un diario local desea analizar qué tanta gente que adquiere el diario estaría interesada por que se ofrezcan recetas de comidas típicas de diferentes regiones del país. Para ello, de un total de 2100 personas suscritas al diario, de las cuales el 74% son hombres, se seleccionaron al azar 352 personas y se les consultó al respecto. Después de resumir la información se encontró que el 60% tiene mucho interés en recetas de comida típica, la edad promedio de las personas entrevistadas es de 31 años y el 10% procede de la Selva. a. Identifique la población, la muestra y el elemento. b. Identifique qué variables se están estudiando, indique su tipo y escala de medida. La población
Muestra
Elemento
Defina la variable
Tipo de variable
Escala de medida
24
Estadística para Comunicadores
4. El Magazine Actualidad empezó a circular en el departamento de Lima el mes de enero del año 2 006, siendo una de las más sólidas en su rubro. Cuenta a la fecha con 1 450 suscriptores, de los cuales el 30% reside fuera de la provincia de Lima y 30 de ellos se retiraron el primer semestre de este año. Los directivos han decidido aplicar una encuesta a una muestra de 120 suscriptores para poder implementar un programa de impacto, con la finalidad, de incrementar el número de suscriptores. Los resultados obtenidos después de la aplicación son:
El 80% está muy satisfecho, el 12% está satisfecho y sólo un 8% está insatisfecho. El 65% de los suscriptores solicita se agregue información referente a actividades recreativas para programarlas en su tiempo libre. El 70% realiza compras por computadora. Esta información revela a los directivos que los avances en computación serán de interés para sus suscriptores.
a. En base al enunciado anterior identifique:
La población
La muestra
b. Complete los espacios en blanco, según el enunciado: Defina la variable
Tipo de variable
Escala de medida Ordinal
Cualitativa
Nominal
Estadística para Comunicadores
Parámetro y estadístico Parámetro • Resume una característica de la población. • Para obtener su valor se hace necesario contar con toda la información que brindan los elementos de una población.
Estadístico • Resume una característica de la muestra. • Para obtener su valor se utiliza la información muestral. • El valor obtenido de un estimador se conoce como estimación. • Al estimador, también se le llama estadígrafo o estadístico.
Estudio muestral
25
Estadística para Comunicadores
Estudio poblacional
http://peru21.pe/politica/elecciones-2014-resultados-onpe-alcaldias-distritales-lima
26
27
Estadística para Comunicadores
Ejemplo de parámetro y estadísticos Nombre
Parámetro
Estadístico
N
Promedio
x
2
x
i 1
N
N
Varianza
n
i
xi
i 1
s2
N
p
Proporción
i 1
x
i
x
2
i 1
n 1
s
A N
i
n
n
2
2
Desviación estándar
x
pˆ
s2
a n
Ejemplo El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación se presenta parte de la base de datos:
N° Edad
Género
País de procedencia
Precio dispuesto Número de a pagar por acompañantes habitación por viaje (en dólares)
Criterio de selección del hotel
1 2
25 35
Masculino Femenino
Inglaterra Argentina
80 60
0 2
Limpieza del dormitorio Precio
3
45
Masculino
Francia
115
3
Buena calidad de las toallas y sábanas
4
65
Masculino
Francia
45
0
Precio
5
72
Femenino
Francia
55
1
Amigable y cordial staff de empleados
6 7
28 45
Masculino Femenino
Estados Unidos Estados Unidos
65 60
2 1
Precio Precio
8
85
Masculino
China
70
2
Precio
9
25
Masculino
Inglaterra
65
3
Limpieza del dormitorio
10
35
Femenino
Francia
45
1
Precio
115
20
Masculino
Estados Unidos
55
2
Amigable y cordial staff de empleados
Después de procesar la información se obtuvieron los siguientes resultados:
28
Estadística para Comunicadores
El 34% de los huéspedes extranjeros procede de los Estados Unidos. La edad promedio de los huéspedes es de 35,2 años. El número de acompañantes por huésped extranjero más frecuente es de dos personas. El criterio de selección más frecuente es el precio.
Identifique el estimador y el valor del estimador para cada una de las variables de la base de datos. Variable
Estadístico
Valor del estadístico
Lugar de procedencia
Proporción
34% Estados Unidos
Edad de los huéspedes
Promedio
35,2 años
Número de acompañantes
Moda
2
Criterio de selección del hotel
Moda
precio
Ejercicios de aplicación 1. Con la intención de conocer la opinión de los pacientes de los hospitales, que fueron afectados por la última huelga médica, se contrató los servicios de la consultora Access Data S.A. la cual encuestó a 500 pacientes que acudieron a los diferentes hospitales de Lima y Callao el presente mes. Entre los principales resultados se obtuvieron los siguientes:
El 67,4% de los encuestados afirmó que se vieron perjudicados por la huelga médica. La respuesta más frecuente a la pregunta ¿Cómo calificaría la calidad de la atención que recibe?, fue regular. El promedio del número de veces que debe acudir mensualmente al hospital es de 3,4 veces. El 25% de los encuestados afirmó que recibe del hospital hasta dos medicamentos por atención.
Identifique: Variable
Estadístico
Valor del estadístico
29
Estadística para Comunicadores
2. Un diario local publicó en su última edición dominical, un estudio realizado sobre el manejo y desarrollo de la publicidad actual. Mencionamos a continuación algunos párrafos publicados en este artículo:
“...se realizó una encuesta en la ciudad de Lima a 1102 personas de 18 a 70 años de edad elegidas al azar...” “…el 52% de los encuestados señalaron que los anunciantes sí sobrepasan los límites de lo aceptable desde el punto de vista ético y social al realizar sus campañas de publicidad…” “… el 40,2% de los encuestados señaló recordar el nombre del producto luego de ver el comercial por TV…” “… el 51,6% de los encuestados no están de acuerdo con el horario en que transmiten algunos comerciales por TV...” “... el ingreso promedio de los encuestados es de 2403 soles...” El encargado de este estudio, publicista peruano de 50 años de edad mencionó: “… la publicidad es comunicación aplaudida y criticada no sólo por su función de venta de productos, sino también por su influencia en la economía y en la sociedad…”
Identifique a partir del enunciado:
Muestra
Variable
Estadístico
Tipo de variable
Notación
Valor del estadístico
30
Estadística para Comunicadores
3. Una empresa de bebidas gaseosas está pensando lanzar una nueva bebida al mercado local. “Ice Tea” es un producto bajo en calorías y dirigido a personas en edad universitaria. Se sabe que la ciudad donde se piensa lanzar el producto cuenta con 100 000 habitantes en edad universitaria, el 65% son mujeres, el 30% consume sólo agua mineral y el 20% estudia en universidades particulares. Para tal estudio se consideró seleccionar una muestra de tamaño 400 donde los resultados obtenidos luego de procesar la información fueron:
La edad promedio de los encuestados es de 21,6 años. El 52% de los encuestados son mujeres. El precio promedio que pagarían por el nuevo producto es 1,70 soles. El 80% de los encuestados calificó al sabor de la bebida como “Muy Bueno”, el 10% como “Bueno”, el 5% como “Malo” y el resto como “Muy Malo”.
Identifique a partir del enunciado:
Población
Muestra
Defina la Variable
Estadístico
Tipo de variable
Notación
Valor del estadístico
31
Estadística para Comunicadores
4. Con la finalidad de determinar en qué medida la población urbana de cierta ciudad identifica elementos sexistas o machistas en la publicidad comercial actual, un sociólogo cultural tomó una muestra de 590 personas, de los cuales encontró que el 60% de los encuestados reconocía elementos sexistas en la publicidad, la edad promedio de los entrevistados fue de 37,5 años, el 20% pertenecía a la clases socioeconómicas A-B, el 45% a la clase C-D, y los restantes a la clase E. A la pregunta respecto a la marca comercial con mayor contenido machista en su publicidad, el 45% reconoce a la marca de cerveza “SENPIL”, el 25% a la marca de artículos de cuidado personal “GOE”, el 10% a la marca de detergente “CEA” y el resto a otras marcas. Relacione cada uno de los elementos que se describen a continuación con los conceptos dados en el párrafo: Conceptos dados en el párrafo A. Todos los ciudadanos de cierta ciudad. B. 32 años. C. 45% pertenecen a la clase C-D D. 590 personas de cierta ciudad. E. Un ciudadano F. Cerveza “SENPIL” G. Nivel socioeconómico registrado y medido como A-B, C-D y E H. Edad del entrevistado I. Marca con mayor contenido sexista
Elementos que se describen ( ( ( ( ( ( ( ( (
) Variable cuantitativa continua. ) Muestra. ) Población. ) Variable cualitativa ) Estadístico. ) Dato cuantitativo. ) Dato cualitativo ) Unidad elemental ) Escala de medida ordinal
32
Estadística para Comunicadores
Autoevaluación 1. Complete la siguiente tabla: Variable
Tipo de variable
Escala de medición
Número de miembros por familia Emisora de radio de su preferencia Gasto semanal en periódico (soles) 2. Hace un mes, una empresa de servicios realizó una encuesta a una muestra de 60 profesionales que asistieron a una conferencia en el Colegio de Ingenieros del Perú con la finalidad de recoger información encomendada por ciertas empresas que alquilan locales para la organización de eventos culturales tales como: Congresos, Coloquios, Conversatorios, etc. Parte del cuestionario que se le pidió completar a los asistentes se presenta a continuación:
Sexo: Masculino
Femenino
6. ¿Cuánto suele gastar por asistir a un evento cultural? ______________ soles
2. Edad: ______ años 3. Ingreso mensual ___________ soles 4. Profesión __________________ 5. Cargo que ocupa en su empresa___________
7. ¿A cuántos congresos asistió el mes pasado? ___________ 8. ¿Su empresa organiza con regularidad eventos profesionales y/o culturales? Sí No 9. ¿Su empresa alquila locales para organizar eventos culturales? Sí No
En base al enunciado anterior y analizando la encuesta complete lo siguiente: Población Elemento Variable
Tipo de variable
Escala de medición Razón
Congresos asistidos el mes pasado
33
Estadística para Comunicadores
Presentación tabular y gráfica de variables Un gráfico es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de un fenómeno en estudio y facilita el análisis estadístico de las variables. Un gráfico, al igual que un cuadro o una tabla, debe contar con un Título y una Fuente.
Ejemplo El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación se presenta parte de la base de datos:
N° Edad
Género
País de procedencia
Precio dispuesto Número de a pagar por acompañantes habitación por viaje (en dólares) 80 0
Criterio de selección del hotel
1
25
Masculino
Inglaterra
2 3
35 45
Femenino Masculino
Argentina Francia
60 115
2 3
Limpieza del dormitorio Precio Buena calidad de las toallas y sábanas
4 5 6
65 72 28
Masculino Femenino Masculino
Francia Francia Estados Unidos
45 55 65
0 1 2
Precio Amigable y cordial staff de empleados Precio
7
45
Femenino
Estados Unidos
60
1
Precio
8 9 10
85 25 35
Masculino Masculino Femenino
China Inglaterra Francia
70 65 45
2 3 1
Precio Limpieza del dormitorio Precio
115
20
Masculino
Estados Unidos
55
2
Amigable y cordial staff de empleados
¿Qué podemos hacer para resumir esta información? Una vez recopilada la información, con las variables consideradas de mayor importancia, el siguiente paso es presentarla a través de una tabla de frecuencias y/o un gráfico que describa adecuadamente las características más importantes. Las tablas y los gráficos que se presentan a continuación han sido obtenidos con el software SPSS.
34
Estadística para Comunicadores
Variable cualitativa Criterio de selección del hotel La Posada
Válidos Amigable y cordial staff de empleados Buena calidad de las toallas y sábanas Limpieza del dormitorio Opciones del Preferred guest card Precio Servicios "In room" Servicios adicionales Total
Frecuencia Porcentaje 25 21,7
Porcentaje válido 21,7
Porcentaje acumulado 21,7
12
10,4
10,4
32,2
13 6
11,3 5,2
11,3 5,2
43,5 48,7
39 10 10 115
33,9 8,7 8,7 100,0
33,9 8,7 8,7 100,0
82,6 91,3 100,0
Fuente: Hotel La Posada. Puno
Gráfico Circular Distribución de huéspedes extranjeros según criterio de selección del hotel
Fuente: Hotel La Posada. Puno
Estadística para Comunicadores
Gráfico de Barras Distribución de huéspedes extranjeros según criterio de selección del hotel
Fuente: Hotel La Posada. Puno
Variable cuantitativa discreta Distribución de huéspedes extranjeros según número de acompañantes por viaje Porcentaje Porcentaje Frecuencia Porcentaje válido acumulado Válidos 0 21 18,3 18,3 18,3 1 26 22,6 22,6 40,9 2 37 32,2 32,2 73,0 3 22 19,1 19,1 92,2 4 9 7,8 7,8 100,0 Total 115 100,0 100,0 Fuente: Hotel La Posada. Puno
35
36
Estadística para Comunicadores
Gráfico de Bastones o Líneas Distribución de huéspedes extranjeros según número de acompañantes por viaje
Fuente: Hotel La Posada. Puno
Variable cuantitativa continua Elabore el gráfico de frecuencia relativa para la variable precio que estaría dispuesto a pagar por habitación (en dólares).
Distribución de huéspedes extranjeros según precio que estaría dispuesto a pagar por habitación (en dólares) Lim. Inf. Lim. Sup. 40 54 68 82 96 110 124 138
Marca Frecuencia de clase absoluta
54 68 82 96 110 124 138 152
Fuente: Hotel La Posada. Puno
47 61 75 89 103 117 131 145
15 47 23 16 8 3 2 1
Frecuencia relativa
Frec abs. acumulada
Frec. relat. acumulada
0.1304 0.4087 0.2000 0.1391 0.0696 0.0261 0.0174 0.0087
15 62 85 101 109 112 114 115
0.1304 0.5391 0.7391 0.8783 0.9478 0.9739 0.9913 1
Estadística para Comunicadores
Gráfico de Histograma Distribución de huéspedes extranjeros según precio que estaría dispuesto a pagar por habitación (en dólares)
Fuente: Hotel La Posada. Puno
37
38
Estadística para Comunicadores
Medidas de Tendencia Central Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del cual tienden a concentrarse o distribuirse las demás observaciones. El objetivo es conseguir un valor que sea representativo del conjunto total de datos que se está analizando.
Medidas de tendencia central Media
Mediana
http://www.ipsos-apoyo.com.pe/perfil_ama_de_casa
Moda
39
Estadística para Comunicadores
En esta unidad trabajaremos las medidas descriptivas únicamente con datos simples o no agrupados; es decir, con valores que no están agrupados en tablas de distribución de frecuencia.
Media La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de dichos valores dividida entre el número de valores. Población
Muestra
N
xi i 1
N
n
x
x i 1
i
n
Características de la media Se puede calcular para datos medidos en escala de intervalo o razón. El valor de la media es sensible a los valores extremos o atípicos (mínimo y máximo) que la distorsionan. El cálculo de la media es sencillo y fácil de entender e interpretar. Ejemplo La siguiente información corresponde al número de notas publicadas por un grupo de periodistas de tres diarios locales durante el último mes: Siglo XXI Media Mediana Moda
Democracia 9,5 10,3 12
Media Mediana Moda
13,3 12 10
40
Estadística para Comunicadores
Tamaño de muestra
10
12 14
9 7
Popular
Tamaño de muestra 8 10
11 10
15
10 6
16 13
Calcule e interprete el valor del promedio del número de notas publicadas por los periodistas del diario Popular. Media = 10,5 notas Interpretación: El número promedio de notas publicados por los periodistas del diario Popular es igual a 10,5. Ejercicio 1. Carlos, estudia por las mañanas en la UPC en la facultad de Comunicaciones y por las tardes trabaja en el diario El Comercio. En una muestra de 10 días del último mes transcurrido registró su gasto diario, en soles. Los resultados se muestran a continuación: Gasto diario (soles)
40
35
32
48
25
25
30
33
42
50
Calcule e interprete la media del gasto diario.
2. Se presenta a continuación la información de una muestra de empleados de cierta compañía. Empleado 1 2 3 4 5 6 7 8
Ingreso mensual (soles) 2020 3410 1967 1630 2502 1677 4286 2952
Experiencia laboral (años) 4,6 8,8 2,1 1,2 5,2 1,1 4,9 2,8
Calcule e interprete el valor del promedio de cada una de las variables.
41
Estadística para Comunicadores
Mediana La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho conjunto. El 50% de las observaciones son menores o iguales a la mediana.
El 50% de las observaciones son menores o igual a la mediana.
Mínimo
El 50% de las observaciones son mayores a la mediana.
Mediana
Máximo
Cálculo 1. Se ordenan los datos en orden ascendente. 2. Calcule la posición i de la mediana usando la siguiente fórmula: i = 0,5n donde n es el tamaño de muestra
Si i es un valor decimal, se redondea. El valor entero inmediato mayor que i indica la posición de la mediana.
Si i es un valor entero, la mediana es el promedio de los valores de los datos ubicados en los lugares i e i+1.
Características de la mediana Se puede calcular para variables medidas en escala de ordinal, intervalo o razón. El valor de la mediana depende del número de datos observados.
42
Estadística para Comunicadores
La mediana es un estadístico que no se ve afectado por valores extremos (mínimo y máximo). Por eso se le utiliza cuando hay datos inusuales o el polígono de frecuencias no es simétrico. Ejemplo La siguiente información corresponde al número de notas publicadas por un grupo de periodistas de tres diarios locales durante el último mes: Siglo XXI
Democracia
Media Mediana Moda Tamaño de muestra
9,5 10,3 12 10
12 14
9 7
Popular
Media Mediana Moda Tamaño de muestra 8 10
11 10
13,3 12 10 15
10 6
16 13
Calcule e interprete el valor de la mediana del número de notas publicadas por los periodistas del diario Popular. Mediana = 10 Interpretación: El 50% de los periodistas del diario Popular publicaron, durante el último mes, como máximo diez notas. Ejercicios 1.
Carlos estudia por las mañanas en la UPC en la facultad de Comunicaciones y por las tardes trabaja en el diario El Comercio. En una muestra de 10 días del mes enero y 7 del mes de febrero registró su gasto diario, en soles. Los resultados se muestran a continuación: Gasto diario Enero Gasto diario Febrero
40
35
32
48
25
25
30
27
35
32
48
25
25
30
33
Calcule e interprete el valor de la mediana del gasto diario de enero y febrero.
42
50
Estadística para Comunicadores
2.
43
Se presenta a continuación la información de una muestra de 9 empleados la editorial Kero y 6 empleados de la editorial Esparta.
Empleado 1 2 3 4 5 6 7 8 9
Kero Experiencia laboral (años) 10,5 6,3 2,5 1,2 3,4 4,9 7,8 5,5 0.9
Esparta Experiencia laboral (años) 4,6 8,8 2,1 1,2 5,2 1,1
Calcule e interprete el valor de la mediana de la experiencia laboral para cada editorial.
44
Estadística para Comunicadores
Moda La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor frecuencia. Agrupe los datos de acuerdo a sus respectivas frecuencias, el dato con mayor frecuencia es la moda. Características de la moda La moda se puede calcular para cualquier escala de medición. El valor de la moda no se ve afectada por valores extremos. La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más de dos modas (multimodal). Algunas series de datos no tienen moda. La moda es una medida menos importante que la mediana o la media debido a su ambigüedad.
Ejemplo La siguiente información corresponde al número de notas publicadas por un grupo de periodistas de tres diarios locales durante el último mes: Siglo XXI
Democracia
Media Mediana Moda Tamaño de muestra
9,5 10,3 12 10
12
9
Popular
Media Mediana Moda Tamaño de muestra 8
11
10
13,3 12 10 15 16
45
Estadística para Comunicadores
14
7
10
10
6
13
Calcule e Interprete el valor de la moda del número de notas publicadas por los periodistas del diario Popular. Moda = 10 Interpretación: El número de notas publicadas con mayor frecuencia por los periodistas del diario Popular es igual a diez.
46
Estadística para Comunicadores
Ejercicios 1. Calcule e interprete la moda de la edad de un grupo de trabajadores clasificados por género. Hombres Mujeres
35 22
28 31
24 20
35 30
28 22
24 27
35 28
23 20
30 34
20 22
Calcule e interprete la moda de la edad para cada grupo. Solución En este caso, la moda de los hombres es igual a ………………….. años y la moda de las mujeres es igual a ………………………….. años. Esto significa que………………………………………………………………………………... ………………………………………………………………………………………………….... ………………………………………………………………………………………………….... 2. A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados de la carrera de Administración. Número
Género
Edad
1 2 3 4 5 6 7 8
Femenino Femenino Femenino Femenino Femenino Femenino Femenino Femenino
15 19 21 34 21 24 30 26
Estatura (en cm) 154 154 156 184 173 170 176 188
Número
Género
Edad
9 10 11 12 13 14 15
Femenino Masculino Masculino Masculino Masculino Masculino Masculino
22 31 31 28 31 28 24
Estatura (en cm) 168 161 171 175 187 161 172
Calcule e interprete la moda de la estatura. Solución En este caso, el resultado son dos modas, la primera moda es igual a ………………….. cm. y la segunda moda es igual a ………………………….. cm. Esto significa que………………………………………………………………………………... …………………………………………………………………………………………………....
47
Estadística para Comunicadores
Forma de la distribución de los datos Además de las medidas de tendencia central y dispersión, podemos estar interesados en saber la forma que presenta el conjunto de datos que se está analizando. Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la media, se dice que la distribución es simétrica. Si los datos por debajo de la media son más frecuentes que aquellos por encima de la media o viceversa, se dice que la distribución es asimétrica. Relación entre media, mediana y moda Para una distribución unimodal, es decir, que tenga una sola moda, se cumplen de manera general las siguientes relaciones.
Para una distribución simétrica: Para una distribución asimétrica negativa: Para una distribución asimétrica positiva:
x Mediana Moda x Mediana Moda x Mediana Moda
media = mediana = moda
Simetría o sesgo nulo
media < mediana < moda
Sesgo izquierdo o negativo Datos concentrados en valores altos
media > mediana > moda
Sesgo derecho o positivo Datos concentrados en valores bajos
Estadística para Comunicadores
48
Ejemplo Un estudiante de la carrera de Comunicaciones revisó durante 11 días el ranking del Instituto Peruano de Marketing (IPM) de la industria publicitaria en Internet. A continuación se presenta el listado que elaboró de acuerdo al número de visitas por día a la página web www.netjoven.pe Número de visitas por día a la página web
4000
3200
3600
3500
3000
3250 2900 3400 3450 2800 3200
A partir de las medidas de tendencia central indique la relación y grafique la forma de la distribución del número de visitas. Media Mediana Moda
= = =
3300 3250 3200
Como el valor de la moda = 3200 < mediana = 3250 < media = 3300 la distribución del número de visitas por día es asimétrica positiva.
Sesgo derecho o positivo
Ejercicio Un grupo de alumnos de la facultad de Ciencias de la Comunicación de la carrera de Publicidad se interesó en analizar el tiempo, en segundos, que tardan las personas en recordar al supermercado cuyo eslogan es “Precios más bajos siempre”. Este trabajo se aplicó en el distrito América de la ciudad de Lima, los resultados obtenidos se muestran a continuación. Tiempo 9,00 7,80 10,30 9,20 5,60 7,40 7,30 5,00 12,40 5,10 11,80 3,40 5,10 (en segundos)
Determine la forma de la distribución de los tiempos de recordación del slogan en este distrito Presente la gráfica e interprete en términos del problema.
Estadística para Comunicadores
Medidas de posición: Cuantiles
Cuartil
Decil
Percentil
•Divide el conjunto de datos en cuatro partes iguales. •El cuartil 1, denotado por Q1, es un valor tal que el 25% de los elementos son menores o iguales que este valor. •El cuartil 2, denotado por Q2 es un valor tal que el 50% de los elementos son menores o iguales que este valor. •El cuartil 3, denotado por Q3 es un valor tal que el 75% de los elementos son menores o iguales que este valor.
•Divide al conjunto de datos en diez partes iguales. •El decil 1, representado por D1 es un valor tal que el 10% de los elementos son menores o iguales que este valor. •El decil 2, representado por D2 es un valor tal que el 20% de los elementos son menores o iguales que este valor y •El último decil, el decil 9, representado por D9 es un valor tal que el 90% de los elementos son menores o iguales que este valor.
•Divide al conjunto de datos en cien partes iguales. •El percentil k-ésimo, representado por Pk es un valor tal que el k% de los elementos son menores o iguales al valor del percentil K. •El (100-k)% de los elementos son mayores al valor del percentil K. •Los percentiles: P25, P50, P75 equivalen a los cuartiles Q1, Q2 y Q3 respectivamente y los percentiles: P10, P20,… P90 equivale a los deciles D1, D2,…, D9 respectivamente.
49
50
Estadística para Comunicadores
Fórmula a. Ordene los datos de manera ascendente o descendente. b. Calcule la posición “i” del percentil k i n 100
Donde: k es el percentil y n es la cantidad de observaciones. Si la posición del percentil es un número entero, el percentil buscado será el promedio de los valores de los datos ubicados en los lugares ‘i’ e ‘i +1’.
Pk
xi xi 1 2
Si la posición del percentil no es un número entero, entonces el valor se redondea por exceso y la posición de éste número entero es el valor del percentil. Pk xi
Ejemplo A continuación se presentan los sueldos mensuales, en soles, de 12 periodistas. 2710
2755
2850
2880
2880
2890
2920
2940
2950
3050
3130
3325
a. Determine el percentil 25 b. Determine el percentil 85 Solución: observe que los datos ya se encuentran ordenados. a. Determine el percentil 25 25 i 12 3 100
“i” es un número entero, entonces el percentil buscado será el promedio de los valores de los datos ubicados en los lugares 3 y 4.
2850 2880 P25 2865 2 Interpretación: El 25% de los periodistas tiene un sueldo máximo de 2865 soles.
51
Estadística para Comunicadores
b. Determine el percentil 85 85 i 12 10,2 100
Redondeando a más se tiene que i = 11, por tanto su valor será
P85 3130
Interpretación: El 85% de los periodistas tiene un sueldo máximo de 3130 soles. Ejercicio Una compañía Publicitaria solicitó al área de Recursos Humanos información sobre las ventas (en miles de soles) obtenidas durante el último mes de los 10 nuevos vendedores. Los resultados se muestran a continuación: 1300
1210
950
1200
1910
700
1300
a. Calcule e interprete el valor del cuartil 3, percentil 80 y decil 6.
1020
1500
870
Estadística para Comunicadores
52
b. ¿Cuál debe ser el valor de la venta mínima que debe tener el vendedor nuevo para pertenecer al 15% de los que más venden?
c. ¿Cuál debe ser el valor de la venta máxima de un vendedor nuevo para pertenecer al 15% de los vendedores con las más bajas ventas?
Estadística para Comunicadores
53
Medidas de variabilidad o dispersión Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero no indican qué tan cercanos o alejados están los datos de dicho valor central.
Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que los representa y por lo tanto permiten evaluar la confiabilidad de ese valor central.
Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de la medida central, en cambio si la medida de dispersión tiene un valor grande, los datos no están concentrados alrededor de la medida central.
Las medidas de dispersión son las siguientes:
Varianza Se define como el promedio de los cuadrados de las desviaciones de los datos respecto de su media aritmética. La varianza mide el grado de dispersión o variación de los valores de una variable con respecto a su media aritmética.
Las unidades de la varianza son las unidades originales de los datos al cuadrado. Por ejemplo, si la variable tiene unidades cm. entonces la varianza tendrá como unidades cm2. Se denota por V(X), 2 (varianza poblacional), s 2 (varianza muestral).
54
Estadística para Comunicadores
Población
Muestra n
N
2
( x ) i 1
(x x )
2
i
i 1
s2
N
2
i
n 1
Desviación estándar Es la raíz cuadrada de la varianza. Las unidades de la desviación estándar son las mismas unidades de la variable. Por ejemplo, si la variable tiene unidades cm. entonces la desviación estándar tendrá como unidades cm. Se denota por
(desviación estándar poblacional),
s
(desviación estándar muestral).
Características de la varianza y la desviación estándar
La varianza y la desviación estándar son números reales no negativos. Se pueden calcular para variables medidas en escala de intervalo o razón. Se ven afectadas por valores extremos o atípicos. La varianza es expresada en unidades cuadráticas a las unidades originales de los datos, mientras que la desviación estándar es expresada en las mismas unidades originales de los datos.
Ejemplo Un estudiante de la carrera de Comunicaciones revisó durante once días el ranking del Instituto Peruano de Marketing (IPM) de la industria publicitaria en Internet. A continuación se presenta el listado que elaboró de acuerdo al número de visitas por día a la página web: www.netjoven.pe Número de visitas por día a la página web www.netjoven.pe
4000
3200
3600
3500
3000
3250
2900
3400
3450
2800
3200
Además, la cantidad de visitas a la página web www.mujeractiva.com se presenta a continuación: Número de visitas por día a la página web www.mujeractiva.com
3200
4300
4700
4400
4200
4200
4200
4100
4100
4300
55
Estadística para Comunicadores
Calcule el valor de la desviación estándar de ambas páginas web. Solución Páginas web
Desviación Estándar
www.netjoven.pe
342,78
www.mujeractiva.com
383,12
Ejercicio A continuación se presenta la información de una muestra aleatoria de 15 profesionales egresados de la carrera de Ciencias de la Comunicación. Nº 1 2 3 4 5 6 7 8
Género Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino
Edad 22 21 21 30 26 31 28 35
Estatura 154 156 173 176 188 161 173 187
Nº 9 10 11 12 13 14 15
Género Femenino Femenino Femenino Femenino Femenino Femenino Femenino
Edad 33 34 24 27 18 39 33
Estatura 154 184 170 168 182 172 154
Calcule el valor de la desviación estándar de la edad y de la estatura, en centímetros, para cada género.
56
Estadística para Comunicadores
Coeficiente de variación Las medidas de variación estudiadas son medidas de variación absolutas pues estas se expresan en las mismas unidades que la variable original (excepto la varianza que se expresa en unidades al cuadrado). El coeficiente de variación es una medida de dispersión relativa libre de unidades por lo que es útil para comparar la variabilidad de dos o más grupos de datos expresados en distintas unidades de medida. Población
Muestra
100%
CV
CV
s 100% x
Características del coeficiente de variación Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones estándar no es muy útil, por ejemplo, cuando las medias están muy distantes. El coeficiente de variación se calcula en variables medidas en escala de razón.
Ejemplo Un estudiante de la carrera de Comunicaciones revisó durante 11 días el ranking del Instituto Peruano de Marketing (IPM) de la industria publicitaria en Internet. A continuación se presenta el listado que elaboró de acuerdo al número de visitas por día a la página web www.netjoven.pe Número de visitas por día a la página web www.netjoven.pe
4000
3200
3600
3500
3000
3250 2900 3400 3450 2800 3200
Si decide comparar la cantidad de visitas a la página web www.mujeractiva.com ¿Cuál de las dos páginas web tiene datos más homogéneos? Justifique numéricamente. Número de visitas por día a la página web www.mujeractiva.com
3200
4300
4700
4400
4200
4200
4200
4100
4100
4300
Solución Páginas web
Promedio
Desviación Estándar
Coeficiente de variación
www.netjoven.pe
3300
342,78
10,39%
www.mujeractiva.com
4170
383,12
9,19%
57
Estadística para Comunicadores
Los datos más homogéneos, en cuanto al número de visitas por día, se encuentra en la página web www.mujeractiva.com, por tener menor valor de coeficiente de variabilidad. Ejercicio A continuación se presenta la información de una muestra aleatoria de 15 profesionales egresados de la carrera de Ciencias de la Comunicación. Nº 1 2 3 4 5 6 7 8
Género Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino
Edad 22 21 21 30 26 31 28 35
Estatura 154 156 173 176 188 161 173 187
Nº 9 10 11 12 13 14 15
Género Femenino Femenino Femenino Femenino Femenino Femenino Femenino
Edad 33 34 24 27 18 39 33
Estatura 154 184 170 168 182 172 154
a. ¿Qué género presenta mayor variabilidad en la estatura? Justifique numéricamente. Género
Promedio
Desviación Estándar
Coeficiente de variación
Masculino Femenino Por lo tanto, el género que presenta mayor variabilidad es…………………………..….. porque ……………………………………………………………………………………………………. b. ¿Qué género presenta menor dispersión en la edad? Justifique numéricamente. Género
Promedio
Desviación Estándar
Coeficiente de variación
Masculino Femenino Por lo tanto, el género que presenta menor dispersión es…………………………..….. porque …………………………………………………………………………………………………….
58
Estadística para Comunicadores
Rango El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre dato mayor (Xmax) y el dato menor (Xmin) R = Xmáx - Xmín
Características del rango Se puede calcular en variables medidas en escala de intervalo o razón Se ve muy afectado por valores extremos.
Ejemplo Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las respuestas mostradas a continuación: 2
1
2
4
1
3
2
3
2
0
5
1
Calcule e interprete el valor del rango. Solución El rango R = máximo – mínimo = 5 - 0 = 5 La dispersión para el número de hijos por familia es de cinco hijos.
Rango intercuartil (RIC) Es la diferencia entre el tercer y primer cuartil. Es el rango del 50% central de los datos. El rango intercuartil elimina la influencia de los valores extremos. Rango intercuartil = RIC = Q3 – Q1= P75 – P25
59
Estadística para Comunicadores
Características del rango intercuartilico Se puede calcular en variables medidas en escala de intervalo o razón No se ve afectado por valores extremos. Ejemplo Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las respuestas mostradas a continuación: 2
1
2
4
1
3
2
3
2
0
5
1
Calcule e interprete el valor del rango intercuartil. Solución Percentiles P75 P25
Valor 3 1
Por lo tanto el valor del RIC = 3 – 1 = 2 hijos Interpretación: La dispersión en el 50% central del número de hijos por familia es igual a 2. Ejercicio A continuación se presentan los costos de producción por segundo de animación en 2D (en dólares) del último trabajo encargado a una empresa nacional. Los datos obtenidos de una muestra de comerciales de TV y otra de películas se muestran a continuación: Comerciales de TV Películas
28 34
25 33
30 32
21 29
27 36
22 37
23 35
29 34
26 31
24
¿Son los costos de producción por segundo de animación en 2D, en las películas, más homogéneos en el 50% central que en los comerciales de TV? Solución Comerciales de TV
Películas
P75 P25 RIC luego el valor del rango intercuartil es …………………………….………… Esto significa que …………………………………………………………………………………………………..
60
Estadística para Comunicadores
Ejercicios de Aplicación 1. A continuación se presentan los costos de producción (en dólares) por segundo de animación en 2D del último trabajo encargado a una empresa nacional. Los datos obtenidos de una muestra de comerciales de TV y otra de películas se muestran a continuación: Comerciales de TV Películas
28 34
25 33
30 32
21 29
27 36
22 37
23 35
29 34
26 31
24
¿Son los costos de producción por segundo de animación más homogéneos en los comerciales de TV que en las películas? 2. Los siguientes datos representan resúmenes del puntaje asignado a dos comerciales del mismo producto. comercial 1 me 4 n 1 10 x1 5
mo 3
n 2 15
s 1
x1 3
comercial 2 me 4 mo 5
s 1,6
Identifique verdadero (V) o falso (F) según corresponda, de ser falso indique dónde está el error. a. ¿La forma de la distribución del comercial 2 es asimétrica negativa? b. Sí la forma de la distribución de uno de los comerciales es asimétrica negativa, entonces quiere decir que existe mayor concentración de datos con valores bajos. c. La medida de tendencia central más representativa en el comercial 1 es la mediana. d. El puntaje recibido en el comercial 2 es menos disperso que el comercial 1. 3. Un grupo de alumnos de Publicidad se interesó en analizar el tiempo (en segundos) que tardan las personas en recordar al supermercado cuyo eslogan es “Precios más bajos siempre”. Este trabajo se aplicó a tres distritos de la ciudad de Lima, los resultados obtenidos se muestran a continuación: Distrito América 9,00 7,80 10,30 9,20 5,60 7,40 7,30 5,00 12,40 5,10 11,80 3,40 5,10 Medida de Resumen
Distrito Esperanza
Distrito Central
Media
4,252
5,338
Mediana
4,960
4,850
Moda
5,100
3,860
Desviación estándar
2,979
2,593
Tamaño de muestra
17
16
61
Estadística para Comunicadores
a. Interprete las medidas de tendencia central del tiempo de recordación del slogan en el distrito Esperanza. b. ¿Qué distrito presenta mayor variabilidad en los tiempos de recordación? Justifique su respuesta. c. Calcule e interprete el valor del tercer cuartil para el tiempo de recordación del slogan en el distrito América. d. ¿Cuál es el tiempo máximo que tardó el 22% de las personas que recordaron más rápidamente el slogan en el distrito América? e. Calcule e indique la forma de la distribución de los tiempos de recordación del slogan en el distrito Central. 4. A continuación se muestran los resultados obtenidos del número de notas publicadas por un grupo de periodistas de 3 diarios locales durante el último mes: Siglo XXI Media Mediana Moda Varianza
Actualidad 9,5 10,3 12 76,110
Tamaño de muestra P20 P80 Publis
Media Mediana Moda Varianza
10 7,6 12 12 14
13,3 12 10 21,952
Tamaño de muestra P75 P25 9 7
8 10
11 10
10 6
15 16,5 10 16 13
a. ¿Cuál es la distribución del número de notas publicadas por los periodistas del diario Actualidad? b. ¿En cuál de los diarios locales el número de notas publicadas es más homogénea? Justifique numéricamente su respuesta. c. ¿Cuál debe ser el mínimo número de notas publicadas por los periodistas del diario Siglo 21 para pertenecer al 20% de periodistas que más artículos escribe y cuál el máximo número de notas que debe publicar un periodista del diario Publis para pertenecer al 25% de periodistas con menos notas publicadas? 5. Un joven egresado de la carrera de Ciencias de la Comunicación tiene la invitación laboral de dos prestigiosas agencias publicitarias internacionales. La primera de ellas ofrece sueldos en dólares y la segunda en euros. Para tomar la decisión de a cuál de ellas aceptar la invitación recopila datos correspondientes a los sueldos mensuales pagados en cada una de ellas, los mismos que se presentan en la siguiente tabla:
62
Estadística para Comunicadores
Agencia A
Agencia B
1295,75
1148,80
Mediana
1241
1180
Moda
1230
1400
Desviación estándar
436,57
343,52
Tamaño de muestra
20
15
Media
En base a la información anterior, responda las siguientes preguntas: a. Defina la variable en estudio, determine su tipo y escala de medición. b. En la Agencia A ¿qué sueldo es el más frecuente? c. ¿Cuánto gana como mínimo el 50% de los empleados con los mejores sueldos de la Agencia B? d. Si se recomienda aceptar la invitación de aquella agencia con sueldos más estables, esto es con menos riesgos de variación, ¿qué agencia considera usted que conviene elegir? Justifique numéricamente su respuesta.
63
Estadística para Comunicadores
Autoevaluación
La siguiente información corresponde al tiempo de servicio (en meses) de una muestra de publicistas que laboran en dos conocidas agencias de la capital. Agencia Omega Media Mediana Moda Desviación estándar Tamaño de muestra
Agencia Sigma 18,93 14 6 15,78 16
Media Mediana Moda Varianza Tamaño de muestra
19,64 15 11 94,284 25
a. Interprete las medidas de tendencia central de la Agencia Omega.
b. ¿Qué forma presenta la distribución del tiempo de servicio de los publicistas de la agencia Sigma?
c. ¿En cuál de las agencias publicitarias el tiempo de servicio (en meses) es más homogéneo? Justifique su respuesta.
Estadística para Comunicadores
Tabulaciones cruzadas También llamadas tablas de contingencia o de doble entrada. Se usan para resumir de manera simultánea los datos para dos variables.
Ejemplo Se tiene información de una muestra de 805 hogares según nivel socioeconómico y área de residencia. Los resultados se presentan a continuación: Distribución de hogares según nivel socioeconómico y área de residencia Área de residencia Nivel socioeconómico Total Área Urbana Área Rural NSE A 15 2 17 NSE B 48 3 51 NSE C 105 145 250 NSE D 94 175 269 NSE E 38 180 218 Total 300 505 805
De la tabla anterior, complete los espacios en blanco: a. b. c. d.
Número de hogares que pertenecen al NSE C o D: ____________ Son _______________ hogares que pertenecen al NSE C y son del área urbana. Del total de hogares del área rural, el ___________% son del NSE E. Del total de hogares del NSE D, el ____________% son del área urbana
Solución a. b. c. d.
Número de hogares que pertenecen al NSE C o D: ___519___ Son __105___ hogares que pertenecen al NSE C y son del área urbana. Del total de hogares del área rural, el ___35,64___% son del NSE E. Del total de hogares del NSE D, el ___34,94___% son del área urbana
64
Estadística para Comunicadores
65
Ejercicios 1. Los directivos de la agencia publicitaria TresPicos quieren implementar un programa de motivación para sus trabajadores. Para ello, se solicitó a cada trabajador realizar primero una autoevaluación (calificación a sí mismo) de su nivel de desempeño profesional en lo que va del año. Los resultados obtenidos de una muestra de 120 trabajadores clasificados de acuerdo a su cargo se presentan a continuación: Distribución de trabajadores según su cargo y nivel de desempeño profesional Nivel de desempeño profesional Cargo Total Excelente Bueno Regular Deficiente Gerente 0 3 2 0 5 2 2 5 1 Director de medios 10 Planificador 3 6 8 2 19 Jefe de medios 4 15 12 0 31 Redactor 8 29 14 4 55 17 55 41 7 120 Total Fuente: Agencia TresPicos
Complete los espacios en blanco: a. La cantidad de trabajadores que ocupan los cargos de redactores y jefes de medios es ………………………………………… b. La cantidad de trabajadores que calificaron su desempeño profesional como mínimo “bueno” es …………………………………………………… c. Del total de trabajadores, el …………….. % son redactores. d. Del total de jefe de medios, el …………… % calificaron su desempeño profesional como “bueno”. e. Del total que calificaron su desempeño profesional como regular, el ………………% son gerentes.
66
Estadística para Comunicadores
2. En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se preguntó a todos los peruanos la religión que profesa, obteniéndose los siguientes resultados
Sexo Hombre Mujer Total
Distribución de peruanos según sexo y religión que profesa Religión que profesa Católica Cristiana - Evangélica Otra Ninguna 8 379 120 1 200 953 324 445 374 024 8 577 602 1 405 102 354 846 234 410 16 956 722 2 606 055 679 291 608 434
Total 10 278 542 10 571 960 20 850 502
Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda
Complete los espacios en blanco. a. b. c. d. e.
El número de cristianos evangélicos en el Perú es ………………… El número de peruanos que profesa una religión distinta a la católica es ………………… El ………….…….% de los hombres peruanos profesa la religión católica. El ………………..% de las peruanas no son cristianas-evangélicas ni católicas. El ………………..% ………………………………………………………………………...
67
Estadística para Comunicadores
Gráfico de barras comparativas Presente las tablas relativas con la información de la tabla de doble entrada de frecuencia absoluta. Distribución de trabajadores según su función y relación con la gerencia Relación con la gerencia Función Total general Buenas Regulares Malas 18 2 20 Apoyo/adm. 10 29 20 59 Obrero 11 6 17 Profesional 19 7 26 Técnico/ventas 58 44 20 122 Total general Las tablas de frecuencias relativas y sus respectivos gráficos se muestran a continuación:
Con respecto al gran total Distribución de trabajadores según su función y relación con la gerencia Relación con la gerencia Función Total general Buenas Regulares Malas 14.75% 1.64% 0.00% 16.39% Apoyo/adm. 8.20% 23.77% 16.39% 48.36% Obrero 9.02% 4.92% 0.00% 13.93% Profesional 15.57% 5.74% 0.00% 21.31% Técnico/ventas 47.54% 36.07% 16.39% 100.00% Total general Distribución de trabajadores según su función y relación con la gerencia 24%
Porcentaje de trabajadores
25%
Buenas Regulares
20% 15%
16%
15%
10% 5%
Malas
16%
9%
8%
5%
6%
Profesional
Técnico/ventas
2%
0% Apoyo/adm.
Obrero Función
68
Estadística para Comunicadores
Interpretación Del total de trabajadores, el 16,4% son de Apoyo/adm. Del total de trabajadores, el 47,5% manifestaron tener una buena relación con la gerencia. Del total de trabajadores, el 23,8% son obreros y manifestaron tener una regular relación con la gerencia.
Con respecto al total de columnas Distribución de trabajadores según su función por tipo de relación con la gerencia Relación con la gerencia Función Buenas Regulares Malas 31.03% 4.55% 0.00% Apoyo/adm. 17.24% 65.91% 100.00% Obrero 18.97% 13.64% 0.00% Profesional 32.76% 15.91% 0.00% Técnico/ventas 100% 100% 100% Total general
Distribución de trabajadores según su función por tipo de relación con la gerencia 100%
100%
Apoyo/adm.
Porcentaje de trabajadores
90%
Obrero
80%
Profesional
66%
70%
Técnico/ventas
60% 50% 40% 30% 20%
33%
31% 17% 19%
14%
16%
5%
10% 0%
Buenas
Regulares Relación con la gerencia
Malas
Interpretación Del total de trabajadores que tienen una buena relación con la gerencia, el 31% son de Apoyo/adm. Del total de trabajadores que tienen una mala relación con la gerencia, el 100% son obreros.
69
Estadística para Comunicadores
Con respecto al total de filas Distribución de trabajadores según relación con la gerencia por función Relación con la gerencia Función Total general Buenas Regulares Malas 90.00% 10.00% 0.00% 100.00% Apoyo/adm. 16.95% 49.15% 33.90% 100.00% Obrero 64.71% 35.29% 0.00% 100.00% Profesional 73.08% 26.92% 0.00% 100.00% Técnico/ventas
Distribución de trabajadores según su relación con la gerencia por función Buenas
100%
Porcentaje de trabajadores
90%
Regulares
90%
Malas
80%
73% 65%
70% 60%
49%
50% 40%
34%
35% 27%
30% 20% 10%
17% 10%
0%
Apoyo/adm.
Obrero
Profesional
Técnico/ventas
Función
Interpretación Del total de trabajadores de Apoyo/adm., el 90% tiene una buena relación con la gerencia. Del total de obreros, el 17% tiene una buena relación con la gerencia.
70
Estadística para Comunicadores
Gráfico de barras apiladas Los datos también pueden ser representados en barras apiladas de porcentajes donde la cantidad para cada valor de la variable elegida para el eje horizontal representa el total parcial (o el 100%) y las cantidades (o los porcentajes) de la segunda variable van a dar lugar a dicha cantidad (o el 100%). Ejemplo Un productor musical ha entrevistado a 425 personas haciéndolas oír una canción y pidiéndoles que la identifiquen. Después de procesar la información en SPSS obtuvo la siguiente tabla: Distribución de individuos por género musical y grado identificación del candidato. Tabla de contingencia Identifi ca al candi dato *de Género musical Identif ica al candidat o
Plenamente
Medianamente
No ident if ica
Total
Recuent o % de I dent if ica al candidat o % de Género musical % del total Recuent o % de I dent if ica al candidat o % de Género musical % del total Recuent o % de I dent if ica al candidat o % de Género musical % del total Recuent o % de I dent if ica al candidat o % de Género musical % del total
Género musical Reggaet on Vals Cumbia 149 97 55
Total 301
49.5%
32.2%
18.3%
100.0%
84.2% 35.1% 12
63.0% 22.8% 30
58.5% 12.9% 35
70.8% 70.8% 77
15.6%
39.0%
45.5%
100.0%
6.8% 2.8% 16
19.5% 7.1% 27
37.2% 8.2% 4
18.1% 18.1% 47
34.0%
57.4%
8.5%
100.0%
9.0% 3.8% 177
17.5% 6.4% 154
4.3% .9% 94
11.1% 11.1% 425
41.6%
36.2%
22.1%
100.0%
100.0% 41.6%
100.0% 36.2%
100.0% 22.1%
100.0% 100.0%
Para realizar el gráfico de barra apilada considerando el gran total 100%. Distribución de individuos según género musical y grado de identificación del candidato Género musical Plenamente Medianamente No identifica Total preferido Reggaeton 35% 3% 4% 42% Vals 23% 7% 6% 36% Cumbia 13% 8% 1% 22% Total 71% 18% 11% 100%
71
Estadística para Comunicadores
Porcentaje de encuestados
Distribución de individuos según género musical y grado de identificación del candidato 45% 40% 35% 30% 25% 20% 15% 10% 5% 0%
4% 3%
6%
7% 1% 8%
35% 23%
13% Reggaeton Plenamente
Vals
Cumbia
Género musical Medianamente No identifica
Gráfico de barras apiladas al 100% Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada categoría. El alto de cada barra es el mismo para cada categoría. Para realizar un gráfico apilado al 100% con respecto a género musical preferido (fila). Distribución de individuos según identificación del candidato por género musical Género musical Plenamente Medianamente No identifica Total preferido Reggaeton 84% 7% 9% 100% Vals 63% 19% 18% 100% Cumbia 59% 37% 4% 100%
Porcentaje de encuestados
Distribución de individuos según identificación del candidato por género musical 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
9% 7%
4%
18%
37%
19%
84%
Reggaeton
63%
59%
Vals
Cumbia
Génro musical Plenamente
Medianamente
No identifica
72
Estadística para Comunicadores
Ejercicios 1. Se tiene información de una muestra de 805 hogares según nivel socioeconómico y área de residencia. Los resultados se presentan a continuación: Nivel socioeconómico NSE A NSE B NSE C NSE D NSE E Total
Área de residencia Área Área Rural Urbana 15 2 48 3 105 145 94 175 38 180 300 505
a. ¿Cuál es el título que llevaría la tabla anterior?
Título
b. Coloque título a los siguientes gráficos:
Total 17 51 250 269 218 805
73
Estadística para Comunicadores
2. La siguiente tabla fue elaborada el Instituto Peruano de Marketing (IPM) y muestra al grupo de profesionales de Ciencias de la Comunicación del semanario “Ultima Hora”. La clasificación se realizó de acuerdo a la categoría laboral y nivel salarial. Nivel salarial Categoría Laboral
Bajo
Medio
Alto
Total
Jefe de sección
46
54
57
157
Redactor
61
60
23
144
Colaborador
73
47
29
149
180
161
109
450
Total
a. ¿Cuál es el título que llevaría la tabla anterior?
Título
b. Interprete el valor de la celda sombreada . Valor 23 con respecto al total de fila
74
Estadística para Comunicadores
Valor 23 con respecto al total de columna
Valor 23 con respecto al gran total
c. Presente la tabla apropiada para elaborar el siguiente gráfico: “Distribución porcentual de profesionales según nivel salarial por categoría laboral”. Nivel salarial Categoría Laboral
Bajo
Jefe de sección Redactor Colaborador Total
d. Elabores el gráfico para la tabla anterior.
Medio
Alto
Total
75
Estadística para Comunicadores
3. Un ejecutivo de medios está interesado en conocer qué medio de comunicación es más eficiente evaluando el éxito o fracaso de los reportes periodísticos difundidos. La siguiente tabla resume la información: Medio de Comunicación Prensa Radio Televisión Total
El reporte tuvo éxito Si No 67 15 12 19 67 28 146 62
Total 82 31 95 208
a. Presente la tabla relativa para elaborar un gráfico de barras comparativas al 100%. Coloque título a la tabla. Título: Medio de Comunicación Prensa Radio Televisión Total
El reporte tuvo éxito Si No
b. Elabore el gráfico para la tabla anterior.
Total
76
Estadística para Comunicadores
Autoevaluación La actividad de la animación es la menos arraigada del sector de la producción de entretenimiento. Por ser transferible culturalmente, es posible tomar contratos desde cualquier parte del mundo. Bajo este contexto un equipo de jóvenes profesionales está decidido en enrumbar en la producción de la animación en 2D y 3D. Sabiendo que el negocio es de escala internacional, uno de los miembros de este equipo propuso realizar un pequeño estudio sobre el comportamiento del mercado y la competencia al cual se enfrentarían. La siguiente tabla resume la información presentada en el reporte final donde se muestra la especialización de un total de 242 producciones y la región de origen: Región Norteamérica Europa Asia Total
Películas y TV 80 10 12 102
Juegos en computadora 27 25 23 75
Otros 10 18 37 65
Total 117 53 72 242
Complete: De las producciones que proceden de Asia, las que son especializadas en juegos de computadoras representan el: __________________%. Coloque el título para el siguiente gráfico que fue presentado en el reporte final.
Estadística para Comunicadores
Unidad 2 Muestreo
Logro: Al término de la Unidad 2, el estudiante selecciona una muestra representativa de la población para el cálculo de los estadísticos, teniendo en cuenta el tipo de muestreo.
Temas de la unidad:
Conceptos y definiciones básicas: población y muestra. Diseño de la encuesta por muestreo. Elaboración de cuestionario. Tipos de muestreo: Muestreo probabilístico: muestreo aleatorio simple, muestreo estratificado y muestreo sistemático Selección de una muestra irrestricta aleatoria.
77
Estadística para Comunicadores
Unidad 2. Muestreo
Unidad Elemental
Población muestreada
Unidad de muestreo
Marco
muestral
•Es el objeto sobre el cual se hace la medición. •También llamada unidad de observación, unidad de análiisis, unidad estadística o elemento. Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemental es cada individuo.
•Es el conjunto de todas las unidades elementales posibles que podrían extraerse en una muestra; es decir, es la población de donde se extrae la muestra.
•Es la unidad donde realizamos la muestra. •Por ejemplo, si queremos estudiar a las personas pero no tenemos la lista de todos los individuos que pertenecen a la población objetivo, la unidad de muestreo sería cada familia y la unidad elemental sería cada individuo que vive en la familia
•Es una lista de las unidades de muestreo que estan disponibles para elección.
78
Estadística para Comunicadores
79
Ejemplo Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números telefónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de todas las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas las áreas que contienen granjas.
Censo Es una investigación estadística que consiste en el recuento de la totalidad de los elementos que componen la población por investigar. Es necesario que se especifique el espacio y el tiempo al que se refiere el recuento.
Muestreo Cuando se opta por una investigación usando una muestra en vez de la población, el estudio estadístico comprende por lo menos cuatro etapas:
Definición de la población objetivo y búsqueda del marco muestral. Determinación del tamaño de la muestra. Selección de las unidades. Registro de las observaciones.
En el curso trabajaremos las dos últimas.
La selección de las unidades y El registro de las observaciones.
80
Estadística para Comunicadores
Ejemplo Niveles socioeconómicos en Lima Metropolitana y Callao Asociación Peruana de Empresas de Investigación de Mercados (APEIM) Miraflores, Abril de 2005 Ficha técnica Universo de estudio Se consideró como universo de estudio a todos los hogares pertenecientes a Lima Metropolitana entendida como los distritos de Lima ubicados en el núcleo urbano (sin considerar balnearios) y la Provincia Constitucional del Callao. Se definió como hogar, al conjunto de personas que, habitando en la misma vivienda, preparan y consumen sus alimentos en común. La persona informante fue el jefe de familia, definido como aquella persona que más aporta económicamente en el hogar. Marco muestral Para el desarrollo de la investigación se consideró como marco muestral: La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI). Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de mayor crecimiento de la ciudad (conos) Tamaño de la muestra Se entrevistó a un total de 3.598 hogares distribuidos en 41 distritos. El margen de error máximo probable con un nivel de confianza del 95.1 % y considerando el máximo de dispersión (p = q = 50%) fue de ± 1.63%. Dentro de esta muestra se realizaron 200 entrevistas en Distritos con predominio de los N.S.E. Muy Alto/Alto con el propósito de obtener una submuestra estadísticamente significativa para este segmento. El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada uno de los distritos de Lima Metropolitana. Selección de la muestra Determinada la cantidad de entrevistas a aplicar por distrito, se procedió a sortear tantas manzanas como entrevistas se requerían. Dentro de cada manzana se seleccionó por un sistema aleatorio simple cinco viviendas: una titular y cuatro reemplazos o suplentes. Los hogares originalmente seleccionados (titulares), fueron visitados hasta en tres oportunidades antes de proceder al reemplazo. Se controló que la tasa de reemplazo no excediera el 10% del total de entrevistas originalmente sorteadas.
Elección de la muestra Se seleccionará los elementos del marco de muestreo que conformarán la muestra aplicando la técnica de muestreo apropiada para el estudio que se desea llevar a cabo.
Estadística para Comunicadores
81
Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño “n” tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos: muestreo simple aleatorio, muestreo sistemático y muestreo estratificado.
Muestreo aleatorio simple Es el procedimiento por el cual se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de muestreo de una población que contiene un total de N unidades. Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida. Pasos a seguir para seleccionar una muestra simple aleatoria 1. Enumere las unidades del marco muestral con números sucesivos. 2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra, usando una tabla de números aleatorios. 3. La selección de las unidades se realiza sin reemplazo.
El muestreo aleatorio simple presenta dos propiedades: Equiprobable: Cada unidad tiene las mismas posibilidades de ser elegida. Independencia: La selección de una unidad no influye en la selección de otras unidades. Pero en el mundo real es difícil encontrar muestras completamente independientes y representativas. Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y cuenta varias veces a los que tienen varios números.
82
Estadística para Comunicadores
Ejercicio 1. Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla que se muestra a continuación información acerca de las variables: ingreso mensual (en soles) y años cumplidos en la empresa. Trabajadores registrados Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
Ingreso (en soles) 2300 2800 2400 2500 2300 2100 1700 2000 2200 2100 1700 2500 2800 2400 1700 2400 2200 2200 2300 2800 2100 1700 2500 2400 2700 1700 1600 2600 2500 2500 2700 1700 1600 2400 1900 1800 1800 2400 2600 2700 2100 2300
Años en la empresa 5 11 4 2 3 2 2 0 7 4 0 2 13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13 16 17 1 1 11 3 5 3 14 16 18 11 14
Nº 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92
Ingreso (en soles) 2100 2100 1800 2000 2100 1900 2000 2300 2000 1700 1900 2000 2400 1700 1700 2400 2500 2600 2100 1900 2000 1800 2100 2300 2700 2800 1800 1700 1700 1700 1700 2100 2600 2400 2600 1900 1600 1900 2100 1700 2100 1700
Años en la empresa 13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13 16 14 7 9 7 10 12 20 20 3 5 4 0 1 6 17 9 19 7 0 3 14 0 15 1
Nº 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142
Ingreso (en soles) 2400 1700 2500 1700 2400 2400 1900 1700 2100 2000 2000 2500 1700 2500 1700 2600 1600 1800 2100 1700 2400 2600 2100 2100 2400 1700 2600 2400 2700 2100 1600 2100 1900 2100 2200 2400 1800 2600 2700 2500 2500 1900
Años en la empresa 16 0 12 3 17 16 7 1 6 5 3 13 0 19 3 19 1 6 10 0 16 17 10 8 17 1 20 16 17 12 0 15 5 12 12 13 4 17 20 16 16 6
83
Estadística para Comunicadores
43 44 45 46 47 48 49 50
1700 2200 2900 1800 2100 2000 2000 2900
0 13 20 5 16 12 12 20
93 94 95 96 97 98 99 100
2300 2500 2600 1900 2500 1800 1700 2000
14 16 18 3 19 6 2 10
143 144 145 146 147 148 149 150
2100 1700 1500 1800 2100 2700 1800 2100
15 9 0 18 10 19 9 15
a. Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Elabore un listado con el número seleccionado y el valor del ingreso mensual y años en la empresa. Use las columnas C4, C8, C11 y C15 de la tabla de números aleatorios. b. Con la muestra obtenida estime e interprete las medidas de tendencia central para la variable ingreso mensual. c. Con la muestra obtenida estime e interprete los cuartiles para la variable años en la empresa. Solución Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra. Como el marco muestral tiene ………. elementos usaremos las columnas ………………………. para elegir números de ………. cifras. a. Elabore un listado con el número seleccionado y el valor del ingreso mensual y años en la empresa: Posición
Ingreso mensual (en soles)
Años en la empresa
Estadística para Comunicadores
84
b. Con la muestra obtenida estime e interprete las medidas de tendencia central para la variable ingreso mensual.
c. Con la muestra obtenida estime e interprete los cuartiles para la variable años en la empresa.
85
Estadística para Comunicadores
TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 4 8 2 4 6 6 3 5 4 5 6 0 5 2 9 2 9 8 1 4 4 1 9 8 5 1 1 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 9 6 0 8 3 5 6 6 6 4 0 8 6 3 1 6 4 1 6 5 2 7 7 2 9 9 9 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 6 1 2 9 5 0 4 0 9 8 2 0 2 6 1 3 1 8 9 9 0 1 2 6 3 7 1 9 4 5 8 1 1 4 5 6 7 9 9 9 2 1 0 0 3 6 9 6 5 0 6 4 7 9 8 1 7 2 4 5 4 1 2 4 4 6 9 2 6 6 4 9 3 4 4 2 4 5 9 0 8 7 4 8 6 1 2 8 1 3 3 2 0 2 6 0 7 2 9 3 4 0 8 1 3 3 7 3 2 4 8 6 1 8 7 1 3 4 3 9 3 1 7 8 3 7 0 2 1 4 7 5 7 3 1 1 9 3 3 8 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 5 9 9 8 4 4 5 9 1 5 4 7 3 0 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 5 3 8 0 4 3 9 4 6 0 8 8 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 6 9 5 9 4 9 1 8 2 0 2 5 3 9 7 4 9 1 4 8 8 6 6 8 5 9 4 8 3 8 1 2 2 4 0 1 4 5 7 7 4 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 4 8 1 5 8 5 5 1 4 9 6 4 4 4 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 5 5 8 8 4 3 4 8 9 0 6 7 6 9 2 0 9 8 2 8 3 4 3 2 8 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 3 3 2 5 6 7 6 1 6 6 1 7 6 5 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 7 5 4 0 9 5 7 8 7 5 0 8 6 2 7 1 7 8 8 3 8 6 9 9 2 7 4 6 0 9 2 6 1 5 1 2 3 1 8 1 2 3 3 6 3 4 9 6 4 4 9 8 5 7 3 0 1 9 7 9 7 9 4 4 1 6 6 7 7 4 7 1 5 3 7 0 9 2 5 2 1 0 0 7 8 9 9 6 8 5 6 8 1 9 2 7 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 2 6 6 4 1 4 8 1 0 6 0 1 3 4 5 1 9 0 3 9 1 6 1 7 8 8 2 8 9 0 5 8 4 9 2 2 3 9 8 5 9 5 8 6 1 9 2 5 0 0 7 9 0 0 7 4 1 9 1 0 9 7 5 1 2 7 1 9 4 8 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 6 9 9 8 0 8 1 8 2 6 6 8 4 3 1 6 1 0 5 7 5 7 0 6 3 0 4
C15 C16 6 9 7 9 6 0 4 8 7 4 7 0 8 7 6 1 3 2 2 4 6 5 4 2 7 9 7 9 3 3 7 4 9 3 3 4 6 8 0 6 8 7 5 9 1 2 5 7 4 8 2 7 7 4 4 7 6 3 0 0 8 7 4 1 8 1 1 8 6 2 5 9 0 8 3 4 0 7 4 0 1 7 8 1 0 9 0 7 7 8 5 4 4 8 8 0 0 7 1 4
C17 C18 C19 8 0 0 8 5 9 7 5 6 1 8 5 1 5 4 1 5 8 0 1 9 7 9 9 3 7 7 4 8 3 2 0 0 1 2 5 1 4 6 0 6 2 0 8 3 8 0 2 6 8 6 6 9 8 1 6 8 0 3 2 1 2 2 9 0 6 0 3 0 7 9 6 9 4 7 8 7 3 5 7 5 6 7 2 4 1 2 8 6 8 9 4 9 1 3 1 6 2 2 6 1 4 5 3 2 5 6 6 6 4 4 2 3 2 9 8 6 4 6 8 0 1 5 7 6 4 1 2 8 8 4 8 4 9 9 8 6 2 9 6 6 2 6 6 8 2 5 0 3 0
C20 9 0 4 4 9 7 7 8 9 6 4 4 5 8 5 5 0 1 1 8 3 8 8 7 0 6 0 8 8 4 4 3 7 4 3 6 0 8 8 8 5 6 6 0 4 3 9 3 1 8
86
Estadística para Comunicadores
2. El director de una revista tiene información de todo su personal y desea obtener una muestra aleatoria de trabajadores. El registro se muestra a continuación: Trabajadores registrados N° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Tiempo de servicio Edad 73 23 96 46 110 67 105 60 91 43 90 36 129 46 129 46 91 43 96 46 110 67 129 46 100 35 99 49 113 55 101 39 86 45 104 42 126 57 98 30 126 58 98 30 101 39 86 40 104 42 99 49 113 55 98 30 126 57 98 31 104 53 104 53 81 29 124 56 91 43 106 45 106 45 91 43 104 63 104 53
N° 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
Tiempo de servicio Edad 106 45 99 49 94 35 98 30 98 30 99 49 98 30 98 30 73 23 73 23 95 33 95 33 96 46 96 46 110 67 124 56 90 36 90 36 101 35 101 35 124 56 95 33 95 33 96 42 96 46 110 67 124 56 99 49 131 32 131 333 113 55 94 35 93 42 91 47 91 47 86 41 93 42 91 47 91 47 86 45
N° 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
Tiempo de servicio Edad 99 49 131 32 131 32 93 42 104 53 81 29 124 56 98 56 98 56 106 45 129 46 106 45 129 46 124 56 98 56 98 56 104 53 106 45 129 46 124 56 98 56 117 30 99 49 104 33 94 35 101 39 123 44 98 30 88 60 123 40 98 30 88 59 101 39 117 30 90 36 98 30 88 59 123 40 98 30 88 59
87
Estadística para Comunicadores
a. TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4
C17 C18 C19 8 0 0 8 5 9 7 5 6 1 8 5 1 5 4 1 5 8 0 1 9 7 9 9 3 7 7 4 8 3 2 0 0 1 2 5 1 4 6 0 6 2 0 8 3 8 0 2 6 8 6 6 9 8 1 6 8 0 3 2 1 2 2 9 0 6 0 3 0 7 9 6 9 4 7 8 7 3 5 7 5 6 7 2 4 1 2 8 6 8 9 4 9 1 3 1 6 2 2 6 1 4 5 3 2 5 6 6 6 4 4 2 3 2 9 8 6 4 6 8 0 1 5 7 6 4 1 2 8 8 4 8 4 9 9 8 6 2 9 6 6 2 6 6 8 2 5 0 3 0
C20 9 0 4 4 9 7 7 8 9 6 4 4 5 8 5 5 0 1 1 8 3 8 8 7 0 6 0 8 8 4 4 3 7 4 3 6 0 8 8 8 5 6 6 0 4 3 9 3 1 8
88
Estadística para Comunicadores
a. Para seleccionar una muestra de 12 trabajadores aplique el muestreo simple aleatorio. Elabore un listado con el número seleccionado y el valor de su tiempo de servicio y edad. Utilice para la selección las columnas: C9; C2; C10; C15 y C1 de la tabla de números aleatorios. b. Con la muestra seleccionada, calcule el tiempo promedio de servicio y el porcentaje de trabajadores mayores de 40 años. Solución Como el marco muestral tiene ………. elementos o unidades elementales, usaremos las columnas ……………………. para elegir números de ………. cifras. a. Elabore un listado con el número seleccionado y el valor de su tiempo de servicio y lugar de procedencia. Posición
Tiempo de servicio
Edad
b. Con la muestra seleccionada, calcule el tiempo promedio de servicio y el porcentaje de trabajadores cuyo lugar de procedencia es el distrito de Villa el Salvador.
Estadística para Comunicadores
89
Muestreo estratificado Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de sus elementos. El objetivo del diseño estratificado es dar un tratamiento especial a cada estrato, ya sea por razones administrativas, de costo, logísticas o minimizar variabilidad. La característica del estrato es que dentro del él los datos son homogéneos pero heterogéneos entre si. Pasos a seguir para seleccionar una muestra estratificada 1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a todos los elementos de la población y que cada elemento pertenezca solamente a un estrato. 2. Una vez conocido el tamaño de muestra a seleccionar, calcule la cantidad de elementos a seleccionar en cada estrato de manera proporcional al tamaño de cada estrato. El tamaño de muestra para cada estrato se obtiene mediante la siguiente fórmula: nh
Nh n N
3. Seleccione muestras aleatorias simples para cada uno de los estratos.
Recomendaciones para el uso de muestras estratificadas
Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén relacionadas entre sí. No se deben considerar la formación de muchos estratos, generalmente se usan entre tres y ocho estratos. Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto pueden no ser considerados. La variable de estratificación la suele sugerir el investigador o el estadístico.
90
Estadística para Comunicadores
Ejemplo La empresa de telecomunicaciones RVTV tiene 120 empleados de los cuales tiene información de las variables: ingreso en soles, nivel de educación, años en la empresa y satisfacción laboral.
Nº
Ingreso (en soles)
Nivel de Educación
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
2300 2800 2400 2500 2300 2100 1700 2000 2200 2100 1700 2500 2800 2400 1700 2400 2200 2200 2300 2800 2100 1700 2500 2400 2700 1700 1600 2600 2500 2500 2100 2300 1700 2200 2900 1800 2100 2000 2000 2900 2100 2100 1800 2000 2100
Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica
Años cumplidos en la empresa 5 11 4 2 3 2 2 0 7 4 0 2 13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13 16 11 14 0 13 20 5 16 12 12 20 13 9 1 9 10
Satisfacción laboral
Nº
Insatisfecho Satisfecho Satisfecho Satisfecho No opina No opina No opina Insatisfecho Satisfecho Insatisfecho Insatisfecho No opina Satisfecho No opina Insatisfecho Satisfecho Satisfecho Insatisfecho Satisfecho Satisfecho No opina Insatisfecho Insatisfecho No opina Satisfecho Insatisfecho No opina Satisfecho Satisfecho Insatisfecho Insatisfecho Insatisfecho Satisfecho Insatisfecho Satisfecho Satisfecho Satisfecho Insatisfecho Insatisfecho Satisfecho No opina No opina Insatisfecho Satisfecho Satisfecho
61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105
Ingreso Nivel de (en Educación soles) 2100 1700 2300 2500 2600 1900 2500 1800 1700 2000 2400 1700 2500 1700 2400 2400 1900 1700 2100 2000 2000 2500 1700 2500 1700 2600 1600 1800 2100 1700 2400 2600 2100 2100 2400 1700 2600 2400 2700 2100 1600 2100 1900 2100 2200
Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior
Años cumplidos en la empresa 15 1 14 16 18 3 19 6 2 10 16 0 12 3 17 16 7 1 6 5 3 13 0 19 3 19 1 6 10 0 16 17 10 8 17 1 20 16 17 12 0 15 5 12 12
Satisfacción laboral Insatisfecho Satisfecho Insatisfecho Insatisfecho No opina No opina Insatisfecho Insatisfecho Satisfecho Satisfecho Insatisfecho Satisfecho Satisfecho Insatisfecho Satisfecho Satisfecho No opina Insatisfecho Insatisfecho No opina Satisfecho Insatisfecho No opina Satisfecho Satisfecho No opina Insatisfecho Insatisfecho Satisfecho Insatisfecho Satisfecho Insatisfecho Insatisfecho Satisfecho Insatisfecho Satisfecho Satisfecho Satisfecho Insatisfecho Insatisfecho Satisfecho Satisfecho Satisfecho Satisfecho Satisfecho
91
Estadística para Comunicadores
46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
1900 2000 2300 2000 1700 1700 2100 2600 2400 2600 1900 1600 1900 2100 1700
Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica
4 10 11 7 1 1 6 17 9 19 7 0 3 14 0
Insatisfecho Satisfecho Satisfecho No opina Insatisfecho Satisfecho Satisfecho Satisfecho Insatisfecho Satisfecho Satisfecho Satisfecho No opina No opina Satisfecho
106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
2400 1800 2600 2700 2500 2500 1900 2100 1700 1500 1800 2100 2700 1800 2100
Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior
13 4 17 20 16 16 6 15 9 0 18 10 19 9 15
Satisfecho No opina Insatisfecho Insatisfecho No opina Satisfecho Insatisfecho No opina Satisfecho Satisfecho Insatisfecho Insatisfecho Insatisfecho Satisfecho Insatisfecho
a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como variable de estratificación el nivel de educación. Elabore un listado identificando el número seleccionado y el valor respectivo de los años cumplidos en la empresa. Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y para el estrato 3 use C4, C3, C5 y C7. b. Con la muestra obtenida calcule la proporción de empleados que tienen más de 12 años en la empresa. Solución a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como variable de estratificación el nivel de educación. Elabore un listado identificando el número seleccionado y el valor respectivo de los años cumplidos en la empresa. Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y para el estrato 3 use C4, C3, C5 y C7. Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3 son: secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccionamos muestras aleatorias simples. Cantidad seleccionada por estrato
Números de elementos en el estrato Nh
Posiciones (desde – hasta)
1. Secundaria
N1 = 30
1 – 30
2. Técnica
N2 = 50
31 – 80
n2
N2 50 n 16 6.67 7 N 120
3. Superior
N3 = 40
81 – 120
n3
N3 40 n 16 5.33 5 N 120
Total
N = 120
Estratos
nh
n1
Nh n N
N1 30 n 16 4 N 120
n = 16
92
Estadística para Comunicadores
Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y C5. Observemos que las posiciones de los primeros elementos a elegir están entre 1 y 30. TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 4 8 2 4 6 6 3 5 4 5 6 9 2 9 8 1 4 4 1 9 8 5 0 2 1 3 3 9 1 6 2 9 7 9 6 0 8 3 5 6 6 6 4 0 1 6 4 1 6 5 2 7 7 2 9 2 9 0 5 5 0 8 4 8 7 4 6 1 2 9 5 0 4 0 9 8 2 1 3 1 8 9 9 0 1 2 6 3
C12 0 1 1 8 9 6 0 7
C13 5 1 2 6 9 2 2 1
C14 C15 2 6 9 7 6 6 3 4 9 7 1 7 6 8 9 6
C16 9 9 0 8 4 0 7 1
C17 8 8 7 1 1 1 0 7
C18 0 5 5 8 5 5 1 9
C19 0 9 6 5 4 8 9 9
C20 9 0 4 4 9 7 7 8
Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es: Estrato Secundaria Posición
Años en la empresa
02 16 29 13
11 9 13 13
Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10 y C11. Observemos que las posiciones de los elementos a elegir están entre 31 y 80. TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0
C17 C18 8 0 8 5 7 5 1 8 1 5 1 5
Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:
C19 C20 0 9 9 0 6 4 5 4 4 9 8 7
Estadística para Comunicadores
93
Estrato Técnica Posición Años en la empresa 54 9 62 1 66 3 77 7 48 11 67 19 44 9 Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5 y C7. Observemos que las posiciones de los elementos a elegir están entre 81 y 120. TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 1 1 4 5 6 7 9 4 5 8 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 0 8 1 3 3 7 3 9 3 4 2 4 8 6 7 9 0 6 2 8 1 3 4 3 9 3 1 1 8 7 7 8 3 7 3 3 0 8 3 5
Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es: Estrato Superior Posición Años en la empresa 114 9 81 3 97 20 105 12 83 0 b. Con la muestra obtenida calcule la proporción de empleados que tienen más de 12 años en la empresa. Solución Luego, con los elementos seleccionados se tiene que la proporción de empleados con más de 12 años en la empresa es igual a 4/16 = 0,25.
94
Estadística para Comunicadores
Ejercicio 1. La siguiente tabla muestra a los 120 alumnos de la especialidad de Comunicaciones, de la universidad El Saber, a quienes se les preguntó por su emisora radial preferida y por la cantidad de horas a la semana que la escucha. Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Radio Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno
Horas 6 10 4 2 3 6 7 6 8 9 11 3 4 2 6 4 9 5 2 7 4 6 7 8 9 10 5 4 7 8 4 6 7 5 8 9 4 5 2 9
Posición 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
Radio Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno
Horas 6 6 8 9 4 6 7 9 8 10 12 9 9 8 4 6 7 8 7 3 6 9 2 5 1 4 7 6 7 8 4 5 3 6 5 8 7 9 10 3
Posición 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
Radio Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta
Horas 4 3 3 5 5 8 7 6 9 9 4 2 11 2 3 8 6 7 9 4 8 7 7 9 6 7 9 8 3 11 13 14 9 8 6 5 7 3 6 5
95
Estadística para Comunicadores
a. Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la variable Radio como variable de estratificación. Elabore un listado con el alumno seleccionado y la cantidad de horas a la semana que escucha la radio de su preferencia. Para el estrato 1 use las columnas C6, C4 y C2, para el estrato 2 use las columnas C15, C10, C2 y C11 y para el estrato 3 use C6, C17, C12, C4, C1, y C7. b. Con la muestra obtenida calcule el promedio de horas a la semana que los alumnos escuchan la radio de su preferencia. Solución a. Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la variable Radio como variable de estratificación. Elabore un listado con el alumno seleccionado y la cantidad de horas a la semana que escucha la radio de su preferencia. Para el estrato 1 use las columnas C6, C4 y C2, para el estrato 2 use las columnas C15, C10, C2 y C11 y para el estrato 3 use C6, C17, C12, C4, C1, y C7. Estrato
Nh
Posición (desde – hasta)
nh
1.
N1=
n1=
2.
N2=
n2=
3.
N3=
n3=
Nh n N
Total
Estrato 1: Estudio 92 Posición
Horas
Estrato 2: Oxígeno Posición
Horas
Estrato 3: Planeta Posición
Horas
b. Con la muestra obtenida calcule el promedio de horas a la semana que los alumnos escuchan la radio de su preferencia. Entonces, con los elementos seleccionados se tiene que el promedio muestral de horas a la semana que los alumnos escuchan la radio de su preferencia es ……................. horas.
96
Estadística para Comunicadores
TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 4 8 2 4 6 6 3 5 4 5 6 0 5 2 9 2 9 8 1 4 4 1 9 8 5 1 1 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 9 6 0 8 3 5 6 6 6 4 0 8 6 3 1 6 4 1 6 5 2 7 7 2 9 9 9 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 6 1 2 9 5 0 4 0 9 8 2 0 2 6 1 3 1 8 9 9 0 1 2 6 3 7 1 9 4 5 8 1 1 4 5 6 7 9 9 9 2 1 0 0 3 6 9 6 5 0 6 4 7 9 8 1 7 2 4 5 4 1 2 4 4 6 9 2 6 6 4 9 3 4 4 2 4 5 9 0 8 7 4 8 6 1 2 8 1 3 3 2 0 2 6 0 7 2 9 3 4 0 8 1 3 3 7 3 2 4 8 6 1 8 7 1 3 4 3 9 3 1 7 8 3 7 0 2 1 4 7 5 7 3 1 1 9 3 3 8 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 5 9 9 8 4 4 5 9 1 5 4 7 3 0 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 5 3 8 0 4 3 9 4 6 0 8 8 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 6 9 5 9 4 9 1 8 2 0 2 5 3 9 7 4 9 1 4 8 8 6 6 8 5 9 4 8 3 8 1 2 2 4 0 1 4 5 7 7 4 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 4 8 1 5 8 5 5 1 4 9 6 4 4 4 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 5 5 8 8 4 3 4 8 9 0 6 7 6 9 2 0 9 8 2 8 3 4 3 2 8 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 3 3 2 5 6 7 6 1 6 6 1 7 6 5 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 7 5 4 0 9 5 7 8 7 5 0 8 6 2 7 1 7 8 8 3 8 6 9 9 2 7 4 6 0 9 2 6 1 5 1 2 3 1 8 1 2 3 3 6 3 4 9 6 4 4 9 8 5 7 3 0 1 9 7 9 7 9 4 4 1 6 6 7 7 4 7 1 5 3 7 0 9 2 5 2 1 0 0 7 8 9 9 6 8 5 6 8 1 9 2 7 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 2 6 6 4 1 4 8 1 0 6 0 1 3 4 5 1 9 0 3 9 1 6 1 7 8 8 2 8 9 0 5 8 4 9 2 2 3 9 8 5 9 5 8 6 1 9 2 5 0 0 7 9 0 0 7 4 1 9 1 0 9 7 5 1 2 7 1 9 4 8 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 6 9 9 8 0 8 1 8 2 6 6 8 4 3 1 6 1 0 5 7 5 7 0 6 3 0 4
C15 C16 6 9 7 9 6 0 4 8 7 4 7 0 8 7 6 1 3 2 2 4 6 5 4 2 7 9 7 9 3 3 7 4 9 3 3 4 6 8 0 6 8 7 5 9 1 2 5 7 4 8 2 7 7 4 4 7 6 3 0 0 8 7 4 1 8 1 1 8 6 2 5 9 0 8 3 4 0 7 4 0 1 7 8 1 0 9 0 7 7 8 5 4 4 8 8 0 0 7 1 4
C17 C18 C19 8 0 0 8 5 9 7 5 6 1 8 5 1 5 4 1 5 8 0 1 9 7 9 9 3 7 7 4 8 3 2 0 0 1 2 5 1 4 6 0 6 2 0 8 3 8 0 2 6 8 6 6 9 8 1 6 8 0 3 2 1 2 2 9 0 6 0 3 0 7 9 6 9 4 7 8 7 3 5 7 5 6 7 2 4 1 2 8 6 8 9 4 9 1 3 1 6 2 2 6 1 4 5 3 2 5 6 6 6 4 4 2 3 2 9 8 6 4 6 8 0 1 5 7 6 4 1 2 8 8 4 8 4 9 9 8 6 2 9 6 6 2 6 6 8 2 5 0 3 0
C20 9 0 4 4 9 7 7 8 9 6 4 4 5 8 5 5 0 1 1 8 3 8 8 7 0 6 0 8 8 4 4 3 7 4 3 6 0 8 8 8 5 6 6 0 4 3 9 3 1 8
97
Estadística para Comunicadores
2. Los siguientes datos han sido extraídos de una investigación realizada por La Defensoría del Pueblo, Comisión de la Verdad y Reconciliación, Comité Internacional Cruz Roja y Coordinadora Nacional de Derechos Humanos sobre un total de 150 personas extraviadas en el Perú entre los años 1980 y 1996 en los 3 principales departamentos donde hubo el brote terrorista: Ayacucho, Huánuco y San Martín. Las variables que se consideraron fueron: Lugar de procedencia, Sexo y Edad al momento de la desaparición. Los datos se presentan a continuación: Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
Lugar de Sexo procedencia Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho F Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M
Edad
Nº
12 40 20 43 28 12 15 28 13 45 10 25 24 32 48 23 7 5 4 9 6 66 18 36 26 17 28 30 19 17 20 21 37 58 18 18 19
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87
Lugar de Sexo procedencia Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Huánuco M Huánuco M Huánuco F Huánuco M Huánuco M
Edad
Nº
44 39 17 19 24 15 17 22 50 42 19 21 15 43 16 30 48 45 41 23 22 20 22 16 45 56 33 22 70 34 69 31 21 27 19 27 20
101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137
Lugar de procedencia Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín
Sexo
Edad
M M F F M M M M M M M M M M M M M M M M M F F M M M M M M M M M M M M M M
24 28 4 2 33 25 21 21 30 21 21 54 38 16 28 36 27 24 45 21 66 70 26 26 14 18 28 25 32 22 21 28 18 29 20 18 21
98
Estadística para Comunicadores
38 39 40 41 42 43 44 45 46 47 48 49 50
Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho
M M F M M F M M M M M M M
18 22 23 50 26 19 54 13 46 28 46 42 40
88 89 90 91 92 93 94 95 96 97 98 99 100
Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco
M M M M M M M M M M M M M
25 18 47 28 32 18 22 28 31 34 25 27 19
138 139 140 141 142 143 144 145 146 147 148 149 150
San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín
M M M M M F M M M M M M M
26 23 35 17 32 32 41 26 20 21 15 22 45
a. Aplique el muestreo estratificado para obtener una muestra de 10 personas desaparecidas. Elabore un listado con el elemento seleccionado y el valor de la edad al momento de la desaparición. Utilice como variable de estratificación: Lugar de procedencia. Estrato 1: Ayacucho Estrato 2: Huánuco Estrato 3: San Martín
C3 ; C5 ; C7 C5; C9 ; C10 ; C12 C4 ; C8 ; C11 ;C15
b. Con la muestra obtenida calcule el promedio de la edad al momento de la desaparición. Solución a. Aplique el muestreo estratificado para obtener una muestra de 10 personas desaparecidas. Elabore un listado con el elemento seleccionado y el valor de la edad al momento de la desaparición. Utilice como variable de estratificación: Lugar de procedencia. Estrato 1: Ayacucho Estrato 2: Huánuco Estrato 3: San Martín Estrato
Nh
C3 ; C5 ; C7 C5; C9 ; C10 ; C12 C4 ; C8 ; C11 ;C15 Posición (desde – hasta)
nh
1.
N1=
n1=
2.
N2=
n2=
3.
N3=
n3=
Total
Nh n N
99
Estadística para Comunicadores
Estrato 1: ……………….. Posición
………………..
Estrato 2: ………………. Posición
………………..
Estrato 3: ………….……. Posición
………………..
b. Con la muestra obtenida calcule el promedio de la edad al momento de la desaparición. Entonces, con los elementos seleccionados se tiene que el promedio de la edad al momento de la desaparición es ……................. años.
100
Estadística para Comunicadores
TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 4 8 2 4 6 6 3 5 4 5 6 0 5 2 9 2 9 8 1 4 4 1 9 8 5 1 1 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 9 6 0 8 3 5 6 6 6 4 0 8 6 3 1 6 4 1 6 5 2 7 7 2 9 9 9 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 6 1 2 9 5 0 4 0 9 8 2 0 2 6 1 3 1 8 9 9 0 1 2 6 3 7 1 9 4 5 8 1 1 4 5 6 7 9 9 9 2 1 0 0 3 6 9 6 5 0 6 4 7 9 8 1 7 2 4 5 4 1 2 4 4 6 9 2 6 6 4 9 3 4 4 2 4 5 9 0 8 7 4 8 6 1 2 8 1 3 3 2 0 2 6 0 7 2 9 3 4 0 8 1 3 3 7 3 2 4 8 6 1 8 7 1 3 4 3 9 3 1 7 8 3 7 0 2 1 4 7 5 7 3 1 1 9 3 3 8 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 5 9 9 8 4 4 5 9 1 5 4 7 3 0 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 5 3 8 0 4 3 9 4 6 0 8 8 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 6 9 5 9 4 9 1 8 2 0 2 5 3 9 7 4 9 1 4 8 8 6 6 8 5 9 4 8 3 8 1 2 2 4 0 1 4 5 7 7 4 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 4 8 1 5 8 5 5 1 4 9 6 4 4 4 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 5 5 8 8 4 3 4 8 9 0 6 7 6 9 2 0 9 8 2 8 3 4 3 2 8 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 3 3 2 5 6 7 6 1 6 6 1 7 6 5 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 7 5 4 0 9 5 7 8 7 5 0 8 6 2 7 1 7 8 8 3 8 6 9 9 2 7 4 6 0 9 2 6 1 5 1 2 3 1 8 1 2 3 3 6 3 4 9 6 4 4 9 8 5 7 3 0 1 9 7 9 7 9 4 4 1 6 6 7 7 4 7 1 5 3 7 0 9 2 5 2 1 0 0 7 8 9 9 6 8 5 6 8 1 9 2 7 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 2 6 6 4 1 4 8 1 0 6 0 1 3 4 5 1 9 0 3 9 1 6 1 7 8 8 2 8 9 0 5 8 4 9 2 2 3 9 8 5 9 5 8 6 1 9 2 5 0 0 7 9 0 0 7 4 1 9 1 0 9 7 5 1 2 7 1 9 4 8 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 6 9 9 8 0 8 1 8 2 6 6 8 4 3 1 6 1 0 5 7 5 7 0 6 3 0 4
C15 C16 6 9 7 9 6 0 4 8 7 4 7 0 8 7 6 1 3 2 2 4 6 5 4 2 7 9 7 9 3 3 7 4 9 3 3 4 6 8 0 6 8 7 5 9 1 2 5 7 4 8 2 7 7 4 4 7 6 3 0 0 8 7 4 1 8 1 1 8 6 2 5 9 0 8 3 4 0 7 4 0 1 7 8 1 0 9 0 7 7 8 5 4 4 8 8 0 0 7 1 4
C17 C18 C19 8 0 0 8 5 9 7 5 6 1 8 5 1 5 4 1 5 8 0 1 9 7 9 9 3 7 7 4 8 3 2 0 0 1 2 5 1 4 6 0 6 2 0 8 3 8 0 2 6 8 6 6 9 8 1 6 8 0 3 2 1 2 2 9 0 6 0 3 0 7 9 6 9 4 7 8 7 3 5 7 5 6 7 2 4 1 2 8 6 8 9 4 9 1 3 1 6 2 2 6 1 4 5 3 2 5 6 6 6 4 4 2 3 2 9 8 6 4 6 8 0 1 5 7 6 4 1 2 8 8 4 8 4 9 9 8 6 2 9 6 6 2 6 6 8 2 5 0 3 0
C20 9 0 4 4 9 7 7 8 9 6 4 4 5 8 5 5 0 1 1 8 3 8 8 7 0 6 0 8 8 4 4 3 7 4 3 6 0 8 8 8 5 6 6 0 4 3 9 3 1 8
Estadística para Comunicadores
101
Muestreo sistemático En el muestreo sistemático se debe elegir un elemento del marco muestral cada cierto intervalo. Este muestreo supone que se cuenta con una enumeración completa de los elementos de la población. Una característica importante del muestreo sistemático es que presenta menos variabilidad que el muestreo aleatorio simple, esto debido a la presencia de una estratificación innata en el diseño del muestreo sistemático. Procedimiento para seleccionar una muestra sistemática
𝑁
Calcule el valor de k, donde 𝑘 = 𝑛 . El valor de k se redondea al valor del entero menor. Seleccione aleatoriamente un número entero entre 1 y k llamado arranque aleatorio (A) A partir de este número elegido, seleccione el siguiente que ocupa la posición (A + k) del listado del marco muestral y así sucesivamente hasta completar la muestra.
Ejemplo 1. Se tiene a continuación una población de 12 personas a quienes se les consultó su edad. Se desea elegir a cuatro de ellas mediante un muestreo sistemático. Use la columna C3, C6 y C12 de la tabla de números aleatorios. 1. 2. 3. 4. 5.
12 23 35 23 35
6. 7. 8. 9. 10.
37 42 44 64 86
11. 40 12. 27
Solución Calculemos el valor de k, donde
k
N 12 3 n 4
El valor de k se redondea al valor del entero menor, luego k = 3
102
Estadística para Comunicadores
Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado arranque aleatorio (A). Observando la columna C3 de la tabla de números aleatorios tenemos que A = 2.
C1 C2 C3 C4 C5 4 8 2 4 6 9 2 9 8 1 0 2 1 3 3
TABLA DE NÚMEROS ALEATORIOS C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 6 3 5 4 5 6 0 5 2 6 4 4 1 9 8 5 1 1 9 7 9 1 6 2 9 7 1 2 6 6
C16 9 9 0
C17 8 8 7
C18 0 5 5
C19 0 9 6
C20 9 0 4
Los elementos seleccionados serán: Posición
Edad
2. Se tiene una población de 15 personas a quienes se les consultó su edad y se desea elegir a seis de ellas mediante un muestreo sistemático. Use la columna C4, C8 y C1 de la tabla de números aleatorios. Con la muestra seleccionada, estime la edad promedio. 1. 2. 3. 4. 5.
45 33 55 45 39
6. 7. 8. 9. 10.
37 43 21 43 32
11. 12. 13. 14. 15.
30 29 35 32 53
Solución Calculemos el valor de k, donde
k
N .......... n
El valor de k se redondea al valor del entero menor, luego k =……… El arranque aleatorio (A) es …………….
C1 C2 C3 C4 C5 4 8 2 4 6 9 2 9 8 1 0 2 1 3 3 9 6 0 8 3 1 6 4 1 6 2 9 0 5 5
TABLA DE NÚMEROS ALEATORIOS C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 6 3 5 4 5 6 0 5 2 6 4 4 1 9 8 5 1 1 9 7 9 1 6 2 9 7 1 2 6 6 5 6 6 6 4 0 8 6 3 4 5 2 7 7 2 9 9 9 9 7 0 8 4 8 7 4 6 2 1 7
C16 9 9 0 8 4 0
C17 8 8 7 1 1 1
C18 0 5 5 8 5 5
C19 0 9 6 5 4 8
C20 9 0 4 4 9 7
103
Estadística para Comunicadores
Los elementos seleccionados serán: Posición
Edad
Con la muestra seleccionada, estime la edad promedio.
Ejercicio 1. Se tiene información de 40 personas de un barrio de Lima Metropolitana. Obtenga una muestra de siete personas usando el muestreo sistemático y elabore una tabla con la posición seleccionada. Utilice las columnas C3, C10 y C11 de la tabla de números aleatorios. Además, con la muestra obtenida calcule la edad promedio de las personas y el porcentaje de individuos que son mujeres. Individuos registrados Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Sexo Mujer Hombre Hombre Mujer Hombre Mujer Hombre Hombre Mujer Mujer Hombre Hombre Mujer Hombre
Edad 15 16 21 31 21 24 32 26 21 22 18 25 29 25
Estatura 154 154 156 184 173 170 176 188 169 173 177 181 164 159
Nº 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Sexo Mujer Mujer Hombre Mujer Hombre Hombre Mujer Hombre Hombre Hombre Hombre Mujer Mujer Hombre
Edad 19 30 29 25 29 25 16 31 18 21 31 28 19 31
Estatura 178 163 180 174 137 153 168 161 270 173 187 161 172 162
Nº 29 30 31 32 33 34 35 36 37 38 39 40
Sexo Hombre Hombre Mujer Mujer Mujer Hombre Mujer Hombre Mujer Hombre Mujer Mujer
Edad 33 17 34 20 26 25 23 20 34 35 30 29
Estatura 147 167 169 156 164 190 167 169 176 188 155 141
104
Estadística para Comunicadores
Solución Calculemos el valor de k, donde
k
N .......... n
El valor de k se redondea al valor del entero menor, luego k =……… El arranque aleatorio (A) es ……………. TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 4 8 2 4 6 6 3 5 4 5 6 0 5 2 9 2 9 8 1 4 4 1 9 8 5 1 1 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 9 6 0 8 3 5 6 6 6 4 0 8 6 3 1 6 4 1 6 5 2 7 7 2 9 9 9 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1
C15 6 7 6 4 7 7
C16 9 9 0 8 4 0
C17 8 8 7 1 1 1
C18 0 5 5 8 5 5
C19 C20 0 9 9 0 6 4 5 4 4 9 8 7
El cuadro con los datos es: Posición
Sexo
Edad
Estatura
Con la muestra obtenida, calcule la edad promedio y el porcentaje de individuos que son mujeres.
105
Estadística para Comunicadores
2. Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla que se muestra a continuación información acerca de las variables: ingreso mensual (en soles), nivel educativo y años cumplidos en la empresa.
Nº
Ingreso (en soles)
Nivel Educativo
Años en la empresa
Nº
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
2300 2800 2400 2500 2300 2100 1700 2000 2200 2100 1700 2500 2800 2400 1700 2400 2200 2200 2300 2800 2100 1700 2500 2400 2700 1700 1600 2600 2500 2500 2700 1700 1600 2400 1900 1800 1800 2400 2600 2700 2100
Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Técnica
5 11 4 2 3 2 2 0 7 4 1 2 13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13 16 17 1 1 11 3 5 3 14 16 18 11
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91
Ingreso Nivel (en soles) Educativo
2100 2100 1800 2000 2100 1900 2000 2300 2000 1700 1900 2000 2400 1700 1700 2400 2500 2600 2100 1900 2000 1800 2100 2300 2700 2800 1800 1700 1700 1700 1700 2100 2600 2400 2600 1900 1600 1900 2100 1700 2100
Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica
Años en la empresa
Nº
13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13 16 14 7 9 7 10 12 20 20 3 5 4 0 1 6 17 9 19 7 0 3 14 0 15
101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141
Años Ingreso Nivel en la (en soles) Educativo empresa
2400 1700 2500 1700 2400 2400 1900 1700 2100 2000 2000 2500 1700 2500 1700 2600 1600 1800 2100 1700 2400 2600 2100 2100 2400 1700 2600 2400 2700 2100 1600 2100 1900 2100 2200 2400 1800 2600 2700 2500 2500
Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior
16 0 12 3 17 16 7 1 6 5 3 13 0 19 3 19 1 6 10 0 16 17 10 8 17 1 20 16 17 12 0 15 5 12 12 13 4 17 20 16 16
106
Estadística para Comunicadores
42 43 44 45 46 47 48 49 50
2300 1700 2200 2900 1800 2100 2000 2000 2900
Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica
14 0 13 20 5 16 12 12 20
92 93 94 95 96 97 98 99 100
1700 2300 2500 2600 1900 2500 1800 1700 2000
Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica
1 14 16 18 3 19 6 2 10
142 143 144 145 146 147 148 149 150
1900 2100 1700 1500 1800 2100 2700 1800 2100
Superior Superior Superior Superior Superior Superior Superior Superior Superior
6 15 9 0 18 10 19 9 15
a. Aplique el muestreo sistemático para seleccionar una muestra de tamaño 13 empleados. Elabore un listado con la posición seleccionada y el valor de los años cumplidos en la empresa y nivel educativo. Utilice la columna C7, C10 y C15 de la tabla de números aleatorios. b. Con la muestra obtenida, estime e interprete para la variable, años en la empresa el promedio y la mediana. Obtenga además la proporción de empleados con nivel técnico.
Solución a. Aplique el muestreo sistemático para seleccionar una muestra de tamaño 13 empleados. Elabore un listado con la posición seleccionada y el valor de los años cumplidos en la empresa y nivel educativo. Utilice la columna C7, C10 y C15 de la tabla de números aleatorios. Calculemos el valor de k, donde
k
N .......... n
El valor de k se redondea al valor del entero menor, luego k =……… El arranque aleatorio (A) es …………….
C1 C2 C3 C4 C5 4 8 2 4 6 9 2 9 8 1 0 2 1 3 3 9 6 0 8 3 1 6 4 1 6 2 9 0 5 5 6 1 2 9 5 1 3 1 8 9 4 5 8 1 1 0 0 3 6 9
TABLA DE NÚMEROS ALEATORIOS C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 6 3 5 4 5 6 0 5 2 6 4 4 1 9 8 5 1 1 9 7 9 1 6 2 9 7 1 2 6 6 5 6 6 6 4 0 8 6 3 4 5 2 7 7 2 9 9 9 9 7 0 8 4 8 7 4 6 2 1 7 0 4 0 9 8 2 0 2 6 8 9 0 1 2 6 3 7 1 9 6 4 5 6 7 9 9 9 2 1 3 6 5 0 6 4 7 9 8 1 2
C16 9 9 0 8 4 0 7 1 2 4
C17 8 8 7 1 1 1 0 7 3 4
C18 0 5 5 8 5 5 1 9 7 8
C19 0 9 6 5 4 8 9 9 7 3
C20 9 0 4 4 9 7 7 8 9 6
107
Estadística para Comunicadores
El cuadro con los datos es: Posición
Años en la empresa
Nivel Educativo
b. Con la muestra obtenida, estime e interprete para la variable, años en la empresa el promedio y la mediana. Obtenga además la proporción de empleados con nivel técnico. Promedio =
Mediana =
Proporción =
108
Estadística para Comunicadores
3. La siguiente tabla muestra el registro de todos los clientes de una empresa de señal por cable del distrito de Los Olivos. Las variables consideradas fueron: ingreso semanal (en dólares), número de televisores en el hogar y nivel educativo alcanzado por el jefe de familia. N° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
Ingreso semanal 100 80 100 85 105 110 102 110 90 130 180 90 104 100 90 80 120 85 100 98 120 105 120 250 300 120 195 120 250 300 250 230 150 200 190 250 205 220 285 220 400
N° de televisores 3 2 3 1 2 2 4 2 2 3 1 3 3 2 2 1 1 1 2 3 2 2 1 3 4 2 3 3 2 3 2 2 2 3 1 2 2 3 4 2 3
Nivel educativo Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria
N° 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93
Ingreso semanal 200 335 250 250 120 130 235 500 200 395 330 310 300 530 540 200 285 430 400 220 230 300 340 420 550 430 690 500 430 620 400 630 585 350 520 402 220 690 420 450 530
N° de televisores 1 1 2 3 2 2 2 3 1 2 3 3 3 3 2 2 1 3 3 2 2 2 3 2 2 2 3 2 2 3 3 2 1 2 2 2 3 1 2 2 2
Nivel educativo Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior
109
Estadística para Comunicadores
350 400 540 250 295 230 240 400 270 320 295
42 43 44 45 46 47 48 49 50 51 52
2 2 2 3 4 1 2 3 5 2 2
Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Secundaria Secundaria
94 95 96 97 98 99 100 101 102 103 104
300 335 330 380 230 385 303 540 490 495 340
3 1 1 2 2 1 2 2 3 2 3
Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior
a. Seleccione una muestra de 12 clientes aplicando el muestreo sistemático. Elabore un listado con la posición seleccionada y los valores del ingreso semanal (en dólares) y número de televisores en el hogar. Utilice la columna C4, C9 y C15 de la tabla de números aleatorios. b. Con la muestra obtenida estime el promedio de cada variable y la proporción de clientes que tienen a lo más 2 televisores. Solución a. Seleccione una muestra de 12 clientes aplicando el muestreo sistemático. Elabore un listado con la posición seleccionada y los valores del ingreso semanal (en dólares) y número de televisores en el hogar. Utilice la columna C4, C9 y C15 de la tabla de números aleatorios. Calculemos el valor de k, donde
k
N ........... n
El valor de k se redondea al valor del entero menor, luego k =……… El arranque aleatorio (A) es …………….
C1
C2
C3
C4
C5
C6
4 9 0 9 1 2 6 1 4 0 7 4
8 2 2 6 6 9 1 3 5 0 2 9
2 9 1 0 4 0 2 1 8 3 4 3
4 8 3 8 1 5 9 8 1 6 5 4
6 1 3 3 6 5 5 9 1 9 4 4
6 4 9 5 5 0 0 9 4 6 1 2
TABLA DE NÚMEROS ALEATORIOS C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 3 4 1 6 2 8 4 0 5 5 2 4
5 1 6 6 7 4 0 1 6 0 4 5
4 9 2 6 7 8 9 2 7 6 4 9
5 8 9 4 2 7 8 6 9 4 6 0
6 5 7 0 9 4 2 3 9 7 9 8
0 1 1 8 9 6 0 7 9 9 2 7
5 1 2 6 9 2 2 1 2 8 6 4
2 9 6 3 9 1 6 9 1 1 6 8
6 7 6 4 7 7 8 6 3 2 6 4
9 9 0 8 4 0 7 1 2 4 5 2
8 8 7 1 1 1 0 7 3 4 2 1
0 5 5 8 5 5 1 9 7 8 0 2
0 9 6 5 4 8 9 9 7 3 0 5
9 0 4 4 9 7 7 8 9 6 4 4
Estadística para Comunicadores
110
El cuadro con los datos es: Posición
Ingreso semanal
N° de televisores
b. Con la muestra obtenida estime el promedio para las variables cuantitativas y la proporción de clientes que tienen a lo más 2 televisores.
111
Estadística para Comunicadores
Ejercicios de aplicación La siguiente tabla muestra a los 120 alumnos de la especialidad de Publicidad, de la universidad El Saber, a quienes se les preguntó por su emisora radial preferida y por la cantidad de horas a la semana que la escucha. Id 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Radio Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Oxigeno Oxigeno Oxigeno Oxigeno Oxigeno Oxigeno Oxigeno Oxigeno Oxigeno
Horas 6 10 4 2 3 6 7 6 8 9 11 3 4 2 6 4 9 5 2 7 4 6 7 8 9 10 5 4 7 8 4 6 7 5 8 9 4 5 2 9
Id 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
Radio Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno
Horas 6 6 8 9 4 6 7 9 8 10 12 9 9 8 4 6 7 8 7 3 6 9 2 5 1 4 7 6 7 8 4 5 3 6 5 8 7 9 10 3
Id 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
Radio Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta
Horas 4 3 3 5 5 8 7 6 9 9 4 2 11 2 3 8 6 7 9 4 8 7 7 9 6 7 9 8 3 11 13 14 9 8 6 5 7 3 6 5
112
Estadística para Comunicadores
a. Seleccione una muestra sistemática de tamaño 13. Elabore un listado con los alumnos seleccionados y el valor de la radio de su preferencia. Utilice las columnas C4, C10 y C6 de la tabla de números aleatorios. Con la muestra seleccionada calcule el porcentaje de alumnos que escuchan radio Planeta. Solución
N .......... luego k =……… n El arranque aleatorio (A) es ……………. Calculemos el valor de k, donde k
Posición
………………..
Posición
………………..
El porcentaje de alumnos que escuchan radio Planeta es igual a ………………… %. b. Seleccione una muestra aleatoria de tamaño 10 mediante muestreo aleatorio simple. Elabore un listado con los alumnos seleccionados y el valor de la cantidad de horas a la semana que escuchan la radio de su preferencia. Utilice las columnas C14, C17 y C4 de la tabla de números aleatorios. Con la muestra obtenida Estime el promedio y el coeficiente de variabilidad de la cantidad de horas a la semana que escuchan la radio de su preferencia. Posición
………………..
113
Estadística para Comunicadores
Con la muestra obtenida calcule el promedio y el coeficiente de variabilidad.
c. Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Utilice como variable de estratificación: Radio. Elabore un listado con el alumno seleccionado y la cantidad de horas a la semana que escucha la radio de su preferencia. Las columnas para cada estrato se presentan a continuación: Estrato 1: Estudio 92 Estrato 2: Oxigeno Estrato 3: Planeta Estrato
C16 ; C4 ; C12; C5; C10; C12 ; C1; C6; C7; C12; C4; C11; C7 Posición (desde – hasta)
Nh
nh
N1=
n1=
N2=
n2=
N3=
n3=
Nh n N
Total Estrato 1: ……………….. Posición
………………
Estrato 2: ………………. Posición
………………
Estrato 3: ………….……. Posición
………………
Estime el promedio de horas a la semana que escuchan la radio de su preferencia la muestra seleccionada.
Estadística para Comunicadores
112
Autoevaluación El 01 de octubre del año pasado, los integrantes de la Federación de Periodistas del Perú celebraron el Congreso Nacional de Periodistas. En ese acto congresal, se elaboró un listado de los asistentes que laboran en los distintos medios periodísticos de la prensa escrita indicando género y edad. Id 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
género masculino masculino femenino masculino femenino masculino masculino femenino masculino masculino masculino femenino femenino masculino masculino masculino femenino femenino masculino masculino
edad 12 48 64 70 56 50 47 20 35 28 45 54 61 66 30 48 56 29 22 24
Id 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
género masculino femenino femenino masculino masculino masculino masculino masculino masculino masculino femenino femenino femenino masculino masculino masculino masculino femenino femenino femenino
edad 49 27 20 23 31 67 44 46 41 17 56 56 62 17 21 26 51 31 45 63
a. Seleccione una muestra simple aleatoria de tamaño 13. Elabore un listado con el número seleccionado y su valor para la variable edad (en años). Utilice las columnas C12, C7 y C16 de la tabla de números aleatorios. Con la muestra seleccionada estime la proporción de hombres y mujeres asistentes al evento y la edad promedio de los asistentes.
Estadística para Comunicadores
113
b. Seleccione una muestra sistemática de tamaño 11. Elabore un listado con el número del asistente seleccionado y su valor respectivo para la variable edad (en años). Utilice las columnas C14, C9 y C6 de la tabla de números aleatorios. Con la muestra seleccionada estime la proporción de hombres y mujeres asistentes al evento y la edad promedio de los asistentes.
Estadística para Comunicadores
Unidad 3 Probabilidad y Variable aleatoria
LOGRO: Al término de la Unidad 3, el estudiante aplica la teoría de la probabilidad para la toma de decisiones en base a datos históricos.
Temas de la unidad:
Probabilidad: concepto, experimento aleatorio, espacio muestral y evento. Operaciones con eventos en tablas de doble entrada. Variable aleatoria continua. Uso de la tabla de la distribución normal estándar. Cálculo de probabilidades.
114
Estadística para Comunicadores
115
Unidad 3. Probabilidad y variable aleatoria Experimento no aleatorio o determinístico Un experimento determinista es aquel en el que se puede predecir el resultado de su realización y existe ley o fórmula matemática que permite explicarlo. Los experimentos de la física son deterministas. Por ejemplo, el movimiento de caída libre. Experimento aleatorio, espacio muestral, evento y probabilidad
Experimento aleatorio •Es un proceso que al ser realizado u observado repetidas veces, bajo las mismas condiciones, genera más de un posible resultado que no puede ser determinado de antemano.
Espacio muestral •Es el conjunto de todos los posibles resultados que genera un experimento aleatorio. •Se denota mediante el símbolo . Cada elemento del espacio muestral se denomina punto muestral.
Evento •Es todo subconjunto de un espacio muestral. Se denotan por letras mayúsculas, por ejemplo, A y B.
Probabilidad •Es una medida de la posibilidad de ocurrencia de un evento.
Los conceptos probabilísticos se aplican sobre experimentos aleatorios.
Estadística para Comunicadores
116
Probabilidad Es una medida de la posibilidad de ocurrencia de un evento. Ejemplo
Experimento aleatorio • Lanzar un dado
Espacio muestral
• Ω = {1, 2, 3, 4, 5, 6}
Eventos
• A = {1} • B = {1, 2, 3} • C = {2, 4, 6}, etc. Probabilidad
• P(A) = n(A) / n(Ω) = 1 / 6 = 0,167 • P(B) = n(B) / n(Ω) = 3 / 6 = 0,5 • P(C) = n(C) / n(Ω) = 3 / 6 = 0,5
Eventos mutuamente excluyentes Diremos que dos eventos, A y B, son mutuamente excluyentes en el mismo espacio muestral si no pueden ocurrir juntos. Por lo tanto A y B son eventos excluyentes si y solo si AB=. En la teoría de conjuntos los eventos mutuamente excluyentes serían equivalentes a los conjuntos disjuntos, aquellos que no tienen elementos comunes. Ejemplo: Sea el experimento : Contar el número de personas atendidas por un banco en un periodo de tiempo. Sean los eventos A: se atiendan a menos de 20 personas A = { 0, 1, 2,…, 19} y B:
Estadística para Comunicadores
117
se han atendido exactamente a veinticinco personas B = {25}. Como AB=, entonces los eventos son mutuamente excluyentes.
Axiomas de la probabilidad Sea un experimento aleatorio, Ω el espacio muestral asociado a dicho experimento aleatorio y A un evento definido en Ω, entonces la probabilidad del evento A, denotada por P(A), es aquel número que cumple los siguientes axiomas:
Axioma 1: 0 P(A) 1
Axioma 2: P(Ω) = 1
Axioma 3: Si A y B son dos eventos mutuamente excluyentes entonces: P(A B) = P(A) + P(B)
Definición clásica de probabilidad Algunos autores definen la probabilidad como una medida de la posibilidad de ocurrencia de un evento. La definición clásica propone que si el espacio muestral es numerable y cada punto muestral tiene la misma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento A definido sobre es: P A
n A Número de casos favorables al evento A n Número de casos totales
Teoremas básicos de probabilidad
P() = 0, donde es el evento imposible. P(AC) = 1 – P(A) Si A y B son eventos cualesquiera, entonces P(A B) = P(A) + P(B) – P(A B)
118
Estadística para Comunicadores
Para cada pregunta formalice las probabilidades con los eventos Ejemplo Una empresa investigadora de mercados por encargo de un cliente, realizó un estudio acerca de las preferencias del turismo interno que realizan los universitarios. La empresa realizó una encuesta a 220 alumnos de diversas universidades nacionales y privadas; registrándose la condición de la universidad y la región de preferencia para un posible viaje. Los resultados se muestran en la siguiente tabla: Región de preferencia Costa (A) Sierra (B) Selva (C) 8 15 60 12 25 100 20 40 160
Condición de Universidad Nacional (D) Privada (E) Total
Se elige un alumno al azar, determine la probabilidad de que: a. b. c. d.
prefiera viajar a la Sierra. no estudie en una universidad privada. no tenga preferencia por viajar a la Selva y estudie en una universidad nacional. prefiera viajar a la Sierra o estudie en una universidad privada.
Solución a. prefiera viajar a la Sierra.
P( B)
40 0,1818 220
b. no estudie en una universidad privada.
P ( E c ) P ( D)
83 0,3772 220
c. no tenga preferencia por viajar a la Selva y estudie en una universidad nacional.
P(C c D)
8 15 0,1045 220
d. prefiera viajar a la Sierra o estudie en una universidad privada.
P( B E )
40 137 25 152 0,6909 220 220 220 220
Total 83 137 220
119
Estadística para Comunicadores
Ejercicios 1. Se seleccionó una muestra aleatoria de trabajadores de la editorial Óptima para determinar sus planes de jubilación después de cumplir los 65 años de edad. Los trabajadores en la muestra se dividieron en: ejecutivos, empleados y obreros. Los resultados obtenidos fueron:
Trabajador Ejecutivo Empleado Obrero Total
Se jubile 8 20 50
Planes después de los 65 años No ha decidido No se jubile su jubilación 3 1 10 5 22 11
Total
Si se selecciona un trabajador al azar. a. b. c. d.
¿Cuál es la probabilidad de que no se jubile del trabajo? ¿Cuál es la probabilidad de que se jubile o no sea ejecutivo? ¿Cuál es la probabilidad de que no haya decidido su jubilación y no sea obrero? ¿Cuál es la probabilidad de que se jubile o no haya decidido su jubilación?
Solución a. ¿Cuál es la probabilidad de que no se jubile del trabajo? Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............ ...........................
b. ¿Cuál es la probabilidad de que se jubile o no sea ejecutivo? Sean los eventos ……… : ……………………………………………………………. ……… : ……………………………………………………………. Se pide calcular: P..................... .........................................
c. ¿Cuál es la probabilidad de que no haya decidido su jubilación y no sea obrero? Sean los eventos
120
Estadística para Comunicadores
……… : ……………………………………………………………. ……… : ……………………………………………………………. Se pide calcular: P..................... .........................................
d. ¿Cuál es la probabilidad de que se jubile o no haya decidido su jubilación? Sean los eventos ……… : ……………………………………………………………. ……… : ……………………………………………………………. Se pide calcular: P..................... .........................................
2. El Director de Mercadotecnia de un diario metropolitano estudia la relación entre el tipo de comunidad donde vive el lector y la sección del periódico que lee primero. Para una muestra de lectores se obtuvo la siguiente información: Comunidad Urbana (U) Rural (R) Total
Noticias nacionales (N) 170 120
Deportes (D) 124 112
Historietas cómicas (H) 90 100
Total
Si se selecciona un lector al azar: a. ¿Cuál es la probabilidad que viva en una comunidad rural? b. ¿Cuál es la probabilidad que viva en una comunidad urbana y la sección del periódico que lee primero sea noticias nacionales? c. ¿Cuál es la probabilidad de que la primera sección del periódico que lee primero sean las noticias nacionales o las historietas cómicas? d. ¿Cuál es la probabilidad que la primera sección del periódico que lea sea deportes o viva en una comunidad granjera? e. ¿Cuál es la probabilidad de que viva en la comunidad rural y la primera sección del periódico que lee no sea deportes?
Estadística para Comunicadores
121
Solución a. ¿Cuál es la probabilidad que viva en una comunidad rural? Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............ ...........................
b. ¿Cuál es la probabilidad que viva en una comunidad urbana y la sección del periódico que lee primero sea noticias nacionales? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............ ...........................
c. ¿Cuál es la probabilidad de que la primera sección del periódico que lee primero sean las noticias nacionales o las historietas cómicas? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............ ...........................
d. ¿Cuál es la probabilidad que la primera sección del periódico que lea sea deportes o viva en una comunidad granjera? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............ ...........................
Estadística para Comunicadores
122
e. ¿Cuál es la probabilidad de que viva en la comunidad rural y la primera sección del periódico que lee no sea deportes? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............ ...........................
1. Trescientas personas se han presentado para una oferta laboral. La siguiente tabla muestra algunas características de estas personas: Género Masculino Femenino
Experiencia previa Sin Con Sin Con
Secundaria 35 10 40 12
Nivel de Instrucción Técnica Universitaria 38 13 30 18 37 8 42 17
Si se selecciona una persona al azar, a. b. c. d. e.
¿cuál es la probabilidad de que tenga instrucción secundaria? ¿cuál es la probabilidad de que sea una persona con instrucción técnica y sin experiencia? ¿cuál es la probabilidad de que sea mujer? ¿cuál es la probabilidad de que sea una persona con experiencia? ¿cuál es la probabilidad de que sea una mujer sin experiencia previa?
Solución a. ¿cuál es la probabilidad de que tenga instrucción secundaria? Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............ ...........................
b. ¿cuál es la probabilidad de que sea una persona con instrucción técnica y sin experiencia? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : …………………………………………………………….
123
Estadística para Comunicadores
Se pide calcular: P............ ...........................
c. ¿cuál es la probabilidad de que sea mujer? Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............ ...........................
d. ¿cuál es la probabilidad de que sea una persona con experiencia? Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............ ...........................
e. ¿cuál es la probabilidad de que sea una mujer sin experiencia previa? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............ ...........................
Ejercicios de aplicación 1. Se llevó a cabo un estudio de satisfacción del servicio de cafetería entre los estudiantes de la universidad, específicamente entre estudiantes de cuatro facultades: Administración, Ingeniería, Derecho y Arquitectura. La satisfacción del servicio se midió en una escala de 1100. Los datos se resumen en la siguiente tabla:
Ocupación Administración Arquitectura Derecho Ingeniería Total
Calificación de la satisfacción Menos de 50 50-59 60-69 70-79 10 21 22 11 16 23 24 13 10 24 20 10 12 20 25 14
80-89 11 10 13 12
Total
124
Estadística para Comunicadores
Si se selecciona al azar a uno de los estudiantes que participaron en el estudio: a. b. c. d.
¿Cuál es la probabilidad de que haya dado un puntaje de 70 ó más? ¿Cuál es la probabilidad de que haya dado un puntaje de 50 a 59 y que estudie Derecho? ¿Cuál es la probabilidad de que haya dado un puntaje menor de 60? ¿Cuál es la probabilidad de que el puntaje haya sido menor de 60 o estudie Administración? e. ¿Cuál es la probabilidad de que estudie Arquitectura y su puntaje no haya sido por lo menos 60? 2. En la siguiente tabla se muestra la distribución de una muestra de 200 empleados de una empresa según su género, estado civil y opinión respecto al ambiente laboral. Género Opinión Buena Regular Mala Total
Femenino Masculino Estado civil Estado Civil Soltero Casado Divorciado Soltero Casado Divorciado 25 9 6 35 6 10 4 22 7 11 21 3 2 5 15 3 7 9 31 36 28 49 34 22
Total 91 68 41 200
Si se selecciona un empleado al azar: a. b. c. d.
¿Cuál es la probabilidad de que sea mujer? ¿Cuál es la probabilidad de que su opinión con respecto al ambiente laboral no sea mala? ¿Cuál es la probabilidad de que sea una mujer soltera? ¿Cuál es la probabilidad de que tenga una buena opinión del ambiente laboral y sea soltero? e. ¿Cuál es la probabilidad de que no tenga una buena opinión del ambiente laboral o sea mujer? f. ¿Cuál es la probabilidad de que sea hombre, divorciado y tenga una mala opinión del ambiente laboral? 3. Cada año, en nuestro país se denuncian alrededor de siete mil violaciones y cerca de 100 mil casos de violencia familiar. Al seleccionar una muestra de mujeres y preguntarles ¿qué tipo de violencia sufrió?, ¿cuál es su estado civil? y ¿tiene hijos? La información se presenta en la siguiente tabla: Solteras (E)
Tipo de violencia
Casadas (F)
Sin hijos (G)
Con hijos (H)
Sin hijos (G)
Con hijos (H)
Total
Abuso sexual
(A)
22
35
42
18
117
Maltrato físico
(B)
26
52
44
50
172
Maltrato psicológico (C)
36
28
38
45
147
Otros
15
10
12
27
64
(D)
125
Estadística para Comunicadores
Total
99
125
136
140
500
Si se selecciona al azar a una mujer: a. ¿Cuál es la probabilidad de que la mujer sea soltera y haya sufrido de maltrato físico? b. ¿Cuál es la probabilidad de que la mujer no tenga hijos y no haya sufrido abuso sexual? c. ¿Cuál es la probabilidad que la mujer sea casada con hijos o haya sufrido un maltrato psicológico?
Variable aleatoria Sea un experimento aleatorio y el espacio muestral asociado. Una variable aleatoria es una descripción numérica del resultado de un experimento. Una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales. El valor numérico de la variable aleatoria depende del resultado del experimento. Una variable aleatoria puede ser discreta o continua, depende del tipo de valores numéricos que asuma. Las variables aleatorias se designan por letras mayúsculas (X, Y, Z, etc.), y a sus valores por letras latinas minúsculas.
X : Rango o recorrido: Se denomina así al conjunto de valores posibles que puede asumir la variable aleatoria X. Se denota por RX. Ejemplo Sea el experimento aleatorio que consiste en registrar el tiempo en que se mete el primer gol de un partido de fútbol durante los 90 minutos de juego, x / 0 x 90 . Si se define la variable aleatoria X como el tiempo registrado, entonces el rango o recorrido es RX x / 0 x 90 .
Estadística para Comunicadores
126
Variable aleatoria continua: Distribución normal Es la distribución de probabilidad más usada para describir variables aleatorias continuas. Ejemplos:
Peso, en kilogramos Estatura, en centímetros
Función de densidad de probabilidad normal 1 x
2
1 f x e 2 2
Se dice que la variable aleatoria X sigue una distribución normal con parámetros y 2. Se denota por X ~ N (, 2)
Características
La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de tendencia central coinciden. El punto más alto se encuentra sobre la media. El rango de la variable normal es toda la recta real, esto es, de – a + . Las colas nunca chocan con el eje horizontal, X. La desviación estándar determina que tan plana o que tan ancha será la curva normal. Si el valor de la desviación estándar es grande implica mayor dispersión en los datos Toda el área bajo la curva normal es igual a uno. Como la distribución es simétrica significa que el área a la derecha de la media es igual a 0,50 y el área a la izquierda de la media es también igual a 0,50.
Estandarización: Se toma como referencia una distribución normal estándar ( = 0 y 2 = 1). Se trabaja con la distancia entre x y en función de la desviación estándar, tal como se muestra. Z
X
Notación: Z ~Normal (0,1) y se lee: La variable aleatoria Z tiene distribución normal estándar con media igual a 0 y varianza igual a 1.
127
Estadística para Comunicadores
Función acumulada: F(z) = P[Z z]
La distribución de la variable Z se encuentra tabulada en la tabla de la normal estándar. A continuación se presentan los diversos casos:
Caso 1
Caso 2
Caso 3
128
Estadística para Comunicadores
TABLA DE LA DISTRIBUCION NORMAL ESTANDAR
Área bajo la curva normal: P Z z Z -3.9 -3.8 -3.7 -3.6 -3.5 -3.4 -3.3 -3.2 -3.1 -3.0
-0.09 0.000033 0.000050 0.000075 0.000112 0.000165 0.000242 0.000349 0.000501 0.000711 0.001001
-0.08 0.000034 0.000052 0.000078 0.000117 0.000172 0.000251 0.000362 0.000519 0.000736 0.001035
-0.07 0.000036 0.000054 0.000082 0.000121 0.000178 0.000260 0.000376 0.000538 0.000762 0.001070
-0.06 0.000037 0.000057 0.000085 0.000126 0.000185 0.000270 0.000390 0.000557 0.000789 0.001107
-0.05 0.000039 0.000059 0.000088 0.000131 0.000193 0.000280 0.000404 0.000577 0.000816 0.001144
-0.04 0.000041 0.000062 0.000092 0.000136 0.000200 0.000291 0.000419 0.000598 0.000845 0.001183
-0.03 0.000042 0.000064 0.000096 0.000142 0.000208 0.000302 0.000434 0.000619 0.000874 0.001223
-0.02 0.000044 0.000067 0.000100 0.000147 0.000216 0.000313 0.000450 0.000641 0.000904 0.001264
-0.01 0.000046 0.000069 0.000104 0.000153 0.000224 0.000325 0.000466 0.000664 0.000935 0.001306
-0.00 0.000048 0.000072 0.000108 0.000159 0.000233 0.000337 0.000483 0.000687 0.000968 0.001350
-2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 -2.2 -2.1 -2.0
0.00139 0.00193 0.00264 0.00357 0.00480 0.00639 0.00842 0.01101 0.01426 0.01831
0.00144 0.00199 0.00272 0.00368 0.00494 0.00657 0.00866 0.01130 0.01463 0.01876
0.00149 0.00205 0.00280 0.00379 0.00508 0.00676 0.00889 0.01160 0.01500 0.01923
0.00154 0.00212 0.00289 0.00391 0.00523 0.00695 0.00914 0.01191 0.01539 0.01970
0.00159 0.00219 0.00298 0.00402 0.00539 0.00714 0.00939 0.01222 0.01578 0.02018
0.00164 0.00226 0.00307 0.00415 0.00554 0.00734 0.00964 0.01255 0.01618 0.02068
0.00169 0.00233 0.00317 0.00427 0.00570 0.00755 0.00990 0.01287 0.01659 0.02118
0.00175 0.00240 0.00326 0.00440 0.00587 0.00776 0.01017 0.01321 0.01700 0.02169
0.00181 0.00248 0.00336 0.00453 0.00604 0.00798 0.01044 0.01355 0.01743 0.02222
0.00187 0.00256 0.00347 0.00466 0.00621 0.00820 0.01072 0.01390 0.01786 0.02275
-1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 -1.2 -1.1 -1.0
0.02330 0.02938 0.03673 0.04551 0.05592 0.06811 0.08226 0.09853 0.11702 0.13786
0.02385 0.03005 0.03754 0.04648 0.05705 0.06944 0.08379 0.10027 0.11900 0.14007
0.02442 0.03074 0.03836 0.04746 0.05821 0.07078 0.08534 0.10204 0.12100 0.14231
0.02500 0.03144 0.03920 0.04846 0.05938 0.07215 0.08691 0.10383 0.12302 0.14457
0.02559 0.03216 0.04006 0.04947 0.06057 0.07353 0.08851 0.10565 0.12507 0.14686
0.02619 0.03288 0.04093 0.05050 0.06178 0.07493 0.09012 0.10749 0.12714 0.14917
0.02680 0.03362 0.04182 0.05155 0.06301 0.07636 0.09176 0.10935 0.12924 0.15151
0.02743 0.03438 0.04272 0.05262 0.06426 0.07780 0.09342 0.11123 0.13136 0.15386
0.02807 0.03515 0.04363 0.05370 0.06552 0.07927 0.09510 0.11314 0.13350 0.15625
0.02872 0.03593 0.04457 0.05480 0.06681 0.08076 0.09680 0.11507 0.13567 0.15866
-0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 -0.0
0.16109 0.18673 0.21476 0.24510 0.27760 0.31207 0.34827 0.38591 0.42465 0.46414
0.16354 0.18943 0.21770 0.24825 0.28096 0.31561 0.35197 0.38974 0.42858 0.46812
0.16602 0.19215 0.22065 0.25143 0.28434 0.31918 0.35569 0.39358 0.43251 0.47210
0.16853 0.19489 0.22363 0.25463 0.28774 0.32276 0.35942 0.39743 0.43644 0.47608
0.17106 0.19766 0.22663 0.25785 0.29116 0.32636 0.36317 0.40129 0.44038 0.48006
0.17361 0.20045 0.22965 0.26109 0.29460 0.32997 0.36693 0.40517 0.44433 0.48405
0.17619 0.20327 0.23270 0.26435 0.29806 0.33360 0.37070 0.40905 0.44828 0.48803
0.17879 0.20611 0.23576 0.26763 0.30153 0.33724 0.37448 0.41294 0.45224 0.49202
0.18141 0.20897 0.23885 0.27093 0.30503 0.34090 0.37828 0.41683 0.45620 0.49601
0.18406 0.21186 0.24196 0.27425 0.30854 0.34458 0.38209 0.42074 0.46017 0.50000
129
Estadística para Comunicadores
TABLA DE LA DISTRIBUCION NORMAL ESTANDAR
Área bajo la curva normal: P Z z Z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0.00 0.50000 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75804 0.78814 0.81594
0.01 0.50399 0.54380 0.58317 0.62172 0.65910 0.69497 0.72907 0.76115 0.79103 0.81859
0.02 0.50798 0.54776 0.58706 0.62552 0.66276 0.69847 0.73237 0.76424 0.79389 0.82121
0.03 0.51197 0.55172 0.59095 0.62930 0.66640 0.70194 0.73565 0.76730 0.79673 0.82381
0.04 0.51595 0.55567 0.59483 0.63307 0.67003 0.70540 0.73891 0.77035 0.79955 0.82639
0.05 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.80234 0.82894
0.06 0.52392 0.56356 0.60257 0.64058 0.67724 0.71226 0.74537 0.77637 0.80511 0.83147
0.07 0.52790 0.56749 0.60642 0.64431 0.68082 0.71566 0.74857 0.77935 0.80785 0.83398
0.08 0.53188 0.57142 0.61026 0.64803 0.68439 0.71904 0.75175 0.78230 0.81057 0.83646
0.09 0.53586 0.57535 0.61409 0.65173 0.68793 0.72240 0.75490 0.78524 0.81327 0.83891
1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9
0.84134 0.86433 0.88493 0.90320 0.91924 0.93319 0.94520 0.95543 0.96407 0.97128
0.84375 0.86650 0.88686 0.90490 0.92073 0.93448 0.94630 0.95637 0.96485 0.97193
0.84614 0.86864 0.88877 0.90658 0.92220 0.93574 0.94738 0.95728 0.96562 0.97257
0.84849 0.87076 0.89065 0.90824 0.92364 0.93699 0.94845 0.95818 0.96638 0.97320
0.85083 0.87286 0.89251 0.90988 0.92507 0.93822 0.94950 0.95907 0.96712 0.97381
0.85314 0.87493 0.89435 0.91149 0.92647 0.93943 0.95053 0.95994 0.96784 0.97441
0.85543 0.87698 0.89617 0.91309 0.92785 0.94062 0.95154 0.96080 0.96856 0.97500
0.85769 0.87900 0.89796 0.91466 0.92922 0.94179 0.95254 0.96164 0.96926 0.97558
0.85993 0.88100 0.89973 0.91621 0.93056 0.94295 0.95352 0.96246 0.96995 0.97615
0.86214 0.88298 0.90147 0.91774 0.93189 0.94408 0.95449 0.96327 0.97062 0.97670
2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9
0.97725 0.98214 0.98610 0.98928 0.99180 0.99379 0.99534 0.99653 0.99744 0.99813
0.97778 0.98257 0.98645 0.98956 0.99202 0.99396 0.99547 0.99664 0.99752 0.99819
0.97831 0.98300 0.98679 0.98983 0.99224 0.99413 0.99560 0.99674 0.99760 0.99825
0.97882 0.98341 0.98713 0.99010 0.99245 0.99430 0.99573 0.99683 0.99767 0.99831
0.97932 0.98382 0.98745 0.99036 0.99266 0.99446 0.99585 0.99693 0.99774 0.99836
0.97982 0.98422 0.98778 0.99061 0.99286 0.99461 0.99598 0.99702 0.99781 0.99841
0.98030 0.98461 0.98809 0.99086 0.99305 0.99477 0.99609 0.99711 0.99788 0.99846
0.98077 0.98500 0.98840 0.99111 0.99324 0.99492 0.99621 0.99720 0.99795 0.99851
0.98124 0.98537 0.98870 0.99134 0.99343 0.99506 0.99632 0.99728 0.99801 0.99856
0.98169 0.98574 0.98899 0.99158 0.99361 0.99520 0.99643 0.99736 0.99807 0.99861
3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9
0.998650 0.999032 0.999313 0.999517 0.999663 0.999767 0.999841 0.999892 0.999928 0.999952
0.998694 0.999065 0.999336 0.999534 0.999675 0.999776 0.999847 0.999896 0.999931 0.999954
0.998736 0.999096 0.999359 0.999550 0.999687 0.999784 0.999853 0.999900 0.999933 0.999956
0.998777 0.999126 0.999381 0.999566 0.999698 0.999792 0.999858 0.999904 0.999936 0.999958
0.998817 0.999155 0.999402 0.999581 0.999709 0.999800 0.999864 0.999908 0.999938 0.999959
0.998856 0.999184 0.999423 0.999596 0.999720 0.999807 0.999869 0.999912 0.999941 0.999961
0.998893 0.999211 0.999443 0.999610 0.999730 0.999815 0.999874 0.999915 0.999943 0.999963
0.998930 0.999238 0.999462 0.999624 0.999740 0.999822 0.999879 0.999918 0.999946 0.999964
0.998965 0.999264 0.999481 0.999638 0.999749 0.999828 0.999883 0.999922 0.999948 0.999966
0.998999 0.999289 0.999499 0.999651 0.999758 0.999835 0.999888 0.999925 0.999950 0.999967
Estadística para Comunicadores
Ejemplo 1. Dada una distribución normal estandarizada. ¿cuál es la probabilidad de que: a. Z sea menor a 1,08?
b. Z esté entre –0,21 y la media?
c. Z sea mayor que 1,08?
d. ¿Cuál será el valor máximo de Z tal que el 15,87% de los valores son menores a Z?
130
Estadística para Comunicadores
131
e. ¿Cuál será el valor mínimo de Z tal que el 15,87% de los valores son mayores a Z?
2. Suponga que el tiempo que emplean los suscriptores de la revista B&C en leer la publicación tiene distribución normal con media de 49 minutos y desviación estándar de 16 minutos. a. ¿Cuál es la probabilidad de que un suscriptor seleccionado al azar tarde por lo menos una hora en leer la publicación? X= tiempo empleado por los suscriptores de la revista B&C en leer la publicación X N(=49 , 2 = 162) P X 60 PZ 0,69 1 PZ 0,69 1 0,75490 0,2451
b. ¿Cuál es el tiempo máximo que debe emplear un suscriptor de esta revista para pertenecer al 34% de suscriptores que emplean menos tiempo en leer la publicación? P X Xmáx 0,34
Xmáx P Z 0,34
PZ a 0,34
a 0,41 Reemplazando Xmáx = 42,44 min
Estadística para Comunicadores
132
3. El consumo mensual de energía eléctrica en kw de una ciudad tiene distribución normal con media de 140 kw, con una desviación estándar de 20 kw. a. ¿Cuál es la probabilidad que un hogar tenga un consumo menor de 150 kw? b. ¿Qué porcentaje de hogares registran un consumo entre 115 y 160 kw? c. Calcule el consumo mínimo de energía eléctrica para estar en el 15% de los mayores consumidores. Solución La variable en estudio es …...………………………………………………………….…….. Sus parámetros son: = ……………………..……. y 2 = ………………………………. a. ¿Cuál es la probabilidad que un hogar tenga un consumo menor de 150 kw?
b. ¿Qué porcentaje de hogares registran un consumo entre 115 y 160 kw?
c. Calcule el consumo mínimo de energía eléctrica para estar en el 15% de los mayores consumidores.
Estadística para Comunicadores
133
4. El pago promedio de los corresponsales de una cadena de TV es de 11,90 dólares diario con desviación estándar es 0,40 dólares diario. Si se supone que los pagos se distribuyen normalmente. ¿Qué porcentaje de corresponsales de esta cadena de TV reciben pagos diarios: Solución La variable en estudio es …...…………………………………………………….…….. Sus parámetros son: = ………………………. y 2 = …………………..…………. a. menores de 11?
b. mayores a 12,95?
c. entre 10,8 y 12,4?
d. entre 12,2 y 13,10?
Estadística para Comunicadores
134
e. ¿Cuál debe ser el pago mínimo para tener la seguridad de que sólo el 10% de los corresponsales ganan más de dicha cantidad?
f. ¿Cuál debe ser el pago máximo para tener la seguridad que sólo el 25% de los corresponsales reciben menos de dicha cantidad?
5. El costo, en dólares, de las cámaras fotográficas semiprofesionales es una variable aleatoria que sigue una distribución normal con media de 700 dólares y desviación estándar 5,5 dólares. Solución La variable en estudio es …...……………………………………………………….…….. Sus parámetros son: = …………………..……. y 2 = ………………………………. a. Si se escoge una cámara al azar ¿cuál es la probabilidad que su costo sea mayor a 710 dólares?
Estadística para Comunicadores
135
b. Si se escoge una cámara al azar ¿cuál es la probabilidad que su costo esté entre 685 y 705 dólares?
c. Los usuarios manifiestan que el 15,151% de las cámaras semiprofesionales son muy fáciles de usar y por lo tanto de menores precios ¿cuál es el costo máximo de estas cámaras de fácil uso?
Ejercicios de aplicación 1. El ingreso mensual de los redactores de noticia tiene distribución normal con media $900 y una desviación estándar de $100. a. Si se elige al azar un redactor de noticia. ¿cuál es la probabilidad de que su ingreso sea menor que $800? b. Si el 5% de los redactores de noticia con mayores ingresos deben pagar impuestos. ¿a partir de que ingreso se debe pagar impuestos?
Estadística para Comunicadores
136
2. Las puntuaciones de una prueba de aptitud académica tomada a 900 postulantes de una cadena internacional de noticias están distribuidas normalmente con media de 60 puntos y desviación estándar de 10 puntos. a. ¿Qué porcentaje de postulantes obtuvo una puntuación mayor a 75 puntos? b. ¿Cuántos postulantes recibieron una puntuación entre 40 y 50 puntos? c. Si el 12,3 % de los postulantes con mayor puntuación reciben el calificativo A y el 20% de los postulantes con menor puntuación reciben el calificativo C. Calcular la mínima puntuación que debe tener un postulante a esta cadena internacional de noticias para recibir un A y la máxima puntuación que debe tener un postulante para recibir un calificativo C. 3. Una estación de noticias que se transmite en AM encuentra que el tiempo que los radioescuchas sintonizan la estación sigue una distribución normal con media de 15 minutos y desviación estándar de 3,5 minutos. Si se elige un radioescucha al azar: a. ¿Cuál es la probabilidad sintonice la estación más de 20 minutos? b. ¿Cuál es el tiempo máximo para que un radioescucha se encuentre en el 12,1% de radioescuchas que menos tiempo escuchan esta estación? 4. Supóngase que los gastos durante un ciclo académico de los estudiantes de diseño publicitario tienen distribución normal con media de 30 soles y desviación estándar de 5 soles. a. ¿Cuál es la probabilidad de que un alumno seleccionado al azar haya tenido un gasto superior a 35 soles? b. ¿Cuál es la probabilidad de que un alumno seleccionado al azar haya tenido un gasto menor a 32,50 pero mayor a 27,50 soles? 5. Las compañías que miden las audiencias de programas de televisión y estaciones de radio para los anunciantes y transmisoras se conocen como servicios de ratings. Si una de estas compañías determinó que los puntos de ratings de las ediciones diarias del programa magazín ABC siguen una distribución normal con media 23,1 puntos y una desviación estándar de 1,6 puntos. a. Si se selecciona al azar una edición de este programa, ¿cuál es la probabilidad de que su ratings se encuentren entre 21,2 puntos y 25,3 puntos? b. ¿Cuánto debe ser el rating mínimo para estar comprendido en el 12.1% de las ediciones de este programa con mayores puntos de ratings? 6. La televisión es el medio publicitario por excelencia: permite mostrar la idea en movimiento, con color y sonido. El producto propio de la televisión es el spot o anuncio. La duración de un spot publicitario sigue una distribución normal con una media de 48 segundos y una desviación estándar de 12 segundos.
Estadística para Comunicadores
137
a. Calcule la probabilidad de que un spot publicitario dure más de 45 segundos. b. ¿Cuál es la duración mínima aproximada que debe tener un spot publicitario para estar dentro del 18% de los spots que más duran?
Autoevaluación 7. Se tiene información que los costos de los spots publicitarios realizado por la empresa PubliNegocios se distribuye normalmente con moda igual a 42 000 dólares y desviación estándar de 3500 dólares. a. Si se selecciona al azar un spot publicitario elaborado por dicha empresa ¿cuál es la probabilidad que su costo haya sido menor de 30 000 dólares? a. b. c. d. e. f. g. h. i. j. k. l. m. n. o. p. q. r. s. t. u. v. w. x. y. z. aa. bb. cc. dd. ee. ff. gg. hh. ii. jj. kk. ll. mm.nn. oo. pp. qq. rr. ss. tt. uu. vv. ww.xx. yy. zz. aaa.bbb.ccc.ddd.eee.fff. ggg.hhh.iii. jjj. kkk.lll. mmm. nnn.ooo.ppp.qqq.rrr. sss. ttt. uuu.vvv.www. xxx.yyy.zzz. aaaa. bbbb. cccc. dddd. eeee. ffff.gggg. hhhh. iiii. jjjj. kkkk. llll. mmmm. nnnn. oooo. pppp. qqqq. rrrr.ssss.tttt. uuuu. vvvv. wwww. xxxx. yyyy. zzzz. aaaaa. bbbbb. ccccc. ddddd. eeeee. fffff.ggggg. hhhhh. iiiii.jjjjj.kkkkk. lllll.mmmmm. nnnnn. ooooo. ppppp. qqqqq. rrrrr.sssss. ttttt.uuuuu. vvvvv. wwwww. xxxxx. yyyyy. zzzzz. aaaaaa. bbbbbb. cccccc. dddddd. eeeeee. ffffff. gggggg. hhhhhh. iiiiii.jjjjjj.kkkkkk. llllll.mmmmmm. nnnnnn. oooooo. pppppp. qqqqqq. rrrrrr. ssssss. tttttt.uuuuuu. vvvvvv. wwwwww. xxxxxx. yyyyyy. zzzzzz. aaaaaaa. bbbbbbb. ccccccc. ddddddd. eeeeeee. fffffff. ggggggg. hhhhhhh. iiiiiii. jjjjjjj. kkkkkkk. lllllll. mmmmmmm. nnnnnnn. ooooooo. ppppppp. qqqqqqq. rrrrrrr. sssssss. ttttttt. uuuuuuu. vvvvvvv. wwwwwww. xxxxxxx. yyyyyyy. zzzzzzz. b. ¿Qué porcentaje de los spots publicitarios elaborados por la empresa PubliNegocios tienen costos entre 41 000 y 43 000 dólares? aaaaaaaa. bbbbbbbb. cccccccc. dddddddd. eeeeeeee. ffffffff. gggggggg. hhhhhhhh. iiiiiiii. jjjjjjjj. kkkkkkkk. llllllll. mmmmmmmm. nnnnnnnn. oooooooo. pppppppp. qqqqqqqq. rrrrrrrr. ssssssss. tttttttt. uuuuuuuu. vvvvvvvv. wwwwwwww. xxxxxxxx. yyyyyyyy. zzzzzzzz.
aaaaaaaaa. bbbbbbbbb. ccccccccc. ddddddddd. eeeeeeeee. fffffffff. ggggggggg. hhhhhhhhh. iiiiiiiii. jjjjjjjjj. kkkkkkkkk. lllllllll. mmmmmmmmm. nnnnnnnnn. ooooooooo. ppppppppp. qqqqqqqqq. rrrrrrrrr. sssssssss. ttttttttt. uuuuuuuuu. vvvvvvvvv. wwwwwwwww. xxxxxxxxx. yyyyyyyyy. zzzzzzzzz. aaaaaaaaaa. bbbbbbbbbb. cccccccccc. dddddddddd. eeeeeeeeee. ffffffffff. gggggggggg. hhhhhhhhhh. iiiiiiiiii. jjjjjjjjjj. kkkkkkkkkk. llllllllll. mmmmmmmmmm. nnnnnnnnnn. oooooooooo. pppppppppp. qqqqqqqqqq. rrrrrrrrrr. ssssssssss. tttttttttt. uuuuuuuuuu. vvvvvvvvvv. wwwwwwwwww. xxxxxxxxxx. yyyyyyyyyy. zzzzzzzzzz. aaaaaaaaaaa. bbbbbbbbbbb. ccccccccccc. ddddddddddd. eeeeeeeeeee. fffffffffff. ggggggggggg. hhhhhhhhhhh. iiiiiiiiiii. jjjjjjjjjjj. kkkkkkkkkkk. lllllllllll. mmmmmmmmmmm. nnnnnnnnnnn. ooooooooooo. ppppppppppp. qqqqqqqqqqq. rrrrrrrrrrr. sssssssssss. ttttttttttt. uuuuuuuuuuu. vvvvvvvvvvv. wwwwwwwwwww. xxxxxxxxxxx. yyyyyyyyyyy. zzzzzzzzzzz. aaaaaaaaaaaa. bbbbbbbbbbbb. cccccccccccc. dddddddddddd. eeeeeeeeeeee. ffffffffffff. gggggggggggg. hhhhhhhhhhhh. iiiiiiiiiiii. jjjjjjjjjjjj. kkkkkkkkkkkk. llllllllllll. mmmmmmmmmmmm. nnnnnnnnnnnn. oooooooooooo. pppppppppppp. qqqqqqqqqqqq. rrrrrrrrrrrr. ssssssssssss. tttttttttttt. uuuuuuuuuuuu. vvvvvvvvvvvv. wwwwwwwwwwww. xxxxxxxxxxxx. yyyyyyyyyyyy. zzzzzzzzzzzz aaaaaaaaaaaaa. bbbbbbbbbbbbb. ccccccccccccc. ddddddddddddd. eeeeeeeeeeeee. fffffffffffff. ggggggggggggg. hhhhhhhhhhhhh. iiiiiiiiiiiii. jjjjjjjjjjjjj. kkkkkkkkkkkkk. lllllllllllll. mmmmmmmmmmmmm. nnnnnnnnnnnnn. ooooooooooooo. ppppppppppppp. qqqqqqqqqqqqq. rrrrrrrrrrrrr. sssssssssssss. ttttttttttttt. uuuuuuuuuuuuu. vvvvvvvvvvvvv. wwwwwwwwwwwww. xxxxxxxxxxxxx. yyyyyyyyyyyyy. zzzzzzzzzzzz aaaaaaaaaaaaaa. bbbbbbbbbbbbbb. cccccccccccccc. dddddddddddddd. eeeeeeeeeeeeee. ffffffffffffff. gggggggggggggg. hhhhhhhhhhhhhh. iiiiiiiiiiiiii. jjjjjjjjjjjjjj. kkkkkkkkkkkkkk. llllllllllllll. mmmmmmmmmmmmmm. nnnnnnnnnnnnnn. oooooooooooooo. pppppppppppppp. qqqqqqqqqqqqqq. rrrrrrrrrrrrrr. ssssssssssssss. tttttttttttttt. uuuuuuuuuuuuuu. vvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxx. yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaa. bbbbbbbbbbbbbbb. ccccccccccccccc. ddddddddddddddd. eeeeeeeeeeeeeee. fffffffffffffff. ggggggggggggggg. hhhhhhhhhhhhhhh. iiiiiiiiiiiiiii. jjjjjjjjjjjjjjj. kkkkkkkkkkkkkkk. lllllllllllllll. mmmmmmmmmmmmmmm. nnnnnnnnnnnnnnn. ooooooooooooooo. ppppppppppppppp. qqqqqqqqqqqqqqq. rrrrrrrrrrrrrrr. sssssssssssssss. ttttttttttttttt. uuuuuuuuuuuuuuu. vvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxx. yyyyyyyyyyyyyy zzzzzzzzzzzz
c. El 30% de los sopts más costos se los va clasificar como “muy rentables” ¿cuál es el valor mínimo que debe tener un spot para estar considerado en este grupo? aaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbb. cccccccccccccccc. dddddddddddddddd. eeeeeeeeeeeeeeee. ffffffffffffffff. gggggggggggggggg. hhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkk. llllllllllllllll. mmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnn. oooooooooooooooo. pppppppppppppppp. qqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrr. ssssssssssssssss. tttttttttttttttt. uuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx. yyyyyyyyyyyyyy zzzzzzzzzzzz
aaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbb. ccccccccccccccccc. ddddddddddddddddd. eeeeeeeeeeeeeeeee. fffffffffffffffff. ggggggggggggggggg. hhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkk. lllllllllllllllll. mmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnn. ooooooooooooooooo. ppppppppppppppppp. qqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrr. sssssssssssssssss. ttttttttttttttttt. uuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbb. cccccccccccccccccc. dddddddddddddddddd. eeeeeeeeeeeeeeeeee. ffffffffffffffffff. gggggggggggggggggg. hhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkk. llllllllllllllllll. mmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnn. oooooooooooooooooo. pppppppppppppppppp. qqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrr. ssssssssssssssssss. tttttttttttttttttt. uuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbb. ccccccccccccccccccc. ddddddddddddddddddd. eeeeeeeeeeeeeeeeeee. fffffffffffffffffff. ggggggggggggggggggg. hhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkk. lllllllllllllllllll. mmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnn. ooooooooooooooooooo. ppppppppppppppppppp. qqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrr. sssssssssssssssssss. ttttttttttttttttttt. uuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbbb. cccccccccccccccccccc. dddddddddddddddddddd. eeeeeeeeeeeeeeeeeeee. ffffffffffffffffffff. gggggggggggggggggggg. hhhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkkk. llllllllllllllllllll. mmmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnnn. oooooooooooooooooooo. pppppppppppppppppppp. qqqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrrr. ssssssssssssssssssss. tttttttttttttttttttt. uuuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbbbb. ccccccccccccccccccccc. ddddddddddddddddddddd. eeeeeeeeeeeeeeeeeeeee. fffffffffffffffffffff. ggggggggggggggggggggg. hhhhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkkkk. lllllllllllllllllllll. mmmmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnnnn. ooooooooooooooooooooo. ppppppppppppppppppppp. qqqqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrrrr. sssssssssssssssssssss. ttttttttttttttttttttt. uuuuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz
Estadística para Comunicadores
138
aaaaaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbbbbb. cccccccccccccccccccccc. dddddddddddddddddddddd. eeeeeeeeeeeeeeeeeeeeee. ffffffffffffffffffffff. gggggggggggggggggggggg. hhhhhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkkkkk. llllllllllllllllllllll. mmmmmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnnnnn. oooooooooooooooooooooo. pppppppppppppppppppppp. qqqqqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrrrrr. ssssssssssssssssssssss. tttttttttttttttttttttt. uuuuuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvvvvv wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbbbbbb. ccccccccccccccccccccccc. ddddddddddddddddddddddd. eeeeeeeeeeeeeeeeeeeeeee. fffffffffffffffffffffff. ggggggggggggggggggggggg. hhhhhhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkkkkkk. lllllllllllllllllllllll. mmmmmmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnnnnnn. ooooooooooooooooooooooo. ppppppppppppppppppppppp. qqqqqqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrrrrrr. sssssssssssssssssssssss. ttttttttttttttttttttttt. uuuuuuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvvvvv wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbbbbbbb. cccccccccccccccccccccccc. dddddddddddddddddddddddd. eeeeeeeeeeeeeeeeeeeeeeee. ffffffffffffffffffffffff. gggggggggggggggggggggggg. hhhhhhhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkkkkkkk. llllllllllllllllllllllll. mmmmmmmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnnnnnnn. oooooooooooooooooooooooo. pppppppppppppppppppppppp. qqqqqqqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrrrrrrr. ssssssssssssssssssssssss. tttttttttttttttttttttttt. uuuuuuuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvvvvv wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz
Estadística para Comunicadores
Unidad 4 Inferencia Estadística
Logro: Al término de la Unidad 4, el estudiante toma decisiones aplicando las pruebas de hipótesis en la solución de problemas comerciales.
Temas de la unidad:
Estimación puntual: Estimadores puntuales de la media y proporción. Estimación por intervalo: Intervalo de confianza de la media. Intervalo de confianza para la proporción. Tamaño de muestra. Prueba de hipótesis: Conceptos generales. Prueba de hipótesis para la media. Prueba de hipótesis para la proporción. Prueba de hipótesis para dos varianzas. Prueba de hipótesis para dos medias de muestras independientes. Prueba de hipótesis para dos muestras relacionadas. Prueba de hipótesis para dos proporciones.
139
Estadística para Comunicadores
140
Unidad 4. Inferencia Estadística Estimación puntual
Estimación por intervalo
• Es la estimación del valor del parámetro por medio de un único valor obtenido mediante el cálculo o evaluación de un estimador para una muestra específica. • El estimador se expresa mediante una fórmula, por ejemplo la media de la muestra es un estimador puntual de la media poblacional µ.
•Como no se puede esperar que un estimador puntual sea el valor exacto del parámetro que se desea estimar, se suele calcular una estimación de dicho parámetro por intervalo. •La estimación por intervalo establece un intervalo dentro del cual es muy probable que se encuentre el parámetro que se desea estimar.
Nivel de confianza El nivel de confianza se usa para indicar la probabilidad de que una estimación por intervalo contenga al parámetro que se desea estimar.
Margen de error El margen de error es el valor que se suma y se resta a la estimación puntual con objeto de obtener un intervalo de estimación para el parámetro que se desea estimar. Se le denota por e. En esta unidad se muestra cómo obtener una estimación por intervalo para la media poblacional µ y para la proporción poblacional p. La fórmula general para obtener una estimación por intervalo para la media poblacional es IC x Margen de
error
La fórmula general para obtener una estimación por intervalo para la proporción poblacional es IC p pˆ Margen de
error
Estadística para Comunicadores
141
Estimación por intervalo Partiendo de que Z N(0,1) lo que se busca es encontrar un valor de Z1 tal que el intervalo (-Z1 Z Z1) tenga una alta probabilidad de ocurrencia ( 1 ) es decir: P(Z1 Z Z1 ) 1
.................. (a)
Ahora si X N( , ) entonces: 2
Z
X
x
.......................................(b)
Reemplazando (b) en (a) tenemos que:
X P Z1 Z1 P X Z1 x X Z1 x x l1 l2 Como X es una variable aleatoria entonces los límites del intervalo de confianza l1 y l2 serán también variables aleatorias mientras no se reemplacen los valores obtenidos en una muestra. Interpretación del nivel de confianza
Estadística para Comunicadores
142
El gráfico ilustra la interpretación del nivel de confianza para el intervalo de confianza para la media.
Para los distintos posibles valores de la media muestral, obtenemos distintos intervalos de confianza
La mayor parte incluye al verdadero valor del parámetro, pero otros no.
Si el nivel de confianza es del 95%, extiste un 95% de confianza de que el intervalo contenga al verdadero valor del parámetro y el 5% restante no lo contenga.
En la práctica disponemos de una única repetición del experimento, y por tanto de un único intervalo de confianza, el señalado en negro en el gráfico, por ejemplo.
Confiamos en que nuestro intervalo contenga al verdadero valor del parámetro aunque no tenemos la seguridad de que sea así, tenemos un riesgo del 5% de equivocarnos.
Estadística para Comunicadores
143
Distribución t-Student
Se dice que la variable aleatoria t sigue una distribución t con v grados de libertad. Para un valor de la variable aleatoria t, v es tal que el área a su derecha bajo la curva de la distribución t con v grados de libertad es igual a .
Características de la distribución t- Student
Es simétrica y tiene forma de campana. Su rango se extiende de - a + La gráfica de la distribución t es parecida a la distribución normal, se diferencian en: Los extremos la distribución t está por encima de la normal estándar. El centro de la distribución t está por debajo de la normal estándar. Cada valor de grado de libertad determina una distribución t distinta. Cuando los grados de libertad son altos, los valores de la distribución t se asemejan con los valores de la distribución normal estándar (n > 29).
Ejemplo de gráficos de la distribución t-Student para diferentes grados de libertad
144
Estadística para Comunicadores
Intervalo de confianza para la media poblacional Si x y S son la media y la desviación estándar de una muestra aleatoria de tamaño n de una población con varianza 2 desconocida, un intervalo de confianza de ( 1 )x100% para está dado por:
x t / 2,n1
Donde
S S x t / 2,n1 n n
t /2 es el valor t con (n -1) grados de libertad que deja un área de / 2 a la derecha.
También puede ser expresado de la siguiente manera: IC(µ) = x̅ ± t (α⁄2 ; n−1)
s √n
Población Finita: es el conjunto compuesto por una cantidad limitada de elementos, como el número de estudiantes de una universidad, el número de obreros de una fábrica, etc. Población Infinita: es la que tiene un número extremadamente grande de componentes, como la cantidad de productos que hay en el mercado.
Si la población es finita, es decir, conocemos N el tamaño de la población, el error estándar será:
S N n n N 1 y los límites del intervalo de confianza se calculan con la siguiente fórmula: x t / 2,n1
S n
N n S x t / 2,n1 N 1 n
N n N 1
Ejemplos 1. El jefe del área de prensa de un diario desea evaluar la habilidad de su equipo de trabajo en la escritura de una misma noticia. Para realizar dicho estudio selecciona al azar una muestra aleatoria de redactores obteniendo los siguientes resultados (en minutos): 3,2 6,3
4,8 7,9
5,3 8,2
9,1 7,9
6,3 6,9
8,2 9,3
6,5 8,6
9,6 6,8
10,3 10,1
8,6 9,0
145
Estadística para Comunicadores
Asumiendo que los tiempos de escritura se distribuyen normalmente. Calcule e interprete un intervalo del 95% de confianza para el tiempo medio utilizado en la escritura de una noticia. Solución:
IC ( ) 7,645 2,0930
(1,8597) (1,8597) 7,645 2,0930 20 20
Efectuando operaciones se tiene: 6,75 8,11 Interpretación: Existe un 95% de confianza de que el intervalo [6,75; 8,11] minutos, contenga a la verdadera media del tiempo utilizado por todos los redactores en la escritura de una noticia.
2. Suponga que el tiempo de duración, en minutos, de los informes periodísticos de un magazín dominical tiene una distribución normal. De un total de 150 informes periodísticos se toma una muestra de 10 y se registra la siguiente información: 25,5
26,8
24,2
25,0
27,3
26,1
23,2
28,4
27,8
25,7
Calcule e interprete un intervalo del 95% de confianza para el tiempo de duración promedio de los informes periodísticos. Solución Como conocemos N =150, entonces la fórmula a utilizar es: x t / 2,n1
S n
N n S x t / 2,n1 N 1 n
N n N 1
Reemplazando: 26 2, 26216
1, 62 150 10 1, 62 150 10 26 2, 26216 10 150 1 10 150 1
Efectuando operaciones se tiene: 24,88 27,12 Interpretación: Con 95% de confianza se puede afirmar que el intervalo: [24,88; 27,12] contiene al verdadero tiempo promedio de duración (en minutos) de los informes periodístico del magazín.
Estadística para Comunicadores
146
3. Un analista de investigación de mercados quiere estimar el ingreso familiar promedio de una
determinada población. a. Calcule e interprete un intervalo de confianza del 95% si en una muestra aleatoria de tamaño 20 de esta población se encontró que el ingreso familiar promedio era de $500 con una desviación estándar de $100. Asuma que la variable tiene distribución normal. b. Si la población consta de 2000 habitantes, determine el intervalo de confianza del 90%. Interprete. Solución a. Calcule e interprete un intervalo de confianza del 95% si en una muestra aleatoria de tamaño 20 de esta población se encontró que el ingreso familiar promedio era de $500 con una desviación estándar de $100. Asuma que la variable tiene distribución normal. Tamaño de muestra n = ………………,
promedio x = ……………..…. y
desviación estándar ………. = ……………. 1- = …………… =……………… y t / 2, n 1 = ………………..
Efectuando las operaciones se tiene: Interpretación:
[……………… ; ………………]
Estadística para Comunicadores
147
b. Si la población consta de 2000 habitantes, determine el intervalo de confianza del 90%. Interprete. Si el tamaño de la población N = …………… , entonces:
Efectuando las operaciones se tiene:
[……………… ; ………………]
Interpretación:
4. El fabricante de una nueva línea de impresoras de inyección de tinta desea incluir como parte de su publicidad, el número de páginas que el usuario puede imprimir con un cartucho. Una muestra tomada al azar de 25 cartuchos reveló que el número promedio de páginas es de 2 154 con una desviación estándar igual a 24. Si la variable en estudio tiene distribución normal. Calcule e interprete un intervalo de confianza del 97% para el número promedio poblacional de páginas que el usuario puede imprimir con un cartucho. Solución x = …………. y s = ……………. , 1- = …………… =……………… t / 2, n 1
= ………………..
148
Estadística para Comunicadores
Efectuando las operaciones se tiene:
[……………… ; ………………]
Interpretación:
Ejercicios de aplicación 1. A un grupo de 15 estudiantes se les sometió a un test de inteligencia y se registró los tiempos que utilizaron para realizar dicho test: 3,4 4,8
2,8 2,9
4,4 5,6
2,5 5,2
3,3 3,7
4,0 3,0
3,6 2,8
4,8
Bajo el supuesto de que los tiempos tienen una distribución normal. Calcule e interprete un intervalo de confianza del 90% para estimar el verdadero tiempo promedio que utilizaría un estudiante para desarrollar el test de inteligencia. 2. Se sabe que el número de tazas de café que se pueden preparar con una lata de café de la marca COLCA de 125 gr. sigue una distribución Normal. Se selecciona una muestra de 10 latas de este tipo de café y se utilizó una medida fija para la preparación de las tazas de café. Los resultados obtenidos fueron: 285 291 279 288 282 285 291 279 288 282 Calcule e interprete un intervalo de confianza del 98% para estimar el número promedio de tazas de cafés que se pueden preparar. 3. Una muestra de 427 suscriptores de una prestigiosa revista de vinos mostró que el tiempo promedio que pasa un suscriptor visitando la Web es de 10,70 horas semanales con varianza de 16,50 horas semanales2. Calcule e interprete un intervalo del 94% de confianza para el verdadero tiempo promedio que pasan los suscriptores semanalmente visitando la Web si la revista cuenta con un total de 1764 suscriptores. 4. El precio de los espacios periodísticos en el diario X en la sección de clasificados en un tamaño de 3cm x 4cm. durante los meses de febrero a agosto del 2010 fueron: 45
52
43
56
41
42
43
Calcule e interprete un intervalo de confianza al 90% para el precio promedio poblacional durante el 2010. Asuma que la variable tiene distribución normal.
149
Estadística para Comunicadores
5. El gasto anual en videojuegos de los jóvenes de una ciudad sigue una distribución normal con una desviación estándar de 18 dólares. Elegida una muestra al azar de 144 jóvenes se ha obtenido un gasto promedio de 120 dólares. Calcule e interprete un intervalo de confianza al 99 % para el gasto medio en videojuegos de todos los jóvenes de esa ciudad. 6. Un reportaje periodístico sobre consumo de cigarrillos en jóvenes universitarios de Lima Metropolitana, indicó que el gasto promedio mensual en cigarrillos de jóvenes universitarios fumadores es de 50 soles. Para comprobarlo, la oficina de Apoyo al alumno de una universidad selecciona al azar una muestra de 9 estudiantes que fuman y registró el gasto mensual en cigarrillos (en soles). Los resultados obtenidos se muestran a continuación: 39
48
55
62
35
74
45
52
32
Suponga que el gasto mensual en cigarrillos tiene distribución normal, con un nivel de confianza del 98% ¿será cierta la afirmación del reportaje? 7. La empresa KreaPubli tiene a la empresa Imagen como su mayor competencia, por lo que el gerente de KreaPubli ha decidido estimar el costo de sus spot que elabora su competencia seleccionando al azar una muestra de 6 spots elaborados por Imagen obteniendo los siguientes resultados, en miles de dólares: 23
25
55
19
33
38
Asumiendo que los costos por spots tienen una distribución normal. Estime e interprete al 95% de confianza el intervalo para el verdadero costo promedio por spot que la empresa Imagen elabora. 8. Una de las ofertas más frecuentes y que congrega a gran cantidad de compradores en los supermercados Metro, es la famosa frase “pague dos y lleve tres” en tallarines Don Vittorio. Un estudiante de Periodismo que lleva el curso de Estadística para Comunicadores quiere verificar si el contenido de las bolsas de fideo Don Vittorio es de 500 gramos tal como se indica en la etiqueta del producto. Asumiendo que el contenido de las bolsas de fideo sigue una distribución normal. Calcule e interprete un intervalo del 98% de confianza para el verdadero peso promedio de las bolsas de fideo, si en una muestra de 300 bolsas se obtuvo un peso promedio de 499 gramos con desviación estándar de 8 gramos. 9. La empresa publicitaria Agnosis cuenta actualmente con 200 trabajadores y en los últimos meses ha observado un alto porcentaje de trabajadores que llegan tarde, por lo que tiene entre sus planes implementar un servicio de transporte. Para este fin, la oficina de Recursos Humanos seleccionó una muestra de 16 trabajadores y estimó que el tiempo promedio que demora un trabajador en llegar al trabajo es de 45 minutos con desviación estándar de 10 minutos. Calcule e interprete un intervalo del 95% de confianza para el tiempo promedio de llegada de todos los trabajadores de la empresa.
Estadística para Comunicadores
150
Tamaño de muestra para estimar la media de una población Cuando la varianza poblacional es desconocida Al iniciar cualquier investigación, la pregunta que surge es ¿cómo podemos determinar el tamaño óptimo de una muestra? ¿Bastará con aplicar un cuestionario a 100 personas? o, ¿Será necesario encuestar a 500 individuos? ¿Cómo influye la variabilidad de las respuestas de cada encuestado? ¿Qué margen de error tendrán los resultados hallados en la encuesta? Las respuestas a cada una de estas preguntas nos la da la Estadística. A la hora de determinar el tamaño que debe alcanzar una muestra hay que tener en cuenta: el parámetro a estimar, el margen de error o error de estimación, la varianza poblacional y el nivel de confianza.
Márgen de error
Nivel de confianza
Varianza poblacional
•Es la diferencia entre un estadístico y su parámetro correspondiente. •Nos da una idea clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. •Un estadístico será más preciso cuando su error sea más pequeño.
•Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero valor del parámetro.
•Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.
La fórmula para determinar el tamaño de muestra es:
z S n 1 / 2 e
2
151
Estadística para Comunicadores
El valor de S puede ser estimada a partir de una muestra preliminar o piloto. Si la población es finita; es decir, se conoce el tamaño de la población, el tamaño de muestra se corrige con la siguiente fórmula:
nc
n 1
n N
Ejemplo Universal es una nueva emisora de carácter político y a una semana de estar al aire cuenta ya con 300 radioescuchas. El gerente de Universal desea realizar un estudio para estimar el tiempo de conexión promedio de los oyentes ¿Cuál debe ser el tamaño de muestra de oyentes que se necesita si desea tener un error de estimación de 0,15 horas con un nivel de confianza del 95%. Al seleccionar una muestra piloto se obtuvieron los siguientes resultados, en horas: 3,2 6,3
4,8 7,9
5,3 8,2
9,1 7,9
6,3 6,9
8,2 9,3
6,5 8,6
9,6 6,8
10,3 10,1
Solución e = 0,15 , s = 1,8597
,
Z (0,975) = 1,96 y N = 300
El tamaño de la muestra se obtiene con la siguiente fórmula: 2
1,96 x 1,8597 n0 590,49 591 0,15 Como el tamaño de la población es conocida se debe corregir la muestra:
n
591 198,87 199 591 1 300
Se necesitará entrevistar una muestra de 199 radioescuchas.
8,6 9,0
152
Estadística para Comunicadores
Ejercicios 1. ¿Cuál debe ser el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que demoran los estudiantes en llegar a la universidad con un nivel de confianza del 94% y con un error de estimación de 0,1 horas? Una muestra piloto de 8 alumnos arrojó los siguientes resultados: 2,0
1,5
0,45
1,45
1,0
0,30
1,20
1,30
Solución: e = …………
desviación estándar = ……. = …………………
El valor de Z(…………………) = …………
Luego, se debe encuestar a ……………………………………………….
2. La gerencia de un diario local desea estimar el gasto promedio mensual que las familias destinan a la compra de diarios. La gerencia desea que sus resultados tengan un nivel de confianza del 95% y un error de estimación no mayor a 3 soles. Si la desviación estándar de los gastos en compra de diarios en una muestra piloto fue de 20 soles ¿Qué tamaño de muestra deberá seleccionar? Solución: e = ………
desviación estándar = ……. = …………………
El valor de Z(…………………) = …………
Luego, se debe encuestar a ……………………………………………….
153
Estadística para Comunicadores
Ejercicios de aplicación 1. Se desea realizar una encuesta para estimar el número promedio de amigos que los jóvenes tienen en su cuenta de Facebook. Con un error de estimación de 25 amigos y con un nivel de confianza del 95%, determine el tamaño de muestra adecuado si en una muestra piloto se obtuvo que el valor de la desviación estándar del número de amigos es igual a 42. 2. La máquina de refrescos de una universidad está ajustada de tal manera que la cantidad de líquido despachada se distribuye aproximadamente en forma normal. ¿Qué tan grande se requiere que sea la muestra si se desea tener una confianza de 98% de que su media muestral esté dentro de 0,09 decilitros del promedio real? Se cuenta con la siguiente información de una muestra preliminar o piloto de tamaño 24. 1,99 2,52
2,59 2,48
2,04 2,14
1,86 1,98
2,58 2,29
2,04 2,02
2,73 1,94
2,51 1,82
2,65 2,53
2,72 2,38
2,44 2,39
2,29 2,43
3. Una editorial desea evaluar el tiempo promedio de distribución de su último best seller en cada uno de sus 400 puntos de venta. Para este estudio se desea tener un error de estimación de 3 minutos con un nivel de confianza del 90%, se sabe además que la desviación estándar de los tiempos de distribución es de 17 minutos. ¿Qué tamaño de muestra debe emplearse para el estudio? 4. La gerencia de un diario local quiere determinar la cantidad mensual promedio que las familias gastan en compra de diarios. En una muestra piloto se obtuvo que la desviación estándar de los gastos fue de 20 soles. Si la gerencia desea tener una confianza del 95% en la información recopilada y no quiere que el error de tolerancia sea mayor a tres soles. ¿Qué tamaño de muestra deberá seleccionar para determinar el gasto familiar mensual promedio? 5. Se planea una encuesta para determinar los gastos mensuales en campañas publicitarias de las 4500 empresas de una ciudad. Para este estudio se desea tener un error de estimación de 50 soles para los gastos mensuales con una confianza del 95%. Se sabe además que la desviación estándar de los gastos mensuales en campañas publicitarias en una muestra preliminar fue de 400 soles ¿Cuál será el tamaño de muestra a seleccionar?
Estadística para Comunicadores
154
Autoevaluación 1. Una muestra de 532 suscriptores de los 9 500 con los que cuenta una revista, mostró que el tiempo promedio que pasa un suscriptor en Internet es de 6,7 horas semanales. Si la desviación estándar de la muestra de suscriptores es de 5,8 horas semanales. Calcule e interprete un intervalo del 95% de confianza para el verdadero tiempo promedio que pasan los suscriptores de esta revista en Internet.
2. El ingreso mensual de una muestra piloto de egresados de la carrera de periodismo de cierta universidad tiene una desviación estándar de 2000 soles ¿De qué tamaño debe tomarse la muestra si se desea tener un margen de error de 500 soles para la estimación del ingreso promedio mensual de los egresados de la carrera de periodismo con una confianza del 90%?
155
Estadística para Comunicadores
Intervalo de confianza para la proporción poblacional Si pˆ es la proporción de éxitos en una muestra aleatoria de tamaño n y qˆ 1 pˆ , la proporción de fracasos, un intervalo de confianza aproximado de ( 1 ) x100% para el parámetro p está dado por:
pˆ Z1 / 2
pˆ qˆ pˆ qˆ p pˆ Z1 / 2 n n
Donde
Z1 / 2 es el valor Z que deja un área de 1-α/2 a la izquierda y
p ˆ
a , donde a = número de éxitos en la muestra. n
También puede ser expresado de la siguiente manera: IC(p) pˆ z (1 / 2)
pˆ (1 pˆ ) n
qˆ 1 pˆ
Si conocemos el tamaño de la población N, los límites del intervalo de confianza para p se calcula con la siguiente fórmula:
pˆ Z1 / 2
pˆ qˆ N n pˆ qˆ N n p pˆ Z1 / 2 n N 1 n N 1
Ejemplos 1. El dueño de un diario se interesa en la proporción de reporteros varones que cometen errores al momento de entregar el reporte final. Al seleccionar una muestra aleatoria de 100 reporteros varones encontró que 24 cometían errores. Calcule e interprete un intervalo de confianza del 99% para la verdadera proporción de reporteros varones que cometen errores al momento de entregar el reporte final. Solución La estimación puntual de p es pˆ
0,24 2,58
24 0,24 100
y
Z 0,995 2,58
(0,24)(0,76) (0,24)(0,76) p 0,24 2,58 100 100
Efectuando las operaciones indicadas se tiene: 0,1298 p 0,3502
156
Estadística para Comunicadores
Interpretación: Existe un 99% de confianza de que el intervalo [0,1298; 0,3502] contenga la verdadera proporción poblacional de reporteros varones que cometen errores al momento de entregar el reporte final. O en forma equivalente: Existe un 99% de confianza que entre [13;35]% se encuentre el verdadero porcentaje de reporteros varones que cometen errores al momento de entregar el reporte final.
2. Una encuesta realizada por una emisora radial acerca de los accidentes automovilísticos a 814 adultos de Lima Metropolitana, ante la pregunta ¿cree usted que el principal problema se debe al estado de ebriedad de los conductores?, se obtuvo que 562 adultos contestaron que sí. ¿Cuál es el valor de la amplitud del intervalo al 98% de confianza para la verdadera proporción de adultos que no creen que el principal problema sea el estado de ebriedad de los conductores? Solución El tamaño de muestra n = ……….. Calculemos la proporción muestral pˆ
.......................
El nivel de confianza (1-α) es …..…..……, entonces z
1
.............................
2
Consideramos a la población ………………….………., (finita o infinita)
Luego, el intervalo será es IC p [................... ; ................... ] Interpretación
157
Estadística para Comunicadores
3. Los resultados de un estudio socioeconómico realizado a una muestra aleatoria de 100 comerciantes informales arrojó lo siguiente: un ingreso medio de $600, una desviación estándar de $50 y sólo un 30% de comerciantes informales tiene ingresos superiores a $800. Estime la proporción de todos los comerciantes informales con ingresos superiores a $800 mediante un intervalo del 98% de confianza. Solución Calculemos la proporción muestral pˆ
.......................
El nivel de confianza (1-α) es …..…..……, entonces z
1
2
.............................
Consideramos a la población ………………….………., (finita o infinita)
Luego, el intervalo será es IC p [................... ; ................... ] Interpretación
158
Estadística para Comunicadores
4. En una muestra aleatoria de 400 videocámaras se recogió información respecto a la situación
operativa de éstas y se encontró que 40 estaban defectuosas. Estime e interprete el intervalo de confianza al 90% para la verdadera proporción de videocámaras defectuosas sabiendo que en total existen 2000 videocámaras. Solución Calculemos la proporción muestral pˆ
.......................
El nivel de confianza (1-α) es …..…..……, entonces z
1
.............................
2
Consideramos a la población ………………….………., (finita o infinita)
Luego, el intervalo será es IC p [................... ; ................... ] Interpretación
Estadística para Comunicadores
159
Ejercicios de aplicación 1. Para contrarrestar la menor demanda interna, algunos fabricantes peruanos de cuadernos están exportando de tal manera que sus maquinarias estén operativas durante todo el año. Se eligió una muestra de 1200 cuadernos en el año 2012 y 2013 respectivamente, cuyos resultados se presentan a continuación: Empresas exportadoras de cuadernos (2012) % de Empresa cuadernos Aw Faber Castell Peruano 39,6 Novo Plast Industrial 23,3 Papelera Nacional 4,0 Artesco 8,8 Otros 24,3
Empresas exportadoras de cuadernos (2013) % de Empresa cuadernos Aw Faber Castell Peruano 27,9 Novo Plast Industrial 12,2 Papelera Nacional 4,3 Artesco 41,3 Otros 14,5
Determine un intervalo de confianza del 90% para la proporción de cuadernos que exportó Papelera Nacional en el año 2013. 2. Una reportera de la revista Byte desea realizar una encuesta para determinar la verdadera proporción de todos los estudiantes universitarios que poseen Tablet. Para realizar este estudio tomo una muestra de 1285 alumnos y encontró que 320 tenían Tablet. Encuentre un intervalo de confianza al 97,5% para la verdadera proporción de estudiantes que poseen Tablet e interprete el resultado obtenido. 3. El director de personal de una agencia desea estimar la proporción de empleados a los que les falta menos de un año para jubilarse. Se selecciona una muestra aleatoria simple de 85 registros de empleados y se encuentra que a cinco les falta menos de un año para jubilarse. Calcule e interprete una estimación por intervalo del 98% para la proporción verdadera de empleados que se encuentran en esta situación en toda la empresa si en dicha agencia existen 290 empleados. 4. La empresa Taco Ahora está evaluando los resultados de su ingreso al mercado de una ciudad. El encargado de la campaña publicitaria de dicha empresa pregunta a 900 residentes elegidos de manera aleatoria si han ido a Taco Ahora en el último mes. De los entrevistados, 300 respondieron que sí. Calcule e interprete un intervalo del 99% de confianza para el porcentaje verdadero de los residentes de la ciudad que no han ido a Taco Ahora en el último mes. 5. En una investigación realizada por una agencia publicitaria se preguntó a una muestra de 320 individuos si conocían un refresco determinado. Si 180 de los encuestados respondieron que sí, calcule e interprete con un 95% de confianza la verdadera proporción de individuos de dicha población que conoce el producto.
Estadística para Comunicadores
160
6. La compañía Sandson acaba de lanzar una nueva campaña publicitaria y le ha pedido a Investigaciones Inland Market que lleve a cabo una encuesta para comprobar en qué medida se retiene la publicidad en la mente del cliente. Inland Market llevo a cabo 120 encuestas telefónicas para determinar la proporción de entrevistados que recordaron el nuevo eslogan o lema publicitario y encontró que 90 de los entrevistados lo recordaron. Determine la estimación por intervalo para la verdadera proporción de entrevistados que recuerdan el eslogan con un 99% de confianza. Interprete. 7. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas. Calcule e interprete un intervalo de confianza del 90% para la proporción de los reproductores de discos compactos de la población que no pasan todas las pruebas. 8. En una muestra aleatoria de 500 personas se encontró que 300 votarán por el candidato A en las próximas elecciones. Estimar la proporción de todos los electores que votarán por el candidato A mediante un intervalo de confianza del 95% si se sabe que hay una población electoral de 7500 personas.
Tamaño de muestra para estimar una proporción poblacional Cuando se dispone de información muestral Si pˆ se utiliza como una estimación de “p” podemos tener una confianza del ( 1 )x100% de que el error será menor de una cantidad específica “e” cuando el tamaño de la muestra es aproximadamente:
z12 / 2 pˆ 1 pˆ n e2 Si se conoce el tamaño de la población N, entonces el tamaño de muestra se reajusta con la siguiente fórmula: n nc n 1 N
Estadística para Comunicadores
161
Ejemplos
1. En cierto estudio piloto, el 32% de los 1 600 adultos encuestados dijeron que el programa espacial debe enfatizar la exploración científica. ¿Qué tan grande se necesita que sea la muestra definitiva de adultos en la encuesta si se desea tener una confianza del 95% de que el porcentaje estimado esté dentro del 2% del porcentaje real. Solución El valor de Z1 / 2 1,96 y la estimación del porcentaje de adultos que manifiestan que se debe enfatizar en la exploración científica es del 32% Remplazando en la fórmula del tamaño de muestra:
1,96 2 (0,32)(0,68) n 2089,8 (0,02) 2 El tamaño de muestra con las condiciones solicitadas será 2090 adultos.
2. En una muestra piloto de 500 familias en la ciudad de Lima, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de la proporción de familias suscritas a HBO esté dentro de 0,02 de la proporción verdadera?
Solución Como el nivel de confianza (1-α) es del 95%, entonces α = ……….………. La estimación
pˆ .................... y el margen de error = ………………
Entonces, el tamaño de muestra para las condiciones propuestas es de …………………..……..
Estadística para Comunicadores
162
Ejercicio En una muestra aleatoria de 300 personas mayores de edad de una gran ciudad se encontró que 105 leían un determinado periódico. De acuerdo a esos datos se pretende seleccionar una nueva muestra para conseguir un error de estimación de 0,03 como máximo, con un nivel de confianza del 98% para la estimación de la proporción de lectores de ese periódico. Encuentre el número de individuos de la población que, como mínimo, debe tener la muestra. Solución Como el nivel de confianza (1-α) es del 98%, entonces α = ……….………. La estimación pˆ .................... y el margen de error = ………………
Entonces, el tamaño de muestra para las condiciones propuestas es de …………………..
Cuando no se dispone de información muestral 1 El valor de pˆ 1 pˆ se hace máximo cuando pˆ 0,5 por lo tanto la fórmula para calcular 2
el tamaño de muestra queda de la siguiente manera:
n
z12 / 2 (0,5) 0,5 e2
Si se conoce el tamaño de la población N, entonces el tamaño de muestra se reajusta con la siguiente fórmula:
nc
n 1
n N
Estadística para Comunicadores
163
Ejemplo 1. Una agencia publicitaria desea hacer una afirmación en su spot publicitario. Para ello lleva a cabo un estudio para estimar el porcentaje de ciudadanos de una gran ciudad que están a favor de que el agua se trate con flúor. ¿Qué tan grande debe ser la muestra que debe seleccionar si se desea tener una confianza de 95% de que la estimación esté dentro del 1% del porcentaje real? Solución El valor de
Z1 / 2 1,96 entonces el tamaño de muestra para un error de 1% es n
1,96 2 (0,5)(0,5) 9604 (0,01) 2
Luego el tamaño de muestra solicitado será 9604 ciudadanos.
2. El alcalde de un distrito desea estimar la proporción de residentes que conocen la propuesta respecto al uso de fondos municipales para mejorar la limpieza del distrito ¿Qué tamaño de muestra necesita seleccionar si requiere una confianza del 98% y un error máximo de estimación de 0,10? Solución Como el nivel de confianza (1-α) es del 98%, entonces α = ……….………. La estimación pˆ .................... y el margen de error = ………………
Entonces, el tamaño de muestra para las condiciones propuestas es de …………………..
Estadística para Comunicadores
164
3. Usted trabaja en una compañía de investigación de mercado y le han encargado estimar el porcentaje de hogares que tienen Internet en casa, ¿cuántos hogares debe encuestar si desea tener una confianza del 95% de que el porcentaje muestral difiera del poblacional a lo más en 2,5%? Solución Como el nivel de confianza (1-α) es del 95%, entonces α = ……….………. La estimación pˆ .................... y el margen de error = ………………
Entonces, el tamaño de muestra para las condiciones propuestas es de …………………….….. 4. Para estimar el porcentaje de electores a favor de un candidato, una encuestadora debe determinar el tamaño de la muestra de una población de 10 000 electores ¿Qué tan grande debe ser la muestra si se quiere tener una confianza del 97% y un error de estimación no superior al 4,8%? Solución Como el nivel de confianza (1-α) es del 97%, entonces α = ……….………. La estimación pˆ .................... y el margen de error = ………………
165
Estadística para Comunicadores
Como N = ………………., entonces el valor de la muestra corregida será:
Finalmente, el tamaño de muestra para las condiciones solicitadas será igual a ………………
Ejercicios de aplicación 1. La alcaldía de Lima desea concientizar a la población a través de la campaña “Si toma no maneje” encargada a una importante agencia publicitaria. Con un 95% de confianza y con un error de estimación no mayor a 3,5% ¿de qué tamaño necesita tomar la muestra la agencia para estimar el porcentaje de todos los ciudadanos a favor de esta campaña? 2. Se realiza un estudio para estimar la proporción de residentes en una ciudad que están a favor de la construcción de una vía expresa. ¿Qué tan grande deber ser una muestra si se quiere una confianza de 97% de que la estimación estará dentro de 0,03 de la proporción real de residentes de la ciudad que están a favor de la construcción de la vía expresa? 3. Una empresa desea estimar la proporción de trabajadores del área de diseño publicitario que están a favor de que se corrija el programa de capacitación que se viene dando actualmente en el área. La estimación debe quedar a menos de 0,08 de la proporción verdadera de los que favorecen el programa de capacitación. Con una confianza del 95% ¿cuántos trabajadores se deben seleccionar? 4. Un supermercado ha adquirido un lote de 2 000 revistas. En adquisiciones anteriores se ha obtenido que la proporción de revistas defectuosas es alrededor de 0,18. ¿Qué tamaño de muestra debe seleccionarse para estimar la proporción de revistas defectuosas en este lote si se desea tener un error de estimación de 0,04 con una confianza del 90%? 5. Una reportera de la revista Byte desea realizar una encuesta para estimar la verdadera proporción de estudiantes universitarios que poseen Tablet y quiere tener una confianza del 96% con un margen de error de 0,035. Suponga que en un estudio previo obtuvo un estimado de la proporción que reveló un porcentaje del 29% de estudiantes universitarios que poseen Tablet. ¿A cuántos estudiantes universitarios deberá encuestar?
Estadística para Comunicadores
166
Autoevaluación 1. Una empresa de cadena de cines (A) está interesada en evaluar un nuevo spot publicitario de una conocida marca de bebida gaseosa que se proyecta en el bloque previo a la proyección del film de entretenimiento. El equipo de investigación de dicha cadena de cines, decidió tomar una muestra de 230 espectadores de los 1200 espectadores que acuden al cine regularmente los fines de semana en el local del centro de la ciudad. A estos espectadores se les entrevistó con la finalidad de averiguar el nivel de percepción del spot publicitario. El resumen de los resultados se muestra a continuación: Nivel de percepción Baja Media Alta
Número de espectadores 70 125 35
Estime el porcentaje de espectadores que tuvieron un nivel de percepción alta del nuevo spot publicitario al 98% de confianza.
2. El gerente de la cadena de cines ha decidido mantener el nuevo spot publicitario en las semanas siguientes si el porcentaje de espectadores con un nivel de percepción alta o media es mayor del 60%. Considerando un nivel de significancia del 5%, ¿qué decisión tomará el gerente?
167
Estadística para Comunicadores
Prueba de Hipótesis La prueba de hipótesis involucra una suposición sobre el valor de un parámetro de la población. A partir de la información proporcionada por la muestra se verificará la suposición sobre el parámetro estudiado. La hipótesis que se contrasta se llama hipótesis nula (Ho). Partiendo de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula a favor de la alternativa, o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación inicial del parámetro poblacional podría ser correcto. El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa simplemente que los datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula.
Tipos de errores Conclusión Condición de la población
No rechazar H0
Rechazar H0
H0 verdadera
Conclusión correcta
Error de tipo I =
H0 falsa
Error de tipo II =
Conclusión correcta
Error Tipo I
• Ocurre cuando se rechaza una hipótesis H0 que es verdadera. La probabilidad de error tipo I viene a ser la probabilidad de rechazar H0 cuando ésta es cierta. • El valor es fijado por la persona que realiza la investigación (por lo general varía entre 1% -10%)
Error Tipo II
• Ocurre cuando se acepta una hipótesis H0 que es falsa, la probabilidad de error tipo II es la probabilidad de aceptar H0 cuando ésta es falsa. • Debido a que el valor real del parámetro es desconocido este error no puede ser fijado.
168
Estadística para Comunicadores
Pasos a seguir en una Prueba de Hipótesis
Paso 1
•Plantear las hipótesis
•Fijar el nivel de significación
Paso 2
Paso 3
•Calcular el estadístico de la prueba
Paso 4
•Graficar las regiones críticas
Paso 5
•Aplicar los criterios de decisión
Paso 6
•Concluir
Prueba de hipótesis para la media poblacional A continuación consideramos el caso donde se supone que la población sigue una distribución normal y la desviación estándar de la población σ no es conocida, por lo tanto se estimará mediante la desviación estándar muestral, s. En este caso se puede utilizar la distribución t para hacer inferencia acerca del valor de la media de la población. Procedimiento para realizar la prueba de hipótesis 1. Plantear las hipótesis
H 0 : 0 H1 : 0 2. Fijar el nivel de significación:
H 0 : 0 H1 : 0
H 0 : 0 H1 : 0
169
Estadística para Comunicadores
3. Estadístico de la prueba
t
x μo S n
El estadístico tiene una distribución t con (n–1) grados de libertad.
4. Graficar las regiones críticas
Bilateral
H1 : 0
Unilateral Izquierda
H1: < 0
Unilateral Derecha
H1: > 0
5. Decisión: Rechazar Ho o No rechazar Ho. 6. Concluir. Ejemplos 1. El fabricante de una marca de cigarrillos le afirma a un publicista que sus cigarrillos contienen en promedio a lo más 18 miligramos de nicotina por cigarrillo. El publicista para verificar esta afirmación y colocarla en el cartel publicitario examina una muestra de 20 cigarrillos. Con un nivel de significancia del 2,5% ¿podrá concluir que la afirmación dada por su cliente es cierta si la muestra arrojó un contenido promedio de 19,2 miligramos con desviación estándar de 2 miligramos? Suponga que el contenido de nicotina se distribuye normalmente.
170
Estadística para Comunicadores
Solución Sea X: contenido de nicotina en los cigarrillos (en miligramos) 1. Hipótesis: H 0 : 18 H 1 : 18
2. Nivel de significación: 0,025 3. Estadístico de la prueba
tc
19,2 18 2,6833 2 / 20
4. Regiones críticas.
No se rechaza Ho
2,09302
5. Decisión: Se rechaza Ho 6. Conclusión: Con 2,5% de nivel de significancia no es posible afirmar que el contenido
promedio de nicotina en los cigarrillos es superior a 18 miligramos. Por lo tanto, no es cierta la afirmación del fabricante.
Aplicación con salida de SPSS Suponga que el peso (en kilogramos) de ciertos paneles publicitarios sigue una distribución normal. Para realizar un control de calidad de los mismos, se tomaron al azar una muestra de 7 de ellos, encontrándose los siguientes resultados: Paneles Peso (en kilos)
1 55,50
2 56,20
3 61,00
4 64,50
5 67,80
6 62,10
7 56,70
Se desea probar si la evidencia muestral permiten suponer que el verdadero peso promedio de estos paneles es menos de 59 kilos. Use un α = 0,05
171
Estadística para Comunicadores
Solución: 1. Hipótesis. H 0 : 59 H 1 : 59
2. Nivel de Significación: α = 0,05 3. Prueba Estadística: Salida obtenida con SPSS Prueba para u na mu estra Valor de prueba = 59
t peso
gl .877
6
Sig. (bilateral) .414
Dif erencia de medias 1.54286
95% Interv alo de conf ianza para la dif erencia Inf erior Superior -2.7623 5.8481
4. Decisión: No se rechaza Ho 5. Conclusión: Con 5% de nivel de significación y a partir de la información muestral, no es posible afirmar que el peso promedio de los paneles sea menos de 59 kilos.
Ejercicios
1. A partir de los datos de una muestra aleatoria de 100 estudiantes de Publicidad seleccionados de varias universidades de la ciudad capital, se estimó que su gasto promedio semanal en materiales de estudios (fotocopias e impresiones) es de 32,5 soles con una desviación estándar de 10 soles. Usando un nivel de significación del 5% ¿proporcionan estos datos suficiente evidencia para decir que el verdadero gasto promedio semanal en materiales de estudios de los estudiantes de Publicidad no es igual a 30 soles? Solución Sea X: ……………………………………………………….. 1.
Hipótesis
H 0 : ..................... H 1 : ..................... 2. Nivel de significación: = ……………….
Estadística para Comunicadores
172
3. Estadístico de la prueba
4. Regiones críticas.
5. Decisión.
6. Conclusión:
2. Una cadena de restaurantes de comida rápida afirma en su anuncio publicitario: “Te atendemos en menos de 3 minutos”. Para corroborar esta afirmación se le encarga a usted verificarla y para ello decide seleccionar al azar una muestra de 50 clientes de uno de estos restaurantes encontrando que el tiempo promedio de espera era de 2,75 minutos con una desviación estándar de 1,5 minutos. Si la variable tiene distribución normal ¿será cierta la afirmación dada por esta cadena de restaurantes? Use un nivel de significancia del 5%. Solución Sea X: ………………………………………………………..
Estadística para Comunicadores
1. Hipótesis
H 0 : ..................... H 1 : ..................... 2. Nivel de significación: = ………………. 3. Estadístico de la prueba
4. Regiones críticas.
5. Decisión.
6. Conclusión:
173
174
Estadística para Comunicadores
Ejercicios de aplicación 1. Antes de poder ver una película debe esperar hasta el final de los comerciales, anuncios y cortos de películas. Una cadena de salas de cines afirma que la duración promedio de cualquier anuncio no es mayor de tres minutos. Para probar esta afirmación, se seleccionan al azar 18 anuncios y se encontró que en promedio duraban 3,25 minutos con una desviación estándar de 0,5 minutos ¿Será cierto lo afirmado por la cadena de salas de cines? Use =1%. Suponga que la duración de los anuncios en las salas de cine se distribuye normalmente. 2. Unos estudiantes de Periodismo y Comunicación desean conocer el tiempo promedio que dura una entrevista a un representante político en los noticieros nocturnos. Para realizar esta prueba tomaron una muestra al azar de 14 noticieros obteniendo un tiempo promedio de 7,4 minutos y una desviación estándar de 0,8 minutos ¿Se puede afirmar que el tiempo promedio que dura una entrevista es mayor a 7,1 minutos? Use α = 0,05 3. Un reportaje periodístico sobre consumo de cigarrillos en jóvenes universitarios de Lima Metropolitana, indicó que el gasto promedio mensual en cigarrillos de jóvenes universitarios fumadores es de 50 soles. Para comprobarlo, la oficina de Apoyo al Alumno de una universidad selecciona al azar una muestra de 9 estudiantes que fuman y registró el gasto mensual en cigarrillos, en soles. Los resultados obtenidos se muestran a continuación: 39
48
55
62
35
74
45
52
32
Suponga que el gasto mensual en cigarrillos tiene distribución normal, con un nivel de significancia del 2% ¿será cierta la afirmación del reportaje? 4. El Consejo Municipal de una ciudad está considerando aumentar el número de agentes de policía municipal en un esfuerzo por reducir los delitos. Si el número promedio de robos diarios es mayor a 8 se aumentará el número de agentes. Para poder tomar una decisión el Consejo Municipal tomó una muestra de 36 días y encontró que el número promedio de robos era de 8,75 con una desviación estándar igual a 2 ¿Qué decisión tomará el Consejo Municipal? Suponga que el número de robos sigue una distribución normal. Utilice un nivel de significación del 5% 5. De una empresa que se dedica a la venta de cámaras fotográficas profesionales se tomó una muestra aleatoria de estos artículos y se registró el precio, en soles. Los datos se presentan a continuación: 1199
948
799
658
859
459
689
859
895
699
1299
Asumiendo que las ventas siguen una distribución normal. Pruebe la hipótesis que señala que el verdadero precio promedio de las cámaras fotográficas es superior a 770 soles. Utilice un nivel de significación del 2%.
175
Estadística para Comunicadores
Prueba de hipótesis para una proporción poblacional Esta prueba se realiza para verificar una suposición que se hace sobre una proporción poblacional. En este caso se utilizará la distribución Z para realizar la inferencia. Procedimiento para realizar la prueba de hipótesis 1. Planteamiento de las hipótesis
H 0 : p p0 H 1 : p p0
H 0 : p p0 H 1 : p p0
H 0 : p p0 H 1 : p p0
2. Fijar el nivel de significación: 3. Estadístico de la prueba
Z
pˆ po po (1 po ) n
4. Graficar las regiones críticas
H1 : p p0
Bilateral
Unilateral Izquierda
Unilateral Derecha
H1 : p < p0
H1 : p > p0
Estadística para Comunicadores
176
5. Decisión: Rechazar Ho o No rechazar Ho. 6. Concluir.
Ejemplo 1. El administrador de un diario de circulación nacional afirma que menos del 5% de los diarios presentan error de impresión. Si en una muestra aleatoria de 60 diarios se encontró que 6 de ellos presentan error de impresión. Con un nivel de significación del 2,5%, ¿se puede afirmar que el administrador tiene razón? Solución 1. Hipótesis
H 0 : p 0,05 H 1 : p 0,05 2. Nivel de significación: 0,025 3. Estadístico de la prueba Z
0,1 0,05 1,7770 0,05 (0,95) 60
4. Regiones críticas
No se rechaza Ho
5. Decisión: No rechazar Ho. 6. Conclusión: Con un nivel de significancia del 2,5% no se puede afirmar que menos el 5% de los diarios presenta error de impresión. La afirmación del administrador no es cierta.
Estadística para Comunicadores
177
2. Un programa que se transmite en cable encontró el año pasado que el 40% de las denuncias que recibían sus investigadores por correo electrónico eran por estafa. En el presente año se realizó un estudio similar, en el que al seleccionar una muestra de 420 mensajes electrónicos se encontró que en 188 de ellos eran denuncias por estafas. A un nivel de significación del 5%, ¿usted afirmaría que aumentó la proporción de denuncias por estafa? Solución 1. Hipótesis
H 0 : p 0,40 H 1 : p 0,40 2. Nivel de significación: 0,05 3. Estadístico de la prueba Z
0,4476 0,40 1,9913 0,40(0,60) 420
4. Regiones críticas
No se rechaza Ho
5. Decisión: Se rechaza Ho 6. Conclusión: Con 5% de nivel de significación se puede afirmar que más del 40% de los investigadores reciben denuncias por estafa vía correo electrónico; por lo tanto, la afirmación es verdadera.
Estadística para Comunicadores
178
Ejercicios 1. El 70% de las campañas publicitarias manejadas por la compañía Cuarzo tienen éxito. Para verificar ésta afirmación se seleccionaron aleatoriamente 80 campañas publicitarias, encontrándose que 50 de ellas tienen éxito. Con un nivel de significancia del 2% ¿será cierta la afirmación? Solución 1. Hipótesis
H 0 : p.................... H 1 : p................... 2. Nivel de significación: = ………………. 3. Estadístico de la prueba
4. Regiones críticas.
5. Decisión.
6. Conclusión:
179
Estadística para Comunicadores
2. El diario local “Perú XXI” afirmó la semana pasada en su portada principal que más del 30% de los estudiantes de la cierta universidad prefieren como plato preferido el ceviche de pato. El jefe del comedor universitario necesita contrastar dicha hipótesis brindada por este diario, para ello seleccionó una muestra aleatoria de 130 estudiantes de dicha universidad preguntándoles ¿Cuál de los platos que ofrece el comedor universitario es su preferido?, el resultado se resume en el siguiente gráfico: Distribución de estudiantes de cierta universidad según su plato preferido 40%
34.62%
Porcentaje de alumnos
35% 30% 23.08%
25% 20%
15.38%
15.38%
Tallarines
Otros
15% 7.69%
10%
3.85%
5% 0% Lomo Saltado Ceviche de Pato Ají de gallina
Carapulcra
Plato Preferido Fuente: Hipotética
Con un nivel de significancia del 5%, es posible afirmar lo manifestado por el diario local “Perú XXI. Solución 1. Hipótesis
H 0 : p.................... H 1 : p................... 2. Nivel de significación: = ………………. 3. Estadístico de la prueba
Estadística para Comunicadores
180
4. Regiones críticas.
5. Decisión.
6. Conclusión:
3. El gerente de una tienda de ventas de cámaras fotográficas de la marca Canon realizó un estudio entre género y el tipo de marca de cámaras fotográficas que utilizan los estudiantes de Ciencias de la Comunicación de cierta universidad, para ello se tomó una muestra aleatoria de 200 estudiantes. Los resultados procesados se muestran en la siguiente tabla adjunta. Distribución de estudiantes de Ciencias de la Comunicación según género y marca de cámaras fotográficas que utilizan Marca de cámaras fotográficas Género Total Hasselblad Mamiya Nikom Pentax 30 20 30 40 120 Masculino 20 15 30 15 80 Femenino 50 35 60 55 200 Total
El gerente afirmó que menos del 25% de los estudiantes utilizan cámaras fotográficas de la marca Pentax y son de género masculino. Con un nivel de significancia del 5% ¿Podemos afirmar lo dicho por el gerente? Asuma normalidad. Solución 1. Hipótesis
Estadística para Comunicadores
H 0 : p.................... H 1 : p................... 2. Nivel de significación: = ………………. 3. Estadístico de la prueba
4. Regiones críticas.
5. Decisión.
6. Conclusión:
181
Estadística para Comunicadores
182
4. Un restaurante de comida rápida planea una oferta especial que permita a los clientes comprar vasos con diseño especial con conocidos personajes de caricaturas. Si más del 15% de los clientes compran esos vasos, se lanzará la promoción. En una prueba preliminar en varios locales, 88 de 500 clientes los compraron ¿Se debe lanzar la promoción especial? Utilizando un nivel de significación del 1%, ¿cuál es su recomendación? Solución 1. Hipótesis
H 0 : p.................... H 1 : p................... 2. Nivel de significación: = ………………. 3. Estadístico de la prueba
4. Regiones críticas.
5. Decisión.
6. Conclusión:
183
Estadística para Comunicadores
Ejercicios de aplicación 1. De acuerdo a los datos provistos por el Observatorio de Movilidad Urbana, en el año 2010 el 53% de los vehículos de transporte público tenían más de 20 años de antigüedad. Este año, en un local de “Revisiones Técnicas Vehiculares S.A.”, se recogió información de una muestra de 120 vehículos, de los cuales 54 tenían más de 20 años de antigüedad. ¿Se puede afirmar con un 2,5% de significación, que la proporción de vehículos antiguos de transporte público se ha reducido? 2. Una encuesta realizada por una emisora radial a 814 adultos de Lima Metropolitana arrojó que 562 adultos consideraban que el principal problema de los accidentes de tránsito se debía al estado de ebriedad de los conductores ¿Será cierto que más del 70% de adultos considera que el principal problema se debe al estado de ebriedad de los conductores? Concluya para =0,02 3. Se cree que por lo menos el 20% de los estudiantes de la carrera de ciencias de la comunicación desea trabajar en el extranjero al finalizar sus estudios. En una encuesta realizada a una muestra aleatoria de 560 estudiantes se encontró que 85 estaban dispuestos a trabajar en el extranjero al finalizar su carrera. A un nivel de significación del 5% ¿cuál es su conclusión? 4. Diferentes estudios indican que más del 80% de los usuarios usan los buscadores en la web para encontrar información sobre productos y servicios antes de comprarlos. Para verificar esta información se selecciona al azar a 200 personas, de las cuales 170 indicaron que realizaron la consulta en la web antes de comprar. Con un nivel de significación del 2,5% ¿Hay razón para dar credibilidad a dicha afirmación? 5. En abril del 2013 un diario de la capital publicó en base a una encuesta realizada por una prestigiosa encuestadora a una muestra de 2735 limeños el siguiente gráfico: ¿Cuál es su situación laboral? 60%
56%
50% 40% 11%
7%
4%
7%
Otro
12%
10%
Empresario
20%
Informal
30%
Cobra honorarios personales
En planilla/estable
trabajador independiente
0%
situación laboral
Estadística para Comunicadores
184
¿Es posible concluir en base a la información muestral que menos del 60% de los limeños son trabajadores independientes? Use =0,05 6. El Director de la empresa de cable Cablemas afirma que más del 75% de los televidentes con cable tiene instalado Cablemas en sus hogares. Otra compañía de cable que va a realizar un estudio, duda de tal afirmación y lo quiere comprobar. Para ello toma una muestra aleatoria de 60 hogares con servicio de cable y obtiene que 42 hogares tienen instalado el servicio de cable Cablemas ¿Es cierto lo que afirma el Director? Concluya para un nivel de significación del 5%? 7. Se realizó una encuesta a una muestra de 155 alumnos universitarios. Los resultados obtenidos a la pregunta ¿Cuál es tu red social favorita? se muestran en el siguiente gráfico:
Distribución porcentual de alumnos según red social favorita
Usando un nivel de significación del 4% ¿se puede afirmar que más del 63% de los alumnos prefieren Facebook como red social favorita?
185
Estadística para Comunicadores
Autoevaluación Un estudio señalaba, que más del 42% del total de personas de grado superior de estudios, prefieren la TV como medio de comunicación. Para comprobar esta afirmación se ha conducido un nuevo estudio para determinar el medio de comunicación de mayor credibilidad. Los resultados obtenidos de una muestra de 200 entrevistados se presentan en el siguiente gráfico: Distribución porcentual de los entrevistados según medio de comunicación por grado de instrucción
% de encuestados
70%
62%
60% 48%
50% 40%
42%
39%
44% Periódico T.V.
30%
30%
Radio
20%
10%
8%
13%
14%
0%
Primaria
Secundaria
Superior
Grado de instrucción
¿Serra cierta la afirmación del estudio inicial? Utilice un nivel de significación del 1%
Estadística para Comunicadores
186
Prueba de hipótesis para dos varianzas poblacionales Al comparar las varianzas de dos poblaciones normales usaremos datos obtenidos de dos muestras aleatorias independientes, una de la población 1 y la otra de la población 2. Las dos 2 2 varianzas de las muestras, S1 y S2 serán la base para realizar la inferencia acerca de las dos 2 2 varianzas poblacionales 1 y 2 .
Procedimiento para realizar la prueba de hipótesis 1. Plantear las hipótesis 2 2 H 0 : 1 2 2 2 H1 : 1 2
2. Fijar el nivel de significación: 3. Estadístico de la prueba
s12 1 F 2 2 s2 1
~
F( n1 1,n2 1)
22
4. Graficar las regiones críticas
/2
/2
NO se rechaza Ho
F2
F1
Donde: n1 n2 s12
s
2 2
Fn1 1,n2 1
: Es el tamaño de la muestra de la población 1. : Es el tamaño de la muestra de la población 2. : Es la varianza de la muestra de la población 1. : Es la varianza de la muestra de la población 2. : Es la distribución F con n1–1 y n2–1 grados de libertad.
5. Aplicar los criterios de decisión: Rechazar Ho o No rechazar Ho. 6. Conclusión
187
Estadística para Comunicadores
Ejemplo 1. En un estudio de investigación referente al número de accidentes de tránsito diario que ocurren en Lima según distrito, realizado por el Diario El Comercio, destaca que tanto en el Cercado de Lima y en el Distritito de la Victoria en el año 2008 son los distritos que presentan mayor incidencia de accidentes. Bajo el supuesto de normalidad de la variable en estudio. ¿Con un nivel de significación del 5%, existe evidencia para afirmar que la variabilidad del número accidentes de tránsito diario es diferente para ambos distritos? Cercado (1) La Victoria (2)
Accidentes
70 43
Distrito Cercado La Victoria
90 43
N 7 7
84 51
Media 77.14 51.29
65 56
75 44
85 64
71 58
Desviación estándar 9.263 8.361
Error típico de la media 3.501 3.160
Solución X: Número de accidentes de tránsito diarios 1. Plantear las hipótesis 2 2 H 0 : 1 2 2 2 H 1 : 1 2
2. Fijar el nivel de significación: α= 0,05 3. Estadístico de la prueba F
s12 9,263 2 1,227 s 22 8,3612
4. Graficar las regiones críticas F1 = Ftab (0,025; 6,6) = 5,820 F2 = 1/Ftab (0,025; 6,6) = 0,172
0,025
NO se rechaza Ho
F2= 0,172
0,025 F1= 5,820
5. Decisión: No se rechaza Ho 6. Conclusión: Con un nivel de significación del 5% no es posible afirmar que la variabilidad del número de accidentes de tránsito diario sea diferente en ambos distritos.
188
Estadística para Comunicadores
2. La empresa de investigación de mercados ABC realiza un estudio para evaluar el tiempo que pasan conectados a Internet, por mes, adultos y jóvenes de los niveles socioeconómicos A y B. En un estudio preliminar, se concluyó que, en promedio, los adultos pasan más tiempo conectados a Internet que los jóvenes. Suponga que para confirmarlo esta empresa toma una muestra de 25 adultos y otra de 21 jóvenes. Las desviaciones estándar de las cantidades de tiempo que pasan conectados a Internet son 94 y 58 minutos, respectivamente. ¿Estos resultados favorecen la conclusión que las varianzas de los tiempos que pasan conectados a Internet los adultos es diferente al de los jóvenes? Use = 0,05. Asuma distribución normal. Solución X: Tiempo conectado a Internet, minutos por mes. 1. Hipótesis 2 2 H 0 : A J 2 2 H 1 : A J
2. Nivel de significación: α= 0,05 3. Estadístico d la prueba F
s12 94 2 2,627 s 22 58 2
4. Regiones Críticas
F1 = Ftab (0,025; 24,20) = 2,41 0,025
F2 = 1/Ftab (0,025; 20,24) = 0,429
0,025
Zona de NO rechazo Ho
F2 = 0,429
F1 = 2,41
5. Decisión: Se rechaza Ho 6. Conclusión: Con un 5% de nivel de significación se puede afirmar que la variabilidad de los tiempos que los adultos están conectados a Internet por mes es diferente al de los jóvenes.
189
Estadística para Comunicadores
Procedimiento para realizar la prueba de hipótesis con el reporte del SPSS 1. Planteamiento de las hipótesis H 0 : 12 22 H 1 : 12 22
2. Fijar el nivel de significación: α 3. Estadístico de la prueba 4. Criterio y decisión 5. Conclusión
1. En una universidad privada, veinte ingresantes fueron divididos aleatoriamente en dos grupos. Los integrantes de un grupo fueron asignados a una sección de estadística en la que sólo se utilizan materiales programados. Los integrantes del otro grupo fueron asignados a una sección en que enseña un profesor. Al término del semestre, a todos se les aplicó el mismo examen final. Los resultados se presentan en la siguiente tabla: Programado (1) Con un profesor (2)
76 81
60 62
85 87
58 70
91 86
44 77
82 90
64 63
79 85
88 83
¿Se puede concluir que existe diferencia significativa en la variabilidad de las notas de los alumnos de ambos grupos? Use un nivel de significancia del 5%. Solución X: Calificación de examen 1. Hipótesis 2 2 H 0 : 1 2 2 2 H 1 : 1 2
190
Estadística para Comunicadores
2. Nivel de significación: α= 0,05
3. Estadístico de la prueba: F = 2,855 4. Criterio y decisión: Si p > α No se rechaza Ho Si p < α Se rechaza Ho Como Sig.= p= 0,108 > α = 0,05 No se rechaza Ho 5. Conclusión: No existe evidencia estadística al nivel de significación del 5% para afirmar que la variabilidad de las notas sea diferente tanto para el método programado como para el método con un profesor.
2. Un estudio de mercado desea comparar los gastos, en soles, en la compostura de dos marcas de laptops realizados por sus propietarios en el tiempo fuera de la garantía que la empresa les otorgó. Al seleccionar 9 propietarios que adquirieron la marca Apple y 7 que adquirieron la marca hp, se obtuvieron los siguientes resultados: Gasto en soles en la compostura de las laptops Marca Apple
322
256
317
315
208
179
324
Marca hp
198
245
187
215
290
198
207
398
321
Prueba de muestras independientes Prueba de Lev ene para la igualdad de v arianzas
F gasto
Se han asumido v arianzas iguales No se han asumido v arianzas iguales
2.581
Sig. .130
Prueba T para la igualdad de medias
t
gl
Sig. (bilateral)
Dif erencia de medias
Error típ. de la dif erencia
95% Interv conf ianza dif eren Inf erior
2.595
14
.021
73.3333
28.2637
12.7136
2.794
12.679
.016
73.3333
26.2441
16.4899
¿Existe evidencia estadística para afirmar que la variabilidad en el monto de gasto por compostura para ambas marcas de laptops es similar? Use un nivel de significación del 10%. Asuma normalidad.
Estadística para Comunicadores
191
Solución X: ……………………………………………………………. 1. Hipótesis
H 0 : .................... H 1 : .................... 2. Nivel de significación: ………………………….. 3. Estadístico de la prueba
4. Criterio y decisión
5. Conclusión
3. Los siguientes datos corresponden a los tiempos de proyección, en minutos, de las películas producidas por 2 compañías cinematográficas. Después de procesar la información en SPSS se obtuvieron los siguientes resultados:
¿Se puede afirmar que la variabilidad del tiempo promedio de proyección de las películas producidas por ambas compañías no es similar? Use un nivel de significancia del 10% y asuma normalidad. Solución X: …………………………………………………………….
192
Estadística para Comunicadores
1. Hipótesis
H 0 : .................... H 1 : .................... 2. Nivel de significación: …………………………. 3. Estadístico de la prueba
4. Criterio y decisión
5. Conclusión
Independent Samples Test
4. Una empresa de publicidad de mucho prestigio desea contratar estudiantes de publicidad en calidad de practicantes, con la proyección de que más adelante formen parte del personal de la empresa. Para la selección se realiza una prueba extensa a estudiantes de las dos mejores universidades. Los resultados de la prueba se muestran a continuación. Los puntajes siguen una distribución normal. puntaje Equal v ariances ¿Se puede afirmar con un nivel de significación del 5% que las varianzas assumed de los puntajes son similares en ambas universidades? Solución X: ……………………………………………………………. 1. Hipótesis
H 0 : .................... H 1 : .................... 2. Nivel de significación: …………………………..
Lev ene's Test f or Equality of Variances
F 2.023
Sig. .167
Estadística para Comunicadores
193
3. Estadístico de la prueba:
4. Criterio y decisión:
5. Conclusión:
Prueba de hipótesis para la diferencia de medias poblacionales Para realizar las pruebas de hipótesis acerca de la diferencia entre las medias de dos poblaciones con varianzas poblacionales desconocidas y poblaciones independientes que siguen una distribución normal, usaremos la distribución t. Aquí las varianzas poblacionales, pueden ser similares o diferentes, para ello será necesario realizar previamente la prueba de la razón de las varianzas poblacionales. Esto afectará al cálculo del error típico de la diferencia de medias muestrales y el grado de libertad del estadístico de prueba. Procedimiento para realizar la prueba de hipótesis con el reporte del SPSS 1. Planteamiento de las hipótesis
H 0 : 1 2 H 1 : 1 2
H 0 : 1 2 H 1 : 1 2
2. Fijar el nivel de significación: α 3. Estadístico de la prueba: T student 4. Criterio y decisión 5. Conclusión
H 0 : 1 2 H 1 : 1 2
Estadística para Comunicadores
194
Ejemplo Ciertos observadores de medios afirman que la cantidad promedio de minutos dedicados a las noticias de negocios y finanzas durante los noticieros de dos canales de televisión no son similares. Para cada canal, seleccionaron de manera aleatoria e independiente diez emisiones semanales y observaron durante la transmisión la cantidad de minutos dedicados a la noticia de negocios y finanzas. Los tiempos, en minutos, medidos en estas muestras independientes se presentan a continuación.
Asumiendo normalidad en el tiempo que dedican a las noticias de negocios y finanzas, ¿es correcta la afirmación de los observadores utilizando un nivel de significación del 10%?
Estadística para Comunicadores
195
Solución X: ………………………………………………………………………….
Ejercicios de aplicación 1. Una empresa de publicidad desea determinar qué tanto éxito han tenido sus nuevos ejecutivos de cuenta en la obtención de clientes. Después de terminar su capacitación, los nuevos ejecutivos pasan varias semanas realizando llamadas a posibles clientes, tratando que abran cuentas con la empresa. Los siguientes datos dan el número de cuentas nuevas abiertas durante las dos primeras semanas por 10 ejecutivas y 8 ejecutivos de cuenta escogidos aleatoriamente.
196
Estadística para Comunicadores
Ejecutivas (1) Ejecutivos (2)
12 13
11 10
14 11
13 12
13 13
14 12
13 10
12 12
14
12
A un nivel de significación de α = 0,05 ¿Parece que las mujeres son más efectivas que los hombres para conseguir nuevas cuentas? 2. Una empresa publicitaria está evaluando a dos equipos de trabajo. La evaluación centra su atención en el tiempo que tardó cada equipo en elaborar una propuesta para una campaña publicitaria. En la tabla se muestran los resultados obtenidos:
Con un nivel de significancia del 5% ¿Considera usted que los equipos tienen la misma eficiencia para elaborar su propuesta? Se sabe que los tiempos están normalmente distribuidos. 3. El gerente de una empresa que comercializa películas tomó una muestra de 13 clientes de su tienda Azul (1) y otra de 16 clientes de su tienda Verde (2) para evaluar el tiempo, en minutos, en que sus clientes son atendidos. Los datos de ambas tiendas se muestran a continuación:
¿Se puede afirmar que el tiempo promedio de atención de la tienda Azul es superior al tiempo promedio de atención de la tienda Verde? Asuma normalidad y concluya para un nivel de significación del 5%.
Estadística para Comunicadores
197
198
Estadística para Comunicadores
Autoevaluación En la Edición 18 del Festival de Cine de Lima se programaron películas de diferente género. Para analizar el gasto de los asistentes en los géneros acción y comedia se seleccionaron muestras independientes. Al procesar los datos en SPSS se obtuvo la siguiente información: Prueba de Levene para la igualdad de varianzas
Prueba T para la igualdad de medias 95% Intervalo de Error típ.
F Gasto realizado durante el festival
Se han asumido varianzas
1,440
Sig.
t ,232
gl
Sig. (bilateral)
Diferencia de
de la
medias
diferencia
confianza para la diferencia Inferior
Superior
,666
308
,507
1,125
1,690
120,22
160,46
,694
127,955
,489
1,125
1,621
112,08
145,33
iguales No se han asumido varianzas iguales
Los organizadores del evento desean comprobar si el gasto promedio realizado este año por los espectadores de películas de acción (1) es mayor al gasto promedio realizado por los espectadores de comedia (2). De ser las películas de acción las que tengan mayor acogida, se ofrecerá en el próximo festival más salas con este tipo de película. Usando un nivel de significancia de 4% ¿qué decisión tomarán los organizadores?
Estadística para Comunicadores
199
Prueba de hipótesis para dos medias poblacionales: Muestras dependientes La prueba estadística t de Student para muestras dependientes es una extensión de la utilizada para muestras independientes. De esta manera, los requisitos que deben satisfacerse son los mismos, excepto la independencia de las muestras; es decir, en esta prueba estadística se exige dependencia entre ambas, en las que hay dos momentos uno antes y otro después. Con ello se da a entender que en el primer período, las observaciones servirán de control o testigo, para conocer los cambios que se susciten después de aplicar una variable experimental. En el diseño con muestras pareadas o dependientes se someten a prueba dos medias poblacionales bajo condiciones similares; por consiguiente, este diseño conduce con frecuencia a un menor error muestral que el diseño con muestras independientes.
Procedimiento para realizar la prueba de hipótesis 1. Planteamiento de las hipótesis
H 0 : 1 2 H 1 : 1 2
H 0 : 1 2 H 1 : 1 2
H 0 : 1 2 H 1 : 1 2
2. Fijar el nivel de significación: α 3. Cálculos. _
d d tc ~ t n 1 gl sd n
La notación d está dado por la diferencia de cada par de datos teniendo en cuenta el orden de la hipótesis. De estos datos se obtiene el promedio y su desviación estándar.
200
Estadística para Comunicadores
4. Regiones críticas
Bilateral
H1 : 1 2 H1 : d 0
Unilateral Izquierda
H1 : 1 < 2 H1 : d < 0
Unilateral Derecha
H1 : 1 > 2 H1 : d > 0
5. Criterios de decisión: Rechazar Ho o No rechazar Ho. 6. Conclusión.
Ejemplos 1. La publicidad del gimnasio Gym Center asegura que al término del curso de seis meses que ofrece se obtendrá una efectiva pérdida de peso corporal. Una muestra aleatoria de ocho registros seleccionados al azar de este gimnasio permitió observar el peso corporal, en kilos, entre los meses de febrero a julio de ocho participantes que asistieron al curso. Los resultados se muestran a continuación: Participante Febrero 2014 Julio 2014
1 70 69
2 103 93
3 63 66
4 73 71
5 95 88
6 74 68
7 83 77
8 77 74
Si los pesos corporales se distribuyen normalmente y con un nivel de significancia del 5%, ¿se puede afirmar que lo ofrecido por este gimnasio es cierto?
201
Estadística para Comunicadores
Solución Sea X: Peso corporal de los participantes (en kilos) 1. Planteo la hipótesis
H 0 : F J d 0 H 1 : F J d 0 2. Nivel de significación: 0,05 3. Cálculos
tc
4,0 0
2,779
4,0708 / 8
4. Regiones críticas.
1.89458
5. Decisión: Rechazo Ho 6. Conclusión: Con 5% de nivel de significación se puede afirmar que al término del curso de 6 meses que ofrece el gimnasio se obtendrá una efectiva pérdida de peso corporal.
2. La gerencia de ventas de una cadena de mercados diseñó un plan de incentivos para sus vendedores. A fin de evaluar este plan se seleccionaron doce vendedores al azar y se registraron sus ventas diarias, en dólares, antes y después de aplicar el plan. Suponga que las ventas antes y después del plan tiene distribución normal. Utilice el nivel de significación de 0,05 para determinar si hubo algún incremento significativo en las ventas de todos sus vendedores debido a la aplicación del plan. Vendedor Antes Después
1 89 94
2 87 91
Solución X: Ventas diarias, en dólares.
3 70 68
4 83 88
5 67 75
6 71 66
7 92 94
8 81 88
9 97 96
10 78 88
11 94 95
12 79 87
202
Estadística para Comunicadores
1. Hipótesis
H 0 : A D d 0 H 1 : A D d 0 Prueba de muestras relacionadas
Par 1
Antes - Despues
Media -3.500
Diferencias relacionadas 95% Intervalo de confianza para la diferencia Desviación Error típ. de típ. la media Inferior Superior 4.583 1.323 -6.412 -.588
t -2.646
gl 11
Sig. (bilateral) .023
2. Nivel de significación : α = 0,05 3. Criterios Si p/2 > α No se rechaza H0 Si p/2 < α Se rechaza H0 4. Cálculos: p/2 = 0,023/2 = 0,0115 < α Se rechaza Ho 5. Conclusión: Con un nivel de significación del 5% y a partir de la información muestral, se puede considerar que después de aplicarse el nuevo plan las ventas promedio diario se incrementaron.
Ejercicios 1. Doce individuos participaron en un experimento para estudiar la efectividad de cierta campaña publicitaria, registrándose la información de sus consumos realizados (en soles) antes y después de observar por televisión la publicidad de dicho producto. Los datos que se presentan a continuación: Sujeto Antes (1) Después (2)
1 201 200
2 231 236
3 221 216
4 260 233
5 228 224
6 237 216
7 326 296
8 235 195
9 240 207
10 267 247
11 284 210
12 201 209
Con un nivel de significación del 5% ¿se puede concluir que la campaña publicitaria es efectiva para aumentar los niveles de consumo de dicho producto? Asuma normalidad. Solución Sea X: ………………………………………………………………………
203
Estadística para Comunicadores
1. Planteo la hipótesis
H 0 : ............................... H 1 : ................................ 2. Nivel de significación: = ………… 3. Cálculo del estadístico
4. Regiones críticas.
5. Decisión.
6. Conclusión:
2. En un programa de telemercado, anuncian que utilizando la crema reductora Reduce Now, usted puede reducir su cintura al primer día de aplicación. Una nutricionista está interesada en verificar tal afirmación, ya que sus pacientes constantemente le preguntan sobre la veracidad de este producto. Para ello toma una muestra aleatoria entre sus amistades de varias edades y les aplica la crema siguiendo las instrucciones. Mide el contorno de cintura un lunes y al día siguiente, después de la aplicación. Los resultados de las medidas se muestran a continuación: Paciente Lunes (1) Martes (2)
1 68 67
2 74 74
3 95 94
4 82 80
5 78 78
6 90 89
7 84 83
Estadística para Comunicadores
204
En base a esta muestra ¿cuál será la conclusión de la nutricionista con un nivel de significación del 5% si las medidas se distribuyen normalmente? Solución Sea X: ……………………………………………………………. 1. Planteo la hipótesis
H 0 : ............................... H 1 : ................................ 2. Nivel de significación: = …………… 3. Cálculo del estadístico
4. Regiones críticas.
5. Decisión.
6. Conclusión:
205
Estadística para Comunicadores
3. Para evaluar el efecto que una campaña publicitaria tiene en la venta de un analgésico muscular, se eligió una muestra aleatoria de siete farmacias de la ciudad donde se vende este producto y se registró el volumen de ventas del mes en cientos de soles. Luego de un mes de lanzar la campaña publicitaria se registró las ventas de las mismas siete farmacias elegidas anteriormente. A continuación se muestran los datos obtenidos, para los meses de febrero y abril. Farmacia Febrero (F) Abril (A)
1 15,3 17,5
2 18,5 20,3
3 12,5 12,8
4 11,6 15,3
5 17,4 19,2
6 14,6 17,9
7 10,2 13,8
¿Fue efectiva la campaña publicitaria para el analgésico muscular? Asuma que el volumen de ventas mensuales se distribuye normalmente. Utilice un nivel de significación del 5%. Solución Sea X: ……………………………………………………………………… 1. Planteo la hipótesis
H 0 : ............................... H 1 : ................................ 2. Nivel de significación: = …………… 3. Cálculo del estadístico
4. Regiones críticas.
5. Decisión.
206
Estadística para Comunicadores
6. Conclusión:
Ejercicios de aplicación 1. Se dice que una nueva dieta reduce el peso de una persona en un periodo de 2 semanas. Los pesos, en kilogramos, de ocho mujeres que siguieron esta dieta fueron anotados antes y después del periodo. Mujer Peso antes Peso después
1 58 60
2 60 54
3 61 58
4 69 62
5 64 58
6 62 59
7 56 54
8 65 62
Asumiendo normalidad, ¿se puede concluir que la dieta fue eficaz? Use = 0,05 2. Se seleccionan al azar siete redactores de un diario y se procede a registrar el número de errores cometidos en la digitación de un artículo. Luego se les envía a un curso de perfeccionamiento y se vuelve a realizar la prueba. Los resultados obtenidos en ambos casos fueron los siguientes: Redactor Antes del curso Después del curso
1 12 10
2 17 12
3 09 13
4 18 12
5 14 12
6 26 20
7 12 18
¿Se puede afirmar con un 3% de significancia que el número de errores cometidos en la digitación es menor luego de haber realizado el curso? Asuma normalidad. 3. Las personas que leen periódico y acceden a ambos tipos de formatos, impreso y online, aseguran dedicar menos tiempo a leer las versiones impresas de los diarios, porque prefieren la inmediatez que ofrecen las versiones online. La siguiente tabla muestra los resultados, en minutos, de una encuesta acerca del tiempo que se dedican a leer el diario. Lector Versión impresa Versión online
1 2 23,3 25,3 28,5 31,3
3 26,1 36,0
4 22,3 19,1
5 24,4 35,5
6 23,6 26,6
7 21,9 20,8
8 28,0 26,2
9 23,0 27,2
Usando un nivel de significación del 4%, ¿se puede afirmar que el tiempo promedio que dedica un lector a leer la versión impresa de un periódico es menor al tiempo que dedica a la versión online?
207
Estadística para Comunicadores
4. La Jefa de la Biblioteca de una universidad ha presentado un informe en el que indica que el número promedio de libros prestados se ha incrementado en el mes de mayo en comparación al mes de abril. La información obtenida de una muestra de siete facultades se presenta en la siguiente tabla: Mes
Facultad
Mayo 1550 720 340 820 1600 580 950
Administración en Hotelería y Turismo Arquitectura Artes Contemporáneas Ciencias de la salud Ciencias Humanas Comunicaciones Derecho
Abril 1500 800 250 750 1500 620 930
Usando un nivel de significación del 5% ¿se puede dar por válida la afirmación de la jefa de la Biblioteca? 5. La publicidad de la compañía Sylph Physical Center asegura que al terminar su curso se obtendrá una pérdida de peso. Una muestra aleatoria de ocho estudiantes recientes dio los siguientes pesos, en libras, corporales antes de ingresar al curso y después de terminarlo. Al nivel de significación de 0,02, ¿se puede concluir que los alumnos perdieron peso? Nombre del estudiante Hunter Carmen Mónica Maribel César Peter Rita Paul
Antes 155 228 141 162 211 164 164 172
Después 154 207 147 157 196 150 150 165
208
Estadística para Comunicadores
Autoevaluación Un publicista está probando un nuevo programa de diseño y lo comprará siempre y cuando al usarlo le demande menos tiempo de elaboración que el actual. A fin de tomar una decisión selecciona una muestra de siete trabajos registrando el tiempo de elaboración, en horas, obteniendo los siguientes resultados: Trabajo Programa Actual Programa Nuevo
1 7 5
2 3 2
3 9 6
4 8 7
5 7 4
6 6 7
7 11 8
Asumiendo normalidad, ¿se puede afirmar que el nuevo programa de diseño utiliza menos tiempo en la elaboración del trabajo? Use = 0,025.
209
Estadística para Comunicadores
Prueba de hipótesis para dos proporciones poblacionales En esta oportunidad veremos una herramienta que permitirá comparar la diferencia de proporciones de dos poblaciones. En las pruebas de hipótesis en las que el valor hipotético de (p1 – p2) es cero, el cero indica que no hay diferencia entre las dos proporciones poblacionales, p 1 y p2. En este caso se deben combinar las dos proporciones muestrales para obtener un estimado de la proporción poblacional. Si el valor hipotético de (p1 – p2) es diferente de cero, entonces utilizaremos las proporciones muestrales para estimar el error típico de la diferencia de proporciones muestrales.
Procedimiento para realizar la prueba de hipótesis 1. Planteamiento de las hipótesis
H 0 : p1 p 2 H 1 : p1 p 2
H 0 : p1 p 2 H 1 : p1 p 2
H 0 : p1 p 2 H 1 : p1 p 2
2. Fijar el nivel de significación: α 3. Estadístico de la prueba
Zc
donde: donde 𝑝̅p
# de éxitos en la muestra1 n1
# de éxitos en la muestra2 n2
p2
1
pˆ 2 p1 p 2
1 1 p 1 p n1 n2
n1 pˆ 1 n2 pˆ 2 a1 a 2 n1 n2 n1 n2
p1
pˆ
~ N 0 , 1
210
Estadística para Comunicadores
4. Regiones críticas
Bilateral
H1: p1 p2
Unilateral Izquierda
H1: p1 < p2
Unilateral Derecha
H1: p1 > p2
5. Decisión: Rechazar Ho o No rechazar Ho. 6. Conclusión.
Aplicación 1. En una encuesta realizada el año pasado se determinó que 20% de 505 hombres y 25% de 426 mujeres encuestados, estaban a favor de prohibir la venta libre de cerveza, vinos y licores en el país. Con un nivel de significación del 5%, ¿considera usted que las mujeres favorecen más a la prohibición? Solución X: Personas a favor de la prohibición de la venta libre de cerveza, vinos y licores en el país.
Estadística para Comunicadores
211
1. Hipótesis. H 0 : p m p h 0 H 1 : p m p h 0
2. Nivel de significación: 0,05 3. Estadístico de la prueba
p
505 (0,20) 426 (0,25) 0,2229 505 426
Z
0,25 0,20 0 1 1 0,2229 1 0,2229 505 426
1,8262
4. Regiones críticas
1.64
5. Decisión: Se rechaza Ho 6. Conclusión: Con un nivel de significación del 5% y a partir de la información muestral, se puede considerar que las mujeres favorecen más a la prohibición de la venta libre de cerveza, vinos y licores en el país.
2. La asociación de ex alumnos de la Facultad de Ciencias de la Comunicación ha seleccionado una muestra aleatoria de 100 graduados en el 2013. En la muestra, 36 fueron de Comunicación y Marketing y 64 de las otras especialidades. Los resultados de cada muestra indican que 15 egresados de cada especialidad ganan por lo menos 3000 dólares mensuales Al nivel de significación del 5% ¿Existe diferencia entre la proporción de graduados de Comunicación y Marketing y los egresados de otras materias que ganan al menos 3000 dólares mensuales? Solución X: Egresados con ingresos de por lo menos 3000 dólares mensuales.
Estadística para Comunicadores
212
1. Hipótesis. H 0 : p CM p Otras 0 H 1 : p CM p Otras 0
2. Nivel de significación: 0,05 3. Estadístico de la prueba p
Z
15 15 0,3 36 64
0,416 0,234 0 1 1 0,3 1 0,3 36 64
1.906
4. Regiones críticas
5. Decisión: No se rechaza Ho 6. Conclusión: Con un nivel de significación del 5% se puede afirmar que no hay diferencia significativa en la proporción de egresados con ingresos de por lo menos de 3 000 dólares para las especialidades Comunicación y Marketing y otras especialidades.
Estadística para Comunicadores
213
Ejercicios 1. Se tiene la siguiente información muestral resultante de una encuesta realizada a alumnos de dos universidades: Correo electrónico preferido Hotmail Gmail Yahoo 85 75 95 Universidad A 107 98 65 Universidad B ¿Es posible afirmar que la proporción de alumnos de la universidad A que no prefieren el correo electrónico Gmail es mayor a la proporción de alumnos de la universidad B? Utilice un nivel de significancia del 1%. Solución X: ……………………………………………………………………….. 1. Hipótesis. H 0 : ........................ H 1 : ........................
2. Nivel de significación: = …….. 3. Cálculo del estadístico
4. Regiones críticas.
Estadística para Comunicadores
5. Decisión.
6. Conclusión:
2. La gerencia de Marketing del Supermercado V&V realizó un estudio con la finalidad de evaluar la opinión de sus clientes sobre los productos ofrecidos. Para este estudio se aplicó una encuesta a una muestra de 252 clientes de los cuales 107 fueron hombres y el resto mujeres. Después de procesar la información en SPSS se obtuvo el siguiente gráfico: Usando un nivel de significancia del 2% ¿se puede afirmar que la proporción de hombres que pagan con tarjeta de crédito es menor a la proporción de mujeres que pagan con tarjeta de crédito? Solución X: ……………………………………………………………………….. 1. Hipótesis. H 0 : ........................ H 1 : ........................
2. Nivel de significación: = ……..
214
Estadística para Comunicadores
3. Cálculo del estadístico
4. Regiones críticas.
5. Decisión.
6. Conclusión:
215
216
Estadística para Comunicadores
3. Un estudiante de la facultad de Comunicaciones, como parte de su trabajo final, desea determinar si la proporción de hombres que respondieron favorablemente a un determinado anuncio con un mensaje controversial supera a la proporción de mujeres. Después de tomar una muestra aleatoria de 60 hombres y otra de 50 mujeres, anotando si están a favor o en contra del mensaje, se obtuvieron los siguientes resultados: Género Hombres (1) Mujeres (2)
A favor 36 17
En contra 24 33
¿A qué conclusión llega el estudiante con un nivel de significación del 5%? Solución X: ……………………………………………………………………….. 1. Hipótesis. H 0 : ........................ H 1 : ........................
2. Nivel de significación: = …….. 3. Cálculo del estadístico
4. Regiones críticas.
217
Estadística para Comunicadores
5. Decisión.
6. Conclusión:
4. El siguiente gráfico muestra la especialización de un total de 242 producciones, de las cuales 100 son norteamericanas, 80 son europeas y el resto de Asia. Distribución porcentual de producciones según especialización por región 80% 70%
Películas y TV
68%
Juegos de Computadora
porcentaje
60%
51.6%
47.5%
50% 40%
32.5%
30%
23%
20%
20%
Otros
32.3% 16.1%
9%
10% 0%
Norteamérica
Europa
Asia
región
¿Es posible afirmar que el porcentaje de empresas de animación que se dedican a la producción de juegos por computadora es mayor en Europa que en Asia? Use un nivel de significancia del 5%. Solución X: ……………………………………………………………………….. 1. Hipótesis. H 0 : ........................ H 1 : ........................
2. Nivel de significación: = ……..
Estadística para Comunicadores
3. Cálculo del estadístico
4. Regiones críticas
5. Decisión
6. Conclusión
218
Estadística para Comunicadores
219
Ejercicios de aplicación 1. Una maqueta de un nuevo automóvil propuesto se mostró a dos grupos de 150 personas cada uno. Un grupo constó de personas entre 18 y 25 años de edad, y el otro grupo entre 35 y 45 años. Del grupo más joven, 120 aprobaron el nuevo modelo, mientras que sólo 85 personas del grupo entre 35 y 45 años lo aprobaron. Con un nivel de significación del 5% ¿Se puede afirmar que la proporción de personas que aprobaron el nuevo modelo es mayor en los jóvenes que en las personas de 35 y 45 años? 2. Un patrocinador de un programa especial de televisión afirma que el programa representa un atractivo mayor para los televidentes hombres que para las mujeres, pero el personal de producción del programa piensa que es igual el porcentaje de televidentes hombres y mujeres que ven el programa especial. Si una muestra aleatoria de 300 hombres y otra de 400 mujeres reveló que 120 hombres y 120 mujeres ven el programa especial de televisión. Al nivel de significación del 5%, ¿se podría decir que el patrocinador tiene razón? 3. Se va a realizar una encuesta sobre habitación en San Isidro y en Miraflores para determinar la proporción de unidades habitacionales ocupadas por familias de ingresos altos. Una muestra aleatoria de 600 unidades habitacionales en San Isidro reveló 150 unidades ocupadas por ingresos altos; mientras que para una muestra de 300 unidades en Miraflores, reveló 120 unidades ocupadas por familias de ingresos altos ¿Existe alguna diferencia entre San Isidro y Miraflores en la proporción de unidades habitacionales ocupadas por familias de ingresos altos? Use α = 0,05. 4. Un artículo periodístico mencionó lo Distribución según Tipo de artículo y Necesidad de compra siguiente “Si bien la publicidad es muy importante para influenciar a los clientes a realizar sus compras, nosotros los consumidores nos dejamos llevar por las ofertas y rebajas de los artículos y los adquirimos solo por no perder la oportunidad, pero ¿es verdaderamente necesaria en ciertas ocasiones nuestras compras? …” Para investigar sobre este tema, se visitó un día de cierra puertas a una tienda comercial, encuestándose a una muestra de clientes en la caja de la sección calzado y a otra muestra Tipo de artículo de clientes en la caja de la sección ropa. El siguiente gráfico muestra los resultados de la pregunta: ¿Fue totalmente necesaria la compra que acaba de realizar? Usando un nivel de significación del 2% ¿se puede afirmar que la proporción de clientes que compraron calzado y respondieron que su compra fue totalmente necesaria es mayor a la proporción de clientes que compraron ropa y respondieron lo mismo?
Estadística para Comunicadores
220
5. La librería de la universidad se enfrenta a una competencia con librerías fuera de ella y está considerando dirigir sus ventas a una generación específica para retener a los estudiantes como clientes. Se realizó un muestreo aleatorio de 150 estudiantes de primer año y 175 de segundo. Encontraron que el 46% de primer año y el 40% de segundo año compraban todos sus libros de texto en la librería universitaria. Para α=0,05 ¿Existe diferencia entre la proporción de estudiantes de primer y segundo año que compran todo en la librería de la universidad? 6. Un columnista de política en un diario local cree que la proporción de votantes de Lima que va a votar en las próximas elecciones municipales es mayor a la proporción de votantes de Provincia. Con el fin de ver si los hechos corroboran esta hipótesis, el columnista hace una encuesta entre los votantes de Lima y de Provincia, con los siguientes resultados: Lugar Lima (1) Provincia (2)
Tamaño de muestra 150 160
Número de personas que votaran en las elecciones municipales 113 104
¿Proporcionan estos datos evidencia suficiente para fundamentar la opinión del especialista al nivel de significación del 5%?
Estadística para Comunicadores
221
Autoevaluación Un profesor del área de marketing publicitario sospecha que la proporción de estudiantes del quinto ciclo a favor de un programa radial supera a la proporción de estudiantes del décimo ciclo a favor del mismo programa radial. Para verificarlo decide realizar una encuesta seleccionando muestras de alumnos del quinto y décimo ciclo. Ciclo académico Quinto ciclo (1) Décimo ciclo (2)
Tamaño de muestra 150 180
Programa radial A favor En contra 112 38 104 76
¿Proporcionan estos datos suficiente evidencia que fundamente la sospecha del profesor? Use =0,05.
Estadística para Comunicadores
Unidad 5 Regresión lineal y correlación
LOGRO: Al término de la Unidad 5, el alumno estima, a partir del modelo de regresión lineal simple, la predicción de nuevos valores participando activamente en el análisis de los problemas.
Temas de la unidad:
Diagrama de dispersión Modelo de regresión lineal e interpretación de los coeficientes Validez del modelo Coeficientes de determinación y correlación.
112
Estadística para Comunicadores
223
Unidad 5. Regresión Lineal y Correlación Análisis de Regresión lineal simple y de Correlación El análisis de regresión lineal y de correlación comprende el estudio de los datos muestrales para saber si dos variables cuantitativas están relacionadas entre sí en una población.
Análisis de regresión lineal
• En el análisis de regresión lineal se obtiene una ecuación matemática que describe cierta relación lineal. La ecuación puede usarse para estimar o predecir los valores de una variable (Y) cuando se conocen o se suponen conocidos los valores de otra variable (X).
Análisis de correlación
• En el análisis de correlación se tiene como objetivo principal medir el grado de asociación o la relación lineal existente entre dos variables. Es útil en un trabajo exploratorio cuando el investigador desea encontrar el grado o la fuerza de esa relación.
Ejemplo
¿Cuál será el gasto que incurrirá una familia cuyo ingreso familiar mensual es 4000 soles? ¿Cuál será el monto de ventas de una empresa si invierte en publicidad 10 000 dólares? ¿Existirá relación lineal entre la edad del cliente y el monto de las compras realizadas?
224
Estadística para Comunicadores
El diagrama de dispersión
El primer paso en el análisis de regresión, es construir una gráfica de los datos muestrales en un plano bidimensional.
X: es la variable independiente y Y: es la variable dependiente, variable que se va a predecir o estimar.
Esta gráfica denominada diagrama de dispersión, nos permite visualizar el tipo de tendencia entre las dos variables. Esta tendencia puede ser lineal o no lineal. También se puede observar si es una relación directamente proporcional o inversamente proporcional.
Ejemplos de diagrama de dispersión Identifique la relación y la pendiente, de existir, para cada caso:
y
y
x
Relación: Pendiente:
y
x
x
Relación: Pendiente:
Relación:
225
Estadística para Comunicadores
La ecuación de la recta estimada Para encontrar la ecuación lineal se trabajará con los cuadros de resultados (salidas) que se obtiene al procesar los datos con el SPSS. La línea recta tiene dos coeficientes de regresión: b o y b1
y x b1 1
b0
x
yˆ i ˆ 0 ˆ 1x i
o
ˆy i b 0 b1x i
Intercepto
Pendiente
Donde: b1 : es la pendiente de la recta. b0 : es el intercepto o punto de corte de la recta con el eje Y. ˆy i : es el i-ésimo valor estimado de la variable Y, reemplazando los valores en la ecuación. Xi : es el valor de X en la i-ésima observación. Interpretación de los coeficientes de regresión
Intercepto b0
Pendiente b1
• Indica el valor de la variable respuesta (Y), cuando la variable independiente (X) es igual a cero. Sin embargo, carece de interpretación práctica si dicho valor está fuera del rango del conjunto de valores de X.
• Indica el cambio promedio (incremento o disminución) en la variable respuesta (Y), cuando la variable independiente (X) aumenta en una unidad.
226
Estadística para Comunicadores
El método de mínimos cuadrados. Para hallar la ecuación de la recta que mejor se ajuste a un conjunto de datos o puntos, el método más utilizado es conocido como el método de mínimos cuadrados, cuya ecuación resultante tiene dos características importantes:
e i y i ˆy i
y
La suma de las desviaciones de los puntos con relación a la recta es 0. n
e
yi
i 1
ei
ˆyi
i
0
La suma de los cuadrados de las desviaciones es mínima, es decir ninguna otra recta daría una menor suma de dichos cuadrados. n
x
Min
e i 1
2
i
La ecuación de la recta estimada mediante el paquete estadístico SPSS, se basa en el método de mínimos cuadrados.
Ejemplo: Considere las siguientes variables X: variable independiente. Tiempo de experiencia (en años) Y: variable dependiente. Ingreso (en soles).
Ingreso
Ecuación de la recta estimada:
y
b1 = 450
yˆi 2500 450 xi bo = 2500
1
x años La relación es: directa La pendiente es: positiva A mayor años de experiencia, mayor será el ingreso
227
Estadística para Comunicadores
Interpretación: bo = 2500, cuando el empleado no tiene experiencia, su ingreso será de 2500 soles. b1 = 450, por cada año de experiencia adicional, el ingreso del empleado se incrementa en 450 soles.
Ejercicio De acuerdo al siguiente gráfico presente un ejemplo indicando la variable X y la variable Y. Escriba cómo sería la ecuación de la recta.
Ejercicio X : variable independiente. Tiempo de uso del vehículo (en años) Y : variable dependiente. Precio de venta del vehículo (en dólares). Suponga una ecuación de la recta estimada teniendo en cuenta la interpretación de los coeficientes de regresión. Grafique la línea adecuada y
x
La relación es: La pendiente es:
228
Estadística para Comunicadores
Interprete los coeficientes de regresión sugeridos.
Ejemplo 1. Se desea estimar el ingreso por ventas (en millones de dólares) en función del gasto en publicidad (en millones de dólares). A continuación se muestran los datos de los últimos 8 meses. 2 7
Gasto en publicidad Ingresos por ventas
1 5
3 7
4 9
3 8
2 6
4 11
5 13
La salida obtenida por el SPSS después de procesar los datos se presenta a continuación: Resumen del modelo Modelo 1
R .944
R cuadrado .891
R cuadrado corregida .872
Error típ. de la estimación .950
DurbinWat son 1.032
Coeficientes
Modelo 1
bo: intercepto (Constante) Gasto en publicidad
Coef icientes no estandarizados B Error típ. 2.500 .889 1.917 .274
Coef icientes estandarizados Beta
b1: pendiente
a. Defina las variables X e Y. Variable independiente X: Variable dependiente Y:
.944
t 2.813 6.988
Sig. .031 .000
Estadística para Comunicadores
b. Presente el diagrama de dispersión. ¿Qué relación observa? Comente.
c. Estime la ecuación de la recta. Interprete los coeficientes de regresión estimados.
Interpretación
229
230
Estadística para Comunicadores
d. Estime las ventas cuando se invierte 4 500 000 dólares en publicidad.
2. Se desea determinar un modelo que permita estimar la audiencia de cierto programa televisivo que se transmite al mediodía, en miles de televidentes, en términos del número de regalos que se entregan durante el programa. Para ello se seleccionaron al azar 10 días y se midió la cantidad de televidentes. Los datos se muestran a continuación: Número de regalos Audiencia diaria
11 20
7 12
13 21
17 26
17 22
19 30
3 10
11 15
16 26
8 13
A continuación se presenta los resultados obtenidos mediante el SPSS. Resumen del modelo Modelo 1
R ,951a
R cuadrado ,905
R cuadrado corregida ,893
Error típ. de la estimación 2,219
Coeficientesa
Modelo 1 (Constante) Número de regalos
Coeficientes no estandarizados B Error típ. 4,275 1,884 1,248 ,143
a. Defina las variables X e Y. Variable independiente X: Variable dependiente Y:
Coeficientes tipificados Beta ,951
t 2,269 8,707
Sig. ,053 ,000
Estadística para Comunicadores
b. Presente el diagrama de dispersión. ¿Qué relación observa? Comente.
c. Estime la ecuación de la recta. Interprete los coeficientes de regresión estimados.
Interpretación
d. Estime la audiencia diaria del programa cuando se hicieron 15 regalos.
231
232
Estadística para Comunicadores
Validando el modelo No siempre la ecuación estimada es válida. Puede ocurrir que no exista pendiente, es decir que la pendiente sea igual a 0. Significaría que no existe relación lineal entre las variables X e Y. Es necesario entonces verificar si el modelo es válido. Ejemplo 1 (continuación) Se desea estimar el ingreso por ventas (en millones de dólares) en función del gasto en publicidad (en millones de dólares). A continuación se muestran los datos de los últimos 8 meses. Gasto en publicidad Ingresos por ventas
2 7
1 5
3 7
4 9
3 8
2 6
4 11
5 13
Valide el modelo. Use un nivel de significación del 5%. Solución Para dar validez al modelo usaremos la tabla de coeficientes de la salida del SPSS. Coeficientes
Modelo 1
H0: 1 0 H1: 1 0
(Constante) Gasto en publicidad
Coeficientes no estandarizados B Error típ. 2.500 .889 1.917 .274
Coeficientes estandarizados Beta .944
t 2.813 6.988
Sig. .031 .000
Sig o p-valor
No es válido el modelo Si es válido el modelo
Comparando Sig o p-valor con : Sig.= p-valor = 0,00 < = 0,05 Se rechaza Ho Conclusión: Con un nivel de significación del 5% se puede afirmar que el modelo lineal estimado es válido.
Supuestos de la Regresión Lineal Los errores o residuos tienen distribución normal. Los errores o residuos tienen media igual a cero y varianza igual a σ2. Los errores o residuos aleatorios asociados a cualquier par de valores asociados a la variable dependiente Y, no se encuentran autocorrelacionados.
233
Estadística para Comunicadores
Coeficiente de determinación y de no determinación El coeficiente de determinación (r2) y de no determinación (1-r2) se calcula de la siguiente manera:
SSR SST
r2
(1 r 2 ) 1
r2 siempre es positivo Varía entre 0 y 1
y
0 r2 1
SSR SST
El coeficiente de determinación (r2 x 100%) expresa el porcentaje de la variabilidad total de Y que es explicada por X en el modelo lineal estimado. Cuando r 2 es más cercano a 1, mejor será el ajuste de la recta a los datos. Ejercicio Indique que valor de r2 le corresponde a cada gráfico, considerando los siguientes valores: r2 = 0,98 r2 = 0,89 r2 = 0,62
Ejemplo 1 (continuación): Interprete el coeficiente de determinación. Resumen del modelo Modelo 1
R .944
R cuadrado .891
R cuadrado corregida .872
Error típ. de la estimación .950
DurbinWat son 1.032
Solución El coeficiente de determinación es r2 = 0,891 y en porcentaje es 89,1% Interpretación: Del total de la variación del ingreso por las ventas, el 89,1% es explicada por los gastos de publicidad en el modelo lineal estimado. El 10,9% restante de la variabilidad del ingreso, se debe a otros factores no contemplados en el modelo.
234
Estadística para Comunicadores
Coeficiente de correlación El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e Y, donde el coeficiente de correlación poblacional se denota por (ro).
1 1 , varía dentro de este intervalo de -1 a 1. 0 entonces indicará que no existe correlación o asociación entre las variables.
1 (Cuando se acerca a 1 ó a -1 indicará que existe una asociación fuerte). 1 ó 1 , la correlación o asociación entre estas variables es perfecta.
El estimador de (ro) es “r” r : siempre tiene el signo de la pendiente b1
Si b1 y r son positivos b1 y r son negativos
relación directa relación inversa
NOTA: En los resultados del SPSS, el valor de r siempre lo muestra positivo. En el caso de que la pendiente b1 sea negativa, se colocará también al coeficiente de correlación r el signo negativo.
Ejemplo 1 (continuación): Interprete el coeficiente de correlación. Aquí siempre aparece positivo. Se le debe colocar el signo de b1
r Resumen del modelo Modelo 1
R .944
R cuadrado .891
El coeficiente de correlación es r = 0,944
R cuadrado corregida .872
Error típ. de la estimación .950
DurbinWat son 1.032
235
Estadística para Comunicadores
Interpretación: Entre el gasto en publicidad y el ingreso por ventas existe una asociación lineal positiva y fuerte, por ser su valor cercano a 1. Ejemplo 2 El gerente de ventas de una compañía se está preparando para una reunión de ventas y le gustaría mostrar al grupo de vendedores la forma como se relaciona el número de llamadas a clientes mensuales con el valor de pedidos que se reciben. A continuación se presenta la información muestral para el último año. Pedidos (miles de $) Número de llamadas
9,0 8,0 12,3 13,7 15,7 5,4 7,3 7,0 6,0 6,7 6,9 7,5 5
4
6
7
8
1
3
4
1
3
2
La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:
a. Defina las variables X e Y. X: Y: b. Realice el diagrama de dispersión. ¿Qué relación observa?
4
Estadística para Comunicadores
c. Estime el modelo lineal e interprete los coeficientes de regresión.
d. Valide el modelo de regresión lineal. Use un nivel de significación del 5%.
e. Interprete el coeficiente de correlación y determinación.
236
237
Estadística para Comunicadores
Ejemplo 3. El gerente de ventas de una agencia publicitaria desea analizar la relación que existe entre los años de experiencia y las ventas anuales (en miles de dólares) y estimar las ventas en base a los años de experiencia. Los resultados de una muestra de 9 publicistas, obtenidos por el SPSS se presentan a continuación: Años de experiencia Ventas anuales (miles de dólares)
2
3
4
6
8
10
10
11
13
97
92
102
103
111
119
123
117
136
La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:
a. Defina las variables X e Y. X: Y:
b. Realice el diagrama de dispersión. ¿Qué relación observa? Comente.
Estadística para Comunicadores
c. Encuentre el modelo estimado e interprete los coeficientes de regresión.
d. Valide el modelo de regresión. Utilice un nivel de significación del 5%.
e. Interprete el coeficiente de correlación y determinación.
238
Estadística para Comunicadores
239
240
Estadística para Comunicadores
Ejercicios de aplicación 1. Para estimar el costo de la producción (en miles de dólares) por cada 15 minutos de animación en 2D en función del número de dibujos (en unidades) realizados por las empresas dedicadas a la animación, se tomó una muestra de 15 producciones realizadas por empresas de animación del continente asiático. Los resultados obtenidos fueron: Costo Número de dibujos
36
21
34
48
54
56
68
26
19
26
33
42
38
33
32
250 150 280 390 460 550 190 200 106 180 250 300 380 294 300 Resumen del modelo Modelo 1
R
R cuadrado
R cuadrado corregida
Error típ. de la estimación
.604a
.365
.317
11.350
Coeficientes Modelo
1
Coeficientes no estandarizados B 17.992 .069
(Constante) Número de dibujos
a. b. c. d.
Error típ. 7.788 .025
Coeficientes tipificados Beta .604
t
Sig.
2.310 2.736
.038 .017
Presente el modelo estimado e interprete el valor de la pendiente. Valide el modelo estimado. Use un nivel de significación de 5% Indique el valor del coeficiente de correlación e interprete. Estime el costo de animación 2D si la producción está compuesta por 280 dibujos.
2. Un economista del Departamento de Recursos Humanos de una empresa, está preparando un estudio sobre el comportamiento del consumidor. Él recolectó los datos, en miles de dólares, para determinar si existe una relación entre el ingreso del consumidor y los niveles de consumo. Consumidor Ingreso Consumo
1 24,3 16,2
2 12,5 8,5
3 31,2 15
4 28,0 17
5 35,1 24,2
6 10,5 11,2
7 23,2 15
8 10,0 7,1
9 8,5 3,5
10 15,9 11,5
11 14,7 10,7
La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:
12 15 9,2
241
Estadística para Comunicadores
a. Presente el diagrama de dispersión. b. Valide e interprete el modelo de regresión. Utilice un nivel de significación del 5%. c. ¿Qué proporción de cada dólar adicional que se gana se destina al consumo? 3. El número de vendedores y los ingresos por ventas (en miles de soles) en una tienda para los primeros seis meses del año fueron los siguientes: Número de vendedores Ingreso por ventas
14
22
19
35
30
44
17,5
18,5
18,0
26,0
25,0
29,5
La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:
a. Trace el diagrama de dispersión ¿qué tipo de relación se deduce a partir del diagrama? b. Valide e interprete el modelo de regresión estimado. Utilice un nivel de significación del 5%. c. Estime el ingreso por ventas si el número de vendedores es igual a 25. d. ¿Qué porcentaje de la variación de los ingresos por ventas sería explicado por la influencia lineal del número de vendedores? 4. El gerente de ventas de una compañía se está preparando para una reunión y le gustaría mostrar al grupo de vendedores la forma como se relaciona el número de visitas que ellos realizan a los clientes con el monto total de compra realizado por el cliente. De sus registros se recolectó la siguiente información muestral para el último año. Los datos fueron los siguientes: Número de visitas Monto de compra (miles de $)
5
4
8,7
7,1
6
7
8
13,7 15,1 16,7
1
3
4
1
3
2,2
4,6
7,5
2,3
6,1
Estadística para Comunicadores
242
La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:
a. Realice un diagrama de dispersión entre estas dos variables. ¿Podría ajustarse un modelo de regresión lineal simple? b. Valide el modelo de regresión lineal simple. Use un nivel de significancia del 5% c. Presente la ecuación estimada. Interprete los coeficientes estimados d. Interprete el valor del coeficiente de determinación. e. Interprete el valor del coeficiente de correlación.
243
Estadística para Comunicadores
Autoevaluación El número de vendedores y los ingresos por ventas (en miles de soles) en una tienda para los primeros seis meses del año fueron los siguientes: Número de vendedores Ingreso por ventas a. b. c. d. e.
14 17,5
22 18,5
19 18,0
35 26,0
30 25,0
44 29,5
Trace el diagrama de dispersión, ¿qué tipo de relación observa a partir del diagrama? Valide el modelo de regresión estimado. Utilice un nivel de significación del 5%. Presente la ecuación estimada. Interprete los coeficientes estimados Estime el ingreso por ventas si el número de vendedores es igual a 25. ¿Qué porcentaje de la variación de los ingresos por ventas sería explicado por la influencia lineal del número de vendedores. Estadísticos descriptivos
ingreso_por_v entas nro_v endedores
Media 22.4167 27.3333
Desv iación típ. 5.07362 11.12954
N 6 6
Resumen del modelob Modelo 1
R .976a
R cuadrado .953
R cuadrado corregida .942
Error típ. de la estimación 1.22561
a. Variables predictoras: (Constante), nro_v endedores Coeficientesa b. Variable dependiente: ingreso_por_v ent as Coef icientes Coef icientes no estandarizad estandarizados os Modelo B Error típ. Beta 1 (Constante) 10.251 1.436 nro_v endedores .445 .049 .976 a. Variable dependient e: ingreso_por_v entas
DurbinWat son 2.085
t 7.138 9.038
Sig. .002 .001
Estadística para Comunicadores
244
245
Estadística para Comunicadores
ÍNDICE ALFABÉTICO
A
V
Axiomas de la probabilidad .........................................128
Valor esperado de una variable aleatoria discreta .......................... 143 Variable aleatoria continua ............................................................... 139 definición.............................................................. 139 discreta................................................................. 139 Función de probabilidad ........................................ 140 Varianza de una variable aleatoria discreta .......................... 144
C Censo .......................................................................... 82
D Desviación estándar de una variable aleatoria .......................................145
E Escalas de medición Nominal ................................................................. 21 Estimador.................................................................... 27
G Gráfico de barras apiladas al 100% ...................................... 72
M Margen de error .........................................................166 Media ......................................................................... 40 Medidas de asimetría .................................................. 48 Muestreo .................................................................... 82 aleatorio simple...................................................... 85 estratificado ........................................................... 93 probabilístico ......................................................... 85 sistemático............................................................105
N Nivel de confianza ......................................................166 Interpretación .......................................................167
P Probabilidad Definición clásica de ..............................................128 Teoremas básicos de .............................................128
R Rango de una variable aleatoria .......................................139 Registro administrativo ................................................ 15
T Tabulaciones cruzadas ................................................. 65
Universidad Peruana de Ciencias Aplicadas
FORMULARIO MA470 ESTADÍSTICA PARA COMUNICADORES
Fórmulas y Tablas Estadísticas
1
Universidad Peruana de Ciencias Aplicadas
FÓRMULAS ESTADÍSTICAS MEDIDAS DESCRIPTIVAS
Coeficiente de variación
s CV x100% x
RIC
P75 – P25
DISTRIBUCIÓN NORMAL ESTÁNDAR
X ~ N ( , 2 )
z
X
TAMAÑO DE MUESTRA
S Z n 1 / 2 e
Fórmulas y Tablas Estadísticas
2
z12 / 2 pˆ (1 pˆ ) n e2
nc
n 1
n N
, donde nc = n corregido
2
Universidad Peruana de Ciencias Aplicadas INFERENCIA ESTADÍSTICA
Parámetro
Intervalo de Confianza
µ
p
IC(µ) = x̅ ± t (α⁄2 ; n−1)
IC(p) pˆ z (1 / 2)
Prueba de Hipótesis - Estadístico de la Prueba _
s
t
√n
x S/ n
z
pˆ (1 pˆ ) n
qˆ 1 pˆ
~ t ( n 1)
pˆ p p(1 p) n
Prueba de Hipótesis - Estadístico de la Prueba
t=
µd
z
d̅ − µd ~ t (n−1) Sd ⁄ √n
pˆ 1 pˆ 2 1 1 p (1 p) n1 n 2
~ N (0,1)
p1 p2
𝑑𝑜𝑛𝑑𝑒: donde 𝑝̅p
Fórmulas y Tablas Estadísticas
n1 pˆ 1 n2 pˆ 2 a1 a 2 n1 n2 n1 n2
3
Universidad Peruana de Ciencias Aplicadas Tabla Nº 1 TABLA DE NÚMEROS ALEATORIOS C1 4 9 0 9 1 2 6 1 4 0 7 4 6 9 1 0 3 9 5 8 0 9 6 7 3 9 4 8 4 6 9 1 3 9 1 2 6 3 0 4 7 2 2 5 9 8 1 5 8 3
C2 8 2 2 6 6 9 1 3 5 0 2 9 1 3 8 2 6 4 9 1 5 7 9 4 8 9 8 6 7 5 2 3 3 9 7 7 0 3 1 7 8 2 6 1 0 6 9 6 6 1
C3 2 9 1 0 4 0 2 1 8 3 4 3 2 4 7 1 3 6 9 8 3 1 5 9 1 9 1 7 1 5 0 7 2 9 5 1 9 6 9 1 9 3 6 9 5 1 1 0 9 6
C4 4 8 3 8 1 5 9 8 1 6 5 4 8 0 1 4 4 7 8 8 8 4 9 1 2 7 5 3 4 8 9 9 5 8 4 7 2 3 7 5 9 3 4 0 8 9 0 6 9 1
C5 6 1 3 3 6 5 5 9 1 9 4 4 1 8 3 7 1 6 4 2 0 2 4 4 2 8 8 6 0 8 8 4 6 2 0 8 6 4 9 3 6 1 1 3 4 2 9 1 8 0
C6 6 4 9 5 5 0 0 9 4 6 1 2 3 1 4 5 9 7 4 3 4 7 9 8 4 0 5 1 3 4 2 8 7 8 9 8 1 9 7 7 8 8 4 9 9 5 7 3 0 5
C7 3 4 1 6 2 8 4 0 5 5 2 4 3 3 3 7 8 9 5 9 3 5 1 8 0 0 5 7 6 3 8 3 6 8 5 3 5 6 9 0 5 1 8 1 2 0 5 3 8 7
C8 5 1 6 6 7 4 0 1 6 0 4 5 2 3 9 3 1 1 9 1 9 5 8 6 1 9 1 1 2 4 3 7 1 1 7 8 1 4 4 9 6 9 1 6 2 0 1 5 1 5
C9 4 9 2 6 7 8 9 2 7 6 4 9 0 7 3 1 0 2 1 4 4 2 2 6 4 3 4 1 4 8 4 0 6 9 8 6 2 4 4 2 8 8 0 1 3 7 2 2 8 7
C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 5 6 0 5 2 6 9 8 0 0 9 8 5 1 1 9 7 9 8 5 9 0 9 7 1 2 6 6 0 7 5 6 4 4 0 8 6 3 4 8 1 8 5 4 2 9 9 9 9 7 4 1 5 4 9 7 4 6 2 1 7 0 1 5 8 7 8 2 0 2 6 8 7 0 1 9 7 6 3 7 1 9 6 1 7 9 9 8 9 9 9 2 1 3 2 3 7 7 9 4 7 9 8 1 2 4 4 8 3 6 6 9 2 6 6 6 5 2 0 0 4 0 8 7 4 8 4 2 1 2 5 4 2 6 0 7 2 7 9 1 4 6 5 3 2 4 8 6 7 9 0 6 2 8 1 7 8 3 7 3 3 0 8 3 5 1 9 3 3 8 7 4 8 0 2 5 9 0 1 1 0 9 3 6 8 6 0 2 7 2 3 9 3 4 6 9 8 1 5 4 7 3 0 6 8 1 6 8 1 2 4 9 1 4 0 6 0 3 2 8 6 0 8 8 3 8 7 1 2 2 3 8 6 6 3 5 5 9 9 0 6 8 0 2 5 3 9 1 2 0 3 0 8 8 5 9 4 8 5 7 7 9 6 7 5 7 7 4 0 4 8 9 4 7 0 2 7 0 5 0 2 7 8 7 3 6 9 6 4 4 4 7 4 5 7 5 0 3 5 5 7 4 4 7 6 7 2 8 4 4 4 0 3 6 3 4 1 2 8 9 0 6 7 6 0 0 8 6 8 4 3 2 8 9 4 8 7 9 4 9 4 8 6 6 6 8 4 1 1 3 1 3 6 1 7 6 5 8 1 6 2 2 7 1 6 2 7 5 1 8 6 1 4 4 7 5 0 8 6 6 2 5 3 2 3 9 9 2 7 4 5 9 5 6 6 6 3 1 8 1 2 0 8 6 4 4 0 9 8 5 7 3 3 4 2 3 2 8 1 6 6 7 7 0 7 9 8 6 8 5 2 1 0 0 4 0 4 6 8 8 1 9 2 7 5 1 7 0 1 5 5 4 2 8 5 2 8 1 7 6 4 6 6 0 1 3 4 0 9 1 2 8 6 7 8 8 2 8 0 7 8 4 8 0 9 8 5 9 5 7 8 4 9 9 4 9 0 0 7 4 5 4 8 6 2 3 7 1 9 4 8 4 8 9 6 6 9 1 0 1 9 2 8 0 2 6 6 3 2 6 6 8 4 0 7 8 2 5 1 0 6 3 0 4 1 4 0 3 0 8
4
Universidad Peruana de Ciencias Aplicadas Tabla Nº 2.1 TABLA DE LA DISTRIBUCION NORMAL ESTANDAR
Área bajo la curva normal: P Z z Z -3.9 -3.8 -3.7 -3.6 -3.5 -3.4 -3.3 -3.2 -3.1 -3.0
-0.09 0.000033 0.000050 0.000075 0.000112 0.000165 0.000242 0.000349 0.000501 0.000711 0.001001
-0.08 0.000034 0.000052 0.000078 0.000117 0.000172 0.000251 0.000362 0.000519 0.000736 0.001035
-0.07 0.000036 0.000054 0.000082 0.000121 0.000178 0.000260 0.000376 0.000538 0.000762 0.001070
-0.06 0.000037 0.000057 0.000085 0.000126 0.000185 0.000270 0.000390 0.000557 0.000789 0.001107
-0.05 0.000039 0.000059 0.000088 0.000131 0.000193 0.000280 0.000404 0.000577 0.000816 0.001144
-0.04 0.000041 0.000062 0.000092 0.000136 0.000200 0.000291 0.000419 0.000598 0.000845 0.001183
-0.03 0.000042 0.000064 0.000096 0.000142 0.000208 0.000302 0.000434 0.000619 0.000874 0.001223
-0.02 0.000044 0.000067 0.000100 0.000147 0.000216 0.000313 0.000450 0.000641 0.000904 0.001264
-0.01 0.000046 0.000069 0.000104 0.000153 0.000224 0.000325 0.000466 0.000664 0.000935 0.001306
-0.00 0.000048 0.000072 0.000108 0.000159 0.000233 0.000337 0.000483 0.000687 0.000968 0.001350
-2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 -2.2 -2.1 -2.0
0.00139 0.00193 0.00264 0.00357 0.00480 0.00639 0.00842 0.01101 0.01426 0.01831
0.00144 0.00199 0.00272 0.00368 0.00494 0.00657 0.00866 0.01130 0.01463 0.01876
0.00149 0.00205 0.00280 0.00379 0.00508 0.00676 0.00889 0.01160 0.01500 0.01923
0.00154 0.00212 0.00289 0.00391 0.00523 0.00695 0.00914 0.01191 0.01539 0.01970
0.00159 0.00219 0.00298 0.00402 0.00539 0.00714 0.00939 0.01222 0.01578 0.02018
0.00164 0.00226 0.00307 0.00415 0.00554 0.00734 0.00964 0.01255 0.01618 0.02068
0.00169 0.00233 0.00317 0.00427 0.00570 0.00755 0.00990 0.01287 0.01659 0.02118
0.00175 0.00240 0.00326 0.00440 0.00587 0.00776 0.01017 0.01321 0.01700 0.02169
0.00181 0.00248 0.00336 0.00453 0.00604 0.00798 0.01044 0.01355 0.01743 0.02222
0.00187 0.00256 0.00347 0.00466 0.00621 0.00820 0.01072 0.01390 0.01786 0.02275
-1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 -1.2 -1.1 -1.0
0.02330 0.02938 0.03673 0.04551 0.05592 0.06811 0.08226 0.09853 0.11702 0.13786
0.02385 0.03005 0.03754 0.04648 0.05705 0.06944 0.08379 0.10027 0.11900 0.14007
0.02442 0.03074 0.03836 0.04746 0.05821 0.07078 0.08534 0.10204 0.12100 0.14231
0.02500 0.03144 0.03920 0.04846 0.05938 0.07215 0.08691 0.10383 0.12302 0.14457
0.02559 0.03216 0.04006 0.04947 0.06057 0.07353 0.08851 0.10565 0.12507 0.14686
0.02619 0.03288 0.04093 0.05050 0.06178 0.07493 0.09012 0.10749 0.12714 0.14917
0.02680 0.03362 0.04182 0.05155 0.06301 0.07636 0.09176 0.10935 0.12924 0.15151
0.02743 0.03438 0.04272 0.05262 0.06426 0.07780 0.09342 0.11123 0.13136 0.15386
0.02807 0.03515 0.04363 0.05370 0.06552 0.07927 0.09510 0.11314 0.13350 0.15625
0.02872 0.03593 0.04457 0.05480 0.06681 0.08076 0.09680 0.11507 0.13567 0.15866
-0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 -0.0
0.16109 0.18673 0.21476 0.24510 0.27760 0.31207 0.34827 0.38591 0.42465 0.46414
0.16354 0.18943 0.21770 0.24825 0.28096 0.31561 0.35197 0.38974 0.42858 0.46812
0.16602 0.19215 0.22065 0.25143 0.28434 0.31918 0.35569 0.39358 0.43251 0.47210
0.16853 0.19489 0.22363 0.25463 0.28774 0.32276 0.35942 0.39743 0.43644 0.47608
0.17106 0.19766 0.22663 0.25785 0.29116 0.32636 0.36317 0.40129 0.44038 0.48006
0.17361 0.20045 0.22965 0.26109 0.29460 0.32997 0.36693 0.40517 0.44433 0.48405
0.17619 0.20327 0.23270 0.26435 0.29806 0.33360 0.37070 0.40905 0.44828 0.48803
0.17879 0.20611 0.23576 0.26763 0.30153 0.33724 0.37448 0.41294 0.45224 0.49202
0.18141 0.20897 0.23885 0.27093 0.30503 0.34090 0.37828 0.41683 0.45620 0.49601
0.18406 0.21186 0.24196 0.27425 0.30854 0.34458 0.38209 0.42074 0.46017 0.50000
Tablas estadísticas
5
Universidad Peruana de Ciencias Aplicadas Tabla Nº 2.2 TABLA DE LA DISTRIBUCION NORMAL ESTANDAR
Área bajo la curva normal: P Z z Z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0.00 0.50000 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75804 0.78814 0.81594
0.01 0.50399 0.54380 0.58317 0.62172 0.65910 0.69497 0.72907 0.76115 0.79103 0.81859
0.02 0.50798 0.54776 0.58706 0.62552 0.66276 0.69847 0.73237 0.76424 0.79389 0.82121
0.03 0.51197 0.55172 0.59095 0.62930 0.66640 0.70194 0.73565 0.76730 0.79673 0.82381
0.04 0.51595 0.55567 0.59483 0.63307 0.67003 0.70540 0.73891 0.77035 0.79955 0.82639
0.05 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.80234 0.82894
0.06 0.52392 0.56356 0.60257 0.64058 0.67724 0.71226 0.74537 0.77637 0.80511 0.83147
0.07 0.52790 0.56749 0.60642 0.64431 0.68082 0.71566 0.74857 0.77935 0.80785 0.83398
0.08 0.53188 0.57142 0.61026 0.64803 0.68439 0.71904 0.75175 0.78230 0.81057 0.83646
0.09 0.53586 0.57535 0.61409 0.65173 0.68793 0.72240 0.75490 0.78524 0.81327 0.83891
1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9
0.84134 0.86433 0.88493 0.90320 0.91924 0.93319 0.94520 0.95543 0.96407 0.97128
0.84375 0.86650 0.88686 0.90490 0.92073 0.93448 0.94630 0.95637 0.96485 0.97193
0.84614 0.86864 0.88877 0.90658 0.92220 0.93574 0.94738 0.95728 0.96562 0.97257
0.84849 0.87076 0.89065 0.90824 0.92364 0.93699 0.94845 0.95818 0.96638 0.97320
0.85083 0.87286 0.89251 0.90988 0.92507 0.93822 0.94950 0.95907 0.96712 0.97381
0.85314 0.87493 0.89435 0.91149 0.92647 0.93943 0.95053 0.95994 0.96784 0.97441
0.85543 0.87698 0.89617 0.91309 0.92785 0.94062 0.95154 0.96080 0.96856 0.97500
0.85769 0.87900 0.89796 0.91466 0.92922 0.94179 0.95254 0.96164 0.96926 0.97558
0.85993 0.88100 0.89973 0.91621 0.93056 0.94295 0.95352 0.96246 0.96995 0.97615
0.86214 0.88298 0.90147 0.91774 0.93189 0.94408 0.95449 0.96327 0.97062 0.97670
2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9
0.97725 0.98214 0.98610 0.98928 0.99180 0.99379 0.99534 0.99653 0.99744 0.99813
0.97778 0.98257 0.98645 0.98956 0.99202 0.99396 0.99547 0.99664 0.99752 0.99819
0.97831 0.98300 0.98679 0.98983 0.99224 0.99413 0.99560 0.99674 0.99760 0.99825
0.97882 0.98341 0.98713 0.99010 0.99245 0.99430 0.99573 0.99683 0.99767 0.99831
0.97932 0.98382 0.98745 0.99036 0.99266 0.99446 0.99585 0.99693 0.99774 0.99836
0.97982 0.98422 0.98778 0.99061 0.99286 0.99461 0.99598 0.99702 0.99781 0.99841
0.98030 0.98461 0.98809 0.99086 0.99305 0.99477 0.99609 0.99711 0.99788 0.99846
0.98077 0.98500 0.98840 0.99111 0.99324 0.99492 0.99621 0.99720 0.99795 0.99851
0.98124 0.98537 0.98870 0.99134 0.99343 0.99506 0.99632 0.99728 0.99801 0.99856
0.98169 0.98574 0.98899 0.99158 0.99361 0.99520 0.99643 0.99736 0.99807 0.99861
3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9
0.998650 0.999032 0.999313 0.999517 0.999663 0.999767 0.999841 0.999892 0.999928 0.999952
0.998694 0.999065 0.999336 0.999534 0.999675 0.999776 0.999847 0.999896 0.999931 0.999954
0.998736 0.999096 0.999359 0.999550 0.999687 0.999784 0.999853 0.999900 0.999933 0.999956
0.998777 0.999126 0.999381 0.999566 0.999698 0.999792 0.999858 0.999904 0.999936 0.999958
0.998817 0.999155 0.999402 0.999581 0.999709 0.999800 0.999864 0.999908 0.999938 0.999959
0.998856 0.999184 0.999423 0.999596 0.999720 0.999807 0.999869 0.999912 0.999941 0.999961
0.998893 0.999211 0.999443 0.999610 0.999730 0.999815 0.999874 0.999915 0.999943 0.999963
0.998930 0.999238 0.999462 0.999624 0.999740 0.999822 0.999879 0.999918 0.999946 0.999964
0.998965 0.999264 0.999481 0.999638 0.999749 0.999828 0.999883 0.999922 0.999948 0.999966
0.998999 0.999289 0.999499 0.999651 0.999758 0.999835 0.999888 0.999925 0.999950 0.999967
Tablas estadísticas
6
Universidad Peruana de Ciencias Aplicadas Tabla Nº 3.1 TABLA DE LA DISTRIBUCION T-STUDENT
Área bajo la curva: P T c
1 2 3 4 5 6 7 8 9 10
0.4 0.32492 0.28868 0.27667 0.27072 0.26718 0.26483 0.26317 0.26192 0.26096 0.26018
0.3 0.72654 0.61721 0.58439 0.56865 0.55943 0.55338 0.54911 0.54593 0.54348 0.54153
0.2 1.37638 1.06066 0.97847 0.94096 0.91954 0.9057 0.89603 0.88889 0.8834 0.87906
0.15 1.96261 1.38621 1.24978 1.18957 1.15577 1.13416 1.11916 1.10815 1.09972 1.09306
0.1 3.07768 1.88562 1.63774 1.53321 1.47588 1.43976 1.41492 1.39682 1.38303 1.37218
0.05 6.31375 2.91999 2.35336 2.13185 2.01505 1.94318 1.89458 1.85955 1.83311 1.81246
0.04 7.91582 3.31976 2.60543 2.33287 2.19096 2.10431 2.04601 2.00415 1.97265 1.9481
0.03 10.57889 3.89643 2.95051 2.60076 2.42158 2.31326 2.24088 2.18915 2.15038 2.12023
0.025 12.7062 4.30265 3.18245 2.77645 2.57058 2.44691 2.36462 2.306 2.26216 2.22814
0.02 15.89454 4.84873 3.48191 2.99853 2.75651 2.61224 2.51675 2.44898 2.39844 2.35931
0.015 21.20495 5.64278 3.89605 3.29763 3.00287 2.82893 2.71457 2.63381 2.5738 2.52748
0.01 31.82052 6.96456 4.5407 3.74695 3.36493 3.14267 2.99795 2.89646 2.82144 2.76377
0.005 63.65674 9.92484 5.84091 4.60409 4.03214 3.70743 3.49948 3.35539 3.24984 3.16927
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
0.25956 0.25903 0.25859 0.25821 0.25789 0.2576 0.25735 0.25712 0.25692 0.25674
0.53994 0.53862 0.5375 0.53655 0.53573 0.53501 0.53438 0.53382 0.53331 0.53286
0.87553 0.87261 0.87015 0.86805 0.86624 0.86467 0.86328 0.86205 0.86095 0.85996
1.08767 1.08321 1.07947 1.07628 1.07353 1.07114 1.06903 1.06717 1.06551 1.06402
1.36343 1.35622 1.35017 1.34503 1.34061 1.33676 1.33338 1.33039 1.32773 1.32534
1.79588 1.78229 1.77093 1.76131 1.75305 1.74588 1.73961 1.73406 1.72913 1.72472
1.92843 1.91231 1.89887 1.8875 1.87774 1.86928 1.86187 1.85534 1.84953 1.84433
2.09614 2.07644 2.06004 2.04617 2.03429 2.024 2.015 2.00707 2.00002 1.99371
2.20099 2.17881 2.16037 2.14479 2.13145 2.11991 2.10982 2.10092 2.09302 2.08596
2.32814 2.30272 2.2816 2.26378 2.24854 2.23536 2.22385 2.2137 2.2047 2.19666
2.49066 2.4607 2.43585 2.4149 2.39701 2.38155 2.36805 2.35618 2.34565 2.33624
2.71808 2.681 2.65031 2.62449 2.60248 2.58349 2.56693 2.55238 2.53948 2.52798
3.10581 3.05454 3.01228 2.97684 2.94671 2.92078 2.89823 2.87844 2.86093 2.84534
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
0.25658 0.25643 0.2563 0.25617 0.25606 0.25595 0.25586 0.25577 0.25568 0.25561
0.53246 0.53208 0.53175 0.53144 0.53115 0.53089 0.53065 0.53042 0.53021 0.53002
0.85907 0.85827 0.85753 0.85686 0.85624 0.85567 0.85514 0.85465 0.85419 0.85377
1.06267 1.06145 1.06034 1.05932 1.05838 1.05752 1.05673 1.05599 1.0553 1.05466
1.32319 1.32124 1.31946 1.31784 1.31635 1.31497 1.3137 1.31253 1.31143 1.31042
1.72074 1.71714 1.71387 1.71088 1.70814 1.70562 1.70329 1.70113 1.69913 1.69726
1.83965 1.83542 1.83157 1.82805 1.82483 1.82186 1.81913 1.81659 1.81424 1.81205
1.98804 1.98291 1.97825 1.97399 1.9701 1.96651 1.9632 1.96014 1.95729 1.95465
2.07961 2.07387 2.06866 2.0639 2.05954 2.05553 2.05183 2.04841 2.04523 2.04227
2.18943 2.18289 2.17696 2.17154 2.16659 2.16203 2.15782 2.15393 2.15033 2.14697
2.32779 2.32016 2.31323 2.30691 2.30113 2.29581 2.29091 2.28638 2.28217 2.27826
2.51765 2.50832 2.49987 2.49216 2.48511 2.47863 2.47266 2.46714 2.46202 2.45726
2.83136 2.81876 2.80734 2.79694 2.78744 2.77871 2.77068 2.76326 2.75639 2.75000
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
0.25553 0.25546 0.2554 0.25534 0.25528 0.25523 0.25518 0.25513 0.25508 0.25504
0.52984 0.52967 0.5295 0.52935 0.52921 0.52908 0.52895 0.52883 0.52871 0.52861
0.85337 0.853 0.85265 0.85232 0.85201 0.85172 0.85144 0.85118 0.85094 0.8507
1.05406 1.0535 1.05298 1.05248 1.05202 1.05158 1.05117 1.05077 1.0504 1.05005
1.30946 1.30857 1.30774 1.30695 1.30621 1.30551 1.30485 1.30423 1.30364 1.30308
1.69552 1.69389 1.69236 1.69092 1.68957 1.6883 1.68709 1.68595 1.68488 1.68385
1.81 1.80809 1.80629 1.80461 1.80302 1.80153 1.80012 1.79878 1.79751 1.79631
1.95218 1.94987 1.9477 1.94567 1.94375 1.94195 1.94024 1.93863 1.93711 1.93566
2.03951 2.03693 2.03452 2.03224 2.03011 2.02809 2.02619 2.02439 2.02269 2.02108
2.14383 2.1409 2.13816 2.13558 2.13316 2.13087 2.12871 2.12667 2.12474 2.12291
2.27461 2.2712 2.26801 2.26501 2.26219 2.25953 2.25702 2.25465 2.2524 2.25027
2.45282 2.44868 2.44479 2.44115 2.43772 2.43449 2.43145 2.42857 2.42584 2.42326
2.74404 2.73848 2.73328 2.72839 2.72381 2.71948 2.71541 2.71156 2.70791 2.70446
31 32 33 34 35 36 37 38 39 40
Tablas estadísticas
7
Universidad Peruana de Ciencias Aplicadas Tabla Nº 3.2 TABLA DE LA DISTRIBUCION T-STUDENT
Área bajo la curva: P T c
41 42 43 44 45 46 47 48 49 50
0.4 0.25500 0.25496 0.25492 0.25488 0.25485 0.25482 0.25479 0.25476 0.25473 0.25470
0.3 0.52850 0.52840 0.52831 0.52822 0.52814 0.52805 0.52798 0.52790 0.52783 0.52776
0.2 0.85048 0.85026 0.85006 0.84987 0.84968 0.84951 0.84934 0.84917 0.84902 0.84887
0.15 1.04971 1.04939 1.04908 1.04879 1.04852 1.04825 1.04800 1.04775 1.04752 1.04729
0.1 1.30254 1.30204 1.30155 1.30109 1.30065 1.30023 1.29982 1.29944 1.29907 1.29871
0.05 1.68288 1.68195 1.68107 1.68023 1.67943 1.67866 1.67793 1.67722 1.67655 1.67591
0.04 1.79517 1.79409 1.79305 1.79207 1.79113 1.79023 1.78937 1.78855 1.78776 1.78700
0.03 1.93428 1.93298 1.93173 1.93054 1.92941 1.92833 1.92729 1.92630 1.92535 1.92444
0.025 2.01954 2.01808 2.01669 2.01537 2.01410 2.01290 2.01174 2.01063 2.00958 2.00856
0.02 2.12117 2.11952 2.11794 2.11644 2.11500 2.11364 2.11233 2.11107 2.10987 2.10872
0.015 2.24825 2.24633 2.24449 2.24275 2.24108 2.23949 2.23797 2.23652 2.23512 2.23379
0.01 2.4208 2.41847 2.41625 2.41413 2.41212 2.41019 2.40835 2.40658 2.40489 2.40327
0.005 2.70118 41 2.69807 42 2.69510 43 2.69228 44 2.68959 45 2.68701 46 2.68456 47 2.68220 48 2.67995 49 2.67779 50
51 52 53 54 55 56 57 58 59 60
0.25467 0.25465 0.25462 0.25460 0.25458 0.25455 0.25453 0.25451 0.25449 0.25447
0.52769 0.52763 0.52757 0.52751 0.52745 0.52740 0.52735 0.52730 0.52725 0.52720
0.84873 0.84859 0.84846 0.84833 0.84821 0.84809 0.84797 0.84786 0.84776 0.84765
1.04708 1.04687 1.04667 1.04648 1.04630 1.04612 1.04595 1.04578 1.04562 1.04547
1.29837 1.29805 1.29773 1.29743 1.29713 1.29685 1.29658 1.29632 1.29607 1.29582
1.67528 1.67469 1.67412 1.67356 1.67303 1.67252 1.67203 1.67155 1.67109 1.67065
1.78627 1.78558 1.78491 1.78426 1.78364 1.78304 1.78246 1.78190 1.78137 1.78085
1.92356 1.92272 1.92191 1.92114 1.92039 1.91967 1.91897 1.91830 1.91765 1.91703
2.00758 2.00665 2.00575 2.00488 2.00404 2.00324 2.00247 2.00172 2.00100 2.0003
2.10762 2.10655 2.10553 2.10455 2.10361 2.10270 2.10182 2.10097 2.10015 2.09936
2.2325 2.23127 2.23009 2.22895 2.22785 2.22679 2.22577 2.22479 2.22384 2.22292
2.40172 2.40022 2.39879 2.39741 2.39608 2.39480 2.39357 2.39238 2.39123 2.39012
2.67572 2.67373 2.67182 2.66998 2.66822 2.66651 2.66487 2.66329 2.66176 2.66028
51 52 53 54 55 56 57 58 59 60
61 62 63 64 65 66 67 68 69 70
0.25445 0.25444 0.25442 0.25440 0.25439 0.25437 0.25436 0.25434 0.25433 0.25431
0.52715 0.52711 0.52706 0.52702 0.52698 0.52694 0.52690 0.52687 0.52683 0.52680
0.84755 0.84746 0.84736 0.84727 0.84719 0.84710 0.84702 0.84694 0.84686 0.84679
1.04532 1.04518 1.04504 1.04490 1.04477 1.04464 1.04452 1.04440 1.04428 1.04417
1.29558 1.29536 1.29513 1.29492 1.29471 1.29451 1.29432 1.29413 1.29394 1.29376
1.67022 1.66980 1.66940 1.66901 1.66864 1.66827 1.66792 1.66757 1.66724 1.66691
1.78034 1.77986 1.77939 1.77893 1.77849 1.77806 1.77765 1.77724 1.77685 1.77647
1.91642 1.91584 1.91527 1.91472 1.91419 1.91368 1.91318 1.91269 1.91222 1.91177
1.99962 1.99897 1.99834 1.99773 1.99714 1.99656 1.99601 1.99547 1.99495 1.99444
2.0986 2.09786 2.09715 2.09645 2.09578 2.09514 2.09451 2.09390 2.09330 2.09273
2.22204 2.22118 2.22035 2.21955 2.21877 2.21802 2.21729 2.21658 2.21589 2.21523
2.38905 2.38801 2.38701 2.38604 2.38510 2.38419 2.38330 2.38245 2.38161 2.38081
2.65886 2.65748 2.65615 2.65485 2.65360 2.65239 2.65122 2.65008 2.64898 2.64790
61 62 63 64 65 66 67 68 69 70
75 80 85 90 95 100 105 110 120 ∞
0.25425 0.25419 0.25414 0.25410 0.25406 0.25402 0.25399 0.25396 0.25391 0.25335
0.52664 0.52650 0.52637 0.52626 0.52616 0.52608 0.52600 0.52592 0.52580 0.52440
0.84644 0.84614 0.84587 0.84563 0.84542 0.84523 0.84506 0.84490 0.84463 0.84162
1.04365 1.04320 1.04280 1.04244 1.04212 1.04184 1.04158 1.04134 1.04093 1.03643
1.29294 1.29222 1.29159 1.29103 1.29053 1.29007 1.28967 1.28930 1.28865 1.28156
1.66543 1.66412 1.66298 1.66196 1.66105 1.66023 1.65950 1.65882 1.65765 1.64484
1.77473 1.77321 1.77187 1.77068 1.76961 1.76866 1.76779 1.76701 1.76564 1.75069
1.90967 1.90784 1.90623 1.90480 1.90352 1.90237 1.90133 1.90039 1.89874 1.88079
1.99210 1.99006 1.98827 1.98667 1.98525 1.98397 1.98282 1.98177 1.97993 1.95997
2.09008 2.08778 2.08574 2.08394 2.08233 2.08088 2.07958 2.07839 2.07631 2.05375
2.21216 2.20949 2.20713 2.20504 2.20317 2.20150 2.19998 2.19861 2.19620 2.17009
2.3771 2.37387 2.37102 2.36850 2.36624 2.36422 2.36239 2.36073 2.35782 2.32635
2.64298 2.63869 2.63491 2.63157 2.62858 2.62589 2.62347 2.62126 2.61742 2.57583
75 80 85 90 95 100 105 110 120 ∞
Tablas estadísticas
8
View more...
Comments