Estadística para Comunicadores

July 23, 2017 | Author: Anonymous Bdt0OGh | Category: Linear Regression, Statistics, Mathematics, Science, Technology (General)
Share Embed Donate


Short Description

Descripción: Cuaderno de Trabajo...

Description

Estadística para Comunicadores

PREGRADO

AUTOR

:

Silvia Gutiérrez Flores

TÍTULO

:

Material de enseñanza

FECHA

:

Agosto 2016

CURSO

:

Estadística para comunicadores

CODIGO

:

MA470

ÁREA

:

Ciencias

CICLO

:

2016- 02

Estadística para Comunicadores

Estadística para Comunicadores

3

Contenido

Unidad 1. Estadística Descriptiva ................................................................................. 6 La Estadística y su clasificación ........................................................................................................ 6 Conceptos básicos............................................................................................................................. 7 Técnicas de recolección de datos ..................................................................................................... 11 Registro administrativo (RRAA) ................................................................................................... 11 Variable .......................................................................................................................................... 14 Escalas de medición ........................................................................................................................ 18 Parámetro y estadístico ................................................................................................................... 25 Presentación tabular y gráfica de variables ...................................................................................... 33 Variable cualitativa ....................................................................................................................... 34 Variable cuantitativa discreta ........................................................................................................ 35 Variable cuantitativa continua ....................................................................................................... 36 Medidas de Tendencia Central ........................................................................................................ 38 Media ........................................................................................................................................... 39 Mediana ....................................................................................................................................... 41 Moda ............................................................................................................................................ 44 Forma de la distribución de los datos .............................................................................................. 47 Medidas de posición: Cuantiles ....................................................................................................... 49 Medidas de variabilidad o dispersión .............................................................................................. 53 Varianza ....................................................................................................................................... 53 Desviación estándar ...................................................................................................................... 54 Coeficiente de variación ............................................................................................................... 56 Rango ........................................................................................................................................... 58 Rango intercuartil (RIC) ............................................................................................................... 58 Tabulaciones cruzadas .................................................................................................................... 64 Gráfico de barras comparativas ..................................................................................................... 67 Gráfico de barras apiladas ............................................................................................................. 70 Gráfico de barras apiladas al 100% ............................................................................................... 71

Unidad 2. Muestreo ..................................................................................................... 78 Censo ............................................................................................................................................. 79 Muestreo ........................................................................................................................................ 79 Muestreo probabilístico .................................................................................................................. 81 Muestreo aleatorio simple ............................................................................................................. 81 Muestreo estratificado................................................................................................................... 89 Muestreo sistemático .................................................................................................................. 101

Unidad 3. Probabilidad y variable aleatoria .............................................................115 Experimento no aleatorio o determinístico .................................................................................... 115 Probabilidad ............................................................................................................................... 116

Estadística para Comunicadores

4

Eventos mutuamente excluyentes ................................................................................................ 116 Axiomas de la probabilidad ........................................................................................................ 117 Definición clásica de probabilidad .............................................................................................. 117 Probabilidad condicional ................................................................... ¡Error! Marcador no definido. Variable aleatoria .......................................................................................................................... 125 Variable aleatoria continua: Distribución normal......................................................................... 126

Unidad 4. Inferencia Estadística................................................................................140 Nivel de confianza ........................................................................................................................ 140 Margen de error ............................................................................................................................ 140 Estimación por intervalo ............................................................................................................... 141 Distribución t-Student ................................................................................................................. 143 Intervalo de confianza para la media poblacional  ..................................................................... 144 Tamaño de muestra para estimar la media de una población ........................................................ 150 Intervalo de confianza para la proporción poblacional ................................................................. 155 Tamaño de muestra para estimar una proporción poblacional ...................................................... 160 Prueba de Hipótesis ...................................................................................................................... 167 Tipos de errores .......................................................................................................................... 167 Pasos a seguir en una Prueba de Hipótesis ..................................................................................... 168 Prueba de hipótesis para la media poblacional  .......................................................................... 168 Prueba de hipótesis para una proporción poblacional ................................................................... 175 Prueba de hipótesis para dos varianzas poblacionales .................................................................. 186 Prueba de hipótesis para la diferencia de medias poblacionales ................................................... 193 Prueba de hipótesis para dos medias poblacionales: Muestras dependientes ................................ 199 Prueba de hipótesis para dos proporciones poblacionales ............................................................ 209

Unidad 5. Regresión Lineal y Correlación ................................................................223 Análisis de Regresión lineal simple y de Correlación .................................................................... 223 El diagrama de dispersión ........................................................................................................... 224 La ecuación de la recta estimada ................................................................................................. 225 El método de mínimos cuadrados. ............................................................................................... 226 Validando el modelo ................................................................................................................... 232 Supuestos de la Regresión Lineal ................................................................................................ 232 Coeficiente de determinación y de no determinación .................................................................... 233 Coeficiente de correlación ............................................................................................................. 234

Estadística para Comunicadores

Unidad 1 Conceptos básicos Medidas descriptivas Tablas de contingencia

LOGRO: Al término de la Unidad 1, el estudiante aplica las estadísticas descriptivas participando activamente en la solución de problemas.

Temas de la unidad:       

Definición de población, muestra, unidad elemental Dato y observación. Variables, tipos y escalas de medición. Parámetros y estadísticos. Medidas de tendencia central y concepto de asimetría. Medidas de posición y medidas de dispersión. Tablas de doble entrada y gráficos comparativos.

5

Estadística para Comunicadores

Unidad 1. Estadística Descriptiva La Estadística y su clasificación

Estadística Es una ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, organizar, presentar y analizar datos. La finalidad y utilidad es describir, numérica o gráficamente, al conjunto de datos, así como también realizar inferencias entendidas como generalizaciones de lo medido, de manera que se puedan obtener conclusiones adecuadas. Es una herramienta útil para la toma de decisiones.

• Son métodos y técnicas de recolección, caracterización, resumen y presentación que permite describir las características de un conjunto de datos. • Comprende el uso de gráficos, tablas e indicadores para el análisis. • Existen diversos tipos de gráficos adecuados a los tipos de variables que se desean representar.

• Son métodos y técnicas que hacen posible estimar una o más características de una población o tomar decisiones referentes a la población basados en el resultado de muestras seleccionadas al azar. • Estas conclusiones no tienen que ser totalmente válidas, pueden tener cierto margen de error, por eso se dan con una medida de confiabilidad o probabilidad.

Estadística Descriptiva

Estadística Inferencial

6

Estadística para Comunicadores

7

Conceptos básicos Población •Es el conjunto de todos los elementos de interés en un determinado estudio. •Pueden ser personas, animales, objetos, conceptos, entre otros. de los cuales sacamos conclusiones a partir de una o más características observables de naturaleza cualitativa o cuantitativa. •Suele llamarse población objetivo porque se selecciona en función al objetivo de estudio.

Muestra •Es una parte representativa de la población que se selecciona adecuadamente para su análisis y así obtener información acerca de la población de la que proviene. •En estadística se suele trabajar con muestras representativas, es decir, que son elegidas de forma aleatoria.

Unidad elemental •Es el objeto sobre el cual se hace el conjunto de mediciones •También se le denomina unidad de análisis, unidad estadística, caso o elemento. •En estudios longitudinales, de series de tiempo, la unidad elemental es la unidad de tiempo. Por ejemplo, un día, un mes, un año, etc.

Dato •Es la respuesta o el resultado de medir una característica de una unidad elemental.

Observación •Es el conjunto de datos de una unidad elemental •En una base de datos, una observación es el registro completo de cada unidad elemental.

8

Estadística para Comunicadores

Ejemplo El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación se presenta parte de la base de datos:

N° Edad

Género

País de procedencia

Precio dispuesto Número de a pagar por acompañantes habitación por viaje (en dólares)

Criterio de selección del hotel

1 2

25 35

Masculino Femenino

Inglaterra Argentina

80 60

0 2

Limpieza del dormitorio Precio

3

45

Masculino

Francia

115

3

Buena calidad de las toallas y sábanas

4 5 6

65 72 28

Masculino Femenino Masculino

Francia Francia Estados Unidos

45 55 65

0 1 2

Precio Amigable y cordial staff de empleados Precio

7

45

Femenino

Estados Unidos

60

1

Precio

8 9 10 

85 25 35 

Masculino Masculino Femenino 

China Inglaterra Francia 

70 65 45 

2 3 1 

Precio Limpieza del dormitorio Precio 

115

20

Masculino

Estados Unidos

55

2

Amigable y cordial staff de empleados

a. Determine la población, la muestra y la unidad elemental.

Población

Todos los huéspedes extranjeros que se hospedaron en el hotel la Posada entre enero y mayo del presente año.

Muestra

115 huéspedes extranjeros que se hospedaron en el hotel la Posada entre enero y mayo del presente año.

Elemento

Un huésped extranjero que se hospedó en el hotel la Posada entre enero y mayo del presente año.

b. De la base de datos, proporcione un ejemplo de dato y uno de observación. Dato

65 años

Observación

65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio.

Estadística para Comunicadores

9

Ejercicios 1. El diario nacional “Al Día” tiene 360 empleados, de los cuales el 36% son mujeres y el 44,2% son solteros. En un estudio realizado a 105 empleados elegidos al azar se encontró que la edad promedio en el grupo era de 31,2 años, el 27,3% estudió en provincias, 66 de estos trabajadores tienen a lo más 5 hijos y que 13 de ellos ganan más de 1650 soles mensuales. Identifique según el enunciado: población, muestra y unidad elemental.

Población

Muestra

Unidad elemental

2. Se quiere estimar el porcentaje de universitarios limeños que trabajan. Determine la población, la muestra y la unidad elemental.

Población

Muestra

Unidad elemental

3. En el Día Internacional de las trabajadoras del Hogar, un diario de la capital publicó el siguiente párrafo: “… En toda Lima Metropolitana existen 313 608 mujeres mayores de 14 años que ejercen la labor de trabajadoras del hogar, el 82% labora en hogares del sector socioeconómico A, la mayoría no cuenta con seguro social, la jornada laboral promedio es de 12,3 horas diarias y el sueldo promedio de la doméstica es de 455 soles mensuales…” Identifique a partir del enunciado anterior la población, la muestra y la unidad elemental.

Población

Muestra

10

Estadística para Comunicadores

Unidad elemental

4. Una empresa tiene un total de 51 trabajadores y ha registrado información acerca del ingreso mensual (en soles) y de los años cumplidos en la empresa. Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Ingreso (en soles) 2300 2800 2400 2500 2300 2100 1700 2000 2200 2100 1700 2500 2800 2400 1700 2400 2200

Años en la empresa 5 11 4 2 3 2 2 0 7 4 0 2 13 9 1 9 10

Nº 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Ingreso (en soles) 2100 2100 1800 2000 2100 1900 2000 2300 2000 1700 1900 2000 2400 1700 1700 2400 2500

Años en la empresa 13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13

Nº 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51

Ingreso (en soles) 2400 1700 2500 1700 2400 2400 1900 1700 2100 2000 2000 2500 1700 2500 1700 2600 1600

Años en la empresa 16 0 12 3 17 16 7 1 6 5 3 13 0 19 3 19 1

Identifique a partir del enunciado la población, la unidad elemental y proporcione un ejemplo de dato y un ejemplo de observación:

Población

Unidad Elemental

Dato

Observación

Estadística para Comunicadores

11

Técnicas de recolección de datos La forma de obtener la información original de las unidades elementales que componen la población a investigar puede ser efectuada a través de:   

un censo, una encuesta o un registro administrativo.

• Se llama Censo cuando se recolecta la información de todas las unidades de la población. • El método para recolectar los datos de toda la población es a través de una encuesta y es necesario que se especifique el espacio y el tiempo al que se refiere el recuento.

• Es un instrumento de recolección de datos. • Este instrumento se puede aplicar a la población o a la muestra. • Es llevada a cabo generalmente a través de algún cuestionario que puede ser por teléfono, virtual o a través de un encuestador.

Censo

Encuesta

Se prefiere el uso de la encuesta en vez de un censo principalmente por dos razones: costo y tiempo.

Registro administrativo (RRAA) El registro administrativo, junto con las encuestas y los censos, forma una de las tres fuentes clásicas de datos estadísticos. La diferencia con las otras dos estriba en su carácter de fuente secundaria (no porque el dato se halla resumido) sino porque el estadístico o investigador no la toma directamente ni bajo criterios metodológicos propios de la investigación que adelanta sino debido a criterios normativos que lleva la institución pública dueña del registro. Sin embargo, el registro administrativo posee propiedades que hacen que pueda convertirse en dato estadístico a un bajo costo y sin perder los requisitos de calidad del dato estadístico. Actualmente el registro administrativo forma parte de la infraestructura estadística nacional mínima de los países pero ha sido descuidada en los países latinoamericanos.

Estadística para Comunicadores

12

Definición de Registro Administrativo Así, los RRAA son …”información referida a una unidad individual –persona física, hogar, empresa, etc. – que ha sido diseñada, recogida y mantenida por una determinada administración pública con el propósito de controlar y/o tomar decisiones relativas a esa unidad individual.”. Begoña (2006). Los RRAA pueden ser privados también, de hecho gran cantidad de información agropecuaria, petrolera, económica, etc., tiene como fuente RRAA procedentes de corporaciones privadas. SO: Begoña Sanz Diez. (2006) Algunas reflexiones sobre el marco legal para la utilización de la información administrativa con fines estadísticos. Instituto de Estudios Fiscales. Madrid 2006 Citado por: Casanova, Hugo Delfín. Los Registros Administrativos: Sus ventajas y desventajas. Sus diferencias frente a las encuestas y los censos [Internet]. Versión 4. Knol. 2009 ago 17. Disponible (URL: http://knol.google.com/k/hugo-delfín-casanova/los-registrosadministrativos/wm2h942t9vjr/5.) Existen oficinas públicas que llevan registros administrativos para sus propios fines. Por ejemplo:   

los Registros Civiles registran nacimientos, casamientos o defunciones, el Ministerio de Educación que lleva registros sobre matrícula de alumnos o deserción escolar, la Aduana que registra las importaciones y exportaciones.

Los registros administrativos constituyen la forma más económica de obtener información estadística. Sin embargo, esta información se obtiene tal como está disponible. Los fines del registro administrativo no siempre coinciden con los de nuestra investigación. Por ejemplo, se puede consultar las páginas web de las siguientes instituciones:     

Ministerio de Educación. http://minedu.gob.pe/ Ministerio de Salud http://www.minsa.gob.pe/ Superintendencia Nacional de Aduanas y de Administración Tributaria SUNAT http://www.sunat.gob.pe/ Registro Nacional de Identificación y Estado Civil http://www.reniec.gob.pe/ Instituto Nacional de Estadística e Informática INEI. http://www.inei.gob.pe/

Estadística para Comunicadores

 

Ministerio de Trabajo y Promoción del Empleo. http://www.mintra.gob.pe Infocorp/Equifax: http://www.equifax.com/home/es_pe



Empresa de investigación de mercados Ipsos Perú: http://www.ipsos.pe/

13

14

Estadística para Comunicadores

Variable

Variable Se define así a una característica que presentan los elementos de una población y que puede asumir diferentes valores cuando se realiza su medición

Variables

Variables cualitativas Son aquellas variables que al ser medidas quedan expresadas por etiquetas o nombres que se utilizan para identificar una característica o atributo.

cuantitativas

Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para identificar una característica o atributo. Estas a su vez pueden clasificarse en discretas o continuas.

Variable

Variable

cuantitativa

cuantitativa

discreta

continua

Las mediciones de este tipo de variable son el resultado del conteo, es decir, los valores que puede tomar son números enteros (finitos o infinitos)

Las mediciones de este tipo de variable pueden ser decimales o fracciones; es decir, para dos valores cualesquiera, siempre se podrá encontrar un tercer valor entre los dos primeros.

15

Estadística para Comunicadores

Variable Cuantitativa

Cualitativa

Distrito de residencia

discreta

Grado de instrucción

Número de capacitacio nes realizadas en el año

Número de errores cometidos en la redacción de un informe

Cuantitativa continua

Tiempo que demora una llamada telefónica (en minutos)

Ingreso mensual (en soles)

Ejemplo El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación se presenta parte de la base de datos:

N° Edad

Género

País de procedencia

Precio dispuesto Número de a pagar por acompañantes habitación por viaje (en dólares) 80 0

Criterio de selección del hotel

1

25

Masculino

Inglaterra

2

35

Femenino

Argentina

60

2

Limpieza del dormitorio Precio

3 4

45 65

Masculino Masculino

Francia Francia

115 45

3 0

Buena calidad de las toallas y sábanas Precio

5

72

Femenino

Francia

55

1

Amigable y cordial staff de empleados

6

28

Masculino

Estados Unidos

65

2

Precio

7 8

45 85

Femenino Masculino

Estados Unidos China

60 70

1 2

Precio Precio

9 10

25 35

Masculino Femenino

Inglaterra Francia

65 45

3 1

Limpieza del dormitorio Precio















115

20

Masculino

Estados Unidos

55

2

Amigable y cordial staff de empleados

16

Estadística para Comunicadores

Identifique el tipo de variable que se presenta en la base de datos. Variable

Tipo de variable

Edad

Cuantitativa continua

Género

Cualitativa

País de procedencia

Cualitativa

Precio dispuesto a pagar por habitación, en dólares

Cuantitativa continua

Número de acompañantes por viaje

Cuantitativa discreta

Criterio de selección del hotel

Cualitativa

Ejercicios 1. Clasifique las siguientes variables de acuerdo a su tipo: Variable Tiempo de servicio de los empleados de un medio de comunicación. Nivel educacional de los empleados de una radio. Lugar de nacimiento de los empleados de una editorial. Orden de llegada de los reporteros a una entrevista. Número de diarios defectuosos que salen de la línea de producción del diario “Mi País”. Ingreso mensual (en soles) de los trabajadores de una empresa publicitaria.

Tipo de variable

17

Estadística para Comunicadores

2. Se desea conocer la opinión sobre el servicio que brinda el transporte “Metropolitano de Lima”. Para llevar a cabo este estudio se aplicó una encuesta, el primer trimestre del año 2014, a 300 personas del sexo femenino que utilizaron dicho medio de transporte en horario pico. Después de procesar las encuestas se obtuvieron los siguientes resultados:  El 65% opinó que el servicio es bueno, el 30% que es regular y el resto manifestó que es deficiente.  El 45% utiliza la línea A, el 30% la línea B y el resto la C.  El 60% manifestó que es muy lenta la recarga de la tarjeta “Bus Card”.  La edad promedio es de 42,5 años con una desviación estándar de 2,3 años.  El 50% demora a lo más 25 minutos en llegar a su destino.  El 85% usa el servicio como máximo 4 veces al día. a. Del enunciado anterior identifique: población, muestra, unidad elemental.

Población

Muestra

Elemento

b. Identifique las variables en estudio e indique su tipo. Variables

Tipo de variable

Estadística para Comunicadores

18

Escalas de medición La medición de una variable consiste en asignar un valor a la característica observada. Por ejemplo, si la característica observada es el género de las personas, al clasificar a una persona como de sexo femenino, le asignamos un valor, y hacemos una medición de la característica. El proceso de medición utiliza diversas escalas: nominal, ordinal, intervalo y razón.

• Sólo permite asignar un nombre, etiqueta o valor al elemento sometido a medición. • Los números que se puedan asignar a las propiedades de los elementos se utilizan sólo como etiquetas con la finalidad de clasificarlos. • Con esta escala no tiene sentido realizar operaciones aritméticas.

Nominal

• Además de asignar un nombre o etiqueta y establecer un orden entre los elementos, esta escala permite calcular diferencias entre los números asignados a las mediciones (el intervalo entre observaciones que se expresa en términos de una unidad fija de medida). • Los datos son numéricos.

Intervalo

• Los datos son etiquetas y además el orden es significativo. • Los datos se pueden ordenar en forma ascendente o descendente, de tal manera que puedan expresar grados de la característica medida.

Ordinal

• Los datos tienen todas las propiedades de los datos de intervalo y el cociente de los dos valores es significativo. • Tiene un punto cero absoluto, es decir, el cero indica la ausencia de la característica medida. • Se puede realizar las operaciones aritméticas a los números asignados.

Razón

Estadística para Comunicadores

19

Estadística para Comunicadores

Ejercicio

20

21

Estadística para Comunicadores

Ejemplo El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación se presenta parte de la base de datos:

N° Edad

Género

País de procedencia

Precio dispuesto Número de a pagar por acompañantes habitación por viaje (en dólares)

Criterio de selección del hotel

1 2

25 35

Masculino Femenino

Inglaterra Argentina

80 60

0 2

Limpieza del dormitorio Precio

3

45

Masculino

Francia

115

3

Buena calidad de las toallas y sábanas

4 5 6

65 72 28

Masculino Femenino Masculino

Francia Francia Estados Unidos

45 55 65

0 1 2

Precio Amigable y cordial staff de empleados Precio

7

45

Femenino

Estados Unidos

60

1

Precio

8 9 10

85 25 35

Masculino Masculino Femenino

China Inglaterra Francia

70 65 45

2 3 1

Precio Limpieza del dormitorio Precio















115

20

Masculino

Estados Unidos

55

2

Amigable y cordial staff de empleados

Identifique el tipo y la escala de medición de cada una de las variables que se presenta en la base de datos. Variable

Tipo de variable

Escala de medición

Cuantitativa continua

Razón

Género

Cualitativa

Nominal

País de procedencia

Cualitativa

Nominal

Precio dispuesto a pagar por habitación, en dólares

Cuantitativa continua

Razón

Número de acompañantes por viaje

Cuantitativa discreta

Razón

Cualitativa

Nominal

Edad

Criterio de selección del hotel

22

Estadística para Comunicadores

Ejercicios 1. Indique el tipo y la escala de medida que corresponde a cada una de las siguientes variables. Variable

Tipo de variable

Escala de medida

Edad Marca de automóvil Número de personas a favor de la pena de muerte Ventas anuales (en dólares) Tamaño de bebida (pequeño, mediano, grande) Método de pago (efectivo, cheque, tarjeta de crédito) Grado de un miembro del ejército (soldado raso, sargento, cabo, etc.). 2. Los clientes que se suscriben a la revista “Buena Vida” deben llenar un formato con información personal. Clasifique cada uno de los datos solicitados indicando el tipo de variable y su respectiva escala de medida. Variable Profesión

Distrito de residencia Ingreso mensual familiar (en soles) Grado de instrucción

Tipo de variable

Escala de medida

23

Estadística para Comunicadores

Número telefónico

Estado civil Gasto semanal en alimentos (en soles) Centro laboral

3. Un diario local desea analizar qué tanta gente que adquiere el diario estaría interesada por que se ofrezcan recetas de comidas típicas de diferentes regiones del país. Para ello, de un total de 2100 personas suscritas al diario, de las cuales el 74% son hombres, se seleccionaron al azar 352 personas y se les consultó al respecto. Después de resumir la información se encontró que el 60% tiene mucho interés en recetas de comida típica, la edad promedio de las personas entrevistadas es de 31 años y el 10% procede de la Selva. a. Identifique la población, la muestra y el elemento. b. Identifique qué variables se están estudiando, indique su tipo y escala de medida. La población

Muestra

Elemento

Defina la variable

Tipo de variable

Escala de medida

24

Estadística para Comunicadores

4. El Magazine Actualidad empezó a circular en el departamento de Lima el mes de enero del año 2 006, siendo una de las más sólidas en su rubro. Cuenta a la fecha con 1 450 suscriptores, de los cuales el 30% reside fuera de la provincia de Lima y 30 de ellos se retiraron el primer semestre de este año. Los directivos han decidido aplicar una encuesta a una muestra de 120 suscriptores para poder implementar un programa de impacto, con la finalidad, de incrementar el número de suscriptores. Los resultados obtenidos después de la aplicación son:   

El 80% está muy satisfecho, el 12% está satisfecho y sólo un 8% está insatisfecho. El 65% de los suscriptores solicita se agregue información referente a actividades recreativas para programarlas en su tiempo libre. El 70% realiza compras por computadora. Esta información revela a los directivos que los avances en computación serán de interés para sus suscriptores.

a. En base al enunciado anterior identifique:

La población

La muestra

b. Complete los espacios en blanco, según el enunciado: Defina la variable

Tipo de variable

Escala de medida Ordinal

Cualitativa

Nominal

Estadística para Comunicadores

Parámetro y estadístico Parámetro • Resume una característica de la población. • Para obtener su valor se hace necesario contar con toda la información que brindan los elementos de una población.

Estadístico • Resume una característica de la muestra. • Para obtener su valor se utiliza la información muestral. • El valor obtenido de un estimador se conoce como estimación. • Al estimador, también se le llama estadígrafo o estadístico.

Estudio muestral

25

Estadística para Comunicadores

Estudio poblacional

http://peru21.pe/politica/elecciones-2014-resultados-onpe-alcaldias-distritales-lima

26

27

Estadística para Comunicadores

Ejemplo de parámetro y estadísticos Nombre

Parámetro

Estadístico

N

Promedio



x

2 

x

i 1

N

N

Varianza

n

i

 xi

 

i 1

s2 

N

p

Proporción

i 1

 x

i

 x

2

i 1

n 1

s

A N

i

n

n

2

  2

Desviación estándar

x

pˆ 

s2

a n

Ejemplo El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación se presenta parte de la base de datos:

N° Edad

Género

País de procedencia

Precio dispuesto Número de a pagar por acompañantes habitación por viaje (en dólares)

Criterio de selección del hotel

1 2

25 35

Masculino Femenino

Inglaterra Argentina

80 60

0 2

Limpieza del dormitorio Precio

3

45

Masculino

Francia

115

3

Buena calidad de las toallas y sábanas

4

65

Masculino

Francia

45

0

Precio

5

72

Femenino

Francia

55

1

Amigable y cordial staff de empleados

6 7

28 45

Masculino Femenino

Estados Unidos Estados Unidos

65 60

2 1

Precio Precio

8

85

Masculino

China

70

2

Precio

9

25

Masculino

Inglaterra

65

3

Limpieza del dormitorio

10

35

Femenino

Francia

45

1

Precio















115

20

Masculino

Estados Unidos

55

2

Amigable y cordial staff de empleados

Después de procesar la información se obtuvieron los siguientes resultados:

28

Estadística para Comunicadores

   

El 34% de los huéspedes extranjeros procede de los Estados Unidos. La edad promedio de los huéspedes es de 35,2 años. El número de acompañantes por huésped extranjero más frecuente es de dos personas. El criterio de selección más frecuente es el precio.

Identifique el estimador y el valor del estimador para cada una de las variables de la base de datos. Variable

Estadístico

Valor del estadístico

Lugar de procedencia

Proporción

34% Estados Unidos

Edad de los huéspedes

Promedio

35,2 años

Número de acompañantes

Moda

2

Criterio de selección del hotel

Moda

precio

Ejercicios de aplicación 1. Con la intención de conocer la opinión de los pacientes de los hospitales, que fueron afectados por la última huelga médica, se contrató los servicios de la consultora Access Data S.A. la cual encuestó a 500 pacientes que acudieron a los diferentes hospitales de Lima y Callao el presente mes. Entre los principales resultados se obtuvieron los siguientes:    

El 67,4% de los encuestados afirmó que se vieron perjudicados por la huelga médica. La respuesta más frecuente a la pregunta ¿Cómo calificaría la calidad de la atención que recibe?, fue regular. El promedio del número de veces que debe acudir mensualmente al hospital es de 3,4 veces. El 25% de los encuestados afirmó que recibe del hospital hasta dos medicamentos por atención.

Identifique: Variable

Estadístico

Valor del estadístico

29

Estadística para Comunicadores

2. Un diario local publicó en su última edición dominical, un estudio realizado sobre el manejo y desarrollo de la publicidad actual. Mencionamos a continuación algunos párrafos publicados en este artículo:      

“...se realizó una encuesta en la ciudad de Lima a 1102 personas de 18 a 70 años de edad elegidas al azar...” “…el 52% de los encuestados señalaron que los anunciantes sí sobrepasan los límites de lo aceptable desde el punto de vista ético y social al realizar sus campañas de publicidad…” “… el 40,2% de los encuestados señaló recordar el nombre del producto luego de ver el comercial por TV…” “… el 51,6% de los encuestados no están de acuerdo con el horario en que transmiten algunos comerciales por TV...” “... el ingreso promedio de los encuestados es de 2403 soles...” El encargado de este estudio, publicista peruano de 50 años de edad mencionó: “… la publicidad es comunicación aplaudida y criticada no sólo por su función de venta de productos, sino también por su influencia en la economía y en la sociedad…”

Identifique a partir del enunciado:

Muestra

Variable

Estadístico

Tipo de variable

Notación

Valor del estadístico

30

Estadística para Comunicadores

3. Una empresa de bebidas gaseosas está pensando lanzar una nueva bebida al mercado local. “Ice Tea” es un producto bajo en calorías y dirigido a personas en edad universitaria. Se sabe que la ciudad donde se piensa lanzar el producto cuenta con 100 000 habitantes en edad universitaria, el 65% son mujeres, el 30% consume sólo agua mineral y el 20% estudia en universidades particulares. Para tal estudio se consideró seleccionar una muestra de tamaño 400 donde los resultados obtenidos luego de procesar la información fueron:    

La edad promedio de los encuestados es de 21,6 años. El 52% de los encuestados son mujeres. El precio promedio que pagarían por el nuevo producto es 1,70 soles. El 80% de los encuestados calificó al sabor de la bebida como “Muy Bueno”, el 10% como “Bueno”, el 5% como “Malo” y el resto como “Muy Malo”.

Identifique a partir del enunciado:

Población

Muestra

Defina la Variable

Estadístico

Tipo de variable

Notación

Valor del estadístico

31

Estadística para Comunicadores

4. Con la finalidad de determinar en qué medida la población urbana de cierta ciudad identifica elementos sexistas o machistas en la publicidad comercial actual, un sociólogo cultural tomó una muestra de 590 personas, de los cuales encontró que el 60% de los encuestados reconocía elementos sexistas en la publicidad, la edad promedio de los entrevistados fue de 37,5 años, el 20% pertenecía a la clases socioeconómicas A-B, el 45% a la clase C-D, y los restantes a la clase E. A la pregunta respecto a la marca comercial con mayor contenido machista en su publicidad, el 45% reconoce a la marca de cerveza “SENPIL”, el 25% a la marca de artículos de cuidado personal “GOE”, el 10% a la marca de detergente “CEA” y el resto a otras marcas. Relacione cada uno de los elementos que se describen a continuación con los conceptos dados en el párrafo: Conceptos dados en el párrafo A. Todos los ciudadanos de cierta ciudad. B. 32 años. C. 45% pertenecen a la clase C-D D. 590 personas de cierta ciudad. E. Un ciudadano F. Cerveza “SENPIL” G. Nivel socioeconómico registrado y medido como A-B, C-D y E H. Edad del entrevistado I. Marca con mayor contenido sexista

Elementos que se describen ( ( ( ( ( ( ( ( (

) Variable cuantitativa continua. ) Muestra. ) Población. ) Variable cualitativa ) Estadístico. ) Dato cuantitativo. ) Dato cualitativo ) Unidad elemental ) Escala de medida ordinal

32

Estadística para Comunicadores

Autoevaluación 1. Complete la siguiente tabla: Variable

Tipo de variable

Escala de medición

Número de miembros por familia Emisora de radio de su preferencia Gasto semanal en periódico (soles) 2. Hace un mes, una empresa de servicios realizó una encuesta a una muestra de 60 profesionales que asistieron a una conferencia en el Colegio de Ingenieros del Perú con la finalidad de recoger información encomendada por ciertas empresas que alquilan locales para la organización de eventos culturales tales como: Congresos, Coloquios, Conversatorios, etc. Parte del cuestionario que se le pidió completar a los asistentes se presenta a continuación:

Sexo: Masculino

Femenino

6. ¿Cuánto suele gastar por asistir a un evento cultural? ______________ soles

2. Edad: ______ años 3. Ingreso mensual ___________ soles 4. Profesión __________________ 5. Cargo que ocupa en su empresa___________

7. ¿A cuántos congresos asistió el mes pasado? ___________ 8. ¿Su empresa organiza con regularidad eventos profesionales y/o culturales? Sí No 9. ¿Su empresa alquila locales para organizar eventos culturales? Sí No

En base al enunciado anterior y analizando la encuesta complete lo siguiente: Población Elemento Variable

Tipo de variable

Escala de medición Razón

Congresos asistidos el mes pasado

33

Estadística para Comunicadores

Presentación tabular y gráfica de variables Un gráfico es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de un fenómeno en estudio y facilita el análisis estadístico de las variables. Un gráfico, al igual que un cuadro o una tabla, debe contar con un Título y una Fuente.

Ejemplo El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación se presenta parte de la base de datos:

N° Edad

Género

País de procedencia

Precio dispuesto Número de a pagar por acompañantes habitación por viaje (en dólares) 80 0

Criterio de selección del hotel

1

25

Masculino

Inglaterra

2 3

35 45

Femenino Masculino

Argentina Francia

60 115

2 3

Limpieza del dormitorio Precio Buena calidad de las toallas y sábanas

4 5 6

65 72 28

Masculino Femenino Masculino

Francia Francia Estados Unidos

45 55 65

0 1 2

Precio Amigable y cordial staff de empleados Precio

7

45

Femenino

Estados Unidos

60

1

Precio

8 9 10

85 25 35

Masculino Masculino Femenino

China Inglaterra Francia

70 65 45

2 3 1

Precio Limpieza del dormitorio Precio















115

20

Masculino

Estados Unidos

55

2

Amigable y cordial staff de empleados

¿Qué podemos hacer para resumir esta información? Una vez recopilada la información, con las variables consideradas de mayor importancia, el siguiente paso es presentarla a través de una tabla de frecuencias y/o un gráfico que describa adecuadamente las características más importantes. Las tablas y los gráficos que se presentan a continuación han sido obtenidos con el software SPSS.

34

Estadística para Comunicadores

Variable cualitativa Criterio de selección del hotel La Posada

Válidos Amigable y cordial staff de empleados Buena calidad de las toallas y sábanas Limpieza del dormitorio Opciones del Preferred guest card Precio Servicios "In room" Servicios adicionales Total

Frecuencia Porcentaje 25 21,7

Porcentaje válido 21,7

Porcentaje acumulado 21,7

12

10,4

10,4

32,2

13 6

11,3 5,2

11,3 5,2

43,5 48,7

39 10 10 115

33,9 8,7 8,7 100,0

33,9 8,7 8,7 100,0

82,6 91,3 100,0

Fuente: Hotel La Posada. Puno

Gráfico Circular Distribución de huéspedes extranjeros según criterio de selección del hotel

Fuente: Hotel La Posada. Puno

Estadística para Comunicadores

Gráfico de Barras Distribución de huéspedes extranjeros según criterio de selección del hotel

Fuente: Hotel La Posada. Puno

Variable cuantitativa discreta Distribución de huéspedes extranjeros según número de acompañantes por viaje Porcentaje Porcentaje Frecuencia Porcentaje válido acumulado Válidos 0 21 18,3 18,3 18,3 1 26 22,6 22,6 40,9 2 37 32,2 32,2 73,0 3 22 19,1 19,1 92,2 4 9 7,8 7,8 100,0 Total 115 100,0 100,0 Fuente: Hotel La Posada. Puno

35

36

Estadística para Comunicadores

Gráfico de Bastones o Líneas Distribución de huéspedes extranjeros según número de acompañantes por viaje

Fuente: Hotel La Posada. Puno

Variable cuantitativa continua Elabore el gráfico de frecuencia relativa para la variable precio que estaría dispuesto a pagar por habitación (en dólares).

Distribución de huéspedes extranjeros según precio que estaría dispuesto a pagar por habitación (en dólares) Lim. Inf. Lim. Sup. 40 54 68 82 96 110 124 138

Marca Frecuencia de clase absoluta

54 68 82 96 110 124 138 152

Fuente: Hotel La Posada. Puno

47 61 75 89 103 117 131 145

15 47 23 16 8 3 2 1

Frecuencia relativa

Frec abs. acumulada

Frec. relat. acumulada

0.1304 0.4087 0.2000 0.1391 0.0696 0.0261 0.0174 0.0087

15 62 85 101 109 112 114 115

0.1304 0.5391 0.7391 0.8783 0.9478 0.9739 0.9913 1

Estadística para Comunicadores

Gráfico de Histograma Distribución de huéspedes extranjeros según precio que estaría dispuesto a pagar por habitación (en dólares)

Fuente: Hotel La Posada. Puno

37

38

Estadística para Comunicadores

Medidas de Tendencia Central Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del cual tienden a concentrarse o distribuirse las demás observaciones. El objetivo es conseguir un valor que sea representativo del conjunto total de datos que se está analizando.

Medidas de tendencia central Media

Mediana

http://www.ipsos-apoyo.com.pe/perfil_ama_de_casa

Moda

39

Estadística para Comunicadores

En esta unidad trabajaremos las medidas descriptivas únicamente con datos simples o no agrupados; es decir, con valores que no están agrupados en tablas de distribución de frecuencia.

Media La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de dichos valores dividida entre el número de valores. Población

Muestra

N



 xi i 1

N

n

x 

x i 1

i

n

Características de la media  Se puede calcular para datos medidos en escala de intervalo o razón.  El valor de la media es sensible a los valores extremos o atípicos (mínimo y máximo) que la distorsionan.  El cálculo de la media es sencillo y fácil de entender e interpretar. Ejemplo La siguiente información corresponde al número de notas publicadas por un grupo de periodistas de tres diarios locales durante el último mes: Siglo XXI Media Mediana Moda

Democracia 9,5 10,3 12

Media Mediana Moda

13,3 12 10

40

Estadística para Comunicadores

Tamaño de muestra

10

12 14

9 7

Popular

Tamaño de muestra 8 10

11 10

15

10 6

16 13

Calcule e interprete el valor del promedio del número de notas publicadas por los periodistas del diario Popular. Media = 10,5 notas Interpretación: El número promedio de notas publicados por los periodistas del diario Popular es igual a 10,5. Ejercicio 1. Carlos, estudia por las mañanas en la UPC en la facultad de Comunicaciones y por las tardes trabaja en el diario El Comercio. En una muestra de 10 días del último mes transcurrido registró su gasto diario, en soles. Los resultados se muestran a continuación: Gasto diario (soles)

40

35

32

48

25

25

30

33

42

50

Calcule e interprete la media del gasto diario.

2. Se presenta a continuación la información de una muestra de empleados de cierta compañía. Empleado 1 2 3 4 5 6 7 8

Ingreso mensual (soles) 2020 3410 1967 1630 2502 1677 4286 2952

Experiencia laboral (años) 4,6 8,8 2,1 1,2 5,2 1,1 4,9 2,8

Calcule e interprete el valor del promedio de cada una de las variables.

41

Estadística para Comunicadores

Mediana La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho conjunto. El 50% de las observaciones son menores o iguales a la mediana.

El 50% de las observaciones son menores o igual a la mediana.

Mínimo

El 50% de las observaciones son mayores a la mediana.

Mediana

Máximo

Cálculo 1. Se ordenan los datos en orden ascendente. 2. Calcule la posición i de la mediana usando la siguiente fórmula: i = 0,5n donde n es el tamaño de muestra 

Si i es un valor decimal, se redondea. El valor entero inmediato mayor que i indica la posición de la mediana.



Si i es un valor entero, la mediana es el promedio de los valores de los datos ubicados en los lugares i e i+1.

Características de la mediana  Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.  El valor de la mediana depende del número de datos observados.

42

Estadística para Comunicadores

 La mediana es un estadístico que no se ve afectado por valores extremos (mínimo y máximo). Por eso se le utiliza cuando hay datos inusuales o el polígono de frecuencias no es simétrico. Ejemplo La siguiente información corresponde al número de notas publicadas por un grupo de periodistas de tres diarios locales durante el último mes: Siglo XXI

Democracia

Media Mediana Moda Tamaño de muestra

9,5 10,3 12 10

12 14

9 7

Popular

Media Mediana Moda Tamaño de muestra 8 10

11 10

13,3 12 10 15

10 6

16 13

Calcule e interprete el valor de la mediana del número de notas publicadas por los periodistas del diario Popular. Mediana = 10 Interpretación: El 50% de los periodistas del diario Popular publicaron, durante el último mes, como máximo diez notas. Ejercicios 1.

Carlos estudia por las mañanas en la UPC en la facultad de Comunicaciones y por las tardes trabaja en el diario El Comercio. En una muestra de 10 días del mes enero y 7 del mes de febrero registró su gasto diario, en soles. Los resultados se muestran a continuación: Gasto diario Enero Gasto diario Febrero

40

35

32

48

25

25

30

27

35

32

48

25

25

30

33

Calcule e interprete el valor de la mediana del gasto diario de enero y febrero.

42

50

Estadística para Comunicadores

2.

43

Se presenta a continuación la información de una muestra de 9 empleados la editorial Kero y 6 empleados de la editorial Esparta.

Empleado 1 2 3 4 5 6 7 8 9

Kero Experiencia laboral (años) 10,5 6,3 2,5 1,2 3,4 4,9 7,8 5,5 0.9

Esparta Experiencia laboral (años) 4,6 8,8 2,1 1,2 5,2 1,1

Calcule e interprete el valor de la mediana de la experiencia laboral para cada editorial.

44

Estadística para Comunicadores

Moda La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor frecuencia. Agrupe los datos de acuerdo a sus respectivas frecuencias, el dato con mayor frecuencia es la moda. Características de la moda  La moda se puede calcular para cualquier escala de medición.  El valor de la moda no se ve afectada por valores extremos.  La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más de dos modas (multimodal). Algunas series de datos no tienen moda.  La moda es una medida menos importante que la mediana o la media debido a su ambigüedad.

Ejemplo La siguiente información corresponde al número de notas publicadas por un grupo de periodistas de tres diarios locales durante el último mes: Siglo XXI

Democracia

Media Mediana Moda Tamaño de muestra

9,5 10,3 12 10

12

9

Popular

Media Mediana Moda Tamaño de muestra 8

11

10

13,3 12 10 15 16

45

Estadística para Comunicadores

14

7

10

10

6

13

Calcule e Interprete el valor de la moda del número de notas publicadas por los periodistas del diario Popular. Moda = 10 Interpretación: El número de notas publicadas con mayor frecuencia por los periodistas del diario Popular es igual a diez.

46

Estadística para Comunicadores

Ejercicios 1. Calcule e interprete la moda de la edad de un grupo de trabajadores clasificados por género. Hombres Mujeres

35 22

28 31

24 20

35 30

28 22

24 27

35 28

23 20

30 34

20 22

Calcule e interprete la moda de la edad para cada grupo. Solución En este caso, la moda de los hombres es igual a ………………….. años y la moda de las mujeres es igual a ………………………….. años. Esto significa que………………………………………………………………………………... ………………………………………………………………………………………………….... ………………………………………………………………………………………………….... 2. A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados de la carrera de Administración. Número

Género

Edad

1 2 3 4 5 6 7 8

Femenino Femenino Femenino Femenino Femenino Femenino Femenino Femenino

15 19 21 34 21 24 30 26

Estatura (en cm) 154 154 156 184 173 170 176 188

Número

Género

Edad

9 10 11 12 13 14 15

Femenino Masculino Masculino Masculino Masculino Masculino Masculino

22 31 31 28 31 28 24

Estatura (en cm) 168 161 171 175 187 161 172

Calcule e interprete la moda de la estatura. Solución En este caso, el resultado son dos modas, la primera moda es igual a ………………….. cm. y la segunda moda es igual a ………………………….. cm. Esto significa que………………………………………………………………………………... …………………………………………………………………………………………………....

47

Estadística para Comunicadores

Forma de la distribución de los datos Además de las medidas de tendencia central y dispersión, podemos estar interesados en saber la forma que presenta el conjunto de datos que se está analizando.  Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la media, se dice que la distribución es simétrica.  Si los datos por debajo de la media son más frecuentes que aquellos por encima de la media o viceversa, se dice que la distribución es asimétrica. Relación entre media, mediana y moda Para una distribución unimodal, es decir, que tenga una sola moda, se cumplen de manera general las siguientes relaciones.   

Para una distribución simétrica: Para una distribución asimétrica negativa: Para una distribución asimétrica positiva:

x  Mediana  Moda x  Mediana  Moda x  Mediana  Moda

media = mediana = moda

Simetría o sesgo nulo

media < mediana < moda

Sesgo izquierdo o negativo Datos concentrados en valores altos

media > mediana > moda

Sesgo derecho o positivo Datos concentrados en valores bajos

Estadística para Comunicadores

48

Ejemplo Un estudiante de la carrera de Comunicaciones revisó durante 11 días el ranking del Instituto Peruano de Marketing (IPM) de la industria publicitaria en Internet. A continuación se presenta el listado que elaboró de acuerdo al número de visitas por día a la página web www.netjoven.pe Número de visitas por día a la página web

4000

3200

3600

3500

3000

3250 2900 3400 3450 2800 3200

A partir de las medidas de tendencia central indique la relación y grafique la forma de la distribución del número de visitas. Media Mediana Moda

= = =

3300 3250 3200

Como el valor de la moda = 3200 < mediana = 3250 < media = 3300  la distribución del número de visitas por día es asimétrica positiva.

Sesgo derecho o positivo

Ejercicio Un grupo de alumnos de la facultad de Ciencias de la Comunicación de la carrera de Publicidad se interesó en analizar el tiempo, en segundos, que tardan las personas en recordar al supermercado cuyo eslogan es “Precios más bajos siempre”. Este trabajo se aplicó en el distrito América de la ciudad de Lima, los resultados obtenidos se muestran a continuación. Tiempo 9,00 7,80 10,30 9,20 5,60 7,40 7,30 5,00 12,40 5,10 11,80 3,40 5,10 (en segundos)

Determine la forma de la distribución de los tiempos de recordación del slogan en este distrito Presente la gráfica e interprete en términos del problema.

Estadística para Comunicadores

Medidas de posición: Cuantiles

Cuartil

Decil

Percentil

•Divide el conjunto de datos en cuatro partes iguales. •El cuartil 1, denotado por Q1, es un valor tal que el 25% de los elementos son menores o iguales que este valor. •El cuartil 2, denotado por Q2 es un valor tal que el 50% de los elementos son menores o iguales que este valor. •El cuartil 3, denotado por Q3 es un valor tal que el 75% de los elementos son menores o iguales que este valor.

•Divide al conjunto de datos en diez partes iguales. •El decil 1, representado por D1 es un valor tal que el 10% de los elementos son menores o iguales que este valor. •El decil 2, representado por D2 es un valor tal que el 20% de los elementos son menores o iguales que este valor y •El último decil, el decil 9, representado por D9 es un valor tal que el 90% de los elementos son menores o iguales que este valor.

•Divide al conjunto de datos en cien partes iguales. •El percentil k-ésimo, representado por Pk es un valor tal que el k% de los elementos son menores o iguales al valor del percentil K. •El (100-k)% de los elementos son mayores al valor del percentil K. •Los percentiles: P25, P50, P75 equivalen a los cuartiles Q1, Q2 y Q3 respectivamente y los percentiles: P10, P20,… P90 equivale a los deciles D1, D2,…, D9 respectivamente.

49

50

Estadística para Comunicadores

Fórmula a. Ordene los datos de manera ascendente o descendente. b. Calcule la posición “i” del percentil  k  i n  100 

Donde: k es el percentil y n es la cantidad de observaciones.  Si la posición del percentil es un número entero, el percentil buscado será el promedio de los valores de los datos ubicados en los lugares ‘i’ e ‘i +1’.

Pk 

xi  xi 1 2

 Si la posición del percentil no es un número entero, entonces el valor se redondea por exceso y la posición de éste número entero es el valor del percentil. Pk  xi

Ejemplo A continuación se presentan los sueldos mensuales, en soles, de 12 periodistas. 2710

2755

2850

2880

2880

2890

2920

2940

2950

3050

3130

3325

a. Determine el percentil 25 b. Determine el percentil 85 Solución: observe que los datos ya se encuentran ordenados. a. Determine el percentil 25  25  i 12  3  100 

“i” es un número entero, entonces el percentil buscado será el promedio de los valores de los datos ubicados en los lugares 3 y 4.

 2850  2880  P25     2865 2   Interpretación: El 25% de los periodistas tiene un sueldo máximo de 2865 soles.

51

Estadística para Comunicadores

b. Determine el percentil 85  85  i 12  10,2  100 

Redondeando a más se tiene que i = 11, por tanto su valor será 

P85  3130

Interpretación: El 85% de los periodistas tiene un sueldo máximo de 3130 soles. Ejercicio Una compañía Publicitaria solicitó al área de Recursos Humanos información sobre las ventas (en miles de soles) obtenidas durante el último mes de los 10 nuevos vendedores. Los resultados se muestran a continuación: 1300

1210

950

1200

1910

700

1300

a. Calcule e interprete el valor del cuartil 3, percentil 80 y decil 6.

1020

1500

870

Estadística para Comunicadores

52

b. ¿Cuál debe ser el valor de la venta mínima que debe tener el vendedor nuevo para pertenecer al 15% de los que más venden?

c. ¿Cuál debe ser el valor de la venta máxima de un vendedor nuevo para pertenecer al 15% de los vendedores con las más bajas ventas?

Estadística para Comunicadores

53

Medidas de variabilidad o dispersión Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero no indican qué tan cercanos o alejados están los datos de dicho valor central.

Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que los representa y por lo tanto permiten evaluar la confiabilidad de ese valor central.

Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de la medida central, en cambio si la medida de dispersión tiene un valor grande, los datos no están concentrados alrededor de la medida central.

Las medidas de dispersión son las siguientes:

Varianza  Se define como el promedio de los cuadrados de las desviaciones de los datos respecto de su media aritmética.  La varianza mide el grado de dispersión o variación de los valores de una variable con respecto a su media aritmética.

 Las unidades de la varianza son las unidades originales de los datos al cuadrado. Por ejemplo, si la variable tiene unidades cm. entonces la varianza tendrá como unidades cm2.  Se denota por V(X),  2 (varianza poblacional), s 2 (varianza muestral).

54

Estadística para Comunicadores

Población

Muestra n

N

2 

 ( x  ) i 1

 (x  x )

2

i

i 1

s2 

N

2

i

n 1

Desviación estándar  Es la raíz cuadrada de la varianza.  Las unidades de la desviación estándar son las mismas unidades de la variable. Por ejemplo, si la variable tiene unidades cm. entonces la desviación estándar tendrá como unidades cm.  Se denota por



(desviación estándar poblacional),

s

(desviación estándar muestral).

Características de la varianza y la desviación estándar    

La varianza y la desviación estándar son números reales no negativos. Se pueden calcular para variables medidas en escala de intervalo o razón. Se ven afectadas por valores extremos o atípicos. La varianza es expresada en unidades cuadráticas a las unidades originales de los datos, mientras que la desviación estándar es expresada en las mismas unidades originales de los datos.

Ejemplo Un estudiante de la carrera de Comunicaciones revisó durante once días el ranking del Instituto Peruano de Marketing (IPM) de la industria publicitaria en Internet. A continuación se presenta el listado que elaboró de acuerdo al número de visitas por día a la página web: www.netjoven.pe Número de visitas por día a la página web www.netjoven.pe

4000

3200

3600

3500

3000

3250

2900

3400

3450

2800

3200

Además, la cantidad de visitas a la página web www.mujeractiva.com se presenta a continuación: Número de visitas por día a la página web www.mujeractiva.com

3200

4300

4700

4400

4200

4200

4200

4100

4100

4300

55

Estadística para Comunicadores

Calcule el valor de la desviación estándar de ambas páginas web. Solución Páginas web

Desviación Estándar

www.netjoven.pe

342,78

www.mujeractiva.com

383,12

Ejercicio A continuación se presenta la información de una muestra aleatoria de 15 profesionales egresados de la carrera de Ciencias de la Comunicación. Nº 1 2 3 4 5 6 7 8

Género Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino

Edad 22 21 21 30 26 31 28 35

Estatura 154 156 173 176 188 161 173 187

Nº 9 10 11 12 13 14 15

Género Femenino Femenino Femenino Femenino Femenino Femenino Femenino

Edad 33 34 24 27 18 39 33

Estatura 154 184 170 168 182 172 154

Calcule el valor de la desviación estándar de la edad y de la estatura, en centímetros, para cada género.

56

Estadística para Comunicadores

Coeficiente de variación Las medidas de variación estudiadas son medidas de variación absolutas pues estas se expresan en las mismas unidades que la variable original (excepto la varianza que se expresa en unidades al cuadrado). El coeficiente de variación es una medida de dispersión relativa libre de unidades por lo que es útil para comparar la variabilidad de dos o más grupos de datos expresados en distintas unidades de medida. Población

Muestra

 100% 

CV 

CV 

s 100% x

Características del coeficiente de variación  Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones estándar no es muy útil, por ejemplo, cuando las medias están muy distantes.  El coeficiente de variación se calcula en variables medidas en escala de razón.

Ejemplo Un estudiante de la carrera de Comunicaciones revisó durante 11 días el ranking del Instituto Peruano de Marketing (IPM) de la industria publicitaria en Internet. A continuación se presenta el listado que elaboró de acuerdo al número de visitas por día a la página web www.netjoven.pe Número de visitas por día a la página web www.netjoven.pe

4000

3200

3600

3500

3000

3250 2900 3400 3450 2800 3200

Si decide comparar la cantidad de visitas a la página web www.mujeractiva.com ¿Cuál de las dos páginas web tiene datos más homogéneos? Justifique numéricamente. Número de visitas por día a la página web www.mujeractiva.com

3200

4300

4700

4400

4200

4200

4200

4100

4100

4300

Solución Páginas web

Promedio

Desviación Estándar

Coeficiente de variación

www.netjoven.pe

3300

342,78

10,39%

www.mujeractiva.com

4170

383,12

9,19%

57

Estadística para Comunicadores

Los datos más homogéneos, en cuanto al número de visitas por día, se encuentra en la página web www.mujeractiva.com, por tener menor valor de coeficiente de variabilidad. Ejercicio A continuación se presenta la información de una muestra aleatoria de 15 profesionales egresados de la carrera de Ciencias de la Comunicación. Nº 1 2 3 4 5 6 7 8

Género Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino

Edad 22 21 21 30 26 31 28 35

Estatura 154 156 173 176 188 161 173 187

Nº 9 10 11 12 13 14 15

Género Femenino Femenino Femenino Femenino Femenino Femenino Femenino

Edad 33 34 24 27 18 39 33

Estatura 154 184 170 168 182 172 154

a. ¿Qué género presenta mayor variabilidad en la estatura? Justifique numéricamente. Género

Promedio

Desviación Estándar

Coeficiente de variación

Masculino Femenino Por lo tanto, el género que presenta mayor variabilidad es…………………………..….. porque ……………………………………………………………………………………………………. b. ¿Qué género presenta menor dispersión en la edad? Justifique numéricamente. Género

Promedio

Desviación Estándar

Coeficiente de variación

Masculino Femenino Por lo tanto, el género que presenta menor dispersión es…………………………..….. porque …………………………………………………………………………………………………….

58

Estadística para Comunicadores

Rango El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre dato mayor (Xmax) y el dato menor (Xmin) R = Xmáx - Xmín

Características del rango  Se puede calcular en variables medidas en escala de intervalo o razón  Se ve muy afectado por valores extremos.

Ejemplo Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las respuestas mostradas a continuación: 2

1

2

4

1

3

2

3

2

0

5

1

Calcule e interprete el valor del rango. Solución El rango R = máximo – mínimo = 5 - 0 = 5 La dispersión para el número de hijos por familia es de cinco hijos.

Rango intercuartil (RIC) Es la diferencia entre el tercer y primer cuartil. Es el rango del 50% central de los datos. El rango intercuartil elimina la influencia de los valores extremos. Rango intercuartil = RIC = Q3 – Q1= P75 – P25

59

Estadística para Comunicadores

Características del rango intercuartilico  Se puede calcular en variables medidas en escala de intervalo o razón  No se ve afectado por valores extremos. Ejemplo Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las respuestas mostradas a continuación: 2

1

2

4

1

3

2

3

2

0

5

1

Calcule e interprete el valor del rango intercuartil. Solución Percentiles P75 P25

Valor 3 1

Por lo tanto el valor del RIC = 3 – 1 = 2 hijos Interpretación: La dispersión en el 50% central del número de hijos por familia es igual a 2. Ejercicio A continuación se presentan los costos de producción por segundo de animación en 2D (en dólares) del último trabajo encargado a una empresa nacional. Los datos obtenidos de una muestra de comerciales de TV y otra de películas se muestran a continuación: Comerciales de TV Películas

28 34

25 33

30 32

21 29

27 36

22 37

23 35

29 34

26 31

24

¿Son los costos de producción por segundo de animación en 2D, en las películas, más homogéneos en el 50% central que en los comerciales de TV? Solución Comerciales de TV

Películas

P75 P25 RIC luego el valor del rango intercuartil es …………………………….………… Esto significa que …………………………………………………………………………………………………..

60

Estadística para Comunicadores

Ejercicios de Aplicación 1. A continuación se presentan los costos de producción (en dólares) por segundo de animación en 2D del último trabajo encargado a una empresa nacional. Los datos obtenidos de una muestra de comerciales de TV y otra de películas se muestran a continuación: Comerciales de TV Películas

28 34

25 33

30 32

21 29

27 36

22 37

23 35

29 34

26 31

24

¿Son los costos de producción por segundo de animación más homogéneos en los comerciales de TV que en las películas? 2. Los siguientes datos representan resúmenes del puntaje asignado a dos comerciales del mismo producto. comercial 1 me  4 n 1  10 x1  5

mo  3

n 2  15

s 1

x1  3

comercial 2 me  4 mo  5

s  1,6

Identifique verdadero (V) o falso (F) según corresponda, de ser falso indique dónde está el error. a. ¿La forma de la distribución del comercial 2 es asimétrica negativa? b. Sí la forma de la distribución de uno de los comerciales es asimétrica negativa, entonces quiere decir que existe mayor concentración de datos con valores bajos. c. La medida de tendencia central más representativa en el comercial 1 es la mediana. d. El puntaje recibido en el comercial 2 es menos disperso que el comercial 1. 3. Un grupo de alumnos de Publicidad se interesó en analizar el tiempo (en segundos) que tardan las personas en recordar al supermercado cuyo eslogan es “Precios más bajos siempre”. Este trabajo se aplicó a tres distritos de la ciudad de Lima, los resultados obtenidos se muestran a continuación: Distrito América 9,00 7,80 10,30 9,20 5,60 7,40 7,30 5,00 12,40 5,10 11,80 3,40 5,10 Medida de Resumen

Distrito Esperanza

Distrito Central

Media

4,252

5,338

Mediana

4,960

4,850

Moda

5,100

3,860

Desviación estándar

2,979

2,593

Tamaño de muestra

17

16

61

Estadística para Comunicadores

a. Interprete las medidas de tendencia central del tiempo de recordación del slogan en el distrito Esperanza. b. ¿Qué distrito presenta mayor variabilidad en los tiempos de recordación? Justifique su respuesta. c. Calcule e interprete el valor del tercer cuartil para el tiempo de recordación del slogan en el distrito América. d. ¿Cuál es el tiempo máximo que tardó el 22% de las personas que recordaron más rápidamente el slogan en el distrito América? e. Calcule e indique la forma de la distribución de los tiempos de recordación del slogan en el distrito Central. 4. A continuación se muestran los resultados obtenidos del número de notas publicadas por un grupo de periodistas de 3 diarios locales durante el último mes: Siglo XXI Media Mediana Moda Varianza

Actualidad 9,5 10,3 12 76,110

Tamaño de muestra P20 P80 Publis

Media Mediana Moda Varianza

10 7,6 12 12 14

13,3 12 10 21,952

Tamaño de muestra P75 P25 9 7

8 10

11 10

10 6

15 16,5 10 16 13

a. ¿Cuál es la distribución del número de notas publicadas por los periodistas del diario Actualidad? b. ¿En cuál de los diarios locales el número de notas publicadas es más homogénea? Justifique numéricamente su respuesta. c. ¿Cuál debe ser el mínimo número de notas publicadas por los periodistas del diario Siglo 21 para pertenecer al 20% de periodistas que más artículos escribe y cuál el máximo número de notas que debe publicar un periodista del diario Publis para pertenecer al 25% de periodistas con menos notas publicadas? 5. Un joven egresado de la carrera de Ciencias de la Comunicación tiene la invitación laboral de dos prestigiosas agencias publicitarias internacionales. La primera de ellas ofrece sueldos en dólares y la segunda en euros. Para tomar la decisión de a cuál de ellas aceptar la invitación recopila datos correspondientes a los sueldos mensuales pagados en cada una de ellas, los mismos que se presentan en la siguiente tabla:

62

Estadística para Comunicadores

Agencia A

Agencia B

1295,75

1148,80

Mediana

1241

1180

Moda

1230

1400

Desviación estándar

436,57

343,52

Tamaño de muestra

20

15

Media

En base a la información anterior, responda las siguientes preguntas: a. Defina la variable en estudio, determine su tipo y escala de medición. b. En la Agencia A ¿qué sueldo es el más frecuente? c. ¿Cuánto gana como mínimo el 50% de los empleados con los mejores sueldos de la Agencia B? d. Si se recomienda aceptar la invitación de aquella agencia con sueldos más estables, esto es con menos riesgos de variación, ¿qué agencia considera usted que conviene elegir? Justifique numéricamente su respuesta.

63

Estadística para Comunicadores

Autoevaluación

La siguiente información corresponde al tiempo de servicio (en meses) de una muestra de publicistas que laboran en dos conocidas agencias de la capital. Agencia Omega Media Mediana Moda Desviación estándar Tamaño de muestra

Agencia Sigma 18,93 14 6 15,78 16

Media Mediana Moda Varianza Tamaño de muestra

19,64 15 11 94,284 25

a. Interprete las medidas de tendencia central de la Agencia Omega.

b. ¿Qué forma presenta la distribución del tiempo de servicio de los publicistas de la agencia Sigma?

c. ¿En cuál de las agencias publicitarias el tiempo de servicio (en meses) es más homogéneo? Justifique su respuesta.

Estadística para Comunicadores

Tabulaciones cruzadas  También llamadas tablas de contingencia o de doble entrada.  Se usan para resumir de manera simultánea los datos para dos variables.

Ejemplo Se tiene información de una muestra de 805 hogares según nivel socioeconómico y área de residencia. Los resultados se presentan a continuación: Distribución de hogares según nivel socioeconómico y área de residencia Área de residencia Nivel socioeconómico Total Área Urbana Área Rural NSE A 15 2 17 NSE B 48 3 51 NSE C 105 145 250 NSE D 94 175 269 NSE E 38 180 218 Total 300 505 805

De la tabla anterior, complete los espacios en blanco: a. b. c. d.

Número de hogares que pertenecen al NSE C o D: ____________ Son _______________ hogares que pertenecen al NSE C y son del área urbana. Del total de hogares del área rural, el ___________% son del NSE E. Del total de hogares del NSE D, el ____________% son del área urbana

Solución a. b. c. d.

Número de hogares que pertenecen al NSE C o D: ___519___ Son __105___ hogares que pertenecen al NSE C y son del área urbana. Del total de hogares del área rural, el ___35,64___% son del NSE E. Del total de hogares del NSE D, el ___34,94___% son del área urbana

64

Estadística para Comunicadores

65

Ejercicios 1. Los directivos de la agencia publicitaria TresPicos quieren implementar un programa de motivación para sus trabajadores. Para ello, se solicitó a cada trabajador realizar primero una autoevaluación (calificación a sí mismo) de su nivel de desempeño profesional en lo que va del año. Los resultados obtenidos de una muestra de 120 trabajadores clasificados de acuerdo a su cargo se presentan a continuación: Distribución de trabajadores según su cargo y nivel de desempeño profesional Nivel de desempeño profesional Cargo Total Excelente Bueno Regular Deficiente Gerente 0 3 2 0 5 2 2 5 1 Director de medios 10 Planificador 3 6 8 2 19 Jefe de medios 4 15 12 0 31 Redactor 8 29 14 4 55 17 55 41 7 120 Total Fuente: Agencia TresPicos

Complete los espacios en blanco: a. La cantidad de trabajadores que ocupan los cargos de redactores y jefes de medios es ………………………………………… b. La cantidad de trabajadores que calificaron su desempeño profesional como mínimo “bueno” es …………………………………………………… c. Del total de trabajadores, el …………….. % son redactores. d. Del total de jefe de medios, el …………… % calificaron su desempeño profesional como “bueno”. e. Del total que calificaron su desempeño profesional como regular, el ………………% son gerentes.

66

Estadística para Comunicadores

2. En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se preguntó a todos los peruanos la religión que profesa, obteniéndose los siguientes resultados

Sexo Hombre Mujer Total

Distribución de peruanos según sexo y religión que profesa Religión que profesa Católica Cristiana - Evangélica Otra Ninguna 8 379 120 1 200 953 324 445 374 024 8 577 602 1 405 102 354 846 234 410 16 956 722 2 606 055 679 291 608 434

Total 10 278 542 10 571 960 20 850 502

Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda

Complete los espacios en blanco. a. b. c. d. e.

El número de cristianos evangélicos en el Perú es ………………… El número de peruanos que profesa una religión distinta a la católica es ………………… El ………….…….% de los hombres peruanos profesa la religión católica. El ………………..% de las peruanas no son cristianas-evangélicas ni católicas. El ………………..% ………………………………………………………………………...

67

Estadística para Comunicadores

Gráfico de barras comparativas Presente las tablas relativas con la información de la tabla de doble entrada de frecuencia absoluta. Distribución de trabajadores según su función y relación con la gerencia Relación con la gerencia Función Total general Buenas Regulares Malas 18 2 20 Apoyo/adm. 10 29 20 59 Obrero 11 6 17 Profesional 19 7 26 Técnico/ventas 58 44 20 122 Total general Las tablas de frecuencias relativas y sus respectivos gráficos se muestran a continuación:

Con respecto al gran total Distribución de trabajadores según su función y relación con la gerencia Relación con la gerencia Función Total general Buenas Regulares Malas 14.75% 1.64% 0.00% 16.39% Apoyo/adm. 8.20% 23.77% 16.39% 48.36% Obrero 9.02% 4.92% 0.00% 13.93% Profesional 15.57% 5.74% 0.00% 21.31% Técnico/ventas 47.54% 36.07% 16.39% 100.00% Total general Distribución de trabajadores según su función y relación con la gerencia 24%

Porcentaje de trabajadores

25%

Buenas Regulares

20% 15%

16%

15%

10% 5%

Malas

16%

9%

8%

5%

6%

Profesional

Técnico/ventas

2%

0% Apoyo/adm.

Obrero Función

68

Estadística para Comunicadores

Interpretación  Del total de trabajadores, el 16,4% son de Apoyo/adm.  Del total de trabajadores, el 47,5% manifestaron tener una buena relación con la gerencia.  Del total de trabajadores, el 23,8% son obreros y manifestaron tener una regular relación con la gerencia.

Con respecto al total de columnas Distribución de trabajadores según su función por tipo de relación con la gerencia Relación con la gerencia Función Buenas Regulares Malas 31.03% 4.55% 0.00% Apoyo/adm. 17.24% 65.91% 100.00% Obrero 18.97% 13.64% 0.00% Profesional 32.76% 15.91% 0.00% Técnico/ventas 100% 100% 100% Total general

Distribución de trabajadores según su función por tipo de relación con la gerencia 100%

100%

Apoyo/adm.

Porcentaje de trabajadores

90%

Obrero

80%

Profesional

66%

70%

Técnico/ventas

60% 50% 40% 30% 20%

33%

31% 17% 19%

14%

16%

5%

10% 0%

Buenas

Regulares Relación con la gerencia

Malas

Interpretación  Del total de trabajadores que tienen una buena relación con la gerencia, el 31% son de Apoyo/adm.  Del total de trabajadores que tienen una mala relación con la gerencia, el 100% son obreros.

69

Estadística para Comunicadores

Con respecto al total de filas Distribución de trabajadores según relación con la gerencia por función Relación con la gerencia Función Total general Buenas Regulares Malas 90.00% 10.00% 0.00% 100.00% Apoyo/adm. 16.95% 49.15% 33.90% 100.00% Obrero 64.71% 35.29% 0.00% 100.00% Profesional 73.08% 26.92% 0.00% 100.00% Técnico/ventas

Distribución de trabajadores según su relación con la gerencia por función Buenas

100%

Porcentaje de trabajadores

90%

Regulares

90%

Malas

80%

73% 65%

70% 60%

49%

50% 40%

34%

35% 27%

30% 20% 10%

17% 10%

0%

Apoyo/adm.

Obrero

Profesional

Técnico/ventas

Función

Interpretación  Del total de trabajadores de Apoyo/adm., el 90% tiene una buena relación con la gerencia.  Del total de obreros, el 17% tiene una buena relación con la gerencia.

70

Estadística para Comunicadores

Gráfico de barras apiladas Los datos también pueden ser representados en barras apiladas de porcentajes donde la cantidad para cada valor de la variable elegida para el eje horizontal representa el total parcial (o el 100%) y las cantidades (o los porcentajes) de la segunda variable van a dar lugar a dicha cantidad (o el 100%). Ejemplo Un productor musical ha entrevistado a 425 personas haciéndolas oír una canción y pidiéndoles que la identifiquen. Después de procesar la información en SPSS obtuvo la siguiente tabla: Distribución de individuos por género musical y grado identificación del candidato. Tabla de contingencia Identifi ca al candi dato *de Género musical Identif ica al candidat o

Plenamente

Medianamente

No ident if ica

Total

Recuent o % de I dent if ica al candidat o % de Género musical % del total Recuent o % de I dent if ica al candidat o % de Género musical % del total Recuent o % de I dent if ica al candidat o % de Género musical % del total Recuent o % de I dent if ica al candidat o % de Género musical % del total

Género musical Reggaet on Vals Cumbia 149 97 55

Total 301

49.5%

32.2%

18.3%

100.0%

84.2% 35.1% 12

63.0% 22.8% 30

58.5% 12.9% 35

70.8% 70.8% 77

15.6%

39.0%

45.5%

100.0%

6.8% 2.8% 16

19.5% 7.1% 27

37.2% 8.2% 4

18.1% 18.1% 47

34.0%

57.4%

8.5%

100.0%

9.0% 3.8% 177

17.5% 6.4% 154

4.3% .9% 94

11.1% 11.1% 425

41.6%

36.2%

22.1%

100.0%

100.0% 41.6%

100.0% 36.2%

100.0% 22.1%

100.0% 100.0%

Para realizar el gráfico de barra apilada considerando el gran total 100%. Distribución de individuos según género musical y grado de identificación del candidato Género musical Plenamente Medianamente No identifica Total preferido Reggaeton 35% 3% 4% 42% Vals 23% 7% 6% 36% Cumbia 13% 8% 1% 22% Total 71% 18% 11% 100%

71

Estadística para Comunicadores

Porcentaje de encuestados

Distribución de individuos según género musical y grado de identificación del candidato 45% 40% 35% 30% 25% 20% 15% 10% 5% 0%

4% 3%

6%

7% 1% 8%

35% 23%

13% Reggaeton Plenamente

Vals

Cumbia

Género musical Medianamente No identifica

Gráfico de barras apiladas al 100% Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada categoría. El alto de cada barra es el mismo para cada categoría. Para realizar un gráfico apilado al 100% con respecto a género musical preferido (fila). Distribución de individuos según identificación del candidato por género musical Género musical Plenamente Medianamente No identifica Total preferido Reggaeton 84% 7% 9% 100% Vals 63% 19% 18% 100% Cumbia 59% 37% 4% 100%

Porcentaje de encuestados

Distribución de individuos según identificación del candidato por género musical 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%

9% 7%

4%

18%

37%

19%

84%

Reggaeton

63%

59%

Vals

Cumbia

Génro musical Plenamente

Medianamente

No identifica

72

Estadística para Comunicadores

Ejercicios 1. Se tiene información de una muestra de 805 hogares según nivel socioeconómico y área de residencia. Los resultados se presentan a continuación: Nivel socioeconómico NSE A NSE B NSE C NSE D NSE E Total

Área de residencia Área Área Rural Urbana 15 2 48 3 105 145 94 175 38 180 300 505

a. ¿Cuál es el título que llevaría la tabla anterior?

Título

b. Coloque título a los siguientes gráficos:

Total 17 51 250 269 218 805

73

Estadística para Comunicadores

2. La siguiente tabla fue elaborada el Instituto Peruano de Marketing (IPM) y muestra al grupo de profesionales de Ciencias de la Comunicación del semanario “Ultima Hora”. La clasificación se realizó de acuerdo a la categoría laboral y nivel salarial. Nivel salarial Categoría Laboral

Bajo

Medio

Alto

Total

Jefe de sección

46

54

57

157

Redactor

61

60

23

144

Colaborador

73

47

29

149

180

161

109

450

Total

a. ¿Cuál es el título que llevaría la tabla anterior?

Título

b. Interprete el valor de la celda sombreada . Valor 23 con respecto al total de fila

74

Estadística para Comunicadores

Valor 23 con respecto al total de columna

Valor 23 con respecto al gran total

c. Presente la tabla apropiada para elaborar el siguiente gráfico: “Distribución porcentual de profesionales según nivel salarial por categoría laboral”. Nivel salarial Categoría Laboral

Bajo

Jefe de sección Redactor Colaborador Total

d. Elabores el gráfico para la tabla anterior.

Medio

Alto

Total

75

Estadística para Comunicadores

3. Un ejecutivo de medios está interesado en conocer qué medio de comunicación es más eficiente evaluando el éxito o fracaso de los reportes periodísticos difundidos. La siguiente tabla resume la información: Medio de Comunicación Prensa Radio Televisión Total

El reporte tuvo éxito Si No 67 15 12 19 67 28 146 62

Total 82 31 95 208

a. Presente la tabla relativa para elaborar un gráfico de barras comparativas al 100%. Coloque título a la tabla. Título: Medio de Comunicación Prensa Radio Televisión Total

El reporte tuvo éxito Si No

b. Elabore el gráfico para la tabla anterior.

Total

76

Estadística para Comunicadores

Autoevaluación La actividad de la animación es la menos arraigada del sector de la producción de entretenimiento. Por ser transferible culturalmente, es posible tomar contratos desde cualquier parte del mundo. Bajo este contexto un equipo de jóvenes profesionales está decidido en enrumbar en la producción de la animación en 2D y 3D. Sabiendo que el negocio es de escala internacional, uno de los miembros de este equipo propuso realizar un pequeño estudio sobre el comportamiento del mercado y la competencia al cual se enfrentarían. La siguiente tabla resume la información presentada en el reporte final donde se muestra la especialización de un total de 242 producciones y la región de origen: Región Norteamérica Europa Asia Total

Películas y TV 80 10 12 102

Juegos en computadora 27 25 23 75

Otros 10 18 37 65

Total 117 53 72 242

Complete:  De las producciones que proceden de Asia, las que son especializadas en juegos de computadoras representan el: __________________%.  Coloque el título para el siguiente gráfico que fue presentado en el reporte final.

Estadística para Comunicadores

Unidad 2 Muestreo

Logro: Al término de la Unidad 2, el estudiante selecciona una muestra representativa de la población para el cálculo de los estadísticos, teniendo en cuenta el tipo de muestreo.

Temas de la unidad:   



Conceptos y definiciones básicas: población y muestra. Diseño de la encuesta por muestreo. Elaboración de cuestionario. Tipos de muestreo: Muestreo probabilístico: muestreo aleatorio simple, muestreo estratificado y muestreo sistemático Selección de una muestra irrestricta aleatoria.

77

Estadística para Comunicadores

Unidad 2. Muestreo

Unidad Elemental

Población muestreada

Unidad de muestreo

Marco

muestral

•Es el objeto sobre el cual se hace la medición. •También llamada unidad de observación, unidad de análiisis, unidad estadística o elemento. Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemental es cada individuo.

•Es el conjunto de todas las unidades elementales posibles que podrían extraerse en una muestra; es decir, es la población de donde se extrae la muestra.

•Es la unidad donde realizamos la muestra. •Por ejemplo, si queremos estudiar a las personas pero no tenemos la lista de todos los individuos que pertenecen a la población objetivo, la unidad de muestreo sería cada familia y la unidad elemental sería cada individuo que vive en la familia

•Es una lista de las unidades de muestreo que estan disponibles para elección.

78

Estadística para Comunicadores

79

Ejemplo Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números telefónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de todas las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas las áreas que contienen granjas.

Censo Es una investigación estadística que consiste en el recuento de la totalidad de los elementos que componen la población por investigar. Es necesario que se especifique el espacio y el tiempo al que se refiere el recuento.

Muestreo Cuando se opta por una investigación usando una muestra en vez de la población, el estudio estadístico comprende por lo menos cuatro etapas:    

Definición de la población objetivo y búsqueda del marco muestral. Determinación del tamaño de la muestra. Selección de las unidades. Registro de las observaciones.

En el curso trabajaremos las dos últimas.  

La selección de las unidades y El registro de las observaciones.

80

Estadística para Comunicadores

Ejemplo Niveles socioeconómicos en Lima Metropolitana y Callao Asociación Peruana de Empresas de Investigación de Mercados (APEIM) Miraflores, Abril de 2005 Ficha técnica Universo de estudio Se consideró como universo de estudio a todos los hogares pertenecientes a Lima Metropolitana entendida como los distritos de Lima ubicados en el núcleo urbano (sin considerar balnearios) y la Provincia Constitucional del Callao. Se definió como hogar, al conjunto de personas que, habitando en la misma vivienda, preparan y consumen sus alimentos en común. La persona informante fue el jefe de familia, definido como aquella persona que más aporta económicamente en el hogar. Marco muestral Para el desarrollo de la investigación se consideró como marco muestral:  La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).  Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de mayor crecimiento de la ciudad (conos) Tamaño de la muestra Se entrevistó a un total de 3.598 hogares distribuidos en 41 distritos. El margen de error máximo probable con un nivel de confianza del 95.1 % y considerando el máximo de dispersión (p = q = 50%) fue de ± 1.63%. Dentro de esta muestra se realizaron 200 entrevistas en Distritos con predominio de los N.S.E. Muy Alto/Alto con el propósito de obtener una submuestra estadísticamente significativa para este segmento. El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada uno de los distritos de Lima Metropolitana. Selección de la muestra Determinada la cantidad de entrevistas a aplicar por distrito, se procedió a sortear tantas manzanas como entrevistas se requerían. Dentro de cada manzana se seleccionó por un sistema aleatorio simple cinco viviendas: una titular y cuatro reemplazos o suplentes. Los hogares originalmente seleccionados (titulares), fueron visitados hasta en tres oportunidades antes de proceder al reemplazo. Se controló que la tasa de reemplazo no excediera el 10% del total de entrevistas originalmente sorteadas.

Elección de la muestra Se seleccionará los elementos del marco de muestreo que conformarán la muestra aplicando la técnica de muestreo apropiada para el estudio que se desea llevar a cabo.

Estadística para Comunicadores

81

Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño “n” tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos: muestreo simple aleatorio, muestreo sistemático y muestreo estratificado.

Muestreo aleatorio simple Es el procedimiento por el cual se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de muestreo de una población que contiene un total de N unidades. Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida. Pasos a seguir para seleccionar una muestra simple aleatoria 1. Enumere las unidades del marco muestral con números sucesivos. 2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra, usando una tabla de números aleatorios. 3. La selección de las unidades se realiza sin reemplazo.

El muestreo aleatorio simple presenta dos propiedades:  Equiprobable: Cada unidad tiene las mismas posibilidades de ser elegida.  Independencia: La selección de una unidad no influye en la selección de otras unidades. Pero en el mundo real es difícil encontrar muestras completamente independientes y representativas. Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y cuenta varias veces a los que tienen varios números.

82

Estadística para Comunicadores

Ejercicio 1. Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla que se muestra a continuación información acerca de las variables: ingreso mensual (en soles) y años cumplidos en la empresa. Trabajadores registrados Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42

Ingreso (en soles) 2300 2800 2400 2500 2300 2100 1700 2000 2200 2100 1700 2500 2800 2400 1700 2400 2200 2200 2300 2800 2100 1700 2500 2400 2700 1700 1600 2600 2500 2500 2700 1700 1600 2400 1900 1800 1800 2400 2600 2700 2100 2300

Años en la empresa 5 11 4 2 3 2 2 0 7 4 0 2 13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13 16 17 1 1 11 3 5 3 14 16 18 11 14

Nº 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92

Ingreso (en soles) 2100 2100 1800 2000 2100 1900 2000 2300 2000 1700 1900 2000 2400 1700 1700 2400 2500 2600 2100 1900 2000 1800 2100 2300 2700 2800 1800 1700 1700 1700 1700 2100 2600 2400 2600 1900 1600 1900 2100 1700 2100 1700

Años en la empresa 13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13 16 14 7 9 7 10 12 20 20 3 5 4 0 1 6 17 9 19 7 0 3 14 0 15 1

Nº 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142

Ingreso (en soles) 2400 1700 2500 1700 2400 2400 1900 1700 2100 2000 2000 2500 1700 2500 1700 2600 1600 1800 2100 1700 2400 2600 2100 2100 2400 1700 2600 2400 2700 2100 1600 2100 1900 2100 2200 2400 1800 2600 2700 2500 2500 1900

Años en la empresa 16 0 12 3 17 16 7 1 6 5 3 13 0 19 3 19 1 6 10 0 16 17 10 8 17 1 20 16 17 12 0 15 5 12 12 13 4 17 20 16 16 6

83

Estadística para Comunicadores

43 44 45 46 47 48 49 50

1700 2200 2900 1800 2100 2000 2000 2900

0 13 20 5 16 12 12 20

93 94 95 96 97 98 99 100

2300 2500 2600 1900 2500 1800 1700 2000

14 16 18 3 19 6 2 10

143 144 145 146 147 148 149 150

2100 1700 1500 1800 2100 2700 1800 2100

15 9 0 18 10 19 9 15

a. Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Elabore un listado con el número seleccionado y el valor del ingreso mensual y años en la empresa. Use las columnas C4, C8, C11 y C15 de la tabla de números aleatorios. b. Con la muestra obtenida estime e interprete las medidas de tendencia central para la variable ingreso mensual. c. Con la muestra obtenida estime e interprete los cuartiles para la variable años en la empresa. Solución Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra. Como el marco muestral tiene ………. elementos usaremos las columnas ………………………. para elegir números de ………. cifras. a. Elabore un listado con el número seleccionado y el valor del ingreso mensual y años en la empresa: Posición

Ingreso mensual (en soles)

Años en la empresa

Estadística para Comunicadores

84

b. Con la muestra obtenida estime e interprete las medidas de tendencia central para la variable ingreso mensual.

c. Con la muestra obtenida estime e interprete los cuartiles para la variable años en la empresa.

85

Estadística para Comunicadores

TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 4 8 2 4 6 6 3 5 4 5 6 0 5 2 9 2 9 8 1 4 4 1 9 8 5 1 1 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 9 6 0 8 3 5 6 6 6 4 0 8 6 3 1 6 4 1 6 5 2 7 7 2 9 9 9 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 6 1 2 9 5 0 4 0 9 8 2 0 2 6 1 3 1 8 9 9 0 1 2 6 3 7 1 9 4 5 8 1 1 4 5 6 7 9 9 9 2 1 0 0 3 6 9 6 5 0 6 4 7 9 8 1 7 2 4 5 4 1 2 4 4 6 9 2 6 6 4 9 3 4 4 2 4 5 9 0 8 7 4 8 6 1 2 8 1 3 3 2 0 2 6 0 7 2 9 3 4 0 8 1 3 3 7 3 2 4 8 6 1 8 7 1 3 4 3 9 3 1 7 8 3 7 0 2 1 4 7 5 7 3 1 1 9 3 3 8 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 5 9 9 8 4 4 5 9 1 5 4 7 3 0 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 5 3 8 0 4 3 9 4 6 0 8 8 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 6 9 5 9 4 9 1 8 2 0 2 5 3 9 7 4 9 1 4 8 8 6 6 8 5 9 4 8 3 8 1 2 2 4 0 1 4 5 7 7 4 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 4 8 1 5 8 5 5 1 4 9 6 4 4 4 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 5 5 8 8 4 3 4 8 9 0 6 7 6 9 2 0 9 8 2 8 3 4 3 2 8 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 3 3 2 5 6 7 6 1 6 6 1 7 6 5 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 7 5 4 0 9 5 7 8 7 5 0 8 6 2 7 1 7 8 8 3 8 6 9 9 2 7 4 6 0 9 2 6 1 5 1 2 3 1 8 1 2 3 3 6 3 4 9 6 4 4 9 8 5 7 3 0 1 9 7 9 7 9 4 4 1 6 6 7 7 4 7 1 5 3 7 0 9 2 5 2 1 0 0 7 8 9 9 6 8 5 6 8 1 9 2 7 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 2 6 6 4 1 4 8 1 0 6 0 1 3 4 5 1 9 0 3 9 1 6 1 7 8 8 2 8 9 0 5 8 4 9 2 2 3 9 8 5 9 5 8 6 1 9 2 5 0 0 7 9 0 0 7 4 1 9 1 0 9 7 5 1 2 7 1 9 4 8 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 6 9 9 8 0 8 1 8 2 6 6 8 4 3 1 6 1 0 5 7 5 7 0 6 3 0 4

C15 C16 6 9 7 9 6 0 4 8 7 4 7 0 8 7 6 1 3 2 2 4 6 5 4 2 7 9 7 9 3 3 7 4 9 3 3 4 6 8 0 6 8 7 5 9 1 2 5 7 4 8 2 7 7 4 4 7 6 3 0 0 8 7 4 1 8 1 1 8 6 2 5 9 0 8 3 4 0 7 4 0 1 7 8 1 0 9 0 7 7 8 5 4 4 8 8 0 0 7 1 4

C17 C18 C19 8 0 0 8 5 9 7 5 6 1 8 5 1 5 4 1 5 8 0 1 9 7 9 9 3 7 7 4 8 3 2 0 0 1 2 5 1 4 6 0 6 2 0 8 3 8 0 2 6 8 6 6 9 8 1 6 8 0 3 2 1 2 2 9 0 6 0 3 0 7 9 6 9 4 7 8 7 3 5 7 5 6 7 2 4 1 2 8 6 8 9 4 9 1 3 1 6 2 2 6 1 4 5 3 2 5 6 6 6 4 4 2 3 2 9 8 6 4 6 8 0 1 5 7 6 4 1 2 8 8 4 8 4 9 9 8 6 2 9 6 6 2 6 6 8 2 5 0 3 0

C20 9 0 4 4 9 7 7 8 9 6 4 4 5 8 5 5 0 1 1 8 3 8 8 7 0 6 0 8 8 4 4 3 7 4 3 6 0 8 8 8 5 6 6 0 4 3 9 3 1 8

86

Estadística para Comunicadores

2. El director de una revista tiene información de todo su personal y desea obtener una muestra aleatoria de trabajadores. El registro se muestra a continuación: Trabajadores registrados N° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

Tiempo de servicio Edad 73 23 96 46 110 67 105 60 91 43 90 36 129 46 129 46 91 43 96 46 110 67 129 46 100 35 99 49 113 55 101 39 86 45 104 42 126 57 98 30 126 58 98 30 101 39 86 40 104 42 99 49 113 55 98 30 126 57 98 31 104 53 104 53 81 29 124 56 91 43 106 45 106 45 91 43 104 63 104 53

N° 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80

Tiempo de servicio Edad 106 45 99 49 94 35 98 30 98 30 99 49 98 30 98 30 73 23 73 23 95 33 95 33 96 46 96 46 110 67 124 56 90 36 90 36 101 35 101 35 124 56 95 33 95 33 96 42 96 46 110 67 124 56 99 49 131 32 131 333 113 55 94 35 93 42 91 47 91 47 86 41 93 42 91 47 91 47 86 45

N° 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120

Tiempo de servicio Edad 99 49 131 32 131 32 93 42 104 53 81 29 124 56 98 56 98 56 106 45 129 46 106 45 129 46 124 56 98 56 98 56 104 53 106 45 129 46 124 56 98 56 117 30 99 49 104 33 94 35 101 39 123 44 98 30 88 60 123 40 98 30 88 59 101 39 117 30 90 36 98 30 88 59 123 40 98 30 88 59

87

Estadística para Comunicadores

a. TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4

C17 C18 C19 8 0 0 8 5 9 7 5 6 1 8 5 1 5 4 1 5 8 0 1 9 7 9 9 3 7 7 4 8 3 2 0 0 1 2 5 1 4 6 0 6 2 0 8 3 8 0 2 6 8 6 6 9 8 1 6 8 0 3 2 1 2 2 9 0 6 0 3 0 7 9 6 9 4 7 8 7 3 5 7 5 6 7 2 4 1 2 8 6 8 9 4 9 1 3 1 6 2 2 6 1 4 5 3 2 5 6 6 6 4 4 2 3 2 9 8 6 4 6 8 0 1 5 7 6 4 1 2 8 8 4 8 4 9 9 8 6 2 9 6 6 2 6 6 8 2 5 0 3 0

C20 9 0 4 4 9 7 7 8 9 6 4 4 5 8 5 5 0 1 1 8 3 8 8 7 0 6 0 8 8 4 4 3 7 4 3 6 0 8 8 8 5 6 6 0 4 3 9 3 1 8

88

Estadística para Comunicadores

a. Para seleccionar una muestra de 12 trabajadores aplique el muestreo simple aleatorio. Elabore un listado con el número seleccionado y el valor de su tiempo de servicio y edad. Utilice para la selección las columnas: C9; C2; C10; C15 y C1 de la tabla de números aleatorios. b. Con la muestra seleccionada, calcule el tiempo promedio de servicio y el porcentaje de trabajadores mayores de 40 años. Solución Como el marco muestral tiene ………. elementos o unidades elementales, usaremos las columnas ……………………. para elegir números de ………. cifras. a. Elabore un listado con el número seleccionado y el valor de su tiempo de servicio y lugar de procedencia. Posición

Tiempo de servicio

Edad

b. Con la muestra seleccionada, calcule el tiempo promedio de servicio y el porcentaje de trabajadores cuyo lugar de procedencia es el distrito de Villa el Salvador.

Estadística para Comunicadores

89

Muestreo estratificado Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de sus elementos. El objetivo del diseño estratificado es dar un tratamiento especial a cada estrato, ya sea por razones administrativas, de costo, logísticas o minimizar variabilidad. La característica del estrato es que dentro del él los datos son homogéneos pero heterogéneos entre si. Pasos a seguir para seleccionar una muestra estratificada 1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a todos los elementos de la población y que cada elemento pertenezca solamente a un estrato. 2. Una vez conocido el tamaño de muestra a seleccionar, calcule la cantidad de elementos a seleccionar en cada estrato de manera proporcional al tamaño de cada estrato. El tamaño de muestra para cada estrato se obtiene mediante la siguiente fórmula: nh 

Nh n N

3. Seleccione muestras aleatorias simples para cada uno de los estratos.

Recomendaciones para el uso de muestras estratificadas    

Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén relacionadas entre sí. No se deben considerar la formación de muchos estratos, generalmente se usan entre tres y ocho estratos. Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto pueden no ser considerados. La variable de estratificación la suele sugerir el investigador o el estadístico.

90

Estadística para Comunicadores

Ejemplo La empresa de telecomunicaciones RVTV tiene 120 empleados de los cuales tiene información de las variables: ingreso en soles, nivel de educación, años en la empresa y satisfacción laboral.



Ingreso (en soles)

Nivel de Educación

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

2300 2800 2400 2500 2300 2100 1700 2000 2200 2100 1700 2500 2800 2400 1700 2400 2200 2200 2300 2800 2100 1700 2500 2400 2700 1700 1600 2600 2500 2500 2100 2300 1700 2200 2900 1800 2100 2000 2000 2900 2100 2100 1800 2000 2100

Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica

Años cumplidos en la empresa 5 11 4 2 3 2 2 0 7 4 0 2 13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13 16 11 14 0 13 20 5 16 12 12 20 13 9 1 9 10

Satisfacción laboral



Insatisfecho Satisfecho Satisfecho Satisfecho No opina No opina No opina Insatisfecho Satisfecho Insatisfecho Insatisfecho No opina Satisfecho No opina Insatisfecho Satisfecho Satisfecho Insatisfecho Satisfecho Satisfecho No opina Insatisfecho Insatisfecho No opina Satisfecho Insatisfecho No opina Satisfecho Satisfecho Insatisfecho Insatisfecho Insatisfecho Satisfecho Insatisfecho Satisfecho Satisfecho Satisfecho Insatisfecho Insatisfecho Satisfecho No opina No opina Insatisfecho Satisfecho Satisfecho

61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Ingreso Nivel de (en Educación soles) 2100 1700 2300 2500 2600 1900 2500 1800 1700 2000 2400 1700 2500 1700 2400 2400 1900 1700 2100 2000 2000 2500 1700 2500 1700 2600 1600 1800 2100 1700 2400 2600 2100 2100 2400 1700 2600 2400 2700 2100 1600 2100 1900 2100 2200

Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior

Años cumplidos en la empresa 15 1 14 16 18 3 19 6 2 10 16 0 12 3 17 16 7 1 6 5 3 13 0 19 3 19 1 6 10 0 16 17 10 8 17 1 20 16 17 12 0 15 5 12 12

Satisfacción laboral Insatisfecho Satisfecho Insatisfecho Insatisfecho No opina No opina Insatisfecho Insatisfecho Satisfecho Satisfecho Insatisfecho Satisfecho Satisfecho Insatisfecho Satisfecho Satisfecho No opina Insatisfecho Insatisfecho No opina Satisfecho Insatisfecho No opina Satisfecho Satisfecho No opina Insatisfecho Insatisfecho Satisfecho Insatisfecho Satisfecho Insatisfecho Insatisfecho Satisfecho Insatisfecho Satisfecho Satisfecho Satisfecho Insatisfecho Insatisfecho Satisfecho Satisfecho Satisfecho Satisfecho Satisfecho

91

Estadística para Comunicadores

46 47 48 49 50 51 52 53 54 55 56 57 58 59 60

1900 2000 2300 2000 1700 1700 2100 2600 2400 2600 1900 1600 1900 2100 1700

Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica

4 10 11 7 1 1 6 17 9 19 7 0 3 14 0

Insatisfecho Satisfecho Satisfecho No opina Insatisfecho Satisfecho Satisfecho Satisfecho Insatisfecho Satisfecho Satisfecho Satisfecho No opina No opina Satisfecho

106 107 108 109 110 111 112 113 114 115 116 117 118 119 120

2400 1800 2600 2700 2500 2500 1900 2100 1700 1500 1800 2100 2700 1800 2100

Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior

13 4 17 20 16 16 6 15 9 0 18 10 19 9 15

Satisfecho No opina Insatisfecho Insatisfecho No opina Satisfecho Insatisfecho No opina Satisfecho Satisfecho Insatisfecho Insatisfecho Insatisfecho Satisfecho Insatisfecho

a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como variable de estratificación el nivel de educación. Elabore un listado identificando el número seleccionado y el valor respectivo de los años cumplidos en la empresa. Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y para el estrato 3 use C4, C3, C5 y C7. b. Con la muestra obtenida calcule la proporción de empleados que tienen más de 12 años en la empresa. Solución a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como variable de estratificación el nivel de educación. Elabore un listado identificando el número seleccionado y el valor respectivo de los años cumplidos en la empresa. Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y para el estrato 3 use C4, C3, C5 y C7. Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3 son: secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccionamos muestras aleatorias simples. Cantidad seleccionada por estrato

Números de elementos en el estrato Nh

Posiciones (desde – hasta)

1. Secundaria

N1 = 30

1 – 30

2. Técnica

N2 = 50

31 – 80

n2 

N2 50 n  16  6.67  7 N 120

3. Superior

N3 = 40

81 – 120

n3 

N3 40 n  16  5.33  5 N 120

Total

N = 120

Estratos

nh 

n1 

Nh n N

N1 30 n  16  4 N 120

n = 16

92

Estadística para Comunicadores

Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y C5. Observemos que las posiciones de los primeros elementos a elegir están entre 1 y 30. TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 4 8 2 4 6 6 3 5 4 5 6 9 2 9 8 1 4 4 1 9 8 5 0 2 1 3 3 9 1 6 2 9 7 9 6 0 8 3 5 6 6 6 4 0 1 6 4 1 6 5 2 7 7 2 9 2 9 0 5 5 0 8 4 8 7 4 6 1 2 9 5 0 4 0 9 8 2 1 3 1 8 9 9 0 1 2 6 3

C12 0 1 1 8 9 6 0 7

C13 5 1 2 6 9 2 2 1

C14 C15 2 6 9 7 6 6 3 4 9 7 1 7 6 8 9 6

C16 9 9 0 8 4 0 7 1

C17 8 8 7 1 1 1 0 7

C18 0 5 5 8 5 5 1 9

C19 0 9 6 5 4 8 9 9

C20 9 0 4 4 9 7 7 8

Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es: Estrato Secundaria Posición

Años en la empresa

02 16 29 13

11 9 13 13

Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10 y C11. Observemos que las posiciones de los elementos a elegir están entre 31 y 80. TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0

C17 C18 8 0 8 5 7 5 1 8 1 5 1 5

Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:

C19 C20 0 9 9 0 6 4 5 4 4 9 8 7

Estadística para Comunicadores

93

Estrato Técnica Posición Años en la empresa 54 9 62 1 66 3 77 7 48 11 67 19 44 9 Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5 y C7. Observemos que las posiciones de los elementos a elegir están entre 81 y 120. TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 1 1 4 5 6 7 9 4 5 8 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 0 8 1 3 3 7 3 9 3 4 2 4 8 6 7 9 0 6 2 8 1 3 4 3 9 3 1 1 8 7 7 8 3 7 3 3 0 8 3 5

Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es: Estrato Superior Posición Años en la empresa 114 9 81 3 97 20 105 12 83 0 b. Con la muestra obtenida calcule la proporción de empleados que tienen más de 12 años en la empresa. Solución Luego, con los elementos seleccionados se tiene que la proporción de empleados con más de 12 años en la empresa es igual a 4/16 = 0,25.

94

Estadística para Comunicadores

Ejercicio 1. La siguiente tabla muestra a los 120 alumnos de la especialidad de Comunicaciones, de la universidad El Saber, a quienes se les preguntó por su emisora radial preferida y por la cantidad de horas a la semana que la escucha. Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

Radio Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno

Horas 6 10 4 2 3 6 7 6 8 9 11 3 4 2 6 4 9 5 2 7 4 6 7 8 9 10 5 4 7 8 4 6 7 5 8 9 4 5 2 9

Posición 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80

Radio Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno

Horas 6 6 8 9 4 6 7 9 8 10 12 9 9 8 4 6 7 8 7 3 6 9 2 5 1 4 7 6 7 8 4 5 3 6 5 8 7 9 10 3

Posición 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120

Radio Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta

Horas 4 3 3 5 5 8 7 6 9 9 4 2 11 2 3 8 6 7 9 4 8 7 7 9 6 7 9 8 3 11 13 14 9 8 6 5 7 3 6 5

95

Estadística para Comunicadores

a. Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la variable Radio como variable de estratificación. Elabore un listado con el alumno seleccionado y la cantidad de horas a la semana que escucha la radio de su preferencia. Para el estrato 1 use las columnas C6, C4 y C2, para el estrato 2 use las columnas C15, C10, C2 y C11 y para el estrato 3 use C6, C17, C12, C4, C1, y C7. b. Con la muestra obtenida calcule el promedio de horas a la semana que los alumnos escuchan la radio de su preferencia. Solución a. Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la variable Radio como variable de estratificación. Elabore un listado con el alumno seleccionado y la cantidad de horas a la semana que escucha la radio de su preferencia. Para el estrato 1 use las columnas C6, C4 y C2, para el estrato 2 use las columnas C15, C10, C2 y C11 y para el estrato 3 use C6, C17, C12, C4, C1, y C7. Estrato

Nh

Posición (desde – hasta)

nh 

1.

N1=

n1=

2.

N2=

n2=

3.

N3=

n3=

Nh n N

Total

Estrato 1: Estudio 92 Posición

Horas

Estrato 2: Oxígeno Posición

Horas

Estrato 3: Planeta Posición

Horas

b. Con la muestra obtenida calcule el promedio de horas a la semana que los alumnos escuchan la radio de su preferencia. Entonces, con los elementos seleccionados se tiene que el promedio muestral de horas a la semana que los alumnos escuchan la radio de su preferencia es ……................. horas.

96

Estadística para Comunicadores

TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 4 8 2 4 6 6 3 5 4 5 6 0 5 2 9 2 9 8 1 4 4 1 9 8 5 1 1 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 9 6 0 8 3 5 6 6 6 4 0 8 6 3 1 6 4 1 6 5 2 7 7 2 9 9 9 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 6 1 2 9 5 0 4 0 9 8 2 0 2 6 1 3 1 8 9 9 0 1 2 6 3 7 1 9 4 5 8 1 1 4 5 6 7 9 9 9 2 1 0 0 3 6 9 6 5 0 6 4 7 9 8 1 7 2 4 5 4 1 2 4 4 6 9 2 6 6 4 9 3 4 4 2 4 5 9 0 8 7 4 8 6 1 2 8 1 3 3 2 0 2 6 0 7 2 9 3 4 0 8 1 3 3 7 3 2 4 8 6 1 8 7 1 3 4 3 9 3 1 7 8 3 7 0 2 1 4 7 5 7 3 1 1 9 3 3 8 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 5 9 9 8 4 4 5 9 1 5 4 7 3 0 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 5 3 8 0 4 3 9 4 6 0 8 8 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 6 9 5 9 4 9 1 8 2 0 2 5 3 9 7 4 9 1 4 8 8 6 6 8 5 9 4 8 3 8 1 2 2 4 0 1 4 5 7 7 4 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 4 8 1 5 8 5 5 1 4 9 6 4 4 4 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 5 5 8 8 4 3 4 8 9 0 6 7 6 9 2 0 9 8 2 8 3 4 3 2 8 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 3 3 2 5 6 7 6 1 6 6 1 7 6 5 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 7 5 4 0 9 5 7 8 7 5 0 8 6 2 7 1 7 8 8 3 8 6 9 9 2 7 4 6 0 9 2 6 1 5 1 2 3 1 8 1 2 3 3 6 3 4 9 6 4 4 9 8 5 7 3 0 1 9 7 9 7 9 4 4 1 6 6 7 7 4 7 1 5 3 7 0 9 2 5 2 1 0 0 7 8 9 9 6 8 5 6 8 1 9 2 7 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 2 6 6 4 1 4 8 1 0 6 0 1 3 4 5 1 9 0 3 9 1 6 1 7 8 8 2 8 9 0 5 8 4 9 2 2 3 9 8 5 9 5 8 6 1 9 2 5 0 0 7 9 0 0 7 4 1 9 1 0 9 7 5 1 2 7 1 9 4 8 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 6 9 9 8 0 8 1 8 2 6 6 8 4 3 1 6 1 0 5 7 5 7 0 6 3 0 4

C15 C16 6 9 7 9 6 0 4 8 7 4 7 0 8 7 6 1 3 2 2 4 6 5 4 2 7 9 7 9 3 3 7 4 9 3 3 4 6 8 0 6 8 7 5 9 1 2 5 7 4 8 2 7 7 4 4 7 6 3 0 0 8 7 4 1 8 1 1 8 6 2 5 9 0 8 3 4 0 7 4 0 1 7 8 1 0 9 0 7 7 8 5 4 4 8 8 0 0 7 1 4

C17 C18 C19 8 0 0 8 5 9 7 5 6 1 8 5 1 5 4 1 5 8 0 1 9 7 9 9 3 7 7 4 8 3 2 0 0 1 2 5 1 4 6 0 6 2 0 8 3 8 0 2 6 8 6 6 9 8 1 6 8 0 3 2 1 2 2 9 0 6 0 3 0 7 9 6 9 4 7 8 7 3 5 7 5 6 7 2 4 1 2 8 6 8 9 4 9 1 3 1 6 2 2 6 1 4 5 3 2 5 6 6 6 4 4 2 3 2 9 8 6 4 6 8 0 1 5 7 6 4 1 2 8 8 4 8 4 9 9 8 6 2 9 6 6 2 6 6 8 2 5 0 3 0

C20 9 0 4 4 9 7 7 8 9 6 4 4 5 8 5 5 0 1 1 8 3 8 8 7 0 6 0 8 8 4 4 3 7 4 3 6 0 8 8 8 5 6 6 0 4 3 9 3 1 8

97

Estadística para Comunicadores

2. Los siguientes datos han sido extraídos de una investigación realizada por La Defensoría del Pueblo, Comisión de la Verdad y Reconciliación, Comité Internacional Cruz Roja y Coordinadora Nacional de Derechos Humanos sobre un total de 150 personas extraviadas en el Perú entre los años 1980 y 1996 en los 3 principales departamentos donde hubo el brote terrorista: Ayacucho, Huánuco y San Martín. Las variables que se consideraron fueron: Lugar de procedencia, Sexo y Edad al momento de la desaparición. Los datos se presentan a continuación: Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37

Lugar de Sexo procedencia Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho F Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M

Edad



12 40 20 43 28 12 15 28 13 45 10 25 24 32 48 23 7 5 4 9 6 66 18 36 26 17 28 30 19 17 20 21 37 58 18 18 19

51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87

Lugar de Sexo procedencia Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho M Ayacucho F Huánuco M Huánuco M Huánuco F Huánuco M Huánuco M

Edad



44 39 17 19 24 15 17 22 50 42 19 21 15 43 16 30 48 45 41 23 22 20 22 16 45 56 33 22 70 34 69 31 21 27 19 27 20

101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137

Lugar de procedencia Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín

Sexo

Edad

M M F F M M M M M M M M M M M M M M M M M F F M M M M M M M M M M M M M M

24 28 4 2 33 25 21 21 30 21 21 54 38 16 28 36 27 24 45 21 66 70 26 26 14 18 28 25 32 22 21 28 18 29 20 18 21

98

Estadística para Comunicadores

38 39 40 41 42 43 44 45 46 47 48 49 50

Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho Ayacucho

M M F M M F M M M M M M M

18 22 23 50 26 19 54 13 46 28 46 42 40

88 89 90 91 92 93 94 95 96 97 98 99 100

Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco Huánuco

M M M M M M M M M M M M M

25 18 47 28 32 18 22 28 31 34 25 27 19

138 139 140 141 142 143 144 145 146 147 148 149 150

San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín San Martín

M M M M M F M M M M M M M

26 23 35 17 32 32 41 26 20 21 15 22 45

a. Aplique el muestreo estratificado para obtener una muestra de 10 personas desaparecidas. Elabore un listado con el elemento seleccionado y el valor de la edad al momento de la desaparición. Utilice como variable de estratificación: Lugar de procedencia. Estrato 1: Ayacucho Estrato 2: Huánuco Estrato 3: San Martín

C3 ; C5 ; C7 C5; C9 ; C10 ; C12 C4 ; C8 ; C11 ;C15

b. Con la muestra obtenida calcule el promedio de la edad al momento de la desaparición. Solución a. Aplique el muestreo estratificado para obtener una muestra de 10 personas desaparecidas. Elabore un listado con el elemento seleccionado y el valor de la edad al momento de la desaparición. Utilice como variable de estratificación: Lugar de procedencia. Estrato 1: Ayacucho Estrato 2: Huánuco Estrato 3: San Martín Estrato

Nh

C3 ; C5 ; C7 C5; C9 ; C10 ; C12 C4 ; C8 ; C11 ;C15 Posición (desde – hasta)

nh 

1.

N1=

n1=

2.

N2=

n2=

3.

N3=

n3=

Total

Nh n N

99

Estadística para Comunicadores

Estrato 1: ……………….. Posición

………………..

Estrato 2: ………………. Posición

………………..

Estrato 3: ………….……. Posición

………………..

b. Con la muestra obtenida calcule el promedio de la edad al momento de la desaparición. Entonces, con los elementos seleccionados se tiene que el promedio de la edad al momento de la desaparición es ……................. años.

100

Estadística para Comunicadores

TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 4 8 2 4 6 6 3 5 4 5 6 0 5 2 9 2 9 8 1 4 4 1 9 8 5 1 1 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 9 6 0 8 3 5 6 6 6 4 0 8 6 3 1 6 4 1 6 5 2 7 7 2 9 9 9 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 6 1 2 9 5 0 4 0 9 8 2 0 2 6 1 3 1 8 9 9 0 1 2 6 3 7 1 9 4 5 8 1 1 4 5 6 7 9 9 9 2 1 0 0 3 6 9 6 5 0 6 4 7 9 8 1 7 2 4 5 4 1 2 4 4 6 9 2 6 6 4 9 3 4 4 2 4 5 9 0 8 7 4 8 6 1 2 8 1 3 3 2 0 2 6 0 7 2 9 3 4 0 8 1 3 3 7 3 2 4 8 6 1 8 7 1 3 4 3 9 3 1 7 8 3 7 0 2 1 4 7 5 7 3 1 1 9 3 3 8 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 5 9 9 8 4 4 5 9 1 5 4 7 3 0 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 5 3 8 0 4 3 9 4 6 0 8 8 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 6 9 5 9 4 9 1 8 2 0 2 5 3 9 7 4 9 1 4 8 8 6 6 8 5 9 4 8 3 8 1 2 2 4 0 1 4 5 7 7 4 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 4 8 1 5 8 5 5 1 4 9 6 4 4 4 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 5 5 8 8 4 3 4 8 9 0 6 7 6 9 2 0 9 8 2 8 3 4 3 2 8 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 3 3 2 5 6 7 6 1 6 6 1 7 6 5 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 7 5 4 0 9 5 7 8 7 5 0 8 6 2 7 1 7 8 8 3 8 6 9 9 2 7 4 6 0 9 2 6 1 5 1 2 3 1 8 1 2 3 3 6 3 4 9 6 4 4 9 8 5 7 3 0 1 9 7 9 7 9 4 4 1 6 6 7 7 4 7 1 5 3 7 0 9 2 5 2 1 0 0 7 8 9 9 6 8 5 6 8 1 9 2 7 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 2 6 6 4 1 4 8 1 0 6 0 1 3 4 5 1 9 0 3 9 1 6 1 7 8 8 2 8 9 0 5 8 4 9 2 2 3 9 8 5 9 5 8 6 1 9 2 5 0 0 7 9 0 0 7 4 1 9 1 0 9 7 5 1 2 7 1 9 4 8 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 6 9 9 8 0 8 1 8 2 6 6 8 4 3 1 6 1 0 5 7 5 7 0 6 3 0 4

C15 C16 6 9 7 9 6 0 4 8 7 4 7 0 8 7 6 1 3 2 2 4 6 5 4 2 7 9 7 9 3 3 7 4 9 3 3 4 6 8 0 6 8 7 5 9 1 2 5 7 4 8 2 7 7 4 4 7 6 3 0 0 8 7 4 1 8 1 1 8 6 2 5 9 0 8 3 4 0 7 4 0 1 7 8 1 0 9 0 7 7 8 5 4 4 8 8 0 0 7 1 4

C17 C18 C19 8 0 0 8 5 9 7 5 6 1 8 5 1 5 4 1 5 8 0 1 9 7 9 9 3 7 7 4 8 3 2 0 0 1 2 5 1 4 6 0 6 2 0 8 3 8 0 2 6 8 6 6 9 8 1 6 8 0 3 2 1 2 2 9 0 6 0 3 0 7 9 6 9 4 7 8 7 3 5 7 5 6 7 2 4 1 2 8 6 8 9 4 9 1 3 1 6 2 2 6 1 4 5 3 2 5 6 6 6 4 4 2 3 2 9 8 6 4 6 8 0 1 5 7 6 4 1 2 8 8 4 8 4 9 9 8 6 2 9 6 6 2 6 6 8 2 5 0 3 0

C20 9 0 4 4 9 7 7 8 9 6 4 4 5 8 5 5 0 1 1 8 3 8 8 7 0 6 0 8 8 4 4 3 7 4 3 6 0 8 8 8 5 6 6 0 4 3 9 3 1 8

Estadística para Comunicadores

101

Muestreo sistemático En el muestreo sistemático se debe elegir un elemento del marco muestral cada cierto intervalo. Este muestreo supone que se cuenta con una enumeración completa de los elementos de la población. Una característica importante del muestreo sistemático es que presenta menos variabilidad que el muestreo aleatorio simple, esto debido a la presencia de una estratificación innata en el diseño del muestreo sistemático. Procedimiento para seleccionar una muestra sistemática   

𝑁

Calcule el valor de k, donde 𝑘 = 𝑛 . El valor de k se redondea al valor del entero menor. Seleccione aleatoriamente un número entero entre 1 y k llamado arranque aleatorio (A) A partir de este número elegido, seleccione el siguiente que ocupa la posición (A + k) del listado del marco muestral y así sucesivamente hasta completar la muestra.

Ejemplo 1. Se tiene a continuación una población de 12 personas a quienes se les consultó su edad. Se desea elegir a cuatro de ellas mediante un muestreo sistemático. Use la columna C3, C6 y C12 de la tabla de números aleatorios. 1. 2. 3. 4. 5.

12 23 35 23 35

6. 7. 8. 9. 10.

37 42 44 64 86

11. 40 12. 27

Solución Calculemos el valor de k, donde

k

N 12  3 n 4

El valor de k se redondea al valor del entero menor, luego k = 3

102

Estadística para Comunicadores

Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado arranque aleatorio (A). Observando la columna C3 de la tabla de números aleatorios tenemos que A = 2.

C1 C2 C3 C4 C5 4 8 2 4 6 9 2 9 8 1 0 2 1 3 3

TABLA DE NÚMEROS ALEATORIOS C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 6 3 5 4 5 6 0 5 2 6 4 4 1 9 8 5 1 1 9 7 9 1 6 2 9 7 1 2 6 6

C16 9 9 0

C17 8 8 7

C18 0 5 5

C19 0 9 6

C20 9 0 4

Los elementos seleccionados serán: Posición

Edad

2. Se tiene una población de 15 personas a quienes se les consultó su edad y se desea elegir a seis de ellas mediante un muestreo sistemático. Use la columna C4, C8 y C1 de la tabla de números aleatorios. Con la muestra seleccionada, estime la edad promedio. 1. 2. 3. 4. 5.

45 33 55 45 39

6. 7. 8. 9. 10.

37 43 21 43 32

11. 12. 13. 14. 15.

30 29 35 32 53

Solución Calculemos el valor de k, donde

k

N  .......... n

El valor de k se redondea al valor del entero menor, luego k =……… El arranque aleatorio (A) es …………….

C1 C2 C3 C4 C5 4 8 2 4 6 9 2 9 8 1 0 2 1 3 3 9 6 0 8 3 1 6 4 1 6 2 9 0 5 5

TABLA DE NÚMEROS ALEATORIOS C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 6 3 5 4 5 6 0 5 2 6 4 4 1 9 8 5 1 1 9 7 9 1 6 2 9 7 1 2 6 6 5 6 6 6 4 0 8 6 3 4 5 2 7 7 2 9 9 9 9 7 0 8 4 8 7 4 6 2 1 7

C16 9 9 0 8 4 0

C17 8 8 7 1 1 1

C18 0 5 5 8 5 5

C19 0 9 6 5 4 8

C20 9 0 4 4 9 7

103

Estadística para Comunicadores

Los elementos seleccionados serán: Posición

Edad

Con la muestra seleccionada, estime la edad promedio.

Ejercicio 1. Se tiene información de 40 personas de un barrio de Lima Metropolitana. Obtenga una muestra de siete personas usando el muestreo sistemático y elabore una tabla con la posición seleccionada. Utilice las columnas C3, C10 y C11 de la tabla de números aleatorios. Además, con la muestra obtenida calcule la edad promedio de las personas y el porcentaje de individuos que son mujeres. Individuos registrados Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Sexo Mujer Hombre Hombre Mujer Hombre Mujer Hombre Hombre Mujer Mujer Hombre Hombre Mujer Hombre

Edad 15 16 21 31 21 24 32 26 21 22 18 25 29 25

Estatura 154 154 156 184 173 170 176 188 169 173 177 181 164 159

Nº 15 16 17 18 19 20 21 22 23 24 25 26 27 28

Sexo Mujer Mujer Hombre Mujer Hombre Hombre Mujer Hombre Hombre Hombre Hombre Mujer Mujer Hombre

Edad 19 30 29 25 29 25 16 31 18 21 31 28 19 31

Estatura 178 163 180 174 137 153 168 161 270 173 187 161 172 162

Nº 29 30 31 32 33 34 35 36 37 38 39 40

Sexo Hombre Hombre Mujer Mujer Mujer Hombre Mujer Hombre Mujer Hombre Mujer Mujer

Edad 33 17 34 20 26 25 23 20 34 35 30 29

Estatura 147 167 169 156 164 190 167 169 176 188 155 141

104

Estadística para Comunicadores

Solución Calculemos el valor de k, donde

k

N  .......... n

El valor de k se redondea al valor del entero menor, luego k =……… El arranque aleatorio (A) es ……………. TABLA DE NÚMEROS ALEATORIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 4 8 2 4 6 6 3 5 4 5 6 0 5 2 9 2 9 8 1 4 4 1 9 8 5 1 1 9 0 2 1 3 3 9 1 6 2 9 7 1 2 6 9 6 0 8 3 5 6 6 6 4 0 8 6 3 1 6 4 1 6 5 2 7 7 2 9 9 9 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1

C15 6 7 6 4 7 7

C16 9 9 0 8 4 0

C17 8 8 7 1 1 1

C18 0 5 5 8 5 5

C19 C20 0 9 9 0 6 4 5 4 4 9 8 7

El cuadro con los datos es: Posición

Sexo

Edad

Estatura

Con la muestra obtenida, calcule la edad promedio y el porcentaje de individuos que son mujeres.

105

Estadística para Comunicadores

2. Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla que se muestra a continuación información acerca de las variables: ingreso mensual (en soles), nivel educativo y años cumplidos en la empresa.



Ingreso (en soles)

Nivel Educativo

Años en la empresa



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41

2300 2800 2400 2500 2300 2100 1700 2000 2200 2100 1700 2500 2800 2400 1700 2400 2200 2200 2300 2800 2100 1700 2500 2400 2700 1700 1600 2600 2500 2500 2700 1700 1600 2400 1900 1800 1800 2400 2600 2700 2100

Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Técnica

5 11 4 2 3 2 2 0 7 4 1 2 13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13 16 17 1 1 11 3 5 3 14 16 18 11

51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91

Ingreso Nivel (en soles) Educativo

2100 2100 1800 2000 2100 1900 2000 2300 2000 1700 1900 2000 2400 1700 1700 2400 2500 2600 2100 1900 2000 1800 2100 2300 2700 2800 1800 1700 1700 1700 1700 2100 2600 2400 2600 1900 1600 1900 2100 1700 2100

Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica

Años en la empresa



13 9 1 9 10 4 10 11 7 1 6 9 17 0 2 17 13 16 14 7 9 7 10 12 20 20 3 5 4 0 1 6 17 9 19 7 0 3 14 0 15

101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141

Años Ingreso Nivel en la (en soles) Educativo empresa

2400 1700 2500 1700 2400 2400 1900 1700 2100 2000 2000 2500 1700 2500 1700 2600 1600 1800 2100 1700 2400 2600 2100 2100 2400 1700 2600 2400 2700 2100 1600 2100 1900 2100 2200 2400 1800 2600 2700 2500 2500

Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior

16 0 12 3 17 16 7 1 6 5 3 13 0 19 3 19 1 6 10 0 16 17 10 8 17 1 20 16 17 12 0 15 5 12 12 13 4 17 20 16 16

106

Estadística para Comunicadores

42 43 44 45 46 47 48 49 50

2300 1700 2200 2900 1800 2100 2000 2000 2900

Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica

14 0 13 20 5 16 12 12 20

92 93 94 95 96 97 98 99 100

1700 2300 2500 2600 1900 2500 1800 1700 2000

Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica Técnica

1 14 16 18 3 19 6 2 10

142 143 144 145 146 147 148 149 150

1900 2100 1700 1500 1800 2100 2700 1800 2100

Superior Superior Superior Superior Superior Superior Superior Superior Superior

6 15 9 0 18 10 19 9 15

a. Aplique el muestreo sistemático para seleccionar una muestra de tamaño 13 empleados. Elabore un listado con la posición seleccionada y el valor de los años cumplidos en la empresa y nivel educativo. Utilice la columna C7, C10 y C15 de la tabla de números aleatorios. b. Con la muestra obtenida, estime e interprete para la variable, años en la empresa el promedio y la mediana. Obtenga además la proporción de empleados con nivel técnico.

Solución a. Aplique el muestreo sistemático para seleccionar una muestra de tamaño 13 empleados. Elabore un listado con la posición seleccionada y el valor de los años cumplidos en la empresa y nivel educativo. Utilice la columna C7, C10 y C15 de la tabla de números aleatorios. Calculemos el valor de k, donde

k

N  .......... n

El valor de k se redondea al valor del entero menor, luego k =……… El arranque aleatorio (A) es …………….

C1 C2 C3 C4 C5 4 8 2 4 6 9 2 9 8 1 0 2 1 3 3 9 6 0 8 3 1 6 4 1 6 2 9 0 5 5 6 1 2 9 5 1 3 1 8 9 4 5 8 1 1 0 0 3 6 9

TABLA DE NÚMEROS ALEATORIOS C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 6 3 5 4 5 6 0 5 2 6 4 4 1 9 8 5 1 1 9 7 9 1 6 2 9 7 1 2 6 6 5 6 6 6 4 0 8 6 3 4 5 2 7 7 2 9 9 9 9 7 0 8 4 8 7 4 6 2 1 7 0 4 0 9 8 2 0 2 6 8 9 0 1 2 6 3 7 1 9 6 4 5 6 7 9 9 9 2 1 3 6 5 0 6 4 7 9 8 1 2

C16 9 9 0 8 4 0 7 1 2 4

C17 8 8 7 1 1 1 0 7 3 4

C18 0 5 5 8 5 5 1 9 7 8

C19 0 9 6 5 4 8 9 9 7 3

C20 9 0 4 4 9 7 7 8 9 6

107

Estadística para Comunicadores

El cuadro con los datos es: Posición

Años en la empresa

Nivel Educativo

b. Con la muestra obtenida, estime e interprete para la variable, años en la empresa el promedio y la mediana. Obtenga además la proporción de empleados con nivel técnico. Promedio =

Mediana =

Proporción =

108

Estadística para Comunicadores

3. La siguiente tabla muestra el registro de todos los clientes de una empresa de señal por cable del distrito de Los Olivos. Las variables consideradas fueron: ingreso semanal (en dólares), número de televisores en el hogar y nivel educativo alcanzado por el jefe de familia. N° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41

Ingreso semanal 100 80 100 85 105 110 102 110 90 130 180 90 104 100 90 80 120 85 100 98 120 105 120 250 300 120 195 120 250 300 250 230 150 200 190 250 205 220 285 220 400

N° de televisores 3 2 3 1 2 2 4 2 2 3 1 3 3 2 2 1 1 1 2 3 2 2 1 3 4 2 3 3 2 3 2 2 2 3 1 2 2 3 4 2 3

Nivel educativo Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria

N° 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93

Ingreso semanal 200 335 250 250 120 130 235 500 200 395 330 310 300 530 540 200 285 430 400 220 230 300 340 420 550 430 690 500 430 620 400 630 585 350 520 402 220 690 420 450 530

N° de televisores 1 1 2 3 2 2 2 3 1 2 3 3 3 3 2 2 1 3 3 2 2 2 3 2 2 2 3 2 2 3 3 2 1 2 2 2 3 1 2 2 2

Nivel educativo Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Secundaria Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior

109

Estadística para Comunicadores

350 400 540 250 295 230 240 400 270 320 295

42 43 44 45 46 47 48 49 50 51 52

2 2 2 3 4 1 2 3 5 2 2

Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Primaria Secundaria Secundaria

94 95 96 97 98 99 100 101 102 103 104

300 335 330 380 230 385 303 540 490 495 340

3 1 1 2 2 1 2 2 3 2 3

Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior Superior

a. Seleccione una muestra de 12 clientes aplicando el muestreo sistemático. Elabore un listado con la posición seleccionada y los valores del ingreso semanal (en dólares) y número de televisores en el hogar. Utilice la columna C4, C9 y C15 de la tabla de números aleatorios. b. Con la muestra obtenida estime el promedio de cada variable y la proporción de clientes que tienen a lo más 2 televisores. Solución a. Seleccione una muestra de 12 clientes aplicando el muestreo sistemático. Elabore un listado con la posición seleccionada y los valores del ingreso semanal (en dólares) y número de televisores en el hogar. Utilice la columna C4, C9 y C15 de la tabla de números aleatorios. Calculemos el valor de k, donde

k

N  ........... n

El valor de k se redondea al valor del entero menor, luego k =……… El arranque aleatorio (A) es …………….

C1

C2

C3

C4

C5

C6

4 9 0 9 1 2 6 1 4 0 7 4

8 2 2 6 6 9 1 3 5 0 2 9

2 9 1 0 4 0 2 1 8 3 4 3

4 8 3 8 1 5 9 8 1 6 5 4

6 1 3 3 6 5 5 9 1 9 4 4

6 4 9 5 5 0 0 9 4 6 1 2

TABLA DE NÚMEROS ALEATORIOS C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 3 4 1 6 2 8 4 0 5 5 2 4

5 1 6 6 7 4 0 1 6 0 4 5

4 9 2 6 7 8 9 2 7 6 4 9

5 8 9 4 2 7 8 6 9 4 6 0

6 5 7 0 9 4 2 3 9 7 9 8

0 1 1 8 9 6 0 7 9 9 2 7

5 1 2 6 9 2 2 1 2 8 6 4

2 9 6 3 9 1 6 9 1 1 6 8

6 7 6 4 7 7 8 6 3 2 6 4

9 9 0 8 4 0 7 1 2 4 5 2

8 8 7 1 1 1 0 7 3 4 2 1

0 5 5 8 5 5 1 9 7 8 0 2

0 9 6 5 4 8 9 9 7 3 0 5

9 0 4 4 9 7 7 8 9 6 4 4

Estadística para Comunicadores

110

El cuadro con los datos es: Posición

Ingreso semanal

N° de televisores

b. Con la muestra obtenida estime el promedio para las variables cuantitativas y la proporción de clientes que tienen a lo más 2 televisores.

111

Estadística para Comunicadores

Ejercicios de aplicación La siguiente tabla muestra a los 120 alumnos de la especialidad de Publicidad, de la universidad El Saber, a quienes se les preguntó por su emisora radial preferida y por la cantidad de horas a la semana que la escucha. Id 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

Radio Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Estudio 92 Oxigeno Oxigeno Oxigeno Oxigeno Oxigeno Oxigeno Oxigeno Oxigeno Oxigeno

Horas 6 10 4 2 3 6 7 6 8 9 11 3 4 2 6 4 9 5 2 7 4 6 7 8 9 10 5 4 7 8 4 6 7 5 8 9 4 5 2 9

Id 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80

Radio Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno

Horas 6 6 8 9 4 6 7 9 8 10 12 9 9 8 4 6 7 8 7 3 6 9 2 5 1 4 7 6 7 8 4 5 3 6 5 8 7 9 10 3

Id 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120

Radio Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Oxígeno Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta Planeta

Horas 4 3 3 5 5 8 7 6 9 9 4 2 11 2 3 8 6 7 9 4 8 7 7 9 6 7 9 8 3 11 13 14 9 8 6 5 7 3 6 5

112

Estadística para Comunicadores

a. Seleccione una muestra sistemática de tamaño 13. Elabore un listado con los alumnos seleccionados y el valor de la radio de su preferencia. Utilice las columnas C4, C10 y C6 de la tabla de números aleatorios. Con la muestra seleccionada calcule el porcentaje de alumnos que escuchan radio Planeta. Solución

N  .......... luego k =……… n El arranque aleatorio (A) es ……………. Calculemos el valor de k, donde k 

Posición

………………..

Posición

………………..

El porcentaje de alumnos que escuchan radio Planeta es igual a ………………… %. b. Seleccione una muestra aleatoria de tamaño 10 mediante muestreo aleatorio simple. Elabore un listado con los alumnos seleccionados y el valor de la cantidad de horas a la semana que escuchan la radio de su preferencia. Utilice las columnas C14, C17 y C4 de la tabla de números aleatorios. Con la muestra obtenida Estime el promedio y el coeficiente de variabilidad de la cantidad de horas a la semana que escuchan la radio de su preferencia. Posición

………………..

113

Estadística para Comunicadores

Con la muestra obtenida calcule el promedio y el coeficiente de variabilidad.

c. Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Utilice como variable de estratificación: Radio. Elabore un listado con el alumno seleccionado y la cantidad de horas a la semana que escucha la radio de su preferencia. Las columnas para cada estrato se presentan a continuación: Estrato 1: Estudio 92 Estrato 2: Oxigeno Estrato 3: Planeta Estrato

C16 ; C4 ; C12; C5; C10; C12 ; C1; C6; C7; C12; C4; C11; C7 Posición (desde – hasta)

Nh

nh 

N1=

n1=

N2=

n2=

N3=

n3=

Nh n N

Total Estrato 1: ……………….. Posición

………………

Estrato 2: ………………. Posición

………………

Estrato 3: ………….……. Posición

………………

Estime el promedio de horas a la semana que escuchan la radio de su preferencia la muestra seleccionada.

Estadística para Comunicadores

112

Autoevaluación El 01 de octubre del año pasado, los integrantes de la Federación de Periodistas del Perú celebraron el Congreso Nacional de Periodistas. En ese acto congresal, se elaboró un listado de los asistentes que laboran en los distintos medios periodísticos de la prensa escrita indicando género y edad. Id 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

género masculino masculino femenino masculino femenino masculino masculino femenino masculino masculino masculino femenino femenino masculino masculino masculino femenino femenino masculino masculino

edad 12 48 64 70 56 50 47 20 35 28 45 54 61 66 30 48 56 29 22 24

Id 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

género masculino femenino femenino masculino masculino masculino masculino masculino masculino masculino femenino femenino femenino masculino masculino masculino masculino femenino femenino femenino

edad 49 27 20 23 31 67 44 46 41 17 56 56 62 17 21 26 51 31 45 63

a. Seleccione una muestra simple aleatoria de tamaño 13. Elabore un listado con el número seleccionado y su valor para la variable edad (en años). Utilice las columnas C12, C7 y C16 de la tabla de números aleatorios. Con la muestra seleccionada estime la proporción de hombres y mujeres asistentes al evento y la edad promedio de los asistentes.

Estadística para Comunicadores

113

b. Seleccione una muestra sistemática de tamaño 11. Elabore un listado con el número del asistente seleccionado y su valor respectivo para la variable edad (en años). Utilice las columnas C14, C9 y C6 de la tabla de números aleatorios. Con la muestra seleccionada estime la proporción de hombres y mujeres asistentes al evento y la edad promedio de los asistentes.

Estadística para Comunicadores

Unidad 3 Probabilidad y Variable aleatoria

LOGRO: Al término de la Unidad 3, el estudiante aplica la teoría de la probabilidad para la toma de decisiones en base a datos históricos.

Temas de la unidad:   

Probabilidad: concepto, experimento aleatorio, espacio muestral y evento. Operaciones con eventos en tablas de doble entrada. Variable aleatoria continua. Uso de la tabla de la distribución normal estándar. Cálculo de probabilidades.

114

Estadística para Comunicadores

115

Unidad 3. Probabilidad y variable aleatoria Experimento no aleatorio o determinístico Un experimento determinista es aquel en el que se puede predecir el resultado de su realización y existe ley o fórmula matemática que permite explicarlo. Los experimentos de la física son deterministas. Por ejemplo, el movimiento de caída libre. Experimento aleatorio, espacio muestral, evento y probabilidad

Experimento aleatorio •Es un proceso que al ser realizado u observado repetidas veces, bajo las mismas condiciones, genera más de un posible resultado que no puede ser determinado de antemano.

Espacio muestral •Es el conjunto de todos los posibles resultados que genera un experimento aleatorio. •Se denota mediante el símbolo . Cada elemento del espacio muestral se denomina punto muestral.

Evento •Es todo subconjunto de un espacio muestral. Se denotan por letras mayúsculas, por ejemplo, A y B.

Probabilidad •Es una medida de la posibilidad de ocurrencia de un evento.

Los conceptos probabilísticos se aplican sobre experimentos aleatorios.

Estadística para Comunicadores

116

Probabilidad Es una medida de la posibilidad de ocurrencia de un evento. Ejemplo

Experimento aleatorio • Lanzar un dado

Espacio muestral

• Ω = {1, 2, 3, 4, 5, 6}

Eventos

• A = {1} • B = {1, 2, 3} • C = {2, 4, 6}, etc. Probabilidad

• P(A) = n(A) / n(Ω) = 1 / 6 = 0,167 • P(B) = n(B) / n(Ω) = 3 / 6 = 0,5 • P(C) = n(C) / n(Ω) = 3 / 6 = 0,5

Eventos mutuamente excluyentes Diremos que dos eventos, A y B, son mutuamente excluyentes en el mismo espacio muestral si no pueden ocurrir juntos. Por lo tanto A y B son eventos excluyentes si y solo si AB=. En la teoría de conjuntos los eventos mutuamente excluyentes serían equivalentes a los conjuntos disjuntos, aquellos que no tienen elementos comunes. Ejemplo: Sea el experimento : Contar el número de personas atendidas por un banco en un periodo de tiempo. Sean los eventos A: se atiendan a menos de 20 personas  A = { 0, 1, 2,…, 19} y B:

Estadística para Comunicadores

117

se han atendido exactamente a veinticinco personas  B = {25}. Como AB=, entonces los eventos son mutuamente excluyentes.

Axiomas de la probabilidad Sea un experimento aleatorio, Ω el espacio muestral asociado a dicho experimento aleatorio y A un evento definido en Ω, entonces la probabilidad del evento A, denotada por P(A), es aquel número que cumple los siguientes axiomas: 

Axioma 1: 0  P(A)  1



Axioma 2: P(Ω) = 1



Axioma 3: Si A y B son dos eventos mutuamente excluyentes entonces: P(A  B) = P(A) + P(B)

Definición clásica de probabilidad Algunos autores definen la probabilidad como una medida de la posibilidad de ocurrencia de un evento. La definición clásica propone que si el espacio muestral es numerable y cada punto muestral tiene la misma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento A definido sobre  es: P A 

n A Número de casos favorables al evento A  n Número de casos totales

Teoremas básicos de probabilidad   

P() = 0, donde  es el evento imposible. P(AC) = 1 – P(A) Si A y B son eventos cualesquiera, entonces P(A  B) = P(A) + P(B) – P(A  B)

118

Estadística para Comunicadores

Para cada pregunta formalice las probabilidades con los eventos Ejemplo Una empresa investigadora de mercados por encargo de un cliente, realizó un estudio acerca de las preferencias del turismo interno que realizan los universitarios. La empresa realizó una encuesta a 220 alumnos de diversas universidades nacionales y privadas; registrándose la condición de la universidad y la región de preferencia para un posible viaje. Los resultados se muestran en la siguiente tabla: Región de preferencia Costa (A) Sierra (B) Selva (C) 8 15 60 12 25 100 20 40 160

Condición de Universidad Nacional (D) Privada (E) Total

Se elige un alumno al azar, determine la probabilidad de que: a. b. c. d.

prefiera viajar a la Sierra. no estudie en una universidad privada. no tenga preferencia por viajar a la Selva y estudie en una universidad nacional. prefiera viajar a la Sierra o estudie en una universidad privada.

Solución a. prefiera viajar a la Sierra.

P( B) 

40  0,1818 220

b. no estudie en una universidad privada.

P ( E c )  P ( D) 

83  0,3772 220

c. no tenga preferencia por viajar a la Selva y estudie en una universidad nacional.

P(C c  D) 

8  15  0,1045 220

d. prefiera viajar a la Sierra o estudie en una universidad privada.

P( B  E ) 

40 137 25 152     0,6909 220 220 220 220

Total 83 137 220

119

Estadística para Comunicadores

Ejercicios 1. Se seleccionó una muestra aleatoria de trabajadores de la editorial Óptima para determinar sus planes de jubilación después de cumplir los 65 años de edad. Los trabajadores en la muestra se dividieron en: ejecutivos, empleados y obreros. Los resultados obtenidos fueron:

Trabajador Ejecutivo Empleado Obrero Total

Se jubile 8 20 50

Planes después de los 65 años No ha decidido No se jubile su jubilación 3 1 10 5 22 11

Total

Si se selecciona un trabajador al azar. a. b. c. d.

¿Cuál es la probabilidad de que no se jubile del trabajo? ¿Cuál es la probabilidad de que se jubile o no sea ejecutivo? ¿Cuál es la probabilidad de que no haya decidido su jubilación y no sea obrero? ¿Cuál es la probabilidad de que se jubile o no haya decidido su jubilación?

Solución a. ¿Cuál es la probabilidad de que no se jubile del trabajo? Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............  ...........................

b. ¿Cuál es la probabilidad de que se jubile o no sea ejecutivo? Sean los eventos ……… : ……………………………………………………………. ……… : ……………………………………………………………. Se pide calcular: P.....................  .........................................

c. ¿Cuál es la probabilidad de que no haya decidido su jubilación y no sea obrero? Sean los eventos

120

Estadística para Comunicadores

……… : ……………………………………………………………. ……… : ……………………………………………………………. Se pide calcular: P.....................  .........................................

d. ¿Cuál es la probabilidad de que se jubile o no haya decidido su jubilación? Sean los eventos ……… : ……………………………………………………………. ……… : ……………………………………………………………. Se pide calcular: P.....................  .........................................

2. El Director de Mercadotecnia de un diario metropolitano estudia la relación entre el tipo de comunidad donde vive el lector y la sección del periódico que lee primero. Para una muestra de lectores se obtuvo la siguiente información: Comunidad Urbana (U) Rural (R) Total

Noticias nacionales (N) 170 120

Deportes (D) 124 112

Historietas cómicas (H) 90 100

Total

Si se selecciona un lector al azar: a. ¿Cuál es la probabilidad que viva en una comunidad rural? b. ¿Cuál es la probabilidad que viva en una comunidad urbana y la sección del periódico que lee primero sea noticias nacionales? c. ¿Cuál es la probabilidad de que la primera sección del periódico que lee primero sean las noticias nacionales o las historietas cómicas? d. ¿Cuál es la probabilidad que la primera sección del periódico que lea sea deportes o viva en una comunidad granjera? e. ¿Cuál es la probabilidad de que viva en la comunidad rural y la primera sección del periódico que lee no sea deportes?

Estadística para Comunicadores

121

Solución a. ¿Cuál es la probabilidad que viva en una comunidad rural? Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............  ...........................

b. ¿Cuál es la probabilidad que viva en una comunidad urbana y la sección del periódico que lee primero sea noticias nacionales? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............  ...........................

c. ¿Cuál es la probabilidad de que la primera sección del periódico que lee primero sean las noticias nacionales o las historietas cómicas? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............  ...........................

d. ¿Cuál es la probabilidad que la primera sección del periódico que lea sea deportes o viva en una comunidad granjera? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............  ...........................

Estadística para Comunicadores

122

e. ¿Cuál es la probabilidad de que viva en la comunidad rural y la primera sección del periódico que lee no sea deportes? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............  ...........................

1. Trescientas personas se han presentado para una oferta laboral. La siguiente tabla muestra algunas características de estas personas: Género Masculino Femenino

Experiencia previa Sin Con Sin Con

Secundaria 35 10 40 12

Nivel de Instrucción Técnica Universitaria 38 13 30 18 37 8 42 17

Si se selecciona una persona al azar, a. b. c. d. e.

¿cuál es la probabilidad de que tenga instrucción secundaria? ¿cuál es la probabilidad de que sea una persona con instrucción técnica y sin experiencia? ¿cuál es la probabilidad de que sea mujer? ¿cuál es la probabilidad de que sea una persona con experiencia? ¿cuál es la probabilidad de que sea una mujer sin experiencia previa?

Solución a. ¿cuál es la probabilidad de que tenga instrucción secundaria? Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............  ...........................

b. ¿cuál es la probabilidad de que sea una persona con instrucción técnica y sin experiencia? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : …………………………………………………………….

123

Estadística para Comunicadores

Se pide calcular: P............  ...........................

c. ¿cuál es la probabilidad de que sea mujer? Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............  ...........................

d. ¿cuál es la probabilidad de que sea una persona con experiencia? Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............  ...........................

e. ¿cuál es la probabilidad de que sea una mujer sin experiencia previa? Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular: P............  ...........................

Ejercicios de aplicación 1. Se llevó a cabo un estudio de satisfacción del servicio de cafetería entre los estudiantes de la universidad, específicamente entre estudiantes de cuatro facultades: Administración, Ingeniería, Derecho y Arquitectura. La satisfacción del servicio se midió en una escala de 1100. Los datos se resumen en la siguiente tabla:

Ocupación Administración Arquitectura Derecho Ingeniería Total

Calificación de la satisfacción Menos de 50 50-59 60-69 70-79 10 21 22 11 16 23 24 13 10 24 20 10 12 20 25 14

80-89 11 10 13 12

Total

124

Estadística para Comunicadores

Si se selecciona al azar a uno de los estudiantes que participaron en el estudio: a. b. c. d.

¿Cuál es la probabilidad de que haya dado un puntaje de 70 ó más? ¿Cuál es la probabilidad de que haya dado un puntaje de 50 a 59 y que estudie Derecho? ¿Cuál es la probabilidad de que haya dado un puntaje menor de 60? ¿Cuál es la probabilidad de que el puntaje haya sido menor de 60 o estudie Administración? e. ¿Cuál es la probabilidad de que estudie Arquitectura y su puntaje no haya sido por lo menos 60? 2. En la siguiente tabla se muestra la distribución de una muestra de 200 empleados de una empresa según su género, estado civil y opinión respecto al ambiente laboral. Género Opinión Buena Regular Mala Total

Femenino Masculino Estado civil Estado Civil Soltero Casado Divorciado Soltero Casado Divorciado 25 9 6 35 6 10 4 22 7 11 21 3 2 5 15 3 7 9 31 36 28 49 34 22

Total 91 68 41 200

Si se selecciona un empleado al azar: a. b. c. d.

¿Cuál es la probabilidad de que sea mujer? ¿Cuál es la probabilidad de que su opinión con respecto al ambiente laboral no sea mala? ¿Cuál es la probabilidad de que sea una mujer soltera? ¿Cuál es la probabilidad de que tenga una buena opinión del ambiente laboral y sea soltero? e. ¿Cuál es la probabilidad de que no tenga una buena opinión del ambiente laboral o sea mujer? f. ¿Cuál es la probabilidad de que sea hombre, divorciado y tenga una mala opinión del ambiente laboral? 3. Cada año, en nuestro país se denuncian alrededor de siete mil violaciones y cerca de 100 mil casos de violencia familiar. Al seleccionar una muestra de mujeres y preguntarles ¿qué tipo de violencia sufrió?, ¿cuál es su estado civil? y ¿tiene hijos? La información se presenta en la siguiente tabla: Solteras (E)

Tipo de violencia

Casadas (F)

Sin hijos (G)

Con hijos (H)

Sin hijos (G)

Con hijos (H)

Total

Abuso sexual

(A)

22

35

42

18

117

Maltrato físico

(B)

26

52

44

50

172

Maltrato psicológico (C)

36

28

38

45

147

Otros

15

10

12

27

64

(D)

125

Estadística para Comunicadores

Total

99

125

136

140

500

Si se selecciona al azar a una mujer: a. ¿Cuál es la probabilidad de que la mujer sea soltera y haya sufrido de maltrato físico? b. ¿Cuál es la probabilidad de que la mujer no tenga hijos y no haya sufrido abuso sexual? c. ¿Cuál es la probabilidad que la mujer sea casada con hijos o haya sufrido un maltrato psicológico?

Variable aleatoria Sea  un experimento aleatorio y  el espacio muestral asociado. Una variable aleatoria es una descripción numérica del resultado de un experimento. Una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales. El valor numérico de la variable aleatoria depende del resultado del experimento. Una variable aleatoria puede ser discreta o continua, depende del tipo de valores numéricos que asuma. Las variables aleatorias se designan por letras mayúsculas (X, Y, Z, etc.), y a sus valores por letras latinas minúsculas.

X : Rango o recorrido: Se denomina así al conjunto de valores posibles que puede asumir la variable aleatoria X. Se denota por RX. Ejemplo Sea el experimento aleatorio  que consiste en registrar el tiempo en que se mete el primer gol de un partido de fútbol durante los 90 minutos de juego,   x   / 0  x  90 . Si se define la variable aleatoria X como el tiempo registrado, entonces el rango o recorrido es RX  x   / 0  x  90 .

Estadística para Comunicadores

126

Variable aleatoria continua: Distribución normal Es la distribución de probabilidad más usada para describir variables aleatorias continuas. Ejemplos:  

Peso, en kilogramos Estatura, en centímetros

Función de densidad de probabilidad normal 1  x    

2

  1 f x   e 2  2

Se dice que la variable aleatoria X sigue una distribución normal con parámetros  y 2. Se denota por X ~ N (, 2)

Características      

La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de tendencia central coinciden. El punto más alto se encuentra sobre la media. El rango de la variable normal es toda la recta real, esto es, de – a + . Las colas nunca chocan con el eje horizontal, X. La desviación estándar determina que tan plana o que tan ancha será la curva normal. Si el valor de la desviación estándar es grande implica mayor dispersión en los datos Toda el área bajo la curva normal es igual a uno. Como la distribución es simétrica significa que el área a la derecha de la media es igual a 0,50 y el área a la izquierda de la media es también igual a 0,50.

Estandarización: Se toma como referencia una distribución normal estándar ( = 0 y 2 = 1). Se trabaja con la distancia entre x y  en función de la desviación estándar, tal como se muestra. Z

X  

Notación: Z ~Normal (0,1) y se lee: La variable aleatoria Z tiene distribución normal estándar con media igual a 0 y varianza igual a 1.

127

Estadística para Comunicadores

Función acumulada: F(z) = P[Z  z]

La distribución de la variable Z se encuentra tabulada en la tabla de la normal estándar. A continuación se presentan los diversos casos:

Caso 1

Caso 2

Caso 3

128

Estadística para Comunicadores

TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal:  P  Z  z     Z -3.9 -3.8 -3.7 -3.6 -3.5 -3.4 -3.3 -3.2 -3.1 -3.0

-0.09 0.000033 0.000050 0.000075 0.000112 0.000165 0.000242 0.000349 0.000501 0.000711 0.001001

-0.08 0.000034 0.000052 0.000078 0.000117 0.000172 0.000251 0.000362 0.000519 0.000736 0.001035

-0.07 0.000036 0.000054 0.000082 0.000121 0.000178 0.000260 0.000376 0.000538 0.000762 0.001070

-0.06 0.000037 0.000057 0.000085 0.000126 0.000185 0.000270 0.000390 0.000557 0.000789 0.001107

-0.05 0.000039 0.000059 0.000088 0.000131 0.000193 0.000280 0.000404 0.000577 0.000816 0.001144

-0.04 0.000041 0.000062 0.000092 0.000136 0.000200 0.000291 0.000419 0.000598 0.000845 0.001183

-0.03 0.000042 0.000064 0.000096 0.000142 0.000208 0.000302 0.000434 0.000619 0.000874 0.001223

-0.02 0.000044 0.000067 0.000100 0.000147 0.000216 0.000313 0.000450 0.000641 0.000904 0.001264

-0.01 0.000046 0.000069 0.000104 0.000153 0.000224 0.000325 0.000466 0.000664 0.000935 0.001306

-0.00 0.000048 0.000072 0.000108 0.000159 0.000233 0.000337 0.000483 0.000687 0.000968 0.001350

-2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 -2.2 -2.1 -2.0

0.00139 0.00193 0.00264 0.00357 0.00480 0.00639 0.00842 0.01101 0.01426 0.01831

0.00144 0.00199 0.00272 0.00368 0.00494 0.00657 0.00866 0.01130 0.01463 0.01876

0.00149 0.00205 0.00280 0.00379 0.00508 0.00676 0.00889 0.01160 0.01500 0.01923

0.00154 0.00212 0.00289 0.00391 0.00523 0.00695 0.00914 0.01191 0.01539 0.01970

0.00159 0.00219 0.00298 0.00402 0.00539 0.00714 0.00939 0.01222 0.01578 0.02018

0.00164 0.00226 0.00307 0.00415 0.00554 0.00734 0.00964 0.01255 0.01618 0.02068

0.00169 0.00233 0.00317 0.00427 0.00570 0.00755 0.00990 0.01287 0.01659 0.02118

0.00175 0.00240 0.00326 0.00440 0.00587 0.00776 0.01017 0.01321 0.01700 0.02169

0.00181 0.00248 0.00336 0.00453 0.00604 0.00798 0.01044 0.01355 0.01743 0.02222

0.00187 0.00256 0.00347 0.00466 0.00621 0.00820 0.01072 0.01390 0.01786 0.02275

-1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 -1.2 -1.1 -1.0

0.02330 0.02938 0.03673 0.04551 0.05592 0.06811 0.08226 0.09853 0.11702 0.13786

0.02385 0.03005 0.03754 0.04648 0.05705 0.06944 0.08379 0.10027 0.11900 0.14007

0.02442 0.03074 0.03836 0.04746 0.05821 0.07078 0.08534 0.10204 0.12100 0.14231

0.02500 0.03144 0.03920 0.04846 0.05938 0.07215 0.08691 0.10383 0.12302 0.14457

0.02559 0.03216 0.04006 0.04947 0.06057 0.07353 0.08851 0.10565 0.12507 0.14686

0.02619 0.03288 0.04093 0.05050 0.06178 0.07493 0.09012 0.10749 0.12714 0.14917

0.02680 0.03362 0.04182 0.05155 0.06301 0.07636 0.09176 0.10935 0.12924 0.15151

0.02743 0.03438 0.04272 0.05262 0.06426 0.07780 0.09342 0.11123 0.13136 0.15386

0.02807 0.03515 0.04363 0.05370 0.06552 0.07927 0.09510 0.11314 0.13350 0.15625

0.02872 0.03593 0.04457 0.05480 0.06681 0.08076 0.09680 0.11507 0.13567 0.15866

-0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 -0.0

0.16109 0.18673 0.21476 0.24510 0.27760 0.31207 0.34827 0.38591 0.42465 0.46414

0.16354 0.18943 0.21770 0.24825 0.28096 0.31561 0.35197 0.38974 0.42858 0.46812

0.16602 0.19215 0.22065 0.25143 0.28434 0.31918 0.35569 0.39358 0.43251 0.47210

0.16853 0.19489 0.22363 0.25463 0.28774 0.32276 0.35942 0.39743 0.43644 0.47608

0.17106 0.19766 0.22663 0.25785 0.29116 0.32636 0.36317 0.40129 0.44038 0.48006

0.17361 0.20045 0.22965 0.26109 0.29460 0.32997 0.36693 0.40517 0.44433 0.48405

0.17619 0.20327 0.23270 0.26435 0.29806 0.33360 0.37070 0.40905 0.44828 0.48803

0.17879 0.20611 0.23576 0.26763 0.30153 0.33724 0.37448 0.41294 0.45224 0.49202

0.18141 0.20897 0.23885 0.27093 0.30503 0.34090 0.37828 0.41683 0.45620 0.49601

0.18406 0.21186 0.24196 0.27425 0.30854 0.34458 0.38209 0.42074 0.46017 0.50000

129

Estadística para Comunicadores

TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal:  P  Z  z     Z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

0.00 0.50000 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75804 0.78814 0.81594

0.01 0.50399 0.54380 0.58317 0.62172 0.65910 0.69497 0.72907 0.76115 0.79103 0.81859

0.02 0.50798 0.54776 0.58706 0.62552 0.66276 0.69847 0.73237 0.76424 0.79389 0.82121

0.03 0.51197 0.55172 0.59095 0.62930 0.66640 0.70194 0.73565 0.76730 0.79673 0.82381

0.04 0.51595 0.55567 0.59483 0.63307 0.67003 0.70540 0.73891 0.77035 0.79955 0.82639

0.05 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.80234 0.82894

0.06 0.52392 0.56356 0.60257 0.64058 0.67724 0.71226 0.74537 0.77637 0.80511 0.83147

0.07 0.52790 0.56749 0.60642 0.64431 0.68082 0.71566 0.74857 0.77935 0.80785 0.83398

0.08 0.53188 0.57142 0.61026 0.64803 0.68439 0.71904 0.75175 0.78230 0.81057 0.83646

0.09 0.53586 0.57535 0.61409 0.65173 0.68793 0.72240 0.75490 0.78524 0.81327 0.83891

1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9

0.84134 0.86433 0.88493 0.90320 0.91924 0.93319 0.94520 0.95543 0.96407 0.97128

0.84375 0.86650 0.88686 0.90490 0.92073 0.93448 0.94630 0.95637 0.96485 0.97193

0.84614 0.86864 0.88877 0.90658 0.92220 0.93574 0.94738 0.95728 0.96562 0.97257

0.84849 0.87076 0.89065 0.90824 0.92364 0.93699 0.94845 0.95818 0.96638 0.97320

0.85083 0.87286 0.89251 0.90988 0.92507 0.93822 0.94950 0.95907 0.96712 0.97381

0.85314 0.87493 0.89435 0.91149 0.92647 0.93943 0.95053 0.95994 0.96784 0.97441

0.85543 0.87698 0.89617 0.91309 0.92785 0.94062 0.95154 0.96080 0.96856 0.97500

0.85769 0.87900 0.89796 0.91466 0.92922 0.94179 0.95254 0.96164 0.96926 0.97558

0.85993 0.88100 0.89973 0.91621 0.93056 0.94295 0.95352 0.96246 0.96995 0.97615

0.86214 0.88298 0.90147 0.91774 0.93189 0.94408 0.95449 0.96327 0.97062 0.97670

2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9

0.97725 0.98214 0.98610 0.98928 0.99180 0.99379 0.99534 0.99653 0.99744 0.99813

0.97778 0.98257 0.98645 0.98956 0.99202 0.99396 0.99547 0.99664 0.99752 0.99819

0.97831 0.98300 0.98679 0.98983 0.99224 0.99413 0.99560 0.99674 0.99760 0.99825

0.97882 0.98341 0.98713 0.99010 0.99245 0.99430 0.99573 0.99683 0.99767 0.99831

0.97932 0.98382 0.98745 0.99036 0.99266 0.99446 0.99585 0.99693 0.99774 0.99836

0.97982 0.98422 0.98778 0.99061 0.99286 0.99461 0.99598 0.99702 0.99781 0.99841

0.98030 0.98461 0.98809 0.99086 0.99305 0.99477 0.99609 0.99711 0.99788 0.99846

0.98077 0.98500 0.98840 0.99111 0.99324 0.99492 0.99621 0.99720 0.99795 0.99851

0.98124 0.98537 0.98870 0.99134 0.99343 0.99506 0.99632 0.99728 0.99801 0.99856

0.98169 0.98574 0.98899 0.99158 0.99361 0.99520 0.99643 0.99736 0.99807 0.99861

3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9

0.998650 0.999032 0.999313 0.999517 0.999663 0.999767 0.999841 0.999892 0.999928 0.999952

0.998694 0.999065 0.999336 0.999534 0.999675 0.999776 0.999847 0.999896 0.999931 0.999954

0.998736 0.999096 0.999359 0.999550 0.999687 0.999784 0.999853 0.999900 0.999933 0.999956

0.998777 0.999126 0.999381 0.999566 0.999698 0.999792 0.999858 0.999904 0.999936 0.999958

0.998817 0.999155 0.999402 0.999581 0.999709 0.999800 0.999864 0.999908 0.999938 0.999959

0.998856 0.999184 0.999423 0.999596 0.999720 0.999807 0.999869 0.999912 0.999941 0.999961

0.998893 0.999211 0.999443 0.999610 0.999730 0.999815 0.999874 0.999915 0.999943 0.999963

0.998930 0.999238 0.999462 0.999624 0.999740 0.999822 0.999879 0.999918 0.999946 0.999964

0.998965 0.999264 0.999481 0.999638 0.999749 0.999828 0.999883 0.999922 0.999948 0.999966

0.998999 0.999289 0.999499 0.999651 0.999758 0.999835 0.999888 0.999925 0.999950 0.999967

Estadística para Comunicadores

Ejemplo 1. Dada una distribución normal estandarizada. ¿cuál es la probabilidad de que: a. Z sea menor a 1,08?

b. Z esté entre –0,21 y la media?

c. Z sea mayor que 1,08?

d. ¿Cuál será el valor máximo de Z tal que el 15,87% de los valores son menores a Z?

130

Estadística para Comunicadores

131

e. ¿Cuál será el valor mínimo de Z tal que el 15,87% de los valores son mayores a Z?

2. Suponga que el tiempo que emplean los suscriptores de la revista B&C en leer la publicación tiene distribución normal con media de 49 minutos y desviación estándar de 16 minutos. a. ¿Cuál es la probabilidad de que un suscriptor seleccionado al azar tarde por lo menos una hora en leer la publicación? X= tiempo empleado por los suscriptores de la revista B&C en leer la publicación X  N(=49 , 2 = 162) P X  60  PZ  0,69  1  PZ  0,69  1  0,75490  0,2451

b. ¿Cuál es el tiempo máximo que debe emplear un suscriptor de esta revista para pertenecer al 34% de suscriptores que emplean menos tiempo en leer la publicación? P X  Xmáx  0,34

Xmáx     P Z    0,34   

PZ  a   0,34

a  0,41 Reemplazando  Xmáx = 42,44 min

Estadística para Comunicadores

132

3. El consumo mensual de energía eléctrica en kw de una ciudad tiene distribución normal con media de 140 kw, con una desviación estándar de 20 kw. a. ¿Cuál es la probabilidad que un hogar tenga un consumo menor de 150 kw? b. ¿Qué porcentaje de hogares registran un consumo entre 115 y 160 kw? c. Calcule el consumo mínimo de energía eléctrica para estar en el 15% de los mayores consumidores. Solución La variable en estudio es …...………………………………………………………….…….. Sus parámetros son:  = ……………………..……. y 2 = ………………………………. a. ¿Cuál es la probabilidad que un hogar tenga un consumo menor de 150 kw?

b. ¿Qué porcentaje de hogares registran un consumo entre 115 y 160 kw?

c. Calcule el consumo mínimo de energía eléctrica para estar en el 15% de los mayores consumidores.

Estadística para Comunicadores

133

4. El pago promedio de los corresponsales de una cadena de TV es de 11,90 dólares diario con desviación estándar es 0,40 dólares diario. Si se supone que los pagos se distribuyen normalmente. ¿Qué porcentaje de corresponsales de esta cadena de TV reciben pagos diarios: Solución La variable en estudio es …...…………………………………………………….…….. Sus parámetros son:  = ………………………. y 2 = …………………..…………. a. menores de 11?

b. mayores a 12,95?

c. entre 10,8 y 12,4?

d. entre 12,2 y 13,10?

Estadística para Comunicadores

134

e. ¿Cuál debe ser el pago mínimo para tener la seguridad de que sólo el 10% de los corresponsales ganan más de dicha cantidad?

f. ¿Cuál debe ser el pago máximo para tener la seguridad que sólo el 25% de los corresponsales reciben menos de dicha cantidad?

5. El costo, en dólares, de las cámaras fotográficas semiprofesionales es una variable aleatoria que sigue una distribución normal con media de 700 dólares y desviación estándar 5,5 dólares. Solución La variable en estudio es …...……………………………………………………….…….. Sus parámetros son:  = …………………..……. y 2 = ………………………………. a. Si se escoge una cámara al azar ¿cuál es la probabilidad que su costo sea mayor a 710 dólares?

Estadística para Comunicadores

135

b. Si se escoge una cámara al azar ¿cuál es la probabilidad que su costo esté entre 685 y 705 dólares?

c. Los usuarios manifiestan que el 15,151% de las cámaras semiprofesionales son muy fáciles de usar y por lo tanto de menores precios ¿cuál es el costo máximo de estas cámaras de fácil uso?

Ejercicios de aplicación 1. El ingreso mensual de los redactores de noticia tiene distribución normal con media $900 y una desviación estándar de $100. a. Si se elige al azar un redactor de noticia. ¿cuál es la probabilidad de que su ingreso sea menor que $800? b. Si el 5% de los redactores de noticia con mayores ingresos deben pagar impuestos. ¿a partir de que ingreso se debe pagar impuestos?

Estadística para Comunicadores

136

2. Las puntuaciones de una prueba de aptitud académica tomada a 900 postulantes de una cadena internacional de noticias están distribuidas normalmente con media de 60 puntos y desviación estándar de 10 puntos. a. ¿Qué porcentaje de postulantes obtuvo una puntuación mayor a 75 puntos? b. ¿Cuántos postulantes recibieron una puntuación entre 40 y 50 puntos? c. Si el 12,3 % de los postulantes con mayor puntuación reciben el calificativo A y el 20% de los postulantes con menor puntuación reciben el calificativo C. Calcular la mínima puntuación que debe tener un postulante a esta cadena internacional de noticias para recibir un A y la máxima puntuación que debe tener un postulante para recibir un calificativo C. 3. Una estación de noticias que se transmite en AM encuentra que el tiempo que los radioescuchas sintonizan la estación sigue una distribución normal con media de 15 minutos y desviación estándar de 3,5 minutos. Si se elige un radioescucha al azar: a. ¿Cuál es la probabilidad sintonice la estación más de 20 minutos? b. ¿Cuál es el tiempo máximo para que un radioescucha se encuentre en el 12,1% de radioescuchas que menos tiempo escuchan esta estación? 4. Supóngase que los gastos durante un ciclo académico de los estudiantes de diseño publicitario tienen distribución normal con media de 30 soles y desviación estándar de 5 soles. a. ¿Cuál es la probabilidad de que un alumno seleccionado al azar haya tenido un gasto superior a 35 soles? b. ¿Cuál es la probabilidad de que un alumno seleccionado al azar haya tenido un gasto menor a 32,50 pero mayor a 27,50 soles? 5. Las compañías que miden las audiencias de programas de televisión y estaciones de radio para los anunciantes y transmisoras se conocen como servicios de ratings. Si una de estas compañías determinó que los puntos de ratings de las ediciones diarias del programa magazín ABC siguen una distribución normal con media 23,1 puntos y una desviación estándar de 1,6 puntos. a. Si se selecciona al azar una edición de este programa, ¿cuál es la probabilidad de que su ratings se encuentren entre 21,2 puntos y 25,3 puntos? b. ¿Cuánto debe ser el rating mínimo para estar comprendido en el 12.1% de las ediciones de este programa con mayores puntos de ratings? 6. La televisión es el medio publicitario por excelencia: permite mostrar la idea en movimiento, con color y sonido. El producto propio de la televisión es el spot o anuncio. La duración de un spot publicitario sigue una distribución normal con una media de 48 segundos y una desviación estándar de 12 segundos.

Estadística para Comunicadores

137

a. Calcule la probabilidad de que un spot publicitario dure más de 45 segundos. b. ¿Cuál es la duración mínima aproximada que debe tener un spot publicitario para estar dentro del 18% de los spots que más duran?

Autoevaluación 7. Se tiene información que los costos de los spots publicitarios realizado por la empresa PubliNegocios se distribuye normalmente con moda igual a 42 000 dólares y desviación estándar de 3500 dólares. a. Si se selecciona al azar un spot publicitario elaborado por dicha empresa ¿cuál es la probabilidad que su costo haya sido menor de 30 000 dólares? a. b. c. d. e. f. g. h. i. j. k. l. m. n. o. p. q. r. s. t. u. v. w. x. y. z. aa. bb. cc. dd. ee. ff. gg. hh. ii. jj. kk. ll. mm.nn. oo. pp. qq. rr. ss. tt. uu. vv. ww.xx. yy. zz. aaa.bbb.ccc.ddd.eee.fff. ggg.hhh.iii. jjj. kkk.lll. mmm. nnn.ooo.ppp.qqq.rrr. sss. ttt. uuu.vvv.www. xxx.yyy.zzz. aaaa. bbbb. cccc. dddd. eeee. ffff.gggg. hhhh. iiii. jjjj. kkkk. llll. mmmm. nnnn. oooo. pppp. qqqq. rrrr.ssss.tttt. uuuu. vvvv. wwww. xxxx. yyyy. zzzz. aaaaa. bbbbb. ccccc. ddddd. eeeee. fffff.ggggg. hhhhh. iiiii.jjjjj.kkkkk. lllll.mmmmm. nnnnn. ooooo. ppppp. qqqqq. rrrrr.sssss. ttttt.uuuuu. vvvvv. wwwww. xxxxx. yyyyy. zzzzz. aaaaaa. bbbbbb. cccccc. dddddd. eeeeee. ffffff. gggggg. hhhhhh. iiiiii.jjjjjj.kkkkkk. llllll.mmmmmm. nnnnnn. oooooo. pppppp. qqqqqq. rrrrrr. ssssss. tttttt.uuuuuu. vvvvvv. wwwwww. xxxxxx. yyyyyy. zzzzzz. aaaaaaa. bbbbbbb. ccccccc. ddddddd. eeeeeee. fffffff. ggggggg. hhhhhhh. iiiiiii. jjjjjjj. kkkkkkk. lllllll. mmmmmmm. nnnnnnn. ooooooo. ppppppp. qqqqqqq. rrrrrrr. sssssss. ttttttt. uuuuuuu. vvvvvvv. wwwwwww. xxxxxxx. yyyyyyy. zzzzzzz. b. ¿Qué porcentaje de los spots publicitarios elaborados por la empresa PubliNegocios tienen costos entre 41 000 y 43 000 dólares? aaaaaaaa. bbbbbbbb. cccccccc. dddddddd. eeeeeeee. ffffffff. gggggggg. hhhhhhhh. iiiiiiii. jjjjjjjj. kkkkkkkk. llllllll. mmmmmmmm. nnnnnnnn. oooooooo. pppppppp. qqqqqqqq. rrrrrrrr. ssssssss. tttttttt. uuuuuuuu. vvvvvvvv. wwwwwwww. xxxxxxxx. yyyyyyyy. zzzzzzzz.

aaaaaaaaa. bbbbbbbbb. ccccccccc. ddddddddd. eeeeeeeee. fffffffff. ggggggggg. hhhhhhhhh. iiiiiiiii. jjjjjjjjj. kkkkkkkkk. lllllllll. mmmmmmmmm. nnnnnnnnn. ooooooooo. ppppppppp. qqqqqqqqq. rrrrrrrrr. sssssssss. ttttttttt. uuuuuuuuu. vvvvvvvvv. wwwwwwwww. xxxxxxxxx. yyyyyyyyy. zzzzzzzzz. aaaaaaaaaa. bbbbbbbbbb. cccccccccc. dddddddddd. eeeeeeeeee. ffffffffff. gggggggggg. hhhhhhhhhh. iiiiiiiiii. jjjjjjjjjj. kkkkkkkkkk. llllllllll. mmmmmmmmmm. nnnnnnnnnn. oooooooooo. pppppppppp. qqqqqqqqqq. rrrrrrrrrr. ssssssssss. tttttttttt. uuuuuuuuuu. vvvvvvvvvv. wwwwwwwwww. xxxxxxxxxx. yyyyyyyyyy. zzzzzzzzzz. aaaaaaaaaaa. bbbbbbbbbbb. ccccccccccc. ddddddddddd. eeeeeeeeeee. fffffffffff. ggggggggggg. hhhhhhhhhhh. iiiiiiiiiii. jjjjjjjjjjj. kkkkkkkkkkk. lllllllllll. mmmmmmmmmmm. nnnnnnnnnnn. ooooooooooo. ppppppppppp. qqqqqqqqqqq. rrrrrrrrrrr. sssssssssss. ttttttttttt. uuuuuuuuuuu. vvvvvvvvvvv. wwwwwwwwwww. xxxxxxxxxxx. yyyyyyyyyyy. zzzzzzzzzzz. aaaaaaaaaaaa. bbbbbbbbbbbb. cccccccccccc. dddddddddddd. eeeeeeeeeeee. ffffffffffff. gggggggggggg. hhhhhhhhhhhh. iiiiiiiiiiii. jjjjjjjjjjjj. kkkkkkkkkkkk. llllllllllll. mmmmmmmmmmmm. nnnnnnnnnnnn. oooooooooooo. pppppppppppp. qqqqqqqqqqqq. rrrrrrrrrrrr. ssssssssssss. tttttttttttt. uuuuuuuuuuuu. vvvvvvvvvvvv. wwwwwwwwwwww. xxxxxxxxxxxx. yyyyyyyyyyyy. zzzzzzzzzzzz aaaaaaaaaaaaa. bbbbbbbbbbbbb. ccccccccccccc. ddddddddddddd. eeeeeeeeeeeee. fffffffffffff. ggggggggggggg. hhhhhhhhhhhhh. iiiiiiiiiiiii. jjjjjjjjjjjjj. kkkkkkkkkkkkk. lllllllllllll. mmmmmmmmmmmmm. nnnnnnnnnnnnn. ooooooooooooo. ppppppppppppp. qqqqqqqqqqqqq. rrrrrrrrrrrrr. sssssssssssss. ttttttttttttt. uuuuuuuuuuuuu. vvvvvvvvvvvvv. wwwwwwwwwwwww. xxxxxxxxxxxxx. yyyyyyyyyyyyy. zzzzzzzzzzzz aaaaaaaaaaaaaa. bbbbbbbbbbbbbb. cccccccccccccc. dddddddddddddd. eeeeeeeeeeeeee. ffffffffffffff. gggggggggggggg. hhhhhhhhhhhhhh. iiiiiiiiiiiiii. jjjjjjjjjjjjjj. kkkkkkkkkkkkkk. llllllllllllll. mmmmmmmmmmmmmm. nnnnnnnnnnnnnn. oooooooooooooo. pppppppppppppp. qqqqqqqqqqqqqq. rrrrrrrrrrrrrr. ssssssssssssss. tttttttttttttt. uuuuuuuuuuuuuu. vvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxx. yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaa. bbbbbbbbbbbbbbb. ccccccccccccccc. ddddddddddddddd. eeeeeeeeeeeeeee. fffffffffffffff. ggggggggggggggg. hhhhhhhhhhhhhhh. iiiiiiiiiiiiiii. jjjjjjjjjjjjjjj. kkkkkkkkkkkkkkk. lllllllllllllll. mmmmmmmmmmmmmmm. nnnnnnnnnnnnnnn. ooooooooooooooo. ppppppppppppppp. qqqqqqqqqqqqqqq. rrrrrrrrrrrrrrr. sssssssssssssss. ttttttttttttttt. uuuuuuuuuuuuuuu. vvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxx. yyyyyyyyyyyyyy zzzzzzzzzzzz

c. El 30% de los sopts más costos se los va clasificar como “muy rentables” ¿cuál es el valor mínimo que debe tener un spot para estar considerado en este grupo? aaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbb. cccccccccccccccc. dddddddddddddddd. eeeeeeeeeeeeeeee. ffffffffffffffff. gggggggggggggggg. hhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkk. llllllllllllllll. mmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnn. oooooooooooooooo. pppppppppppppppp. qqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrr. ssssssssssssssss. tttttttttttttttt. uuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx. yyyyyyyyyyyyyy zzzzzzzzzzzz

aaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbb. ccccccccccccccccc. ddddddddddddddddd. eeeeeeeeeeeeeeeee. fffffffffffffffff. ggggggggggggggggg. hhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkk. lllllllllllllllll. mmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnn. ooooooooooooooooo. ppppppppppppppppp. qqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrr. sssssssssssssssss. ttttttttttttttttt. uuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbb. cccccccccccccccccc. dddddddddddddddddd. eeeeeeeeeeeeeeeeee. ffffffffffffffffff. gggggggggggggggggg. hhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkk. llllllllllllllllll. mmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnn. oooooooooooooooooo. pppppppppppppppppp. qqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrr. ssssssssssssssssss. tttttttttttttttttt. uuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbb. ccccccccccccccccccc. ddddddddddddddddddd. eeeeeeeeeeeeeeeeeee. fffffffffffffffffff. ggggggggggggggggggg. hhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkk. lllllllllllllllllll. mmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnn. ooooooooooooooooooo. ppppppppppppppppppp. qqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrr. sssssssssssssssssss. ttttttttttttttttttt. uuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbbb. cccccccccccccccccccc. dddddddddddddddddddd. eeeeeeeeeeeeeeeeeeee. ffffffffffffffffffff. gggggggggggggggggggg. hhhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkkk. llllllllllllllllllll. mmmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnnn. oooooooooooooooooooo. pppppppppppppppppppp. qqqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrrr. ssssssssssssssssssss. tttttttttttttttttttt. uuuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbbbb. ccccccccccccccccccccc. ddddddddddddddddddddd. eeeeeeeeeeeeeeeeeeeee. fffffffffffffffffffff. ggggggggggggggggggggg. hhhhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkkkk. lllllllllllllllllllll. mmmmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnnnn. ooooooooooooooooooooo. ppppppppppppppppppppp. qqqqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrrrr. sssssssssssssssssssss. ttttttttttttttttttttt. uuuuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvvvv. wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz

Estadística para Comunicadores

138

aaaaaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbbbbb. cccccccccccccccccccccc. dddddddddddddddddddddd. eeeeeeeeeeeeeeeeeeeeee. ffffffffffffffffffffff. gggggggggggggggggggggg. hhhhhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkkkkk. llllllllllllllllllllll. mmmmmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnnnnn. oooooooooooooooooooooo. pppppppppppppppppppppp. qqqqqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrrrrr. ssssssssssssssssssssss. tttttttttttttttttttttt. uuuuuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvvvvv wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbbbbbb. ccccccccccccccccccccccc. ddddddddddddddddddddddd. eeeeeeeeeeeeeeeeeeeeeee. fffffffffffffffffffffff. ggggggggggggggggggggggg. hhhhhhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkkkkkk. lllllllllllllllllllllll. mmmmmmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnnnnnn. ooooooooooooooooooooooo. ppppppppppppppppppppppp. qqqqqqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrrrrrr. sssssssssssssssssssssss. ttttttttttttttttttttttt. uuuuuuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvvvvv wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz aaaaaaaaaaaaaaaaaaaaaaaa. bbbbbbbbbbbbbbbbbbbbbbbb. cccccccccccccccccccccccc. dddddddddddddddddddddddd. eeeeeeeeeeeeeeeeeeeeeeee. ffffffffffffffffffffffff. gggggggggggggggggggggggg. hhhhhhhhhhhhhhhhhhhhhhhh. iiiiiiiiiiiiiiiiiiiiiiii. jjjjjjjjjjjjjjjjjjjjjjjj. kkkkkkkkkkkkkkkkkkkkkkkk. llllllllllllllllllllllll. mmmmmmmmmmmmmmmmmmmmmmmm. nnnnnnnnnnnnnnnnnnnnnnnn. oooooooooooooooooooooooo. pppppppppppppppppppppppp. qqqqqqqqqqqqqqqqqqqqqqqq. rrrrrrrrrrrrrrrrrrrrrrrr. ssssssssssssssssssssssss. tttttttttttttttttttttttt. uuuuuuuuuuuuuuuuuuuuuuuu. vvvvvvvvvvvvvvvvvvvvvv wwwwwwwwwwwwww xxxxxxxxxxxxxxxx yyyyyyyyyyyyyy zzzzzzzzzzzz

Estadística para Comunicadores

Unidad 4 Inferencia Estadística

Logro: Al término de la Unidad 4, el estudiante toma decisiones aplicando las pruebas de hipótesis en la solución de problemas comerciales.

Temas de la unidad: 



 

Estimación puntual: Estimadores puntuales de la media y proporción. Estimación por intervalo: Intervalo de confianza de la media. Intervalo de confianza para la proporción. Tamaño de muestra. Prueba de hipótesis: Conceptos generales. Prueba de hipótesis para la media. Prueba de hipótesis para la proporción. Prueba de hipótesis para dos varianzas. Prueba de hipótesis para dos medias de muestras independientes. Prueba de hipótesis para dos muestras relacionadas. Prueba de hipótesis para dos proporciones.

139

Estadística para Comunicadores

140

Unidad 4. Inferencia Estadística Estimación puntual

Estimación por intervalo

• Es la estimación del valor del parámetro por medio de un único valor obtenido mediante el cálculo o evaluación de un estimador para una muestra específica. • El estimador se expresa mediante una fórmula, por ejemplo la media de la muestra es un estimador puntual de la media poblacional µ.

•Como no se puede esperar que un estimador puntual sea el valor exacto del parámetro que se desea estimar, se suele calcular una estimación de dicho parámetro por intervalo. •La estimación por intervalo establece un intervalo dentro del cual es muy probable que se encuentre el parámetro que se desea estimar.

Nivel de confianza El nivel de confianza se usa para indicar la probabilidad de que una estimación por intervalo contenga al parámetro que se desea estimar.

Margen de error El margen de error es el valor que se suma y se resta a la estimación puntual con objeto de obtener un intervalo de estimación para el parámetro que se desea estimar. Se le denota por e. En esta unidad se muestra cómo obtener una estimación por intervalo para la media poblacional µ y para la proporción poblacional p. La fórmula general para obtener una estimación por intervalo para la media poblacional es IC    x  Margen de

error

La fórmula general para obtener una estimación por intervalo para la proporción poblacional es IC p   pˆ  Margen de

error

Estadística para Comunicadores

141

Estimación por intervalo Partiendo de que Z  N(0,1) lo que se busca es encontrar un valor de Z1 tal que el intervalo (-Z1  Z  Z1) tenga una alta probabilidad de ocurrencia ( 1   ) es decir: P(Z1  Z  Z1 )  1  

.................. (a)

Ahora si X  N(  ,  ) entonces: 2

Z 

X 

x

.......................................(b)

Reemplazando (b) en (a) tenemos que:

    X   P   Z1   Z1   P X  Z1 x    X  Z1 x     x   l1 l2   Como X es una variable aleatoria entonces los límites del intervalo de confianza l1 y l2 serán también variables aleatorias mientras no se reemplacen los valores obtenidos en una muestra. Interpretación del nivel de confianza

Estadística para Comunicadores

142

El gráfico ilustra la interpretación del nivel de confianza para el intervalo de confianza para la media.

Para los distintos posibles valores de la media muestral, obtenemos distintos intervalos de confianza

La mayor parte incluye al verdadero valor del parámetro, pero otros no.

Si el nivel de confianza es del 95%, extiste un 95% de confianza de que el intervalo contenga al verdadero valor del parámetro y el 5% restante no lo contenga.

En la práctica disponemos de una única repetición del experimento, y por tanto de un único intervalo de confianza, el señalado en negro en el gráfico, por ejemplo.

Confiamos en que nuestro intervalo contenga al verdadero valor del parámetro aunque no tenemos la seguridad de que sea así, tenemos un riesgo del 5% de equivocarnos.

Estadística para Comunicadores

143

Distribución t-Student  

Se dice que la variable aleatoria t sigue una distribución t con v grados de libertad. Para un valor de la variable aleatoria t, v es tal que el área a su derecha bajo la curva de la distribución t con v grados de libertad es igual a .

Características de la distribución t- Student       

Es simétrica y tiene forma de campana. Su rango se extiende de - a + La gráfica de la distribución t es parecida a la distribución normal, se diferencian en: Los extremos la distribución t está por encima de la normal estándar. El centro de la distribución t está por debajo de la normal estándar. Cada valor de grado de libertad determina una distribución t distinta. Cuando los grados de libertad son altos, los valores de la distribución t se asemejan con los valores de la distribución normal estándar (n > 29).

Ejemplo de gráficos de la distribución t-Student para diferentes grados de libertad

144

Estadística para Comunicadores

Intervalo de confianza para la media poblacional  Si x y S son la media y la desviación estándar de una muestra aleatoria de tamaño n de una población con varianza  2 desconocida, un intervalo de confianza de ( 1   )x100% para  está dado por:

x  t / 2,n1

Donde

S S    x  t / 2,n1 n n

t /2 es el valor t con (n -1) grados de libertad que deja un área de  / 2 a la derecha.

También puede ser expresado de la siguiente manera: IC(µ) = x̅ ± t (α⁄2 ; n−1)

 

s √n

Población Finita: es el conjunto compuesto por una cantidad limitada de elementos, como el número de estudiantes de una universidad, el número de obreros de una fábrica, etc. Población Infinita: es la que tiene un número extremadamente grande de componentes, como la cantidad de productos que hay en el mercado.

Si la población es finita, es decir, conocemos N el tamaño de la población, el error estándar será:

S N n n N 1 y los límites del intervalo de confianza se calculan con la siguiente fórmula: x  t / 2,n1

S n

N n S    x  t / 2,n1 N 1 n

N n N 1

Ejemplos 1. El jefe del área de prensa de un diario desea evaluar la habilidad de su equipo de trabajo en la escritura de una misma noticia. Para realizar dicho estudio selecciona al azar una muestra aleatoria de redactores obteniendo los siguientes resultados (en minutos): 3,2 6,3

4,8 7,9

5,3 8,2

9,1 7,9

6,3 6,9

8,2 9,3

6,5 8,6

9,6 6,8

10,3 10,1

8,6 9,0

145

Estadística para Comunicadores

Asumiendo que los tiempos de escritura se distribuyen normalmente. Calcule e interprete un intervalo del 95% de confianza para el tiempo medio utilizado en la escritura de una noticia. Solución:

IC (  )  7,645  2,0930

(1,8597) (1,8597)    7,645  2,0930 20 20

Efectuando operaciones se tiene: 6,75    8,11 Interpretación: Existe un 95% de confianza de que el intervalo [6,75; 8,11] minutos, contenga a la verdadera media del tiempo utilizado por todos los redactores en la escritura de una noticia.

2. Suponga que el tiempo de duración, en minutos, de los informes periodísticos de un magazín dominical tiene una distribución normal. De un total de 150 informes periodísticos se toma una muestra de 10 y se registra la siguiente información: 25,5

26,8

24,2

25,0

27,3

26,1

23,2

28,4

27,8

25,7

Calcule e interprete un intervalo del 95% de confianza para el tiempo de duración promedio de los informes periodísticos. Solución Como conocemos N =150, entonces la fórmula a utilizar es: x  t / 2,n1

S n

N n S    x  t / 2,n1 N 1 n

N n N 1

Reemplazando: 26  2, 26216

1, 62 150  10 1, 62 150  10    26  2, 26216 10 150  1 10 150  1

Efectuando operaciones se tiene: 24,88    27,12 Interpretación: Con 95% de confianza se puede afirmar que el intervalo: [24,88; 27,12] contiene al verdadero tiempo promedio de duración (en minutos) de los informes periodístico del magazín.

Estadística para Comunicadores

146

3. Un analista de investigación de mercados quiere estimar el ingreso familiar promedio de una

determinada población. a. Calcule e interprete un intervalo de confianza del 95% si en una muestra aleatoria de tamaño 20 de esta población se encontró que el ingreso familiar promedio era de $500 con una desviación estándar de $100. Asuma que la variable tiene distribución normal. b. Si la población consta de 2000 habitantes, determine el intervalo de confianza del 90%. Interprete. Solución a. Calcule e interprete un intervalo de confianza del 95% si en una muestra aleatoria de tamaño 20 de esta población se encontró que el ingreso familiar promedio era de $500 con una desviación estándar de $100. Asuma que la variable tiene distribución normal. Tamaño de muestra n = ………………,

promedio x = ……………..…. y

desviación estándar ………. = ……………. 1- = ……………   =……………… y t / 2, n 1 = ………………..

Efectuando las operaciones se tiene: Interpretación:

[……………… ; ………………]

Estadística para Comunicadores

147

b. Si la población consta de 2000 habitantes, determine el intervalo de confianza del 90%. Interprete. Si el tamaño de la población N = …………… , entonces:

Efectuando las operaciones se tiene:

[……………… ; ………………]

Interpretación:

4. El fabricante de una nueva línea de impresoras de inyección de tinta desea incluir como parte de su publicidad, el número de páginas que el usuario puede imprimir con un cartucho. Una muestra tomada al azar de 25 cartuchos reveló que el número promedio de páginas es de 2 154 con una desviación estándar igual a 24. Si la variable en estudio tiene distribución normal. Calcule e interprete un intervalo de confianza del 97% para el número promedio poblacional de páginas que el usuario puede imprimir con un cartucho. Solución x = …………. y s = ……………. , 1- = ……………   =……………… t / 2, n 1

= ………………..

148

Estadística para Comunicadores

Efectuando las operaciones se tiene:

[……………… ; ………………]

Interpretación:

Ejercicios de aplicación 1. A un grupo de 15 estudiantes se les sometió a un test de inteligencia y se registró los tiempos que utilizaron para realizar dicho test: 3,4 4,8

2,8 2,9

4,4 5,6

2,5 5,2

3,3 3,7

4,0 3,0

3,6 2,8

4,8

Bajo el supuesto de que los tiempos tienen una distribución normal. Calcule e interprete un intervalo de confianza del 90% para estimar el verdadero tiempo promedio que utilizaría un estudiante para desarrollar el test de inteligencia. 2. Se sabe que el número de tazas de café que se pueden preparar con una lata de café de la marca COLCA de 125 gr. sigue una distribución Normal. Se selecciona una muestra de 10 latas de este tipo de café y se utilizó una medida fija para la preparación de las tazas de café. Los resultados obtenidos fueron: 285 291 279 288 282 285 291 279 288 282 Calcule e interprete un intervalo de confianza del 98% para estimar el número promedio de tazas de cafés que se pueden preparar. 3. Una muestra de 427 suscriptores de una prestigiosa revista de vinos mostró que el tiempo promedio que pasa un suscriptor visitando la Web es de 10,70 horas semanales con varianza de 16,50 horas semanales2. Calcule e interprete un intervalo del 94% de confianza para el verdadero tiempo promedio que pasan los suscriptores semanalmente visitando la Web si la revista cuenta con un total de 1764 suscriptores. 4. El precio de los espacios periodísticos en el diario X en la sección de clasificados en un tamaño de 3cm x 4cm. durante los meses de febrero a agosto del 2010 fueron: 45

52

43

56

41

42

43

Calcule e interprete un intervalo de confianza al 90% para el precio promedio poblacional durante el 2010. Asuma que la variable tiene distribución normal.

149

Estadística para Comunicadores

5. El gasto anual en videojuegos de los jóvenes de una ciudad sigue una distribución normal con una desviación estándar de 18 dólares. Elegida una muestra al azar de 144 jóvenes se ha obtenido un gasto promedio de 120 dólares. Calcule e interprete un intervalo de confianza al 99 % para el gasto medio en videojuegos de todos los jóvenes de esa ciudad. 6. Un reportaje periodístico sobre consumo de cigarrillos en jóvenes universitarios de Lima Metropolitana, indicó que el gasto promedio mensual en cigarrillos de jóvenes universitarios fumadores es de 50 soles. Para comprobarlo, la oficina de Apoyo al alumno de una universidad selecciona al azar una muestra de 9 estudiantes que fuman y registró el gasto mensual en cigarrillos (en soles). Los resultados obtenidos se muestran a continuación: 39

48

55

62

35

74

45

52

32

Suponga que el gasto mensual en cigarrillos tiene distribución normal, con un nivel de confianza del 98% ¿será cierta la afirmación del reportaje? 7. La empresa KreaPubli tiene a la empresa Imagen como su mayor competencia, por lo que el gerente de KreaPubli ha decidido estimar el costo de sus spot que elabora su competencia seleccionando al azar una muestra de 6 spots elaborados por Imagen obteniendo los siguientes resultados, en miles de dólares: 23

25

55

19

33

38

Asumiendo que los costos por spots tienen una distribución normal. Estime e interprete al 95% de confianza el intervalo para el verdadero costo promedio por spot que la empresa Imagen elabora. 8. Una de las ofertas más frecuentes y que congrega a gran cantidad de compradores en los supermercados Metro, es la famosa frase “pague dos y lleve tres” en tallarines Don Vittorio. Un estudiante de Periodismo que lleva el curso de Estadística para Comunicadores quiere verificar si el contenido de las bolsas de fideo Don Vittorio es de 500 gramos tal como se indica en la etiqueta del producto. Asumiendo que el contenido de las bolsas de fideo sigue una distribución normal. Calcule e interprete un intervalo del 98% de confianza para el verdadero peso promedio de las bolsas de fideo, si en una muestra de 300 bolsas se obtuvo un peso promedio de 499 gramos con desviación estándar de 8 gramos. 9. La empresa publicitaria Agnosis cuenta actualmente con 200 trabajadores y en los últimos meses ha observado un alto porcentaje de trabajadores que llegan tarde, por lo que tiene entre sus planes implementar un servicio de transporte. Para este fin, la oficina de Recursos Humanos seleccionó una muestra de 16 trabajadores y estimó que el tiempo promedio que demora un trabajador en llegar al trabajo es de 45 minutos con desviación estándar de 10 minutos. Calcule e interprete un intervalo del 95% de confianza para el tiempo promedio de llegada de todos los trabajadores de la empresa.

Estadística para Comunicadores

150

Tamaño de muestra para estimar la media de una población Cuando la varianza poblacional es desconocida Al iniciar cualquier investigación, la pregunta que surge es ¿cómo podemos determinar el tamaño óptimo de una muestra? ¿Bastará con aplicar un cuestionario a 100 personas? o, ¿Será necesario encuestar a 500 individuos? ¿Cómo influye la variabilidad de las respuestas de cada encuestado? ¿Qué margen de error tendrán los resultados hallados en la encuesta? Las respuestas a cada una de estas preguntas nos la da la Estadística. A la hora de determinar el tamaño que debe alcanzar una muestra hay que tener en cuenta: el parámetro a estimar, el margen de error o error de estimación, la varianza poblacional y el nivel de confianza.

Márgen de error

Nivel de confianza

Varianza poblacional

•Es la diferencia entre un estadístico y su parámetro correspondiente. •Nos da una idea clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. •Un estadístico será más preciso cuando su error sea más pequeño.

•Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero valor del parámetro.

•Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

La fórmula para determinar el tamaño de muestra es:

 z  S   n   1 / 2  e  

2

151

Estadística para Comunicadores

 El valor de S puede ser estimada a partir de una muestra preliminar o piloto.  Si la población es finita; es decir, se conoce el tamaño de la población, el tamaño de muestra se corrige con la siguiente fórmula:

nc 

n 1

n N

Ejemplo Universal es una nueva emisora de carácter político y a una semana de estar al aire cuenta ya con 300 radioescuchas. El gerente de Universal desea realizar un estudio para estimar el tiempo de conexión promedio de los oyentes ¿Cuál debe ser el tamaño de muestra de oyentes que se necesita si desea tener un error de estimación de 0,15 horas con un nivel de confianza del 95%. Al seleccionar una muestra piloto se obtuvieron los siguientes resultados, en horas: 3,2 6,3

4,8 7,9

5,3 8,2

9,1 7,9

6,3 6,9

8,2 9,3

6,5 8,6

9,6 6,8

10,3 10,1

Solución e = 0,15 , s = 1,8597

,

Z (0,975) = 1,96 y N = 300

El tamaño de la muestra se obtiene con la siguiente fórmula: 2

 1,96 x 1,8597  n0     590,49  591 0,15   Como el tamaño de la población es conocida se debe corregir la muestra:

n

591  198,87  199 591 1 300

Se necesitará entrevistar una muestra de 199 radioescuchas.

8,6 9,0

152

Estadística para Comunicadores

Ejercicios 1. ¿Cuál debe ser el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que demoran los estudiantes en llegar a la universidad con un nivel de confianza del 94% y con un error de estimación de 0,1 horas? Una muestra piloto de 8 alumnos arrojó los siguientes resultados: 2,0

1,5

0,45

1,45

1,0

0,30

1,20

1,30

Solución: e = …………

desviación estándar = ……. = …………………

El valor de Z(…………………) = …………

Luego, se debe encuestar a ……………………………………………….

2. La gerencia de un diario local desea estimar el gasto promedio mensual que las familias destinan a la compra de diarios. La gerencia desea que sus resultados tengan un nivel de confianza del 95% y un error de estimación no mayor a 3 soles. Si la desviación estándar de los gastos en compra de diarios en una muestra piloto fue de 20 soles ¿Qué tamaño de muestra deberá seleccionar? Solución: e = ………

desviación estándar = ……. = …………………

El valor de Z(…………………) = …………

Luego, se debe encuestar a ……………………………………………….

153

Estadística para Comunicadores

Ejercicios de aplicación 1. Se desea realizar una encuesta para estimar el número promedio de amigos que los jóvenes tienen en su cuenta de Facebook. Con un error de estimación de 25 amigos y con un nivel de confianza del 95%, determine el tamaño de muestra adecuado si en una muestra piloto se obtuvo que el valor de la desviación estándar del número de amigos es igual a 42. 2. La máquina de refrescos de una universidad está ajustada de tal manera que la cantidad de líquido despachada se distribuye aproximadamente en forma normal. ¿Qué tan grande se requiere que sea la muestra si se desea tener una confianza de 98% de que su media muestral esté dentro de 0,09 decilitros del promedio real? Se cuenta con la siguiente información de una muestra preliminar o piloto de tamaño 24. 1,99 2,52

2,59 2,48

2,04 2,14

1,86 1,98

2,58 2,29

2,04 2,02

2,73 1,94

2,51 1,82

2,65 2,53

2,72 2,38

2,44 2,39

2,29 2,43

3. Una editorial desea evaluar el tiempo promedio de distribución de su último best seller en cada uno de sus 400 puntos de venta. Para este estudio se desea tener un error de estimación de 3 minutos con un nivel de confianza del 90%, se sabe además que la desviación estándar de los tiempos de distribución es de 17 minutos. ¿Qué tamaño de muestra debe emplearse para el estudio? 4. La gerencia de un diario local quiere determinar la cantidad mensual promedio que las familias gastan en compra de diarios. En una muestra piloto se obtuvo que la desviación estándar de los gastos fue de 20 soles. Si la gerencia desea tener una confianza del 95% en la información recopilada y no quiere que el error de tolerancia sea mayor a tres soles. ¿Qué tamaño de muestra deberá seleccionar para determinar el gasto familiar mensual promedio? 5. Se planea una encuesta para determinar los gastos mensuales en campañas publicitarias de las 4500 empresas de una ciudad. Para este estudio se desea tener un error de estimación de 50 soles para los gastos mensuales con una confianza del 95%. Se sabe además que la desviación estándar de los gastos mensuales en campañas publicitarias en una muestra preliminar fue de 400 soles ¿Cuál será el tamaño de muestra a seleccionar?

Estadística para Comunicadores

154

Autoevaluación 1. Una muestra de 532 suscriptores de los 9 500 con los que cuenta una revista, mostró que el tiempo promedio que pasa un suscriptor en Internet es de 6,7 horas semanales. Si la desviación estándar de la muestra de suscriptores es de 5,8 horas semanales. Calcule e interprete un intervalo del 95% de confianza para el verdadero tiempo promedio que pasan los suscriptores de esta revista en Internet.

2. El ingreso mensual de una muestra piloto de egresados de la carrera de periodismo de cierta universidad tiene una desviación estándar de 2000 soles ¿De qué tamaño debe tomarse la muestra si se desea tener un margen de error de 500 soles para la estimación del ingreso promedio mensual de los egresados de la carrera de periodismo con una confianza del 90%?

155

Estadística para Comunicadores

Intervalo de confianza para la proporción poblacional Si pˆ es la proporción de éxitos en una muestra aleatoria de tamaño n y qˆ  1  pˆ , la proporción de fracasos, un intervalo de confianza aproximado de ( 1   ) x100% para el parámetro p está dado por:

pˆ  Z1 / 2

pˆ qˆ pˆ qˆ  p  pˆ  Z1 / 2 n n

Donde 

Z1 / 2 es el valor Z que deja un área de 1-α/2 a la izquierda y



p ˆ 

a , donde a = número de éxitos en la muestra. n

También puede ser expresado de la siguiente manera: IC(p)  pˆ  z (1 / 2)

pˆ (1  pˆ ) n

qˆ  1  pˆ

Si conocemos el tamaño de la población N, los límites del intervalo de confianza para p se calcula con la siguiente fórmula:

pˆ  Z1 / 2

pˆ qˆ N  n pˆ qˆ N  n  p  pˆ  Z1 / 2 n N 1 n N 1

Ejemplos 1. El dueño de un diario se interesa en la proporción de reporteros varones que cometen errores al momento de entregar el reporte final. Al seleccionar una muestra aleatoria de 100 reporteros varones encontró que 24 cometían errores. Calcule e interprete un intervalo de confianza del 99% para la verdadera proporción de reporteros varones que cometen errores al momento de entregar el reporte final. Solución La estimación puntual de p es pˆ 

0,24  2,58

24  0,24 100

y

Z 0,995  2,58

(0,24)(0,76) (0,24)(0,76)  p  0,24  2,58 100 100

Efectuando las operaciones indicadas se tiene: 0,1298  p  0,3502

156

Estadística para Comunicadores

Interpretación: Existe un 99% de confianza de que el intervalo [0,1298; 0,3502] contenga la verdadera proporción poblacional de reporteros varones que cometen errores al momento de entregar el reporte final. O en forma equivalente: Existe un 99% de confianza que entre [13;35]% se encuentre el verdadero porcentaje de reporteros varones que cometen errores al momento de entregar el reporte final.

2. Una encuesta realizada por una emisora radial acerca de los accidentes automovilísticos a 814 adultos de Lima Metropolitana, ante la pregunta ¿cree usted que el principal problema se debe al estado de ebriedad de los conductores?, se obtuvo que 562 adultos contestaron que sí. ¿Cuál es el valor de la amplitud del intervalo al 98% de confianza para la verdadera proporción de adultos que no creen que el principal problema sea el estado de ebriedad de los conductores? Solución El tamaño de muestra n = ……….. Calculemos la proporción muestral pˆ 

 .......................

El nivel de confianza (1-α) es …..…..……, entonces z

1



 .............................

2

Consideramos a la población ………………….………., (finita o infinita)

Luego, el intervalo será es IC p   [................... ; ................... ] Interpretación

157

Estadística para Comunicadores

3. Los resultados de un estudio socioeconómico realizado a una muestra aleatoria de 100 comerciantes informales arrojó lo siguiente: un ingreso medio de $600, una desviación estándar de $50 y sólo un 30% de comerciantes informales tiene ingresos superiores a $800. Estime la proporción de todos los comerciantes informales con ingresos superiores a $800 mediante un intervalo del 98% de confianza. Solución Calculemos la proporción muestral pˆ 

 .......................

El nivel de confianza (1-α) es …..…..……, entonces z

1

 2

.............................

Consideramos a la población ………………….………., (finita o infinita)

Luego, el intervalo será es IC p   [................... ; ................... ] Interpretación

158

Estadística para Comunicadores

4. En una muestra aleatoria de 400 videocámaras se recogió información respecto a la situación

operativa de éstas y se encontró que 40 estaban defectuosas. Estime e interprete el intervalo de confianza al 90% para la verdadera proporción de videocámaras defectuosas sabiendo que en total existen 2000 videocámaras. Solución Calculemos la proporción muestral pˆ 

 .......................

El nivel de confianza (1-α) es …..…..……, entonces z

1



 .............................

2

Consideramos a la población ………………….………., (finita o infinita)

Luego, el intervalo será es IC p   [................... ; ................... ] Interpretación

Estadística para Comunicadores

159

Ejercicios de aplicación 1. Para contrarrestar la menor demanda interna, algunos fabricantes peruanos de cuadernos están exportando de tal manera que sus maquinarias estén operativas durante todo el año. Se eligió una muestra de 1200 cuadernos en el año 2012 y 2013 respectivamente, cuyos resultados se presentan a continuación: Empresas exportadoras de cuadernos (2012) % de Empresa cuadernos Aw Faber Castell Peruano 39,6 Novo Plast Industrial 23,3 Papelera Nacional 4,0 Artesco 8,8 Otros 24,3

Empresas exportadoras de cuadernos (2013) % de Empresa cuadernos Aw Faber Castell Peruano 27,9 Novo Plast Industrial 12,2 Papelera Nacional 4,3 Artesco 41,3 Otros 14,5

Determine un intervalo de confianza del 90% para la proporción de cuadernos que exportó Papelera Nacional en el año 2013. 2. Una reportera de la revista Byte desea realizar una encuesta para determinar la verdadera proporción de todos los estudiantes universitarios que poseen Tablet. Para realizar este estudio tomo una muestra de 1285 alumnos y encontró que 320 tenían Tablet. Encuentre un intervalo de confianza al 97,5% para la verdadera proporción de estudiantes que poseen Tablet e interprete el resultado obtenido. 3. El director de personal de una agencia desea estimar la proporción de empleados a los que les falta menos de un año para jubilarse. Se selecciona una muestra aleatoria simple de 85 registros de empleados y se encuentra que a cinco les falta menos de un año para jubilarse. Calcule e interprete una estimación por intervalo del 98% para la proporción verdadera de empleados que se encuentran en esta situación en toda la empresa si en dicha agencia existen 290 empleados. 4. La empresa Taco Ahora está evaluando los resultados de su ingreso al mercado de una ciudad. El encargado de la campaña publicitaria de dicha empresa pregunta a 900 residentes elegidos de manera aleatoria si han ido a Taco Ahora en el último mes. De los entrevistados, 300 respondieron que sí. Calcule e interprete un intervalo del 99% de confianza para el porcentaje verdadero de los residentes de la ciudad que no han ido a Taco Ahora en el último mes. 5. En una investigación realizada por una agencia publicitaria se preguntó a una muestra de 320 individuos si conocían un refresco determinado. Si 180 de los encuestados respondieron que sí, calcule e interprete con un 95% de confianza la verdadera proporción de individuos de dicha población que conoce el producto.

Estadística para Comunicadores

160

6. La compañía Sandson acaba de lanzar una nueva campaña publicitaria y le ha pedido a Investigaciones Inland Market que lleve a cabo una encuesta para comprobar en qué medida se retiene la publicidad en la mente del cliente. Inland Market llevo a cabo 120 encuestas telefónicas para determinar la proporción de entrevistados que recordaron el nuevo eslogan o lema publicitario y encontró que 90 de los entrevistados lo recordaron. Determine la estimación por intervalo para la verdadera proporción de entrevistados que recuerdan el eslogan con un 99% de confianza. Interprete. 7. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas. Calcule e interprete un intervalo de confianza del 90% para la proporción de los reproductores de discos compactos de la población que no pasan todas las pruebas. 8. En una muestra aleatoria de 500 personas se encontró que 300 votarán por el candidato A en las próximas elecciones. Estimar la proporción de todos los electores que votarán por el candidato A mediante un intervalo de confianza del 95% si se sabe que hay una población electoral de 7500 personas.

Tamaño de muestra para estimar una proporción poblacional Cuando se dispone de información muestral Si pˆ se utiliza como una estimación de “p” podemos tener una confianza del ( 1   )x100% de que el error será menor de una cantidad específica “e” cuando el tamaño de la muestra es aproximadamente:

z12 / 2 pˆ 1  pˆ  n e2 Si se conoce el tamaño de la población N, entonces el tamaño de muestra se reajusta con la siguiente fórmula: n nc  n 1 N

Estadística para Comunicadores

161

Ejemplos

1. En cierto estudio piloto, el 32% de los 1 600 adultos encuestados dijeron que el programa espacial debe enfatizar la exploración científica. ¿Qué tan grande se necesita que sea la muestra definitiva de adultos en la encuesta si se desea tener una confianza del 95% de que el porcentaje estimado esté dentro del 2% del porcentaje real. Solución El valor de Z1 / 2  1,96 y la estimación del porcentaje de adultos que manifiestan que se debe enfatizar en la exploración científica es del 32% Remplazando en la fórmula del tamaño de muestra:

1,96 2 (0,32)(0,68) n  2089,8 (0,02) 2 El tamaño de muestra con las condiciones solicitadas será 2090 adultos.

2. En una muestra piloto de 500 familias en la ciudad de Lima, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de la proporción de familias suscritas a HBO esté dentro de 0,02 de la proporción verdadera?

Solución Como el nivel de confianza (1-α) es del 95%, entonces α = ……….………. La estimación

pˆ  .................... y el margen de error = ………………

Entonces, el tamaño de muestra para las condiciones propuestas es de …………………..……..

Estadística para Comunicadores

162

Ejercicio En una muestra aleatoria de 300 personas mayores de edad de una gran ciudad se encontró que 105 leían un determinado periódico. De acuerdo a esos datos se pretende seleccionar una nueva muestra para conseguir un error de estimación de 0,03 como máximo, con un nivel de confianza del 98% para la estimación de la proporción de lectores de ese periódico. Encuentre el número de individuos de la población que, como mínimo, debe tener la muestra. Solución Como el nivel de confianza (1-α) es del 98%, entonces α = ……….………. La estimación pˆ  .................... y el margen de error = ………………

Entonces, el tamaño de muestra para las condiciones propuestas es de …………………..

Cuando no se dispone de información muestral 1 El valor de pˆ 1  pˆ  se hace máximo cuando pˆ   0,5 por lo tanto la fórmula para calcular 2

el tamaño de muestra queda de la siguiente manera:

n

z12 / 2 (0,5)  0,5 e2

Si se conoce el tamaño de la población N, entonces el tamaño de muestra se reajusta con la siguiente fórmula:

nc 

n 1

n N

Estadística para Comunicadores

163

Ejemplo 1. Una agencia publicitaria desea hacer una afirmación en su spot publicitario. Para ello lleva a cabo un estudio para estimar el porcentaje de ciudadanos de una gran ciudad que están a favor de que el agua se trate con flúor. ¿Qué tan grande debe ser la muestra que debe seleccionar si se desea tener una confianza de 95% de que la estimación esté dentro del 1% del porcentaje real? Solución El valor de

Z1 / 2  1,96 entonces el tamaño de muestra para un error de 1% es n

1,96 2 (0,5)(0,5)  9604 (0,01) 2

Luego el tamaño de muestra solicitado será 9604 ciudadanos.

2. El alcalde de un distrito desea estimar la proporción de residentes que conocen la propuesta respecto al uso de fondos municipales para mejorar la limpieza del distrito ¿Qué tamaño de muestra necesita seleccionar si requiere una confianza del 98% y un error máximo de estimación de 0,10? Solución Como el nivel de confianza (1-α) es del 98%, entonces α = ……….………. La estimación pˆ  .................... y el margen de error = ………………

Entonces, el tamaño de muestra para las condiciones propuestas es de …………………..

Estadística para Comunicadores

164

3. Usted trabaja en una compañía de investigación de mercado y le han encargado estimar el porcentaje de hogares que tienen Internet en casa, ¿cuántos hogares debe encuestar si desea tener una confianza del 95% de que el porcentaje muestral difiera del poblacional a lo más en 2,5%? Solución Como el nivel de confianza (1-α) es del 95%, entonces α = ……….………. La estimación pˆ  .................... y el margen de error = ………………

Entonces, el tamaño de muestra para las condiciones propuestas es de …………………….….. 4. Para estimar el porcentaje de electores a favor de un candidato, una encuestadora debe determinar el tamaño de la muestra de una población de 10 000 electores ¿Qué tan grande debe ser la muestra si se quiere tener una confianza del 97% y un error de estimación no superior al 4,8%? Solución Como el nivel de confianza (1-α) es del 97%, entonces α = ……….………. La estimación pˆ  .................... y el margen de error = ………………

165

Estadística para Comunicadores

Como N = ………………., entonces el valor de la muestra corregida será:

Finalmente, el tamaño de muestra para las condiciones solicitadas será igual a ………………

Ejercicios de aplicación 1. La alcaldía de Lima desea concientizar a la población a través de la campaña “Si toma no maneje” encargada a una importante agencia publicitaria. Con un 95% de confianza y con un error de estimación no mayor a 3,5% ¿de qué tamaño necesita tomar la muestra la agencia para estimar el porcentaje de todos los ciudadanos a favor de esta campaña? 2. Se realiza un estudio para estimar la proporción de residentes en una ciudad que están a favor de la construcción de una vía expresa. ¿Qué tan grande deber ser una muestra si se quiere una confianza de 97% de que la estimación estará dentro de 0,03 de la proporción real de residentes de la ciudad que están a favor de la construcción de la vía expresa? 3. Una empresa desea estimar la proporción de trabajadores del área de diseño publicitario que están a favor de que se corrija el programa de capacitación que se viene dando actualmente en el área. La estimación debe quedar a menos de 0,08 de la proporción verdadera de los que favorecen el programa de capacitación. Con una confianza del 95% ¿cuántos trabajadores se deben seleccionar? 4. Un supermercado ha adquirido un lote de 2 000 revistas. En adquisiciones anteriores se ha obtenido que la proporción de revistas defectuosas es alrededor de 0,18. ¿Qué tamaño de muestra debe seleccionarse para estimar la proporción de revistas defectuosas en este lote si se desea tener un error de estimación de 0,04 con una confianza del 90%? 5. Una reportera de la revista Byte desea realizar una encuesta para estimar la verdadera proporción de estudiantes universitarios que poseen Tablet y quiere tener una confianza del 96% con un margen de error de 0,035. Suponga que en un estudio previo obtuvo un estimado de la proporción que reveló un porcentaje del 29% de estudiantes universitarios que poseen Tablet. ¿A cuántos estudiantes universitarios deberá encuestar?

Estadística para Comunicadores

166

Autoevaluación 1. Una empresa de cadena de cines (A) está interesada en evaluar un nuevo spot publicitario de una conocida marca de bebida gaseosa que se proyecta en el bloque previo a la proyección del film de entretenimiento. El equipo de investigación de dicha cadena de cines, decidió tomar una muestra de 230 espectadores de los 1200 espectadores que acuden al cine regularmente los fines de semana en el local del centro de la ciudad. A estos espectadores se les entrevistó con la finalidad de averiguar el nivel de percepción del spot publicitario. El resumen de los resultados se muestra a continuación: Nivel de percepción Baja Media Alta

Número de espectadores 70 125 35

Estime el porcentaje de espectadores que tuvieron un nivel de percepción alta del nuevo spot publicitario al 98% de confianza.

2. El gerente de la cadena de cines ha decidido mantener el nuevo spot publicitario en las semanas siguientes si el porcentaje de espectadores con un nivel de percepción alta o media es mayor del 60%. Considerando un nivel de significancia del 5%, ¿qué decisión tomará el gerente?

167

Estadística para Comunicadores

Prueba de Hipótesis La prueba de hipótesis involucra una suposición sobre el valor de un parámetro de la población. A partir de la información proporcionada por la muestra se verificará la suposición sobre el parámetro estudiado. La hipótesis que se contrasta se llama hipótesis nula (Ho). Partiendo de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula a favor de la alternativa, o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación inicial del parámetro poblacional podría ser correcto. El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa simplemente que los datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula.

Tipos de errores Conclusión Condición de la población

No rechazar H0

Rechazar H0

H0 verdadera

Conclusión correcta

Error de tipo I = 

H0 falsa

Error de tipo II = 

Conclusión correcta

Error Tipo I

• Ocurre cuando se rechaza una hipótesis H0 que es verdadera. La probabilidad de error tipo I viene a ser la probabilidad de rechazar H0 cuando ésta es cierta. • El valor es fijado por la persona que realiza la investigación (por lo general varía entre 1% -10%)

Error Tipo II

• Ocurre cuando se acepta una hipótesis H0 que es falsa, la probabilidad de error tipo II es la probabilidad de aceptar H0 cuando ésta es falsa. • Debido a que el valor real del parámetro es desconocido este error no puede ser fijado.

168

Estadística para Comunicadores

Pasos a seguir en una Prueba de Hipótesis

Paso 1

•Plantear las hipótesis

•Fijar el nivel de significación

Paso 2

Paso 3

•Calcular el estadístico de la prueba

Paso 4

•Graficar las regiones críticas

Paso 5

•Aplicar los criterios de decisión

Paso 6

•Concluir

Prueba de hipótesis para la media poblacional  A continuación consideramos el caso donde se supone que la población sigue una distribución normal y la desviación estándar de la población σ no es conocida, por lo tanto se estimará mediante la desviación estándar muestral, s. En este caso se puede utilizar la distribución t para hacer inferencia acerca del valor de la media de la población. Procedimiento para realizar la prueba de hipótesis 1. Plantear las hipótesis

H 0 :    0  H1 :    0 2. Fijar el nivel de significación: 

H 0 :    0  H1 :    0

H 0 :    0  H1 :    0

169

Estadística para Comunicadores

3. Estadístico de la prueba

t

x  μo S n

El estadístico tiene una distribución t con (n–1) grados de libertad.

4. Graficar las regiones críticas

Bilateral

H1 :    0

Unilateral Izquierda

H1:  < 0

Unilateral Derecha

H1:  > 0

5. Decisión: Rechazar Ho o No rechazar Ho. 6. Concluir. Ejemplos 1. El fabricante de una marca de cigarrillos le afirma a un publicista que sus cigarrillos contienen en promedio a lo más 18 miligramos de nicotina por cigarrillo. El publicista para verificar esta afirmación y colocarla en el cartel publicitario examina una muestra de 20 cigarrillos. Con un nivel de significancia del 2,5% ¿podrá concluir que la afirmación dada por su cliente es cierta si la muestra arrojó un contenido promedio de 19,2 miligramos con desviación estándar de 2 miligramos? Suponga que el contenido de nicotina se distribuye normalmente.

170

Estadística para Comunicadores

Solución Sea X: contenido de nicotina en los cigarrillos (en miligramos) 1. Hipótesis: H 0 :   18  H 1 :   18

2. Nivel de significación:   0,025 3. Estadístico de la prueba

tc 

19,2  18  2,6833 2 / 20

4. Regiones críticas.

No se rechaza Ho

2,09302

5. Decisión: Se rechaza Ho 6. Conclusión: Con 2,5% de nivel de significancia no es posible afirmar que el contenido

promedio de nicotina en los cigarrillos es superior a 18 miligramos. Por lo tanto, no es cierta la afirmación del fabricante.

Aplicación con salida de SPSS Suponga que el peso (en kilogramos) de ciertos paneles publicitarios sigue una distribución normal. Para realizar un control de calidad de los mismos, se tomaron al azar una muestra de 7 de ellos, encontrándose los siguientes resultados: Paneles Peso (en kilos)

1 55,50

2 56,20

3 61,00

4 64,50

5 67,80

6 62,10

7 56,70

Se desea probar si la evidencia muestral permiten suponer que el verdadero peso promedio de estos paneles es menos de 59 kilos. Use un α = 0,05

171

Estadística para Comunicadores

Solución: 1. Hipótesis. H 0 :   59  H 1 :   59

2. Nivel de Significación: α = 0,05 3. Prueba Estadística: Salida obtenida con SPSS Prueba para u na mu estra Valor de prueba = 59

t peso

gl .877

6

Sig. (bilateral) .414

Dif erencia de medias 1.54286

95% Interv alo de conf ianza para la dif erencia Inf erior Superior -2.7623 5.8481

4. Decisión: No se rechaza Ho 5. Conclusión: Con 5% de nivel de significación y a partir de la información muestral, no es posible afirmar que el peso promedio de los paneles sea menos de 59 kilos.

Ejercicios

1. A partir de los datos de una muestra aleatoria de 100 estudiantes de Publicidad seleccionados de varias universidades de la ciudad capital, se estimó que su gasto promedio semanal en materiales de estudios (fotocopias e impresiones) es de 32,5 soles con una desviación estándar de 10 soles. Usando un nivel de significación del 5% ¿proporcionan estos datos suficiente evidencia para decir que el verdadero gasto promedio semanal en materiales de estudios de los estudiantes de Publicidad no es igual a 30 soles? Solución Sea X: ……………………………………………………….. 1.

Hipótesis

H 0 :  .....................  H 1 :  ..................... 2. Nivel de significación:  = ……………….

Estadística para Comunicadores

172

3. Estadístico de la prueba

4. Regiones críticas.

5. Decisión.

6. Conclusión:

2. Una cadena de restaurantes de comida rápida afirma en su anuncio publicitario: “Te atendemos en menos de 3 minutos”. Para corroborar esta afirmación se le encarga a usted verificarla y para ello decide seleccionar al azar una muestra de 50 clientes de uno de estos restaurantes encontrando que el tiempo promedio de espera era de 2,75 minutos con una desviación estándar de 1,5 minutos. Si la variable tiene distribución normal ¿será cierta la afirmación dada por esta cadena de restaurantes? Use un nivel de significancia del 5%. Solución Sea X: ………………………………………………………..

Estadística para Comunicadores

1. Hipótesis

H 0 :  .....................  H 1 :  ..................... 2. Nivel de significación:  = ………………. 3. Estadístico de la prueba

4. Regiones críticas.

5. Decisión.

6. Conclusión:

173

174

Estadística para Comunicadores

Ejercicios de aplicación 1. Antes de poder ver una película debe esperar hasta el final de los comerciales, anuncios y cortos de películas. Una cadena de salas de cines afirma que la duración promedio de cualquier anuncio no es mayor de tres minutos. Para probar esta afirmación, se seleccionan al azar 18 anuncios y se encontró que en promedio duraban 3,25 minutos con una desviación estándar de 0,5 minutos ¿Será cierto lo afirmado por la cadena de salas de cines? Use =1%. Suponga que la duración de los anuncios en las salas de cine se distribuye normalmente. 2. Unos estudiantes de Periodismo y Comunicación desean conocer el tiempo promedio que dura una entrevista a un representante político en los noticieros nocturnos. Para realizar esta prueba tomaron una muestra al azar de 14 noticieros obteniendo un tiempo promedio de 7,4 minutos y una desviación estándar de 0,8 minutos ¿Se puede afirmar que el tiempo promedio que dura una entrevista es mayor a 7,1 minutos? Use α = 0,05 3. Un reportaje periodístico sobre consumo de cigarrillos en jóvenes universitarios de Lima Metropolitana, indicó que el gasto promedio mensual en cigarrillos de jóvenes universitarios fumadores es de 50 soles. Para comprobarlo, la oficina de Apoyo al Alumno de una universidad selecciona al azar una muestra de 9 estudiantes que fuman y registró el gasto mensual en cigarrillos, en soles. Los resultados obtenidos se muestran a continuación: 39

48

55

62

35

74

45

52

32

Suponga que el gasto mensual en cigarrillos tiene distribución normal, con un nivel de significancia del 2% ¿será cierta la afirmación del reportaje? 4. El Consejo Municipal de una ciudad está considerando aumentar el número de agentes de policía municipal en un esfuerzo por reducir los delitos. Si el número promedio de robos diarios es mayor a 8 se aumentará el número de agentes. Para poder tomar una decisión el Consejo Municipal tomó una muestra de 36 días y encontró que el número promedio de robos era de 8,75 con una desviación estándar igual a 2 ¿Qué decisión tomará el Consejo Municipal? Suponga que el número de robos sigue una distribución normal. Utilice un nivel de significación del 5% 5. De una empresa que se dedica a la venta de cámaras fotográficas profesionales se tomó una muestra aleatoria de estos artículos y se registró el precio, en soles. Los datos se presentan a continuación: 1199

948

799

658

859

459

689

859

895

699

1299

Asumiendo que las ventas siguen una distribución normal. Pruebe la hipótesis que señala que el verdadero precio promedio de las cámaras fotográficas es superior a 770 soles. Utilice un nivel de significación del 2%.

175

Estadística para Comunicadores

Prueba de hipótesis para una proporción poblacional Esta prueba se realiza para verificar una suposición que se hace sobre una proporción poblacional. En este caso se utilizará la distribución Z para realizar la inferencia. Procedimiento para realizar la prueba de hipótesis 1. Planteamiento de las hipótesis

 H 0 : p  p0   H 1 : p  p0

 H 0 : p  p0   H 1 : p  p0

 H 0 : p  p0   H 1 : p  p0

2. Fijar el nivel de significación:  3. Estadístico de la prueba

Z

pˆ  po po (1  po ) n

4. Graficar las regiones críticas

H1 : p  p0

Bilateral

Unilateral Izquierda

Unilateral Derecha

H1 : p < p0

H1 : p > p0

Estadística para Comunicadores

176

5. Decisión: Rechazar Ho o No rechazar Ho. 6. Concluir.

Ejemplo 1. El administrador de un diario de circulación nacional afirma que menos del 5% de los diarios presentan error de impresión. Si en una muestra aleatoria de 60 diarios se encontró que 6 de ellos presentan error de impresión. Con un nivel de significación del 2,5%, ¿se puede afirmar que el administrador tiene razón? Solución 1. Hipótesis

 H 0 : p  0,05   H 1 : p  0,05 2. Nivel de significación:   0,025 3. Estadístico de la prueba Z

0,1  0,05  1,7770 0,05 (0,95) 60

4. Regiones críticas

No se rechaza Ho

5. Decisión: No rechazar Ho. 6. Conclusión: Con un nivel de significancia del 2,5% no se puede afirmar que menos el 5% de los diarios presenta error de impresión. La afirmación del administrador no es cierta.

Estadística para Comunicadores

177

2. Un programa que se transmite en cable encontró el año pasado que el 40% de las denuncias que recibían sus investigadores por correo electrónico eran por estafa. En el presente año se realizó un estudio similar, en el que al seleccionar una muestra de 420 mensajes electrónicos se encontró que en 188 de ellos eran denuncias por estafas. A un nivel de significación del 5%, ¿usted afirmaría que aumentó la proporción de denuncias por estafa? Solución 1. Hipótesis

 H 0 : p  0,40   H 1 : p  0,40 2. Nivel de significación:   0,05 3. Estadístico de la prueba Z

0,4476  0,40  1,9913 0,40(0,60) 420

4. Regiones críticas

No se rechaza Ho

5. Decisión: Se rechaza Ho 6. Conclusión: Con 5% de nivel de significación se puede afirmar que más del 40% de los investigadores reciben denuncias por estafa vía correo electrónico; por lo tanto, la afirmación es verdadera.

Estadística para Comunicadores

178

Ejercicios 1. El 70% de las campañas publicitarias manejadas por la compañía Cuarzo tienen éxito. Para verificar ésta afirmación se seleccionaron aleatoriamente 80 campañas publicitarias, encontrándose que 50 de ellas tienen éxito. Con un nivel de significancia del 2% ¿será cierta la afirmación? Solución 1. Hipótesis

H 0 : p....................  H 1 : p................... 2. Nivel de significación:  = ………………. 3. Estadístico de la prueba

4. Regiones críticas.

5. Decisión.

6. Conclusión:

179

Estadística para Comunicadores

2. El diario local “Perú XXI” afirmó la semana pasada en su portada principal que más del 30% de los estudiantes de la cierta universidad prefieren como plato preferido el ceviche de pato. El jefe del comedor universitario necesita contrastar dicha hipótesis brindada por este diario, para ello seleccionó una muestra aleatoria de 130 estudiantes de dicha universidad preguntándoles ¿Cuál de los platos que ofrece el comedor universitario es su preferido?, el resultado se resume en el siguiente gráfico: Distribución de estudiantes de cierta universidad según su plato preferido 40%

34.62%

Porcentaje de alumnos

35% 30% 23.08%

25% 20%

15.38%

15.38%

Tallarines

Otros

15% 7.69%

10%

3.85%

5% 0% Lomo Saltado Ceviche de Pato Ají de gallina

Carapulcra

Plato Preferido Fuente: Hipotética

Con un nivel de significancia del 5%, es posible afirmar lo manifestado por el diario local “Perú XXI. Solución 1. Hipótesis

H 0 : p....................  H 1 : p................... 2. Nivel de significación:  = ………………. 3. Estadístico de la prueba

Estadística para Comunicadores

180

4. Regiones críticas.

5. Decisión.

6. Conclusión:

3. El gerente de una tienda de ventas de cámaras fotográficas de la marca Canon realizó un estudio entre género y el tipo de marca de cámaras fotográficas que utilizan los estudiantes de Ciencias de la Comunicación de cierta universidad, para ello se tomó una muestra aleatoria de 200 estudiantes. Los resultados procesados se muestran en la siguiente tabla adjunta. Distribución de estudiantes de Ciencias de la Comunicación según género y marca de cámaras fotográficas que utilizan Marca de cámaras fotográficas Género Total Hasselblad Mamiya Nikom Pentax 30 20 30 40 120 Masculino 20 15 30 15 80 Femenino 50 35 60 55 200 Total

El gerente afirmó que menos del 25% de los estudiantes utilizan cámaras fotográficas de la marca Pentax y son de género masculino. Con un nivel de significancia del 5% ¿Podemos afirmar lo dicho por el gerente? Asuma normalidad. Solución 1. Hipótesis

Estadística para Comunicadores

H 0 : p....................  H 1 : p................... 2. Nivel de significación:  = ………………. 3. Estadístico de la prueba

4. Regiones críticas.

5. Decisión.

6. Conclusión:

181

Estadística para Comunicadores

182

4. Un restaurante de comida rápida planea una oferta especial que permita a los clientes comprar vasos con diseño especial con conocidos personajes de caricaturas. Si más del 15% de los clientes compran esos vasos, se lanzará la promoción. En una prueba preliminar en varios locales, 88 de 500 clientes los compraron ¿Se debe lanzar la promoción especial? Utilizando un nivel de significación del 1%, ¿cuál es su recomendación? Solución 1. Hipótesis

H 0 : p....................  H 1 : p................... 2. Nivel de significación:  = ………………. 3. Estadístico de la prueba

4. Regiones críticas.

5. Decisión.

6. Conclusión:

183

Estadística para Comunicadores

Ejercicios de aplicación 1. De acuerdo a los datos provistos por el Observatorio de Movilidad Urbana, en el año 2010 el 53% de los vehículos de transporte público tenían más de 20 años de antigüedad. Este año, en un local de “Revisiones Técnicas Vehiculares S.A.”, se recogió información de una muestra de 120 vehículos, de los cuales 54 tenían más de 20 años de antigüedad. ¿Se puede afirmar con un 2,5% de significación, que la proporción de vehículos antiguos de transporte público se ha reducido? 2. Una encuesta realizada por una emisora radial a 814 adultos de Lima Metropolitana arrojó que 562 adultos consideraban que el principal problema de los accidentes de tránsito se debía al estado de ebriedad de los conductores ¿Será cierto que más del 70% de adultos considera que el principal problema se debe al estado de ebriedad de los conductores? Concluya para =0,02 3. Se cree que por lo menos el 20% de los estudiantes de la carrera de ciencias de la comunicación desea trabajar en el extranjero al finalizar sus estudios. En una encuesta realizada a una muestra aleatoria de 560 estudiantes se encontró que 85 estaban dispuestos a trabajar en el extranjero al finalizar su carrera. A un nivel de significación del 5% ¿cuál es su conclusión? 4. Diferentes estudios indican que más del 80% de los usuarios usan los buscadores en la web para encontrar información sobre productos y servicios antes de comprarlos. Para verificar esta información se selecciona al azar a 200 personas, de las cuales 170 indicaron que realizaron la consulta en la web antes de comprar. Con un nivel de significación del 2,5% ¿Hay razón para dar credibilidad a dicha afirmación? 5. En abril del 2013 un diario de la capital publicó en base a una encuesta realizada por una prestigiosa encuestadora a una muestra de 2735 limeños el siguiente gráfico: ¿Cuál es su situación laboral? 60%

56%

50% 40% 11%

7%

4%

7%

Otro

12%

10%

Empresario

20%

Informal

30%

Cobra honorarios personales

En planilla/estable

trabajador independiente

0%

situación laboral

Estadística para Comunicadores

184

¿Es posible concluir en base a la información muestral que menos del 60% de los limeños son trabajadores independientes? Use =0,05 6. El Director de la empresa de cable Cablemas afirma que más del 75% de los televidentes con cable tiene instalado Cablemas en sus hogares. Otra compañía de cable que va a realizar un estudio, duda de tal afirmación y lo quiere comprobar. Para ello toma una muestra aleatoria de 60 hogares con servicio de cable y obtiene que 42 hogares tienen instalado el servicio de cable Cablemas ¿Es cierto lo que afirma el Director? Concluya para un nivel de significación del 5%? 7. Se realizó una encuesta a una muestra de 155 alumnos universitarios. Los resultados obtenidos a la pregunta ¿Cuál es tu red social favorita? se muestran en el siguiente gráfico:

Distribución porcentual de alumnos según red social favorita

Usando un nivel de significación del 4% ¿se puede afirmar que más del 63% de los alumnos prefieren Facebook como red social favorita?

185

Estadística para Comunicadores

Autoevaluación Un estudio señalaba, que más del 42% del total de personas de grado superior de estudios, prefieren la TV como medio de comunicación. Para comprobar esta afirmación se ha conducido un nuevo estudio para determinar el medio de comunicación de mayor credibilidad. Los resultados obtenidos de una muestra de 200 entrevistados se presentan en el siguiente gráfico: Distribución porcentual de los entrevistados según medio de comunicación por grado de instrucción

% de encuestados

70%

62%

60% 48%

50% 40%

42%

39%

44% Periódico T.V.

30%

30%

Radio

20%

10%

8%

13%

14%

0%

Primaria

Secundaria

Superior

Grado de instrucción

¿Serra cierta la afirmación del estudio inicial? Utilice un nivel de significación del 1%

Estadística para Comunicadores

186

Prueba de hipótesis para dos varianzas poblacionales Al comparar las varianzas de dos poblaciones normales usaremos datos obtenidos de dos muestras aleatorias independientes, una de la población 1 y la otra de la población 2. Las dos 2 2 varianzas de las muestras, S1 y S2 serán la base para realizar la inferencia acerca de las dos 2 2 varianzas poblacionales 1 y 2 .

Procedimiento para realizar la prueba de hipótesis 1. Plantear las hipótesis 2 2  H 0 :  1   2  2 2  H1 :  1   2

2. Fijar el nivel de significación:  3. Estadístico de la prueba

s12 1 F 2 2 s2  1

~

F( n1 1,n2 1)

 22

4. Graficar las regiones críticas

/2

/2

NO se rechaza Ho

F2

F1

Donde: n1 n2 s12

s

2 2

Fn1 1,n2 1

: Es el tamaño de la muestra de la población 1. : Es el tamaño de la muestra de la población 2. : Es la varianza de la muestra de la población 1. : Es la varianza de la muestra de la población 2. : Es la distribución F con n1–1 y n2–1 grados de libertad.

5. Aplicar los criterios de decisión: Rechazar Ho o No rechazar Ho. 6. Conclusión

187

Estadística para Comunicadores

Ejemplo 1. En un estudio de investigación referente al número de accidentes de tránsito diario que ocurren en Lima según distrito, realizado por el Diario El Comercio, destaca que tanto en el Cercado de Lima y en el Distritito de la Victoria en el año 2008 son los distritos que presentan mayor incidencia de accidentes. Bajo el supuesto de normalidad de la variable en estudio. ¿Con un nivel de significación del 5%, existe evidencia para afirmar que la variabilidad del número accidentes de tránsito diario es diferente para ambos distritos? Cercado (1) La Victoria (2)

Accidentes

70 43

Distrito Cercado La Victoria

90 43

N 7 7

84 51

Media 77.14 51.29

65 56

75 44

85 64

71 58

Desviación estándar 9.263 8.361

Error típico de la media 3.501 3.160

Solución X: Número de accidentes de tránsito diarios 1. Plantear las hipótesis 2 2  H 0 :  1   2  2 2  H 1 :  1   2

2. Fijar el nivel de significación: α= 0,05 3. Estadístico de la prueba F

s12 9,263 2   1,227 s 22 8,3612

4. Graficar las regiones críticas F1 = Ftab (0,025; 6,6) = 5,820 F2 = 1/Ftab (0,025; 6,6) = 0,172

0,025

NO se rechaza Ho

F2= 0,172

0,025 F1= 5,820

5. Decisión: No se rechaza Ho 6. Conclusión: Con un nivel de significación del 5% no es posible afirmar que la variabilidad del número de accidentes de tránsito diario sea diferente en ambos distritos.

188

Estadística para Comunicadores

2. La empresa de investigación de mercados ABC realiza un estudio para evaluar el tiempo que pasan conectados a Internet, por mes, adultos y jóvenes de los niveles socioeconómicos A y B. En un estudio preliminar, se concluyó que, en promedio, los adultos pasan más tiempo conectados a Internet que los jóvenes. Suponga que para confirmarlo esta empresa toma una muestra de 25 adultos y otra de 21 jóvenes. Las desviaciones estándar de las cantidades de tiempo que pasan conectados a Internet son 94 y 58 minutos, respectivamente. ¿Estos resultados favorecen la conclusión que las varianzas de los tiempos que pasan conectados a Internet los adultos es diferente al de los jóvenes? Use = 0,05. Asuma distribución normal. Solución X: Tiempo conectado a Internet, minutos por mes. 1. Hipótesis 2 2  H 0 :  A   J  2 2  H 1 :  A   J

2. Nivel de significación: α= 0,05 3. Estadístico d la prueba F

s12 94 2   2,627 s 22 58 2

4. Regiones Críticas

F1 = Ftab (0,025; 24,20) = 2,41 0,025

F2 = 1/Ftab (0,025; 20,24) = 0,429

0,025

Zona de NO rechazo Ho

F2 = 0,429

F1 = 2,41

5. Decisión: Se rechaza Ho 6. Conclusión: Con un 5% de nivel de significación se puede afirmar que la variabilidad de los tiempos que los adultos están conectados a Internet por mes es diferente al de los jóvenes.

189

Estadística para Comunicadores

Procedimiento para realizar la prueba de hipótesis con el reporte del SPSS 1. Planteamiento de las hipótesis  H 0 :  12   22   H 1 :  12   22

2. Fijar el nivel de significación: α 3. Estadístico de la prueba 4. Criterio y decisión 5. Conclusión

1. En una universidad privada, veinte ingresantes fueron divididos aleatoriamente en dos grupos. Los integrantes de un grupo fueron asignados a una sección de estadística en la que sólo se utilizan materiales programados. Los integrantes del otro grupo fueron asignados a una sección en que enseña un profesor. Al término del semestre, a todos se les aplicó el mismo examen final. Los resultados se presentan en la siguiente tabla: Programado (1) Con un profesor (2)

76 81

60 62

85 87

58 70

91 86

44 77

82 90

64 63

79 85

88 83

¿Se puede concluir que existe diferencia significativa en la variabilidad de las notas de los alumnos de ambos grupos? Use un nivel de significancia del 5%. Solución X: Calificación de examen 1. Hipótesis 2 2  H 0 :  1   2  2 2  H 1 :  1   2

190

Estadística para Comunicadores

2. Nivel de significación: α= 0,05

3. Estadístico de la prueba: F = 2,855 4. Criterio y decisión: Si p > α  No se rechaza Ho Si p < α  Se rechaza Ho Como Sig.= p= 0,108 > α = 0,05  No se rechaza Ho 5. Conclusión: No existe evidencia estadística al nivel de significación del 5% para afirmar que la variabilidad de las notas sea diferente tanto para el método programado como para el método con un profesor.

2. Un estudio de mercado desea comparar los gastos, en soles, en la compostura de dos marcas de laptops realizados por sus propietarios en el tiempo fuera de la garantía que la empresa les otorgó. Al seleccionar 9 propietarios que adquirieron la marca Apple y 7 que adquirieron la marca hp, se obtuvieron los siguientes resultados: Gasto en soles en la compostura de las laptops Marca Apple

322

256

317

315

208

179

324

Marca hp

198

245

187

215

290

198

207

398

321

Prueba de muestras independientes Prueba de Lev ene para la igualdad de v arianzas

F gasto

Se han asumido v arianzas iguales No se han asumido v arianzas iguales

2.581

Sig. .130

Prueba T para la igualdad de medias

t

gl

Sig. (bilateral)

Dif erencia de medias

Error típ. de la dif erencia

95% Interv conf ianza dif eren Inf erior

2.595

14

.021

73.3333

28.2637

12.7136

2.794

12.679

.016

73.3333

26.2441

16.4899

¿Existe evidencia estadística para afirmar que la variabilidad en el monto de gasto por compostura para ambas marcas de laptops es similar? Use un nivel de significación del 10%. Asuma normalidad.

Estadística para Comunicadores

191

Solución X: ……………………………………………………………. 1. Hipótesis

H 0 : ....................  H 1 : .................... 2. Nivel de significación: ………………………….. 3. Estadístico de la prueba

4. Criterio y decisión

5. Conclusión

3. Los siguientes datos corresponden a los tiempos de proyección, en minutos, de las películas producidas por 2 compañías cinematográficas. Después de procesar la información en SPSS se obtuvieron los siguientes resultados:

¿Se puede afirmar que la variabilidad del tiempo promedio de proyección de las películas producidas por ambas compañías no es similar? Use un nivel de significancia del 10% y asuma normalidad. Solución X: …………………………………………………………….

192

Estadística para Comunicadores

1. Hipótesis

H 0 : ....................  H 1 : .................... 2. Nivel de significación: …………………………. 3. Estadístico de la prueba

4. Criterio y decisión

5. Conclusión

Independent Samples Test

4. Una empresa de publicidad de mucho prestigio desea contratar estudiantes de publicidad en calidad de practicantes, con la proyección de que más adelante formen parte del personal de la empresa. Para la selección se realiza una prueba extensa a estudiantes de las dos mejores universidades. Los resultados de la prueba se muestran a continuación. Los puntajes siguen una distribución normal. puntaje Equal v ariances ¿Se puede afirmar con un nivel de significación del 5% que las varianzas assumed de los puntajes son similares en ambas universidades? Solución X: ……………………………………………………………. 1. Hipótesis

H 0 : ....................  H 1 : .................... 2. Nivel de significación: …………………………..

Lev ene's Test f or Equality of Variances

F 2.023

Sig. .167

Estadística para Comunicadores

193

3. Estadístico de la prueba:

4. Criterio y decisión:

5. Conclusión:

Prueba de hipótesis para la diferencia de medias poblacionales Para realizar las pruebas de hipótesis acerca de la diferencia entre las medias de dos poblaciones con varianzas poblacionales desconocidas y poblaciones independientes que siguen una distribución normal, usaremos la distribución t. Aquí las varianzas poblacionales, pueden ser similares o diferentes, para ello será necesario realizar previamente la prueba de la razón de las varianzas poblacionales. Esto afectará al cálculo del error típico de la diferencia de medias muestrales y el grado de libertad del estadístico de prueba. Procedimiento para realizar la prueba de hipótesis con el reporte del SPSS 1. Planteamiento de las hipótesis

 H 0 : 1   2   H 1 : 1   2

 H 0 : 1   2   H 1 : 1   2

2. Fijar el nivel de significación: α 3. Estadístico de la prueba: T student 4. Criterio y decisión 5. Conclusión

 H 0 : 1   2   H 1 : 1   2

Estadística para Comunicadores

194

Ejemplo Ciertos observadores de medios afirman que la cantidad promedio de minutos dedicados a las noticias de negocios y finanzas durante los noticieros de dos canales de televisión no son similares. Para cada canal, seleccionaron de manera aleatoria e independiente diez emisiones semanales y observaron durante la transmisión la cantidad de minutos dedicados a la noticia de negocios y finanzas. Los tiempos, en minutos, medidos en estas muestras independientes se presentan a continuación.

Asumiendo normalidad en el tiempo que dedican a las noticias de negocios y finanzas, ¿es correcta la afirmación de los observadores utilizando un nivel de significación del 10%?

Estadística para Comunicadores

195

Solución X: ………………………………………………………………………….

Ejercicios de aplicación 1. Una empresa de publicidad desea determinar qué tanto éxito han tenido sus nuevos ejecutivos de cuenta en la obtención de clientes. Después de terminar su capacitación, los nuevos ejecutivos pasan varias semanas realizando llamadas a posibles clientes, tratando que abran cuentas con la empresa. Los siguientes datos dan el número de cuentas nuevas abiertas durante las dos primeras semanas por 10 ejecutivas y 8 ejecutivos de cuenta escogidos aleatoriamente.

196

Estadística para Comunicadores

Ejecutivas (1) Ejecutivos (2)

12 13

11 10

14 11

13 12

13 13

14 12

13 10

12 12

14

12

A un nivel de significación de α = 0,05 ¿Parece que las mujeres son más efectivas que los hombres para conseguir nuevas cuentas? 2. Una empresa publicitaria está evaluando a dos equipos de trabajo. La evaluación centra su atención en el tiempo que tardó cada equipo en elaborar una propuesta para una campaña publicitaria. En la tabla se muestran los resultados obtenidos:

Con un nivel de significancia del 5% ¿Considera usted que los equipos tienen la misma eficiencia para elaborar su propuesta? Se sabe que los tiempos están normalmente distribuidos. 3. El gerente de una empresa que comercializa películas tomó una muestra de 13 clientes de su tienda Azul (1) y otra de 16 clientes de su tienda Verde (2) para evaluar el tiempo, en minutos, en que sus clientes son atendidos. Los datos de ambas tiendas se muestran a continuación:

¿Se puede afirmar que el tiempo promedio de atención de la tienda Azul es superior al tiempo promedio de atención de la tienda Verde? Asuma normalidad y concluya para un nivel de significación del 5%.

Estadística para Comunicadores

197

198

Estadística para Comunicadores

Autoevaluación En la Edición 18 del Festival de Cine de Lima se programaron películas de diferente género. Para analizar el gasto de los asistentes en los géneros acción y comedia se seleccionaron muestras independientes. Al procesar los datos en SPSS se obtuvo la siguiente información: Prueba de Levene para la igualdad de varianzas

Prueba T para la igualdad de medias 95% Intervalo de Error típ.

F Gasto realizado durante el festival

Se han asumido varianzas

1,440

Sig.

t ,232

gl

Sig. (bilateral)

Diferencia de

de la

medias

diferencia

confianza para la diferencia Inferior

Superior

,666

308

,507

1,125

1,690

120,22

160,46

,694

127,955

,489

1,125

1,621

112,08

145,33

iguales No se han asumido varianzas iguales

Los organizadores del evento desean comprobar si el gasto promedio realizado este año por los espectadores de películas de acción (1) es mayor al gasto promedio realizado por los espectadores de comedia (2). De ser las películas de acción las que tengan mayor acogida, se ofrecerá en el próximo festival más salas con este tipo de película. Usando un nivel de significancia de 4% ¿qué decisión tomarán los organizadores?

Estadística para Comunicadores

199

Prueba de hipótesis para dos medias poblacionales: Muestras dependientes La prueba estadística t de Student para muestras dependientes es una extensión de la utilizada para muestras independientes. De esta manera, los requisitos que deben satisfacerse son los mismos, excepto la independencia de las muestras; es decir, en esta prueba estadística se exige dependencia entre ambas, en las que hay dos momentos uno antes y otro después. Con ello se da a entender que en el primer período, las observaciones servirán de control o testigo, para conocer los cambios que se susciten después de aplicar una variable experimental. En el diseño con muestras pareadas o dependientes se someten a prueba dos medias poblacionales bajo condiciones similares; por consiguiente, este diseño conduce con frecuencia a un menor error muestral que el diseño con muestras independientes.

Procedimiento para realizar la prueba de hipótesis 1. Planteamiento de las hipótesis

 H 0 : 1   2   H 1 : 1   2

 H 0 : 1   2   H 1 : 1   2

 H 0 : 1   2   H 1 : 1   2

2. Fijar el nivel de significación: α 3. Cálculos. _

d  d tc  ~ t  n 1  gl sd n  

La notación d está dado por la diferencia de cada par de datos teniendo en cuenta el orden de la hipótesis. De estos datos se obtiene el promedio y su desviación estándar.

200

Estadística para Comunicadores

4. Regiones críticas

Bilateral

H1 :  1   2 H1 :  d  0

Unilateral Izquierda

H1 :  1 <  2 H1 :  d < 0

Unilateral Derecha

H1 :  1 >  2 H1 :  d > 0

5. Criterios de decisión: Rechazar Ho o No rechazar Ho. 6. Conclusión.

Ejemplos 1. La publicidad del gimnasio Gym Center asegura que al término del curso de seis meses que ofrece se obtendrá una efectiva pérdida de peso corporal. Una muestra aleatoria de ocho registros seleccionados al azar de este gimnasio permitió observar el peso corporal, en kilos, entre los meses de febrero a julio de ocho participantes que asistieron al curso. Los resultados se muestran a continuación: Participante Febrero 2014 Julio 2014

1 70 69

2 103 93

3 63 66

4 73 71

5 95 88

6 74 68

7 83 77

8 77 74

Si los pesos corporales se distribuyen normalmente y con un nivel de significancia del 5%, ¿se puede afirmar que lo ofrecido por este gimnasio es cierto?

201

Estadística para Comunicadores

Solución Sea X: Peso corporal de los participantes (en kilos) 1. Planteo la hipótesis

H 0 :  F   J   d  0  H 1 :  F   J   d  0 2. Nivel de significación:   0,05 3. Cálculos

tc 

4,0  0

 2,779

4,0708 / 8

4. Regiones críticas.

1.89458

5. Decisión: Rechazo Ho 6. Conclusión: Con 5% de nivel de significación se puede afirmar que al término del curso de 6 meses que ofrece el gimnasio se obtendrá una efectiva pérdida de peso corporal.

2. La gerencia de ventas de una cadena de mercados diseñó un plan de incentivos para sus vendedores. A fin de evaluar este plan se seleccionaron doce vendedores al azar y se registraron sus ventas diarias, en dólares, antes y después de aplicar el plan. Suponga que las ventas antes y después del plan tiene distribución normal. Utilice el nivel de significación de 0,05 para determinar si hubo algún incremento significativo en las ventas de todos sus vendedores debido a la aplicación del plan. Vendedor Antes Después

1 89 94

2 87 91

Solución X: Ventas diarias, en dólares.

3 70 68

4 83 88

5 67 75

6 71 66

7 92 94

8 81 88

9 97 96

10 78 88

11 94 95

12 79 87

202

Estadística para Comunicadores

1. Hipótesis

H 0 :  A   D   d  0  H 1 :  A   D   d  0 Prueba de muestras relacionadas

Par 1

Antes - Despues

Media -3.500

Diferencias relacionadas 95% Intervalo de confianza para la diferencia Desviación Error típ. de típ. la media Inferior Superior 4.583 1.323 -6.412 -.588

t -2.646

gl 11

Sig. (bilateral) .023

2. Nivel de significación : α = 0,05 3. Criterios Si p/2 > α  No se rechaza H0 Si p/2 < α  Se rechaza H0 4. Cálculos: p/2 = 0,023/2 = 0,0115 < α  Se rechaza Ho 5. Conclusión: Con un nivel de significación del 5% y a partir de la información muestral, se puede considerar que después de aplicarse el nuevo plan las ventas promedio diario se incrementaron.

Ejercicios 1. Doce individuos participaron en un experimento para estudiar la efectividad de cierta campaña publicitaria, registrándose la información de sus consumos realizados (en soles) antes y después de observar por televisión la publicidad de dicho producto. Los datos que se presentan a continuación: Sujeto Antes (1) Después (2)

1 201 200

2 231 236

3 221 216

4 260 233

5 228 224

6 237 216

7 326 296

8 235 195

9 240 207

10 267 247

11 284 210

12 201 209

Con un nivel de significación del 5% ¿se puede concluir que la campaña publicitaria es efectiva para aumentar los niveles de consumo de dicho producto? Asuma normalidad. Solución Sea X: ………………………………………………………………………

203

Estadística para Comunicadores

1. Planteo la hipótesis

H 0 : ...............................  H 1 : ................................ 2. Nivel de significación:  = ………… 3. Cálculo del estadístico

4. Regiones críticas.

5. Decisión.

6. Conclusión:

2. En un programa de telemercado, anuncian que utilizando la crema reductora Reduce Now, usted puede reducir su cintura al primer día de aplicación. Una nutricionista está interesada en verificar tal afirmación, ya que sus pacientes constantemente le preguntan sobre la veracidad de este producto. Para ello toma una muestra aleatoria entre sus amistades de varias edades y les aplica la crema siguiendo las instrucciones. Mide el contorno de cintura un lunes y al día siguiente, después de la aplicación. Los resultados de las medidas se muestran a continuación: Paciente Lunes (1) Martes (2)

1 68 67

2 74 74

3 95 94

4 82 80

5 78 78

6 90 89

7 84 83

Estadística para Comunicadores

204

En base a esta muestra ¿cuál será la conclusión de la nutricionista con un nivel de significación del 5% si las medidas se distribuyen normalmente? Solución Sea X: ……………………………………………………………. 1. Planteo la hipótesis

H 0 : ...............................  H 1 : ................................ 2. Nivel de significación:  = …………… 3. Cálculo del estadístico

4. Regiones críticas.

5. Decisión.

6. Conclusión:

205

Estadística para Comunicadores

3. Para evaluar el efecto que una campaña publicitaria tiene en la venta de un analgésico muscular, se eligió una muestra aleatoria de siete farmacias de la ciudad donde se vende este producto y se registró el volumen de ventas del mes en cientos de soles. Luego de un mes de lanzar la campaña publicitaria se registró las ventas de las mismas siete farmacias elegidas anteriormente. A continuación se muestran los datos obtenidos, para los meses de febrero y abril. Farmacia Febrero (F) Abril (A)

1 15,3 17,5

2 18,5 20,3

3 12,5 12,8

4 11,6 15,3

5 17,4 19,2

6 14,6 17,9

7 10,2 13,8

¿Fue efectiva la campaña publicitaria para el analgésico muscular? Asuma que el volumen de ventas mensuales se distribuye normalmente. Utilice un nivel de significación del 5%. Solución Sea X: ……………………………………………………………………… 1. Planteo la hipótesis

H 0 : ...............................  H 1 : ................................ 2. Nivel de significación:  = …………… 3. Cálculo del estadístico

4. Regiones críticas.

5. Decisión.

206

Estadística para Comunicadores

6. Conclusión:

Ejercicios de aplicación 1. Se dice que una nueva dieta reduce el peso de una persona en un periodo de 2 semanas. Los pesos, en kilogramos, de ocho mujeres que siguieron esta dieta fueron anotados antes y después del periodo. Mujer Peso antes Peso después

1 58 60

2 60 54

3 61 58

4 69 62

5 64 58

6 62 59

7 56 54

8 65 62

Asumiendo normalidad, ¿se puede concluir que la dieta fue eficaz? Use  = 0,05 2. Se seleccionan al azar siete redactores de un diario y se procede a registrar el número de errores cometidos en la digitación de un artículo. Luego se les envía a un curso de perfeccionamiento y se vuelve a realizar la prueba. Los resultados obtenidos en ambos casos fueron los siguientes: Redactor Antes del curso Después del curso

1 12 10

2 17 12

3 09 13

4 18 12

5 14 12

6 26 20

7 12 18

¿Se puede afirmar con un 3% de significancia que el número de errores cometidos en la digitación es menor luego de haber realizado el curso? Asuma normalidad. 3. Las personas que leen periódico y acceden a ambos tipos de formatos, impreso y online, aseguran dedicar menos tiempo a leer las versiones impresas de los diarios, porque prefieren la inmediatez que ofrecen las versiones online. La siguiente tabla muestra los resultados, en minutos, de una encuesta acerca del tiempo que se dedican a leer el diario. Lector Versión impresa Versión online

1 2 23,3 25,3 28,5 31,3

3 26,1 36,0

4 22,3 19,1

5 24,4 35,5

6 23,6 26,6

7 21,9 20,8

8 28,0 26,2

9 23,0 27,2

Usando un nivel de significación del 4%, ¿se puede afirmar que el tiempo promedio que dedica un lector a leer la versión impresa de un periódico es menor al tiempo que dedica a la versión online?

207

Estadística para Comunicadores

4. La Jefa de la Biblioteca de una universidad ha presentado un informe en el que indica que el número promedio de libros prestados se ha incrementado en el mes de mayo en comparación al mes de abril. La información obtenida de una muestra de siete facultades se presenta en la siguiente tabla: Mes

Facultad

Mayo 1550 720 340 820 1600 580 950

Administración en Hotelería y Turismo Arquitectura Artes Contemporáneas Ciencias de la salud Ciencias Humanas Comunicaciones Derecho

Abril 1500 800 250 750 1500 620 930

Usando un nivel de significación del 5% ¿se puede dar por válida la afirmación de la jefa de la Biblioteca? 5. La publicidad de la compañía Sylph Physical Center asegura que al terminar su curso se obtendrá una pérdida de peso. Una muestra aleatoria de ocho estudiantes recientes dio los siguientes pesos, en libras, corporales antes de ingresar al curso y después de terminarlo. Al nivel de significación de 0,02, ¿se puede concluir que los alumnos perdieron peso? Nombre del estudiante Hunter Carmen Mónica Maribel César Peter Rita Paul

Antes 155 228 141 162 211 164 164 172

Después 154 207 147 157 196 150 150 165

208

Estadística para Comunicadores

Autoevaluación Un publicista está probando un nuevo programa de diseño y lo comprará siempre y cuando al usarlo le demande menos tiempo de elaboración que el actual. A fin de tomar una decisión selecciona una muestra de siete trabajos registrando el tiempo de elaboración, en horas, obteniendo los siguientes resultados: Trabajo Programa Actual Programa Nuevo

1 7 5

2 3 2

3 9 6

4 8 7

5 7 4

6 6 7

7 11 8

Asumiendo normalidad, ¿se puede afirmar que el nuevo programa de diseño utiliza menos tiempo en la elaboración del trabajo? Use  = 0,025.

209

Estadística para Comunicadores

Prueba de hipótesis para dos proporciones poblacionales En esta oportunidad veremos una herramienta que permitirá comparar la diferencia de proporciones de dos poblaciones. En las pruebas de hipótesis en las que el valor hipotético de (p1 – p2) es cero, el cero indica que no hay diferencia entre las dos proporciones poblacionales, p 1 y p2. En este caso se deben combinar las dos proporciones muestrales para obtener un estimado de la proporción poblacional. Si el valor hipotético de (p1 – p2) es diferente de cero, entonces utilizaremos las proporciones muestrales para estimar el error típico de la diferencia de proporciones muestrales.

Procedimiento para realizar la prueba de hipótesis 1. Planteamiento de las hipótesis

H 0 : p1  p 2  H 1 : p1  p 2

H 0 : p1  p 2  H 1 : p1  p 2

H 0 : p1  p 2  H 1 : p1  p 2

2. Fijar el nivel de significación: α 3. Estadístico de la prueba

Zc 

donde: donde 𝑝̅p 

# de éxitos en la muestra1 n1



# de éxitos en la muestra2 n2

p2 

1

 

 pˆ 2  p1  p 2



1 1 p 1  p      n1 n2 

n1 pˆ 1  n2 pˆ 2 a1  a 2  n1  n2 n1  n2



p1 

 pˆ

~ N 0 , 1

210

Estadística para Comunicadores

4. Regiones críticas

Bilateral

H1: p1  p2

Unilateral Izquierda

H1: p1 < p2

Unilateral Derecha

H1: p1 > p2

5. Decisión: Rechazar Ho o No rechazar Ho. 6. Conclusión.

Aplicación 1. En una encuesta realizada el año pasado se determinó que 20% de 505 hombres y 25% de 426 mujeres encuestados, estaban a favor de prohibir la venta libre de cerveza, vinos y licores en el país. Con un nivel de significación del 5%, ¿considera usted que las mujeres favorecen más a la prohibición? Solución X: Personas a favor de la prohibición de la venta libre de cerveza, vinos y licores en el país.

Estadística para Comunicadores

211

1. Hipótesis. H 0 : p m  p h  0  H 1 : p m  p h  0

2. Nivel de significación:   0,05 3. Estadístico de la prueba

p

505 (0,20)  426 (0,25)  0,2229 505  426

Z

 0,25  0,20   0 1   1 0,2229 1  0,2229     505 426 

 1,8262

4. Regiones críticas

1.64

5. Decisión: Se rechaza Ho 6. Conclusión: Con un nivel de significación del 5% y a partir de la información muestral, se puede considerar que las mujeres favorecen más a la prohibición de la venta libre de cerveza, vinos y licores en el país.

2. La asociación de ex alumnos de la Facultad de Ciencias de la Comunicación ha seleccionado una muestra aleatoria de 100 graduados en el 2013. En la muestra, 36 fueron de Comunicación y Marketing y 64 de las otras especialidades. Los resultados de cada muestra indican que 15 egresados de cada especialidad ganan por lo menos 3000 dólares mensuales Al nivel de significación del 5% ¿Existe diferencia entre la proporción de graduados de Comunicación y Marketing y los egresados de otras materias que ganan al menos 3000 dólares mensuales? Solución X: Egresados con ingresos de por lo menos 3000 dólares mensuales.

Estadística para Comunicadores

212

1. Hipótesis. H 0 : p CM  p Otras  0  H 1 : p CM  p Otras  0

2. Nivel de significación:   0,05 3. Estadístico de la prueba p

Z

15  15  0,3 36  64

 0,416  0,234   0 1   1 0,3 1  0,3     36 64 

 1.906

4. Regiones críticas

5. Decisión: No se rechaza Ho 6. Conclusión: Con un nivel de significación del 5% se puede afirmar que no hay diferencia significativa en la proporción de egresados con ingresos de por lo menos de 3 000 dólares para las especialidades Comunicación y Marketing y otras especialidades.

Estadística para Comunicadores

213

Ejercicios 1. Se tiene la siguiente información muestral resultante de una encuesta realizada a alumnos de dos universidades: Correo electrónico preferido Hotmail Gmail Yahoo 85 75 95 Universidad A 107 98 65 Universidad B ¿Es posible afirmar que la proporción de alumnos de la universidad A que no prefieren el correo electrónico Gmail es mayor a la proporción de alumnos de la universidad B? Utilice un nivel de significancia del 1%. Solución X: ……………………………………………………………………….. 1. Hipótesis. H 0 : ........................  H 1 : ........................

2. Nivel de significación:  = …….. 3. Cálculo del estadístico

4. Regiones críticas.

Estadística para Comunicadores

5. Decisión.

6. Conclusión:

2. La gerencia de Marketing del Supermercado V&V realizó un estudio con la finalidad de evaluar la opinión de sus clientes sobre los productos ofrecidos. Para este estudio se aplicó una encuesta a una muestra de 252 clientes de los cuales 107 fueron hombres y el resto mujeres. Después de procesar la información en SPSS se obtuvo el siguiente gráfico: Usando un nivel de significancia del 2% ¿se puede afirmar que la proporción de hombres que pagan con tarjeta de crédito es menor a la proporción de mujeres que pagan con tarjeta de crédito? Solución X: ……………………………………………………………………….. 1. Hipótesis. H 0 : ........................  H 1 : ........................

2. Nivel de significación:  = ……..

214

Estadística para Comunicadores

3. Cálculo del estadístico

4. Regiones críticas.

5. Decisión.

6. Conclusión:

215

216

Estadística para Comunicadores

3. Un estudiante de la facultad de Comunicaciones, como parte de su trabajo final, desea determinar si la proporción de hombres que respondieron favorablemente a un determinado anuncio con un mensaje controversial supera a la proporción de mujeres. Después de tomar una muestra aleatoria de 60 hombres y otra de 50 mujeres, anotando si están a favor o en contra del mensaje, se obtuvieron los siguientes resultados: Género Hombres (1) Mujeres (2)

A favor 36 17

En contra 24 33

¿A qué conclusión llega el estudiante con un nivel de significación del 5%? Solución X: ……………………………………………………………………….. 1. Hipótesis. H 0 : ........................  H 1 : ........................

2. Nivel de significación:  = …….. 3. Cálculo del estadístico

4. Regiones críticas.

217

Estadística para Comunicadores

5. Decisión.

6. Conclusión:

4. El siguiente gráfico muestra la especialización de un total de 242 producciones, de las cuales 100 son norteamericanas, 80 son europeas y el resto de Asia. Distribución porcentual de producciones según especialización por región 80% 70%

Películas y TV

68%

Juegos de Computadora

porcentaje

60%

51.6%

47.5%

50% 40%

32.5%

30%

23%

20%

20%

Otros

32.3% 16.1%

9%

10% 0%

Norteamérica

Europa

Asia

región

¿Es posible afirmar que el porcentaje de empresas de animación que se dedican a la producción de juegos por computadora es mayor en Europa que en Asia? Use un nivel de significancia del 5%. Solución X: ……………………………………………………………………….. 1. Hipótesis. H 0 : ........................  H 1 : ........................

2. Nivel de significación:  = ……..

Estadística para Comunicadores

3. Cálculo del estadístico

4. Regiones críticas

5. Decisión

6. Conclusión

218

Estadística para Comunicadores

219

Ejercicios de aplicación 1. Una maqueta de un nuevo automóvil propuesto se mostró a dos grupos de 150 personas cada uno. Un grupo constó de personas entre 18 y 25 años de edad, y el otro grupo entre 35 y 45 años. Del grupo más joven, 120 aprobaron el nuevo modelo, mientras que sólo 85 personas del grupo entre 35 y 45 años lo aprobaron. Con un nivel de significación del 5% ¿Se puede afirmar que la proporción de personas que aprobaron el nuevo modelo es mayor en los jóvenes que en las personas de 35 y 45 años? 2. Un patrocinador de un programa especial de televisión afirma que el programa representa un atractivo mayor para los televidentes hombres que para las mujeres, pero el personal de producción del programa piensa que es igual el porcentaje de televidentes hombres y mujeres que ven el programa especial. Si una muestra aleatoria de 300 hombres y otra de 400 mujeres reveló que 120 hombres y 120 mujeres ven el programa especial de televisión. Al nivel de significación del 5%, ¿se podría decir que el patrocinador tiene razón? 3. Se va a realizar una encuesta sobre habitación en San Isidro y en Miraflores para determinar la proporción de unidades habitacionales ocupadas por familias de ingresos altos. Una muestra aleatoria de 600 unidades habitacionales en San Isidro reveló 150 unidades ocupadas por ingresos altos; mientras que para una muestra de 300 unidades en Miraflores, reveló 120 unidades ocupadas por familias de ingresos altos ¿Existe alguna diferencia entre San Isidro y Miraflores en la proporción de unidades habitacionales ocupadas por familias de ingresos altos? Use α = 0,05. 4. Un artículo periodístico mencionó lo Distribución según Tipo de artículo y Necesidad de compra siguiente “Si bien la publicidad es muy importante para influenciar a los clientes a realizar sus compras, nosotros los consumidores nos dejamos llevar por las ofertas y rebajas de los artículos y los adquirimos solo por no perder la oportunidad, pero ¿es verdaderamente necesaria en ciertas ocasiones nuestras compras? …” Para investigar sobre este tema, se visitó un día de cierra puertas a una tienda comercial, encuestándose a una muestra de clientes en la caja de la sección calzado y a otra muestra Tipo de artículo de clientes en la caja de la sección ropa. El siguiente gráfico muestra los resultados de la pregunta: ¿Fue totalmente necesaria la compra que acaba de realizar? Usando un nivel de significación del 2% ¿se puede afirmar que la proporción de clientes que compraron calzado y respondieron que su compra fue totalmente necesaria es mayor a la proporción de clientes que compraron ropa y respondieron lo mismo?

Estadística para Comunicadores

220

5. La librería de la universidad se enfrenta a una competencia con librerías fuera de ella y está considerando dirigir sus ventas a una generación específica para retener a los estudiantes como clientes. Se realizó un muestreo aleatorio de 150 estudiantes de primer año y 175 de segundo. Encontraron que el 46% de primer año y el 40% de segundo año compraban todos sus libros de texto en la librería universitaria. Para α=0,05 ¿Existe diferencia entre la proporción de estudiantes de primer y segundo año que compran todo en la librería de la universidad? 6. Un columnista de política en un diario local cree que la proporción de votantes de Lima que va a votar en las próximas elecciones municipales es mayor a la proporción de votantes de Provincia. Con el fin de ver si los hechos corroboran esta hipótesis, el columnista hace una encuesta entre los votantes de Lima y de Provincia, con los siguientes resultados: Lugar Lima (1) Provincia (2)

Tamaño de muestra 150 160

Número de personas que votaran en las elecciones municipales 113 104

¿Proporcionan estos datos evidencia suficiente para fundamentar la opinión del especialista al nivel de significación del 5%?

Estadística para Comunicadores

221

Autoevaluación Un profesor del área de marketing publicitario sospecha que la proporción de estudiantes del quinto ciclo a favor de un programa radial supera a la proporción de estudiantes del décimo ciclo a favor del mismo programa radial. Para verificarlo decide realizar una encuesta seleccionando muestras de alumnos del quinto y décimo ciclo. Ciclo académico Quinto ciclo (1) Décimo ciclo (2)

Tamaño de muestra 150 180

Programa radial A favor En contra 112 38 104 76

¿Proporcionan estos datos suficiente evidencia que fundamente la sospecha del profesor? Use =0,05.

Estadística para Comunicadores

Unidad 5 Regresión lineal y correlación

LOGRO: Al término de la Unidad 5, el alumno estima, a partir del modelo de regresión lineal simple, la predicción de nuevos valores participando activamente en el análisis de los problemas.

Temas de la unidad:  

 

Diagrama de dispersión Modelo de regresión lineal e interpretación de los coeficientes Validez del modelo Coeficientes de determinación y correlación.

112

Estadística para Comunicadores

223

Unidad 5. Regresión Lineal y Correlación Análisis de Regresión lineal simple y de Correlación El análisis de regresión lineal y de correlación comprende el estudio de los datos muestrales para saber si dos variables cuantitativas están relacionadas entre sí en una población.

Análisis de regresión lineal

• En el análisis de regresión lineal se obtiene una ecuación matemática que describe cierta relación lineal. La ecuación puede usarse para estimar o predecir los valores de una variable (Y) cuando se conocen o se suponen conocidos los valores de otra variable (X).

Análisis de correlación

• En el análisis de correlación se tiene como objetivo principal medir el grado de asociación o la relación lineal existente entre dos variables. Es útil en un trabajo exploratorio cuando el investigador desea encontrar el grado o la fuerza de esa relación.

Ejemplo   

¿Cuál será el gasto que incurrirá una familia cuyo ingreso familiar mensual es 4000 soles? ¿Cuál será el monto de ventas de una empresa si invierte en publicidad 10 000 dólares? ¿Existirá relación lineal entre la edad del cliente y el monto de las compras realizadas?

224

Estadística para Comunicadores

El diagrama de dispersión

El primer paso en el análisis de regresión, es construir una gráfica de los datos muestrales en un plano bidimensional.

X: es la variable independiente y Y: es la variable dependiente, variable que se va a predecir o estimar.

Esta gráfica denominada diagrama de dispersión, nos permite visualizar el tipo de tendencia entre las dos variables. Esta tendencia puede ser lineal o no lineal. También se puede observar si es una relación directamente proporcional o inversamente proporcional.

Ejemplos de diagrama de dispersión Identifique la relación y la pendiente, de existir, para cada caso:

y

y

x

Relación: Pendiente:

y

x

x

Relación: Pendiente:

Relación:

225

Estadística para Comunicadores

La ecuación de la recta estimada Para encontrar la ecuación lineal se trabajará con los cuadros de resultados (salidas) que se obtiene al procesar los datos con el SPSS. La línea recta tiene dos coeficientes de regresión: b o y b1

y x b1 1

b0

x

yˆ i  ˆ 0  ˆ 1x i

o

ˆy i  b 0  b1x i

Intercepto

Pendiente

Donde: b1 : es la pendiente de la recta. b0 : es el intercepto o punto de corte de la recta con el eje Y. ˆy i : es el i-ésimo valor estimado de la variable Y, reemplazando los valores en la ecuación. Xi : es el valor de X en la i-ésima observación. Interpretación de los coeficientes de regresión

Intercepto b0

Pendiente b1

• Indica el valor de la variable respuesta (Y), cuando la variable independiente (X) es igual a cero. Sin embargo, carece de interpretación práctica si dicho valor está fuera del rango del conjunto de valores de X.

• Indica el cambio promedio (incremento o disminución) en la variable respuesta (Y), cuando la variable independiente (X) aumenta en una unidad.

226

Estadística para Comunicadores

El método de mínimos cuadrados. Para hallar la ecuación de la recta que mejor se ajuste a un conjunto de datos o puntos, el método más utilizado es conocido como el método de mínimos cuadrados, cuya ecuación resultante tiene dos características importantes:



e i  y i  ˆy i

y

La suma de las desviaciones de los puntos con relación a la recta es 0. n

e

yi

i 1

ei



ˆyi

i

0

La suma de los cuadrados de las desviaciones es mínima, es decir ninguna otra recta daría una menor suma de dichos cuadrados. n

x

Min

e i 1

2

i

La ecuación de la recta estimada mediante el paquete estadístico SPSS, se basa en el método de mínimos cuadrados.

Ejemplo: Considere las siguientes variables X: variable independiente. Tiempo de experiencia (en años) Y: variable dependiente. Ingreso (en soles).

Ingreso

Ecuación de la recta estimada:

y

b1 = 450

yˆi  2500  450 xi bo = 2500

1

x años  La relación es: directa  La pendiente es: positiva  A mayor años de experiencia, mayor será el ingreso

227

Estadística para Comunicadores

Interpretación: bo = 2500, cuando el empleado no tiene experiencia, su ingreso será de 2500 soles. b1 = 450, por cada año de experiencia adicional, el ingreso del empleado se incrementa en 450 soles.

Ejercicio De acuerdo al siguiente gráfico presente un ejemplo indicando la variable X y la variable Y. Escriba cómo sería la ecuación de la recta.

Ejercicio X : variable independiente. Tiempo de uso del vehículo (en años) Y : variable dependiente. Precio de venta del vehículo (en dólares). Suponga una ecuación de la recta estimada teniendo en cuenta la interpretación de los coeficientes de regresión. Grafique la línea adecuada y

x

La relación es: La pendiente es:

228

Estadística para Comunicadores

Interprete los coeficientes de regresión sugeridos.

Ejemplo 1. Se desea estimar el ingreso por ventas (en millones de dólares) en función del gasto en publicidad (en millones de dólares). A continuación se muestran los datos de los últimos 8 meses. 2 7

Gasto en publicidad Ingresos por ventas

1 5

3 7

4 9

3 8

2 6

4 11

5 13

La salida obtenida por el SPSS después de procesar los datos se presenta a continuación: Resumen del modelo Modelo 1

R .944

R cuadrado .891

R cuadrado corregida .872

Error típ. de la estimación .950

DurbinWat son 1.032

Coeficientes

Modelo 1

bo: intercepto (Constante) Gasto en publicidad

Coef icientes no estandarizados B Error típ. 2.500 .889 1.917 .274

Coef icientes estandarizados Beta

b1: pendiente

a. Defina las variables X e Y. Variable independiente X: Variable dependiente Y:

.944

t 2.813 6.988

Sig. .031 .000

Estadística para Comunicadores

b. Presente el diagrama de dispersión. ¿Qué relación observa? Comente.

c. Estime la ecuación de la recta. Interprete los coeficientes de regresión estimados.

Interpretación

229

230

Estadística para Comunicadores

d. Estime las ventas cuando se invierte 4 500 000 dólares en publicidad.

2. Se desea determinar un modelo que permita estimar la audiencia de cierto programa televisivo que se transmite al mediodía, en miles de televidentes, en términos del número de regalos que se entregan durante el programa. Para ello se seleccionaron al azar 10 días y se midió la cantidad de televidentes. Los datos se muestran a continuación: Número de regalos Audiencia diaria

11 20

7 12

13 21

17 26

17 22

19 30

3 10

11 15

16 26

8 13

A continuación se presenta los resultados obtenidos mediante el SPSS. Resumen del modelo Modelo 1

R ,951a

R cuadrado ,905

R cuadrado corregida ,893

Error típ. de la estimación 2,219

Coeficientesa

Modelo 1 (Constante) Número de regalos

Coeficientes no estandarizados B Error típ. 4,275 1,884 1,248 ,143

a. Defina las variables X e Y. Variable independiente X: Variable dependiente Y:

Coeficientes tipificados Beta ,951

t 2,269 8,707

Sig. ,053 ,000

Estadística para Comunicadores

b. Presente el diagrama de dispersión. ¿Qué relación observa? Comente.

c. Estime la ecuación de la recta. Interprete los coeficientes de regresión estimados.

Interpretación

d. Estime la audiencia diaria del programa cuando se hicieron 15 regalos.

231

232

Estadística para Comunicadores

Validando el modelo No siempre la ecuación estimada es válida. Puede ocurrir que no exista pendiente, es decir que la pendiente sea igual a 0. Significaría que no existe relación lineal entre las variables X e Y. Es necesario entonces verificar si el modelo es válido. Ejemplo 1 (continuación) Se desea estimar el ingreso por ventas (en millones de dólares) en función del gasto en publicidad (en millones de dólares). A continuación se muestran los datos de los últimos 8 meses. Gasto en publicidad Ingresos por ventas

2 7

1 5

3 7

4 9

3 8

2 6

4 11

5 13

Valide el modelo. Use un nivel de significación del 5%. Solución Para dar validez al modelo usaremos la tabla de coeficientes de la salida del SPSS. Coeficientes

Modelo 1

H0:  1  0 H1:  1  0

(Constante) Gasto en publicidad

Coeficientes no estandarizados B Error típ. 2.500 .889 1.917 .274

Coeficientes estandarizados Beta .944

t 2.813 6.988

Sig. .031 .000

Sig o p-valor

No es válido el modelo Si es válido el modelo

Comparando Sig o p-valor con  : Sig.= p-valor = 0,00 <  = 0,05  Se rechaza Ho Conclusión: Con un nivel de significación del 5% se puede afirmar que el modelo lineal estimado es válido.

Supuestos de la Regresión Lineal  Los errores o residuos tienen distribución normal.  Los errores o residuos tienen media igual a cero y varianza igual a σ2.  Los errores o residuos aleatorios asociados a cualquier par de valores asociados a la variable dependiente Y, no se encuentran autocorrelacionados.

233

Estadística para Comunicadores

Coeficiente de determinación y de no determinación El coeficiente de determinación (r2) y de no determinación (1-r2) se calcula de la siguiente manera:

SSR SST



r2 



(1  r 2 )  1 

r2 siempre es positivo Varía entre 0 y 1

y

0  r2  1

SSR SST

El coeficiente de determinación (r2 x 100%) expresa el porcentaje de la variabilidad total de Y que es explicada por X en el modelo lineal estimado. Cuando r 2 es más cercano a 1, mejor será el ajuste de la recta a los datos. Ejercicio Indique que valor de r2 le corresponde a cada gráfico, considerando los siguientes valores: r2 = 0,98 r2 = 0,89 r2 = 0,62

Ejemplo 1 (continuación): Interprete el coeficiente de determinación. Resumen del modelo Modelo 1

R .944

R cuadrado .891

R cuadrado corregida .872

Error típ. de la estimación .950

DurbinWat son 1.032

Solución El coeficiente de determinación es r2 = 0,891 y en porcentaje es 89,1% Interpretación: Del total de la variación del ingreso por las ventas, el 89,1% es explicada por los gastos de publicidad en el modelo lineal estimado. El 10,9% restante de la variabilidad del ingreso, se debe a otros factores no contemplados en el modelo.

234

Estadística para Comunicadores

Coeficiente de correlación El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e Y, donde el coeficiente de correlación poblacional se denota por  (ro).

 1    1 , varía dentro de este intervalo de -1 a 1.   0 entonces indicará que no existe correlación o asociación entre las variables.

   

   1 (Cuando  se acerca a 1 ó a -1 indicará que existe una asociación fuerte).   1 ó   1 , la correlación o asociación entre estas variables es perfecta.

El estimador de  (ro) es “r” r : siempre tiene el signo de la pendiente b1

Si b1 y r son positivos b1 y r son negativos

 

relación directa relación inversa

NOTA: En los resultados del SPSS, el valor de r siempre lo muestra positivo. En el caso de que la pendiente b1 sea negativa, se colocará también al coeficiente de correlación r el signo negativo.

Ejemplo 1 (continuación): Interprete el coeficiente de correlación. Aquí siempre aparece positivo. Se le debe colocar el signo de b1

r Resumen del modelo Modelo 1

R .944

R cuadrado .891

El coeficiente de correlación es r = 0,944

R cuadrado corregida .872

Error típ. de la estimación .950

DurbinWat son 1.032

235

Estadística para Comunicadores

Interpretación: Entre el gasto en publicidad y el ingreso por ventas existe una asociación lineal positiva y fuerte, por ser su valor cercano a 1. Ejemplo 2 El gerente de ventas de una compañía se está preparando para una reunión de ventas y le gustaría mostrar al grupo de vendedores la forma como se relaciona el número de llamadas a clientes mensuales con el valor de pedidos que se reciben. A continuación se presenta la información muestral para el último año. Pedidos (miles de $) Número de llamadas

9,0 8,0 12,3 13,7 15,7 5,4 7,3 7,0 6,0 6,7 6,9 7,5 5

4

6

7

8

1

3

4

1

3

2

La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:

a. Defina las variables X e Y. X: Y: b. Realice el diagrama de dispersión. ¿Qué relación observa?

4

Estadística para Comunicadores

c. Estime el modelo lineal e interprete los coeficientes de regresión.

d. Valide el modelo de regresión lineal. Use un nivel de significación del 5%.

e. Interprete el coeficiente de correlación y determinación.

236

237

Estadística para Comunicadores

Ejemplo 3. El gerente de ventas de una agencia publicitaria desea analizar la relación que existe entre los años de experiencia y las ventas anuales (en miles de dólares) y estimar las ventas en base a los años de experiencia. Los resultados de una muestra de 9 publicistas, obtenidos por el SPSS se presentan a continuación: Años de experiencia Ventas anuales (miles de dólares)

2

3

4

6

8

10

10

11

13

97

92

102

103

111

119

123

117

136

La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:

a. Defina las variables X e Y. X: Y:

b. Realice el diagrama de dispersión. ¿Qué relación observa? Comente.

Estadística para Comunicadores

c. Encuentre el modelo estimado e interprete los coeficientes de regresión.

d. Valide el modelo de regresión. Utilice un nivel de significación del 5%.

e. Interprete el coeficiente de correlación y determinación.

238

Estadística para Comunicadores

239

240

Estadística para Comunicadores

Ejercicios de aplicación 1. Para estimar el costo de la producción (en miles de dólares) por cada 15 minutos de animación en 2D en función del número de dibujos (en unidades) realizados por las empresas dedicadas a la animación, se tomó una muestra de 15 producciones realizadas por empresas de animación del continente asiático. Los resultados obtenidos fueron: Costo Número de dibujos

36

21

34

48

54

56

68

26

19

26

33

42

38

33

32

250 150 280 390 460 550 190 200 106 180 250 300 380 294 300 Resumen del modelo Modelo 1

R

R cuadrado

R cuadrado corregida

Error típ. de la estimación

.604a

.365

.317

11.350

Coeficientes Modelo

1

Coeficientes no estandarizados B 17.992 .069

(Constante) Número de dibujos

a. b. c. d.

Error típ. 7.788 .025

Coeficientes tipificados Beta .604

t

Sig.

2.310 2.736

.038 .017

Presente el modelo estimado e interprete el valor de la pendiente. Valide el modelo estimado. Use un nivel de significación de 5% Indique el valor del coeficiente de correlación e interprete. Estime el costo de animación 2D si la producción está compuesta por 280 dibujos.

2. Un economista del Departamento de Recursos Humanos de una empresa, está preparando un estudio sobre el comportamiento del consumidor. Él recolectó los datos, en miles de dólares, para determinar si existe una relación entre el ingreso del consumidor y los niveles de consumo. Consumidor Ingreso Consumo

1 24,3 16,2

2 12,5 8,5

3 31,2 15

4 28,0 17

5 35,1 24,2

6 10,5 11,2

7 23,2 15

8 10,0 7,1

9 8,5 3,5

10 15,9 11,5

11 14,7 10,7

La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:

12 15 9,2

241

Estadística para Comunicadores

a. Presente el diagrama de dispersión. b. Valide e interprete el modelo de regresión. Utilice un nivel de significación del 5%. c. ¿Qué proporción de cada dólar adicional que se gana se destina al consumo? 3. El número de vendedores y los ingresos por ventas (en miles de soles) en una tienda para los primeros seis meses del año fueron los siguientes: Número de vendedores Ingreso por ventas

14

22

19

35

30

44

17,5

18,5

18,0

26,0

25,0

29,5

La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:

a. Trace el diagrama de dispersión ¿qué tipo de relación se deduce a partir del diagrama? b. Valide e interprete el modelo de regresión estimado. Utilice un nivel de significación del 5%. c. Estime el ingreso por ventas si el número de vendedores es igual a 25. d. ¿Qué porcentaje de la variación de los ingresos por ventas sería explicado por la influencia lineal del número de vendedores? 4. El gerente de ventas de una compañía se está preparando para una reunión y le gustaría mostrar al grupo de vendedores la forma como se relaciona el número de visitas que ellos realizan a los clientes con el monto total de compra realizado por el cliente. De sus registros se recolectó la siguiente información muestral para el último año. Los datos fueron los siguientes: Número de visitas Monto de compra (miles de $)

5

4

8,7

7,1

6

7

8

13,7 15,1 16,7

1

3

4

1

3

2,2

4,6

7,5

2,3

6,1

Estadística para Comunicadores

242

La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:

a. Realice un diagrama de dispersión entre estas dos variables. ¿Podría ajustarse un modelo de regresión lineal simple? b. Valide el modelo de regresión lineal simple. Use un nivel de significancia del 5% c. Presente la ecuación estimada. Interprete los coeficientes estimados d. Interprete el valor del coeficiente de determinación. e. Interprete el valor del coeficiente de correlación.

243

Estadística para Comunicadores

Autoevaluación El número de vendedores y los ingresos por ventas (en miles de soles) en una tienda para los primeros seis meses del año fueron los siguientes: Número de vendedores Ingreso por ventas a. b. c. d. e.

14 17,5

22 18,5

19 18,0

35 26,0

30 25,0

44 29,5

Trace el diagrama de dispersión, ¿qué tipo de relación observa a partir del diagrama? Valide el modelo de regresión estimado. Utilice un nivel de significación del 5%. Presente la ecuación estimada. Interprete los coeficientes estimados Estime el ingreso por ventas si el número de vendedores es igual a 25. ¿Qué porcentaje de la variación de los ingresos por ventas sería explicado por la influencia lineal del número de vendedores. Estadísticos descriptivos

ingreso_por_v entas nro_v endedores

Media 22.4167 27.3333

Desv iación típ. 5.07362 11.12954

N 6 6

Resumen del modelob Modelo 1

R .976a

R cuadrado .953

R cuadrado corregida .942

Error típ. de la estimación 1.22561

a. Variables predictoras: (Constante), nro_v endedores Coeficientesa b. Variable dependiente: ingreso_por_v ent as Coef icientes Coef icientes no estandarizad estandarizados os Modelo B Error típ. Beta 1 (Constante) 10.251 1.436 nro_v endedores .445 .049 .976 a. Variable dependient e: ingreso_por_v entas

DurbinWat son 2.085

t 7.138 9.038

Sig. .002 .001

Estadística para Comunicadores

244

245

Estadística para Comunicadores

ÍNDICE ALFABÉTICO

A

V

Axiomas de la probabilidad .........................................128

Valor esperado de una variable aleatoria discreta .......................... 143 Variable aleatoria continua ............................................................... 139 definición.............................................................. 139 discreta................................................................. 139 Función de probabilidad ........................................ 140 Varianza de una variable aleatoria discreta .......................... 144

C Censo .......................................................................... 82

D Desviación estándar de una variable aleatoria .......................................145

E Escalas de medición Nominal ................................................................. 21 Estimador.................................................................... 27

G Gráfico de barras apiladas al 100% ...................................... 72

M Margen de error .........................................................166 Media ......................................................................... 40 Medidas de asimetría .................................................. 48 Muestreo .................................................................... 82 aleatorio simple...................................................... 85 estratificado ........................................................... 93 probabilístico ......................................................... 85 sistemático............................................................105

N Nivel de confianza ......................................................166 Interpretación .......................................................167

P Probabilidad Definición clásica de ..............................................128 Teoremas básicos de .............................................128

R Rango de una variable aleatoria .......................................139 Registro administrativo ................................................ 15

T Tabulaciones cruzadas ................................................. 65

Universidad Peruana de Ciencias Aplicadas

FORMULARIO MA470 ESTADÍSTICA PARA COMUNICADORES

Fórmulas y Tablas Estadísticas

1

Universidad Peruana de Ciencias Aplicadas

FÓRMULAS ESTADÍSTICAS MEDIDAS DESCRIPTIVAS

Coeficiente de variación

s CV   x100% x

RIC

P75 – P25

DISTRIBUCIÓN NORMAL ESTÁNDAR

X ~ N ( ,  2 )

z

X 



TAMAÑO DE MUESTRA

S Z n   1 / 2   e 

Fórmulas y Tablas Estadísticas

2

z12 / 2 pˆ (1  pˆ ) n e2

nc 

n 1

n N

, donde nc = n corregido

2

Universidad Peruana de Ciencias Aplicadas INFERENCIA ESTADÍSTICA

Parámetro

Intervalo de Confianza

 µ

p

IC(µ) = x̅ ± t (α⁄2 ; n−1)

IC(p)  pˆ  z (1 / 2)

Prueba de Hipótesis - Estadístico de la Prueba _

s

t

√n

x  S/ n

z

pˆ (1  pˆ ) n

qˆ  1  pˆ

~ t ( n 1)

pˆ  p p(1  p) n

Prueba de Hipótesis - Estadístico de la Prueba

t=

µd

z

d̅ − µd ~ t (n−1) Sd ⁄ √n

pˆ 1  pˆ 2  1 1   p (1  p)    n1 n 2 

~ N (0,1)

p1  p2

𝑑𝑜𝑛𝑑𝑒: donde 𝑝̅p 

Fórmulas y Tablas Estadísticas

n1 pˆ 1  n2 pˆ 2 a1  a 2  n1  n2 n1  n2

3

Universidad Peruana de Ciencias Aplicadas Tabla Nº 1 TABLA DE NÚMEROS ALEATORIOS C1 4 9 0 9 1 2 6 1 4 0 7 4 6 9 1 0 3 9 5 8 0 9 6 7 3 9 4 8 4 6 9 1 3 9 1 2 6 3 0 4 7 2 2 5 9 8 1 5 8 3

C2 8 2 2 6 6 9 1 3 5 0 2 9 1 3 8 2 6 4 9 1 5 7 9 4 8 9 8 6 7 5 2 3 3 9 7 7 0 3 1 7 8 2 6 1 0 6 9 6 6 1

C3 2 9 1 0 4 0 2 1 8 3 4 3 2 4 7 1 3 6 9 8 3 1 5 9 1 9 1 7 1 5 0 7 2 9 5 1 9 6 9 1 9 3 6 9 5 1 1 0 9 6

C4 4 8 3 8 1 5 9 8 1 6 5 4 8 0 1 4 4 7 8 8 8 4 9 1 2 7 5 3 4 8 9 9 5 8 4 7 2 3 7 5 9 3 4 0 8 9 0 6 9 1

C5 6 1 3 3 6 5 5 9 1 9 4 4 1 8 3 7 1 6 4 2 0 2 4 4 2 8 8 6 0 8 8 4 6 2 0 8 6 4 9 3 6 1 1 3 4 2 9 1 8 0

C6 6 4 9 5 5 0 0 9 4 6 1 2 3 1 4 5 9 7 4 3 4 7 9 8 4 0 5 1 3 4 2 8 7 8 9 8 1 9 7 7 8 8 4 9 9 5 7 3 0 5

C7 3 4 1 6 2 8 4 0 5 5 2 4 3 3 3 7 8 9 5 9 3 5 1 8 0 0 5 7 6 3 8 3 6 8 5 3 5 6 9 0 5 1 8 1 2 0 5 3 8 7

C8 5 1 6 6 7 4 0 1 6 0 4 5 2 3 9 3 1 1 9 1 9 5 8 6 1 9 1 1 2 4 3 7 1 1 7 8 1 4 4 9 6 9 1 6 2 0 1 5 1 5

C9 4 9 2 6 7 8 9 2 7 6 4 9 0 7 3 1 0 2 1 4 4 2 2 6 4 3 4 1 4 8 4 0 6 9 8 6 2 4 4 2 8 8 0 1 3 7 2 2 8 7

C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 5 6 0 5 2 6 9 8 0 0 9 8 5 1 1 9 7 9 8 5 9 0 9 7 1 2 6 6 0 7 5 6 4 4 0 8 6 3 4 8 1 8 5 4 2 9 9 9 9 7 4 1 5 4 9 7 4 6 2 1 7 0 1 5 8 7 8 2 0 2 6 8 7 0 1 9 7 6 3 7 1 9 6 1 7 9 9 8 9 9 9 2 1 3 2 3 7 7 9 4 7 9 8 1 2 4 4 8 3 6 6 9 2 6 6 6 5 2 0 0 4 0 8 7 4 8 4 2 1 2 5 4 2 6 0 7 2 7 9 1 4 6 5 3 2 4 8 6 7 9 0 6 2 8 1 7 8 3 7 3 3 0 8 3 5 1 9 3 3 8 7 4 8 0 2 5 9 0 1 1 0 9 3 6 8 6 0 2 7 2 3 9 3 4 6 9 8 1 5 4 7 3 0 6 8 1 6 8 1 2 4 9 1 4 0 6 0 3 2 8 6 0 8 8 3 8 7 1 2 2 3 8 6 6 3 5 5 9 9 0 6 8 0 2 5 3 9 1 2 0 3 0 8 8 5 9 4 8 5 7 7 9 6 7 5 7 7 4 0 4 8 9 4 7 0 2 7 0 5 0 2 7 8 7 3 6 9 6 4 4 4 7 4 5 7 5 0 3 5 5 7 4 4 7 6 7 2 8 4 4 4 0 3 6 3 4 1 2 8 9 0 6 7 6 0 0 8 6 8 4 3 2 8 9 4 8 7 9 4 9 4 8 6 6 6 8 4 1 1 3 1 3 6 1 7 6 5 8 1 6 2 2 7 1 6 2 7 5 1 8 6 1 4 4 7 5 0 8 6 6 2 5 3 2 3 9 9 2 7 4 5 9 5 6 6 6 3 1 8 1 2 0 8 6 4 4 0 9 8 5 7 3 3 4 2 3 2 8 1 6 6 7 7 0 7 9 8 6 8 5 2 1 0 0 4 0 4 6 8 8 1 9 2 7 5 1 7 0 1 5 5 4 2 8 5 2 8 1 7 6 4 6 6 0 1 3 4 0 9 1 2 8 6 7 8 8 2 8 0 7 8 4 8 0 9 8 5 9 5 7 8 4 9 9 4 9 0 0 7 4 5 4 8 6 2 3 7 1 9 4 8 4 8 9 6 6 9 1 0 1 9 2 8 0 2 6 6 3 2 6 6 8 4 0 7 8 2 5 1 0 6 3 0 4 1 4 0 3 0 8

4

Universidad Peruana de Ciencias Aplicadas Tabla Nº 2.1 TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal:  P  Z  z     Z -3.9 -3.8 -3.7 -3.6 -3.5 -3.4 -3.3 -3.2 -3.1 -3.0

-0.09 0.000033 0.000050 0.000075 0.000112 0.000165 0.000242 0.000349 0.000501 0.000711 0.001001

-0.08 0.000034 0.000052 0.000078 0.000117 0.000172 0.000251 0.000362 0.000519 0.000736 0.001035

-0.07 0.000036 0.000054 0.000082 0.000121 0.000178 0.000260 0.000376 0.000538 0.000762 0.001070

-0.06 0.000037 0.000057 0.000085 0.000126 0.000185 0.000270 0.000390 0.000557 0.000789 0.001107

-0.05 0.000039 0.000059 0.000088 0.000131 0.000193 0.000280 0.000404 0.000577 0.000816 0.001144

-0.04 0.000041 0.000062 0.000092 0.000136 0.000200 0.000291 0.000419 0.000598 0.000845 0.001183

-0.03 0.000042 0.000064 0.000096 0.000142 0.000208 0.000302 0.000434 0.000619 0.000874 0.001223

-0.02 0.000044 0.000067 0.000100 0.000147 0.000216 0.000313 0.000450 0.000641 0.000904 0.001264

-0.01 0.000046 0.000069 0.000104 0.000153 0.000224 0.000325 0.000466 0.000664 0.000935 0.001306

-0.00 0.000048 0.000072 0.000108 0.000159 0.000233 0.000337 0.000483 0.000687 0.000968 0.001350

-2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 -2.2 -2.1 -2.0

0.00139 0.00193 0.00264 0.00357 0.00480 0.00639 0.00842 0.01101 0.01426 0.01831

0.00144 0.00199 0.00272 0.00368 0.00494 0.00657 0.00866 0.01130 0.01463 0.01876

0.00149 0.00205 0.00280 0.00379 0.00508 0.00676 0.00889 0.01160 0.01500 0.01923

0.00154 0.00212 0.00289 0.00391 0.00523 0.00695 0.00914 0.01191 0.01539 0.01970

0.00159 0.00219 0.00298 0.00402 0.00539 0.00714 0.00939 0.01222 0.01578 0.02018

0.00164 0.00226 0.00307 0.00415 0.00554 0.00734 0.00964 0.01255 0.01618 0.02068

0.00169 0.00233 0.00317 0.00427 0.00570 0.00755 0.00990 0.01287 0.01659 0.02118

0.00175 0.00240 0.00326 0.00440 0.00587 0.00776 0.01017 0.01321 0.01700 0.02169

0.00181 0.00248 0.00336 0.00453 0.00604 0.00798 0.01044 0.01355 0.01743 0.02222

0.00187 0.00256 0.00347 0.00466 0.00621 0.00820 0.01072 0.01390 0.01786 0.02275

-1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 -1.2 -1.1 -1.0

0.02330 0.02938 0.03673 0.04551 0.05592 0.06811 0.08226 0.09853 0.11702 0.13786

0.02385 0.03005 0.03754 0.04648 0.05705 0.06944 0.08379 0.10027 0.11900 0.14007

0.02442 0.03074 0.03836 0.04746 0.05821 0.07078 0.08534 0.10204 0.12100 0.14231

0.02500 0.03144 0.03920 0.04846 0.05938 0.07215 0.08691 0.10383 0.12302 0.14457

0.02559 0.03216 0.04006 0.04947 0.06057 0.07353 0.08851 0.10565 0.12507 0.14686

0.02619 0.03288 0.04093 0.05050 0.06178 0.07493 0.09012 0.10749 0.12714 0.14917

0.02680 0.03362 0.04182 0.05155 0.06301 0.07636 0.09176 0.10935 0.12924 0.15151

0.02743 0.03438 0.04272 0.05262 0.06426 0.07780 0.09342 0.11123 0.13136 0.15386

0.02807 0.03515 0.04363 0.05370 0.06552 0.07927 0.09510 0.11314 0.13350 0.15625

0.02872 0.03593 0.04457 0.05480 0.06681 0.08076 0.09680 0.11507 0.13567 0.15866

-0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 -0.0

0.16109 0.18673 0.21476 0.24510 0.27760 0.31207 0.34827 0.38591 0.42465 0.46414

0.16354 0.18943 0.21770 0.24825 0.28096 0.31561 0.35197 0.38974 0.42858 0.46812

0.16602 0.19215 0.22065 0.25143 0.28434 0.31918 0.35569 0.39358 0.43251 0.47210

0.16853 0.19489 0.22363 0.25463 0.28774 0.32276 0.35942 0.39743 0.43644 0.47608

0.17106 0.19766 0.22663 0.25785 0.29116 0.32636 0.36317 0.40129 0.44038 0.48006

0.17361 0.20045 0.22965 0.26109 0.29460 0.32997 0.36693 0.40517 0.44433 0.48405

0.17619 0.20327 0.23270 0.26435 0.29806 0.33360 0.37070 0.40905 0.44828 0.48803

0.17879 0.20611 0.23576 0.26763 0.30153 0.33724 0.37448 0.41294 0.45224 0.49202

0.18141 0.20897 0.23885 0.27093 0.30503 0.34090 0.37828 0.41683 0.45620 0.49601

0.18406 0.21186 0.24196 0.27425 0.30854 0.34458 0.38209 0.42074 0.46017 0.50000

Tablas estadísticas

5

Universidad Peruana de Ciencias Aplicadas Tabla Nº 2.2 TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal:  P  Z  z     Z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

0.00 0.50000 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75804 0.78814 0.81594

0.01 0.50399 0.54380 0.58317 0.62172 0.65910 0.69497 0.72907 0.76115 0.79103 0.81859

0.02 0.50798 0.54776 0.58706 0.62552 0.66276 0.69847 0.73237 0.76424 0.79389 0.82121

0.03 0.51197 0.55172 0.59095 0.62930 0.66640 0.70194 0.73565 0.76730 0.79673 0.82381

0.04 0.51595 0.55567 0.59483 0.63307 0.67003 0.70540 0.73891 0.77035 0.79955 0.82639

0.05 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.80234 0.82894

0.06 0.52392 0.56356 0.60257 0.64058 0.67724 0.71226 0.74537 0.77637 0.80511 0.83147

0.07 0.52790 0.56749 0.60642 0.64431 0.68082 0.71566 0.74857 0.77935 0.80785 0.83398

0.08 0.53188 0.57142 0.61026 0.64803 0.68439 0.71904 0.75175 0.78230 0.81057 0.83646

0.09 0.53586 0.57535 0.61409 0.65173 0.68793 0.72240 0.75490 0.78524 0.81327 0.83891

1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9

0.84134 0.86433 0.88493 0.90320 0.91924 0.93319 0.94520 0.95543 0.96407 0.97128

0.84375 0.86650 0.88686 0.90490 0.92073 0.93448 0.94630 0.95637 0.96485 0.97193

0.84614 0.86864 0.88877 0.90658 0.92220 0.93574 0.94738 0.95728 0.96562 0.97257

0.84849 0.87076 0.89065 0.90824 0.92364 0.93699 0.94845 0.95818 0.96638 0.97320

0.85083 0.87286 0.89251 0.90988 0.92507 0.93822 0.94950 0.95907 0.96712 0.97381

0.85314 0.87493 0.89435 0.91149 0.92647 0.93943 0.95053 0.95994 0.96784 0.97441

0.85543 0.87698 0.89617 0.91309 0.92785 0.94062 0.95154 0.96080 0.96856 0.97500

0.85769 0.87900 0.89796 0.91466 0.92922 0.94179 0.95254 0.96164 0.96926 0.97558

0.85993 0.88100 0.89973 0.91621 0.93056 0.94295 0.95352 0.96246 0.96995 0.97615

0.86214 0.88298 0.90147 0.91774 0.93189 0.94408 0.95449 0.96327 0.97062 0.97670

2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9

0.97725 0.98214 0.98610 0.98928 0.99180 0.99379 0.99534 0.99653 0.99744 0.99813

0.97778 0.98257 0.98645 0.98956 0.99202 0.99396 0.99547 0.99664 0.99752 0.99819

0.97831 0.98300 0.98679 0.98983 0.99224 0.99413 0.99560 0.99674 0.99760 0.99825

0.97882 0.98341 0.98713 0.99010 0.99245 0.99430 0.99573 0.99683 0.99767 0.99831

0.97932 0.98382 0.98745 0.99036 0.99266 0.99446 0.99585 0.99693 0.99774 0.99836

0.97982 0.98422 0.98778 0.99061 0.99286 0.99461 0.99598 0.99702 0.99781 0.99841

0.98030 0.98461 0.98809 0.99086 0.99305 0.99477 0.99609 0.99711 0.99788 0.99846

0.98077 0.98500 0.98840 0.99111 0.99324 0.99492 0.99621 0.99720 0.99795 0.99851

0.98124 0.98537 0.98870 0.99134 0.99343 0.99506 0.99632 0.99728 0.99801 0.99856

0.98169 0.98574 0.98899 0.99158 0.99361 0.99520 0.99643 0.99736 0.99807 0.99861

3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9

0.998650 0.999032 0.999313 0.999517 0.999663 0.999767 0.999841 0.999892 0.999928 0.999952

0.998694 0.999065 0.999336 0.999534 0.999675 0.999776 0.999847 0.999896 0.999931 0.999954

0.998736 0.999096 0.999359 0.999550 0.999687 0.999784 0.999853 0.999900 0.999933 0.999956

0.998777 0.999126 0.999381 0.999566 0.999698 0.999792 0.999858 0.999904 0.999936 0.999958

0.998817 0.999155 0.999402 0.999581 0.999709 0.999800 0.999864 0.999908 0.999938 0.999959

0.998856 0.999184 0.999423 0.999596 0.999720 0.999807 0.999869 0.999912 0.999941 0.999961

0.998893 0.999211 0.999443 0.999610 0.999730 0.999815 0.999874 0.999915 0.999943 0.999963

0.998930 0.999238 0.999462 0.999624 0.999740 0.999822 0.999879 0.999918 0.999946 0.999964

0.998965 0.999264 0.999481 0.999638 0.999749 0.999828 0.999883 0.999922 0.999948 0.999966

0.998999 0.999289 0.999499 0.999651 0.999758 0.999835 0.999888 0.999925 0.999950 0.999967

Tablas estadísticas

6

Universidad Peruana de Ciencias Aplicadas Tabla Nº 3.1 TABLA DE LA DISTRIBUCION T-STUDENT

Área bajo la curva:  P  T  c    



 1 2 3 4 5 6 7 8 9 10

0.4 0.32492 0.28868 0.27667 0.27072 0.26718 0.26483 0.26317 0.26192 0.26096 0.26018

0.3 0.72654 0.61721 0.58439 0.56865 0.55943 0.55338 0.54911 0.54593 0.54348 0.54153

0.2 1.37638 1.06066 0.97847 0.94096 0.91954 0.9057 0.89603 0.88889 0.8834 0.87906

0.15 1.96261 1.38621 1.24978 1.18957 1.15577 1.13416 1.11916 1.10815 1.09972 1.09306

0.1 3.07768 1.88562 1.63774 1.53321 1.47588 1.43976 1.41492 1.39682 1.38303 1.37218

0.05 6.31375 2.91999 2.35336 2.13185 2.01505 1.94318 1.89458 1.85955 1.83311 1.81246

0.04 7.91582 3.31976 2.60543 2.33287 2.19096 2.10431 2.04601 2.00415 1.97265 1.9481

0.03 10.57889 3.89643 2.95051 2.60076 2.42158 2.31326 2.24088 2.18915 2.15038 2.12023

0.025 12.7062 4.30265 3.18245 2.77645 2.57058 2.44691 2.36462 2.306 2.26216 2.22814

0.02 15.89454 4.84873 3.48191 2.99853 2.75651 2.61224 2.51675 2.44898 2.39844 2.35931

0.015 21.20495 5.64278 3.89605 3.29763 3.00287 2.82893 2.71457 2.63381 2.5738 2.52748

0.01 31.82052 6.96456 4.5407 3.74695 3.36493 3.14267 2.99795 2.89646 2.82144 2.76377

0.005 63.65674 9.92484 5.84091 4.60409 4.03214 3.70743 3.49948 3.35539 3.24984 3.16927

 1 2 3 4 5 6 7 8 9 10

11 12 13 14 15 16 17 18 19 20

0.25956 0.25903 0.25859 0.25821 0.25789 0.2576 0.25735 0.25712 0.25692 0.25674

0.53994 0.53862 0.5375 0.53655 0.53573 0.53501 0.53438 0.53382 0.53331 0.53286

0.87553 0.87261 0.87015 0.86805 0.86624 0.86467 0.86328 0.86205 0.86095 0.85996

1.08767 1.08321 1.07947 1.07628 1.07353 1.07114 1.06903 1.06717 1.06551 1.06402

1.36343 1.35622 1.35017 1.34503 1.34061 1.33676 1.33338 1.33039 1.32773 1.32534

1.79588 1.78229 1.77093 1.76131 1.75305 1.74588 1.73961 1.73406 1.72913 1.72472

1.92843 1.91231 1.89887 1.8875 1.87774 1.86928 1.86187 1.85534 1.84953 1.84433

2.09614 2.07644 2.06004 2.04617 2.03429 2.024 2.015 2.00707 2.00002 1.99371

2.20099 2.17881 2.16037 2.14479 2.13145 2.11991 2.10982 2.10092 2.09302 2.08596

2.32814 2.30272 2.2816 2.26378 2.24854 2.23536 2.22385 2.2137 2.2047 2.19666

2.49066 2.4607 2.43585 2.4149 2.39701 2.38155 2.36805 2.35618 2.34565 2.33624

2.71808 2.681 2.65031 2.62449 2.60248 2.58349 2.56693 2.55238 2.53948 2.52798

3.10581 3.05454 3.01228 2.97684 2.94671 2.92078 2.89823 2.87844 2.86093 2.84534

11 12 13 14 15 16 17 18 19 20

21 22 23 24 25 26 27 28 29 30

0.25658 0.25643 0.2563 0.25617 0.25606 0.25595 0.25586 0.25577 0.25568 0.25561

0.53246 0.53208 0.53175 0.53144 0.53115 0.53089 0.53065 0.53042 0.53021 0.53002

0.85907 0.85827 0.85753 0.85686 0.85624 0.85567 0.85514 0.85465 0.85419 0.85377

1.06267 1.06145 1.06034 1.05932 1.05838 1.05752 1.05673 1.05599 1.0553 1.05466

1.32319 1.32124 1.31946 1.31784 1.31635 1.31497 1.3137 1.31253 1.31143 1.31042

1.72074 1.71714 1.71387 1.71088 1.70814 1.70562 1.70329 1.70113 1.69913 1.69726

1.83965 1.83542 1.83157 1.82805 1.82483 1.82186 1.81913 1.81659 1.81424 1.81205

1.98804 1.98291 1.97825 1.97399 1.9701 1.96651 1.9632 1.96014 1.95729 1.95465

2.07961 2.07387 2.06866 2.0639 2.05954 2.05553 2.05183 2.04841 2.04523 2.04227

2.18943 2.18289 2.17696 2.17154 2.16659 2.16203 2.15782 2.15393 2.15033 2.14697

2.32779 2.32016 2.31323 2.30691 2.30113 2.29581 2.29091 2.28638 2.28217 2.27826

2.51765 2.50832 2.49987 2.49216 2.48511 2.47863 2.47266 2.46714 2.46202 2.45726

2.83136 2.81876 2.80734 2.79694 2.78744 2.77871 2.77068 2.76326 2.75639 2.75000

21 22 23 24 25 26 27 28 29 30

31 32 33 34 35 36 37 38 39 40

0.25553 0.25546 0.2554 0.25534 0.25528 0.25523 0.25518 0.25513 0.25508 0.25504

0.52984 0.52967 0.5295 0.52935 0.52921 0.52908 0.52895 0.52883 0.52871 0.52861

0.85337 0.853 0.85265 0.85232 0.85201 0.85172 0.85144 0.85118 0.85094 0.8507

1.05406 1.0535 1.05298 1.05248 1.05202 1.05158 1.05117 1.05077 1.0504 1.05005

1.30946 1.30857 1.30774 1.30695 1.30621 1.30551 1.30485 1.30423 1.30364 1.30308

1.69552 1.69389 1.69236 1.69092 1.68957 1.6883 1.68709 1.68595 1.68488 1.68385

1.81 1.80809 1.80629 1.80461 1.80302 1.80153 1.80012 1.79878 1.79751 1.79631

1.95218 1.94987 1.9477 1.94567 1.94375 1.94195 1.94024 1.93863 1.93711 1.93566

2.03951 2.03693 2.03452 2.03224 2.03011 2.02809 2.02619 2.02439 2.02269 2.02108

2.14383 2.1409 2.13816 2.13558 2.13316 2.13087 2.12871 2.12667 2.12474 2.12291

2.27461 2.2712 2.26801 2.26501 2.26219 2.25953 2.25702 2.25465 2.2524 2.25027

2.45282 2.44868 2.44479 2.44115 2.43772 2.43449 2.43145 2.42857 2.42584 2.42326

2.74404 2.73848 2.73328 2.72839 2.72381 2.71948 2.71541 2.71156 2.70791 2.70446

31 32 33 34 35 36 37 38 39 40

Tablas estadísticas

7

Universidad Peruana de Ciencias Aplicadas Tabla Nº 3.2 TABLA DE LA DISTRIBUCION T-STUDENT

Área bajo la curva:  P  T  c     

 41 42 43 44 45 46 47 48 49 50

0.4 0.25500 0.25496 0.25492 0.25488 0.25485 0.25482 0.25479 0.25476 0.25473 0.25470

0.3 0.52850 0.52840 0.52831 0.52822 0.52814 0.52805 0.52798 0.52790 0.52783 0.52776

0.2 0.85048 0.85026 0.85006 0.84987 0.84968 0.84951 0.84934 0.84917 0.84902 0.84887

0.15 1.04971 1.04939 1.04908 1.04879 1.04852 1.04825 1.04800 1.04775 1.04752 1.04729

0.1 1.30254 1.30204 1.30155 1.30109 1.30065 1.30023 1.29982 1.29944 1.29907 1.29871

0.05 1.68288 1.68195 1.68107 1.68023 1.67943 1.67866 1.67793 1.67722 1.67655 1.67591

0.04 1.79517 1.79409 1.79305 1.79207 1.79113 1.79023 1.78937 1.78855 1.78776 1.78700

0.03 1.93428 1.93298 1.93173 1.93054 1.92941 1.92833 1.92729 1.92630 1.92535 1.92444

0.025 2.01954 2.01808 2.01669 2.01537 2.01410 2.01290 2.01174 2.01063 2.00958 2.00856

0.02 2.12117 2.11952 2.11794 2.11644 2.11500 2.11364 2.11233 2.11107 2.10987 2.10872

0.015 2.24825 2.24633 2.24449 2.24275 2.24108 2.23949 2.23797 2.23652 2.23512 2.23379

0.01 2.4208 2.41847 2.41625 2.41413 2.41212 2.41019 2.40835 2.40658 2.40489 2.40327

0.005  2.70118 41 2.69807 42 2.69510 43 2.69228 44 2.68959 45 2.68701 46 2.68456 47 2.68220 48 2.67995 49 2.67779 50

51 52 53 54 55 56 57 58 59 60

0.25467 0.25465 0.25462 0.25460 0.25458 0.25455 0.25453 0.25451 0.25449 0.25447

0.52769 0.52763 0.52757 0.52751 0.52745 0.52740 0.52735 0.52730 0.52725 0.52720

0.84873 0.84859 0.84846 0.84833 0.84821 0.84809 0.84797 0.84786 0.84776 0.84765

1.04708 1.04687 1.04667 1.04648 1.04630 1.04612 1.04595 1.04578 1.04562 1.04547

1.29837 1.29805 1.29773 1.29743 1.29713 1.29685 1.29658 1.29632 1.29607 1.29582

1.67528 1.67469 1.67412 1.67356 1.67303 1.67252 1.67203 1.67155 1.67109 1.67065

1.78627 1.78558 1.78491 1.78426 1.78364 1.78304 1.78246 1.78190 1.78137 1.78085

1.92356 1.92272 1.92191 1.92114 1.92039 1.91967 1.91897 1.91830 1.91765 1.91703

2.00758 2.00665 2.00575 2.00488 2.00404 2.00324 2.00247 2.00172 2.00100 2.0003

2.10762 2.10655 2.10553 2.10455 2.10361 2.10270 2.10182 2.10097 2.10015 2.09936

2.2325 2.23127 2.23009 2.22895 2.22785 2.22679 2.22577 2.22479 2.22384 2.22292

2.40172 2.40022 2.39879 2.39741 2.39608 2.39480 2.39357 2.39238 2.39123 2.39012

2.67572 2.67373 2.67182 2.66998 2.66822 2.66651 2.66487 2.66329 2.66176 2.66028

51 52 53 54 55 56 57 58 59 60

61 62 63 64 65 66 67 68 69 70

0.25445 0.25444 0.25442 0.25440 0.25439 0.25437 0.25436 0.25434 0.25433 0.25431

0.52715 0.52711 0.52706 0.52702 0.52698 0.52694 0.52690 0.52687 0.52683 0.52680

0.84755 0.84746 0.84736 0.84727 0.84719 0.84710 0.84702 0.84694 0.84686 0.84679

1.04532 1.04518 1.04504 1.04490 1.04477 1.04464 1.04452 1.04440 1.04428 1.04417

1.29558 1.29536 1.29513 1.29492 1.29471 1.29451 1.29432 1.29413 1.29394 1.29376

1.67022 1.66980 1.66940 1.66901 1.66864 1.66827 1.66792 1.66757 1.66724 1.66691

1.78034 1.77986 1.77939 1.77893 1.77849 1.77806 1.77765 1.77724 1.77685 1.77647

1.91642 1.91584 1.91527 1.91472 1.91419 1.91368 1.91318 1.91269 1.91222 1.91177

1.99962 1.99897 1.99834 1.99773 1.99714 1.99656 1.99601 1.99547 1.99495 1.99444

2.0986 2.09786 2.09715 2.09645 2.09578 2.09514 2.09451 2.09390 2.09330 2.09273

2.22204 2.22118 2.22035 2.21955 2.21877 2.21802 2.21729 2.21658 2.21589 2.21523

2.38905 2.38801 2.38701 2.38604 2.38510 2.38419 2.38330 2.38245 2.38161 2.38081

2.65886 2.65748 2.65615 2.65485 2.65360 2.65239 2.65122 2.65008 2.64898 2.64790

61 62 63 64 65 66 67 68 69 70

75 80 85 90 95 100 105 110 120 ∞

0.25425 0.25419 0.25414 0.25410 0.25406 0.25402 0.25399 0.25396 0.25391 0.25335

0.52664 0.52650 0.52637 0.52626 0.52616 0.52608 0.52600 0.52592 0.52580 0.52440

0.84644 0.84614 0.84587 0.84563 0.84542 0.84523 0.84506 0.84490 0.84463 0.84162

1.04365 1.04320 1.04280 1.04244 1.04212 1.04184 1.04158 1.04134 1.04093 1.03643

1.29294 1.29222 1.29159 1.29103 1.29053 1.29007 1.28967 1.28930 1.28865 1.28156

1.66543 1.66412 1.66298 1.66196 1.66105 1.66023 1.65950 1.65882 1.65765 1.64484

1.77473 1.77321 1.77187 1.77068 1.76961 1.76866 1.76779 1.76701 1.76564 1.75069

1.90967 1.90784 1.90623 1.90480 1.90352 1.90237 1.90133 1.90039 1.89874 1.88079

1.99210 1.99006 1.98827 1.98667 1.98525 1.98397 1.98282 1.98177 1.97993 1.95997

2.09008 2.08778 2.08574 2.08394 2.08233 2.08088 2.07958 2.07839 2.07631 2.05375

2.21216 2.20949 2.20713 2.20504 2.20317 2.20150 2.19998 2.19861 2.19620 2.17009

2.3771 2.37387 2.37102 2.36850 2.36624 2.36422 2.36239 2.36073 2.35782 2.32635

2.64298 2.63869 2.63491 2.63157 2.62858 2.62589 2.62347 2.62126 2.61742 2.57583

75 80 85 90 95 100 105 110 120 ∞

Tablas estadísticas

8

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF