Ejercicios Chi Cuadrado
Short Description
Download Ejercicios Chi Cuadrado...
Description
EJERCICIOS 1. ¿Qué tipo de datos se usan para la prueba con tablas de contingencia? Los datos necesarios para la prueba con tablas de contingencia consisten en medidas muestrales sobre dos variables categóricas (con escala nominal u ordinal) 2. ¿Porque la prueba con tablas de contingencia es útil en las aplicaciones de negocios? La prueba con tablas de contingencia se usa ampliamente en los negocios porque las investigaciones de mercado con frecuencia incluyen la recopilación de datos categóricos. 3. ¿Cuál es el objetivo de la prueba con tablas de contingencia? La prueba con tablas de contingencia determina si dos variables categóricas se relacionan entre si 4. Establezca la hipótesis nula y alternativa alternativa para la prueba con tablas de contingencia. H0: Las variables en las filas y las columnas son independientes H1: Las variables en las filas y las columnas son dependientes 5. ¿Cómo se calculan calculan las frecuencias esperadas para la prueba con tablas de contingencia?
( ) )( )
6. Si una tabla de contingencia tiene 4 columnas y tres filas, ¿Cuántos ¿Cuántos grados de libertad se tienen para la prueba con tablas de contingencia ji cuadrada? gl = (r – 1)(c – 1) r = número de filas c = número de columnas Para nuestro caso: gl = (3 – 1)(4 – 1) = 6 7. Los distribuidores Core- Mark clasifican sus cuentas por cobrar como pagadas a tiempo o retrasadas. Core- Mark también clasifica las cuentas como locales o nacionales. Los datos de las últimas semanas son: SITUACION DEL PAGO PROXIMIDAD PAGADO RETRASADO total LOCAL 75 95 NACIONAL 60 110 total 135 205
170 170 340
a) Establezca la hipótesis hipótesis nula nula y alternativa H0: Situación del pago y proximidad son independientes H1: Situación del pago y proximidad son dependientes b) Calcule los grados de libertad gl = (2 – 1)(2 – 1) = 1 c) Establezca la regla de decisión decisión con un nivel de significancia significancia de 0.02 Si el valor de nuestro estadístico de prueba deja un área mayor a 0,02 aceptaremos nuestra hipótesis nula y concluiremos que la situación del pago y proximidad son independientes, y en caso que esta área sea menor que 0,02 rechazaremos nuestra hipótesis nula planteada d) Prueba si la la proximidad del deudor tiene alguna influencia influencia en la situación de sus pagos.
a) Establezca la hipótesis hipótesis nula nula y alternativa H0: Situación del pago y proximidad son independientes H1: Situación del pago y proximidad son dependientes b) Calcule los grados de libertad gl = (2 – 1)(2 – 1) = 1 c) Establezca la regla de decisión decisión con un nivel de significancia significancia de 0.02 Si el valor de nuestro estadístico de prueba deja un área mayor a 0,02 aceptaremos nuestra hipótesis nula y concluiremos que la situación del pago y proximidad son independientes, y en caso que esta área sea menor que 0,02 rechazaremos nuestra hipótesis nula planteada d) Prueba si la la proximidad del deudor tiene alguna influencia influencia en la situación de sus pagos.
Por tanto concluimos que la situación del pago y proximidad son independientes, es decir que la proximidad del deudor no influye en su situación de pago, aceptando así nuestra hipótesis nula
8. Publicidad Pacific investiga la relación entre el tipo favorito el mensaje comercial y el nivel de ingresos para una muestra de consumidores. Los datos son:
INGRESO BAJO MEDIO ALTO total
COMERCIAL FAVORITO A B C 25 40 70 30 30 30 45 20 10 100 90
135 90 75 110 300
a) Establezca las hipótesis nula y alternativa H0: Ingreso y comercial favorito son independientes H1: Ingreso y comercial favorito son dependientes b) Calcule los grados de libertad gl = (3 – 1)(3 – 1) = 4 c) Establezca le regla de decisión con un nivel de significancia de 0.05 Si el valor de nuestro estadístico de prueba deja un área mayor a 0,05 aceptaremos nuestra hipótesis nula y concluiremos que el ingreso de las personas con su comercial favorito son independientes, y en caso que esta área sea menor que 0,05 rechazaremos nuestra hipótesis nula planteada d) Pruebe si el nivel de ingreso se relaciona con la preferencia de comerciales.
Por tanto concluimos que el nivel Ingreso y comercial favorito son dependientes, es decir que el nivel de ingreso se relaciona con la preferencia de comerciales, rechazamos nuestra hipótesis nula y aceptamos la hipótesis alternativa. 9. La corporación Computervision investiga si la calidad de las partes es independiente del turno de producción. Los datos en número de partes no defectuosas frente a defectuosas son: CALIDAD DE LA PARTE NO TURNO DEFECTUOSA DEFECTUOSA MATUTINO 67 726 VESPERTINO 33 575 NOCTURNO 61 363 total 161 1664
793 608 424 1825
a) Establezca las hipótesis nula y alternativa H0: calidad de la parte y turno de producción son independientes H1: calidad de la parte y turno de producción son dependientes b) Calcule los grados de libertad gl = (3 – 1)(2 – 1) = 2 c) Establezca le regla de decisión con un nivel de significancia de 0.05 Si el valor de nuestro estadístico de prueba deja un área mayor a 0,05 aceptaremos nuestra hipótesis nula y concluiremos que la calidad de la parte y turno de producción son independientes , y en caso que esta área sea menor que 0,05 rechazaremos nuestra hipótesis nula planteada d) Pruebe si la calidad de la parte es independiente del turno de producción
Por tanto concluimos que calidad de la parte y turno de producción son dependientes, rechazamos nuestra hipótesis nula y aceptamos la hipótesis alternativa.
10. Los grandes almacenes A.D.Nickel vende vales de regalo durante la temporada de navidad. El gerente de ventas, Leo Henneman, quiere determinar si el valor de un vale tiene alguna relación con lo que el cliente compra con dicho vale. Los datos recogidos de una muestra de clientes son: VALOR DEL VALE DEPARTAMENTO $ 10 $ 50 ELECTRODOMESTICOS 22 26 ROPA 33 31 HERRAMIENTAS 41 43 total 96 100
$ 100 + 54 22 19 95
102 86 103 291
a) Establezca las hipótesis nula y alternativa H0: valor del vale y departamento son independientes H1: valor del vale y departamento son dependientes b) Calcule los grados de libertad gl = (3 – 1)(2 – 1) = 2 c) Establezca le regla de decisión con un nivel de significancia de 0.01 Si el valor de nuestro estadístico de prueba deja un área mayor a 0,0 aceptaremos nuestra hipótesis nula y concluiremos que el valor del vale y departamento son independientes , y en caso que esta área sea menor que 0,01 rechazaremos nuestra hipótesis nula planteada d) Pruebe si el valor del vale se relaciona con lo que el cliente compra
De donde podemos concluir que el valor del vale si se relaciona con lo que el cliente compra es decir rechazamos nuestra hipótesis nula y aceptamos la hipótesis alternativa. 11. La Asociación Metropolitana está planeando construir un nuevo club deportivo en Pueblo, Colorado. El grupo emprendió una investigación de mercado en el sur de Colorado para determinar las preferencias deportivas de los hombres de varias edades. Una muestra aleatoria de 680 hombres dio los siguientes resultados:
DEPORTE HOCKEY BASKETBOL FUTBOL AMERICANO FUTBOL total
GRUPO DE EDAD 18-30 31-45 25 50 100 80 5 20 150
25 30 185
45-60 75 30 25 40 170
61+ 100 10
total 250 220
30 35 175
85 125 680
a) Establezca las hipótesis nula y alternativa H0: Grupo de edad y deporte son independientes H1: Grupo de edad y deporte son dependientes b) Calcule los grados de libertad gl = (4 – 1)(4 – 1) = 9 c) Establezca le regla de decisión con un nivel de significancia de 0.10 Si el valor de nuestro estadístico de prueba deja un área mayor a 0,1 aceptaremos nuestra hipótesis nula y concluiremos que el Grupo de edad y deporte son independientes, y en caso que esta área sea menor que 0,1 rechazaremos nuestra hipótesis nula planteada d) Se relaciona la edad con las preferencias deportivas.
Nuestra probabilidad p menor a o,10 nos da evidencia suficiente para rechazar la hipótesis nula y aceptar la hipótesis alternativa y concluir que la edad si se relaciona o es dependiente de la preferencias deportivas.
PRUEBAS DE BONDAD DE AJUSTE 12. ¿Qué tipo de datos se usan en la prueba de bondad de ajuste ji cuadrada? Se utilizan datos cualitativos o categóricos 13. ¿Por qué la prueba de bondad de ajuste ji cuadrada es útil en los negocios? Esta prueba se usa ampliamente en los negocios porque muchas situaciones requieren medidas sobre personas en lugar de cosas 14. ¿Cuál es el objetivo de la prueba de bondad de ajuste? El objetivo es medir el grado en el que las frecuencias observadas en cada categoría de una sola variable se ajustan a las frecuencias que se esperan para una población hipotética. 15. Establezca la hipótesis nula y alternativa para la prueba de bondad de ajuste. H0: La muestra procede de la población especificada H1: La muestra no procede de la población especificada 16. ¿Cómo se calcula las frecuencias esperadas en una prueba de bondad de ajuste? A través del valor que se espera que tome cada una de estas frecuencias y en caso de que se quiera comprobar que la muestra proviene de alguna distribución en específica se usará la función de distribución correspondiente para sacar el valor de las frecuencias esperadas. 17. si una prueba de bondad de ajuste para investigar preferencias de marcas iguales tiene cuatro categorías, ¿Cuántos grados de libertad tiene la prueba? gl = k - 1 – c gl = 4 – 1 – 0 = 3 18. Si una prueba de bondad de ajuste para investigar si una variable sigue una distribución normal tiene ocho categorías, ¿Cuántos grados de libertad tiene la prueba? gl = k - 1 – c gl = 8 – 1 – 2 gl = 5 19. ¿En que difieren la prueba con tablas de contingencia y la prueba de bondad de ajuste? La prueba de bondad de ajuste solo incluye una variable categórica mientras que con tablas de contingencia se estudia la comparación de dos variables categóricas. 20. La compañía de refrescos Shaga está a punto de introducir en el mercado su refresco de cola dietético y quiere saber si los consumidores prefieren una marca determinada en una prueba de sabor a ciegas. Se ofrece 200 bebederos de refresco de cola dietético cuatro bebidas diferentes en recipientes idénticos y se les pide que indiquen su favorito. Los resultados son.
Refresco de cola dietético favorito A
B
C
D
Frec observada
60
43
46
51
Frec esperada
50
50
50
50
a) Establezca la hipótesis nula y alternativa H0: La gente prefiere cualquier marca por igual H1: La gente prefiere una marca específica b) Calcule los grados de libertad. gl = k – 1 – c gl = 4 – 1 – 0 gl = 3 c) Establezca la regla de decisión con un nivel de significancia de 0,01. Si el área que tiene el punto crítico de nuestro estadístico de prueba ji cuadrado que calcularemos es menor a 0,01 entonces se rechazará la hipótesis nula y se concluirá que la gente prefiere cualquier marca de cola por igual caso contrario no habrá evidencia para rechazar la hipótesis nula y se concluirá que la gente prefiere una marca específica d) Pruebe si la gente prefiere una marca a otra.
Nuestro estadístico de prueba ji cuadrado de 3,32 deja un área de 0,3449 que es mayor que nuestro nivel de significancia 0,01 por lo que aceptamos nuestra hipótesis nula y concluimos que la gente prefiere cualquiera de las cuatro marcas por igual 21. Kay Brigth, supervisora de contabilidad en Westman Corporation, quiere saber si el proceso contable de la compañía se puede simular usando una distribución de Poisson para describir si la incidencia de error. Kay toma una muestra aleatoria de 400 cuentas de los registros de contabilidad de la empresa y resume el número de errores encontrados en cada cuenta. Los resultados son: Número de errores 0 1 2 3 4 ó mas Número de cuentas 102 140 75 52 31 F. esperada (dist poisson) 0,99239885 1 0,31238423 0,00055273 2,30533582 a) Establezca las hipótesis nulas y alternativas. H0: la muestra procede de una distribución de Poisson H1: la muestra no procede de una distribución de Poisson b) Calcule los grados de libertad. gl = k – 1 – c gl = 5 – 1 – 1
gl = 3 c) Establezca la regla de decisión con un nivel de significancia de 0,05. Al 95% de confianza probaremos si los datos obtenidos en la tabla dan evidencia suficiente para decir que los mismos provienen de una distribución de Poissón d) Pruebe si la distribución de Poisson describe la incidencia de error en los registros contables de la compañía.
Nuestro valor chi cuadrado con un valor de 56551,63 deja un áre a menor al 0,05 por lo que rechazamos la hipótesis nula y concluimos que la muestra no procede de una distribución de Poisson 22. El First Intercountry Bank investigó el número de operaciones comerciales fallidas en los condados en los que tiene sucursales. El vicepresidente, Cal Worship, intenta obtener datos que les sirven para decidir cómo distribuir a los ejecutivos de préstamos comerciales del banco entrenados especialmente en la gestión de bancarrotas. Los resultados del muestreo son:
Condado Fracaso observado Fracaso esperado
A 17 20
B 23 20
C 25 20
D 12 20
E 23 20
a. Establezca las hipótesis nula y alternativa. H0: Los 5 condados tienen el mismo número de problemas H1: Los 5 condados no tienen el mismo número de problemas b. Calcule los grados de libertad. gl = k – 1 – c gl = 5 – 1 – 0 gl = 4 c. Establezca la regla de decisión con un nivel de significancia de 0.10. Al 90% de confianza probaremos si los 5 condados tienen el mismo número de problemas d. Determine si es razonable o no que Cal asigne a los ejecutivos de préstamos bajo la suposición de que los 5 condados tienen el mismo número de problemas.
Nuestro chi cuadrado de 5,8 deja un área de 0,2146 que es mayor que 0,10 por lo que aceptamos la hipótesis nula y concluimos que los 5 condados tienen el mismo número de problemas 23. Los registros históricos indican el número promedio de llamadas solicitando un servicio que se reciben en las instalaciones se servicio Magna es de cuatro llamadas a la hora. Se obtiene una muestra aleatoria de 200 intervalos de una hora y se registran las frecuencias de llamadas de servicio. Los resultados son: Número de Llamadas Número de 200 intervalos de una hora 0 45 1 99 2 32
3 4 o más
19 5 Suma 200
Utilice un nivel de significancia de 0.05 para probar si la distribución de Poisson describe o no el número de llamadas de servicio recibidas en las instalaciones de Magna.
H0: la muestra procede de una distribución de Poisson H1: la muestra no procede de una distribución de Poisson Como nos podemos dar cuenta la probabilidad de nuestro estadístico chi cuadrado es menor a 0,05 que es nuestro nivel de significancia por lo que rechazamos nuestra hipótesis nula y concluimos que la muestra no procede de una distribución de Poisson
EJERCICIOS 24. ¿Cuál es la regla general respecto a la frecuencia esperada necesaria para realizar una prueba ji cuadrada válida? Todas las frecuencias esperadas deben ser por la regla general mayores que 5 25. ¿Cómo puede usar el valor p el analista que lleva a cabo una prueba ji cuadrado? El analista puede tomar una decisión racional para rechazar o no la hipótesis nula basada en el conocimiento del valor p
26. Después de rechazar la hipótesis nula en una prueba con tablas de contingencia. ¿Qué debe hacer el analista? Cuando se rechaza la hipótesis nula en la prueba de tablas de contingencia, la conclusión es que existe dependencia entre las variables de las filas y las columnas 27. La compañía Aliance Pacific realizó una encuesta entre los electores para conocer su opinión sobre una proposición para proteger un área acuífera. Se les preguntó cuál sería su voto y se probó esta variable comparándola con el nivel de ingresos, en miles de dólares. Los resultados son: Preferencia de los electores Nivel de ingresos ($1000) Si No Indeciso Menos de 15 155 55 35 De 15 a menos de 30 409 110 30 De 30 a menos de 50 269 45 26 50 ó más 84 11 9 a) Establezca las hipótesis nula y alternativa H0: La preferencia de los electores con su nivel de ingreso son independientes H1: La preferencia de los electores con su nivel de ingreso son dependientes b) Calcule los grados de libertad gl = (3 – 1)(4 – 1) gl = 6 c) Establezca la regla de decisión con un nivel de significancia de 0.05 Al 95% de confianza probaremos si el nivel de ingresos de una persona influye con su voto sobre la protección del área acuífera d) Pruebe si el nivel de ingresos de una persona se relaciona con su voto sobre la protección del área acuífera
Nuestro valor de chi cuadrado deja un área menor que 0,05 por lo q ue rechazamos la hipótesis nula y concluimos que el nivel de ingreso de una persona se relaciona con su voto
28. En la investigación del ejercicio 27, la variable escolaridad también se probó comparándola con la forma en que las personas planeaban votar en el plebiscito. Los resultados son: Preferencia de los electores Escolaridad Si No Indeciso Preparatoria 303 65 30 Parte de universidad 282 70 40 En posgrado 332 86 30 a) Establezca la hipótesis nula y alternativa H0: La escolaridad de los electores no se relaciona con su voto H1: La escolaridad de los electores se relaciona con su voto b) Calcule los grados de libertad gl = (3 – 1)(3 – 1) gl = 4 c) Establezca la regla de decisión con un nivel de significancia de 0.01 Al 90% de confianza probaremos si la escolaridad se relaciona o no con el voto positivo de una persona para el área acuífera
d) Pruebe si la escolaridad se relaciona con el voto positivo de una persona para la protección del área acuífera
Y como nos podemos dar cuenta el área generada es mayor que 0.01 por lo que aceptamos nuestra hipótesis nula y concluimos que la escolaridad de los electores no se relaciona con su voto 29. La compañía Dayton trata de decidir sobre cómo debe distribuir su presupuesto de publicidad. Harold Ellis, el analista de la compañía sugiere que se haga un estudio para determinar la efectividad de los distintos tipos de publicidad en otras empresas. Obtiene los siguientes datos
Número de tiendas Tipos de publicidad
Incremento Ventas Disminución en ventas estables en ventas Periódico 18 12 4 Radio 12 16 3 TV 14 16 2 a) Establezca la hipótesis nula y alternativa H0: El tipo de publicidad y las ventas son independientes H1: El tipo de publicidad y las ventas son dependientes b) Calcule los grados de libertad gl = (3 -1)(3 – 1 ) gl = 4
c) Establezca la regla de decisión con un nivel de significancia de 0.1 Al 90% de confianza probaremos si el tipo de publicidad afecta o no a las ventas d) Pruebe si el tipo de publicidad afecta a las ventas
Y como nos damos cuenta nuestro valor p mayor que 0,1 nos da evidencia suficiente para aceptar la hipótesis nula y concluir que el tipo de publicidad no afecta a las ventas
EJERCICIOS 30. Cuando se usa la prueba de la ji cuadrad, ¿es necesario supones que la población sique una distribución normal? No es necesario ya que la prueba ji cuadrada se usa solo para variables categóricas 31. ¿Cuáles son las similitudes entre la distribución ji cuadrada y la distribución t? ¿Cuáles son sus diferencias? La distribución t y la distribución ji cuadrada se caracterizan por un solo parámetro los grados de libertad, y la diferencia es que la distribución t se usa para trabajar en datos numéricos y la ji cuadrada se utiliza para datos categóricos, además que la t también necesita dos parámetros mas que son la media y la varianza 32. ¿Por qué la hipótesis alternativa de las pruebas de ji cuadrada es de una cola? Esto se debe a que la distribución ji cuadrada tiene sesgo positivo y deja un área en la cola derecha mucho más significativa que el área de la cola izquierda 33. Janis Yee, el director de mercadotecnia de la compañía Financial Fleet, lleva a cabo un experimento para determinar si el tipo de timbres que se usa en los sobres con cuestionarios influye en el hecho de que lo devuelvan. Janis manda
por correo 4000 cuestionarios; la mitad con un sello postal y la otra mitad con una estampilla normal. Los resultados son: Tipo de timbre Sello Estampilla Respondió No respondió
750
775
1250
1225
a) Establezca la hipótesis nula y alternativa. H0: la tasa de respuesta no varía con el tipo de timbre postal, (son indep) H1: la tasa de respuesta varía con el tipo de timbre postal b) Calcule los grados de libertad. gl = (r – 1)(c – 1) gl = (2 – 1)(2 – 1) gl = 1 c) Establezca la regla de decisión con un nivel de significancia de 0,01. Si la probabilidad p de nuestro estadístico de prueba fuera mayor que 0,01 aceptaríamos la hipótesis nula y concluiríamos que la tasa de respuesta no varía con el tipo de timbre postal. Y si este valor fuera menor que 0,01 rechazaríamos H0 y concluiríamos que la tasa de respuesta varía con el tipo de timbre postal d) Pruebe si la tasa de respuesta varía con el tipo de timbre postal.
Como podemos observar la probabilidad del estadístico de prueba es mayor que 0,01 por lo que aceptamos la hipótesis nula y concluimos que la tasa de respuesta no varía con el tipo de timbre postal 34. Tony Greenwell, analista de la compañía de seguros Wise, piensa que los conductores de automóviles jóvenes tienen más accidentes y deben pagar más por el seguro de sus autos. Para probar esta hipótesis, Tony reúne evidencias estadísticas sobre las tasas de siniestros para diferentes grupos de edad en un promedio de cinco años: Grupo de edad Con siniestro Sin siniestro 16 – 20 50 175 21 – 34 45 225 35 – 49 38 375 50 s más 34 225 a) Establezca la hipótesis nula y alternativa. H0: El número de siniestros no depende de la edad H1: El número de siniestros depende de la edad b) Calcule los grados de libertad. gl = (r – 1)(c – 1) gl = (4 – 1)(3 – 1) gl = 6 c) Establezca la regla de decisión con un nivel de significancia de 0,05. Si la probabilidad p de nuestro estadístico de prueba fuera mayor que 0,05 aceptaríamos la hipótesis nula y concluiríamos que el número de siniestros no depende de la edad. Y si este valor fuera menor que 0,01 rechazaríamos H0 y concluiríamos que el número de siniestros depende de la edad d) Pruebe si el número de siniestros depende de la edad.
Como podemos observar la probabilidad de nuestro estadístico de prueba es mucho menor que nuestro nivel de significancia de 0,05 por lo que rechazamos la hipótesis nula y concluimos que el número de siniestros depende de la edad 35. Holly Largent, vicepresidente de computación de la North ern University, ha recogido datos sobre el número de veces que se interrumpió el servicio a los usuarios por día, durante el último año. Holly quiere determinar la distribución de probabilidad adecuada para estas variables de manera que pueda crear un proceso de simulación. Los datos son: Interrupciones por día Número de días 0 117 1 128 2 63 3 30 4 13 5 o mas 14 ¿A qué conclusión llegará Holly? 36. La compañía Bif Peanut Butter está preocupada por sus preferencias que tienen los consumidores por otras marcas de crema de cacahuete. Contrata los servicios de una empresa de investigación que realiza una encuesta telefónica de 400 casas y obtiene las siguientes preferencias de marca:
Marca A Bif Marca C Marca D Marca E 75 65 90 82 88 Escriba un memorándum para la empresa de investigación resumiendo estos resultados. Si no hubiera preferencias de marcas por parte de los consumidores se esesperaría las siguientes frecuencias Marca A Bif Marca C Marca D Marca E 75 65 90 82 88 frec observadas frec esperadas
80
80
80
80
80
Por lo que entonces probaremos las siguientes hipótesis: H0: Todas las marcas tienen igual demanda de crema de cacahuate H1: no todas las marcas tienen igual demanda de crema de cacahuate
Por lo que con este valor aceptamos la hipótesis nula y concluimos que todas las marcas tienen igual demanda de crema de cacahuate por lo que se puede hacer un informe a la empresa en la cual se detalle que los resultados de la investigación nos dicen que no hay
preferencia de los consumidores por ningún tipo de marca por lo que la empresa puede estar tranquila. 37. Diane Morton, directora de mercadotecnia para las Autoridades de Transito de Spokane, contrató a Decision Science Associates para llevar a cabo un estudio de mercado. Diane quiere determinar si los usuarios del transporte viven más cerca de una parada de autobús que los que no lo usan. La decision Science hace un estudio de 1201 residentes del condado de Spokane. Los resultados son: Proximidad a la parada Usuarios No usuarios Total del autobus Menos de una manzana 1 o 2 manzanas 3 o 4 manzanas
200
234
434
170 55
221 112
391 167
5 manzanas o mas 52 117 169 No lo sabe 12 28 40 TOTALES 489 712 1201 Escriba un memorándum a Diane explicándole los resultados de este estudio. Vamos a plantear las siguientes hipótesis: H0: La proximidad a la parada del autobús no depende al momento de que una persona use o no este transporte H1: La proximidad a la parada del autobús influye al momento de que u na persona use o no este transporte
Podemos observar de acuerdo a este estudio que la proximidad a la parada del autobús con respecto al lugar donde viven los usuarios del mismo influye en el hecho de que sean usuarios, es decir las personas que se encuentran más alejadas de la parada del autobús suelen no ser usuarias de este medio de transporte 38. Berry Wise creó un programa de computadora para generar números aleatorios de un digito y quiere estar seguro de que dicho programa funcione correctamente. Su amigo, Michelle Conrath, está realizando un curso de estadística y accede a probar el programa. Michelle usa el programa para generar 1000 números aleatorios. Números Frecuencia 0 90 1 85 2 115 3 101 4 92 5 107 6 85 7 112 8 113
9 100 N 1000 ¿Qué debe decir Michelle a Berry sobre el programa? 0 números 1 2 3 4 5 frec 90 85 115 101 92 107 observada frec esperada 100 100 100 100 100 100
6 85
7 112
8 113
9 100
100
100
100
100
Para que este sea un buen programa debería generar una población de números aleatorios iguales H0: población de números aleatorios p = 100 H1: p ≠ 100
Por lo que concluimos que es un buen programa ya que genera una población de números aleatorios iguales 39. Carla Parrish piensa que la demanda de buñuelos de mermelada los fines de semana en Strick’s Doughnut sigue una distribución normal. Si esta en lo cierto, podrá resolver el problema de inventario de cuantos buñuelos debe hacer los viernes. Carla recoge los datos de los últimos 100 fines de semana. 40 39 33 43 45 39 44 36 39 36 45 42 45 42 33 43 42 42 45 37
42 41 34 35 47 37 31 45
39 36 43 40 37 42 34 38
40 40 38 48 40 35 37 33
40 44 50 41 40 42 34 30
38 45 37 37 39 40 31 39
36 35 38 38 47 44 31 42
37 39 35 37 37 35 42 40
37 49 36 37 39 41 39 38
41 40 39 40 36 38 43 45
42 36 31 37 45 39 44 42
Y como podemos observar estos datos claramente siguen una distribución normal Si Carla usa un nivel de significancia de 0,05, ¿Cuál será sus conclusiones?
40. “Videophiles”, un articulo den el American Demographics (julio de 1992), publica la demografía de los usuarios de kmedios de comunicación. Una vez al año, Simmons Market Research Bureau solicita a cerca de 20000 estadounidenses que den una idea detallada sobre un comportamiento de compras, uso de medios de comunicación, características demográficas y actitudes. El estudio pregunta sobre la mayoría de las formas de comunicación, incluso revistas y periódicos, películas, estaciones de radio, canales de televisión, alquiler de videos, y la compra de libros, juegos de video y discos compactos. Simmons identifica varios tipos de usuarios, cada uno con distintas características demográficas. Entre las personas que contestaron, se identificó un total de 3800, ya sea como videoadictos o compradores de discos compactos; la siguiente tabla desglosa los resultados por categorías de ingresos por casa. Ingreso por casa Videoadictos Compradores de Total discos compactos Menos de $15000 208 84 292 $15000 a menos de $35000 512 300 812 $35000 a menos de $60000 560 384 944 $60000 o más 320 432 752 1600 1200 2800 Todd Corlett está interesado en abrir una tienda para videoadictos (usuarios constantes de videos, juegos y TV por cable) y quiere saber si los compradores de discos compactos prevalecen en las mismas categorías de ingresos de los videoadictos. Esta información le ayudará a determinar donde localizar su nueva tienda. ¿Debe concluir Todd que la clasificación de personas, ya sea como videoadictos o como compradores de discos compactos, es independiente de las categorías de ingresos por casa? Lo que haremos es probar las siguientes hipótesis bajo el estadístico de prueba chi cuadrado: H0: La clasificación de las personas es independiente de las categorías de ingresos por casa H1: La clasificación de las personas depende de las categorías de ingreso por casa
A un nivel de significancia de 0,01 rechazamos nuestra hipótesis nula y concluimos que la clasificación de las personas depende de las categorías de ingreso por casa 41. Investigaciones Robinson lleva a cabo un estudio de porcentajes de mercado en el ares de Atlanta. Bill Robinson, el presidente de la compañía, identificó siete tipos de usuarios de medios de comunicación, cada uno con características demográficas distintas. Para determinar si sus resultados pueden extrapolarse a toda la población, Bill los compara con los suministros por Simmons Market Research Bureau (American Demographics, julio de 1992). Los porcentajes de Simmons para cad a grupo fueron: fanáticos de TV (22%), radioyentes (22%), lectores de periódicos (20%), cinéfilos (12%), compradores de libro (10%), video adictos (8%), y compradores de discos compactos (6%). Cuando Robinson clasifico sus 500 personas d e la muestra, los resultados fueron: fanáticos de TV (100), radioyentes ( 120), lectores de periódicos (80), cinéfilos (80), compradores de libros (35), video adictos (60) y compradores de discos compactos (25). ¿Son los resultados de Bill los mismos que los que publica Simmons Market Research Bureau?
Para este problema los datos tomados por Bill se constituirán en frecuencias observadas mientras que los datos que publica Simmons son los valores que Bill espera que tomen sus datos (frecuencias esperadas)
H0: Los datos tomados por Bill son los mismos que los de la publicación de Simmons H1: Los datos tomados por Bill son distintos a los de la publicación de Simmons
Con esta área mayor que 0,01 que deja nuestro estadístico de prueba aceptamos la hipótesis nula y concluimos que los datos tomados por Bill son los mismos que los de la publicación de Simmons
EJERCICIOS ADICIONALES:
1) BABBET ELECTRONICS
Joe Burt es el gerente de control de calidad de la planta de la compañía Babbet Electronics que fabrica discos compactos (CD). Su jefe, el gerente de la planta, hace poco explicó a la junta de ejecutivos que acababa de leer un artículo en la revista Gramophone (agosto de 1989) sobre las ventas de CD en el mercado japonés. El administrador estableció que la calidad de las unidades producidas por Babbet había disminuido ligeramente en el último año, lo que afectaba a la efectividad de la compañía en este mercado. Joe contesto que la calidad no había bajado, pero no tenía datos que lo respaldaran. Decidió buscar alguna evidencia que confirmara o contradijera la afirmación del gerente de la planta. Se obtuvieron los registros de la compañía anteriores al último año para tener una idea del nivel de calidad en ese momento. Después e tomó una muestra aleatoria de los informes de calidad de 224 CD a partir de los registros de los últimos seis meses. Se establecieron cinco categorías para las condiciones de los CD (Tabla 11.17). Los porcentajes históricos se multiplicaron por 224 (tamaño de la muestra) para producir las frecuencias esperadas. Estas se compararon con las frecuencias observadas en cada categoría para poder realizar una prueba de bondad de ajuste. La hipótesis nula es que no hubo cambio en la calidad durante los últimos meses. TABLA 11.17 Datos para el ejercicio adicional 45. Calidad de producto Adecuada
Pequeña corrección
Volver a procesar
Vender con Descartar descuento
Entonces
163
37
10
8
6
Ahora
125
56
12
15
16
Con los datos de la tabla 11.17 Joe calcula un valor de p de 41,82 para la prueba de bondad de ajuste. Considera que este es un valor de prueba muy grande y se da cuenta que su jefe tiene razón: la calidad de la línea de CD se ha deteriorado en el último año, por lo que deberán tomarse medidas. a. ¿Calculó bien Joe el estadístico de prueba? Las hipótesis a evaluarse son las siguientes: H0: no hubo cambio en la calidad durante los últimos meses. H1: hubo cambio en la calidad durante los últimos meses.
Si, el estadístico de prueba calculado por joe es correcto b. ¿Cuáles son los valores críticos de la tabla para ji cuadrada, para varios niveles de significancia? Alfa 0,1 0,05 0,02 0,01 ji cuadrada 7,77944034 9,48772904 11,6678434 13,2767041 c. ¿Es correcto la conclusión final de Joe? Es correcta en cuanto Joe da la razón al gerente de la Empresa al concluir que hubo cambio en la calidad durante los últimos meses.
2) COMPAÑIA PETROLERA SHELTY Durante muchos años, Shelty (un mayorista de gasolina y otros productos para automóvil, a nivel nacional) ha ofrecido al publico su propia tarjeta de crédito. Es caro mantener este servicio y la administración de Shelty se pregunta si debe eliminar las tarjetas. Se piensa que las tarjetas de créditos generales, tan populares en estos tiempos, se prefieren a las tarjetas que se pueden usar solo con una compañía. Se contrata a un consultor para diseñar una encuesta que se mandará a una muestra aleatoria de 1383 titulares de tarjetas de crédito. Una de preguntas demográficas pide a los encuestados que clasifiquen el uso de su tarjtea Shelty como: Frecuente, regular o nulo. Otra pregunta utiliza una escala de 1 a 7 para determinar la opinión de los encuestados sobre la conveniencia de continuar con la tarjeta Shelty. La tabla 11,18 contiene los datos que se obtuvieron. a. ¿Cuál es la hipótesis nula en esta situación? H0: La conveniencia que tiene la tarjeta es independiente del uso que le da el usuario H1: La conveniencia de la tarjeta influye en el uso de la misma
b. ¿Cuál es el estadístico de prueba, el número de grados de libertad para la prueba y el valor crítico para un nivel de significancia de 0,05? El estadístico de prueba que utilizaremos es la prueba chi cuadrada con tablas de contingencia gl = (r – 1)(c – 1) gl = (3 – 1)(7 – 1) gl = 12 El valor crítico para un nivel de significancia de 0,05 es 21,03 c. Con un nivel de significancia de 0,05, establezca el resultado de esta prueba en términos sencillos. No conveniente Bastante conveniente Uso de 1 2 3 4 5 6 7 tarjeta Frecuente 56 79 87 93 128 59 21 Regular 67 89 94 132 32 21 16 Nulo 87 128 90 64 21 10 9
Con este valor rechazamos la hipótesis nula y concluimos que la conveniencia de la tarjeta influye en el uso de la misma
3) VELLEY HOSPITAL . Lane Samson, jefe de la administración de un pequeño hospital en el oeste de Estado Washington, contrató a un consultor para que lleve a cabo un estudio en el área de servicio de su hospital. Se puso en marcha una serie de grupos de interés, además de una encuesta de puerta en puerta. Entre los aspectos de interés para Lane se encuentra la respuesta a la siguiente afirmación: En lo que respecta a atención sanitaria, me sentiría mejor si me trataran en el Valley Hospital. Se preguntó a los encuestados su reacción a esta afirmación y se clasificó la información según las siguientes respuestas: Estoy en completo acuerdo, no estoy de acuerdo, neutral o sin opinión, estoy de acuerdo o estoy completamente de acuerdo. Lane ya vio la tabulación de las respuestas para toda la muestra, pero quiere compararlas según dos aéreas geográficas clave. La primera (área 1) es el área de la vecindad inmediata al hospital (cuadro millas alrededor).la segunda (área 2) es el condado en el que se encuentra el hospital, fuera de las cuatro millas. Los datos se ejecutaron en el programa de computadora SPSS, versión X. se presentan aquí los comandos para generar una tabla cruzada en el área según la respuesta a la afirmación: CROSSTABS TABLES= VAR5 BY VAR 14 STATISTICS 1 Cuando se introducen los datos en la computadora, el número de área (1 o 2) es la quinta variable, por lo que esta variable recibe el nombre de VAR5. La variable de la respuesta a la afirmación de interés para LANE se introdujo como la variable 14, por lo que recibe el nombre de VAR14. La segunda línea de comandos que se muestra pide al programa que calcule el valor ji cuadrado y el valor p de los datos. Una vez finalizada la ejecución del programa de computadora, se produjeron los siguientes resultados: VAR 14 VAR 5 SD D N A SA 1 9 30 53 65 17 2 21 45 42 15 11 CHI – SQUARE = 36,97 p = 0,0000 Lane interpreta estos resultados de la siguiente manera: la tabla cruzada indica el numero de respuestas en cada una de las 10 categorías, y el número total de respuestas es de 308, el tamaño de la muestra puerta en puerta. Se calculó el estadístico ji cuadrada, 36,97, mediante la ecuación 11,2. Lane calculó los grados de libertad, 4, lo que llevo a la tabla de 13,277 a un nivel de significancia de 0,01. Así, se rechaza la hipótesis de independencia entre filas y columnas y se concluye que las dos áreas reaccionan de la forma distinta a la posibilidad de que se les trate en el Valley Hospital. Al analizar la tabla cruzada, Lane encuentra que los residentes del área 1 (cerca del hospital) se sienten más cómodos con la idea de recibir tratamiento en el Valley Hospital que quienes viven más lejos. Lane decide que una campaña de publicidad puede mejorar esta situación. a. ¿Llegó Lane a la conclusión adecuada según los resultados de la computadora?
View more...
Comments