Ejercicios Tema 2 Estadística II
Short Description
Ejercicios Tema 2 Estadística II...
Description
Estad´ıstica II Ejercicios Tema 2
1. Una empresa farmac´eutica est´ a preocupada por controlar el nivel de impurezas en uno de sus productos; su objetivo es que la concentraci´on de las impurezas no supere el 3%. Se sabe que para un lote del producto la concentraci´ on de las impurezas sigue una distribuci´on normal con desviaci´ on t´ıpica de 0.4%. Se ha seleccionado una muestra aleatoria de un lote del tama˜ no 64, y se ha obtenido que la concentraci´ on promedio de las impurezas en la muestra era de 3.07%. (a) Contraste a un nivel del 5% que la media de impurezas en la poblaci´on es igual al 3%, frente a la alternativa de que sea mayor del 3%. (b) Encuentre el menor nivel de significaci´on para el que se pueda rechazar la hip´otesis nula. (c) Supongamos que la hip´ otesis alternativa fuese bilateral en vez de unilateral. Indique, sin llevar a cabo nuevos c´ alculos, si el p-valor del contraste ser´ıa superior o inferior al obtenido en 1b. Dibuje un gr´ afico que ilustre sus argumentos. (d) En el contexto de este problema, explique porqu´e una hip´otesis alternativa unilateral puede ser m´ as apropiada que una hip´ otesis bilateral. 2. Un profesor de Estad´ıstica est´ a interesado en contrastar la capacidad de los estudiantes para determinar la dificultad de un examen una vez que lo han completado. Un n´ umero elevado de estudiantes han realizado un examen, con una nota promedio de 78.5. Se pide a una muestra aleatoria de ocho estudiantes que predigan esta nota media, obteniendo los valores siguientes: 72
83
78
65
69
77
81
71
Suponemos que la distribuci´ on de estas predicciones es normal. (a) Contraste la hip´ otesis nula de que la media de las predicciones en la poblaci´on ser´ıa 78.5. Utilice una alternativa bilateral y un nivel de significaci´on del 10%. (b) Si se hubieran obtenido los mismos valores (media y desviaci´on t´ıpica) de una muestra aleatoria de diecis´eis estudiantes, ¿ser´ıa la conclusi´on del contraste diferente de la obtenida en 2a? (c) Si llevar a cabo ning´ un nuevo c´ alculo y sobre la base de la respuesta a 2a, decida si un intervalo de confianza al 90% para la media de la poblaci´on incluir´ıa el valor 78.5 o no. ¿Y en el caso de un intervalo de confianza para la media al 95%? 3. El alcalde de una ciudad cree que en una barriada especialmente deprimida al menos el 20% de todos los varones entre 18 y 65 a˜ nos de edad est´an en paro. Una muestra aleatoria de 120 hombres de esta poblaci´ on incluy´ o a veinte desempleados. (a) Contraste la creencia del alcalde a un nivel de significaci´on del 5%. (b) Calcule la potencia de dicho contraste. (c) Construya una gr´ afica de la curva obtenida en 3b usando Excel. (d) A partir del gr´ afico obtenido en 3c, ¿para qu´e valores de p es la potencia del contraste mayor o igual que 0.8 (aproximadamente)? Para estos valores de p, ¿cu´al es una cota superior para la probabilidad de un error de Tipo II? (e) ¿Cu´ al ser´ıa una cota superior para la potencia cuando p ≥ 0.2? 4. Una posible manera de evaluar la eficiencia de un profesor consiste en examinar las puntuaciones obtenidas por sus alumnos en el examen final. El valor medio de estas notas es por supuesto relevante, pero tambi´en lo es la varianza: algunos profesores trabajan muy bien con los estudiantes m´ as brillantes, pero pueden obtener peores resultados con estudiantes menos brillantes o menos motivados. Para aplicar este procedimiento, el coordinador de la asignatura fija un examen est´andar para todos los grupos de la misma. Este experimento se ha llevado a cabo durante varios a˜ nos en una cierta asignatura, y la varianza observada ha estado t´ıpicamente pr´oxima a 300. Un nuevo 1
profesor imparte un grupo con treinta estudiantes, y en el examen final estos estudiantes han obtenido calificaciones con una cuasi varianza muestral de 480. Consideraremos las notas de estos estudiantes como una muestra aleatoria simple de una poblaci´on normal. (a) Para un nivel de significaci´ on del 5%, contraste la hip´otesis nula de que la varianza de la poblaci´ on de todas las calificaciones es 300, frente a una alternativa bilateral. (b) Bas´ andose en la respuesta a 4a, indique si un intervalo de confianza al 95% para la varianza de la poblaci´ on contendr´ıa el valor 300. (c) Calcule la potencia del contraste. (d) Dibuje la funci´ on de potencia para 4c en Excel. (e) A partir de la gr´ afica en 4d, ¿cu´al es la probabilidad de un error de Tipo II para σ 2 = 500 (aproximadamente)? 5. Indique cuales de las siguientes afirmaciones son verdaderas o falsas: (a) El nivel de significaci´ on de un test es la probabilidad de que la hip´otesis nula sea falsa. (b) Un error de Tipo I se produce cuando una hip´otesis nula verdadera es rechazada. (c) Una hip´ otesis nula se rechaza al nivel de 0.025, pero se acepta al nivel 0.01. Esto quiere decir que el p-valor del contraste est´ a entre 0.01 y 0.025. (d) La potencia de un contraste es la probabilidad de aceptar la hip´otesis nula cuando es verdadera. (e) Si se rechaza una hip´ otesis nula frente a su alternativa al nivel del 5%, con los mismos datos se deber´ıa rechazar tambi´en frente a esa alternativa al nivel del 1%. (f) Si se rechaza una hip´ otesis nula frente a su alternativa al nivel del 1%, con los mismos datos se deber´ıa rechazar tambi´en frente a esa alternativa al nivel del 5%. (g) El p-valor de un contraste es la probabilidad de que la hip´otesis nula sea verdadera. 6. Una compa˜ n´ıa de seguros paga a sus agentes mediante comisiones. Asegura que en su primer a˜ no los agentes obtendr´ an unas comisiones de 40000 euros en promedio, y que la desviaci´on t´ıpica de la poblaci´ on es menor o igual a 6000 euros. Para una muestra aleatoria simple de nueve agentes se han obtenido los valores siguientes, correspondientes a comisiones en su primer a˜ no, 9 X
xi = 333
y
9 X
(xi − x ¯)2 = 312,
i=1
i=1
donde xi est´ a medida en miles de euros y la distribuci´on de la poblaci´on se supone normal. (a) Contraste a un nivel del 5% la hip´otesis nula de que la media de la poblaci´on es al menos de 40000 euros (utilice el p-valor). (b) Contraste a un nivel del 10% la hip´otesis nula de que la desviaci´on t´ıpica de la poblaci´on es como m´ aximo de 6000 euros (utilice el p-valor). 7. Un fabricante asegura que un aerogenerador en una localizaci´on concreta puede generar en promedio al menos 800 kWh de energ´ıa por d´ıa. Se supone que la generaci´on de energ´ıa diaria del aerogenerador sigue una distribuci´ on normal con desviaci´on t´ıpica igual a 120 kWh. Se recogen datos de una muestra aleatoria de 100 d´ıas para contrastar esta afirmaci´on frente a la alternativa de que la media es inferior a 800 kW. Se acepta la afirmaci´on si la media muestral es 776 kWh o m´as, y se rechaza en otro caso. (a) ¿Cu´ al es la probabilidad α de un error de Tipo I aplicando la regla de decisi´on anterior si la media de la poblaci´ on es realmente igual a 800 kWh por d´ıa? (b) ¿Cu´ al es la probabilidad β de un error de Tipo II aplicando esta regla de decisi´on si la media de la poblaci´ on es realmente de 740 kWh por d´ıa? (c) Supongamos que se aplica la misma regla de decisi´on, pero a una muestra de 200 d´ıas en lugar de 100 d´ıas. i. ¿Ser´ıa el nuevo valor de α mayor, menor o igual que el obtenido en 7a? ii. ¿Ser´ıa el valor de β mayor, menor o igual que el obtenido en 7b? 2
Supongamos ahora que se trabaja con una muestra de 100 observaciones, pero la regla de decisi´ on se modifica para aceptar la afirmaci´ on siempre que la media de la muestra sea al menos igual a 765 kWh. (d) Para esta nueva regla de decisi´ on: i. ¿Ser´ıa el valor de α mayor, menor o igual que el obtenido en 7a? ii. ¿Ser´ıa el valor de β mayor, menor o igual que el obtenido en 7b? 8. Queremos contrastar la hip´ otesis nula de que una proporci´on en una poblaci´on es igual a 0.5 frente a una alternativa bilateral. Una complicaci´on en estos casos es que para un nivel de significaci´ on dado, cuanto mayor es el n´ umero de observaciones en la muestra, m´as probable es que se rechace la hip´ otesis nula. ¿Por qu´e es esto cierto, y en qu´e sentido puede plantear esta situaci´on un problema para un profesional que quiera aplicar t´ecnicas de contraste de hip´otesis en estos casos? 9. Consideremos la poblaci´ on de todos los residentes en Getafe. Estamos interesados en estudiar el gasto semanal de estos residentes en pan, cantidad que suponemos sigue una distribuci´on normal. Para una muestra aleatoria simple de diez residentes se obtuvieron los siguientes valores de gasto (en euros): 4.6 4.2 5.1 3.8 4.4 4.5 3.8 3.1 5.0 4.0 que podemos resumir en las cantidades siguientes: n X
xi = 42.5
y
i=1
n X
x2i = 183.91.
i=1
(a) Utilice un intervalo de confianza para contrastar la hip´otesis nula de que la varianza de la poblaci´ on σ 2 es igual a 2, frente a la alternativa bilateral, a un nivel de significaci´on del 5%. (b) Estudiamos ahora otro par´ ametro de la misma poblaci´on, la proporci´on de residentes en Getafe que gastan una cantidad igual o menor a 4 euros en pan a la semana, p. Deseamos llevar a cabo un contraste unilateral, H0 : p ≥ 0.75, a un nivel del 5%. Para ello, como necesitamos una muestra mayor, recogemos informaci´on de otras 25 personas, que combinada con los datos anteriores nos proporciona la muestra siguiente: 4.6 4.2 5.1 3.8 4.4 4.5 3.8 3.1 5.0 4.0 3.0 4.6 3.3 3.5 4.4 4.2 4.2 3.4 3.8 4.0 4.1 4.5 4.4 2.3 3.7 4.4 4.4 4.1 3.5 3.6 3.5 3.8 4.2 4.4 4.0 Estime la proporci´ on de residentes en Getafe que no gastan m´as de 4 euros en pan a la semana, y lleve a cabo el contraste indicado. 10. Los datos que se indican a continuaci´on representan los tiempos de desplazamiento al trabajo (en minutos) para una muestra aleatoria simple de 15 personas que trabajan en una planta industrial: 21.7
26.8
33.1
27.9
23.5
39.0
28.0
24.7
28.4
28.9
30.0
33.6
33.3
34.1
35.1
Suponemos que los tiempos de desplazamiento siguen una distribuci´on normal. Hemos llevado a cabo un contraste unilateral para una muestra en Excel a un nivel del 5%, con el objeto de contrastar si la media de la poblaci´ on supera los 28 minutos Describa formalmente el contraste a llevar a cabo. A partir de los resultados mostrados, ¿se rechazar´ıa la hip´ otesis nula? ¿Cu´ al ser´ıa su conclusi´on? (Nota: Excel no incluye una funci´on para llevar a cabo un contraste sobre una muestra, por lo que hemos realizado un contraste para dos muestras como muestras emparejadas, donde la primera muestra corresponde a los valores de los que disponemos, y la segunda muestra est´a formada por n repeticiones de µ0 ).
3
11. A continuaci´ on se muestra una salida de Excel, correspondiente a los datos del problema 9b. Interprete sus contenidos, e indique como explicar´ıa a un compa˜ nero suyo la manera de llevar a cabo el contraste del problema 9b en Excel. Sugerencia: emplee un contraste para muestras emparejadas.
12. Deseamos llevar a cabo el contraste de hip´otesis siguiente: H0 : µ = −10 vs. H1 : µ 6= −10. Se ha obtenido una muestra aleatoria simple con 700 observaciones, y un valor (estandarizado) para el
4
estad´ıstico del contraste igual a −1.96. El p-valor asociado a este contraste es: (a) 0.025
(b) 0.05
(c) 1.96
(d) Ninguno de los anteriores.
13. Se quiere verificar si un dado est´ a equilibrado. Para ello, se decide llevar a cabo el siguiente experimento: se tira el dado tres veces y se concluye que el dado est´a cargado si la suma de las tres tiradas es menor que 5. (a) Defina las hip´ otesis nula y alternativa para este contraste. (b) Defina la regi´ on cr´ıtica del contraste en funci´on de los resultados de las tres tiradas. (c) Determine el nivel de significaci´on del contraste. (d) De una expresi´ on para la potencia de este contraste en funci´on de las probabilidades de cada uno de los valores (pi , i = 1, . . . , 6, donde pi = P (X = i) con X = “el resultado de una tirada”). (e) Determine la probabilidad de un error de Tipo II si p1 = 1/2 y todas las dem´as probabilidades fueran iguales a 1/10. 14. Se ha observado que un cierto procedimiento de respuesta autom´atica desarrollado para actuar cuando se detectan problemas de calidad (emergencias) en una linea de producci´on da lugar a respuestas inadecuadas en ciertos casos. Se desea determinar si el procedimiento ha de ser modificado, ya que en general ha funcionado adecuadamente. Se ha seleccionado una medida de calidad para utilizar como referencia en esta decisi´on. Se supone que la medida sigue una distribuci´on normal con varianza igual a 1. Esta referencia se ha observado en n = 25 emergencias, obteniendo un valor promedio muestral de 15.4. Si el valor promedio para el proceso (en ausencia de emergencias) es 15, responda a las preguntas siguientes: (a) ¿Se dispone de evidencia suficiente para concluir que el procedimiento de respuesta aumenta el valor promedio de la medida de referencia, a un nivel α = 0.05? (b) La cuasi desviaci´ on t´ıpica muestral para las 25 observaciones fue 1.2. ¿Implica este valor que la varianza de la poblaci´ on ha aumentado con el procedimiento? Lleve a cabo este contraste para un nivel de confianza del 10%. (c) ¿Obtendr´ıa las mismas conclusiones si los contrastes anteriores fueran llevados a cabo a un nivel del 1%? 15. Dentro de una encuesta sobre la duraci´on del empleo en un cierto sector econ´omico, se ha recogido informaci´ on de una muestra de 86 empleados (una vez que abandonaron el sector). Estos datos nos y meses de duraci´on de los empleos. est´ an disponibles en el fichero “datos ej2.xlsx”, medidos en a˜ Utilice Excel para responder a las preguntas siguientes: (a) ¿Es razonable suponer que estos datos siguen una distribuci´on normal? ¿Por qu´e? (b) ¿Proporciona la informaci´ on en la muestra suficiente evidencia para aceptar la afirmaci´on (a un nivel del 5%) de que la media del tiempo que se permanece empleado en este sector es inferior a cinco a˜ nos y medio? 16. Para mejorar las habilidades de sus vendedores y las ventas de la empresa, una compa˜ n´ıa est´ a considerando la posibilidad de ofrecerles cursos de formaci´on en “T´ecnicas de Venta”. Como esta formaci´ on es cara, se ha seleccionado un grupo de nueve vendedores al azar para participar en una versi´ on de prueba del programa de formaci´on. Una vez completado el curso, y empleando las t´ecnicas aprendidas en el curso, los nueve empleados consiguieron una media de 115 unidades vendidas en un cierto periodo de tiempo. El objetivo de la empresa es que sus vendedores realicen unas ventas en promedio superiores a 100 unidades en ese periodo de tiempo. Suponemos que la variable de inter´es sigue una distribuci´ on normal con una desviaci´ on t´ıpica de 20 unidades. (a) A un nivel de significaci´ on del 5%, contraste la eficacia del curso definiendo la regi´on cr´ıtica del correspondiente contraste de hip´otesis. (b) Obtenga el p-valor del contraste y haga una recomendaci´on en relaci´on con la implantaci´ on del curso, en funci´ on del nivel de significaci´on deseado. 5
(c) Supongamos que µ = 120 tras el curso y el nivel de significaci´on es del 5%. Determine la probabilidad de un error de Tipo II para este contraste. (d) Supongamos que la empresa desease que la probabilidad de un error de Tipo II para este contraste fuese inferior al 1%, si µ = 120 y el nivel de significaci´on permanece en el 5%. Encuentre el menor valor de n para el que se cumpla esta condici´on.
6
View more...
Comments