Trabajo Final Control (1)

August 15, 2017 | Author: David Fernando Dongo Chira | Category: Sampling (Statistics), Type I And Type Ii Errors, Estimation Theory, Statistical Hypothesis Testing, Mean
Share Embed Donate


Short Description

control...

Description

1. En un estudio estadístico, ¿qué es una población y para qué se toma una muestra? La población de un estudio estadístico es el conjunto de elementos objeto de estudio. Cada elemento se denomina individuo. Cuando el número de individuos de la población es muy grande, tomamos una parte de ésta, denominada muestra. La muestra es un subconjunto de la población y tiene que ser representativa de la misma. 2. ¿Qué significa probar una hipótesis? Una prueba de hipótesis es una prueba estadística que se utiliza para determinar si existe suficiente evidencia en una muestra de datos para inferir que cierta condición es válida para toda la población. Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia". La hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero. 3. ¿Qué implica realizar una estimación puntual y en qué consiste la estimación por intervalo para la media? 

ESTIMACION PUNTUAL

Una estimación puntual del valor de un parámetro poblacional desconocido (como puede ser la media µ, o la desviación estándar σ), es un número que se utiliza para aproximar el verdadero valor de dicho parámetro poblacional. A fin de realizar tal estimación, tomaremos una muestra de la población y calcularemos el parámetro muestral asociado (x para la media, s para la desviación estándar, etc.). El valor de este parámetro muestral será la estimación puntual del parámetro poblacional. 

ESTIMACION POR INTERVALO PARA LA MEDIA

Dada una población X, que sigue una distribución cualquiera con media µ y desviación estándar σ.

Por tanto, ésta última fórmula nos da un intervalo de valores tal que la probabilidad de que la media de la población µ esté contenida en él es de 0,95. Este tipo de intervalos se llaman intervalos de confianza de un parámetro poblacional. El nivel de confianza (1 - α) del intervalo es la

probabilidad de que éste contenga al parámetro poblacional. En el ejemplo anterior, el nivel de confianza era del 95% (α = 0,05).

4. ¿Por qué no es suficiente la estimación puntual y por qué se tiene que recurrir a la estimación por intervalo? -

Porque la estimación puntual dirá poco sobre el parámetro cuando la varianza ente una estimación y la otra es muy grande.

-

Porque dicho intervalo de confianza indicara un rango donde puede estar el parámetro con cierto nivel de seguridad o confianza.

5. Explique el papel que desempeñan las distribuciones de probabilidad en la inferencia estadística. Una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de un experimento. Una distribución de probabilidad es similar a la distribución de frecuencias relativas. Sin embargo, en vez de describir el pasado, describe la probabilidad que un evento se realice en el futuro, constituye una herramienta fundamental para la prospectiva, puesto que se puede diseñar un escenario de acontecimientos futuros considerando las tendencias actuales de diversos fenómenos naturales. Las decisiones estadísticas basadas en la estadística inferencial son fundamentales en la investigación que son evaluadas en términos de distribución de probabilidades. 6. En el contexto de estimación por intervalo, señale en forma específica qué parámetro utiliza cada una de las siguientes distribuciones para realizar estimaciones: T de Student, normal y ji-cuadrada. T de Student = miu Chicuadrado = varianza (sigma al cuadrado) 7. Explique qué es un estadístico de prueba y señale su relación con los intervalos de aceptación y rechazo. Un estadístico de prueba es un número que tiene las dos propiedades siguientes:

a) Contienen la información muestral respecto al parámetro de interés. b) Bajo el supuesto de que la hipótesis nula es verdadera y sigue una distribución de probabilidad conocida La relación que existe es que hay que calcular el estadístico de prueba Z O para luego modificar si cae en la región de rechazo o aceptación.

8. ¿Qué son los errores tipo I y tipo II en las pruebas de hipótesis?  ERROR DE TIPO I Si rechaza la hipótesis nula cuando ésta es verdadera, usted comete un error de tipo I. La probabilidad de cometer un error de tipo I es α, que es el nivel de significancia que usted establece para su prueba de hipótesis. Un α de 0.05 indica que usted está dispuesto a aceptar una probabilidad de 5% de que está equivocado cuando rechaza la hipótesis nula. Para reducir este riesgo, debe utilizar un valor más bajo para α. Sin embargo, si utiliza un valor más bajo para alfa, significa que tendrá menos probabilidades de detectar una diferencia verdadera, si es que realmente existe. 

ERROR DE TIPO II

Cuando la hipótesis nula es falsa y usted no la rechaza, comete un error de tipo II. La probabilidad de cometer un error de tipo II es β, que depende de la potencia de la prueba. Puede reducir su riesgo de cometer un error de tipo II al asegurarse de que la prueba tenga suficiente potencia. Para ello, asegúrese de que el tamaño de la muestra sea lo suficientemente grande como para detectar una diferencia práctica cuando ésta realmente exista.

9. Señale y describa de manera breve los tres criterios equivalentes de rechazo de una hipótesis.

10. Mencione un ejemplo de datos o muestras pareadas. Las muestras pareadas se obtienen usualmente de distintas observaciones realizadas sobre los mismos individuos. Por ejemplo: Medir la glucosa en 10 personas en la mañana (MUESTRA A) Medir la glucosa de las mismas personas en la tarde (MUESTRA B) Ejercicios de estimación para la media y la desviación estándar 11. En la elaboración de envases de plástico es necesario garantizar que cierto tipo de botella en posición vertical tenga una resistencia mínima de 50 kg de fuerza. Para asegurar esto, en el pasado se realizaba una prueba del tipo pasa-no-pasa, donde se aplicaba la fuerza mínima y se veía si la botella resistía o no. En la actualidad se realiza una prueba exacta, en la que mediante un equipo se aplica fuerza a la botella hasta que ésta cede, y el equipo registra la resistencia que alcanzó la botella. a) ¿Qué ventajas y desventajas tiene cada método?

Prueba del tipo pasa-no-pasa

Prueba exacta

Ventajas - Mas rápido y sencillo. - Fácil de aplicar - Permite determinar con exactitud si la botella resiste los 50kg o no. - No permite conocer la cantidad máxima de fuerza que puede resistir.

Desventajas - Otorga datos exactos sobre la cantidad máxima de fuerza que puede resistir cada botella. - Tiene mayores costos - Necesita más tiempo y equipo más avanzado. - Es necesario deteriorar las botellas para conocer su resistencia máxima.

b) Para evaluar la resistencia media de los envases se toma una muestra aleatoria de n=20 piezas. De los resultados se obtiene que X=55.2 y S=3. Estime con una confianza de 95% ¿cuál es la resistencia promedio de los envases?

54,38937525 ≤ µ ≤ 56,01062475 Lo que significa que la resistencia promedio de los envases debe estar en este intervalo para garantizar la confianza de la muestra del estudio c) Antes del estudio se suponía que μ = 52. Dada la evidencia de los datos, ¿tal supuesto es correcto? El supuesto es incorrecto ya que, con la realización del estudio, se obtuvo el intervalo en donde se debe encontrar el valor de la media poblacional y µ=52 es menor que el límite inferior del intervalo lo que significa que no se incluye dentro de éste, por lo que la suposición previa al estudio no coincide con los resultados posteriores al estudio d) Con los datos anteriores, estime con una confianza de 95% ¿cuál es la desviación estándar poblacional (del proceso)? Se obtiene que el intervalo de confianza es: 1,317214554 ≤ σ ≤ 2,529715616 Esto significa que el valor de la desviación estándar poblacional se encuentra determinado por este intervalo.

12. Para evaluar el contenido de nicotina en cierto tipo de cigarros elaborados por un proceso se toma una muestra aleatoria de 40 cigarrillos y se obtiene que X = 18.1 mg y S = 1.7. a) Estime con una confianza de 95%, ¿cuál es la cantidad de nicotina promedio por cigarro? Al estimar la media poblacional del estudio, se obtuvo el siguiente intervalo de confianza: 17,68571 ≤ µ ≤ 18,51429 Esto significa que el valor de la cantidad promedio de cigarro se encuentra determinada por el intervalo mostrado anteriormente, delimitado por un límite inferior y uno superior. b) ¿Cuál es el error de estimación en el inciso anterior? El error de estimación es de 0.206155 c) Antes del estudio se suponía que μ = 17.5. Dada la evidencia de los datos, ¿se puede rechazar tal supuesto? Partiendo de los valores de los límites del intervalo encontrado después del estudio, se puede decir que el supuesto es incorrecto ya que éste es

menor que el límite inferior del intervalo y no se alcanza a encontrar dentro de este d) Si se quiere estimar la media con un error máximo de 0.4, ¿qué tamaño de muestra se requiere?

e) Con los datos anteriores, estime con una confianza de 95% ¿cuál es la desviación estándar poblacional (del proceso)? Realizando el procedimiento para estimar la desviación estándar poblacional, se obtiene el intervalo de confianza para esta: 0,98465182 ≤ σ ≤ 1,67417832 El valor de la desviación estándar poblacional se encuentra en el intervalo calculado anteriormente.

f) ¿Qué puede decir sobre la cantidad mínima y máxima de nicotina por cigarro? Es posible garantizar con suficiente confianza que los cigarros tienen menos de 20 mg de nicotina. Si se puede garantizar con suficiente confianza, pues al momento de hacer el análisis de una muestra representativa de cigarrillos, se encontraron valores máximos y mínimos de la media poblacional de la cantidad de cada uno de ellos. A partir de esto se obtiene un intervalo con un 95% de confianza en donde hay un límite inferior y superior con respecto a la media, que nos indica la tendencia de los valores que representan la cantidad de nicotina en cada uno. Con base en este intervalo, se puede garantizar esto, ya que ambos límites del intervalo son menores a 20 lo que significa que este valor no está incluido dentro del intervalo y que el valor máximo de nicotina presente en los cigarrillos es 18,51429, según la estimación. 13. En un problema similar al del ejercicio 11 es necesario garantizar que la resistencia mínima que tienen un envase de plástico en posición vertical sea de 20 kg. Para evaluar esto se obtuvieron los siguientes datos mediante pruebas destructivas:

a) Esta variable forzosamente tiene que evaluarse mediante muestreo y no a 100%, ¿por qué? Se debe realizar mediante muestreo ya que si se evalúa al 100% se tendría que realizar la prueba destructiva a cada uno de los envases de plástico que pertenezcan a la población, la cual es finita pero demasiado grande, entonces implicaría una mayor inversión de tiempo y dinero, lo que no es viable para ningún tipo de estudio o investigación. Por esta razón, se toma una muestra aleatoria representativa de la población y se realizan las pruebas a esta muestra obteniendo los estadísticos correspondientes a ella. Posteriormente, se pueden obtener los mismos estadísticos para la población a partir de los de la muestra a partir de la estimación con un nivel de confianza que garantiza la correspondencia de los valores entre la población y la muestra con un margen de error. Esto es posible hacerlo ya que se considera que las propiedades de la muestra son extrapolables a la población debido a que la muestra es representativa por lo que representa en cantidad y calidad a todos los elementos de la población. En pocas palabras, el muestreo se hace porque permite ahorrar recursos y a la vez obtener resultados parecidos a los que se alcanzarían si se realizara un estudio de toda la población. b) Realice un análisis exploratorio de estos datos (obtenga un histograma y vea el comportamiento de los datos obtenidos).

Clase 23,7 24,6571428 6 25,6142857 1 26,5714285 7 27,5285714 3 28,4857142 9 29,4428571 4

Frecuen cia 1 0 9 8 12 15 7

y mayor

4

El histograma anterior, basado en las pruebas realizadas sobre los envases, permite afirmar, que todos los envases plásticos de la muestra pasan la prueba, pues poseen una resistencia mayor a la que se requiere garantizar. La mayoría de los envases poseen una resistencia superior a 25.6, siendo 27.52 y 28.48 el intervalo de mayor frecuencia para la resistencia de los envases, obtenida mediante las pruebas. El valor máximo obtenido fue 30,4 y el valor mínimo fue 23,7 c) Estime con una confianza de 95%, ¿cuál es la resistencia promedio de los envases? Estimando el valor de la media poblacional, se obtiene que el intervalo de confianza para ésta es: 26,86336184 ≤ µ ≤ 27,6294953 Entonces, se puede decir que el valor de la resistencia promedio de los envases se encuentra dentro de este intervalo si se quiere garantizar una confianza del 95%. d) Antes del estudio se suponía que μ = 25. Dada la evidencia de los datos, ¿tal supuesto es correcto? Comparando la suposición realizada antes del estudio con el intervalo obtenido después del estudio, se puede notar que el valor supuesto de la media poblacional µ=25 es menor al límite inferior del intervalo de confianza de 95% obtenido en el estudio, lo que quiere decir que no se incluye dentro de este y la suposición es incorrecta. e) Con los datos anteriores, estime con una confianza de 95% ¿cuál es la desviación estándar poblacional (del proceso)? A partir de los datos y realizando el procedimiento para estimar la desviación estándar poblacional, se obtiene el intervalo de confianza: 1,205970243 ≤ σ ≤ 1,758379939 El valor de la desviación estándar poblacional se debe encontrar en el intervalo calculado anteriormente.

14. En la elaboración de una bebida se desea garantizar que el porcentaje de

CO2 (gas) por envase esté entre 2.5 y 3.0. Los siguientes datos fueron obtenidos del monitoreo del proceso

a) Realice un análisis exploratorio de estos datos (obtenga un histograma y vea el comportamiento de los datos obtenidos).

b) Estime con una confianza de 95%, ¿cuál es el CO2 promedio por envase? c) Se supone que μ debe ser igual a 2.75. Dada la evidencia, ¿es posible rechazar tal supuesto? d) Con los datos anteriores, estime con una confianza de 95% la desviación estándar del proceso. e) De los datos muestrales se observa que el mínimo es 2.48 y el máximo 2.73, ¿por qué el intervalo obtenido en el inciso b) tiene menor amplitud?

15. Una característica importante en la calidad de la leche de vaca es la concentración de grasa. En una industria en particular se fijó como estándar mínimo del producto que se recibe directamente de los establos lecheros sea de 3.0%. Por medio de 40 muestreos y evaluaciones en cierta época del año se obtuvo que X –= 3.2 y S = 0.3. a) Estime con una confianza de 90% el contenido promedio de grasa poblacional. b) ¿Cuál es el error máximo de estimación para la media? ¿Por qué? c) Si se quiere estimar la media con un error máximo de 0.05, ¿qué tamaño de muestra se requiere? d) Estime con una confianza de 95%, ¿cuál es la desviación estándar poblacional? e) ¿Qué puede decir acerca de la cantidad mínima y máxima de grasa en la leche? ¿Es posible garantizar con suficiente confianza que la leche tiene más de 3,0% de grasa? Sugerencia: aplique la regla empírica. De acuerdo a los resultados del primer inciso se plantea la garantía que contiene mas de 3.0% de grasa contenida en la leche. Los intervalos que nos muestra la campaña serán de 3.12 a 3.28 de acuerdo a los datos.

16. En la fabricación de discos compactos una variable de interés es la densidad mínima (grosor) de la capa de metal, la cual no debe ser menor de 1.5 micras. Por experiencia se sabe que la densidad mínima del metal casi

siempre ocurre en los radios 24 y 57, aunque en el método actual también se miden los radios 32, 40 y 48. Se realizan siete lecturas en cada radio, lo cual da un total de 35 lecturas, de las cuales sólo se usa la mínima. A continuación, se presenta una muestra histórica de 18 densidades mínimas:

a) Argumente en términos estadísticos si las densidades mínimas individuales cumplen con la especificación de 1.5 micras. Sugerencia: aplique la regla empírica. Si cumple con las especificaciones de 1.5 micras b) Encuentre un intervalo de confianza de 99% para la media de la densidad mínima. La media de la densidad mínima es de [1.836 y 2.044]. c) Proporcione un intervalo de confianza de 99% para la desviación estándar. Intervalo de confianza, para la desviación estándar es de [0.00225 y 0.00806] d) Dibuje el diagrama de cajas para los datos e interprete los resultados.

Ejercicios de estimación para una proporción 17. En una auditoría se seleccionan de manera aleatoria 200 facturas de las

compras realizadas durante el año, y se encuentra que 10 de ellas tienen algún tipo de anomalía. a) Estime con una confianza de 95% el porcentaje de facturas con anomalías en todas las compras del año. P = 10/200 = 0.05 b) ¿Cuál es el error de estimación? ¿Por qué? El error es de 0.05. Ya que es el error promedio o central dentro del intervalo

c) ¿Qué tamaño de muestra se tiene que usar si se quiere estimar el porcentaje de facturas con anomalías con un error máximo de 2%?

a) Estime con una confianza de 95% el porcentaje de facturas con anomalías en todas las compras del año. P=10200=0.05 P+Z α/2P(1-P)n 0.05+1.96

0.05(1-0.05)200=0,05+0.030 [0.2<=P<=0.8]

c) ¿Qué tamaño de muestra se tiene que usar si se quiere estimar tal porcentaje con un error máximo de 2%? N=1.962x0.05(1-0.05)0.022=456.19

18. En la producción de una planta se está evaluando un tratamiento para hacer que germine cierta semilla. De un total de 60 semillas se observó que 37 de ellas germinaron. a) Estime con una confianza de 90% la proporción de germinación que se logrará con tal tratamiento. [0.5835 < P < 0.6485] b) Con una confianza de 90%, ¿es posible garantizar que la mayoría (más de la mitad) de las semillas germinarán? No se garantiza que las semillas germinen c) Conteste los dos incisos anteriores, pero ahora con 95% de confianza. [0.5662 < P < 0.6485] 19. Para evaluar la efectividad de un fármaco contra cierta enfermedad se integra en forma aleatoria un grupo de 100 personas. Se suministra el

fármaco y transcurrido el tiempo de prueba se observa x = 65 personas con un efecto favorable. a) Estime con una confianza de 90% la proporción de efectividad que se logrará con tal fármaco. Realice una interpretación de los resultados. Proporción muestral = 0.65 Proporción de efectividad = intervalo (0.4811; 0.8189) b) ¿Con base en lo anterior se puede decir que a la mayoría de las personas (más de la mitad) les hizo buen efecto el fármaco? c)

¿Qué tamaño de muestra debe usarse si se quiere tener un error de estimación máximo de 4% (0.04)?

20. Con respecto al problema del ejercicio 11, los datos anteriores al diseño de la prueba continua muestran lo siguiente: de n = 120 envases de plástico probados para ver si tenían la resistencia mínima de 50 kg de fuerza, x = 10 envases no pasaron la prueba. a) Estime con una confianza de 95% la proporción de envases que no tienen la resistencia mínima especificada. Haga una interpretación de los resultados. b) ¿Cuál es el error de estimación? c) Calcule el tamaño de muestra que se necesita para que el error de estimación máximo sea de 0.03.

Prueba de hipótesis para un parámetro

21. Un inspector de la Procuraduría Federal del Consumidor acude a una planta

que elabora alimentos para verificar el cumplimiento de lo estipulado en los envases de los productos en cuanto a peso y volumen. Uno de los productos que decide analizar es el peso de las cajas de cereal, en las cuales para una de sus presentaciones se establece que el contenido neto es de 300 gramos. El inspector toma una muestra de 25 cajas y pesa su contenido. La media y desviación estándar de la muestra son x – = 298.3 y S = 4.5. a) Suponiendo una distribución normal, pruebe la hipótesis de que μ = 300 contra la alternativa de que es diferente, con un nivel de significancia de 5%. Formular claramente las hipótesis, cálculos y conclusión.

H0: = 300 H1: ≠ 300 α = 0.05 grados de libertad = 15 -1 = 14

Criterio de rechazo: se rechaza la hipotesis nula.

, por lo tanto no se rechaza

b) Repita el inciso anterior pero ahora con un nivel de significancia de 10%.

c) ¿Desde la perspectiva del consumidor del producto cuál debe ser la hipótesis alternativa que debe plantear el inspector en este problema? Argumente. Se debe plantear que H1: < 300 puesto que eso muestran los datos del problema. d) Haga el inciso a) pero ahora planteando como hipótesis alternativa μ < 300.

22. En el problema anterior respecto a la desviación estándar:

a) Pruebe la hipótesis de que σ = 3.0 contra la alternativa que es diferente. b) ¿Si lo que se quiere es proteger al consumidor del exceso de variabilidad, la conclusión del inciso anterior le es favorable? Argumente.

23. Las especificaciones técnicas de un comprensor establecen que el aumento promedio de temperatura en el agua usada como enfriador en la cámara del compresor es menor a 5 °C. Para verificar esto se mide el aumento de temperatura en el agua en 10 periodos de funcionamiento del compresor, y se obtiene que son x = 6.6 y S = 2.0. a) Plantear las hipótesis para la media que son adecuadas al problema. Argumente. b) Pruebe las hipótesis planteadas con un nivel de significancia de 5%. c) Si en lugar de trabajar con una significancia de 5%, lo hace con una de 1%, ¿se mantiene la conclusión del inciso anterior? Explique.

24. En relación con el problema anterior, pruebe la hipótesis para la desviación estándar de σ = 1.5 contra la alternativa de que es mayor. 25. En relación con el ejercicio 16 de este capítulo, con una significancia α = 0.05 pruebe la hipótesis de que la media de la densidad mínima de la capa de metal de los discos es igual a 2.0 micras, contra la alternativa de que es menor.

26. En una planta embotelladora de bebidas gaseosas se desea estar seguro de que las botellas que usan tienen en promedio un valor que supera el mínimo de presión de estallamiento de 200 psi. a) Formule la hipótesis para la media pertinente al problema. H0: = 200 H1: > 200 b) Si en una evaluación de la presión de estallamiento de 15 botellas seleccionadas al azar se obtiene que x – = 202.5 y S = 7.0; pruebe la hipótesis formulada antes.

c) Si procedió de manera correcta no se rechaza la hipótesis nula, y por lo tanto no se puede concluir lo que desea el embotellador, es decir que μ > 200. Explique por qué no se puede concluir esto a pesar de que la media muestral sí es mayor que 200. Porque el valor de la desviación estándar es muy grande.

27. En el problema anterior, pruebe la hipótesis para la desviación estándar de σ

= 5.0 contra la alternativa de que es mayor

28. Para validar la afirmación de un fabricante que señala que la proporción de

artículos defectuosos de sus lotes de producción no supera 5%; se toma una muestra aleatoria de 100 artículos de los últimos lotes y se obtiene que 8 son defectuosos. a) Formular la hipótesis adecuada al problema, si lo que se quiere es concluir que la afirmación del fabricante es falsa, porque en realidad su calidad es peor. b) Probar la hipótesis formulada con una significancia de 5%.

c) Si procedió de manera correcta no se pudo concluir que p > 5%. Explique por qué no se puede concluir esto a pesar de que la proporción muestral es mayor a 5%. d) ¿En este problema cuál sería el tamaño de muestra a usar si se quiere tener un error máximo de estimación de 3%?

29. ¿En el ejercicio 17 de este capítulo es correcto afirmar que más de 8% de las

facturas tienen alguna anomalía? Para responder, formule y pruebe la hipótesis pertinente con una significancia de 5%.

30. En un centro escolar se ha venido aplicando una campaña contra el uso del tabaco por parte de los estudiantes. Antes de la campaña, 30% de los alumnos eran fumadores activos, para investigar si disminuyó esta proporción se toma una muestra aleatoria de 150 estudiantes y se detecta que 35 de ellos son fumadores. Datos: n = 150 p = 0.30 y = 35

p=

35 =0.23 150

a) Formule la hipótesis pertinente al problema. Justifique. H0: p=0.30 H1: p
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF