PruebaHipótesis-Parte_I
Short Description
Descripción: PDF resumen...
Description
PRUEBAS DE HIPÓTESIS
Inferencia Estadística - Sección “C” UFM Claudia Contreras
PRUEBAS DE HIPÓTESIS En muchas situaciones se realizan proposiciones o afirmaciones respecto al valor de un parámetro poblacional (en la exigencia de cumplimiento de una norma, índices de procesos). Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos), para tomar una decisión entre aceptar y rechazar la afirmación. La prueba de hipótesis es una herramienta mediante la cual se busca comprobar alguna proposición o afirmación sobre la población, a partir de los datos de la muestra. La verdad o falsedad de una hipótesis no puede conocerse con total seguridad a menos que pueda examinarse toda la población. Claudia Contreras - Inferencia Estadística
PRUEBAS DE HIPÓTESIS – Procedimiento General 1. Definir Hipótesis
Establecer la Hipótesis Nula (H0) y la Hipótesis Alternativa (Ha)
2. Especificar Nivel de Significancia
Definir el nivel de significancia para controlar el error Tipo I. Identificar tipo de prueba.
3. Calcular Estadístico de Prueba
Identificar la distribución muestral asociada (“Z” o “t” de Student ) y calcular el estadístico de prueba.
4. Establecer reglas de decisión
Establecer la regla de decisión bajo la cual se rechaza H0, a través del valor crítico o valor-p.
5. Rechazar o no
Formular conclusiones.
Claudia Contreras - Inferencia Estadística
HIPÓTESIS ESTADÍSTICA Se puede definir como un supuesto tentativo acerca de un parámetro poblacional (media, varianza, proporción, etc). HIPÓTESIS NULA ( H0) Es la hipótesis que será sometida a prueba, se supone tentativamente verdadera, también se denomina Hipótesis de no diferencia porque parte del supuesto que no hay diferencia entre el valor verdadero del parámetro y su valor hipotético. HIPÓTESIS ALTERNATIVA (Ha) Es una hipótesis que contradice lo que establece la hipótesis nula. También se le conoce como hipótesis del investigador o de la investigación. Describe lo que ha de considerarse si la hipótesis nula es rechazada. Claudia Contreras - Inferencia Estadística
FORMULACIÓN DE HIPÓTESIS ¿Cómo decidir o establecer qué proposición se establece como hipótesis nula y cuál como alternativa? Cuando se realiza una investigación en el desarrollo de un nuevo método, sistema, producto se empieza por definir la hipótesis alternativa como la conclusión que el investigador desea sustentar. La hipótesis nula expresa la creencia o supuesto acerca del valor del parámetro poblacional que debe ser comprobado. La hipótesis nula debe contener una proposición de igualdad (≤, ≥, =). Ambas hipótesis son complementarias. Es decir, las dos deben contener de manera exhaustiva todos los valores posibles de que los parámetros pueden asumir. Claudia Contreras - Inferencia Estadística
FORMULACIÓN DE HIPÓTESIS Ejemplo 1. Todos los cigarros que se encuentran en el mercado tienen un contenido promedio de nicotina de por lo menos 1.6mg por cigarro. Una empresa tabacalera afirma haber encontrado un método para curar las hojas de cigarro que da como resultado un contenido promedio de nicotina menor a 1.6mg Para demostrarlo analizará una muestra de cigarros producidos utilizando el nuevo método. Ejemplo 2. El productor de una llanta de fibra de vidrio, manifiesta que la vida promedio de estas llantas es de por lo menos 40000 millas. Para verificarlo se realizará una prueba en una muestra de llantas.
Claudia Contreras - Inferencia Estadística
FORMULACIÓN DE HIPÓTESIS Ejemplo 1. Todos los cigarros que se encuentran en el mercado tienen un contenido promedio de nicotina de por lo menos 1.6mg por cigarro. Una empresa tabacalera afirma haber encontrado un método para curar las hojas de cigarro que da como resultado un contenido promedio de nicotina menor a 1.6mg Para demostrarlo analizará una muestra de cigarros producidos utilizando el nuevo método. H0: ≥ . Ha: < . Ejemplo 2. El productor de una llanta de fibra de vidrio, manifiesta que la vida promedio de estas llantas es de por lo menos 40000 millas. Para verificarlo se realizará una prueba en una muestra de llantas. H0: ≥ Ha: < Claudia Contreras - Inferencia Estadística
FORMULACIÓN DE HIPÓTESIS Ejemplo 3. Una operación de la línea de producción está diseñada para llenar cajas con un peso medio de 32 onzas de detergente. Con periodicidad se selecciona una muestra para determinar si se está llenando de manera insuficiente o en demasía. Si se determina que hay llenado insuficiente o en demasía la producción se suspende y se ajusta el llenado. Formule la hipótesis nula y alternativa que ayudarán a determinar si se debe ajustar el peso. H0: = Ha: ≠
Claudia Contreras - Inferencia Estadística
FORMULACIÓN DE HIPÓTESIS Aquí se muestran las tres formas que pueden asumir H0 y Ha, refiriéndonos a las pruebas de hipótesis para la media poblacional. Observe que en la hipótesis nula siempre aparece la igualdad. H0: ≥
H0: ≤
H0: =
Ha: <
Ha: >
Ha: ≠
Pruebas de una cola (unilateral)
Claudia Contreras - Inferencia Estadística
Pruebas de dos colas (bilateral)
ERRORES TIPO I Y TIPO II Dado que la prueba de hipótesis se basa en información muestral, debe considerarse que existe posibilidad de error. Condición real de la Población D E C I S I Ó N
H0 es verdadera
Ha es verdadera
H0 es aceptada
Decisión Correcta
Error Tipo II
H0 es rechazada
Error Tipo I
Decisión Correcta
Error Tipo I : Se rechaza H0, cuando ésta es verdadera. Error Tipo II: Se acepta H0, cuando ésta es falsa. Claudia Contreras - Inferencia Estadística
NIVEL DE SIGNFICANCIA A la probabilidad de cometer un error de Tipo I se denota por y se le llama el nivel o tamaño de la significancia de la prueba, es decir: = = ( ⋮ ! "##) Aunque no existe una regla general para seleccionar el valor de suelen utilizarse 0.05 (5%) y 0.01 (1%). El valor de se selecciona a priori por el investigador de acuerdo con su experiencia y objetivos.
Claudia Contreras - Inferencia Estadística
NIVEL DE SIGNFICANCIA (Cont.) Si por ejemplo se elige un = %% , al diseñar una prueba entonces podemos esperar que en 5 ocasiones de cada 100 se rechazará la H0 cuando debería ser aceptada (porque por azar la muestra cae en la región de rechazo); o sea que tenemos una probabilidad de 95% que no rechazaremos H0 cuando sea cierta. Ejemplo 4. Se desarrolla un nuevo sistema de inyección de combustible que tiene proyectado mejorar el rendimiento en millas por galón de combustible. El sistema actual para un modelo determinado alcanza 24 millas por galón en manejo urbano. Antes de implementar el nuevo sistema se busca un respaldo estadístico que sustente que este sistema es mejor que el actual. Las hipótesis serían
H0: ≤ Ha: >
Entonces se cometería un Error Tipo I, cuando rechazaramos H0 es decir estableceríamos que el nuevo sistema de inyección es mejor que el actual cuando en realidad no es así. Claudia Contreras - Inferencia Estadística
ERROR TIPO II Para evaluar un experimento de prueba de hipótesis también se requiere calcular la probabilidad del error de Tipo II, denotada por ', es decir: ' = ( )**+* ,-.+ // = ((01).20* 3 ⋮ 3 )4 50640) Para el ejemplo 4. Se desarrolla un nuevo sistema de inyección de combustible que tiene proyectado mejorar el rendimiento en millas por galón de combustible. El sistema actual para un modelo determinado alcanza 24 millas por galón en manejo urbano. Antes de implementar el nuevo sistema se busca un respaldo estadístico que sustente que este sistema es mejor que el actual. Las hipótesis serían
H0: ≤ Ha: >
Entonces se cometería un Error Tipo II, cuando aceptamos H0 es decir estableceríamos que el nuevo sistema de inyección no es mejor que el actual cuando en realidad si mejora el rendimiento. Claudia Contreras - Inferencia Estadística
CONCLUSIONES FUERTE Y DÉBIL Dado que el investigador escoge el valor de , entonces se puede controlar la probabilidad de rechazar de manera errónea 3 , es decir se controla la probabilidad de cometer error Tipo I. Por lo que el rechazo de 3 siempres se considera una conclusión fuerte. (los datos muestrales aportan evidencia fuerte que 3 es falsa. Por otro lado la decisión de aceptar 3 se considera una conclusión débil, a menos que se conozca que ' es considerablemente pequeño. Por lo que en lugar de decir “se acepta 3 ” se prefiere decir “incapaz de rechazar 3 ” (porque no existe gran evidencia que 3 sea cierta sino que hay gran evidencia de que sea falsa). Claudia Contreras - Inferencia Estadística
TIPOS DE PRUEBA: PRUEBA DE DOS COLAS La hipótesis planteada de H0 se formula con la igualdad.
H0: =
Ha: ≠
Región de Rechazo
Región de NO Rechazo de H0
Valor Crítico
3
Región de Rechazo
Valor Crítico
La distribución de muestreo del estadístico de prueba se divide en dos regiones, una región de rechazo (región crítica) y una región de no rechazo (aceptación).
Si el estadístico de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula. El valor crítico separa la región de no rechazo de la de rechazo.
Se rechaza H0 si la media muestral cae en cualquiera de las dos regiones de rechazo. Claudia Contreras - Inferencia Estadística
TIPOS DE PRUEBA: PRUEBA DE DOS COLAS Ejemplo 5. Se tiene interés en la rapidez de combustión de un agente propulsor para los sistemas de salida de emergencia en aeronaves. Especialmente interesa la rapidez de combustión promedio, de manera específica interesa decidir si esta rapidez promedio es o no 50cm/seg. H0: = % Ha: ≠ %
Región de Rechazo
Región de NO Rechazo de H0
Valor Crítico
Claudia Contreras - Inferencia Estadística
3
Región de Rechazo
Valor Crítico
TIPOS DE PRUEBA: PRUEBA DE UNA COLA La hipótesis planteada de H0 se formula con ≤ , ≥.
Región de rechazo
Región de aceptación
Claudia Contreras - Inferencia Estadística
Región de aceptación
Región de rechazo
TIPOS DE PRUEBA: PRUEBA DE UNA COLA Ejemplo 6. El departamento de admisión de una universidad ha considerado que completará el 100% de sus matrículas disponibles solo con bachilleres de los colegios cuyos promedios sean al menos de 14 puntos. Para ello se toma una muestra de 30 bachilleres de cada colegio, y si se supera este parámetro, los bachilleres son convocados a presentar prueba de admisión. H0: ≥ Ha: <
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA ESTADÍSTICO DE PRUEBA Es un número obtenido a través de los valores de la muestra. Este número al compararse con el valor crítico, es utilizado para tomar la decisión entre rechazar o no la Hipótesis nula. En las pruebas de hipótesis para la media población (), cuando se conoce la desviación estándar (8) poblacional, o cuando el valor de la muestra es grande (30 ó más) se utiliza la distribución normal estándar, el valor del estadístico de prueba se determina:
; − + : 9= 8:; Si la población tiene distribución normal, el procedimiento de prueba de hipótesis será exacto y puede utilizarse con cualquier tamaño de muestra. Si no es normal pero aproximadamente simétrico con muestras de hasta 15 pueden esperarse resultados aceptables. Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA REGLA DE DECISIÓN Y CONCLUSIÓN Si el valor calculado del estadístico de prueba queda localizado dentro de la región crítica se rechaza H0, de lo contrario no se podrá rechazar H0. Si se rechaza H0 se concluye: “Existe suficiente evidencia para indicar que .. (el enunciado de Ha) a un nivel de % de significancia”
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA VALOR -p Es una probabilidad que aporta una medida de evidencia suministrada por la muestra contra la hipótesis nula. En otras palabras el valor-p es la probabilidad que la hipótesis nula sea cierta. Valores-p pequeños indican una evidencia mayor contra la hipótesis nula. Este valor –p solo depende de la muestra tomada, es decir para una muestra y un estadístico calculado se puede obtener su valor –p y compararlo con un especificado.
Entonces si el valor-p < , H0 se rechaza.
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA Un fabricante provee una fibra sintética que se considera tiene una resistencia de ruptura de 8Kg, con una desviación típica poblacional de 0.5 Kg. Queremos probar, a nivel = 0.01 la hipótesis que = =>? frente a la alternativa que ≠ =>?. Se tiene que una muestra simple de 50 trozos de fibra sintética la resistencia de ruptura media es 7.8 Kg.
Ejemplo- Caso 1
Solución Paso 1 : Planteamiento de hipótesis 3 : = = 30 : ≠ = Paso 2: Se ha definido un nivel de significancia = . (1%), se trata de una prueba de hipótesis de dos colas o bilateral.
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA Ejemplo- Caso 1 (Cont.) Solución Paso 3 : Debido al tamaño de la muestra y a que se conoce el valor de 8 se puede utilizar la distribución Z.
Para un valor de = . , se tiene un = . %. De la tabla de la distribución normal estándar los valores críticos (−9 , +9 ) son: -2.58 y +2.58
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA Ejemplo- Caso 1 (Cont.) Solución Paso 3 (Cont.) : Ahora calculemos el valor del estadístico de prueba para determinar si cae en la región de rechazo o en la de aceptación. ;− : D. = − = 9= 8 = = − . = . % C B C % Paso 4. Observe que el estadístico de prueba cae en la región de Rechazo por lo que 3 debe ser rechazada. La Regla de Rechazo se establecería: Rechazar 3 si 9 ≤ −9 ó 4- 9 ≥ 9
9 ≤ − . %= ó 4- 9 ≥ . %=
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA Ejemplo- Caso 1 (Cont.) Solución Paso 5: Del análisis de los pasos previos 3 debe ser rechazada, ya que Z= -2.83. Concluimos que: “Existe suficiente evidencia para indicar que la resistencia de ruptura media no es igual a 8Kg a un nivel de % de significancia”
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA Ejemplo- Caso 1 (Cont.) Solución (Utilizando Valor-p) Paso 4: Del estadístico de prueba calculamos el área total de la región de rechazo. De la tabla normal estándar para Z=-2.83, el área es 0.0023. Este valor corresponde al área de la región de rechazo a la izquierda. Por simetría, el área de la región de rechazo de la derecha es la misma. Por lo tanto, el área total que corresponde al valor-p es: F06+* − . = . = . La regla de rechazo utilizando el valor- estipula: Rechazar 3 si valor-p ≤ Paso 5: A partir del valor-p se establece que 3 debe ser rechazada, valorp ≤ . . Concluimos que: “Existe suficiente evidencia para indicar que .la resistencia de ruptura media no es igual a 8Kg a un nivel de % de significancia” Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA Playbill es una revista que se distribuye entre personas que asisten a obras musicales. El ingreso medio anual por familia de la población de lectores de Playbill es de US$119155. Suponga que la desviación estándar poblacional es US$20700. Un grupo de San Francisco asegura que las personas de la zona de la Bahía el ingreso medio es más alto. En una muestra de 60 personas de la Bahía que suelen acudir al teatro se encontró que el ingreso medio es US$126,100.
Ejemplo- Caso 2
Establezca una conclusión con respecto a sí las personas de la zona de la Bahía tienen un ingreso medio por familia más alto que los demás lectores de Playbill. Use = . Solución Paso 1 : Planteamiento de hipótesis 3 : ≤ G%% 30 : > G%% Paso 2: Se ha definido un nivel de significancia = . (1%), se trata de una prueba de hipótesis de una cola o unilateral. Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA Ejemplo- Caso 2 (Cont.) Solución Paso 3 : Debido al tamaño de la muestra y a que se conoce el valor de 8 se puede utilizar la distribución Z. Para un valor de = . . De la tabla de la distribución normal estándar el valor crítico es (+9(H )) : +2.33
= .
2.33
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA Ejemplo- Caso 2 (Cont.) Solución Paso 3 (Cont.) : Ahora calculemos el valor del estadístico de prueba para determinar si cae en la región de rechazo o en la de aceptación. ; − − G%% : 9= 8 = = . D C B C Paso 4. Observe que el estadístico de prueba cae en la región de Rechazo por lo que 3 debe ser rechazada. La Regla de Rechazo se establecería: Rechazar 3 si 9 ≥ 9(H) 9 ≥ .
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA Ejemplo- Caso 2 (Cont.) Solución Paso 5: Del análisis de los pasos previos 3 debe ser rechazada, ya que Z= 2.60. Concluimos que: “Existe suficiente evidencia para indicar que el ingreso medio de las personas de la Zona de la Bahía es mayor a US$119155 a un nivel de % de significancia”
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA Ejemplo- Caso 2 (Cont.) Solución (Utilizando Valor-p) Paso 4: Del estadístico de prueba calculamos el área total de la región de rechazo. De la tabla normal estándar para Z=2.60, el área de la cola superior es (10.9953) es 0.0047. Por lo tanto, el área que corresponde al valor-p es: F06+* − . = . D La regla de rechazo utilizando el valor- estipula: Rechazar 3 si valor-p ≤ Paso 5: A partir del valor-p se establece que 3 debe ser rechazada, valorp ≤ . . Concluimos que: “Existe suficiente evidencia para indicar que el ingreso medio de las personas de la Zona de la Bahía es mayor a US$119155 a un nivel de % de significancia” Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA RELACIÓN ENTRE ESTIMACIÓN POR INTERVALO Y PRUEBA DE HIPÓTESIS
Se puede utilizar el método del intervalo de confianza para probar una hipótesis de la forma: H0: = Ha: ≠ 1. Se selecciona una muestra aleatoria simple y se establece un intervalo de confianza de la forma: 8 ; ± 9 : B 2. Si el intervalo de confianza contiene el valor + , 3 no es rechazada, en caso contrario es rechazada.
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA RELACIÓN ENTRE ESTIMACIÓN POR INTERVALO Y PRUEBA DE HIPÓTESIS
Ejemplo- Solución Caso 1 (Utilizando estimación por intervalo) Un fabricante provee una fibra sintética que se considera tiene una resistencia de ruptura de 8Kg, con una desviación típica poblacional de 0.5 Kg. Queremos probar, a nivel = 0.01 la hipótesis que = =>? frente a la alternativa que ≠ =>?. Se tiene que una muestra simple de 50 trozos de fibra sintética la resistencia de ruptura media es 7.8 Kg. Solución Se tienen las hipótesis: 3 : = = 30 : ≠ = 8 B
; ± 9 El intervalo de confianza, con base a la información del caso: : D. = ± . %D%
. % %
(7.618, 7.982) Se debe rechazar 3 ya que no se encuentra en el intervalo de confianza. Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA RESUMEN Prueba de cola inferior
Prueba de cola superior
Prueba de dos colas
JK : L ≥ LM JN: L < LM ;− : 9= 8 C B
JK : L ≤ LM JN: L > LM ;− : 9= 8 C B
JK : L = LM JN: L ≠ LM ;− : 9= 8 C B
Hipótesis Estadístico de Prueba Regla de rechazo: Método de valor-p Regla de rechazo: Método del valor crítico
Rechazar JK si: valor-p≤ O
Rechazar JK si: valor-p≤ O
Rechazar JK si: valor-p≤ O
Rechazar JK si: P ≤ −PQ
Rechazar JK si: P ≥ PQ
Rechazar JK si: P ≤ −PQ
Claudia Contreras - Inferencia Estadística
P≥
R PQ R
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 CONOCIDA CNN y ActMedia presentaron un canal de televisión dirigido a las personas que esperan en las colas de supermercados. En este canal se transmitían noticias, reportajes cortos y publicidad. La duración de la programación se basa en el supuesto que la media poblacional del tiempo de los clientes que esperan en fila en una caja es 8 minutos. Se utilizará una muestra de tiempos de espera reales para probar este supuesto y determinar si el tiempo medio de espera difiere de ese estándar.
Ejercicio de práctica
a) Formule las hipótesis para esta aplicación b) En una muestra de 120 clientes, la media muestral del tiempo de espera fue de 8.5 minutos. Suponga que la desviación estándar poblacional es 8 = . minutos. ¿Cuál es el valor-p? c) Con = . %, ¿Cuál es su conclusión? d) Calcule un intervalo de confianza de 95% para la media poblacional. ¿Esto sustenta su conclusión?
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA ESTADÍSTICO DE PRUEBA En las pruebas de hipótesis para la media población (), cuando se desconoce la desviación estándar ( 8 ) poblacional, se utiliza la distribución t- de Student con B − grados de libertad, el valor del estadístico de prueba se determina:
; − + : 2= 4 C B Si la población tiene distribución normal, el procedimiento de prueba de hipótesis será exacto para cualquier tamaño de muestra. Si no es normal, dará un resultado aproximado y presentará buenas aproximaciones para n ≥ 30. Si la población es muy sesgada se recomiendan tamaños de muestra de alrededor de 50. Los pasos a seguir para la prueba de hipótesis son los mismos que cuando σ se conoce, la diferencia se encuentra en el cálculo del estadístico de prueba y del valor-p. Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA Ejemplo- Caso 3 La tasa actual para producir fusibles de 5 amperios es de 250 por hora. Se compró una máquina nueva que, según el proveedor aumentará la tasa de producción. Una muestra de 10 horas seleccionadas al azar el mes pasado indica que la producción media por hora de la nueva máquina es de 256, con desviación estándar muestral de 6 por hora. Con 0.05 de nivel de significancia ¿puede concluir que la nueva máquina es más rápida?. Solución Paso 1 : Planteamiento de hipótesis 3 : ≤ % 30 : > % Paso 2: Se ha definido un nivel de significancia = . % (5%), se trata de una prueba de hipótesis de una cola o unilateral (cola superior).
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA Ejemplo- Caso 3 (Cont.) Solución Paso 3 : Debido a que se desconoce el valor de 8 se utilizará la distribución t. Se asumirá que la distribución de la población es simétrica. ; = %, B = , 4 = , Calculando el estadístico de prueba, se tiene : = % ; − + % − % : 2= 4 = = . C B C Para un valor de = . %, con 9 grados de libertad, el valor crítico (de la Tabla de la Distribución-t) Valor crítico 1.833
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA Ejemplo- Caso 3 (Cont.) Solución Paso 4. Observe que el estadístico de prueba cae en la región de Rechazo por lo que 3 debe ser rechazada. La Regla de Rechazo se establecería: Rechazar 3 si : S ≥ . =. Como t = 3.16 cae en la región de rechazo entonces 3 debe ser rechazada. Paso 5: Concluimos que: “Existe suficiente evidencia para indicar que la nueva máquina es más rápida a un nivel de %% de significancia”
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA Ejemplo- Caso 3 (Cont.) Solución (Utilizando Valor-p) Paso 4: Del estadístico de prueba calculamos el área total de la región de rechazo, para t =3.16. Utilizando Excel: =DISTR.T.CD(3.1622,9) F06+* − . = . %D5 La regla de rechazo utilizando el valor- estipula: Rechazar 3 si valor-p ≤ Paso 5: A partir del valor-p se establece que 3 debe ser rechazada, valor-p ≤ . %. Concluimos que: “Existe suficiente evidencia para indicar que la nueva máquina es más rápida a un nivel de %% de significancia”
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA Ejemplo- Caso 4 Joan´s Nursery se especializa en jardines de zonas residenciales diseñados según el gusto del cliente. La estimación del precio se basa en el número de arbustos, árboles, etc. Los gerentes consideran que se requieren dos horas de trabajo para plantar un árbol mediano. A continuación se presentan los tiempos en horas, realmente requeridos en una muestra de 10 árboles plantados el mes pasado. 1.7
1.5
2.6
2.2
2.4
2.3
2.6
3
1.4
2.3
Con un nivel de significancia de = . %, realice una prueba para ver si el tiempo necesario para plantar los árboles difieren de 2 horas. ¿Cuál es su conclusión? Solución Paso 1 : Planteamiento de hipótesis 3 : = 30 : ≠ Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA Ejemplo- Caso 4 (Cont.) Solución Paso 2: Se ha definido un nivel de significancia = . % (5%), se trata de una prueba de hipótesis de dos colas o bilateral. Debido a que se desconoce el valor de 8 se utilizará la distribución t. Se asumirá que la distribución de la población es simétrica. Utilizando la muestra calcularemos la desviación estándar muestral y la media muestral. ;) (U- − : 1.7 1.5 2.6 2.2 2.4 2.3 2.6 3 1.4 2.3 22 Claudia Contreras - Inferencia Estadística
0.25 0.49 0.16 0 0.04 0.01 0.16 0.64 0.64 0.01 2.4
;= :
4=
∑ U- = = . B
; ) (U- H: (BH)
= 0.52
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA Ejemplo- Caso 4 (Cont.) Solución Paso 3 : Debido a que se desconoce el valor de 8 se utilizará la distribución t. Se asumirá que la distribución de la población es simétrica. ; = . , B = , 4 = . % , Calculando el estadístico de prueba, se tiene : = ; − + : . − 2= 4 = = . . % C B C Para un valor de = . %, con 9 grados de libertad, los valores críticos (de la Tabla de la Distribución-t) Valor crítico 2/ = . Valor crítico 2/ = − .
Claudia Contreras - Inferencia Estadística
Valor crítico: t = -2.262
Valor crítico: t = 2.262 Área de No rechazo
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA Ejemplo- Caso 4 (Cont.) Solución Paso 4. Observe que el estadístico de prueba cae en la región de No Rechazo por lo que no puede rechazarse 3 . La Regla de Rechazo se establecería: Rechazar 3 si : S ≥ . ó 2 ≤ − . Como t = 1.216 no cae en la región de rechazo, entonces 3 no puede ser rechazada. Paso 5: Concluimos que: “3 no puede ser rechazada”, no existe razón para modificar el criterio de 2 horas en la estimación de costos.
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA Ejemplo- Caso 4 (Cont.) Solución (Utilizando Valor-p) Paso 4: Del estadístico de prueba calculamos el área total de la región de rechazo, para t =1.216 Recuerde que es una prueba de dos colas, por lo que el área total es el área de la cola superior más el área de la cola inferior. Utilizando Excel: ==DISTR.T.2C(1.22,9) F06+* − . = .2535 La regla de rechazo utilizando el valor- estipula: Rechazar 3 si valor-p ≤ Paso 5: A partir del valor-p se establece que 3 no puede ser rechazada, valor-p > . %. Concluimos que: Concluimos que: “3 no puede ser rechazada”, no existe razón para modificar el criterio de 2 horas en la estimación de costos. Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA
RESUMEN
Prueba de cola inferior
Prueba de cola superior
Prueba de dos colas
JK : L ≥ LM JN: L < LM ;− : 2= 4 C B
JK : L ≤ LM JN: L > LM ;− : 2= 4 C B
JK : L = LM JN: L ≠ LM ;− : 2= 4 C B
Hipótesis Estadístico de Prueba Regla de rechazo: Método de valor-p Regla de rechazo: Método del valor crítico
Rechazar JK si: valor-p≤ O
Rechazar JK si: valor-p≤ O
Rechazar JK si: valor-p≤ O
Rechazar JK si: W ≤ −WQ
Rechazar JK si: W ≥ WQ
Rechazar JK si: W ≤ −WQ
Claudia Contreras - Inferencia Estadística
W≥
R WQ R
PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL: 8 DESCONOCIDA CNN tiene el liderazgo de noticias de televisión por cable. Nielsen Media Research indica que en 2002 la media de audiencia de CNN fue de 600000 espectadores por día. Suponga que en una muestra de 40 días durante la 1era mitad de 2003 la cantidad media de espectadores fue de 612000, con una desviación estándar muestral de 65000 sujetos.
Ejercicio de práctica
a) Formule las hipótesis si el director de CNN desea información sobre cualquier cambio en la cantidad de espectadores de la empresa. b) ¿Cuál es el valor-p? Si utiliza la tabla t-student indique entre que rango se encuentra este valor. c) Con = . %, ¿Cuál es su conclusión? (Utilice el método de valor crítico) d) ¿Qué indicaría al director de CNN, al respecto?
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN POBLACIONAL
Aquí se muestran las tres formas que pueden asumir H0 y Ha, refiriéndonos a las pruebas de hipótesis para la proporción poblacional. Observe que en la hipótesis nula siempre aparece la igualdad. H0: . ≥ .
H0: . ≤ .
H0: . = .
Ha: . < .
Ha: . > .
Ha: . ≠ .
Pruebas de una cola (unilateral)
Claudia Contreras - Inferencia Estadística
Pruebas de dos colas (bilateral)
PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN POBLACIONAL ESTADÍSTICO DE PRUEBA En las pruebas de hipótesis para la proporción poblacional (.+ ), se utiliza ;) y la poblacional y su error la diferencia entre la proporción muestral (. estándar. Se utiliza la distribución Z, para calcular este estadístico:
; − .+ . 9= = 8.;
; − .+ . .+ ( − .+ ) B
Se supone que np≥ % X B − . ≥ %, con lo cual se puede utilizar una distribución normal como aproximación a la distribución de muestreo de ;. . En la mayor parte de las aplicaciones las muestras son lo suficientemente grandes para utilizar la aproximación a normal.
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN POBLACIONAL Ejemplo- Caso 5 En un estudio diseñado para investigar si ciertos detonadores empleados con explosivos en una mina de carbón cumple con los requerimientos de que al menos 90% encenderá el explosivo al ser detonados. Se encontró en una muestra que 174 de 200 detonadores funcionaron adecuadamente. Compruebe esta hipótesis con un nivel de significancia de 0.05. Solución Paso 1 : Planteamiento de hipótesis 3 : . ≥ G 30 : . < G Paso 2: Se ha definido un nivel de significancia = . % (5%), se trata de una prueba de hipótesis de una cola o unilateral (cola inferior).
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN POBLACIONAL Ejemplo- Caso 5 (Cont.) Solución Paso 3 :Calculando el estadístico de prueba, se tiene . = . G , B = , D ;= . = . =D
9=
; − .+ . .+ ( − .+ ) B
=
. =D − . G . G( . )
= −.
Para un valor de = . %, el valor crítico (de la Tabla de la Distribución-Z) Valor crítico -1.645
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN POBLACIONAL Ejemplo- Caso 5 (Cont.) Solución Paso 4. Observe que el estadístico de prueba cae en la región de No Rechazo por lo que no puede rechazarse 3 . La Regla de Rechazo se establecería: Rechazar 3 si : 9 ≤ −. % Como Z = -1.41 no cae en la región de rechazo, entonces 3 no puede ser rechazada. Paso 5: Concluimos que: “3 no puede ser rechazada, no existe suficiente evidencia para afirmar que la clase de detonador no cumple con sus normas.”
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN POBLACIONAL Ejemplo- Caso 5 (Cont.) Solución (Utilizando Valor-p) Paso 4: Del estadístico de prueba calculamos el área total de la región de rechazo. De la tabla normal estándar P(z ≤ −. ) =0.0793,que es el área de la cola inferior. Por lo tanto, el área que corresponde al valor-p es: F06+* − . = . DG La regla de rechazo utilizando el valor- estipula: Rechazar 3 si valor-p ≤ Paso 5: A partir del valor-p se establece que 3 no puede ser rechazada, valor-p > . %. Concluimos que: “3 no puede ser rechazada, no existe suficiente evidencia para afirmar que la clase de detonador no cumple con sus normas.”
Claudia Contreras - Inferencia Estadística
PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN POBLACIONAL RESUMEN
Hipótesis Estadístico de Prueba
Regla de rechazo: Método de valor-p Regla de rechazo: Método del valor crítico
Prueba de cola inferior
Prueba de cola superior
Prueba de dos colas
JK : Y ≥ YM JN: Y < YM ; − .+ . 9 == .+ ( − .+ ) B
JK : Y ≤ YM JN: Y > YM ; − .+ . 9 == .+ ( − .+ ) B
JK : Y = YM JN: Y ≠ YM ; − .+ . 9 == .+ ( − .+ ) B
Rechazar JK si: valor-p≤ O
Rechazar JK si: valor-p≤ O
Rechazar JK si: valor-p≤ O
Rechazar JK si: P ≤ −PQ
Rechazar JK si: P ≥ PQ
Rechazar JK si: P ≤ −PQ
Claudia Contreras - Inferencia Estadística
P≥
R PQ R
View more...
Comments