Prueba de Hipótesis - Taller
January 21, 2023 | Author: Anonymous | Category: N/A
Short Description
Download Prueba de Hipótesis - Taller...
Description
PRUEBA DE HIPÓTESIS
¿Qué es una hipótesis?
Es una suposición o conjetura respecto del modo de darse una realidad, y que admite un si o un no como respuesta
¿Qué es una hipótesis?
¿El salario medio en Europa es menor que el salario medio en Estados Unidos? ¿Beber frecuentemente alcohol está relacionada con padecer cáncer? ¿Las visitas en una web es la causa de éxito en un proyecto?
Tipos de hipótesis
Comparación: ¿El salario medio en Europa es menor que el salario medio en Estados Unidos? Relación o asociación: ¿Beber frecuentemente alcohol está relacionada con padecer cáncer? Causalidad: ¿Las visitas en una web es la causa de éxito en un proyecto?
Media poblacional
Media muestral
∑
= El promedio se calcula con todos los datos de la población
=
∑
El promedio se calcula solo con los datos de la muestra obtenida
Suponga una empresa que fabrica bombillos. Todos los días produce miles de bombillos.
Se espera que estos bombillos tengan una vida de 1000 horas, ya que cuando se venden, eso es lo que se ofrece a los compradores.
La gerencia tiene algunas dudas, pues algunos clientes se han quejado, por lo que se debe determinar si efectivamente la vida media de los bombillos es inferior a la ofrecida.
Entonces, se toma una muestra aleatoria de bombillos. Estos bombillos serán probados para determinar su vida media
Esta decisión debe tomarse con base en datos de una muestra, pues si probara todos los bombillos que se producen, no se vendería ninguno, lo cual no tendría sentido
Al tomar la decisión con base a datos muestrales se corre el riesgo de que, por causa del azar, esos bombillos tengan una vida mayor, o menor, que la real (media poblacional).
En esta situación se debe determinar si la afirmación: La vida media de los bombillos es 1000 horas
es verdadera o es falsa Esta afirmación cuya veracidad se prueba se conoce como prueba de hipótesis El procedimiento para realizar esta evaluación se llama
Prueba de hipótesis
Entonces, podemos definir: Hipótesis: es una afirmación o conjetura acerca de un parámetro
de una o más poblaciones y que está sujeta a verificación
Prueba de hipótesis: procedimiento basado en evidencia de la
muestra y la teoría de probabilidades para determinar si la hipótesis es una afirmación razonable
El temor de la empresa es que la vida media de los bombillos sea inferior a 1000 horas, pues esa ha sido la queja de los clientes. cl ientes. Entonces, si se rechaza la hipótesis nula de que: horas La vida media de los bombillos es 1000 horas
Se estaría tomando por válida la hipótesis alternativa: La vida media de los bombillos es menor que 1000 1000 horas.
También podemos definir:
Hipótesis nula: es cualquier hipótesis que se desea probar Se denota
Hipótesis alternativa: es la hipótesis que se acepta cuando la hipótesis nula es rechazada. Se denota
En este caso: Hipótesis nula: La vida media de los bombillos es 1000 hor horas as
Hipótesis alternativa:
La vida media de los bombillos es menor que 10 1000 00 horas.
Simbólicamente se representa:
Suponga que la empresa tomó una muestra de 24 bombillos y los probó para determinar la vida media. Y así contar con datos para la prueba pr ueba de hipótesis.
En la muestra se obtuvo una vida media de 970 horas.
¿Se puede concluir que la vida media de los bombillos es menor que 1000 horas?
La hipótesis nula se rechaza sólo si los datos ofrecen suficiente evidencia para no considerarla verdadera
¿Por qué esto es así?
Muestra 1
Vida media: 985 hr.
Población
Muestra 2
Vida media: 1012 hr.
Muestra 3
Vida media: 1007 hr.
Dado que las muestras se obtienen al azar, la media en cada muestra será distinta, por lo que esas diferencias no se atribuyen a problemas en el producto, sino que son causadas por el azar
¿Cómo se sabe qué tanto es " suficiente evidencia" ? Para esto tenemos que agregar algunos conceptos adicionales.
Nivel de significancia: Es la probabilidad de rechazar la hipótesis
nula cuando es verdadera.
Se denota por . El nivel de confianza es Este nivel de significancia permite establecer, con base en probabilidad probabilidades, es, un criterio para determinar si se tiene " suficiente evidencia" para descartar la hipótesis nula. Esto sería rechazar que la diferencia de 30 horas menos se debe al azar ( o sea, por cuestión del azar la muestra contenía bombillos de menor duración). duración).
¿Cuánto es un nivel de significancia “aceptable"?
No se desea que la probabilidad de rechazar la hipótesis nula cuando es verdadera sea alta Generalmente las pruebas de hipótesis se realizan con niveles de significancia de
5%
o de
1%
¿Es confiable esta decisión basada en datos de una muestra ? Al basarse en datos de la muestra es posible cometer dos tipos de errores:
Error tipo I: se comete
cuando se rechaza una hipótesis que es correcta. La probabilidad de cometer este error se denota por
Error tipo II: se comete
cuando se acepta una hipótesis que es incorrecta. La probabilidad de cometer este error se denota por
Error tipo I y error tipo II
Decisiones con respecto a Se acepta Se rechaza Verdadera a l u n s i s e t ó p i H
Decisión correcta
Error tipo I
Error tipo II
Decisión correcta
Falsa
¿Qué significa estos errores para esta empresa? Población
Muestra
Error tipo I:
Por causa del azar los bombillos de la muestra tenían una vida muy baja y se rechaza que la vida media es de 1000 horas siendo verdadera esta hipótesis.
Consecuencia:
La empresa va a tratar de mejorar su proceso de producción innecesariamente, lo cual le hará incurrir en costos mayores
¿Qué significa estos errores para esta empresa? Población
Muestra
Error tipo II:
Por causa del azaruna losvida bombillos tenían muy alta y se acepta que la vida media es de 1000 horas siendo falsa esta hipótesis.
Consecuencia:
La empresa no va a tratar de mejorar su proceso de producción, pero debería hacerlo, lo cual le generará clientes insatisfechos.
Las hipótesis y el p – valor
El valor de p es una simple medida de la probabilidad de que la diferencia de resultado se deba al azar. Se calcula con base a los datos de la muestra
Se rechaza Ho
Se mantiene a Ho como cierta
Pasos para aprobar una hipótesis
1
Se establece la hipótesis nula y la hipótesis alternativa.
2 3
Se selecciona un nivel de significancia para la prueba.
4
Con base a la muestra se toma una decisión: se acepta o se rechaza la hipótesis nula.
Se identifica el estadístico de prueba.
Prueba de media hipótesis para la
Ejemplo 1: Datos sobre par de torsión para retirar
tapas Un ingeniero especializado en control de calidad debe garantizar que las tapas de las botellas
de
champú
queden
ajustadas
correctamente. Si las tapas quedan fojas, podrían caerse durante el envío. Si se
Columna de la hoja de trabajo Torsión
El par de torsión necesario para retirar la tapa.
Máquina
La máquina que ajustó la tapa: 1 ó 2.
aprietan demasiado, será diícil retirarlas. El valor objetivo del par de torsión para ajustar
Descripción
las tapas es 18. El ingeniero recolecta una muestra aleatoria de 68 botellas y prueba la cantidad de par de torsión que se necesita
Base de datos: TorsiónTapa.MTW
para quitar las tapas.
Paso 1. Plantear la hipótesis.
La hipótesis nula se plantea como:
La hipótesis alternativa entonces podría ser alguna al guna de las siguientes
En el ejemplo se desea probar probar que el valor del par de torsión para ajustar las tapas es 18:
Como en la muestra la media es 21.265 mayor que 18, la hipótesis alternativa lógica es:
Paso 2. Especificar el nivel significancia significancia
(la probabilidad de error tipo I) con
que se desea trabajar trabajar.. Los valores usualmente usados son 5% y 1%. - Si se escogede una probabilidad error tipo probabilidad error tipo II seade muy gran grande de I muy pequeña esto hace que la
En el ejemplo se aplica =5%
Paso 3. Se define el estadístico de prueba apropiado para la determinación del p-valor
Con conocida: =
Con desconocida y :
En el ejemplo la es desconocida, entonces:
Ejecución de la prueba en Minitab
Paso 4. Se toma una decisión con respecto a la Gráfica de caja de Torsión (con Ho e intervalo de confianza t de 95% para la media)
_ X Ho
10
15
20
25
30
35
40
Torsión
Como Valor p es menor al 5%, se rechaza la hipótesis nula, existe evidencia suficiente para afirmar que el par
de torsión media es mayor a 18
Prueba de hipótesis para la comparación de dos medias poblacionaless poblacionale
Diferencia entre medias
Muchas veces se debe decidir si la diferencia entre dos medias muestrales se puede atribuir al azar o si en realidad las dos muestras provienen de poblaciones con medias diferentes
Comparar rendimiento de dos tipos de llantas
Comparar dos métodos de enseñanza
Comparar efectividad de un plan de seguridad seguridad ocupaciona ocupacionall (antes vs. Después)
Comparar condiciones socioeconómicas socioeconóm icas de
Comparar dos métodos de soldadura ¿Cuál es la más resistente?
Comparar el rendimiento de dos
dos poblaciones
planes de marketing marketing
Diferencia entre medias
Se plantea la hipótesis nula como: La hipótesis alternativa entonces podría ser alguna de las la s siguientes:
Diferencia entre medias Comparación de dos medias dependientes Prueba t pareada La prueba t pareada es útil para analizar el mismo conjunto de elementos que se midieron bajo dos condiciones diferentes, las diferencias en las mediciones realizadas en el mismo sujeto antes y después de un tratamiento o las diferencias entre dos tratamientos administrados al mismo sujeto.
Comparación de dos medias independientes Los dos grupos deben ser independientes. Esto quiere decir que cada elemento debe pertenecer a solo uno de los dos grupos y no tiene relación con los elementos del otro grupo.
Ejemplo 1: Datos sobre par de torsión para retirar tapas Un ingeniero especializado en control de calidad debe garantizar que las tapas de las botellas
de
champú
queden
ajustadas
correctamente. Si las tapas quedan fojas, podrían caerse durante el envío. Si se aprietan demasiado, será diícil retirarlas. El valor objetivo del par de torsión para ajustar
Columna de la hoja de trabajo
Descripción
Torsión
El par de torsión necesario para retirar la tapa.
Máquina
La máquina que ajustó la tapa: 1 ó 2.
las tapas es 18. El ingeniero recolecta una muestra aleatoria de 68 botellas y prueba la cantidad de par de torsión que se necesita
Base de datos: TorsiónTapa.MTW
para quitar las tapas.
Ejecución de la prueba en Minitab
Gráfica de caja de Torsión 40
35
30 n ó i 25 s r o T
20
15 10 1
2
Máquina
Se observa que la torsión media necesaria aplicando la maquina 1 es menor que la torsión media necesaria aplicando la máquina 2, la hipótesis alternativa lógica es:
Como Valor p es menor al 5%, se rechaza la hipótesis nula, existe evidencia suficiente para afirmar que la torsión media necesaria aplicando la máquina 1 es inferior que la torsión
media necesaria aplicando la máquina 2.
Ejemplo 1: Datos sobre ritmo cardíaco en reposo Un investigador médico estudia la obesidad en las chicas adolescentes. Puesto que es el porcentaje de grasa corporal diícil y costoso de medir directamente, el investigador desea determinar si el índice de masa corporal (IMC), una medición que es ácil de tomar, es un predictor adecuado del porcentaje de grasa corporal. El investigador recopila el IMC, el porcentaje de grasa corporal y otras variables personales de 92 chicas adolescentes.
Columna de la hoja de trabajo
Descripción
Antes
El ritmo cardíaco en reposo de la persona antes del programa de correr.
Después
El ritmo cardíaco en reposo de la persona después del programa de correr.
Diferencia Diferen cia
La dierencia entre el ritmo cardíaco en reposo de la persona antes y después del programa de correr.
Base de datos: RitmoCarRep.MTW
Ejecución de la prueba en Minitab
85
Gráfica de caja de Antes. Después
80
75 s o t a D
70
65
60 Antes
Después
Como Valor p es menor al 5%, se rechaza la hipótesis nula, existe evidencia suficiente para afirmar que el ritmo cardiaco promedio antes del programa es diferente al ritmo cardiaco promedio después después del programa.
Ejemplo 2: Datos sobre grosor del Un ingeniero de manuactura hizo un experimento para determinar la manera en que varias condiciones aectan el grosor de una sustancia de recubrimiento. Tres operadores dierentes hacen el experimento dosel veces. operador mide grosorCada dos veces para cada tiempo y conguración
recubrimiento
Columna de la hoja de de tr trabajo
Descripción
Tipo de variable
Grosor
El gr gros oso or del del rec ecub ubrrim imie ient nto o.
Res espu pues estta
Tiempo
La hora del día en que realizó el experimento: 1 = mañana, 2 = tarde.
Factor
Operador
El operador que midió el
Factor
Posición
grosor: 1, 2 o 3. La conguración de la máquina: 35, 44 o 52.
Factor
Base de datos: GrosorRecub.MTW
Prueba de hipótesis para la comparación de más de dos medias poblacionales (ANOVA)
Usualme Usualmente, el ANOV ANOVA A de un yfactor se emplea cuando tenemo tenemos s una únicao variable nte, o factor independiente el objetivo es investigar si las variaciones diferentes niveles de ese factor tienen un efecto medible sobre una variable dependiente.
Factor: Tipo de llanta (A, B o Variable dependiente:
Rendimiento Comparar rendimiento de más de dos tipos de llantas
C)
Diferencia entre medias
Se plantea la hipótesis nula como:
No existe efector del factor sobre la variable de respuesta La hipótesis alternativa se plantearía de la forma:
Si existe efecto de los niveles del factor sobre la variable de respuesta
Ejemplo 1: Datos sobre crecimiento de plantas Un abricante de ertilizantes para plantas desea desarrollar una órmula de ertilizante que produzca el mayor aumento en la altura de las plantas. Para probar las órmulas de ertilizantes, un cientíco
Columna de la hoja de trabajo
El ertilizante utilizado: Ninguno , Gro wFast (el (el ertilizante sometido a prueba) o SuperPlant (el (el ertilizante de la competencia).
Factor
Altura
La al altu tura ra de la la pla plant nta. a.
Resspu Re pues esta ta
grupo de control sin ningún tipo de ertilizante, un
llamado SuperPlant ,
de
un
abricante
de
la
competencia. Después de que las plantas han permanecido
tres
meses
en
un
ambiente
de
Tipo de variable
Fertilizante
prepara tres grupos de 50 plántulas idénticas: un
grupo con el ertilizante del abricante, llamado GrowFast , y un grupo con un ertilizante
Descripción
Base de datos: CreciPlantas.MTW
invernadero controlado, el cientíco mide la altura de las plantas.
Gráfica de caja de Altura 40
35
30
a r 25 u t l A
20
15
10
GrowFast
Ninguno Fertilizante
SuperPlant
La aplicación delplantas fertilizante resulta en un crecimiento adicionalrespecto sobre laaplanta, ya que el crecimiento promedio de las pla ntas a las GrowFast que se aplica aplicaron ron este fertilizante eess superior otr otros os grupos.
Diferencia entre medias
Se plantea la hipótesis nula como:
(factor ) sobre la altura de la planta (variable No existe efector del fertilizante (factor (variable de respuesta)) respuesta La hipótesis alternativa se plantearía de la forma:
Si existe efecto del fertilizante aplicado sobre el crecimiento de la planta
Ejecución de la prueba ANOVA ANOVA en Minitab
Como Valor p es menor al 5%, se rechaza la hipótesis nula, existe evidencia suficiente para afirmar que si existe efecto del tipo de fertilizante sobre el crecimiento de la planta.
Prueba de independencia Chi-cuadrado
Prueba de independencia entre dos variables cualitativas
Se plantea la hipótesis nula como:
La hipótesis alternativa se plantearía de la forma: Una variable se distribuye de modo diferente para diversos niveles de la otra
Ejemplo 1: Desayuno de preferencia preferencia Este archivo de datos hipotécos trata sobre
Columna de la
una encuesta realizada a 880 personas sobre sus preferencias en el desayuno, teniendo también en cuenta su edad, sexo, estado civil y si enen un eslo de vida acvo o no (en función de si praccan ejercicio al menos
hoja de trabajo
dos veces a la semana). Cada caso representa un encuestado diferente. El objevo de la presente invesgación es idencar el perl del consumidor de cada po de desayuno.
Edad Género Estado Civil Estilo de vida
Descripción
Menor de 31, 31-45, 46 – 60 o Más de 60
o Hombre Mujer o
Soltero, Casado Activo, Sin actividad
Desayuno preferido desayuno Cereales,, o Cereales Barrita Cereales de
Prueba de independencia Desayuno de preferencia preferencia según la edad
Se plantea la hipótesis nula como:
La hipótesis alternativa se plantearía de la forma: El desayuno de preferencia difiere por categoría de edad
Gráfica de Edad. Desayuno preferido 20 e j a t n e c r o P
15 10 5
0 Desayuno preferido
s s s s l a e e a l a e v e e n n a a s a y u u n n o o e r e a l a e v e e n n a s a a y u u n n o o e r e e a l a e v e e n n a s a a y u u n n o o e r e a e n n a a s a y u u n n o o e r e A A A A v e e C e C e C e C e d e d e d e d d d d d a a t a t a t a r t a r r i r i r r i r r i B a B a B a B a Edad 1 0 4 5 6 0 e 3 e 6 6 d d 3 1 4 r s n o M á M e
Porcentaje en en todos lo s datos.
Como Valor p es menor al 5%, se rechaza la hipótesis nula, el desayuno de preferencia difiere por categoría de edad. edad.
Gráfica de Edad. Desayuno preferido 20 e j a t n e c r o P
El desayuno de preferencia puede ser los cereales y la barrita de desayuno. desayuno. Menores de 46:
15 10 5
0 Desayuno preferido
a o s a o s a o s a o s e n u n e a l e e n u n a l e e n u n a l e e n u n a l e A v e s a y C e r e A v e s a y C e r e A v e s a y C e r e e A v e s a y C e r e d d d d d e d e d e d e a a a a a a t t t t i i i i a r r a r r a r r a r r B B B B Edad 5 0 3 1 6 0 - 4 - 6 e 1 6 d d e 3 4 r s o M á e n M
Porcentajee en todos los datos. Porcentaj
El desayuno de preferencia puede ser la avena y los cereales. De
46
a
60:
El desayuno de preferencia es la avena. Mayores de 60:
Avena: Avena: Es mayor a 45
años.
Barrita de desayuno:
45años
Es menor a
Cereales: Es menor a 60 años Cereales:
Prueba de independencia Desayuno de preferencia según género
Se plantea la hipótesis nula como:
La hipótesis alternativa se plantearía de la forma: El desayuno de preferencia difiere por género
Gráfica de Género. Desayuno preferido 140 120 100 o e t n o C
80 60 40 20
0 Desayuno preferido
Género
s o r e a l a e y u u n n e r a y s C d e d e i t a r r B a b r e m H o a v e e n n A v
s o r e e a l a e y u u n n e r a y s C d e d e i t a r r B a r u j e M a v e e n n A v
Como Valor p es mayor al 5%, se mantiene la hipótesis nula como cierta, no existen diferencias significativas entre hombre y mujeres en cuanto al desayuno de preferencia.
Prueba de independencia Desayuno de preferencia preferencia según el estado civil
Se plantea la hipótesis nula como:
La hipótesis alternativa se plantearía de la forma: El desayuno de preferencia difiere por estado civil
Gráfica de Estado Civil. Desayuno preferido 200
150 o e t n o C
100
50
0 Desayuno preferido
Estado Civil
s e a l a e e n n a a s a y u u n n o o e r e A v e e C d d e i t a r r B a
s e a l a e e n n a a s a y u u n n o o e r e A v e e C d d e i t a r r B a
o s a d C a
r o l t e S o
Como Valor p es menor al 5%, se rechaza la hipótesis nula, el desayuno de preferencia difiere por por estado civil.
Gráfica de Estado Civil. Desayuno preferido
o e t n o
Casado: Prefiere la avena o los
200
cereales
150
Soltero: No se observa
diferencias significantes
100
C
50
Avena: Avena: Es casado 0 Desayuno preferido
Estado Civil
o l e s u n r e e a a y e s C d e d e a i t B a a r r r o s a d a C a e n A v
o l e s u n r e e a a y e s C d e d e a i t B a a r r r r o l t e o S a e n A v
desayuno: No No se Barrita de desayuno:
diferencias significantes Cereales: Es casado Cereales:
observa
Prueba de independencia Desayuno de preferencia preferencia según el estilo de vida
Se plantea la hipótesis nula como:
La hipótesis alternativa se plantearía de la forma: El desayuno de preferencia difiere por estilo de vida
Gráfica de Estilo de vida. Desayuno preferido 200
150 o e t n o C
100
50
0 Desayuno preferido
Estilo de vida
o l e s u n r e a e s a y e C e d a d r r i t B a a r o t i v a c n E a e n A v
o l e s u n r e e a e s a y e C e d a d r r i t B a a r d d a i v i t c a S i n a e n A v
Como Valor p es menor al 5%, se rechaza la hipótesis nula, el desayuno de preferencia difiere de acuerdo al estilo de
vida.
Gráfica de Estilo de vida. Desayuno D esayuno preferid preferido o 200
No significativas. Activo:
hay
diferencias
150 o e t n o C
El desayuno de preferencia es la avena avena o cereales Sin actividad:
100
50
0 Desayuno preferido
Estilo de vida
a n o l e s e n e a y u r e a A v e s e C e d d i t a a r r B v o c t i a E n
a n o l e s e n e a y u r e a A v e s e C e d d i t a a r r B a d v i d i t a c S i n
Avena: Avena: Sin actividad. Barrita
de
desayuno: desayuno:
En
actividad. No se encuentra diferencias significativ significativas. as. Cereales: Cereales:
Perfil del consumidor Avena: El consumidor es una persona mayor a 45 años, es casado y tiene un
estilo de vida sin actividad. Barrita de desayuno: Es menor a 45 años y tiene un estilo estil o de vida activo. Cereales: El consumidor es una persona es menor a 60 años y casado.
Avena: Avena:
Es mayor a 45
Avena: Avena: Es casado
Avena: Sin actividad. Avena:
No se observa diferencias significantes
Barrita
años. Barrita
Barrita de desayuno:
menor a 45años
Es
de
desayuno: desayuno:
actividad.
de
desayuno: desayuno:
En
Cereales: Es Cereales:
años
menor a 60
Cereales: Cereales: Es casado
No se encuentra diferencias significativas.
Cereales: Cereales:
View more...
Comments