Cap. 2 Prueba de Hipótesis

Share Embed Donate


Short Description

Descripción: En este capítulo explicaremos la lógica de reducción de la dimensionalidad de los datos. Su propósito últim...

Description

Cap. II

Test de contraste de hipótesis

Capítulo II

TEST DE CONTRASTE DE HIPÓTESIS

................................. …................................... Objetivo del Capítulo

Desarrollar la metodología de prueba de hipótesis como una técnica para analizar diferencias y tomar decisiones; determinar los riesgos implicados al tomar tales decisiones si nos basamos únicamente en la información de muestra; y estudiar la interrelación de estos riesgos con el tamaño de la muestra utilizada.

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

17

Cap. II

2.1

18

Test de contraste de hipótesis

INTRODUCCIÓN

Existen múltiples problemas en los cuales, en vez de estimar el valor de un parámetro, debemos decidir si una afirmación relativa a un parámetro es verdadera o falsa; esto es, debemos probar una hipótesis relativa a un parámetro. Por ejemplo, en un trabajo de control de calidad una muestra aleatoria puede servir para determinar el hecho de que la “media del proceso” (con base en una clase determinada de medición) ha permanecido inalterada o bien si ha cambiado a tal grado que el proceso esté “fuera de control” y tenga que hacerse ajustes. La comprobación de hipótesis estadísticas es quizás el área más importante de la inferencia estadística y, por consiguiente, de la teoría de la decisión. Dado que una hipótesis estadística que involucra a una o más poblaciones, decimos que una suposición o afirmación establecida por el investigador, puede ser verdadera o falsa. La verdad o falsedad de una hipótesis estadística nunca se conoce con certidumbre a menos que se examine a la población total. Esto, por supuesto, no sería posible por lo que se escoge una muestra al azar de la población en estudio y se utiliza la información contenida en dicha muestra para decidir si la hipótesis es falsa o verdadera. Si la información obtenida en esa forma muestra inconsistencia con la información establecida se rechaza la hipótesis; si ocurre lo contrario la hipótesis se acepta. Debe tomarse en cuenta que la aceptación de una hipótesis estadística es el resultado de una insuficiente evidencia o información para rechazarla y no necesariame nte implica que dicha hipótesis es verdadera. Cuando las hipótesis establezcan las diferencias entre dos grupos de observaciones, se deben obtener tales observaciones en dos muestras, y los resultados finales estarán comparando dos poblaciones de donde provienen las muestras; esta situación es diferente a la de hacer inferencias a partir de una sola muestra proveniente de una sola población, en este capítulo las pruebas estadísticas para llevar acabo estas serán tanto la distribución normal “Z” como la dist ribución “t” de Student. Por cierta característica de algunos problemas se conoce la proporción de ocurrencia de un evento, por lo cual las hipótesis estarán en términos de dichas proporciones. Cuando la única información que se tiene son las varianzas muestrales, obtenidas como estimadores a partir de dos muestras, de la varianza poblacional, se aplicará la prueba de la razón de varianzas para contrastar hipótesis acerca de varianzas. 2.2

TEST DE CONTRASTE DE HIPÓTESIS

Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error. La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por H0 . Rechazar H0 implica aceptar una hipótesis alternativa (Ha). La situación se puede esquematizar: H0 cierta H0 rechazada H0 no rechazada

Error tipo I (  ) Decisión correcta

H0 falsa Ha cierta Decisión correcta (*) Error tipo II (  )

(*) Decisión correcta que se busca

Debe tenerse en cuenta que sólo se puede cometer uno de los dos tipos de error y, en la mayoría de las situaciones, se desea controlar controlar la probabilidad de cometer un error de tipo I. Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

Test de contraste de hipótesis

19

Siempre que se rechaza una Hipótesis se corre el riego de cometer un error del tipo I  p(rechazar H0 |H0 cierta) siempre que se acepta una Hipótesis nula existe el riego de cometer al error tipo II  = p(aceptar H0 |H0 falsa) Potencia =1-  0 |H0 falsa) Cuando se lleva a cabo un test de contraste de hipótesis, se ha de comenzar por establecer las hipótesis nula y alternativa, recordando que la hipótesis nula ha de contener obligatoriamente una igualdad. Por lo general, se establece como hipótesis alternativa, la que trata de probar a lgo que significa un cambio sobre lo que se encuentra preestablecido (por resultados anteriores al test o por inercia) y que está representado por la hipótesis nula. La hipótesis nula es siempre conservadora, frente a la alternativa que propugna el cambio. Detalles a tener en cuenta: 1.   2. Sólo pueden disminuirse las dos, aumentando n. Los pasos necesarios para realizar un contraste relativo a un parámetro  son:  Establecer la hipótesis nula en términos de igualdad H O    O  Establecer la hipótesis alternativa, que puede hacerse de tres maneras, dependiendo del interés del investigador H a    O ,   O ,   O en el primer caso se habla de contraste bilateral o de dos colas, y en los otros dos de lateral (derecho en el 2º caso, o izquierdo en el 3º) o una cola.  Elegir un nivel de significación: nivel crítico para  que puede ser: (0.10, 0.05 ó 0.01, etc.).  Determinar la función de distribución (función pivotal) que minimice la probabilidad de error, es decir un estadístico de contraste: estadístico cuya distribución muestral se conozca en H0 y que esté relacionado con  y establecer, en base a dicha distribución, la región crítica: región en la que el estadístico tiene una probabilidad menor que  si H0 fuera cierta y, en consecuencia, si el estadístico cayera en la misma, se rechazaría H0 . Obsérvese que, de esta manera, se está más seguro cuando se rechaza una hipótesis que cuando no. Por eso se fija como H0 lo que se quiere rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar. Por otro lado, la decisión se toma en base a la distribución muestral en H0 , por eso es necesario que tenga la igualdad.  Calcular el estadístico para una muestra aleatoria y compararlo con la región crítica, o equivalentemente, calcular el "valor p" del estadístico (probabilidad de obtener ese valor, u otro más alejado de la H0 , si H0 fuera cierta) y compararlo con  .

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

20

Test de contraste de hipótesis

Se estudia para el nivel de significación dado, si se puede rechazar o no la hipótesis nula. Esto se hace viendo si la media obtenida se encuentra dentro de la región crítica asociada al nivel de significación, o si por el contrario, está fuera.  Decisión: Verificar si el valor experimental pertenece a la RA/H0 ó RR/Ho  Conclusión. Si "se rechaza la hipótesis nula", la conclusión debe ser redactada: "Existe evidencia suficiente al nivel de significación  ...(Significado de la hipótesis alternativa)" Si por el contrario la decisión es "no se puede rechazar la hipótesis nula", la conclusión debería ser redactada: "No existe suficiente evidencia al nivel de significación  que indique que ...(significado de la hipótesis alternativa)" 2.3

PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL

a) Cuando la varianza poblacional es conocida o n grande Ho :    O

Ho :    O

Ho :    O

Ha :    O

Ha :    O

Ha :    O

Hi pótesis bilateral _

Estadísitico de contraste sería:



x

Hi pótesis unilaterales

 n

Ejemplo 1 Se saca una muestra de 36 análisis de nitratos (NO 3 ) para el diseño de una planta de tratamiento de aguas industriales. Para esto, se calcula un promedio estadístico de x  92 mg / L . Estudios previos indican una desviación estándar conocida de   9 mg/L. Probar la hipótesis de que el valor esperado de µ es 100 mg/L. Asumir   0.05 y calcular el valor de la probabilidad p. Solución: 1. La hipótesis nula es: Ho: µ = 100. La hipótesis alternativa es Ho:   100 2. Las suposiciones son que la poblacional muestreada es normal, es conocida y, la muestra es aleatoria. 3. Con el nivel de significancia de   0.05 (nivel de confianza 95%), las regiones críticas y los coeficientes críticos son de ±1.96.

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

21

Test de contraste de hipótesis

4. La estadística usada es la de la distribución z , Z 

x



= Z 

n

92  100  5.3 9 36

5. Ahora comparando la z=-5.3 experimental con la z=1.96 tabulada, se rechaza la hipótesis nula

6. El valor de la probabilidad p se calcula buscando el valor de –5.3 en la tabla de la distribución normal (exel), Z (-5.3=). Además, como la prueba es bilateral, entonces, multiplicamos 5.79013E-07 por 2, es decir, (2)( 5.79013E-07) = 1.15803E-07 Este valor es muy significante y da evidencia para apoyar el rechazo de la hipótesis. Ejemplo 2 Un psicologo le da a un chimpancé 46 gr. de cacahuate a través de una máquina automática para que se ponga a bailar; la variable se distribuye normalmente con una media (  = 46 gr). Si el contenido medio es inferior a 46 gr. el chimpancé brinca, corre y se olvida de la respuesta; por otra parte, si el contenido es superior el chimpancé se satisface rápidamente y emite respuestas. Se sabe que la desviación estándar es de 5 gr. Si se toma una muestra n=25 y se encontró una media de 45.5 gr de cacahuate, contraste las hipótesis establecidas. Ho :   46 Ha :   46 Nivel de significancia:  = 0.05 _

Estadístico de contraste sería(varianza conocida):  

x



n



45.5  46  0.5 5 25

Región crítica (para  = 0.05,   1.64 ):

Decisión: Zexp = -0.5 < 1.64. Pertenece a la región de aceptación, por lo tanto no podemos rechazar Ho. Conclusión: No existe evidencia suficiente al nivel de significación  la máquina está arrojando la cantidad media como para que el chimpancé baile. Ejemplo 3 El contenido de calorías de Chicha morada "SuperBueno" es de 50 calorías por botella con una desviación estándar poblacional de 1.5 calorías. Se toma una m.a. de 19 botellas y se encuentra que el promedio de calorías por botella es de 49.3. ¿Estos datos apoyan lo que se afirma? Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

22

Test de contraste de hipótesis

Solución: Ho :   50 Ha :   50 Nivel de significancia:  = 0.05 _

Estadístico de contraste sería(varianza conocida):  

x

 n



49.3  50  2.03 1.5 19

Región crítica (para  = 0.05, Z   1.96 ): 2

Región crítica: Z < - 1.96 o Z > 1.96 Decisión: El valor experimental (Z = -2.03) pertenece a la región de rechazo RR/Ho, rechazamos la hipótesis nula, aceptamos la hipótesis alterna. Conclusión: Existe evidencia suficiente al nivel de significación  promedio de calorías por botella no está cumpliendo las especificaciones indicadas en la botella.

b) Cuando la varianza poblacional es desconocida y n peque ña Ho :    O

Ho :    O

Ho :    O

Ha :    O

Ha :    O

Ha :    O

El estadístico para el contraste es:

x t s n

_

 t , n 1

Ejemplo 1 Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra _

de 26 sujetos y encontramos: x = 18.5 , s = 3.6

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

23

Test de contraste de hipótesis

Solución Se trata de un contraste sobre medias. La hipótesis nula (lo que queremos rechazar) es: Ho :   18 Ha :   18 Es un contraste lateral derecho. Fijamos "a priori" el nivel de significación en 0,05 _

x El estadístico para el contraste es : t  s n En este ejemplo t (25, 0,05) =1.708. Calculamos el valor de “t” en la muestra :

La región crítica T > t 

T

18 .5  18  0.7082 3.6

26 El valor experimental no está en la región crítica (no es mayor que 1,708), por tanto no podemos rechazar H0 , esto quiere decir que la presión sistólica media en varones no es mayor que 18 cm de Hg.

Ejemplo 2 El pan integral sandwich de Productos Unión debe tener un peso de 250 Gr. el departamento de control de calidad, para verificar si el proceso está bajo control, selecciona una m.a. de 15 panes y los pesa, obteniéndose los siguientes datos: 248, 248, 245, 253, 250, 249, 244, 252, 253, 248, 247, 247, 252, 250, 247 Si usted fuera el jefe de control de calidad. ¿Qué recomendaría?

2.4

PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS POBLACIONALES

Población N2

Población N1

Comparación

Muestra n1

Muestra n2

Muestras independientes a) Cuando se conoce la varianza poblacional o n bastante grande Ho :    O Ha :    O

Ho :    O Ha :    O

Ho :    O Ha :    O

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

24

Test de contraste de hipótesis

El estadístico sería:  

x1  x 2   1   2   12 n1



 22 n2

Regiones críticas para probar Hipótesis alterna

1   2  0 1   2  0 1   2  0

Rechaza la Ho si

Z   Z Z  Z Z   Z 2



Z  Z 2 Ejemplo 1: Un psicologo efectúa un estudio acerca del uso de una tarjeta de crédito en una muestra formada por 62 personas (32 hombres y 30 mujeres). Este investigador encontró que después de 5 días de haber entregado la tarjeta, el promedio de gastos efectuados con dicha tarjeta fueron los siguientes: Hombres: $730.00 y Mujeres: $820.00, con varianzas de $144.00 y de $162.00, respectivamente; a simple vista no se puede concluir que las mujeres gasten más que los hombres, se quiere saber si la diferencia es estadísticamente significativa o no. Hombres xh  730

Mujeres xm  820

sh2  144

sm2  162

nh  32

nm  30

2.

Ho :  m   h Ha :  m   h   0.05

3.

   xm  xh    m   h  820  730    m   h   = 

1.



 m   h =0

2 m

nm





2 h

nh

162 144  30 32

90  28 .60 3.1464

4.

5. Desición: El valor de la distribución Zexperimental pertenece a la región de rechazo, entonces rechazamos Ho, aceptamos la Ha. 6. Conclusión: Al nivel de significancia del 5% la diferencia es significativa; por lo tanto se concluye que las mujeres gastaron más que los hombres (en los primeros 5 días).

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

25

Test de contraste de hipótesis

Ejemplo 2: Se utilizan dos máquinas para llenar botellas de plástico con un volumen neto de 16.0 onzas. Las distribuciones de los volúmenes de llenado pueden suponerse normales, con desviaciones estándar 1 = 0.020 y 2 = 0.025 onzas. Un miembro del grupo de ingeniería de calidad sospecha que el volumen neto de llenado de ambas máquinas es el mismo. De cada máquina se toma una muestra aleatoria de 9 botellas. ¿Se encuentra el ingeniero en lo correcto? Máquina 1

16,03 16,05 15,96

16,01 16,05 15,98

Máquina 2

16,04 16,02 16,02

16,02 15,96 16,04

16,03 16,01 16,02

15,97 15,99 16,00

b) Cuando no se conoce la varianza poblacional y n pequeño Ho : 1   2 Ha : 1   2

Ho : 1   2 Ha : 1   2

Si tenemos poblaciones finitas y n1 entonces el estadístico sería:

y n2 pequeñas y las varianzas poblacionales desconocidas

x1  x 2   1   2  , t s 2p

n1



Ho : 1   2 Ha : 1   2

s 2p

donde

(n1  1) s12  (n2  1) s 2 s  n1  n2  2

2

2 p

n2

Regiones críticas para probar Hipótesis alterna Rechaza la Ho si

1   2  0 1   2  0 1   2  0

t  t t  t t  t 2



t  t 2 Ejemplo 1: Un fabricante de cigarrillos analiza el tabaco de dos marcas diferentes, para determinar el contenido en nicotina y obtiene los resultados siguientes (en miligramos). Marca A : Marca B :

24 27

26 28

25 25

22 29

23 26

¿Los resultados anteriores, señalan que existe una diferencia en el contenido medio de nicotina en ambas marcas? Solución Ho : 1   2 Ha : 1   2   0.05 Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

Test de contraste de hipótesis

26

Estadísticos obtenidos a traves de las muestras x A  24 , S A  1.58 xB  27 , S B  1.58 Si tenemos poblaciones finitas y n1 y n2 pequeñas y las varianzas poblacionales desconocidas entonces el estadístico será: t 

x1  x 2   1   2  , s 2p

n1



s 2p

n2

donde

(n  1) s12  (n2  1) s 2 s  1 n1  n2  2

2

2 p

t

=

S p2 

4(1.58 ) 2  4(1.58 ) 2  2.5 8

24  27   0  3 2 .5 2 . 5  5 5

Regla de decisión Si to  t  o to  t   rechazamos H o 2

t 

( ,n1  n2 2) 2

2

 t(0.025,8)  2.306

Como la distribución t observada = -3 < t tabulada = -2.306, podemos concluir al nivel de significancia del 5% que existe una diferencia significativa en el contenido medio de nicotina en ambas marcas. 2.5

PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS POBLACIONALES (MUESTRAS DEPENDIENTES)

N1

n1 (antes)

N2

n2 (despues)

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

27

Test de contraste de hipótesis

El procedimiento para comparar las medias de dos muestras dependientes es muy diferente del que se sigue cuando las muestras son independientes. Un procedimiento comúnmente usado que da como resultado dos muestras no independientes es la denominada prueba "antes y después". Las mediciones se hacen sobre la muestra de sujetos tanto antes como después de la introducción de algún fenómeno. La presión sanguínea de un grupo de atletas se puede tomar antes y después de un período de ejercicios, en este caso el interés se concentra en la magnitud del cambio que registran las dos mediciones. También pueden compararse dos clases de observaciones cuando una muestra se divide de tal forma que la mitad experimente un fenómeno y la otra mitad experimente otro. Pasos de una prueba de Hipótesis para comparaciones pareadas Paso 1

Planteamiento de hipótesis Ho :  d  0 Ha :  d   d

Paso 2

Nivel de significancia  = (0.01, 0.05, 0.10)

Paso 3

Función pivotal:



Ho :  d  0 Ha :  d   d

d  d

d

Ho :  d  0 Ha :  d   d

Si la varianza de la población es conocida

n d  d Si no se conoce la varianza de la población t sd n

Donde:

d = x– y n

d

Paso 4 Paso 5 Paso 6 Paso 7

d i 1

i

n  d = diferencia media supuesta  d = desviación estándar de la población de los resultados de diferencia n = tamaño de muestra Determinar las regiones de aceptación y rechazo para Ho Calcular el valor experimental o crítico, que se obtiene reemplazando los datos del problema en el paso 3. Decisión: Verificar si el valor experimental pertenece a la RA/H0 ó RR/Ho Conclusión

También es posible estimar la diferencia media en datos pareados. La formula utilizada para esta estimación por Intervalo de confianza es: sd d t  ( , n d 1 ) n 2 Ejemplo 1 Un grupo de diez pacientes a quienes se le detectó diabetes recientemente, fue observado para decidir si un programa educativo fue efectivo en acrecentar su conocimiento de la diabetes. Se le aplicó un examen antes y después del programa educativo sobre aspectos de autoc uidado relacionados con la enfermedad. Los resultados de los exámenes fueron los siguientes:

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

28

Test de contraste de hipótesis

Paciente Antes Después

:1 :75 :77

2 62 65

3 67 68

4 70 72

5 55 62

6 59 61

7 60 60

8 64 67

9 72 75

10 59 68

¿El programa educativo fue eficaz con respecto al incremento del conocimiento de los pacientes? Solución Ho :  d  0 Ha :  d   d  = 0.05 d  d = 3.692 t sd n d = (y – x) Decisión: La t experimental = 3.692 > t tabular 2.26. Por lo tanto el valor experimental pertenece a la región de rechazo. Conclusión: Al nivel de significancia del 5% podemos decir que el programa educativo fue eficaz con respecto al incremento del conocimiento de los pacientes. También es posible estimar la diferencia media en datos pareados. La formula utilizada para esta estimación por Intervalo de confianza es: sd d t  = ( , nd 1 ) n 2 Reporte del SPSS 1° base de datos

2° Proceso

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

29

Test de contraste de hipótesis

3° Salida Es tadísticos de m ue str as re lacionadas

Par 1

Media 64.3000 67.5000

A NTES DESPUES

N 10 10

Desv iación típ. 6.49872 5.79751

Error típ. de la media 2.05508 1.83333

Prue ba de m ues tras re lacionadas

DESPUES - ANTES

Media 3.2000

Dif erencias relacionadas 95% Intervalo de conf ianz a para la dif erencia Desv iación típ. Inf erior Superior 2.74064 1.2395 5.1605

t 3.692

gl 9

Sig. (bilateral) .005

Regla de decisión: Sig = 0.005< 0.05, por lo tanto al nivel de significancia del 5% podemos decir que el programa educativo fue eficaz con respecto al incremento del conocimiento de los pacientes.

2.6 PRUEBA DE HIPOTESIS PARA LA PROPORCION POBLACIONAL Las pruebas de hipótesis relacionadas con proporciones (porcentajes) se requieren en muchas áreas de la ingeniería. Por ejemplo, las compañías constructoras están interesadas en saber, qué proporción de sus productos salen defectuosos. Además, los políticos están interesados en saber qué fracción de los votantes los favorecerán.

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

30

Test de contraste de hipótesis

Por otro lado, en la ingeniería ambiental estamos interesados en saber qué fracción de las industrias están cumpliendo con las legislaciones ambientales. También, es de interés social saber qué fracción de los jóvenes universitarios usan determinadas drogas. Igualmente, es de interés saber qué fracción o proporción de personas que puedan estar conscientes de la magnitud del problema de la contaminación ambiental, etc. Las pruebas de hipótesis con la estadística p (que estima a  ) de proporción están basadas en una muestra aleatoria de tamaño n de la población muestreada. Si el tamaño de la muestra n es pequeño, con relación al tamaño poblacional, el promedio x tiene aproximadamente una distribución binomial. Además, si n es grande, el promedio x y el estimador p = X/n posee una distribución binomial. Pero si n es grande, se usa la distribución normal como una aproximación a la binomial. Las condiciones para usar la distribució n binomial es tener un número fijo de ensayos independientes, que tengan probabilidades constantes y de que, cada ensayo, tenga dos resultados clasificados como “éxito” o “fracaso”. El planteamiento de la hipótesis sería: Ho : P  P0 Ha : P  P0

Ho : P  P0 Ha : P  P0

Ho : P  P0 Ha : P  P0

La función de prueba para valores de n  30 es:

zo =

P - po po (1 - po )/n

 n(0,1)

Donde: P=proporción muestral Po=proporción poblacional o valor esperado q=1-p n=tamaño de muestra La función de prueba para valores de n  30 es:

to =

P - po  t(n-1) po (1 - po )/n

Ejemplo 1: Un grupo ambiental afirma que los incidentes de las aves que chocan con los aviones son muy raros, es decir, como para justificar la matanza de aves en los aeropuertos. Sin embargo, un grupo de pilotos aviadores afirman que, en el despegue de los aviones, en el 10% de los casos, las aves chocan contra el avión. Usar = 0.05 para probar esta afirmación. La muestra es de 150 despegues abortados de aviones, de los cuales 5 se debieron a choque contra las aves. Solución: Se usa la distribución normal como aproximación a la binomial, porque np  5 y nq  5, es decir, (150)(0.10) = 15 y nq = (150)(0.90) = 135. Debido a que el reclamo es del 10%, entonces, la fracción = p = 0.10. Lo opuesto del reclamo original es  = 0.10. Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

Test de contraste de hipótesis

31

3. Debido a que  = 0.10 contiene la condición de igualdad, la hipótesis nula y la alternativa son: Ho:  =0.10 Ha:   0.10 El nivel de significancia es de  = 0.05. La estadística apropiada para probar si p = 5/150 = 0.033 es usando la estadística z que se apro xima a la distribución binomial. 0.033 - 0.10

zo =

0.10( 0.90 )/150

 2.79

Los valores críticos con = 0.05 son z = ±1.96 Debido a que el valor de –2.79 cae en la región crítica izquierda, se rechaza la hipótesis. Ejemplo 2: El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio adyacente está a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos, 75 dijeron que estaban a favor. ¿Proporcionan estos datos evidencia suficiente como para apoyar la opinión del alcalde?

Solución 75  0.625,   0.05 120 Como n > 30, entonces la distribución normal para  0.95   1.645

P = 0.60,

n = 120,

pˆ 

H 0 : P  0.60 H a : P  0.60

  0.05 o 

0.625  0.60 0.60 x 0.40 120

 0.56

Decisión: Como Zo pertenece a la RA/Ho, entonces no podemos rechazar Ho Conclusión: Al nivel de significancia del 5% los datos no proporcionan suficiente evidencia como para aceptar la opinión del alcalde. Ejemplo 3: Por evidencia experimental se sabe que cierta droga pediátrica es eficaz en un 80% de los casos, cuando esta correctamente administrada. Se aplica dicha droga a 400 niños y se obtiene únicamente 300 resultados positivos. ¿Puede considerarse este resultado como evidencia de que la droga no estuvo bien administrada?

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

32

Test de contraste de hipótesis

Solución 300  0.75,   0.05 400 Como n > 30, entonces la distribución normal para  0.95   1.645

P = 0.80,

n = 400,

pˆ 

H 0 : P  0.80 H a : P  0.80

  0.05 0.75  0.80  2 . 5 0.80 x 0.20 400 Decisión: Como Zo pertenece a la RA/Ho, entonces no podemos rechazar Ho o 

Conclusión: Al nivel de significancia del 5% los datos confirman que existe evidencia de que la droga no estuvo bien administrada. 2.7

PRUEBA PARA LA DIFERENCIA DE PROPORCIONES (P1 - P2 )

Ho : P1  P2 Ha : P1  P2

Ho : P1  P2 Ha : P1  P2

Prueba bilateral

Ho : P1  P2 Ha : P1  P2

Pruebas unilaterales

La función de prueba es:

o 

 pˆ1  pˆ 2   P1  P2   n (0,1) P1 . q1 P2 . q2  n1 n2

Ejemplo 1: En un estudio referente a las preferencias sobre la envoltura de papas fritas en hojuelas. Se entrevistó a un grupo de 100 mujeres de altos ingresos y un grupo de 200 mujeres de bajos ingresos. Los resultados de sus selecciones se dan a continuación: Grupo de mayores ingresos

Grupo de menores ingresos

Preferencia de paquete metálico

36

84

Preferencia de paquete en papel encerado

39

51

Preferencia en papel celofán

16

44

No tiene preferencia

9

21

Determine si existe diferencia significativa entre la opinión de las mujeres de alto ingreso con las mujeres de bajo ingreso en cuanto a la envoltura metálica. Solución Ho : P1  P2 Ha : P1  P2 Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

  0.05 o 

pˆ 1 

33

Test de contraste de hipótesis

 pˆ1  pˆ 2   P1  P2   n (0,1) P1 . q1 P2 . q2  n1 n2

36  0.36 100

pˆ 2 

o 

0.36  0.42   0 0.36 x0.64 0.42 x0.58  100 200

 1.02

84  0.42 200

Decisión: El valor experimental pertenece a la región de aceptación, por lo tanto no podemos rechazar la hipótesis nula. Conclusión: Al nivel de significancia del 5% la prueba no es significativa, esto quiere decir que no existe diferencia significativa entre la opinión que tienen las mujeres de alto ingreso con las de bajo ingreso con respecto a la envoltura metálica.

2.8 PRUEBA DE HIPÓTESIS SOBRE LA VARIANZA POBLACIONAL El interés es probar la hipótesis nula de que la varianza de una población es igual a una constante determinada contra una alternativa unilateral o bilateral adecuada

Estadístico de prueba: X o2 

(n  1) S 2

 o2

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

Test de contraste de hipótesis

34

donde S2 es la varianza muestral. Ahora si Ho :  2   02 es verdadera, entonces el estadístico de prueba X2 o sigue una distribución ji-cuadrada con n-1 grados de libertad. Por consiguiente, se calcula el valor de la estadística de prueba  02 , y la hipótesis Ho :  2   02 debe rechazarse si:

 o2   2 / 2,n 1 o si

 o2   12 / 2,n 1 donde 2 / 2,n1 y 12 / 2,n1 son los puntos que corresponden a los porcentajes 100/2 inferior y superior de la distribución ji-cuadrada con n-1 grados de libertad, respectivamente. Ejemplo 1: Un investigador está convensido de que su equipo de medición tiene una variabilidad que arroja una desviación estándar de 2. Dieciséis mediciones dieron como resultado un valor de S 2  6.1 : ¿Contradicen los datos su afirmación?. Use   0.05 Ho :  2  4

Ha :  2  4   0.05 2 (n  1)S 2

15(6.1)  22.875 4  Conclusión: al nivel de significancia del 5% no podemos rechazar la afirmación del experimentador.

 o2 

2 o

=

PROBLEMAS DE REPASO DEL CAPÍTULO 1. Una muestra aleatoria de 36 concentraciones atmosféricas de óxido de nitrógeno (NO x ), en mg/L, mostró un promedio estadístico de x  74 .0mg / L . Suponiendo que  2  81 .0mg / L , ¿indicaría esto que un límite de concentraciones de NOx arriba de 70 mg/L? Usar   0.05 . Rpta: se rechaza la Ho, Z= 2.66 2. En un estudio de la ingeniería ambiental atmosférica, para evitar la contaminación ambiental producida por el consumo excesivo e innecesario de gasolina, en el diseño de un motor de combustión interna, el departamento de ingeniería de un constructor de autos, de cierto modelo, afirma que el rendimiento del millaje de este modelo de auto es de cuando menos 35 millas por galón. El departamento de control de calidad sugiere que el valor de la desviación estándar es de   4 millas. La Environmental Protection Agency de Estados Unidos de América quiere probar esta afirmación para ver si la figura afirmada debería ser más alta o más baja que 35 millas por galón. Para esto, se saca una muestra aleatoria de 50 modelos de este tipo y se prueban bajo circunstancias iguales. Los resultados dan un promedio muestral de 33.6 millas por galón. Probar el reclamo del departamento de ingeniería usando un nivel de significancia de 0.05. Rpta: se rechaza la Ho, Z= -2.47 3. Para medir la calidad del aire de cierta zona industrial, con relación a los óxidos de azufre, se sacaron dos muestras de tamaños 50 y 75, respectivamente. Los promedios fueron de 76 mg/L y de 82 mg/L, respectivamente. Asumir que las varianzas de estas poblaciones son conocidas e iguales a 16. Asumir un nivel de significancia de  = .05. Usando el valor de p, probar que no hay deferencias entre las dos poblaciones muestreadas. Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

Test de contraste de hipótesis

35

Rpta: En conclusión, debido a que el valor calculado de z = 2.05 es mayor que la región crítica derecha de 1.96, se rechaza la hipótesis y se concluye que los promedios no son iguales. 4. Se quieren probar dos analizadores de CO de diferentes marcas, para ver si los dos dan los mismos resultados en las mediciones de CO. Llamemos al primer analizador A y al segundo B. Probar que los resultados de las dos mediciones de CO provenientes de los dos analizadores son iguales. Asumir = 0.05. Los datos se dan abajo. Tabla mostrando los datos de este problema.

Rpta: Debido a que 4.06 cae dentro de la región crítica derecha, se rechaza la hipótesis nula y se concluye que los promedios poblacionales correspondientes a ambos muestreadores de CO no son iguales. Tal parece que el muestreador A da resultados de mediciones de CO, con una probabilidad mucho más significante que el muestreador B. 5. Un activista del medio ambiente afirma que, menos de la mitad de las industrias, cumplen con los límites ambientales. Probar esta aseveración, si un sondeo dice que 48% de 1998 industrias si cumplen, satisfactoriamente, con los reglamentos ambientales. Usar un nivel de = 0.05. Rpta: Debido a que el valor de –1.79 < 1.645, se introduce en el extremo izquierdo de la distribución, se rechaza Ho 6. Una empresa se dedica a la fabricación y venta de jabones. Ud está a cargo de la planificación de la demanda de los mismos. Su jefe le aconseja para reducir su trabajo analizar la incidencia que pudo tener en las ventas de jabón para ropa blanco la elaboración del mismo con un nuevo aditivo. Para ello usted decide analizar las ventas del último mes para el jabón anterior y el que tiene nuevo aditivo en las 24 sucursales Sucursal jabón ropa bl anca sin aditi vo

Sucursal Con aditi vo

A B C D

145 130 125 138

M N O P

160 155 158 150

E F G H I J K L

128 132 140 165 175 182 174 160

Q R S T U V W X

162 170 145 168 180 200 195 180

a. Se incrementaron las ventas de jabón con el nuevo aditivo?  =0,05 b.El jefe de su jefa tomo su información y Ud sabe que es una persona exigente. Mencione que supuestos debió considerar y demás pruebe los que sean posibles. Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

Test de contraste de hipótesis

36

c.Que otra prueba podía realizar para comparar las ventas de ambos tipos de jabón para un mismo grupo de sucursales y que ventajas tendría respecto de la prueba utilizada en el punto a). 7. Tomando en cuenta la opinión de los consumidores se considera un éxito el lanzamiento del nuevo jabón, si la proporción de aceptación en el mercado alcanza el 60%. En una muestra de 200 potenciales consumidores 125 expresaron su conformidad con el nuevo jabón. Realizar la prueba al 10% de significación. 8. El archivo de datos “Aerolíneas.sav” contiene datos relativos al número de pasajeros registrados en 48 vuelos de cierta compañía aérea. a. Hallar un I.C. para la media del número del número de pasajeros basado en la muestra de los 48 vuelos al 90% de confianza. Rpta: IC al 90%= b. Probar la hipótesis de que el número medio de pasajeros es de 450 al nivel de significación de 0.10 basándose en la muestra dada. 9. Durante los tres primeros meses de vida el aumento de peso registrado por cierto anima l fue de 65 gr.desde el nacimiento hasta los tres meses de edad; una docena de estos animales fueron alimentados con determinada dieta y los aumentos de pesos observados fueron los siguientes. (en gr.) 61, 67, 62, 59, 62, 60, 63, 65, 58, 54, 62, 55 ¿Hay razón para creer, al nivel de significación del 5% que la dieta originó cambio en el peso? 10. Una empresa comercializa una bebida refrescante, en un envase en cuya etiqueta se puede leer: "Contenido 250 cc". El "Departamento de Consumo", toma aleatoriamente 36 envases, y estudia el contenido medio, obteniendo una media de 234 cc y una desviación típica muestral de 18 cc. ¿Puede afirmarse con un 1% de significación que se está estafando al público? (Consideraremos estafa que el contenido sea menor que el expresado en la etiqueta) (P.A.U. 2006) 11. Una máquina para enlatar conservas de pescado ha sido regulada para que el contenido de cada lata sea de 16 onzas, usando  = 0.05, Diría Ud. que la máquina ha sido adecuadamente regulada, si una muestra de 20 latas dio un peso medio de 16.05 onzas y una desviación típica de 1.5 onzas? 12. Productos Unión distribuye dos tipos de pan integral. En una encuesta se encuentra que 56 de 200 amas de casa prefieren el pan integral mediano y que 29 de 150 amas de casa encuestadas prefieren el pan integral fibra. ¿Se puede concluir al nivel de significación 0.06 que el pan integral mediano se vende más rápidamente que el pan fibra? 13. Una empresa estaba considerando establecer un servicio de reparto de pasteles los domingos en la mañana en La Molina. Con base en el costo de esté servicio y las utilidades que se pueden lograr, ha llegado a la siguiente conclusión: Si hay prueba de que el pedido promedio será de mas de 14 pasteles por casa durante un trimestre, ento nces se instituirá el servicio de reparto. Si no se puede demostrar con pruebas, no se instituirá el servicio. Con base en experiencias previas en otras urbanizaciones se estimó que la desviación estándar era de tres pasteles. Se toma una m.a. de 36 residencias en la cual se encuentra un consumo promedio de pasteles de 12.5, la empresa está dispuesta a correr un riesgo del 1% de que se instituirá el servicio. ¿Que opina Ud.? 14. Una compañía de productos para el consumidor está desarrollando un nuevo champú, y está interesada en la altura de la espuma (en mm). La altura de la espuma tiene una distribución aproximadamente normal, con una desviación estándar de 20mm. La compañía desea probar H 0 : Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

37

Test de contraste de hipótesis

 = 175 mm. contra Ha:  > 175 mm, utilizando los resultados obtenidos con n = 10 muestras en las cuales se encuentra que X  180 ¿A qué conclusión puede llegarse? 15. Dos grupos A y B de 100 personas, cada una tiene una tiene una enfermedad, el suero es dado al grupo A pero no al grupo B, por otra parte los grupos son tratados idénticamente, si encontramos que en el grupo A 75 personas se sanaron de la enfermedad y en el grupo B 65. Pruebe la hipótesis de que el suero cura la enfermedad. 16. Durante un periodo de 12 meses, el número de nacimientos de mellizos por mes registrados en un hospital son: 2, 0, 1, 1, 0, 0, 3, 2, 1, 1, 0, 1.¿Contradicen estos resultados la hipótesis de que el promedio de nacimientos de mellizos es de 0.5 por mes? (Nivel del 5%) 17. El jefe de admisión de una universidad afirmó en una reunión con la directiva que el 15% de los estudiantes que ingresan, se retiran antes de haber completado cuatro semestres académicos. En una revisión a los registros de los últimos años, mediante una muestra aleatoria de 300 alumnos, se encontró que 54 se retiraron. ¿Al nivel del 1 % es válida la información? 18. Un estudio de consumo de café en el trabajo, por sexo, mostró en una encuesta aleatoria de 200 mujeres que 128 lo toman durante su trabajo, mientras que una muestra de 150 hombres reveló que 106 lo toman. ¿Hay alguna diferencia entre la proporción de los dos grupos, en cuanto al hábito de tomar café en el trabajo? 19. Se estudia el nivel de nicotina en los cigarrillos de dos marcas A y B, absteniéndose los siguientes resultados. A: 17, 20, 20, 23 B: 18, 20, 21, 22, 24 Con  = 0.05. Determinar si es posible llegar a la conclusión que el contenido de nicotina en ambas marcas es diferente. 20. 11 ratas tratadas crónicamente con alcohol se les midió la presión sanguínea sistólica antes y después de 30 minutos de administrarles a todas ellas una cantidad fija de etanol, obteniéndose los datos siguientes:

Antes Después

126 119

120 116

124 117

Presión sanguínea sistólica 122 130 129 114 116 122 127 122 110 120

119 112

112 110

118 111

¿Hay un descenso significativo de la presión sanguínea sistólica tras la ingestión de etanol? 21. En un experimento diseñado para estimar los efectos de la inhalación prolongada de óxido de cadmio, 15 animales de laboratorio sirvieron de sujetos para el experimento, mientras que 10 animales similares sirvieron de grupo control. La variable de interés fue el nivel de hemoglobina después del experimento. Se desea saber si puede concluirse que la inhalación prolongada de óxido de cadmio disminuye el nivel de hemoglobina según los siguientes datos que presentamos:

Expuestos No expuestos

Nivel de hemoglobina 14.4 14.2 13.8 16.5 14.1 16.6 15.9 15.6 14.1 15.3 15.7 16.7 13.7 15.3 14 17.4 16.2 17.1 17.5 15

16

16.9 15

16.3 16.8

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

38

Test de contraste de hipótesis

22. Se realiza un estudio para determinar los efectos de poner fin a un bloqueo renal en pacientes cuya función renal está deteriorada a causa de una metástasis maligna avanzada de causa no urológica. Se mide la tensión arterial de cada paciente antes y después de la operación. Se obtienen los siguientes resultados:

Antes Después

Tensión arterial 132 130 102 80

150 90

116 82

¿Se puede concluir que la intervención quirúrgica tiende a disminuir la tensión arterial? 23. Dos tipos de soluciones químicas A y B fueron ensayadas para ver su PH. Análisis de 20 muestras de A dieron un PH de 6.5 con una S 1 = 0.24. Análisis de 20 muestras de B arrojó que su PH 7.4 con S2 = 0.30. Docimar si existe una diferencia significativa. 24. En una escuela pública se escogieron 10 pares de niños de primer año para comparar la similitud de inteligencia y preparación. Un niño de cada par fue enseñado a leer con un método y el otro con otro método. Después del periodo de aprendizaje, los niños fueron sometidos a una prueba de lectura con los siguientes resultados, (el puntaje utilizado fue de 0 a 100): Niño Nº Método I (x) MétodoII (y)

1 65 63

2 68 68

3 70 68

4 63 60

5 64 68

6 62 66

7 74 60

8 72 78

9 70 70

10 66 70

¿A un nivel de significación del 5%, existe alguna diferencia significativa en la mayor efectividad de alguno de los métodos aplicados? 25. Un fabricante de productos alimenticios hace una prueba previa con cierto tipo de salsa picante, que puede preparar en una forma mas espesa (x) o en otra forma menos espesa (y). Para medir la preferencia por uno y otro tipo de salsa picante, utiliza una muestra de 10 amas de casa, quienes manifiestan sus preferencias, por dichos tipos de salsa picante, con los siguientes resultados (se utilizó una escala de 1 a 10) en puntos. Ama de casa: Salsa (x) : Salsa (y) :

1 3 2

2 1 4

3 5 4

4 2 7

5 0 3

6 4 4

7 3 6

8 3 5

9 2 5

10 5 8

Al nivel de significación del 5%, se podría concluir que el tipo de salsa menos espesa(y) tiene mayores oportunidades de ser aceptada en el mercado, que el tipo más espeso (x)? 26. A 10 atletas se les sometió a un programa de entrenamiento físico intensivo por parte del preparador físico. Se anotaron sus pesos (en libras) antes y después de dicho entrenamiento con los resultados siguientes: Atleta: Peso antes: Peso después:

1 127 135

2 195 200

3 162 160

4 170 182

5 143 147

6 205 200

7 168 172

8 175 186

9 197 194

10 136 141

¿Afecta el programa el peso medio de los atletas? 27. Una manzana recién descubierta tiene un sabor delicioso. Se ha decidido docimar (someter a prueba) su rendimiento, plantando este tipo de manzanas junto a otras corrientes, en 8 huertos Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

39

Test de contraste de hipótesis

diseminados en una región apropiada para la producción de ambas variedades. Cuando los árboles empiezan a rendir frutos, se mide su producción en cajas. Los datos obtenidos son los siguientes: Huerto: Nueva manzana. Manzana corriente

1 13 12

2 14 16

3 19 17

4 10 9

5 15 16

6 14 12

7 12 10

8 11 8

¿Señalan estos datos una mayor producción para la nueva manzana que para la corriente? 28. Un gimnasio recién inaugurado en la capital, invita a su afiliación argumentando una reducción de peso, al menos de 4.6 kilos. Una muestra aleatoria de 34 personas, revela que el promedio de reducción de peso es de 4.1 kilos, con desviación típica de 1.8 kilos. A un nivel del 1 % ¿ Se puede creer lo tan anunciado por el gimnasio? 29. Una compañía desea estudiar el efecto que tiene la pausa para el café, sobre la productividad de sus obreros. Selecciona 6 obreros y mide su productividad en un día corriente, y luego mide la productividad de los mismos 6 obreros en un día en que se concede la pausa para el café. Las cifras que miden la productividad son las siguientes: Trabajador: Sin pausa: Con pausa:

1 23 28

2 35 38

3 29 29

4 33 37

5 43 42

6 32 30

¿Indican estos resultados que la pausa para el café aumentan la productividad? 30. Una empresa necesita un químico, los aspirantes son sometidos a diferentes pruebas psicotécnicas, de las cuales una es un test de análisis de un producto. Los dos mejores candidatos A y B , han obtenido los resultados en la prueba de análisis químico: Nº de prueba: Candidato A: Candidato B:

1 20 19

2 17 18

3 18 20

4 20 17

5 19 18

6 18 17

7 19 19

8 20 19

9 19 20

10 20 19

Puede considerarse que el químico A ha realizado mejores análisis que B o viceversa? 31. En una conferencia de prensa, una alta autoridad anuncia que el 90% de los habitantes adultos del país están a favor de cierto proyecto del gobierno. Una muestra aleatoria de 625 adultos indica que 550 están a favor del proyecto. Si Ud. desea rechazar una hipótesis verdadera no más de una vez en 100, ¿concluiría que la popularidad del proyecto ha sido exa gerada por la autoridad? 32. La oficina de relaciones familiares informa que el 50% de los matrimonios que viven en la ciudad A, llegan a la corte de divorcios dentro de su primer año de casados. ¿Qué conclusión puede sacarse acerca de la validez de este informe si de una muestra aleatoria de 400 matrimonios, solo 193 fueron a la corte de divorcios dentro de su primer año de casados? Utilice un nivel de significancia  = 0.01. 33. El gerente de personal de una empresa querría determinar la cantidad de tiempo que necesitan los empleados para llegar a su trabajo. Se selecciona una m.a. de 12 empleados y se registra el tiempo en minutos para llegar al trabajo, con los siguientes resultados: 15 30

50

60

25

65

45

90

75

50

50

20

Mètodos estadìsticos aplicados a la investigaciòn - Mg. Rosa Padilla Castro

Cap. II

Test de contraste de hipótesis

40

Con un nivel de significancia del 5%, ¿Hay pruebas de que el tiempo promedio de viaje de los empleados es menos de 60 minutos? 34. Un terapeuta ocupacional realizó un estudio para evaluar los méritos relativos de dos aparatos prostéticos ideados para facilitar la destreza manual. El terapeuta le entrego a 21 pacientes con idénticas dificultades uno de los dos aparatos para que lo usaran mientras realizaban determinada tarea. 11 pacientes llevaron el aparato A y 10 el B. El investigador registró el tiempo que gasto cada paciente en realizar la tarea y obtuvo los siguientes resultados: SA = 81 X A  65 segundos , SB = 64 X B  75 segundos , ¿Darán estos datos evidencia suficiente como para concluir que el aparato A es más efectivo que el aparato B? sea  = 0.05. Nota: En las preguntas donde sea necesario encontrar medias, una de las formas es usando: (analizar
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF