Prueba Hipótesis en SPSS

April 4, 2019 | Author: FrancisLeonardo | Category: Statistical Hypothesis Testing, P Value, Confidence Interval, Spss, Sampling (Statistics)
Share Embed Donate


Short Description

Prueba Hipótesis en SPSS...

Description

Tema: Contrastes de hipótesis con SPSS 1. Análisis de una y dos muestras con el SPSS

[email protected]

Ejemplo La duración de una determinada componente electrónica sigue una distribución normal. Los resultados de una muestra aleatoria de esta clase de componentes son: 1200; 1350; 1275; 890; 1125; 1520 y 1100 horas. Realiza con  = 0,05 el contraste de hipótesis:

 H 0 :    1100   H 1 :    1100

Propuesta de solución: 1. Crea el fichero de datos con la variable: duración 2. Selecciona el procedimiento Prueba T para una muestra, eligiendo el menú Analizar/Comparar medias/Prueba T para una muestra. muestra . ‘duración’’ e introducir el valor 1100 en la ventana 3. Selecciona la variable ‘duración correspondiente a ‘Valor de prueba’ 4. Pulsa ‘Aceptar’ y ‘Aceptar’ y observarás los siguientes cuadros: Es tadísticos tadísticos p ara una mues tra

N DURACION

Med ia 7 12 08 ,5 714

Desviación típ. 20 0,72 19

Err or tí t íp. de de la media 75 ,8 65 8

Prueb Prueb a para para una mues tra V alor alor de p rueba = 1100

DURACION

t 1,43 1

gl 6

Sig. ( bila te r al) ,202

Diferencia de me dias 10 8,57 14

95% Intervalo de conf ianz ianz a para la la diferencia In f er ior - 77 ,0 65 4

Supe r io r   29 4,20 82

Para interpretar el contraste de hipótesis hay que usar el valor que aparece en la casilla ‘Sig. (bilateral)’. En esta casilla está representada la significación o p-valor . En este caso este p-valor es la probabilidad de que |T| > t = 1,431. La interpretación se resume en lo siguiente: Si el p-valor es menor  que  que el tamaño del test α es porque el valor del estimador usado para el contraste pertenece a la región crítica y, por tanto, se rechaza la hipótesis nula. nula. Si, por el contrario, el p-valor es mayor que α dicho valor no está en la región crítica y se acepta la hipótesis nula. En este ejemplo, se debe aceptar la hipótesis nula.

Relación entre intervalos de confianza y contrastes de hipótesis La región de aceptación (complementario de la región crítica) de un contraste de hipótesis  para un parámetro  con tamaño  coincide con un intervalo de confianza para  al (1- (1-x100 x100 %.

En el caso del contraste visto anteriormente, la región de no rechazo (o aceptación) es:

  X   t n -1 ,  InfExcel

S   /2

n

     X   t n -1 ,

  n

S   /2

Otra forma de interpretar el contraste es ver si el 0 está contenido en el intervalo de confianza al 95% para la diferencia de medias, que también lo proporciona el programa. Si esto es así (como en el ejemplo) se acepta la hipótesis nula y se rechaza en caso contrario. La prueba T es válida siempre que el tamaño muestral sea suficientemente grande o, en caso contrario, cuando la muestra provenga de una población con distribución normal. 2. Prueba t para dos muestras independientes

 H  :     2 Para el contraste  0 1  H 1 :  1   2

(con varianzas poblacionales desconocidas)

Dependiendo de si las desviaciones típicas son iguales o diferentes se tienen diferentes valores para m y S*. Para distinguir entre ambos casos se hace un  H 0 :  12   22 contraste previo  . 2 2 :      H   2  1 1  H 0 :  12 /  22  1 En realidad el que se hace es  2 2  H 1 :  1 /  2  1 Este se resuelve usando la región crítica R = {  F   ( F n1 1,n2 1;1  / 2 , F n1 1,n2 1;  / 2 )} 2

siendo

 F 



S 1

2

S 2

que sigue una distribución F de Fisher-Snedecor con n 1 - 1 y n2 - 1

grados de libertad. (n1 y n2  son los tamaños muestrales correspondientes y las respectivas cuasivarianzas muestrales)

Si las varianzas son iguales m = n 1 + n2 – 2 y S* = siendo Sp =

1 n1



1 n2

2

2

S 1 , S 2

Sp

( n1  1) S 12  ( n2  1) S 22

 n2  1 En caso contrario m se estima mediante una expresión un poco complicada   2 2 2 2 2   ( S 1 / n1  S 2 / n2 ) S 1 S 2 *    (Smith-Satterhwaite) m = yS= n1 n2  1 ( S 2 / n ) 2  1 ( S 2 / n ) 2  2 2  n1  1 1 1  n2  1  n1

Ejemplo 2. Se quiere comparar la calidad de dos máquinas que fabrican un cierto componente eléctrico. Se han tomado datos sobre la cantidad de componentes estropeados en diferentes lotes obteniéndose para la máquina 1 los siguientes datos: 15, 16, 17, 12, 13, 15, 16, 13, 17, 15, 16, 17, 15, 13 y para la máquina 2: 8, 9, 5, 7, 9 , 11, 15, 13, 9, 8. Contrasta la igualdad de medias con   0,05

Para poder efectuar la prueba T para muestras independientes, SPSS necesita una columna en el editor de datos que contenga los valores de la variable cuyas medias InfExcel

en las dos poblaciones se desea comparar, y otra que indica la población o grupo a que pertenece cada individuo. Propuesta de solución: 1. Crea el fichero EJEMPLO2.SAV, con las variables ‘fallos’ (15; 16; …) y ‘máquina’ (1 u 2). 2. Selecciona Analizar/Comparar medias/Prueba T para muestras independientes. 3. Selecciona la variable numérica ‘fallos’ y situarla en la ventana de Contrastar variables. A continuación, selecciona la variable de agrupación ‘maquina’ y pulsa Definir grupos. 4. Especifica los dos valores de la variables de agrupación que definen cada máquina:  Usar valores especificados. Escribir un valor (1) para el Grupo 1 y otro (2) para el Grupo 2. Los casos con otros valores (si existen) quedarán excluidos.  Punto de corte. Escribir un número que divida los valores de la variable de agrupación en dos conjuntos. Todos los códigos menores que el punto de corte forman un grupo y los mayores o iguales que el punto de corte forman el otro grupo. 5. Pulsa ‘Aceptar’ Es tadísticos de grupo

FALLOS

MAQUINA 1,00

14

Media 15,0000

Desviación típ. 1,6641

10

9,4000

2,9136

N

2,00

Err or típ. de la media ,4447 ,9214

Prueba de m uestras independientes Prueba de Levene para la igualdad de varianzas

F FALLOS

Se han asumido varianzas iguales No se han as umido varianzas iguales

2,303

Sig. ,143

Prueba T para la igualdad de medias

t

gl

Sig. (bilateral)

Diferencia de medias

Erro r típ. de la dif erenc ia

95% Intervalo de confianza para la diferencia Inf erior

5,984

22

,000

5,6000

,9359

3,6591

7,5409

5,474

13,187

,000

5,6000

1,0231

3,3930

7,8070

Para la interpretación de este contraste, primero se observa la columna ‘Prueba de Levene para la igualdad de varianzas’. En este caso, con α = 0,05 se acepta que las varianzas son iguales. Posteriormente, en la fila inferior aparecen los dos contrastes sobre la igualdad de medias para la variable ‘fallos’: uno con varianzas iguales y otro con diferentes. En este caso, hay que fijarse en la fila correspondiente a varianzas iguales. El p-valor es menor que 0,05 por lo que se rechaza la hipótesis nula. Esta prueba T es válida siempre que los tamaños muestrales sean suficientemen-te grandes o cuando las muestras provengan de poblaciones con distribuciones normales.

InfExcel

Superior  

3. Prueba t para dos muestras dependientes En este caso, se tienen dos distribuciones normales apareadas. Esto ocurre, por ejemplo, cuando se miden dos variables sobre una muestra de individuos. Se tiene una variable D = X-Y que sigue una distribución N(µD, σD) El contraste a efectuar es:  H 0 :   D  0   H 1 :   D  0

Ejemplo 3. Se quiere comparar la rapidez de dos programas informáticos A y B para la resolución de cierta clase de problemas de ingeniería hidráulica. Para ello se analizan 9 casos utilizando tanto el programa A como el B. Los tiempos obtenidos para resolver estos casos fueron:

Caso Programa A Programa B

1 11.5 12.3

2 13.2 12.9

3 15.7 13.1

4 9.8 10.9

5 12.6 11.2

6 10.5 12.1

7 11.3 9.9

8 12.6 11.8

9 14.1 12.3

Contrasta con   0,05 si la diferencia de los tiempos medios de resolución es 0.

Para efectuar la Prueba T para muestras emparejadas, a diferencia de las muestras independientes, se necesita una columna en los datos para cada una de las variables a comparar. Propuesta de solución: 1. Crea el archivo EJEMPLO3.SAV con las variables Programa y Programb 2. Selecciona Analizar/Comparar medias/Prueba T para muestras relacionadas 3. Selecciona las dos variables en cuya diferencia estamos interesados. Al hacer la primera selección en la columna de variables, esta aparece en el recuadro selecciones actuales como variable 1, y al realizar la segunda selección aparecerá como variable 2. En ese momento, ya seleccionadas las dos es cuando se pueden introducir en la columna variables relacionadas. 4. Pulsa Aceptar . Es tadísticos d e m uestr as relacionadas

Par 1

PROGRA MA

Media 12,3667

PROGRA MB

11,8333

9

Desviación típ. 1,8330

Err or típ. de la media ,6110

9

1,0161

,3387

N

Prueba de muestras relacionadas Diferencias relacionadas

Media Par 1

InfExcel

PROGRAMA PROGRAMB

,5333

Desviación típ. 1,4361

Erro r típ. de la media ,4787

95% Intervalo de confianza para la diferencia Inf erior -,5706

Superior   1,6372

t 1,114

gl

Sig. (bilateral) 8

,298

Se observa el p-valor en la columna ‘Sig. (bilateral)’. Como es mayor que 0,05 se acepta la igualdad de medias. Esta prueba T es válida siempre que el tamaño muestral sea suficientemente grande o cuando las muestra provenga de poblaciones con distribución normal.

Tareas. En todas las tareas debes identificar los principales valores de las pruebas emitidas por el SPSS señalando su respectivo significado, además de indicar tus conclusiones. PD = Penúltimo dígito de tu matrícula. Entrega tu informe y envía el archivo de Resultados identificado con tu apellido antes de las 11:50 horas. 1. Durante los últimos 5 años el número de ordenadores que vende por semana la empresa Darth Vader Helado Oscuro es aproximadamente normal N( ). En una muestra aleatoria simple de 10 semanas de los últimos cinco años, dicha empresa vendió 175, 168, 171, 169, 183, 165, 188, 177, 167 y (180 + UD) ordenadores. Contrasta si el valor medio de las ventas es 200 con   0,1 2. Contrasta si el peso medio de un cierto tipo de piezas mecánicas difiere según sean fabricados en dos lugares diferentes A y B con un nivel de significación igual a 0,01. Los datos obtenidos son los siguientes, A: 80, 97, 85, 73, 92, 97, 100 y 94; B: 99, 92, 85, 79, 91, 96 y 105. 3. Estudia si un cierto tipo de componente mecánico es simétrico o no en base a la medida de sus lados izquierdo y derecho con un nivel de significación 0,05. Los datos que se han obtenido en las medidas son: Pieza 1 2 3 4 5 Izquierdo 11.5 13.2 15.7 9.8 12.6 Derecho 12.3 12.9 13.1 10.9 11.2

InfExcel

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF