capIII.pdf

March 9, 2018 | Author: londonpark147 | Category: Normal Distribution, Statistics, Probability, Randomness, Hypothesis

Share Embed Donate

Report this link

Short Description

Download capIII.pdf...

Description

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Capítulo III Diseño Completamente al Azar Los números redondos son siempre falsos. Samuel Johnson

Los estadísticos generalmente hacen la pregunta incorrecta, y están dispuestos a responder con una mentira, una que es frecuentemente una descarada mentira. Ellos preguntan “Son los efectos de A y B diferentes?” y ellos están dispuestos a responder “no”. Todo lo que nosotros sabemos acerca del mundo nos enseña que los efectos de A y B son siempre diferentes – en algún lugar decimal – para cualquier A y B. De esta manera, preguntar “¿Son los efectos diferentes?” es tonto. Lo que deberíamos responder primero es “¿Podemos indicar la dirección en la cual los efectos de A difieren de los efectos de B?”. ¿Es “arriba”, “abajo” o “incierta”? La tercera respuesta a la última pregunta es que nosotros tenemos “incertidumbre sobre la dirección”, y no que nosotros “aceptemos la hipótesis nula”. John Tukey

1. Introducción El diseño completamente al azar (DCA) es el más simple de todos los diseños. Es un diseño en el cual los tratamientos son asignados aleatoriamente a las unidades experimentales sin ningún tipo de restricción. Este diseño es utilizado cuando las unidades experimentales son bastante homogéneas, es decir, cuando la variabilidad entre ellas es pequeña y no existe ningún criterio de bloqueo que permita disminuirla. Dado que los tratamientos constituyen el único criterio de clasificación para las unidades experimentales, a este diseño se le conoce también como diseño de clasificación de una vía (One Way). En este capítulo se verán los casos paramétrico y no paramétrico del DCA, el análisis de la variancia y las pruebas de comparación de medias de tratamientos.

Ing. Raúl Eyzaguirre Pérez [email protected]

24

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

2. Diseño Completamente al Azar (DCA Clásico o Paramétrico) 2.1. Ventajas y Desventajas del DCA Ventajas: -

Es un diseño flexible en tanto que el número de tratamientos y de repeticiones solo está limitado por el número de unidades experimentales. El número de repeticiones puede variar entre tratamientos aunque generalmente lo ideal es tener un número igual para cada tratamiento. El análisis estadístico es simple. El número de grados de libertad para estimar el error experimental es máximo. Esto mejora la precisión del experimento.

Desventajas: -

Solo es aplicable en situaciones en las que el material experimental es homogéneo. Dado que no hay restricciones de aleatoriedad toda la variabilidad existente en las unidades experimentales tratadas con el mismo tratamiento estará incluida en el error experimental.

2.2. Aleatorización y Croquis Experimental Como ya se mencionó, en este diseño no existe ninguna restricción de aleatoriedad por lo que la asignación de los tratamientos a las unidades experimentales será completamente aleatoria (Esto quiere decir que cualquier distribución de los tratamientos en las unidades experimentales es igualmente probable). Para lograr la asignación aleatoria de los tratamientos se puede utilizar cualquier método de generación de números aleatorios como una tabla de números al azar, un modelo de urnas o un sistema de cómputo (aunque los números generados por calculadoras y computadoras no son estrictamente aleatorios sino solo pseudoaleatorios, son aceptables). Por ejemplo, suponga que va a evaluar 4 tratamientos con 3 repeticiones cada uno; en este caso necesitará de 12 unidades experimentales. Para asignar los tratamientos completamente al azar a las unidades experimentales, genere primero un orden aleatorio para los primeros 12 números naturales. Para ello podría por ejemplo utilizar 12 papeles idénticos, numerarlos del 1 al 12, colocarlos en una urna y luego sacarlos uno a uno anotando el orden en el cual son seleccionados. Otra alternativa sería generar 12 números aleatorios usando la computadora o una tabla de números aleatorios y luego asignarle a cada uno un número de orden desde el 1 hasta el 12 (de menor a mayor). A continuación se presenta una secuencia de 12 números aleatorios obtenidos utilizando la función ALEATORIO() de Excel con su respectivo número de orden: .755 9

.442 4

.582 6

Ing. Raúl Eyzaguirre Pérez [email protected]

.601 7

.479 5

.994 12

.306 1

.416 2

.435 3

.836 10

.743 8

.902 11

25

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Con esta secuencia, el primer tratamiento es asignado a las unidades experimentales 9, 4 y 6, el segundo a las u.e. 7, 5 y 12, el tercero a las u.e. 1, 2 y 3 y el cuarto a las u.e. 10, 8 y 11. El croquis para este experimento podría ser el siguiente: T3

T3

T3

T1

T2

T1

T2

T4

T1

T4

T4

T2

2.3. Modelo Aditivo Lineal El modelo aditivo lineal para un diseño completamente al azar es el siguiente: Yij = µ + τ i + ε ij

i = 1,..., t

j = 1,...ri

donde: Yij es el valor o rendimiento observado en el i-ésimo tratamiento, j-ésima repetición. µ es el efecto de la media general. τi es el efecto del i-ésimo tratamiento. εij es el efecto del error experimental en el i-ésimo tratamiento, j-ésima repetición. t es el número de tratamientos. ri es el número de repeticiones para el i-ésimo tratamiento. Ejemplo 1: Se realizó un experimento para evaluar el efecto de la adición de compuestos vitamínicos al alimento balanceado en la ganancia de peso en cerdos. Tres diferentes compuestos fueron evaluados (A, B y C) y un control (D – sin la adición de compuesto vitamínico). El aumento de peso tras una semana en una muestra aleatoria de 22 cerdos se da a continuación: Compuesto Vitamínico A B C D

11.1 11.5 10.1 9.2

Aumento de peso tras una semana en lb 10.9 10.8 10.2 11.4 11 10.8 10.6 11.2 10.6 11.2 10.2 10.4 9.8 10.1 9.7 10.4

10.7 10.9

Este experimento fue conducido bajo los lineamientos de un DCA, por lo que el modelo aditivo lineal es el siguiente: Yij = µ + τ i + ε ij

i = 1,..., t

j = 1,...ri

donde: - Yij es la ganancia de peso obtenida en el j-ésimo cerdo alimentado con el i-ésimo compuesto vitamínico. - µ es el efecto de la media general de las ganancias de peso. - τi es el efecto del i-ésimo compuesto vitamínico. - εij es el efecto del error experimental con el j-ésimo cerdo alimentado con el i-ésimo compuesto vitamínico. Ing. Raúl Eyzaguirre Pérez [email protected]

26

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

- t = 4 (Número de tratamientos) - r1 = 6, r2 = 6, r3 = 5 y r4 = 5 (Número de repeticiones por tratamiento). 2.4. Supuestos del Modelo Estadístico El modelo estadístico debe cumplir con los siguientes supuestos: 1. Aditividad: Los efectos del modelo son aditivos. 2. Linealidad: Las relaciones entre los efectos del modelo son lineales. 3. Normalidad: Los errores del modelo deben tener una distribución normal con media cero y variancia σ2. 4. Independencia. Los resultados obtenidos en el experimento son independientes entre sí. 5. Homogeneidad de Variancias: Las diferentes poblaciones generadas por la aplicación de los diferentes tratamientos tienen variancias iguales (σ2). Más adelante se presentarán pruebas estadísticas para evaluar los supuestos de normalidad de los errores y de homogeneidad de variancias. 2.5. Estimación de los Efectos Los efectos del modelo son estimados por el método de Mínimos Cuadrados. Este método permite obtener los valores de µ y τi que minimizan la suma de los errores al cuadrado, es decir, que minimizan la siguiente expresión: t

ri

t

ri

Q = ∑∑ ε ij2 = ∑∑ (Yij − µ − τ i ) 2 i =1 j =i

i =1 j =i

Para calcular los valores de µ y τi que minimizan la suma de los errores al cuadrado, se debe solucionar el sistema de ecuaciones obtenido al igualar las derivadas parciales de Q con respecto a µ y cada uno de los τi a cero, y la siguiente restricción adicional: t

∑rτ i =1

i i

=0

La aplicación de este método da los siguientes resultados para la estimación de los parámetros:

µˆ = Y•• τˆi = Yi• − Y•• εˆij = Yij − Yi• Ejemplo 1 (Cont.): Con los datos del ejemplo anterior, la media estimada es: Ing. Raúl Eyzaguirre Pérez [email protected]

27

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

µˆ = 10.582 Los efectos estimados de los tratamientos:

τˆ1 = Y1• − Y•• = 10.850 − 10.582 = 0.268 τˆ2 = Y2• − Y•• = 11.000 − 10.582 = 0.418 τˆ3 = Y3• − Y•• = 10.500 − 10.582 = −0.082 τˆ4 = Y4• − Y•• = 9.840 − 10.582 = −0.742 El efecto estimado del error ε42:

εˆ42 = Y42 − Y4• = 9.8 − 9.840 = −0.04 2.6. Prueba de Anderson – Darling para Normalidad La prueba de Anderson-Darling, al igual que la prueba chi-cuadrado para bondad de ajuste tratada en el capítulo I, es utilizada para probar si un conjunto de datos muestrales provienen de una población con una distribución de probabilidades específica. Aunque en esta sección se tratará solo el caso de bondad de ajuste a la distribución normal, al igual que la prueba chicuadrado esta prueba puede ser aplicada para evaluar el ajuste a cualquier distribución de probabilidades. La prueba de Anderson-Darling se basa en la comparación de la distribución de probabilidades acumulada empírica (resultado de los datos) con la distribución de probabilidades acumulada teórica (defina por H0). En un diseño completamente al azar se debe evaluar si la variable respuesta Y sigue una distribución Normal con media µ +τi y variancia σ 2 en cada uno de los tratamientos, o si los errores siguen una distribución Normal con media 0 y variancia σ 2. Hipótesis: H0: La variable sigue una distribución Normal (µ, σ2) H1: La variable no sigue una distribución Normal (µ, σ2) Estadístico de Prueba: El estadístico de prueba, A2, está dado por: A2 = − n − S S=

1 n ∑ ( 2i − 1) ln F (Yi ) + ln (1 − F (Yn+1−i ) ) n i =1

donde n es el número de observaciones, F(Y) es la distribución de probabilidades acumulada normal con media y variancia especificadas a partir de la muestra y Yi son los datos obtenidos en la muestra, ordenados de menor a mayor.

Ing. Raúl Eyzaguirre Pérez [email protected]

28

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Regla de decisión: La hipótesis nula se rechaza con un nivel de significación α sí A2 es mayor que el valor crítico A2crit. Aunque la prueba de Anderson-Darling puede ser aplicada a cualquier distribución, no se dispone de tablas para todos los casos. A continuación se presenta una tabla para la prueba a la distribución normal.

α A2crit

0.1 0.631

0.05 0.752

0.025 0.873

0.01 1.035

Ejemplo 1 (Cont.): H0: Los errores siguen una distribución Normal (0, σ2) H1: Los errores no siguen una distribución Normal (0, σ2) A continuación se presentan los residuales obtenidos con los datos del ejemplo: Compuesto Vitamínico A B C D

0.25 0.50 -0.40 -0.64

0.05 0.00 0.10 -0.04

Residuales -0.05 -0.65 -0.20 -0.40 0.70 -0.30 0.26 -0.14

0.55 0.20 -0.10 0.56

-0.15 -0.10

La media de los residuales es 0 y la desviación estándar es 0.3708. Con estos valores, el cálculo del estadístico de prueba se presenta en la siguiente tabla: i (2i-1) 1 1 2 3 3 5 4 7 5 9 6 11 7 13 8 15 9 17 10 19 11 21 12 23 13 25 14 27 15 29 16 31 17 33 18 35 19 37 20 39 21 41 22 43

Yi -0.65 -0.64 -0.40 -0.40 -0.30 -0.20 -0.15 -0.14 -0.10 -0.10 -0.05 -0.04 0.00 0.05 0.10 0.20 0.25 0.26 0.50 0.55 0.56 0.70

Ing. Raúl Eyzaguirre Pérez [email protected]

Yn+1-i 0.70 0.56 0.55 0.50 0.26 0.25 0.20 0.10 0.05 0.00 -0.04 -0.05 -0.10 -0.10 -0.14 -0.15 -0.20 -0.30 -0.40 -0.40 -0.64 -0.65

F(Yi) 0.0398 0.0422 0.1403 0.1403 0.2092 0.2948 0.3429 0.3529 0.3937 0.3937 0.4464 0.4570 0.5000 0.5536 0.6063 0.7052 0.7499 0.7584 0.9113 0.9310 0.9345 0.9705

F(Yn+1-i) 0.9705 0.9345 0.9310 0.9113 0.7584 0.7499 0.7052 0.6063 0.5536 0.5000 0.4570 0.4464 0.3937 0.3937 0.3529 0.3429 0.2948 0.2092 0.1403 0.1403 0.0422 0.0398

ln(F(Yi)) -3.224 -3.166 -1.964 -1.964 -1.564 -1.221 -1.070 -1.042 -0.932 -0.932 -0.807 -0.783 -0.693 -0.591 -0.500 -0.349 -0.288 -0.277 -0.093 -0.071 -0.068 -0.030

ln(F(Yn+1-i)) -3.523 -2.726 -2.674 -2.422 -1.421 -1.386 -1.221 -0.932 -0.807 -0.693 -0.611 -0.591 -0.500 -0.500 -0.435 -0.420 -0.349 -0.235 -0.151 -0.151 -0.043 -0.041

Si -0.307 -0.803 -1.054 -1.395 -1.221 -1.304 -1.354 -1.346 -1.344 -1.404 -1.353 -1.437 -1.356 -1.340 -1.233 -1.084 -0.956 -0.813 -0.411 -0.395 -0.206 -0.138 29

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Sumando los valores de la última columna se tiene que S = -22.253 y entonces: A2 = −22 + 22.253 = 0.2532 Este valor es menor inclusive al valor crítico correspondiente a α = 0.1. Por lo tanto se acepta el supuesto de normalidad de los errores. 2.7. Prueba de Bartlett para Homogeneidad de Variancias Esta prueba se utiliza para evaluar si existe homogeneidad de variancias entre k (2 ó más) poblaciones (en el caso de un diseño experimental, las poblaciones corresponderán a los tratamientos). Los supuestos para la aplicación de esta prueba son que las poblaciones tienen distribuciones normales e independientes, y que las muestras son tomadas al azar. Hipótesis: H0: σ 12 = σ 22 = … = σ k2 = σ 2 H1: Al menos un σ i2 es diferente. Estadístico de Prueba: El estadístico de prueba tiene una distribución Chi-Cuadrado con k-1 grados de libertad y se define de la siguiente manera: k  k  2 r − Ln s − ( 1) ( (ri − 1) Ln si2 ) ∑ p ∑ i  i =1  Q =  i =1 ∼ χ (k2 -1)   k     1 1 1 ∑  1+ − k 3(k − 1)   i =1 ri − 1  (ri − 1)  ∑  i =1  

donde k es el número de poblaciones (tratamientos), ri es el tamaño de muestra para cada población, si2 es la variancia muestral para la población i y s 2p es la variancia muestral ponderada para las k muestras. Estas dos últimas cantidades son calculadas por las siguientes fórmulas: k

ri

si2 = ∑ j =i

(Yij − Yi• ) ri − 1

2

s 2p =

∑ (r − 1)s i =i k

2 i

i

∑ (r − 1) i =i

i

Regla de decisión: La hipótesis nula se rechaza con un nivel de significación α sí Q resulta mayor que el valor de tabla χ 2[1-α, k -1].

Ing. Raúl Eyzaguirre Pérez [email protected]

30

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Ejemplo 1 (Cont.): H0: σ 12 = σ 22 = σ 32 = σ 42 H1: Al menos un σ i2 es diferente. s12 = 0.163

s22 = 0.1

s32 = 0.19

s42 = 0.203

s 2p = 0.1610

2 Q = 0.605 ∼ χ (3)

2 El valor de tabla es χ (0.95, 3gl) = 7.815. Como Q resulta menor que el valor de tabla, se acepta H0. Por lo tanto se acepta el supuesto de homogeneidad de variancias.

2.8. Análisis de Variancia En este modelo la variabilidad total se descompone en dos fuentes de variación, la explicada por los tratamientos y la explicada por el error. Por lo tanto, el modelo de descomposición de la variancia será el siguiente: Variabilidad (Total) = Variabilidad (Tratamientos) + Variabilidad (Error) La variabilidad total es cuantificada por la suma de cuadrados total, la cual se calcula de la siguiente manera: t

ri

t

ri

SC(Total) = SC(Y ) = ∑∑ (Yij − Y•• ) 2 = ∑∑ Yij2 − i =1 j =1

A la expresión

i =1 j =1

Y••2 r•

Y•2• se le conoce como el término de corrección (TC). r•

La variabilidad explicada por los tratamientos (o suma de cuadrados de los tratamientos) se calcula de la siguiente manera: Yi•2 − TC SC(Tratamientos) = ∑ i =1 ri t

Por último, la variabilidad explicada por el error puede ser calculada por la siguiente expresión: t

ri

Yi•2 i =1 ri t

SC(Error) = ∑∑ Yij2 − ∑ i =1 j =1

o por diferencia desde la relación SC(Total) = SC(Tratamientos) + SC(Error), con lo que se tiene: SC(Error) = SC(Total) - SC(Tratamientos)

Ing. Raúl Eyzaguirre Pérez [email protected]

31

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Estas dos fuentes de variación (tratamientos y error) son comparadas mediante el siguiente procedimiento de prueba de hipótesis a partir del cuadro de análisis de variancia (Cuadro ANVA): Cuadro ANVA Fuentes de Variación

Grados de Libertad (gl)

Tratamientos

t–1

Error Experimental

r• - t

Sumas de Cuadrados (SC) t Yi•2 − TC ∑ i =1 ri

r• - 1

t

∑∑ Yij2 − ∑ i =1 j =1 t

Total

Yi•2 i =1 ri

ri

t

ri

∑∑ Y i =1 j =1

2 ij

Cuadrados Medios (CM) SC(Trat) gl(Trat)

Fc CM(Trat) CM(Error)

SC(Error) gl(Error)

− TC

Hipótesis: Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los tratamientos las siguientes: H0: τi = 0 ∀ i H1: τi ≠ 0 para al menos algún i En términos de las medias de los tratamientos: H0: µi = µ ∀ i H1: µi ≠ µ para al menos algún i Para el Modelo II (Efectos aleatorios) las hipótesis serán planteadas en términos de la variancia de los tratamientos: H0: σ τ2 = 0 H1: σ τ2 > 0 En cualquiera de los casos, la hipótesis nula implica que los tratamientos no afectan a la variable respuesta, o lo que es lo mismo, que con todos los tratamientos se obtienen los mismos resultados. Valores Esperados de los Cuadrados Medios: Si un experimento en DCA, con igual número de repeticiones por tratamiento, se repitiera bajo las mismas condiciones indefinidamente, y se calculara la media de los cuadrados medios obtenidos, estas medias se aproximarían a los valores presentados en la siguiente tabla. Esto permite establecer qué parámetros se están estimando cuando se calculan los diferentes cuadrados medios y el valor Fc.

Ing. Raúl Eyzaguirre Pérez [email protected]

32

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Valor Esperado de los Cuadrados Medios Modelo I Modelo II

Grados de Libertad (GL)

Fuentes de Variación

Diseño Completamente al Azar

τ i2 i =1 t − 1 t

Tratamientos

σ 2 + r∑

t–1

Error Experimental

σ2

t(r – 1)

Total

σ 2 + rσ τ2 σ2

tr - 1

Estadístico de Prueba: Fc =

CM(Trat) ∼ F( gl(Trat ),gl(Error) ) CM(Error)

Regla de Decisión: La hipótesis nula se rechaza con un nivel de significación α si el Fc resulta mayor que el valor de tabla F(1−α , gl(Trat ),gl(Error) ) . Ejemplo 1 (Cont.): A continuación se presenta el análisis de variancia y la prueba de hipótesis correspondiente para el ejemplo tratado en esta sección: t

ri

SC(Total) = ∑∑ Yij2 − i =1 j =1

Y••2 r•

232.82 = (11.1 + 10.9 + ... + 10.4 ) − = 7.1527 22 2

2

2

Yi•2 − TC i =1 ri t

SC(Tratamientos) = ∑ =

65.12 662 52.52 49.22 232.82 + + + − = 4.2657 6 6 5 5 22

SC(Error) = SC(Total) - SC(Tratamientos) = 2.8870 Cuadro ANVA Fuentes de Variación Tratamientos Error Experimental Total

Ing. Raúl Eyzaguirre Pérez [email protected]

gl 3 18 21

SC 4.2657 2.8870 7.1527

CM 1.4219 0.1604

Fc 8.87

33

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Ganancia de Peso en lb

11.5 11.0 10.5 10.0 9.5 9.0 A

B

C

D

Tratamientos

Asumiendo un modelo de efectos fijos, las hipótesis en términos de los efectos de los tratamientos son: H0: τi = 0 i = 1, ..., 4 H1: τi ≠ 0 para al menos algún i En términos de las medias de los tratamientos: H0: µi = µ i = 1, ..., 4 H1: µi ≠ µ para al menos algún i o literalmente: H0: Todos los compuestos vitamínicos tienen el mismo efecto en la ganancia de peso de los cerdos. H1: Con al menos uno de los compuestos vitamínicos se obtiene una ganancia de peso diferente. El estadístico de prueba es Fc = 8.87. El valor de tabla para un nivel de significación del 5% es F(0.95, 3,18 ) = 3.19. Dado que el estadístico de prueba resulta mayor que el valor de tabla se rechaza H0. En conclusión, existe suficiente evidencia estadística para aceptar que con al menos uno de los compuestos vitamínicos se obtienen ganancias de peso diferentes en los cerdos. El nivel de significación usual y aceptado en investigación científica para considerar que un efecto o diferencia es significativo es 5%. Cuando la prueba resulta significativa con α = 1% se dice que el efecto o diferencia es altamente significativo.

Ing. Raúl Eyzaguirre Pérez [email protected]

34

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

2.9. Coeficiente de Variación Es una medida usada por los experimentadores para evaluar el grado de homogeneidad de los resultados de un experimento. Para saber si un determinado coeficiente de variación es demasiado grande o pequeño, es preciso tener experiencia con datos similares. En el DCA, el cuadrado medio del error (CME) es el estimador de la variancia del experimento σ 2 y el coeficiente de variación es calculado por la siguiente expresión: cv =

CME Y••

Con los datos del ejemplo, el coeficiente de variación será: cv =

0.1604 = 3.78% 10.58

Ejemplo 2: Se desarrolló un experimento para evaluar 4 tratamientos para la preparación del terreno: T1: Aplicación de herbicida T2: Quemado del campo T3: Escarificación T4: Control (sin preparación del terreno) La variable respuesta fue el tamaño de los plantones en cm a los 30 días. Los resultados del experimento se dan a continuación: Repetición 1 2 3 4

T1 25 18 29 24

Tratamiento T2 T3 15 12 22 7 17 8 17 13

T4 4 6 5 9

Este experimento fue conducido bajo los lineamientos de un DCA, por lo que el modelo aditivo lineal es el siguiente: Yij = µ + τ i + ε ij

i = 1,..., t

j = 1,...r

donde: - Yij es el tamaño de los plantones a los 30 días obtenido con el i-ésimo método de preparación del terreno y en la j-ésima repetición. - µ es el efecto de la media general de los tamaños de los plantones. - τi es el efecto del i-ésimo método de preparación del terreno. - εij es el efecto del error experimental con el i-ésimo método de preparación del terreno y en la j-ésima repetición. Ing. Raúl Eyzaguirre Pérez [email protected]

35

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

- t = 4 (Número de tratamientos) - r = 4 (Número de repeticiones por tratamiento). En este problema los resultados obtenidos en las pruebas de Anderson-Darling y de Bartlett son satisfactorios y por lo tanto se aceptan los supuestos de normalidad y homogeneidad de variancias (ver anexo al final del capítulo). El cuadro de análisis de variancia se presenta a continuación: Cuadro ANVA Fuente de Variación Tratamientos Error Total

gl 3 12 15

SC 773.2 128.8 901.9

CM 257.7 10.7

Fc 24.02

H0: µi = µ i = 1, ..., 4 H1: µi ≠ µ para al menos algún i Como F = 24.02 > F[0.95, 3, 12] =3.49, entonces se rechaza H0 y se concluye que existe suficiente evidencia estadística con un nivel de significación del 5% para aceptar que con al menos uno de los tratamientos para la preparación del terreno se obtienen resultados diferentes en el tamaño de los plantones. El coeficiente de variación en este problema es: cv =

10.73 = 22.68% 14.44

3. Pruebas de Comparación de Medias de Tratamientos Note que la conclusión obtenida tras un análisis de variancia significativo es que con al menos uno de los tratamientos se obtienen resultados diferentes. Si bien esta conclusión ya resulta valiosa, definitivamente no es suficiente. Un investigador, querrá ir más allá en el análisis y responder preguntas tales como: ¿Con qué tratamiento se obtienen los mejores resultados?, ¿es este tratamiento significativamente superior a los demás?, ¿es el tratamiento A mejor que el B?. Para responder a este tipo de preguntas será necesario realizar pruebas adicionales que permitan comparar a los distintos tratamientos, en forma individual o por grupos, unos con otros. A algunas de estas pruebas se les conoce también como pruebas de comparaciones múltiples, ya que permiten efectuar un conjunto de comparaciones. Suponga por ejemplo que usted conduce un experimento con 3 tratamientos (A, B y C). En este caso usted podría efectuar 3 comparaciones por pares (A con B, A con C y B con C). Si tiene cuatro tratamientos, el número de comparaciones por pares sería 6, con cinco tratamientos sería 10, y en general, con t tratamientos, el número de comparaciones por pares sería C 2t . Debido a que se están efectuando varias pruebas de hipótesis simultáneamente y no solo una, un problema a tener en cuenta es el de la definición del nivel de significación. Por ejemplo, suponga que usted hace un experimento con 5 tratamientos entre los cuales realmente no Ing. Raúl Eyzaguirre Pérez [email protected]

36

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

existen diferencias. En este caso la hipótesis nula de no diferencias sería verdadera para todas las comparaciones, aunque de hecho por cuestiones de azar usted obtendría resultados ligeramente diferentes en su experimento. Si usted realizara una prueba para comparar dos de estos tratamientos a un nivel de significación del 5%, y repitiera esta misma prueba con diferentes datos varias veces, encontraría diferencias significativas en aproximadamente el 5% de las veces; pero ¿qué pasa si usted decide comparar los dos tratamientos en los que se obtuvieron los resultados más similares?, ¿qué pasa si usted decide comparar los dos tratamientos en los que se obtuvieron los resultados más extremos? En el primer caso la probabilidad de encontrar diferencias significativas va a ser menor a 5% y en el segundo caso mayor. Por esta razón, algunas de las pruebas que se verán más adelante deben ser planeadas con anterioridad a la ejecución del experimento y no sugeridas por los resultados obtenidos. Por último, otro factor a considerar es el número de comparaciones que se están efectuando. En el caso descrito anteriormente, con un total de cinco tratamientos, usted efectuará 10 pruebas. Cada una de esas pruebas tendrá una probabilidad de 5% de resultar en diferencias significativas, pero ¿cuál es la probabilidad de que al menos una de las 10 comparaciones resulte significativa?. Dado que realmente no existen diferencias entre los 5 tratamientos, bastará que se encuentren diferencias significativas en una de las 10 comparaciones para cometer un error. Obviamente, la probabilidad de errar en al menos una de las 10 comparaciones será mayor al 5%. Esta característica lleva a la necesidad de definir el nivel de significación en dos formas. Al total de comparaciones por pares que se puedan plantear entre todos los tratamientos considerados en un experimento se le llamará una “familia de comparaciones”, y entonces al nivel de significación para una comparación se le llamará “error individual” y al nivel de significación para el total de comparaciones (probabilidad de encontrar diferencias significativas en al menos una de las comparaciones) “error por familia”. Las pruebas en las que el nivel de significación sea individual servirán para efectuar comparaciones individuales planeadas con anterioridad; las pruebas en las que el nivel de significación sea por familia servirán para efectuar todas las comparaciones posibles (comparaciones múltiples). 3.1. Prueba t Es una prueba para comparaciones planeadas con anterioridad. El nivel de significación se toma como un error individual. Los supuestos para la realización de esta prueba son: -

Prueba F del análisis de variancia significativa. Variancias homogéneas. Las muestras son extraídas al azar.

Hipótesis: Caso A:

Caso B:

Caso C:

H0: µi - µj = k H1: µi - µj > k

H0: µi - µj = k H1: µi - µj < k

H0: µi - µj = k H1: µi - µj ≠ k

Ing. Raúl Eyzaguirre Pérez [email protected]

37

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Estadístico de Prueba: tc =

(Yi• − Y j • ) − k sd

∼ t(gl(Error))

1 1 donde sd = CME  +  es la desviación estándar de la diferencia de las medias r r  j   i muestrales de los dos tratamientos. Si todos los tratamientos tienen el mismo número de repeticiones, el estadístico de prueba se simplifica a: tc =

(Yi• − Y j • ) − k 2CME r

Regla de Decisión: Caso A: La hipótesis nula se rechaza con un nivel de significación α si el tc es mayor que el valor de tabla t(1-α, gl(Error)). Caso B: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el valor de tabla t(α, gl(Error)). Caso C: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el valor de tabla t(α/2, gl(Error)) o mayor que el valor de tabla t(1-α/2, gl(Error)). Ejemplo 1 (Cont.): Uno de los objetivos del experimento era evaluar si el aumento de peso logrado con el compuesto vitamínico B superaba al logrado con D en más de una libra. El procedimiento para esta prueba será el siguiente: H0: µB - µD = 1 H1: µB - µD > 1 tc =

(YB − YD ) − k 1 1 CME  +   rB rD 

=

(11 − 9.84) − 1 1 1 0.1604  +  6 5

= 0.6598

El valor de tabla para un nivel de significación de 5% es t(0.95, 18) = 1.734. Como el valor calculado es menor al valor de tabla no se rechaza H0. En conclusión, no existe suficiente evidencia estadística para aceptar que el aumento de peso logrado con el compuesto vitamínico B supere al logrado con D en más de una libra. 3.2. Prueba DLS La prueba DLS es una forma abreviada de la prueba t para el caso bilateral (Caso C). La prueba consiste en calcular una diferencia límite significativa (DLS) de modo que cualquier diferencia entre las medias de dos tratamientos mayor a dicho límite sea significativa. Los Ing. Raúl Eyzaguirre Pérez [email protected]

38

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

supuestos para esta prueba son los mismos que para la prueba t y por supuesto, también debe ser planeada con anterioridad. Hipótesis: H0: µi = µj H1: µi ≠ µj Diferencia Límite Significativa: DLS = t(1-α/2, gl(Error)) sd 1 1 donde sd = CME  +  es la desviación estándar de la diferencia de las medias r r  j   i muestrales de los dos tratamientos. Regla de Decisión: La hipótesis nula se rechaza con un nivel de significación α si Yi• − Y j • > DLS. Ejemplo 1 (Cont.): Aplique la prueba DLS para comparar los tratamientos A y B. H0: µA = µB H1: µA ≠ µB DLS = t(0.975, 18)

1 1 CME  +  rA rB

  = 2.101 

1 1 0.1604 +  = 0.4858 6 6

Y A − YB = 10.85 − 11 = 0.15 Como Y A − YB es menor al DLS no se rechaza H0. En conclusión, no existe suficiente evidencia estadística para aceptar que la ganancia de peso obtenida con el compuesto vitamínico A sea diferente a la obtenida con el compuesto vitamínico B. 3.3. Prueba de Contrastes Ortogonales La prueba t vista anteriormente permite comparar dos tratamientos; la prueba de contrastes es el caso general, ya que permite comparar más de dos tratamientos. Específicamente, el interés del investigador estará en comparar combinaciones lineales de las medias de los tratamientos. Tanto la prueba t como la DLS vienen a ser casos particulares de esta prueba. Los supuestos para esta prueba son los mismos que para la prueba t o DLS y cada combinación lineal de las medias de los tratamientos que sea evaluada también debe ser planeada con anterioridad. Una comparación o contraste, al que se denotará por L, es una combinación lineal de la forma:

Ing. Raúl Eyzaguirre Pérez [email protected]

39

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

t

t

i =1

i =1

L = ∑ ciYi• = ∑ ri ci µi en donde: t

∑ rc i =1

=0

i i

Si todos los tratamientos tienen el mismo número de repeticiones, entonces la condición anterior se reduce a: t

∑c i =1

i

=0

y el contraste puede plantearse como: t

L = ∑ ci µi i =1

Por ejemplo, para comparar los tratamientos 1 y 2 en un experimento con igual número de repeticiones por tratamiento, podría plantearse el siguiente contraste: L = µ1 − µ 2 Este es un contraste ya que el coeficiente de µ1 es 1 y el de µ2 es –1, con lo que la suma de los coeficientes da cero. Como este contraste involucra solo dos tratamientos puede ser evaluado con una prueba t o DLS (de hecho note que este contraste fue evaluado en el ejemplo anterior). Un contraste que involucre 4 tratamientos, en un experimento con igual número de repeticiones por tratamiento, podría ser el siguiente: L = µ1 + µ2 + µ3 - 3µ4 Cada contraste tiene un grado de libertad, por lo que en un experimento con t tratamientos podrán efectuarse t – 1 contrastes ortogonales (ya que se tienen t – 1 grados de libertad para los tratamientos). Dos contrastes, L1 = ∑ ri c1i µi y L2 = ∑ ri c2i µi son ortogonales si cumplen con la siguiente condición: t

∑ rc c i =1

i 1i 2 i

=0

Si todos los tratamientos tienen el mismo número de repeticiones, la condición anterior se reduce a: t

∑c c i =1

Ing. Raúl Eyzaguirre Pérez [email protected]

1i 2 i

=0

40

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Ejemplo: Suponga que se tienen 4 tratamientos (A, B, C y D) con igual número de repeticiones. Un conjunto de contrastes ortogonales podría ser el siguiente: L1 = µA + µB + µC - 3µD L2 = µA + µB - 2µC L3 = µA - µB Un contraste puede ser evaluado en una prueba de hipótesis usando la distribución t. Un conjunto de contrastes ortogonales pueden ser evaluados simultáneamente en una prueba de hipótesis usando la distribución F. En esta sección se verá solo el primer caso. Hipótesis: Caso A:

Caso B:

Caso C:

H0: L = L0 H1: L > L0

H0: L = L0 H1: L < L0

H0: L = L0 H1: L ≠ L0

Estadístico de Prueba: tc =

Lˆ − L0 ∼ t(gl(Error)) s Lˆ

t

t

i =1

i =1

donde Lˆ = ∑ ci rY CME ∑ ri ci2 es la desviación estándar i i • es el contraste estimado y sLˆ = del contraste estimado. Si todos los tratamientos tienen el mismo número de repeticiones, el t

contraste estimado se puede definir por Lˆ = ∑ ciYi•

y su desviación estándar será

i =1

ci2 sLˆ = CME ∑ . i =1 r t

Regla de Decisión: Caso A: La hipótesis nula se rechaza con un nivel de significación α si el tc es mayor que el valor de tabla t(1-α, gl(Error)). Caso B: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el valor de tabla t(α, gl(Error)). Caso C: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el valor de tabla t(α/2, gl(Error)) o mayor que el valor de tabla t(1-α/2, gl(Error)). Ejemplo 2 (Cont.): En el ejemplo de preparación del terreno, evalúe si el tamaño medio de los plantones obtenido en terreno preparado (Tratamientos T1, T2 y T3) es superior en más de 5 cm al obtenido en terreno sin preparación (Tratamiento T4). El contraste a evaluar en este caso es L = µ1 + µ2 + µ3 - 3µ4, y se quiere probar si: Ing. Raúl Eyzaguirre Pérez [email protected]

41

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

µ1 + µ 2 + µ3 − µ4 > 5 3 es decir, si L es mayor a 15. Luego, las hipótesis serán: H0: L = 15 H1: L > 15 El cálculo del estadístico de prueba es el siguiente: Lˆ = Y1 + Y2 + Y3 − 3Y4 = 33.75  (1) 2 (1) 2 (1) 2 (−3) 2  sLˆ = CME  + + +  = 5.674 4 4 4   4 tc =

Lˆ − L0 33.75 − 15 = = 3.305 5.674 sLˆ

El valor de tabla para un nivel de significación de 5% es t(0.95, 12) = 1.782. Como el valor calculado es mayor al valor de tabla se rechaza H0 y se concluye que existe suficiente evidencia estadística para aceptar que el tamaño medio de los plantones obtenido en terreno preparado es superior en más de 5 cm al obtenido en terreno sin preparación. 3.4. Prueba de Tukey La prueba de Tukey permite evaluar la significancia de todas las diferencias entre tratamientos. Las hipótesis correspondientes a todas las comparaciones constituyen una familia y por lo tanto el error es familiar. Los supuestos para la realización de esta prueba son: -

Variancias homogéneas. Las muestras son extraídas al azar.

Hipótesis: H0: µi = µj H1: µi ≠ µj

∀i≠j

Amplitud Límite Significativa de Tukey: ALS(T) = AES(T) sd donde: -

AES(T) es la amplitud estudiantizada significativa de Tukey, obtenida desde la tabla de Tukey con α = nivel de significación, p = número de tratamientos del experimento y los grados de libertad del error experimental.

Ing. Raúl Eyzaguirre Pérez [email protected]

42

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

-

Diseño Completamente al Azar

CME es la desviación estándar de la diferencia de las medias muestrales de dos r tratamientos para la prueba de Tukey cuando los tratamientos tienen el mismo número de repeticiones. sd =

Si los tratamientos no están igualmente repetidos, entonces la desviación estándar puede calcularse por: sd =

CME  1 1   +  2  ri rj 

Sin embargo, esta aproximación hace que la prueba sea ligeramente conservadora (esto es, disminuye la probabilidad de detectar diferencias significativas) ya que el nivel de significación real es ligeramente menor que el establecido en la prueba. Regla de Decisión: La hipótesis nula se rechaza con un nivel de significación α si Yi• − Y j • > ALS(T). Ejemplo 1 (Cont.): Aplique la prueba de Tukey para evaluar la significancia de las diferencias entre los tratamientos. En este caso se están evaluando un conjunto de hipótesis: H0: µA = µB H1: µA ≠ µB

H0: µA = µC H1: µA ≠ µC

H0: µA = µD H1: µA ≠ µD

H0: µB = µC H1: µB ≠ µC

H0: µB = µD H1: µB ≠ µD

H0: µC = µD H1: µC ≠ µD

El valor de tabla con α = 5%, p = 4 tratamientos y 18 grados de libertad para el error experimental es AES(T) = 4.00. Dado que los tratamientos tienen diferentes números de repeticiones, la desviación estándar para la diferencia de dos medias será diferente dependiendo de los tratamientos que se estén comparando. En el siguiente cuadro se resumen los cálculos necesarios para efectuar las 6 comparaciones: Tratamientos Número de comparados repeticiones AyB AyC AyD ByC ByD CyD

6y6 6y5 6y5 6y5 6y5 5y5

Ing. Raúl Eyzaguirre Pérez [email protected]

CME  1 1   +  2  ri rj  0.1675 0.1715 0.1715 0.1715 0.1715 0.1791

ALS(T)

Yi• − Y j •

Significancia

0.6540 0.6859 0.6859 0.6859 0.6859 0.7164

0.15 0.35 1.01 0.50 1.16 0.66

n.s. n.s. * n.s. * n.s

43

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

“n.s.” significa que la diferencia entre ambos tratamientos no es significativa (es decir, que no existe evidencia suficiente para rechazar H0). “*” significa que la diferencia entre ambos tratamientos sí es significativa. Es usual utilizar el símbolo “*” para denotar diferencias o efectos significativos con α = 5% y “**” para denotar diferencias o efectos significativos con α = 1%. En el primer caso se dice que la diferencia o efecto es “significativo” y en el segundo que es “altamente significativo”. Esta simbología es muy útil para presentar los resultados de pruebas múltiples en las que se evalúan un gran número de hipótesis. Otra representación resumida y bastante útil es la del diagrama de líneas. El método consiste en ordenar las medias de los tratamientos en forma ascendente o descendente y unir con una línea todos los tratamientos que no presentan diferencias significativas. En el ejemplo, el diagrama de líneas sería el siguiente: D 9.84

C 10.50

A 10.85

B 11.00

3.5. Prueba de Dunnett La prueba de Dunnett es utilizada cuando se quiere comparar a cada uno de los tratamientos contra el tratamiento testigo o control. En esta prueba, el error también es familiar. Los supuestos para la realización de esta prueba son: -

Variancias homogéneas. Las muestras son extraídas al azar.

Hipótesis: H0: µT = µi H1: µT ≠ µi

∀ i ≠ T (tratamiento testigo)

Amplitud Límite Significativa de Dunnett: ALS(Dn) = t(Dn) sd donde: -

-

t(Dn) es el valor de tabla para la prueba, obtenido desde la tabla de Dunnett con α = nivel de significación, p = número de tratamientos del experimento sin incluir el control y los grados de libertad del error experimental. 2CME es la desviación estándar de la diferencia de las medias muestrales del r tratamiento testigo y el tratamiento i para la prueba de Dunnett cuando los tratamientos tienen el mismo número de repeticiones. sd =

Si los tratamientos no están igualmente repetidos, entonces la desviación estándar puede calcularse por:

Ing. Raúl Eyzaguirre Pérez [email protected]

44

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

 1 1 sd = CME  +   rT ri  Regla de Decisión: La hipótesis nula se rechaza con un nivel de significación α si YT • − Yi • > ALS(Dn). Ejemplo 1 (Cont.): Aplique la prueba de Dunnett para evaluar la significancia de las diferencias de los tratamientos con el tratamiento testigo. H0: µD = µA H1: µD ≠ µA

H0: µD = µB H1: µD ≠ µB

H0: µD = µC H1: µD ≠ µC

El valor de tabla con α = 5%, p = 3 tratamientos sin considerar el control y 18 grados de libertad para el error experimental es t(Dn) = 2.56. Dado que los tratamientos tienen diferente número de repeticiones, la desviación estándar para la diferencia de dos medias será diferente dependiendo de los tratamientos que se estén comparando. En el siguiente cuadro se resumen los cálculos necesarios para efectuar las 3 comparaciones: Tratamientos comparados

Número de repeticiones

DyA DyB DyC

5y6 5y6 5y5

 1 1 CME  +   rT ri  0.2425 0.2425 0.2533

ALS(Dn)

YT • − Yi•

Significancia

0.6208 0.6208 0.6484

1.01 1.16 0.66

* * *

En este caso, en los tres tratamientos (A, B y C) se obtienen diferencias significativas con respecto al tratamiento testigo.

4. Prueba de Kruskal Wallis La prueba de Kruskal Wallis es la alternativa no paramétrica para el diseño completamente al azar. Para la aplicación de una prueba paramétrica, se requiere del cumplimiento de ciertos supuestos sobre los parámetros de las poblaciones desde las cuales se obtienen los datos, como por ejemplo la normalidad de los errores. En una prueba no paramétrica en cambio, no son necesarios estos supuestos. 4.1. Datos Los datos consisten de k muestras independientes (correspondientes a los k tratamientos) de tamaños ni (i = 1, ... k). Sea N que denota el total de observaciones: k

N = ∑ ni i =1

Ing. Raúl Eyzaguirre Pérez [email protected]

45

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Asigne el rango 1 a la observación más pequeña, 2 a la segunda y así sucesivamente hasta la más grande de las N observaciones, la cual recibirá el rango N. En caso de empates utilice la media de los rangos correspondientes. Sea R(Xij) el rango asignado a la observación Xij y sea Ri la suma de los rangos asignados a la muestra i: ni

Ri = ∑ R( X ij ) i =1

Calcule Ri para cada muestra. 4.2. Supuestos 1. Las k muestras son seleccionadas aleatoriamente desde sus respectivas poblaciones, lo cual implica independencia entre los datos dentro de cada muestra. 2. Las muestras son independientes. 3. La escala de medida es al menos ordinal. 4. Las k poblaciones tienen distribuciones de probabilidad idénticas a no ser que algunas tiendan a generar valores mayores o menores que las otras. 4.3. Procedimiento de Prueba Hipótesis: H0: Las k muestras provienen de poblaciones idénticas. H1: Las k muestras no provienen de poblaciones idénticas. Debido a que esta prueba está diseñada para encontrar diferencias entre las medias de las poblaciones, las hipótesis algunas veces (cuando la variable sea cuantitativa) pueden definirse como sigue: H0: Las k poblaciones tienen la misma media. H1: Las k poblaciones no tienen la misma media. Estadístico de Prueba: T=

1  k Ri2 N ( N + 1) 2  − ∑  S 2  i =1 ni 4 

donde: S2 =

1  N ( N + 1) 2  2 R ( X ) − ∑  ij N − 1  ij 4 

Si no hay empates, S 2 se simplifica a: S2 = Ing. Raúl Eyzaguirre Pérez [email protected]

N ( N + 1) 12 46

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

y el estadístico de prueba se reduce a: k Ri2 12 T= ∑ − 3( N + 1) N ( N + 1) i =1 ni

Si el número de empates es moderado, la diferencia entre ambas expresiones de T será pequeña. Regla de Decisión: La hipótesis nula se rechaza con un nivel de significación α si T resulta mayor que el valor de tabla χ2(1-α, k-1). Ejemplo 3: Para evaluar el efecto de la expectativa sobre la percepción de la calidad en vinos, un investigador asignó aleatoriamente 24 bebedores aficionados a tres grupos A, B y C, de 8 individuos cada uno. Cada individuo fue citado para una entrevista individual. Desafortunadamente, uno de los individuos del grupo B y dos del grupo C no se presentaron por lo que el investigador tuvo que trabajar con muestras de distinto tamaño. A los individuos que sí se presentaron se les pidió que prueben una copa de vino y que la evalúen en una escala de 10 puntos donde 1 era el calificativo menor y 10 el mayor. En realidad, los tres grupos probaron el mismo vino; la única diferencia está en la presentación de la muestra, la cual es diseñada para inducir a una alta expectativa sobre la calidad del vino en los miembros del grupo A, una baja expectativa en los miembros del grupo C y una expectativa neutral en los del grupo B. La siguiente tabla muestra los calificativos asignados por los 21 individuos: Grupo A Grupo B Grupo C

6 4 3

7 5 4

7 5 5

8 6 5

8 8 8

9 8 6

9 7

9

9

Calificativo

8 7 6 5 4 3 A

B

C

Grupo

H0: La presentación del vino no influye en la percepción de su calidad. H1: La presentación del vino sí influye en la percepción de su calidad. Ing. Raúl Eyzaguirre Pérez [email protected]

47

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

La asignación de los rangos a las observaciones, de menor a mayor (desde 1 a 21), se presenta en el siguiente cuadro: Grupo A Grupo B Grupo C

9 2.5 1

12 5.5 2.5

12 5.5 5.5

16 9 5.5

16 16 16

20 16 9

20 12

20

R1 = 125 R2 = 66.5 R3 = 39.5

Note que en este caso hay varios empates por lo que los cálculos serán los siguientes:

∑ R( X

ij

) 2 = 92 + 122 + … + 92 = 3289.5

ij

S2 =

T=

1  ( N + 1) 2  1  21(21 + 1) 2  2 R ( X ) N 3289.5 = − − ∑    = 37.425 ij N − 1  ij 4  21 − 1  4 

1  k Ri2 N ( N + 1) 2  1  1252 66.52 39.52 21(21 + 1) 2  = + + − − ∑    = 8.12 4 7 6 4 S 2  i =1 ni   37.425  8

De haber pocos empates, el cálculo se simplificaría a: S2 = T=

N ( N + 1) 21(21 + 1) 2 = = 38.5 12 12

k  1252 66.52 39.52  Ri2 12 12 − 3( N + 1) = + + ∑   − 3(21 + 1) = 7.89 N ( N + 1) i =1 ni 21(21 + 1)  8 7 6 

El valor de tabla para un nivel de significación del 5% es χ2(0.95, 2) = 5.991. Como el estadístico de prueba resulta mayor que el valor de tabla se rechaza H0 y se concluye que existe suficiente evidencia estadística para aceptar que la presentación del vino influye en la percepción sobre su calidad. 4.4. Comparaciones Múltiples Si la hipótesis nula es rechazada, la prueba de Kruskal Wallis presenta un procedimiento para comparar a los tratamientos por pares. Se dirá que los tratamientos i y j difieren significativamente si satisfacen la siguiente desigualdad: Ri R j  N −1− T − > t(1−α / 2, N − k )  S 2 ni n j N −k 

 1 1    +    ni n j 

Ejemplo 3 (Cont.): Con los datos del ejemplo se tiene: t(1−α / 2, N − k ) = t(0.975,18) = 2.101

Ing. Raúl Eyzaguirre Pérez [email protected]

48

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Tratamientos Número de comparados repeticiones AyB AyC ByC

8y7 8y6 7y6

Ri R j − ni n j 6.13 9.04 2.92

Diseño Completamente al Azar

 N −1− T t(1−α / 2, N − k )  S 2 N −k  5.40 5.64 5.81

 1 1    +    ni n j 

Sig. * * ns

Las diferencias encontradas entre los grupos A y B así como las encontradas entre A y C resultan significativas, no así la diferencia entre los grupos B y C.

Ing. Raúl Eyzaguirre Pérez [email protected]

49

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Anexo: Salida de Minitab Ejemplo 1 Normal Probability Plot

.999 .99

Probability

.95 .80 .50 .20 .05 .01 .001 -0.5

0.0

0.5

RESI1

Average: 0 StDev: 0.370778 N: 22

Anderson-Darling Normality Test A-Squared: 0.253 P-Value: 0.701

Test for Equal Variances Response Factors ConfLvl

Y Trat 95.0000

Bartlett's Test (normal distribution) Test Statistic: 0.605 P-Value : 0.895

One-way ANOVA: Resp versus Trat Analysis of Variance for Resp Source DF SS MS Trat 3 4.266 1.422 Error 18 2.887 0.160 Total 21 7.153

Level A B C D

N 6 6 5 5

Pooled StDev =

Mean 10.850 11.000 10.500 9.840 0.400

Ing. Raúl Eyzaguirre Pérez [email protected]

StDev 0.404 0.316 0.436 0.451

F 8.87

P 0.001

Individual 95% CIs For Mean Based on Pooled StDev ---+---------+---------+---------+--(-----*-----) (----*-----) (-----*-----) (-----*-----) ---+---------+---------+---------+--9.60 10.20 10.80 11.40

50

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Dunnett's comparisons with a control Family error rate = 0.0500 Individual error rate = 0.0199 Critical value = 2.56 Control = level (D) of Trat Intervals for treatment mean minus control mean Level A B C

Lower 0.3902 0.5402 0.0127

Center 1.0100 1.1600 0.6600

Upper ----------+---------+---------+------1.6298 (-----------*------------) 1.7798 (-----------*------------) 1.3073 (------------*------------) ----------+---------+---------+------0.50 1.00 1.50

Tukey's pairwise comparisons Family error rate = 0.0500 Individual error rate = 0.0111 Critical value = 4.00 Intervals for (column level mean) - (row level mean) A

B

C

B

-0.8040 0.5040

C

-0.3359 1.0359

-0.1859 1.1859

D

0.3241 1.6959

0.4741 1.8459

-0.0564 1.3764

Fisher's pairwise comparisons Family error rate = 0.190 Individual error rate = 0.0500 Critical value = 2.101 Intervals for (column level mean) - (row level mean) A

B

B

-0.6358 0.3358

C

-0.1595 0.8595

-0.0095 1.0095

D

0.5005 1.5195

0.6505 1.6695

Ing. Raúl Eyzaguirre Pérez [email protected]

C

0.1278 1.1922

51

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Ejemplo 2 Normal Probability Plot

.999 .99

Probability

.95 .80 .50 .20 .05 .01 .001 -5

0

5

RESI1

Average: 0 StDev: 2.92973 N: 16

Anderson-Darling Normality Test A-Squared: 0.211 P-Value: 0.827

Test for Equal Variances Response Factors ConfLvl

Y T 95.0000

Bartlett's Test (normal distribution) Test Statistic: 1.516 P-Value : 0.679

One-way ANOVA: Y versus T Analysis of Variance for Y Source DF SS T 3 773.2 Error 12 128.8 Total 15 901.9

Level 1 2 3 4

N 4 4 4 4

Pooled StDev =

Mean 24.000 17.750 10.000 6.000 3.276

Ing. Raúl Eyzaguirre Pérez [email protected]

MS 257.7 10.7

StDev 4.546 2.986 2.944 2.160

F 24.02

P 0.000

Individual 95% CIs For Mean Based on Pooled StDev -------+---------+---------+--------(----*----) (----*----) (----*----) (-----*----) -------+---------+---------+--------7.0 14.0 21.0

52

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Dunnett's comparisons with a control Family error rate = 0.0500 Individual error rate = 0.0199 Critical value = 2.68 Control = level (4) of T Intervals for treatment mean minus control mean Level 1 2 3

Lower 11.786 5.536 -2.214

Center 18.000 11.750 4.000

Upper ----+---------+---------+---------+--24.214 (--------*--------) 17.964 (--------*--------) 10.214 (--------*--------) ----+---------+---------+---------+--0.0 7.0 14.0 21.0

Tukey's pairwise comparisons Family error rate = 0.0500 Individual error rate = 0.0117 Critical value = 4.20 Intervals for (column level mean) - (row level mean) 1

2

3

2

-0.629 13.129

3

7.121 20.879

0.871 14.629

4

11.121 24.879

4.871 18.629

-2.879 10.879

Fisher's pairwise comparisons Family error rate = 0.184 Individual error rate = 0.0500 Critical value = 2.179 Intervals for (column level mean) - (row level mean) 1

2

2

1.203 11.297

3

8.953 19.047

2.703 12.797

4

12.953 23.047

6.703 16.797

Ing. Raúl Eyzaguirre Pérez [email protected]

3

-1.047 9.047

53

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Ejemplo 3 Kruskal-Wallis Test Kruskal-Wallis Test on Resp Grupo A B C Overall H = 7.89 H = 8.12

N 8 7 6 21 DF = 2 DF = 2

Median 8.000 6.000 5.000

Ave Rank 15.6 9.5 6.6 11.0

Z 2.68 -0.78 -2.06

P = 0.019 P = 0.017 (adjusted for ties)

Ing. Raúl Eyzaguirre Pérez [email protected]

54

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

Ejercicios 1. Los datos que se presentan a continuación corresponden al tiempo de coagulación (en segundos) de sangre extraída a 24 animales, asignados aleatoriamente a cuatro dietas diferentes. Dieta A 62 60 63 59

B 63 67 71 64 65

C 68 66 71 67 68

D 56 62 60 61 63 64

a) Presente el modelo aditivo lineal. Interprete cada uno de sus componentes en términos del problema. b) Estime los efectos de los tratamientos. c) Calcule los residuales obtenidos con la dieta B (error experimental). d) Efectúe la prueba de Anderson – Darling para normalidad. e) Efectúe la prueba de Bartlett para homogeneidad de variancias. f) Realice el análisis de variancia. Calcule el coeficiente de variación. g) Realice la prueba de Tukey. Concluya mediante el diagrama de líneas. 2. En una estación experimental se estudiaron cuatro dosis de insecticidas (3 l/ha, 5 l/ha, 7 l/ha. y 9 l/ha.) para el control de la Racha en papa. Los resultados se presentan a continuación en TM de rendimiento de papa por ha: 3 l/ha 4.29 4.24 4.53 4.26 4.62

Dosis de insecticida 5 l/ha 7 l/ha 8.50 10.75 8.03 11.52 7.94 11.49 6.75 11.52 7.16 10.81

9 l/ha 5.63 5.96 5.47 6.01 6.09

a) Presente el modelo aditivo lineal e interprete cada uno se sus componentes en términos del problema. b) Estime los efectos de los tratamientos. c) Efectúe la prueba de Anderson – Darling para normalidad. d) Efectúe la prueba de Bartlett para homogeneidad de variancias. e) Realice el análisis de variancia. Calcule el coeficiente de variación. f) Realice la prueba de Tukey. Concluya mediante el diagrama de líneas.

Ing. Raúl Eyzaguirre Pérez [email protected]

55

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

g) Antes de realizar el experimento, el experimentador sostenía que con la dosis 2 (5 l/ha) se podía obtener un rendimiento medio superior en más de 2 Tm/ha al de la dosis 1 (3 l/ha). A que conclusión puede llegar con la información del experimento. 3. Se realizó un estudio para evaluar el efecto de tres fármacos en la duración de la relajación muscular inducida. En el experimento 24 pacientes fueron aleatoriamente asignados a los cuatro grupos, cinco pacientes a los dos primeros grupos y 7 a los dos últimos. Un grupo no recibió fármaco alguno, uno recibió Innovar, uno Droperidol y uno Fentayl antes de la aplicación de anestesia. Para cada paciente la duración de la relajación muscular fue registrada en minutos. Los resultados del experimento son dados a continuación: Fármaco Innovar Droperidol 16.1 10.3 11.2 6.8 9.0 5.3 8.8 3.2 10.2 6.5 7.0 7.5

Sin droga 5.9 8.0 11.5 6.0 9.2

Fentayl 7.2 10.5 8.5 4.2 6.5 6.6 9.1

a) Presente el modelo aditivo lineal. Interprete cada uno de sus componentes en términos del problema. b) Estime los efectos de los tratamientos. c) Calcule los residuales obtenidos con la droga Innovar. d) Efectúe la prueba de Anderson – Darling para normalidad. e) Efectúe la prueba de Bartlett para homogeneidad de variancias. f) Realice el análisis de variancia. Calcule el coeficiente de variación. g) Realice la prueba de Tukey. Concluya mediante el diagrama de líneas. h) Realice la prueba de Dunnett. ¿Qué fármaco recomendaría usted? i) Uno de los objetivos del experimento era comparar los fármacos Droperidol y Fentayl, razón por la cual se asignaron 7 repeticiones a cada uno. ¿Existe suficiente evidencia estadística para aceptar que Fentayl es mejor que Droperidol? 4. Se desea comparar los resultados obtenidos en el examen parcial de Métodos Estadísticos para la Investigación I por las clases de 4 profesores. A continuación se presentan los resultados de una muestra aleatoria de 8 alumnos de cada clase. Profesor A B C D

10 16 9 13

16 14 6 13

Nota en el examen parcial 17 13 14 17 13 7 9 13 10 8 14 11 12 16 8 11

18 11 12 7

12 14 8 12

a) ¿Presentan los datos suficiente evidencia estadística para aceptar que las notas en el examen parcial son diferentes entre los grupos? Ing. Raúl Eyzaguirre Pérez [email protected]

56

Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I

Diseño Completamente al Azar

b) Realice la prueba de comparación por pares. 5. Cuatro programas de entrenamiento para cierto trabajo fueron probados con 20 empleados nuevos. Los 20 empleados fueron asignados al mismo supervisor y, al final del periodo de entrenamiento, el supervisor calificó a los empleados de acuerdo a su habilidad para el trabajo, asignando los rangos más bajos a aquellos empleados con la menor habilidad. Programa A B C D

4 1 20 18

6 8 19 15

Rangos 7 12 19 17

2 3 14 13

10 11 5 9

¿Indican estos datos diferencias en la efectividad de los programas de entrenamiento? Si la respuesta es afirmativa, ¿cuáles son diferentes?

Ing. Raúl Eyzaguirre Pérez [email protected]

57

capIII.pdf

Short Description

Description

Comments

We need your help!