Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
Capítulo IV Diseño de Bloques Completos al Azar Algunos usan las estadísticas como el ebrio usa los faroles: para apoyo más que para iluminación. - Andrew Lang
1. Introducción El Diseño Completamente al Azar (DCA) es aplicable en casos en los que la única fuente de variabilidad son los tratamientos. En casos en los que se pueda identificar de antemano otras fuentes de variación, que no constituyen el objetivo de la investigación, estas deberán ser controladas por el experimentador. Esto puede ocurrir por ejemplo en experimentos en el terreno, en donde se sabe que parcelas adyacentes suelen presentar resultados más homogéneos entre sí que parcelas más separadas, o en experimentos en donde los datos se toman por días, y en donde se sabe que los resultados pueden diferir entre los distintos días. Estas fuentes de variación son controladas mediante la formación de bloques; la idea es agrupar a las observaciones en los distintos bloques de modo que sean lo más homogéneas dentro del bloque y heterogéneas entre bloques. Al diseño que controla una fuente de variación adicional a los tratamientos se le conoce como el Diseño de Bloques. En este capítulo se verá el Diseño de Bloques Completos al Azar (DBCA), en el caso paramétrico y no paramétrico, y sus respectivas pruebas de comparación de medias. Los bloques son completos porque todos los tratamientos aparecen en igual número, usualmente una vez, dentro de cada bloque, y son al azar por que los tratamientos son asignados aleatoriamente dentro de cada bloque. A este diseño se le conoce también como diseño de clasificación de dos vías sin interacción (Two Way). Los diseños de bloques pueden también ser incompletos balanceados. En este caso, los bloques son incompletos porque no todos los tratamientos aparecen dentro de cada bloque, y balanceados porque el número de tratamientos dentro de cada bloque es el mismo y cada tratamiento se repite el mismo número de veces dentro del experimento.
Ing. Raúl Eyzaguirre Pérez
[email protected]
58
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
2. Diseño de Bloques Completos al Azar (DBCA Clásico o Paramétrico) 2.1. Ventajas y Desventajas del DBCA Ventajas: -
El agrupamiento de las unidades experimentales en bloques, debido a la existencia real de esta fuente de variabilidad, aumenta la precisión del experimento con relación al DCA. No existen restricciones en cuanto al número de tratamientos o bloques. El análisis estadístico es simple. Si se pierden los datos de un bloque completo, estos pueden omitirse sin mayores complicaciones para el análisis. Si faltan datos de unidades experimentales, estos pueden estimarse.
Desventajas: -
-
Cuando la variabilidad entre las unidades experimentales dentro de los bloques es grande, resulta un error experimental considerable. Esto ocurre usualmente cuando el número de tratamientos es muy grande. Si existe interacción entre los bloques y los tratamientos, ésta va incluida en el error experimental. Si no existe una real diferencia entre los bloques, habrá una pérdida de precisión en el experimento con relación al DCA, debido a la disminución de los grados de libertad del error.
2.2. Aleatorización y Croquis Experimental En este diseño los tratamientos son asignados en forma aleatoria dentro de cada bloque. Por ejemplo, suponga que va a evaluar 4 tratamientos con 3 repeticiones cada uno, en donde cada repetición constituye un bloque; en este caso necesitará de 12 unidades experimentales. Para asignar los tratamientos en forma aleatoria dentro de un bloque, genere 4 números al azar y luego ordénelos del 1 al 4. A continuación se presenta un resultado obtenido utilizando la función ALEATORIO() de Excel: .565 3
.585 4
.077 1
.243 2
Con esta secuencia, en el primer bloque el primer tratamiento es asignado a la unidad experimental 3, el segundo a la u.e. 4, el tercero a la u.e. 1 y el cuarto a la u.e. 2. A continuación se presenta la aleatorización para los dos bloques restantes:
Ing. Raúl Eyzaguirre Pérez
[email protected]
.970 4
.788 3
.200 1
.730 2
.977 4
.359 2
.755 3
.061 1 59
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
El croquis para este experimento podría ser el siguiente: Bloque 1 Bloque 2 Bloque 3
T3 T4 T4
T4 T3 T2
T1 T1 T3
T2 T2 T1
2.3. Modelo Aditivo Lineal El modelo aditivo lineal para un diseño de bloques completos al azar es el siguiente: Yij = µ + τ i + β j + ε ij
i = 1,..., t
j = 1,..., b
donde: Yij es el valor o rendimiento observado en el i-ésimo tratamiento, j-ésimo bloque. µ es el efecto de la media general. τi es el efecto del i-ésimo tratamiento. βj es el efecto del j-ésimo bloque. εij es el efecto del error experimental en el i-ésimo tratamiento, j-ésimo bloque. t es el número de tratamientos b es el número de bloques. Ejemplo 1: Tres diferentes soluciones están siendo estudiadas para evaluar su efectividad en el retardo del crecimiento de bacterias en contenedores de leche de 5 galones. Los análisis son hechos en un laboratorio y solo tres ensayos pueden efectuarse en un día dado. Debido a que los días pueden ser una fuente de variabilidad, el investigador decide utilizar un diseño de bloques completos al azar. Las observaciones fueron tomadas en cuatro días y los datos (en UFC) se muestran en la siguiente tabla. Días Solución 1 2 3
1 13 16 5
2 22 24 4
3 18 17 1
4 39 44 22
El modelo aditivo lineal es el siguiente: Yij = µ + τ i + β j + ε ij
i = 1,..., t
j = 1,..., b
donde: -
Yij es el número de UFC observado con la i-ésima solución, j-ésimo día (bloque). µ es el efecto de la media general. τi es el efecto de la i-ésima solución. βj es el efecto del j-ésimo día (bloque). εij es el efecto del error experimental con la i-ésima solución, j-ésimo día (bloque).
Ing. Raúl Eyzaguirre Pérez
[email protected]
60
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
- t = 3 (Número de tratamientos) - b = 4 (Número de días o bloques). 2.4. Supuestos del Modelo Estadístico El modelo estadístico debe cumplir con los siguientes supuestos: 1. Aditividad: Los efectos del modelo son aditivos. 2. Linealidad: Las relaciones entre los efectos del modelo son lineales. 3. Normalidad: Los errores del modelo deben tener una distribución normal con media cero y variancia σ2. 4. Independencia. Los resultados obtenidos en el experimento son independientes entre sí. 5. Homogeneidad de Variancias: Las diferentes poblaciones generadas por la aplicación de los diferentes tratamientos tienen variancias iguales (σ2). 6. No existe interacción entre los bloques y los tratamientos. 2.5. Estimación de los Efectos Los efectos del modelo, µ, τi y βj, son estimados de modo que se minimice la siguiente expresión (Método de Mínimos Cuadrados): ri
t
t
ri
Q = ∑∑ ε ij2 = ∑∑ (Yij − µ − τ i − β j ) 2 i =1 j = i
i =1 j = i
teniendo en cuenta las siguientes restricciones: t
∑τ i =1
i
b
∑β
=0
j =1
j
=0
La aplicación de este método da los siguientes resultados para la estimación de los parámetros:
µˆ = Y••
τˆi = Yi• − Y••
βˆ j = Y• j − Y••
εˆij = Yij − Yi• − Y• j + Y••
Ejemplo 1 (Cont.): Con los datos del ejemplo anterior, la media estimada es:
µˆ = 18.75 Los efectos estimados de los tratamientos:
τˆ1 = Y1• − Y•• = 23 − 18.75 = 4.25 Ing. Raúl Eyzaguirre Pérez
[email protected]
61
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
τˆ2 = Y2• − Y•• = 25.25 − 18.75 = 6.5 τˆ3 = Y3• − Y•• = 8 − 18.75 = −10.75 Los efectos estimados de los bloques:
βˆ1 = Y•1 − Y•• = 11.33 − 18.75 = −7.42 βˆ2 = Y•2 − Y•• = 16.67 − 18.75 = −2.08 βˆ3 = Y•3 − Y•• = 12 − 18.75 = −6.75 βˆ4 = Y•4 − Y•• = 35 − 18.75 = 16.25 El efecto estimado del error ε24:
εˆ24 = Y24 − Y2• − Y•4 + Y•• = 44 − 25.25 − 35 + 18.75 = 2.5 2.6. Análisis de Variancia En este modelo la variabilidad total se descompone en tres fuentes de variación, la explicada por los tratamientos, la explicada por los bloques y la explicada por el error. Por lo tanto, el modelo de descomposición de la variancia será el siguiente: Variabilidad (Total) = Var (Tratamientos) + Var (Bloques) + Var (Error) La variabilidad total es cuantificada por la suma de cuadrados total: t
b
t
b
SC(Total) = SC(Y ) = ∑∑ (Yij − Y•• ) 2 = ∑∑ Yij2 − i =1 j =1
donde
i =1 j =1
Y••2 tb
Y••2 es el término de corrección (TC). tb
Las sumas de cuadrados de los tratamientos, bloques y error se calculan de la siguiente manera: Yi•2 SC(Tratamientos) = ∑ − TC i =1 b t
b
Y•2j
j =1
t
SC(Bloques) = ∑ t
b
2
Yi•2 b Y• j −∑ + TC i =1 b j =1 t t
SC(Error) = ∑∑ Yij2 − ∑ i =1 j =1
− TC
SC(Error) = SC(Total) - SC(Tratamientos) – SC(Bloques) Ing. Raúl Eyzaguirre Pérez
[email protected]
62
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
Estas fuentes de variación son comparadas mediante el siguiente procedimiento de prueba de hipótesis a partir del cuadro de análisis de variancia (Cuadro ANVA): Cuadro ANVA Fuentes de Variación
Grados de Libertad (gl)
Sumas de Cuadrados (SC)
Tratamientos
t–1
SC(Trat)
Bloques
b–1
SC(Bloques)
(t – 1)( b – 1)
SC(Error)
tb – 1
SC(Total)
Error Experimental Total
Cuadrados Medios (CM) SC(Trat) gl(Trat) SC(Bloqes) gl(Bloques) SC(Error) gl(Error)
Fc CM(Trat) CM(Error)
Hipótesis: Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los tratamientos las siguientes: H0: τi = 0 ∀ i H1: τi ≠ 0 para al menos algún i En términos de las medias de los tratamientos: H0: µi = µ ∀ i H1: µi ≠ µ para al menos algún i Para el Modelo II (Efectos aleatorios) las hipótesis serán planteadas en términos de la variancia de los tratamientos: H0: σ τ2 = 0 H1: σ τ2 > 0 En cualquiera de los casos, la hipótesis nula implica que los tratamientos no afectan a la variable respuesta o lo que es lo mismo, que con todos los tratamientos se obtienen los mismos resultados. Valores Esperados de los Cuadrados Medios: En la siguiente tabla se presentan los valores esperados de los cuadrados medios para un experimento en DBCA, en el caso de efectos fijos y aleatorios tanto para los tratamientos como para los bloques.
Ing. Raúl Eyzaguirre Pérez
[email protected]
63
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Grados de Libertad (gl)
Fuentes de Variación
Diseño de Bloques Completos al Azar
Valor Esperado de los Cuadrados Medios Modelo I Modelo II
τ i2 i =1 t − 1 b β 2j 2 σ + t∑ j =1 b − 1 t
Tratamientos
t–1
Bloques
b–1
Error Experimental
σ 2 + b∑
(t – 1)( b – 1)
Total
σ2
σ 2 + bσ τ2 σ 2 + tσ β2 σ2
tb – 1
Estadístico de Prueba: Fc =
CM(Trat) ∼ F( gl(Trat ),gl(Error) ) CM(Error)
Regla de Decisión: La hipótesis nula se rechaza con un nivel de significación α si el Fc resulta mayor que el valor de tabla F(1−α , gl(Trat ),gl(Error) ) . Ejemplo 1 (Cont.): A continuación se presenta el análisis de variancia y la prueba de hipótesis correspondiente para el ejemplo tratado en esta sección: t
b
SC(Total) = ∑∑ Yij2 − TC i =1 j =1
2252 = (13 + 22 + ... + 22 ) − = 1862.25 (3)(4) 2
2
2
Yi•2 SC(Tratamientos) = ∑ − TC i =1 b t
922 1012 322 2252 = + + − = 703.5 4 4 4 (3)(4) b
Y•2j
j =1
t
SC(Bloques) = ∑ =
− TC
342 502 362 1052 2252 + + + − = 1106.92 3 3 3 3 (3)(4)
SC(Error) = SC(Total) - SC(Tratamientos) - SC(Bloques) = 51.83
Ing. Raúl Eyzaguirre Pérez
[email protected]
64
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
Cuadro ANVA Fuentes de Variación Tratamientos Bloques Error Experimental Total
gl 2 3 6 11
SC 703.5 1106.92 51.83 1862.25
CM 351.75 368.97 8.64
Fc 40.72
45 40 35
UFC
30 25 20 15 10 5 0 1
2
3
Solución
Asumiendo un modelo de efectos fijos, las hipótesis en términos de los efectos de los tratamientos son: H0: τi = 0 i = 1, 2, 3 H1: τi ≠ 0 para al menos algún i En términos de las medias de los tratamientos: H0: µi = µ i = 1, 2, 3 H1: µi ≠ µ para al menos algún i o literalmente: H0: Las tres soluciones son igualmente efectivas en el retardo del crecimiento de bacterias en contenedores de leche. H1: Al menos una de las soluciones tienen una efectividad diferente en el retardo del crecimiento de bacterias en contenedores de leche. El estadístico de prueba es Fc = 40.72. El valor de tabla para un nivel de significación del 5% es F( 0.95, 2,6) = 5.14. Dado que el estadístico de prueba resulta mayor que el valor de tabla se rechaza H0. En conclusión, existe suficiente evidencia estadística para aceptar que las tres soluciones no son igualmente efectivas en el retardo del crecimiento de bacterias en contenedores de leche. El coeficiente de variación para este experimento es: Ing. Raúl Eyzaguirre Pérez
[email protected]
65
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
CME 8.64 = 15.68% = Y•• 18.75
cv =
3. Pruebas de Comparación de Medias de Tratamientos En esta sección se aplicarán las mismas pruebas presentadas en el capítulo correspondiente al Diseño Completamente al Azar. Los supuestos y características de cada prueba son los mismos. A continuación se presentan las desviaciones estándar a utilizar en cada una de las pruebas: 2CME b
1. Prueba t y DLS
sd =
2. Contrastes Ortogonales
sLˆ = CME ∑
t
i =1
3. Tukey
sd =
CME b
4. Dunnett
sd =
2CME b
ci2 b
Ejemplo 1 (Cont.): Utilice la prueba t para evaluar si la solución 1 es más eficiente que la solución 2 (Note que con la solución más eficiente se tendrá menos bacterias) H0: µ2 - µ1 = 0 H1: µ2 - µ1 > 0 tc =
(Y2 − Y1 ) − k (25.25 − 23) − 0 = = 1.08 2CME 2(8.64) b 4
El valor de tabla para un nivel de significación de 5% es t(0.95, 6) = 1.943. Como el valor calculado es menor al valor de tabla no se rechaza H0. En conclusión, no existe suficiente evidencia estadística para aceptar que la solución 1 sea más efectiva que la solución 2 en el retardo del crecimiento de bacterias. Ejemplo 1 (Cont.): Aplique la prueba DLS para comparar las soluciones 1 y 3. H0: µ1 = µ3 H1: µ1 ≠ µ3 DLS = t(0.975, 6) Ing. Raúl Eyzaguirre Pérez
[email protected]
2CME 2(8.64) = 2.447 = 5.09 b 4 66
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
Y1 − Y3 = 23 − 8 = 15 Como Y1 − Y3 es mayor al DLS se rechaza H0. En conclusión, existe suficiente evidencia estadística para aceptar que las soluciones 1 y 3 no son igualmente eficientes en el retardo del crecimiento de bacterias. Ejemplo 1 (Cont.): Utilice un contraste que permita comparar las soluciones 1 y 2 con la 3. El contraste a evaluar en este caso es L = µ1 + µ2 - 2µ3, y las hipótesis son: H0: L = 0 H1: L ≠ 0 El cálculo del estadístico de prueba es el siguiente: Lˆ = Y1 + Y2 − 2Y3 = 32.25 (1) 2 (1) 2 (−2) 2 + + sLˆ = CME = 3.60 4 4 4 tc =
Lˆ − L0 32.25 − 0 = = 8.96 3.60 sLˆ
El valor de tabla para un nivel de significación de 5% es t(0.975, 6) = 2.447. Como el valor calculado es mayor al valor de tabla se rechaza H0. En conclusión, existe suficiente evidencia estadística para aceptar que la eficiencia en el retardo del crecimiento de bacterias de las soluciones 1 y 2 es diferente a la de la solución 3. Ejemplo 1 (Cont.): Aplique la prueba de Tukey para evaluar la significancia de las diferencias entre los tratamientos. Las hipótesis son las siguientes: H0: µ1 = µ2 H0: µ1 ≠ µ2
H0: µ1 = µ3 H0: µ1 ≠ µ3
H0: µ2 = µ3 H0: µ2 ≠ µ3
El valor de tabla con α = 5%, p = 3 tratamientos y 6 grados de libertad para el error experimental es AES(T) = 4.34. La amplitud límite significativa de Tukey es: ALS(T) = AES(T)
CME 8.64 = 4.34 = 6.38 b 4
A continuación se presentan los resultados para las 3 comparaciones:
Ing. Raúl Eyzaguirre Pérez
[email protected]
67
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
Tratamientos comparados 1y2 1y3 2y3
Yi• − Y j •
Significancia
2.25 15.00 17.25
n.s. * *
Solución 3 8
Solución 1 23
Solución 2 25.25
Ejemplo 1 (Cont.): Suponga que la solución 1 es el tratamiento testigo. Aplique la prueba de Dunnett. H0: µ1 = µ2 H1: µ1 ≠ µ2
H0: µ1 = µ3 H1: µ1 ≠ µ3
El valor de tabla con α = 5%, p = 2 tratamientos sin considerar el control y 6 grados de libertad para el error experimental es t(Dn) = 2.86. La amplitud límite significativa de Dunnett es: ALS(Dn) = t(Dn)
2CME 2(8.64) = 2.86 = 5.94 b 4
A continuación se presentan los resultados para las 2 comparaciones: Tratamientos comparados 1y2 1y3
Y3• − Yi•
Significancia
2.25 15.00
n.s *
En este caso, solo la solución 3 presenta resultados significativamente diferentes a los del testigo.
4. Prueba de Friedman La prueba de Friedman es la alternativa no paramétrica para el diseño de bloques completos al azar. 4.1. Datos Los datos consisten de k muestras relacionadas (correspondientes a los k tratamientos), cada una de tamaño b (número de bloques). Asigne el rango 1 a la observación más pequeña, 2 a la segunda y así sucesivamente hasta la más grande de las k observaciones dentro de cada bloque. En caso de empates utilice la media Ing. Raúl Eyzaguirre Pérez
[email protected]
68
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
de los rangos correspondientes. Sea R(Xij) el rango asignado a la observación Xij dentro del bloque j y sea Ri la suma de los rangos asignados a la muestra i: b
Ri = ∑ R( X ij ) j =1
Calcule Ri para cada muestra (tratamiento). 4.2. Supuestos 1. Los b bloques son mutuamente independientes (Los resultados dentro de un bloque no influyen en los resultados dentro de los otros). 2. La escala de medida es al menos ordinal, de modo que las observaciones pueden ser ordenadas dentro de cada bloque. 4.3. Procedimiento de Prueba Hipótesis: H0: Los tratamientos tienen los mismos efectos. H1: Al menos uno de los tratamientos tiene un efecto diferente. Estadístico de Prueba: Primero calcule los valores A y B: k
b
A = ∑∑ R( X ij )
2
B=
i =1 j =1
1 k 2 ∑ Ri b i =1
Si no hay empates, A se simplifica a: A=
bk (k + 1)(2k + 1) 6
El estadístico de prueba es:
T=
2 b 2 k ( k + 1) ( k − 1) bB − 4
bk ( k + 1) A− 4
2
Regla de Decisión: La hipótesis nula se rechaza con un nivel de significación α si T resulta mayor que el valor de tabla χ (12 −α ,k −1) .
Ing. Raúl Eyzaguirre Pérez
[email protected]
69
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
Ejemplo 2: Se desea comparar la calidad de 4 marcas de vino. Para ello, se le pide a 8 jueces que prueben (en orden aleatorio) cada una de las 4 muestras y las califiquen en una escala del 0 al 10. Los resultados se presentan a continuación: Juez Vino A B C D
1 9 8 9 5
2 7 5 6 5
3 8 8 7 3
4 6 2 6 5
5 5 4 4 4
6 8 4 7 5
7 6 3 5 6
8 4 2 3 4
¿Existen diferencias significativas entre las calidades de los vinos? 9
Calificativo
8 7 6 5 4 3 2 A
B
C
D
Vino
H0: Los cuatro vinos son de la misma calidad. H1: Al menos uno de los vinos es de diferente calidad. La asignación de los rangos a las observaciones de menor a mayor dentro de cada bloque (juez) se presenta en el siguiente cuadro: Juez Vino A B C D
1 3.5 2 3.5 1
2 4 1.5 3 1.5
3 3.5 3.5 2 1
4 3.5 1 3.5 2
5 4 2 2 2
6 4 1 3 2
7 3.5 1 2 3.5
8 3.5 1 2 3.5
Ri 29.5 13 21 16.5
Los valores de A y B son: 4
8
A = ∑∑ R( X ij ) = 235 i =1 j =1
2
B=
1 4 2 ∑ Ri = 219.0625 b i =1
El estadístico de prueba es:
Ing. Raúl Eyzaguirre Pérez
[email protected]
70
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
2 b 2 k ( k + 1) (8) 2 (4)(4 + 1) 2 ( k − 1) bB − (4 − 1) (8)(219.0625) − 4 4 = 13.07 T= = 2 2 (8)(4)(4 + 1) bk ( k + 1) 235 − A− 4 4 2 El valor de tabla para un nivel de significación del 5% es χ (0.95,3) = 7.815. Como el estadístico de prueba resulta mayor que el valor de tabla se rechaza H0 y se concluye que existe suficiente evidencia estadística para aceptar que al menos uno de los vinos es de diferente calidad.
4.4. Comparaciones Múltiples Si la hipótesis nula es rechazada, la prueba de Friedman presenta un procedimiento para comparar a los tratamientos por pares. Se dirá que los tratamientos i y j difieren significativamente si satisfacen la siguiente desigualdad: Ri − R j > t(1−α / 2,(b −1)( k −1) )
2b( A − B) (b − 1)(k − 1)
Ejemplo 2 (Cont.): Con los datos del ejemplo anterior se tiene: t(1−α / 2,(b −1)( k −1) ) = t(0.975,21) = 2.08 t(1−α / 2,(b −1)( k −1))
2b( A − B) 2(8)(235 − 219.0625) = 2.08 = 7.25 (b − 1)(k − 1) 21 Tratamientos comparados AyB AyC AyD ByC ByD CyD
Ri − R j
Significancia
16.5 8.5 13 8 3.5 4.5
* * * * n.s. n.s.
Se encuentran diferencias significativas en todas las comparaciones salvo en B con D y C con D. Una representación gráfica de estas comparaciones sería la siguiente: Tratamiento: Ri:
Ing. Raúl Eyzaguirre Pérez
[email protected]
B 13
D 16.5
C 21
A 29.5
71
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
Anexo: Salida de Minitab Ejemplo 1 Two-way Analysis of Variance Analysis of Variance for UFC Source DF SS Trat 2 703.50 Bloq 3 1106.92 Error 6 51.83 Total 11 1862.25
MS 351.75 368.97 8.64
F 40.72 42.71
P 0.000 0.000
Tukey Simultaneous Tests Response Variable UFC All Pairwise Comparisons among Levels of Trat Trat = 1 subtracted from: Level Trat 2 3
Difference of Means 2.25 -15.00
SE of Difference 2.078 2.078
T-Value 1.083 -7.217
Adjusted P-Value 0.5578 0.0009
T-Value -8.300
Adjusted P-Value 0.0004
Trat = 2 subtracted from: Level Trat 3
Difference of Means -17.25
SE of Difference 2.078
Dunnett Simultaneous Tests Response Variable UFC Comparisons with Control Level Solución = 1 subtracted from: Level Solución 2 3
Difference of Means 2.25 -15.00
SE of Difference 2.078 2.078
T-Value 1.083 -7.217
Adjusted P-Value 0.4919 0.0007
Ejemplo 2 Friedman Test Friedman test for Resp by Vino blocked by Juez S = 11.44 S = 13.07
DF = 3 DF = 3
P = 0.010 P = 0.004 (adjusted for ties)
Vino 1 2 3 4
N 8 8 8 8
Est Median 6.625 4.625 5.750 5.000
Grand median
=
5.500
Ing. Raúl Eyzaguirre Pérez
[email protected]
Sum of Ranks 29.5 13.0 21.0 16.5
72
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
Ejercicios 1. El propósito del experimento es comparar cuatro procesos, A, B, C y D para la producción de penicilina. La materia prima, licor de maíz, es algo variable y sólo puede ser preparada en cantidad suficiente para cuatro ensayos. De este modo, cinco preparaciones son necesarias para poder contar con cinco repeticiones. Los resultados del experimento, para la producción de penicilina en mg se presentan en la siguiente tabla: Proceso A B C D
I 85 85 97 93
II 81 79 92 85
Preparación III 82 86 89 87
IV 85 89 91 88
V 82 81 86 87
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos del enunciado. b) Efectúe el análisis de variancia. c) Se justifica el uso de los bloques. Explique brevemente. d) Realice las comparaciones por pares en caso sea necesario. Concluya mediante el diagrama de líneas. e) Antes de realizar el experimento se tenía principal interés en comparar los procesos C y D. Realice la prueba correspondiente. f) Los procesos A y B son dos variantes de una metodología, llamémosla metodología 1, y los procesos C y D son variantes de otra, llamémosla metodología 2. Se cree que la metodología 2 es mejor que la metodología 1. ¿Aportan los resultados de este experimento suficiente evidencia para aceptar que la metodología 2 es mejor que la 1? 2. Se realizó un experimento para comparar el contenido de colesterol de 3 alimentos dietéticos. Cada uno de los 3 laboratorios que fabrican alimentos dietéticos produce alimentos de estos 3 tipos en paquetes de similar peso. Al evaluar el contenido de colesterol (en miligramos por paquete) se obtuvo los siguientes resultados: Alimento Dietético A B C
1 13 17 15
Laboratorio 2 15 18 18
3 12 14 13
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos del enunciado. b) Efectúe el análisis de variancia. c) Mediante la prueba DLS compare el contenido medio de colesterol de los alimentos A y B. d) Realice la prueba de Tukey. Resuma sus resultados mediante el diagrama de líneas. Ing. Raúl Eyzaguirre Pérez
[email protected]
73
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
3. En un experimento de riegos en el cultivo de algodón se tuvieron los siguientes tratamientos que están expresados en metros cúbicos de agua absorbidos por hectárea: T1=5400, T2=4800, T3=4200 y T4=3600. El experimento se condujo en parcelas de 300 m2 de área útil y los resultados están expresados en kilogramos. A continuación se dan los rendimientos: Bloques I II III
T1 68 86 68
Tratamientos T2 T3 73 53 90 62 71 46
T4 50 62 50
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos del enunciado. b) Efectúe el análisis de variancia. c) Realice la prueba de Tukey. d) Efectúe la prueba DLS para comparar los tratamientos T3 y T4. e) ¿Se puede afirmar que con T2 el rendimiento por parcela supera en más de 80 kilogramos al que se obtiene con T4? 4. Con la finalidad de estudiar el efecto de los tratamientos de semilla de soya sobre el % de germinación, se llevó a cabo un experimento conducido en el DBCA. En el experimento se utilizaron 3 tratamientos + 1 testigo (semillas no tratadas), en 4 unidades experimentales. Los resultados fueron: Tratamiento Bloque 1 2 3 4
Testigo 92 90 88 86
A 98 94 93 91
B 96 90 91 89
C 91 93 97 95
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos del enunciado. b) Efectúe el análisis de variancia. c) Realice la prueba de Dunnett. 5. Un investigador realiza un estudio de la efectividad de cuatro cremas para el tratamiento de un cierto tipo de enfermedad cutánea. Él cuenta con 28 pacientes para dividirlos en cuatro grupos de 7 pacientes cada uno. Los pacientes son evaluados y colocados en bloques de cuatro de acuerdo a la severidad de la condición inicial de su piel. De esta manera, los cuatro casos más severos son asignados al primer bloque, los cuatro siguientes más severos al segundo, y así hasta completar el séptimo bloque con los cuatro casos menos severos. Los cuatro miembros de cada bloque fueron asignados aleatoriamente, uno a cada uno de los cuatro tratamientos. Al final del tratamiento, cada paciente fue nuevamente evaluado y calificado en una escala del 1 al 7 de acuerdo al estado final de su Ing. Raúl Eyzaguirre Pérez
[email protected]
74
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Diseño de Bloques Completos al Azar
piel. El calificativo de 7 corresponde a una piel completamente sana. Los resultados del experimento se presentan en la siguiente tabla: Crema 1 2 3 4
1 3 4 5 4
2 3 4 4 5
3 4 6 6 4
Bloque 4 4 5 5 6
5 3 5 5 4
6 4 6 7 6
7 5 6 7 7
a) ¿Existen diferencias significativas entre las cremas? b) Realice las comparaciones por pares. 6. A seis soldadores, con diferente nivel de experiencia, se les pidió que unieran dos tubos metálicos utilizando 5 diferentes tipos de llama. Las llamas fueron utilizadas en orden aleatorio por cada soldador. Las soldaduras ya terminadas fueron evaluadas sobre una variedad de factores cualitativos y calificadas del 1 al 10, donde 10 representa un trabajo perfecto. Los resultados fueron los siguientes: Soldador 1 2 3 4 5 6
1 3.9 9.4 9.7 8.3 9.8 9.9
2 4.1 9.5 9.3 8.0 8.9 10.0
Tipo de llama 3 4.2 9.4 9.3 7.9 9.0 9.7
4 4.1 9.0 9.2 8.6 9.0 9.6
5 3.3 8.6 8.4 7.4 8.3 9.1
a) Efectúe la prueba de Friedman con estos datos. b) Efectúe las comparaciones por pares. c) Efectúe las prueba utilizando métodos paramétricos. Suponga que se cumple con todos los supuestos.
Ing. Raúl Eyzaguirre Pérez
[email protected]
75