Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Parcelas Divididas
Capítulo IX Diseño de Parcelas Divididas In God we trust; all others must bring data. W. E. Deming
1. Introducción En el capítulo anterior, los tratamientos generados por la combinación de los niveles de los factores en estudio eran asignados aleatoriamente, dependiendo del diseño utilizado, a las unidades experimentales; esto es, los niveles de ambos factores eran aleatorizados simultáneamente. Sin embargo, existen casos en los que esta aleatorización es poco práctica y en los que resulta recomendable aleatorizar primero los niveles de un factor y luego los niveles del otro. El procedimiento consiste entonces en asignar los niveles de un factor a las unidades experimentales completas, también llamadas parcelas, y luego, cada unidad experimental dividirla en subunidades, llamadas subparcelas, a las cuales se les aplicarán los niveles del otro factor. Suponga por ejemplo que se desea evaluar el rendimiento de algunas variedades de cultivo bajo un número de métodos de preparación del terreno. Los métodos de preparación del terreno podrían requerir el uso de maquinaria y para su aplicación sería conveniente utilizar parcelas grandes; en cambio, las variedades de cultivo sí podrían ser aplicadas en parcelas de tamaño pequeño. Para analizar esto con mayor detalle suponga que se tiene un campo de media Ha y que se desean evaluar 5 variedades de cultivo y dos métodos para la preparación del terreno. Desarrollando el experimento como un factorial en DBCA con 5 bloques, cada combinación de variedad y método tendría que ser aplicada a una parcela de 100 m2. En cambio, resultaría más adecuado dividir el terreno en 10 parcelas de 500 m2 y aplicar los métodos de preparación del terreno aleatoriamente a estas parcelas grandes y luego dividir cada parcela grande en 5 subparcelas más pequeñas de 100 m2 cada una, para asignar ahí en forma aleatoria las 5 variedades de cultivo. Nótese que en este caso, cada parcela es considerada como un bloque completo con relación a las variedades, pero solo como un bloque incompleto con relación al conjunto de tratamientos. El croquis experimental para este experimento podría ser el siguiente:
Ing. Raúl Eyzaguirre Pérez
[email protected]
135
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Parcelas Divididas
Bloque 1
b1
b2
a1 b4
b5
b2
b5
b2
a2 b4
b3
b1
Bloque 2
b2
b3
a2 b1
b4
b5
b1
b5
a1 b3
b4
b2
b2
a1 b3
b3
a2 b1
b4
b5
b1
a1 b4
b4
a2 b2
b5
b1
b5
a2 b1
b1
a1 b2
b3
b5
Bloque 3 Bloque 4 Bloque 5
b1 b3 b4
b4 b5 b3
b5 b2 b2
b2 b3 b4
Otra situación en la que sería deseable utilizar este diseño, es cuando se desea mayor precisión para uno de los dos factores en estudio; en este caso, dicho factor iría en las subunidades. En este capítulo se tratará el caso del diseño de parcelas divididas con dos factores, un factor en las unidades completas y un factor en las subunidades, utilizando los diseños completamente al azar y de bloques completos al azar para la asignación de los niveles del factor que va en las unidades completas. Sin embargo, es posible utilizar el diseño de parcelas divididas con más de un factor, tanto en las unidades completas como en las subunidades. Aunque este diseño fue desarrollado en agricultura (y de ahí su nombre), puede aplicarse en muchas otras disciplinas.
2. Análisis de un Diseño de Parcelas Divididas 2.1. Modelo Aditivo Lineal Dado que en este diseño la aleatorización se realiza en dos etapas, el modelo aditivo lineal tendrá dos fuentes de error, una desde las unidades completas y otra desde las subunidades. En el caso de que los niveles del factor que va en las unidades completas se distribuyan según un DCA, el modelo aditivo lineal estará dado por: Yijk = µ + α i + γ ij + β k + (αβ )ik + ε ijk donde: Yijk es el valor o rendimiento observado con el i-ésimo nivel del factor A, j-ésima repetición, y k-ésimo nivel del factor B. µ es el efecto de la media general. αi es el efecto del i-ésimo nivel del factor A. γ ij es el efecto del error experimental en parcelas (Error (a))
βk es el efecto del k-ésimo nivel del factor B. Ing. Raúl Eyzaguirre Pérez
[email protected]
136
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Parcelas Divididas
(αβ)ik es el efecto de la interacción en el i-ésimo nivel del factor A y el k-ésimo nivel del factor B. εijk es el efecto del error experimental en subparcelas (Error (b)) i = 1, ..., p (p = número de niveles del factor A) j = 1, ..., r (r = número de repeticiones para los niveles del factor A) k = 1, ..., q (q = número de niveles del factor B) En el caso que el diseño sea un DBCA, el modelo será: Yijk = µ + α i + ρ j + γ ij + β k + (αβ )ik + ε ijk En este caso:
ρj es el efecto del j-ésimo bloque. j = 1, ..., r (r = número de bloques) Se asume que tanto γ ij como εijk están normal e independientemente distribuidos con medias cero y variancias σ γ2 y σ ε2 respectivamente. Ejemplo (Parcelas Divididas en DBCA): Un experimento diseñado para evaluar tres variedades de cebada y cuatro niveles de abobamiento con nitrógeno (0, 0.01, 0.02 y 0.04 toneladas por parcela) fue conducido en 4 bloques de tres parcelas cada uno. Cada parcela fue dividida en 4 subparcelas. Cada variedad fue sembrada en una parcela mientras que los cuatro niveles de abonamiento fueron utilizados en las subparcelas. Los resultados del experimento (en kilogramos por subparcela) se presentan en la siguiente tabla: Bloque Variedad
b2
b3
b4
130
157
174
114
161
141
140
118
156
III a (432) (1178) 2 a3 (380)
61
91
97
100
a1 (368)
70
108
126
149
96
124
121
144
b1
a1 (572) 111 I a (533) 117 (1624) 2 a3 (519) 105 a1 (349) II a (453) (1287) 2 a3 (485)
Bloque Variedad
b1
b2
b3
b4
a1 (366)
74
89
81
122
64
103
132
133
70
89
104
117
62
90
100
116
80
82
94
126
63
70
109
99
IV a (382) (1091) 2 a3 (341)
El modelo aditivo lineal para este ejemplo será: Yijk = µ + α i + ρ j + γ ij + β k + (αβ )ik + ε ijk donde: Yijk es el rendimiento observado con la i-ésima variedad, j-ésimo bloque y k-ésimo nivel de abonamiento. Ing. Raúl Eyzaguirre Pérez
[email protected]
137
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Parcelas Divididas
µ es el efecto de la media general. αi es el efecto de la i-ésima variedad. ρj es el efecto del j-ésimo bloque. γ ij es el efecto del error experimental en parcelas (Error (a)) βk es el efecto del k-ésimo nivel de abonamiento. (αβ)ik es el efecto de la interacción en la i-ésima variedad y el k-ésimo nivel de abonamiento. εijk es el efecto del error experimental en subparcelas (Error (b)). 2.2. Análisis de Variancia Las sumas de cuadrados para un diseño de parcelas divididas en DBCA son calculadas por: p
q
r
SC(Total subparcelas) = ∑∑∑ Yijk2 − i =1 j =1 k =1
donde
2 Y••• prq
2 Y••• es el término de corrección (TC). prq p
r
SC(Total parcelas) = ∑∑
Yij2•
i =1 j =1
r
Y•2j •
j =1
pq
SC(Bloques) = ∑
q
− TC
− TC p
Yi•2k − TC k =1 r q
SC(Comb. AB) = SC(A) + SC(B) + SC(AB) = ∑∑ i =1
Yi••2 − TC i =1 rq p
SC(A) = ∑
Y••2 k − TC k =1 pr q
SC(B) = ∑
SC(AB) = SC(Comb. AB) - SC(A) - SC(B) SC(Error (a)) = SC(Total unidades) - SC(A) – SC(Bloques) SC(Error (b)) = SC(Total subunidades) - SC(Total unidades) – SC(B) – SC(AB)
El cuadro de Análisis de Variancia se presenta a continuación. Generalmente el cuadrado medio del error para las unidades completas, designado por Ea, es mayor que el cuadrado medio del error para las subunidades, designado por Eb, ya que las observaciones en las Ing. Raúl Eyzaguirre Pérez
[email protected]
138
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Parcelas Divididas
subunidades tienden a tener resultados más homogéneos dentro la misma unidad que entre unidades diferentes. Cuadro ANVA Fuentes de Variación
Grados de Libertad (gl)
Bloques
r–1
A
p–1
Error (a)
(r – 1)(p – 1)
Sumas de Cuadrados Medios Cuadrados (SC) (CM) SC(Bloques) SC(Bloques) gl(Bloques) SC( A) SC(A) gl( A) SC(Error(a )) SC(Error(a)) gl(Error(a))
Total Unidades
pr – 1
SC(Total Unid.)
B
q-1
SC(B)
(p – 1)(q-1)
SC(AB)
p(q – 1)(r – 1)
SC(Error(b))
pqr – 1
SC(Total Subunid.)
AB Error (b) Total Subunidades
SC( B) gl( B ) SC( AB) gl( AB ) SC(Error(b)) gl(Error(b))
Fc
CM( A) Ea
CM( B ) Eb CM( AB ) Eb
Hipótesis: Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los niveles de los factores las siguientes: Para el efecto principal de A:
H0: αi = 0 ∀ i H1: αi ≠ 0 para al menos algún i
Para el efecto principal de B:
H0: βk = 0 ∀ k H1: βk ≠ 0 para al menos algún k
Para el efecto de la interacción AB: H0: (αβ)ik = 0 ∀ i, k H1: (αβ)ik ≠ 0 para al menos algún i, k Estadístico de Prueba: Para el efecto principal de A:
Fc =
CM( A) ~ F( gl( A),gl(Error(a )) ) Ea
Para el efecto principal de B:
Fc =
CM( B ) ~ F( gl( B ),gl(Error(b ))) Eb
Ing. Raúl Eyzaguirre Pérez
[email protected]
139
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Fc =
Para el efecto de la interacción AB:
Parcelas Divididas
CM( AB) ~ F( gl( AB ),gl(Error(b ))) Eb
Regla de Decisión: Las hipótesis nulas se rechazan con un nivel de significación α si el Fc resulta mayor que el valor de tabla F(1−α ) con los grados de libertad correspondientes a cada caso. Al igual que en el análisis de un experimento factorial, se debe primero evaluar la hipótesis correspondiente a la interacción. De no existir interacción, se procedería a evaluar los efectos principales de los factores, en caso contrario, sería necesario evaluar los efectos simples. Ejemplo (Cont.): A continuación se presenta el análisis de variancia y las prueba de hipótesis correspondientes para el ejemplo tratado en esta sección: p
r
q
SC(Total subunidades) = ∑∑∑ Yijk2 − i =1 j =1 k =1
2 Y••• prq
= (1112 + 1302 + ... + 992 ) − p
r
SC(Total unidades) = ∑∑ i =1 j =1
=
q
− TC
5722 + 5332 + ... + 3412 51802 − = 17361.2 4 (3)(4)(4)
= r
Y•2j •
j =1
pq
SC(Bloques) = ∑
Yij2•
51802 = 38303.7 (3)(4)(4)
− TC
16242 + 1287 2 + 11782 + 10912 51802 − = 13634.2 12 (3)(4)(4)
Yi•2k SC(Comb. AB) = ∑∑ − TC i =1 k =1 r p
q
3082 + 4002 + ... + 5162 51802 = − = 17756.2 4 (3)(4)(4) Yi••2 − TC i =1 rq p
SC( A) = ∑ =
16552 + 18002 + 17252 51802 − = 657.3 16 (3)(4)(4)
Ing. Raúl Eyzaguirre Pérez
[email protected]
140
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Parcelas Divididas
Y••2 k − TC k =1 pr q
SC( B) = ∑ =
9732 + 12302 + 14002 + 1577 2 51802 − = 16538.2 12 (3)(4)(4)
SC(AB) = SC(Comb. AB) - SC(A) - SC(B) = 17756.2 – 657.3 – 16538.2 = 560.7 SC(Error (a)) = SC(Total unidades) - SC(A) – SC(Bloques) = 17361.2 – 657.3 – 13634.2 = 3069.7 SC(Error (b)) = SC(Total subunidades) - SC(Total unidades) – SC(B) – SC(AB) = 38303.7 – 17361.2 – 16538.2 – 560.7 = 3843.6 Cuadro ANVA Fuentes de Variación Bloques A Error (a) Total Unidades B AB Error (b) Total Subunidades
Grados de Libertad (gl) 3 2 6 11 3 6 27 47
Sumas de Cuadrados (SC) 13634.2 657.3 3069.7 17361.2 16538.2 560.7 3843.6 38303.7
Cuadrados Medios (CM) 4544.7 328.6 511.6 5512.7 93.5 142.6
Fc 0.6423 38.66 0.6557
Las hipótesis a probar son: Para el efecto principal de A:
H0: αi = 0 i = 1, 2, 3. H1: αi ≠ 0 para al menos algún i
Para el efecto principal de B:
H0: βk = 0 k = 1, 2, 3, 4. H1: βk ≠ 0 para al menos algún k
Para el efecto de la interacción AB: H0: (αβ)ik = 0 i = 1, 2, 3; k = 1, 2, 3, 4. H1: (αβ)ik ≠ 0 para al menos algún i, k Para la interacción el estadístico de prueba es Fc = 0.6557 y el valor de tabla, con un nivel de significación del 5%, es F( 0.95, 6,27 ) = 2.46. Dado que el estadístico de prueba resulta menor que el valor de tabla se acepta H0 y se concluye que no existe suficiente evidencia estadística para aceptar que exista interacción entre la variedad de cebada y el nivel de abonamiento. Al aceptar que no existe interacción entre los dos factores se procede a evaluar los efectos principales. Para el factor A (variedad), el Fc = 0.6423 es menor que el valor de tabla F( 0.95, 2,6) = 5.14; para el factor B (nivel de abonamiento), el Fc = 38.66 es mayor que el valor de tabla F( 0.95, 3,27 ) = 2.96. Luego, se concluye que: Ing. Raúl Eyzaguirre Pérez
[email protected]
141
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Parcelas Divididas
- No existe suficiente evidencia estadística con un nivel de significación del 5% para aceptar que con al menos una de las variedades de cebada se obtengan rendimientos diferentes. - Existe suficiente evidencia estadística con un nivel de significación del 5% para aceptar que con al menos uno de los niveles de abonamiento se obtiene un rendimiento diferente. En este diseño, se debe calcular un coeficiente de variación para parcelas y otro para subparcelas: cv(parcelas) =
Ea / q Y•••
cv(subparcelas) =
Eb Y•••
Con los datos del ejemplo se tiene: cv(parcelas) =
511.6 / 4 = 10.48% 107.9
cv(subparcelas) =
142.6 = 11.07% 107.9
2.3. Pruebas de comparación de medias Para comparar las medias de los niveles i y j de un factor sobre todos los niveles del otro (efectos principales) se deben utilizar las siguientes fórmulas para las desviaciones estándar: Prueba t y DLS Tukey
Factor A (Parcelas) 2 Ea sd = qr sd =
Ea qr
Factor B (Subparcelas) 2 Eb sd = pr sd =
Eb pr
Ejemplo (Cont.): En el ejemplo tratado en esta sección, sería necesario efectuar la prueba de Tukey para el factor niveles de abonamiento. Las hipótesis en este caso serán: H0: µ••1 = µ••2 H1: µ••1 ≠ µ••2
H0: µ••1 = µ••3 H1: µ••1 ≠ µ••3
H0: µ••1 = µ••4 H1: µ••1 ≠ µ••4
H0: µ••2 = µ••3 H1: µ••2 ≠ µ••3
H0: µ••2 = µ••4 H1: µ••2 ≠ µ••4
H0: µ••3 = µ••4 H1: µ••3 ≠ µ••4
Ing. Raúl Eyzaguirre Pérez
[email protected]
142
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Parcelas Divididas
El valor de tabla con α = 5%, p = 4 tratamientos y 27 grados de libertad para Eb es AES(T) = 3.87. La amplitud límite significativa de Tukey es: ALS(T) = AES(T)
Eb 142.6 = 3.87 = 13.34 pr (3)(4)
A continuación se presentan los resultados para las 6 comparaciones: Niveles de B
Y••i − Y•• j
Significancia
1y2 1y3 1y4 2y3 2y4 3y5
21.42 35.59 50.34 14.17 28.92 14.75
* * * * * *
2.4. Pruebas de comparación de medias de efectos simples Para comparar las medias de los niveles k y l de un factor en un nivel del otro utilice las siguientes fórmulas para las desviaciones estándar: Prueba t y DLS
Factor A en bj 2[(q − 1) Eb + Ea ] sd = qr
Tukey
Factor B en ai sd =
2 Eb r
sd =
Eb r
Al comparar dos medias del factor A en un nivel del factor B, se están comparando tanto parcelas como subparcelas, por lo que es necesario utilizar un promedio ponderado de Ea y Eb para el cálculo de la desviación estándar como se puede ver en el cuadro presentado arriba. Las ponderaciones son (q-1) y 1 para Eb y Ea respectivamente, las cuales suman q, cantidad que aparece en el divisor. Para estas comparaciones, el valor t calculado no sigue una distribución t de Student, y por lo tanto se deberá utilizar la siguiente aproximación para el valor tabular: t'=
(q − 1) Eb tb + Ea ta (q − 1) Eb + Ea
donde los valores ta y tb son los valores de la tabla t de Student con los grados de libertad de Ea y Eb respectivamente.
Ing. Raúl Eyzaguirre Pérez
[email protected]
143
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Parcelas Divididas
Ejercicios 1. La siguiente información corresponde a un experimento en tabaco realizado con un diseño de parcelas divididas en DBCA con 3 bloques, donde los factores están dados por: A (en unidades): Tipo de riego con 3 niveles (a1, a2 y a3) B (en subunidades): Tipo de fertilizante con 2 niveles (b1 y b2) Los resultados del experimento, en Kg por parcela, se dan a continuación:
Bloque I
Riego a1 a2 a3
b1 159 220 303
b2 301 409 144
Bloque III
Bloque II
Riego a1 a2 a3
b1 333 198 253
Riego a1 a2 a3
b1 207 109 281
b2 209 186 153
b2 419 254 228
a) Presente el modelo aditivo lineal e interprete sus componentes en términos del problema. b) Realice el ANVA y presente los coeficientes de variabilidad. c) Utilice la prueba t para comparar las medias de los niveles del factor fertilizante en cada uno de los sistemas de riego. 2. Considere un experimento para comparar el efecto de tres diferentes planes de manejo en el campo para ser cultivado con cuatro diferentes variedades de trigo. Seis parcelas fueron aleatoriamente asignadas a los planes de manejo (factor A). Entonces, cada parcela es dividida en cuatro subparcelas y las cuatro variedades (factor B) son aleatoriamente asignadas a ellas (en forma independiente dentro de cada parcela). A continuación se presentan los resultados obtenidos en Kg/subparcela. Plan de Manejo
Parcela
Sin labrar
1 2 1 2 1 2
Sin cultivar en verano Cultivado en verano
I 178 164 141 129 151 197
Variedad II III 154 119 154 107 130 81 112 73 144 113 176 137
IV 145 139 116 98 132 150
a) Presente el modelo aditivo lineal e interprete sus componentes en términos del problema. b) Realice el ANVA y presente los coeficientes de variación. c) Realice la prueba de Tukey para comparar las distintas variedades. 3. Se estudió el comportamiento de 4 épocas de aplicación (A) en parcelas y 3 dosis de Nitrógeno (B) en subparcelas. El experimento se llevó a cabo en un DBCA con 3 Ing. Raúl Eyzaguirre Pérez
[email protected]
144
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Parcelas Divididas
repeticiones, 12 parcelas y 36 subparcelas. Los resultados del experimento en TM/Ha de arroz se presentan a continuación: Dosis de Nitrógeno (Subparcelas): 0 Kg/Ha (b1), 50 Kg/Ha (b2), 100 Kg/Ha. (b3). Toda la siembra (a1) Bloques I II III Total b1 6.1 8.1 7.8 22.0 b2 3.8 7.2 6.0 17.0 b3 4.0 3.1 4.6 11.7 Total 13.9 18.4 18.4 50.7
Siembra y Floración (a2) Bloques I II III Total b1 6.1 6.8 6.0 18.9 b2 4.2 6.2 4.4 14.8 b3 4.1 5.2 4.5 13.8 Total 14.4 18.2 14.9 47.5
Macollo y Floración (a3) Bloques I II III Total b1 5.1 7.8 5.9 18.8 b2 5.8 7.1 7.7 20.6 b3 4.1 5.0 4.5 13.6 Total 15.0 19.9 18.1 53.0
Siembra Macollo y Floración (a4) Bloques I II III Total b1 4.8 6.2 5.2 16.2 b2 5.4 6.1 6.8 18.3 b3 4.6 5.4 5.5 15.5 Total 14.8 17.7 17.5 50
a) Presente el modelo aditivo lineal e interprete sus componentes en términos del problema. b) Realice el ANVA y presente los coeficientes de variación. c) Presente el gráfico de la interacción. d) Realice la prueba de Tukey para B(a1). Presente sus resultados mediante el diagrama de líneas. 4. Un fabricante de papel está interesado en el efecto de tres diferentes métodos para la preparación de la pulpa y cuatro temperaturas de cocción de la pulpa en la resistencia a la tensión del papel resultante. El equipo que es usado en el método de la preparación de la pulpa trabaja solo con grandes cantidades de pulpa. El equipo que es usado para la cocción de la pulpa puede trabajar con pequeñas cantidades. En un día, un lote de pulpa es producido por uno de los tres métodos bajo estudio. El método es aleatorizado entre los 9 días disponibles para el experimento. En cada día, el lote es dividido en cuatro sublotes y cada sublote es cocido en cada una de las cuatro temperaturas (en ºF). Los resultados obtenidos para la resistencia a la tensión del papel son los siguientes: Método Día Temperatura 200 225 250 275
1 5
2 1
3 8
1 7
2 6
3 3
1 9
2 4
3 2
30 35 32 36
34 41 38 42
29 31 33 31
28 32 35 41
31 36 42 40
31 35 32 35
31 37 36 40
35 40 39 44
32 39 39 40
a) Presente el modelo aditivo lineal e interprete sus componentes en términos del problema. b) Realice el ANVA y presente los coeficientes de variación. c) Realice la prueba de Tukey para comparar las distintas temperaturas. Ing. Raúl Eyzaguirre Pérez
[email protected]
145