Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
Capítulo VIII Experimentos Factoriales Las características del diseño siempre triunfan sobre las características del análisis. G. E. Dallal
1. Introducción En capítulos anteriores se estudiaron los diseños Completamente al Azar, de Bloques Completos al Azar y Cuadrado Latino, en los cuales se analizó un solo factor de tratamientos. Un experimento factorial es aquel en el que se estudian simultáneamente varios factores, de modo que los tratamientos se forman por todas las posibles combinaciones de los niveles de los factores. Un experimento factorial no constituye un nuevo diseño experimental, sino un diseño para la formación de los tratamientos. Los experimentos factoriales pueden ser conducidos bajo los lineamientos de cualquier diseño experimental tal como el DCA, DBCA o DCL. Los experimentos factoriales son ampliamente utilizados y son de gran valor en el trabajo exploratorio cuando se sabe poco sobre los niveles óptimos de los factores o ni siquiera qué factores son importantes. Estos experimentos son útiles también en campos de estudio más complejos en los que se sabe que un factor no actúa independientemente sino en estrecha relación con otros factores. En este capítulo se tratarán los experimentos factoriales con dos factores conducidos bajo los lineamientos de un DCA y DBCA.
2. Ventajas y Desventajas Ventajas: -
Permite obtener más información que en un experimento de un solo factor, ya que se estudian los efectos principales, los efectos simples, los efectos cruzados y de interacción entre los factores.
-
Todas las unidades intervienen en la estimación de los efectos principales y de interacción, por lo que el número de repeticiones es elevado para estos casos.
Desventajas: -
Se requiere un mayor número de unidades experimentales que en los experimentos con un solo factor.
Ing. Raúl Eyzaguirre Pérez
[email protected]
112
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
-
Dado que todos los niveles de un factor se combinan con todos los niveles de los otros, por requerimientos del análisis estadístico, se tendrá que algunas combinaciones que no son de interés para el investigador, serán también incluidas en el experimento.
-
El análisis estadístico y la interpretación de los resultados son más complicados que en los experimentos con un solo factor, y la dificultad aumenta considerablemente conforme más factores son incluidos.
3. Notación y Definiciones 3.1. Factor Los factores son designados por letras mayúsculas. Por ejemplo en un experimento en el que se evalúan 3 cantidades de semilla con 4 dosis de nitrógeno por parcela y 2 variedades de maíz destinado a chala, el factor cantidad de semilla se puede denotar por A, el factor dosis de nitrógeno por B y el factor variedad de maíz por C. 3.2. Niveles de un Factor Los niveles de un factor son denotados por letras minúsculas con subíndices. Por ejemplo, las 3 cantidades de semilla podrían ser denotadas por a1, a2 y a3, las 4 dosis de nitrógeno por b1, b2, b3 y b4, y las 2 variedades de maíz por c1 y c2. Una combinación de letras minúsculas con sus respectivos subíndices es utilizada para denotar una combinación de los niveles de los factores. Por ejemplo la combinación a2b2c1 denotará el tratamiento conformado por la aplicación de la cantidad a2 de semilla con la dosis b2 de nitrógeno y la variedad c1 de maíz. 3.3. Tipos de Factores Dependiendo de la naturaleza de los niveles de los factores, estos pueden ser cualitativos o cuantitativos. En el ejemplo, los factores A y B son cuantitativos y el factor C cualitativo. En el caso de factores cuantitativos estos pueden ser igualmente espaciados o no. Así por ejemplo, para el factor B, niveles de 0, 10, 20 y 30 kg/parcela y de 10, 20, 40 y 80 kg/parcela constituirían niveles igualmente espaciados y no igualmente espaciados respectivamente. Adicionalmente, los factores pueden ser fijos o al azar, dependiendo de la forma en que son seleccionados sus niveles (ver el capítulo II). Un experimento factorial con todos sus factores fijos corresponderá a un modelo I o de efectos fijos, un experimento factorial con todos sus factores aleatorios corresponderá a un modelo II o de efectos aleatorios y un experimento factorial con algunos factores fijos y otros aleatorios corresponderá a un modelo III o de efectos mixtos. En el desarrollo de este capítulo se considerará que todos los factores son fijos.
Ing. Raúl Eyzaguirre Pérez
[email protected]
113
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
3.4. Tipos de Experimentos Factoriales Un experimento factorial queda definido por el número de factores y niveles de cada factor. Un experimento factorial puede ser denotado utilizando las letras correspondientes a los factores antecedidas por el número de niveles correspondiente a cada uno. Por ejemplo, el experimento con 3 niveles del factor A, 4 del factor B y 2 del factor C puede ser denotado por 3A4B2C o simplemente 3x4x2. 3.5. Efectos en los Experimentos Factoriales Efecto Principal: Es el efecto de un factor en promedio sobre los niveles de los otros factores. Efecto Simple: Es el efecto de un factor, en un nivel de los demás factores. Efecto de Interacción: Está dado por la variación que tiene un efecto simple de un factor al pasar de un nivel a otro de otro factor. Efecto Cruzado: Está dado por las combinaciones cruzadas de dos factores. Ejemplo 1: A continuación se presentan datos para un experimento factorial 2x2. Niveles del Factor A Niveles del Factor B Medias
a1 b1 54
a2 b2 38
b1 45
b2 56
Efectos Simples: - de A en b1: ES(A(b1)) = a1b1 – a2b1 = 54 – 45 = 9 - de A en b2: ES(A(b2)) = a1b2 – a2b2 = 38 – 56 = -18 - de B en a1: ES(B(a1)) = a1b1 – a1b2 = 54 – 38 = 16 - de B en a2: ES(B(a2)) = a2b1 – a2b2 = 45 – 56 = -11 Efectos Principales: - de A: EP(A) =
1 9 − 18 = −4.5 [ ES( A(b1 ) + ES( A(b2 )] = 2 2
- de B: EP(B) =
1 16 − 11 = 2.5 [ ES( B(a1 ) + ES( B(a2 )] = 2 2
Efecto de interacción: - de AB: EI(AB) =
1 9 + 18 = 6.75 [ ES( A(b1 ) − ES( A(b2 )] = 2× 2 4
EI(AB) =
1 16 + 11 = 6.75 [ ES( B(a1 ) − ES( B(a2 )] = 2× 2 4
Ing. Raúl Eyzaguirre Pérez
[email protected]
114
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
Efectos cruzados: - entre a1b1 y a2b2: EC(a1b1 - a2b2) = a1b1 – a2b2 = 54 – 56 = -2 - entre a1b2 y a2b1: EC(a1b2 - a2b1) = a1b2 – a2b1 = 38 – 45 = -7 La interacción entre dos factores puede también analizarse gráficamente. El gráfico de la interacción presenta las medias de los niveles de un factor en cada uno de los niveles del otro. Con los datos del ejemplo se tienen los siguientes gráficos:
Cada línea corresponde a un efecto simple, y la interacción puede notarse cuando las líneas tienen pendientes diferentes, esto es, cuando el efecto simple de un factor no es el mismo en todos los niveles del otro. En el primer gráfico se presentan los efectos simples de A en b1 (línea punteada) y de A en b2 (línea continua) y es claro que el efecto simple de A depende del nivel de B (esto es, que existe interacción). A continuación se presenta otro ejemplo de interacción:
Note que no es necesario que las líneas se crucen para evidenciar una interacción entre ambos factores. Un caso de factores sin interacción aparente sería el siguiente: Ing. Raúl Eyzaguirre Pérez
[email protected]
115
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
4. Experimento Factorial pxq 4.1. Modelo Aditivo Lineal En un DCA, el modelo aditivo lineal está dado por: Yij = µ + τ i + ε ij
i = 1,..., t
Ahora, dado que los tratamientos son generados por las combinaciones entre los niveles de dos factores, el efecto de los tratamientos se descompone en el efecto del factor A, el efecto del factor B y el efecto de la interacción entre los dos factores. Así, el modelo aditivo lineal para un factorial pxq en DCA será: Yijk = µ + α i + β j + (αβ )ij + ε ijk
i = 1,..., p
j = 1,..., q
k = 1,..., rij
donde: Yijk es el valor o rendimiento observado con el i-ésimo nivel del factor A, j-ésimo nivel del factor B, k-ésima repetición. µ es el efecto de la media general. αi es el efecto del i-ésimo nivel del factor A. βj es el efecto del j-ésimo nivel del factor B. (αβ)ij es el efecto de la interacción en el i-ésimo nivel del factor A, j-ésimo nivel del factor B. εijk es el efecto del error experimental en el i-ésimo nivel del factor A, j-ésimo nivel del factor B, k-ésima repetición. p es el número de niveles del factor A. q es el número de niveles del factor B. rij es el número de repeticiones en el i-ésimo nivel del factor A, j-ésimo nivel del factor B. Ing. Raúl Eyzaguirre Pérez
[email protected]
116
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
En el caso de un experimento factorial en DBCA, el modelo aditivo lineal es: Yijk = µ + α i + β j + (αβ )ij + γ k + ε ijk
i = 1,..., p
j = 1,..., q
k = 1,..., b
donde:
γk es el efecto del k-ésimo bloque. b es el número de bloques. Los supuestos del modelo serán los mismos que para el DCA o DBCA con un solo factor vistos en capítulos anteriores. Los cálculos y procedimientos presentados de aquí en adelante corresponderán al caso del experimento factorial pxq en DBCA. El caso del experimento factorial en DCA es similar al del DBCA y será ilustrado mediante un ejemplo. Ejemplo 2 (Experimento Factorial en DBCA): Se realizó un experimento con un arreglo factorial 2A3B en DBCA en 4 campos de cultivo, para evaluar el efecto en el rendimiento de maíz obtenido con dos tipos de abono (a1 y a2) y tres dosis (b1=20, b2=30 y b3=40 kg/ha). Los resultados obtenidos (en TM/ha) se presentan a continuación: Campos 1 2 3 4 Total
b1 1.9 2.3 2.0 2.1 8.3
a1 b2 1.8 2.1 2.4 2.9 9.2
b3 2.7 2.4 2.9 2.8 10.8
b1 1.8 2.2 2.0 2.4 8.4
a2 b2 2.9 2.7 3.2 3.5 12.3
b3 3.0 3.2 2.9 3.4 12.5
El modelo aditivo lineal para este ejemplo será: Yijk = µ + α i + β j + (αβ )ij + γ k + ε ijk
i = 1,..., p
j = 1,..., q
k = 1,..., b
donde: Yijk es el rendimiento de maíz en Tm/Ha obtenido con el i-ésimo tipo de abono, j-ésima dosis, k-ésimo campo de cultivo. µ es el efecto de la media general. αi es el efecto del i-ésimo tipo de abono. βj es el efecto de la j-ésima dosis de abono. (αβ)ij es el efecto de la interacción en el i-ésimo tipo de abono, j-ésima dosis. γk es el efecto del k-ésimo campo de cultivo. εijk es el efecto del error experimental en el i-ésimo tipo de abono, j-ésima dosis, késimo campo de cultivo. p = 2 es el número de niveles del factor A. q = 3 es el número de niveles del factor B. b = 4 es el número de bloques. Ing. Raúl Eyzaguirre Pérez
[email protected]
117
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
4.2. Estimación de los Efectos Los efectos del modelo, µ, αi, βj, (αβ)ij y γk son estimados de modo que se minimice la siguiente expresión (Método de Mínimos Cuadrados): p
q
b
Q = ∑∑∑ ε i =1 j = i k =1
2 ijk
p
q
b
=∑∑∑ (Yijk − µ − α i − β j − (αβ )ij − γ k )
2
i =1 j = i k =1
teniendo en cuenta las siguientes restricciones: p
∑αi = 0 i =1
q
∑βj = 0 j =1
p
∑ (αβ )ij = 0 i =1
q
b
∑ (αβ )ij = 0
∑γ
j =1
k =1
k
=0
La aplicación de este método da los siguientes resultados para la estimación de los parámetros:
µˆ = Y•••
αˆ i = Yi•• − Y•••
βˆ j = Y• j • − Y•••
(αβ )ij = Yij • − Yi•• − Y• j • + Y•••
γˆk = Y••k − Y•••
εˆijk = Yijk − Yij • − Y••k + Y•••
∧
Ejemplo 2 (Cont.): Con los datos del ejemplo anterior, la media estimada es:
µˆ = Y••• = 2.5625 Los efectos estimados de los niveles del factor A:
αˆ1 = Y1•• − Y••• = 2.3583 − 2.5625 = −0.2042 αˆ 2 = Y2•• − Y••• = 2.7667 − 2.5625 = 0.2042 Los efectos estimados de los niveles del factor B:
βˆ1 = Y•1• − Y••• = 2.0875 − 2.5625 = −0.475 βˆ2 = Y•2• − Y••• = 2.6875 − 2.5625 = 0.125 βˆ3 = Y•3• − Y••• = 2.9125 − 2.5625 = 0.35 El efecto estimado de la interacción entre el nivel 1 del factor A y el nivel 2 del factor B: ∧
(αβ )12 = Y12• − Y1•• − Y•2• + Y••• = 2.3 − 2.3583 − 2.6875 + 2.5625 = −0.1833 El efecto estimado del error ε234:
εˆ234 = Y234 − Y23• − Y••4 + Y••• = 3.4 − 3.125 − 2.85 + 2.5625 = −0.0125
Ing. Raúl Eyzaguirre Pérez
[email protected]
118
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
4.3. Análisis de Variancia En este modelo la variabilidad total se descompone de la siguiente manera: Variabilidad (Total) = Var (Tratamientos) + Var (Bloques) + Var (Error) donde a su vez, la variabilidad correspondiente a los tratamientos se descompone en: Variabilidad (Tratamientos) = Var (Factor A) + Var (Factor B) + Var (Interacción AB) La variabilidad total es cuantificada por la suma de cuadrados total: p
q
p
b
q
b
SC(Total) = SC(Y ) = ∑∑∑ (Yijk − Y••• ) 2 = ∑∑∑ Yijk2 − i =1 j =1 k =1
donde
i =1 j =1 k =1
2 Y••• pqb
2 Y••• es el término de corrección (TC). pqb
La variabilidad correspondiente a los tratamientos, la cual corresponde al efecto combinado de los factores A y B, se calcula por: p
q
SC(Comb. AB) = SC(A) + SC(B) + SC(AB) = ∑∑ i =1 j =1
Yij2• b
− TC
Las sumas de cuadrados para los factores A y B, para la interacción, bloques y error se calculan de la siguiente manera: Yi••2 − TC i =1 qb p
SC(A) = ∑ q
Y•2j •
j =1
pb
SC(B) = ∑
− TC
SC(AB) = SC(Comb. AB) – SC(A) – SC(B) Y••2 k − TC k =1 pq b
SC(Bloques) = ∑
SC(Error) = SC(Total) - SC(Comb. AB) – SC(Bloques) Estas fuentes de variación son comparadas mediante el siguiente procedimiento de prueba de hipótesis a partir del cuadro de análisis de variancia (Cuadro ANVA):
Ing. Raúl Eyzaguirre Pérez
[email protected]
119
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
Cuadro ANVA Fuentes de Variación
Grados de Libertad (gl)
Sumas de Cuadrados (SC)
Bloques
b–1
SC(Bloques)
A
p–1
SC(A)
SC( A) gl( A)
CM( A) CM(Error)
B
q–1
SC(B)
SC( B) gl( B )
CM( B) CM(Error)
(p – 1)(q-1)
SC(AB)
SC( AB) gl( AB )
CM( AB) CM(Error)
(pq – 1)( b – 1)
SC(Error)
SC(Error) gl(Error)
pqb – 1
SC(Total)
AB Error Experimental Total
Cuadrados Medios (CM) SC(Bloques) gl(Bloques)
Fc
Hipótesis: Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los niveles de los factores las siguientes: Para el efecto principal de A:
H0: αi = 0 ∀ i H1: αi ≠ 0 para al menos algún i
Para el efecto principal de B:
H0: βj = 0 ∀ j H1: βj ≠ 0 para al menos algún j
Para el efecto de la interacción AB: H0: (αβ)ij = 0 ∀ i, j H1: (αβ)ij ≠ 0 para al menos algún i, j Para el Modelo II (Efectos aleatorios) las hipótesis serán planteadas en términos de la variancia de los niveles de los factores: Para el efecto principal de A:
H0: σ α2 = 0 H1: σ α2 > 0
Para el efecto principal de B:
H0: σ β2 = 0 H1: σ β2 > 0
2 Para el efecto de la interacción AB: H0: σ αβ =0 2 H1: σ αβ >0
Ing. Raúl Eyzaguirre Pérez
[email protected]
120
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
Estadístico de Prueba: Para el efecto principal de A:
Fc =
CM(A) ~ F( gl( A),gl(Error) ) CM(Error)
Para el efecto principal de B:
Fc =
CM(B) ~ F( gl( B ),gl(Error) ) CM(Error)
Para el efecto de la interacción AB:
Fc =
CM(AB) ~ F( gl( AB ),gl(Error) ) CM(Error)
Regla de Decisión: Las hipótesis nulas se rechazan con un nivel de significación α si el Fc resulta mayor que el valor de tabla F(1−α ) con los grados de libertad correspondientes a cada caso. La primera hipótesis a evaluar es la correspondiente a la interacción. Que no exista interacción significa que el efecto de un factor es el mismo en cualquiera de los niveles del otro, por lo que las conclusiones para los factores se obtendrán a partir del análisis de sus efectos principales. Si en cambio existe interacción, el efecto de un factor dependerá de los niveles del otro y el análisis de los efectos principales no será apropiado. En este caso se deberá efectuar un análisis de los efectos simples de los factores. Ejemplo 2 (Cont.): A continuación se presenta el análisis de variancia y las prueba de hipótesis correspondiente para el ejemplo tratado en esta sección: p
q
b
SC(Total) = ∑∑∑ Yijk2 − i =1 j =1 k =1
2 Y••• pqb
= (1.92 + 2.32 + ... + 3.42 ) − p
q
SC(Comb. AB) = ∑∑ i =1 j =1
=
Yij2• b
61.52 = 6.0763 (2)(3)(4)
− TC
8.32 9.22 12.52 61.52 + +" + − = 4.4738 4 4 4 (2)(3)(4)
Yi••2 − TC i =1 qb p
SC( A) = ∑ =
28.32 33.22 61.52 + − = 1.0004 (3)(4) (3)(4) (2)(3)(4)
Ing. Raúl Eyzaguirre Pérez
[email protected]
121
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
q
Y•2j •
j =1
pb
SC( B) = ∑
Experimentos Factoriales
− TC
16.7 2 21.52 23.32 61.52 = + + − = 2.91 (2)(4) (2)(4) (2)(4) (2)(3)(4) SC(AB) = SC(Comb. AB) – SC(A) – SC(B) = 4.4738 – 1.0004 – 2.91 = 0.5633 Y••2 k − TC k =1 pq b
SC(Bloques) = ∑ =
14.12 14.92 15.42 17.12 61.52 + + + − = 0.8046 (2)(3) (2)(3) (2)(3) (2)(3) (2)(3)(4)
SC(Error) = SC(Total) – SC (Comb. AB) – SC(Bloques) = 6.0763 – 4.4738 – 0.8046 = 0.7979 Cuadro ANVA Fuentes de Variación
gl
SC
CM
Fc
Bloques A B AB Error Experimental Total
3 1 2 2 15 23
0.8046 1.0004 2.9100 0.5633 0.7979 6.0763
0.2682 1.0004 1.4550 0.2817 0.0532
18.81 27.35 5.30
Para un modelo de efectos fijos las hipótesis serán: Para el efecto principal de A:
H0: αi = 0 i = 1, 2. H1: αi ≠ 0 para al menos algún i
Para el efecto principal de B:
H0: βj = 0 j = 1, 2, 3. H1: βj ≠ 0 para al menos algún j
Para el efecto de la interacción AB: H0: (αβ)ij = 0 i = 1, 2; j = 1, 2, 3. H1: (αβ)ij ≠ 0 para al menos algún i, j Para la interacción el estadístico de prueba es Fc = 5.30 y el valor de tabla, con un nivel de significación del 5% es F( 0.95, 2,15) = 3.68. Dado que el estadístico de prueba resulta mayor que el valor de tabla se rechaza H0 y se concluye que hay suficiente evidencia estadística para aceptar la existencia de interacción entre el tipo de abono y la dosis; por lo tanto, será necesario analizar los efectos simples de los factores en vez de sus efectos principales. El coeficiente de variación para este experimento es:
Ing. Raúl Eyzaguirre Pérez
[email protected]
122
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
cv =
Experimentos Factoriales
CME 0.0532 = 9% = Y••• 2.5625
4.4. Análisis de Efectos Simples Este análisis debe ser efectuado en el caso que la interacción resulte significativa y consiste en evaluar a cada factor en cada uno de los niveles del otro. Las hipótesis a contrastar en este caso, asumiendo un Modelo I (Efectos fijos) son las siguientes: 1. Para el efecto simple de A en el j-ésimo nivel de B: H0: µ1 j • = µ 2 j • = " µ pj • H1: Al menos un µij • es diferente. 2. Para el efecto simple de B en el i-ésimo nivel de A: H0: µi1• = µi 2• = " µiq• H1: Al menos un µij • es diferente. Los grados de libertad para cada efecto simple serán iguales a los grados de libertad del correspondiente efecto principal y las sumas de cuadrados son calculadas de acuerdo con las siguientes fórmulas: 1. Para el factor A en el j-ésimo nivel del factor B: p
Yij2•
i =1
b
SC(Abj) = ∑
−
Y•2j • pb
2. Para el factor B en el i-ésimo nivel del factor A: q
Yij2•
j =1
b
SC(Bai) = ∑
−
Yi••2 qb
Para cada efecto simple el estadístico de prueba Fc se calcula dividiendo el cuadrado medio del efecto simple entre el cuadrado medio del error. El efecto será significativo con un nivel de significación α si es que el Fc es mayor que el valor F de tabla con los grados de libertad del efecto y del error. Ejemplo 2 (Cont.): Análisis de los efectos simples. Yi12• Y•21• 8.32 8.42 16.7 2 SC(Ab1) = ∑ − = + − = 0.00125 pb 4 4 (2)(4) i =1 b p
Yi 22• Y•22• 9.22 12.32 21.52 SC(Ab2) = ∑ − = + − = 1.20125 pb 4 4 (2)(4) i =1 b p
Ing. Raúl Eyzaguirre Pérez
[email protected]
123
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
Yi 32• Y•23• 10.82 12.52 23.32 − = + − = 0.36125 pb 4 4 (2)(4) i =1 b p
SC(Ab3) = ∑ q
Y12j •
j =1
b
SC(Ba1) = ∑ q
SC(Ba2) = ∑ j =1
−
2 Y1•• 8.32 9.22 10.82 28.32 = + + − = 0.80167 qb 4 4 4 (3)(4)
Y22j •
Y22•• 8.42 12.32 12.52 33.22 − = + + − = 2.67167 b qb 4 4 4 (3)(4)
Cuadro ANVA para efectos simples Fuentes de Variación
gl
SC
CM
A b1 A b2 A b3 B a1 B a2 Error Experimental Total
1 1 1 2 2 15 23
0.00125 1.20125 0.36125 0.80167 2.67167 0.79792 6.07625
0.00125 1.20125 0.36125 0.40083 1.33583 0.05319
Fc 0.02 22.58 6.79 7.54 25.11
n.s. * * * *
Las hipótesis son: Para A en b1: H0: µ11• = µ 21• H1: µ11• ≠ µ 21• Para A en b2: H0: µ12• = µ 22• H1: µ12• ≠ µ 22• Para A en b3: H0: µ13• = µ 23• H1: µ13• ≠ µ 23• Para B en a1: H0: µ11• = µ12• = µ13• H1: Al menos un µ1 j • es diferente. Para B en a2: H0: µ 21• = µ 22• = µ 23• H1: Al menos un µ 2 j • es diferente. Los efectos simples del factor A son comparados con el valor de tabla F( 0.95, 1,15) = 4.54 y los efectos simples del factor B con F( 0.95, 2,15) = 3.68. Note que solo el efecto simple de A en b1 resulta no significativo. Las conclusiones en este experimento serían las siguientes: -
No existe suficiente evidencia estadística para aceptar que con los dos tipos de abono se obtengan resultados diferentes en el rendimiento de maíz cuando se aplican en la dosis b1 (20 kg/ha).
Ing. Raúl Eyzaguirre Pérez
[email protected]
124
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
-
Existe suficiente evidencia estadística para aceptar que con los dos tipos de abono se obtienen resultados diferentes en el rendimiento de maíz cuando se aplican en las dosis b2 (30 kg/ha) y b3 (40 kg/ha).
-
Existe suficiente evidencia estadística para aceptar que con al menos una de las dosis se obtienen resultados diferentes en el rendimiento de maíz tanto con el abono a1 como con el a2.
Estos resultados pueden apreciarse en el siguiente gráfico:
5. Pruebas de Comparación de Medias 5.1. Pruebas de comparación de medias de efectos principales Para comparar las medias de los niveles i y j de un factor sobre todos los niveles del otro utilice las siguientes fórmulas para las desviaciones estándar: Prueba
Factor A
Factor B
t y DLS
sd =
2CME qb
sd =
2CME pb
Tukey
sd =
CME qb
sd =
CME pb
5.2. Pruebas de comparación de medias de efectos simples Para comparar las medias de los niveles k y l de un factor en un nivel del otro utilice las siguientes fórmulas para las desviaciones estándar:
Ing. Raúl Eyzaguirre Pérez
[email protected]
125
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Prueba
Experimentos Factoriales
Factor A en bj
Factor B en ai
t y DLS
sd =
2CME b
sd =
2CME b
Tukey
sd =
CME b
sd =
CME b
Ejemplo 2 (Cont.): En el análisis de variancia de efectos simples se obtuvo resultados significativos para los efectos simples de A en b2, A en b3, B en a1 y B en a2. Dado que el factor A solo tiene dos niveles, no será necesario efectuar pruebas de comparaciones múltiples. En el factor B en cambio sí se podrían realizar comparaciones por pares entre sus tres niveles. A continuación se presenta la prueba de Tukey para B en a1. H0: µ11• = µ12• H1: µ11• ≠ µ12•
H0: µ11• = µ13• H1: µ11• ≠ µ13•
H0: µ12• = µ13• H1: µ12• ≠ µ13•
El valor de tabla con α = 5%, p = 3 tratamientos y 15 grados de libertad para el error experimental es AES(T) = 3.67. La amplitud límite significativa de Tukey es: ALS(T) = AES(T)
CME 0.05319 = 3.67 = 0.4232 b 4
A continuación se presentan los resultados para las 3 comparaciones: Niveles de B en a1
Y1i• − Y1 j •
Significancia
1y2 1y3 2y3
0.225 0.625 0.400
n.s. * n.s.
a1b1 2.075
a1b2 2.3
a1b3 2.7
Ejemplo 2 (Cont.): Ahora se aplicará la prueba t para evaluar si con el nivel 3 de B se obtienen mejores resultados que con el nivel 1 cuando se aplica el abono 2. H0: µ21• = µ23• H1: µ21• < µ23• El valor del estadístico de prueba es: tc =
Ing. Raúl Eyzaguirre Pérez
[email protected]
Y21• − Y23• 2.1 − 3.125 = = -6.29 2CME 2(0.05319) b 4 126
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
El valor de tabla con α = 5% y 15 grados de libertad para el error es t(0.05, 15) = -1.753. Como el estadístico de prueba resulta menor que el valor de tabla, se rechaza H0 y se concluye que existe suficiente evidencia estadística para aceptar que con la dosis 3 se obtienen mejores resultados que con la dosis 1 cuando se aplica el abono tipo 2. Ejemplo 3 (Experimento factorial en DCA): Los siguientes datos muestran los aumentos de peso en gramos de ratas machos bajo 6 tratamientos de alimentación en un experimento conducido en un DCA. Los factores en estudio y los resultados del experimento son: A: Fuente de proteína (a1 = Res, a2 = cereal, a3 = cerdo) B: Dosis de proteína (b1 = Baja, b2 = alta). a1 b1 88 74 90 83 335
a2 b2 83 102 108 104 397
b1 91 81 75 101 348
a3 b2 107 95 97 80 379
b1 64 83 74 73 294
b2 93 78 95 97 363
Modelo Aditivo Lineal: En este caso el diseño utilizado es un DCA por lo que el modelo aditivo lineal será el siguiente: Yijk = µ + α i + β j + (αβ )ij + ε ijk
i = 1,..., p
j = 1,..., q
k = 1,..., r
donde: Yijk es la ganancia de peso obtenida con la i-ésima fuente de proteína en la j-ésima dosis, k-ésima repetición. µ es el efecto de la media general. αi es el efecto de la i-ésima fuente de proteína. βj es el efecto de la j-ésima dosis de proteína. (αβ)ij es el efecto de la interacción en la i-ésima fuente de proteína, j-ésima dosis. εijk es el efecto del error experimental en la i-ésima fuente de proteína, j-ésima dosis, késima repetición. p = 3 es el número de niveles del factor A. q = 2 es el número de niveles del factor B. r = 4 es el número de repeticiones. Estimación de los efectos:
µˆ = Y••• = 88.17 Efectos estimados de los niveles del factor A:
αˆ1 = Y1•• − Y••• = 91.50 − 88.17 = 3.33 Ing. Raúl Eyzaguirre Pérez
[email protected]
127
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
αˆ 2 = Y2•• − Y••• = 90.88 − 88.17 = 2.71 αˆ 3 = Y3•• − Y••• = 82.13 − 88.17 = −6.04 Efectos estimados de los niveles del factor B:
βˆ1 = Y•1• − Y••• = 81.42 − 88.17 = −6.75 βˆ2 = Y•2• − Y••• = 94.92 − 88.17 = 6.75 Efecto estimado de la interacción en el nivel 1 del factor A y el nivel 2 del factor B: ∧
(αβ )12 = Y12• − Y1•• − Y•2• + Y••• = 99.25 − 91.50 − 94.92 + 88.17 = 1 El efecto estimado del error ε312:
εˆ312 = Y312 − Y31• = 83 − 73.5 = 9.5 Análisis de Variancia: 2 Y••• SC(Total) = ∑∑∑ Y − pqr i =1 j =1 k =1 p
q
r
2 ijk
= (882 + 742 + ... + 97 2 ) − p
q
SC(Comb. AB) = ∑∑ i =1 j =1
Yij2• r
21162 = 3329.33 (3)(2)(4)
− TC
3352 397 2 3632 21162 = + +"+ − = 1635.33 4 4 4 (3)(2)(4) Yi••2 − TC i =1 qr p
SC( A) = ∑ =
7322 727 2 657 2 21162 + + − = 439.58 (2)(4) (2)(4) (2)(4) (3)(2)(4) q
Y•2j •
j =1
pr
SC( B) = ∑
− TC
977 2 11392 21162 = + − = 1093.50 (3)(4) (3)(4) (3)(2)(4) SC(AB) = SC(Comb. AB) - SC(A) - SC(B) = 1635.33 – 439.58 – 1093.50 = 102.25 SC(Error) = SC(Total) - SC(Comb. AB) = 3329.33 – 1635.33 = 1694 Ing. Raúl Eyzaguirre Pérez
[email protected]
128
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
Cuadro ANVA Fuentes de Variación
gl
SC
CM
Fc
A B AB Error Experimental Total
2 1 2 18 23
439.58 1093.50 102.25 1694.00 3329.33
219.79 1093.50 51.13 94.11
2.34 11.62 0.54
Para un modelo de efectos fijos las hipótesis serán: Para el efecto principal de A:
H0: αi = 0 i = 1, 2, 3. H1: αi ≠ 0 para al menos algún i
Para el efecto principal de B:
H0: βj = 0 j = 1, 2. H1: βj ≠ 0 para al menos algún j
Para el efecto de la interacción AB: H0: (αβ)ij = 0 i = 1, 2, 3; j = 1, 2. H1: (αβ)ij ≠ 0 para al menos algún i, j
Para la interacción el estadístico de prueba es Fc = 0.54 y el valor de tabla, con un nivel de significación del 5% es F( 0.95, 2,18) = 3.55. Como el estadístico de prueba resulta menor que el valor de tabla no se rechaza H0, y se concluye que no hay suficiente evidencia estadística para aceptar la existencia de interacción entre la fuente de proteína y la dosis. Dado que la interacción resulta no significativa, las conclusiones para un factor serán independientes del otro; por lo tanto, se procede al análisis de los efectos principales. Para el factor A se obtiene un Fc de 2.34 menor que el valor de tabla F( 0.95, 2,18) = 3.55, por lo que no se rechaza H0, y se concluye que no existe suficiente evidencia estadística para aceptar que con al menos una de las fuentes de proteína se obtenga una ganancia de peso diferente en las ratas. Ing. Raúl Eyzaguirre Pérez
[email protected]
129
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
Para el factor B en cambio, se obtiene un Fc de 11.62 mayor que el valor de tabla F( 0.95, 1,18) = 4.41, por lo que se rechaza H0, y se concluye que sí existe suficiente evidencia estadística para aceptar que la ganancia de peso de las ratas es diferente en las dos dosis de proteína. El coeficiente de variación para este experimento es: cv =
Ing. Raúl Eyzaguirre Pérez
[email protected]
CME 94.11 = = 11% Y••• 88.17
130
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
Anexo: Salida de Minitab Ejemplo 2 General Linear Model: Y versus Bloques, A, B Factor Bloques A B
Type Levels Values fixed 4 1 2 3 4 fixed 2 1 2 fixed 3 1 2 3
Analysis of Variance for Y, using Adjusted SS for Tests Source Bloques A B A*B Error Total
DF 3 1 2 2 15 23
Seq SS 0.80458 1.00042 2.91000 0.56333 0.79792 6.07625
Adj SS 0.80458 1.00042 2.91000 0.56333 0.79792
Adj MS 0.26819 1.00042 1.45500 0.28167 0.05319
F 5.04 18.81 27.35 5.30
P 0.013 0.001 0.000 0.018
Ejemplo 3 General Linear Model: Y versus A, B Factor A B
Type Levels Values fixed 3 1 2 3 fixed 2 1 2
Analysis of Variance for Y, using Adjusted SS for Tests Source A B A*B Error Total
DF 2 1 2 18 23
Seq SS 439.58 1093.50 102.25 1694.00 3329.33
Ing. Raúl Eyzaguirre Pérez
[email protected]
Adj SS 439.58 1093.50 102.25 1694.00
Adj MS 219.79 1093.50 51.13 94.11
F 2.34 11.62 0.54
P 0.125 0.003 0.590
131
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
Ejercicios 1. En la tabla que se presenta a continuación se presentan los tiempos de supervivencia en horas de animales asignados aleatoriamente a tres venenos (v1, v2, v3) y tres antídotos (a1, a2, a3). El experimento fue parte de una investigación para combatir los efectos de ciertos agentes tóxicos y el diseño fue un DCA. Rep. 1 2 3 4
a1 4.5 4.4 4.2 3.9
v1 a2 6.3 6.9 6.4 6.5
a3 3.5 3.5 4.0 3.2
v2 a2 4.0 3.5 4.0 4.1
a1 4.1 3.9 3.6 4.1
a3 3.6 3.1 3.5 3.9
v3 a2 4.8 4.3 3.9 4.2
a1 4.2 4.3 3.8 4.7
a3 3.9 3.6 4.0 4.1
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos del enunciado. b) Efectúe el análisis gráfico de la interacción. c) Efectúe el análisis de variancia. Analice los efectos principales o simples según corresponda. d) Efectúe la prueba de Tukey para evaluar si existen diferencias entre los venenos cuando se aplica el antídoto a2. e) Se cree que el antídoto a2 es más efectivo que el a1 para contrarrestar al veneno v1. Efectúe la prueba correspondiente. 2. Se realizó un experimento para evaluar el efecto del estrógeno en la ganancia de peso en ovejas. Las ovejas fueron bloqueadas por corral con seis tratamientos por bloque. Los tratamientos resultaron de las combinaciones del sexo de las ovejas (s1, s2)y el nivel de estrógeno (d1, d2, d3). La dosis d1 fue un testigo (sin la aplicación de estrógeno) y d3 la dosis mayor. Los resultados en libras se presentan en la siguiente tabla. Bloque 1 2 3 4
d1 45 50 42 46
s1 (Machos) d2 57 53 63 60
d3 57 55 65 61
d1 40 45 43 39
s2 (Hembras) d2 49 52 53 50
d3 52 56 55 55
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos del enunciado b) Efectúe el análisis gráfico de la interacción. c) Efectúe el análisis de variancia. Analice los efectos principales o simples según corresponda. d) Efectúe la prueba de Tukey para evaluar si existen diferencias entre las dosis. 3. Una compañía grande de productos alimenticios realizó un experimento para investigar el efecto de dos factores, el material de la envoltura de los paquetes y el color de la Ing. Raúl Eyzaguirre Pérez
[email protected]
132
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
envoltura, sobre las ventas de uno de sus productos. Se utilizaron dos tipos de material (a1=Papel encerado y a2=Plástico), en tres colores (b1=Amarillo, b2=Rojo y b3=Verde). Se seleccionaron 4 supermercados para el experimento y después de estar el producto en el mercado por una semana se registró la venta total (en miles de soles) para cada una de las 6 combinaciones. Los resultados se muestran a continuación: Supermercado Amarillo 1 2.6 2 1.8 3 2.4 4 2.6
Papel encerado Rojo Verde 2.7 2.2 2.3 1.5 2.2 1.8 2.9 2.5
Amarillo 2.9 1.9 2.4 2.8
Plástico Rojo 3.0 2.5 2.8 3.2
Verde 2.4 1.8 2.1 2.7
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos del enunciado b) Efectúe el análisis gráfico de la interacción. c) Efectúe el análisis de variancia. Analice los efectos principales o simples según corresponda. d) Efectúe la prueba de Tukey donde sea necesario. 4. Se realizó un experimento para evaluar el efecto de tres densidades de siembra (d1, d2, d3) con tres variedades de frijol (v1, v2 y v3), en el rendimiento de frijol en kg/parcela. El diseño utilizado para el experimento fue un DBCA. Bloque I II III
d1 10.05 8.71 9.9
v1 d2 9.66 8.45 8.05
d3 9.14 9.02 8.01
d1 10.71 9.45 9.25
v2 d2 10.35 10.24 11.1
d3 11.42 12.91 11.5
d1 9.03 8.54 7.24
v3 d2 10.46 10.5 8.85
d3 13 10.1 11.57
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos del enunciado b) Efectúe el análisis gráfico de la interacción. c) Efectúe el análisis de variancia. Analice los efectos principales o simples según corresponda. d) Efectúe la prueba de Tukey en donde sea necesario. e) A partir de los resultados obtenidos en las preguntas anteriores, presente sus recomendaciones. 5. En un experimento de algodón se analizaron 3 distanciamientos entre matas y dos dosis de nitrógeno, en 4 campos de cultivo (bloques). A: Distanciamiento entre matas (25, 37.5 y 50 cm) B: Abonamiento nitrogenado (50 y 100 kg de N por ha) Y: Rendimiento por parcela (en libras).
Ing. Raúl Eyzaguirre Pérez
[email protected]
133
Departamento de Estadística e Informática Curso: Métodos Estadísticos para la Investigación I
Experimentos Factoriales
a1 Campo 1 2 3 4
b1 9.56 9.32 8.96 8.78
a2 b2 8.26 8.50 8.42 8.26
b1 9.18 8.86 8.22 8.70
a3 b2 8.90 8.50 9.82 9.78
b1 8.26 8.64 8.10 8.72
b2 9.82 9.84 9.7 10.04
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos del enunciado. b) Efectúe el análisis gráfico de la interacción. c) Efectúe el análisis de variancia. Analice los efectos principales o simples según corresponda. d) Mediante la prueba DLS compare a1b2 con a3b2. 6. Con la finalidad de estudiar el efecto de tres niveles de Nitrógeno (a1, a2, a3) y dos niveles de fósforo (b1, b2), en el cultivo de una variedad de papa se realizó un experimento con un arreglo factorial conducido en el DCA con 4 repeticiones. Los resultados obtenidos en kg/parcela son los siguientes: a2
a1 Repetición 1 2 3 4
b1 31 32 34 35
b2 43 41 43 39
b1 42 38 36 41
a3 b2 45 46 44 43
b1 48 50 48 51
B2 51 47 50 52
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos del enunciado. b) Efectúe el análisis gráfico de la interacción. c) Efectúe el análisis de variancia. Analice los efectos principales o simples según corresponda. d) Efectúe la prueba de Tukey en donde sea necesario.
Ing. Raúl Eyzaguirre Pérez
[email protected]
134