UNIVERSIDAD NACIONAL DEL ALTIPLANO - PUNO
Facultad de Ciencias Agrarias Facultad de Ingeniería Estadística e Informática
α2
R.C.
1− α
R.R./Ho:
Aceptar Ho:
α 2
R.R./Ho:
ANÁLISIS Y DISEÑO DE EXPERIMENTOS PREPARADO POR: VLADIMIRO IBAÑEZ QUISPE, Dr.
Puno, Abril del 2009
- ii -
V. Ibañez Q. - Docente FINESI - UNA - Puno
VLADIMIRO IBAÑEZ QUISPE Ingeniero Estadístico, UNA - Puno - Perú. M.Sc. en Informática Dr. en Administración Profesor Principal - Facultad de Ingeniería Estadística e Informática. Derechos Reservados: Ninguna parte de este guía puede ser reproducida sin la autorización del autor.
[email protected] © 2009, Editorial Universitaria. Primera Edición: 2009 Impreso en Puno - Perú. Ciudad Universitaria. Apartado 291. Fax (054) 352992. Puno - Perú Diagramación y Composición: Vladimiro Ibañez Quispe
Análisis y Diseño de Experimentos - iii -
PRESENTACIÓN
La presente publicación «Análisis y Diseño de Experimentos» está dirigido a los estudiantes de pre-grado y post-grado, muy especialmente a estudiantes de la Escuela Profesional de Ingeniería Agroindustrial y áreas afines que necesitan de las herramientas estadísticas para poder aplicarlo en el proceso de la investigación científica, y sea una ayuda para generar conocimientos en la ingeniería. En los procesos industriales se trabaja bastante con factores cuantitativos, lo que obliga a desarrollar metodologías orientadas y adecuadas para resolver los problemas de la investigación, tales como el análisis de regresión, los diseños experimentales básicos, experimentos factoriales (dos factores cuantitativos), superficie de respuesta (diseño central compuesto, diseño de Placket-Burman, EVOP, etc.). Estas metodologías necesitan ensayar en un proceso en el cual interviene los diferentes factores en estudio, lo que a veces se convierte muy complejo resolver en forma manual, y necesariamente se recurre a los software estadísticos adecuados para realizar los análisis respectivos. Actualmente existen varios software estadísticos con diferentes bondades, por lo que el investigador, se debe adaptar paulatinamente para el procesamiento de la información entre ellos podemos mencionar: Statistica, Statgraphics, Minitab, Stata, SPSS, SAS, etc., lo importante es que nos permite manipular la información recopilada (crudo) y posteriormente ésta información se convierte en conocimiento. Espero que esta publicación les permita orientar en el uso de las metodologías estadísticas para el proceso de la investigación, despertar a la mente y motivar en la conducción de la investigación acorde a nuestro medio. El autor estará plenamente agradecido y se sentirá mejor para publicar otros textos, si los interesados observan cualquier error, redacción, fórmulas, etc. y las sugerencias se reciben en viq_ibañ
[email protected] El autor Abril, 2009
- iv -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Análisis y Diseño de Experimentos - v -
ÍNDICE Pág. CAPÍTULO 1: ANÁLISIS DE REGRESIÓN 1.1. Regresión Lineal Simple (RLS)......................................................... 02 Propiedades del modelo.................................................................... Diagrama de dispersión.................................................................... Estimación de la ecuación de regresión.......................................... Interpretación del coeficiente de regresión β$ 1 ............................... Prueba de hipótesis para ( β 1 )......................................................... Intervalo confidencial (IC) para ( β 1 ).............................................. Intervalo de confianza para la predicción........................................ i) Intervalo de confianza para la respuesta media E ( Yh ) ................... ii) Intervalo de Confianza para la predicción o futura
03 03 04 07 10 11 11 11
Yh ( New ) ......... 12
1.2. Correlación........................................................................................ Coeficiente de correlación de Pearson ............................................. Prueba de hipótesis para la correlación ( ρ )................................... Intervalo confidencial (IC) para ( ρ ).............................................. Coeficiente de Determinación R2, R2ajustado ........................................ Análisis gráfico de residuos ............................................................ Ejercicios .......................................................................................
28 28 29 30 30 31 36
1.3. Regresión Lineal Múltiple (RLM)..................................................... 40 Estimación de los parámetros del modelo........................................ Estimación de los parámetros ( β 0 , β 1 ,L , β k )(Forma matricial)....... Consecuencias de la Estimación....................................................... Prueba de Hipótesis en Regresión Lineal Múltiple............................ Pruebas sobre coeficientes individuales del modelo........................... Intervalos de Confianza y predicción en Regresión Lineal Múltiple... a) Intervalo Confidencial (IC) para β j ..............................................
41 42 46 46 48 49 49
b) IC para la respuesta media de E ( Y0 ) dado el vector X'0 .............. 50
- vi -
V. Ibañez Q. - Docente FINESI - UNA - Puno Pág. c) ICpara la predicción de nuevas observaciones Yh ( new ) ................... 52 Correlaciones Parciales .................................................................. 61 Prueba de hipótesis parciales........................................................... 61 Ejercicios ....................................................................................... 80
1.4. Regresión Curvilineal o no lineales.................................................... 83 A) Caso exponencial: Y = abX.......................................................... 83 B) Función potencial o curva geométrica: Y = aXb........................... 87 C) Caso parabólico (Función de Segundo Grado)............................. 91 CAPÍTULO 2: ASPECTOS GENERALES DEL DISEÑO 2.1. ¿Qué es un experimento?.............................................................. 2.2. Objetivos de un experimento......................................................... 2.3. Unidad experimental (UE)............................................................ 2.4. ¿Qué es un tratamiento? .............................................................. 2.5. Error experimental (EE)............................................................... 2.6. Principios básicos del diseño experimental....................................
95 96 96 96 96 97
CAPÍTULO 3: DISEÑO COMPLETAMENTE AL AZAR (DCA, DIA) 3.1. Diseño completamente al azar (balanceado o equilibrado).............. Características ............................................................................. Arreglo de campo ........................................................................ Modelo estadístico lineal .............................................................. Esquema del diseño ...................................................................... Ventajas ....................................................................................... Desventajas ................................................................................. Descomposición de la suma de cuadrados total ............................. Análisis de Varianza (ANOVA) .................................................... 3.2. Diseño Completamente al azar (desbalanceado)............................. Metodología de la forma matricial.................................................
103 103 104 104 105 105 105 106 107 115 122
Intervalo Confidencial (IC)
µ i • − µ j• ........................................ 124
Ejercicios..................................................................................... 3.3. Diseño completo al azar con igual numero de subunidades por unidad experimental............................................................... Características ............................................................................. Casos ilustrativos .........................................................................
129 131 131 131
Análisis y Diseño de Experimentos - vii Pág. Muestreo aleatorio....................................................................... Análisis estadísticos.................................................................... Análisis de varianza..................................................................... Ejercicio...................................................................................... 3.4. Diseño Completamente al azar con submuestreo (desbalanceado).. Forma matricial ............................................................................
132 132 133 137 137 143
CAPÍTULO 4: DISEÑO BLOQUE COMPLETO AL AZAR (DBCA) 4.1. Diseño bloque completo al azar ................................................... Características ............................................................................. Ventajas ....................................................................................... Desventajas ................................................................................. Esquema del diseño bloque compelto al azar............................... Modelo lineal aditivo ................................................................... Análisis de Varianza (ANOVA) .................................................... 4.2. Diseño bloque completo al azar con submuestreo........................... 4.3. Análisis funcional de la varianza .................................................. 4.4. Curva de respuesta ........................................................................ 4.5. Ajuste de la función de respuesta .................................................. Ejercicios .....................................................................................
151 151 153 154 155 155 157 164 170 180 185 192
CAPÍTULO 5: PRUEBAS DE COMPARACIÓN MÚLTIPLE DE MEDIAS 5.1. Prueba t de Student ....................................................................... 194 5.2. Diferencia Límite Significativa (DLS)........................................... 199 5.3. Prueba de Comparaciones múltiples de Duncan............................. 202 5.4. Prueba de comparación múltiple Tukey......................................... 209 5.5. Prueba de comparación de Dunnett.............................................. 213 5.6. Prueba de comparación múltipl de Studente-Newman-Keuls (SNK). 216 5.7. Prueba de Scheffe........................................................................ 219 5.8. Transformación de datos ............................................................... 220 CAPÍTULO 6: DISEÑO CUADRADO LATINO (DCL) 6.1. Características del diseño.............................................................. Ventajas ........................................................................................ Desventajas ................................................................................. Modelo estadístico lineal............................................................... Hipótesis..................................................................................... Estimación de los parámetros del modelo.....................................
224 225 225 225 226 227
- viii -
V. Ibañez Q. - Docente FINESI - UNA - Puno Pág.
Análisis de Varianza (ANOVA).................................................... 228 Ejercicios ..................................................................................... 236 6.2. Diseño Cuadrado Grecolatino (DCGL) .......................................... 238 CAPÍTULO 7: EXPERIMENTOS FACTORIALES Introducción................................................................................. Objetivos..................................................................................... Ventajas..................................................................................... Desventajas................................................................................. Elección de los factores................................................................ Tipos de factores............................................................................ Clasificación de los factores.......................................................... 7.1. Experimento factorial de la serie 2n............................................ 7.1.1. Experimento factorial bajo el DCA................................. Método 1: Ajuste de la función de respuesta................... Método 2: Ajuste de la función de respuesta................... 7.1.2. Experimento factorial bajo del DBCA............................... Ejercicios ...................................................................... 7.2. Experimento factorial de la serie 3n............................................ 7.2.1. Experimento factorial bajo el DCA................................. 7.2.2. Experimento factorial bajo el DBCA................................. 7.2.3. Experimentos con factores cuantitativos (dos factores) ....... Ejercicios ......................................................................
245 246 246 246 247 247 248 238 252 265 267 269 274 276 277 287 298 306
CAPÍTULO 8: MÉTODOS Y DISEÑO DE SUPERFICIE DE RESPUESTA Diseño para ajustar modelos de segundo orden ........................... 310 Diseño Compuesto Central (DCC) ............................................... 311 Diseños rotatorios para mejorar superficie de respuesta................ 315 Determinación de α en el Diseño Central Compuesto (CCD)...... 316 Estimación del modelo para diseño rotables y compuestos............. 320 Análisis de varianza para diseños rotables y compuestos................ 326 Soluciones óptimas ...................................................................... 333 Aplicaciones con software estadístico ........................................... 336 Ejercicios ..................................................................................... 351 CAPÍTULO 9: DISEÑO Y ANÁLISIS DE PARCELAS DIVIDIDAS 9.1. Diseño de parcela dividida (Split plot design) ............................. 355 Características del diseño de parcela dividida ............................... 355
Análisis y Diseño de Experimentos - ix Pág. Ventajas y desventajas .................................................................. Aleatorización ............................................................................ Arreglo de campo ....................................................................... 9.1.1. Diseño de parcela dividida bajo el DCA........................... Ajuste para comparación de medias.................................. 9.1.2. Diseño de parcela dividida bajo el DBCA......................... 9.2. Diseño de parcela subdivididas (Split split plot design) ............... 9.3. Diseño de parcelas en franja ........................................................ Ejercicios .....................................................................................
356 357 357 358 361 363 380 387 395
CAPÍTULO 10: ANÁLISIS DE COVARIANZA (ANCOVA) Usos del análisis de covarianza .................................................... Suposiciones del análisis de covarianza ........................................ Modelos estadísticos para el análisis de covarianza ...................... ANCOVA bajo el diseño completo al azar ..................................... ANCOVA en un arreglo factorial .................................................. Análisis de Covarianza Múltiple.................................................. Ejercicios .....................................................................................
397 398 399 400 415 421 426
Bibliografía consultada ........................................................................ 429 Tablas estadísticas ................................................................................. 433
Análisis y Diseño de Experimentos - 1 -
1 ANÁLISIS DE REGRESIÓN El término regresión viene del Latín regresio: que significa regreso, vuelta, retroceso y fue usado por primera vez como concepto estadístico en 1877 por Sir Francis Galtón, quién efectuó un estudio demostrando que la altura de los hijos de padres altos tendía a retroceder o «regresar», hacia la talla media de la población; regresión fue el nombre que le dió al proceso general de predecir una variable (la talla de los niños) a partir e otra (la talla de los padres). Más tarde, los estadísticos acunaron la expresión regresión múltiple para describir el proceso en virtud del cual se emplean algunas variables para predecir otra. Los métodos de regresión, se utiliza para analizar datos que provienen de experimentos que no fueron diseñados, este es el caso del estudio de fenómenos no controlados o de registros históricos. Los métodos de regresion se usan para determinar la «mejor» relación funcional entre las variables, mientras que los métodos de correlación se utilizan para medir el grado de asociación de las distintas variables. En pocas palabras, regresión es la cantidad de cambio de una variable asociado a un cambio único de otra variable. El principal objetivo del análisis de la regresión es realizar predicciones. La regresión permite determinar si existe relación entre las variables en estudio (X e Y), para lo cual se utiliza el comportamiento de una variable (X = independiente), para predecir el comportamiento de otra variable (Y = dependiente). Las dos características son medibles.
-2-
V. Ibañez Q. - Docente FINESI - UNA - Puno
Usos de la Regresión: - Para hacer predicciones futuras de Y, teniendo como base la X. - Para ver si la variable (Y) depende de otra (X), estimando por consiguiente la medida de dicha relación o asociación. - Para determinar la forma de la curva de la regresión. - Para conocer el error real implicado en un experimento, después que haya sido descontado el efecto de una variable relacionada. - Sirve de base para el análisis estadístico. Como se manifestó el objeto principal de la regresión es realizar predicciones como: - Predecir el tiempo meteorológico basado en los datos del pasado. - Predecir la performance de un toro basado en sus antepasados. - Predecir la producción de lana/año, basado en los años anteriores. - Predecir la calidad genética de una vaca, basado en sus antepasados. - Predecir la producción de semen en carneros basado en el tamaño testicular. - etc.. 1.1. REGRESIÓN LINEAL SIMPLE (RLS). Consideremos una variable dependiente Y con una sola variable independiente X. Representemos una muestra aleatoria de tamaño “n” de (X,Y) por el conjunto de pares de datos: {(xi,yi)/i = 1,2,...,n}. La relación entre variables es aquel que se considera únicamente dos variables, a estas designamos por «Y» y «X», donde «Y» es la variable dependiente ó variable de respuesta y «X» la variable independiente ó predictor. El modelo de regresión lineal consiste en especificar la forma de la relación lineal, es decir:
Yi = β 0 + β1X i + ε i ,
i = 1,2,..., n
Donde: Yi = Variable dependiente. Xi = Variable independiente.
β 0 = Parámetro desconocido que indica la ordenada donde la línea de regresión lo intersecta.
β 1 = Parámetro desconocido que indica la pendiente de la línea de mejor ajuste, llamada también coeficiente de regresión poblacional.
ε i = Error de perturbación que puede tomar valores positivos o negativos.
Análisis y Diseño de Experimentos - 3 Propiedades del modelo: a) Toda perturbación aleatoria tiene de media cero, es decir: i = 1,2,...,n. Ε( ε i ) = 0 , b) Todas las perturbaciones aleatorias tienen la misma varianza (homoscedasticidad). i = 1,2,...,n. V(ε i ) = σ 2i c) Las perturbaciones son independientes entre sí: cov( ε i , ε j ) = 0, i ≠ j
Yi E(Y) = β0 + β1Xi Yj
UVε W .
UV ε W
j
i
Yi
X1
X2
X3
X4
Xi
Suposiciones en regresión Diagrama de dispersión. Una vez recopilada la serie de «n» observaciones bidimensionales, cada par de valores (X,Y) en el plano cartesiano o rectángular está representado por un punto, y habra tantos puntos como parejas de observaciones que tenga. Esta representación da origen a una nube de puntos que se denomina diagrama de dispersión ó esparcimiento; este diagrama puede tener diferentes formas. Esta es la forma más usual para detectar si la función es lineal, exponencial, potencial, cuadrática, cúbica, etc. al cual el experimentador ajustará su información recopilada, de tal forma que describa adecuadamente la relación entre las variables en estudio.
Eje Y
Eje Y
Eje Y
V. Ibañez Q. - Docente FINESI - UNA - Puno
Eje Y
-4-
Eje X
Eje X
Eje X
Eje X
Lineal positiva
Lineal negativa
No Lineal
Ninguna relación
Estimación de la ecuación de regresión. En el análisis de regresión lineal simple, se busca una línea de tal forma que la sumatoria de los errores de todas las observaciones con respecto a la línea sea mínima, para lograr la estimación de los parámetros desconocidos ( β 0 y β 1 ), se utiliza el método de «Mínimos Cuadrados». Este método consiste en encontrar los valores
β 0 y β 1 de la ecuación de regresión muestral, de manera que la suma de los cuadrados de todos los residuos ε i (suma de cuadrados del error: SCE) alrededor de la línea de regresión sea mínima. Para estimar los parámetros se partirá del modelo original, que está expresada en la siguiente ecuación:
Yi = β 0 + β1X i + ε i ,
i = 1,2,..., n
ε i = Yi − β 0 − β1X i
b
g
ε 2i = Yi − β 0 − β1X i elevando al cuadrado.
∑ ε = ∑ bY − β n
n
2 i
i
i =1
0
2
− β1 X i
i =1
g aplicando sumatoria. 2
Para encontrar las Ecuaciones Normales se usan las derivadas parciales con respecto a los parámetros desconocidos β 0 y β 1 , entonces tenemos: n
∂∑ ε 2i a)
i=1
∂β 0
n
=0
∂ ∑ ε 2i y
b)
i=1
∂β1
=0
Análisis y Diseño de Experimentos - 5 ∂
n
i
0
− β1X i
i =1
De a) n
LM∑ bY − β N
∂ β0
b
g OPQ 2
= 0 , entonces se tiene que:
g
2 ∑ Yi − β 0 − β1X i ( −1) = 0 , haciendo operaciones elementales se tiene la prii =1
mera ecuación normal, pero por la propiedad de la sumatoria de una constantes es: n
∑ β$
0
= nβ$ 0
i =1
n
n
i =1
i =1
nβ$ 0 + β$ 1 ∑ X i = ∑ Yi ∂
De b)
LM∑ bY − β N n
i
0
− β1X i
i =1
∂ β1
g OPQ 2
n
b
L i)
g
= 0 , 2∑ Yi − β 0 − β1X i ( − X i ) = 0 , igual que la i =1
primera ecuación, se encuentra, la segunda ecuación normal. n
n
n
i =1
i =1
i =1
β$ 0 ∑ Xi +β$ 1 ∑ X2i = ∑ Xi Yi
L ii)
En resumen de a) y b) se tiene las Ecuaciones Normales: n
n
i =1
i =1
nβ$ 0 + β$ 1 ∑ X i = ∑ Yi n
n
n
i =1
i =1
i =1
β$ 0 ∑ X i +β$ 1 ∑ X i2 = ∑ X i Yi El objetivo de estas ecuaciones normales es despejar los parámetros β 0 y β 1 , esto se consigue de la siguiente forma: De a) nβ$ 0 + β$ 1
n
n
∑ X = ∑ Y , despejando i
i =1
i
i =1
n
n
i =1
i =1
nβ$ 0 = ∑ Yi − β$ 1 ∑ X i y n
n
dividiendo entre «n» a ambos miembros tenemos: β$ 0 =
∑Y
i
i =1
n
− β$ 1
∑X i =1
n
i
-6-
V. Ibañez Q. - Docente FINESI - UNA - Puno
β$ 0 = Y − β$ 1X β$ 0 = Y − β$ 1X en la segunda Ecuación Normal se tiene:
Reemplazando
e
Y − β$ 1 X
j∑ n
i =1
n
n
X i +β$ 1 ∑ X 2i =
∑XY i
i =1
i
i =1
, y haciendo ope-
raciones elementales de álgebra, se llega a encontrar β$ 1 en dos formas siguientes para facilitar el cálculo. n
n
β$ 1 =
n
∑ X Y − Y∑ X i
i
i =1 n
∑X i =1
∑ cX i =1
i
i =1 n
− X∑ Xi
2 i
n
β$ 1 =
n
i
, ó β$ 1 =
∑X Y − i =1
∑X
hc
∑ cX n
i
−X
i =1
h
2
i
i =1
F I − G∑ X J H K
2 i
i
n
n
,ó
2
n
i
i =1
h
i =1
i
n
i =1
− X Yi − Y
i
n
∑X ∑Y
i =1
n
=
∑ X Y − nXY i
i
i =1 n
∑X
2 i
− nX 2
i =1
Otra forma de encontrar β$ 1 es usando la Regla de Cramer. n
n
U| V| ⇒ = ∑X Y |W
n
i =1 n
β$ 0 ∑ X i +β$ 1 ∑ X i =1
i =1
i =1 n
2 i
i
i
i =1 n
n
n
nβ$ 0 + β$ 1 ∑ X i = ∑ Yi
∑Y
n β$ 1 =
∑X ∑X Y i
i =1
i =1
n
∑ Xi i =1
∑X i =1 n
i
∑ X2i i =1
n
i
i =1 n
n
i
i
=
n∑ X i Yi − i =1
n
n∑ X 2i − i =1
Análisis y Diseño de Experimentos - 7 n
n
β$ 1 =
∑ X iYi − i =1 n
∑ X i2 − i =1
n
∑ X ∑Y i
i =1
i
i =1
n
FG ∑ X IJ H K n
2
i
n
i =1
Algunas veces, se expresa en términos de desviaciones β$ 1 , utilizando letras minúsculas para diferenciar de las observaciones que se denotan con letras mayúsculas, entonces en términos de desviaciones se expresa: n
β$ 1 =
∑x y i
i =1 n
∑x
i
=
2 i
Cov( X, Y) S XY = 2 V ( X) SX
i =1
La recta de regresión estimada es: Donde
$ = β$ + β$ X Y i 0 1 i
$ es el estimador para la media de la observación Yi, la cual corresY i
ponde al valor Xi de la variable de predicción.
$ = ( Y − β$ X) + β$ X = Y + β$ X − β$ X = Y + β$ ( X − X) Y i 1 1 i 1 i 1 1 i $ − Y = β$ (X − X) Y i 1 i Esta es otra forma expresar la recta de regresión. Observar que la recta de regresión contiene al punto ( x , y ) cuyos componentes son las medias X y de Y, respectivamente. Interpretación del coeficiente de regresión β$ 1 El valor constante β$ 0 de la ecuación de regresión muestral, es la ordenada con el origen. El valor de la pendiente β$ 1 es el cambio en una unidad de medición.
$ cuando Xi cambia Y i
-8-
V. Ibañez Q. - Docente FINESI - UNA - Puno
Si β$ 1 >0, entonces, la tendencia lineal es creciente, es decir, a mayores valores de X corresponden mayores valores de Y. También, a menores valores de X corresponden menores valores de Y. Si β$ 1 t α 2,(n-2) 5. Valor experimental. Se obtiene reemplazando valores en la función pivotal.
tc =
β$ 1 − β1 s.e.(β$ ) = , 1 s. e(β$ ) 1
s2
FG∑X IJ H K ∑X −− n
i
n
2 i
i=1
i=1
n
2
Análisis y Diseño de Experimentos - 11 6. Si tc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha: Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha: 7. Conclusión. Realizar la interpretación en base al paso 4) y concluir de acuerdo al tenor del problema.
Intervalo Confidencial (IC) para ( β 1 ).
Pr β$ 1 − t α ,( n −2 ) s. e.(β$ 1 ) ≤ β1 ≤ β$ 1 + t α ,( n−2 ) s. e.(β$ 1 ) = 1 − α 2
2
β1 ∈ β$ 1 ± t α ,( n − 2 ) s. e.(β$ 1 ) 2
Intervalos de Confianza (IC) para la predicción. Una vez que se ha encontrado que existe regresión lineal simple poblacional ó que la línea de regresión muestral es válida para realizar predicciones; entonces podemos realizar las predicciones. i) Intervalo de confianza para la respuesta media E ( Yh ) . Sea de
µY
Xh
el valor de la media cuando X = X h ó X = X 0 y sea Y$h el valor
Y$h = β$ 0 + β$ 1 X , cuando X = X h entonces Y$h = β$ 0 + β$ 1 X h . E ( Y$h ) = E ( β$ 0 + β$ 1 X h ) = β$ 0 + β$ 1 X h = µ Y
LM MN
OP PQ
Xh
1 ( X h − X )2 S 2 ( Y$h ) = MSE + n ∑ X i2 − nX 2 , la distribución muestral es:
LM MN
2 Y$h − Yh $ ) = MSE 1 + ( X h − X ) S ( Y ~ t( n − 2 ) ; tc = h n ∑ X i2 − nX 2 s( Y$h )
OP PQ
- 12 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Luego el intervalo confidencial del (1- α )x100% para la respuesta media se obtiene de la siguiente forma:
E ( Yh ) ,
Pr Y$h − tα 2 ,n − 2 S ( Y$h ) ≤ E ( Yh ) ≤ Y$h + tα 2 ,n − 2 S ( Y$h ) = 1 − α ii) Intervalo de Confianza para la predicción o futura Para obtener un intervalo confidencial de un sólo valor
Yh ( New ) . Yh ( New ) de la variable
Yh = β 0 + β 1 X h , se considera a la diferencia y$h( New ) − yh( New ) como un valor de la variable aleatoria Y$h( New ) − Yh( New ) . Primeramente se debe calcular: Y$h = β$ 0 + β$ 1 X h
LM MN
S 2 ( Y$h( New ) ) = MSE 1 +
OP PQ
LM MN
OP PQ
1 ( X h − X )2 1 ( X h − X )2 + = S 2 1+ + 2 2 n ∑ X i − nX n ∑ X i2 − nX 2 , la
distribución muestral es:
tc =
Y$h( New ) − Yh( New ) ~ t( n − 2 ) ; S ( Y$ ) h ( New )
LM MN
1 ( X h − X )2 S ( Y$h( New ) ) = S 2 1 + + n ∑ X i2 − nX 2
OP PQ
Luego el intervalo confidencial del (1- α )x100% para una sola respuesta o futura
Yh ( New ) , se obtiene de la siguiente forma: Pr Y$h − tα 2 ,n − 2 S ( Y$h ( New ) ) ≤ Yh ( New ) ≤ Y$h + tα 2 ,n − 2 S ( Y$h( New ) ) = 1 − α
EJEMPLO: En la tabla siguiente se presenta los resultados promedio de la evaluación sensorial de la naranja Valencia «control» a través del tiempo de almacenamiento, para este caso se establece el límite de aceptabilidad del producto, considerando un puntaje de 3.5 en la escala de: 6 (Excelente), 5 (Muy buena), 4 (buena), 3 (regular), 2 (mala) y 1 (inaceptable). Se presentan datos para el análisis sensorial de la naranja Washington Navel «Hipobárico» en s apariencia general externa.
Análisis y Diseño de Experimentos - 13 Tiempo (días) 0 13 25 AGE (Puntaje) 5.50 4.25 4.00 AGE: Apariencia General Externa.
35 3.75
50 3.40
61 2.25
68 1.75
86 1.25
93 1.00
a) Trace el diagrama de dispersión, b) Obtener la ecuación normal, c) Calcule la ecuación de regresión de Y sobre X, d) Grafique en el diagrama de dispersión la ecuación ajustada, e) Realice el ANVA, f) Pruebe la hipótesis para β1 ≠ 0 , g) Encuentre los intervalos confidenciales e intreprete en cada uno de las preguntas. SOLUCIÓN:
∑X
i
= 431, ∑ Yi = 27 .15, ∑ X i Yi = 913.25, ∑ X i2 = 28909 , ∑ Yi 2 = 10
X = 47 .89;
Y = 3.017
a) Diagrama de dispersión.
Apariencia general (puntaje)
6.00 5.00 4.00 3.00 2.00 1.00 0.00 0
20
40
60
Tiempo (días)
b) Obtener la ecuación normal.
9β$ 0 + 431β$ 1 = 27.15 431β$ + 28909β$ = 913.25 0
1
80
100
- 14 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
c) Encuentre la ecuación de regresión. 9
β$ 1 =
9
9
∑ X Y − ∑ X ∑Y i i
i
i =1
i =1
9
∑X
2 i
−
i =1
i
n =
i =1
FG ∑ X IJ H K 9
2
i
n
913.25 − ( 431 )( 27.15 ) 9 = −0.046793 28909 − ( 431 )2 9
i =1
β$ 0 = Y − β$ 1 X =
27 .15 9
b g = 5.257958559
− 0.046793872
Entonces, el modelo de regresión estimado es:
431 9
$ = β$ + β$ X , reemplazando Y i 0 1 i
se tiene:
Y$i = 5.25796 − 0.04679 X i De acuerdo a la ecuación estimada, se puede interpretar que por cada un día de incremento en el tiempo, deberá esperarse una reducción en la apariencia general externa en puntaje de 0.04679. d) Obtener la gráfica de la ecuación de regresión ajustada.
Apariencia gral (puntaje)
6.00
− 0.04679 Xi Y$i = 525796 .
5.00 4.00 3.00 2.00 1.00 0.00 0
20
40
60
Tiempo (días)
80
100
Análisis y Diseño de Experimentos - 15 e) Procedimiento para efectuar el análisis de varianza (ANOVA). Grados de libertad (G.L.) GLreg. = p - 1 = 2 - 1 = 1 GLerror = n - 2 = 9 - 2 = 7 GLtotal = n - 1 = 9 - 1 = 8 Sumas de Cuadrados (S.C. = S.S).
SSRm =
∑ X Y − d∑ X id∑ Y i ∑ X − d∑ X i n i i
i
i
2
2 i
2
n
=
913.25 − (431)(27.15) 9
b g
28909 − 431
i
2
2
9
= 18.10610911 n=9
n =9
( ∑ Yi )2
i =1
n
SSTm = ∑ Yi 2 −
i =1
= 100.6225 −
( 27.15 )2 = 18.72 14
SSE = SSTm − SSRm = 18.72 − 18.10610911 = 0.613890894 Tabla de Análisis de Varianza. F. de V. G.L. Debido a Regresión 1 Error residual 7 Total 8
S.S. 18.106109 0.613891 18.720000
M.S. 18.10611 0.08770 2.34000000
Fc. 206.46
Signif **
En el ANOVA precedente, podemos afirmar que existe diferencia estadística altamente significativa (P ≤ 0.01), esto implica que la variable independiente X (tiempo) influye sobre la variable dependiente Y (apariencia general), es decir las dos variables en estudio son dependientes, esto afirma que el modelo es bueno y para ratificar ésta aseveración se calcula el coeficiente de determinación (R2).
R2 =
18.10610911 SSRm x100 = x100 = 96.72% 18.72 SSTm
MSE 0.087698699 ~2 Rajust x100 = 1x100 = 96.25% . = 1− MSTm 2.34
- 16 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
El coeficiente de determinación ajustado
~2 Rajust . es alto por lo que existe una bondad
de ajuste bueno, es decir el modelo es confiable para realizar las predicciones hacia el futuro, recomendar que el modelo se puede usar en diferentes lugares para este tipo de evaluación sensorial de la naranja, tal como afirma Gutierrez, H. y De la Vara, R. (2004), para fines de predicción se recomienda el coeficiente de determinación ajustado al menos de 0.7 para que el modelo sea aceptable y confiable. Es importante indicar, si el modelo ajustado es confiable o no, para esto se realiza la validación del modelo ajustado y existen varias formas: i) la primera es realizar el ANOVA en la cual debe ser significativo F(Regresión), ii) Se prueba a través de la prueba de hipótesis, y iii) se calcula el intervalo confidencial (IC). f) Prueba de hipótesis para ( β 1 ). 1. Hipótesis Estadística:
H 0 : β1 = 0 H a : β1 ≠ 0
2. Elegir el nivel de significación: α = 0.05 3. Estadígrafo de Contraste, elegida para este caso, la prueba t-Student y cuya función pivotal.
t=
β$ 1 − β1 ~ t ( n−2) s. e(β$ ) 1
4. Establecer la Región de aceptación y rechazo. Se determina la región crítica de la prueba.
RA Ho : - 2.365 ≤ t c ≤ 2.365
α2
RR Ho : t c < -2.365 ó t c > 2.365
α2
1- α -2.365
0
t0.025,7 = 2.365
β1
RR/Ho:
RA/Ha: Valor crítico
Valor crítico
5. Valor experimental. Se obtiene reemplazando valores en la función pivotal.
tc =
β$ 1 − β 1 −0.046793872 − 0 = = −14.36865 , 0.003256664 s. e( β$ 1 ) s 2 = CME = MSE = 0.087698699
t
RR/Ho:
Análisis y Diseño de Experimentos - 17 V ( β$ 1 ) =
s2
∑X
2 i
−
d∑ X i
2
i
= n
0.087698699 = 0.000010605 8268.888889
s.e( β$ 1 ) = 0.003256664 6. Estadística de decisión: Si tc =14.37 > t0.025,7 =2.365, entonces cae en la región de rechazo, y se rechaza H0: y se acepta la Ha: 7. Conclusión. Se puede interpretar que β 1 es diferente de cero, es decir el modelo tiene pendiente positiva. g) Intervalo Confidencial (IC) para ( β 1 ).
Pr β$ 1 − t α ,( n −2 ) s. e.(β$ 1 ) ≤ β1 ≤ β$ 1 + t α ,( n − 2 ) s. e.(β$ 1 ) = 1 − α 2
2
Pr −0.046793872 − ( 2.365 )( 0.003256664 ) ≤ β 1 ≤ −0.046793872 + ( 2 .365 )( 0.00325666
Pr −0.054495883 ≤ β 1 ≤ −0.03909186 = 0.95 Se puede interpretar; de 100 muestras que se toma en el 95% el parámetro estimado β$ 1 estará comprendido entre el intervalo (-0.05449, -0.03909) y tan sólo el 5%
de las muestras estará fuera del intervalo o no contendrá en el intervalo. h) Estime la respuesta media E ( Yh ) . Con el ejemplo anterior, encuentre el intervalo confidencial para la respuesta media, cuando X = 35 ó X h = 35, entonces: i) Y$35 = β$ 0 + β$ 1 X h = 5.257958559 − 0.046793872( 35 ) = 3.61978769 .
LM MNn
OP PQ
LM N9
OP Q
2 2 ii) S 2 ( Y$35 ) = MSE 1 + ( X 352− X ) 2 = 0.087698699 1 + ( 35 − 47.89 ) = 0.011506486
∑ Xi − nX
S ( Y$35 ) = 0.10726829
. 8268888889
- 18 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
iii) Encuentre el Intervalo confidencial del 95% para la respuesta media E ( Yh ) , cuando Xh = 35 .
Pr Y$h − tα 2 ,n − 2 S ( Y$h ) ≤ E ( Y35 ) ≤ Y$h + tα 2 ,n − 2 S ( Y$h ) = 1 − α Pr 3.61978769 − ( 2.365 )( 0.10726829 ) ≤ E ( Y35 ) ≤ 3.61978769 + ( 2.365 )( 010726829 .
Pr 3.366098 ≤ E ( Y35 ) ≤ 3.877477 = 0.95
i) Intervalo Confidencial para observaciones futuras o individuales Yh ( New ) . Se desea calcular el intervalo confidencial del 95% cuando X h = 100 . i) Y$35 = β$ 0 + β$ 1 X h = 5.257958559 − 0.046793872( 100 ) = 0.57818597
LM MN
1 n
ii) S 2 ( Y$h( New ) ) = MSE 1 + +
OP PQ
LM N
( X h − X )2 1 (100 − 47.89 )2 = 0.087698699 1 + + 2 2 . 9 8268888889 ∑ Xi − nX
OP Q
= 0.12624271
S ( Y$h( New ) ) = 0.355306502 iii) El intervalo confidencial para la predicción futura
Yh ( New ) es:
Pr Y$h − tα 2 ,n −2 S ( Y$h( New ) ) ≤ Yh( New ) ≤ Y$h + tα 2 ,n− 2 S ( Y$h( New ) ) = 1 − α Pr 0.57818597 − ( 2.365 )( 0.355306502 ) ≤ Y100( New ) ≤ 0.57818597 + ( 2.365 )( 0.355306502
Pr −0.262113906 ≤ Y100( New ) ≤ 1.41848585 = 0.95
Análisis y Diseño de Experimentos - 19 -
PROGRAMA EN SAS.
DATA AGROI; OPTIONS NODATE NOCENTER NONUMBER; INPUT X Y; DATALINES; 0 13 25 35 50 61 68 86 93
5.50 4.25 4.00 3.75 3.40 2.25 1.75 1.25 1.00
; PROC PRINT; RUN; PROC REG; MODEL Y = X/XPX I COVB CLB CLI CLM P; RUN; /* CALCULA EL COEFICIENTE DE CORRELACIÓN PROC CORR; VAR X Y; RUN;
*/
- 20 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
SALIDA DEL SAS. The REG Procedure Model: MODEL1 Model Crossproducts X’X X’Y Y’Y Variable Intercept X Intercept 9 431 X 431 28909 Y 27.15 913.25
Variable Intercept X Y
X’X Inverse, Parameter Estimates, and SSE Intercept X Y 0.3884574039 -0.005791454 5.257573233 -0.005791454 0.0001209352 -0.046793873 5.257573233 -0.046793873 0.6138908895
Source Model Error Corrected Total Root MSE Dependent Mean Coeff Var
Variable Intercept X
Variable Intercept X
Y 27.15 913.25 100.6225
DF 1 1
Analysis of Variance Sum of Mean Squares Square 18.10611 18.10611 0.61389 0.08770 18.72000 R-Square 0.9672 Adj R-Sq 0.9625
DF 1 7 8 0.29614 3.01667 9.81678 Parameter Estimate 5.25757 -0.04679
F Value 206.46
Parameter Estimates Standard Error t Value Pr > |t| 0.18457 28.49 F 1 28.27035 28.27035 41.95 |t| 95% Confidence Limits 3.42839 0.62434 5.49 0.0001 2.06807 4.78871 0.99070 0.15296 6.48 t α 2,(n-2) 5. Si tc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha: Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha: 6. Conclusión. Realizar la interpretación en base al paso 4) y concluir de acuerdo al tenor del problema. Fisher sugiere la transformación de r en z, como sigue: Z r =
1 1+ r , donde ln 2 1− r
ln es el logaritmo natural. Es posible demostrar que Z , sigue una distribución aproxi-
FG H
IJ K
r
1 1+ ρ madamente normal, con: E ( Z r ) = µ = Zρ = ln , 2 1− ρ
V(Z r ) =
1 n−3
Para probar la hipótesis nula (Ho:) que indica que ρ es igual a un valor diferente de cero, la estadística de prueba es: Z c =
Z r − Zρ 1
n−3
que sigue una distribución aproxi-
madamente normal con N(0,1). En algunas situaciones, los datos disponibles para el análisis no cumplen con las suposiciones necesarias para el uso de los procedimientos estudiados. La prueba de hipótesis respecto al coeficiente de correlación de la población. En tales circunstancias es conveniente utilizar la técnica de correlación de rango de Spearman.
- 30 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
INTERVALO DE CONFIANZA PARA ρ Para encontrar el intervalo de confidencial, se utiliza la transformación de Fisher del (1- α )x100, para ρ . Este procedimiento se calcula con la siguiente fórmula para el intervalo de confianza:
Pr tanh( Z r − E 0 ) ≤ ρ ≤ tanh( Z r + E 0 ) = 1 − α Donde:
FG IJ H K
1 1+ r Z r = ln , 2 1− r tanh( x) =
E0 =
eX − e− X , eX + e−X
Zα 2 n−3
tanh: Tangente hiperbólica
COEFICIENTE DE DETERMINACIÓN: R2 ó r2 El coeficiente de determinación, R2, es el valor cuadrado del coeficiente r de Pearson, y representa la proporción de la varianza explicada por una variable respecto a la varianza total, también se conoce con el nombre de determinación porque se considera como la medida del grado de influencia de una variable frente a la otra variable. El coeficiente de determinación mide la proporción de la variación que se explica por la variable independiente en el modelo de regresión, y está definido por:
R2 = r2 =
Varianza Explicada SSRm x100 = x100 SSTm Varianza Total
El valor complementario del coeficiente de determinación, 1-R2, recibe el nombre de coeficiente de no determinación ó coeficiente de alineación, que indica la varianza de una variable no explicada por otra.
~2 ) COEFICIENTE DE DETERMINACIÓN AJUSTADO ( R El coeficiente de determinación ajustado, se puede expresar con las siguientes fórmulas:
MSE ~ R2 = 1− MSTm
Análisis y Diseño de Experimentos - 31 EJEMPLO: Calcular el coeficiente de correlación de Pearson «r» y coeficiente de determinación R2 del ejemplo 1, que corresponde a los datos para el análisis sensorial de la naranza Wasgington Navel «hipobárico» en su apariencia general externa. X= Tiempo (días) e Y= Apariencia general externa (puntaje) El coeficiente de correlación queda definido por. rxy =
∑ X Y −( ∑ X )( ∑Y ) n − ( ∑ X ) n ∑Y −( ∑Y ) i i
∑X
2 i
i
=
i
2
i
2
i
2
i
n
91325 . − ( 431)( 2715 . )9 ( 28909 − ( 431)2 9 )(1006225 . . )2 9 ) −( 2715
. = −0983
Se ha encontrado una correlación negativa y alta, es decir existe una directa asociación entre la variable sobre el tiempo en días y la apariencia general externa en forma inversa. Calculamos el Coeficiente de Determinación R2.
R2 =
18.106109 SSRm x100 = 96.72% x100 = 18.72 SSTm
El 96.72% de la variación de la apareiencia general externa (puntajes) está explicado por la variación del tiempo (días), y 3.28% está explicado por otros factores externos o lo que no se puede controlar en el modelo. Calculamos el Coeficiente de Determinación Ajustada: MSE 0.087698699 ~2 Rajust x100 = 1x100 = 96.25% . = 1− MSTm 2.34
El 96.25% indica que el modelo tiene buen ajuste y es confiable para realizar las predicciones futuras, asimismo se puede recomendar el uso de este modelo para los estudios en otros lugares.
Análisis gráfico de Residuos. Como complemento a lo que se ha desarrollado hasta el momento, un análisis adecuado de los residuos da información adicional sobre la calidad del ajuste del modelo de regresión y de esta forma verificar si el modelo es adecuado. Las gráficas que se hacen para completar el diagnóstico del modelo son: graficar los residuos en papel de probabilidad normal, graficar los residuos contra los predichos, los residuos contra cada variable regresora y contra alguna otra variable importante que no haya sido incluido en el modelo. A continuación presentamos la gráfica de residuos con-
- 32 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
tra predicios ( ε i vs Y$i ) . Si el modelo es adecuado, se espera que en esta gráfica los puntos no sigan ningún patrón, y que por tanto estén distribuidos más o menos aleatoriamente a lo largo y ancho de la gráfica. Cuando esto ocurre significa que el modelo se ajusta de igual manera a lo largo de los valores de Y, si esto no ocurre habrá que ver cuál es el tipo de patrón que se observa en la gráfica y diagnosticar cuál es la falla que registra el modelo. La gráfica que se muestra en seguida no muestra ninguna anomalía, por lo que esto es una evidencia más en favor del modelo de regresión lineal simple para nuestro ejemplo.
Probar la hipótesis para 1. Hipótesis Estadística:
ρ≠0 H 0: ρ = 0 H a: ρ ≠ 0
(ausencia de correlación entre las variables) (existencia de correlación entre las variables en forma directa).
Análisis y Diseño de Experimentos - 33 2. Elegir el nivel de significación: 3. Estadígrafo de Contraste: t =
α = 0.05
r n-2 1- r 2
~ t n−2 ,
4. Establecer la Región de rechazo y aceptación.
RA Ho : - 2.365 ≤ t c ≤ 2.365 RR Ho : t c < -2.365 ó t c > 2.365 5. Cálculo del valor experimental.
t=
r n-2 1- r
2
=
−0.98347 7 1- (-0.98347) 2
= −14.36865
6. Decisión: Como tc =14.37 > t0.025,7 =2.365, entonces cae en la región de rechazo, aceptándose la Ha: y se rechaza la H0:. 7. Conclusión: Existe suficiente evidencia para afirmar que ρ ≠ 0 , es decir que la correlación es diferente de cero. Esto corrobora a los resultados de la correlación encontrada. Calcular el intervalo confidencial para ρ . Para encontrar el Intervalo Confidencial, se utiliza la transformación de Fisher del (1- α )x100 para ρ . Cuya fórmula es el siguiente:
Pr tanh( Zr − E0 ) ≤ ρ ≤ tanh( Zr + E0 ) = 1 − α Calcular el Intervalo Confidencial al 95% de confianza para ρ con la información del ejmplo 1.
FG H
IJ K
1 1 + ( −0.98347 ) Zr = ln = −2.3937 , 2 1 − ( −0.98347 )
E0 =
Zα 2 n−3
=
. 196 = 0.80 6
- 34 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Reemplazando al Intervalo se obtiene el límite inferior del intervalo y límite superior del intervalo:
Pr tanh( −2.3937 − 0.8 ) ≤ ρ ≤ tanh( −2.3937 + 0.8 = 0.95
Pr tanh( −31937 . ) ≤ ρ ≤ tanh( −15937 . ) = 0.95 tanh( −31937 . )=
e −3.1937 − e 3.1937 −24.33744 = = −0.9966 e −3.1937 + e 3.1937 24.41948
tanh( −15937 . )=
e −1.5937 − e1.5937 −4.71875 = = −0.9207 −1.5937 1.5937 e 51250989 . +e
Pr -0.9966 ≤ ρ ≤ −0.9207 = 0.95 Otra forma: Se puede encontrar usando tablas preparadas para la transformación de r a Z; los valores aparecen en el cuerpo de la tabla para valores correspondientes de r, los coeficientes de correlación están en los márgenes. Ubicar en el cuerpo de la tabla el valor 3.1937 para el límite inferior del intervalo, esto es 0.99 que debe ser cambiado con signo menos, es decir -0.99. En forma similar para el límite superior del intervalo ubicar en el cuerpo de la tabla el valor 1.5937 que corresponde a 0.92 que debe ser cambiado de signo a -0.92. EJEMPLO 4. Calcular el coeficiente de correlación de Pearson «r» y coeficiente de determinación R2 para el ejemplo 2 que corresponde a la información sobre el número de horas de estudio (X) para preparar un examen de matemáticas, y la calificación obtenida en dicho examen (Y). El coeficiente de correlación queda definido por. rxy =
∑XY −(∑X )(∑Y ) n ∑X −(∑X ) n ∑Y −(∑Y ) i i
2 i
i
i
=
i
2
2
i
2
i
n
4145 . −(535 . )(101) 14 ( 23325 . −(535 . )2 14)(765−(101)2 14)
= 08818 .
Se ha encontrado una correlación positiva y alta, es decir existe una directa asociación entre la variable sobre el número de horas de estudio para preparar un examen y la calificación obtenida en el examen. Calculamos el Coeficiente de Determinación R2.
R2 =
28.270348 SSRm x100 = x100 = 77.76% 36.35714286 SSTm
Análisis y Diseño de Experimentos - 35 Se puede interpretar que el modelo tiene buen ajuste. El 77.76% de la variación en la calificación obtenida (puntos) está explicado por la variación del número de horas de estudio para preparar un examen de matemáticas, y 22.24% está explicado por otros factores ajenos al modelo. Calculamos el Coeficiente de Determinación Ajustada: MSE 0.673899566 ~2 Rajust x100 = 1x100 = 75.90% . = 1− MSTm 2.796703297
Probar la hipótesis para 1. Hipótesis Estadística:
ρ≠0 H 0: ρ = 0 Ha: ρ ≠ 0
(ausencia de correlación entre las variables) (existencia de correlación entre las variables en forma directa). 2. Elegir el nivel de significación: 3. Estadígrafo de Contraste: t =
α = 0.05
r n-2
,
1- r 2
4. Establecer la Región de rechazo y aceptación.
RA Ho : - 2.179 ≤ t c ≤ 2.179 RR Ho : t c < -2.179 ó t c > 2.179 5. Cálculo del valor experimental.
0.95 -2.179
RR/Ho:
r n-2 1- r
2
=
08818 . 12 1-0.88182
0
ρ
2.179
t RR/Ho:
RA/Ha: Valor crítico
t=
0.05 2
0.05 2
Valor crítico
. = 647688
6. Decisión: Como tc =6.477 > t0.025,12 =2.179, cae en la región de rechazo, entonces se acepta la Ha: y se rechaza la H0:. 7. Conclusión: Se puede concluir que existe diferencia significativa entre la variable horas de estudio para preparar el examen y la calificación obtenida en el examen.
- 36 -
V. Ibañez Q. - Docente FINESI - UNA - Puno Calcular el intervalo confidencial para ρ .
Zr =
FG H
IJ K
1 1 + 0.8818 = 13838 ln . , 2 1 − 0.8818
E0 =
Zα 2 n−3
=
196 . = 0.59096 11
Pr tanh( Zr − E0 ) ≤ ρ ≤ tanh( Zr + E0 ) = 1 − α Pr tanh ( 1.3838 − 0 .59096 ) ≤ ρ ≤ tanh ( 1.3838 + 0 .59096 ) = 0 .95
P r tanh ( 0 .79284 ) ≤ ρ ≤ tanh ( 1.97476 ) = 0 .95 e 0.79284 − e −0.79284 1757105 . tanh( 0.79284 ) = 0.79284 = = 0.660 −0 .79284 e +e 2.66222067
tanh( 197476 . )=
e1.97476 − e −1.97476 7.0660956 = = 0.9622 −1.97476 1.97476 e 7.34368489 +e
Pr 0.660 ≤ ρ ≤ 0.9622 = 0.95 EJERCICIOS: Para cada uno de los siguientes ejercicios: a) Fijar el modelo de regresión lineal simple, b) Graficar el diagrama de dispersión, c) Estimar la ecuación de regresión, d) graficar la ecuación estimada, calcule los errores, y grafique e) Realice el ANOVA, ~2 R2, Rajust . f) Probar la hipótesis b1 ≠ 0 , g) Calcule los intervalos confidenciales para
bi , h) Encontrar el intervalo confidencial para la respuesta media E(Y ), i) Calcule h el intervalo confidencial para la predicción u observación futura Y , j) Calcule el h(new)
coeficiente de correlación de Pearson «r», k) Pruebe la hipótesis para
ρ ≠ 0 al nivel
de significación de 0.05, l) Construya el intervalo de confianza del 95% para ρ e interpretar en cada uno de las preguntas anteriores. 1.- Considere los datos de la tabla siguiente, en donde X = Gastos semanales de publicidad, y Y = Ventas semanales. Pronostique las ventas para un gasto de publicidad de $50 dólares. Y ($) 1250 X ($) 41
1380 54
1425 63
1425 54
1450 48
1300 46
1400 62
1510 61
1575 64
1650 71
Análisis y Diseño de Experimentos - 37 2.- En la tabla siguiente se muestran los tiempos requeridos de atención a clientes en las cajas de un supermercado y los valores de las compras. Dé un punto e intervalo de estimación de 99% para Y si X = 3.0. Tiempo requerido de atención (en minutos) Valor de las compras (en $)
3.6 30.6
4.1 30.5
0.8 2.4
5.7 42.2
3.4 21.8
1.8 6.2
4.3 40.1
0.2 2
2.6 15.5
3.- Andrew Vazsony es el gerente de la cadena de supermercado Spendwise. A él le gustaría poder pronosticar las venas de libros en rústica (libros por semana), con base en la cantidad de espacio disponible en los estantes (en pies). Andrew reúne datos para una muestra de 11 semanas. Semana N° de libros vendidos Y Pies de espacio en estante X
1 2 3 4 5 6 7 8 9 10 11 275 142 168 197 215 188 241 295 125 266 200 6.8 3.3 4.1 4.2 4.8 3.9 4.9 7.7 3.1 5.9 5
4.- En la siguiente tabla se presenta información de una empresa de órdenes por correo, para las 12 ciudades. Pronostique las órdenes por correo recibidas cuando se distribuyen 10000 catálogos. Ciudad N° órdenes recibidas por correo, Y (en miles) N° de catálogos distribuidos, X (miles)
A 24
B 16
C 23
D 15
E 32
F 25
G 18
H 18
I 35
J 34
K 15
L 32
6
2
5
1
10
7
15
3
11
13
2
12
5.- En una regresión de inversiones sobre la tasa de interés, se observaron los resultados que se muetran en la tabla siguiente, para un período de 10 años. ¿Podemos pronosticar la inversión anual si la tasa de interés dentro de 5 años es del 4%? Inversión anual (miles de dólares) Tasa promedio de interés (%)
1060 940 920 1110 1590 2050 2070 2030 1780 142 4.8 5.1 5.9 5.1 4.8 3.8 3.7 4.5 4.9 6.2
6.- Los siguientes datos muestran la densidad óptica de cierta substancia en diferentes niveles de concentraicón. Nivel de concentración (X) 80 120 160 200 240 280 320 360 400 440 480 Densidad óptica (Y) 0.08 0.12 0.18 0.21 0.28 0.28 0.38 0.40 0.42 0.50 0.52
7.- Se recolectaron los siguientes datos a partir de un estudio de la relación entre la inteligencia y el número de hijos por familia. N° de niños en la familia Inteligencia de todos los niños de la familia
1 2 3 4 5 6 7 105 102 104 100 97 101 95
8 93
9 97
- 38 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
8.- Las siguientes mediciones se efectuaron en 20 áreas geográficas. La variable X es la medición combinada de contaminación del aire y agua en la zona, y Y es la medición del estado de salud de los residentes del área. Entre mayor sea el valor de X, hay mayor contaminación y entre mayor sea el valor de Y, la salud es más precaria. X Y X Y
73 90 67 76
52 74 73 82
68 91 71 93
47 62 57 73
60 63 86 82
71 78 76 88
67 60 91 97
80 89 69 80
86 82 87 87
91 105 77 95
9. Los siguientes valores representan 15 lecturas que indican el volumen del tráfico y la concentración de monóxido de carbono tomados en un laboratorio para determinar la calidad del aire de cierta ciudad. Volumen del tráfico (autos/hora) "X" 100 110 125 150 175 190 200 225 250 275 300 325 350 375 400 CO(PPM) (Y) 8.8 9.0 9.5 10.0 10.5 10.5 10.5 10.6 11.0 12.1 12.1 12.5 13.0 13.2 14.5
10. Se espera que, por lo general, el número de horas de estudio (X) en la preparación de un examen tenga una correlación directa (positiva) con la calificación (Y) alcanzada en tal examen. En la tabla siguiente se presentan las horas de estudio así como las calificaciones obtenidas por diez estudiantes seleccionados al azar de un grupo. Estudiante 1 Horas de estudio (X) 10 Calificación en el examen (Y) 51
2 6 36
3 15 67
4 11 63
5 7 44
6 19 89
7 17 80
8 3 26
9 13 50
10 TOTAL 17 118 85 591
11. Los datos muestran el aumento en la rapidez de lectura (Y), y el número de semanas que se asistió a un curso para mejorarla (X), para ocho estudiantes: X Y
3 80
5 110
2 50
8 190
6 160
9 230
3 70
4 110
12. Las calificaciones de un grupo de estudiantes en su reporte de medio años (X) y en los exámenes finales (Y) fueron los siguientes: X Y
77 82.00
50 66.00
71 78.00
72 34.00
81 47.00
94 85.00
96 99.00
99 99.00
67 68.00
13. A un grupo de 20 estudiantes de un curso de computación para principiantes se les aplicó una prueba de aptitud computacional con un puntaje X, y otra de aprovechamiento final con un puntaje Y (medida como un examen de conocimiento).
Análisis y Diseño de Experimentos - 39 Los resultados fueron los siguientes: X Y
4 19
16 19
20 24
13 36
22 27
21 26
15 25
20 28
19 17
16 27
18 21
17 24
8 18
6 18
5 14
20 28
18 21
11 22
19 20
14 21
14. Los datos siguientes hacen referencia al número de horas invertidas para preparar un examen (X) y la calificación recibida en este último (Y) (esta última expresa en decenas). X Y
2 5
3 5
3 7
4 5
4 7
5 7
5 8
6 6
6 9
6 8
7 7
7 7 8 8 9 10 8 9
15. Se preguntó a 10 estudiantes de una muestra la distancia recorrida y el tiempo que utilizaron para llegar a la Universidad el día anterior. Los datos reunidos se tienen en la tabla siguiente: Re c o rrid o (X ) T ie mp o (Y)
1 5
3 10
5 15
5 20
7 15
7 25
8 20
10 25
10 35
12 35
16. Se obtuvieron los siguientes datos para determinar la relación entre cantidad de fertilizante y producción de papa por hectárea. Sacos de fertilizante por hectárea Rendimiento en quintales
3 45
4 48
5 52
6 55
7 60
8 65
9 68
10 70
11 74
12 76
17. Un comerciante minorista encargó un estudio para determinar la relación entre los gastos de publicidad semanal por radio y las ventas de sus productos. En la quinta semana por diversos motivos no se pudo hacer el estudio. En el estudio se obtuvieron los siguientes resultados: Semana Gastos de publicidad ($) Ventas ($)
2 3 4 30 20 40 300 250 400
5 30 --
6 7 8 9 10 11 50 70 60 80 70 80 550 750 630 930 700 840
- 40 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
1.3. REGRESIÓN LINEAL MÚLTIPLE (RLM) Muchos problemas de regresión involucran más de una variable regresiva. Tales modelos de regresión se denominan regresión múltiple. La regresión múltiple es una de las técnicas estadísticas más ampliamente utilizadas en la actualidad. En esta oportunidad se presenta las técnicas básicas de la estimación de parámetros conocido como el Métodos de los Mínimos Cuadrados, además se realizará la estimación del intervalo de confianza y de la verificación de la suficiencia del modelo para la regresión múltiple. Se presentará también algunos de los problemas encontrados con frecuencia en el uso práctico de la regresión múltiple, incluyendo la construcción del modelo y la selección de variables y la dependencia casi lineal entre los regresores. El modelo de regresión que involucra más de una variable regresora se llama modelo de regresión múltiple; como un ejemplo, supóngase Y la variabledependiente, X1 y X2 son las variables independientes. Un modelo de regresión múltiple que podría describir esta relación es:
Y = β 0 + β1 X 1 + β 2 X 2 + ε Donde: Y = Representa la variable dependiente. X1 y X2 = Son las variables independiente o regresoras.
β 0 ,β1 ,β 2 = Son los parámetros desconocidos que será estimado. ε = Es el error residual o perturbación.
El parámetro β 0 define la ordenada al origen del plano. Algunas veces llamamos a β1 y β 2 coeficientes de regresión parciales, porque β 1 mide el cambio esperado en Y por cambio unitario en X1 cuando X2 se mantiene constante, y β 2 mide el cambio esperado en Y por cambio unitario en X2 cuando X1 se mantiene constante. En general, sea X 1 , X 2 ,L , X k variables independientes o regresoras, ya sea Y una variable de respuesta, entonces el modelo de regresión lineal múltiple con «k» variables independientes es el polinomio de primer orden:
Yi = β 0 + β 1 X i 1 + β 2 X i 2 + L + β k X ik + ε i ; ó Y = X β
Análisis y Diseño de Experimentos - 41 Se denomina modelo de regresión lineal múltiple con k-variables independientes. Los parámetros β j , j = 0,1,K , k , se llaman coeficientes de regresión. Este modelo describe un hiperplano en el espacio k-dimensional de las variables regresoras Xi. El término lineal del modelo de regresión se emplea debido a que la ecuación anterior es función lineal de los parámetros desconocidos β 0 , β 1 ,K , β k . La interpretación de éstos es muy similar a lo ya explicado para el caso de regresión lineal simple: β 0 es la ordenada al origen, y β j mide el cambio esperado en Y por cambio unitario de Xj cuando el resto de las variables regresoras se mantienen fijas o constantes. Estimación de los parámetros del modelo. Para estimar los parámetros de la regresión lineal múltiple se necesita contar con «n» datos (n>k). El método de Mínimos Cuadrados puede utilizarse para estimar los coeficientes de regresión. Supóngase que se dispone n>k observaciones, y déjese que Xij denote la observación iésima o el nivel de la variable Xj. En términos de los datos, el modelo de regresión lineal múltiple puede escribirse de la siguiente manera:
Yi = β 0 + β1 X i1 + β 2 X i 2 + L + β k X ik + ε i k
= β 0 + ∑ β j X ij + ε i
i = 1,2 ,...., N
j =1
Para estimar por el método de mínimos cuadrados, se despeja el error. k
ε i = Yi − β 0 − ∑ β j X ij , elevamos al cuadrado ambos miembros se tiene: j =1
k
ε i2 = (Yi − β 0 − ∑ β j X ij ) 2 aplicamos la sumatoria a ambos miembros: j =1
k
∑i =1 ε i2 = ∑i =1 (Yi − β 0 − ∑ β j X ij ) 2 a partir de esto, se realiza la derivada n
n
j =1
parcial con respecto a los parámetros del modelo para encontrar las ecuaciones normales.
- 42 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
∂
e∑ ε j n
i =1
2 i
∂β 0
k
= 2∑i =1 (Yi − β 0 − ∑ β j X ij )(-1) = 0 n
j =1
β$ 0 ,β$ 1 ,L,β$ k
n
n
n
n
i =1
i =1
i =1
i =1
nβ$ 0 + β$ 1 ∑ X i1 + β$ 2 ∑ X i 2 +L+β$ k ∑ X ik = ∑ Yi
.................. (1)
y
∂
e∑ ε j n 2 i =1 i
∂β j
k
, ,3,..., k .....(2) = 2∑i =1 (Yi − β 0 − ∑ β j Xij )(-Xij ) = 0; j = 12 n
j =1
β$ 0 ,β$ 1 ,L,β$ k
Al simplificar la ecuación (1) y (2), obtenemos las ecuaciones normales de mínimos cuadrados: nβ$ 0
+
n
β$ 0∑Xi1 + i=1
M
M
n
n
+
β$1∑Xi21
+ β$ 2∑Xi1Xi2 + L + β$ k ∑Xi1Xik =
i=1 n
i=1
M
β$ 2∑Xi2
+ L +
i=1 n
M
i=1
M
i=1
i=1
β$ k ∑Xik
=
i=1 n
M M M
M M M M M M M M n n n $β X + β$ X X + β$ X X + L + 0∑ ik 1∑ i1 ik 2 ∑ i2 ik i=1
n
β$1∑Xi1
i=1
M
M
M n $β X2 k ∑ ik
M
i=1
=
n
∑Y i
i=1 n
∑X Y i1 i
i=1
n
M
(3)
M
∑X Y ik i
i=1
Nótese que hay p = k+1 ecuaciones normales, una para cada uno de los coeficientes de regresión desconocidos. La solución para las ecuaciones normales serán los estimadores de mínimos cuadrados ordinarios de los coeficientes de regresión, β$ 0 , β$ 1 ,K , β$ k .
Ilustar el procedimiento de estimación por mínimos cuadrados es más sencillo si se utiliza la notación matricial. Daremos ahora un desarrollo matricial de las ecuaciones normales que es similar al desarrollo de la ecuación anterior. El modelo en términos de las observaciones, se puede escribir en notación matricial o llamada también forma compacta como: Y = Xβ + ε Si asignamos a X i 0 = 1 , entonces extendiendo en forma general para kvariables X tenemos:
Análisis y Diseño de Experimentos - 43 -
LMY OP Y Y=M P MM M PP NY Q
LM X X X =M MM M NX
10
1
20
1
N Nx1
N0
LMβ OP β β=M P MM M PP Nβ Q
OP PP PQ
0
LM ε OP ε ε=M P MM M PP Nε Q
OP PP PQ
N( k+1)
1
1
k
LM MM MN
X11 X12 L X1k 1 X11 X12 L X1k X21 X22 L X2k 1 X21 X22 L X2k = M M M M M M M XN1 XN2 L XNk 1 XN1 XN2 L XNk
y ( k +1 ) x 1
2
N
, además se sabe que: Y = Xβ + ε Nx 1
Propiedades: a) E( ε ) = 0, E( Y ) = Xβ, Y = E( Y ) + ε , ⇒ ε = Y − E( Y ) b) Var ( ε ) = E ε − E ( ε ) ε − E ( ε ) ' = E ( εε' ) = σ 2 I N c)
Cov( ei , e j ) = 0, ∀i ≠ j
Estimación de los parámetros ( β 0 , β 1 ,L , β k )(Forma matricial). Para estimar el parámetro β , utilizamos el método de los mínimos cuadrados, es decir se debe minimizar el error de la siguiente forma: N
∑ε
2 i
=ε' ε = Y − E ( Y ) ' Y − E ( Y )
i =1
= ( Y − Xβ )' ( Y − Xβ ) = ( Y' −β' X ' )( Y − Xβ ) = ( Y' Y −
Y' Xβ 123
− β' X ' Y + β' X ' Xβ
( Y ' Xβ )' = β' X ' Y
= ( Y' Y − β' X ' Y − β' X ' Y + β' X ' Xβ = Y' Y − 2β' X ' Y + β' X ' Xβ
- 44 -
V. Ibañez Q. - Docente FINESI - UNA - Puno NOTA: Por propiedad se sabe que: a) ∂( a' X ) = a , ⇒ ∂X
∂( X ' Y )' β = X' Y ∂β
b) ∂( X ' AX ) = 2 AX , ⇒ ∂X
∂( β' X ' X β ) = 2 X ' Xβ ∂β
Simplificando se tiene que X ' Xβ$ = X ' Y , que son las ecuaciones normales de mínimos cuadrados. Para resolver las ecuaciones normales, multiplíquense ambos lados de la ecuación X ' Xβ$ = X ' Y por la inversa de X'X. De tal modo, el estimador de mínimos cuadrados de β es:
( X ' X )−1 X ' Xβ$ = ( X ' X )−1 X ' Y , ⇒ β$ = ( X ' X )−1 X ' Y Es fácil ver que la forma matricial de las ecuaciones normales es idéntica a la forma escalar. Al escribir completa la ecuación X ' Xβ$ = X ' Y obtenemos:
LM n MM MM∑ X MM M MN∑ X
n
∑ X i1 i =1 n
n
i1
i =1
i =1
n
i =1
∑X n
ik
∑ Xi2
2 i1
M
L
i =1
n
∑ Xi1 Xik i =1
n
∑X i =1 n
i1
Xi 2 L
M
∑ Xi 2 Xik L i =1
n
∑X i =1
i =1
i1
X ik
M n
∑ Xik2 i =1
i
0
n
∑X
OP L YO $β O M ∑ P L PP M $ P M PP M β X Y PP MM M PP = M∑ P PP MMNβ$ PPQ MM M PP MM∑ X Y PP PQ Q N n
ik
i =1
n
1
i1 i
i =1 n
k
ik i
i =1
Cuando X ' X es de rango completo, la solución de X ' Xβ$ = X ' Y para β$ puede $ ( X' X )−1 X' Y . Por otro lado si ( X ' X )−1 no existe, entonces la solución ser escrito como β=
de X ' Xβ$ = X ' Y puede ser escrito en términos de una inversa generalizada de X ' X . Este es el caso de modelo de rango no completo. Por la naturaleza de X mostrada anteriormente la matriz X ' X es cuadrada de orden (k+1), con los elementos que son suma de cuadrados y productos, como se presenta a continuación:
Análisis y Diseño de Experimentos - 45 -
LM ∑X MM X X X' X = M∑ MM M MM∑X X N n
2 i0
n
i =1
i0
n
∑X
i0
i =1
i=1
ik
i =1 n
n
∑X
2 i1
i =1
i0
i0
∑X
i1
n
n
∑X
Xi1
i =1
i1
i=1
M
n
∑X
i1
n
i2
i=1
i0
LM∑X Y OP L MM PP MM Y X' Y = M∑ X Y P = M∑ X Y MM M PP MM MM∑X Y PP MMN∑X Y N Q n
Xik
i =1 n
Xi2 L
i1
ik
i =1
M
∑X
Xik
OP PP X X ∑ PP, M P ∑ X PPQ n
∑X
Xi 2 L
i=1 n
y
i1 i
i =1
i =1 n
n
2 ik
i =1
•
n
i1 i
n
Xik L
i0 i
ik i
ik i
i =1
i =1
i =1
Así X ' X es la matriz de suma de cuadrados y productos de los Xs observados y X'Y es el vector de suma de productos de los Xs observados e Ys. Además, se sabe que las expresiones puede tomar la forma siguiente:
X i 0 = 1, ∀i =1,2 ,...., N ,
LM n M∑X X' X = M∑X MM M MN∑X
i1
i2
ik
∑X ∑X
∑X ∑X ∑X ∑X X ∑X X ∑X i1 2 i1
i1 i2
M ∑Xi1Xik
i2
i1 i2 2 i2
2 i0
∑X
= N,
i0
Y = ∑ Yi = Y .
X i1 = ∑ X i1 = X .1
i1 i
L L L
M ∑Xi2 Xik L
X ∑X OP LM n X X X X X X X ∑ ∑ ∑ P M P M X X X X = X X ∑ ∑ P M ∑ .1
ik
i1 ik
i2
M ∑Xik2
ik
.1
.2
PP M M Q MNX
.k
.2
2 i1
i1 i2
M X ∑ i1Xik
i1 i2 2 i2
L L L
M X ∑ i2 Xik L
O
∑X X PP ∑X X PP X.k
i1 ik
i2
M ∑Xik2
ik
PP Q
Los elementos de la diagonal de X ' X son las sumas de cuadrados de los elementos en las columnas de X, y los elementos fuera de la diagonal son las sumas de los productos cruzados de los elementos de las columnas de X. Además, los elementos de X ' Y son las sumas de los productos cruzados de las columnas de X y las observaciones {Yi}. El modelo de regresión ajustado es: k
Y$ = Xβ$ . En notación escalar es:
y$i = β$ 0 + ∑ β$ j xij , i = 1,2 ,.., n j =1
- 46 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Consecuencias de la Estimación. -1 A continuación presentamos algunas propiedades de β$ = (X' X) X' Y , bajo el
supuesto de que ε ~ N ( 0 ,σ 2 I n ) ,
E( ε ) = 0 , v( ε ) = σ 2 In .
a) Insesgamiento: Desde que β$ es el BLUE de β para V = σ 2 I n , este es insesgado a partir de la definición de valor esperado, se demuestra que efecto:
E( β$ ) = β .
En
E ( β$ ) = E (X' X) -1 X' Y = (X' X) -1 X' E(Y) = (X' X) -1 X' Xβ = β b) Varianza de β$ . La matriz de Varianzas-Covarianzas de β$ está dado por: V( β$ ) = E[ β$ − E (β$ )][ β$ − E ( β$ )]'
m = E m[(X' X)
r
= E [(X' X) -1 X' Y − E ((X' X) -1 X' Y)][(X' X) -1 X' Y − E ((X' X) -1 X'Y)]' -1
m = E m[(X' X)
r
X' (Y − E (Y)][(X' X) -1 X' (Y − E (Y)]'
r ]r
= E [(X' X) -1 X' ε ][(X' X) -1 X' ε ]' -1
X' ε ][ε' X(X' X) -1
= (X' X) -1 X' E (εε' )X(X' X) -1
= (X' X) -1 X' X(X' X) -1 σ 2 I = (X' X) -1σ 2
Prueba de Hipótesis en Regresión Lineal Múltiple. En esta sección veremos la prueba de hipótesis sobre los parámetros del modelo que son equivalentes a las realizadas para la regresión lineal simple, pero que ahora son más necesarias, dado que en regresión lineal múltiple tenemos más parámetros en el modelo, que por lo general es necesario evaluar su verdadera contribución a la explicación de la respueta. En este caso, también requerimos de la suposición adicio-
Análisis y Diseño de Experimentos - 47 nal de que los errores deben distribuirse en forma normal, independientes, con medio cero y varianza constante
σ 2 ( ε i ~ NID( 0,σ 2 ) . Una consecuencia de esta suposi-
e
j
ción es que las observaciones yi son NID β 0 + ∑ j =1 β j X ij ,σ 2 . k
1. Hipótesis Estadística: H0 : β 1 = β 2 =L = β k = 0
Ha : β j ≠ 0 para al menos un j = 1,2,3,.., k 2. Nivel de significación:
α = 0.05
3. Estadístico de prueba.
F (Re g ) =
SSRm r − 1 MSRm = ~ Fnr−−r1,α SSE n − r MSE
4. Región de rechazo ó aceptación.
RA H0 :
F (Re g ) ≤ Fnr−−r1,α entonces se acepta la Ho:
RR H0 :
F (Re g ) > Fnr−−r1,α entonces se acepta la Ha:
5. ANOVA para la significación del modelo de regresión lineal múltiple. Fuentes de Variación G.L.
Suma de Cuadrados
Cuadrados Medios
Regresión
r-1
SSRm = β$' X' Y −nY 2
SSRm = MSRm r −1
Error Residual
n- r
SSE =Y' Y −β$ ' X' Y
SSE = MSE r −n
Total
n- 1
SSTm =Y' Y −nY 2
Fobs.
F(Reg)=
MSRm MSE
MSTm = SSTm n −1
El coeficiente de determinación es: R 2 =
SSRm MSE ~2 x100 , R Ajust )x100 . = (1 − SSTm MSTm
Ambos coeficientes se interpretan de forma similar al caso de regresión lineal simple, como el porcentaje de variabilidad de los datos que es explicada por el mode~
2 2 lo. Se cumple que 0 < R Ajust . ≤ R < 1 ; en general para hablar de un modelo que tiene un ajuste satisfactorio es necesario que ambos coeficientes tengan valores superiores
- 48 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
a 0.7. Cuando en el modelo hay términos que no contribuyen de manera significativa ~
2 2 al modelo, el R Ajust . tiende a ser menor que el R . Por ello es deseable depurar el modelo y para ello las pruebas de hipótesis son de mucha utilidad.
Pruebas sobre coeficientes individuales del modelo. Un aspecto muy importante y clave en un análisis de regresión lineal múltiple es valorar qué tanto contribuyó cada término a la explicación de la variable de respuesta, para de esta forma eliminar los que tienen una contribución poco importante o quizá pensar en agregar otras variables no consideradas. Las hipótesis para probar la significancia de cualquier coeficiente individual de β j , se especifica de la siguiente manera: Hipótesis: H0 : β j = 0 Ha : β j ≠ 0
j = 0,1,2,3,.., k
De acuerdo con la sección anterior, el estimador de mínimos cuadrados β$ es un vector aleatorio, cuya distribución es normal con media β y matriz de varianzascovarianzas
(X' X) -1σ 2 .
Entonces, en resumen:
β$ j ~ N[ β j , σ 2 C j+1, j+1 ] . Donde
C j+1, j+1 es el elemento de la diagonal de la matriz (X' X) -1 correspondiente al parámetro β$ j . Otra forma alternativa es el siguiente: β$ ~ N[ β ,(X' X) -1σ 2 ] . El estimador de σ 2 es el cuadrado medio del error denotado por: MSE=CME (se encuentra en la tabla ANOVA), entonces el estadístico de prueba para probar la hipótesis es el siguiente:
tc =
β$ j − β j MSE ⋅ C j +1, j +1
=
β$ j − β j ~ tn −r $ V(β ) j
Se rechaza la hipótseis H o si tc > tα 2,n− r o en forma equivalente si pvalue= P( T > t c ) ≤ α . A continuación se presenta el resumen del análisis sobre el modelo de regresión basado sobre coeficientes individuales del modelo.
Análisis y Diseño de Experimentos - 49 -
PARÁMETRO ESTIMACIÓN
ERROR ESTÁNDAR
Intercepción
) β0
) MSE×C11 = V (β0 )
β1
) β1
) MSE×C22 = V(β1)
β2
) β2
) MSE×C33 = V (β2 )
. . .
. . .
βk
) βk
ESTADÍSTICO "t"
) ) β0 β0 = ) MSE × C11 V ( β0 ) ) ) β1 β1 = ) MSE × C22 V ( β1 ) ) ) β2 β2 = ) MSE × C33 V ( β2 )
. . .
. . .
) MSE × Ck +1,k +1 = V ( βk )
) ) βk βk = ) MSE ×Ck+1,k+1 V(βk )
VALOR-p
Pr(T > tc ) Pr(T > tc ) Pr(T > tc )
. . . Pr(T > tc )
Intervalos de Confianza y predicción en Regresión Lineal Múltiple. a) Intervalo Confidencial (IC) para β j . 2 Para un β j , su estimador β$ j ~ N[ β j , σ C j+1, j+1 ] donde C j+1, j+1 es el ele-
mento de la diagonal de la matriz
β$ j − β j σ 2 C j+1, j+1
(X' X) -1 . Estandarizando se tiene:
~ N ( 0,1 ), pero se sabe que:
SSE ~ χ n2 −r entonces: σ2
SSE ( n − r )σ$ 2 SSE ( n − r )σ$ 2 σ$ 2 = , ; ~ χ n2 − r = n−r σ2 σ2 σ2 Se realiza el cambio de variable cial para
t=
u=
(n−r )σ$ 2 para obtener un intervalo confidenσ2
2 2 σ 2 , es decir tendremos: Pr[ χ α 2 ≤ u ≤ χ 1−α 2 ] = 1 − α .
β$ j − β j ( n − r )σ$ 2 σ2
σ 2 C j+1, j+1 n−r
β$ j − β j
=
σ C j+1, j+1 σ$ 2 σ2
=
β$ j − β j σ$ C j+1, j+1
~ tn−r
- 50 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Pr − tα
2 ,n − r
LM MN
≤ t ≤ tα
Pr − tα 2 ,n − r ≤
= 1− α
2 ,n − r
β$ j − β j σ$ C j+1, j+1
OP PQ
≤ tα 2 ,n − r = 1 − α
Pr − tα 2 ,n − r σ$ C j+1, j+1 ≤ β$ j − β j ≤ tα 2 ,n − r σ$ C j+1, j+1 = 1 − α r estar −β$ j se tiene:
Pr −β$ j − tα 2,n−rσ$ C j+1, j+1 ≤ −β$/ j + β$/ j − β j ≤ −β$ j + tα 2,n−rσ$ C j+1, j+1 = Pr β$ j + tα 2 ,n − rσ$ C j+1, j+1 ≥ β j ≥ β$ j − tα 2 ,n − rσ$ C j+1, j+1 = 1 − α
LM $ C Pr β − t ≤β MMN14442σ$444 3 α 2 ,n − r
j
j+1, j+1
j
Límite Inferior del Intervalo
En resumen:
Límite Superior del Intervalo
LM N
β j ∈ β$ j ± tα 2 ,n − rσ$ C j+1, j+1
OP PPQ
≤ β$ j + tα 2 ,n − r σ$ C j+1, j+1 = 144424443
ó β j ∈ β$ j ± tα 2 ,n − r V( β$ j )
OP Q
b) Estimación del Intervalo para la respuesta media de E ( Y0 ) dado el vector
X'0 Sean los valores de X 1 , X 2 , X 3 ,L , X k denotado por X 01 , X 02 , X 03 ,L , X 0 k la respuesta media está denotado por E ( Y0 ) . Para estimar la respuesta media en este punto defínase el vector X 0 como sigue:
X 0' = 1 X 01
X 02 L
X 0k
La respuesta media estimada correspondiente para X 0 es denotado por:
Y$0 = X 0' β$
ó Y$h = X h' β$ , entonces este estimador es insesgado:
Y$0 .
Análisis y Diseño de Experimentos - 51 1) E ( Y$0 ) = E ( X 0' β$ ) = X 0' E ( β$ ) = X 0' E ( X ' X )−1 X ' Y = X 0' ( X ' X )−1 X ' E Y
= X 0' ( X ' X )−1 X ' Xβ = X 0' β es insesgado. 2) La varianza es: V ( X 0' β$ ) = X 0' V ( β$ ) X 0 = X 0' ( X ' X )−1σ 2 X 0 o su equivalente es: S 2 ( Y$0 ) = MSE X 0' ( X ' X )−1 X 0 , su estimador es:
E ( Y$0 ) = X 0' β$ ~ N X 0' β , X 0' ( X ' X )−1 X 0σ 2 , entonces:
X '0 β$ − X '0 β
σ X '0 ( X ' X )−1 X 0
SSE entonces: n−r
~ N ( 0,1 ), pero: σ$ 2 =
( n − r )σ$ 2 SSE SSE ; entonces ~ χ 2n − r = 2 2 2 σ σ σ 3) Para encontrar el Intervalo Confidencial para E ( Y0 ) , formamos la distribución de «t» de la siguiente manera: t=
X '0 β$ − X '0 β σ X '0 ( X ' X )−1 X 0 $2
( n − r )σ σ2
n−r
Pr − tα
LM MN
2 ,n − r
Pr −tα 2,n−r ≤
X '0 β$ − X '0 β
=
≤ t ≤ tα
σ
X '0 ( X ' X )−1 X 0 $2
σ σ2
2 ,n − r
X'0 β$ − X'0 β
σ$ X'0 ( X' X )−1 X0
=
X '0 β$ − X '0 β
σ$ X '0 ( X ' X )−1 X 0
= 1− α
OP PQ
≤ tα 2,n−r = 1−α
Pr −tα 2,n−rσ$ X'0 ( X' X )−1 X0 ≤ X'0 β$ − X'0 β ≤ tα 2,n−rσ$ X'0 ( X' X )−1 X0 = restar − X'0 β$ se tiene: Pr − X'0 β$ − tα 2,n−rσ$ X'0 ( X' X )−1 X0 ≤ − X'0 β$ + X'0 β$ − X'0 β ≤ − X'0 β$ + tα 2,n−rσ$ X'0 ( X' X )−1 X0 =
Pr X'0 β$ + tα 2,n−rσ$ X'0 ( X' X )−1 X0 ≥ X'0 β ≥ X'0 β$ − tα 2,n−rσ$ X'0 ( X' X )−1 X0 = 1− α
- 52 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
LM MN
Pr X '0 β$ − tα 2 ,n− rσ$ X '0 ( X ' X )−1 X 0 ≤ X '0 β ≤ X '0 β$ + tα 2 ,n− rσ$ X '0 ( X ' X )−1 X 0 144444 42444444 3 144444 42444444 3 Límite Inferior
Límite Superior
OP PQ
Pr X 0' β$ − tα 2 ,n −r S ( Y$0 ) ≤ E ( Y0 ) ≤ X 0' β$ + tα 2 ,n −r S ( Y$0 ) = 1 − α En resumen:
LM MN
X '0 β ∈ X '0 β$ ± tα 2 ,n− rσ$ X '0 ( X ' X )−1 X 0 12 3 123 Y0
Y$0
OP PQ
LM MN
ó Y0 ∈ X '0 β$ ± tα 2 ,n− r S ( Y$ 123 Y$0
c) Intervalo confidencial para la predicción de nuevas observaciones Yh ( new ) . Si X h = 1 '
X h1
X h2 L
X h , p −1 , con Y$h = X h' β$ , entonces :
1) E ( Y$h ) = E ( X h' β$ ) = X h' E ( β$ ) = X h' E ( X ' X )−1 X ' Y = X h' ( X ' X )−1 X ' E Y
= X h' ( X ' X )−1 X ' Xβ = X h' β es insesgado. 2) yh = X h' β + eh
~y = X ' β$ , donde X ' β$ son usados ambos para la predicción futura de h h h las observaciones correspondientes de X h' ' ' −1 −1 E ( ~yh ) = E ( X h' β$ ) = X h' E ( β$ ) = X h E ( X ' X ) X ' Y = X h ( X ' X ) X ' E Y
= X h' ( X ' X )−1 X ' Xβ = X h' β
yh − ~ yh = yh − X h' β$ = X h' β + eh − X h' β$ = X h' ( β − β$ ) + eh , pero cov( β$ ,eh ) = 0 3) La varianza es:
v( yh − ~yh ) = v( yh − X h' β$ )
= v( X h' β + eh − X h' β$ ) = v [ X h' ( β − β$ ) + eh ]
Análisis y Diseño de Experimentos - 53 -
= v [ X h' ( β − β$ )] + v( eh ) = X h' v( β − β$ ) X h ] + σ 2 = X h' v ( β$ ) X h + σ 2 = X h' ( X ' X )−1 σ 2 X h + σ 2
v( yh − ~yh ) = [ X h' ( X ' X )−1 X h + 1]σ 2 Entonces su estimadores es: X h' β$ ~ N [ X h' β ,( X h' ( X ' X )−1 X h + 1)σ 2 ] y se distribuye como: X h' β$ − X h' β X h' ( X ' X )−1 X h + 1 σ 2
~ N ( 0,1 ) estandarizada.
Pero, se sabe que: σ$ 2 = SSE , ( n − r )σ$ 2 = SSE dividiendo entre σ$ 2 a n−r ambos miembros tenemos:
( n − r )σ$ 2 SSE ( n − r )σ$ 2 ; ~ χ 2n − r . Luego formamos la «t», de = 2 2 2 σ σ σ la siguiente manera:
X'h β$ − X'h β t=
σ X'h ( X' X )−1 Xh + 1 $2
( n−r )σ σ2
n−r
X 'h β$ − X 'h β
=
σ X'h ( X ' X )−1 Xh +1 $2
σ σ2
=
X'h β$ − X'h β
σ$ X'h ( X' X )−1 Xh
~
4) Una predicción del intervalo con 1- α de coeficiente confidencial para una nueva observación Yh ( new ) correspondiente a
X h , para el valor espe-
cificado de X variables, se construye en seguida. El intervalo confidencial es:
Pr − tα
LM MN
2 ,n − r
Pr −tα 2 ,n− r ≤
≤ t ≤ tα
2 ,n − r
= 1− α
X 'h β$ − X 'h β
σ$ X 'h ( X ' X )−1 X h + 1
OP PQ
≤ tα 2 ,n − r = 1 − α
Pr −tα 2,n−rσ$ X'h ( X' X )−1 Xh +1 ≤ X'h β$ − X'h β ≤ tα 2,n−rσ$ X'h ( X' X )−1 Xh +1 =
- 54 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
restar − X 'h β$ se tiene: Pr − X'h β$ − tα 2,n−rσ$ X'h ( X' X )−1 Xh +1 ≤ − X'h β$ + X'h β$ − X'h β ≤ − X'h β$ + tα 2,n−rσ$ X'h ( X' X )−1 Xh +1
Pr X'h β$ + tα 2,n−rσ$ X'h ( X' X )−1 X h + 1 ≥ X'h β ≥ X'h β$ − tα 2,n−rσ$ X'h ( X' X )−1 Xh + 1
LM MN
O Q
Pr X'h β$ − tα 2 ,n−rσ$ X'h ( X' X )−1 Xh + 1 ≤ X'h β ≤ X'h β$ + tα 2,n−rσ$ X'h ( X' X )−1 X h + 1 144444424444443 144444424444443 Límite Inferior
Límite Superior
En forma resumida:
Pr Xh' β$ − tα 2,n−r S( Y$h( new ) ) ≤ Yh( new ) ≤ Xh' β$ + tα 2,n−r S( Y$h( new ) ) = 1− α S 2 ( Y$h( New ) ) = MSE 1 + X h' ( X ' X )−1 X h
S ( Y$h( New ) ) =
LM MN
MSE 1 + X h' ( X ' X )−1 X h
OP PQ
X'h β ∈ X'h β$ ± tα 2 ,n−rσ$ X'h ( X' X )−1 X h + 1 12 3 12 3 Yh( new )
Y$h
LM MN
ó Yh( new ) ∈ X'h β$ ± tα 2 ,n−r S( Y$h( 123 Y$h
EJEMPLO: En la provincia de Azángaro se obtuvieron la producción de papa (kg/ha) durante la campaña agrícola (Noviembre-Abril), para lo cual las se incorporó las variables independientes: tierra (ha) y semilla (kg/ha). Los datos se presentan a continuación:
Análisis y Diseño de Experimentos - 55 -
Produc. Q 3250 1675 1450 2450 3608 2350 2250 1800 3580 7345 3880 3880 3220 6860 3608 6450
Nro. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 TOTAL
Tierra (Xi1) 1.00 0.70 0.60 1.00 1.00 0.50 0.50 0.50 1.00 2.00 1.00 1.00 1.00 2.00 1.00 2.00
∑Y = ∑X i
57656
i1
=
16.80
Semilla (Xi2) 1500 780 800 1500 1600 810 820 750 1560 3130 1670 1620 1650 3200 1600 3240
∑X
i2
=
26230
Xi12
Xi22
1.00 0.49 0.36 1.00 1.00 0.25 0.25 0.25 1.00 4.00 1.00 1.00 1.00 4.00 1.00 4.00
2250000 608400 640000 2250000 2560000 656100 672400 562500 2433600 9796900 2788900 2624400 2722500 10240000 2560000 10497600
∑X
2 i1
=
21.60
∑X
2 i2
=
53863300
Xi1Xi2
Xi1Yi
Xi2Yi
3250 1172.5 870 2450 3608 1175 1125 900 3580 14690 3880 3880 3220 13720 3608 12900
4875000 1306500 1160000 3675000 5772800 1903500 1845000 1350000 5584800 22989850 6479600 6285600 5313000 21952000 5772800 20898000
1500 546 480 1500 1600 405 410 375 1560 6260 1670 1620 1650 6400 1600 6480
Yi2 10562500 2805625 2102500 6002500 13017664 5522500 5062500 3240000 12816400 53949025 15054400 15054400 10368400 47059600 13017664 41602500
∑X X = ∑X Y = ∑X Y = ∑Y = 2
i1 i2
34056
i1 i
74028.5
i2 i
i
117163450
257238178
a) Fijar el modelo de Regresión Lineal Múltiple. b) Encontrar las ecuaciones normales. c) Estimar β$ = ( X ' X )−1 X ' Y d) E ( Y$ ) = β$ 0 + β$ 1 X i1 + β$ 2 X i 2 e) Calcular el ANOVA,
~2 R 2 , R Ajust .
f) Calcular V ( β$ ) = ( X ' X )−1σ 2 g) Estimar los errores: e$ = Y − Y$ h) Estimar los intervalos confidenciales para
βi
i) Estimar la respuesta media E ( Yh ) y el intervalo confidencial. j) Realice la predicción de nuevas observaciones SOLUCIÓN: a) Y$ = β$ 0 + β$ 1 X i 1 + β$ 2 X i 2 b) Ecuaciones normales ( X ' X )β$ = X ' Y
Yh( new ) y el intervalo confidencial.
- 56 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
1 1 X = 1 M 1
1.0 1500 0.7 780 1 1 1 L 1 0.6 800 0.7 0.6 L 2.0 X' = 1.0 M M , 1500 780 800 L 3240 2.0 3240
LM MM N
1 1 1 L 1 1 1 X ' X = 1.0 0.7 0.6 L 2.0 × 1 1500 780 800 L 3240 M 1
n X ' X = ∑Xi1 ∑Xi2
OP PP Q
1.0 1500 16.8 26230 0.7 780 16 34056 0.6 800 = 16.8 21.6 M M 26230 34056 53863300 2.0 3240
∑X ∑X ∑X ∑X X ∑X X ∑X
16 16.8 26230 21.6 34056 i1 i 2 = 16.8 , 2 i 2 26230 34056 53863300
i1 2 i1
i1
i2
i2
∑Yi 57656 X ' Y = ∑ X i1Yi = 74028.5 , ∑ X i 2Yi 117163450
16.8 26230 βˆ0 57656 16 16.8 21.6 34056 βˆ1 = 74028.5 26230 34056 53863300 βˆ 117163450 2
16 βˆ0 + 16.8βˆ1 + 26230 βˆ2 = 57656 16.8βˆ + 21.6 βˆ + 34056βˆ = 74028.5 0
1
2
26230 βˆ0 + 34056 βˆ1 + 53863300 βˆ2 = 117163450 c) Estimar β$ = ( X ' X )−1 X ' Y ,
A11 Adj ( X ' X ) = − A12 A13
− A21 A22 − A23
( X ' X )−1 =
Adj( X ' X ) det( X ' X )
A31 a11 a12 − A32 X ' X = a21 a22 , a31 a32 A33
a13 a23 a33
Análisis y Diseño de Experimentos - 57 -
A11 = a22 a33 − a23 a32 = 3636144
A22 = a11a33 − a13a31 = 173799900
A12 = a21a33 − a23 a31 = 11614560
A23 = a11a32 − a12 a31 = 104232
A13 = a21a32 − a22 a31 = 5572.8
A33 = a11a22 − a12 a21 = 63.36
A11 − A21 A31 3636144 −11614560 5572.8 Adj( X ' X ) = − A12 A22 − A32 = −11614560 173799900 −104232 A13 − A23 A33 5572.8 −104232 63.36 16.8 26230 16 16.8 21.6 34056 det( X ' X ) = 26230 34056 53863300 = 9228240 = D 16.8 26230 16 16.8 21.6 34056
0.394023562 −1.258588853 0.000603885 Adj( X ' X ) = −1.258588853 18.83348287 −0.011294894 (X ' X ) = det( X ' X ) 0.000603885 −0.011294894 0.000006865 −1
) 0.394023562 −1.258588853 0.000603885 57656 β0 = 299.68 ) ∠= −1.258588853 18.83348287 −0.011294894 × 74028.5 = β1 = −1699. ) 0.000603885 −0.011294894 0.000006865 117163450 β2 = 3.1038
Y$ = 299 .68 − 1699 .5543 X i 1 + 3.1038 X i 2 2 ~2 e) Calcular el ANOVA, R , R Ajust . d)
i) Grados de libertad (GL). GLRe g . = r − 1 = 3 - 1 = 2 GLError = n − r = 16 - 3 = 13 GLTotal = n − 1 = 16 - 1 = 15
ii) Sumas de Cuadrados (SC ó SS).
- 58 -
V. Ibañez Q. - Docente FINESI - UNA - Puno 57656 2 ˆ X 'Y − nY 2 = [ 299.682028 −1699.5543 3.10383528]× 74028.5 −16 57656 SSRm = â' 16 117163450
= 255119061.1 - 207763396 = 47355665.14 2
57656 SSTm = Y ' Y − nY 2 = 257238178 − 16 = 49474782 16
SSE = Y ' Y − βˆ ' X ' Y = 257238178 − 255119061.1 = 2119116.86 ó
SSE = SSTm − SSRm = 49474782 − 47355665.14 = 2119116.86 Tabla de Análisis de Varianza para la producción de papa. F. de V. G.L. S.S. M.S. Fc. Signif Debido a Regresión 2 47355665.140 23677832.5700 145.25 ** Error residual 13 2119116.860 163008.9892 Total 15 49474782.000 3298318.8000 Cálculo del Coeficiente de Determinación: R2 =
. SSRm 4735566514 × 100 = × 100 = 95.72% SSTm 49474782
~2 ) Coeficiente de Determinación ajustado ( R MSE 163008.9892 ~ R2 = 1− ) × 100 = 95.06% = (1 − MSTm 3298318.8
f) Calcular V ( β$ ) = ( X ' X )−1σ 2
LM MM N
OP PP Q
LM MM N
OP PP Q
0.394023562 -1.258588853 0.000603885 64229.38257 -205161.2968 98.43868346 V( β$ ) = -1.258588853 18.83348287 -0.011294894 (1630089892 . ) = -205161.2968 3070027.006 -1841.169254 0.000603885 -0.011294894 0.000006865 98.43868346 -1841.169254 1.119056711
g) Estimar los errores: e$ = Y − Y$ , Y$ = Xβ$
Análisis y Diseño de Experimentos - 59 -
LM3250 OP LM1 1675 MM1450 PP MM11 M P M e$ = M 2450 P − M1 MM M PP MMM MM3608 PP MM1 N6450 Q N1
LM − 5.8807 OP OP M 144 .0144 P P 800 P L 299 .682028 O M − 313.0177 P M M PP P 1500 P × M − 1699 .5543 P = M M P PP M P MN 3 .10383528 PQ M M M P 1600 P MM 41.7358 PP 3240 PQ N − 506 .9998 Q
1.0
1500
0 .7
780
0 .6 1.0 M 1.0 2 .0
h) Estimar los intervalos confidenciales para
LM N
βi
OP Q
Pr β$ i − t α ,( n − r ) V ( β$ i ) ≤ β i ≤ β$ i + t α ,( n − r ) V ( β$ i ) = 1 − α 2
2
Intervalo confidencial (IC) para
LM N
β0:
OP Q
Pr β$ 0 − t α ,( n − r ) V ( β$ 0 ) ≤ β 0 ≤ β$ 0 + t α ,( n − r ) V ( β$ 0 ) = 1 − 0.05 2
2
Pr 299.682028 − ( 216 . ) 64229.38257 ≤ β 0 ≤ 299.682028+ ( 216 . ) 64229.38257 = 095 .
Pr -247.7379 ≤ β 0 ≤ 847.10198 = 0.95
Intervalo confidencial (IC) para
LM N
β1:
OP Q
Pr β$ 1 − t α ,( n− r ) V ( β$ 1 ) ≤ β 1 ≤ β$ 1 + t α ,( n − r ) V ( β$ 1 ) = 1 − 0.05 2
2
Pr -1699.5543- ( 2.16 ) 3070027.006 ≤ β 1 ≤ -1699.5543 + ( 2.16 ) 3070027.006 = 0
Pr -5484.196687 ≤ β 1 ≤ 2085.088 = 0.95
Intervalo confidencial (IC) para
LM N
β2 :
OP Q
Pr β$ 2 − t α ,( n − r ) V ( β$ 2 ) ≤ β 2 ≤ β$ 2 + t α ,( n − r ) V ( β$ 2 ) = 1 − 0.05 2
2
Pr 3.103835 − ( 2.16 ) 1.1190567 ≤ β 2 ≤ 3.103835 + ( 2.16 ) 1.1190567 = 0.95
Pr 0.81887 ≤ β 2 ≤ 5.3888 = 0.95
i) Estimar la respuesta media E ( Yh ) y el intervalo confidencial.
X h' = 1 15 . 1640
- 60 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
LM MM N
OP PP Q
299.682028 $ Y$h = X β = 1 15 . 1640 × -1699.5543 = 2840.640437 3.10383528 ' h
V( Xh' β$ ) = Xh' ( X' X )−1σ 2 Xh = Xh' V( β$ ) Xh ó S2 (Y$h ) = MSE[ Xh' ( X' X )−1 Xh ]
LM MM N 98.43868346
OP LM OP P M P -1841.169254 1.119056711 QP MN1640PQ L 1 OP −828.0621915 × MM 15 . = 630447.3382 MN1640PPQ
64229.38257 -205161.2968 98.43868346 1 V ( X h' β$ ) = 1 15 . 1640 × -205161.2968 3070027.006 -1841.169254 × 15 .
= −8207312176 . 1380361636 .
S ( Y$h ) = 794.0071399 El intervalo Confidencial para la respuesta Media es: Pr 2840.64 - (2.16)(794.007) ≤ E ( Yh ) ≤ 2840.64 + (2.16)(794.007) = 0.9
Pr 1125.585 ≤ E ( Yh ) ≤ 4555.6959 = 0.95 j) Predicción de nuevas observaciones X h' = 1 0.25 400
LM MM N
Yh( new ) y el intervalo confidencial.
OP PP Q
299.682028 ' $ $ Yh = X h β = 1 0.25 400 × -1699.5543 = 1116.327565 3.10383528 S 2 ( Y$h( New ) ) = MSE [1 + X 'h (X' X) -1 X h ] = MSE + X 'h (X' X) -1 MSE X h = MSE + X 'hV ( β$
LM64229.38257 MM98.43868346 N
OP LM 1 OP PM P 1.119056711 PQ MN400PQ L1O 85.76905 × MM0.25P = 206100.581 MN 400 PPQ
-205161.2968 98.43868346
. . 400]× -205161.2968 3070027.006 -1841.169254 × 025 . S2(Y$h( New) ) =1630089892 +[1 025 -1841.169254
= 163008.9892 + [52314.53175 −174122.2469
S ( Y$h( New ) ) = 453.9830184
Análisis y Diseño de Experimentos - 61 -
Pr Y$h − tα ,( n−r )S(Y$h( new) ) ≤ Yh( new) ≤ Y$h + tα ,( n−r )S(Y$h( new) ) = 1−α 2
2
Pr 1116.3276- (2.16)(453.983018) ≤ Yh( New ) ≤ 1116.3276 + (2.16)(453.983018) = 0.95
Pr 135.724 ≤ Yh ( New ) ≤ 2096.93088 = 0.95
Correlaciones Parciales:
r12•3 = r13•2 =
r12 − r13r23 (1− r )(1 − r ) 2 13
2 23
=
r13 − r12r23 ( 1 − r )( 1 − r ) 2 12
2 23
. . )( 099327 . ) 096375 − ( 097676 2 2 (1− 097676 . )(1 − 099327 . )
=
. = −0259
0.97676 − ( 0.96375 )( 0.99327 ) ( 1 − 0.963752 )( 1 − 0.99327 2 )
= 0.63089
Correlación Múltiple:
R12•23 = 1 −
2119116.86 SSE = 1− = 0.957 ó en forma equivalente. 49474782 SSTm
2 2 1− R12•23 = 1− (1− r122 )(1− r132•2 ) = 1− (1− 096375 . )(1− 0630897 . ) = 1− 004285 . . = 095714
Prueba de hipótesis parciales para el ejemplo anterior. 1) Hipótesis: H0 : β 1•0 ,2 = 0
H0 : β 2•0 ,1 = 0
Ha : β 1•0 ,2 ≠ 0
Ha : β 2•0 ,1 ≠ 0
2) Nivel de significación: α = 0.05 3) Estadígrafo de Contraste: F-Snedecor. 4) Región de Rechazo y Aceptación: Si
numerador Fc ≤ FglglError
Si
numerador Fc > FglglError , entonces se rechaza la Ho: y se acepta la Ha:
, entonces se acepta la Ho:
5) Cálculo de ANOVA. Adj( x' x ) SCRe g . ( β 1 , β 2 β 0 ) = β$ ' x' y , β$ = ( x' x )−1 x' y ; ( x' x )−1 = x' x
- 62 -
V. Ibañez Q. - Docente FINESI - UNA - Puno x' x =
LM ∑ x MN∑ x x
∑x x ∑x
2 i1
i1 i 2 2 i2
i1 i 2
( ∑ X i1 )2
∑ xi21 = ∑ X i21 − ∑x
2 i2
∑x
= ∑ X i22 −
n
( ∑ X i 2 )2
x = ∑ X i1 X i 2 −
= 216 . −
( 16.8 )2 = 3.96 16
( ∑ X i1 )( ∑ X i 2 ) n
( ∑ Yi )2 n
OP 10862493.75Q 6514.5
= 53863300 −
n
i1 i 2
∑ yi2 = ∑ Yi 2 −
OP = L 3.96 PQ MN6514.5
( 26230 )2 = 10862493.75 16
= 34056 −
= 257238178 −
( 16.8 )( 26230 ) = 6514.5 16
( 57656 )2 = 49474782 16
x' x = 3.96 × 10862493.75 − 6514 .5 × 6514.5 = 576765 ( x' x )−1 =
x' y =
LM MN
1 ∑ xi 2 x' x − ∑ xi1 xi 2
− ∑ xi1 xi 2
2
∑ xi21
OP = L 18.83348287 PQ MN−0.011294894
−0.011294894 0.000006865
LM∑ x y OP = L 13489.7 O MN∑ x y PQ MN22643645PQ
OP Q
i1 i
i2
i
∑x
y = ∑ X i1Yi −
∑x
y = ∑ X i 2Yi −
i1 i
i2 i
( ∑ X i1 )( ∑ Yi ) n
( ∑ X i 2 )( ∑ Yi ) n
= 74028.5 −
= 117163450 −
LM N
( 16.8 )( 57656 ) = 13489.7 16 ( 26230 )( 57656 ) = 22643645 16
OP LM OP Q MN PQ
−1699.55431 β$ β$ = ( x' x )−1 x' y = = 1 . 310383527 β$ 2 k
β$ 0 = Y − ∑ β$ j X • j =Y − β$ 1 X •1 − β$ 2 X •2 j =1
= 3603.5 - (-1699.55431)(1.05) - 3.10383527x1639.375) = 299.6820798
SCRe g ( β 1 ,β 2
β0 )
. = −1699.55431 310383527 ×
LM 13489.7 OP = 473556 N22643645Q
Análisis y Diseño de Experimentos - 63 -
SCR ( β 2
β0 )
=
( ∑ xi 2 yi )2
∑x
2 i2
=
( 22643645 )2 = 47202297.25 10862493.75
SCR( β1 β0 ,β2 ) = SCR( β1 ,β2 β0 ) − SCR( β2 β0 ) = 4735566622 . − 47202297 = 153368.97
=
SCR ( β 1
β0 )
SCR ( β 2
β 0 ,β 1 )
( ∑ xi1 yi )2
=
∑x
2 i1
= SCR ( β 1 ,β 2
β0 )
( 13489.7 )2 = 45952526.79 3.96 − SCR ( β 1
β0 )
= 47355666.22 − 45952526
= 1403139.43 RESUMEN EN ANOVA: F. de V.
GL:
R( β1 ,β 2 β 0 )
2
47355665.14
R( β 2 β 0 )
1
47202297.25
R( β1 β 0 ,β 2 )
1
153368.97
R( β1 β 0 )
R( β 2 β 0 ,β1 )
Error Residual Total
SC.
CM.
Fc
Signif. Tabla-F
153368.97
0.94
ns.
4.67
1
45952526.79
1 13 15
1403139.43 1403139.43 2119116.86 163008.9892 49474782.00
8.61
*
4.67
6) Decisión: Tiene dos partes para la decisión. i) Para es
β 1 , Fc = 0.94 < 4.67, por lo tanto no se rechaza la hipótesis Ho:, esto
β 1•0 ,2 = 0 ,
esto implica que no debe incluirse en el modelo
R( β 1 β 0 , β 2 ) ii) Para
β 2 , Fc = 8.61 ≥ 4.67, por lo tanto se rechaza la Ho:, y se acepta la Ha:
β 2•0 ,1 ≠ 0 , esto implica que aporta al modelo R( β 2 β 0 , β 1 ) . Luego el modelo final debe ser calculado sin incluir lo.
β 1 , ya que no aporta al mode-
- 64 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Y$ = β$ 0 + β$ 2 X i 2 , β$ 2 =
∑x y ∑x
i2 i 2 i2
=
22643645 = 2.08457 10862493.75
. − 2.08457 × 1639.375 = 18610558 . β$ 0 = Y − β$ 2 X •2 = 36035
Y$ = 186.10558 + 2.08 X i 2 ,
X i 2 corresponde a la variable semilla
Para encontrar la bondad de ajuste, se debe calcular el coeficiente de determinación ( R 2 )
R = 2
( ∑ xi 2 yi )2
∑y
2 i
∑x
2 i2
=
SCR( β 2 / β 0 ) SSTm
=
( 22643645 )2 10862493.75 =9 49474782
Se puede interpretar que el modelo tiene una buena bondad de ajuste y es confiable, es decir el 95.41% de la variación de la producción de papa depende de la variación de semilla, y el 4.59% está explicado por otros factores ajenos al trabajo. RESULTADOS CON EL SAS. The REG Procedure Model: MODEL1 Variable Intercept T S Q
XX Inverse, Intercept 0.3940235625 -1.258588853 0.0006038855 299.68202648
Variable Intercept T S Q
Source Model Error Corrected Total Root MSE Dependent Mean Coeff Var Variable Intercept T S
Model Crossproducts XX XY YY Intercept T S 16 16.8 26230 16.8 21.6 34056 26230 34056 53863300 57656 74028.5 117163450
DF 1 1 1
Parameter Estimates, and SSE T S -1.258588853 0.0006038855 18.833482874 -0.011294895 -0.011294895 6.8658813E-6 -1699.554261 3.1038352709
Analysis of Variance Sum of Mean DF Squares Square 2 47355667 23677833 13 2119115 163009 15 49474782 403.74355 R-Square 0.9572 3603.50000 Adj R-Sq 0.9506 11.20421
Parameter Estimate 299.68203 -1699.55426 3.10384
Parameter Estimates Standard Error t Value Pr > |t| 253.43506 1.18 0.2582 1752.14853 -0.97 0.3498 1.05792 2.93 0.0116
F Value 145.25
Q 57656 74028.5 117163450 257238178 Q 299.68202648 -1699.554261 3.1038352709 2119115.0975
Pr > F FglglError , entonces se rechaza la Ho: y se acepta la Ha:
, entonces se acepta la Ho:
5) Cálculo de ANOVA. Adj( x' x ) SCRe g . ( β 1 , β 2 β 0 ) = β$ ' x' y , β$ = ( x' x )−1 x' y ; ( x' x )−1 = x' x
x' x =
LM ∑ x MN∑ x x
∑x x ∑x
2 i1
i1 i 2 2 i2
i1 i 2
∑ xi21 = ∑ X i21 − ∑x
( ∑ X i 1 )2 n
x = ∑ X i1 X i 2 −
i1 i 2
∑ yi2 = ∑ Yi 2 −
OP = L976.79469 PQ MN−1932.627
= 976.79469 ,
( ∑ X i1 )( ∑ X i 2 ) n
( ∑ Yi )2 n
x' x = 10147256.69
−1932.627 14212.100
∑x
2 i2
OP Q
= ∑ X i22 −
( ∑ X i 2 )2 n
= −1932.627
= 40290.2053 −
( 582.424 )2 = 6368.433723 10
= 14212.1
Análisis y Diseño de Experimentos - 71 ( x' x )−1 =
x' y =
LM MN
1 ∑ xi 2 x' x − ∑ xi1 xi 2
− ∑ xi 1 xi 2
2
∑ xi21
OP = L0.001400585 PQ MN0.000190458
0.000190458 0.0000962619
LM∑ x y OP = L1042.375564O MN∑ x y PQ MN 4899.4678 PQ
OP Q
i1 i
i2 i
∑x
y = ∑ X i1Yi −
∑x
y = ∑ X i 2Yi −
( ∑ X i 1 )( ∑ Yi )
i1 i
i2 i
n
( ∑ X i 2 )( ∑ Yi ) n
= 1042.375564 ,
= 4899.4678
LM N
OP Q
LM MN
2.393079257 β$ β$ = ( x' x )−1 x' y = = 1 0.670161157 β$ 2
OP PQ
k
β$ 0 = Y − ∑ β$ j X • j =Y − β$ 1 X •1 − β$ 2 X •2 = −40.2208399 j =1
SCRe g( β1 ,β 2 β 0 ) = 2.393079257 0670161157 . ×
SCR ( β 2
β0 )
=
( ∑ xi 2 yi )2
∑x
2 i2
=
LM1042.375564OP = 5777.9 N 4899.46780 Q
( 4899.4678 )2 = 1689.038546 14212.1
SCR( β1 β0 ,β2 ) = SCR( β1 ,β2 β0 ) − SCR( β2 β0 ) = 5777920352 . . −16890385 = 4088.881806
SCR( β1 β 0 ) =
SCR ( β 2
β 0 ,β 1 )
( ∑ xi1 yi )2
∑x
= SCR ( β 1 ,β 2
2 i1
β0 )
= 4665.56089
=
(1042.375564 )2 = 1112.359463 976.79469
− SCR ( β 1
β0 )
= 5777.920352 − 1112.3594
- 72 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
RESUMEN EN ANOVA: F. de V.
GL:
R( β1 ,β2 β0 )
2
5777.92
R( β 2 β 0 )
1
1689.038546
R( β1 β0 ,β2 )
1
4088.881806 4088.881806
R( β1 β 0 )
1
1112.359463
R( β2 β0 ,β1 )
1 7 9
Error Residua Total
SC.
CM.
4665.56089 4665.56089 590.5134 84.35905717 6368.43
Fc
Signif. Tabla-F
48.47
**
12.2
55.31
**
12.2
6) Decisión: Tiene dos partes para la decisión. i) Para
β 1 , Fc = 48.47 ≥ F71,0.01 = 12.2, por lo tanto se rechaza la hipótesis
Ho:, esto es
β 1•0 ,2 ≠ 0 , esto implica que se debe incluirse en el modelo
R( β 1 β 0 , β 2 ) o aporta al modelo. ii) Para
β 2 , Fc = 55.31 ≥ F71,0.01 = 12.2, por lo tanto se rechaza la Ho:, y se
acepta la Ha:
β 2•0 ,1 ≠ 0 , esto implica que aporta al mode-
lo R( β 2 β 0 , β 1 ) . Luego el modelo final queda con los dos variables independientes en estudio, ya que aportan al modelo.
Y$ = −40.2208 + 2.393079 X i 1 + 0.67016 X i 2 SALIDA DEL SAS Variable Intercept X1 X2 Y
Variable Intercept X1 X2 Y
Model Crossproducts XX XY YY Intercept X1 X2 10 276.19 483 276.19 8604.8863 11407.35 483 11407.35 37541 582.424 17128.34402 33030.547 XX Inverse, Intercept 1.9010892146 -0.047881894 -0.009909714 -40.22083991
Parameter Estimates, and SSE X1 X2 -0.047881894 -0.009909714 0.0014005854 0.0001904581 0.0001904581 0.0000962619 2.3930792572 0.6701611574
Y 582.424 17128.34402 33030.547 40290.20533
Y -40.22083991 2.3930792572 0.6701611574 590.51340023
Análisis y Diseño de Experimentos - 73 Source Model Error Corrected Total Root MSE Dependent Mean Coeff Var
DF 2 7 9 9.18472 58.24240 15.76981
Squares 5777.92035 590.51340 6368.43375 R-Square Adj R-Sq
Square 2888.96018 84.35906
F Value 34.25
Pr > F 0.0002
0.9073 0.8808
Parameter Estimates Parameter
Standard
Variable
DF
Estimate
Error
t Value
Pr > |t|
Intercept
1
-40.22084
12.66389
-3.18
0.0156
-70.16618
-10.27550
X1
1
2.39308
0.34373
6.96
0.0002
1.58028
3.20588
X2
1
0.67016
0.09011
7.44
0.0001
0.45707
0.88325
Variable Intercept X1 X2
Covariance of Estimates Intercept X1 160.37409376 -4.039271472 -4.039271472 0.1181520674 -0.835974104 0.0160668638
95% Confidence Limits
X2 -0.835974104 0.0160668638 0.0081205671
Output Statistics Dep Var Predicted
Std Error
Obs
Y
1
43.1270
49.9789
Value Mean Predict 3.1014
42.6452
57.3125
27.0557
72.9020
-6.8519
2
16.6530
20.8301
5.6319
7.5126
34.1475
-4.6463
46.3064
-4.1771
3
92.3220
85.1420
7.2965
67.8886
102.3954
57.4045
112.8795
7.1800
4
38.0840
48.6114
4.1121
38.8878
58.3349
24.8156
72.4071
-10.5274
5
61.9390
62.8069
2.9893
55.7384
69.8754
39.9671
85.6466
-0.8679
6
92.3760
88.0975
7.1596
71.1677
105.0272
60.5601
115.6348
4.2785
7
24.3730
16.5681
5.8138
2.8206
30.3156
-9.1356
42.2719
7.8049
8
74.0290
85.7364
4.9458
74.0416
97.4313
61.0695
110.4034
-11.7074
9
70.7720
67.5905
3.8256
58.5446
76.6365
44.0636
91.1175
3.1815
10
68.7490
57.0623
2.9156
50.1680
63.9565
34.2759
79.8487
11.6867
Sum of Residuals Sum of Squared Residuals Predicted Residual SS (PRESS)
95% CL Mean
0 590.51340 1401.80989
Pearson Correlation Coefficients, N = 10 Prob > |r| under H0: Rho=0 Y X1 X2 Y 1.00000 0.41793 0.51500 0.2294 0.1277 X1 0.41793 1.00000 -0.51870 0.2294 0.1245 X2 0.51500 -0.51870 1.00000 0.1277 0.1245
95% CL Predict
Residual
- 74 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
EJEMPLO: En un estudio diseñado para descubrir qué factores podrían estar relacionados con el peso al nacer, se obtuvieron los siguientes datos en 10 niños recién nacidos. Peso al nacer Calificación de condición Orden en gramos (Y) socioeconómica (X1) de nacimiento (X2) 1361 8 4 1588 7 3 1815 4 4 2087 5 3 2268 5 2 2404 4 2 3402 3 2 3629 3 1 3765 2 1 4083 1 1
a) Estimar la ecuación de regresión ajustada, b) Construir la Tabla de ANOVA, c) Encontrar los intervalos confidenciales para bi (betas) e interpretar. SOLUCIÓN: a) Estimar la ecuación de regresión múltiple. N X ' X = ∑ X i1 ∑ X i 2
∑X ∑X ∑X X i1 2 i1
i1
∑X ∑X X ∑X
i2
∑ Yi 26402 X ' Y = ∑ X i1Yi = 93361 , ∑ X i 2Yi 51354 A11 Adj ( X ' X ) = − A12 A13
− A21 A22 − A23
10 42 23 218 114 i1 i 2 = 42 2 23 114 65 i2 i2
10 42 23 42 218 114 det( X ' X ) = 23 114 65 = 2006 10 42 23 42 218 114
A31 1174 −108 −226 − A32 = −108 121 −174 , A33 −226 −174 416
a11 a12 X ' X = a21 a22 a31 a32
a13 a23 a33
Análisis y Diseño de Experimentos - 75 -
A11 = a22 a33 − a32 a23 = 1174
A21 = a12 a 32 − a 32 a13 = 108
A12 = a 21 a33 − a31 a 23 = 108
A22 = a11a33 − a31a13 = 121
A13 = a21a32 − a31a22 = −226
A23 = a11a23 − a21a13 = 174
A31 = a21a32 − a31a22 = −226 A32 = a11 a 32 − a31 a12 = 174 A33 = a11a22 − a21a12 = 416
(X ' X )−1 =
1174 −108 −226 0.58524427 −0.05383848 −0.11266201 Adj(X ' X ) 1 = −108 121 −174 = −0.05383848 0.06031904 −0.08673978 det(X ' X ) 2006 −226 −174 416 −0.11266201 −0.08673978 0.20737787
0.58524427 −0.05383848 −0.11266201 26402 4639.55932 ∠= ( X ' X )−1 X 'Y = −0.05383848 0.06031904 −0.08673978 93361 = −244.432203 −0.11266201 −0.08673978 0.20737787 51354 −422.932203
Yˆ = 4639.55932 − 244.432203 X i1 − 422.932203 X i 2 b) Tabla de ANOVA Grados de libertad (GL.) GLreg = p - 1 = 3 - 1 = 2 GLerror = N - p = 10 - 3 = 7 GLtotal = N - 1 = 10 - 1 = 9 Sumas de Cuadrados (SS): ˆ X ' Y − NY 2 SSR m = â' 26402 2 26402 = [4639.55932 −244.432203 −422.932203] 93361 − 10 = 824738 10 51354 2
26402 SSTm = Y ' Y − NY 2 = 78536258 − 10 = 8829697.6 10
SSE = 8829697.6 - 8247389.51 = 582308.09
- 76 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Tabla de Análisis de Varianza para la Frecuencia Cardíaca F. de V. G.L. S.S. M.S. Fc. Signif Debido a Regresión 2 8247389.510 4123694.7550 49.57 ** Error residual 7 582308.090 83186.8700 Total 9 8829697.600 981077.5111 Cálculo del Coeficiente de Determinación: R2 =
SSRm 8247389.51 x100 = ( 100 ) = 93.41% SSTm 8829697.6
~2 ) Coeficiente de Determinación ajustado ( R V ( β$ ) = ( X ' X )−1 MSE
MSE 83186.87 ~ R 2 = 1− . %, = 1− = 9152 MSTm 981077.51
LM MM N
OP PP Q
LM MM N
OP PP Q
0.585244267 -0.053838485 -0.112662014 48684.63877 -4478.65501 -9372.00031 V( β$ ) = -0.053838485 0.060319043 -0.086739781 (83186.87) = -4478.65501 5017.75238 -7215.61086 -0.112662014 -0.086739781 0.207377866 -9372.00031 -7215.61086 17251.11561
INTERVALO CONFIDENCIAL (IC) PARA ( β i ).
LM N
OP Q
Pr β$ i − t α ,( N − r ) V ( β$ i ) ≤ βi ≤ β$ i + t α ,( N − r ) V ( β$ i ) = 1 − α 2
2
Intervalo confidencial (IC) para
LM N
β0:
OP Q
Pr β$ 0 − t α ,( N − r ) V ( β$ 0 ) ≤ β 0 ≤ β$ 0 + t α ,( N − r ) V ( β$ 0 ) = 1 − 0.05 2
2
Pr 4639.559322−(2.365) 48684.63877 ≤β0 ≤4639.559322+(2.365) 48684.63877 =095 . Pr 4117.731631 ≤ β 0 ≤ 5161.387013 = 0.95
Intervalo confidencial (IC) para
LM N
β1:
OP Q
Pr β$ 1 − t α ,( N − r ) V ( β$ 1 ) ≤ β 1 ≤ β$ 1 + t α ,( N − r ) V ( β$ 1 ) = 1 − 0.05 2
2
Pr -244.4322034 − ( 2.365 ) 5017.75238 ≤ β 1 ≤ -244.4322034 + ( 2.365 ) 5017.75238 =
Pr -411.9595684 ≤ β 1 ≤ -76.90483833 = 0.95
Análisis y Diseño de Experimentos - 77 Intervalo confidencial (IC) para
LM N
β2 :
OP Q
Pr β$ 2 − t α ,( N − r ) V ( β$ 2 ) ≤ β 2 ≤ β$ 2 + t α ,( N − r ) V ( β$ 2 ) = 1 − 0.05 2
2
Pr -422.9322034 − ( 2.365 ) 17251.11561 ≤ β 2 ≤ -422.9322034 − ( 2.365 ) 17251.11561 = 095 .
Pr -733.5595865 ≤ β 2 ≤ -112.3048203 = 0.95
Calcule el intervalo confidencial para la respuesta media E ( Yh ) .
X h' = 1 6 5
LM MM N
OP PP Q
4639.559322 ' $ $ Yh = X h β = 1 6 5 -244.4322034 = 1058.305085 -422.9322034
LM MM-0.112662014 N
OPLM OP PM P 0.207377866 QPNM5PQ
0.585244267 -0.053838485 -0.112662014 1 V( Xh' β$ ) = (83186.87 ) 1 6 5 -0.053838485 0.060319043 -0.086739781 6 = 80201.09999 -0.086739781
S ( Y$h ) = 283.1979873 Pr 1058.305085-(2.365)(283.1979873) ≤ E( Yh ) ≤ 1058.305085+(2.365)(283.1979873) =
Pr 388.5418449 ≤ E ( Yh ) ≤ 1728.068325 = 0.95 Con la información anterior calcular Intervalo confidencia al 95%. X h' = 1 7 6
LM MM N
OP PP Q
4639.559322 Y$h = X h' β$ = 1 7 6 -244.4322034 = 390.940678 -422.9322034
R| S| T
LM MM N
OPLM OPU| PPMM PPV| QN QW
0.585244267 -0.053838485 -0.112662014 1 S2(Y$h( New) ) = (83186.87 ) 1+ 1 7 6 -0.053838485 0.060319043 -0.086739781 7 =217505.0 -0.112662014 -0.086739781 0.207377866 6
S( Y$h( New ) ) = 466.3743683 Pr 390.940678 - (2.365)(466.3743683) ≤ Yh ( New ) ≤ 390.940678 + (2.365)(466.3743683) =
Pr -712.0347031 ≤ Yh( New ) ≤ 1493.916059 = 0.95
- 78 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
PROGRAMA EN SAS.
DATA REGG; OPTIONS NODATE NOCENTER NONUMBER; INPUT Y X1 X2; DATALINES; 1361 8 4 1588 7 3 1815 4 4 2087 5 3 2268 5 2 2404 4 2 3402 3 2 3629 3 1 3765 2 1 4083 1 1 ; PROC PRINT; RUN; PROC REG; MODEL Y = X1 X2/XPX COVB CLB CLI CLM I P; RUN; PROC CORR; VAR Y X1 X2; RUN; PROC CORR; PARTIAL X2; VAR Y X1; RUN;
Análisis y Diseño de Experimentos - 79 SALIDA DEL SAS. Model: MODEL1 Model Crossproducts X’X X’Y Y’Y Intercept X1 10 42 42 218 23 114 26402 93361
Variable Intercept X1 X2 Y
X’X Inverse, Intercept 0.5852442672 -0.053838485 -0.112662014 4639.559322
Variable Intercept X1 X2 Y
Source Model Error Corrected Total Root MSE Dependent Mean Coeff Var
Variable Intercept X1 X2
Variable Intercept X1 X2
Obs 1 2 3 4 5 6 7 8 9 10
DF 1 1 1
X2 23 114 65 51354
Y 26402 93361 51354 78536258
Parameter Estimates, and SSE X1 X2 -0.053838485 -0.112662014 0.0603190429 -0.086739781 -0.086739781 0.2073778664 -244.4322034 -422.9322034
Y 4639.559322 -244.4322034 -422.9322034 582308.09322
Analysis of Variance Sum of Mean DF Squares Square 2 8247390 4123695 7 582308 83187 9 8829698 288.42134 R-Square 0.9341 2640.20000 Adj R-Sq 0.9152 10.92422 Parameter Estimate 4639.55932 -244.43220 -422.93220
Parameter Estimates Standard Error t Value Pr > |t| 220.64596 21.03 F F101 ,0.01 = 10.04 entonces rechazamos la Ho: E ( Y ) = 0 Como F ( Rm ) = 5.98 > F106 ,0 .01 = 5.39 , entonces rechazamos la Ho: A partir del ANOVA (Modelo Lineal General), se realizará la partición en dos fuentes de variación, lo que llamaremos Modelo Lineal General Completo. a=4 2 Y Y2 Y2 Y2 Y2 173 . 2 662 . 2 568 . 2 297 .2 R( µ,α ) = ∑ i•• = 1•• + 2•• + 3•• + 4•• = + + + = 1714985857 . n1• n2• n3• n4• 2 7 5 3 i=1 ni•
SSPadres = R( α µ ) = R( µ ,α ) − R( µ ) = 1724.056667 − 1700 = 14.98585 SSMadres/ Padres = R( β:α µ ,α ) = R( µ,α ,β:α ) − R( µ,α ) = 1724.056667 − 1714985857 . = 9.0708099
Para comprobar la suma de cuadrados del modelo: SS Modelo = R( α ,β:α µ ) = R( β:α µ ,α ) + R( α µ ) = 9.0708099 + 14.985857 = 24.056
Suma de cuadrados del total corregido por la media. SSTm = SST − R( µ ) = 1730.76 − 1700 = 30.76 F ( Padres ) = F ( α µ ) =
R( α µ ) 14 .9858571 = = 7.45 ( a − 1 ) MSE 3 × 0.670333
F ( Madres: Padres ) = F ( β :α µ ,α ) = F. de V. Padres
G.L. a-1 = 3
R( β :α µ ,α ) 9.0708099 = = 4.51 ( b• − a ) MSE 3 × 0.670333
SS. SSPadres =14.985857
Madres/Padres
. GLM:P =b• −a = 7−4 = 3 SSM:P = 90708099
Error Residual
GLError = N−b• =17−7=10
SSE = 6.70333
Total corregido
N - 1 = 16
SSTm = 30.76
MS.
Fc
MSPadres = 49952857 .
F(Padres) =7.4
MSM:P = 30236033 . MSE = 0.670333
F(M:P) = 4.51
- 148 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
EJEMPLO: En el Centro Experimental Chuquibambilla de la Universidad Nacional del Altiplano, se evaluaron los pesos de destete (kg) en ovinos criollos de la progenie de 8 hembras, las cuales fueron apareados a 3 padres. Cada padre fue apareado al azar con diferente número de madres, de los cuales cada madre tiene diferente número de crías (1984 - 1989). Con la información obtenida se estimaron los componentes de varianza y la heredabilidad para esta característica. Información de peso al destete (kg) en ovinos criollos del Centro Experimental Chuquibambilla - UNA - Puno. Padres Madres 1 2 3 4 5 6 Yijk nij Yi..
M602 15 17 14 13 15 74 5
P1 M270 16 15 13
44 3 196
M694 17 19 18 24
78 4
P2 M268 M278 22 22 15 19 19 18 20 15 17 93 5 167
74 4
M246 15 17 18 22 20 17 109 6
P3 M249 16 17 20 18
71 4 290
M603 25 16 16 20 15 18 110 6
653 37
/* PROGRAMA EN SAS */ DATA CRIOLLO; OPTIONS NODATE NOCENTER NONUMBER; TITLE’DISEÑO ANIDADO O JERARQUICO’; INPUT PADRE MADRE CRIA PEDE; CARDS; 1 1 1 15 1 1 2 17 1 1 3 14 1 1 4 13 ..................(ingrese los datos siguiente....) 3 3 3 16 3 3 4 20 3 3 5 15 3 3 6 18 ; PROC PRINT; RUN; PROC GLM; CLASS PADRE MADRE CRIA; MODEL PEDE = PADRE MADRE(PADRE); TEST H = PADRE E =MADRE(PADRE); RUN; /* PRESIONE UD. F3 PARA EJECUTAR EL PROGRAMA */
Análisis y Diseño de Experimentos - 149 SALIDA DE RESULTADOS CON SAS. The GLM Procedure Class Level Information Class Levels Values PADRE 3 1 2 3 MADRE 3 1 2 3 CRIA 6 1 2 3 4 5 6 Number of observations 37 Dependent Variable: PEDE Source Model Error Corrected Total R-Square Coeff Var 0.311123 15.08633
Sum of DF Squares Mean Square 7 92.8490991 13.2641570 29 205.5833333 7.0890805 36 298.4324324 Root MSE PEDE Mean 2.662533 17.64865
Source PADRE MADRE(PADRE)
DF 2 5
Type I SS 31.79354354 61.05555556
Mean Square 15.89677177 12.21111111
F Value 1.87
Pr > F 0.1113
F Value 2.24 1.72
Pr > F 0.1243 0.1610
Tests of Hypotheses Using the Type III MS for MADRE(PADRE) as an Error Term Source DF Type III SS Mean Square F Value Pr > F PADRE 2 30.34375550 15.17187775 1.24 0.3647
Least Squares Means PADRE 1 2 3
PEDE LSMEAN 16.3222222 18.5500000 18.0833333
Standard Error 0.7855015 0.8930406 0.6778477
Pr > |t| F( tt−−11 )( r −1 ),0.05 , entonces se acepta la Ha:
CM Tratam. CM Error
Análisis y Diseño de Experimentos - 159 5. Cálculos: a)
b)
Grados de libertad. Bloques Tratamientos (muestras) Error experimental Total
:r-1 = 10 - 1 = 9 :t-1 = 5-1=4 : (r-1)(t-1) = 9 x 4 = 36 : tr - 1 = 5x10 - 1 = 49
Suma de Cuadrados (SC ó SS).
TC =
Y..2 ( 308.1 )2 = = 1898.5122 5x10 tr
i) SCBloques =
26.7 2 + 27.4 2 +L+32.82 − TC = 16.02980 5
ii) SCTratam. =
52.7 2 + 54.2 2 + 601 . 2 + 67.32 + 738 .2 − TC = 31.7548 10
5
10
2 2 . 2 +L+8.92 ) − TC = 1962.83 − TC = 64.3178 iii) SCTotal = ∑∑Yij − TC = ( 4.2 + 63 i =1 j =1
iv) SCerror exptal. = SCtotal - SCbloque - SCtrat. = 64.3178 - 16.0298-31.7548 = 16.53320
ANALISIS DE VARIANZA F. de V. G.L. S.C. Bloques (Jueces) 9 16.0298 Entre muestras 4 31.7548 Error experimental 36 16.5332 Total 49 64.3178
C.M. 1.781089 7.938700 0.459256
Fc. 3.88 17.29
4
6. Decisión: Como F(tratam.) = 17.29 > F36,0.01
Signif. ** **
= 3.83, entonces se acepta la
hipótesis alterna (Ha:), y se rechaza la Ho: 7. Conclusión: Existe suficiente evidencia para afirmar que se ha encontrado diferencia estadística altamente significativa (P ≤ 0.01) entre los jueces (bloques) y entre las muestras en estudio, esto implica analizar muy detalladamente para obtener conclusiones coherentes, y para esto se debe realizar la prueba múltiple de comparación de Duncan ó Tukey.
- 160 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Prueba Múltiple de comparación de DUNCAN 1. Hipótesis: H0 : µ A = µ B = µ C = µ D = µ E Vs. Ha : µ i ≠ 0 2. Nivel de significación: α = 0.05 3. Buscar en la Tabla de Duncan los valores de AES(D) con Grados de Libertad del Error (GLerror = 36).
p: AES(D)
SY =
0.45925556 10
2 2.86
=
ALS(D)
3 3.01
4 3.1
0.63
0.65
0.21 0.60
ALS ( D ) = SY × AES ( D ) , SY =
0.45925556 CM Error = = 0.2143 10 r
3. Ordenar los promedios de mayor a menor.
Tratamiento E D C B A
Promedios 7.38 6.73 6.01 5.42 5.27
Duncan (P ≤ 0.0
a b c cd d
4. Regla de decisión: Sí Yi • − Yj • ≤ ALS ( D ) , entonces se acepta la Ho: Sí Yi • − Yj • > ALS ( D ) , entonces se acepta la Ha: 5. Realizar las comparaciones: 7.38 - 6.73 = 0.65 > 0.6, entonces es significativo
µE ≠ µD
6.73 - 6.01 = 0.72 > 0.6, entonces es significativo
µ D ≠ µC
6.01 - 5.42 = 0.59 ≤ 0.6, entonces no es significativo 6.01 - 5.27 = 0.74 > 0.63, entonces es significativo
µC = µ B
µC ≠ µ A
5.42 - 5.27 = 0.15 ≤ 0.6, entonces no es significativo
µB = µA
Análisis y Diseño de Experimentos - 161 Prueba Múltiple de comparación de TUKEY 1. Hipótesis: H 0 : µ A = µ B = µ C = µ D = µ E Vs. H a : µ i ≠ µ j 2. Nivel de significación: α = 0.05 3. Buscar en la Tabla de Tukey (Usa la tabla SNK), los valores de Amplitudes Estudentizadas Significativas de Tukey AES(T) con Grados de Libertad del Error (GLerror = 36), p = 5 tratamientos, AES(T) = 4.04 SY =
0.45925556 CM Error = = 0.2143 , ALS ( T ) = S Y × AES ( T ) , 10 r = 0 .2143 × 4 .04 = 0 .86577
3. Ordenar los promedios de mayor a menor. Tratamiento E D C B A
Promedios 7.38 6.73 6.01 5.42 5.27
Tukey (P ≤ 0.05)
a ab bc c c
4. Regla de decisión: Sí Yi • − Yj • ≤ ALS ( T ) , entonces se acepta la Ho: Sí Yi • − Yj • > ALS ( T ) , entonces se acepta la Ha: 5. Realizar las comparaciones: 7.38 - 6.73 = 0.65 ≤ 0.87, entonces no es significativo 7.38 - 6.01 = 1.37 > 0.87, entonces es significativo
µE ≠ µC
6.73 - 6.01 = 0.72 ≤ 0.87, entonces no es significativo 6.73 - 5.42 = 1.31 > 0.87, entonces es significativo
µE = µD µ D = µC
µD ≠ µB
6.01 - 5.42 = 0.59 ≤ 0.87, entonces no es significativo
µC = µ B
6.01 - 5.42 = 0.70 ≤ 0.87, entonces no es significativo
µC = µ A
- 162 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
PROGRAMA EN SAS. DATA AGROIND; OPTIONS NODATE NOCENTER NONUMBER; INPUT TRAT $ JUECES SABOR; DATALINES; A 1 4.2 A 2 6.3 A 3 5.3 . . ... B 1 4.0 B 2 4.2 B 3 5.4 . . ... C 1 5.0 C 2 5.6 C 3 6.3 . . ... D 1 6.3 D 2 5.1 D 3 7.8 . . ... E 1 7.2 E 2 6.2 E 3 8.4 . . ... E 9 7.6 E 10 8.9 ; PROC PRINT; RUN; PROC ANOVA; CLASS TRAT JUECES; MODEL SABOR = JUECES TRAT; MEANS JUECES TRAT/DUNCAN TUKEY; RUN;
Análisis y Diseño de Experimentos - 163 SALIDA DEL SAS (OUTPUT) Class Level Information Class Levels Values TRAT 5 A B C D E JUECES 10 1 2 3 4 5 6 7 8 9 10 Number of observations 50 Dependent Variable: SABOR Source Model JUECES TRAT Error Corrected Total
R-Square 0.742945
Coeff Var 10.99779
DF 13 9 4 36 49
Sum of Squares 47.78460000 16.02980000 31.75480000 16.53320000 64.31780000
Root MSE 0.677684
Mean Square 3.67573846 1.78108889 7.93870000 0.45925556
F Value 8.00 3.88 17.29
Pr > F F( tt−−11 )( r −1 ),0.05 , entonces se acepta la Ha:
5. Cálculos: a) Grados de libertad. Bloques Tratamientos Error experimental Total b)
:r-1 =6-1=5 :t-1 =8-1=7 : (r-1)(t-1) = 5 x 7 = 35 : tr - 1 = 8x6 - 1 = 47
Suma de Cuadrados (SC ó SS).
TC =
Y••2 ( 450 )2 = = 4218.75 6×8 tr
CM Tratam. CM Error
Análisis y Diseño de Experimentos - 173 i) SC Bloq ues = ii) SCTratam. =
83 2 + 94 2 + L + 58 2 − T C = 10 2 .50 8
44 2 +119 2 + 84 2 +L+332 + 652 − TC = 1210.583333 6 5
10
iii) SCTotal = ∑ ∑ Yij2 − TC = ( 82 + 82 +L+52 ) − TC = 5734 − TC = 1515.25 i =1 j =1
iv) SCerror exptal. = SCtotal - SCbloque - SCtrat. = 1515.25 - 102.5 - 1210.583333 = 202.166667 ANALISIS DE VARIANZA F. de V. G.L. S.C. C.M. Bloques 5 102.5 20.500000 Tratamientos 7 1210.583333 172.940476 Error experimental 35 202.166667 5.776190 Total 47 1515.25
Fc. 3.55 29.94
7
6. Decisión: Como F(tratam.) = 29.94 > F35,0.01
Signif. ns. **
= 3.12, entonces se acepta la
hipótesis alterna (Ha:), y se rechaza la Ho: 7. Conclusión: Existe suficiente evidencia para afirmar que se ha encontrado diferencia estadística altamente significativa (P ≤ 0.01) entre los tratamientos, esto implica realizar los contrastes para obtener las conclusiones coherentes. b) Se descomponelos grados de libertad y la suma de cuadrados de tratamientos en siete contrastes (formar los posibles contrastes con los tratamientos). C1 : C2 : C3 : C4 : C5 : C6 : C7 :
A (B y C) B (D y H) D E F
versus versus versus versus versus versus versus
(B, C, D, E, F, G, H) (D, E, F, G, H ) (Fungicidas Mercúricos Vs. Fungicidas no me C (Entre fungicidas mercúricos) (E, F y G) (Entre las compañías) H (entre los productos de la compañía I) (F y G) (entre con las nuevas formulaciones) G (entre formulaciones nuevas)
- 174 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Tratamiento
divisores A
B
C
D
G
32
H
33
Qj
65
FG ∑c IJ SCQ H K k
r
2 i.
j
84
C1 : A vs (B,C,D,E,F,G,H)
7
-1
-1
-1
-1
-1
-1
-1
-98
56(6)
28.583
C2 : (B y C) vs (D,E,F,G,H)
0
5
5
-2
-2
-2
-2
-2
609
70(6)
883.05 **
C3 : B vs C
0
1
-1
0
0
0
0
0
35
2(6)
102.08 **
C4 : (D y H) vs (E,F,G)
0
0
0
3
-2
-2
-2
3
174
30(6)
168.20 **
C5 : D vs H
0
0
0
1
0
0
0
-1
-14
2(6)
16.333
C6 : E vs (F y G)
0
0
0
0
2
-1
-1
0
-21
6(6)
12.25
C7 : F vs G
0
0
0
0
0
1
-1
0
-1
2(6)
0.08
Yi.
22
F
44 119
Contrastes
51
E
i =1
SCTratamientos =
1210.5833
k =8
Verificando para j = 1 entonces
Q1 = ∑ ci1Ti i =1
Q1 = c11T1 + c21T2 + c31T3 + c41T4 + c51T5 + c61T6 + c71T7 + c81T8 = = 7(44)+(-1)(119)+(-1)(84)+(-1)(51)+(-1)(22)+(-1)(32)+(-1)(33)+(-1)(65)= -98
Q2 = c12 T1 + c22 T2 + c32 T3 + c42 T4 + c52 T5 + c62 T6 + c72 T7 + c82 T8 = = 0(44)+(5)(119)+(5)(84)+(-2)(51)+(-2)(22)+(-2)(32)+(-2)(33)+(-2)(65)= 609
Q3 = c13T1 + c23T2 + c33T3 + c43T4 + c53T5 + c63T6 + c73T7 + c83T8 = 35 Q4 = c14 T1 + c24 T2 + c34 T3 + c44 T4 + c54 T5 + c64 T6 + c74 T7 + c84 T8 = 174 Q5 = c15T1 + c25T2 + c35T3 + c45T4 + c55T5 + c65T6 + c75T7 + c85T8 = -14 Q6 = c16 T1 + c26 T2 + c36T3 + c46T4 + c56T5 + c66 T6 + c76 T7 + c86 T8 = -21
Q7 = c17 T1 + c27 T2 + c37 T3 + c47 T4 + c57 T5 + c67 T6 + c77 T7 + c87 T8 = -1 Un método más fácil para calcular es multiplicar la matriz por un vector.
LM7 MM00 MM0 MM0 MM0 N0
44 O OP LM119 PP LM−98OP M P M 84 P M609 P 0 P M P M 35 P P 51 M P 3 P × M P = M174 P M 22 P −1P M P M −14P 32 P M P 0 P MM PP M −21P 33 0 QP M P MN −1 PQ MN 65 PQ
−1 −1 −1 −1 −1 −1 −1 5
5
−2 −2 −2 −2 −2
1
−1
0
0
0
0
3
−2 −2 −2
0
0
0
0
1
0
0
0
0
0
2
−1 −1
0
0
0
0
0
1
−1
Análisis y Diseño de Experimentos - 175 Cálculo de los divisores: D j = r
FG ∑ c IJ H K k
2 ij
i =1
2 2 2 2 + c312 + c41 + c512 + c61 + c71 + c812 = 6 72 + ( −1)2 + ( −1)2 + ( −1)2 + ( −1)2 + ( −1)2 D1 = r c112 + c21
= 6x56 = 336 D2 = 6x70 = 420; D3 = 6x2 = 12; D4 = 6x30 = 180; D5 = 6x2 = 12; D6 = 6x6 = 36; D7 = 6x2 = 12. Suma de Cuadrados de los contrastes: SCQ1 =
Q12 k
r ∑ cij2
=
Q12 982 = = 28.583 D1 336
i =1
Q 2 6092 SCQ2 = 2 = = 883.05 D2 420
SCQ5 =
Q52 ( −14 )2 = = 16.333 D5 12
SCQ3 =
Q32 352 = = 102.083 D3 12
SCQ6 =
Q62 ( −21)2 = = 12.25 D6 36
SCQ4 =
Q42 174 2 = = 168.20 D4 180
SCQ7 =
Q72 ( −1 )2 = = 0.083 D7 12
Finalmente con los componentes calculados, se hace la tabla final de ANOVA Fuentes de Variación GL. SC. Bloques 5 102.5000 Tratamientos 7 1210.5833 C1 : A vs (B,C,D,E,F,G,H) 1 28.5830 C2 : (B y C) vs (D,E,F,G,H) 1 883.0500 C3 : B vs C 1 102.0830 C4 : (D y H) vs (E,F,G) 1 168.2000 C5 : D vs H 1 16.3300 C6 : E vs (F y G) 1 12.2500 C7 : F vs G 1 0.0830 Error Experimental 35 202.166667 TOTAL 47 1515.249967 CV = 25.64%
CM. 20.50000 172.94047 28.58300 883.05000 102.08300 168.20000 16.33000 12.25000 0.08300 5.77619
Fc Signific. 3.55 ns. 29.94 ** 4.95 * 152.88 ** 17.67 ** 29.12 ** 2.83 ns. 2.12 ns. 0.01 ns.
- 176 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
/* PROGRAMA EN SAS */ DATA FCUFVA; OPTIONS NODATE NOCENTER NONUMBER; DO TRAT = 1 TO 8; DO BLK = 1 TO 6; INPUT SEMI @; OUTPUT; END; END; CARDS; 8 8 9 7 7 5 16 19 24 22 19 19 14 16 14 13 14 13 10 11 12 8 7 3 8 7 1 1 3 2 8 8 3 3 3 7 7 6 6 6 4 4 12 19 9 11 9 5 ; PROC PRINT; RUN; PROC GLM; CLASS BLK TRAT; MODEL SEMI = BLK TRAT; RUN; CONTRAST’A VERSUS B,C,D,E,F,G,H ‘ TRAT 7 -1 -1 -1 -1 -1 -1 -1; CONTRAST’B y C VERSUS D,E,F,G, H ‘ TRAT 0 5 5 -2 -2 -2 -2 -2; CONTRAST’B VERSUS C ‘ TRAT 0 1 -1 0 0 0 0 0; CONTRAST’D y H VERSUS E,F Y G ‘ TRAT 0 0 0 3 -2 -2 -2 3; CONTRAST’D VERSUS H ‘ TRAT 0 0 0 1 0 0 0 -1; CONTRAST’E VERSUS F y G ‘ TRAT 0 0 0 0 2 -1 -1 0; CONTRAST’F VERSUS G ‘ TRAT 0 0 0 0 0 1 -1 0; RUN;
SALIDA DE RESULTADOS CON SAS The GLM Procedure Class Level Information Class Levels Values BLK 6 1 2 3 4 5 6 TRAT 8 1 2 3 4 5 6 7 8 Number of observations 48 Dependent Variable: SEMI Source Model BLK TRAT Error Corrected Total R-Square Coeff Var 0.866579 25.63595 Contrast A VERSUS B,C,D,E,F,G,H B y C VERSUS D,E,F,G, H B VERSUS C D y H VERSUS E,F Y G D VERSUS H E VERSUS F y G F VERSUS G
Sum of DF Squares Mean Square 12 1313.083333 109.423611 5 102.500000 20.500000 7 1210.583333 172.940476 35 202.166667 5.776190 47 1515.250000 Root MSE SEMI Mean 2.403371 9.375000 DF 1 1 1 1 1 1 1
Contrast SS 28.5833333 883.0500000 102.0833333 168.2000000 16.3333333 12.2500000 0.0833333
Mean Square 28.5833333 883.0500000 102.0833333 168.2000000 16.3333333 12.2500000 0.0833333
F Value 4.95 152.88 17.67 29.12 2.83 2.12 0.01
F Value 18.94 3.55 29.94
Pr > F 0.0327 F( tt−−11 )( r −1 ),0.05 , entonces se acepta la Ha:
5. Cálculos: i) Grados de libertad. Bloques Tratamientos (muestras) Error experimental Total
:r-1 =4-1 = 3 :t-1 =4-1 = 3 : (r-1)(t-1) = 3 x 3 = 9 : tr - 1 = 4x4 - 1 = 15
CM Tratam. CM Error
- 182 -
V. Ibañez Q. - Docente FINESI - UNA - Puno ii)
Suma de Cuadrados (SC ó SS). TC =
Y••2 1912 = = 2280.0625 tr 4 × 4 r =4
Y•2j
i =1
t
SCBloques = ∑
=
482 + 452 + 49 2 + 49 2 − TC = 2.6875 4
Y 402 + 482 + 612 + 42 2 = − TC = 67.1875 4 i =1 r
t =4
2 i•
SCTratam. = ∑ 4
4
SCTotal = ∑ ∑ Yij2 − TC = ( 102 + 9 2 +L+112 ) − TC = 2353 − TC = 72.9375 i =1 j =1
SCError = SCTotal − SCBloque − SCTratam. = 72.9375 − 2.6875 − 67.1875 = 3.0625
ANALISIS DE VARIANZA F. de V. G.L. S.C. Bloques 3 2.6875 Tratamientos 3 67.1875 Error experimental 9 3.0625 Total 15 72.9375
C.M. 0.895833 22.395833 0.340278
Fc. 2.63 65.82
3
6. Decisión: Como F(tratam.) = 65.85 > F9,0.01
Signif. ns. **
= 6.99, entonces se acepta la
hipótesis alterna (Ha:), y se rechaza la Ho: 7. Conclusión: En base a los resultados de ANOVA, podemos afirmar que existe diferencia estadística altamente significativa (P ≤ 0.01) entre los niveles de fertilización nitrogenada, es decir que el fertilizante tiene efecto sobre la producción de papa, además los niveles de tratamientos son tipo cuantitativo por lo que se debe realizar los la prueba de tendencias. 2. Ordenar los totales de los niveles (tratamientos) de fertilizantes nitrogenados con los valores de los polinomios ortogonales para cada tendencia. N0
N50
N100
N150
Totales (Yi.) Componentes o tendencias 1. Lineal
40
48
61
42
-3
-1
1
3
2. Cuadrático 3. Cúbico
1 -1
-1 3
-1 -3
1 1 k
3. Calcular los valores Qj de acuerdo a la siguiente ecuación: Q j = ∑ Yi • cij i =1
Análisis y Diseño de Experimentos - 183 Reemplazando para cada uno de las tendencias, se obtiene: k =4
Q1 = QLineal = ∑Yi•cij = Y1•c11 + Y2•c21 + Y3•c31 + Y4•c41 = 40( −3) + 48( −1) + 61( +1) + 42( +3) = 19 i =1
k =4
Q2 = QCuadrática = ∑Yi•cij = Y1•c12 + Y2•c22 + Y3•c32 + Y4•c42 = 40( +1) + 48( −1) + 61( +1) + 42( +1) = −27 i =1
k =4
Q3 = QCúbica = ∑Yi•cij = Y1•c13 + Y2•c23 + Y3•c33 + Y4•c43 = 40(-1) + 48(+3) + 61(-3) +42(+1) = -37 i =1
k
4. Calcular los divisores mediante la fórmula: r ∑ cij2 i =1
k =4
Lineal1: r∑ci21 = 4 c112 + c212 + c312 + c412 =4[ (-3)2 +(-1)2 +(+1)2 +(+3)2 ] = 4(20) =80 i =1
k =4
Cuadrática2: r∑ci22 = 4 c122 + c222 + c322 + c422 =4[ (+1)2 +(-1)2 +(+1)2 +(+1)2 ]=4(4) =16 i=1
k =4
Cúbica3: r∑ci23 = 4 c132 + c232 + c332 + c432 =4[ (-1)2 +(+3)2 +(-3)2 +(+1)2 ]=4(20) =80 i=1
5. Calcular la suma de cuadrados para cada una de las tendencias, mediante la siguiente fórmula:
SC Q j =
Q 2j k
r ∑ cij2 i =1
SC Q1 = SCLineal =
Q12 ( 19 )2 = = 4.5125 80 80
SC Q 2 = SCCuadrática =
Q22 ( −27 )2 . = = 455625 16 16
SCQ3 = SCCúbica =
Q32 ( −37 )2 = = 17.1125 80 80 SCTratamiento = 67.1875
- 184 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
6. Efectuar la prueba de significancia de las tendencias o respuestas mediante la prueba de F y completar el Análisis de Variancia (ANOVA). Tabla de ANOVA, considerando los componentes. F. de V. G.L. SC. CM. Bloques 2.6875 0.8958 3 Tratamientos 67.1875 22.3958 3 Lineal 1 4.5125 4.5125 Cuadrático 1 45.5625 45.5625 Cúbico 1 17.1125 17.1125 Error 3.0625 0.3403 9 Total 72.9375 15
Fc 2.63 n.s. 65.82 ** 13.26 ** 133.89 ** 50.59 **
/* PROGRAMA EN SAS */ DATA CURVA; OPTIONS NODATE NOCENTER NONUMBER; INPUT TRAT REP NIT Y; YH = Y*(10000/20); N2 = NIT*NIT; CARDS; 1 1 0 10 1209 1 3 0 11 1 4 0 10 2 1 50 12 2 2 50 11 2 3 50 12 2 4 50 13 3 1 100 15 3 2 100 15 3 3 100 16 3 4 100 15 4 1 150 11 4 2 150 10 4 3 150 10 4 4 150 11 ; PROC GLM; CLASS TRAT REP NIT; MODEL Y = REP TRAT; CONTRAST’LINEAL ‘ TRAT -3 -1 1 3; CONTRAST’CUADRATICA ‘ TRAT 1 -1 -1 1; CONTRAST’CUBICA ‘ TRAT -1 3 -3 1; RUN; /* Presione F3 para ejecutar el programa */
Análisis y Diseño de Experimentos - 185 SALIDA DE RESULTADOS CON SAS Class Level Information Class Levels Values TRAT 4 1 2 3 4 REP 4 1 2 3 4 NIT 4 0 50 100 150 Number of observations 16 Dependent Variable: Y Source Model REP TRAT Error Corrected Total R-Square Coeff Var 0.958012 4.886562
Sum of DF Squares Mean Square 6 69.87500000 11.64583333 3 2.68750000 0.89583333 3 67.18750000 22.39583333 9 3.06250000 0.34027778 15 72.93750000 Root MSE Y Mean 0.583333 11.93750
Contrast LINEAL CUADRATICA CUBICA
DF 1 1 1
Contrast SS 4.51250000 45.56250000 17.11250000
Mean Square 4.51250000 45.56250000 17.11250000
F Value 34.22 2.63 65.82
Pr > F F124 ,0 .01 = 5.41, entonces se acepta la Ha: y se rechaza la Ho: 6. Conclusión: No existen evidencias estadísticas significativas para los filas ó bloques y columnas, en cambio encontramos diferencia estadística altamente significativa para los catalizadores ( P ≤ 0.01) en el análisis de varianza, lo cual confirma que cada uno de los catalizadores actúan en forma diferente en la variable de respuesta, para una mejor interpretación de estos resultados se realizará la prueba múltiple de significancia de Duncan.
Prueba Múltiple de comparación de DUNCAN 1. Hipótesis: H0 : µ A = µ B = µ C = µ D = µ E Vs. Ha : µ i ≠ 0 2. Nivel de significación: α = 0.05 3. Buscar en la Tabla de Duncan los valores de AES(D) con Grados de Libertad del Error (GLerror = 12).
Análisis y Diseño de Experimentos - 231 p: A ES(D)
SY =
2 3.08 3 .1266667 5
=
A LS(D)
3 3.23
4 3.33
2.55
2.63
0.79 2.43
ALS ( D ) = SY × AES ( D ) , S Y =
3.1266667 = 0.79 5
CM Error = r
3. Ordenar los promedios de mayor a menor. Catalizadores C A B D E
Promedios 8.8 8.4 5.6 3.4 3.2
Duncan (P ≤ 0.05)
a a b b b
4. Regla de decisión: Sí Yi • − Yj • ≤ ALS ( D ) , entonces se acepta la Ho: Sí Yi • − Yj • > ALS ( D ) , entonces se acepta la Ha: 5. Realizar las comparaciones: 8.80 - 8.40 = 0.40 ≤ 2.43, entonces no es significativo
µC = µ A
8.80 - 5.60 = 3.20 > 2.55, entonces es significativo µ C ≠ µ B -------------------------------------------------------------------------------5.60 - 3.40 = 2.20 ≤ 2.43, entonces no es significativo
µB = µD
5.60 - 3.20 = 2.40 ≤ 2.55, entonces no es significativo
µB = µE
- 232 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
DATA DCLAT; OPTIONS NODATE NOCENTER NONUMBER; INPUT FILA COLUM TRAT $ TIEMPO; DATALINES; 1 1 A 8 1 2 C 11 1 3 B 4 1 4 D 6 1 5 E 4 2 1 B 7 2 2 E 2 2 3 A 9 2 4 C 8 2 5 D 2 3 1 D 1 3 2 A 7 3 3 C 10 3 4 E 6 3 5 B 3 4 1 C 7 4 2 D 3 4 3 E 1 4 4 B 6 4 5 A 8 5 1 E 3 5 2 B 8 5 3 D 5 5 4 A 10 5 5 C 8 ; PROC PRINT; RUN; PROC ANOVA; CLASS FILA COLUM TRAT; MODEL TIEMPO = FILA COLUM TRAT; MEANS FILA COLUM TRAT/LSD DUNCAN TUKEY; RUN;
Análisis y Diseño de Experimentos - 233 RESULTADOS DEL SAS The ANOVA Procedure Class Level Information Class Levels Values FILA 5 1 2 3 4 5 COLUM 5 1 2 3 4 5 TRAT 5 A B C D E Number of observations 25 Dependent Variable: TIEMPO Source Model FILA COLUM TRAT Error Corrected Total R-Square Coeff Var 0.818428 30.07208
Sum of DF Squares Mean Square 12 169.1200000 14.0933333 4 12.2400000 3.0600000 4 15.4400000 3.8600000 4 141.4400000 35.3600000 12 37.5200000 3.1266667 24 206.6400000 Root MSE TIEMPO Mean 1.768238 5.880000
t Tests (LSD) for TIEMPO Alpha 0.05 Error Degrees of Freedom 12 Error Mean Square 3.126667 Critical Value of t 2.17881 Least Significant Difference 2.4366 Mean N TRAT A 8.800 5 C A 8.400 5 A B 5.600 5 B B 3.400 5 D B 3.200 5 E Duncan’s Multiple Range Test for TIEMPO Mean N TRAT A 8.800 5 C A 8.400 5 A B 5.600 5 B B 3.400 5 D B 3.200 5 E Tukey’s Studentized Range Tukey Groupi ng Mean A 8.800 A 8.400 B A 5.600 B 3.400 B 3.200
(HSD) Test for TIEMPO N 5 5 5 5 5
TRAT C A B D E
F Value 4.51 0.98 1.23 11.31
Pr > F 0.0072 0.4550 0.3476 0.0005
- 234 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
EJEMPLO: En un experimento se probaron tres dietas diferentes (A, B y C) para medir su efecto en la producción de leche. Las dietas se aplicaron a tres vacas en tres períodos de lactancia diferentes. Los resultados son los siguientes:
1 Período
I II III
A B C
608 715 884 2207
A B C
608 715 884
Cj
VA CA 2 B 885 C 1087 A 711 2683 711 885 1087
3 C A B
940 766 832 2538 766 832 940 Y... =
Hk 2433 2568 2427 Y... = 7428 2085 2432 2911 7428
Las hipótesis para hileras y columnas, al igual que la de bloques en un diseño completo al azar, en realidad sólo dan una idea acerca de la eficiencia o justificación en el empleo del control local efectuado en estos diseños. SUMA DE CUADRADOS:
SC tratam. =
2085 2 + 2432 2 + 2911 2 7428 2 − = 114680.6 3 9
SC PERIO D O S =
SC VAC AS =
2433 2 + 2568 2 + 2427 2 7428 2 − = 4238 .0 3 9
2207 2 + 2683 2 + 2538 7428 2 − = 39684 .60 4 9
7428 2 = 164664 .0 9 SCerror exptal. = 164664 - (114680.6 + 4238 + 39684.6) = 6060.8
SC To tal = 608 2 + L + 832 2 −
Análisis y Diseño de Experimentos - 235 TABLA DE ANALISIS DE VARIANZA. F. de V. Períodos Vacas Tratamientos Error exptal. Total
G.L. 2 2 2 2 8
S.C. 4238.00 39684.60 114680.60 6060.80 164664.00
C.M. 2119.00 19842.30 57340.30 3030.40
Fc. 0.70ns. 6.55* 18.92**
0.05 0.01 4.46 8.65
Por lo anterior, no se rechaza la hipótesis nula respecto de los períodos, pero sucede lo contrario para los efectos de vacas y raciones. La partición de las sumas de cuadrados significativas. Existe diferencia significativa entre vacas es fuente de variación para la respuesta. Para las raciones alimenticias, se ha encontrado diferencia estadística altamente significativo ( P ≤ 0.01) , esto implica la fuente de variación para la respuesta, es decir que el consumo de la dieta de cada vaca es diferente a las otras vacas. Se deja como ejercicio al estudiante para que realice la prueba múltiple de comparación de Duncan. PROGRAMA EN SAS. DATA DIETA; OPTIONS NODATE NOCENTER NONUMBER; TITLE’DISEÑO CUADRADO LATINO DE 3x3’; DO FILA = 1 TO 3; DO COLUM = 1 TO 3; INPUT TRAT $ LECHE; OUTPUT; END; END; CARDS; A 608 B 715 C 884 B 885 C 1087 A 711 C 940 A 766 B 832 ; PROC PRINT; RUN; PROC GLM; CLASS FILA COLUM TRAT; MODEL LECHE = FILA COLUM TRAT; MEANS FILA COLUM TRAT /DUNCAN; RUN; /* F3 para ejecutar */
- 236 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
EJERCICIOS: 1. En un experimento donde se desea probar 4 máquinas con el objeto de ver si difieren significativamente en su capacidad de producción de una cierta pieza manufacturada. Es perfectamente conocido que diferentes trabajadores y diferentes periodos de tiempo en un día de trabajo tendrán un efecto sobre la producción. Las máquinas son asignadas al azar a cada trabajador frente a su respectivo periodo de tiempo, en un día de trabajo. Obteniéndose los siguientes resultados experimentales. Analice y obtenga las conclusiones. Periodo de tiempo 1 2 3 4
1 C 31 D 39 B 57 A 85
OPERADORES 2 3 D 43 A 31 A 96 B 50 C 33 D 40 B 46 C 48
B C A D
4 36 48 84 50
2.- Se realizó un experimento para asegurar las resistencias relativas a la abrasión de 4 tipos de pieles (A, B, C, D). Se usó una máquina en la cual se probaron las muestras en una cualquiera de 4 posiciones. Puesto que se conoce que diferentes ejecuciones del experimento (reproducciones) dan resultados variables, se decidió hacer 4 ejecuciones del mismo. Se utilizó un diseño cuadrado latino y se obtuvieron los siguientes resultados. Analice e interprete los datos. Ejecución 1 2 3 4
1 118(B) 127(D) 174(A) 130(C)
2 136(D) 141(B) 173(C) 170(A)
POSICION 3 168(A) 129(C) 126(B) 125(D)
4 135(C) 151(A) 134(D) 95(B)
3.- Un ingeniero químico está investigando el efecto que tienen 4 métodos de ensamblaje (A, B, C y D) sobre el tiempo de ensamblaje de un componente para televisores a color. Se seleccionan 4 operadores para realizar este estudio. Por otra parte, el ingeniero sabe que cada método de ensamblaje produce fatiga, por lo que el tiempo que se tarda en el último ensamblaje puede ser mayor que en el primero, independientemente del método. En otras palabras se produce un patrón en el tiempo de ensamblaje. Para controlar esta posible fuente de variabilidad el ingeniero utiliza el diseño de cuadrados latinos que aparece a continuación. Analice y obtenga las conclusiones apropiadas. Orden de montaje 1 2 3 4
1 C 10 B 7 A 5 D 10
OPERADOR 2 3 D 14 A 7 C 18 D 11 B 10 C 11 A 10 B 12
4 B A D C
8 8 9 14
Análisis y Diseño de Experimentos - 237 4.-Se prueba seis dietas de concentración y su efecto en la producción de leche, en seis vacas que tienen diferente período de lactación ( 1 a 6 meses), cuya distribución es: Períodos III I VI IV II V
C E F B D A
5 9.40 4.90 6.70 8.90 5.92 7.20
1 E 5.450 A 7.600 B 8.320 D 6.120 F 9.850 C 9.900
A C D F B E
VACAS 3 6 4 6.08 D 3.46 B 8.85 10.87 F 7.15 D 4.12 6.80 A 7.11 E 6.14 12.43 C 11.40 A 5.15 6.15 E 8.10 C 8.16 5.64 B 9.12 F 10.50
F B C E A D
2 8.50 7.15 8.84 7.30 6.13 7.00
a) Habrá diferencia entre dietass. b) Habrá diferencia entre vacas. c) Habrá diferencia entre períodos. d) Contraste promedios entre dietas a través de la prueba de Tukey al 95%.
- 238 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
6.2. Diseño Cuadrado Grecolatino (DCGL). Considere un cuadrado latino pxp al cual se le superpone un segundo cuadrado latino pxp en el que los tratamientos se denotan con letras griegas. Si cuando se hace la superposición los dos cuadrados tienen la propiedad de que cada letra griega aparece una y sólo una vez con cada letra latina, se dice que los cuadrados latinos son ortogonales, y al diseño obtenido se le llama Cuadrado Grecolatino. El diseño de cuadrado Grecolatino puede usarse para controlar sistemáticamente tres fuentes de variabilidad extraña, es decir, para hacer la formación de bloques en tres direcciones. El diseño permite la investigación de cuatro factores (renglones, columnas, letras latinas y letras griegas), cada una con «p» niveles en sólo p2 corridas. Existen cuadrados grecolatinos para toda p ≥ 3, excepto p = 6. En la siguiente tabla, se muestra un ejemplo de un cuadrado grecolatino de 4x4. Ejemplo de Diseño Cuadrado Grecolatino de 4x4. Renglones 1
1 A
Letras Latinas 2 3 B C
4 D
2
B
A
D
C
3
C
D
A
B
4
D
C
B
A
1
Letras Griegas 2 3 4
α β γ + δ γ β β α δ γ δ α
δ α γ β
1
Aα
= Bδ Cβ Dγ
Grecolatino 2 3 Bβ Cγ
Aγ
Dα Cδ
Dβ Aδ
Bα
4 Dδ
Cα
Bγ A
β
El modelo estadístico lineal para el diseño de cuadrado grecolatino es:
Yijkl = µ + θ i + τ j + ω k + ψ l + ε ijkl
R| i = 1,2,K, p |S j = 1,2,K, p ||k = 1,2,K, p T l = 1,2,K , p
donde:
Yijkl : Es la observación del renglón «i» y la columna «l» para la letra latina «j» y la letra griega «k».
θ i : Es el efecto del renglón i-ésimo.
τ j : Es el efecto del tratamiento de la letra latina «j» ω k : Es el efecto del tratamiento de la letra griega «k».
Análisis y Diseño de Experimentos - 239 -
ψ l : Es el efecto de la columna «l».
ε ijkl : Es un componente del error aleatorio
ε ijkl ~ NID( 0,σ 2 ) .
Sólo son necesario dos de los cuatro subíndices para identificar completamente una observación. El análisis de varianza es muy parecido al de un cuadrado latino. Puesto que las letras griegas aparecen exactamente una vez en cada renglón y columna, y exactamente una vez con cada letra latina, el factor representado por las letras griegas es ortogonal a los renglones, las columnas y los tratamientos de letras latinas. Por lo tanto, puede calcularse una suma de cuadrados debida al factor de las letras griegas a partir de los totales de las letras griegas y el error experimental se reduce adicionalmemnte en esta cantidad. En la siguiente tabla se ilustran los detalles de los cálculos de las fórmulas de análisis de varianza. La hipótesis nula de la igualdad de tratamientos de renglones, columnas, letras latinas y letras griegas, se probaría dividiendo el cuadrado medio correspondiente por el cuadrado medio del error. La región de rechazo es la cola superior del punto de la distribución F( pp−−13 )( p −1 ) . TABLA ANOVA: Fórmulas. F. de Variación
G.L.
S.C.
Tratamientos con letras latinas
p-1 SCL = ∑
p
Y•2j ••
j =1
p
−
C.M.
Fc.
2 Y•••• p2
SC Latina p−1
CM Latina CM Error
Tratamientos con letras griegas
p-1 SCG = ∑
2 Y••2k • Y•••• − 2 p k =1 p
SC G rieg a
CM Griega
p −1
CM Error
Renglones ó filas
p Y2 Y2 p-1 SCRengl . = ∑ i••• − •••• p2 i =1 p
S C R e ngl .
CM Re ngl .
p −1
CM Error
Columnas
p Y2 Y2 p-1 SCColum. = ∑ •••l − •••• p2 l =1 p
SC Colum . p −1
CM Colum . CM Error
CM Error =
SCError ( p − 1 )( p − 3 )
p
(p - 1)(p - 3) SCError (por diferencia)
Error Exptal (EE)
Total
2 Y•••• 2 SC Y = − ∑i ∑j ∑k ∑l ijkl p 2 Total p -1 2
- 240 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
EJEMPLO: El rendimiento de un proceso químico se midió utilizando cinco lotes de materia prima, cinco concentraciones de ácido, cinco tiempos de procesamiento (A,B,C,D y E) y cinco concentraciones del catalizador ( α ,
β , γ , δ y ε ). Se usó el cuadrado
grecolatino siguiente. Analizar los datos de este experimento (utilizar sacar conclusiones. Lote 1 2 3 4 5 Y..k.
Aα Bγ Cε Dβ Eδ
1 26 18 20 15 10 89
Concentración del ácido 2 3 4 B β 16 C γ 19 Dδ 16 Cδ 21 D ε 18 Eα 11 D α 12 E β 16 A γ 25 E γ 15 A δ 22 Bε 14 Aε 24 B α 17 C β 17 88 92 83
Eε A β Bδ Cα Dγ
5 13 21 13 17 14 78
α = 0.05) y
Y...l 90 89 86 83 82 430
SOLUCIÓN: 1. Hipótesis: Respecto al tratamiento de la letra latina: H0 : τ j = 0 versus Ha :τ j ≠ 0 Respecto al tratamiento de la letra griega: H0 : ω k = 0 versus Ha :ω k ≠ 0 Respecto a fila:
H0 :θ i = 0 versus Ha :θ i ≠ 0
Respecto a columnas:
H0 :ψ l = 0 versus Ha :ψ l ≠ 0
2. Nivel de significación:
α = 0.05
3. Estadígrafo de contraste:
F ( L a tin a ) = F ( G rieg a ) =
C M L a tin a C M E rro r C M G r ie g a
C M E rro r C M C o lu m . F ( C o lu m . ) = C M E rro r C M F ila F ( F ila ) = C M E rro r
U| || |V ~ F || || W
p −1 ( p − 1 )( p − 3 ),0 . 0 5
4. Cálculo de Análisis de Varianza (ANOVA). a)
Grado de libertad (GL). Letras latinas Letras griegas
:p-1=5-1=4 :p-1=5-1=4
Análisis y Diseño de Experimentos - 241 Filas ó Hileras Columnas Error experimental Total
b)
:p-1=5-1=4 :p-1=5-1=4 : (p - 1)(p - 3) = 4x2 = 8 : p2 - 1 = 5x5 - 1 = 24
Suma de Cuadrados:
TC =
Y•2• • ( 4 3 0 )2 = = 7396 2 p 5×5
Suma de Cuadrados para filas ó bloques: 2 Yi ••• 90 2 + 89 2 + 86 2 + 832 + 82 2 − TC = − TC = 10.0 5 5
5
SC Filas = ∑ i =1
Suma de Cuadrados para Columnas. 2 Y••• 89 2 + 882 + 92 2 + 832 + 782 l − TC = − TC = 24.40 5 l =1 5 5
SCcolumnas = ∑
Suma de Cuadrados para letras latinas (tiempos de procesamiento) 5
Y•2j ••
j =1
5
SCLatinas = ∑
− TC =
1182 + 782 + 94 2 + 752 + 652 − TC = 342.80 5
Suma de Cuadrados para letras griegas (concent. del catalizador) Y••2 k • 832 + 852 + 912 + 82 2 + 892 − TC = − TC = 37040 − TC = 12.0 5 k =1 5 5
SCGriegas = ∑
SC T otal =
5
∑Y
2 ijk
− TC = ( 26 2 + 18 2 + L + 17 2 + 14 2 ) − TC = 436 .0
i , j ,k ,l
SCError = SCTotal − SCLatinas − SCGriegas − SCFilas − SCColum. = 46.80 TABLA DE ANALISIS DE VARIANCIA. F. de V. Tratamiento con letras Latinas Tratamiento con letras Griegas Filas o renglones Columnas Error experimental Total
G.L. S.C. 4 342.80 4 12.00 4 10.00 4 24.40 8 46.80 24 436.00
C.M. 85.700 3.000 2.500 6.100 5.850
Fc. Signifc. F-Tabla 14.65 ** 3.84 0.51 ns. 0.43 ns. 1.04 ns.
- 242 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
5. Decisión: Como FTiempos de proc.= 14.65 > F8 ,0 .05 = 3.84, entonces se acepta la Ha: 4
y se rechaza la Ho: 6. Conclusión: Se ha encontrado diferencias estadísticas significativas para los cinco tiempos de concentración (letras latinas), en cambio no presentaron diferencia estadística significativa para: concentración de catalizadores, lotes de materia prima y concentraciones de ácido. Se deja como ejercicio al estudiante para que realice la prueba adecuada (Tukey o Duncan) para los cinco tiempos de concentración por ser significativo en la fuente de variación.
/* PROGRAMA EN SAS */ DATA DCGL; OPTIONS NODATE NOCENTER NONUMBER; INPUT COLUM FILAS LATINA $ GRIEGA $ Y; CARDS; 1 1 A a 26 1 2 B g 18 1 3 C e 20 1 4 D b 15 1 5 E d 10 2 1 B b 16 2 2 C d 21 2 3 D a 12 2 4 E g 15 2 5 A e 24 3 1 C g 19 3 2 D e 18 3 3 E b 16 3 4 A d 22 3 5 B a 17 4 1 D d 16 4 2 E a 11 4 3 A g 25 4 4 B e 14 4 5 C b 17 5 1 E e 13 5 2 A b 21 5 3 B d 13 5 4 C a 17 5 5 D g 14 ; PROC PRINT; RUN; PROC ANOVA; CLASS COLUM FILAS LATINA GRIEGA; MODEL Y = LATINA GRIEGA FILAS COLUM; MEANS LATINA/DUNCAN TUKEY; RUN;
Análisis y Diseño de Experimentos - 243 SALIDA DE RESULTADOS CON SAS The ANOVA Procedure Class Level Information Class Levels Values COLUM 5 1 2 3 4 FILAS 5 1 2 3 4 LATINA 5 A B C D GRIEGA 5 a b d e Number of observations 25 Dependent Variable: Y Source Model LATINA GRIEGA FILAS COLUM Error Corrected Total R-Square Coeff Var 0.892661 14.06208
5 5 E g
Sum of DF Squares Mean Square 16 389.2000000 24.3250000 4 342.8000000 85.7000000 4 12.0000000 3.0000000 4 10.0000000 2.5000000 4 24.4000000 6.1000000 8 46.8000000 5.8500000 24 436.0000000 Root MSE Y Mean 2.418677 17.20000
F Value 4.16 14.65 0.51 0.43 1.04
Pr > F 0.0236 0.0009 0.7289 0.7854 0.4425
Duncans Multiple Range Test for Y Duncan Mean N LATINA A 23.600 5 A B 18.800 5 C C B 15.600 5 B C 15.000 5 D C 13.000 5 E
Ejercicios: 1. El rendimiento de un proceso químico se midió utilizando cinco lotes de materia prima, cinco concentraciones del ácido, cinco tiempos de procesamiento (A, B, C, D y E) y cinco concentraciones del catalizador (á, â, ã, ä, å ). Se usó el cuadrado grecolatino siguiente. Analizar los datos de este experimento (utilizar α = 0 .0 5 ) y sacar conclusiones. Lote 1 2 3 4 5
1 Aá =26 Bã= 18 Cå = 20 Dâ = 15 Eä= 10
Concentración del ácido 2 3 4 Bâ= 16 Cã = 19 Dä = 16 Cä = 2 Då = 18 Eá = 11 Dá = 12 Eâ = 16 Aã = 25 Eã = 15 Aä = 22 Bå = 14 Aå = 24 Bá = 17 Câ = 17
5 Eå = 13 Aâ = 21 Bä = 13 Cá = 17 Dã = 14
- 244 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
2. Suponga que en el problema 10 el ingeniero sospecha que los sitios de trabajo usados por los cuatro operadores pueden representar una fuente adicional de variación. Es posible introducir un cuarto factor, el sitio de trabajo ( á, â, ã, ä ), y realizar otro experimento, de donde resulta el cuadrado grecolatino siguiente. Analizar los datos de este experimento (utilizar α = 0 .0 5 ) y sacar conclusiones. Orden de Ensamblaje 1 2 3 4
1 Câ = 11 Ba = 8 Aä = 9 Dã = 9
Operador 2 3 Bã=10 Dä = 14 Cä = 12 Aã = 10 Da = 11 Bâ = 1 Aâ = 8 Ca = 18
4 Aá = 8 Dâ = 12 Cã = 15 Bä = 6
Análisis y Diseño de Experimentos - 245 -
7 EXPERIMENTOS FACTORIALES Introducción. Los Experimentos Factoriales son arreglos de tratamientos que permiten aplicar de una sola vez una serie de estímulos o tratamientos que consideramos que intervengan en la respuesta dada por una unidad experimental. Los arreglos factoriales son de importancia práctica, ya que permiten el estudio de un estímulo como tal y su respuesta combinatoria respecto de otras condiciones generadas por la interacción con otros factores, dando así información más completa, aun cuando los efectos interaccionales no sean significativos. En las ciencias agropecuarias normalmente se usan combinaciones hasta de tres factores debido principalmente a la interpretación fisiológica de las interacciones. Los arreglos de tratamientos pueden ser estudiados en el contexto de los diseños básicos, considerando las características de las unidades experimentales con las que se trabaje. Los Experimentos Factoriales no constituyen un diseño en sí, sino que debe arreglarse a cualesquiera de los diseños conocidos como: diseño completamente al azar, diseño bloques completos, cuadrados latino, etc.
- 246 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Su utilidad radica en que es posible estudiar simultáneamente más de un factor. Ejemplo estudiar varias razas de los animales y el sexo de los mismos para determinar sus incrementos de pesos; estudiar diversas variedades y su respuesta a las diferentes formas de abonamiento, etc. Además es importante porque nos permite comparar los niveles de cada factor entre sí y además las interacciones que puedan resultar como consecuencia de las combinaciones de los niveles de cada factor. Objetivos: 1. Describir los conceptos básicos de experimentos factoriales y explicar cómo se hace la experimentación factorial. 2. Desarrollar los experimentos factoriales de 2 y 3 factores y la manera en que se estabiliza la varianza. 3. Explicar el experimento general, el modelo de efectos fijos y su diferencia con el modelo de efectos aleatorios. Ventajas de los Experimentos Factoriales. 1. Permite estudiar los efectos principales, efectos simples así como de los efectos de la interacción. 2. Todas las unidades experimentales intervienen en la determinación de los efectos principales, efectos simples y de la interacción. 3. Permite ganar mayor precisión en el experimento. Desventajas de los Experimentos Factoriales. 1. Se requiere mayor número de unidades experimentales que en los experimentos simples en los cuales se estudia únicamente un solo factor; así que en un experimento factorial con 4 niveles del A, y 5 niveles del factor B, repetidos 5 veces para cada combinación de tratamientos, se requerirá 100 unidades experimentales para estudiar solamente 2 factores, mientras si se quisiera estudiar mayor número de factores el número de unidades experimentales sería aún mayor. 2. Como en los experimentos factoriales deben de combinarse todos los niveles de los factores en estudio, algunas de estas combinaciones resulta de poco interés del investigador. 3. El análisis estadístico es mas complicado en comparación con los experimentos simples.
Análisis y Diseño de Experimentos - 247 Experimento factorial. El término experimentación factorial se refiere a la evaluación simultánea de dos ó más factores en un experimento o estudiar el efecto de varios factores sobre una o varias respuestas o características de calidad, lo que se busca es estudiar la relación entre los factores y la respuesta, con la finalidad de conocer mejor cómo es ésta relación y genera conocimiento que permita tomar acciones y decisiones que mejoren el desempeño del proceso. Para diseñar un experimento factorial, se utilizan los diesños básicos como: diseño completamente al azar, diseño bloque completo al azar, diseño cuadrado latino entre otros. Elección de los factores. Factor. Es una clase de tratamiento que interviene en el experimento, es así que en los Experimentos Factoriales, todo factor proporciona varios tratamientos; ejemplo de factores: Razas de animales, variedades de alfalfa, dosis de nitrógeno, profundidad de labranza, raciones alimenticias, dosis de una hormona, etc. A los Factores se les simboliza generalmente por las primeras letras mayúsculas del alfabeto (A, B, C, D, etc). Niveles de un factor. Son los diversos tratamientos que pertenecen a un determinado factor; y se acostumbra a simbolizar un nivel cualquiera por la letra que representa el factor y el valor del respectivo sub índice. Ejemplo: el factor dosis de la hormona estilbestrol simbolizado por A tiene 4 niveles en el experimento: a1 = 2cc, a2 = 3cc, a3 = 4cc, a4 = 5cc. Tipos de factores. Los factores que se estudian en los experimentos se clasifican en: Factor fijo: Los niveles o tratamientos son fijados por el experimentador de acuerdo a su interés. Son muy usuales en la experimentación. Ejemplos: - Factor Nitrógeno: 50, 70, 90 kg de N/ha. - Factor temperatura: 10, 15, 18, 20 grados centígrados. - Alimento: con ingrediente nuevo, sin ingrediente.
- 248 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
- Tres variedades de trigo: V1, V2, V3, etc. Factor al azar: Los niveles o tratamientos son seleccionados al azar de la población de niveles, constituyendo una muestra los que están en el experimento. Ejemplo: - Los años en los que se cultivan ciertas variedades de papa, trigo, etc. son considerados como una muestra de años antes y años después de lo establecido. Clasificación de los factores: Factores Cualitativos.- Los niveles o tratamientos son cualidades o categorías, cuyos niveles corresponden a procedimientos o cualidades y no tienen un orden natural y cada nivel tiene un valor intrínsico. Ejemplo: métodos de enseñanza de cierta asignatura, variedades o linajes de un cultivo, épocas del año, las estaciones del año, clases de lana, razas de ganado, variedades, zonas ecológicas, tipos de hormona, tipos de alimento, sistema de riego, sistema de labranza, variedades de los cereales, etc. Factores Cuantitativos.- Son aquellos cuyos niveles corresponden a cantidades numéricas de un factor cuantitativo, que de preferencia debe ser igualmente espaciadas o de igual intervalo o no. Ejemplo: distanciamiento entre plantas de algodón a 50 cm., 60 cm., 70 cm., niveles de pH en la elaboración de cierto alimento: 2.0, 2.5, 2.8, 3.0, diferentes dosis de una hormona, diferentes dosis de una ración protéica, diferentes dosis de un abono nitrogenado, diferentes grados de temperatura, dosis de vitamina B12, tiempos, minutos, etc. Factores cruzados.- Factores en los que cada nivel de uno de los factores se combina con todos los niveles de los otros factores. Factores anidados.- Los niveles de cada factor no pueden o no interesa que se combinen con todos los niveles de los otros factores, un factor puede ser fijo o al azar. Simbolización.- Se utiliza letras mayúsculas para los factores: A, B, C, D, R y letras minúsculas con subíndices para indicar niveles: a, b, c, d, r (para indicar el número de niveles de cada factor). i, j, k, l, m (para indicar cualquier nivel del factor). ai, bj, ck, dl, rm (para indicar los niveles).
α , β , γ , δ , ε (para indicar los efectos).
Análisis y Diseño de Experimentos - 249 Ejemplos: Un experimento factorial en el cual se estudia dos factores, y cada factor con dos niveles, se simboliza como 2Ax2B ó 2x2. El número de combinaciones de tratamientos que intervienen en este factorial es el producto de las cantidades de niveles de los factores en estudio, en este experimento existirán 4 tratamientos. En un experimento factorial en el cual intervienen tres factores A, B y C, donde el factor A tiene tres niveles, el factor B tiene 2 niveles y el factor C, tiene dos niveles, se simbolizará como 3Ax2Bx2C ó 3x2x2 o también 3x22; y el número de tratamientos producto de las combinaciones será igual a 12. Tipos de notación en el experimento factorial (croquis de campo). Trat. Combinado
I
II
III
IV
V
1
a1b1c1
111
a0b0c0
000
(1)
2
a1b1c2
112
a0b0c1
001
c 2
3
a1b1c3
113
a0b0c2
002
c
4
a1b2c1
121
a0b1c0
010
b
5
a1b2c2
122
a0b1c1
011
bc
6
a1b2c3
123
a0b1c2
012
bc
7
a2b1c1
211
a1b0c0
100
a
8
a2b1c2
212
a1b0c1
101
ac
9
a2b1c3
213
a1b0c2
102
ac
2
2
10
a2b2c1
221
a1b1c0
110
ab
11
a2b2c2
222
a1b1c1
111
abc
12
a2b2c3
223
a1b1c2
112
abc
2
El cálculo de número de interacciones de cierta cantidad «m» de factores, se hace mediante la operación combinaciones de «f» en «m», tal como se presenta en seguida:
FG f IJ = f ! que cuenta el número de maneras diferentes de seleccionar «m» H mK m!( f − m )!
factores de los f.
- 250 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
En resumen, con el factorial general, se pueden estudiar los siguientes 2 f − 1efectos:
FG f IJ = f efectos principales (A, B,...,K) H 1K FG f IJ = f ( f − 1 ) interacciones dobles (AB, AC,...(K-1)K) 2 H 2K
FG f IJ = f H f −1K FG f IJ = 1 HfK
M interacciones de f-1 factores (AB...K-1, AB...(K-2)K,....) interacciones de todos los factores (ABC....K)
Ejemplo: 2 2 × 31 = 12 tratamientos o combinaciones. Entonces existen 3 factores en estudio,
se desea saber cuántas interacciones de primer orden existen?.
FG 3IJ = 3! = 3 interacciones de primer orden ó interacciones dobles. H 2K 2 !( 3 − 2 )!
Cuando se tiene 4 factores en estudio, cuántas interacciones de segundo orden existen en el experimento?.
FG 4IJ = 4! = 4 interacciones de segundo orden o a veces lo llaman interacciones H 3K 3!( 4 − 3)!
triples. Observación: a) Cuando todo los factores son cuantitativos, entonces se debe estudiar por el método de superficie de respuesta. b) Cuando existen factores cualitativos y factores cuantitativos, entonces se puede estudiar con efectos simples. d) Se recomienda no estudiar más de tres factores, ya que se complicará la interpretación de la interacción significativa. e) Cuando se complica los factores, entonces se realiza mediante repetición fraccionada (experimentos factoriales grandes).
Análisis y Diseño de Experimentos - 251 7.1. EXPERIMENTO FACTORIAL DE LA SERIE 2n Considere los factores A y B con «a» y «b» (a,b ≥ 2) niveles de prueba, respectivamente. Con ellos se puede construir el arreglo o diseño factorial axb, que consiste axb tratamientos o combinaciones. Algunos casos particualres de uso frecuente son: el experimento factorial 22, el factorial 32 y el factorial 3x2. Los experimentos factoriales que involucran menos de cuatro factores se corren replicados para poder tener la potencia necesaria en las pruebas estadísticas sobre los efectos de interés, de tal forma que si se hacen «n» réplicas, el número total de corridas experimentales es n(axb). Ejemplo: 22= 4 tratamientos o combinaciones. a0
A B
b0
a1 b1
b0
a1 b1
b1
Efecto simple de A en b0: a1b0 - a0b0 Efecto simple de A en b1: a1b1 - a0b1 Efecto simple de B en a0: b1a0 - b0a0 Efecto simple de B en a1: b1a1 - b0a1
a2 b2
b1
b2
Efecto simple de A en b1: a2b1 - a1b1 Efecto simple de A en b2: a2b2 - a1b2 Efecto simple de B en a1: b2a1 - b1a1 Efecto simple de B en a2: b2a2 - b1a2
Ordenando el efecto simple de B en a0, se tiene a0b1 - a0b0 efecto atribuible a b cuando se mantiene a0 fijo. Ordenando el efecto simple de B en a1, se tiene a1b1 - a1b0 efecto atribuible a b cuando se mantiene a1 fijo. Efecto principal A: La variabilidad que existe entre los niveles del factor A, pero en promedio del factor B. Efecto principal A =
( a1b1 − a0b1 ) + ( a1b0 − a0b0 ) ( a1b1 + a1b0 ) − ( a0b1 = 2 2
Efecto principal B =
( a1b1 − a1b0 ) + ( a0b1 − a0b0 ) ( a1b1 + a0b1 ) − ( a1b0 = 2 2
Efecto interacción AB =
( a1b1 − a0b1 ) − ( a1b0 − a0b0 ) 2
- 252 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Efecto interacción BA =
( a1b1 − a1b0 ) − ( a0b1 − a0b0 ) 2
7.1.1. Experimento factorial bajo el diseño completo al azar (DCA). El modelo lineal aditivo es el siguiente:
Yijk = µ + α i + β j + ( αβ )ij + ε ijk
R|i = 1,2,L , p ( Niveles de factor A S| j = 1,2,L ,q ( Niveles de factor B T k = 1,2,L ,r ( repeticiones )
donde: Yijk = Es la variable respuesta de la k-ésima observación bajo el j-ésimo nivel de factor B, sujeto al i-ésimo nivel de tratamiento A. µ = Constante, media de la población a la cual pertenecen las observaciones. τ i = Efecto del del i-ésimo nivel del factor A. β j = Efecto del j-ésimo nivel del factor B. (α β)ij = Efecto de la interacción del i-ésimo nivel del factor A, en el j-ésimo nivel del factor B.
ε ijk = Efecto del error experimental, que está distribuído como ε ijk ~ D N I ( 0 , σ e2 )
ANÁLISIS DE VARIANZA(ANOVA)
Fuentes de Variación
G. L.
S.C. Yij2. Y...2 − ∑ ∑ abr i=1 j=1 r a
b
t
Yi 2..
Tratamientos
t-1
Factor A
a- 1
∑br − abr
b- 1
∑ar − abr
i =1 b
Factor B
F Y − Y I − bSC + SC g GH ∑∑ r abr JK 144 42444 3 b
2 ij .
2 ...
A
i =1 j =1
SCcomb( AxB )
Error Experimental
ab(r -1)
Por diferencia a
Total
abr - 1
b
r
∑∑∑Yijk2 − i=1 j=1 k=1
Y...2 abr
B
Fc CMtratam. CMerror
SC( A ) a −1
CMerror
SC( B)
CM( B)
b−1
CMerror
SC( AB )
CM( AB)
gl( AB )
CMerror
SCerror ( ab −1)( r −1)
CM( A)
Análisis y Diseño de Experimentos - 253 -
(a - 1)(b - 1)
Y.j2. Y...2
j=1
a
Interacción AxB
C.M.
Y...2
SCtratam. t −1
- 254 -
V. Ibañez Q. - Docente FINESI - UNA - Puno EJEMPLO:
En una empresa alimenticia se desean evaluar cuatro antioxidantes, a través de su efecto en un aceite vegetal. El propósito es seleccionar el producto que retrase más la oxidación. Las pruebas se hacen a condiciones de estrés, midiendo como variable de respuesta al índice de peróxidos. Diferentes unidades experimentales se evaluan a diferentes tiempos. El tiempo está dado en horas. Los datos obtenidos se presentan a continuación (en el control no se agrega ningún antioxidante). a) Calcular el ANVA respectivo y realice efectos simples para la interacción. b) Graficar la interacción de los dos factores e interprete los resultados. A: Producto B: Tiempo 1 2 Yij. Yi.. Y.j.
Control = 1 4 8 12 3.84 27.63 39.95 3.72 27.58 39.00 7.56 55.21 78.95 Y1.. = 141.72 Y.1. = 37.01
4 4.00 3.91 7.91 Y2.. =
A=2 8 12 22.00 46.20 21.83 45.60 43.83 91.80 143.54 Y.2. =
4 3.61 3.61 7.22 Y3.. = 224.14
B=3 8 21.94 21.85 43.79 137.57
12 4 43.58 3.57 42.98 3.50 86.56 7.07 Y4.. =
SOLUCIÓN: 1. Hipótesis: Respecto al factor A.
H0 : α i = 0,
C=4 8 20.50 20.32 40.82 137.92
12 4 45.14 3.64 44.89 3.61 90.03 7.25 Y5.. = Y.3. = 435.72
D=5 8 20.30 20.19 40.49 136.12
12 44.36 44.02 88.38 696.87 = Y... 696.87 = Y... 696.87 = Y...
Respecto al factor B.
i = 1,2,..... a
Ha : α i ≠ 0, para cualquier i
H0 : β j = 0 ,
j = 1,2 ,.....b
Ha : β j ≠ 0, para cualquier j
Respecto a la interacción A x B
b g H : bαβ g Ho : αβ a
ij
= 0,
ij
≠0
i = 1,2 ,..... a ; j = 1,2,3,..., b
2. Nivel de Significación:
α = 0.05
3. Prueba de Contraste: F ( A ) =
CM A CM B CM A × B , F( B ) = , F( A × B ) = CM Error CM Error CM Error
4. Región de aceptación y rechazo:
RA Ho: Sí F ( A ) ≤ Faba −( 1r −1 ),α , entonces se acepta la Ho:
RR Ho: Sí F ( A ) > Faba −( 1r −1 ),α , entonces se acepta la Ha:
Análisis y Diseño de Experimentos - 255 -
RA Ho: Sí F ( B ) ≤ Fabb −( 1r −1 ),α , entonces se acepta la Ho:
RR Ho: Sí F ( B ) > Fabb −( 1r −1 ),α , entonces se acepta la Ha: RA Ho: Sí F ( A × B ) ≤ Fab( a( −r 1−)(1 ),bα−1 ) , entonces se acepta la Ho: RR Ho: Sí F ( A × B ) > Fab( a( −r 1−)(1 ),bα−1 ) , entonces se acepta la Ha: 5. Procedimiento de Cálculo de ANOVA a) Grados de libertad (GL) GL A = a − 1 = 5 − 1 = 4 , GLA × B
GLB = b − 1 = 3 − 1 = 2
= ( a − 1 )( b − 1 ) = 4 × 2 = 8 , GLError = ab( r − 1 ) = 5 × 3 × ( 2 − 1 ) = 15
GLTotal = abr − 1 = 5 × 3 × 2 − 1 = 29
b) Suma de Cuadrados (SC ó SS) 2 Y••• (696.87) 2 = = 16187.59323 abr 5× 3× 2
TC =
Y2
5
i i) SCA = ∑ br•• − TC= i=1
3
Y2
(141.72)2 + (14354 . )2 +L+(13612 . )2 − TC = 6469386 . 3× 2
• j• ii) SC B = ∑ ar − TC = j=1
F
I JK 144 42444 3 Yij2•
iii) SCA×B = GH∑∑ r 5
3
(37.01) 2 + (224.14) 2 + ( 435.72 )2 − TC = 7958.4465 5× 2
− TC − SCA − SCB =
i=1 j=1
LM(7.56) +(55.21) +L+(88.38) −TCOP − SC − SC 2 N Q 2
2
2
A
B
SCTratamientos
= 8080.55102 - SCA-SCB = 115.635054 iv)
5
3
2
SC Total = ∑ ∑ ∑ Yijk2 − TC = ( 384 . )2 + ( 3.72 )2 + L + ( 44.36 )2 + ( 44.02 )2 − TC = 24269.1007 − TC = i =1 j =1 k =1
v)
− 6.469388 − 7958.44658 − 115.635054 SC Error = SC Total − SC A − SC B - SCA × B = 808150747 .
SC ErrorExptal = SC TOTAL − SCTratamientos = 808150747 . − 8080.55102 = 0.95645
- 256 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
RESUMEN EN LA TABLA DE ANALISIS DE VARIANZA F. de V. Antioxidantes (A) Tiempo (B) AxB Error Experimental Total CV =
G.L. S.C. C.M. Fc. 4 6.4693860 1.6173465 25.36 2 7958.4465800 3979.2232900 62406.14 8 115.6350540 14.4543818 226.69 15 0.9564500 0.0637633 29 8081.5074700
Signif. ** ** **
4 2 8 F15,0.01 = 4.89; F15,0.01 = 6.36; F15,0.01 = 4.0
CM error 0.063763 x100 = × 100 = 1.09% Y••• 696.87 30
INTERPRETACIÓN: De acuerdo al análisis de varianza (ANVA), encontramos que existe diferencia estadística altamente significativa (P ≤ 0.01) para los efectos principales y efectos de interacción; los efectos principales pierden el interés y las conclusiones se deben obtener del efecto de la interacción antioxidante por tiempo, para esto se debe realizar el análisis de varianza de efectos simples para nuestras conclusiones. MÉTODO TABULAR PARA LA INTERACCIÓN (A= Antioxidantes x B = Tiempo) Antioxidantes a1 Tiempo (Hrs)
b1 b2 b3
Yi..
a2
a4
a5
Y.j.
7.07 40.82 90.03
7.25 40.49 88.38
37.01 224.14 435.72
a3
7.56 7.91 7.22 55.21 43.83 43.79 78.95 91.8 86.56
141.72 143.54 137.57 137.92 136.12
696.87 = Y...
MÉTODO GRÁFICO (Se debe obtener los promedios del método tabular)
a1 Tiempo (Hrs)
b1 b2 b3 Promedio
3.78 27.605 39.475 23.62
Antioxidantes a2 a3 3.955 21.915 45.9 23.923
3.61 21.895 43.28 22.928
a4
a5
3.535 3.625 20.41 20.245 45.015 44.19 22.987 22.6867
Promedio
18.505 112.07 217.86 23.229
51 48 45 42 39 36 33 30 27 24 21 18 15 12 9 6 3 0
Promedios
Promedios (Hrs)
Análisis y Diseño de Experimentos - 257 -
a1
a2
a3
a4
51 48 45 42 39 36 33 30 27 24 21 18 15 12 9 6 3 0
a5
b1
Niveles de Antioxidante
b2
b3
Tiempo en horas A dentro de b1
A dentro de b2
A dentro de b3
B dentro de a1
B dentro de a2
B dentro de a4
B dentro de a5
B dentro de a3
Análisis de varianza de efectos simples para la interacción Antioxidantes con el tiempo. a) Suma de cuadrados de efectos simples: A en bj: 5 . 2 + 791 . 2 + 722 . 2 + 707 . 2 + 725 . 2 ( 3701 . )2 Y2 Y2 756 . SC( A dentro b1 ) = ∑ i1• − •1• = − = 022474 ar 2 5× 2 i =1 r 5 Y2 . 2 + 4383 . 2 + 4379 . 2 + 4082 . 2 + 4049 . 2 ( 22414 . )2 Y2 5521 i2 − = 7237084 SC( A dentro b2 ) = ∑ • − •2• = . ar 2 5× 2 i=1 r 5 Y2 . 2 + 918 . 2 + 8656 . 2 + 9003 . 2 + 8838 . 2 ( 43572 . )2 Y2 7895 i3 − = 4950886 SC( A dentro b3 ) = ∑ • − •3• = . ar 2 5× 2 i =1 r
b) Suma de Cuadrados de B en ai: b=3 Y2 Y2 7.562 +5521 . 2 + 7895 . 2 (141.72)2 i1 SC(B en a1) = ∑ • − 1•• = − = 13217737 . br 2 3× 2 j=1 r b=3 Y2 Y2 7.912 + 4383 . 2 + 918 . 2 (143.54)2 i2 − = 1771483233 SC(B en a2 ) = ∑ • − 2•• = . br 2 3× 2 j=1 r b=3
Yi32•
j=1
r
SC(B en a3 ) = ∑
−
Y32•• 7.222 + 4379 . 2 +8656 . 2 (137.57)2 = − = 1576912233 . br 2 3× 2
- 258 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
b=3 2 Y Y2 7.072 + 4082 . 2 + 9003 . 2 (137.92)2 − =1740508033 SC(B en a4 ) = ∑ i4• − 4•• = . br 2 3×2 j=1 r b=3 2 Y Y2 7.252 +4049 . 2 +8838 . 2 (136.12)2 − = 1663404433 SC(B en a5) = ∑ i5• − 5•• = . br 2 3×2 j=1 r
ANOVA DE EFECTOS SIMPLES PARA LA INTERACCIÓN AxB F. de V. Efecto simple de Antioxidante (A) dentro de 4 Hrs. Efecto simple de Antioxidante (A) dentro de 8 Hrs. Efecto simple de Antioxidante (A) dentro de 12 Hrs. Efecto simple de Tiempo (B) dentro de Control Efecto simple de Tiempo (B) dentro de A Efecto simple de Tiempo (B) dentro de B Efecto simple de Tiempo (B) dentro de C Efecto simple de Tiempo (B) dentro de D Error Experimental 4 F15,0.01 = 4.89;
G.L. 4 4 4 2 2 2 2 2 15
S.C. 0.224740 72.370840 49.508860 1321.773700 1771.483233 1576.912233 1740.508033 1663.404433 0.956450
C.M. 0.05619 18.09271 12.37722 660.88685 885.74162 788.45612 870.25402 831.70222 0.0637633
Fc. Signif. 0.88 ns. 283.75 ** 194.11 ** 10364.68 ** 13891.08 ** 12365.35 ** 13648.19 ** 13043.58 **
2 F15,0.01 = 6.36
Interpretación: A dentro de 4 hrs.: No se encontró diferencia estadística significativa entre los niveles de a1, a2, a3, a4, a5 bajo los niveles de b1, es decir no hay diferencia significativa entre los niveles de antioxidantes con el tiempo, es decir son independientes entre los niveles. A dentro 8 hrs: Existe diferencia significativa entre los niveles de a1, a2, a3, a4, a5 bajo los niveles de b2, es decir hay diferencia significativa entre los antioxidantes con el tiempo. A dentro 12 hrs: Existe diferencia significativa entre los niveles de a1, a2, a3, a4, a5 bajo los niveles de b3, es decir hay diferencia significativa entre los antioxidantes con el tiempo. B dentro ai: Existe diferencia significativa entre los niveles de b1, b2 y b3 bajo los niveles de ai, es decir hay diferencia significativa entre los tiempos con el antioxidante (para todo los niveles).
Análisis y Diseño de Experimentos - 259 Prueba Múltiple de comparación de DUNCAN para los efectos simples. 1. Hipótesis: H 0 : µ 1 = µ 2 = µ 3 = µ 4 = µ 5 Vs. H a : µ i ≠ 0 2. Nivel de significación: α = 0.05 3. Buscar en la Tabla de Duncan los valores de AES(D) con Grados de Libertad del Error (GLerror = 15). p: AES(D)
SY =
2 3.01
0.063763 2
=
3 3.16
4 3.25
5 3.31
0.56
0.58
0.59
0.17855
ALS(D)
0.54
3. DUNCAN para A dentro de bi: A dentro b1:Yi1• Antioxidantes A Control D B C
A dentro b2 :Yi2•
Yi1• Duncan(P≤0.05) 3.96 3.78 3.63 3.61 3.54
Antioxidantes
a a a a a
Control A B C D
A dentro b3 :Yi3• Duncan(P≤0.05)
Yi2• 27.61 21.92 21.90 20.41 20.25
Antioxidantes
a
A C D B Control
b b c c
Yi3•
Duncan(P≤0.0
45.90 45.02 44.19 43.28 39.48
a b c d
4. DUNCAN para B dentro de ai: B dentro a1:Y1 j• Tiempo Y1 j• 12 8 4
39.5 27.6 3.78
B dentro a2 :Y2 j•
Duncan(P≤0.05) a b c
Y2 j• 45.90 21.92 3.96
B dentro a3:Y3 j•
Duncan(P≤0.05) a b c
Y3 j• 43.28 21.90 3.61
B dentro a4 :Y4 j•
Duncan(P≤0.05) a b c
Y4 j• 45.02 20.41 3.54
B dentro a5:Y5 j•
Duncan(P≤0.05) a b c
Y5 j• 44.19 20.25 3.63
Duncan(P≤0.05) a b c
Nota: El efecto principal del factor tiempo es de tipo cuantitativo por que se debe realizar a través de superficie de respuesta para encontrar el óptimo. En nuestro caso se ilustra solamente para efectos didácticos del ejemplo, más adelante se desarrollará en forma detallada cuando se tienen factores cuantitativos.
- 260 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
PROGRAMA EN SAS. DATA AGROI; OPTIONS NODATE NOCENTER NONUMBER; INPUT ANTIOX $ TIEMPO REP INDICE; DATALINES; /* Ingresar los datos */ ; PROC PRINT; RUN; PROC GLM; CLASS ANTIOX TIEMPO; MODEL INDICE = ANTIOX TIEMPO ANTIOX*TIEMPO; LSMEANS ANTIOX*TIEMPO/SLICE=ANTIOX; LSMEANS ANTIOX*TIEMPO/SLICE=TIEMPO; RUN; SALIDA DE RESULTADOS CON SAS Class Level Information Class Levels Values ANTIOX 5 A B C D TES TIEMPO 3 4 8 12 Number of observations 30 Dependent Variable: INDICE Source DF Squares Mean Square Model 14 8080.551020 577.182216 ANTIOX 4 6.469387 1.617347 TIEMPO 2 7958.446580 3979.223290 ANTIOX*TIEMPO 8 115.635053 14.454382 Error 15 0.956450 0.063763 Corrected Total 29 8081.507470 R-Square Coeff Var Root MSE INDICE Mean 0.999882 1.087064 0.252514 23.22900
Least Squares Means ANTIOX A B C D TES
ANTIOX*TIEMPO Effect Sliced by ANTIOX for Sum of DF Squares Mean Square 2 1771.483233 885.741617 2 1576.912233 788.456117 2 1740.508033 870.254017 2 1663.404433 831.702217 2 1321.773700 660.886850
F Value 9051.95 25.36 62406.1 226.69
Pr > F F Ft ⇒ se rechaza la H o :
c) Ho. (αβ) ij = 0 vs Ha: (αβ)ij ≠ 0, si Fc > Ft ⇒ serechazala Ho : d) Ho. ρ k = 0 vs Ha: ρ k ≠ 0, si
Fc > Ft ⇒serechazala Ho :
PRUEBAS DE COMPARACION DE TRATAMIENTOS. Teniendo en cuenta que el factor A está en Parcelas y B en subparcelas, entonces en el cuadro siguiente se muestran las desviaciones estándar para comparar promedios. Caso
DLS s d
Tipo de comparación
DUNCAN s X
2Ea rb
E a rb
1)
Para niveles principales de A Yi .. − Y j ..
2)
Para efectos principales de B Y.i . − Y. j .
2Eb ra
E b ra
3)
Dos medias en B al mismo nivel de A Ai : Yik. − Yij.
2Eb r
E b r
3)
Dos medias en A al mismo nivel B
d = Yij . − Ykj . ó d = Yii . − Yjj .
2(b − 1) Eb + 2Ea rb
(b−1)Eb +Ea rb
Las comparaciones de dos medias de un factor al mismo nivel de otro factor, sólo se realiza cuando la interacción AB es significativa, caso contrario, las comparaciones se realizan independientemente, es decir como en los dos primeros (1) y (2) las medias del factor A independiente de B y viceversa.
EJEMPLO: Una de las mediciones realizadas en las parcelas con pasto fue el contenido de clorofila en la hierba cortada (mg/g) para las muestras de cada parcela. Los datos se muestran en la siguiente tabla:
Análisis y Diseño de Experimentos - 367 Co ntenid o d e clo ro fila (mg /g ) en la h ierb a co rtad a. A ñ o s d e acumulación de hierb a Fuen te de n itró geno Bloq u e b1 = 2 b2 = 5 b3 = 8 a1 = Urea 1 3.8 5.3 5.9 2 3.9 5.4 4.3 a2 = Sulfato d e amo n io 1 5.2 5.6 5.4 2 6.0 6.1 6.2 a3 = IBDU 1 6.0 5.6 7.8 2 7.0 6.4 7.8 a4 = Urea(SC) 1 6.8 8.6 8.5 2 7.9 8.6 8.4
Realizar el ANOVA, y su interpretación correspondiente. SOLUCIÓN: Primeramente se realizará el ordenamiento de los datos, para los efectos de cálculo. Bloque b1 I 3.8 II 3.9 Yij. 7.7 Yi.. Y1.. = Y.j.
a1 = Urea b2 5.3 5.4 10.7 28.6
b3 5.9 4.3 10.2
total p. Yi.k 15.0 13.6 28.6
Y.1. =
46.6
b1 5.2 6.0 11.2 Y2.. =
a2 = Sulfato de amtotal p. a3 = IBDU total p. a4 = Urea(SC) total p. b2 b3 Yi.k b1 b2 b3 Yi.k b1 b2 b3 Yi.k 5.6 5.4 16.2 6.0 5.6 7.8 19.4 6.8 8.6 8.5 23.9 6.1 6.2 18.3 7.0 6.4 7.8 21.2 7.9 8.6 8.4 24.9 11.7 11.6 34.5 13.0 12.0 15.6 40.6 14.7 17.2 16.9 48.8 34.5 Y3.. = 40.6 Y4.. = 48.8 Y.2. = 51.6 Y.3. = 54.3
A) GRADOS DE LIBERTAD (GL). GLEntre parcelas = ra - 1 = 2x4-1 = 7 GLBloque = r - 1 = 2-1 = 1 GL(A) = a - 1 = 4-1 = 3 GLE(a) = (r-1)(a-1) = 1x3 = 3 GLDentro de parcelas = ra(b-1) = 2x4(3-1)= 16 GL(B) = b - 1 = 3-1 = 2 GL(AxB) = (a-1)(b-1) = 3x2 = 6 GLE(b) = a(b-1)(r-1) = 4x2x1 = 8 GLTotal = rab-1 = 2x4x3 - 1 = 23 B) SUMAS DE CUADRADOS (SS) TC =
2 ( 152.5 )2 Y••• = = 969.0104167 abr 4 x3x2
Y..l 74.5 78.0 152.5 152.5 152.5
- 368 I)
V. Ibañez Q. - Docente FINESI - UNA - Puno
4 2 Y2 . 2 +162 . 2 +L+239 . 2 + 249 .2 152 +136 SCParcelas = ∑∑ i•k − TC = − TC = 1008103333 − TC = 3909291664 . . 3 i =1 k =1 b
4
3
2
II) SCTotal-subparcelas = ∑∑∑Yijkl2 −TC = 38 . 2 + 39 . 2 +L+84 . 2 − TC = 101779 . − TC = 4877958334 . i=1 j=1 k =1
III) SCDentro de parcelas = SCTotal-subparcelas − SCParcelas = 4877958334 . − 3909291664 . = 96866667 . Luego calculamos las fuentes de variación de interés: Y••2l Y2 +Y2 74.52 + 782 − TC = ••1 ••2 − TC = − TC = 0.51041667 4 x3 12 k =1 ab 2
SCBloque = ∑
4 . 2 +345 . 2 +406 . 2 +488 .2 Y2 Y2 +Y2 +Y2 +Y2 286 −TC = 3732458334 . SCA = ∑ i•• −TC = 1•• 2•• 3•• 4•• −TC = 4x2 3x2 i=1 br
SCE(a) =SCParcela −SCA −SCBloque =3909291664 . . . . −3732458334 −051041667 =125791663 3
Y•2j •
j =1
ar
SCB = ∑ SCAxB =
− TC =
Y•21• + Y•22• + Y•23• 46.62 + 51.62 + 54.32 = − TC = 381583334 . 4( 2 ) 8
F Y −TCI −SC −SC =F77. +107. +L+169. −TCI −SC −SC =4529458334 . . −SC −SC =415416666 GH 2 JK GH∑∑ r JK 4
3
2 ij•
2
A
2
2
B
A
B
A
B
i=1 j=1
SCE(b) = SCDentro parcelas − SCB − SCAxB = 96866667 . − 381583334 . − 415416666 . = 1716667 .
RESUMEN EN LA TABLA DE ANOVA: Fuentes de Variación Bloques Tratamientos Nitrógeno (A) Error(a) TOTAL PARCELAS Hierba (B) Ax B Error(b) TOTAL DENTRO DE PARCELAS
TOTAL SUB-PARCELAS
CVA =
G.L. 1 11 3 3 7 2 6 8 16 23
S.S. 0.51041667 45.29458334 37.32458334 1.25791663 39.09291664 3.81583334 4.15416666 1.71666700 9.68666700 48.77958364
0.419305543 x100 = 10.19%; CVB = Y•••
M.S. Fc Signif. 0.51041667 1.22 n.s. 4.11768939 12.44152778 29.67 ** 0.41930554 1.90791667 0.69236111 0.21458338 0.60541669
8.89 3.23
0.214583375 x100 = 7.29% Y•••
** n.s.
Análisis y Diseño de Experimentos - 369 SYA =
CME(a) br
CME(b) 0214583375 . . 0419305543 . =0163777 =0.264356; SYB = = ar 3(2) 4(2)
=
Para graficar, se realiza por el Método tabular: TOTALES DE AxB b1=2 a1 7.7 a2 11.2 a3 13.0 a4 14.7 Y.j. 46.6
b2=5 10.7 11.7 12.0 17.2 51.6
b3=8 10.2 11.6 15.6 16.9 54.3
Yi.. 28.6 34.5 40.6 48.8 152.5
PROMEDIOS DE AxB b1=2 a1 3.85 a2 5.60 a3 6.50 a4 7.35 Promedio(j) 5.83
b2=5 5.35 5.85 6.00 8.60 6.45
b3=8 5.10 5.80 7.80 8.45 6.79
Prom(i) 4.77 5.75 6.77 8.13 6.35
9 8 7
9
cont. de Clorofila(mg/g)
cont. de Clorofila(mg/g)
Con los promedios de la interacción AxB, se realiza la gráfica y se muestra en seguida:
6 5 4 3 2 1 0
2
5
8 7 6 5 4 3 2 1 0
8
a1
Años de acumulación de hierba
a2
a3
a4
Fuente de Nitrógeno B dent ro de Urea
B dent ro Sulfat o
B dent ro IBDU
B dentro urea(SC)
A dent ro de 2 años
B dentro 5 años
B dentro 8 años
Interpretación de los efectos de factores con contrastes de regresión: El factor Hierbas es de tipo cuantitativo: 2 - 5 - 8 años de acumulación, entonces se realizará el cálculo de la partición de las sumas de cuadrados de contraste lineal y cuadrático para la interacción años de acumulación y años de años de acumulación x nitrógeno. Años de acumulación Nitrógeno a1 a2 a3 a4
Y• j• Lineal (P 1j) Cuadrática (P2j)
Lineal
2 3.85 5.60 6.50 7.35
5 5.35 5.85 6.00 8.60
8 5.10 5.80 7.80 8.45
5.83
6.45
6.79
-1 1
0 -2
1 1
∑P Y 1j
ij•
Cuadrática
∑P
2j
Yij•
1.25 0.20 1.30 1.10
-1.75 -0.30 2.30 -1.40
0.9625
-0.2875
- 370 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
CÁLCULO DE LAS SUMAS DE CUADRADOS:
SCLineal =
ra
e∑
4
PY j =1 1 j • j •
j
2
4
∑P
=
2( 4 )( 0.9625 )2 = 3.705625 2
=
2( 4 )( −0.2875 )2 . = 0110208333 6
2 1j
j =1
ra
SCCuadrática =
e∑
4 j =1
P2 j Y• j •
2
4
∑P
2 2j
j =1
r∑i=1 4
SCLineal x Cuadrática =
j
e∑
j − SC 2
3
PY
j =1 1 j ij•
Lineal
3
∑P
2 1j
=
. 2 + 02 . 2 +13 . 2 +11 . 2) 2(125 . − SCLineal = 0796875 2
j =1
e
r∑i=1 ∑j=1 P2 jYij• 4
SCCuadrática x Nitrógeno =
3
3
∑P
j −SC 2
Cuadrático
2 2j
=
2 ( −175 . )2 +( −030 . )2 +( 23 . )2 +( −14 . )2 6
− SCCuadrática = 3357291667 .
j=1
Análisis de varianza para el contenido de Clorofila en recortes de pasto Pencross con particiones de regresión polinomial ortogonal para el factor hierba. Fuentes de Variación Bloques Nitrógeno (A) Error(a) Hierba (B) BLineal BCuadrática Ax B A x Blineal A x BCuadrática Error(b)
GL 1 3 3 2 1 1 6 3 3 8
S.C. C.M. 0.510416670 0.510416670 37.324583340 12.441527780 1.257916630 0.419305543 3.815833340 1.907916670 3.705625000 3.705625000 0.110208333 0.110208333 4.154166660 0.692361110 0.796875000 0.265625000 3.357291667 1.119097222 1.716667000 0.214583375
Fc. 1.22 29.67
Signif. ns. **
8.89 17.27 0.51 3.23 1.24 5.22
** ** ns. ns. ns. *
Existe desviaciones cuadráticas significativas de la respuesta lineal para los años de acumulación de hierba que difieren entre las fuentes de nitrógeno. Se presenta una componente de interacción significativa, y es posible comparar los promedios de nitrógeno para cada año de acumulación de hierba y determinar si la Urea con cubierta
Análisis y Diseño de Experimentos - 371 de sulfuro siempre rindió el mayor contenido de clorofila en el pasto. Estos resultados comprobaremos usando el software estadístico SAS, para una mejor aproximación de los resultados y tomar una buena decisión al respecto, y lo detallamos a continuación.
/**** PROGRAMA EN SAS PARA PARCELA LA DIVIDIDA */ DATA HIERBA; OPTIONS NODATE NOCENTER NONUMBER; INPUT NITRO $ ACUMU BLOQUE Y; DATALINES; UREA 2 1 3.8 UREA 2 2 3.9 UREA 5 1 5.3 UREA 5 2 5.4 UREA 8 1 5.9 UREA 8 2 4.3 SULFA 2 1 5.2 SULFA 2 2 6.0 SULFA 5 1 5.6 SULFA 5 2 6.1 SULFA 8 1 5.4 SULFA 8 2 6.2 IBDU 2 1 6.0 IBDU 2 2 7.0 IBDU 5 1 5.6 IBDU 5 2 6.4 IBDU 8 1 7.8 IBDU 8 2 7.8 U_SC 2 1 6.8 U_SC 2 2 7.9 U_SC 5 1 8.6 U_SC 5 2 8.6 U_SC 8 1 8.5 U_SC 8 2 8.4 ; PROC PRINT; RUN; PROC ANOVA; CLASS NITRO ACUMU BLOQUE; MODEL Y = BLOQUE NITRO ACUMU BLOQUE*NITRO NITRO*ACUMU; TEST H = BLOQUE NITRO E = BLOQUE*NITRO; RUN;
- 372 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
RESULTADOS DEL SAS The ANOVA Procedure Class Level Information Class Levels Values NITRO 4 IBDU SULFA UREA U_SC ACUMU 3 2 5 8 BLOQUE 2 1 2 Number of observations 24 Dependent Variable: Y Source Model BLOQUE NITRO NITRO*BLOQUE ACUMU NITRO*ACUMU Error Corrected Total R-Square 0.964808
DF 15 1 3 3 2 6 8 23
Coeff Var 7.290199
Sum of Squares 47.06291667 0.51041667 37.32458333 1.25791667 3.81583333 4.15416667 1.71666667 48.77958333
Root MSE 0.463231
Mean Square 3.13752778 0.51041667 12.44152778 0.41930556 1.90791667 0.69236111 0.21458333
F Value 14.62 1.22 29.67 1.95 8.89 3.23
Pr > F 0.0003 0.3505 0.0099 0.1996 0.0093 0.0646
Y Mean 6.354167
EJEMPLO. En la Estación Experimental INIA (Tahuaco - Yunguyo) en el período de 1995 1996, se ensayó el desarrollo de tecnología en OCA, para esto se experimentó en parcelas divididas con 3 bloques, evaluándose el factor A (parcela principal) con 2 niveles (con estiércol y sin estiércol) y el factor B (sub-parcela) con niveles de: 1 tubérculo/golpe, 2 tubérculos/golpe y 3 tubérculos/golpe. Los rendimientos fueron obtenidos en una parcela de 12.8 m2, 4 surcos/parcela. (a0 = con estiércol 2t/ha., a1 = Sin estiércol, b1 = 1 tubérculo-golpe, b1= 2 Tubérculo/golpe, b2 = 3 tubérculo/golpe). La información se presenta a continuación: I
II a1
a0
a0
III a1
a0
a1
b1
5 b2
6
b0
9 b2
13
b0
8
b2
12
b2
14 b1
6
b2
6 b0
6
b1
7
b1
12
b0
10 b0
7
b1
14 b1
19
b2
10 b0
7
Análisis y Diseño de Experimentos - 373 SOLUCION: Primeramente debemos ordenar el cuadro anterior de la siguiente forma: Total parcelas
a0 Bloque I II III Total Yij.=AB
b0 10 9 8 27
b1 5 14 7 26
Factor A (Yi..)
a0 = 83
Factor B (Y.j.)
b0 = 47
b2 14 6 10 30
Yi.k 29 29 25 83 b1 = 63
a1 b0 7 6 7 20
b1 6 19 12 37
b2 6 13 12 31
Total parcelas
Total Bloques
Yi.k 19 38 31 88
Y..k 48 67 56 Y...= 171
a1 = 88
171
b2 = 61
171
a) GRADOS DE LIBERTAD: Para entre parcelas: ra - 1 = 3(2) - 1 = 5 Descomponiendo en bloques: r - 1 = 3 - 1 = 2 A: a - 1 = 2 - 1 = 1 Error(a): (r-1)(a-1) = 2x1 = 2 Dentro de parcelas: ra(b-1) = 3(2)(2) = 12 Descomponiendo en B: B: (b-1) = 3-1 = 2 Interacción AxB: (a-1)(b-1) = 1x2 = 2 Error(b): a(r-1)(b-1) = 8 Total: rab - 1 = 3(2)(3) = 17 b) SUMA DE CUADRADOS
TC =
Y...2 (171) 2 = = 1624.5 abr 2 ( 3) 3
Yi.k 29 2 + 292 + 252 + 192 + 382 + 312 − TC = − TC = 6650 . 3 i =1 k =1 b a
r
SCparcelas = ∑∑
SCTotal subparcelas = ∑Yijk2 − TC = 102 + 92 + 82 +L+62 + 132 + 122 − TC = 1871− TC = 24650 . i , j ,k
SCDentro de parcelas = SCtotal − subparc. − SC parcelas = 246.50 − 6650 . = 180.0
- 374 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Luego calculamos las fuentes de variación de interés: Y..2k 48 2 + 67 2 + 56 2 − TC = − TC = 1654.83333 − TC = 30.33 2 x3 k =1 ab r
SCBloques = ∑
a
∑
SC A =
i =1
Y i ..2 832 + 88 2 − TC = − T C = 1 6 2 5 .8 9 − T C = 1.3 9 br 9
SC Error ( a ) = SC Parcela − SC Bloque − SC A = 66.50 − 30.33 − 1.39 = 34.78 b
Y. 2j .
j =1
ar
SC B = ∑
− TC =
47 2 + 632 + 612 − TC = 25.33 6
a b Y 272 + 262 + 302 + 202 + 372 + 312 ij. SCComb( AxB) = ∑∑ − TC = − TC = 5383 . 3 i =1 j =1 r
. − 139 . − 25.33 = 27.11 SCint.( AxB ) = SCcomb ( AxB ) − SC A − SC B = 5383
SCError (b) = SCdentro parcelas − SCB − SC AxB = 180 − 25.33 − 2711 . = 127.56 RESUMEN EN LA TABLA DE ANALISIS DE VARIANZA.
F. De V. Bloques A Error(a) Total parcelas B AxB Error(b) Total dentro de parcelas Total sub-parcelas
G.L. S.C. 2 30.33 1 1.39 2 34.78 5 66.50 2 25.33 2 27.11 8 127.56 12 180.00 17 246.50
C.M. 15.17 1.39 17.39
Fc. 0.87 0.08
Signif. n.s. n.s.
12.67 13.56 15.95
0.79 0.85
n.s. n.s.
Análisis y Diseño de Experimentos - 375 CONCLUSION: Ninguno de los factores tiene efecto significativo, por consiguiente no influye en el rendimiento de Oca con estiércol y sin estiércol, se puede usar indistintamente en la siembra, esto nos sugiere sembrar la oca con estiércol y sin estiércol no tiene efecto significativo, tampoco influye en número de tubérculos/golpe en el sembrado de oca, es decir es igual sembrar con 1,2,3 tubérculos/golpe. En la interacción de primer orden no se encontró diferencia estadística significativa, esto quiere decir que estos dos factores se comportan en forma independiente.
PROGRAMA EN SAS.
DATA PDIVID; OPTIONS NODATE NOCENTER NONUMBER;
DO A = 1 TO 2; DO B = 1 TO 3; DO BLOQUE = 1 TO 3; INPUT RDTO @; OUTPUT; END; END; END; CARDS; 10 9 8 5 14 7 14 6 10 7 6 7 6 19 12 6 13 12 ; PROC PRINT; RUN; PROC ANOVA; CLASS BLOQUE A B; MODEL RDTO = BLOQUE A BLOQUE*A B A*B; TEST H = BLOQUE A E = BLOQUE*A; TEST H = BLOQUE A /DUNCAN E = BLOQUE*A; RUN;
- 376 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
EJEMPLO. El siguiente experimento fue diseñado en una parcela dividida en bloque al azar. Consiste en un estudio del rendimiento (materia seca) en kilogramos por parcela para el Rye grass, donde el factor nitrógeno, con sus respectivos niveles, ocupó la parcela mayor -parcela principal- y el factor mejorador de suelo -Polisul- se localizó en las subparcelas. En este ejemplo se utilizarán las siguientes notaciones: niveles de nitrógeno (N), niveles de Polisul (P), bloques (B), error parcela mayor (EPM) y error parcela menor (Epm). Nitrógeno Polisul (kg/ha) (litros/ha) 100 50 60 70 Yi.k 150 50 60 70 Yi.k 200 50 60 70 Yi.k Y..k
BLOQUES III 25.30 27.40 30.60 83.30 28.40 30.20 31.90 90.50 27.90 29.30 32.20 89.40
I 24.30 25.80 31.00 81.10 26.40 29.30 32.80 88.50 26.40 28.30 32.40 87.10
II 23.90 26.70 29.80 80.40 27.30 31.40 33.60 92.30 26.90 30.80 33.20 90.90
256.70
263.60 263.20
IV 24.50 28.30 30.90 83.70 27.80 31.60 32.90 92.30 28.10 31.40 32.50 92.00
V 24.90 27.90 31.20 84.00 26.80 29.90 32.60 89.30 27.10 30.20 31.70 89.00
268.00
262.30
Yij. 122.90 136.10 153.50 136.70 152.40 163.80 136.40 150.00 162.00
Cuadro de concentración para sumas de cuadrados de efectos simples.
Niveles de nitrógeno
100 150 200 Y.j.
Niveles de Polisul 50 60 70 122.90 136.10 153.50 136.70 152.40 163.80 136.40 150.00 162.00 396.00 438.50 479.30
Yi.. 412.50 452.90 448.40 1313.80 = Y...
Análisis y Diseño de Experimentos - 377 En función del modelo descrito, las sumas de cuadrados del análisis de varianza son las siguientes: Y..2k 25670 . 2 +L+26230 . 2 − TC = − TC = 38364375 . − 38357121 . = 7254 . 3x3 k =1 ab r
SCBloques = ∑
Yi ..2 412.50 + L + 448.40 2 − TC = − TC = 38422.481 − TC = 65.360 3x 5 i =1 br a
SC N = ∑
a r Y2 8110 . 2 + L+ 8900 . 2 SCEPM = ∑∑ i.k − TC − SCN − SCP = − (TC + 65360 . + 7254 . ) = 4965 . 3 i=1 k =1 b
b
Y. 2j.
j =1
ar
SCP = ∑
− TC =
396002 +L+479.302 − TC = 38588.449 − 38357121 . = 231328 . 3x5
a b Y2 . 2 + L+ 16200 . 2 Y 2 12209 ij . . − (38357121 . + 65360 . + 231328 . ) = 257 . SCint.( AxB) = ∑∑ − ... = − TC −(SCN + SCP ) = 38656384 5 abr i =1 j =1 r
. 2 + 239 . 2 + 253 . 2 +L+322 . 2 + 325 . 2 + 317 . 2 − TC = 38679820 . − 38357121 . = 32269 . SCTotal = ∑Yijk2 − TC = 243 i , j ,k
SC Epm = SC Total − ( SC N + SC P + SC bloque + SC EPM + SC NxP ) = 322 .699 − ( 65.360 + 231.328 + 7 .254 + 4 .965 + 2 .575) = 11.217
TABLA DE ANALISIS DE VARIANZA. F. De V. Bloques Nitrógeno (N) Error(EPM) Polisul (P) NxP Error(EPM) Total
G.L. 4 2 8 2 4 24 44
S.C. 7.254 65.360 4.965 231.328 2.575 11.217 322.699
C.M. Fc. Ft.(.05 1.814 2.92 ns. 3.84 32.680 52.66 ** 4.46 0.621 115.664 247.48 ** 3.40 0.644 1.38 ns. 2.78 0.467
.01) 7.01 8.65 5.61 4.22
- 378 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Como en ocasiones anteriores, la significancia de los efectos está en función del contraste entre las estadísticas de prueba y los valores tabulares de Snedecor. También es necesario considerar los ajustes que para pruebas de medias y contrastes se hacen en función de los diferentes cuadrados medios del error. CONCLUSION. Existe evidencias estadísticas en los efectos principales: Nitrógeno y Polisul, encontrándose una diferencia estadística altamente significativo (P ≤ 0.01), esto nos demuestra que los niveles de nitrógeno influye estadísticamente, así mismo los niveles de Polisul, para interpretar mejor estos efectos se debe realizar la prueba múltiple de significancia de Duncan, Tukey, etc. EJEMPLO. Consideremos el caso de un experimento sobre avena donde se comparó dos niveles de fertilización nitrogenaday 4 variedades de esta especie conducidos en un diseño BCA con 4 réplicas y en un diseño de tratamientos de Parcela Dividida. Se ubió en parcelas las diferentes dosis ensayadas y en subparcelas las distintas variedades. a1 : 100 kg/ha de N, a2: 120 kg /ha de N b1 : variedad W ; b2 : variedad X ; b3 : variedad Y ; a4 : variedad Z. Cuadro de resultados ordenados a1 Bloque I II III IV
b1 2.17 1.88 1.62 2.34
b2 1.58 1.26 1.22 1.59
b3 2.29 1.60 1.67 1.91
a2 b4 2.23 2.01 1.82 2.10
b1 2.33 2.01 1.70 1.78
b2 1.38 1.30 1.85 1.09
b3 1.86 1.70 1.81 1.54
b4 2.27 1.81 2.01 1.40
ANVA : cuadro de resultados F. De V. B lo q u e s N it ró g e n o (A ) E rro r(a ) To t a l p a rc e la s V a rie d a d e s (B ) In t e ra c c ió n (A x B ) E rro r(b ) To t a l d e n t ro d e p a rc e la s To t a l d e s u b p a rc e la s
G .L. 3 1 3 7 3 3 18 24 31
S .C . 0.560 0.070 0.660 1.290 1.670 0.034 0.600 2.304 3.594
C .M . 0.187 0.070 0.220
Fc. 0.85 n.s . 0.32 n.s .
0.557 0.011 0.033
1 6 . 7 0 ** 0.34 n.s .
Análisis y Diseño de Experimentos - 379 -
PROGRAMA EN SAS. DATA PARDIV; TITLE ‘PARCELAS DIVIDIDAS EN BCA’; INPUT A B REP PESO; CARDS; 1 1 1 2.17 2 1 1 2.33 1 1 2 1.88 2 1 2 2.01 1 1 3 1.62 2 1 3 1.70 1 1 4 2.34 2 1 4 1.78 1 2 1 1.58 2 2 1 1.38 1 2 2 1.26 2 2 2 1.30 1 2 3 1.22 2 2 3 1.85 1 2 4 1.59 2 2 4 1.09 1 3 1 2.29 2 3 1 1.86 1 3 2 1.60 2 3 2 1.70 1 3 3 1.67 2 3 3 1.81 1 3 4 1.91 2 3 4 1.54 1 4 1 2.23 2 4 1 2.27 1 4 2 2.01 2 4 2 1.81 1 4 3 1.82 2 4 3 2.01 1 4 4 2.10 2 4 4 1.40 ; PROC ANOVA; CLASSES REP A B; MODEL PESO=REP A REP*A B A*B; TEST H=REP E=REP*A; TEST H=A E=REP*A; MEANS REP A B A*B; RUN;
- 380 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
9.2. DISEÑO DE PARCELA SUBDIVIDIDAS (SPLIT SPLIT PLOT). Características. La adición de un tercer factor mediante la división de las subparcelas de un diseño de parcelas divididas da lugar a un diseño de parcelas sub-divididas. Este diseño suele ser bastante útil en un experimento de tres factores, a fin de facilitar las operaciones de campo o cuando resulta deseable mantener agrupados combinaciones de tratamientos; sin embargo, la restricción adicional a la distribución aleatoria hace necesario el cálculo de un tercer término de error que se utiliza para probar los efectos principales del factor aplicado a la segunda división, así como todas las interacciones que influyen dicho factor. El procedimiento para la distribución aleatoria es el mismo que para el diseño de parcelas divididas, estando las sub-parcelas divididas en sub-parcelas, cuyo número coincide con los niveles de los tres factores, a los cuales el tercer factor es aleatoriamente asignado con una nueva distribución aleatoria para cada conjunto de sub-parcelas. El modelo lineal aditivo es el siguiente: Yijkl = µ + ρk +αi +δil + β j + (αβ)ij +τ ijk +γ k + (αγ )ik + (βγ ) jk + (αβγ )ijk +εijkl i = 12 , ,L,a ( parcelas) j =12 , ,L,b (Sub − parcelas) k = 12 , ,L,c (sub − sub − parcelas) l = 12 , ,L,r (bloques)
donde: Yijkl = Variable respuesta u observación. µ = Constante común o media poblacional.
ρ l = Efecto del del l-ésimo bloque.
α i = Efecto del del i-ésimo nivel del factor A. δ il = Es el efecto del i-ésimo nivel del factor A enla l-ésima repetición. β j = Es el efecto del j-ésimo nivel el factor B que se estudia en la sub-parcela.
Análisis y Diseño de Experimentos - 381 -
τ ijk = Es el efecto del error en términos de sub-parcela.
γ k = Es el efecto del k-ésimo nivel del factor C que se estudia en sub-sub-parcela.
(α β) ij = Efecto de la interacción entre parcela y sub-parcela.
(αγ )ik = Es el efecto de la interacción entre la parcela y sub-sub-parcela. (β γ ) jk = Efecto de la interacción entre sub-parcela y sub-sub-parcela. (αβγ)ijk = Efecto de la interacción entre parcela, sub-parcela y sub-sub-parcela.
ε ijkl = Error expresado en términos de sub-sub-parcelas.
δ il , τ ijk , ε ijkl son las variables de error con media cero y varianza σ 2a , σ b2 y σ 2c , respectivamente. Pruebas de hipótesis: a) Ho. α i = 0 vs Ha: α i ≠ 0, si
Fc > Ft ⇒ serechazala Ho :
b) Ho. β j = 0 vs Ha: β j ≠ 0, si
Fc > Ft ⇒ se rechaza la H o :
c) Ho. (αβ)ij = 0 vs Ha: (αβ)ij ≠ 0, si Fc > Ft ⇒serechazala Ho : d) Ho. γ k = 0 vs Ha: γ k ≠ 0, si
Fc > Ft ⇒serechazala Ho :
e) Ho.(αγ )ik = 0 vs Ha:(αγ )ik ≠ 0, si Fc > Ft ⇒serechazalaHo: f) Ho. (βγ ) jk = 0 vs Ha: (βγ ) jk ≠ 0, si Fc > Ft ⇒serechazalaHo: g) Ho.(αβγ )ijk = 0 vs Ha:(αβγ )ijk ≠ 0, si Fc > Ft ⇒serechazalaHo:
- 382 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
TABLA DE ANALISIS DE VARIANZA.
F. de Variación G.L.
S.C.
Y...2l
r
Bloques
C.M.
Y....2
∑ abc − abcr
r-1
l =1
Yi ...2 Y....2 − ∑ abcr i =1 bcr a
A
a-1
Error(a)
ra - 1
B
b-1
AB
(a-1)(b-1)
∑ cr − TC −SC
A
SC B − SCint( AxB)
Y..2k .
c
Y....2
∑ abr − abcr Yi.2k. − TC −SCA − SCC ∑ i ,k br
Y. jk2 .
(b-1)(c-1)
Y2 − .... − SCB − SCC ∑ abcr j ,k ar Y ∑ r − TC − ( SC + SC + SC 2 ijk .
ABC Error(c)
(a-1)(b-1)(c-1) (c-1)(r-1)ab
A
TC =
Y....2 , abcr
(abcr - 1)
CV(a) =
CMError(a) Y....
B
C
+
i , j ,k
SC AB + SC AC + SC BC )
SCTotal − SCsup − parcelas − SCC − SC AC − SC BC − SC ABC
a
Total
=Ea
b
c
r
∑ ∑ ∑ ∑Y
2 ijkl
−
i =1 j =1 k =1 j =1
x100, CV(b) =
CM( B)
b −1
CM Error (b) CM ( AB)
( a − 1)(b − 1) SCError(b) = Eb (b −1)(r −1)a SC (B)
b − 1 SC ( AC )
CM Error (b)
CM( AC)
( a − 1)( c − 1) SC(BC)
CM Error (c) CM( BC)
(b−1)(c−1) SC( ABC)
CM Error (c) CM ( ABC )
(a −1)(b −1)(c −1) SCError(c) (c −1)(r −1)ab
= Ec
Y....2 abcr
CMError(b) Y....
SC (B)
CM Error (b)
k =1
(a-1)(c-1)
BC
CM Error (a )
SC ( AB )
− SCB
SC sub− parcela − SC parcelas −
c-1
AC
a −1
r
Yij2..
(b-1)(r-1)a
C
r −1 SC ( A )
∑∑
i, j
Error(b)
CM Bloque CM Error (a ) CM ( A)
(r−1)(a−1)
Yi ..2l Y2 − .... abcr i = 1 k =21 bc b Y Y....2 . j .. − ∑ abcr j =1 acr a
Parcelas
SC Bloques
SCError(a)
SC parcelas − SCbloques − SCA
(r-1)(a-1)
Fc.
x100, CV(c) =
CMError(c) Y....
x1
CM ( B )
CM Error (c)
Análisis y Diseño de Experimentos - 383 EJEMPLO. En la Estación Experimental INIAA (Tahuaco-Yunguyo) en el período (1995-1996), se se ensayó el desarrollo de tecnología en Oca, para esto se experimentó en parcelas sub-divididas con tres bloques, evaluándose el factor A (parcela principal) con dos niveles: con estiércol y sin estiércol, el factor B (sub-parcela) con niveles de: tubérculo semilla con brotes y semilla sin brotes y el factor C (sup-sub-parcelas) con niveles de: 1, 2 y 3 tubérculos/golpe. Los rendimientos fueron obtenidos en una parcela de 12.8m² con 4 surcos/parcela. La información se presenta a continuación. a0 : Con estiércol 2 t/ha, a1 : Sin estiércol, b0 : Tubérculo semilla con brotes, b1 : Tubérculo semilla sin brote, c0 : 1 tubérculo/golpe (15 g), c1 : 2 tubérculo/golpe (10 g), c2 : 3 tubérculo/golpe (8 g). a0
Total
b0 I II III Yijk.
c0 10 9 8 27
c1 5 14 7 26
b1 c2 14 6 10 30
Yij..
a0b0= 83
Yi.k.
a0c0= 62
Y.jk.
b0c0= 47
Yij.l 29 29 25 83
c0 15 7 13 35
a1
Parcela
c1 c2 Yij.l 18 9 42 5 11 23 15 18 46 38 38 111
Yi..l 71 52 71 194
a0b1=111
Total
b0 c0 7 6 7 20
b1
c1 c2 Yij.l 6 6 19 19 13 38 12 12 31 37 31 88
c0 3 9 4 16
a1b0= 88
a0c1=64
a0c2= 68
a1c0= 36
b0c1=63
b0c2= 61
b1c0= 51
c1 13 5 5 23
Parcela Bloque c2 12 10 4 26
Yij.l 28 24 13 65
Yi..l 47 62 44 153
a1b1=65
Y...l 118 114 115 347 347
a1c1= 60
a1c2= 57
347
b1c1= 61
b1c2= 64
347
Yi...
a0= 194
a1= 153
347
Y.j..
b0= 171
b1= 176
347
Y..k.
c0= 98
c2= 125
347
c1= 124
a) GRADOS DE LIBERTAD. 1) GLParcelas = ar - 1 = 2x3 -1 = 5 GLBloques = r - 1 = 3 -1 = 2 GLA = a - 1 = 2 - 1 = 1 GLError(a) = (a-1)(r-1) = 1x2 = 2 2) GLTotal sub-parcelas = ra(b - 1) = 3x2x(2 -1) = 6 GLB = b - 1 = 2 - 1 = 1 GLAB = (a-1)(b - 1) = 1x1 = 1 GLError(b) = a(r-1)(b-1) = 2x2x1 = 4 3) GLC = c - 1 = 3 - 1 = 2 GLAC = (a-1)(c - 1) = 1x2 = 2 GLBC = (b - 1)(c-1) = 1x2 = 2
- 384 -
V. Ibañez Q. - Docente FINESI - UNA - Puno GLABC = (a-1)(b - 1)(c-1) = 2 GLError(c) = ab(r-1)(c - 1) = 2x2x2x2 = 16 GLDentro de parcelas = abr(c - 1) = 2x2x3x(3-1) = 24 4) GLTotal = abcr - 1 = 2x2x3x3 - 1 = 35
b) SUMAS DE CUADRADOS. r
SCBloques = ∑ l =1
TC =
Y....2 347 2 = = 3344.694444 abcr 2 x 2 x 3x 3
Y...2l Y2 118 2 + 114 2 + 1152 − .... = − TC = 0.7222222 12 abc abcr
Yi ...2 Y2 194 2 + 1532 − .... = − TC = 46.694444 abcr 18 i =1 bcr a
SC A = ∑
Y2 712 + 522 + 712 + 472 + 622 + 442 − TC = 1178055556 SCparcelas = ∑ i..l − TC = . 6 i ,k bc SCError(a) = SCparcelas − SCbloques − SCA = 1178055556 − 07222 − 4669444 = 70388889 . . . . SC B =
b
Y. j2..
∑ acr
−
j =1
SCComb( AxB) = ∑
Yij2.. cr
Y....2 171 2 + 176 2 = − TC = 0.6944444 abcr 18 − TC =
832 + 1112 + 882 + 652 − TC = 1119.6388889 9
− 46694444 − 0694444 = 7225000 SCInt ( AxB) = SCComb( AxB) − SCA − SCB = 119638889 . . . . SC Error ( b ) = SC sub − parcela − SC parcelas − SC B − SC int( AxB ) = 325.638889 − 117 .8055556 − 0.694444 − 72 .25 = 134 .8888889
Yij2.l 292 + 292 + 252 +L+282 + 242 + 132 − TC = 3256388889 SCSub− parcelas = ∑ − TC = . c 3
Y..2k . 98 2 + 124 2 + 1252 −TC = − TC = 39.0555556 12 k =1 abr c
SCC = ∑
Y2 622 + 642 + 682 + 362 + 602 + 572 SCcomb( AxC) = ∑ i.k. −TC = − TC = 1068055556 . 6 i ,k br SCInt .( AxC) = SCComb.( AxC) − SCB − SCC = 1068055556 − 466944444 − 3905555556 = 210555556 . . . .
Análisis y Diseño de Experimentos - 385 SCcomb( BxC) = ∑
Y. 2jk .
j ,k
−TC =
ar
472 + 632 + 612 + 512 + 612 + 642 − TC = 4147222222 . 6
SCInt.( BxC) = SCComb.( BxC) − SCB − SCC = 41472222 − 0694444 − 390555556 = 172222 . . . . SCcomb( AxBxC) = ∑
Yijk2 .
i , j ,k
SCIntc.( AxBxC) = ∑
r
Yijk2 . r
i , j ,k
−TC =
272 + 262 + 302 +L+162 + 232 + 262 − TC = 1916388889 . 3
− TC −(SCA + SCB + SCC + SCAB + SCAC + SCBC )
= 1916388889 − (4669444 + 069444 + 39.0555556 + 72.25 + 21055556 + 172222 . . . . . ) = 101666666 . a
b
c
r
SCTotal = ∑∑∑∑Yijkl2 −TC = 102 + 92 +L+102 + 42 − TC = 3999 − TC = 654305556 . i =1 j =1 k =1 j =1
SCError (c) = SCTotal − SCsup− parcelas − SCC − SCAC − SCBC − SCABC = 6543055556 − 3256388889 − 390555556 − 210555556 − 172222 −101666666 . . . . . . = 2566666667 .
TABLA DE ANALISIS DE VARIANZA. F. De V. PARCELAS PRINCIPALES Bloques A Error(a) SUB-PARCELAS B AxB Error(b) SUB-SUBPARCELAS C AxC BxC AxBxC Error( c) Total
G.L.
S.C.
C.M.
Fc.
Signific.
2 1 2 5 1 1 4 6 2 2 2 2 16 30
0.7222222 46.6944444 70.3888890 117.8055556 0.6944444 72.2500001 134.8888889 325.6388890 39.0555556 21.0555556 1.7222222 10.1666666 256.6666667 654.3055557
0.3611111 46.6944444 35.1944445
0.01 n.s. 1.33 n.s.
0.6944444 72.2500001 33.7222222
0.02 n.s. 2.14 n.s.
19.5277778 10.5277778 0.8611111 5.0833333 16.0416667
1.22 0.66 0.05 0.32
n.s. n.s. n.s. n.s.
- 386 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
CONCLUSION: En el ANVA encontramos que no existe diferencia significativas para los diferentes factores y de interacción, esto implica que los factores posiblemente se deben al azar.
PROGRAMA EN SAS. DATA PDIVID; TITLE'PARCELA SUB-DIVIDIDA SPLIT-SPLIT-PLOT';
DO A = 1 TO 2; DO B = 1 TO 2; DO C = 1 TO 3; DO BLOQUE = 1 TO 3; INPUT RDTO @; OUTPUT; END; END; END; END; CARDS; 10 9 8 5 14 7 14 6 10 15 7 13 18 5 15 9 11 18 7 6 7 6 19 12 6 13 12 3 9 4 13 5 5 12 10 4 ; PROC PRINT; RUN; PROC ANOVA; CLASS BLOQUE A B C; MODEL RDTO = BLOQUE A BLOQUE*A B A*B B*BLOQUE(A) C A*C B*C A*B*C; TEST H = BLOQUE A E = BLOQUE*A; TEST H = B A*B E=B*BLOQUE(A); MEANS A /DUNCAN E = BLOQUE*A;
Análisis y Diseño de Experimentos - 387 9.3. DISEÑO DE PARCELAS EN FRANJA Introducción. Los experimentos en parcelas divididas son frecuentemente utilizados en la experimentación agronómica cuando, en un experimento de tipo factorial, el material experimental o la propia conducción del experimento no permite una completa aleatorización de todas las combinaciones de los niveles de los factores. Una variación de los experimentos en parcelas divididas es caracterizada cuando, por diversas razones, aunque se estructuren las parcelas pequeñas, no hay posibilidad de una aleatorización total de estas parcelas. En este caso, las parcelas relativas a cada factor se posicionan en franjas (o fajas), tanto en filas como en las columnas. Considerando dos factores A y B, con “a” y “b” niveles, respectivamente, de forma que en cada nivel de A se tienen los niveles de B como subparcelas y viceversa, tanto los niveles de A como los niveles de B son considerado parcelas (factores principales), en tanto que la interacción (AxB) en cada uno de los índices de A y B constituyen las subparcelas (parcelas pequeñas). Para ilustrar este caso de diseño, considere un experimento con dos factores A y B, con 3 y 4 niveles, respectivamente, y cada bloque constituido por fajas horizontales Ai y fajas verticales Bj, resultando para un bloque cualquiera, el siguiente esquema: B1
B4
B2
B3
A3
A3B1
A3B4
A3B2
A3B3
A2
A2B1
A2B4
A2B2
A2B3
A1
A1B1
A1B4
A1B2
A1B3
Y de igual manera para los demás bloques, los cuales difieren entre sí apenas en lo referente a la aleatorización. De acuerdo con Gomes, FP. (2000) el análisis de los experimentos en franjas son más complejos, en comparación con los dispuestos en un arreglo en parcelas dividi-
- 388 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
das; y dan menor precisión a las comparaciones entre los niveles del factor que se ubica en la parcela pequeña. Por ello, los experimentos en franjas deben ser evitados, siempre que sea posible. Sin embargo, existen varias situaciones en que razones de orden práctica nos llevan a adoptarlos. Dentro de estas situaciones, se puede citar: experimentos con épocas de cosecha (cuando la cosecha es mecanizada), tipos de preparación del suelo, aplicación mecanizada de fertilizantes, aplicación de correcciones al suelo, aplicación de madurantes en caña de azúcar, en evaluaciones de distanciamiento de siembra, sistemas de riego, sistemas de labranza, etc. Modelo estadístico lineal aditivo. Según Kempthorne (1952), citado por Nogueira (2000), el modelo adecuado con dos factores y un diseño un diseño de bloques completos al azar es el siguiente:
Yijk = µ + ρk +αi (αρ )ik + β j + ( βρ )jk + (αβ )ij + (αβρ )ijk
R|i = 12, ,L,a S| j = 12, ,L,b Tk = 12, ,L,r
donde:
Yijk = Variable respuesta medida en la ijk-ésima unidad experimental.
µ
= Constante común o media poblacional.
ρ k = Efecto del del k-ésimo bloque. α i = Efecto del del i-ésimo nivel del factor A. ( αρ )ik = Efecto de la interacción entre el i-ésimo nivel del factor A con el késimo bloque, es el error experimental asociado al factor A, tal que ( αρ )ik ~ N ( 0,σ 12 ) e independientes, es utilizado como Error(a).
β j = Es el efecto del j-ésimo nivel el factor B.
( βρ )jk = Efecto de la interacción entre j-ésimo nivel del factor B con el k-ésimo bloque, es el error experimental asociado al factor B, tal que ( βρ )jk ~ N ( 0,σ 22 ) e independientes, es utilizado como Error(b).
(α β) ij = Efecto debido a la interacción del i-ésimo nivel del factor A con el jéimo nivel del factor B. ( αβ ρ )ijk = Error experimental asociado a
Yijk tal que
( αβ ρ )ijk ~ N ( 0,σ 2 ) e inde-
pendientes, es utilizado como término de error(c) o residuo.
Análisis y Diseño de Experimentos - 389 Pruebas de hipótesis: a) Ho. α i = 0 vs Ha: α i ≠ 0, si b) Ho. β j = 0 vs Ha: β j ≠ 0, si c)
Fc > Ft ⇒ serechazala Ho : Fc > Ft ⇒ se rechaza la H o :
Ho. (αβ)ij = 0 vs Ha: (αβ)ij ≠ 0, si Fc > Ft ⇒ serechazala Ho :
Esquema del Análisis de Varianza. F. de V.
G.L.
SC.
Bloques
(r-1)
S C B loques
CMBloques = SCBloque ( r −1)
Factor A
a-1
SC A
CM A = SCA ( a − 1 )
Error (a)
(r - 1)(a - 1)
Factor B
b-1
Error (b)
(r - 1)(b - 1)
S C E r r o r ( b ) CME( b ) = SCE( b ) ( b − 1)( r − 1)
(a - 1)(b - 1)
SC
AxB
abr - 1
Fc
CMA CME( a )
S C E r ro r ( a ) CME( a ) = SCError( a ) ( a −1)( r −1) SC
B
A × B
Residuo (r - 1)(a - 1)(b - 1) S C R e s id u o TOTAL
CM.
CM B = SCB ( b − 1 )
CM B CM E ( b )
CMA×B =SCA×B (a−1)(b−1) CM A× B CM Re siduo CMResiduo = SCResiduo GLResiduo
S C T o ta l
Decisión: Si
F ( A ) > F( ar −−11 )( a −1 ),α , entonces se acepta la Ha: y se rechaza la Ho:
Si
F ( B ) > F(br−−11 )( b −1 ),α , entonces se acepta la Ha: y se rechaza la Ho:
Si
( a −1 )( b −1 ) F ( A × B ) > FGL , entonces se acepta la Ha: y se rechaza la Ho: Re siduo ,α
- 390 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
F. de V.
G.L.
SC.
Bloques
(r-1)
Y Y2 SCBloques = ∑ − ••• abr k=1 ab
Factor A
a- 1
SCA = ∑
A, bloques
ra - 1
a r Y2 Y2 SCA,Bloque = ∑∑ i•k − ••• abr i=1 k=1 b
Error (a)
(r - 1)(a - 1)
Factor B
b- 1
2 ••k
r
2 Yi••2 Y••• − abr i =1 br a
SCError( a ) = SC( A,Bloque ) −SCA − SCBloque SC B =
b
Y•2j •
j =1
ar
∑
b
B, bloques
rb - 1
Error (b)
(r - 1)(b - 1)
−
2 Y••• abr
r
Y•2jk
SCB,Bloque = ∑∑ j =1 k =1
a
b
i =1 j =1
AxB
(a - 1)(b - 1)
Residuo=Error( c )
(r - 1)(a - 1)(b - 1) abr - 1
Yij2• r
−
2 Y••• abr
SCA×B = SCComb( A,B) − SCA −SCB SCError(c) =SCTotal −SCA−SCB−SCAB Bloque −SC Ea ( ) −SC Eb () × −SC a
TOTAL
2 Y••• abr
SCError(b) = SC( B,Bloque) − SCB −SCBloque SCComb( A,B ) = ∑ ∑
A,B
a
−
b
r
SCTotal = ∑ ∑ ∑ Yijk2 − i =1 j =1 k =1
2 Y••• abr
EJEMPLO. Los datos que se presentan a continuación se refieren al Pol% de la caña de azúcar, obtenido de un experimento en franjas en el ingenio Santa Cruz, citado por Nogueira (2000), que involucró dos factores A y B; correspondientes a tipos de surcos, asociado con distanciamientos entre surcos y densidades de siembra, con 4 y 3 niveles respectivamente, siendo:
Análisis y Diseño de Experimentos - 391 A1: Surco simple y distanciamiento de 1.40 m. A2: Surco doble y distanciamiento de 1.40 m x 0.90 m. A3: Surco de base larga y distanciamiento de 1.70 m. A4: Surco de base larga y distanciamiento de 1.90 m. B1: 4 toneladas de semilla/ha. B2: 6 toneladas de semilla/ha. B3: 8 toneladas de semilla/ha. A (Surcos) B (densidad) I II III IV Yij. Yi.. Y.j.
4 17.67 17.23 17.43 17.61 69.94 Y1.. =
A1 6 17.31 17.6 17.05 16.91 68.87 209.55 Y.1. =
8 17.49 17.3 17.68 18.27 70.74 279.24
4 17.19 17.85 17.44 17.56 70.04 Y2.. =
A2 6 17.21 17.26 16.71 17.52 68.7 207.53 Y.2. =
8 18.04 16.38 17.23 17.14 68.79
4 17.39 17.54 16.61 17.51 69.05 Y3.. =
277.42
A3 6 17.39 17.67 16.77 17.61 69.44 208.56 Y.3. =
8 17.69 17.02 17.34 18.02 70.07
4 17.19 17.57 17.72 17.73 70.21 Y4.. =
A4 6 16.78 17.57 17.79 18.27 70.41 211.39
8 17.86 16.85 18.12 17.94 70.77
280.37
Y..k 209.21 207.84 207.89 212.09 837.03 837.03 837.03
SOLUCIÓN: 1. Hipótesis: H 0 : α i = 0 Vs
Ha : α i ≠ 0
H0 : β j = 0 Vs Ha : β j ≠ 0 H0 : ( αβ )ij = 0 Vs Ha : ( αβ )ij ≠ 0 2. Nivel de significación:
α = 0.05
3. Prueba estadística de contraste:
F( A ) =
CM A CM B CM A× B , F( B ) = , F( A × B ) = CM E ( a ) CM E ( b ) CM Re siduo
4. Región de aceptación y rechazo: Si
F ( A ) > F( ar −−11 )( a −1 ),α , entonces se acepta la Ha:
Si
F ( A ) ≤ F( ar −−11 )( a −1 ),α , entonces se acepta la Ho:
Si
F ( B ) > F(br−−11 )( b −1 ),α , entonces se acepta la Ha:
Si
F ( B ) ≤ F(br −−11 )( b −1 ),α , entonces se acepta la Ho:
Si
( a −1 )( b −1 ) F ( A × B ) > FGL , entonces se acepta la Ha: Re siduo ,α
Si
( a −1 )( b −1 ) F ( A × B ) ≤ FGL , entonces se acepta la Ho: Re siduo ,α
- 392 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
5. Cálculo de Análisis de Varianza. a) Grados de Libertad (GL) GLBloque = r − 1 = 4 − 1 = 3
GL A = a − 1 = 4 − 1 = 3
GLE ( a ) = ( r − 1 )( a − 1 ) = 3 × 3 = 9
GLB = b − 1 = 3 − 1 = 2
GLE ( b ) = ( r − 1 )( b − 1 ) = 3 × 2 = 6
GL A × B = ( a − 1 )( b − 1 ) = 3 × 2 = 6 GLRe siduo = ( r − 1 )( a − 1 )( b − 1 ) = 3 × 3 × 2 = 18
GLTOTAL = abr − 1 = 4 × 3 × 4 − 1 = 47
Para facilitar los cálculos, se construyen los siguientes cuadros auxiliares: k
i A1 A2 A3 A4 Y..k
I 52.47 52.44 52.47 51.83 209.21
II 52.13 51.49 52.23 51.99 207.84
III 52.16 51.38 50.72 53.63 207.89
IV 52.79 52.22 53.14 53.94 212.09
Yi.. 209.55 207.53 208.56 211.39 837.03
i A1 A2 A3 A4 Y.j.
j
j B1 B2 B3 Y..k
k
I 69.44 68.69 71.08 209.21
II III IV 70.19 69.2 70.41 70.10 68.32 70.31 67.55 70.37 71.37 207.84 207.89 212.09
B1 B2 B3 69.94 68.87 70.74 70.04 68.7 68.79 69.05 69.44 70.07 70.21 70.41 70.77 279.24 277.42 280.37
Yi.. 279.24 277.42 280.37 837.03
Yi.. 209.55 207.53 208.56 211.39 837.03
b) Suma de cuadrados (SC)
TC =
2 Y••• (837.03) 2 = = 14596.23377 abr 4 × 3× 4
4 Y2 (209.21)2 +(20784 . )2 +( 20789 . )2 +( 21209 . )2 SCbloques = ∑ ••k − TC= − TC = 0992057 . 4 ×3 k=1 ab
Yi2•• (209.55)2 + ( 20753 . )2 +L+( 21139 . )2 − TC = − TC = 0675323 . 3× 4 i=1 br 4
SCA = ∑
4 4 Y2 (52.47)2 + (52.44)2 +L+(5314 . )2 + (53.94)2 − TC = 3284665 SC(A,Bloque) = ∑∑ i•k − TC = . b 3 i=1 k=11
SCError(a) = SC( A,Bloque ) − SCA − SCBloque = 3284665 . . . . − 0675323 − 0992057 = 1617285
----------------------------------------------------------------------------
Análisis y Diseño de Experimentos - 393 2 Y2 (279.24)2 +(277.42)2 + (280.37)2 • j• . . SCB = ∑ − TC = −TC = 1459651068 −TC = 0276913 4×4 j=1 ar 3 4 Y2 (69.44)2 + (70.19)2 +L+( 7137 . )2 − TC = 1459979628 − TC = 3562507 SC(B,Bloque) = ∑∑ • jk − TC = . . 4 j=1 k=11 a
SCError(b) = SC( B,Bloque ) − SCB − SCBloque = 3562507 . . . . − 0276913 − 0992057 = 2293537
---------------------------------------------------------------------------SCA×B =
F Y − TCI − SC − SC = F 69.94 + 6887 I . +L+7077 . − TCJ − SC − SC = 0616471 . GH GH∑∑ r JK 4 K 4
3
2 ij•
2
A
2
A
B
i=1 j=1
4
3
SCComb(A×B ) = ∑∑
Yij2•
i =1 k =1
4
2
B
3
r
− TC =
(69.94)2 + (68.87)2 +L+( 7077 . )2 − TC = 1568707 . 4
4
SCTotal = ∑∑∑Yijk2 −TC = (1767 . 2 +1723 . 2 +L+1794 . 2 ) −TC =146046585 . −TC = 8424732 . i=1 j=1 k=1
SCRe siduo = SCTOTAL − SCA − SCB − SCA×B − SCBloque − SCE( a ) − SCE( b ) = 8.424732-0.675323-0.276913-0.616471-0.992057-1.617285-2.293537 = 1.953146
RESUMEN EN LA TABLA DE ANALISIS DE VARIANZA F. de V. Bloque Surcos (A) Error (a) Densidades (B) Error(b) AxB R e s idual Total
G.L. 3 3 9 2 6 6 18 47
S.C. 0.992057 0.675323 1.617285 0.276913 2.293537 0.616471 1.953146 8.424732
C.M. 0.330686 0.225108 0.179698 0.138457 0.382256 0.102745 0.108508
Fc.
Signific.
1.253
n.s.
0.362
n.s.
0.947
n.s.
3 2 6 F9,0.05 = 386 . ; F6,0.05 = 514 . ; F18,0.05 = 2.66
Conclusión: No se encontró diferencia estadística alguna contrastados a través de la Prueba de F para los efectos principales y de interacción (Surcos, Densidades y Surcos por Densidades), esto nos demuestra que hay suficiente evidencia para afirmar que los factores en estudio son independientes.
- 394 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
IMPLEMENTACIÓN CON EL PROGRAMA SAS. DATA FRANJA; OPTIONS NODATE NOCENTER NONUMBER; INPUT SURCO $ DENSI BLOQUE Y; DATALINES; A1 4 1 17.67 A1 4 2 17.23 A1 4 3 17.43 A1 4 4 17.61 ....CONTINUAR ... A4 8 1 17.86 A4 8 2 16.85 A4 8 3 18.12 A4 8 4 17.94 ; PROC PRINT; RUN; PROC ANOVA; CLASS SURCO DENSI BLOQUE; MODEL Y = BLOQUE SURCO BLOQUE*SURCO DENSI BLOQUE*DENSI SURCO*DENSI; TEST H = SURCO E = BLOQUE*SURCO; TEST H = DENSI E = BLOQUE*DENSI; RUN;
SALIDA DE RESULTADOS The SAS System The ANOVA Procedure Class Level Information Class Levels Values SURCO 4 A1 A2 A3 A4 DENSI 3 4 6 8 BLOQUE 4 1 2 3 4 Number of observations 48 Dependent Variable: Y Source Model BLOQUE SURCO SURCO*BLOQUE DENSI DENSI*BLOQUE SURCO*DENSI Error Corrected Total R-Square Coeff Var 0.768165 1.888997
Sum of DF Squares Mean Square 29 6.47158542 0.22315812 3 0.99205625 0.33068542 3 0.67532292 0.22510764 9 1.61728542 0.17969838 2 0.27691250 0.13845625 6 2.29353750 0.38225625 6 0.61647083 0.10274514 18 1.95314583 0.10850810 47 8.42473125 Root MSE Y Mean 0.329406 17.43813
F Value 2.06 3.05 1.25 1.66 0.36 3.52 0.95
Pr > F 0.0563 0.0554 0.3473 0.1731 0.7104 0.0175 0.4869
Tests of Hypotheses Using the Anova MS for SURCO*BLOQUE as an Error Term Source DF Anova SS Mean Square F Value Pr > F SURCO 3 0.67532292 0.22510764 1.25 0.3473 Tests of Hypotheses Using the Anova MS for DENSI*BLOQUE as an Error Term Source DF Anova SS Mean Square F Value Pr > F DENSI 2 0.27691250 0.13845625 0.36 0.7104
Análisis y Diseño de Experimentos - 395 EJERCICIO: 1. Se desea analizar el largo de vida (Y) de componentes electrónicos al variar la temperatura (T) y el tiempo de horneado (H). Se analizan cuatro niveles de temperatura y tres niveles de tiempo de horneado. El experimentador decide realizar tres replicas. El siguiente cuadro muestra las respuestas obtenidas para cada uno de los arreglos. Tiempo Réplicas (minutos) I 5 10 15 II 5 10 15 III 5 10 15
580 217 233 175 188 201 195 162 170 213
Temperatura (°C) 600 620 158 229 138 186 152 155 126 160 130 170 147 161 122 167 185 181 180 182
640 223 227 156 201 181 172 182 201 199
a) Fijar el modelo lineal aditivo y explicar sus componentes, b) Plantear la hipótesis, c) calcular el ANOVA e interpretar los resultados en base al tenor del problema. 2. Los siguientes datos se refieren a la producción de trigo obtenido en un experimento, en el cual se utilizó un diseño bloques al azar con arreglo en bloque dividido, con el objetivo de estudiar el efecto de dos sistemas de riego (R1:Inundación y R2:Aspersión) y tres dosis de nitrógeno (N0, N1, N2), distribuidos en cuatro bloques.
- 396 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Dosis de Sistemas de Nitrógeno Riego 0 R1 0 R2 1 R1 1 R2 2 R1 2 R2
Bloques I 55 71 62 77 69 78
Analice, interprete los resultados.
II 63 77 66 79 77 81
III 63 77 70 78 79 80
IV 65 75 66 76 76 79
Análisis y Diseño de Experimentos - 397 -
10 ANÁLISIS DE COVARIANZA (ANCOVA) Es una técnica que combina los aspectos del análisis de variancia y de regresión, para manejar casos particulares, en los cuales se tiene una o más variables externas al experimento que no están afectas a los tratamientos e influyen en el valor observado. Muy útil en investigación, permite dar una mejor explicación del comportamietno de la variable de respuesta y a la vez, permite reducir el error experimental. Usos del análisis de covariancia. Se puede aplicar a cualquier diseño experimental. Mediante el ANVA se descompone la variación tota de la variable de respuesta en factores controlables y no controlables, en el factor no controlable se considera el error experimental. En el error experimental están todos aquellos factores y variables que no puedieron ser medidos o simplemente no semidieron. Sin embargo, si una variable es factible de medir en cada unidad experimental, esta debe ser considerada en el modelo, a menos que se pruebe estadísticamente que no tiene ningún efecto. El análisis de covariancia (ANCOVA) permiten el estudio de estas variables externas (concomitantes), si deben o no ser consideradas en el modelo y en que forma se las controla. Supongamos que en un experimento la variable de respuesta "Y" esta relacionada linealmente con la variable independiente "X", además el experimentador no
- 398 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
puede controlar la variable "X" pero puede medirla al mismo tiempo que a "Y", esto es a "X" se le conoce como covariable o variable concomitante, con el ANCOVA se busca adaptar el valor observado de la respuesta para tomar en cuenta el efecto de la variable concomitante. Para realizar el ANCOVA. a) Primeramente se realiza el análisis de regresión (prueba sobre el efecto de regresión), si este análisis resulta ser significativo entonces la variable "X" influye sobre la variable "Y" (concomitante), entonces se procede a realizar el ANCOVA. b) En caso de que la prueba sobre el modelo de regresión hubiera resultado ser no significativo, esto nos indica que la variable "X" no influye en la variable "Y", por lo tanto el análisis estadístico se realiza en la variable "Y" sin considerar la variable "X". Dentro de los posibles usos del ANCOVA están . EL ANCOVA se puede aplicar a cualquier diseño experimental. Mediante el ANVA se descompone la variación total de la variable "Y" en factores controlables y no controlables, en el factor no controlable se considera el error experimental. En el error experimental están todos aquellos factores y variables que no pudieron ser medidos o simplemente no se midieron. Sin embargo, si una variable es factible de medir en cada unidad experimental, esta debe ser considerada en el modelo, a menos que se pruebe estadísticamente que no tiene ningún efecto. El ANCOVA permite el estudio de estas variables externas (concomitantes), si deben o no ser consideradas en el modelo y en que forma se las controla. Dentro de los posibles usos del ANCOVA están: a)
Control de variables externas que implica una disminución del error que se traduce en una mayor precisión del análisis. b) Ajuste de las medias de tratamientos de la variable dependiente (Y) por las diferentes variables independientes (concomitantes). c) Ayudar en la interpretación de los datos, específicamente en la naturaleza del efecto de los tratamientos. SUPOSICIONES DEL ANCOVA. Los supuestos requeridos para que sea válido el ANCOVA son: - Independencia de los errores. - Normalidad en las variables aleatorias ε ~ N (0, σ ) - Que exista homogeneidad entre las varianzas. - Aditividad de los efectos involucrados en el modelo.
Análisis y Diseño de Experimentos - 399 - La variable X es fija, y medida sin error. - La variable X no esta influenciada por los tratamientos. - La variable Y esta relacionada con X en forma lineal. Ejemplos: El peso inicial (X) de animales relaciona el peso final (Y), cuando estos animales están sujetos a diferentes raciones. Se estudia el efecto de las raciones a través de los pesos observados. El número de plantas (X) por parcela, se estudia el rendiemiento total (Y) de la parcela. La incidencia de plagas (X) en el rendimiento de algunas variedades, el estudio es comparar las variedades. Porcentaje de germinación (X), esta medido en el rendimiento (Y). El rendimiento de las parcelas en una producción anterior (X), el estudio del rendimiento de las mismos parcelas al finalizar el experimento (Y).
La edad edad de los animales (X), en la determinación del peso corporal (Y). En cada caso se entiende que la variable X tiene un efecto en la variable Y, sin embargo, esta dependencia deberá ser probada estadísticamente mediante el ANALISIS DE REGRESIÓN. En algunos casos puede existir más de una variable externa, caso multivarial, ejemplo X1 X2, X3. Este caso puede resolverse matricialmente y con ayuda del computador porque los procesos manuales son tediosos. Modelos estadísticos para el análisis de covarianza. ANCOVA en el Diseño completamente al azar: Y ij = µ + τ
i
+ β(X
ij
− X .. ) + ε ij ;
i = 1, 2 , L , t ; j = 1 , 2 , L , ri
ANCOVA en el Diseño Bloque Completamente al Azar.
Yij = µ + β j + τ i + β ( X ij − X .. ) + ε ij ;
i = 1,2 , L , t ; j = 1,2 , L , r
- 400 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
ANCOVA en el Diseño Cuadrado Latino.
Yij ( k ) = µ + Fi + C j + γ k + β ( X ij ( k ) − X ) + ε ij ( k ) ;
i = j = k = 1,
Experimento factorial con dos factores con un modelo de Covarianza lineal simple. Diseño completamente al azar.
Yijk = µ + α i + γ j + (αγ ) ij + β ( X ijk − X ) + ε ijk ;
i = 1,2,L , a; j = 1,2,L , b k = 1,2,L , r
Diseño bloque completamente al azar.
Yijk = µ + ρ j + α i + γ k + (αγ ) ik + β ( X ijk − X ) + ε ijk ;
i = 1,2,L , a; j = 1,2,L , b k = 1,2,L , r
En todos los modelos
β es un parámetro que representa el coeficiente de
regresión. Se supone que β es distinto de cero, lo cual debe probarse, caso contrario en el modelo se elimina el término afectado por
β
.
Las hipótesis a formularse en ANCOVA son: Para la regresión: Para tratamientos.
H o: β = 0
v s.
H a: β ≠ 0
Ho:α i = 0 vs. Ha: α i ≠ 0, ∀ i =1,2 ,L,t
ANCOVA BAJO EL DISEÑO COMPLETAMENTE AL AZAR.
Para realizar ambas pruebas la hipótesi se realizará: a) Para la regresión Ho: β = 0 vs. Ha: β ≠ 0 y b) Para tratamientos: Ho:τ i = 0 vs. Ha: τ i ≠ 0 , se deben calcular las sumas de cuadrados y sumas de productos de las variables X e Y.
Análisis y Diseño de Experimentos - 401 -
ANALISIS DE REGRESION: Hipótesis: Ho: β = 0 vs. Ha: β ≠ 0 F. de V.
G.L.
Suma de Cuadrados
r-1
bE XY = SSRm = b$ ' X ' Y − NY 2
Error resid. N - r
EYY − bEXY = SSE = Y' Y − b$' X ' Y
Total
SSTm = Y ' Y − NY 2
Regresión
N-1
Cuadrados Medios SSRm = MSRm r −1 SSE = MSE r−N
Fobs. M SRm M SE
Para tratamientos el modelo estadístico lineal es:
Yij = µ + τ i + β ( X ij − X .. ) + ε ij ;
i = 1,2,L, t ; j = 1,2,L , r
donde: Yij = Es la j-ésima observación de la variable de respuesta tomada bajo el i-ésimo tratamiento o nivel del facto único.
µ = La media general o constante común.
τ i = Es el verdadero efecto del i-ésimo tratamiento. β = Es un parámetro que representa el coeficiente de regresión lineal que indica la dependencia entre Yij y Xij .
Xij = Es el valor de la covarianza o variable concomitante correspondiente a Yij, es decir es el ij-ésimo ensayo.
X = Es el promedio de las Xij . ε ij = Es un componente de error aleatorio ε ij ~ NI (0, σ 2e )
- 402 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Los cálculos para un ANCOVA basado en el modelo de la ecuación se resumen a continuación. ANALISIS DE COVARIANZA GENERAL PARA DISEÑO COMPLETO AL AZAR.
Suma de cuadrados y Productos cruzados F. de V.
G.L.
∑x
∑xy
Tratamientos
t-1
TXX
TXY
Error experimental
∑n − t EXX
Tratam.+ Error
∑n − 1
2
i
i
EXY
S XX = TXX + E XX
∑y
2
Desviaciones respecto a la regresión. ∑y
2
−
(∑ xy) 2
∑x
G.L.
2
C.M.
TYY EYY
SE = EYY −
S XY = TXY + E XY
Diferencias para probar entre
2 E XY E XX
S T + E = S YY − ST+E − SE = TYY −
∑n −t −1 i
2 S XY S XX 2 XY
SE =
∑n − 2 i
2 XY
S E + SXX EXX
t-1
medias ajustadas de tratamientos
SUMA DE CUADRADOS Y PRODUCTOS: PARA TRATAMIENTOS: t
∑
T XX =
i =1
t
TXY = ∑ i =1
TYY =
X i2. X ..2 − ni ∑ n i (suma de cuadrados de tratamientos para X).
Xi.Yi. ( X.. )(Y.. ) − ni ∑ni (suma de productos de tratamientos para X e Y).
t
∑
i =1
Yi .2 Y2 − .. (Suma de cuadrados de tratamientos para Y). ni ∑ ni
ERROR (Por diferencia: Error = Total - Tratamientos).
∑n
SE − t −1
i
Análisis y Diseño de Experimentos - 403 ni
t
t
E XX = ∑ ∑ X ij2 − ∑ i =1 j =1
i =1
ni
t
t
E XY = ∑∑ Xij Yij − ∑ i =1 j =1
E YY =
t
i =1
ni
Xi.Yi. ni (Suma de cuadrados del error experimental para X e Y)
t
∑ ∑ Yij2 − ∑ i =1 j = 1
X i2. ni (Suma de cuadrados del error experimental para X)
i =1
Yi .2 n i (Suma de cuadrados del error experimental para Y).
TRATAMIENTO + ERROR: La suma de estas fuentes de variación es:
S XX = TXX + E XX S XY = TXY + E XY SYY = TYY + EYY
∑ xy = ∑ X 2
∑ x =∑ X 2
Y −
ij ij
2 ij
−
(∑ X ij ) 2
∑n
i
∑ y =∑ Y 2
2 ij
−
(∑ Yij ) 2
∑n
d∑ X id∑ Y i ij
∑n
ij
i
OTRA FORMA DE CALCULAR: PARA LA VARIABLE X:
S XX = T XX =
E
XX
∑∑ ∑
X ..2 X − ∑ n i (suma de cuadrados total de X). 2 ij
X i2. − ni
X ..2 ∑ n i (Suma de cuadrados de tratamientos de X).
= S X X − T X X (Suma de cuadrados del error X).
PARA LA VARIABLE Y:
S YY =
∑∑Y
2 ij
−
Y..2 ∑ n i (suma de cuadrados total de Y).
i
- 404 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
TY Y =
∑
Y i .2 − ni
Y ..2 ∑ ni
(Suma de cuadrados de tratamientos de Y).
E YY = S YY − TYY
(Suma de cuadrados del error X).
PRODUCTO CRUZADO DE XY:
S XY =
∑∑ X
T XY =
∑
ij
Yij −
( X .. )(Y.. ) ∑ ni ( suma de producto total XY).
X i . Yi . ( X .. )( Y.. ) − ni ∑ ni
(Suma de producto para tratamiento XY).
E XY = S XY − T XY
(Suma de Producto del error XY).
Del cuadro se determina el valor de F calculado (Fc) para la prueba estadística: Ho: β = 0 F=
2 2 E XY E XY E XX E2 E = = XY 2 XX con v1 =1 S ( E XX ) S E ∑ni − t − 1 SE
d
2 E
i
y
v2 = ∑ni − t −1 grados de
libertad. PARA TRATAMIENTOS:
F=
bS
T+E
SE
g
− SE (t − 1)
d∑n − t −1i i
=
bS
H o: τ i = 0
T +E
g
− SE (t − 1) S
2 E
vs .
H a: τ i ≠ 0
con v1 = t −1 y v2 = ∑ni − t −1 grados
de libertad. A parte de realizar la prueba F es frecuente e importante presentar una tabla de medias de tratamientos ajustadas, como una ayuda para la interpretación de los resultados experimentales. Las medias de tratamientos ajustadas se pueden encontrar por medio de la siguiente fórmula:
Análisis y Diseño de Experimentos - 405 -
Yi .ajust = Yi − β ( X i − X );
i = 1,2 ,L , t .
Donde β es el coeficiente de regresión calculado a partir del error experimental de cuadrado y productos, esto es:
β =
E XY E XX
La varianza estimada de una media de tratamientos ajustada esta dada por:
c
LM 1 c X − X h OP MNn + E PQ 2
h
V$ ajus.Yi = S E2
i
i
XX
El error estándar de una media de tratamientos ajustada por:
c
h
S Ajust .Yi = V$ ajus. Yi = S E
LM 1 c X − X h MN n + E
2
i
i
XX
OP PQ
La varianza estimada de la diferencia entre dos medias de tratamiento ajustadas, esta dada por:
d
i
V$ ajus. Yi − ajust . Y j = S E2
LM 1 MN n
i
d
Xi − X 1 + + nj E XX
i OP PQ 2
j
EJEMPLO. En un experimento realizados en cerdos de las razas: Yorkshire, Hampshire y Criolla se evaluó el peso final (Y) de estos animales enla Estación Experimental Illpa - INIAA-Puno, para este experimento se pesó a los animales al inicio del experimento, registrándose a este peso inicial de los cerdos (X), estos animales fueron alimentados con residuos de la zona. La información se presenta a continuación.
- 406 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
1 2 3 4 Xi. Yi.
YORKSHIRE X Y 7.4 18.7 10.6 24.4 13.5 30.1 12.0 25.9 43.5 99.1
HAMPSHIRE X Y 8.4 20.2 10.8 22.5 12.4 22.9 10.3 20.1 41.9 85.7
CRIOLLO X Y 12.8 22.0 10.6 20.4 10.8 20.7 11.4 21.0 45.6 84.1
X.. Y.. 131 268.9
PRIMER PASO ES RESOLVER MEDIANTE LA REGRESION. El procedimiento se realiza agrupando en dos columnas X e Y. Los resultados son las siguientes:
∑X
2 i
= 1463.22,
∑Y
2
i
∑XY
= 6134.23,
X'X =
LM 12 N131
( X' X)−1 =
146322 . 1 12(146322 . ) −131*131 −131
β$ = ( X' X)−1 X'Y =
O, 1463.22 PQ
i i
131
LM N
= 2978.64,
∑X
LM 268.9 OP N2978.64 Q . −131O 1 L146322 ,= M P 12 Q 39764 . N −131
i
= 131,
∑
X 'Y =
LM N
OP LM QN
OP Q
LM N
OP LM Q N
OP Q
−131 12
OP Q
. . . . 8193385977 −131 2689 1 146322 1 3258018 = = . . . 51778 1302132585 −131 12 297864 . . 39764 39764
⇒ SSRm = β$ ' X 'Y − NY 2 = 8193385977 1302132585 . .
LM 2689. OP −12FG 2689. IJ H 12 K . Q N297864
2
= 561848405 .
SSE = Y ' Y − β$ ' X ' Y = 6134.23 − 6081785674 . = 52.444326
. = 108.6291669 SSTm = Y' Y − NY 2 = 6134.23 − 6025600833 TABLA DE ANALISIS DE VARIANZA. F. De V. G.L. Debido a regresión 1 Error 10 Total 11
R2 =
S.C. 56.184841 52.444326 108.629167
C.M. Fobs. 56.184841 10.71** 5.244433
SSRm 561848405 . x100 = 5172 = . , SSTm 108.6291669
r = 0.72
0.05 0.01 4.96 10.04
Análisis y Diseño de Experimentos - 407 CONCLUSION: Como Fc = 10.71 > Ft = 10.04, entonces se rechaza la hipótesis nula, esto implica que β ≠ 0 , es decir que la variable Y esta influenciada por la variable X, por consiguiente se procede a efectuar el análisis de covarianza. Esta afirmación podemos corroborar con el coeficiente de determinación R 2 = 5172 . %, es decir el 51.72% de la variación de peso final depende de la variación del peso inicial, y en un 48.28% debe a otros factores como por ejemplo medio ambiente, condiciones de manejo y otros. Como se comprobó que la Fc es significativo, entonces se procede a efectuar el ANCOVA. PARA TRATAMIENTOS: t
∑
TXX =
i =1
t
TXY = ∑ i =1
X i2. X ..2 43.52 + 41.9 2 + 45.6 2 131 − = − = 1.7216667 ni 4 12 ∑ ni
Xi.Yi. ( X.. )(Y.. ) (435 . )(991 . ) + (419 . )(857 . ) + (456 . )(841 . ) (131)(2689 .) − = − = −13316666 . ni 4 12 ∑ni
Yi .2 Y2 99.12 + 85.7 2 + 84.12 (268.9) 2 − .. = − = 33.9266667 4 12 i =1 ni ∑ ni t
TYY = ∑
ERROR (Por diferencia: Error = Total - Tratamientos). ni
t
t
EXX = ∑∑Xij2 − ∑ i =1 j =1
t
i =1
ni
t
EXY = ∑∑ Xij Yij − ∑ i =1 j =1
IJ K
h FGH
c
Xi2. 435 . 2 + 419 . 2 + 456 .2 = 74 = 31415 . 2 + 106 . 2 +135 . 2 +L+108 . 2 +114 .2 − . ni 4
i =1
Xi.Yi. = (74 . )(187 . ) + (106 . )(244 . )+L+(108 . )(207 . ) + (114 . )(210 .) ni
FG 435. *991. + 419. *857. +L+456. *841. IJ = 4448 H K . 4 c991. +857. +841. h = 747025 = c187 . + 244 . +L+207 . + 210 . h− . −
t ni t Y2 EYY = ∑∑Yij2 − ∑ i. i=1 j=1 i=1 ni
2
2
2
2
2
2
4
2
- 408 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
TRATAMIENTO + ERROR: La suma de estas fuentes de variación es:
. + 31415 . = 331366667 . S XX = TXX + E XX = 17216667 . + 44.48 = 431483334 . S XY = TXY + E XY = −13316666 SYY = TYY + E YY = 33.926667 + 74.7025 = 108.629167 TABLA DE ANALISIS DE COVARIANZA (ANCOVA). Suma de Cuadrados y Productos Correg. Desviación respecto a Regres.
∑x
2
∑ xy
∑y
2
F. De V. G.L. Tratamientos 2 1.7216667 -1.3316666 33.9266700 Error exptal. 9 31.4150000 44.4800000 74.7025000 Trat. + Error 11 33.1366667 43.1483334 108.6291700 Diferencias para probar entre medias ajustadas de tratamientos
∑y
2
−
d ∑ xy i ∑
2
x2
G.L.
11.7239733 8 52.4443132 10 40.7203424 2
C.M. 1.465497 20.36017
2 E XY (44.48) 2 S E = EYY − = 74.7025 − = 1172397382 . E XX 31415 .
S E2 = 1.465496727 , S T + E
= SYY −
2 S XY = 52.44431618 , S − S = 4072034236 . T +E E S XX
F-calculado para TRATAMIENTOS:
F=
(ST+E − SE ) (t −1) 2036017118 . . **, = = 1389 1465496727 . SE2
. con F82(0.01) = 8649
F-calculado para REGRESION: F=
2 EXY E2 E (4448 . )2 = = XY 2 XX = 4297418413 . **, S (EXX ) 1465496727 SE . *31415 . 2 E
con F81(0.01) = 11259 .
Para resumir los datos analizados en un tabla necesitamos efectuar los siguientes cálculos.
SCTOTAL sin corregir = ∑ Yi 2 = SST = 6134.23
SCde la Media = SSM =
Y..2 (268.9) 2 = = 6025.600833 12 ∑ ni
Análisis y Diseño de Experimentos - 409 -
SCError exp tal. = SSE = EYY −
2 E XY 44.482 = 74.7025 − = 1172397382 . E XX 31415 .
SCREGRESION = SSRm = SST − SSM − SSE = SCTotal − SCMedia − SCError = 6134.23 − 6025600833 . − 1172397383 . = 96905193 . SCTrat ./ β = ST + E − S E = 52.44431618 − 1172397382 = 40.72034236 . − 4072034236 = 5618485081 SCDebidoa β = SCregresión − SCTrat./ β = 9690519317 . . . TABLA DE ANALISIS DE VARIANZA. F. de
V.
G.L.
S.C.
C.M.
∑n
Media
1
SC(µ) = Y..2
Regresión.
t
SC (τ 1 , τ 2 ,...., τ t −1 , β ) / µ )
Debido a
β
Error exptal.
SC ( β µ )
1
Tratamiento/ β
t-1
∑n
Total
i
SC(τ1,τ2 ,....,τt−1 µ,β)
c
2 EYY − EXY EXX
−t −1
∑n
i
∑Y
i
SC Trat β ( t − 1)
h
E YY ( ∑ ni − t − 1)
2
Numéricamente tenemos en la siguiente Tabla: F. De V. Media REGRESION Debido a ß Tratamientos/ß Error Exptal. Total
G.L. 1 3 1 2 8 12
S.C. 6025.6008330 96.9051932 56.1848508 40.7203424 11.7239738 6134.2300000
C.M.
Fc.
20.3601712 13.89** 1.4654967
- 410 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Ajuste de los promedios de los tratamientos mediante el uso de fórmula:
c
Yi .ajust . = Yi . − β X i . − X ..
h
donde:
Yi. Ajust = Promedio ajustado de cada tratamiento. Yi . = Promedio de cda tratamiento sin ajustar.
β
= Coeficiente de regresión.
X i. = Promedio del número de observaciones en cada tratamiento (o variable X). X .. = Promedio general del número de observaciones por unidad experimental. El ajuste siempre es ventajoso, aún cuando la prueba de F, para la variable X no sea significativa: β = E XY E XX = 44.48 31.415 = 1.415884132
c
h
Y$i = Yi . − 1.415884132 X i . − X .. ,
Tratamientos
X i.
Xi. − X..
X .. =
c
β X
i.
− X
131 = 10.91666667 12
..
h
Yi .
Yi . Ajustado
Yorkshire 43.5/4 = 10.875 -0.04167 -0.05899517 99.1/4 = 24.775 24.833995 Hampshire 41.9/4 = 10.475 -0.44167 -0.62534882 85.7/4 = 21.425 22.05034 Criollo 45.6/4 = 11.40 0.48333 0.684343997 84.1/4 = 21.025 20.340656
c
h
La suma de las desviaciones debe ser cero β X i. − X .. = 0 La suma de promedios observados experimentalmente también debe ser igual a la suma de los promedios ajustados.
C.V . =
S E2 Y..
x100 =
1465496727 . x100 = 5.40% 268.9 12
Análisis y Diseño de Experimentos - 411 La varianza estimada de una media de tratamientos ajustada está dada por:
c
h
V$ ajus.Yi = S
Tratamientos
LM 1 c X − X h OP MN n + E PQ 2
2 E
i.
..
i
X i.
XX
c
Xi. − X..
β X
i.
− X
..
h
Yorkshire 10.875 -0.04167 -0.05899517 Hampshire 10.475 -0.44167 -0.62534882 Criollo 11.40 0.48333 0.684343997
Yi .
Yi . Ajustado
24.775 24.833995 0.605355408 21.425 22.05034 0.612759406 21.025 20.340656 0.614224749
El error estándar de una media de tratamientos ajustada por:
S Ajust .Yi
c
c
h
h
LM 1 c X − X h OP MN n + E PQ 2
= V$ ajus.Yi = S E
i.
i
..
XX
LM b MN
g OP = 036645517 . PQ
. − 1091666667 . 1 10875 V$ ajus.Y1 = 1465496727 . + . 4 31415
S Ajust .Y1 = 0.36645517 = 0.605355408
c
h
LM b MN
2
g OP = 037547409 . PQ
. − 1091666667 . 1 10475 V$ ajus.Y2 = 1465496727 . + . 4 31415
S Ajust .Y2 = 0.37547409 = 0.612759406
c
h
S Ajustado .Yi
LM b MN
g OP = 0377272043 . PQ
. −1091666667 . 1 1040 V$ ajus.Y3 = 1465496727 . + . 4 31415
S Ajust .Y3 = 0.377272043 = 0.614224749
2
2
- 412 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
La varianza estimada de la diferencia entre dos medias de tratamiento ajustadas está dada por:
LM MN
d
Xi − X j 1 1 + + V$ ajus.Yi − ajust.Yj = S E2 ni n j E XX
d
i
i OP PQ 2
PROGRAMA EN SAS. DATA CERDOS; OPTIONS NODATE NOCENTER NONUMBER; INPUT RAZA $ X Y; CARDS; Y 7.4 18.7 Y 10.6 24.4 Y 13.5 30.1 Y 12.0 25.9 H 8.4 20.2 H 10.8 22.5 H 12.4 22.9 H 10.3 20.1 C 12.8 22.0 C 10.6 20.4 C 10.8 20.7 C 11.4 21.0 ; PROC PRINT; RUN; PROC REG; MODEL Y = X /XPX I COVB; RUN; PROC GLM; CLASS RAZA; MODEL Y = RAZA X /SOLUTION SS3; LSMEANS RAZA /STDERR PDIFF; RUN; /* PRESIONE F3 PARA EJECUTAR EL PROGRAMA */
Análisis y Diseño de Experimentos - 413 EJEMPLO. Aplicación. En un experimento en cerdos se evalúo el peso (Y) de estos animales cuando se aplicaron 4 tipos de alimento balanceado “2”, “3”, “4”, “5” y un testigo identificado como “1”, Se peso a los animales al iniciar el experimento, registrándose a este peso inicial como la variable X. 1 1 2 3 Xi.
Yi.
2
3
4
5
X 15 18 21
Y 55 60 63
X 16 22 26
Y 65 62 69
X 14 23 27
Y 80 95 100
X 13 15 12
Y 80 95 79
X 16 19 15
Y 83 94 98
54
178
64
196
64
275
40
254
50
275 272 1178
Y..
X..
Cuadro de ANVA para la regresión Fuentes
g.l.
S.C.
C.M.
Fc
Regresión Residual
1 9
248.64 306.69
248.64 34.08
7.30
Fc>Ft, se rechaza la Ho: b=0. Se afirma estadísticamente que el peso inicial tiene una influencia en el peso final del animal. Prueba de hipótesis : Ho : ti=0 vs ti¹0 Según el resultado de la regresión, el análisis continua con el ANCOVA.
Fuentes
g.l.
∑x
Alimentos Error
4 10
137.1 170.6
2
Al. + error 14 307.7 Alimento ajustado CV=7.43% F =3.63 0.05(4,9)
∑ xy
∑y
-139.0 206.0
2776.4 555.3
66.9
3331.7 3010.45
2
∑y
2
− ( ∑ xy ) 2
∑x
306.69
2
g.l.
CM Fc
9
34.0
4
752.6 22
3317.14
- 414 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Comparaciones de los promedios Peso (X) Peso (Y) Peso Ajustado Inicial Final Final 1 18.00 59.33 59.33-1.207(18.00-18.13)=59.49 2 21.33 65.33 61.47 3 21.33 91.67 87.81 4 13.33 84.67 90.46 5 16.67 91.67 93.43 Comparación Dif
s
0.05
0.01
Signif
11.99 11.99 10.79 13.48 11.76 11.99
16.22 16.22 15.50 19.37 16.90 16.22
ns ** ** ns ns ns
d
1 vs 2 1 vs 3 2 vs 3 3 vs 4 3 vs 5 4 vs 5
1.98 28.32 26.34 2.65 5.62 2.97
4.99 4.99 4.77 5.96 5.20 4.99
El alimento tstigo y el alimento balanceado “2” responden en forma semejante, los alimentos balanceados “3”, “4” y “5” no muestran diferencias, sin embargo, este grupo difiere muy significativamente del grupo testigo y alimento “2”. PROGRAMA EN SAS. DATA ANCOVAM; OPTIONS NODATE NOCENTER NONUMBER; TITLE ‘Alimento para cerdos EN UN D.B.C.A.’; DO ALIMENTO = 1 TO 5; INPUT INICIAL FINAL @; OUTPUT; END; CARDS; 15 55 16 65 14 80 13 80 16 83 18 60 22 62 23 95 15 95 19 94 21 63 26 69 27 100 12 79 15 98 ; PROC GLM; CLASS ALIMENTO; MODEL FINAL=ALIMENTO INICIAL/SOLUTION SS3; LSMEANS ALIMENTO/STDERR PDIFF; RUN;
Análisis y Diseño de Experimentos - 415 ANALISIS DE COVARIANZA EN UN ARREGLO FACTORIAL En esta parte vamos a describir y aplicar el análisis de covarianza en un arreglo factorial con dos factores, en un diseño completamente al azar. Consideramos ahora la combinación de efectos para definir tratamientos o estímulos, tomando en cuenta que la respuesta de los mismos puede ser afectada por una variable, la cual se pretende controlar a través de covarianza. El modelo estadístico para este análisis es el siguiente:
Yijk = µ + α i + β j + ( αβ )ij + β( X i .. − X ... ) + ε ijk i = 1,2,3,.., a j = 1,2,3,.., b k = 1,2,3,.., r
β = Coeficiente de regresión
EJEMPLO: En la Granja de Animales Menores de la Facultad de Medicina Veterinaria y Zootecnia de la UNA - Puno, se ensayó dos razas de conejos: California y Nueva Zelandia, para este experimento se ha suministrado tres raciones de tratamientos: T1 = Forraje hidropónico, T2 = 25% de concentrado y 75% de forraje hidropónico y T3 = Puro concentrado, el objetivo del presente estudio fue evaluar el incremento de peso vivo durante las 8 semanas. La información se presenta a continuación:
T1 X 1 749.5 2 614.7 3 477.7 4 726.5 5 767.4 Total 3335.8 XY 5449586
Y 1996.5 1503.7 1096.4 1807.9 1552.9 7957.4
Raza California T2 T3 X Y X 423.7 1411.7 757.7 550.8 1558.5 391.1 712.6 1834.7 622.5 685.8 1882.1 738.0 691.5 1923.9 627.3 3064.4 8610.9 3136.6 5385087 6042370.6
Y 2197.3 1410.9 1734.4 2132.4 1868.8 9343.8
T1 X 708.0 574.1 692.1 738.8 618.9 3331.9
Y 1490.0 1030.0 1790.5 2070.5 1570.0 7951.0
Raza Nueva Zelandia T2 T3 X Y X 675.5 1418.5 786.4 496.9 1799.1 807.3 609.3 1685.0 698.6 747.4 1498.7 749.7 778.7 1977.7 749.5 3307.8 8379.0 3791.5 5539003 7203000 X... = 19968.0 Y... = 51746.6
Y 1900. 1820. 1893. 2200. 1691. 9504.
- 416 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
1) Suma de cuadrados para «X».
a) TC = b)
X 2 ... ( 19968 )2 = = 13290700.8 abr 2x3x5
2 SCTotal = ∑ Xijk − TC
2) Suma de cuadrados para «Y»
a) TC =
b) SC Total =
= 749.52 + 614.7 2 +L+749.7 2 + 749.52 − TC
2
br
3x5
∑Y
2 ijk
2 2 2 c) SC = ∑Yi.. − TC = 25912.1 + 25834.5 − TC A
br
3x5
=26665.05 d) SC = B =
∑X
2 . j.
ar
=200.73
− TC
=
= 15471.774
e) SC Int(AB) = SC comb(AB) − SC A − SC B
=
∑X r
2 ij.
∑Y
2 . j.
d) SC B =
.2 6667.7 2 + 6372.2 2 + 69281 − TC 2x5
SCcomb(AB) =
− TC
. 2 − TC = 1996.52 + 1503.7 2 +L+2200.02 + 16912 = 2461716.71
= 345884.08
.2 c) SC = ∑ Xi.. − TC = 9536.82 + 104312 − TC A
Y 2 ... ( 51746.6 )2 = = 89257020.39 abr 30
ar
− TC
15908.4 2 + 16989 .9 2 + 18848.32 − TC 2x5
= 442210.16 e) SCInt(AB) = SCcomb(AB) − SCA −SCB SCcomb(AB) =
− TC
. 2 + 37915 .2 3335.82 + 3064.42 +L+33078 − TC 5
=
= 64287.052
∑Y
2 ij.
r
− TC
7957.42 + 8610.92 +L+83792 + 9504.52 − TC 5
= 450174.47
SC int(AB) = 64287.05 - 26665.05-15471.774 SCint(AB) = 450174.47 - 200.73 -442210.16 = 22150.23
f) SC Error = SCTotal − SC Comb(AB) = 345884.08 - 64287.052 = 281597.028
= 7763.58
f)
SCError = SCTotal − SCComb(AB) = 2461716.71 - 450174.47 = 2011542.25
Análisis y Diseño de Experimentos - 417 3) Suma de Cuadrados para calcular:
a) TC =
(Producto cruzado)
(X...)(Y...) (19968.0)(51746.6) = = 34442536.96 abr 30
∑ xy
b)
∑ xy
Total
∑X
=
ijk
Yijk − TC
= (749.5)(1996.5) + ........ + (749.5)(1691.2) - TC = 563316.89
∑ xy
c)
A
∑X
= =
∑ xy
d)
B
=
e)
=
i..
Yi..
br
− TC =
(X 1.. )(Y1.. ) + (X 2.. )(Y2.. ) − TC br
(9536.8)(25912.1) + (10431.2)(25834.5) − TC = -2313.515 15
∑X Y
.j. .j.
ar
− TC =
(X.1. )(Y.1. ) +(X.2. )(Y.2. ) +(X.3. )(Y.3. ) − TC ar
(6667.7)(15908.4) +(6372.2)(16989.9) +(6928.1)(18848.3) − TC= 49301.709 2x5
SC Int(AB) = SC comb(AB) − SC A − SC B SC comb(AB) = =
∑X
ij.
Yij.
r
− TC
(3335.8)(7957.4) +(3064.4)(8610.9) + L+(3307.8)(8379.0) +(3791.5)(9504.5) −TC 5
SC int(AB) = 54184.002 + 2313.515 - 49301.709 = 7195.808 f)
SC Error = SC Total − SC Comb(AB) = 563316.89 - 54184.002 = 509132.888
- 418 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
La salida con el Sistema de Análisis Estadístico S.A.S. se presenta a continuación: Primeramente se realizará el Análisis de Regresión para detectar, si la variable X influye sobre los tratamientos en estudio.
Model: MODEL1 Dependent Variable: Y Sumof Source DF Squares Model 1 917434.29926 Error 28 1544282.4154 C Total 29 2461716.7147 Root MSE 234.84664 Dep Mean 1724.88667 C.V. 13.61519 Parameter Estimates Variable INTERCEP X
R-square Adj R-sq
Mean Square 917434.29926 55152.94341
F Value 16.634
0.3727 0.3503
Parameter Standard TforH0: DF Estimate Error Parameter=0 1 640.871114 269.22243225 2.380 1 1.628629 0.39931816 4.079
Covariance of Estimates COVB INTERCEP INTERCEP 72480.718025 X -106.1332431
Prob>F 0.0003
Prob > |T| 0.0243 0.0003
X -106.1332431 0.1594549926
Se observa que la Fc = 16.634 es mayor que F-tabla, entonces se procede a realizar el Análisis de Covarianza. Class Level Information Class Levels Values RAZA 2 CALI ZELA ALIM 3 CONC CPURO REP 5 12345 Number of observations in data set = 30
HIDRO
Análisis y Diseño de Experimentos - 419 Dependent Variable: Y Source Model Error Corrected Total
Sumof Squares 6 1370696.602 23 1091020.112 29 2461716.715
Mean Square 228449.434 47435.657
DF
R-Square 0.556805
C.V. 12.62676
Root MSE 217.7973
F Value Pr > F 4.82 0.0026
Y Mean 1724.88667
Dependent Variable: Y Type III SS Source DF Mean Square F Value RAZA 1 87451.7603 87451.7603 1.84 ALIM 2 312978.1754 156489.0877 3.30 RAZA*ALIM 2 50597.7288 25298.8644 0.53 X 1 920522.1358 920522.1358 19.41 TforH0: Estimate Parameter=0 385.3720360 B 1.33 -0.1302551 B -0.00 0.0000000B . . 94.3146535 B 0.68 CPURO 144.5068573 B 1.01 HIDRO 0.0000000B . . 1.8080194 4.41
Parameter INTERCEPT RAZA CALI ZELA ALIM CONC X
Least Squares Means RAZA Y
Std Err LSMEAN CALI 1781.37642 57.55088 ZELA 1668.39692 57.55088
ALIM
Y
CONC 1750.30159 CPURO 1835.63379 HIDRO 1588.72462
LSMEAN 69.85157 69.77310 68.87522
Pr>|T| 0.1974 0.9993 0.5004 0.3222 0.0002
Pr > |T| LSMEAN H0:LSMEAN=0 0.0001 0.0001
Std Err Pr > |T| LSMEAN H0:LSMEAN=0 0.0001 0.0001 0.0001
Least Squares Means for effect ALIM Pr > |T| H0: LSMEAN(i)=LSMEAN(j) Dependent Variable: Y i/j 1 2 3 1 . 0.4025 0.1133 2 0.4025 . 0.0191 3 0.1133 0.0191 .
StdErrorof Estimate 290.32814569 137.74746933 . 137.76130216 142.82004148 . 0.41042937 Pr > |T| H0: LSMEAN1=LSMEAN2 0.1877
LSMEAN Number 1 2 3
Pr > F 0.1877 0.0550 0.5937 0.0002
- 420 -
V. Ibañez Q. - Docente FINESI - UNA - Puno General Linear Models Procedure Least Squares Means RAZA ALIM Y Std Err Pr > |T| LSMEAN LSMEAN H0:LSMEAN=0 CALI CONC 1817.49878 99.77639 0.0001 CALI CPURO 1937.97098 98.66091 0.0001 CALI HIDRO 1588.65949 97.40401 0.0001 ZELA CONC 1683.10440 97.41602 0.0001 ZELA CPURO 1733.29660 104.56907 0.0001 ZELA HIDRO 1588.78974 97.40243 0.0001 Least Squares Means for effect RAZA*ALIM Pr > |T| H0: LSMEAN(i)=LSMEAN(j) Dependent Variable: Y i/j 1 2 3 4 5 1 . 0.3913 0.1146 0.3443 0.5803 2 0.3913 . 0.0192 0.0786 0.1796 3 0.1146 0.0192 . 0.4999 0.3214 4 0.3443 0.0786 0.4999 . 0.7294 5 0.5803 0.1796 0.3214 0.7294 . 6 0.1147 0.0192 0.9993 0.5004 0.3222
6 0.1147 0.0192 0.9993 0.5004 0.3222 .
LSMEAN Number 1 2 3 4 5 6
Análisis y Diseño de Experimentos - 421 A NÁLISIS DE COVARIANZA MÚLTIPLE. En situaciones generales, es posible que sobre cada unidad experimental se observen los valores de p variables concomitantes, simultáneamente con el valor observado de la característica en estudio.
Yij = µ + ρi + τ j + β 1 X1ij + β 2 X 2ij + L + β p X pij + ε ij Con los resultados del experimento se debe preparar, en primer lugar la siguiente tabla: Las sumas de cuadrados:
R x1x1 , Tx1x1 , E x1x1 , R x2 x2 , Tx 2 x 2 ,K , R yy , Tyy y E yy , de la Tabla resumen pueden ser obtenidos como en cualquier diseño de Bloque completo al azar.
Sx1x1 = Tx1x1 + Ex1x1 ; Sx1x2 = Tx1x2 + Ex1x2 ;K; Ux1x1 = Rx1x1 + Ex1x1 ; U x1x 2 = R x1x 2 + E x1x 2 ;L Las sumas de productos pueden ser calculadas a partir de las ecuaciones: r
∑X Y .j
R xiy =
j=1
t t
t
.j
−
Txi y =
∑X Y i.
i=1
t
r
∑∑X Y ij
E xi y =
(X..)(Y..) rt
,
i =1 j =1
t
ij
− Txy − R xy −
(X..)(Y..) rt
i.
−
(X..)(Y..) rt
- 422 -
G.L.
Bloques
r- 1
Rx1x1
Rx1x2
Rx1y
Rx2x2
Rx2y
Tratamientos
t- 1
Tx1x1
Tx1x2
Tx1y
Tx2x2
Tx2y
Ex1x2
Ex1y
Ex2x2
Ex2y
Tox1x2
Tox1y
Tox2x2
Tox2y
Error exptal. Total
(r - 1)(r - 1) Ex1x1 Tox1x1 rt - 1
Tratamiento + Error
r(t-1)
Sx1x1
Sx1x2
Sx1y
Sx2x2
Sx2y
Bloque + Error
t(r - 1)
Ux1x1
Ux1x2
Ux1y
Ux2x2
Ux2y
V. Ibañez Q. - Docente FINESI - UNA - Puno
F. De V.
SUMAS DECUADRADOS YDEPRODUCTOS CORREGID ∑x12 ∑x1x2 ∑x1y ∑x22 ∑x2y
RYY TYY EYY SYY
r- 1 t-1 (r - 1)(t - 1) r(t - 1)
Bloque Tratamientos (T) Error Exptal. (E) i =1
i(T + E)
( b iE E
∑ (b
k
i=1
∑
k
t(r - 1)
UYY i =1
∑ (b
i(B+ E)
Diferencia para probar entre medias de bloques ajustados
B+E
k
)
S x iy )
xiy
S.C. Debido a la regresión ..... .....
U xiy )
Diferencia para probar entre medias de tratamientos ajustados
T+ E
S.C.
G.L.
Fuentes de Variación
k
k
i =1
∑ (b
iE
E xiy ) = W
Z- W i=1
X- W
Uyy −∑(bi(B+E)Uxyi )=X
k
i=1
Syy −∑(bi(T+E)Sxiy ) =Z
S yy −
S.C. De las desviaciones respec. A la regr. ..... .....
G.L.
r- 1
t(r - 1)
t-1
r(t - 1) - 2
(r - 1)(t - 1) - 2
ANALISIS ABREVIADO DE COVARIANCIA PARA LOS DATOS DEL EXPERIMENTO
Análisis y Diseño de Experimentos - 423 -
- 424 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
ANALISIS DECOVARIANCIAPARALOS DATOS EXPERIMENTALES. Fuentes de Variación Media Regresión
G.L.
Suma de Cuadrados 2 ..
X rt
1 r+ t
Por diferencia
C.M. ..... .....
k
Debido a β1 ,β2 Bloques/ β 1 ,β 2 Tratamientos/β1 ,β2 Error exptal. Total
k r- 1 t-1 (r - 1)(t - 1) -2 rt
∑
( b iT o T o
i=1
x iy
Por diferencia Z- W** W*
∑∑X
2 ij
)
..... (Z - W) (t - 1) W =E (r -1)(t -1) - 2
.....
EJEMPLO. Se probaron 5 líneas de soya, conducidas en un Diseño Bloque Completo al Azar con 4 repeticiones. Los datos que se registaron fueron : X1 : maduración, medida en días posteriores al de la variedad testigo X2 : acame, medido en una escal de 0 a 5. Y : infección por gangrena del tallo medida como porcentaje de tallos infectados. El objetivo principal es saber cual de los dos, la madurez o el acame, está más intimamente relacionadao con la infección. Determine esto a partir de la regresión múltiple del error. Pruebe la hipótesis de que no existen diferencias entre los promedios de infección ajustados para las variedades. Resultados ordenados del experimento de soya conducido en D.B.C.A.
Análisis y Diseño de Experimentos - 425 Línea Tratamiento A B C D E TOTAL
X1 9 10 10 8 12 49
Bloque I X2 Y 3 19.3 3 10.1 2.5 13.1 2 15.6 2.5 4.3 13 62.4
X1 10 10 9 5 11 45
Bloque II X2 Y 2 29.2 2 34.7 1.5 59.3 2 49 1 48.2 8.5 220.4
X1 12 9 12 8 13 54
Bloque III X2 Y 3 1 2 14 2.5 1.1 2 17.4 3 6.3 12.5 39.8
X1 9 9 10 6 10 44
Bloque IV X2 Y 2.5 6.4 3 5.6 2.5 8.1 2 11.7 2.5 6.7 12.5 38.5
El programa SAS, que nos permite realizar este análisis es el siguiente :
DATA ANCOVAM; OPTIONS NODATE NOCENTER NONUMBER; TITLE ‘ANCOVA MULTIPLE EN UN D.B.C.A.’; DO TRAT =’A’,’B’,’C’,’D’,’E’; DO REP=1 TO 4; INPUT X1 X2 Y @; OUTPUT; END; END; CARDS; 9 3.0 19.3 10 2.0 29.2 12 3.0 1.0 9 2.5 6.4 10 3.0 10.1 10 2.0 34.7 9 2.0 14.0 9 3.0 5.6 10 2.5 13.1 9 1.5 59.3 12 2.5 1.1 10 2.5 8.1 8 2.0 15.6 5 2.0 49.0 8 2.0 17.4 6 2.0 11.7 12 2.5 4.3 11 1.0 48.2 13 3.0 6.3 10 2.5 6.7 ; PROC PRINT; RUN, PROC REG; MODEL Y = X1 X2/ALL; RUN; PROC GLM; CLASS REP TRAT; MODEL Y=REP TRAT X1 X2/SOLUTION; LSMEANS TRAT/STDERR PDIFF; RUN; PROC GLM; CLASS REP TRAT; MODEL Y=REP TRAT X1 X2/SS1; RUN;
- 426 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
EJERCICIOS: 1. El presete trabajo de investigación se realizó en el Centro Experimental Quimsachata de la Estación Experimental ILLPA - INIA Puno, ubicado en el distrito de Santa Rosa, Provincia de Lampa, Dpto. de Puno. El objetivo fue determinar las medidas biometricas de altura a la cabeza, altura a la cruz, largo de cuerpo, perímetro toráxico (cm) respectivamente, desde el primer mes (marzo) hasta el destete (octubre) en llamas. La información corresponde a la primeras pariciones (Enero). Los factores que se han considerado son: Raza de llamas (Ch’acu y K’ara); Sexo ( Machos y Hembras). Y = PEVI = Peso vivo (kg), X1 = A_CAB = altura a la cabeza (cm), X2 = A_CRUZ = Altura a la cruz (cm), X3 = LCUERP = Largo del cuerpo (cm), X4 = PTOR = Perímetro toráxico (cm). Raza Sexo Repet. 1 2 3 4 1ra_Par_Mar
5 6 7 8 9 10 11 12 13 14 15
Raza Sexo Repet. 1 2 3 4 1ra_Par_Oct
5 6 7 8 9 10 11 12 13 14 15
Y
Ch'acu Machos X1 X2 X3 X4 Y
14.0 17.5 17.0 15.5 19.5 22.0 16.5 14.5 15.0 14.5 19.0 12.0 12.0 18.5 17.5
95.0 107.0 106.5 104.0 109.0 112.0 106.5 96.0 107.0 96.5 107.5 98.0 97.0 106.0 112.5
Y
Ch'acu Machos X1 X2 X3 X4 Y
30.0 27.0 38.0 38.0 40.0 48.5 32.0 32.0 42.0 31.0 32.5 26.0 25.0 33.0 30.5
114.5 123.5 130.0 128.0 129.0 133.5 128.5 121.5 127.0 127.0 121.5 111.0 116.5 121.0 127.0
57.5 69.0 68.5 68.0 72.0 71.5 68.5 62.5 67.0 63.0 65.0 65.0 60.0 63.5 64.0
71.5 70.0 82.0 81.5 83.0 84.5 82.0 76.5 76.0 73.0 79.0 74.0 74.5 80.5 78.5
43.5 54.0 52.0 52.0 53.5 54.0 56.0 52.0 52.5 49.5 56.0 49.0 51.0 54.0 52.5
65.0 66.0 72.0 68.0 71.0 78.5 70.0 68.0 69.0 68.5 70.0 66.0 62.5 68.0 63.5
57.0 58.0 61.0 57.0 60.0 64.0 56.0 54.0 58.0 53.0 60.0 56.0 57.0 67.0 57.0
78.0 86.0 95.0 84.0 87.0 89.0 87.0 77.5 83.0 84.0 82.5 79.0 76.5 82.0 78.0
13.0 16.0 16.0 17.5 20.0 12.5 12.5 19.0 19.5 22.5 24.5 20.0 18.5 16.5 20.0
31.0 31.0 35.5 38.0 41.0 26.0 42.5 33.0 42.0 34.0 47.5 33.0 36.0 30.5 27.5
Hembras X1 X2 X3 X4 99.5 105.0 103.0 99.0 112.5 95.5 101.5 107.5 107.0 110.5 116.0 108.0 105.0 107.5 105.0
62.5 68.0 64.0 64.5 72.0 65.0 61.0 70.0 68.5 69.0 76.0 69.0 68.0 69.5 69.0
21.0 15.0 22.0 10.5 20.5 19.5 18.5 18.5 19.0 21.0 19.0 18.0 18.5 20.5 16.5
107.0 101.5 106.5 98.0 114.0 103.0 106.0 106.5 111.0 113.0 112.5 107.5 111.0 113.5 98.5
Hembras X1 X2 X3 X4
Y
K'ara Machos X1 X2 X3 X4 Y
120.5 124.0 119.5 123.5 133.0 117.0 133.5 126.0 135.0 129.5 131.5 122.0 132.0 122.5 124.0
44.0 30.5 49.0 22.0 47.0 38.5 38.0 38.0 39.0 35.0 40.5 43.5 40.5 47.5 33.0
69.5 80.0 77.0 76.5 87.0 73.0 81.0 76.5 83.5 80.5 87.5 76.5 81.5 81.0 78.0
49.0 51.5 52.0 57.0 57.5 46.0 55.0 55.0 54.5 56.0 59.0 56.0 59.0 50.0 52.0
64.0 65.5 72.5 70.5 77.0 61.5 78.0 72.0 78.0 71.5 80.0 70.0 69.0 68.0 65.0
56.0 62.0 62.0 59.0 67.0 53.0 60.0 61.0 60.0 62.0 66.0 57.0 57.0 55.0 58.0
Y
K'ara Machos X1 X2 X3 X4 Y
80.0 92.0 84.0 82.0 96.0 91.0 91.0 82.0 94.0 81.0 96.0 82.0 86.5 82.0 80.0
138.5 123.5 130.5 114.0 144.0 123.5 132.0 133.0 138.5 134.0 137.0 134.5 129.5 136.5 133.5
66.5 74.0 69.5 59.0 74.0 65.5 67.5 69.0 71.0 75.5 76.0 70.0 71.0 76.5 57.5
87.0 79.5 84.0 71.0 92.0 84.5 85.5 82.0 86.5 89.0 86.5 86.5 83.5 88.0 82.0
52.5 54.5 52.0 46.0 59.0 55.5 54.0 54.0 57.0 51.5 55.0 58.0 52.5 53.0 53.5
76.5 71.0 77.0 61.0 92.0 70.0 75.0 73.0 75.5 71.5 77.0 80.5 74.0 73.0 75.0
62.0 56.0 52.0 56.0 59.0 57.0 59.0 62.0 59.0 61.0 59.5 59.0 58.0 60.0 56.0
100.0 72.0 91.0 84.0 91.0 94.0 93.0 93.0 93.0 95.0 93.5 89.0 93.0 91.0 88.0
Hembras X1 X2 X3 X4
19.0 17.5 15.0 16.0 17.5 16.0 20.0 13.5 19.0 16.0 17.0 23.5 15.0 18.0 15.5
40.0 37.0 28.5 36.0 35.5 35.5 42.5 33.5 40.5 35.5 38.0 49.0 29.5 37.0 38.5
111.0 110.5 106.0 112.5 108.0 108.5 110.0 101.5 109.0 109.5 109.0 113.0 107.5 109.5 92.0
71.5 70.0 64.0 66.5 67.5 65.5 72.5 65.0 67.5 71.5 68.0 72.0 69.5 69.5 65.0
56.0 56.0 51.0 52.5 56.0 45.0 57.0 53.0 55.0 54.0 54.0 63.0 51.0 52.0 51.0
61.0 63.0 59.0 62.0 61.0 59.0 62.0 58.0 53.0 59.0 62.0 63.0 50.0 63.0 56.0
Hembras X1 X2 X3 X4 134.5 127.5 123.0 126.5 122.5 124.0 136.5 128.5 132.5 130.0 129.5 133.0 119.0 130.5 129.0
82.0 77.0 74.0 79.0 79.0 80.5 86.0 78.5 84.5 83.0 81.5 87.0 78.5 82.5 82.5
69.0 72.0 68.0 72.0 70.5 70.0 77.0 68.0 74.5 72.0 73.0 79.5 64.0 72.0 73.0
90.0 89.0 85.0 84.0 76.0 90.0 94.0 81.0 89.0 87.0 88.0 96.0 74.0 91.0 94.0
Análisis y Diseño de Experimentos - 427 Raza Sexo Repet. 1 2 3 4 Ul_Par_Mar
5 6 7 8 9 10 11 12 13 14 15
Raza Sexo Repet. 1 2 3 4 Ult_Par_Oct
5 6 7 8 9 10 11 12 13 14 15
Y
Ch'acu Machos X1 X2 X3 X4 Y
17.0 19.0 17.5 18.5 13.5 15.5 14.0 19.0 14.5 15.5 18.0 16.0 16.0 20.0 18.0
100.5 102.5 106.0 101.0 101.0 97.0 97.0 105.0 103.5 103.5 107.0 105.5 107.5 115.5 112.0
62.5 66.0 69.5 68.0 63.0 64.0 61.5 70.0 66.0 62.5 66.0 72.0 65.0 74.0 72.0
48.0 51.0 54.0 50.0 51.5 51.0 49.0 52.0 52.0 52.0 50.0 51.5 51.0 61.5 59.0
Y
Machos X1 X2 X3
56.0 60.0 59.0 62.0 52.0 59.0 55.0 62.0 63.0 57.0 61.0 60.0 59.0 67.0 66.0
18.5 15.0 12.0 17.0 16.0 18.0 18.0 14.0 20.0 16.0 20.0 18.0 18.0 17.0 15.0
Hembras X1 X2 X3 X4 106.5 108.0 93.0 106.0 105.5 104.0 103.5 103.0 118.0 104.0 113.0 105.5 111.0 108.0 102.5
68.0 67.0 58.0 68.5 67.5 63.0 65.5 63.0 74.0 66.5 72.5 68.5 69.0 67.5 62.5
55.5 50.5 45.0 50.5 53.0 52.0 52.0 51.0 58.0 51.5 60.0 57.0 55.5 53.0 49.0
61.0 59.0 57.0 55.0 59.0 60.0 65.0 59.0 71.0 59.0 70.0 58.0 61.0 61.0 59.0
Y
K'ara Machos X1 X2 X3 X4 Y
15.0 14.5 17.5 18.0 19.0 16.0 23.0 16.0 21.0 17.0 18.0 20.0 18.0 16.0 14.0
101.0 99.5 106.0 106.0 107.0 103.5 111.0 104.0 115.0 114.5 111.5 109.5 114.5 109.5 104.0
66.0 62.0 69.0 67.0 68.0 67.5 74.0 65.0 74.0 74.5 73.0 67.0 76.5 70.0 66.0
49.0 51.0 54.0 52.0 53.5 55.5 61.0 51.5 57.5 60.0 59.0 60.0 57.0 57.5 49.0
X4
Y
Machos X1 X2 X3
94.0 83.0 75.0 85.0 93.0 87.0 86.0 79.0 91.5 80.0 87.0 86.0 87.0 85.0 73.0
34.0 34.0 37.0 38.0 31.0 37.0 45.5 30.0 36.0 40.5 39.0 37.5 42.0 34.0 28.5
Ch'acu
34.5 42.5 39.0 35.5 30.0 35.5 35.0 41.0 35.5 31.0 36.0 40.5 37.0 40.5 34.0
126.0 135.5 135.5 128.5 123.0 125.0 118.5 132.0 122.0 130.5 122.5 129.5 128.0 136.0 128.0
80.0 81.0 87.0 83.0 77.5 80.5 77.0 84.5 76.0 77.0 78.0 84.5 80.5 83.0 83.0
69.0 71.0 74.0 78.0 66.0 67.5 70.0 75.0 70.0 66.5 69.5 76.0 70.5 75.0 70.0
X4
Y
84.0 93.0 90.0 95.0 79.0 82.0 88.0 71.0 87.0 87.0 86.0 90.0 91.0 90.0 90.0
43.5 33.5 23.0 34.0 39.0 26.5 38.5 26.0 44.5 27.5 39.0 29.0 36.0 32.5 24.5
58.0 54.0 60.0 56.0 64.0 62.0 66.0 60.0 67.0 66.0 66.0 74.0 65.0 56.0 50.0
18.5 14.0 18.5 16.5 18.0 20.5 12.5 19.0 19.0 17.0 21.0 17.0 19.0 15.0 18.5
Hembras X1 X2 X3 X4 109.5 106.0 110.0 106.5 111.0 108.0 106.0 118.0 105.0 120.5 114.0 109.5 117.5 112.5 113.0
66.0 66.5 67.5 66.0 71.0 71.0 65.0 76.5 68.0 79.5 75.5 67.5 78.5 74.5 72.5
54.0 55.0 58.0 54.0 55.5 59.0 51.5 61.0 58.0 58.0 55.5 60.5 62.0 57.0 59.0
57.0 66.0 59.0 60.0 59.0 66.0 51.0 69.0 68.0 71.0 65.0 67.0 65.0 69.0 67.0
K'ara Hembras X1 X2 X3 132.0 121.5 116.0 126.5 130.5 117.5 123.0 115.5 136.0 118.0 134.0 122.0 128.5 128.5 113.0
83.0 77.0 73.0 78.0 84.0 71.5 76.0 72.5 85.5 71.0 79.0 78.0 82.5 77.0 75.5
76.5 68.0 60.5 70.0 74.0 65.5 74.5 63.0 74.5 67.5 75.5 67.5 71.0 72.0 62.0
127.5 122.5 129.5 131.5 123.0 129.5 137.0 124.0 134.0 135.0 128.0 131.0 136.0 127.0 119.5
80.5 83.0 83.5 81.0 78.0 82.0 91.0 71.5 85.5 85.5 83.0 81.5 85.0 80.5 77.0
68.5 69.0 72.0 68.0 68.0 71.5 79.5 62.0 74.0 71.0 73.0 69.0 73.0 74.0 63.0
Hembras X2 X3
X4
Y
X1
92.0 87.0 93.0 83.0 89.0 85.5 100.0 78.0 91.0 90.5 95.0 87.0 85.0 85.0 82.0
42.0 34.0 38.0 44.0 38.0 44.0 30.5 39.5 36.0 41.5 31.0 32.5 33.5 38.0 24.5
135.0 134.5 137.0 136.0 132.0 136.0 127.0 135.5 124.0 140.0 123.5 126.5 133.0 129.0 124.0
84.5 85.0 87.0 82.0 88.0 85.0 78.5 88.0 77.5 87.5 80.0 75.0 82.5 83.0 82.5
78.0 79.0 74.0 78.0 76.0 74.0 68.0 73.0 73.0 74.5 68.5 70.0 74.5 71.0 68.0
X4 92.0 100.0 90.0 92.0 85.0 96.0 82.0 94.0 86.0 91.5 83.0 87.5 87.0 91.0 80.0
2. El presete trabajo de investigación se realizó en el Centro Experimental Quimsachata de la Estación Experimental ILLPA - INIA Puno, ubicado en el distrito de Santa Rosa, Provincia de Lampa, Dpto. de Puno. El objetivo fue determinar las medidas biometricas de altura a la cabeza, altura a la cruz, largo de cuerpo, perímetro toráxico (cm) respectivamente, desde el primer mes (marzo) hasta el destete (octubre) en llamas. La información corresponde a la primeras pariciones (Enero). Los factores que se han considerado son: Epocas de pariciones (Primeras y últimas), Raza de llamas (Ch’acu y K’ara); Sexo ( Machos y Hembras). Y = PEVI = Peso vivo (kg), X1 = A_CAB = altura a la cabeza (cm), X2 = A_CRUZ = Altura a la cruz (cm), X3 = LCUERP = Largo del cuerpo (cm), X4 = PTOR = Perímetro toráxico (cm). Calcule el ANCOVA.
Raza Sexo Repet. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Pariciones
Repet. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Sexo
Raza
Pariciones
Y 30.0 27.0 38.0 38.0 40.0 48.5 32.0 32.0 42.0 31.0 32.5 26.0 25.0 33.0 30.5
Y 14.0 17.5 17.0 15.5 19.5 22.0 16.5 14.5 15.0 14.5 19.0 12.0 12.0 18.5 17.5
X2 57.5 69.0 68.5 68.0 72.0 71.5 68.5 62.5 67.0 63.0 65.0 65.0 60.0 63.5 64.0
Machos X1 X2 114.5 71.5 123.5 70.0 130.0 82.0 128.0 81.5 129.0 83.0 133.5 84.5 128.5 82.0 121.5 76.5 127.0 76.0 127.0 73.0 121.5 79.0 111.0 74.0 116.5 74.5 121.0 80.5 127.0 78.5
X1 95.0 107.0 106.5 104.0 109.0 112.0 106.5 96.0 107.0 96.5 107.5 98.0 97.0 106.0 112.5
Machos
X3 65.0 66.0 72.0 68.0 71.0 78.5 70.0 68.0 69.0 68.5 70.0 66.0 62.5 68.0 63.5
X3 43.5 54.0 52.0 52.0 53.5 54.0 56.0 52.0 52.5 49.5 56.0 49.0 51.0 54.0 52.5
Y 13.0 16.0 16.0 17.5 20.0 12.5 12.5 19.0 19.5 22.5 24.5 20.0 18.5 16.5 20.0
X4 78.0 86.0 95.0 84.0 87.0 89.0 87.0 77.5 83.0 84.0 82.5 79.0 76.5 82.0 78.0
Y 31.0 31.0 35.5 38.0 41.0 26.0 42.5 33.0 42.0 34.0 47.5 33.0 36.0 30.5 27.5
Ch'acu
X4 57.0 58.0 61.0 57.0 60.0 64.0 56.0 54.0 58.0 53.0 60.0 56.0 57.0 67.0 57.0
Ch'acu
X2 62.5 68.0 64.0 64.5 72.0 65.0 61.0 70.0 68.5 69.0 76.0 69.0 68.0 69.5 69.0
Hembras X1 X2 120.5 69.5 124.0 80.0 119.5 77.0 123.5 76.5 133.0 87.0 117.0 73.0 133.5 81.0 126.0 76.5 135.0 83.5 129.5 80.5 131.5 87.5 122.0 76.5 132.0 81.5 122.5 81.0 124.0 78.0
X1 99.5 105.0 103.0 99.0 112.5 95.5 101.5 107.5 107.0 110.5 116.0 108.0 105.0 107.5 105.0
Hembras
X4 56.0 62.0 62.0 59.0 67.0 53.0 60.0 61.0 60.0 62.0 66.0 57.0 57.0 55.0 58.0
Y 21.0 15.0 22.0 10.5 20.5 19.5 18.5 18.5 19.0 21.0 19.0 18.0 18.5 20.5 16.5
X3 64.0 65.5 72.5 70.5 77.0 61.5 78.0 72.0 78.0 71.5 80.0 70.0 69.0 68.0 65.0
X4 80.0 92.0 84.0 82.0 96.0 91.0 91.0 82.0 94.0 81.0 96.0 82.0 86.5 82.0 80.0
Y 44.0 30.5 49.0 22.0 47.0 38.5 38.0 38.0 39.0 35.0 40.5 43.5 40.5 47.5 33.0
Machos X1 X2 138.5 87.0 123.5 79.5 130.5 84.0 114.0 71.0 144.0 92.0 123.5 84.5 132.0 85.5 133.0 82.0 138.5 86.5 134.0 89.0 137.0 86.5 134.5 86.5 129.5 83.5 136.5 88.0 133.5 82.0
X2 66.5 74.0 69.5 59.0 74.0 65.5 67.5 69.0 71.0 75.5 76.0 70.0 71.0 76.5 57.5
Machos X1 107.0 101.5 106.5 98.0 114.0 103.0 106.0 106.5 111.0 113.0 112.5 107.5 111.0 113.5 98.5
Primeras Pariciones
X3 49.0 51.5 52.0 57.0 57.5 46.0 55.0 55.0 54.5 56.0 59.0 56.0 59.0 50.0 52.0
Primeras Pariciones
X3 76.5 71.0 77.0 61.0 92.0 70.0 75.0 73.0 75.5 71.5 77.0 80.5 74.0 73.0 75.0
X3 52.5 54.5 52.0 46.0 59.0 55.5 54.0 54.0 57.0 51.5 55.0 58.0 52.5 53.0 53.5
Y 19.0 17.5 15.0 16.0 17.5 16.0 20.0 13.5 19.0 16.0 17.0 23.5 15.0 18.0 15.5
X4 100 72.0 91.0 84.0 91.0 94.0 93.0 93.0 93.0 95.0 93.5 89.0 93.0 91.0 88.0
Y 40.0 37.0 28.5 36.0 35.5 35.5 42.5 33.5 40.5 35.5 38.0 49.0 29.5 37.0 38.5
K'ara
X4 62.0 56.0 52.0 56.0 59.0 57.0 59.0 62.0 59.0 61.0 59.5 59.0 58.0 60.0 56.0
K'ara
X2 71.5 70.0 64.0 66.5 67.5 65.5 72.5 65.0 67.5 71.5 68.0 72.0 69.5 69.5 65.0
Hembras X1 X2 134.5 82.0 127.5 77.0 123.0 74.0 126.5 79.0 122.5 79.0 124.0 80.5 136.5 86.0 128.5 78.5 132.5 84.5 130.0 83.0 129.5 81.5 133.0 87.0 119.0 78.5 130.5 82.5 129.0 82.5
X1 111.0 110.5 106.0 112.5 108.0 108.5 110.0 101.5 109.0 109.5 109.0 113.0 107.5 109.5 92.0
Hembras
X3 69.0 72.0 68.0 72.0 70.5 70.0 77.0 68.0 74.5 72.0 73.0 79.5 64.0 72.0 73.0
X3 56.0 56.0 51.0 52.5 56.0 45.0 57.0 53.0 55.0 54.0 54.0 63.0 51.0 52.0 51.0
X4 90.0 89.0 85.0 84.0 76.0 90.0 94.0 81.0 89.0 87.0 88.0 96.0 74.0 91.0 94.0
X4 61.0 63.0 59.0 62.0 61.0 59.0 62.0 58.0 53.0 59.0 62.0 63.0 50.0 63.0 56.0
Y 34.5 42.5 39.0 35.5 30.0 35.5 35.0 41.0 35.5 31.0 36.0 40.5 37.0 40.5 34.0
Y 17.0 19.0 17.5 18.5 13.5 15.5 14.0 19.0 14.5 15.5 18.0 16.0 16.0 20.0 18.0
X2 62.5 66.0 69.5 68.0 63.0 64.0 61.5 70.0 66.0 62.5 66.0 72.0 65.0 74.0 72.0
Machos X1 X2 126.0 80.0 135.5 81.0 135.5 87.0 128.5 83.0 123.0 77.5 125.0 80.5 118.5 77.0 132.0 84.5 122.0 76.0 130.5 77.0 122.5 78.0 129.5 84.5 128.0 80.5 136.0 83.0 128.0 83.0
X1 100.5 102.5 106.0 101.0 101.0 97.0 97.0 105.0 103.5 103.5 107.0 105.5 107.5 115.5 112.0
Machos
X3 69.0 71.0 74.0 78.0 66.0 67.5 70.0 75.0 70.0 66.5 69.5 76.0 70.5 75.0 70.0
X3 48.0 51.0 54.0 50.0 51.5 51.0 49.0 52.0 52.0 52.0 50.0 51.5 51.0 61.5 59.0
Y 18.5 15.0 12.0 17.0 16.0 18.0 18.0 14.0 20.0 16.0 20.0 18.0 18.0 17.0 15.0
X4 84.0 93.0 90.0 95.0 79.0 82.0 88.0 71.0 87.0 87.0 86.0 90.0 91.0 90.0 90.0
Y 43.5 33.5 23.0 34.0 39.0 26.5 38.5 26.0 44.5 27.5 39.0 29.0 36.0 32.5 24.5
Ch'acu
X4 56.0 60.0 59.0 62.0 52.0 59.0 55.0 62.0 63.0 57.0 61.0 60.0 59.0 67.0 66.0
Ch'acu
Hem X1 X 132.0 8 121.5 7 116.0 7 126.5 7 130.5 8 117.5 7 123.0 7 115.5 7 136.0 8 118.0 7 134.0 7 122.0 7 128.5 8 128.5 7 113.0 7
X 6 6 5 6 6 6 6 6 7 6 7 6 6 6 6
Hem X1 106.5 108.0 93.0 106.0 105.5 104.0 103.5 103.0 118.0 104.0 113.0 105.5 111.0 108.0 102.5
- 428 V. Ibañez Q. - Docente FINESI - UNA - Puno
Análisis y Diseño de Experimentos - 429 -
Bibliografía consultada AYALA, J. y PARDO, R. (1995). “Optimización por diseños experimentales: con aplicaciones en ingeniería”. Primera Edición. Edit. A & B S.A. CONCYTEC. Lima - Perú. BALLUERKA, N. y Vergara, A. (2002). “Diseños de Investigación Experimental en Psicología”. 1ra. Edición. Edit. Prentice-Hall. Madrid – España BECKER, W.A. (1986). "Manual de genética cuantitativa". Academic enterprises. Pullman Washington U.S.A. BOWERMAN, B.L., O’CONNELL,R.T. y KOEHLER,A. (2007). "Pronósticos, Series de tiempo y Regresión: un enfoque aplicado". Cuarta Edición. CENGAGE Learning. México. CALZADA, B.J. (1970). "Métodos Estadísticos para la investigación". Edit. Jurídica. Lima Perú. COCHRAN, W.G. (1978). "Métodos Estadísticos". Primera Edición. Editorial Continental S.A. de C.V. México. COCHRAN, W. G. y COX, G. M. (1978). Diseños experimentales. Editorial Trillas. S.A. México. DRAPER, N. and H. SMITH (1969). "Applied regression analysis". 2nd. Ed. New York: McGraw-Hill Book Company. FALCONER, D.S. (1983). "Introducción a la genética cuantitativa". Tercera edición. Impresión en Español. Edit. CECSA. México. GARCIA, R.M. (2004). "Inferencia Estadística y diseño de Experimentos". Primera Edición. Edit. Universitaria de Buenos Aires - Argentina. GUTIERREZ, H. y DE LA VARA, S. (2004). “Análisis y Diseño de Experimentos”. Primera Edición. Edit. McGraw-Hill.
- 430 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
HENDERSON, C.R. (1952). "Estimation of variance and covariance components". Presented at North Carolina Staties. Conference. Cornell University. HERRERA, H.J.G. (1985). "Introducción al Mejoramiento Genético Animal". Colegio de Postgraduados Centro de Ganadería. Chapingo - México. IBAÑEZ, Q.V. (1996). "Estimación de Indices de Herencia en Rumiantes". Primera Edición. Editorial Universitaria. UNA-Puno. IBAÑEZ, Q.V. (1998). "Modelos Lineales". Primera Edición. Facultad de Ingeniería Estadística e Informática UNA - Puno. IBAÑEZ, V. (2003). “Diseños Estadísticos con el SAS”. Primera Edición. Maestría Ganadería Andina. UNA – Puno. IBAÑEZ, V. (2004). “Estadística Inferencial Aplicada a la Ganadería“. Primera Edición. Maestría Ganadería Andina. UNA – Puno. IBAÑEZ, V. (2005). “Bioestadística“. Primera Edición. Edit. Universitaria. UNA Puno. IBAÑEZ, V. (2005). “Estadística No Paramétrica“. Primera Edición. Edit. Universitaria. UNA - FMVZ - Puno. IBAÑEZ, V. (2006). “Estadística Inferencial Aplicada a la Salud“. Primera Edición Edit. Universitaria. UNA - Puno. IBAÑEZ, V., y ZEA, F.W. (2006). “Aplicaciones con el Sistema de Análisis Estadístico SAS“. Universidad Nacional Micaela Bastidas de Apurimac. SegundaEdición. Edit. Abancay-Apurimac. IBAÑEZ, V. (2007). “Estadística Inferencial Aplicada a la Educación“. Primera Edición Edit. Universitaria. UNA - Puno. IBAÑEZ, V. (2008). “Guía de prácticas de Métodos Estadísticos para la Investigación“. Primera Edición Edit. Universitaria. Facultad de Ciencias Agrarias. UNA Puno.
Análisis y Diseño de Experimentos - 431 KUEHL, R.O. (2001). “Diseño de experimentos: Principios estadísticos de diseño y análisis de investigación”. Segunda Edición. Editorial Thomson y Learning. LITTLE, T.M. y HILLS, F.J. (1985). "Métodos Estadísticos para la Investigación en la Agricultura". Editorial TRILLAS S.A. de C.V. México. LOPEZ, E.A. (2008). "Diseño y Análisis de Experimentos: Fundamentos y aplicaciones en agronomía". Primera Edición. Edit. Facultad de Agronomía. Guatemala. MANZANEDA, J. (2000). “Diseño Experimental. Estadística Aplicada”. MARTINEZ, G.A. (1988). "Diseños Experimentales. Métodos y elementos de teoría". Primera Edición. Editorial TRILLAS S.A. de C.V. México. MONTGOMERY, D.C. (2002). «Diseño y Análisis de Experimentos». 2da. Edición. Edit. Limusa Wiley, México. NETER, J. y WASSERMAN, W. (1977). "Applied Linear Statistical Models: Regression, Analysis of Variance, and Experimental Designs". Octava Edición. Editorial Irwin-Dorsey Limited. USA. OSTLE, B. (1981). " Estadística Aplicada". Primera Edición. Editorial LIMUSA México. PEREZ-TEJADA, H.E. (2000). Estadística para las ciencias sociales y del comportamiento. 2da. Edic. Edit. Oxford University Press México, S.A. de C.V.
REYES, C.P. (1985). "Diseño de Experimentos Aplicados". Primera Edición. Editorial TRILLAS S.A. de C.V. México. Tercera Reimpresión. RODRIGUEZ DEL ANGEL, J.M. (1991). "Métodos de Investigación PECUARIA". Primera Edición. Editorial TRILLAS S.A. de C.V. México. SAS/STAT (2002). "User's Guide". SAS Institute Inc., Cary, NC., USA. Versión 9.12. Fourth Edition. Volume 2. SIEGEL, S. y CASTELLAN, N.J. (1995). Estadística No Paramétrica. 2da. Edic. Edit. Trillas, México.
- 432 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
STEEL, G.D.R. y TORRIE, H.J. (1996). "Bioestadística principios y procedimientos". Segunda Edición. Editorial McGraw-Hill/Interamericana de México, S.A. de C.V. SUSAN, M.J. (1994). "Estadística para Biología y de la Salud". Segunda Edición. Editorial Interamericana McGraw-Hill. España. TINEO, A.L. (2001). “Manual para el Análisis de Diseños Experimentales de Superficie de Respuesta”. 1ra. Edic. Edit. VRAC-OSA. UNSCH. Ayacucho, Perú. VASQUEZ, A.V. (1990). "Experimentación Agrícola". Primera Edición. Editorial AMARU Editores S.a. Lima - Perú. VENTURA, E.R. y ZAVALA, Z.A. (1994). "Métodos Estadísticos Básicos en la Investigación". Dpto. Académico de Estadística e Informática. UNA La Molina. Lima - Perú. WAYNE, D. (2002). Bioestadística: Bases para el análisis de las ciencias de la salud. 4ta. Edic. Edit. UTEHA-México. WINER, B. J. (1962) Statistical Principles in Experimental Design. McGraw-Hill Book Company, Inc. 672 p. ZEA, F.W. (1995). "Estadística y Diseños Experimentales". Primera Edición. Facultad de Ciencias Agrairias - UNA - Puno. ZEA, F.W. e IBAÑEZ, Q.V. (1996). "I Curso de Sistema de Análisis Estadístico SAS para la Investigación Experimental". Universidad Nacional Jorge Basadre Grohomann Tacna. Facultad de Ciencias Agrícolas. ZEA, F.W. e IBAÑEZ, V. (2003). "Tablas Estadísticas". Segunda Edición. Edit. Universitaria. Fac. Ciencias Agrarias - Puno - Perú.
Análisis y Diseño de Experimentos - 433 -
Tablas Estadísticas
- 434 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
Análisis y Diseño de Experimentos - 435 -
0.25 gl
0.50 1 1.0005 2 0.816 3 0.765 4 0.741 5 0.727
TABLA A: Valores críticos de t Nivel de significación para una prueba unilateral 0.20 0.15 0.10 0.05 0.025 0.01 0.005 0.0005 Nivel de significación para una prueba bilate ral 0.40 0.30 0.20 0.10 0.05 0.02 0.01 0.001 1.376 1.963 3.078 6.314 12.706 31.821 63.657 636.619 1.061 1.386 1.836 2.920 4.303 6.965 9.925 31.598 0.978 1.250 1.638 2.353 3.182 4.541 5.841 12.941 0.941 1.190 1.533 2.132 2.776 3.747 4.604 8.610 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.859
6 7 8 9 10
0.718 0.711 0.706 0.703 0.700
0.906 0.896 0.889 0.883 0.879
1.134 1.119 1.108 1.100 1.093
1.440 1.415 1.397 1.383 1.372
1.943 1.895 1.860 1.833 1.812
2.447 2.365 2.306 2.262 2.228
3.143 2.998 2.896 2.821 2.764
3.707 3.499 3.355 3.250 3.169
5.959 5.405 5.041 4.781 4.587
11 12 13 14 15
0.697 0.695 0.694 0.692 0.691
0.876 0.873 0.870 0.868 0.866
1.088 1.083 1.079 1.076 1.074
1.363 1.356 1.350 1.345 1.341
1.796 1.782 1.771 1.761 1.753
2.201 2.179 2.160 2.145 2.131
2.718 2.681 2.650 2.624 2.602
3.106 3.055 3.012 2.977 2.947
4.437 4.318 4.221 4.140 4.073
16 17 18 19 20
0.690 0.689 0.688 0.688 0.687
0.866 0.863 0.862 0.861 0.860
1.071 1.069 1.067 1.066 1.064
1.337 1.333 1.330 1.328 1.325
1.746 1.740 1.734 1.729 1.725
2.120 2.110 2.101 2.093 2.086
2.584 2.567 2.552 2.540 2.528
2.921 2.898 2.878 2.861 2.845
4.015 3.965 3.922 3.883 3.850
21 22 23 24 25
0.686 0.686 0.685 0.685 0.684
0.859 0.858 0.858 0.000 0.856
1.063 1.061 1.060 1.059 1.058
1.323 1.321 1.319 1.318 1.316
1.721 1.717 1.714 1.711 1.708
2.080 2.074 2.069 2.064 2.060
2.518 2.508 2.500 2.492 2.485
2.831 2.819 2.807 2.797 2.787
3.819 3.792 3.767 3.745 3.725
26 27 28 29 30
0.684 0.684 0.683 0.683 0.683
0.856 0.855 0.855 0.854 0.854
1.058 1.057 1.056 1.055 1.055
1.315 1.314 1.313 1.311 1.310
1.706 1.703 1.701 1.699 1.697
2.056 2.052 2.048 2.045 2.042
0.000 2.473 2.467 2.460 2.457
2.779 2.771 2.763 2.756 2.750
3.707 3.690 3.674 3.659 3.646
35 40 45 50 55
0.682 0.681 0.680 0.680 0.679
0.853 0.851 0.850 0.849 0.849
1.052 1.050 1.048 1.047 1.047
1.306 1.303 1.301 1.299 1.297
1.690 1.684 1.680 1.676 1.673
2.030 2.021 2.014 2.008 2.004
2.438 2.423 2.412 2.403 2.396
2.724 2.704 2.690 2.678 2.669
3.591 3.551 3.520 3.496 3.476
60 70 80
0.679 0.678 0.678
0.848 0.847 0.847
1.046 1.045 1.044
1.296 1.294 1.293
1.671 1.667 1.665
2.000 1.994 1.990
2.390 2.381 2.374
2.600 2.648 2.638
3.460 3.435 3.416
- 436 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
1 1 162 2 18.50 3 10.10 4 7.71 5 6.61 6 5.99 7 5.59 8 5.32 9 5.12 10 4.96
2 200 19.00 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10
TABLAB1: DISTRIBUCIONF, Nivel de significacióndel 5% Grados de libertadparael numerador 3 4 5 6 7 8 9 10 11 12 13 216 225 230 234 237 239 241 242 243 244 245 19.20 19.20 19.30 19.30 19.40 19.40 19.40 19.40 19.40 19.40 19.40 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89
11 12 13 14 15
4.84 4.75 4.67 4.60 4.54
3.98 3.89 3.81 3.74 3.68
3.59 3.49 3.41 3.34 3.29
3.36 3.26 3.18 3.11 3.06
3.20 3.11 3.03 2.96 2.90
3.09 3.00 2.92 2.85 2.79
3.01 2.91 2.83 2.76 2.71
2.95 2.85 2.77 2.70 2.64
2.90 2.80 2.71 2.65 2.59
2.85 2.75 2.67 2.60 2.54
2.82 2.72 2.63 2.57 2.51
2.79 2.69 2.60 2.53 2.48
2.76 2.66 2.58 2.51 2.45
2.74 2.64 2.55 2.48 2.42
2.72 2.62 2.53 2.46 2.40
16 17 18 19 20
4.49 4.45 4.41 4.38 4.35
3.63 3.59 3.55 3.52 3.49
3.24 3.20 3.16 3.13 3.10
3.01 2.96 2.93 2.90 2.87
2.85 2.81 2.77 2.74 2.71
2.74 2.70 2.66 2.63 2.60
2.66 2.61 2.58 2.54 2.51
2.59 2.55 2.51 2.48 2.45
2.54 2.49 2.46 2.42 2.39
2.49 2.45 2.41 2.38 2.35
2.46 2.41 2.37 2.34 2.31
2.42 2.38 2.34 2.31 2.28
2.40 2.35 2.31 2.28 2.25
2.37 2.33 2.29 2.26 2.22
2.35 2.31 2.27 2.23 2.20
21 22 23 24 25
4.32 4.30 4.28 4.26 4.24
3.47 3.44 3.42 3.40 3.39
3.07 3.05 3.03 3.01 2.99
2.84 2.82 2.80 2.78 2.76
2.68 2.66 2.64 2.62 2.60
2.57 2.55 2.53 2.51 2.49
2.49 2.46 2.44 2.42 2.40
2.42 2.40 2.37 2.36 2.34
2.37 2.34 2.32 2.30 2.28
2.32 2.30 2.27 2.25 2.24
2.28 2.26 2.24 2.22 2.20
2.25 2.23 2.20 2.18 2.16
2.22 2.20 2.18 2.15 2.14
2.20 2.17 2.15 2.13 2.11
2.18 2.15 2.13 2.11 2.09
26 27 28 29 30
4.23 4.21 4.20 4.18 4.17
3.37 3.35 3.34 3.33 3.32
2.98 2.96 2.95 2.93 2.92
2.74 2.73 2.71 2.70 2.69
2.59 2.57 2.56 2.55 2.53
2.47 2.46 2.45 2.43 2.42
2.39 2.37 2.36 2.35 2.33
2.32 2.31 2.29 2.28 2.27
2.27 2.25 2.24 2.22 2.21
2.22 2.20 2.19 2.18 2.16
2.18 2.17 2.15 2.14 2.13
2.15 2.13 2.12 2.10 2.09
2.12 2.10 2.09 2.08 2.06
2.09 2.08 2.06 2.05 2.04
2.07 2.06 2.04 2.03 2.01
40 50 60 70
4.08 4.03 4.00 3.98
3.23 3.18 3.15 3.13
2.84 2.79 2.76 2.74
2.61 2.56 2.53 2.50
2.45 2.40 2.37 2.35
2.34 2.29 2.25 2.23
2.25 2.20 2.17 2.14
2.18 2.13 2.10 2.07
2.12 2.07 2.04 2.02
2.08 2.03 1.99 1.97
2.04 1.99 1.95 1.93
2.00 1.95 1.92 1.89
1.97 1.92 1.89 1.86
1.95 1.89 1.86 1.84
1.92 1.87 1.84 1.81
14 245 19.40 8.71 5.87 4.64 3.96 3.53 3.24 3.03 2.86
15 246 19.40 8.70 5.86 4.62 3.94 3.51 3.22 3.01 2.85
Análisis y Diseño de Experimentos - 437 -
16 1 246 2 19.40 3 8.69 4 5.84 5 4.60 6 3.92 7 3.49 8 3.20 9 2.99 10 2.83
17 247 19.40 8.68 5.83 4.59 3.91 3.48 3.19 2.97 2.81
TABLAB1: DISTRIBUCIONF, Nivel de significacióndel 5%(Cont.) Grados de libertadparael numerador 18 19 20 30 40 50 60 70 80 100 200 247 248 248 250 251 252 252 252 253 253 254 19.40 19.40 19.40 19.50 19.50 19.50 19.50 19.50 19.50 19.50 19.50 8.67 8.67 8.66 8.62 8.60 8.58 8.57 8.57 8.56 8.55 8.54 5.82 5.81 5.80 5.75 5.72 5.70 5.69 5.68 5.67 5.66 5.65 4.58 4.57 4.56 4.50 4.46 4.44 4.43 4.42 4.41 4.41 4.39 3.90 3.88 3.87 3.81 3.77 3.75 3.74 3.73 3.72 3.71 3.69 3.47 3.46 3.44 3.38 3.34 3.32 3.30 3.29 3.29 3.27 3.25 3.17 3.16 3.15 3.08 3.04 3.02 3.01 2.99 2.99 2.97 2.95 2.96 2.95 2.94 2.86 2.83 2.80 2.79 2.78 2.77 2.76 2.73 2.80 2.79 2.77 2.70 2.66 2.64 2.62 2.61 2.60 2.59 2.56
11 12 13 14 15
2.70 2.60 2.51 2.44 2.38
2.68 2.58 2.50 2.43 2.37
2.67 2.57 2.48 2.41 2.35
2.66 2.56 2.47 2.40 2.34
2.65 2.54 2.46 2.39 2.33
2.57 2.47 2.38 2.31 2.25
2.53 2.43 2.34 2.27 2.20
2.51 2.40 2.31 2.24 2.18
2.49 2.38 2.30 2.22 2.16
2.48 2.37 2.28 2.21 2.15
2.47 2.36 2.27 2.20 2.14
2.46 2.35 2.26 2.19 2.12
2.43 2.32 2.23 2.16 2.10
2.42 2.31 2.22 2.14 2.08
2.40 2.30 2.21 2.13 2.07
16 17 18 19 20
2.33 2.29 2.25 2.21 2.18
2.32 2.27 2.23 2.20 2.17
2.30 2.26 2.22 2.18 2.15
2.29 2.24 2.20 2.17 2.14
2.28 2.23 2.19 2.16 2.12
2.19 2.15 2.11 2.07 2.04
2.15 2.10 2.06 2.03 1.99
2.12 2.08 2.04 2.00 1.97
2.11 2.06 2.02 1.98 1.95
2.09 2.04 2.00 1.97 1.93
2.08 2.03 1.99 1.96 1.92
2.07 2.02 1.98 1.94 1.91
2.04 1.99 1.95 1.91 1.88
2.02 1.97 1.93 1.89 1.86
2.01 1.96 1.92 1.88 1.84
21 22 23 24 25
2.16 2.13 2.11 2.09 2.07
2.14 2.11 2.09 2.07 2.05
2.12 2.10 2.08 2.05 2.04
2.11 2.08 2.06 2.04 2.02
2.10 2.07 2.05 2.03 2.01
2.01 1.98 1.96 1.94 1.92
1.96 1.94 1.91 1.89 1.87
1.94 1.91 1.88 1.86 1.84
1.92 1.89 1.86 1.84 1.82
1.90 1.88 1.85 1.83 1.81
1.89 1.86 1.84 1.82 1.80
1.88 1.85 1.82 1.80 1.78
1.84 1.82 1.79 1.77 1.75
1.82 1.80 1.77 1.75 1.73
1.81 1.78 1.76 1.73 1.71
26 27 28 29 30
2.05 2.04 2.02 2.01 1.99
2.03 2.02 2.00 1.99 1.98
2.02 2.00 1.99 1.97 1.96
2.00 1.99 1.97 1.96 1.95
1.99 1.97 1.96 1.94 1.93
1.90 1.88 1.87 1.85 1.84
1.85 1.84 1.82 1.81 1.79
1.82 1.81 1.79 1.77 1.76
1.80 1.79 1.77 1.75 1.74
1.79 1.77 1.75 1.74 1.72
1.78 1.76 1.74 1.73 1.71
1.76 1.74 1.73 1.71 1.70
1.73 1.71 1.69 1.67 1.66
1.71 1.69 1.67 1.65 1.64
1.69 1.67 1.65 1.64 1.62
40 50 60 70
1.90 1.85 1.82 1.79
1.89 1.83 1.80 1.77
1.87 1.81 1.78 1.75
1.85 1.80 1.76 1.74
1.84 1.78 1.75 1.72
1.74 1.69 1.65 1.62
1.69 1.63 1.59 1.57
1.66 1.60 1.56 1.53
1.64 1.58 1.53 1.50
1.62 1.56 1.52 1.49
1.61 1.54 1.50 1.47
1.59 1.52 1.48 1.45
1.55 1.48 1.44 1.40
1.53 1.46 1.41 1.37
1.51 1.44 1.39 1.35
500 254 19.50 8.53 5.64 4.37 3.68 3.24 2.94 2.72 2.55
Inf 254 19.50 8.53 5.63 4.37 3.67 3.23 2.93 2.71 2.54
- 438 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
1 1 4052 2 98.50 3 34.10 4 21.20 5 16.30 6 13.70 7 12.20 8 11.30 9 10.60 10 10.00
2 4999 99.00 30.80 18.00 13.30 10.90 9.55 8.65 8.02 7.56
3 5403 99.20 29.40 16.70 12.10 9.78 8.45 7.59 6.99 6.55
TABLAC1: DISTRIBUCIONF, Nivel de significacióndel 1% Grados delibertadparaelnumerador 4 5 6 7 8 9 10 11 12 13 5625 5764 5859 5928 5981 6023 6056 6083 6106 6126 99.30 99.30 99.30 99.40 99.40 99.40 99.40 99.40 99.40 99.40 28.70 28.20 27.90 27.70 27.50 27.30 27.20 27.10 27.10 27.00 16.00 15.50 15.20 15.00 14.80 14.70 14.50 14.50 14.40 14.30 11.40 11.00 10.70 10.50 10.30 10.20 10.10 9.96 9.89 9.82 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.66 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.41 7.01 6.63 6.37 6.18 6.05 5.91 5.81 5.73 5.67 5.61 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.05 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.65
11 12 13 14 15
9.64 9.33 9.07 8.86 8.68
7.20 6.93 6.70 6.51 6.36
6.21 5.95 5.74 5.56 5.42
5.67 5.41 5.21 5.04 4.89
5.31 5.06 4.86 4.69 4.56
5.07 4.82 4.62 4.46 4.32
4.88 4.64 4.44 4.28 4.14
4.74 4.50 4.30 4.14 4.00
4.63 4.39 4.19 4.03 3.89
4.54 4.30 4.10 3.94 3.80
4.46 4.22 4.02 3.86 3.73
4.39 4.16 3.96 3.80 3.67
4.34 4.10 3.90 3.75 3.61
4.29 4.05 3.86 3.70 3.56
4.25 4.01 3.82 3.66 3.52
16 17 18 19 20
8.53 8.40 8.29 8.18 8.10
6.23 6.11 6.01 5.93 5.85
5.29 5.18 5.09 5.01 4.94
4.77 4.67 4.58 4.50 4.43
4.44 4.34 4.25 4.17 4.10
4.20 4.10 4.01 3.94 3.87
4.03 3.93 3.84 3.77 3.70
3.89 3.79 3.71 3.63 3.56
3.78 3.68 3.60 3.52 3.46
3.69 3.59 3.51 3.43 3.37
3.62 3.52 3.43 3.36 3.29
3.55 3.46 3.37 3.30 3.23
3.50 3.40 3.32 3.24 3.18
3.45 3.35 3.27 3.19 3.13
3.41 3.31 3.23 3.15 3.09
21 22 23 24 25
8.02 7.95 7.88 7.82 7.77
5.78 5.72 5.66 5.61 5.57
4.87 4.82 4.76 4.72 4.68
4.37 4.31 4.26 4.22 4.18
4.04 3.99 3.94 3.90 3.85
3.81 3.76 3.71 3.67 3.63
3.64 3.59 3.54 3.50 3.46
3.51 3.45 3.41 3.36 3.32
3.40 3.35 3.30 3.26 3.22
3.31 3.26 3.21 3.17 3.13
3.24 3.18 3.14 3.09 3.06
3.17 3.12 3.07 3.03 2.99
3.12 3.07 3.02 2.98 2.94
3.07 3.02 2.97 2.93 2.89
3.03 2.98 2.93 2.89 2.85
26 27 28 29 30
7.72 7.68 7.64 7.60 7.56
5.53 5.49 5.45 5.42 5.39
4.64 4.60 4.57 4.54 4.51
4.14 4.11 4.07 4.04 4.02
3.82 3.78 3.75 3.73 3.70
3.59 3.56 3.53 3.50 3.47
3.42 3.39 3.36 3.33 3.30
3.29 3.26 3.23 3.20 3.17
3.18 3.15 3.12 3.09 3.07
3.09 3.06 3.03 3.00 2.98
3.02 2.99 2.96 2.93 2.91
2.96 2.93 2.90 2.87 2.84
2.90 2.87 2.84 2.81 2.79
2.86 2.82 2.79 2.77 2.74
2.81 2.78 2.75 2.73 2.70
40 50 60 70 80
7.31 7.17 7.07 7.01 6.96
5.18 5.06 4.98 4.92 4.88
4.31 4.20 4.13 4.07 4.04
3.83 3.72 3.65 3.60 3.56
3.51 3.41 3.34 3.29 3.25
3.29 3.19 3.12 3.07 3.04
3.12 3.02 2.95 2.91 2.87
2.99 2.89 2.82 2.78 2.74
2.89 2.78 2.72 2.67 2.64
2.80 2.70 2.63 2.59 2.55
2.73 2.62 2.56 2.51 2.48
2.66 2.56 2.50 2.45 2.42
2.61 2.51 2.44 2.40 2.36
2.56 2.46 2.39 2.35 2.31
2.52 2.42 2.35 2.31 2.27
14 6143 99.40 26.90 14.20 9.77 7.60 6.36 5.56 5.01 4.60
15 6157 99.40 26.90 14.20 9.72 7.56 6.31 5.52 4.96 4.56
Análisis y Diseño de Experimentos - 439 -
16 1 6169 2 99.40 3 26.80 4 14.20 5 9.68 6 7.52 7 6.28 8 5.48 9 4.92 10 4.52
17 6182 99.40 26.80 14.10 9.64 7.48 6.24 5.44 4.89 4.49
TABLAC1: DISTRIBUCIONF, Nivel de significacióndel 1%(Cont.) Grados de libertadparael numerador 18 19 20 30 40 50 60 70 80 100 200 6192 6201 6209 6261 6287 6303 6313 6320 6326 6335 6350 99.40 99.40 99.50 99.50 99.50 99.50 99.50 99.50 99.50 99.50 99.50 26.80 26.70 26.70 26.50 26.40 26.40 26.30 26.30 26.30 26.20 26.20 14.10 14.00 14.00 13.80 13.70 13.70 13.70 13.60 13.60 13.60 13.50 9.61 9.58 9.55 9.38 9.29 9.24 9.20 9.18 9.16 9.13 9.08 7.45 7.42 7.40 7.23 7.14 7.09 7.06 7.03 7.01 6.99 6.93 6.21 6.18 6.16 5.99 5.91 5.86 5.82 5.80 5.78 5.75 5.70 5.41 5.38 5.36 5.20 5.12 5.07 5.03 5.01 4.99 4.96 4.91 4.86 4.83 4.81 4.65 4.57 4.52 4.48 4.46 4.44 4.41 4.36 4.46 4.43 4.41 4.25 4.17 4.12 4.08 4.06 4.04 4.01 3.96
11 12 13 14 15
4.21 3.97 3.78 3.62 3.49
4.18 3.94 3.74 3.59 3.45
4.15 3.91 3.72 3.56 3.42
4.12 3.88 3.69 3.53 3.40
4.10 3.86 3.66 3.51 3.37
3.94 3.70 3.51 3.35 3.21
3.86 3.62 3.42 3.27 3.13
3.81 3.57 3.37 3.22 3.08
3.77 3.54 3.34 3.18 3.05
3.75 3.51 3.32 3.16 3.02
3.73 3.49 3.30 3.14 3.00
3.70 3.47 3.27 3.11 2.98
3.65 3.41 3.22 3.06 2.92
3.62 3.38 3.19 3.03 2.89
3.60 3.36 3.17 3.00 2.87
16 17 18 19 20
3.37 3.27 3.19 3.12 3.05
3.34 3.24 3.16 3.08 3.02
3.31 3.21 3.13 3.05 2.99
3.28 3.19 3.10 3.03 2.96
3.26 3.16 3.08 3.00 2.94
3.10 3.00 2.92 2.84 2.78
3.02 2.92 2.84 2.76 2.69
2.97 2.87 2.78 2.71 2.64
2.93 2.83 2.75 2.67 2.61
2.91 2.81 2.72 2.65 2.58
2.89 2.79 2.70 2.63 2.56
2.86 2.76 2.68 2.60 2.54
2.81 2.71 2.62 2.55 2.48
2.78 2.68 2.59 2.51 2.44
2.75 2.65 2.57 2.49 2.42
21 22 23 24 25
2.99 2.94 2.89 2.85 2.81
2.96 2.91 2.86 2.82 2.78
2.93 2.88 2.83 2.79 2.75
2.90 2.85 2.80 2.76 2.72
2.88 2.83 2.78 2.74 2.70
2.72 2.67 2.62 2.58 2.54
2.64 2.58 2.54 2.49 2.45
2.58 2.53 2.48 2.44 2.40
2.55 2.50 2.45 2.40 2.36
2.52 2.47 2.42 2.38 2.34
2.50 2.45 2.40 2.36 2.32
2.48 2.42 2.37 2.33 2.29
2.42 2.36 2.32 2.27 2.23
2.38 2.33 2.28 2.24 2.19
2.36 2.31 2.26 2.21 2.17
26 27 28 29 30
2.78 2.75 2.72 2.69 2.66
2.75 2.71 2.68 2.66 2.63
2.72 2.68 2.65 2.63 2.60
2.69 2.66 2.63 2.60 2.57
2.66 2.63 2.60 2.57 2.55
2.50 2.47 2.44 2.41 2.39
2.42 2.38 2.35 2.33 2.30
2.36 2.33 2.30 2.27 2.25
2.33 2.29 2.26 2.23 2.21
2.30 2.27 2.24 2.21 2.18
2.28 2.25 2.22 2.19 2.16
2.25 2.22 2.19 2.16 2.13
2.19 2.16 2.13 2.10 2.07
2.16 2.12 2.09 2.06 2.03
2.13 2.10 2.06 2.03 2.01
40 50 60 70 80
2.48 2.38 2.31 2.27 2.23
2.45 2.35 2.28 2.23 2.20
2.42 2.32 2.25 2.20 2.17
2.39 2.29 2.22 2.18 2.14
2.37 2.27 2.20 2.15 2.12
2.20 2.10 2.03 1.98 1.94
2.11 2.01 1.94 1.89 1.85
2.06 1.95 1.88 1.83 1.79
2.02 1.91 1.84 1.78 1.75
1.99 1.88 1.81 1.75 1.71
1.97 1.86 1.78 1.73 1.69
1.94 1.82 1.75 1.70 1.65
1.87 1.76 1.68 1.62 1.58
1.83 1.71 1.63 1.57 1.53
1.80 1.68 1.60 1.54 1.49
500 6361 99.50 26.10 13.50 9.04 6.90 5.67 4.88 4.33 3.93
Inf 6366 99.50 26.10 13.50 9.02 6.88 5.65 4.86 4.31 3.91
- 440 -
V. Ibañez Q. - Docente FINESI - UNA - Puno
1 2 3 4 5
0.995 0.00 0.01 0.072 0.207 0.412
TABLAD: Distribucion de Chi-cuadrada Probabilidadde un valor más alto de chi-cuadrado 0.99 0.975 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.025 0.00 0.00 0.00 0.016 0.102 0.455 1.32 2.71 3.84 5.02 0.02 0.051 0.103 0.211 0.575 1.39 2.77 4.61 5.99 7.38 0.115 0.216 0.352 0.584 1.21 2.37 4.11 6.25 7.81 9.35 0.297 0.484 0.711 1.06 1.92 3.36 5.39 7.78 9.49 11.10 0.554 0.831 1.15 1.61 2.67 4.35 6.63 9.24 11.10 12.80
6 7 8 9 10
0.676 0.989 1.34 1.73 2.16
0.872 1.24 1.65 2.09 2.56
1.24 1.69 2.18 2.70 3.25
1.64 2.17 2.73 3.33 3.94
2.20 2.83 3.49 4.17 4.87
3.45 4.25 5.07 5.90 6.74
5.35 6.35 7.34 8.34 9.34
7.84 9.04 10.20 11.40 12.50
10.60 12.00 13.40 14.70 16.00
12.60 14.10 15.50 16.90 18.30
14.40 16.00 17.50 19.00 20.50
16.80 18.50 20.10 21.70 23.20
18.50 20.30 22.00 23.60 25.20
11 12 13 14 15
2.60 3.07 3.57 4.07 4.60
3.05 3.57 4.11 4.66 5.23
3.82 4.40 5.01 5.63 6.26
4.57 5.23 5.89 6.57 7.26
5.582 6.30 7.04 7.79 8.55
7.58 8.44 9.30 10.20 11.00
10.30 11.30 12.30 13.30 14.30
13.70 14.80 16.00 17.10 18.20
17.30 18.50 19.80 21.10 22.30
19.70 21.00 22.40 23.70 25.00
21.90 23.30 24.70 26.10 27.50
24.70 26.20 27.70 29.10 30.60
26.80 28.30 29.80 31.30 32.80
16 17 18 19 20
5.14 5.70 6.26 6.84 7.43
5.81 6.41 7.01 7.63 8.26
6.91 7.56 8.23 8.91 9.59
7.96 8.67 9.39 10.10 10.90
9.31 10.10 10.90 11.70 12.40
11.90 12.80 13.70 14.60 15.50
15.30 16.30 17.30 18.30 19.30
19.40 20.50 21.60 22.70 23.80
23.50 24.80 26.00 27.20 28.40
26.30 27.60 28.90 30.10 31.40
28.80 30.20 31.50 32.90 34.20
32.00 33.40 34.80 36.20 37.60
34.30 35.70 37.20 38.60 40.00
21 22 23 24 25
8.03 8.64 9.26 9.89 10.50
8.90 9.54 10.20 10.90 11.50
10.30 11.00 11.70 12.40 13.10
11.60 12.30 13.10 13.80 14.60
13.20 14.00 14.80 15.70 16.50
16.30 17.20 18.10 19.00 19.90
20.30 21.30 22.30 23.30 24.30
24.90 26.00 27.10 28.20 29.30
29.60 30.80 32.00 33.20 34.40
32.70 33.90 35.20 36.40 37.70
35.50 36.80 38.10 39.40 40.60
38.90 40.30 41.50 43.00 44.30
41.40 42.80 44.20 45.60 46.90
gl
0.01 0.005 6.63 7.88 9.21 10.60 11.3 12.80 13.30 14.90 15.10 16.70
26 11.20 12.20 13.80 15.40 17.30 20.80 25.30 30.40 35.60 38.90 41.90 45.60 48.30 27 11.80 12.90 14.60 16.20 18.10 21.70 26.30 31.50 36.70 40.10 43.20 47.00 49.60