Analisis y Diseño

July 25, 2017 | Author: Andrea Salazar Quispe | Category: Correlation And Dependence, Linear Regression, Regression Analysis, Analysis Of Variance, Statistical Theory
Share Embed Donate


Short Description

Descripción: analisi y diseño...

Description

UNIVERSIDAD NACIONAL DEL ALTIPLANO - PUNO

Facultad de Ciencias Agrarias Facultad de Ingeniería Estadística e Informática

α2

R.C.

1− α

R.R./Ho:

Aceptar Ho:

α 2

R.R./Ho:

ANÁLISIS Y DISEÑO DE EXPERIMENTOS PREPARADO POR: VLADIMIRO IBAÑEZ QUISPE, Dr.

Puno, Abril del 2009

- ii -

V. Ibañez Q. - Docente FINESI - UNA - Puno

VLADIMIRO IBAÑEZ QUISPE Ingeniero Estadístico, UNA - Puno - Perú. M.Sc. en Informática Dr. en Administración Profesor Principal - Facultad de Ingeniería Estadística e Informática. Derechos Reservados: Ninguna parte de este guía puede ser reproducida sin la autorización del autor. [email protected] © 2009, Editorial Universitaria. Primera Edición: 2009 Impreso en Puno - Perú. Ciudad Universitaria. Apartado 291. Fax (054) 352992. Puno - Perú Diagramación y Composición: Vladimiro Ibañez Quispe

Análisis y Diseño de Experimentos - iii -

PRESENTACIÓN

La presente publicación «Análisis y Diseño de Experimentos» está dirigido a los estudiantes de pre-grado y post-grado, muy especialmente a estudiantes de la Escuela Profesional de Ingeniería Agroindustrial y áreas afines que necesitan de las herramientas estadísticas para poder aplicarlo en el proceso de la investigación científica, y sea una ayuda para generar conocimientos en la ingeniería. En los procesos industriales se trabaja bastante con factores cuantitativos, lo que obliga a desarrollar metodologías orientadas y adecuadas para resolver los problemas de la investigación, tales como el análisis de regresión, los diseños experimentales básicos, experimentos factoriales (dos factores cuantitativos), superficie de respuesta (diseño central compuesto, diseño de Placket-Burman, EVOP, etc.). Estas metodologías necesitan ensayar en un proceso en el cual interviene los diferentes factores en estudio, lo que a veces se convierte muy complejo resolver en forma manual, y necesariamente se recurre a los software estadísticos adecuados para realizar los análisis respectivos. Actualmente existen varios software estadísticos con diferentes bondades, por lo que el investigador, se debe adaptar paulatinamente para el procesamiento de la información entre ellos podemos mencionar: Statistica, Statgraphics, Minitab, Stata, SPSS, SAS, etc., lo importante es que nos permite manipular la información recopilada (crudo) y posteriormente ésta información se convierte en conocimiento. Espero que esta publicación les permita orientar en el uso de las metodologías estadísticas para el proceso de la investigación, despertar a la mente y motivar en la conducción de la investigación acorde a nuestro medio. El autor estará plenamente agradecido y se sentirá mejor para publicar otros textos, si los interesados observan cualquier error, redacción, fórmulas, etc. y las sugerencias se reciben en viq_ibañ[email protected] El autor Abril, 2009

- iv -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Análisis y Diseño de Experimentos - v -

ÍNDICE Pág. CAPÍTULO 1: ANÁLISIS DE REGRESIÓN 1.1. Regresión Lineal Simple (RLS)......................................................... 02 Propiedades del modelo.................................................................... Diagrama de dispersión.................................................................... Estimación de la ecuación de regresión.......................................... Interpretación del coeficiente de regresión β$ 1 ............................... Prueba de hipótesis para ( β 1 )......................................................... Intervalo confidencial (IC) para ( β 1 ).............................................. Intervalo de confianza para la predicción........................................ i) Intervalo de confianza para la respuesta media E ( Yh ) ................... ii) Intervalo de Confianza para la predicción o futura

03 03 04 07 10 11 11 11

Yh ( New ) ......... 12

1.2. Correlación........................................................................................ Coeficiente de correlación de Pearson ............................................. Prueba de hipótesis para la correlación ( ρ )................................... Intervalo confidencial (IC) para ( ρ ).............................................. Coeficiente de Determinación R2, R2ajustado ........................................ Análisis gráfico de residuos ............................................................ Ejercicios .......................................................................................

28 28 29 30 30 31 36

1.3. Regresión Lineal Múltiple (RLM)..................................................... 40 Estimación de los parámetros del modelo........................................ Estimación de los parámetros ( β 0 , β 1 ,L , β k )(Forma matricial)....... Consecuencias de la Estimación....................................................... Prueba de Hipótesis en Regresión Lineal Múltiple............................ Pruebas sobre coeficientes individuales del modelo........................... Intervalos de Confianza y predicción en Regresión Lineal Múltiple... a) Intervalo Confidencial (IC) para β j ..............................................

41 42 46 46 48 49 49

b) IC para la respuesta media de E ( Y0 ) dado el vector X'0 .............. 50

- vi -

V. Ibañez Q. - Docente FINESI - UNA - Puno Pág. c) ICpara la predicción de nuevas observaciones Yh ( new ) ................... 52 Correlaciones Parciales .................................................................. 61 Prueba de hipótesis parciales........................................................... 61 Ejercicios ....................................................................................... 80

1.4. Regresión Curvilineal o no lineales.................................................... 83 A) Caso exponencial: Y = abX.......................................................... 83 B) Función potencial o curva geométrica: Y = aXb........................... 87 C) Caso parabólico (Función de Segundo Grado)............................. 91 CAPÍTULO 2: ASPECTOS GENERALES DEL DISEÑO 2.1. ¿Qué es un experimento?.............................................................. 2.2. Objetivos de un experimento......................................................... 2.3. Unidad experimental (UE)............................................................ 2.4. ¿Qué es un tratamiento? .............................................................. 2.5. Error experimental (EE)............................................................... 2.6. Principios básicos del diseño experimental....................................

95 96 96 96 96 97

CAPÍTULO 3: DISEÑO COMPLETAMENTE AL AZAR (DCA, DIA) 3.1. Diseño completamente al azar (balanceado o equilibrado).............. Características ............................................................................. Arreglo de campo ........................................................................ Modelo estadístico lineal .............................................................. Esquema del diseño ...................................................................... Ventajas ....................................................................................... Desventajas ................................................................................. Descomposición de la suma de cuadrados total ............................. Análisis de Varianza (ANOVA) .................................................... 3.2. Diseño Completamente al azar (desbalanceado)............................. Metodología de la forma matricial.................................................

103 103 104 104 105 105 105 106 107 115 122

Intervalo Confidencial (IC)

µ i • − µ j• ........................................ 124

Ejercicios..................................................................................... 3.3. Diseño completo al azar con igual numero de subunidades por unidad experimental............................................................... Características ............................................................................. Casos ilustrativos .........................................................................

129 131 131 131

Análisis y Diseño de Experimentos - vii Pág. Muestreo aleatorio....................................................................... Análisis estadísticos.................................................................... Análisis de varianza..................................................................... Ejercicio...................................................................................... 3.4. Diseño Completamente al azar con submuestreo (desbalanceado).. Forma matricial ............................................................................

132 132 133 137 137 143

CAPÍTULO 4: DISEÑO BLOQUE COMPLETO AL AZAR (DBCA) 4.1. Diseño bloque completo al azar ................................................... Características ............................................................................. Ventajas ....................................................................................... Desventajas ................................................................................. Esquema del diseño bloque compelto al azar............................... Modelo lineal aditivo ................................................................... Análisis de Varianza (ANOVA) .................................................... 4.2. Diseño bloque completo al azar con submuestreo........................... 4.3. Análisis funcional de la varianza .................................................. 4.4. Curva de respuesta ........................................................................ 4.5. Ajuste de la función de respuesta .................................................. Ejercicios .....................................................................................

151 151 153 154 155 155 157 164 170 180 185 192

CAPÍTULO 5: PRUEBAS DE COMPARACIÓN MÚLTIPLE DE MEDIAS 5.1. Prueba t de Student ....................................................................... 194 5.2. Diferencia Límite Significativa (DLS)........................................... 199 5.3. Prueba de Comparaciones múltiples de Duncan............................. 202 5.4. Prueba de comparación múltiple Tukey......................................... 209 5.5. Prueba de comparación de Dunnett.............................................. 213 5.6. Prueba de comparación múltipl de Studente-Newman-Keuls (SNK). 216 5.7. Prueba de Scheffe........................................................................ 219 5.8. Transformación de datos ............................................................... 220 CAPÍTULO 6: DISEÑO CUADRADO LATINO (DCL) 6.1. Características del diseño.............................................................. Ventajas ........................................................................................ Desventajas ................................................................................. Modelo estadístico lineal............................................................... Hipótesis..................................................................................... Estimación de los parámetros del modelo.....................................

224 225 225 225 226 227

- viii -

V. Ibañez Q. - Docente FINESI - UNA - Puno Pág.

Análisis de Varianza (ANOVA).................................................... 228 Ejercicios ..................................................................................... 236 6.2. Diseño Cuadrado Grecolatino (DCGL) .......................................... 238 CAPÍTULO 7: EXPERIMENTOS FACTORIALES Introducción................................................................................. Objetivos..................................................................................... Ventajas..................................................................................... Desventajas................................................................................. Elección de los factores................................................................ Tipos de factores............................................................................ Clasificación de los factores.......................................................... 7.1. Experimento factorial de la serie 2n............................................ 7.1.1. Experimento factorial bajo el DCA................................. Método 1: Ajuste de la función de respuesta................... Método 2: Ajuste de la función de respuesta................... 7.1.2. Experimento factorial bajo del DBCA............................... Ejercicios ...................................................................... 7.2. Experimento factorial de la serie 3n............................................ 7.2.1. Experimento factorial bajo el DCA................................. 7.2.2. Experimento factorial bajo el DBCA................................. 7.2.3. Experimentos con factores cuantitativos (dos factores) ....... Ejercicios ......................................................................

245 246 246 246 247 247 248 238 252 265 267 269 274 276 277 287 298 306

CAPÍTULO 8: MÉTODOS Y DISEÑO DE SUPERFICIE DE RESPUESTA Diseño para ajustar modelos de segundo orden ........................... 310 Diseño Compuesto Central (DCC) ............................................... 311 Diseños rotatorios para mejorar superficie de respuesta................ 315 Determinación de α en el Diseño Central Compuesto (CCD)...... 316 Estimación del modelo para diseño rotables y compuestos............. 320 Análisis de varianza para diseños rotables y compuestos................ 326 Soluciones óptimas ...................................................................... 333 Aplicaciones con software estadístico ........................................... 336 Ejercicios ..................................................................................... 351 CAPÍTULO 9: DISEÑO Y ANÁLISIS DE PARCELAS DIVIDIDAS 9.1. Diseño de parcela dividida (Split plot design) ............................. 355 Características del diseño de parcela dividida ............................... 355

Análisis y Diseño de Experimentos - ix Pág. Ventajas y desventajas .................................................................. Aleatorización ............................................................................ Arreglo de campo ....................................................................... 9.1.1. Diseño de parcela dividida bajo el DCA........................... Ajuste para comparación de medias.................................. 9.1.2. Diseño de parcela dividida bajo el DBCA......................... 9.2. Diseño de parcela subdivididas (Split split plot design) ............... 9.3. Diseño de parcelas en franja ........................................................ Ejercicios .....................................................................................

356 357 357 358 361 363 380 387 395

CAPÍTULO 10: ANÁLISIS DE COVARIANZA (ANCOVA) Usos del análisis de covarianza .................................................... Suposiciones del análisis de covarianza ........................................ Modelos estadísticos para el análisis de covarianza ...................... ANCOVA bajo el diseño completo al azar ..................................... ANCOVA en un arreglo factorial .................................................. Análisis de Covarianza Múltiple.................................................. Ejercicios .....................................................................................

397 398 399 400 415 421 426

Bibliografía consultada ........................................................................ 429 Tablas estadísticas ................................................................................. 433

Análisis y Diseño de Experimentos - 1 -

1 ANÁLISIS DE REGRESIÓN El término regresión viene del Latín regresio: que significa regreso, vuelta, retroceso y fue usado por primera vez como concepto estadístico en 1877 por Sir Francis Galtón, quién efectuó un estudio demostrando que la altura de los hijos de padres altos tendía a retroceder o «regresar», hacia la talla media de la población; regresión fue el nombre que le dió al proceso general de predecir una variable (la talla de los niños) a partir e otra (la talla de los padres). Más tarde, los estadísticos acunaron la expresión regresión múltiple para describir el proceso en virtud del cual se emplean algunas variables para predecir otra. Los métodos de regresión, se utiliza para analizar datos que provienen de experimentos que no fueron diseñados, este es el caso del estudio de fenómenos no controlados o de registros históricos. Los métodos de regresion se usan para determinar la «mejor» relación funcional entre las variables, mientras que los métodos de correlación se utilizan para medir el grado de asociación de las distintas variables. En pocas palabras, regresión es la cantidad de cambio de una variable asociado a un cambio único de otra variable. El principal objetivo del análisis de la regresión es realizar predicciones. La regresión permite determinar si existe relación entre las variables en estudio (X e Y), para lo cual se utiliza el comportamiento de una variable (X = independiente), para predecir el comportamiento de otra variable (Y = dependiente). Las dos características son medibles.

-2-

V. Ibañez Q. - Docente FINESI - UNA - Puno

Usos de la Regresión: - Para hacer predicciones futuras de Y, teniendo como base la X. - Para ver si la variable (Y) depende de otra (X), estimando por consiguiente la medida de dicha relación o asociación. - Para determinar la forma de la curva de la regresión. - Para conocer el error real implicado en un experimento, después que haya sido descontado el efecto de una variable relacionada. - Sirve de base para el análisis estadístico. Como se manifestó el objeto principal de la regresión es realizar predicciones como: - Predecir el tiempo meteorológico basado en los datos del pasado. - Predecir la performance de un toro basado en sus antepasados. - Predecir la producción de lana/año, basado en los años anteriores. - Predecir la calidad genética de una vaca, basado en sus antepasados. - Predecir la producción de semen en carneros basado en el tamaño testicular. - etc.. 1.1. REGRESIÓN LINEAL SIMPLE (RLS). Consideremos una variable dependiente Y con una sola variable independiente X. Representemos una muestra aleatoria de tamaño “n” de (X,Y) por el conjunto de pares de datos: {(xi,yi)/i = 1,2,...,n}. La relación entre variables es aquel que se considera únicamente dos variables, a estas designamos por «Y» y «X», donde «Y» es la variable dependiente ó variable de respuesta y «X» la variable independiente ó predictor. El modelo de regresión lineal consiste en especificar la forma de la relación lineal, es decir:

Yi = β 0 + β1X i + ε i ,

i = 1,2,..., n

Donde: Yi = Variable dependiente. Xi = Variable independiente.

β 0 = Parámetro desconocido que indica la ordenada donde la línea de regresión lo intersecta.

β 1 = Parámetro desconocido que indica la pendiente de la línea de mejor ajuste, llamada también coeficiente de regresión poblacional.

ε i = Error de perturbación que puede tomar valores positivos o negativos.

Análisis y Diseño de Experimentos - 3 Propiedades del modelo: a) Toda perturbación aleatoria tiene de media cero, es decir: i = 1,2,...,n. Ε( ε i ) = 0 , b) Todas las perturbaciones aleatorias tienen la misma varianza (homoscedasticidad). i = 1,2,...,n. V(ε i ) = σ 2i c) Las perturbaciones son independientes entre sí: cov( ε i , ε j ) = 0, i ≠ j

Yi E(Y) = β0 + β1Xi Yj

UVε W .

UV ε W

j

i

Yi

X1

X2

X3

X4

Xi

Suposiciones en regresión Diagrama de dispersión. Una vez recopilada la serie de «n» observaciones bidimensionales, cada par de valores (X,Y) en el plano cartesiano o rectángular está representado por un punto, y habra tantos puntos como parejas de observaciones que tenga. Esta representación da origen a una nube de puntos que se denomina diagrama de dispersión ó esparcimiento; este diagrama puede tener diferentes formas. Esta es la forma más usual para detectar si la función es lineal, exponencial, potencial, cuadrática, cúbica, etc. al cual el experimentador ajustará su información recopilada, de tal forma que describa adecuadamente la relación entre las variables en estudio.

Eje Y

Eje Y

Eje Y

V. Ibañez Q. - Docente FINESI - UNA - Puno

Eje Y

-4-

Eje X

Eje X

Eje X

Eje X

Lineal positiva

Lineal negativa

No Lineal

Ninguna relación

Estimación de la ecuación de regresión. En el análisis de regresión lineal simple, se busca una línea de tal forma que la sumatoria de los errores de todas las observaciones con respecto a la línea sea mínima, para lograr la estimación de los parámetros desconocidos ( β 0 y β 1 ), se utiliza el método de «Mínimos Cuadrados». Este método consiste en encontrar los valores

β 0 y β 1 de la ecuación de regresión muestral, de manera que la suma de los cuadrados de todos los residuos ε i (suma de cuadrados del error: SCE) alrededor de la línea de regresión sea mínima. Para estimar los parámetros se partirá del modelo original, que está expresada en la siguiente ecuación:

Yi = β 0 + β1X i + ε i ,

i = 1,2,..., n

ε i = Yi − β 0 − β1X i

b

g

ε 2i = Yi − β 0 − β1X i elevando al cuadrado.

∑ ε = ∑ bY − β n

n

2 i

i

i =1

0

2

− β1 X i

i =1

g aplicando sumatoria. 2

Para encontrar las Ecuaciones Normales se usan las derivadas parciales con respecto a los parámetros desconocidos β 0 y β 1 , entonces tenemos: n

∂∑ ε 2i a)

i=1

∂β 0

n

=0

∂ ∑ ε 2i y

b)

i=1

∂β1

=0

Análisis y Diseño de Experimentos - 5 ∂

n

i

0

− β1X i

i =1

De a) n

LM∑ bY − β N

∂ β0

b

g OPQ 2

= 0 , entonces se tiene que:

g

2 ∑ Yi − β 0 − β1X i ( −1) = 0 , haciendo operaciones elementales se tiene la prii =1

mera ecuación normal, pero por la propiedad de la sumatoria de una constantes es: n

∑ β$

0

= nβ$ 0

i =1

n

n

i =1

i =1

nβ$ 0 + β$ 1 ∑ X i = ∑ Yi ∂

De b)

LM∑ bY − β N n

i

0

− β1X i

i =1

∂ β1

g OPQ 2

n

b

L i)

g

= 0 , 2∑ Yi − β 0 − β1X i ( − X i ) = 0 , igual que la i =1

primera ecuación, se encuentra, la segunda ecuación normal. n

n

n

i =1

i =1

i =1

β$ 0 ∑ Xi +β$ 1 ∑ X2i = ∑ Xi Yi

L ii)

En resumen de a) y b) se tiene las Ecuaciones Normales: n

n

i =1

i =1

nβ$ 0 + β$ 1 ∑ X i = ∑ Yi n

n

n

i =1

i =1

i =1

β$ 0 ∑ X i +β$ 1 ∑ X i2 = ∑ X i Yi El objetivo de estas ecuaciones normales es despejar los parámetros β 0 y β 1 , esto se consigue de la siguiente forma: De a) nβ$ 0 + β$ 1

n

n

∑ X = ∑ Y , despejando i

i =1

i

i =1

n

n

i =1

i =1

nβ$ 0 = ∑ Yi − β$ 1 ∑ X i y n

n

dividiendo entre «n» a ambos miembros tenemos: β$ 0 =

∑Y

i

i =1

n

− β$ 1

∑X i =1

n

i

-6-

V. Ibañez Q. - Docente FINESI - UNA - Puno

β$ 0 = Y − β$ 1X β$ 0 = Y − β$ 1X en la segunda Ecuación Normal se tiene:

Reemplazando

e

Y − β$ 1 X

j∑ n

i =1

n

n

X i +β$ 1 ∑ X 2i =

∑XY i

i =1

i

i =1

, y haciendo ope-

raciones elementales de álgebra, se llega a encontrar β$ 1 en dos formas siguientes para facilitar el cálculo. n

n

β$ 1 =

n

∑ X Y − Y∑ X i

i

i =1 n

∑X i =1

∑ cX i =1

i

i =1 n

− X∑ Xi

2 i

n

β$ 1 =

n

i

, ó β$ 1 =

∑X Y − i =1

∑X

hc

∑ cX n

i

−X

i =1

h

2

i

i =1

F I − G∑ X J H K

2 i

i

n

n



2

n

i

i =1

h

i =1

i

n

i =1

− X Yi − Y

i

n

∑X ∑Y

i =1

n

=

∑ X Y − nXY i

i

i =1 n

∑X

2 i

− nX 2

i =1

Otra forma de encontrar β$ 1 es usando la Regla de Cramer. n

n

U| V| ⇒ = ∑X Y |W

n

i =1 n

β$ 0 ∑ X i +β$ 1 ∑ X i =1

i =1

i =1 n

2 i

i

i

i =1 n

n

n

nβ$ 0 + β$ 1 ∑ X i = ∑ Yi

∑Y

n β$ 1 =

∑X ∑X Y i

i =1

i =1

n

∑ Xi i =1

∑X i =1 n

i

∑ X2i i =1

n

i

i =1 n

n

i

i

=

n∑ X i Yi − i =1

n

n∑ X 2i − i =1

Análisis y Diseño de Experimentos - 7 n

n

β$ 1 =

∑ X iYi − i =1 n

∑ X i2 − i =1

n

∑ X ∑Y i

i =1

i

i =1

n

FG ∑ X IJ H K n

2

i

n

i =1

Algunas veces, se expresa en términos de desviaciones β$ 1 , utilizando letras minúsculas para diferenciar de las observaciones que se denotan con letras mayúsculas, entonces en términos de desviaciones se expresa: n

β$ 1 =

∑x y i

i =1 n

∑x

i

=

2 i

Cov( X, Y) S XY = 2 V ( X) SX

i =1

La recta de regresión estimada es: Donde

$ = β$ + β$ X Y i 0 1 i

$ es el estimador para la media de la observación Yi, la cual corresY i

ponde al valor Xi de la variable de predicción.

$ = ( Y − β$ X) + β$ X = Y + β$ X − β$ X = Y + β$ ( X − X) Y i 1 1 i 1 i 1 1 i $ − Y = β$ (X − X) Y i 1 i Esta es otra forma expresar la recta de regresión. Observar que la recta de regresión contiene al punto ( x , y ) cuyos componentes son las medias X y de Y, respectivamente. Interpretación del coeficiente de regresión β$ 1 El valor constante β$ 0 de la ecuación de regresión muestral, es la ordenada con el origen. El valor de la pendiente β$ 1 es el cambio en una unidad de medición.

$ cuando Xi cambia Y i

-8-

V. Ibañez Q. - Docente FINESI - UNA - Puno

Si β$ 1 >0, entonces, la tendencia lineal es creciente, es decir, a mayores valores de X corresponden mayores valores de Y. También, a menores valores de X corresponden menores valores de Y. Si β$ 1 t α 2,(n-2) 5. Valor experimental. Se obtiene reemplazando valores en la función pivotal.

tc =

β$ 1 − β1 s.e.(β$ ) = , 1 s. e(β$ ) 1

s2

FG∑X IJ H K ∑X −− n

i

n

2 i

i=1

i=1

n

2

Análisis y Diseño de Experimentos - 11 6. Si tc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha: Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha: 7. Conclusión. Realizar la interpretación en base al paso 4) y concluir de acuerdo al tenor del problema.

Intervalo Confidencial (IC) para ( β 1 ).

Pr β$ 1 − t α ,( n −2 ) s. e.(β$ 1 ) ≤ β1 ≤ β$ 1 + t α ,( n−2 ) s. e.(β$ 1 ) = 1 − α 2

2

β1 ∈ β$ 1 ± t α ,( n − 2 ) s. e.(β$ 1 ) 2

Intervalos de Confianza (IC) para la predicción. Una vez que se ha encontrado que existe regresión lineal simple poblacional ó que la línea de regresión muestral es válida para realizar predicciones; entonces podemos realizar las predicciones. i) Intervalo de confianza para la respuesta media E ( Yh ) . Sea de

µY

Xh

el valor de la media cuando X = X h ó X = X 0 y sea Y$h el valor

Y$h = β$ 0 + β$ 1 X , cuando X = X h entonces Y$h = β$ 0 + β$ 1 X h . E ( Y$h ) = E ( β$ 0 + β$ 1 X h ) = β$ 0 + β$ 1 X h = µ Y

LM MN

OP PQ

Xh

1 ( X h − X )2 S 2 ( Y$h ) = MSE + n ∑ X i2 − nX 2 , la distribución muestral es:

LM MN

2 Y$h − Yh $ ) = MSE 1 + ( X h − X ) S ( Y ~ t( n − 2 ) ; tc = h n ∑ X i2 − nX 2 s( Y$h )

OP PQ

- 12 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Luego el intervalo confidencial del (1- α )x100% para la respuesta media se obtiene de la siguiente forma:

E ( Yh ) ,

Pr Y$h − tα 2 ,n − 2 S ( Y$h ) ≤ E ( Yh ) ≤ Y$h + tα 2 ,n − 2 S ( Y$h ) = 1 − α ii) Intervalo de Confianza para la predicción o futura Para obtener un intervalo confidencial de un sólo valor

Yh ( New ) . Yh ( New ) de la variable

Yh = β 0 + β 1 X h , se considera a la diferencia y$h( New ) − yh( New ) como un valor de la variable aleatoria Y$h( New ) − Yh( New ) . Primeramente se debe calcular: Y$h = β$ 0 + β$ 1 X h

LM MN

S 2 ( Y$h( New ) ) = MSE 1 +

OP PQ

LM MN

OP PQ

1 ( X h − X )2 1 ( X h − X )2 + = S 2 1+ + 2 2 n ∑ X i − nX n ∑ X i2 − nX 2 , la

distribución muestral es:

tc =

Y$h( New ) − Yh( New ) ~ t( n − 2 ) ; S ( Y$ ) h ( New )

LM MN

1 ( X h − X )2 S ( Y$h( New ) ) = S 2 1 + + n ∑ X i2 − nX 2

OP PQ

Luego el intervalo confidencial del (1- α )x100% para una sola respuesta o futura

Yh ( New ) , se obtiene de la siguiente forma: Pr Y$h − tα 2 ,n − 2 S ( Y$h ( New ) ) ≤ Yh ( New ) ≤ Y$h + tα 2 ,n − 2 S ( Y$h( New ) ) = 1 − α

EJEMPLO: En la tabla siguiente se presenta los resultados promedio de la evaluación sensorial de la naranja Valencia «control» a través del tiempo de almacenamiento, para este caso se establece el límite de aceptabilidad del producto, considerando un puntaje de 3.5 en la escala de: 6 (Excelente), 5 (Muy buena), 4 (buena), 3 (regular), 2 (mala) y 1 (inaceptable). Se presentan datos para el análisis sensorial de la naranja Washington Navel «Hipobárico» en s apariencia general externa.

Análisis y Diseño de Experimentos - 13 Tiempo (días) 0 13 25 AGE (Puntaje) 5.50 4.25 4.00 AGE: Apariencia General Externa.

35 3.75

50 3.40

61 2.25

68 1.75

86 1.25

93 1.00

a) Trace el diagrama de dispersión, b) Obtener la ecuación normal, c) Calcule la ecuación de regresión de Y sobre X, d) Grafique en el diagrama de dispersión la ecuación ajustada, e) Realice el ANVA, f) Pruebe la hipótesis para β1 ≠ 0 , g) Encuentre los intervalos confidenciales e intreprete en cada uno de las preguntas. SOLUCIÓN:

∑X

i

= 431, ∑ Yi = 27 .15, ∑ X i Yi = 913.25, ∑ X i2 = 28909 , ∑ Yi 2 = 10

X = 47 .89;

Y = 3.017

a) Diagrama de dispersión.

Apariencia general (puntaje)

6.00 5.00 4.00 3.00 2.00 1.00 0.00 0

20

40

60

Tiempo (días)

b) Obtener la ecuación normal.

9β$ 0 + 431β$ 1 = 27.15 431β$ + 28909β$ = 913.25 0

1

80

100

- 14 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

c) Encuentre la ecuación de regresión. 9

β$ 1 =

9

9

∑ X Y − ∑ X ∑Y i i

i

i =1

i =1

9

∑X

2 i



i =1

i

n =

i =1

FG ∑ X IJ H K 9

2

i

n

913.25 − ( 431 )( 27.15 ) 9 = −0.046793 28909 − ( 431 )2 9

i =1

β$ 0 = Y − β$ 1 X =

27 .15 9

b g = 5.257958559

− 0.046793872

Entonces, el modelo de regresión estimado es:

431 9

$ = β$ + β$ X , reemplazando Y i 0 1 i

se tiene:

Y$i = 5.25796 − 0.04679 X i De acuerdo a la ecuación estimada, se puede interpretar que por cada un día de incremento en el tiempo, deberá esperarse una reducción en la apariencia general externa en puntaje de 0.04679. d) Obtener la gráfica de la ecuación de regresión ajustada.

Apariencia gral (puntaje)

6.00

− 0.04679 Xi Y$i = 525796 .

5.00 4.00 3.00 2.00 1.00 0.00 0

20

40

60

Tiempo (días)

80

100

Análisis y Diseño de Experimentos - 15 e) Procedimiento para efectuar el análisis de varianza (ANOVA). Grados de libertad (G.L.) GLreg. = p - 1 = 2 - 1 = 1 GLerror = n - 2 = 9 - 2 = 7 GLtotal = n - 1 = 9 - 1 = 8 Sumas de Cuadrados (S.C. = S.S).

SSRm =

∑ X Y − d∑ X id∑ Y i ∑ X − d∑ X i n i i

i

i

2

2 i

2

n

=

913.25 − (431)(27.15) 9

b g

28909 − 431

i

2

2

9

= 18.10610911 n=9

n =9

( ∑ Yi )2

i =1

n

SSTm = ∑ Yi 2 −

i =1

= 100.6225 −

( 27.15 )2 = 18.72 14

SSE = SSTm − SSRm = 18.72 − 18.10610911 = 0.613890894 Tabla de Análisis de Varianza. F. de V. G.L. Debido a Regresión 1 Error residual 7 Total 8

S.S. 18.106109 0.613891 18.720000

M.S. 18.10611 0.08770 2.34000000

Fc. 206.46

Signif **

En el ANOVA precedente, podemos afirmar que existe diferencia estadística altamente significativa (P ≤ 0.01), esto implica que la variable independiente X (tiempo) influye sobre la variable dependiente Y (apariencia general), es decir las dos variables en estudio son dependientes, esto afirma que el modelo es bueno y para ratificar ésta aseveración se calcula el coeficiente de determinación (R2).

R2 =

18.10610911 SSRm x100 = x100 = 96.72% 18.72 SSTm

MSE 0.087698699 ~2 Rajust x100 = 1x100 = 96.25% . = 1− MSTm 2.34

- 16 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

El coeficiente de determinación ajustado

~2 Rajust . es alto por lo que existe una bondad

de ajuste bueno, es decir el modelo es confiable para realizar las predicciones hacia el futuro, recomendar que el modelo se puede usar en diferentes lugares para este tipo de evaluación sensorial de la naranja, tal como afirma Gutierrez, H. y De la Vara, R. (2004), para fines de predicción se recomienda el coeficiente de determinación ajustado al menos de 0.7 para que el modelo sea aceptable y confiable. Es importante indicar, si el modelo ajustado es confiable o no, para esto se realiza la validación del modelo ajustado y existen varias formas: i) la primera es realizar el ANOVA en la cual debe ser significativo F(Regresión), ii) Se prueba a través de la prueba de hipótesis, y iii) se calcula el intervalo confidencial (IC). f) Prueba de hipótesis para ( β 1 ). 1. Hipótesis Estadística:

H 0 : β1 = 0 H a : β1 ≠ 0

2. Elegir el nivel de significación: α = 0.05 3. Estadígrafo de Contraste, elegida para este caso, la prueba t-Student y cuya función pivotal.

t=

β$ 1 − β1 ~ t ( n−2) s. e(β$ ) 1

4. Establecer la Región de aceptación y rechazo. Se determina la región crítica de la prueba.

RA Ho : - 2.365 ≤ t c ≤ 2.365

α2

RR Ho : t c < -2.365 ó t c > 2.365

α2

1- α -2.365

0

t0.025,7 = 2.365

β1

RR/Ho:

RA/Ha: Valor crítico

Valor crítico

5. Valor experimental. Se obtiene reemplazando valores en la función pivotal.

tc =

β$ 1 − β 1 −0.046793872 − 0 = = −14.36865 , 0.003256664 s. e( β$ 1 ) s 2 = CME = MSE = 0.087698699

t

RR/Ho:

Análisis y Diseño de Experimentos - 17 V ( β$ 1 ) =

s2

∑X

2 i



d∑ X i

2

i

= n

0.087698699 = 0.000010605 8268.888889

s.e( β$ 1 ) = 0.003256664 6. Estadística de decisión: Si tc =14.37 > t0.025,7 =2.365, entonces cae en la región de rechazo, y se rechaza H0: y se acepta la Ha: 7. Conclusión. Se puede interpretar que β 1 es diferente de cero, es decir el modelo tiene pendiente positiva. g) Intervalo Confidencial (IC) para ( β 1 ).

Pr β$ 1 − t α ,( n −2 ) s. e.(β$ 1 ) ≤ β1 ≤ β$ 1 + t α ,( n − 2 ) s. e.(β$ 1 ) = 1 − α 2

2

Pr −0.046793872 − ( 2.365 )( 0.003256664 ) ≤ β 1 ≤ −0.046793872 + ( 2 .365 )( 0.00325666

Pr −0.054495883 ≤ β 1 ≤ −0.03909186 = 0.95 Se puede interpretar; de 100 muestras que se toma en el 95% el parámetro estimado β$ 1 estará comprendido entre el intervalo (-0.05449, -0.03909) y tan sólo el 5%

de las muestras estará fuera del intervalo o no contendrá en el intervalo. h) Estime la respuesta media E ( Yh ) . Con el ejemplo anterior, encuentre el intervalo confidencial para la respuesta media, cuando X = 35 ó X h = 35, entonces: i) Y$35 = β$ 0 + β$ 1 X h = 5.257958559 − 0.046793872( 35 ) = 3.61978769 .

LM MNn

OP PQ

LM N9

OP Q

2 2 ii) S 2 ( Y$35 ) = MSE 1 + ( X 352− X ) 2 = 0.087698699 1 + ( 35 − 47.89 ) = 0.011506486

∑ Xi − nX

S ( Y$35 ) = 0.10726829

. 8268888889

- 18 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

iii) Encuentre el Intervalo confidencial del 95% para la respuesta media E ( Yh ) , cuando Xh = 35 .

Pr Y$h − tα 2 ,n − 2 S ( Y$h ) ≤ E ( Y35 ) ≤ Y$h + tα 2 ,n − 2 S ( Y$h ) = 1 − α Pr 3.61978769 − ( 2.365 )( 0.10726829 ) ≤ E ( Y35 ) ≤ 3.61978769 + ( 2.365 )( 010726829 .

Pr 3.366098 ≤ E ( Y35 ) ≤ 3.877477 = 0.95

i) Intervalo Confidencial para observaciones futuras o individuales Yh ( New ) . Se desea calcular el intervalo confidencial del 95% cuando X h = 100 . i) Y$35 = β$ 0 + β$ 1 X h = 5.257958559 − 0.046793872( 100 ) = 0.57818597

LM MN

1 n

ii) S 2 ( Y$h( New ) ) = MSE 1 + +

OP PQ

LM N

( X h − X )2 1 (100 − 47.89 )2 = 0.087698699 1 + + 2 2 . 9 8268888889 ∑ Xi − nX

OP Q

= 0.12624271

S ( Y$h( New ) ) = 0.355306502 iii) El intervalo confidencial para la predicción futura

Yh ( New ) es:

Pr Y$h − tα 2 ,n −2 S ( Y$h( New ) ) ≤ Yh( New ) ≤ Y$h + tα 2 ,n− 2 S ( Y$h( New ) ) = 1 − α Pr 0.57818597 − ( 2.365 )( 0.355306502 ) ≤ Y100( New ) ≤ 0.57818597 + ( 2.365 )( 0.355306502

Pr −0.262113906 ≤ Y100( New ) ≤ 1.41848585 = 0.95

Análisis y Diseño de Experimentos - 19 -

PROGRAMA EN SAS.

DATA AGROI; OPTIONS NODATE NOCENTER NONUMBER; INPUT X Y; DATALINES; 0 13 25 35 50 61 68 86 93

5.50 4.25 4.00 3.75 3.40 2.25 1.75 1.25 1.00

; PROC PRINT; RUN; PROC REG; MODEL Y = X/XPX I COVB CLB CLI CLM P; RUN; /* CALCULA EL COEFICIENTE DE CORRELACIÓN PROC CORR; VAR X Y; RUN;

*/

- 20 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

SALIDA DEL SAS. The REG Procedure Model: MODEL1 Model Crossproducts X’X X’Y Y’Y Variable Intercept X Intercept 9 431 X 431 28909 Y 27.15 913.25

Variable Intercept X Y

X’X Inverse, Parameter Estimates, and SSE Intercept X Y 0.3884574039 -0.005791454 5.257573233 -0.005791454 0.0001209352 -0.046793873 5.257573233 -0.046793873 0.6138908895

Source Model Error Corrected Total Root MSE Dependent Mean Coeff Var

Variable Intercept X

Variable Intercept X

Y 27.15 913.25 100.6225

DF 1 1

Analysis of Variance Sum of Mean Squares Square 18.10611 18.10611 0.61389 0.08770 18.72000 R-Square 0.9672 Adj R-Sq 0.9625

DF 1 7 8 0.29614 3.01667 9.81678 Parameter Estimate 5.25757 -0.04679

F Value 206.46

Parameter Estimates Standard Error t Value Pr > |t| 0.18457 28.49 F 1 28.27035 28.27035 41.95 |t| 95% Confidence Limits 3.42839 0.62434 5.49 0.0001 2.06807 4.78871 0.99070 0.15296 6.48 t α 2,(n-2) 5. Si tc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha: Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha: 6. Conclusión. Realizar la interpretación en base al paso 4) y concluir de acuerdo al tenor del problema. Fisher sugiere la transformación de r en z, como sigue: Z r =

1 1+ r , donde ln 2 1− r

ln es el logaritmo natural. Es posible demostrar que Z , sigue una distribución aproxi-

FG H

IJ K

r

1 1+ ρ madamente normal, con: E ( Z r ) = µ = Zρ = ln , 2 1− ρ

V(Z r ) =

1 n−3

Para probar la hipótesis nula (Ho:) que indica que ρ es igual a un valor diferente de cero, la estadística de prueba es: Z c =

Z r − Zρ 1

n−3

que sigue una distribución aproxi-

madamente normal con N(0,1). En algunas situaciones, los datos disponibles para el análisis no cumplen con las suposiciones necesarias para el uso de los procedimientos estudiados. La prueba de hipótesis respecto al coeficiente de correlación de la población. En tales circunstancias es conveniente utilizar la técnica de correlación de rango de Spearman.

- 30 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

INTERVALO DE CONFIANZA PARA ρ Para encontrar el intervalo de confidencial, se utiliza la transformación de Fisher del (1- α )x100, para ρ . Este procedimiento se calcula con la siguiente fórmula para el intervalo de confianza:

Pr tanh( Z r − E 0 ) ≤ ρ ≤ tanh( Z r + E 0 ) = 1 − α Donde:

FG IJ H K

1 1+ r Z r = ln , 2 1− r tanh( x) =

E0 =

eX − e− X , eX + e−X

Zα 2 n−3

tanh: Tangente hiperbólica

COEFICIENTE DE DETERMINACIÓN: R2 ó r2 El coeficiente de determinación, R2, es el valor cuadrado del coeficiente r de Pearson, y representa la proporción de la varianza explicada por una variable respecto a la varianza total, también se conoce con el nombre de determinación porque se considera como la medida del grado de influencia de una variable frente a la otra variable. El coeficiente de determinación mide la proporción de la variación que se explica por la variable independiente en el modelo de regresión, y está definido por:

R2 = r2 =

Varianza Explicada SSRm x100 = x100 SSTm Varianza Total

El valor complementario del coeficiente de determinación, 1-R2, recibe el nombre de coeficiente de no determinación ó coeficiente de alineación, que indica la varianza de una variable no explicada por otra.

~2 ) COEFICIENTE DE DETERMINACIÓN AJUSTADO ( R El coeficiente de determinación ajustado, se puede expresar con las siguientes fórmulas:

MSE ~ R2 = 1− MSTm

Análisis y Diseño de Experimentos - 31 EJEMPLO: Calcular el coeficiente de correlación de Pearson «r» y coeficiente de determinación R2 del ejemplo 1, que corresponde a los datos para el análisis sensorial de la naranza Wasgington Navel «hipobárico» en su apariencia general externa. X= Tiempo (días) e Y= Apariencia general externa (puntaje) El coeficiente de correlación queda definido por. rxy =

∑ X Y −( ∑ X )( ∑Y ) n − ( ∑ X ) n ∑Y −( ∑Y ) i i

∑X

2 i

i

=

i

2

i

2

i

2

i

n

91325 . − ( 431)( 2715 . )9 ( 28909 − ( 431)2 9 )(1006225 . . )2 9 ) −( 2715

. = −0983

Se ha encontrado una correlación negativa y alta, es decir existe una directa asociación entre la variable sobre el tiempo en días y la apariencia general externa en forma inversa. Calculamos el Coeficiente de Determinación R2.

R2 =

18.106109 SSRm x100 = 96.72% x100 = 18.72 SSTm

El 96.72% de la variación de la apareiencia general externa (puntajes) está explicado por la variación del tiempo (días), y 3.28% está explicado por otros factores externos o lo que no se puede controlar en el modelo. Calculamos el Coeficiente de Determinación Ajustada: MSE 0.087698699 ~2 Rajust x100 = 1x100 = 96.25% . = 1− MSTm 2.34

El 96.25% indica que el modelo tiene buen ajuste y es confiable para realizar las predicciones futuras, asimismo se puede recomendar el uso de este modelo para los estudios en otros lugares.

Análisis gráfico de Residuos. Como complemento a lo que se ha desarrollado hasta el momento, un análisis adecuado de los residuos da información adicional sobre la calidad del ajuste del modelo de regresión y de esta forma verificar si el modelo es adecuado. Las gráficas que se hacen para completar el diagnóstico del modelo son: graficar los residuos en papel de probabilidad normal, graficar los residuos contra los predichos, los residuos contra cada variable regresora y contra alguna otra variable importante que no haya sido incluido en el modelo. A continuación presentamos la gráfica de residuos con-

- 32 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

tra predicios ( ε i vs Y$i ) . Si el modelo es adecuado, se espera que en esta gráfica los puntos no sigan ningún patrón, y que por tanto estén distribuidos más o menos aleatoriamente a lo largo y ancho de la gráfica. Cuando esto ocurre significa que el modelo se ajusta de igual manera a lo largo de los valores de Y, si esto no ocurre habrá que ver cuál es el tipo de patrón que se observa en la gráfica y diagnosticar cuál es la falla que registra el modelo. La gráfica que se muestra en seguida no muestra ninguna anomalía, por lo que esto es una evidencia más en favor del modelo de regresión lineal simple para nuestro ejemplo.

Probar la hipótesis para 1. Hipótesis Estadística:

ρ≠0 H 0: ρ = 0 H a: ρ ≠ 0

(ausencia de correlación entre las variables) (existencia de correlación entre las variables en forma directa).

Análisis y Diseño de Experimentos - 33 2. Elegir el nivel de significación: 3. Estadígrafo de Contraste: t =

α = 0.05

r n-2 1- r 2

~ t n−2 ,

4. Establecer la Región de rechazo y aceptación.

RA Ho : - 2.365 ≤ t c ≤ 2.365 RR Ho : t c < -2.365 ó t c > 2.365 5. Cálculo del valor experimental.

t=

r n-2 1- r

2

=

−0.98347 7 1- (-0.98347) 2

= −14.36865

6. Decisión: Como tc =14.37 > t0.025,7 =2.365, entonces cae en la región de rechazo, aceptándose la Ha: y se rechaza la H0:. 7. Conclusión: Existe suficiente evidencia para afirmar que ρ ≠ 0 , es decir que la correlación es diferente de cero. Esto corrobora a los resultados de la correlación encontrada. Calcular el intervalo confidencial para ρ . Para encontrar el Intervalo Confidencial, se utiliza la transformación de Fisher del (1- α )x100 para ρ . Cuya fórmula es el siguiente:

Pr tanh( Zr − E0 ) ≤ ρ ≤ tanh( Zr + E0 ) = 1 − α Calcular el Intervalo Confidencial al 95% de confianza para ρ con la información del ejmplo 1.

FG H

IJ K

1 1 + ( −0.98347 ) Zr = ln = −2.3937 , 2 1 − ( −0.98347 )

E0 =

Zα 2 n−3

=

. 196 = 0.80 6

- 34 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Reemplazando al Intervalo se obtiene el límite inferior del intervalo y límite superior del intervalo:

Pr tanh( −2.3937 − 0.8 ) ≤ ρ ≤ tanh( −2.3937 + 0.8 = 0.95

Pr tanh( −31937 . ) ≤ ρ ≤ tanh( −15937 . ) = 0.95 tanh( −31937 . )=

e −3.1937 − e 3.1937 −24.33744 = = −0.9966 e −3.1937 + e 3.1937 24.41948

tanh( −15937 . )=

e −1.5937 − e1.5937 −4.71875 = = −0.9207 −1.5937 1.5937 e 51250989 . +e

Pr -0.9966 ≤ ρ ≤ −0.9207 = 0.95 Otra forma: Se puede encontrar usando tablas preparadas para la transformación de r a Z; los valores aparecen en el cuerpo de la tabla para valores correspondientes de r, los coeficientes de correlación están en los márgenes. Ubicar en el cuerpo de la tabla el valor 3.1937 para el límite inferior del intervalo, esto es 0.99 que debe ser cambiado con signo menos, es decir -0.99. En forma similar para el límite superior del intervalo ubicar en el cuerpo de la tabla el valor 1.5937 que corresponde a 0.92 que debe ser cambiado de signo a -0.92. EJEMPLO 4. Calcular el coeficiente de correlación de Pearson «r» y coeficiente de determinación R2 para el ejemplo 2 que corresponde a la información sobre el número de horas de estudio (X) para preparar un examen de matemáticas, y la calificación obtenida en dicho examen (Y). El coeficiente de correlación queda definido por. rxy =

∑XY −(∑X )(∑Y ) n ∑X −(∑X ) n ∑Y −(∑Y ) i i

2 i

i

i

=

i

2

2

i

2

i

n

4145 . −(535 . )(101) 14 ( 23325 . −(535 . )2 14)(765−(101)2 14)

= 08818 .

Se ha encontrado una correlación positiva y alta, es decir existe una directa asociación entre la variable sobre el número de horas de estudio para preparar un examen y la calificación obtenida en el examen. Calculamos el Coeficiente de Determinación R2.

R2 =

28.270348 SSRm x100 = x100 = 77.76% 36.35714286 SSTm

Análisis y Diseño de Experimentos - 35 Se puede interpretar que el modelo tiene buen ajuste. El 77.76% de la variación en la calificación obtenida (puntos) está explicado por la variación del número de horas de estudio para preparar un examen de matemáticas, y 22.24% está explicado por otros factores ajenos al modelo. Calculamos el Coeficiente de Determinación Ajustada: MSE 0.673899566 ~2 Rajust x100 = 1x100 = 75.90% . = 1− MSTm 2.796703297

Probar la hipótesis para 1. Hipótesis Estadística:

ρ≠0 H 0: ρ = 0 Ha: ρ ≠ 0

(ausencia de correlación entre las variables) (existencia de correlación entre las variables en forma directa). 2. Elegir el nivel de significación: 3. Estadígrafo de Contraste: t =

α = 0.05

r n-2

,

1- r 2

4. Establecer la Región de rechazo y aceptación.

RA Ho : - 2.179 ≤ t c ≤ 2.179 RR Ho : t c < -2.179 ó t c > 2.179 5. Cálculo del valor experimental.

0.95 -2.179

RR/Ho:

r n-2 1- r

2

=

08818 . 12 1-0.88182

0

ρ

2.179

t RR/Ho:

RA/Ha: Valor crítico

t=

0.05 2

0.05 2

Valor crítico

. = 647688

6. Decisión: Como tc =6.477 > t0.025,12 =2.179, cae en la región de rechazo, entonces se acepta la Ha: y se rechaza la H0:. 7. Conclusión: Se puede concluir que existe diferencia significativa entre la variable horas de estudio para preparar el examen y la calificación obtenida en el examen.

- 36 -

V. Ibañez Q. - Docente FINESI - UNA - Puno Calcular el intervalo confidencial para ρ .

Zr =

FG H

IJ K

1 1 + 0.8818 = 13838 ln . , 2 1 − 0.8818

E0 =

Zα 2 n−3

=

196 . = 0.59096 11

Pr tanh( Zr − E0 ) ≤ ρ ≤ tanh( Zr + E0 ) = 1 − α Pr tanh ( 1.3838 − 0 .59096 ) ≤ ρ ≤ tanh ( 1.3838 + 0 .59096 ) = 0 .95

P r tanh ( 0 .79284 ) ≤ ρ ≤ tanh ( 1.97476 ) = 0 .95 e 0.79284 − e −0.79284 1757105 . tanh( 0.79284 ) = 0.79284 = = 0.660 −0 .79284 e +e 2.66222067

tanh( 197476 . )=

e1.97476 − e −1.97476 7.0660956 = = 0.9622 −1.97476 1.97476 e 7.34368489 +e

Pr 0.660 ≤ ρ ≤ 0.9622 = 0.95 EJERCICIOS: Para cada uno de los siguientes ejercicios: a) Fijar el modelo de regresión lineal simple, b) Graficar el diagrama de dispersión, c) Estimar la ecuación de regresión, d) graficar la ecuación estimada, calcule los errores, y grafique e) Realice el ANOVA, ~2 R2, Rajust . f) Probar la hipótesis b1 ≠ 0 , g) Calcule los intervalos confidenciales para

bi , h) Encontrar el intervalo confidencial para la respuesta media E(Y ), i) Calcule h el intervalo confidencial para la predicción u observación futura Y , j) Calcule el h(new)

coeficiente de correlación de Pearson «r», k) Pruebe la hipótesis para

ρ ≠ 0 al nivel

de significación de 0.05, l) Construya el intervalo de confianza del 95% para ρ e interpretar en cada uno de las preguntas anteriores. 1.- Considere los datos de la tabla siguiente, en donde X = Gastos semanales de publicidad, y Y = Ventas semanales. Pronostique las ventas para un gasto de publicidad de $50 dólares. Y ($) 1250 X ($) 41

1380 54

1425 63

1425 54

1450 48

1300 46

1400 62

1510 61

1575 64

1650 71

Análisis y Diseño de Experimentos - 37 2.- En la tabla siguiente se muestran los tiempos requeridos de atención a clientes en las cajas de un supermercado y los valores de las compras. Dé un punto e intervalo de estimación de 99% para Y si X = 3.0. Tiempo requerido de atención (en minutos) Valor de las compras (en $)

3.6 30.6

4.1 30.5

0.8 2.4

5.7 42.2

3.4 21.8

1.8 6.2

4.3 40.1

0.2 2

2.6 15.5

3.- Andrew Vazsony es el gerente de la cadena de supermercado Spendwise. A él le gustaría poder pronosticar las venas de libros en rústica (libros por semana), con base en la cantidad de espacio disponible en los estantes (en pies). Andrew reúne datos para una muestra de 11 semanas. Semana N° de libros vendidos Y Pies de espacio en estante X

1 2 3 4 5 6 7 8 9 10 11 275 142 168 197 215 188 241 295 125 266 200 6.8 3.3 4.1 4.2 4.8 3.9 4.9 7.7 3.1 5.9 5

4.- En la siguiente tabla se presenta información de una empresa de órdenes por correo, para las 12 ciudades. Pronostique las órdenes por correo recibidas cuando se distribuyen 10000 catálogos. Ciudad N° órdenes recibidas por correo, Y (en miles) N° de catálogos distribuidos, X (miles)

A 24

B 16

C 23

D 15

E 32

F 25

G 18

H 18

I 35

J 34

K 15

L 32

6

2

5

1

10

7

15

3

11

13

2

12

5.- En una regresión de inversiones sobre la tasa de interés, se observaron los resultados que se muetran en la tabla siguiente, para un período de 10 años. ¿Podemos pronosticar la inversión anual si la tasa de interés dentro de 5 años es del 4%? Inversión anual (miles de dólares) Tasa promedio de interés (%)

1060 940 920 1110 1590 2050 2070 2030 1780 142 4.8 5.1 5.9 5.1 4.8 3.8 3.7 4.5 4.9 6.2

6.- Los siguientes datos muestran la densidad óptica de cierta substancia en diferentes niveles de concentraicón. Nivel de concentración (X) 80 120 160 200 240 280 320 360 400 440 480 Densidad óptica (Y) 0.08 0.12 0.18 0.21 0.28 0.28 0.38 0.40 0.42 0.50 0.52

7.- Se recolectaron los siguientes datos a partir de un estudio de la relación entre la inteligencia y el número de hijos por familia. N° de niños en la familia Inteligencia de todos los niños de la familia

1 2 3 4 5 6 7 105 102 104 100 97 101 95

8 93

9 97

- 38 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

8.- Las siguientes mediciones se efectuaron en 20 áreas geográficas. La variable X es la medición combinada de contaminación del aire y agua en la zona, y Y es la medición del estado de salud de los residentes del área. Entre mayor sea el valor de X, hay mayor contaminación y entre mayor sea el valor de Y, la salud es más precaria. X Y X Y

73 90 67 76

52 74 73 82

68 91 71 93

47 62 57 73

60 63 86 82

71 78 76 88

67 60 91 97

80 89 69 80

86 82 87 87

91 105 77 95

9. Los siguientes valores representan 15 lecturas que indican el volumen del tráfico y la concentración de monóxido de carbono tomados en un laboratorio para determinar la calidad del aire de cierta ciudad. Volumen del tráfico (autos/hora) "X" 100 110 125 150 175 190 200 225 250 275 300 325 350 375 400 CO(PPM) (Y) 8.8 9.0 9.5 10.0 10.5 10.5 10.5 10.6 11.0 12.1 12.1 12.5 13.0 13.2 14.5

10. Se espera que, por lo general, el número de horas de estudio (X) en la preparación de un examen tenga una correlación directa (positiva) con la calificación (Y) alcanzada en tal examen. En la tabla siguiente se presentan las horas de estudio así como las calificaciones obtenidas por diez estudiantes seleccionados al azar de un grupo. Estudiante 1 Horas de estudio (X) 10 Calificación en el examen (Y) 51

2 6 36

3 15 67

4 11 63

5 7 44

6 19 89

7 17 80

8 3 26

9 13 50

10 TOTAL 17 118 85 591

11. Los datos muestran el aumento en la rapidez de lectura (Y), y el número de semanas que se asistió a un curso para mejorarla (X), para ocho estudiantes: X Y

3 80

5 110

2 50

8 190

6 160

9 230

3 70

4 110

12. Las calificaciones de un grupo de estudiantes en su reporte de medio años (X) y en los exámenes finales (Y) fueron los siguientes: X Y

77 82.00

50 66.00

71 78.00

72 34.00

81 47.00

94 85.00

96 99.00

99 99.00

67 68.00

13. A un grupo de 20 estudiantes de un curso de computación para principiantes se les aplicó una prueba de aptitud computacional con un puntaje X, y otra de aprovechamiento final con un puntaje Y (medida como un examen de conocimiento).

Análisis y Diseño de Experimentos - 39 Los resultados fueron los siguientes: X Y

4 19

16 19

20 24

13 36

22 27

21 26

15 25

20 28

19 17

16 27

18 21

17 24

8 18

6 18

5 14

20 28

18 21

11 22

19 20

14 21

14. Los datos siguientes hacen referencia al número de horas invertidas para preparar un examen (X) y la calificación recibida en este último (Y) (esta última expresa en decenas). X Y

2 5

3 5

3 7

4 5

4 7

5 7

5 8

6 6

6 9

6 8

7 7

7 7 8 8 9 10 8 9

15. Se preguntó a 10 estudiantes de una muestra la distancia recorrida y el tiempo que utilizaron para llegar a la Universidad el día anterior. Los datos reunidos se tienen en la tabla siguiente: Re c o rrid o (X ) T ie mp o (Y)

1 5

3 10

5 15

5 20

7 15

7 25

8 20

10 25

10 35

12 35

16. Se obtuvieron los siguientes datos para determinar la relación entre cantidad de fertilizante y producción de papa por hectárea. Sacos de fertilizante por hectárea Rendimiento en quintales

3 45

4 48

5 52

6 55

7 60

8 65

9 68

10 70

11 74

12 76

17. Un comerciante minorista encargó un estudio para determinar la relación entre los gastos de publicidad semanal por radio y las ventas de sus productos. En la quinta semana por diversos motivos no se pudo hacer el estudio. En el estudio se obtuvieron los siguientes resultados: Semana Gastos de publicidad ($) Ventas ($)

2 3 4 30 20 40 300 250 400

5 30 --

6 7 8 9 10 11 50 70 60 80 70 80 550 750 630 930 700 840

- 40 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

1.3. REGRESIÓN LINEAL MÚLTIPLE (RLM) Muchos problemas de regresión involucran más de una variable regresiva. Tales modelos de regresión se denominan regresión múltiple. La regresión múltiple es una de las técnicas estadísticas más ampliamente utilizadas en la actualidad. En esta oportunidad se presenta las técnicas básicas de la estimación de parámetros conocido como el Métodos de los Mínimos Cuadrados, además se realizará la estimación del intervalo de confianza y de la verificación de la suficiencia del modelo para la regresión múltiple. Se presentará también algunos de los problemas encontrados con frecuencia en el uso práctico de la regresión múltiple, incluyendo la construcción del modelo y la selección de variables y la dependencia casi lineal entre los regresores. El modelo de regresión que involucra más de una variable regresora se llama modelo de regresión múltiple; como un ejemplo, supóngase Y la variabledependiente, X1 y X2 son las variables independientes. Un modelo de regresión múltiple que podría describir esta relación es:

Y = β 0 + β1 X 1 + β 2 X 2 + ε Donde: Y = Representa la variable dependiente. X1 y X2 = Son las variables independiente o regresoras.

β 0 ,β1 ,β 2 = Son los parámetros desconocidos que será estimado. ε = Es el error residual o perturbación.

El parámetro β 0 define la ordenada al origen del plano. Algunas veces llamamos a β1 y β 2 coeficientes de regresión parciales, porque β 1 mide el cambio esperado en Y por cambio unitario en X1 cuando X2 se mantiene constante, y β 2 mide el cambio esperado en Y por cambio unitario en X2 cuando X1 se mantiene constante. En general, sea X 1 , X 2 ,L , X k variables independientes o regresoras, ya sea Y una variable de respuesta, entonces el modelo de regresión lineal múltiple con «k» variables independientes es el polinomio de primer orden:

Yi = β 0 + β 1 X i 1 + β 2 X i 2 + L + β k X ik + ε i ; ó Y = X β

Análisis y Diseño de Experimentos - 41 Se denomina modelo de regresión lineal múltiple con k-variables independientes. Los parámetros β j , j = 0,1,K , k , se llaman coeficientes de regresión. Este modelo describe un hiperplano en el espacio k-dimensional de las variables regresoras Xi. El término lineal del modelo de regresión se emplea debido a que la ecuación anterior es función lineal de los parámetros desconocidos β 0 , β 1 ,K , β k . La interpretación de éstos es muy similar a lo ya explicado para el caso de regresión lineal simple: β 0 es la ordenada al origen, y β j mide el cambio esperado en Y por cambio unitario de Xj cuando el resto de las variables regresoras se mantienen fijas o constantes. Estimación de los parámetros del modelo. Para estimar los parámetros de la regresión lineal múltiple se necesita contar con «n» datos (n>k). El método de Mínimos Cuadrados puede utilizarse para estimar los coeficientes de regresión. Supóngase que se dispone n>k observaciones, y déjese que Xij denote la observación iésima o el nivel de la variable Xj. En términos de los datos, el modelo de regresión lineal múltiple puede escribirse de la siguiente manera:

Yi = β 0 + β1 X i1 + β 2 X i 2 + L + β k X ik + ε i k

= β 0 + ∑ β j X ij + ε i

i = 1,2 ,...., N

j =1

Para estimar por el método de mínimos cuadrados, se despeja el error. k

ε i = Yi − β 0 − ∑ β j X ij , elevamos al cuadrado ambos miembros se tiene: j =1

k

ε i2 = (Yi − β 0 − ∑ β j X ij ) 2 aplicamos la sumatoria a ambos miembros: j =1

k

∑i =1 ε i2 = ∑i =1 (Yi − β 0 − ∑ β j X ij ) 2 a partir de esto, se realiza la derivada n

n

j =1

parcial con respecto a los parámetros del modelo para encontrar las ecuaciones normales.

- 42 -

V. Ibañez Q. - Docente FINESI - UNA - Puno



e∑ ε j n

i =1

2 i

∂β 0

k

= 2∑i =1 (Yi − β 0 − ∑ β j X ij )(-1) = 0 n

j =1

β$ 0 ,β$ 1 ,L,β$ k

n

n

n

n

i =1

i =1

i =1

i =1

nβ$ 0 + β$ 1 ∑ X i1 + β$ 2 ∑ X i 2 +L+β$ k ∑ X ik = ∑ Yi

.................. (1)

y



e∑ ε j n 2 i =1 i

∂β j

k

, ,3,..., k .....(2) = 2∑i =1 (Yi − β 0 − ∑ β j Xij )(-Xij ) = 0; j = 12 n

j =1

β$ 0 ,β$ 1 ,L,β$ k

Al simplificar la ecuación (1) y (2), obtenemos las ecuaciones normales de mínimos cuadrados: nβ$ 0

+

n

β$ 0∑Xi1 + i=1

M

M

n

n

+

β$1∑Xi21

+ β$ 2∑Xi1Xi2 + L + β$ k ∑Xi1Xik =

i=1 n

i=1

M

β$ 2∑Xi2

+ L +

i=1 n

M

i=1

M

i=1

i=1

β$ k ∑Xik

=

i=1 n

M M M

M M M M M M M M n n n $β X + β$ X X + β$ X X + L + 0∑ ik 1∑ i1 ik 2 ∑ i2 ik i=1

n

β$1∑Xi1

i=1

M

M

M n $β X2 k ∑ ik

M

i=1

=

n

∑Y i

i=1 n

∑X Y i1 i

i=1

n

M

(3)

M

∑X Y ik i

i=1

Nótese que hay p = k+1 ecuaciones normales, una para cada uno de los coeficientes de regresión desconocidos. La solución para las ecuaciones normales serán los estimadores de mínimos cuadrados ordinarios de los coeficientes de regresión, β$ 0 , β$ 1 ,K , β$ k .

Ilustar el procedimiento de estimación por mínimos cuadrados es más sencillo si se utiliza la notación matricial. Daremos ahora un desarrollo matricial de las ecuaciones normales que es similar al desarrollo de la ecuación anterior. El modelo en términos de las observaciones, se puede escribir en notación matricial o llamada también forma compacta como: Y = Xβ + ε Si asignamos a X i 0 = 1 , entonces extendiendo en forma general para kvariables X tenemos:

Análisis y Diseño de Experimentos - 43 -

LMY OP Y Y=M P MM M PP NY Q

LM X X X =M MM M NX

10

1

20

1

N Nx1

N0

LMβ OP β β=M P MM M PP Nβ Q

OP PP PQ

0

LM ε OP ε ε=M P MM M PP Nε Q

OP PP PQ

N( k+1)

1

1

k

LM MM MN

X11 X12 L X1k 1 X11 X12 L X1k X21 X22 L X2k 1 X21 X22 L X2k = M M M M M M M XN1 XN2 L XNk 1 XN1 XN2 L XNk

y ( k +1 ) x 1

2

N

, además se sabe que: Y = Xβ + ε Nx 1

Propiedades: a) E( ε ) = 0, E( Y ) = Xβ, Y = E( Y ) + ε , ⇒ ε = Y − E( Y ) b) Var ( ε ) = E ε − E ( ε ) ε − E ( ε ) ' = E ( εε' ) = σ 2 I N c)

Cov( ei , e j ) = 0, ∀i ≠ j

Estimación de los parámetros ( β 0 , β 1 ,L , β k )(Forma matricial). Para estimar el parámetro β , utilizamos el método de los mínimos cuadrados, es decir se debe minimizar el error de la siguiente forma: N

∑ε

2 i

=ε' ε = Y − E ( Y ) ' Y − E ( Y )

i =1

= ( Y − Xβ )' ( Y − Xβ ) = ( Y' −β' X ' )( Y − Xβ ) = ( Y' Y −

Y' Xβ 123

− β' X ' Y + β' X ' Xβ

( Y ' Xβ )' = β' X ' Y

= ( Y' Y − β' X ' Y − β' X ' Y + β' X ' Xβ = Y' Y − 2β' X ' Y + β' X ' Xβ

- 44 -

V. Ibañez Q. - Docente FINESI - UNA - Puno NOTA: Por propiedad se sabe que: a) ∂( a' X ) = a , ⇒ ∂X

∂( X ' Y )' β = X' Y ∂β

b) ∂( X ' AX ) = 2 AX , ⇒ ∂X

∂( β' X ' X β ) = 2 X ' Xβ ∂β

Simplificando se tiene que X ' Xβ$ = X ' Y , que son las ecuaciones normales de mínimos cuadrados. Para resolver las ecuaciones normales, multiplíquense ambos lados de la ecuación X ' Xβ$ = X ' Y por la inversa de X'X. De tal modo, el estimador de mínimos cuadrados de β es:

( X ' X )−1 X ' Xβ$ = ( X ' X )−1 X ' Y , ⇒ β$ = ( X ' X )−1 X ' Y Es fácil ver que la forma matricial de las ecuaciones normales es idéntica a la forma escalar. Al escribir completa la ecuación X ' Xβ$ = X ' Y obtenemos:

LM n MM MM∑ X MM M MN∑ X

n

∑ X i1 i =1 n

n

i1

i =1

i =1

n

i =1

∑X n

ik

∑ Xi2

2 i1

M

L

i =1

n

∑ Xi1 Xik i =1

n

∑X i =1 n

i1

Xi 2 L

M

∑ Xi 2 Xik L i =1

n

∑X i =1

i =1

i1

X ik

M n

∑ Xik2 i =1

i

0

n

∑X

OP L YO $β O M ∑ P L PP M $ P M PP M β X Y PP MM M PP = M∑ P PP MMNβ$ PPQ MM M PP MM∑ X Y PP PQ Q N n

ik

i =1

n

1

i1 i

i =1 n

k

ik i

i =1

Cuando X ' X es de rango completo, la solución de X ' Xβ$ = X ' Y para β$ puede $ ( X' X )−1 X' Y . Por otro lado si ( X ' X )−1 no existe, entonces la solución ser escrito como β=

de X ' Xβ$ = X ' Y puede ser escrito en términos de una inversa generalizada de X ' X . Este es el caso de modelo de rango no completo. Por la naturaleza de X mostrada anteriormente la matriz X ' X es cuadrada de orden (k+1), con los elementos que son suma de cuadrados y productos, como se presenta a continuación:

Análisis y Diseño de Experimentos - 45 -

LM ∑X MM X X X' X = M∑ MM M MM∑X X N n

2 i0

n

i =1

i0

n

∑X

i0

i =1

i=1

ik

i =1 n

n

∑X

2 i1

i =1

i0

i0

∑X

i1

n

n

∑X

Xi1

i =1

i1

i=1

M

n

∑X

i1

n

i2

i=1

i0

LM∑X Y OP L MM PP MM Y X' Y = M∑ X Y P = M∑ X Y MM M PP MM MM∑X Y PP MMN∑X Y N Q n

Xik

i =1 n

Xi2 L

i1

ik

i =1

M

∑X

Xik

OP PP X X ∑ PP, M P ∑ X PPQ n

∑X

Xi 2 L

i=1 n

y

i1 i

i =1

i =1 n

n

2 ik

i =1



n

i1 i

n

Xik L

i0 i

ik i

ik i

i =1

i =1

i =1

Así X ' X es la matriz de suma de cuadrados y productos de los Xs observados y X'Y es el vector de suma de productos de los Xs observados e Ys. Además, se sabe que las expresiones puede tomar la forma siguiente:

X i 0 = 1, ∀i =1,2 ,...., N ,

LM n M∑X X' X = M∑X MM M MN∑X

i1

i2

ik

∑X ∑X

∑X ∑X ∑X ∑X X ∑X X ∑X i1 2 i1

i1 i2

M ∑Xi1Xik

i2

i1 i2 2 i2

2 i0

∑X

= N,

i0

Y = ∑ Yi = Y .

X i1 = ∑ X i1 = X .1

i1 i

L L L

M ∑Xi2 Xik L

X ∑X OP LM n X X X X X X X ∑ ∑ ∑ P M P M X X X X = X X ∑ ∑ P M ∑ .1

ik

i1 ik

i2

M ∑Xik2

ik

.1

.2

PP M M Q MNX

.k

.2

2 i1

i1 i2

M X ∑ i1Xik

i1 i2 2 i2

L L L

M X ∑ i2 Xik L

O

∑X X PP ∑X X PP X.k

i1 ik

i2

M ∑Xik2

ik

PP Q

Los elementos de la diagonal de X ' X son las sumas de cuadrados de los elementos en las columnas de X, y los elementos fuera de la diagonal son las sumas de los productos cruzados de los elementos de las columnas de X. Además, los elementos de X ' Y son las sumas de los productos cruzados de las columnas de X y las observaciones {Yi}. El modelo de regresión ajustado es: k

Y$ = Xβ$ . En notación escalar es:

y$i = β$ 0 + ∑ β$ j xij , i = 1,2 ,.., n j =1

- 46 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Consecuencias de la Estimación. -1 A continuación presentamos algunas propiedades de β$ = (X' X) X' Y , bajo el

supuesto de que ε ~ N ( 0 ,σ 2 I n ) ,

E( ε ) = 0 , v( ε ) = σ 2 In .

a) Insesgamiento: Desde que β$ es el BLUE de β para V = σ 2 I n , este es insesgado a partir de la definición de valor esperado, se demuestra que efecto:

E( β$ ) = β .

En

E ( β$ ) = E (X' X) -1 X' Y = (X' X) -1 X' E(Y) = (X' X) -1 X' Xβ = β b) Varianza de β$ . La matriz de Varianzas-Covarianzas de β$ está dado por: V( β$ ) = E[ β$ − E (β$ )][ β$ − E ( β$ )]'

m = E m[(X' X)

r

= E [(X' X) -1 X' Y − E ((X' X) -1 X' Y)][(X' X) -1 X' Y − E ((X' X) -1 X'Y)]' -1

m = E m[(X' X)

r

X' (Y − E (Y)][(X' X) -1 X' (Y − E (Y)]'

r ]r

= E [(X' X) -1 X' ε ][(X' X) -1 X' ε ]' -1

X' ε ][ε' X(X' X) -1

= (X' X) -1 X' E (εε' )X(X' X) -1

= (X' X) -1 X' X(X' X) -1 σ 2 I = (X' X) -1σ 2

Prueba de Hipótesis en Regresión Lineal Múltiple. En esta sección veremos la prueba de hipótesis sobre los parámetros del modelo que son equivalentes a las realizadas para la regresión lineal simple, pero que ahora son más necesarias, dado que en regresión lineal múltiple tenemos más parámetros en el modelo, que por lo general es necesario evaluar su verdadera contribución a la explicación de la respueta. En este caso, también requerimos de la suposición adicio-

Análisis y Diseño de Experimentos - 47 nal de que los errores deben distribuirse en forma normal, independientes, con medio cero y varianza constante

σ 2 ( ε i ~ NID( 0,σ 2 ) . Una consecuencia de esta suposi-

e

j

ción es que las observaciones yi son NID β 0 + ∑ j =1 β j X ij ,σ 2 . k

1. Hipótesis Estadística: H0 : β 1 = β 2 =L = β k = 0

Ha : β j ≠ 0 para al menos un j = 1,2,3,.., k 2. Nivel de significación:

α = 0.05

3. Estadístico de prueba.

F (Re g ) =

SSRm r − 1 MSRm = ~ Fnr−−r1,α SSE n − r MSE

4. Región de rechazo ó aceptación.

RA H0 :

F (Re g ) ≤ Fnr−−r1,α entonces se acepta la Ho:

RR H0 :

F (Re g ) > Fnr−−r1,α entonces se acepta la Ha:

5. ANOVA para la significación del modelo de regresión lineal múltiple. Fuentes de Variación G.L.

Suma de Cuadrados

Cuadrados Medios

Regresión

r-1

SSRm = β$' X' Y −nY 2

SSRm = MSRm r −1

Error Residual

n- r

SSE =Y' Y −β$ ' X' Y

SSE = MSE r −n

Total

n- 1

SSTm =Y' Y −nY 2

Fobs.

F(Reg)=

MSRm MSE

MSTm = SSTm n −1

El coeficiente de determinación es: R 2 =

SSRm MSE ~2 x100 , R Ajust )x100 . = (1 − SSTm MSTm

Ambos coeficientes se interpretan de forma similar al caso de regresión lineal simple, como el porcentaje de variabilidad de los datos que es explicada por el mode~

2 2 lo. Se cumple que 0 < R Ajust . ≤ R < 1 ; en general para hablar de un modelo que tiene un ajuste satisfactorio es necesario que ambos coeficientes tengan valores superiores

- 48 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

a 0.7. Cuando en el modelo hay términos que no contribuyen de manera significativa ~

2 2 al modelo, el R Ajust . tiende a ser menor que el R . Por ello es deseable depurar el modelo y para ello las pruebas de hipótesis son de mucha utilidad.

Pruebas sobre coeficientes individuales del modelo. Un aspecto muy importante y clave en un análisis de regresión lineal múltiple es valorar qué tanto contribuyó cada término a la explicación de la variable de respuesta, para de esta forma eliminar los que tienen una contribución poco importante o quizá pensar en agregar otras variables no consideradas. Las hipótesis para probar la significancia de cualquier coeficiente individual de β j , se especifica de la siguiente manera: Hipótesis: H0 : β j = 0 Ha : β j ≠ 0

j = 0,1,2,3,.., k

De acuerdo con la sección anterior, el estimador de mínimos cuadrados β$ es un vector aleatorio, cuya distribución es normal con media β y matriz de varianzascovarianzas

(X' X) -1σ 2 .

Entonces, en resumen:

β$ j ~ N[ β j , σ 2 C j+1, j+1 ] . Donde

C j+1, j+1 es el elemento de la diagonal de la matriz (X' X) -1 correspondiente al parámetro β$ j . Otra forma alternativa es el siguiente: β$ ~ N[ β ,(X' X) -1σ 2 ] . El estimador de σ 2 es el cuadrado medio del error denotado por: MSE=CME (se encuentra en la tabla ANOVA), entonces el estadístico de prueba para probar la hipótesis es el siguiente:

tc =

β$ j − β j MSE ⋅ C j +1, j +1

=

β$ j − β j ~ tn −r $ V(β ) j

Se rechaza la hipótseis H o si tc > tα 2,n− r o en forma equivalente si pvalue= P( T > t c ) ≤ α . A continuación se presenta el resumen del análisis sobre el modelo de regresión basado sobre coeficientes individuales del modelo.

Análisis y Diseño de Experimentos - 49 -

PARÁMETRO ESTIMACIÓN

ERROR ESTÁNDAR

Intercepción

) β0

) MSE×C11 = V (β0 )

β1

) β1

) MSE×C22 = V(β1)

β2

) β2

) MSE×C33 = V (β2 )

. . .

. . .

βk

) βk

ESTADÍSTICO "t"

) ) β0 β0 = ) MSE × C11 V ( β0 ) ) ) β1 β1 = ) MSE × C22 V ( β1 ) ) ) β2 β2 = ) MSE × C33 V ( β2 )

. . .

. . .

) MSE × Ck +1,k +1 = V ( βk )

) ) βk βk = ) MSE ×Ck+1,k+1 V(βk )

VALOR-p

Pr(T > tc ) Pr(T > tc ) Pr(T > tc )

. . . Pr(T > tc )

Intervalos de Confianza y predicción en Regresión Lineal Múltiple. a) Intervalo Confidencial (IC) para β j . 2 Para un β j , su estimador β$ j ~ N[ β j , σ C j+1, j+1 ] donde C j+1, j+1 es el ele-

mento de la diagonal de la matriz

β$ j − β j σ 2 C j+1, j+1

(X' X) -1 . Estandarizando se tiene:

~ N ( 0,1 ), pero se sabe que:

SSE ~ χ n2 −r entonces: σ2

SSE ( n − r )σ$ 2 SSE ( n − r )σ$ 2 σ$ 2 = , ; ~ χ n2 − r = n−r σ2 σ2 σ2 Se realiza el cambio de variable cial para

t=

u=

(n−r )σ$ 2 para obtener un intervalo confidenσ2

2 2 σ 2 , es decir tendremos: Pr[ χ α 2 ≤ u ≤ χ 1−α 2 ] = 1 − α .

β$ j − β j ( n − r )σ$ 2 σ2

σ 2 C j+1, j+1 n−r

β$ j − β j

=

σ C j+1, j+1 σ$ 2 σ2

=

β$ j − β j σ$ C j+1, j+1

~ tn−r

- 50 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Pr − tα

2 ,n − r

LM MN

≤ t ≤ tα

Pr − tα 2 ,n − r ≤

= 1− α

2 ,n − r

β$ j − β j σ$ C j+1, j+1

OP PQ

≤ tα 2 ,n − r = 1 − α

Pr − tα 2 ,n − r σ$ C j+1, j+1 ≤ β$ j − β j ≤ tα 2 ,n − r σ$ C j+1, j+1 = 1 − α r estar −β$ j se tiene:

Pr −β$ j − tα 2,n−rσ$ C j+1, j+1 ≤ −β$/ j + β$/ j − β j ≤ −β$ j + tα 2,n−rσ$ C j+1, j+1 = Pr β$ j + tα 2 ,n − rσ$ C j+1, j+1 ≥ β j ≥ β$ j − tα 2 ,n − rσ$ C j+1, j+1 = 1 − α

LM $ C Pr β − t ≤β MMN14442σ$444 3 α 2 ,n − r

j

j+1, j+1

j

Límite Inferior del Intervalo

En resumen:

Límite Superior del Intervalo

LM N

β j ∈ β$ j ± tα 2 ,n − rσ$ C j+1, j+1

OP PPQ

≤ β$ j + tα 2 ,n − r σ$ C j+1, j+1 = 144424443

ó β j ∈ β$ j ± tα 2 ,n − r V( β$ j )

OP Q

b) Estimación del Intervalo para la respuesta media de E ( Y0 ) dado el vector

X'0 Sean los valores de X 1 , X 2 , X 3 ,L , X k denotado por X 01 , X 02 , X 03 ,L , X 0 k la respuesta media está denotado por E ( Y0 ) . Para estimar la respuesta media en este punto defínase el vector X 0 como sigue:

X 0' = 1 X 01

X 02 L

X 0k

La respuesta media estimada correspondiente para X 0 es denotado por:

Y$0 = X 0' β$

ó Y$h = X h' β$ , entonces este estimador es insesgado:

Y$0 .

Análisis y Diseño de Experimentos - 51 1) E ( Y$0 ) = E ( X 0' β$ ) = X 0' E ( β$ ) = X 0' E ( X ' X )−1 X ' Y = X 0' ( X ' X )−1 X ' E Y

= X 0' ( X ' X )−1 X ' Xβ = X 0' β es insesgado. 2) La varianza es: V ( X 0' β$ ) = X 0' V ( β$ ) X 0 = X 0' ( X ' X )−1σ 2 X 0 o su equivalente es: S 2 ( Y$0 ) = MSE X 0' ( X ' X )−1 X 0 , su estimador es:

E ( Y$0 ) = X 0' β$ ~ N X 0' β , X 0' ( X ' X )−1 X 0σ 2 , entonces:

X '0 β$ − X '0 β

σ X '0 ( X ' X )−1 X 0

SSE entonces: n−r

~ N ( 0,1 ), pero: σ$ 2 =

( n − r )σ$ 2 SSE SSE ; entonces ~ χ 2n − r = 2 2 2 σ σ σ 3) Para encontrar el Intervalo Confidencial para E ( Y0 ) , formamos la distribución de «t» de la siguiente manera: t=

X '0 β$ − X '0 β σ X '0 ( X ' X )−1 X 0 $2

( n − r )σ σ2

n−r

Pr − tα

LM MN

2 ,n − r

Pr −tα 2,n−r ≤

X '0 β$ − X '0 β

=

≤ t ≤ tα

σ

X '0 ( X ' X )−1 X 0 $2

σ σ2

2 ,n − r

X'0 β$ − X'0 β

σ$ X'0 ( X' X )−1 X0

=

X '0 β$ − X '0 β

σ$ X '0 ( X ' X )−1 X 0

= 1− α

OP PQ

≤ tα 2,n−r = 1−α

Pr −tα 2,n−rσ$ X'0 ( X' X )−1 X0 ≤ X'0 β$ − X'0 β ≤ tα 2,n−rσ$ X'0 ( X' X )−1 X0 = restar − X'0 β$ se tiene: Pr − X'0 β$ − tα 2,n−rσ$ X'0 ( X' X )−1 X0 ≤ − X'0 β$ + X'0 β$ − X'0 β ≤ − X'0 β$ + tα 2,n−rσ$ X'0 ( X' X )−1 X0 =

Pr X'0 β$ + tα 2,n−rσ$ X'0 ( X' X )−1 X0 ≥ X'0 β ≥ X'0 β$ − tα 2,n−rσ$ X'0 ( X' X )−1 X0 = 1− α

- 52 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

LM MN

Pr X '0 β$ − tα 2 ,n− rσ$ X '0 ( X ' X )−1 X 0 ≤ X '0 β ≤ X '0 β$ + tα 2 ,n− rσ$ X '0 ( X ' X )−1 X 0 144444 42444444 3 144444 42444444 3 Límite Inferior

Límite Superior

OP PQ

Pr X 0' β$ − tα 2 ,n −r S ( Y$0 ) ≤ E ( Y0 ) ≤ X 0' β$ + tα 2 ,n −r S ( Y$0 ) = 1 − α En resumen:

LM MN

X '0 β ∈ X '0 β$ ± tα 2 ,n− rσ$ X '0 ( X ' X )−1 X 0 12 3 123 Y0

Y$0

OP PQ

LM MN

ó Y0 ∈ X '0 β$ ± tα 2 ,n− r S ( Y$ 123 Y$0

c) Intervalo confidencial para la predicción de nuevas observaciones Yh ( new ) . Si X h = 1 '

X h1

X h2 L

X h , p −1 , con Y$h = X h' β$ , entonces :

1) E ( Y$h ) = E ( X h' β$ ) = X h' E ( β$ ) = X h' E ( X ' X )−1 X ' Y = X h' ( X ' X )−1 X ' E Y

= X h' ( X ' X )−1 X ' Xβ = X h' β es insesgado. 2) yh = X h' β + eh

~y = X ' β$ , donde X ' β$ son usados ambos para la predicción futura de h h h las observaciones correspondientes de X h' ' ' −1 −1 E ( ~yh ) = E ( X h' β$ ) = X h' E ( β$ ) = X h E ( X ' X ) X ' Y = X h ( X ' X ) X ' E Y

= X h' ( X ' X )−1 X ' Xβ = X h' β

yh − ~ yh = yh − X h' β$ = X h' β + eh − X h' β$ = X h' ( β − β$ ) + eh , pero cov( β$ ,eh ) = 0 3) La varianza es:

v( yh − ~yh ) = v( yh − X h' β$ )

= v( X h' β + eh − X h' β$ ) = v [ X h' ( β − β$ ) + eh ]

Análisis y Diseño de Experimentos - 53 -

= v [ X h' ( β − β$ )] + v( eh ) = X h' v( β − β$ ) X h ] + σ 2 = X h' v ( β$ ) X h + σ 2 = X h' ( X ' X )−1 σ 2 X h + σ 2

v( yh − ~yh ) = [ X h' ( X ' X )−1 X h + 1]σ 2 Entonces su estimadores es: X h' β$ ~ N [ X h' β ,( X h' ( X ' X )−1 X h + 1)σ 2 ] y se distribuye como: X h' β$ − X h' β X h' ( X ' X )−1 X h + 1 σ 2

~ N ( 0,1 ) estandarizada.

Pero, se sabe que: σ$ 2 = SSE , ( n − r )σ$ 2 = SSE dividiendo entre σ$ 2 a n−r ambos miembros tenemos:

( n − r )σ$ 2 SSE ( n − r )σ$ 2 ; ~ χ 2n − r . Luego formamos la «t», de = 2 2 2 σ σ σ la siguiente manera:

X'h β$ − X'h β t=

σ X'h ( X' X )−1 Xh + 1 $2

( n−r )σ σ2

n−r

X 'h β$ − X 'h β

=

σ X'h ( X ' X )−1 Xh +1 $2

σ σ2

=

X'h β$ − X'h β

σ$ X'h ( X' X )−1 Xh

~

4) Una predicción del intervalo con 1- α de coeficiente confidencial para una nueva observación Yh ( new ) correspondiente a

X h , para el valor espe-

cificado de X variables, se construye en seguida. El intervalo confidencial es:

Pr − tα

LM MN

2 ,n − r

Pr −tα 2 ,n− r ≤

≤ t ≤ tα

2 ,n − r

= 1− α

X 'h β$ − X 'h β

σ$ X 'h ( X ' X )−1 X h + 1

OP PQ

≤ tα 2 ,n − r = 1 − α

Pr −tα 2,n−rσ$ X'h ( X' X )−1 Xh +1 ≤ X'h β$ − X'h β ≤ tα 2,n−rσ$ X'h ( X' X )−1 Xh +1 =

- 54 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

restar − X 'h β$ se tiene: Pr − X'h β$ − tα 2,n−rσ$ X'h ( X' X )−1 Xh +1 ≤ − X'h β$ + X'h β$ − X'h β ≤ − X'h β$ + tα 2,n−rσ$ X'h ( X' X )−1 Xh +1

Pr X'h β$ + tα 2,n−rσ$ X'h ( X' X )−1 X h + 1 ≥ X'h β ≥ X'h β$ − tα 2,n−rσ$ X'h ( X' X )−1 Xh + 1

LM MN

O Q

Pr X'h β$ − tα 2 ,n−rσ$ X'h ( X' X )−1 Xh + 1 ≤ X'h β ≤ X'h β$ + tα 2,n−rσ$ X'h ( X' X )−1 X h + 1 144444424444443 144444424444443 Límite Inferior

Límite Superior

En forma resumida:

Pr Xh' β$ − tα 2,n−r S( Y$h( new ) ) ≤ Yh( new ) ≤ Xh' β$ + tα 2,n−r S( Y$h( new ) ) = 1− α S 2 ( Y$h( New ) ) = MSE 1 + X h' ( X ' X )−1 X h

S ( Y$h( New ) ) =

LM MN

MSE 1 + X h' ( X ' X )−1 X h

OP PQ

X'h β ∈ X'h β$ ± tα 2 ,n−rσ$ X'h ( X' X )−1 X h + 1 12 3 12 3 Yh( new )

Y$h

LM MN

ó Yh( new ) ∈ X'h β$ ± tα 2 ,n−r S( Y$h( 123 Y$h

EJEMPLO: En la provincia de Azángaro se obtuvieron la producción de papa (kg/ha) durante la campaña agrícola (Noviembre-Abril), para lo cual las se incorporó las variables independientes: tierra (ha) y semilla (kg/ha). Los datos se presentan a continuación:

Análisis y Diseño de Experimentos - 55 -

Produc. Q 3250 1675 1450 2450 3608 2350 2250 1800 3580 7345 3880 3880 3220 6860 3608 6450

Nro. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 TOTAL

Tierra (Xi1) 1.00 0.70 0.60 1.00 1.00 0.50 0.50 0.50 1.00 2.00 1.00 1.00 1.00 2.00 1.00 2.00

∑Y = ∑X i

57656

i1

=

16.80

Semilla (Xi2) 1500 780 800 1500 1600 810 820 750 1560 3130 1670 1620 1650 3200 1600 3240

∑X

i2

=

26230

Xi12

Xi22

1.00 0.49 0.36 1.00 1.00 0.25 0.25 0.25 1.00 4.00 1.00 1.00 1.00 4.00 1.00 4.00

2250000 608400 640000 2250000 2560000 656100 672400 562500 2433600 9796900 2788900 2624400 2722500 10240000 2560000 10497600

∑X

2 i1

=

21.60

∑X

2 i2

=

53863300

Xi1Xi2

Xi1Yi

Xi2Yi

3250 1172.5 870 2450 3608 1175 1125 900 3580 14690 3880 3880 3220 13720 3608 12900

4875000 1306500 1160000 3675000 5772800 1903500 1845000 1350000 5584800 22989850 6479600 6285600 5313000 21952000 5772800 20898000

1500 546 480 1500 1600 405 410 375 1560 6260 1670 1620 1650 6400 1600 6480

Yi2 10562500 2805625 2102500 6002500 13017664 5522500 5062500 3240000 12816400 53949025 15054400 15054400 10368400 47059600 13017664 41602500

∑X X = ∑X Y = ∑X Y = ∑Y = 2

i1 i2

34056

i1 i

74028.5

i2 i

i

117163450

257238178

a) Fijar el modelo de Regresión Lineal Múltiple. b) Encontrar las ecuaciones normales. c) Estimar β$ = ( X ' X )−1 X ' Y d) E ( Y$ ) = β$ 0 + β$ 1 X i1 + β$ 2 X i 2 e) Calcular el ANOVA,

~2 R 2 , R Ajust .

f) Calcular V ( β$ ) = ( X ' X )−1σ 2 g) Estimar los errores: e$ = Y − Y$ h) Estimar los intervalos confidenciales para

βi

i) Estimar la respuesta media E ( Yh ) y el intervalo confidencial. j) Realice la predicción de nuevas observaciones SOLUCIÓN: a) Y$ = β$ 0 + β$ 1 X i 1 + β$ 2 X i 2 b) Ecuaciones normales ( X ' X )β$ = X ' Y

Yh( new ) y el intervalo confidencial.

- 56 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

1 1  X = 1  M 1

1.0 1500  0.7 780  1 1 1 L 1 0.6 800  0.7 0.6 L 2.0  X' = 1.0 M M , 1500 780 800 L 3240 2.0 3240

LM MM N

1 1 1 L 1  1  1   X ' X =  1.0 0.7 0.6 L 2.0  × 1  1500 780 800 L 3240 M 1

 n  X ' X = ∑Xi1 ∑Xi2 

OP PP Q

1.0 1500 16.8 26230  0.7 780   16 34056  0.6 800  =  16.8 21.6  M M  26230 34056 53863300 2.0 3240

∑X ∑X ∑X ∑X X ∑X X ∑X

  16 16.8 26230    21.6 34056  i1 i 2  =  16.8 , 2    i 2  26230 34056 53863300

i1 2 i1

i1

i2

i2

 ∑Yi   57656    X ' Y =  ∑ X i1Yi  =  74028.5  , ∑ X i 2Yi  117163450  

16.8 26230  βˆ0   57656   16    16.8 21.6 34056   βˆ1  =  74028.5      26230 34056 53863300 βˆ  117163450  2 

16 βˆ0 + 16.8βˆ1 + 26230 βˆ2 = 57656 16.8βˆ + 21.6 βˆ + 34056βˆ = 74028.5 0

1

2

26230 βˆ0 + 34056 βˆ1 + 53863300 βˆ2 = 117163450 c) Estimar β$ = ( X ' X )−1 X ' Y ,

 A11 Adj ( X ' X ) =  − A12  A13

− A21 A22 − A23

( X ' X )−1 =

Adj( X ' X ) det( X ' X )

A31   a11 a12 − A32  X ' X =  a21 a22 ,  a31 a32 A33 

a13  a23  a33 

Análisis y Diseño de Experimentos - 57 -

A11 = a22 a33 − a23 a32 = 3636144

A22 = a11a33 − a13a31 = 173799900

A12 = a21a33 − a23 a31 = 11614560

A23 = a11a32 − a12 a31 = 104232

A13 = a21a32 − a22 a31 = 5572.8

A33 = a11a22 − a12 a21 = 63.36

 A11 − A21 A31   3636144 −11614560 5572.8  Adj( X ' X ) = − A12 A22 − A32  = −11614560 173799900 −104232  A13 − A23 A33   5572.8 −104232 63.36  16.8 26230   16  16.8  21.6 34056   det( X ' X ) =  26230 34056 53863300  = 9228240 = D   16.8 26230   16  16.8 21.6 34056 

 0.394023562 −1.258588853 0.000603885 Adj( X ' X )  = −1.258588853 18.83348287 −0.011294894 (X ' X ) = det( X ' X )   0.000603885 −0.011294894 0.000006865 −1

)  0.394023562 −1.258588853 0.000603885   57656   β0 = 299.68 ) ∠= −1.258588853 18.83348287 −0.011294894 ×  74028.5  =  β1 = −1699.     )  0.000603885 −0.011294894 0.000006865  117163450  β2 = 3.1038

Y$ = 299 .68 − 1699 .5543 X i 1 + 3.1038 X i 2 2 ~2 e) Calcular el ANOVA, R , R Ajust . d)

i) Grados de libertad (GL). GLRe g . = r − 1 = 3 - 1 = 2 GLError = n − r = 16 - 3 = 13 GLTotal = n − 1 = 16 - 1 = 15

ii) Sumas de Cuadrados (SC ó SS).

- 58 -

V. Ibañez Q. - Docente FINESI - UNA - Puno  57656  2 ˆ X 'Y − nY 2 = [ 299.682028 −1699.5543 3.10383528]×  74028.5  −16  57656  SSRm = â'      16  117163450

= 255119061.1 - 207763396 = 47355665.14 2

 57656  SSTm = Y ' Y − nY 2 = 257238178 − 16   = 49474782  16 

SSE = Y ' Y − βˆ ' X ' Y = 257238178 − 255119061.1 = 2119116.86 ó

SSE = SSTm − SSRm = 49474782 − 47355665.14 = 2119116.86 Tabla de Análisis de Varianza para la producción de papa. F. de V. G.L. S.S. M.S. Fc. Signif Debido a Regresión 2 47355665.140 23677832.5700 145.25 ** Error residual 13 2119116.860 163008.9892 Total 15 49474782.000 3298318.8000 Cálculo del Coeficiente de Determinación: R2 =

. SSRm 4735566514 × 100 = × 100 = 95.72% SSTm 49474782

~2 ) Coeficiente de Determinación ajustado ( R MSE 163008.9892 ~ R2 = 1− ) × 100 = 95.06% = (1 − MSTm 3298318.8

f) Calcular V ( β$ ) = ( X ' X )−1σ 2

LM MM N

OP PP Q

LM MM N

OP PP Q

0.394023562 -1.258588853 0.000603885 64229.38257 -205161.2968 98.43868346 V( β$ ) = -1.258588853 18.83348287 -0.011294894 (1630089892 . ) = -205161.2968 3070027.006 -1841.169254 0.000603885 -0.011294894 0.000006865 98.43868346 -1841.169254 1.119056711

g) Estimar los errores: e$ = Y − Y$ , Y$ = Xβ$

Análisis y Diseño de Experimentos - 59 -

LM3250 OP LM1 1675 MM1450 PP MM11 M P M e$ = M 2450 P − M1 MM M PP MMM MM3608 PP MM1 N6450 Q N1

LM − 5.8807 OP OP M 144 .0144 P P 800 P L 299 .682028 O M − 313.0177 P M M PP P 1500 P × M − 1699 .5543 P = M M P PP M P MN 3 .10383528 PQ M M M P 1600 P MM 41.7358 PP 3240 PQ N − 506 .9998 Q

1.0

1500

0 .7

780

0 .6 1.0 M 1.0 2 .0

h) Estimar los intervalos confidenciales para

LM N

βi

OP Q

Pr β$ i − t α ,( n − r ) V ( β$ i ) ≤ β i ≤ β$ i + t α ,( n − r ) V ( β$ i ) = 1 − α 2

2

Intervalo confidencial (IC) para

LM N

β0:

OP Q

Pr β$ 0 − t α ,( n − r ) V ( β$ 0 ) ≤ β 0 ≤ β$ 0 + t α ,( n − r ) V ( β$ 0 ) = 1 − 0.05 2

2

Pr 299.682028 − ( 216 . ) 64229.38257 ≤ β 0 ≤ 299.682028+ ( 216 . ) 64229.38257 = 095 .

Pr -247.7379 ≤ β 0 ≤ 847.10198 = 0.95

Intervalo confidencial (IC) para

LM N

β1:

OP Q

Pr β$ 1 − t α ,( n− r ) V ( β$ 1 ) ≤ β 1 ≤ β$ 1 + t α ,( n − r ) V ( β$ 1 ) = 1 − 0.05 2

2

Pr -1699.5543- ( 2.16 ) 3070027.006 ≤ β 1 ≤ -1699.5543 + ( 2.16 ) 3070027.006 = 0

Pr -5484.196687 ≤ β 1 ≤ 2085.088 = 0.95

Intervalo confidencial (IC) para

LM N

β2 :

OP Q

Pr β$ 2 − t α ,( n − r ) V ( β$ 2 ) ≤ β 2 ≤ β$ 2 + t α ,( n − r ) V ( β$ 2 ) = 1 − 0.05 2

2

Pr 3.103835 − ( 2.16 ) 1.1190567 ≤ β 2 ≤ 3.103835 + ( 2.16 ) 1.1190567 = 0.95

Pr 0.81887 ≤ β 2 ≤ 5.3888 = 0.95

i) Estimar la respuesta media E ( Yh ) y el intervalo confidencial.

X h' = 1 15 . 1640

- 60 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

LM MM N

OP PP Q

299.682028 $ Y$h = X β = 1 15 . 1640 × -1699.5543 = 2840.640437 3.10383528 ' h

V( Xh' β$ ) = Xh' ( X' X )−1σ 2 Xh = Xh' V( β$ ) Xh ó S2 (Y$h ) = MSE[ Xh' ( X' X )−1 Xh ]

LM MM N 98.43868346

OP LM OP P M P -1841.169254 1.119056711 QP MN1640PQ L 1 OP −828.0621915 × MM 15 . = 630447.3382 MN1640PPQ

64229.38257 -205161.2968 98.43868346 1 V ( X h' β$ ) = 1 15 . 1640 × -205161.2968 3070027.006 -1841.169254 × 15 .

= −8207312176 . 1380361636 .

S ( Y$h ) = 794.0071399 El intervalo Confidencial para la respuesta Media es: Pr 2840.64 - (2.16)(794.007) ≤ E ( Yh ) ≤ 2840.64 + (2.16)(794.007) = 0.9

Pr 1125.585 ≤ E ( Yh ) ≤ 4555.6959 = 0.95 j) Predicción de nuevas observaciones X h' = 1 0.25 400

LM MM N

Yh( new ) y el intervalo confidencial.

OP PP Q

299.682028 ' $ $ Yh = X h β = 1 0.25 400 × -1699.5543 = 1116.327565 3.10383528 S 2 ( Y$h( New ) ) = MSE [1 + X 'h (X' X) -1 X h ] = MSE + X 'h (X' X) -1 MSE X h = MSE + X 'hV ( β$

LM64229.38257 MM98.43868346 N

OP LM 1 OP PM P 1.119056711 PQ MN400PQ L1O 85.76905 × MM0.25P = 206100.581 MN 400 PPQ

-205161.2968 98.43868346

. . 400]× -205161.2968 3070027.006 -1841.169254 × 025 . S2(Y$h( New) ) =1630089892 +[1 025 -1841.169254

= 163008.9892 + [52314.53175 −174122.2469

S ( Y$h( New ) ) = 453.9830184

Análisis y Diseño de Experimentos - 61 -

Pr Y$h − tα ,( n−r )S(Y$h( new) ) ≤ Yh( new) ≤ Y$h + tα ,( n−r )S(Y$h( new) ) = 1−α 2

2

Pr 1116.3276- (2.16)(453.983018) ≤ Yh( New ) ≤ 1116.3276 + (2.16)(453.983018) = 0.95

Pr 135.724 ≤ Yh ( New ) ≤ 2096.93088 = 0.95

Correlaciones Parciales:

r12•3 = r13•2 =

r12 − r13r23 (1− r )(1 − r ) 2 13

2 23

=

r13 − r12r23 ( 1 − r )( 1 − r ) 2 12

2 23

. . )( 099327 . ) 096375 − ( 097676 2 2 (1− 097676 . )(1 − 099327 . )

=

. = −0259

0.97676 − ( 0.96375 )( 0.99327 ) ( 1 − 0.963752 )( 1 − 0.99327 2 )

= 0.63089

Correlación Múltiple:

R12•23 = 1 −

2119116.86 SSE = 1− = 0.957 ó en forma equivalente. 49474782 SSTm

2 2 1− R12•23 = 1− (1− r122 )(1− r132•2 ) = 1− (1− 096375 . )(1− 0630897 . ) = 1− 004285 . . = 095714

Prueba de hipótesis parciales para el ejemplo anterior. 1) Hipótesis: H0 : β 1•0 ,2 = 0

H0 : β 2•0 ,1 = 0

Ha : β 1•0 ,2 ≠ 0

Ha : β 2•0 ,1 ≠ 0

2) Nivel de significación: α = 0.05 3) Estadígrafo de Contraste: F-Snedecor. 4) Región de Rechazo y Aceptación: Si

numerador Fc ≤ FglglError

Si

numerador Fc > FglglError , entonces se rechaza la Ho: y se acepta la Ha:

, entonces se acepta la Ho:

5) Cálculo de ANOVA. Adj( x' x ) SCRe g . ( β 1 , β 2 β 0 ) = β$ ' x' y , β$ = ( x' x )−1 x' y ; ( x' x )−1 = x' x

- 62 -

V. Ibañez Q. - Docente FINESI - UNA - Puno x' x =

LM ∑ x MN∑ x x

∑x x ∑x

2 i1

i1 i 2 2 i2

i1 i 2

( ∑ X i1 )2

∑ xi21 = ∑ X i21 − ∑x

2 i2

∑x

= ∑ X i22 −

n

( ∑ X i 2 )2

x = ∑ X i1 X i 2 −

= 216 . −

( 16.8 )2 = 3.96 16

( ∑ X i1 )( ∑ X i 2 ) n

( ∑ Yi )2 n

OP 10862493.75Q 6514.5

= 53863300 −

n

i1 i 2

∑ yi2 = ∑ Yi 2 −

OP = L 3.96 PQ MN6514.5

( 26230 )2 = 10862493.75 16

= 34056 −

= 257238178 −

( 16.8 )( 26230 ) = 6514.5 16

( 57656 )2 = 49474782 16

x' x = 3.96 × 10862493.75 − 6514 .5 × 6514.5 = 576765 ( x' x )−1 =

x' y =

LM MN

1 ∑ xi 2 x' x − ∑ xi1 xi 2

− ∑ xi1 xi 2

2

∑ xi21

OP = L 18.83348287 PQ MN−0.011294894

−0.011294894 0.000006865

LM∑ x y OP = L 13489.7 O MN∑ x y PQ MN22643645PQ

OP Q

i1 i

i2

i

∑x

y = ∑ X i1Yi −

∑x

y = ∑ X i 2Yi −

i1 i

i2 i

( ∑ X i1 )( ∑ Yi ) n

( ∑ X i 2 )( ∑ Yi ) n

= 74028.5 −

= 117163450 −

LM N

( 16.8 )( 57656 ) = 13489.7 16 ( 26230 )( 57656 ) = 22643645 16

OP LM OP Q MN PQ

−1699.55431 β$ β$ = ( x' x )−1 x' y = = 1 . 310383527 β$ 2 k

β$ 0 = Y − ∑ β$ j X • j =Y − β$ 1 X •1 − β$ 2 X •2 j =1

= 3603.5 - (-1699.55431)(1.05) - 3.10383527x1639.375) = 299.6820798

SCRe g ( β 1 ,β 2

β0 )

. = −1699.55431 310383527 ×

LM 13489.7 OP = 473556 N22643645Q

Análisis y Diseño de Experimentos - 63 -

SCR ( β 2

β0 )

=

( ∑ xi 2 yi )2

∑x

2 i2

=

( 22643645 )2 = 47202297.25 10862493.75

SCR( β1 β0 ,β2 ) = SCR( β1 ,β2 β0 ) − SCR( β2 β0 ) = 4735566622 . − 47202297 = 153368.97

=

SCR ( β 1

β0 )

SCR ( β 2

β 0 ,β 1 )

( ∑ xi1 yi )2

=

∑x

2 i1

= SCR ( β 1 ,β 2

β0 )

( 13489.7 )2 = 45952526.79 3.96 − SCR ( β 1

β0 )

= 47355666.22 − 45952526

= 1403139.43 RESUMEN EN ANOVA: F. de V.

GL:

R( β1 ,β 2 β 0 )

2

47355665.14

R( β 2 β 0 )

1

47202297.25

R( β1 β 0 ,β 2 )

1

153368.97

R( β1 β 0 )

R( β 2 β 0 ,β1 )

Error Residual Total

SC.

CM.

Fc

Signif. Tabla-F

153368.97

0.94

ns.

4.67

1

45952526.79

1 13 15

1403139.43 1403139.43 2119116.86 163008.9892 49474782.00

8.61

*

4.67

6) Decisión: Tiene dos partes para la decisión. i) Para es

β 1 , Fc = 0.94 < 4.67, por lo tanto no se rechaza la hipótesis Ho:, esto

β 1•0 ,2 = 0 ,

esto implica que no debe incluirse en el modelo

R( β 1 β 0 , β 2 ) ii) Para

β 2 , Fc = 8.61 ≥ 4.67, por lo tanto se rechaza la Ho:, y se acepta la Ha:

β 2•0 ,1 ≠ 0 , esto implica que aporta al modelo R( β 2 β 0 , β 1 ) . Luego el modelo final debe ser calculado sin incluir lo.

β 1 , ya que no aporta al mode-

- 64 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Y$ = β$ 0 + β$ 2 X i 2 , β$ 2 =

∑x y ∑x

i2 i 2 i2

=

22643645 = 2.08457 10862493.75

. − 2.08457 × 1639.375 = 18610558 . β$ 0 = Y − β$ 2 X •2 = 36035

Y$ = 186.10558 + 2.08 X i 2 ,

X i 2 corresponde a la variable semilla

Para encontrar la bondad de ajuste, se debe calcular el coeficiente de determinación ( R 2 )

R = 2

( ∑ xi 2 yi )2

∑y

2 i

∑x

2 i2

=

SCR( β 2 / β 0 ) SSTm

=

( 22643645 )2 10862493.75 =9 49474782

Se puede interpretar que el modelo tiene una buena bondad de ajuste y es confiable, es decir el 95.41% de la variación de la producción de papa depende de la variación de semilla, y el 4.59% está explicado por otros factores ajenos al trabajo. RESULTADOS CON EL SAS. The REG Procedure Model: MODEL1 Variable Intercept T S Q

X’X Inverse, Intercept 0.3940235625 -1.258588853 0.0006038855 299.68202648

Variable Intercept T S Q

Source Model Error Corrected Total Root MSE Dependent Mean Coeff Var Variable Intercept T S

Model Crossproducts X’X X’Y Y’Y Intercept T S 16 16.8 26230 16.8 21.6 34056 26230 34056 53863300 57656 74028.5 117163450

DF 1 1 1

Parameter Estimates, and SSE T S -1.258588853 0.0006038855 18.833482874 -0.011294895 -0.011294895 6.8658813E-6 -1699.554261 3.1038352709

Analysis of Variance Sum of Mean DF Squares Square 2 47355667 23677833 13 2119115 163009 15 49474782 403.74355 R-Square 0.9572 3603.50000 Adj R-Sq 0.9506 11.20421

Parameter Estimate 299.68203 -1699.55426 3.10384

Parameter Estimates Standard Error t Value Pr > |t| 253.43506 1.18 0.2582 1752.14853 -0.97 0.3498 1.05792 2.93 0.0116

F Value 145.25

Q 57656 74028.5 117163450 257238178 Q 299.68202648 -1699.554261 3.1038352709 2119115.0975

Pr > F FglglError , entonces se rechaza la Ho: y se acepta la Ha:

, entonces se acepta la Ho:

5) Cálculo de ANOVA. Adj( x' x ) SCRe g . ( β 1 , β 2 β 0 ) = β$ ' x' y , β$ = ( x' x )−1 x' y ; ( x' x )−1 = x' x

x' x =

LM ∑ x MN∑ x x

∑x x ∑x

2 i1

i1 i 2 2 i2

i1 i 2

∑ xi21 = ∑ X i21 − ∑x

( ∑ X i 1 )2 n

x = ∑ X i1 X i 2 −

i1 i 2

∑ yi2 = ∑ Yi 2 −

OP = L976.79469 PQ MN−1932.627

= 976.79469 ,

( ∑ X i1 )( ∑ X i 2 ) n

( ∑ Yi )2 n

x' x = 10147256.69

−1932.627 14212.100

∑x

2 i2

OP Q

= ∑ X i22 −

( ∑ X i 2 )2 n

= −1932.627

= 40290.2053 −

( 582.424 )2 = 6368.433723 10

= 14212.1

Análisis y Diseño de Experimentos - 71 ( x' x )−1 =

x' y =

LM MN

1 ∑ xi 2 x' x − ∑ xi1 xi 2

− ∑ xi 1 xi 2

2

∑ xi21

OP = L0.001400585 PQ MN0.000190458

0.000190458 0.0000962619

LM∑ x y OP = L1042.375564O MN∑ x y PQ MN 4899.4678 PQ

OP Q

i1 i

i2 i

∑x

y = ∑ X i1Yi −

∑x

y = ∑ X i 2Yi −

( ∑ X i 1 )( ∑ Yi )

i1 i

i2 i

n

( ∑ X i 2 )( ∑ Yi ) n

= 1042.375564 ,

= 4899.4678

LM N

OP Q

LM MN

2.393079257 β$ β$ = ( x' x )−1 x' y = = 1 0.670161157 β$ 2

OP PQ

k

β$ 0 = Y − ∑ β$ j X • j =Y − β$ 1 X •1 − β$ 2 X •2 = −40.2208399 j =1

SCRe g( β1 ,β 2 β 0 ) = 2.393079257 0670161157 . ×

SCR ( β 2

β0 )

=

( ∑ xi 2 yi )2

∑x

2 i2

=

LM1042.375564OP = 5777.9 N 4899.46780 Q

( 4899.4678 )2 = 1689.038546 14212.1

SCR( β1 β0 ,β2 ) = SCR( β1 ,β2 β0 ) − SCR( β2 β0 ) = 5777920352 . . −16890385 = 4088.881806

SCR( β1 β 0 ) =

SCR ( β 2

β 0 ,β 1 )

( ∑ xi1 yi )2

∑x

= SCR ( β 1 ,β 2

2 i1

β0 )

= 4665.56089

=

(1042.375564 )2 = 1112.359463 976.79469

− SCR ( β 1

β0 )

= 5777.920352 − 1112.3594

- 72 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

RESUMEN EN ANOVA: F. de V.

GL:

R( β1 ,β2 β0 )

2

5777.92

R( β 2 β 0 )

1

1689.038546

R( β1 β0 ,β2 )

1

4088.881806 4088.881806

R( β1 β 0 )

1

1112.359463

R( β2 β0 ,β1 )

1 7 9

Error Residua Total

SC.

CM.

4665.56089 4665.56089 590.5134 84.35905717 6368.43

Fc

Signif. Tabla-F

48.47

**

12.2

55.31

**

12.2

6) Decisión: Tiene dos partes para la decisión. i) Para

β 1 , Fc = 48.47 ≥ F71,0.01 = 12.2, por lo tanto se rechaza la hipótesis

Ho:, esto es

β 1•0 ,2 ≠ 0 , esto implica que se debe incluirse en el modelo

R( β 1 β 0 , β 2 ) o aporta al modelo. ii) Para

β 2 , Fc = 55.31 ≥ F71,0.01 = 12.2, por lo tanto se rechaza la Ho:, y se

acepta la Ha:

β 2•0 ,1 ≠ 0 , esto implica que aporta al mode-

lo R( β 2 β 0 , β 1 ) . Luego el modelo final queda con los dos variables independientes en estudio, ya que aportan al modelo.

Y$ = −40.2208 + 2.393079 X i 1 + 0.67016 X i 2 SALIDA DEL SAS Variable Intercept X1 X2 Y

Variable Intercept X1 X2 Y

Model Crossproducts X’X X’Y Y’Y Intercept X1 X2 10 276.19 483 276.19 8604.8863 11407.35 483 11407.35 37541 582.424 17128.34402 33030.547 X’X Inverse, Intercept 1.9010892146 -0.047881894 -0.009909714 -40.22083991

Parameter Estimates, and SSE X1 X2 -0.047881894 -0.009909714 0.0014005854 0.0001904581 0.0001904581 0.0000962619 2.3930792572 0.6701611574

Y 582.424 17128.34402 33030.547 40290.20533

Y -40.22083991 2.3930792572 0.6701611574 590.51340023

Análisis y Diseño de Experimentos - 73 Source Model Error Corrected Total Root MSE Dependent Mean Coeff Var

DF 2 7 9 9.18472 58.24240 15.76981

Squares 5777.92035 590.51340 6368.43375 R-Square Adj R-Sq

Square 2888.96018 84.35906

F Value 34.25

Pr > F 0.0002

0.9073 0.8808

Parameter Estimates Parameter

Standard

Variable

DF

Estimate

Error

t Value

Pr > |t|

Intercept

1

-40.22084

12.66389

-3.18

0.0156

-70.16618

-10.27550

X1

1

2.39308

0.34373

6.96

0.0002

1.58028

3.20588

X2

1

0.67016

0.09011

7.44

0.0001

0.45707

0.88325

Variable Intercept X1 X2

Covariance of Estimates Intercept X1 160.37409376 -4.039271472 -4.039271472 0.1181520674 -0.835974104 0.0160668638

95% Confidence Limits

X2 -0.835974104 0.0160668638 0.0081205671

Output Statistics Dep Var Predicted

Std Error

Obs

Y

1

43.1270

49.9789

Value Mean Predict 3.1014

42.6452

57.3125

27.0557

72.9020

-6.8519

2

16.6530

20.8301

5.6319

7.5126

34.1475

-4.6463

46.3064

-4.1771

3

92.3220

85.1420

7.2965

67.8886

102.3954

57.4045

112.8795

7.1800

4

38.0840

48.6114

4.1121

38.8878

58.3349

24.8156

72.4071

-10.5274

5

61.9390

62.8069

2.9893

55.7384

69.8754

39.9671

85.6466

-0.8679

6

92.3760

88.0975

7.1596

71.1677

105.0272

60.5601

115.6348

4.2785

7

24.3730

16.5681

5.8138

2.8206

30.3156

-9.1356

42.2719

7.8049

8

74.0290

85.7364

4.9458

74.0416

97.4313

61.0695

110.4034

-11.7074

9

70.7720

67.5905

3.8256

58.5446

76.6365

44.0636

91.1175

3.1815

10

68.7490

57.0623

2.9156

50.1680

63.9565

34.2759

79.8487

11.6867

Sum of Residuals Sum of Squared Residuals Predicted Residual SS (PRESS)

95% CL Mean

0 590.51340 1401.80989

Pearson Correlation Coefficients, N = 10 Prob > |r| under H0: Rho=0 Y X1 X2 Y 1.00000 0.41793 0.51500 0.2294 0.1277 X1 0.41793 1.00000 -0.51870 0.2294 0.1245 X2 0.51500 -0.51870 1.00000 0.1277 0.1245

95% CL Predict

Residual

- 74 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

EJEMPLO: En un estudio diseñado para descubrir qué factores podrían estar relacionados con el peso al nacer, se obtuvieron los siguientes datos en 10 niños recién nacidos. Peso al nacer Calificación de condición Orden en gramos (Y) socioeconómica (X1) de nacimiento (X2) 1361 8 4 1588 7 3 1815 4 4 2087 5 3 2268 5 2 2404 4 2 3402 3 2 3629 3 1 3765 2 1 4083 1 1

a) Estimar la ecuación de regresión ajustada, b) Construir la Tabla de ANOVA, c) Encontrar los intervalos confidenciales para bi (betas) e interpretar. SOLUCIÓN: a) Estimar la ecuación de regresión múltiple.  N  X ' X =  ∑ X i1 ∑ X i 2 

∑X ∑X ∑X X i1 2 i1

i1

∑X ∑X X ∑X

i2

 ∑ Yi   26402   X ' Y =  ∑ X i1Yi  =  93361 ,  ∑ X i 2Yi  51354     A11 Adj ( X ' X ) =  − A12  A13

− A21 A22 − A23

 10 42 23    218 114 i1 i 2  =  42 2   23 114 65  i2  i2

10 42 23  42 218 114   det( X ' X ) =  23 114 65  = 2006   10 42 23  42 218 114

A31  1174 −108 −226  − A32  =  −108 121 −174  , A33   −226 −174 416 

 a11 a12 X ' X = a21 a22 a31 a32

a13  a23  a33 

Análisis y Diseño de Experimentos - 75 -

A11 = a22 a33 − a32 a23 = 1174

A21 = a12 a 32 − a 32 a13 = 108

A12 = a 21 a33 − a31 a 23 = 108

A22 = a11a33 − a31a13 = 121

A13 = a21a32 − a31a22 = −226

A23 = a11a23 − a21a13 = 174

A31 = a21a32 − a31a22 = −226 A32 = a11 a 32 − a31 a12 = 174 A33 = a11a22 − a21a12 = 416

(X ' X )−1 =

1174 −108 −226  0.58524427 −0.05383848 −0.11266201 Adj(X ' X ) 1  = −108 121 −174 = −0.05383848 0.06031904 −0.08673978 det(X ' X ) 2006  −226 −174 416  −0.11266201 −0.08673978 0.20737787 

 0.58524427 −0.05383848 −0.11266201 26402  4639.55932  ∠= ( X ' X )−1 X 'Y = −0.05383848 0.06031904 −0.08673978 93361 = −244.432203 −0.11266201 −0.08673978 0.20737787  51354 −422.932203

Yˆ = 4639.55932 − 244.432203 X i1 − 422.932203 X i 2 b) Tabla de ANOVA Grados de libertad (GL.) GLreg = p - 1 = 3 - 1 = 2 GLerror = N - p = 10 - 3 = 7 GLtotal = N - 1 = 10 - 1 = 9 Sumas de Cuadrados (SS): ˆ X ' Y − NY 2 SSR m = â'  26402  2  26402  = [4639.55932 −244.432203 −422.932203]  93361 − 10   = 824738  10  51354  2

 26402  SSTm = Y ' Y − NY 2 = 78536258 − 10  = 8829697.6  10 

SSE = 8829697.6 - 8247389.51 = 582308.09

- 76 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Tabla de Análisis de Varianza para la Frecuencia Cardíaca F. de V. G.L. S.S. M.S. Fc. Signif Debido a Regresión 2 8247389.510 4123694.7550 49.57 ** Error residual 7 582308.090 83186.8700 Total 9 8829697.600 981077.5111 Cálculo del Coeficiente de Determinación: R2 =

SSRm 8247389.51 x100 = ( 100 ) = 93.41% SSTm 8829697.6

~2 ) Coeficiente de Determinación ajustado ( R V ( β$ ) = ( X ' X )−1 MSE

MSE 83186.87 ~ R 2 = 1− . %, = 1− = 9152 MSTm 981077.51

LM MM N

OP PP Q

LM MM N

OP PP Q

0.585244267 -0.053838485 -0.112662014 48684.63877 -4478.65501 -9372.00031 V( β$ ) = -0.053838485 0.060319043 -0.086739781 (83186.87) = -4478.65501 5017.75238 -7215.61086 -0.112662014 -0.086739781 0.207377866 -9372.00031 -7215.61086 17251.11561

INTERVALO CONFIDENCIAL (IC) PARA ( β i ).

LM N

OP Q

Pr β$ i − t α ,( N − r ) V ( β$ i ) ≤ βi ≤ β$ i + t α ,( N − r ) V ( β$ i ) = 1 − α 2

2

Intervalo confidencial (IC) para

LM N

β0:

OP Q

Pr β$ 0 − t α ,( N − r ) V ( β$ 0 ) ≤ β 0 ≤ β$ 0 + t α ,( N − r ) V ( β$ 0 ) = 1 − 0.05 2

2

Pr 4639.559322−(2.365) 48684.63877 ≤β0 ≤4639.559322+(2.365) 48684.63877 =095 . Pr 4117.731631 ≤ β 0 ≤ 5161.387013 = 0.95

Intervalo confidencial (IC) para

LM N

β1:

OP Q

Pr β$ 1 − t α ,( N − r ) V ( β$ 1 ) ≤ β 1 ≤ β$ 1 + t α ,( N − r ) V ( β$ 1 ) = 1 − 0.05 2

2

Pr -244.4322034 − ( 2.365 ) 5017.75238 ≤ β 1 ≤ -244.4322034 + ( 2.365 ) 5017.75238 =

Pr -411.9595684 ≤ β 1 ≤ -76.90483833 = 0.95

Análisis y Diseño de Experimentos - 77 Intervalo confidencial (IC) para

LM N

β2 :

OP Q

Pr β$ 2 − t α ,( N − r ) V ( β$ 2 ) ≤ β 2 ≤ β$ 2 + t α ,( N − r ) V ( β$ 2 ) = 1 − 0.05 2

2

Pr -422.9322034 − ( 2.365 ) 17251.11561 ≤ β 2 ≤ -422.9322034 − ( 2.365 ) 17251.11561 = 095 .

Pr -733.5595865 ≤ β 2 ≤ -112.3048203 = 0.95

Calcule el intervalo confidencial para la respuesta media E ( Yh ) .

X h' = 1 6 5

LM MM N

OP PP Q

4639.559322 ' $ $ Yh = X h β = 1 6 5 -244.4322034 = 1058.305085 -422.9322034

LM MM-0.112662014 N

OPLM OP PM P 0.207377866 QPNM5PQ

0.585244267 -0.053838485 -0.112662014 1 V( Xh' β$ ) = (83186.87 ) 1 6 5 -0.053838485 0.060319043 -0.086739781 6 = 80201.09999 -0.086739781

S ( Y$h ) = 283.1979873 Pr 1058.305085-(2.365)(283.1979873) ≤ E( Yh ) ≤ 1058.305085+(2.365)(283.1979873) =

Pr 388.5418449 ≤ E ( Yh ) ≤ 1728.068325 = 0.95 Con la información anterior calcular Intervalo confidencia al 95%. X h' = 1 7 6

LM MM N

OP PP Q

4639.559322 Y$h = X h' β$ = 1 7 6 -244.4322034 = 390.940678 -422.9322034

R| S| T

LM MM N

OPLM OPU| PPMM PPV| QN QW

0.585244267 -0.053838485 -0.112662014 1 S2(Y$h( New) ) = (83186.87 ) 1+ 1 7 6 -0.053838485 0.060319043 -0.086739781 7 =217505.0 -0.112662014 -0.086739781 0.207377866 6

S( Y$h( New ) ) = 466.3743683 Pr 390.940678 - (2.365)(466.3743683) ≤ Yh ( New ) ≤ 390.940678 + (2.365)(466.3743683) =

Pr -712.0347031 ≤ Yh( New ) ≤ 1493.916059 = 0.95

- 78 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

PROGRAMA EN SAS.

DATA REGG; OPTIONS NODATE NOCENTER NONUMBER; INPUT Y X1 X2; DATALINES; 1361 8 4 1588 7 3 1815 4 4 2087 5 3 2268 5 2 2404 4 2 3402 3 2 3629 3 1 3765 2 1 4083 1 1 ; PROC PRINT; RUN; PROC REG; MODEL Y = X1 X2/XPX COVB CLB CLI CLM I P; RUN; PROC CORR; VAR Y X1 X2; RUN; PROC CORR; PARTIAL X2; VAR Y X1; RUN;

Análisis y Diseño de Experimentos - 79 SALIDA DEL SAS. Model: MODEL1 Model Crossproducts X’X X’Y Y’Y Intercept X1 10 42 42 218 23 114 26402 93361

Variable Intercept X1 X2 Y

X’X Inverse, Intercept 0.5852442672 -0.053838485 -0.112662014 4639.559322

Variable Intercept X1 X2 Y

Source Model Error Corrected Total Root MSE Dependent Mean Coeff Var

Variable Intercept X1 X2

Variable Intercept X1 X2

Obs 1 2 3 4 5 6 7 8 9 10

DF 1 1 1

X2 23 114 65 51354

Y 26402 93361 51354 78536258

Parameter Estimates, and SSE X1 X2 -0.053838485 -0.112662014 0.0603190429 -0.086739781 -0.086739781 0.2073778664 -244.4322034 -422.9322034

Y 4639.559322 -244.4322034 -422.9322034 582308.09322

Analysis of Variance Sum of Mean DF Squares Square 2 8247390 4123695 7 582308 83187 9 8829698 288.42134 R-Square 0.9341 2640.20000 Adj R-Sq 0.9152 10.92422 Parameter Estimate 4639.55932 -244.43220 -422.93220

Parameter Estimates Standard Error t Value Pr > |t| 220.64596 21.03 F F101 ,0.01 = 10.04 entonces rechazamos la Ho: E ( Y ) = 0 Como F ( Rm ) = 5.98 > F106 ,0 .01 = 5.39 , entonces rechazamos la Ho: A partir del ANOVA (Modelo Lineal General), se realizará la partición en dos fuentes de variación, lo que llamaremos Modelo Lineal General Completo. a=4 2 Y Y2 Y2 Y2 Y2 173 . 2 662 . 2 568 . 2 297 .2 R( µ,α ) = ∑ i•• = 1•• + 2•• + 3•• + 4•• = + + + = 1714985857 . n1• n2• n3• n4• 2 7 5 3 i=1 ni•

SSPadres = R( α µ ) = R( µ ,α ) − R( µ ) = 1724.056667 − 1700 = 14.98585 SSMadres/ Padres = R( β:α µ ,α ) = R( µ,α ,β:α ) − R( µ,α ) = 1724.056667 − 1714985857 . = 9.0708099

Para comprobar la suma de cuadrados del modelo: SS Modelo = R( α ,β:α µ ) = R( β:α µ ,α ) + R( α µ ) = 9.0708099 + 14.985857 = 24.056

Suma de cuadrados del total corregido por la media. SSTm = SST − R( µ ) = 1730.76 − 1700 = 30.76 F ( Padres ) = F ( α µ ) =

R( α µ ) 14 .9858571 = = 7.45 ( a − 1 ) MSE 3 × 0.670333

F ( Madres: Padres ) = F ( β :α µ ,α ) = F. de V. Padres

G.L. a-1 = 3

R( β :α µ ,α ) 9.0708099 = = 4.51 ( b• − a ) MSE 3 × 0.670333

SS. SSPadres =14.985857

Madres/Padres

. GLM:P =b• −a = 7−4 = 3 SSM:P = 90708099

Error Residual

GLError = N−b• =17−7=10

SSE = 6.70333

Total corregido

N - 1 = 16

SSTm = 30.76

MS.

Fc

MSPadres = 49952857 .

F(Padres) =7.4

MSM:P = 30236033 . MSE = 0.670333

F(M:P) = 4.51

- 148 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

EJEMPLO: En el Centro Experimental Chuquibambilla de la Universidad Nacional del Altiplano, se evaluaron los pesos de destete (kg) en ovinos criollos de la progenie de 8 hembras, las cuales fueron apareados a 3 padres. Cada padre fue apareado al azar con diferente número de madres, de los cuales cada madre tiene diferente número de crías (1984 - 1989). Con la información obtenida se estimaron los componentes de varianza y la heredabilidad para esta característica. Información de peso al destete (kg) en ovinos criollos del Centro Experimental Chuquibambilla - UNA - Puno. Padres Madres 1 2 3 4 5 6 Yijk nij Yi..

M602 15 17 14 13 15 74 5

P1 M270 16 15 13

44 3 196

M694 17 19 18 24

78 4

P2 M268 M278 22 22 15 19 19 18 20 15 17 93 5 167

74 4

M246 15 17 18 22 20 17 109 6

P3 M249 16 17 20 18

71 4 290

M603 25 16 16 20 15 18 110 6

653 37

/* PROGRAMA EN SAS */ DATA CRIOLLO; OPTIONS NODATE NOCENTER NONUMBER; TITLE’DISEÑO ANIDADO O JERARQUICO’; INPUT PADRE MADRE CRIA PEDE; CARDS; 1 1 1 15 1 1 2 17 1 1 3 14 1 1 4 13 ..................(ingrese los datos siguiente....) 3 3 3 16 3 3 4 20 3 3 5 15 3 3 6 18 ; PROC PRINT; RUN; PROC GLM; CLASS PADRE MADRE CRIA; MODEL PEDE = PADRE MADRE(PADRE); TEST H = PADRE E =MADRE(PADRE); RUN; /* PRESIONE UD. F3 PARA EJECUTAR EL PROGRAMA */

Análisis y Diseño de Experimentos - 149 SALIDA DE RESULTADOS CON SAS. The GLM Procedure Class Level Information Class Levels Values PADRE 3 1 2 3 MADRE 3 1 2 3 CRIA 6 1 2 3 4 5 6 Number of observations 37 Dependent Variable: PEDE Source Model Error Corrected Total R-Square Coeff Var 0.311123 15.08633

Sum of DF Squares Mean Square 7 92.8490991 13.2641570 29 205.5833333 7.0890805 36 298.4324324 Root MSE PEDE Mean 2.662533 17.64865

Source PADRE MADRE(PADRE)

DF 2 5

Type I SS 31.79354354 61.05555556

Mean Square 15.89677177 12.21111111

F Value 1.87

Pr > F 0.1113

F Value 2.24 1.72

Pr > F 0.1243 0.1610

Tests of Hypotheses Using the Type III MS for MADRE(PADRE) as an Error Term Source DF Type III SS Mean Square F Value Pr > F PADRE 2 30.34375550 15.17187775 1.24 0.3647

Least Squares Means PADRE 1 2 3

PEDE LSMEAN 16.3222222 18.5500000 18.0833333

Standard Error 0.7855015 0.8930406 0.6778477

Pr > |t| F( tt−−11 )( r −1 ),0.05 , entonces se acepta la Ha:

CM Tratam. CM Error

Análisis y Diseño de Experimentos - 159 5. Cálculos: a)

b)

Grados de libertad. Bloques Tratamientos (muestras) Error experimental Total

:r-1 = 10 - 1 = 9 :t-1 = 5-1=4 : (r-1)(t-1) = 9 x 4 = 36 : tr - 1 = 5x10 - 1 = 49

Suma de Cuadrados (SC ó SS).

TC =

Y..2 ( 308.1 )2 = = 1898.5122 5x10 tr

i) SCBloques =

26.7 2 + 27.4 2 +L+32.82 − TC = 16.02980 5

ii) SCTratam. =

52.7 2 + 54.2 2 + 601 . 2 + 67.32 + 738 .2 − TC = 31.7548 10

5

10

2 2 . 2 +L+8.92 ) − TC = 1962.83 − TC = 64.3178 iii) SCTotal = ∑∑Yij − TC = ( 4.2 + 63 i =1 j =1

iv) SCerror exptal. = SCtotal - SCbloque - SCtrat. = 64.3178 - 16.0298-31.7548 = 16.53320

ANALISIS DE VARIANZA F. de V. G.L. S.C. Bloques (Jueces) 9 16.0298 Entre muestras 4 31.7548 Error experimental 36 16.5332 Total 49 64.3178

C.M. 1.781089 7.938700 0.459256

Fc. 3.88 17.29

4

6. Decisión: Como F(tratam.) = 17.29 > F36,0.01

Signif. ** **

= 3.83, entonces se acepta la

hipótesis alterna (Ha:), y se rechaza la Ho: 7. Conclusión: Existe suficiente evidencia para afirmar que se ha encontrado diferencia estadística altamente significativa (P ≤ 0.01) entre los jueces (bloques) y entre las muestras en estudio, esto implica analizar muy detalladamente para obtener conclusiones coherentes, y para esto se debe realizar la prueba múltiple de comparación de Duncan ó Tukey.

- 160 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Prueba Múltiple de comparación de DUNCAN 1. Hipótesis: H0 : µ A = µ B = µ C = µ D = µ E Vs. Ha : µ i ≠ 0 2. Nivel de significación: α = 0.05 3. Buscar en la Tabla de Duncan los valores de AES(D) con Grados de Libertad del Error (GLerror = 36).

p: AES(D)

SY =

0.45925556 10

2 2.86

=

ALS(D)

3 3.01

4 3.1

0.63

0.65

0.21 0.60

ALS ( D ) = SY × AES ( D ) , SY =

0.45925556 CM Error = = 0.2143 10 r

3. Ordenar los promedios de mayor a menor.

Tratamiento E D C B A

Promedios 7.38 6.73 6.01 5.42 5.27

Duncan (P ≤ 0.0

a b c cd d

4. Regla de decisión: Sí Yi • − Yj • ≤ ALS ( D ) , entonces se acepta la Ho: Sí Yi • − Yj • > ALS ( D ) , entonces se acepta la Ha: 5. Realizar las comparaciones: 7.38 - 6.73 = 0.65 > 0.6, entonces es significativo

µE ≠ µD

6.73 - 6.01 = 0.72 > 0.6, entonces es significativo

µ D ≠ µC

6.01 - 5.42 = 0.59 ≤ 0.6, entonces no es significativo 6.01 - 5.27 = 0.74 > 0.63, entonces es significativo

µC = µ B

µC ≠ µ A

5.42 - 5.27 = 0.15 ≤ 0.6, entonces no es significativo

µB = µA

Análisis y Diseño de Experimentos - 161 Prueba Múltiple de comparación de TUKEY 1. Hipótesis: H 0 : µ A = µ B = µ C = µ D = µ E Vs. H a : µ i ≠ µ j 2. Nivel de significación: α = 0.05 3. Buscar en la Tabla de Tukey (Usa la tabla SNK), los valores de Amplitudes Estudentizadas Significativas de Tukey AES(T) con Grados de Libertad del Error (GLerror = 36), p = 5 tratamientos, AES(T) = 4.04 SY =

0.45925556 CM Error = = 0.2143 , ALS ( T ) = S Y × AES ( T ) , 10 r = 0 .2143 × 4 .04 = 0 .86577

3. Ordenar los promedios de mayor a menor. Tratamiento E D C B A

Promedios 7.38 6.73 6.01 5.42 5.27

Tukey (P ≤ 0.05)

a ab bc c c

4. Regla de decisión: Sí Yi • − Yj • ≤ ALS ( T ) , entonces se acepta la Ho: Sí Yi • − Yj • > ALS ( T ) , entonces se acepta la Ha: 5. Realizar las comparaciones: 7.38 - 6.73 = 0.65 ≤ 0.87, entonces no es significativo 7.38 - 6.01 = 1.37 > 0.87, entonces es significativo

µE ≠ µC

6.73 - 6.01 = 0.72 ≤ 0.87, entonces no es significativo 6.73 - 5.42 = 1.31 > 0.87, entonces es significativo

µE = µD µ D = µC

µD ≠ µB

6.01 - 5.42 = 0.59 ≤ 0.87, entonces no es significativo

µC = µ B

6.01 - 5.42 = 0.70 ≤ 0.87, entonces no es significativo

µC = µ A

- 162 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

PROGRAMA EN SAS. DATA AGROIND; OPTIONS NODATE NOCENTER NONUMBER; INPUT TRAT $ JUECES SABOR; DATALINES; A 1 4.2 A 2 6.3 A 3 5.3 . . ... B 1 4.0 B 2 4.2 B 3 5.4 . . ... C 1 5.0 C 2 5.6 C 3 6.3 . . ... D 1 6.3 D 2 5.1 D 3 7.8 . . ... E 1 7.2 E 2 6.2 E 3 8.4 . . ... E 9 7.6 E 10 8.9 ; PROC PRINT; RUN; PROC ANOVA; CLASS TRAT JUECES; MODEL SABOR = JUECES TRAT; MEANS JUECES TRAT/DUNCAN TUKEY; RUN;

Análisis y Diseño de Experimentos - 163 SALIDA DEL SAS (OUTPUT) Class Level Information Class Levels Values TRAT 5 A B C D E JUECES 10 1 2 3 4 5 6 7 8 9 10 Number of observations 50 Dependent Variable: SABOR Source Model JUECES TRAT Error Corrected Total

R-Square 0.742945

Coeff Var 10.99779

DF 13 9 4 36 49

Sum of Squares 47.78460000 16.02980000 31.75480000 16.53320000 64.31780000

Root MSE 0.677684

Mean Square 3.67573846 1.78108889 7.93870000 0.45925556

F Value 8.00 3.88 17.29

Pr > F F( tt−−11 )( r −1 ),0.05 , entonces se acepta la Ha:

5. Cálculos: a) Grados de libertad. Bloques Tratamientos Error experimental Total b)

:r-1 =6-1=5 :t-1 =8-1=7 : (r-1)(t-1) = 5 x 7 = 35 : tr - 1 = 8x6 - 1 = 47

Suma de Cuadrados (SC ó SS).

TC =

Y••2 ( 450 )2 = = 4218.75 6×8 tr

CM Tratam. CM Error

Análisis y Diseño de Experimentos - 173 i) SC Bloq ues = ii) SCTratam. =

83 2 + 94 2 + L + 58 2 − T C = 10 2 .50 8

44 2 +119 2 + 84 2 +L+332 + 652 − TC = 1210.583333 6 5

10

iii) SCTotal = ∑ ∑ Yij2 − TC = ( 82 + 82 +L+52 ) − TC = 5734 − TC = 1515.25 i =1 j =1

iv) SCerror exptal. = SCtotal - SCbloque - SCtrat. = 1515.25 - 102.5 - 1210.583333 = 202.166667 ANALISIS DE VARIANZA F. de V. G.L. S.C. C.M. Bloques 5 102.5 20.500000 Tratamientos 7 1210.583333 172.940476 Error experimental 35 202.166667 5.776190 Total 47 1515.25

Fc. 3.55 29.94

7

6. Decisión: Como F(tratam.) = 29.94 > F35,0.01

Signif. ns. **

= 3.12, entonces se acepta la

hipótesis alterna (Ha:), y se rechaza la Ho: 7. Conclusión: Existe suficiente evidencia para afirmar que se ha encontrado diferencia estadística altamente significativa (P ≤ 0.01) entre los tratamientos, esto implica realizar los contrastes para obtener las conclusiones coherentes. b) Se descomponelos grados de libertad y la suma de cuadrados de tratamientos en siete contrastes (formar los posibles contrastes con los tratamientos). C1 : C2 : C3 : C4 : C5 : C6 : C7 :

A (B y C) B (D y H) D E F

versus versus versus versus versus versus versus

(B, C, D, E, F, G, H) (D, E, F, G, H ) (Fungicidas Mercúricos Vs. Fungicidas no me C (Entre fungicidas mercúricos) (E, F y G) (Entre las compañías) H (entre los productos de la compañía I) (F y G) (entre con las nuevas formulaciones) G (entre formulaciones nuevas)

- 174 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Tratamiento

divisores A

B

C

D

G

32

H

33

Qj

65

FG ∑c IJ SCQ H K k

r

2 i.

j

84

C1 : A vs (B,C,D,E,F,G,H)

7

-1

-1

-1

-1

-1

-1

-1

-98

56(6)

28.583

C2 : (B y C) vs (D,E,F,G,H)

0

5

5

-2

-2

-2

-2

-2

609

70(6)

883.05 **

C3 : B vs C

0

1

-1

0

0

0

0

0

35

2(6)

102.08 **

C4 : (D y H) vs (E,F,G)

0

0

0

3

-2

-2

-2

3

174

30(6)

168.20 **

C5 : D vs H

0

0

0

1

0

0

0

-1

-14

2(6)

16.333

C6 : E vs (F y G)

0

0

0

0

2

-1

-1

0

-21

6(6)

12.25

C7 : F vs G

0

0

0

0

0

1

-1

0

-1

2(6)

0.08

Yi.

22

F

44 119

Contrastes

51

E

i =1

SCTratamientos =

1210.5833

k =8

Verificando para j = 1 entonces

Q1 = ∑ ci1Ti i =1

Q1 = c11T1 + c21T2 + c31T3 + c41T4 + c51T5 + c61T6 + c71T7 + c81T8 = = 7(44)+(-1)(119)+(-1)(84)+(-1)(51)+(-1)(22)+(-1)(32)+(-1)(33)+(-1)(65)= -98

Q2 = c12 T1 + c22 T2 + c32 T3 + c42 T4 + c52 T5 + c62 T6 + c72 T7 + c82 T8 = = 0(44)+(5)(119)+(5)(84)+(-2)(51)+(-2)(22)+(-2)(32)+(-2)(33)+(-2)(65)= 609

Q3 = c13T1 + c23T2 + c33T3 + c43T4 + c53T5 + c63T6 + c73T7 + c83T8 = 35 Q4 = c14 T1 + c24 T2 + c34 T3 + c44 T4 + c54 T5 + c64 T6 + c74 T7 + c84 T8 = 174 Q5 = c15T1 + c25T2 + c35T3 + c45T4 + c55T5 + c65T6 + c75T7 + c85T8 = -14 Q6 = c16 T1 + c26 T2 + c36T3 + c46T4 + c56T5 + c66 T6 + c76 T7 + c86 T8 = -21

Q7 = c17 T1 + c27 T2 + c37 T3 + c47 T4 + c57 T5 + c67 T6 + c77 T7 + c87 T8 = -1 Un método más fácil para calcular es multiplicar la matriz por un vector.

LM7 MM00 MM0 MM0 MM0 N0

44 O OP LM119 PP LM−98OP M P M 84 P M609 P 0 P M P M 35 P P 51 M P 3 P × M P = M174 P M 22 P −1P M P M −14P 32 P M P 0 P MM PP M −21P 33 0 QP M P MN −1 PQ MN 65 PQ

−1 −1 −1 −1 −1 −1 −1 5

5

−2 −2 −2 −2 −2

1

−1

0

0

0

0

3

−2 −2 −2

0

0

0

0

1

0

0

0

0

0

2

−1 −1

0

0

0

0

0

1

−1

Análisis y Diseño de Experimentos - 175 Cálculo de los divisores: D j = r

FG ∑ c IJ H K k

2 ij

i =1

2 2 2 2 + c312 + c41 + c512 + c61 + c71 + c812 = 6 72 + ( −1)2 + ( −1)2 + ( −1)2 + ( −1)2 + ( −1)2 D1 = r c112 + c21

= 6x56 = 336 D2 = 6x70 = 420; D3 = 6x2 = 12; D4 = 6x30 = 180; D5 = 6x2 = 12; D6 = 6x6 = 36; D7 = 6x2 = 12. Suma de Cuadrados de los contrastes: SCQ1 =

Q12 k

r ∑ cij2

=

Q12 982 = = 28.583 D1 336

i =1

Q 2 6092 SCQ2 = 2 = = 883.05 D2 420

SCQ5 =

Q52 ( −14 )2 = = 16.333 D5 12

SCQ3 =

Q32 352 = = 102.083 D3 12

SCQ6 =

Q62 ( −21)2 = = 12.25 D6 36

SCQ4 =

Q42 174 2 = = 168.20 D4 180

SCQ7 =

Q72 ( −1 )2 = = 0.083 D7 12

Finalmente con los componentes calculados, se hace la tabla final de ANOVA Fuentes de Variación GL. SC. Bloques 5 102.5000 Tratamientos 7 1210.5833 C1 : A vs (B,C,D,E,F,G,H) 1 28.5830 C2 : (B y C) vs (D,E,F,G,H) 1 883.0500 C3 : B vs C 1 102.0830 C4 : (D y H) vs (E,F,G) 1 168.2000 C5 : D vs H 1 16.3300 C6 : E vs (F y G) 1 12.2500 C7 : F vs G 1 0.0830 Error Experimental 35 202.166667 TOTAL 47 1515.249967 CV = 25.64%

CM. 20.50000 172.94047 28.58300 883.05000 102.08300 168.20000 16.33000 12.25000 0.08300 5.77619

Fc Signific. 3.55 ns. 29.94 ** 4.95 * 152.88 ** 17.67 ** 29.12 ** 2.83 ns. 2.12 ns. 0.01 ns.

- 176 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

/* PROGRAMA EN SAS */ DATA FCUFVA; OPTIONS NODATE NOCENTER NONUMBER; DO TRAT = 1 TO 8; DO BLK = 1 TO 6; INPUT SEMI @; OUTPUT; END; END; CARDS; 8 8 9 7 7 5 16 19 24 22 19 19 14 16 14 13 14 13 10 11 12 8 7 3 8 7 1 1 3 2 8 8 3 3 3 7 7 6 6 6 4 4 12 19 9 11 9 5 ; PROC PRINT; RUN; PROC GLM; CLASS BLK TRAT; MODEL SEMI = BLK TRAT; RUN; CONTRAST’A VERSUS B,C,D,E,F,G,H ‘ TRAT 7 -1 -1 -1 -1 -1 -1 -1; CONTRAST’B y C VERSUS D,E,F,G, H ‘ TRAT 0 5 5 -2 -2 -2 -2 -2; CONTRAST’B VERSUS C ‘ TRAT 0 1 -1 0 0 0 0 0; CONTRAST’D y H VERSUS E,F Y G ‘ TRAT 0 0 0 3 -2 -2 -2 3; CONTRAST’D VERSUS H ‘ TRAT 0 0 0 1 0 0 0 -1; CONTRAST’E VERSUS F y G ‘ TRAT 0 0 0 0 2 -1 -1 0; CONTRAST’F VERSUS G ‘ TRAT 0 0 0 0 0 1 -1 0; RUN;

SALIDA DE RESULTADOS CON SAS The GLM Procedure Class Level Information Class Levels Values BLK 6 1 2 3 4 5 6 TRAT 8 1 2 3 4 5 6 7 8 Number of observations 48 Dependent Variable: SEMI Source Model BLK TRAT Error Corrected Total R-Square Coeff Var 0.866579 25.63595 Contrast A VERSUS B,C,D,E,F,G,H B y C VERSUS D,E,F,G, H B VERSUS C D y H VERSUS E,F Y G D VERSUS H E VERSUS F y G F VERSUS G

Sum of DF Squares Mean Square 12 1313.083333 109.423611 5 102.500000 20.500000 7 1210.583333 172.940476 35 202.166667 5.776190 47 1515.250000 Root MSE SEMI Mean 2.403371 9.375000 DF 1 1 1 1 1 1 1

Contrast SS 28.5833333 883.0500000 102.0833333 168.2000000 16.3333333 12.2500000 0.0833333

Mean Square 28.5833333 883.0500000 102.0833333 168.2000000 16.3333333 12.2500000 0.0833333

F Value 4.95 152.88 17.67 29.12 2.83 2.12 0.01

F Value 18.94 3.55 29.94

Pr > F 0.0327 F( tt−−11 )( r −1 ),0.05 , entonces se acepta la Ha:

5. Cálculos: i) Grados de libertad. Bloques Tratamientos (muestras) Error experimental Total

:r-1 =4-1 = 3 :t-1 =4-1 = 3 : (r-1)(t-1) = 3 x 3 = 9 : tr - 1 = 4x4 - 1 = 15

CM Tratam. CM Error

- 182 -

V. Ibañez Q. - Docente FINESI - UNA - Puno ii)

Suma de Cuadrados (SC ó SS). TC =

Y••2 1912 = = 2280.0625 tr 4 × 4 r =4

Y•2j

i =1

t

SCBloques = ∑

=

482 + 452 + 49 2 + 49 2 − TC = 2.6875 4

Y 402 + 482 + 612 + 42 2 = − TC = 67.1875 4 i =1 r

t =4

2 i•

SCTratam. = ∑ 4

4

SCTotal = ∑ ∑ Yij2 − TC = ( 102 + 9 2 +L+112 ) − TC = 2353 − TC = 72.9375 i =1 j =1

SCError = SCTotal − SCBloque − SCTratam. = 72.9375 − 2.6875 − 67.1875 = 3.0625

ANALISIS DE VARIANZA F. de V. G.L. S.C. Bloques 3 2.6875 Tratamientos 3 67.1875 Error experimental 9 3.0625 Total 15 72.9375

C.M. 0.895833 22.395833 0.340278

Fc. 2.63 65.82

3

6. Decisión: Como F(tratam.) = 65.85 > F9,0.01

Signif. ns. **

= 6.99, entonces se acepta la

hipótesis alterna (Ha:), y se rechaza la Ho: 7. Conclusión: En base a los resultados de ANOVA, podemos afirmar que existe diferencia estadística altamente significativa (P ≤ 0.01) entre los niveles de fertilización nitrogenada, es decir que el fertilizante tiene efecto sobre la producción de papa, además los niveles de tratamientos son tipo cuantitativo por lo que se debe realizar los la prueba de tendencias. 2. Ordenar los totales de los niveles (tratamientos) de fertilizantes nitrogenados con los valores de los polinomios ortogonales para cada tendencia. N0

N50

N100

N150

Totales (Yi.) Componentes o tendencias 1. Lineal

40

48

61

42

-3

-1

1

3

2. Cuadrático 3. Cúbico

1 -1

-1 3

-1 -3

1 1 k

3. Calcular los valores Qj de acuerdo a la siguiente ecuación: Q j = ∑ Yi • cij i =1

Análisis y Diseño de Experimentos - 183 Reemplazando para cada uno de las tendencias, se obtiene: k =4

Q1 = QLineal = ∑Yi•cij = Y1•c11 + Y2•c21 + Y3•c31 + Y4•c41 = 40( −3) + 48( −1) + 61( +1) + 42( +3) = 19 i =1

k =4

Q2 = QCuadrática = ∑Yi•cij = Y1•c12 + Y2•c22 + Y3•c32 + Y4•c42 = 40( +1) + 48( −1) + 61( +1) + 42( +1) = −27 i =1

k =4

Q3 = QCúbica = ∑Yi•cij = Y1•c13 + Y2•c23 + Y3•c33 + Y4•c43 = 40(-1) + 48(+3) + 61(-3) +42(+1) = -37 i =1

k

4. Calcular los divisores mediante la fórmula: r ∑ cij2 i =1

k =4

Lineal1: r∑ci21 = 4 c112 + c212 + c312 + c412 =4[ (-3)2 +(-1)2 +(+1)2 +(+3)2 ] = 4(20) =80 i =1

k =4

Cuadrática2: r∑ci22 = 4 c122 + c222 + c322 + c422 =4[ (+1)2 +(-1)2 +(+1)2 +(+1)2 ]=4(4) =16 i=1

k =4

Cúbica3: r∑ci23 = 4 c132 + c232 + c332 + c432 =4[ (-1)2 +(+3)2 +(-3)2 +(+1)2 ]=4(20) =80 i=1

5. Calcular la suma de cuadrados para cada una de las tendencias, mediante la siguiente fórmula:

SC Q j =

Q 2j k

r ∑ cij2 i =1

SC Q1 = SCLineal =

Q12 ( 19 )2 = = 4.5125 80 80

SC Q 2 = SCCuadrática =

Q22 ( −27 )2 . = = 455625 16 16

SCQ3 = SCCúbica =

Q32 ( −37 )2 = = 17.1125 80 80 SCTratamiento = 67.1875

- 184 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

6. Efectuar la prueba de significancia de las tendencias o respuestas mediante la prueba de F y completar el Análisis de Variancia (ANOVA). Tabla de ANOVA, considerando los componentes. F. de V. G.L. SC. CM. Bloques 2.6875 0.8958 3 Tratamientos 67.1875 22.3958 3 Lineal 1 4.5125 4.5125 Cuadrático 1 45.5625 45.5625 Cúbico 1 17.1125 17.1125 Error 3.0625 0.3403 9 Total 72.9375 15

Fc 2.63 n.s. 65.82 ** 13.26 ** 133.89 ** 50.59 **

/* PROGRAMA EN SAS */ DATA CURVA; OPTIONS NODATE NOCENTER NONUMBER; INPUT TRAT REP NIT Y; YH = Y*(10000/20); N2 = NIT*NIT; CARDS; 1 1 0 10 1209 1 3 0 11 1 4 0 10 2 1 50 12 2 2 50 11 2 3 50 12 2 4 50 13 3 1 100 15 3 2 100 15 3 3 100 16 3 4 100 15 4 1 150 11 4 2 150 10 4 3 150 10 4 4 150 11 ; PROC GLM; CLASS TRAT REP NIT; MODEL Y = REP TRAT; CONTRAST’LINEAL ‘ TRAT -3 -1 1 3; CONTRAST’CUADRATICA ‘ TRAT 1 -1 -1 1; CONTRAST’CUBICA ‘ TRAT -1 3 -3 1; RUN; /* Presione F3 para ejecutar el programa */

Análisis y Diseño de Experimentos - 185 SALIDA DE RESULTADOS CON SAS Class Level Information Class Levels Values TRAT 4 1 2 3 4 REP 4 1 2 3 4 NIT 4 0 50 100 150 Number of observations 16 Dependent Variable: Y Source Model REP TRAT Error Corrected Total R-Square Coeff Var 0.958012 4.886562

Sum of DF Squares Mean Square 6 69.87500000 11.64583333 3 2.68750000 0.89583333 3 67.18750000 22.39583333 9 3.06250000 0.34027778 15 72.93750000 Root MSE Y Mean 0.583333 11.93750

Contrast LINEAL CUADRATICA CUBICA

DF 1 1 1

Contrast SS 4.51250000 45.56250000 17.11250000

Mean Square 4.51250000 45.56250000 17.11250000

F Value 34.22 2.63 65.82

Pr > F F124 ,0 .01 = 5.41, entonces se acepta la Ha: y se rechaza la Ho: 6. Conclusión: No existen evidencias estadísticas significativas para los filas ó bloques y columnas, en cambio encontramos diferencia estadística altamente significativa para los catalizadores ( P ≤ 0.01) en el análisis de varianza, lo cual confirma que cada uno de los catalizadores actúan en forma diferente en la variable de respuesta, para una mejor interpretación de estos resultados se realizará la prueba múltiple de significancia de Duncan.

Prueba Múltiple de comparación de DUNCAN 1. Hipótesis: H0 : µ A = µ B = µ C = µ D = µ E Vs. Ha : µ i ≠ 0 2. Nivel de significación: α = 0.05 3. Buscar en la Tabla de Duncan los valores de AES(D) con Grados de Libertad del Error (GLerror = 12).

Análisis y Diseño de Experimentos - 231 p: A ES(D)

SY =

2 3.08 3 .1266667 5

=

A LS(D)

3 3.23

4 3.33

2.55

2.63

0.79 2.43

ALS ( D ) = SY × AES ( D ) , S Y =

3.1266667 = 0.79 5

CM Error = r

3. Ordenar los promedios de mayor a menor. Catalizadores C A B D E

Promedios 8.8 8.4 5.6 3.4 3.2

Duncan (P ≤ 0.05)

a a b b b

4. Regla de decisión: Sí Yi • − Yj • ≤ ALS ( D ) , entonces se acepta la Ho: Sí Yi • − Yj • > ALS ( D ) , entonces se acepta la Ha: 5. Realizar las comparaciones: 8.80 - 8.40 = 0.40 ≤ 2.43, entonces no es significativo

µC = µ A

8.80 - 5.60 = 3.20 > 2.55, entonces es significativo µ C ≠ µ B -------------------------------------------------------------------------------5.60 - 3.40 = 2.20 ≤ 2.43, entonces no es significativo

µB = µD

5.60 - 3.20 = 2.40 ≤ 2.55, entonces no es significativo

µB = µE

- 232 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

DATA DCLAT; OPTIONS NODATE NOCENTER NONUMBER; INPUT FILA COLUM TRAT $ TIEMPO; DATALINES; 1 1 A 8 1 2 C 11 1 3 B 4 1 4 D 6 1 5 E 4 2 1 B 7 2 2 E 2 2 3 A 9 2 4 C 8 2 5 D 2 3 1 D 1 3 2 A 7 3 3 C 10 3 4 E 6 3 5 B 3 4 1 C 7 4 2 D 3 4 3 E 1 4 4 B 6 4 5 A 8 5 1 E 3 5 2 B 8 5 3 D 5 5 4 A 10 5 5 C 8 ; PROC PRINT; RUN; PROC ANOVA; CLASS FILA COLUM TRAT; MODEL TIEMPO = FILA COLUM TRAT; MEANS FILA COLUM TRAT/LSD DUNCAN TUKEY; RUN;

Análisis y Diseño de Experimentos - 233 RESULTADOS DEL SAS The ANOVA Procedure Class Level Information Class Levels Values FILA 5 1 2 3 4 5 COLUM 5 1 2 3 4 5 TRAT 5 A B C D E Number of observations 25 Dependent Variable: TIEMPO Source Model FILA COLUM TRAT Error Corrected Total R-Square Coeff Var 0.818428 30.07208

Sum of DF Squares Mean Square 12 169.1200000 14.0933333 4 12.2400000 3.0600000 4 15.4400000 3.8600000 4 141.4400000 35.3600000 12 37.5200000 3.1266667 24 206.6400000 Root MSE TIEMPO Mean 1.768238 5.880000

t Tests (LSD) for TIEMPO Alpha 0.05 Error Degrees of Freedom 12 Error Mean Square 3.126667 Critical Value of t 2.17881 Least Significant Difference 2.4366 Mean N TRAT A 8.800 5 C A 8.400 5 A B 5.600 5 B B 3.400 5 D B 3.200 5 E Duncan’s Multiple Range Test for TIEMPO Mean N TRAT A 8.800 5 C A 8.400 5 A B 5.600 5 B B 3.400 5 D B 3.200 5 E Tukey’s Studentized Range Tukey Groupi ng Mean A 8.800 A 8.400 B A 5.600 B 3.400 B 3.200

(HSD) Test for TIEMPO N 5 5 5 5 5

TRAT C A B D E

F Value 4.51 0.98 1.23 11.31

Pr > F 0.0072 0.4550 0.3476 0.0005

- 234 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

EJEMPLO: En un experimento se probaron tres dietas diferentes (A, B y C) para medir su efecto en la producción de leche. Las dietas se aplicaron a tres vacas en tres períodos de lactancia diferentes. Los resultados son los siguientes:

1 Período

I II III

A B C

608 715 884 2207

A B C

608 715 884

Cj

VA CA 2 B 885 C 1087 A 711 2683 711 885 1087

3 C A B

940 766 832 2538 766 832 940 Y... =

Hk 2433 2568 2427 Y... = 7428 2085 2432 2911 7428

Las hipótesis para hileras y columnas, al igual que la de bloques en un diseño completo al azar, en realidad sólo dan una idea acerca de la eficiencia o justificación en el empleo del control local efectuado en estos diseños. SUMA DE CUADRADOS:

SC tratam. =

2085 2 + 2432 2 + 2911 2 7428 2 − = 114680.6 3 9

SC PERIO D O S =

SC VAC AS =

2433 2 + 2568 2 + 2427 2 7428 2 − = 4238 .0 3 9

2207 2 + 2683 2 + 2538 7428 2 − = 39684 .60 4 9

7428 2 = 164664 .0 9 SCerror exptal. = 164664 - (114680.6 + 4238 + 39684.6) = 6060.8

SC To tal = 608 2 + L + 832 2 −

Análisis y Diseño de Experimentos - 235 TABLA DE ANALISIS DE VARIANZA. F. de V. Períodos Vacas Tratamientos Error exptal. Total

G.L. 2 2 2 2 8

S.C. 4238.00 39684.60 114680.60 6060.80 164664.00

C.M. 2119.00 19842.30 57340.30 3030.40

Fc. 0.70ns. 6.55* 18.92**

0.05 0.01 4.46 8.65

Por lo anterior, no se rechaza la hipótesis nula respecto de los períodos, pero sucede lo contrario para los efectos de vacas y raciones. La partición de las sumas de cuadrados significativas. Existe diferencia significativa entre vacas es fuente de variación para la respuesta. Para las raciones alimenticias, se ha encontrado diferencia estadística altamente significativo ( P ≤ 0.01) , esto implica la fuente de variación para la respuesta, es decir que el consumo de la dieta de cada vaca es diferente a las otras vacas. Se deja como ejercicio al estudiante para que realice la prueba múltiple de comparación de Duncan. PROGRAMA EN SAS. DATA DIETA; OPTIONS NODATE NOCENTER NONUMBER; TITLE’DISEÑO CUADRADO LATINO DE 3x3’; DO FILA = 1 TO 3; DO COLUM = 1 TO 3; INPUT TRAT $ LECHE; OUTPUT; END; END; CARDS; A 608 B 715 C 884 B 885 C 1087 A 711 C 940 A 766 B 832 ; PROC PRINT; RUN; PROC GLM; CLASS FILA COLUM TRAT; MODEL LECHE = FILA COLUM TRAT; MEANS FILA COLUM TRAT /DUNCAN; RUN; /* F3 para ejecutar */

- 236 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

EJERCICIOS: 1. En un experimento donde se desea probar 4 máquinas con el objeto de ver si difieren significativamente en su capacidad de producción de una cierta pieza manufacturada. Es perfectamente conocido que diferentes trabajadores y diferentes periodos de tiempo en un día de trabajo tendrán un efecto sobre la producción. Las máquinas son asignadas al azar a cada trabajador frente a su respectivo periodo de tiempo, en un día de trabajo. Obteniéndose los siguientes resultados experimentales. Analice y obtenga las conclusiones. Periodo de tiempo 1 2 3 4

1 C 31 D 39 B 57 A 85

OPERADORES 2 3 D 43 A 31 A 96 B 50 C 33 D 40 B 46 C 48

B C A D

4 36 48 84 50

2.- Se realizó un experimento para asegurar las resistencias relativas a la abrasión de 4 tipos de pieles (A, B, C, D). Se usó una máquina en la cual se probaron las muestras en una cualquiera de 4 posiciones. Puesto que se conoce que diferentes ejecuciones del experimento (reproducciones) dan resultados variables, se decidió hacer 4 ejecuciones del mismo. Se utilizó un diseño cuadrado latino y se obtuvieron los siguientes resultados. Analice e interprete los datos. Ejecución 1 2 3 4

1 118(B) 127(D) 174(A) 130(C)

2 136(D) 141(B) 173(C) 170(A)

POSICION 3 168(A) 129(C) 126(B) 125(D)

4 135(C) 151(A) 134(D) 95(B)

3.- Un ingeniero químico está investigando el efecto que tienen 4 métodos de ensamblaje (A, B, C y D) sobre el tiempo de ensamblaje de un componente para televisores a color. Se seleccionan 4 operadores para realizar este estudio. Por otra parte, el ingeniero sabe que cada método de ensamblaje produce fatiga, por lo que el tiempo que se tarda en el último ensamblaje puede ser mayor que en el primero, independientemente del método. En otras palabras se produce un patrón en el tiempo de ensamblaje. Para controlar esta posible fuente de variabilidad el ingeniero utiliza el diseño de cuadrados latinos que aparece a continuación. Analice y obtenga las conclusiones apropiadas. Orden de montaje 1 2 3 4

1 C 10 B 7 A 5 D 10

OPERADOR 2 3 D 14 A 7 C 18 D 11 B 10 C 11 A 10 B 12

4 B A D C

8 8 9 14

Análisis y Diseño de Experimentos - 237 4.-Se prueba seis dietas de concentración y su efecto en la producción de leche, en seis vacas que tienen diferente período de lactación ( 1 a 6 meses), cuya distribución es: Períodos III I VI IV II V

C E F B D A

5 9.40 4.90 6.70 8.90 5.92 7.20

1 E 5.450 A 7.600 B 8.320 D 6.120 F 9.850 C 9.900

A C D F B E

VACAS 3 6 4 6.08 D 3.46 B 8.85 10.87 F 7.15 D 4.12 6.80 A 7.11 E 6.14 12.43 C 11.40 A 5.15 6.15 E 8.10 C 8.16 5.64 B 9.12 F 10.50

F B C E A D

2 8.50 7.15 8.84 7.30 6.13 7.00

a) Habrá diferencia entre dietass. b) Habrá diferencia entre vacas. c) Habrá diferencia entre períodos. d) Contraste promedios entre dietas a través de la prueba de Tukey al 95%.

- 238 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

6.2. Diseño Cuadrado Grecolatino (DCGL). Considere un cuadrado latino pxp al cual se le superpone un segundo cuadrado latino pxp en el que los tratamientos se denotan con letras griegas. Si cuando se hace la superposición los dos cuadrados tienen la propiedad de que cada letra griega aparece una y sólo una vez con cada letra latina, se dice que los cuadrados latinos son ortogonales, y al diseño obtenido se le llama Cuadrado Grecolatino. El diseño de cuadrado Grecolatino puede usarse para controlar sistemáticamente tres fuentes de variabilidad extraña, es decir, para hacer la formación de bloques en tres direcciones. El diseño permite la investigación de cuatro factores (renglones, columnas, letras latinas y letras griegas), cada una con «p» niveles en sólo p2 corridas. Existen cuadrados grecolatinos para toda p ≥ 3, excepto p = 6. En la siguiente tabla, se muestra un ejemplo de un cuadrado grecolatino de 4x4. Ejemplo de Diseño Cuadrado Grecolatino de 4x4. Renglones 1

1 A

Letras Latinas 2 3 B C

4 D

2

B

A

D

C

3

C

D

A

B

4

D

C

B

A

1

Letras Griegas 2 3 4

α β γ + δ γ β β α δ γ δ α

δ α γ β

1



= Bδ Cβ Dγ

Grecolatino 2 3 Bβ Cγ



Dα Cδ

Dβ Aδ



4 Dδ



Bγ A

β

El modelo estadístico lineal para el diseño de cuadrado grecolatino es:

Yijkl = µ + θ i + τ j + ω k + ψ l + ε ijkl

R| i = 1,2,K, p |S j = 1,2,K, p ||k = 1,2,K, p T l = 1,2,K , p

donde:

Yijkl : Es la observación del renglón «i» y la columna «l» para la letra latina «j» y la letra griega «k».

θ i : Es el efecto del renglón i-ésimo.

τ j : Es el efecto del tratamiento de la letra latina «j» ω k : Es el efecto del tratamiento de la letra griega «k».

Análisis y Diseño de Experimentos - 239 -

ψ l : Es el efecto de la columna «l».

ε ijkl : Es un componente del error aleatorio

ε ijkl ~ NID( 0,σ 2 ) .

Sólo son necesario dos de los cuatro subíndices para identificar completamente una observación. El análisis de varianza es muy parecido al de un cuadrado latino. Puesto que las letras griegas aparecen exactamente una vez en cada renglón y columna, y exactamente una vez con cada letra latina, el factor representado por las letras griegas es ortogonal a los renglones, las columnas y los tratamientos de letras latinas. Por lo tanto, puede calcularse una suma de cuadrados debida al factor de las letras griegas a partir de los totales de las letras griegas y el error experimental se reduce adicionalmemnte en esta cantidad. En la siguiente tabla se ilustran los detalles de los cálculos de las fórmulas de análisis de varianza. La hipótesis nula de la igualdad de tratamientos de renglones, columnas, letras latinas y letras griegas, se probaría dividiendo el cuadrado medio correspondiente por el cuadrado medio del error. La región de rechazo es la cola superior del punto de la distribución F( pp−−13 )( p −1 ) . TABLA ANOVA: Fórmulas. F. de Variación

G.L.

S.C.

Tratamientos con letras latinas

p-1 SCL = ∑

p

Y•2j ••

j =1

p



C.M.

Fc.

2 Y•••• p2

SC Latina p−1

CM Latina CM Error

Tratamientos con letras griegas

p-1 SCG = ∑

2 Y••2k • Y•••• − 2 p k =1 p

SC G rieg a

CM Griega

p −1

CM Error

Renglones ó filas

p Y2 Y2 p-1 SCRengl . = ∑ i••• − •••• p2 i =1 p

S C R e ngl .

CM Re ngl .

p −1

CM Error

Columnas

p Y2 Y2 p-1 SCColum. = ∑ •••l − •••• p2 l =1 p

SC Colum . p −1

CM Colum . CM Error

CM Error =

SCError ( p − 1 )( p − 3 )

p

(p - 1)(p - 3) SCError (por diferencia)

Error Exptal (EE)

Total

2 Y•••• 2 SC Y = − ∑i ∑j ∑k ∑l ijkl p 2 Total p -1 2

- 240 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

EJEMPLO: El rendimiento de un proceso químico se midió utilizando cinco lotes de materia prima, cinco concentraciones de ácido, cinco tiempos de procesamiento (A,B,C,D y E) y cinco concentraciones del catalizador ( α ,

β , γ , δ y ε ). Se usó el cuadrado

grecolatino siguiente. Analizar los datos de este experimento (utilizar sacar conclusiones. Lote 1 2 3 4 5 Y..k.

Aα Bγ Cε Dβ Eδ

1 26 18 20 15 10 89

Concentración del ácido 2 3 4 B β 16 C γ 19 Dδ 16 Cδ 21 D ε 18 Eα 11 D α 12 E β 16 A γ 25 E γ 15 A δ 22 Bε 14 Aε 24 B α 17 C β 17 88 92 83

Eε A β Bδ Cα Dγ

5 13 21 13 17 14 78

α = 0.05) y

Y...l 90 89 86 83 82 430

SOLUCIÓN: 1. Hipótesis: Respecto al tratamiento de la letra latina: H0 : τ j = 0 versus Ha :τ j ≠ 0 Respecto al tratamiento de la letra griega: H0 : ω k = 0 versus Ha :ω k ≠ 0 Respecto a fila:

H0 :θ i = 0 versus Ha :θ i ≠ 0

Respecto a columnas:

H0 :ψ l = 0 versus Ha :ψ l ≠ 0

2. Nivel de significación:

α = 0.05

3. Estadígrafo de contraste:

F ( L a tin a ) = F ( G rieg a ) =

C M L a tin a C M E rro r C M G r ie g a

C M E rro r C M C o lu m . F ( C o lu m . ) = C M E rro r C M F ila F ( F ila ) = C M E rro r

U| || |V ~ F || || W

p −1 ( p − 1 )( p − 3 ),0 . 0 5

4. Cálculo de Análisis de Varianza (ANOVA). a)

Grado de libertad (GL). Letras latinas Letras griegas

:p-1=5-1=4 :p-1=5-1=4

Análisis y Diseño de Experimentos - 241 Filas ó Hileras Columnas Error experimental Total

b)

:p-1=5-1=4 :p-1=5-1=4 : (p - 1)(p - 3) = 4x2 = 8 : p2 - 1 = 5x5 - 1 = 24

Suma de Cuadrados:

TC =

Y•2• • ( 4 3 0 )2 = = 7396 2 p 5×5

Suma de Cuadrados para filas ó bloques: 2 Yi ••• 90 2 + 89 2 + 86 2 + 832 + 82 2 − TC = − TC = 10.0 5 5

5

SC Filas = ∑ i =1

Suma de Cuadrados para Columnas. 2 Y••• 89 2 + 882 + 92 2 + 832 + 782 l − TC = − TC = 24.40 5 l =1 5 5

SCcolumnas = ∑

Suma de Cuadrados para letras latinas (tiempos de procesamiento) 5

Y•2j ••

j =1

5

SCLatinas = ∑

− TC =

1182 + 782 + 94 2 + 752 + 652 − TC = 342.80 5

Suma de Cuadrados para letras griegas (concent. del catalizador) Y••2 k • 832 + 852 + 912 + 82 2 + 892 − TC = − TC = 37040 − TC = 12.0 5 k =1 5 5

SCGriegas = ∑

SC T otal =

5

∑Y

2 ijk

− TC = ( 26 2 + 18 2 + L + 17 2 + 14 2 ) − TC = 436 .0

i , j ,k ,l

SCError = SCTotal − SCLatinas − SCGriegas − SCFilas − SCColum. = 46.80 TABLA DE ANALISIS DE VARIANCIA. F. de V. Tratamiento con letras Latinas Tratamiento con letras Griegas Filas o renglones Columnas Error experimental Total

G.L. S.C. 4 342.80 4 12.00 4 10.00 4 24.40 8 46.80 24 436.00

C.M. 85.700 3.000 2.500 6.100 5.850

Fc. Signifc. F-Tabla 14.65 ** 3.84 0.51 ns. 0.43 ns. 1.04 ns.

- 242 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

5. Decisión: Como FTiempos de proc.= 14.65 > F8 ,0 .05 = 3.84, entonces se acepta la Ha: 4

y se rechaza la Ho: 6. Conclusión: Se ha encontrado diferencias estadísticas significativas para los cinco tiempos de concentración (letras latinas), en cambio no presentaron diferencia estadística significativa para: concentración de catalizadores, lotes de materia prima y concentraciones de ácido. Se deja como ejercicio al estudiante para que realice la prueba adecuada (Tukey o Duncan) para los cinco tiempos de concentración por ser significativo en la fuente de variación.

/* PROGRAMA EN SAS */ DATA DCGL; OPTIONS NODATE NOCENTER NONUMBER; INPUT COLUM FILAS LATINA $ GRIEGA $ Y; CARDS; 1 1 A a 26 1 2 B g 18 1 3 C e 20 1 4 D b 15 1 5 E d 10 2 1 B b 16 2 2 C d 21 2 3 D a 12 2 4 E g 15 2 5 A e 24 3 1 C g 19 3 2 D e 18 3 3 E b 16 3 4 A d 22 3 5 B a 17 4 1 D d 16 4 2 E a 11 4 3 A g 25 4 4 B e 14 4 5 C b 17 5 1 E e 13 5 2 A b 21 5 3 B d 13 5 4 C a 17 5 5 D g 14 ; PROC PRINT; RUN; PROC ANOVA; CLASS COLUM FILAS LATINA GRIEGA; MODEL Y = LATINA GRIEGA FILAS COLUM; MEANS LATINA/DUNCAN TUKEY; RUN;

Análisis y Diseño de Experimentos - 243 SALIDA DE RESULTADOS CON SAS The ANOVA Procedure Class Level Information Class Levels Values COLUM 5 1 2 3 4 FILAS 5 1 2 3 4 LATINA 5 A B C D GRIEGA 5 a b d e Number of observations 25 Dependent Variable: Y Source Model LATINA GRIEGA FILAS COLUM Error Corrected Total R-Square Coeff Var 0.892661 14.06208

5 5 E g

Sum of DF Squares Mean Square 16 389.2000000 24.3250000 4 342.8000000 85.7000000 4 12.0000000 3.0000000 4 10.0000000 2.5000000 4 24.4000000 6.1000000 8 46.8000000 5.8500000 24 436.0000000 Root MSE Y Mean 2.418677 17.20000

F Value 4.16 14.65 0.51 0.43 1.04

Pr > F 0.0236 0.0009 0.7289 0.7854 0.4425

Duncan’s Multiple Range Test for Y Duncan Mean N LATINA A 23.600 5 A B 18.800 5 C C B 15.600 5 B C 15.000 5 D C 13.000 5 E

Ejercicios: 1. El rendimiento de un proceso químico se midió utilizando cinco lotes de materia prima, cinco concentraciones del ácido, cinco tiempos de procesamiento (A, B, C, D y E) y cinco concentraciones del catalizador (á, â, ã, ä, å ). Se usó el cuadrado grecolatino siguiente. Analizar los datos de este experimento (utilizar α = 0 .0 5 ) y sacar conclusiones. Lote 1 2 3 4 5

1 Aá =26 Bã= 18 Cå = 20 Dâ = 15 Eä= 10

Concentración del ácido 2 3 4 Bâ= 16 Cã = 19 Dä = 16 Cä = 2 Då = 18 Eá = 11 Dá = 12 Eâ = 16 Aã = 25 Eã = 15 Aä = 22 Bå = 14 Aå = 24 Bá = 17 Câ = 17

5 Eå = 13 Aâ = 21 Bä = 13 Cá = 17 Dã = 14

- 244 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

2. Suponga que en el problema 10 el ingeniero sospecha que los sitios de trabajo usados por los cuatro operadores pueden representar una fuente adicional de variación. Es posible introducir un cuarto factor, el sitio de trabajo ( á, â, ã, ä ), y realizar otro experimento, de donde resulta el cuadrado grecolatino siguiente. Analizar los datos de este experimento (utilizar α = 0 .0 5 ) y sacar conclusiones. Orden de Ensamblaje 1 2 3 4

1 Câ = 11 Ba = 8 Aä = 9 Dã = 9

Operador 2 3 Bã=10 Dä = 14 Cä = 12 Aã = 10 Da = 11 Bâ = 1 Aâ = 8 Ca = 18

4 Aá = 8 Dâ = 12 Cã = 15 Bä = 6

Análisis y Diseño de Experimentos - 245 -

7 EXPERIMENTOS FACTORIALES Introducción. Los Experimentos Factoriales son arreglos de tratamientos que permiten aplicar de una sola vez una serie de estímulos o tratamientos que consideramos que intervengan en la respuesta dada por una unidad experimental. Los arreglos factoriales son de importancia práctica, ya que permiten el estudio de un estímulo como tal y su respuesta combinatoria respecto de otras condiciones generadas por la interacción con otros factores, dando así información más completa, aun cuando los efectos interaccionales no sean significativos. En las ciencias agropecuarias normalmente se usan combinaciones hasta de tres factores debido principalmente a la interpretación fisiológica de las interacciones. Los arreglos de tratamientos pueden ser estudiados en el contexto de los diseños básicos, considerando las características de las unidades experimentales con las que se trabaje. Los Experimentos Factoriales no constituyen un diseño en sí, sino que debe arreglarse a cualesquiera de los diseños conocidos como: diseño completamente al azar, diseño bloques completos, cuadrados latino, etc.

- 246 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Su utilidad radica en que es posible estudiar simultáneamente más de un factor. Ejemplo estudiar varias razas de los animales y el sexo de los mismos para determinar sus incrementos de pesos; estudiar diversas variedades y su respuesta a las diferentes formas de abonamiento, etc. Además es importante porque nos permite comparar los niveles de cada factor entre sí y además las interacciones que puedan resultar como consecuencia de las combinaciones de los niveles de cada factor. Objetivos: 1. Describir los conceptos básicos de experimentos factoriales y explicar cómo se hace la experimentación factorial. 2. Desarrollar los experimentos factoriales de 2 y 3 factores y la manera en que se estabiliza la varianza. 3. Explicar el experimento general, el modelo de efectos fijos y su diferencia con el modelo de efectos aleatorios. Ventajas de los Experimentos Factoriales. 1. Permite estudiar los efectos principales, efectos simples así como de los efectos de la interacción. 2. Todas las unidades experimentales intervienen en la determinación de los efectos principales, efectos simples y de la interacción. 3. Permite ganar mayor precisión en el experimento. Desventajas de los Experimentos Factoriales. 1. Se requiere mayor número de unidades experimentales que en los experimentos simples en los cuales se estudia únicamente un solo factor; así que en un experimento factorial con 4 niveles del A, y 5 niveles del factor B, repetidos 5 veces para cada combinación de tratamientos, se requerirá 100 unidades experimentales para estudiar solamente 2 factores, mientras si se quisiera estudiar mayor número de factores el número de unidades experimentales sería aún mayor. 2. Como en los experimentos factoriales deben de combinarse todos los niveles de los factores en estudio, algunas de estas combinaciones resulta de poco interés del investigador. 3. El análisis estadístico es mas complicado en comparación con los experimentos simples.

Análisis y Diseño de Experimentos - 247 Experimento factorial. El término experimentación factorial se refiere a la evaluación simultánea de dos ó más factores en un experimento o estudiar el efecto de varios factores sobre una o varias respuestas o características de calidad, lo que se busca es estudiar la relación entre los factores y la respuesta, con la finalidad de conocer mejor cómo es ésta relación y genera conocimiento que permita tomar acciones y decisiones que mejoren el desempeño del proceso. Para diseñar un experimento factorial, se utilizan los diesños básicos como: diseño completamente al azar, diseño bloque completo al azar, diseño cuadrado latino entre otros. Elección de los factores. Factor. Es una clase de tratamiento que interviene en el experimento, es así que en los Experimentos Factoriales, todo factor proporciona varios tratamientos; ejemplo de factores: Razas de animales, variedades de alfalfa, dosis de nitrógeno, profundidad de labranza, raciones alimenticias, dosis de una hormona, etc. A los Factores se les simboliza generalmente por las primeras letras mayúsculas del alfabeto (A, B, C, D, etc). Niveles de un factor. Son los diversos tratamientos que pertenecen a un determinado factor; y se acostumbra a simbolizar un nivel cualquiera por la letra que representa el factor y el valor del respectivo sub índice. Ejemplo: el factor dosis de la hormona estilbestrol simbolizado por A tiene 4 niveles en el experimento: a1 = 2cc, a2 = 3cc, a3 = 4cc, a4 = 5cc. Tipos de factores. Los factores que se estudian en los experimentos se clasifican en: Factor fijo: Los niveles o tratamientos son fijados por el experimentador de acuerdo a su interés. Son muy usuales en la experimentación. Ejemplos: - Factor Nitrógeno: 50, 70, 90 kg de N/ha. - Factor temperatura: 10, 15, 18, 20 grados centígrados. - Alimento: con ingrediente nuevo, sin ingrediente.

- 248 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

- Tres variedades de trigo: V1, V2, V3, etc. Factor al azar: Los niveles o tratamientos son seleccionados al azar de la población de niveles, constituyendo una muestra los que están en el experimento. Ejemplo: - Los años en los que se cultivan ciertas variedades de papa, trigo, etc. son considerados como una muestra de años antes y años después de lo establecido. Clasificación de los factores: Factores Cualitativos.- Los niveles o tratamientos son cualidades o categorías, cuyos niveles corresponden a procedimientos o cualidades y no tienen un orden natural y cada nivel tiene un valor intrínsico. Ejemplo: métodos de enseñanza de cierta asignatura, variedades o linajes de un cultivo, épocas del año, las estaciones del año, clases de lana, razas de ganado, variedades, zonas ecológicas, tipos de hormona, tipos de alimento, sistema de riego, sistema de labranza, variedades de los cereales, etc. Factores Cuantitativos.- Son aquellos cuyos niveles corresponden a cantidades numéricas de un factor cuantitativo, que de preferencia debe ser igualmente espaciadas o de igual intervalo o no. Ejemplo: distanciamiento entre plantas de algodón a 50 cm., 60 cm., 70 cm., niveles de pH en la elaboración de cierto alimento: 2.0, 2.5, 2.8, 3.0, diferentes dosis de una hormona, diferentes dosis de una ración protéica, diferentes dosis de un abono nitrogenado, diferentes grados de temperatura, dosis de vitamina B12, tiempos, minutos, etc. Factores cruzados.- Factores en los que cada nivel de uno de los factores se combina con todos los niveles de los otros factores. Factores anidados.- Los niveles de cada factor no pueden o no interesa que se combinen con todos los niveles de los otros factores, un factor puede ser fijo o al azar. Simbolización.- Se utiliza letras mayúsculas para los factores: A, B, C, D, R y letras minúsculas con subíndices para indicar niveles: a, b, c, d, r (para indicar el número de niveles de cada factor). i, j, k, l, m (para indicar cualquier nivel del factor). ai, bj, ck, dl, rm (para indicar los niveles).

α , β , γ , δ , ε (para indicar los efectos).

Análisis y Diseño de Experimentos - 249 Ejemplos: Un experimento factorial en el cual se estudia dos factores, y cada factor con dos niveles, se simboliza como 2Ax2B ó 2x2. El número de combinaciones de tratamientos que intervienen en este factorial es el producto de las cantidades de niveles de los factores en estudio, en este experimento existirán 4 tratamientos. En un experimento factorial en el cual intervienen tres factores A, B y C, donde el factor A tiene tres niveles, el factor B tiene 2 niveles y el factor C, tiene dos niveles, se simbolizará como 3Ax2Bx2C ó 3x2x2 o también 3x22; y el número de tratamientos producto de las combinaciones será igual a 12. Tipos de notación en el experimento factorial (croquis de campo). Trat. Combinado

I

II

III

IV

V

1

a1b1c1

111

a0b0c0

000

(1)

2

a1b1c2

112

a0b0c1

001

c 2

3

a1b1c3

113

a0b0c2

002

c

4

a1b2c1

121

a0b1c0

010

b

5

a1b2c2

122

a0b1c1

011

bc

6

a1b2c3

123

a0b1c2

012

bc

7

a2b1c1

211

a1b0c0

100

a

8

a2b1c2

212

a1b0c1

101

ac

9

a2b1c3

213

a1b0c2

102

ac

2

2

10

a2b2c1

221

a1b1c0

110

ab

11

a2b2c2

222

a1b1c1

111

abc

12

a2b2c3

223

a1b1c2

112

abc

2

El cálculo de número de interacciones de cierta cantidad «m» de factores, se hace mediante la operación combinaciones de «f» en «m», tal como se presenta en seguida:

FG f IJ = f ! que cuenta el número de maneras diferentes de seleccionar «m» H mK m!( f − m )!

factores de los f.

- 250 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

En resumen, con el factorial general, se pueden estudiar los siguientes 2 f − 1efectos:

FG f IJ = f efectos principales (A, B,...,K) H 1K FG f IJ = f ( f − 1 ) interacciones dobles (AB, AC,...(K-1)K) 2 H 2K

FG f IJ = f H f −1K FG f IJ = 1 HfK

M interacciones de f-1 factores (AB...K-1, AB...(K-2)K,....) interacciones de todos los factores (ABC....K)

Ejemplo: 2 2 × 31 = 12 tratamientos o combinaciones. Entonces existen 3 factores en estudio,

se desea saber cuántas interacciones de primer orden existen?.

FG 3IJ = 3! = 3 interacciones de primer orden ó interacciones dobles. H 2K 2 !( 3 − 2 )!

Cuando se tiene 4 factores en estudio, cuántas interacciones de segundo orden existen en el experimento?.

FG 4IJ = 4! = 4 interacciones de segundo orden o a veces lo llaman interacciones H 3K 3!( 4 − 3)!

triples. Observación: a) Cuando todo los factores son cuantitativos, entonces se debe estudiar por el método de superficie de respuesta. b) Cuando existen factores cualitativos y factores cuantitativos, entonces se puede estudiar con efectos simples. d) Se recomienda no estudiar más de tres factores, ya que se complicará la interpretación de la interacción significativa. e) Cuando se complica los factores, entonces se realiza mediante repetición fraccionada (experimentos factoriales grandes).

Análisis y Diseño de Experimentos - 251 7.1. EXPERIMENTO FACTORIAL DE LA SERIE 2n Considere los factores A y B con «a» y «b» (a,b ≥ 2) niveles de prueba, respectivamente. Con ellos se puede construir el arreglo o diseño factorial axb, que consiste axb tratamientos o combinaciones. Algunos casos particualres de uso frecuente son: el experimento factorial 22, el factorial 32 y el factorial 3x2. Los experimentos factoriales que involucran menos de cuatro factores se corren replicados para poder tener la potencia necesaria en las pruebas estadísticas sobre los efectos de interés, de tal forma que si se hacen «n» réplicas, el número total de corridas experimentales es n(axb). Ejemplo: 22= 4 tratamientos o combinaciones. a0

A B

b0

a1 b1

b0

a1 b1

b1

Efecto simple de A en b0: a1b0 - a0b0 Efecto simple de A en b1: a1b1 - a0b1 Efecto simple de B en a0: b1a0 - b0a0 Efecto simple de B en a1: b1a1 - b0a1

a2 b2

b1

b2

Efecto simple de A en b1: a2b1 - a1b1 Efecto simple de A en b2: a2b2 - a1b2 Efecto simple de B en a1: b2a1 - b1a1 Efecto simple de B en a2: b2a2 - b1a2

Ordenando el efecto simple de B en a0, se tiene a0b1 - a0b0 efecto atribuible a b cuando se mantiene a0 fijo. Ordenando el efecto simple de B en a1, se tiene a1b1 - a1b0 efecto atribuible a b cuando se mantiene a1 fijo. Efecto principal A: La variabilidad que existe entre los niveles del factor A, pero en promedio del factor B. Efecto principal A =

( a1b1 − a0b1 ) + ( a1b0 − a0b0 ) ( a1b1 + a1b0 ) − ( a0b1 = 2 2

Efecto principal B =

( a1b1 − a1b0 ) + ( a0b1 − a0b0 ) ( a1b1 + a0b1 ) − ( a1b0 = 2 2

Efecto interacción AB =

( a1b1 − a0b1 ) − ( a1b0 − a0b0 ) 2

- 252 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Efecto interacción BA =

( a1b1 − a1b0 ) − ( a0b1 − a0b0 ) 2

7.1.1. Experimento factorial bajo el diseño completo al azar (DCA). El modelo lineal aditivo es el siguiente:

Yijk = µ + α i + β j + ( αβ )ij + ε ijk

R|i = 1,2,L , p ( Niveles de factor A S| j = 1,2,L ,q ( Niveles de factor B T k = 1,2,L ,r ( repeticiones )

donde: Yijk = Es la variable respuesta de la k-ésima observación bajo el j-ésimo nivel de factor B, sujeto al i-ésimo nivel de tratamiento A. µ = Constante, media de la población a la cual pertenecen las observaciones. τ i = Efecto del del i-ésimo nivel del factor A. β j = Efecto del j-ésimo nivel del factor B. (α β)ij = Efecto de la interacción del i-ésimo nivel del factor A, en el j-ésimo nivel del factor B.

ε ijk = Efecto del error experimental, que está distribuído como ε ijk ~ D N I ( 0 , σ e2 )

ANÁLISIS DE VARIANZA(ANOVA)

Fuentes de Variación

G. L.

S.C. Yij2. Y...2 − ∑ ∑ abr i=1 j=1 r a

b

t

Yi 2..

Tratamientos

t-1

Factor A

a- 1

∑br − abr

b- 1

∑ar − abr

i =1 b

Factor B

F Y − Y I − bSC + SC g GH ∑∑ r abr JK 144 42444 3 b

2 ij .

2 ...

A

i =1 j =1

SCcomb( AxB )

Error Experimental

ab(r -1)

Por diferencia a

Total

abr - 1

b

r

∑∑∑Yijk2 − i=1 j=1 k=1

Y...2 abr

B

Fc CMtratam. CMerror

SC( A ) a −1

CMerror

SC( B)

CM( B)

b−1

CMerror

SC( AB )

CM( AB)

gl( AB )

CMerror

SCerror ( ab −1)( r −1)

CM( A)

Análisis y Diseño de Experimentos - 253 -

(a - 1)(b - 1)

Y.j2. Y...2

j=1

a

Interacción AxB

C.M.

Y...2

SCtratam. t −1

- 254 -

V. Ibañez Q. - Docente FINESI - UNA - Puno EJEMPLO:

En una empresa alimenticia se desean evaluar cuatro antioxidantes, a través de su efecto en un aceite vegetal. El propósito es seleccionar el producto que retrase más la oxidación. Las pruebas se hacen a condiciones de estrés, midiendo como variable de respuesta al índice de peróxidos. Diferentes unidades experimentales se evaluan a diferentes tiempos. El tiempo está dado en horas. Los datos obtenidos se presentan a continuación (en el control no se agrega ningún antioxidante). a) Calcular el ANVA respectivo y realice efectos simples para la interacción. b) Graficar la interacción de los dos factores e interprete los resultados. A: Producto B: Tiempo 1 2 Yij. Yi.. Y.j.

Control = 1 4 8 12 3.84 27.63 39.95 3.72 27.58 39.00 7.56 55.21 78.95 Y1.. = 141.72 Y.1. = 37.01

4 4.00 3.91 7.91 Y2.. =

A=2 8 12 22.00 46.20 21.83 45.60 43.83 91.80 143.54 Y.2. =

4 3.61 3.61 7.22 Y3.. = 224.14

B=3 8 21.94 21.85 43.79 137.57

12 4 43.58 3.57 42.98 3.50 86.56 7.07 Y4.. =

SOLUCIÓN: 1. Hipótesis: Respecto al factor A.

H0 : α i = 0,

C=4 8 20.50 20.32 40.82 137.92

12 4 45.14 3.64 44.89 3.61 90.03 7.25 Y5.. = Y.3. = 435.72

D=5 8 20.30 20.19 40.49 136.12

12 44.36 44.02 88.38 696.87 = Y... 696.87 = Y... 696.87 = Y...

Respecto al factor B.

i = 1,2,..... a

Ha : α i ≠ 0, para cualquier i

H0 : β j = 0 ,

j = 1,2 ,.....b

Ha : β j ≠ 0, para cualquier j

Respecto a la interacción A x B

b g H : bαβ g Ho : αβ a

ij

= 0,

ij

≠0

i = 1,2 ,..... a ; j = 1,2,3,..., b

2. Nivel de Significación:

α = 0.05

3. Prueba de Contraste: F ( A ) =

CM A CM B CM A × B , F( B ) = , F( A × B ) = CM Error CM Error CM Error

4. Región de aceptación y rechazo:

RA Ho: Sí F ( A ) ≤ Faba −( 1r −1 ),α , entonces se acepta la Ho:

RR Ho: Sí F ( A ) > Faba −( 1r −1 ),α , entonces se acepta la Ha:

Análisis y Diseño de Experimentos - 255 -

RA Ho: Sí F ( B ) ≤ Fabb −( 1r −1 ),α , entonces se acepta la Ho:

RR Ho: Sí F ( B ) > Fabb −( 1r −1 ),α , entonces se acepta la Ha: RA Ho: Sí F ( A × B ) ≤ Fab( a( −r 1−)(1 ),bα−1 ) , entonces se acepta la Ho: RR Ho: Sí F ( A × B ) > Fab( a( −r 1−)(1 ),bα−1 ) , entonces se acepta la Ha: 5. Procedimiento de Cálculo de ANOVA a) Grados de libertad (GL) GL A = a − 1 = 5 − 1 = 4 , GLA × B

GLB = b − 1 = 3 − 1 = 2

= ( a − 1 )( b − 1 ) = 4 × 2 = 8 , GLError = ab( r − 1 ) = 5 × 3 × ( 2 − 1 ) = 15

GLTotal = abr − 1 = 5 × 3 × 2 − 1 = 29

b) Suma de Cuadrados (SC ó SS) 2 Y••• (696.87) 2 = = 16187.59323 abr 5× 3× 2

TC =

Y2

5

i i) SCA = ∑ br•• − TC= i=1

3

Y2

(141.72)2 + (14354 . )2 +L+(13612 . )2 − TC = 6469386 . 3× 2

• j• ii) SC B = ∑ ar − TC = j=1

F

I JK 144 42444 3 Yij2•

iii) SCA×B = GH∑∑ r 5

3

(37.01) 2 + (224.14) 2 + ( 435.72 )2 − TC = 7958.4465 5× 2

− TC − SCA − SCB =

i=1 j=1

LM(7.56) +(55.21) +L+(88.38) −TCOP − SC − SC 2 N Q 2

2

2

A

B

SCTratamientos

= 8080.55102 - SCA-SCB = 115.635054 iv)

5

3

2

SC Total = ∑ ∑ ∑ Yijk2 − TC = ( 384 . )2 + ( 3.72 )2 + L + ( 44.36 )2 + ( 44.02 )2 − TC = 24269.1007 − TC = i =1 j =1 k =1

v)

− 6.469388 − 7958.44658 − 115.635054 SC Error = SC Total − SC A − SC B - SCA × B = 808150747 .

SC ErrorExptal = SC TOTAL − SCTratamientos = 808150747 . − 8080.55102 = 0.95645

- 256 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

RESUMEN EN LA TABLA DE ANALISIS DE VARIANZA F. de V. Antioxidantes (A) Tiempo (B) AxB Error Experimental Total CV =

G.L. S.C. C.M. Fc. 4 6.4693860 1.6173465 25.36 2 7958.4465800 3979.2232900 62406.14 8 115.6350540 14.4543818 226.69 15 0.9564500 0.0637633 29 8081.5074700

Signif. ** ** **

4 2 8 F15,0.01 = 4.89; F15,0.01 = 6.36; F15,0.01 = 4.0

CM error 0.063763 x100 = × 100 = 1.09% Y••• 696.87 30

INTERPRETACIÓN: De acuerdo al análisis de varianza (ANVA), encontramos que existe diferencia estadística altamente significativa (P ≤ 0.01) para los efectos principales y efectos de interacción; los efectos principales pierden el interés y las conclusiones se deben obtener del efecto de la interacción antioxidante por tiempo, para esto se debe realizar el análisis de varianza de efectos simples para nuestras conclusiones. MÉTODO TABULAR PARA LA INTERACCIÓN (A= Antioxidantes x B = Tiempo) Antioxidantes a1 Tiempo (Hrs)

b1 b2 b3

Yi..

a2

a4

a5

Y.j.

7.07 40.82 90.03

7.25 40.49 88.38

37.01 224.14 435.72

a3

7.56 7.91 7.22 55.21 43.83 43.79 78.95 91.8 86.56

141.72 143.54 137.57 137.92 136.12

696.87 = Y...

MÉTODO GRÁFICO (Se debe obtener los promedios del método tabular)

a1 Tiempo (Hrs)

b1 b2 b3 Promedio

3.78 27.605 39.475 23.62

Antioxidantes a2 a3 3.955 21.915 45.9 23.923

3.61 21.895 43.28 22.928

a4

a5

3.535 3.625 20.41 20.245 45.015 44.19 22.987 22.6867

Promedio

18.505 112.07 217.86 23.229

51 48 45 42 39 36 33 30 27 24 21 18 15 12 9 6 3 0

Promedios

Promedios (Hrs)

Análisis y Diseño de Experimentos - 257 -

a1

a2

a3

a4

51 48 45 42 39 36 33 30 27 24 21 18 15 12 9 6 3 0

a5

b1

Niveles de Antioxidante

b2

b3

Tiempo en horas A dentro de b1

A dentro de b2

A dentro de b3

B dentro de a1

B dentro de a2

B dentro de a4

B dentro de a5

B dentro de a3

Análisis de varianza de efectos simples para la interacción Antioxidantes con el tiempo. a) Suma de cuadrados de efectos simples: A en bj: 5 . 2 + 791 . 2 + 722 . 2 + 707 . 2 + 725 . 2 ( 3701 . )2 Y2 Y2 756 . SC( A dentro b1 ) = ∑ i1• − •1• = − = 022474 ar 2 5× 2 i =1 r 5 Y2 . 2 + 4383 . 2 + 4379 . 2 + 4082 . 2 + 4049 . 2 ( 22414 . )2 Y2 5521 i2 − = 7237084 SC( A dentro b2 ) = ∑ • − •2• = . ar 2 5× 2 i=1 r 5 Y2 . 2 + 918 . 2 + 8656 . 2 + 9003 . 2 + 8838 . 2 ( 43572 . )2 Y2 7895 i3 − = 4950886 SC( A dentro b3 ) = ∑ • − •3• = . ar 2 5× 2 i =1 r

b) Suma de Cuadrados de B en ai: b=3 Y2 Y2 7.562 +5521 . 2 + 7895 . 2 (141.72)2 i1 SC(B en a1) = ∑ • − 1•• = − = 13217737 . br 2 3× 2 j=1 r b=3 Y2 Y2 7.912 + 4383 . 2 + 918 . 2 (143.54)2 i2 − = 1771483233 SC(B en a2 ) = ∑ • − 2•• = . br 2 3× 2 j=1 r b=3

Yi32•

j=1

r

SC(B en a3 ) = ∑



Y32•• 7.222 + 4379 . 2 +8656 . 2 (137.57)2 = − = 1576912233 . br 2 3× 2

- 258 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

b=3 2 Y Y2 7.072 + 4082 . 2 + 9003 . 2 (137.92)2 − =1740508033 SC(B en a4 ) = ∑ i4• − 4•• = . br 2 3×2 j=1 r b=3 2 Y Y2 7.252 +4049 . 2 +8838 . 2 (136.12)2 − = 1663404433 SC(B en a5) = ∑ i5• − 5•• = . br 2 3×2 j=1 r

ANOVA DE EFECTOS SIMPLES PARA LA INTERACCIÓN AxB F. de V. Efecto simple de Antioxidante (A) dentro de 4 Hrs. Efecto simple de Antioxidante (A) dentro de 8 Hrs. Efecto simple de Antioxidante (A) dentro de 12 Hrs. Efecto simple de Tiempo (B) dentro de Control Efecto simple de Tiempo (B) dentro de A Efecto simple de Tiempo (B) dentro de B Efecto simple de Tiempo (B) dentro de C Efecto simple de Tiempo (B) dentro de D Error Experimental 4 F15,0.01 = 4.89;

G.L. 4 4 4 2 2 2 2 2 15

S.C. 0.224740 72.370840 49.508860 1321.773700 1771.483233 1576.912233 1740.508033 1663.404433 0.956450

C.M. 0.05619 18.09271 12.37722 660.88685 885.74162 788.45612 870.25402 831.70222 0.0637633

Fc. Signif. 0.88 ns. 283.75 ** 194.11 ** 10364.68 ** 13891.08 ** 12365.35 ** 13648.19 ** 13043.58 **

2 F15,0.01 = 6.36

Interpretación: A dentro de 4 hrs.: No se encontró diferencia estadística significativa entre los niveles de a1, a2, a3, a4, a5 bajo los niveles de b1, es decir no hay diferencia significativa entre los niveles de antioxidantes con el tiempo, es decir son independientes entre los niveles. A dentro 8 hrs: Existe diferencia significativa entre los niveles de a1, a2, a3, a4, a5 bajo los niveles de b2, es decir hay diferencia significativa entre los antioxidantes con el tiempo. A dentro 12 hrs: Existe diferencia significativa entre los niveles de a1, a2, a3, a4, a5 bajo los niveles de b3, es decir hay diferencia significativa entre los antioxidantes con el tiempo. B dentro ai: Existe diferencia significativa entre los niveles de b1, b2 y b3 bajo los niveles de ai, es decir hay diferencia significativa entre los tiempos con el antioxidante (para todo los niveles).

Análisis y Diseño de Experimentos - 259 Prueba Múltiple de comparación de DUNCAN para los efectos simples. 1. Hipótesis: H 0 : µ 1 = µ 2 = µ 3 = µ 4 = µ 5 Vs. H a : µ i ≠ 0 2. Nivel de significación: α = 0.05 3. Buscar en la Tabla de Duncan los valores de AES(D) con Grados de Libertad del Error (GLerror = 15). p: AES(D)

SY =

2 3.01

0.063763 2

=

3 3.16

4 3.25

5 3.31

0.56

0.58

0.59

0.17855

ALS(D)

0.54

3. DUNCAN para A dentro de bi: A dentro b1:Yi1• Antioxidantes A Control D B C

A dentro b2 :Yi2•

Yi1• Duncan(P≤0.05) 3.96 3.78 3.63 3.61 3.54

Antioxidantes

a a a a a

Control A B C D

A dentro b3 :Yi3• Duncan(P≤0.05)

Yi2• 27.61 21.92 21.90 20.41 20.25

Antioxidantes

a

A C D B Control

b b c c

Yi3•

Duncan(P≤0.0

45.90 45.02 44.19 43.28 39.48

a b c d

4. DUNCAN para B dentro de ai: B dentro a1:Y1 j• Tiempo Y1 j• 12 8 4

39.5 27.6 3.78

B dentro a2 :Y2 j•

Duncan(P≤0.05) a b c

Y2 j• 45.90 21.92 3.96

B dentro a3:Y3 j•

Duncan(P≤0.05) a b c

Y3 j• 43.28 21.90 3.61

B dentro a4 :Y4 j•

Duncan(P≤0.05) a b c

Y4 j• 45.02 20.41 3.54

B dentro a5:Y5 j•

Duncan(P≤0.05) a b c

Y5 j• 44.19 20.25 3.63

Duncan(P≤0.05) a b c

Nota: El efecto principal del factor tiempo es de tipo cuantitativo por que se debe realizar a través de superficie de respuesta para encontrar el óptimo. En nuestro caso se ilustra solamente para efectos didácticos del ejemplo, más adelante se desarrollará en forma detallada cuando se tienen factores cuantitativos.

- 260 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

PROGRAMA EN SAS. DATA AGROI; OPTIONS NODATE NOCENTER NONUMBER; INPUT ANTIOX $ TIEMPO REP INDICE; DATALINES; /* Ingresar los datos */ ; PROC PRINT; RUN; PROC GLM; CLASS ANTIOX TIEMPO; MODEL INDICE = ANTIOX TIEMPO ANTIOX*TIEMPO; LSMEANS ANTIOX*TIEMPO/SLICE=ANTIOX; LSMEANS ANTIOX*TIEMPO/SLICE=TIEMPO; RUN; SALIDA DE RESULTADOS CON SAS Class Level Information Class Levels Values ANTIOX 5 A B C D TES TIEMPO 3 4 8 12 Number of observations 30 Dependent Variable: INDICE Source DF Squares Mean Square Model 14 8080.551020 577.182216 ANTIOX 4 6.469387 1.617347 TIEMPO 2 7958.446580 3979.223290 ANTIOX*TIEMPO 8 115.635053 14.454382 Error 15 0.956450 0.063763 Corrected Total 29 8081.507470 R-Square Coeff Var Root MSE INDICE Mean 0.999882 1.087064 0.252514 23.22900

Least Squares Means ANTIOX A B C D TES

ANTIOX*TIEMPO Effect Sliced by ANTIOX for Sum of DF Squares Mean Square 2 1771.483233 885.741617 2 1576.912233 788.456117 2 1740.508033 870.254017 2 1663.404433 831.702217 2 1321.773700 660.886850

F Value 9051.95 25.36 62406.1 226.69

Pr > F F Ft ⇒ se rechaza la H o :

c) Ho. (αβ) ij = 0 vs Ha: (αβ)ij ≠ 0, si Fc > Ft ⇒ serechazala Ho : d) Ho. ρ k = 0 vs Ha: ρ k ≠ 0, si

Fc > Ft ⇒serechazala Ho :

PRUEBAS DE COMPARACION DE TRATAMIENTOS. Teniendo en cuenta que el factor A está en Parcelas y B en subparcelas, entonces en el cuadro siguiente se muestran las desviaciones estándar para comparar promedios. Caso

DLS s d

Tipo de comparación

DUNCAN s X

2Ea rb

E a rb

1)

Para niveles principales de A Yi .. − Y j ..

2)

Para efectos principales de B Y.i . − Y. j .

2Eb ra

E b ra

3)

Dos medias en B al mismo nivel de A Ai : Yik. − Yij.

2Eb r

E b r

3)

Dos medias en A al mismo nivel B

d = Yij . − Ykj . ó d = Yii . − Yjj .

2(b − 1) Eb + 2Ea rb

(b−1)Eb +Ea rb

Las comparaciones de dos medias de un factor al mismo nivel de otro factor, sólo se realiza cuando la interacción AB es significativa, caso contrario, las comparaciones se realizan independientemente, es decir como en los dos primeros (1) y (2) las medias del factor A independiente de B y viceversa.

EJEMPLO: Una de las mediciones realizadas en las parcelas con pasto fue el contenido de clorofila en la hierba cortada (mg/g) para las muestras de cada parcela. Los datos se muestran en la siguiente tabla:

Análisis y Diseño de Experimentos - 367 Co ntenid o d e clo ro fila (mg /g ) en la h ierb a co rtad a. A ñ o s d e acumulación de hierb a Fuen te de n itró geno Bloq u e b1 = 2 b2 = 5 b3 = 8 a1 = Urea 1 3.8 5.3 5.9 2 3.9 5.4 4.3 a2 = Sulfato d e amo n io 1 5.2 5.6 5.4 2 6.0 6.1 6.2 a3 = IBDU 1 6.0 5.6 7.8 2 7.0 6.4 7.8 a4 = Urea(SC) 1 6.8 8.6 8.5 2 7.9 8.6 8.4

Realizar el ANOVA, y su interpretación correspondiente. SOLUCIÓN: Primeramente se realizará el ordenamiento de los datos, para los efectos de cálculo. Bloque b1 I 3.8 II 3.9 Yij. 7.7 Yi.. Y1.. = Y.j.

a1 = Urea b2 5.3 5.4 10.7 28.6

b3 5.9 4.3 10.2

total p. Yi.k 15.0 13.6 28.6

Y.1. =

46.6

b1 5.2 6.0 11.2 Y2.. =

a2 = Sulfato de amtotal p. a3 = IBDU total p. a4 = Urea(SC) total p. b2 b3 Yi.k b1 b2 b3 Yi.k b1 b2 b3 Yi.k 5.6 5.4 16.2 6.0 5.6 7.8 19.4 6.8 8.6 8.5 23.9 6.1 6.2 18.3 7.0 6.4 7.8 21.2 7.9 8.6 8.4 24.9 11.7 11.6 34.5 13.0 12.0 15.6 40.6 14.7 17.2 16.9 48.8 34.5 Y3.. = 40.6 Y4.. = 48.8 Y.2. = 51.6 Y.3. = 54.3

A) GRADOS DE LIBERTAD (GL). GLEntre parcelas = ra - 1 = 2x4-1 = 7 GLBloque = r - 1 = 2-1 = 1 GL(A) = a - 1 = 4-1 = 3 GLE(a) = (r-1)(a-1) = 1x3 = 3 GLDentro de parcelas = ra(b-1) = 2x4(3-1)= 16 GL(B) = b - 1 = 3-1 = 2 GL(AxB) = (a-1)(b-1) = 3x2 = 6 GLE(b) = a(b-1)(r-1) = 4x2x1 = 8 GLTotal = rab-1 = 2x4x3 - 1 = 23 B) SUMAS DE CUADRADOS (SS) TC =

2 ( 152.5 )2 Y••• = = 969.0104167 abr 4 x3x2

Y..l 74.5 78.0 152.5 152.5 152.5

- 368 I)

V. Ibañez Q. - Docente FINESI - UNA - Puno

4 2 Y2 . 2 +162 . 2 +L+239 . 2 + 249 .2 152 +136 SCParcelas = ∑∑ i•k − TC = − TC = 1008103333 − TC = 3909291664 . . 3 i =1 k =1 b

4

3

2

II) SCTotal-subparcelas = ∑∑∑Yijkl2 −TC = 38 . 2 + 39 . 2 +L+84 . 2 − TC = 101779 . − TC = 4877958334 . i=1 j=1 k =1

III) SCDentro de parcelas = SCTotal-subparcelas − SCParcelas = 4877958334 . − 3909291664 . = 96866667 . Luego calculamos las fuentes de variación de interés: Y••2l Y2 +Y2 74.52 + 782 − TC = ••1 ••2 − TC = − TC = 0.51041667 4 x3 12 k =1 ab 2

SCBloque = ∑

4 . 2 +345 . 2 +406 . 2 +488 .2 Y2 Y2 +Y2 +Y2 +Y2 286 −TC = 3732458334 . SCA = ∑ i•• −TC = 1•• 2•• 3•• 4•• −TC = 4x2 3x2 i=1 br

SCE(a) =SCParcela −SCA −SCBloque =3909291664 . . . . −3732458334 −051041667 =125791663 3

Y•2j •

j =1

ar

SCB = ∑ SCAxB =

− TC =

Y•21• + Y•22• + Y•23• 46.62 + 51.62 + 54.32 = − TC = 381583334 . 4( 2 ) 8

F Y −TCI −SC −SC =F77. +107. +L+169. −TCI −SC −SC =4529458334 . . −SC −SC =415416666 GH 2 JK GH∑∑ r JK 4

3

2 ij•

2

A

2

2

B

A

B

A

B

i=1 j=1

SCE(b) = SCDentro parcelas − SCB − SCAxB = 96866667 . − 381583334 . − 415416666 . = 1716667 .

RESUMEN EN LA TABLA DE ANOVA: Fuentes de Variación Bloques Tratamientos Nitrógeno (A) Error(a) TOTAL PARCELAS Hierba (B) Ax B Error(b) TOTAL DENTRO DE PARCELAS

TOTAL SUB-PARCELAS

CVA =

G.L. 1 11 3 3 7 2 6 8 16 23

S.S. 0.51041667 45.29458334 37.32458334 1.25791663 39.09291664 3.81583334 4.15416666 1.71666700 9.68666700 48.77958364

0.419305543 x100 = 10.19%; CVB = Y•••

M.S. Fc Signif. 0.51041667 1.22 n.s. 4.11768939 12.44152778 29.67 ** 0.41930554 1.90791667 0.69236111 0.21458338 0.60541669

8.89 3.23

0.214583375 x100 = 7.29% Y•••

** n.s.

Análisis y Diseño de Experimentos - 369 SYA =

CME(a) br

CME(b) 0214583375 . . 0419305543 . =0163777 =0.264356; SYB = = ar 3(2) 4(2)

=

Para graficar, se realiza por el Método tabular: TOTALES DE AxB b1=2 a1 7.7 a2 11.2 a3 13.0 a4 14.7 Y.j. 46.6

b2=5 10.7 11.7 12.0 17.2 51.6

b3=8 10.2 11.6 15.6 16.9 54.3

Yi.. 28.6 34.5 40.6 48.8 152.5

PROMEDIOS DE AxB b1=2 a1 3.85 a2 5.60 a3 6.50 a4 7.35 Promedio(j) 5.83

b2=5 5.35 5.85 6.00 8.60 6.45

b3=8 5.10 5.80 7.80 8.45 6.79

Prom(i) 4.77 5.75 6.77 8.13 6.35

9 8 7

9

cont. de Clorofila(mg/g)

cont. de Clorofila(mg/g)

Con los promedios de la interacción AxB, se realiza la gráfica y se muestra en seguida:

6 5 4 3 2 1 0

2

5

8 7 6 5 4 3 2 1 0

8

a1

Años de acumulación de hierba

a2

a3

a4

Fuente de Nitrógeno B dent ro de Urea

B dent ro Sulfat o

B dent ro IBDU

B dentro urea(SC)

A dent ro de 2 años

B dentro 5 años

B dentro 8 años

Interpretación de los efectos de factores con contrastes de regresión: El factor Hierbas es de tipo cuantitativo: 2 - 5 - 8 años de acumulación, entonces se realizará el cálculo de la partición de las sumas de cuadrados de contraste lineal y cuadrático para la interacción años de acumulación y años de años de acumulación x nitrógeno. Años de acumulación Nitrógeno a1 a2 a3 a4

Y• j• Lineal (P 1j) Cuadrática (P2j)

Lineal

2 3.85 5.60 6.50 7.35

5 5.35 5.85 6.00 8.60

8 5.10 5.80 7.80 8.45

5.83

6.45

6.79

-1 1

0 -2

1 1

∑P Y 1j

ij•

Cuadrática

∑P

2j

Yij•

1.25 0.20 1.30 1.10

-1.75 -0.30 2.30 -1.40

0.9625

-0.2875

- 370 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

CÁLCULO DE LAS SUMAS DE CUADRADOS:

SCLineal =

ra

e∑

4

PY j =1 1 j • j •

j

2

4

∑P

=

2( 4 )( 0.9625 )2 = 3.705625 2

=

2( 4 )( −0.2875 )2 . = 0110208333 6

2 1j

j =1

ra

SCCuadrática =

e∑

4 j =1

P2 j Y• j •

2

4

∑P

2 2j

j =1

r∑i=1 4

SCLineal x Cuadrática =

j

e∑

j − SC 2

3

PY

j =1 1 j ij•

Lineal

3

∑P

2 1j

=

. 2 + 02 . 2 +13 . 2 +11 . 2) 2(125 . − SCLineal = 0796875 2

j =1

e

r∑i=1 ∑j=1 P2 jYij• 4

SCCuadrática x Nitrógeno =

3

3

∑P

j −SC 2

Cuadrático

2 2j

=

2 ( −175 . )2 +( −030 . )2 +( 23 . )2 +( −14 . )2 6

− SCCuadrática = 3357291667 .

j=1

Análisis de varianza para el contenido de Clorofila en recortes de pasto Pencross con particiones de regresión polinomial ortogonal para el factor hierba. Fuentes de Variación Bloques Nitrógeno (A) Error(a) Hierba (B) BLineal BCuadrática Ax B A x Blineal A x BCuadrática Error(b)

GL 1 3 3 2 1 1 6 3 3 8

S.C. C.M. 0.510416670 0.510416670 37.324583340 12.441527780 1.257916630 0.419305543 3.815833340 1.907916670 3.705625000 3.705625000 0.110208333 0.110208333 4.154166660 0.692361110 0.796875000 0.265625000 3.357291667 1.119097222 1.716667000 0.214583375

Fc. 1.22 29.67

Signif. ns. **

8.89 17.27 0.51 3.23 1.24 5.22

** ** ns. ns. ns. *

Existe desviaciones cuadráticas significativas de la respuesta lineal para los años de acumulación de hierba que difieren entre las fuentes de nitrógeno. Se presenta una componente de interacción significativa, y es posible comparar los promedios de nitrógeno para cada año de acumulación de hierba y determinar si la Urea con cubierta

Análisis y Diseño de Experimentos - 371 de sulfuro siempre rindió el mayor contenido de clorofila en el pasto. Estos resultados comprobaremos usando el software estadístico SAS, para una mejor aproximación de los resultados y tomar una buena decisión al respecto, y lo detallamos a continuación.

/**** PROGRAMA EN SAS PARA PARCELA LA DIVIDIDA */ DATA HIERBA; OPTIONS NODATE NOCENTER NONUMBER; INPUT NITRO $ ACUMU BLOQUE Y; DATALINES; UREA 2 1 3.8 UREA 2 2 3.9 UREA 5 1 5.3 UREA 5 2 5.4 UREA 8 1 5.9 UREA 8 2 4.3 SULFA 2 1 5.2 SULFA 2 2 6.0 SULFA 5 1 5.6 SULFA 5 2 6.1 SULFA 8 1 5.4 SULFA 8 2 6.2 IBDU 2 1 6.0 IBDU 2 2 7.0 IBDU 5 1 5.6 IBDU 5 2 6.4 IBDU 8 1 7.8 IBDU 8 2 7.8 U_SC 2 1 6.8 U_SC 2 2 7.9 U_SC 5 1 8.6 U_SC 5 2 8.6 U_SC 8 1 8.5 U_SC 8 2 8.4 ; PROC PRINT; RUN; PROC ANOVA; CLASS NITRO ACUMU BLOQUE; MODEL Y = BLOQUE NITRO ACUMU BLOQUE*NITRO NITRO*ACUMU; TEST H = BLOQUE NITRO E = BLOQUE*NITRO; RUN;

- 372 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

RESULTADOS DEL SAS The ANOVA Procedure Class Level Information Class Levels Values NITRO 4 IBDU SULFA UREA U_SC ACUMU 3 2 5 8 BLOQUE 2 1 2 Number of observations 24 Dependent Variable: Y Source Model BLOQUE NITRO NITRO*BLOQUE ACUMU NITRO*ACUMU Error Corrected Total R-Square 0.964808

DF 15 1 3 3 2 6 8 23

Coeff Var 7.290199

Sum of Squares 47.06291667 0.51041667 37.32458333 1.25791667 3.81583333 4.15416667 1.71666667 48.77958333

Root MSE 0.463231

Mean Square 3.13752778 0.51041667 12.44152778 0.41930556 1.90791667 0.69236111 0.21458333

F Value 14.62 1.22 29.67 1.95 8.89 3.23

Pr > F 0.0003 0.3505 0.0099 0.1996 0.0093 0.0646

Y Mean 6.354167

EJEMPLO. En la Estación Experimental INIA (Tahuaco - Yunguyo) en el período de 1995 1996, se ensayó el desarrollo de tecnología en OCA, para esto se experimentó en parcelas divididas con 3 bloques, evaluándose el factor A (parcela principal) con 2 niveles (con estiércol y sin estiércol) y el factor B (sub-parcela) con niveles de: 1 tubérculo/golpe, 2 tubérculos/golpe y 3 tubérculos/golpe. Los rendimientos fueron obtenidos en una parcela de 12.8 m2, 4 surcos/parcela. (a0 = con estiércol 2t/ha., a1 = Sin estiércol, b1 = 1 tubérculo-golpe, b1= 2 Tubérculo/golpe, b2 = 3 tubérculo/golpe). La información se presenta a continuación: I

II a1

a0

a0

III a1

a0

a1

b1

5 b2

6

b0

9 b2

13

b0

8

b2

12

b2

14 b1

6

b2

6 b0

6

b1

7

b1

12

b0

10 b0

7

b1

14 b1

19

b2

10 b0

7

Análisis y Diseño de Experimentos - 373 SOLUCION: Primeramente debemos ordenar el cuadro anterior de la siguiente forma: Total parcelas

a0 Bloque I II III Total Yij.=AB

b0 10 9 8 27

b1 5 14 7 26

Factor A (Yi..)

a0 = 83

Factor B (Y.j.)

b0 = 47

b2 14 6 10 30

Yi.k 29 29 25 83 b1 = 63

a1 b0 7 6 7 20

b1 6 19 12 37

b2 6 13 12 31

Total parcelas

Total Bloques

Yi.k 19 38 31 88

Y..k 48 67 56 Y...= 171

a1 = 88

171

b2 = 61

171

a) GRADOS DE LIBERTAD: Para entre parcelas: ra - 1 = 3(2) - 1 = 5 Descomponiendo en bloques: r - 1 = 3 - 1 = 2 A: a - 1 = 2 - 1 = 1 Error(a): (r-1)(a-1) = 2x1 = 2 Dentro de parcelas: ra(b-1) = 3(2)(2) = 12 Descomponiendo en B: B: (b-1) = 3-1 = 2 Interacción AxB: (a-1)(b-1) = 1x2 = 2 Error(b): a(r-1)(b-1) = 8 Total: rab - 1 = 3(2)(3) = 17 b) SUMA DE CUADRADOS

TC =

Y...2 (171) 2 = = 1624.5 abr 2 ( 3) 3

Yi.k 29 2 + 292 + 252 + 192 + 382 + 312 − TC = − TC = 6650 . 3 i =1 k =1 b a

r

SCparcelas = ∑∑

SCTotal subparcelas = ∑Yijk2 − TC = 102 + 92 + 82 +L+62 + 132 + 122 − TC = 1871− TC = 24650 . i , j ,k

SCDentro de parcelas = SCtotal − subparc. − SC parcelas = 246.50 − 6650 . = 180.0

- 374 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Luego calculamos las fuentes de variación de interés: Y..2k 48 2 + 67 2 + 56 2 − TC = − TC = 1654.83333 − TC = 30.33 2 x3 k =1 ab r

SCBloques = ∑

a



SC A =

i =1

Y i ..2 832 + 88 2 − TC = − T C = 1 6 2 5 .8 9 − T C = 1.3 9 br 9

SC Error ( a ) = SC Parcela − SC Bloque − SC A = 66.50 − 30.33 − 1.39 = 34.78 b

Y. 2j .

j =1

ar

SC B = ∑

− TC =

47 2 + 632 + 612 − TC = 25.33 6

a b Y 272 + 262 + 302 + 202 + 372 + 312 ij. SCComb( AxB) = ∑∑ − TC = − TC = 5383 . 3 i =1 j =1 r

. − 139 . − 25.33 = 27.11 SCint.( AxB ) = SCcomb ( AxB ) − SC A − SC B = 5383

SCError (b) = SCdentro parcelas − SCB − SC AxB = 180 − 25.33 − 2711 . = 127.56 RESUMEN EN LA TABLA DE ANALISIS DE VARIANZA.

F. De V. Bloques A Error(a) Total parcelas B AxB Error(b) Total dentro de parcelas Total sub-parcelas

G.L. S.C. 2 30.33 1 1.39 2 34.78 5 66.50 2 25.33 2 27.11 8 127.56 12 180.00 17 246.50

C.M. 15.17 1.39 17.39

Fc. 0.87 0.08

Signif. n.s. n.s.

12.67 13.56 15.95

0.79 0.85

n.s. n.s.

Análisis y Diseño de Experimentos - 375 CONCLUSION: Ninguno de los factores tiene efecto significativo, por consiguiente no influye en el rendimiento de Oca con estiércol y sin estiércol, se puede usar indistintamente en la siembra, esto nos sugiere sembrar la oca con estiércol y sin estiércol no tiene efecto significativo, tampoco influye en número de tubérculos/golpe en el sembrado de oca, es decir es igual sembrar con 1,2,3 tubérculos/golpe. En la interacción de primer orden no se encontró diferencia estadística significativa, esto quiere decir que estos dos factores se comportan en forma independiente.

PROGRAMA EN SAS.

DATA PDIVID; OPTIONS NODATE NOCENTER NONUMBER;

DO A = 1 TO 2; DO B = 1 TO 3; DO BLOQUE = 1 TO 3; INPUT RDTO @; OUTPUT; END; END; END; CARDS; 10 9 8 5 14 7 14 6 10 7 6 7 6 19 12 6 13 12 ; PROC PRINT; RUN; PROC ANOVA; CLASS BLOQUE A B; MODEL RDTO = BLOQUE A BLOQUE*A B A*B; TEST H = BLOQUE A E = BLOQUE*A; TEST H = BLOQUE A /DUNCAN E = BLOQUE*A; RUN;

- 376 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

EJEMPLO. El siguiente experimento fue diseñado en una parcela dividida en bloque al azar. Consiste en un estudio del rendimiento (materia seca) en kilogramos por parcela para el Rye grass, donde el factor nitrógeno, con sus respectivos niveles, ocupó la parcela mayor -parcela principal- y el factor mejorador de suelo -Polisul- se localizó en las subparcelas. En este ejemplo se utilizarán las siguientes notaciones: niveles de nitrógeno (N), niveles de Polisul (P), bloques (B), error parcela mayor (EPM) y error parcela menor (Epm). Nitrógeno Polisul (kg/ha) (litros/ha) 100 50 60 70 Yi.k 150 50 60 70 Yi.k 200 50 60 70 Yi.k Y..k

BLOQUES III 25.30 27.40 30.60 83.30 28.40 30.20 31.90 90.50 27.90 29.30 32.20 89.40

I 24.30 25.80 31.00 81.10 26.40 29.30 32.80 88.50 26.40 28.30 32.40 87.10

II 23.90 26.70 29.80 80.40 27.30 31.40 33.60 92.30 26.90 30.80 33.20 90.90

256.70

263.60 263.20

IV 24.50 28.30 30.90 83.70 27.80 31.60 32.90 92.30 28.10 31.40 32.50 92.00

V 24.90 27.90 31.20 84.00 26.80 29.90 32.60 89.30 27.10 30.20 31.70 89.00

268.00

262.30

Yij. 122.90 136.10 153.50 136.70 152.40 163.80 136.40 150.00 162.00

Cuadro de concentración para sumas de cuadrados de efectos simples.

Niveles de nitrógeno

100 150 200 Y.j.

Niveles de Polisul 50 60 70 122.90 136.10 153.50 136.70 152.40 163.80 136.40 150.00 162.00 396.00 438.50 479.30

Yi.. 412.50 452.90 448.40 1313.80 = Y...

Análisis y Diseño de Experimentos - 377 En función del modelo descrito, las sumas de cuadrados del análisis de varianza son las siguientes: Y..2k 25670 . 2 +L+26230 . 2 − TC = − TC = 38364375 . − 38357121 . = 7254 . 3x3 k =1 ab r

SCBloques = ∑

Yi ..2 412.50 + L + 448.40 2 − TC = − TC = 38422.481 − TC = 65.360 3x 5 i =1 br a

SC N = ∑

a r Y2 8110 . 2 + L+ 8900 . 2 SCEPM = ∑∑ i.k − TC − SCN − SCP = − (TC + 65360 . + 7254 . ) = 4965 . 3 i=1 k =1 b

b

Y. 2j.

j =1

ar

SCP = ∑

− TC =

396002 +L+479.302 − TC = 38588.449 − 38357121 . = 231328 . 3x5

a b Y2 . 2 + L+ 16200 . 2 Y 2 12209 ij . . − (38357121 . + 65360 . + 231328 . ) = 257 . SCint.( AxB) = ∑∑ − ... = − TC −(SCN + SCP ) = 38656384 5 abr i =1 j =1 r

. 2 + 239 . 2 + 253 . 2 +L+322 . 2 + 325 . 2 + 317 . 2 − TC = 38679820 . − 38357121 . = 32269 . SCTotal = ∑Yijk2 − TC = 243 i , j ,k

SC Epm = SC Total − ( SC N + SC P + SC bloque + SC EPM + SC NxP ) = 322 .699 − ( 65.360 + 231.328 + 7 .254 + 4 .965 + 2 .575) = 11.217

TABLA DE ANALISIS DE VARIANZA. F. De V. Bloques Nitrógeno (N) Error(EPM) Polisul (P) NxP Error(EPM) Total

G.L. 4 2 8 2 4 24 44

S.C. 7.254 65.360 4.965 231.328 2.575 11.217 322.699

C.M. Fc. Ft.(.05 1.814 2.92 ns. 3.84 32.680 52.66 ** 4.46 0.621 115.664 247.48 ** 3.40 0.644 1.38 ns. 2.78 0.467

.01) 7.01 8.65 5.61 4.22

- 378 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Como en ocasiones anteriores, la significancia de los efectos está en función del contraste entre las estadísticas de prueba y los valores tabulares de Snedecor. También es necesario considerar los ajustes que para pruebas de medias y contrastes se hacen en función de los diferentes cuadrados medios del error. CONCLUSION. Existe evidencias estadísticas en los efectos principales: Nitrógeno y Polisul, encontrándose una diferencia estadística altamente significativo (P ≤ 0.01), esto nos demuestra que los niveles de nitrógeno influye estadísticamente, así mismo los niveles de Polisul, para interpretar mejor estos efectos se debe realizar la prueba múltiple de significancia de Duncan, Tukey, etc. EJEMPLO. Consideremos el caso de un experimento sobre avena donde se comparó dos niveles de fertilización nitrogenaday 4 variedades de esta especie conducidos en un diseño BCA con 4 réplicas y en un diseño de tratamientos de Parcela Dividida. Se ubió en parcelas las diferentes dosis ensayadas y en subparcelas las distintas variedades. a1 : 100 kg/ha de N, a2: 120 kg /ha de N b1 : variedad W ; b2 : variedad X ; b3 : variedad Y ; a4 : variedad Z. Cuadro de resultados ordenados a1 Bloque I II III IV

b1 2.17 1.88 1.62 2.34

b2 1.58 1.26 1.22 1.59

b3 2.29 1.60 1.67 1.91

a2 b4 2.23 2.01 1.82 2.10

b1 2.33 2.01 1.70 1.78

b2 1.38 1.30 1.85 1.09

b3 1.86 1.70 1.81 1.54

b4 2.27 1.81 2.01 1.40

ANVA : cuadro de resultados F. De V. B lo q u e s N it ró g e n o (A ) E rro r(a ) To t a l p a rc e la s V a rie d a d e s (B ) In t e ra c c ió n (A x B ) E rro r(b ) To t a l d e n t ro d e p a rc e la s To t a l d e s u b p a rc e la s

G .L. 3 1 3 7 3 3 18 24 31

S .C . 0.560 0.070 0.660 1.290 1.670 0.034 0.600 2.304 3.594

C .M . 0.187 0.070 0.220

Fc. 0.85 n.s . 0.32 n.s .

0.557 0.011 0.033

1 6 . 7 0 ** 0.34 n.s .

Análisis y Diseño de Experimentos - 379 -

PROGRAMA EN SAS. DATA PARDIV; TITLE ‘PARCELAS DIVIDIDAS EN BCA’; INPUT A B REP PESO; CARDS; 1 1 1 2.17 2 1 1 2.33 1 1 2 1.88 2 1 2 2.01 1 1 3 1.62 2 1 3 1.70 1 1 4 2.34 2 1 4 1.78 1 2 1 1.58 2 2 1 1.38 1 2 2 1.26 2 2 2 1.30 1 2 3 1.22 2 2 3 1.85 1 2 4 1.59 2 2 4 1.09 1 3 1 2.29 2 3 1 1.86 1 3 2 1.60 2 3 2 1.70 1 3 3 1.67 2 3 3 1.81 1 3 4 1.91 2 3 4 1.54 1 4 1 2.23 2 4 1 2.27 1 4 2 2.01 2 4 2 1.81 1 4 3 1.82 2 4 3 2.01 1 4 4 2.10 2 4 4 1.40 ; PROC ANOVA; CLASSES REP A B; MODEL PESO=REP A REP*A B A*B; TEST H=REP E=REP*A; TEST H=A E=REP*A; MEANS REP A B A*B; RUN;

- 380 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

9.2. DISEÑO DE PARCELA SUBDIVIDIDAS (SPLIT SPLIT PLOT). Características. La adición de un tercer factor mediante la división de las subparcelas de un diseño de parcelas divididas da lugar a un diseño de parcelas sub-divididas. Este diseño suele ser bastante útil en un experimento de tres factores, a fin de facilitar las operaciones de campo o cuando resulta deseable mantener agrupados combinaciones de tratamientos; sin embargo, la restricción adicional a la distribución aleatoria hace necesario el cálculo de un tercer término de error que se utiliza para probar los efectos principales del factor aplicado a la segunda división, así como todas las interacciones que influyen dicho factor. El procedimiento para la distribución aleatoria es el mismo que para el diseño de parcelas divididas, estando las sub-parcelas divididas en sub-parcelas, cuyo número coincide con los niveles de los tres factores, a los cuales el tercer factor es aleatoriamente asignado con una nueva distribución aleatoria para cada conjunto de sub-parcelas. El modelo lineal aditivo es el siguiente: Yijkl = µ + ρk +αi +δil + β j + (αβ)ij +τ ijk +γ k + (αγ )ik + (βγ ) jk + (αβγ )ijk +εijkl i = 12 , ,L,a ( parcelas) j =12 , ,L,b (Sub − parcelas) k = 12 , ,L,c (sub − sub − parcelas) l = 12 , ,L,r (bloques)

donde: Yijkl = Variable respuesta u observación. µ = Constante común o media poblacional.

ρ l = Efecto del del l-ésimo bloque.

α i = Efecto del del i-ésimo nivel del factor A. δ il = Es el efecto del i-ésimo nivel del factor A enla l-ésima repetición. β j = Es el efecto del j-ésimo nivel el factor B que se estudia en la sub-parcela.

Análisis y Diseño de Experimentos - 381 -

τ ijk = Es el efecto del error en términos de sub-parcela.

γ k = Es el efecto del k-ésimo nivel del factor C que se estudia en sub-sub-parcela.

(α β) ij = Efecto de la interacción entre parcela y sub-parcela.

(αγ )ik = Es el efecto de la interacción entre la parcela y sub-sub-parcela. (β γ ) jk = Efecto de la interacción entre sub-parcela y sub-sub-parcela. (αβγ)ijk = Efecto de la interacción entre parcela, sub-parcela y sub-sub-parcela.

ε ijkl = Error expresado en términos de sub-sub-parcelas.

δ il , τ ijk , ε ijkl son las variables de error con media cero y varianza σ 2a , σ b2 y σ 2c , respectivamente. Pruebas de hipótesis: a) Ho. α i = 0 vs Ha: α i ≠ 0, si

Fc > Ft ⇒ serechazala Ho :

b) Ho. β j = 0 vs Ha: β j ≠ 0, si

Fc > Ft ⇒ se rechaza la H o :

c) Ho. (αβ)ij = 0 vs Ha: (αβ)ij ≠ 0, si Fc > Ft ⇒serechazala Ho : d) Ho. γ k = 0 vs Ha: γ k ≠ 0, si

Fc > Ft ⇒serechazala Ho :

e) Ho.(αγ )ik = 0 vs Ha:(αγ )ik ≠ 0, si Fc > Ft ⇒serechazalaHo: f) Ho. (βγ ) jk = 0 vs Ha: (βγ ) jk ≠ 0, si Fc > Ft ⇒serechazalaHo: g) Ho.(αβγ )ijk = 0 vs Ha:(αβγ )ijk ≠ 0, si Fc > Ft ⇒serechazalaHo:

- 382 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

TABLA DE ANALISIS DE VARIANZA.

F. de Variación G.L.

S.C.

Y...2l

r

Bloques

C.M.

Y....2

∑ abc − abcr

r-1

l =1

Yi ...2 Y....2 − ∑ abcr i =1 bcr a

A

a-1

Error(a)

ra - 1

B

b-1

AB

(a-1)(b-1)

∑ cr − TC −SC

A

SC B − SCint( AxB)

Y..2k .

c

Y....2

∑ abr − abcr Yi.2k. − TC −SCA − SCC ∑ i ,k br

Y. jk2 .

(b-1)(c-1)

Y2 − .... − SCB − SCC ∑ abcr j ,k ar Y ∑ r − TC − ( SC + SC + SC 2 ijk .

ABC Error(c)

(a-1)(b-1)(c-1) (c-1)(r-1)ab

A

TC =

Y....2 , abcr

(abcr - 1)

CV(a) =

CMError(a) Y....

B

C

+

i , j ,k

SC AB + SC AC + SC BC )

SCTotal − SCsup − parcelas − SCC − SC AC − SC BC − SC ABC

a

Total

=Ea

b

c

r

∑ ∑ ∑ ∑Y

2 ijkl



i =1 j =1 k =1 j =1

x100, CV(b) =

CM( B)

b −1

CM Error (b) CM ( AB)

( a − 1)(b − 1) SCError(b) = Eb (b −1)(r −1)a SC (B)

b − 1 SC ( AC )

CM Error (b)

CM( AC)

( a − 1)( c − 1) SC(BC)

CM Error (c) CM( BC)

(b−1)(c−1) SC( ABC)

CM Error (c) CM ( ABC )

(a −1)(b −1)(c −1) SCError(c) (c −1)(r −1)ab

= Ec

Y....2 abcr

CMError(b) Y....

SC (B)

CM Error (b)

k =1

(a-1)(c-1)

BC

CM Error (a )

SC ( AB )

− SCB

SC sub− parcela − SC parcelas −

c-1

AC

a −1

r

Yij2..

(b-1)(r-1)a

C

r −1 SC ( A )

∑∑

i, j

Error(b)

CM Bloque CM Error (a ) CM ( A)

(r−1)(a−1)

Yi ..2l Y2 − .... abcr i = 1 k =21 bc b Y Y....2 . j .. − ∑ abcr j =1 acr a

Parcelas

SC Bloques

SCError(a)

SC parcelas − SCbloques − SCA

(r-1)(a-1)

Fc.

x100, CV(c) =

CMError(c) Y....

x1

CM ( B )

CM Error (c)

Análisis y Diseño de Experimentos - 383 EJEMPLO. En la Estación Experimental INIAA (Tahuaco-Yunguyo) en el período (1995-1996), se se ensayó el desarrollo de tecnología en Oca, para esto se experimentó en parcelas sub-divididas con tres bloques, evaluándose el factor A (parcela principal) con dos niveles: con estiércol y sin estiércol, el factor B (sub-parcela) con niveles de: tubérculo semilla con brotes y semilla sin brotes y el factor C (sup-sub-parcelas) con niveles de: 1, 2 y 3 tubérculos/golpe. Los rendimientos fueron obtenidos en una parcela de 12.8m² con 4 surcos/parcela. La información se presenta a continuación. a0 : Con estiércol 2 t/ha, a1 : Sin estiércol, b0 : Tubérculo semilla con brotes, b1 : Tubérculo semilla sin brote, c0 : 1 tubérculo/golpe (15 g), c1 : 2 tubérculo/golpe (10 g), c2 : 3 tubérculo/golpe (8 g). a0

Total

b0 I II III Yijk.

c0 10 9 8 27

c1 5 14 7 26

b1 c2 14 6 10 30

Yij..

a0b0= 83

Yi.k.

a0c0= 62

Y.jk.

b0c0= 47

Yij.l 29 29 25 83

c0 15 7 13 35

a1

Parcela

c1 c2 Yij.l 18 9 42 5 11 23 15 18 46 38 38 111

Yi..l 71 52 71 194

a0b1=111

Total

b0 c0 7 6 7 20

b1

c1 c2 Yij.l 6 6 19 19 13 38 12 12 31 37 31 88

c0 3 9 4 16

a1b0= 88

a0c1=64

a0c2= 68

a1c0= 36

b0c1=63

b0c2= 61

b1c0= 51

c1 13 5 5 23

Parcela Bloque c2 12 10 4 26

Yij.l 28 24 13 65

Yi..l 47 62 44 153

a1b1=65

Y...l 118 114 115 347 347

a1c1= 60

a1c2= 57

347

b1c1= 61

b1c2= 64

347

Yi...

a0= 194

a1= 153

347

Y.j..

b0= 171

b1= 176

347

Y..k.

c0= 98

c2= 125

347

c1= 124

a) GRADOS DE LIBERTAD. 1) GLParcelas = ar - 1 = 2x3 -1 = 5 GLBloques = r - 1 = 3 -1 = 2 GLA = a - 1 = 2 - 1 = 1 GLError(a) = (a-1)(r-1) = 1x2 = 2 2) GLTotal sub-parcelas = ra(b - 1) = 3x2x(2 -1) = 6 GLB = b - 1 = 2 - 1 = 1 GLAB = (a-1)(b - 1) = 1x1 = 1 GLError(b) = a(r-1)(b-1) = 2x2x1 = 4 3) GLC = c - 1 = 3 - 1 = 2 GLAC = (a-1)(c - 1) = 1x2 = 2 GLBC = (b - 1)(c-1) = 1x2 = 2

- 384 -

V. Ibañez Q. - Docente FINESI - UNA - Puno GLABC = (a-1)(b - 1)(c-1) = 2 GLError(c) = ab(r-1)(c - 1) = 2x2x2x2 = 16 GLDentro de parcelas = abr(c - 1) = 2x2x3x(3-1) = 24 4) GLTotal = abcr - 1 = 2x2x3x3 - 1 = 35

b) SUMAS DE CUADRADOS. r

SCBloques = ∑ l =1

TC =

Y....2 347 2 = = 3344.694444 abcr 2 x 2 x 3x 3

Y...2l Y2 118 2 + 114 2 + 1152 − .... = − TC = 0.7222222 12 abc abcr

Yi ...2 Y2 194 2 + 1532 − .... = − TC = 46.694444 abcr 18 i =1 bcr a

SC A = ∑

Y2 712 + 522 + 712 + 472 + 622 + 442 − TC = 1178055556 SCparcelas = ∑ i..l − TC = . 6 i ,k bc SCError(a) = SCparcelas − SCbloques − SCA = 1178055556 − 07222 − 4669444 = 70388889 . . . . SC B =

b

Y. j2..

∑ acr



j =1

SCComb( AxB) = ∑

Yij2.. cr

Y....2 171 2 + 176 2 = − TC = 0.6944444 abcr 18 − TC =

832 + 1112 + 882 + 652 − TC = 1119.6388889 9

− 46694444 − 0694444 = 7225000 SCInt ( AxB) = SCComb( AxB) − SCA − SCB = 119638889 . . . . SC Error ( b ) = SC sub − parcela − SC parcelas − SC B − SC int( AxB ) = 325.638889 − 117 .8055556 − 0.694444 − 72 .25 = 134 .8888889

Yij2.l 292 + 292 + 252 +L+282 + 242 + 132 − TC = 3256388889 SCSub− parcelas = ∑ − TC = . c 3

Y..2k . 98 2 + 124 2 + 1252 −TC = − TC = 39.0555556 12 k =1 abr c

SCC = ∑

Y2 622 + 642 + 682 + 362 + 602 + 572 SCcomb( AxC) = ∑ i.k. −TC = − TC = 1068055556 . 6 i ,k br SCInt .( AxC) = SCComb.( AxC) − SCB − SCC = 1068055556 − 466944444 − 3905555556 = 210555556 . . . .

Análisis y Diseño de Experimentos - 385 SCcomb( BxC) = ∑

Y. 2jk .

j ,k

−TC =

ar

472 + 632 + 612 + 512 + 612 + 642 − TC = 4147222222 . 6

SCInt.( BxC) = SCComb.( BxC) − SCB − SCC = 41472222 − 0694444 − 390555556 = 172222 . . . . SCcomb( AxBxC) = ∑

Yijk2 .

i , j ,k

SCIntc.( AxBxC) = ∑

r

Yijk2 . r

i , j ,k

−TC =

272 + 262 + 302 +L+162 + 232 + 262 − TC = 1916388889 . 3

− TC −(SCA + SCB + SCC + SCAB + SCAC + SCBC )

= 1916388889 − (4669444 + 069444 + 39.0555556 + 72.25 + 21055556 + 172222 . . . . . ) = 101666666 . a

b

c

r

SCTotal = ∑∑∑∑Yijkl2 −TC = 102 + 92 +L+102 + 42 − TC = 3999 − TC = 654305556 . i =1 j =1 k =1 j =1

SCError (c) = SCTotal − SCsup− parcelas − SCC − SCAC − SCBC − SCABC = 6543055556 − 3256388889 − 390555556 − 210555556 − 172222 −101666666 . . . . . . = 2566666667 .

TABLA DE ANALISIS DE VARIANZA. F. De V. PARCELAS PRINCIPALES Bloques A Error(a) SUB-PARCELAS B AxB Error(b) SUB-SUBPARCELAS C AxC BxC AxBxC Error( c) Total

G.L.

S.C.

C.M.

Fc.

Signific.

2 1 2 5 1 1 4 6 2 2 2 2 16 30

0.7222222 46.6944444 70.3888890 117.8055556 0.6944444 72.2500001 134.8888889 325.6388890 39.0555556 21.0555556 1.7222222 10.1666666 256.6666667 654.3055557

0.3611111 46.6944444 35.1944445

0.01 n.s. 1.33 n.s.

0.6944444 72.2500001 33.7222222

0.02 n.s. 2.14 n.s.

19.5277778 10.5277778 0.8611111 5.0833333 16.0416667

1.22 0.66 0.05 0.32

n.s. n.s. n.s. n.s.

- 386 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

CONCLUSION: En el ANVA encontramos que no existe diferencia significativas para los diferentes factores y de interacción, esto implica que los factores posiblemente se deben al azar.

PROGRAMA EN SAS. DATA PDIVID; TITLE'PARCELA SUB-DIVIDIDA SPLIT-SPLIT-PLOT';

DO A = 1 TO 2; DO B = 1 TO 2; DO C = 1 TO 3; DO BLOQUE = 1 TO 3; INPUT RDTO @; OUTPUT; END; END; END; END; CARDS; 10 9 8 5 14 7 14 6 10 15 7 13 18 5 15 9 11 18 7 6 7 6 19 12 6 13 12 3 9 4 13 5 5 12 10 4 ; PROC PRINT; RUN; PROC ANOVA; CLASS BLOQUE A B C; MODEL RDTO = BLOQUE A BLOQUE*A B A*B B*BLOQUE(A) C A*C B*C A*B*C; TEST H = BLOQUE A E = BLOQUE*A; TEST H = B A*B E=B*BLOQUE(A); MEANS A /DUNCAN E = BLOQUE*A;

Análisis y Diseño de Experimentos - 387 9.3. DISEÑO DE PARCELAS EN FRANJA Introducción. Los experimentos en parcelas divididas son frecuentemente utilizados en la experimentación agronómica cuando, en un experimento de tipo factorial, el material experimental o la propia conducción del experimento no permite una completa aleatorización de todas las combinaciones de los niveles de los factores. Una variación de los experimentos en parcelas divididas es caracterizada cuando, por diversas razones, aunque se estructuren las parcelas pequeñas, no hay posibilidad de una aleatorización total de estas parcelas. En este caso, las parcelas relativas a cada factor se posicionan en franjas (o fajas), tanto en filas como en las columnas. Considerando dos factores A y B, con “a” y “b” niveles, respectivamente, de forma que en cada nivel de A se tienen los niveles de B como subparcelas y viceversa, tanto los niveles de A como los niveles de B son considerado parcelas (factores principales), en tanto que la interacción (AxB) en cada uno de los índices de A y B constituyen las subparcelas (parcelas pequeñas). Para ilustrar este caso de diseño, considere un experimento con dos factores A y B, con 3 y 4 niveles, respectivamente, y cada bloque constituido por fajas horizontales Ai y fajas verticales Bj, resultando para un bloque cualquiera, el siguiente esquema: B1

B4

B2

B3

A3

A3B1

A3B4

A3B2

A3B3

A2

A2B1

A2B4

A2B2

A2B3

A1

A1B1

A1B4

A1B2

A1B3

Y de igual manera para los demás bloques, los cuales difieren entre sí apenas en lo referente a la aleatorización. De acuerdo con Gomes, FP. (2000) el análisis de los experimentos en franjas son más complejos, en comparación con los dispuestos en un arreglo en parcelas dividi-

- 388 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

das; y dan menor precisión a las comparaciones entre los niveles del factor que se ubica en la parcela pequeña. Por ello, los experimentos en franjas deben ser evitados, siempre que sea posible. Sin embargo, existen varias situaciones en que razones de orden práctica nos llevan a adoptarlos. Dentro de estas situaciones, se puede citar: experimentos con épocas de cosecha (cuando la cosecha es mecanizada), tipos de preparación del suelo, aplicación mecanizada de fertilizantes, aplicación de correcciones al suelo, aplicación de madurantes en caña de azúcar, en evaluaciones de distanciamiento de siembra, sistemas de riego, sistemas de labranza, etc. Modelo estadístico lineal aditivo. Según Kempthorne (1952), citado por Nogueira (2000), el modelo adecuado con dos factores y un diseño un diseño de bloques completos al azar es el siguiente:

Yijk = µ + ρk +αi (αρ )ik + β j + ( βρ )jk + (αβ )ij + (αβρ )ijk

R|i = 12, ,L,a S| j = 12, ,L,b Tk = 12, ,L,r

donde:

Yijk = Variable respuesta medida en la ijk-ésima unidad experimental.

µ

= Constante común o media poblacional.

ρ k = Efecto del del k-ésimo bloque. α i = Efecto del del i-ésimo nivel del factor A. ( αρ )ik = Efecto de la interacción entre el i-ésimo nivel del factor A con el késimo bloque, es el error experimental asociado al factor A, tal que ( αρ )ik ~ N ( 0,σ 12 ) e independientes, es utilizado como Error(a).

β j = Es el efecto del j-ésimo nivel el factor B.

( βρ )jk = Efecto de la interacción entre j-ésimo nivel del factor B con el k-ésimo bloque, es el error experimental asociado al factor B, tal que ( βρ )jk ~ N ( 0,σ 22 ) e independientes, es utilizado como Error(b).

(α β) ij = Efecto debido a la interacción del i-ésimo nivel del factor A con el jéimo nivel del factor B. ( αβ ρ )ijk = Error experimental asociado a

Yijk tal que

( αβ ρ )ijk ~ N ( 0,σ 2 ) e inde-

pendientes, es utilizado como término de error(c) o residuo.

Análisis y Diseño de Experimentos - 389 Pruebas de hipótesis: a) Ho. α i = 0 vs Ha: α i ≠ 0, si b) Ho. β j = 0 vs Ha: β j ≠ 0, si c)

Fc > Ft ⇒ serechazala Ho : Fc > Ft ⇒ se rechaza la H o :

Ho. (αβ)ij = 0 vs Ha: (αβ)ij ≠ 0, si Fc > Ft ⇒ serechazala Ho :

Esquema del Análisis de Varianza. F. de V.

G.L.

SC.

Bloques

(r-1)

S C B loques

CMBloques = SCBloque ( r −1)

Factor A

a-1

SC A

CM A = SCA ( a − 1 )

Error (a)

(r - 1)(a - 1)

Factor B

b-1

Error (b)

(r - 1)(b - 1)

S C E r r o r ( b ) CME( b ) = SCE( b ) ( b − 1)( r − 1)

(a - 1)(b - 1)

SC

AxB

abr - 1

Fc

CMA CME( a )

S C E r ro r ( a ) CME( a ) = SCError( a ) ( a −1)( r −1) SC

B

A × B

Residuo (r - 1)(a - 1)(b - 1) S C R e s id u o TOTAL

CM.

CM B = SCB ( b − 1 )

CM B CM E ( b )

CMA×B =SCA×B (a−1)(b−1) CM A× B CM Re siduo CMResiduo = SCResiduo GLResiduo

S C T o ta l

Decisión: Si

F ( A ) > F( ar −−11 )( a −1 ),α , entonces se acepta la Ha: y se rechaza la Ho:

Si

F ( B ) > F(br−−11 )( b −1 ),α , entonces se acepta la Ha: y se rechaza la Ho:

Si

( a −1 )( b −1 ) F ( A × B ) > FGL , entonces se acepta la Ha: y se rechaza la Ho: Re siduo ,α

- 390 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

F. de V.

G.L.

SC.

Bloques

(r-1)

Y Y2 SCBloques = ∑ − ••• abr k=1 ab

Factor A

a- 1

SCA = ∑

A, bloques

ra - 1

a r Y2 Y2 SCA,Bloque = ∑∑ i•k − ••• abr i=1 k=1 b

Error (a)

(r - 1)(a - 1)

Factor B

b- 1

2 ••k

r

2 Yi••2 Y••• − abr i =1 br a

SCError( a ) = SC( A,Bloque ) −SCA − SCBloque SC B =

b

Y•2j •

j =1

ar



b

B, bloques

rb - 1

Error (b)

(r - 1)(b - 1)



2 Y••• abr

r

Y•2jk

SCB,Bloque = ∑∑ j =1 k =1

a

b

i =1 j =1

AxB

(a - 1)(b - 1)

Residuo=Error( c )

(r - 1)(a - 1)(b - 1) abr - 1

Yij2• r



2 Y••• abr

SCA×B = SCComb( A,B) − SCA −SCB SCError(c) =SCTotal −SCA−SCB−SCAB Bloque −SC Ea ( ) −SC Eb () × −SC a

TOTAL

2 Y••• abr

SCError(b) = SC( B,Bloque) − SCB −SCBloque SCComb( A,B ) = ∑ ∑

A,B

a



b

r

SCTotal = ∑ ∑ ∑ Yijk2 − i =1 j =1 k =1

2 Y••• abr

EJEMPLO. Los datos que se presentan a continuación se refieren al Pol% de la caña de azúcar, obtenido de un experimento en franjas en el ingenio Santa Cruz, citado por Nogueira (2000), que involucró dos factores A y B; correspondientes a tipos de surcos, asociado con distanciamientos entre surcos y densidades de siembra, con 4 y 3 niveles respectivamente, siendo:

Análisis y Diseño de Experimentos - 391 A1: Surco simple y distanciamiento de 1.40 m. A2: Surco doble y distanciamiento de 1.40 m x 0.90 m. A3: Surco de base larga y distanciamiento de 1.70 m. A4: Surco de base larga y distanciamiento de 1.90 m. B1: 4 toneladas de semilla/ha. B2: 6 toneladas de semilla/ha. B3: 8 toneladas de semilla/ha. A (Surcos) B (densidad) I II III IV Yij. Yi.. Y.j.

4 17.67 17.23 17.43 17.61 69.94 Y1.. =

A1 6 17.31 17.6 17.05 16.91 68.87 209.55 Y.1. =

8 17.49 17.3 17.68 18.27 70.74 279.24

4 17.19 17.85 17.44 17.56 70.04 Y2.. =

A2 6 17.21 17.26 16.71 17.52 68.7 207.53 Y.2. =

8 18.04 16.38 17.23 17.14 68.79

4 17.39 17.54 16.61 17.51 69.05 Y3.. =

277.42

A3 6 17.39 17.67 16.77 17.61 69.44 208.56 Y.3. =

8 17.69 17.02 17.34 18.02 70.07

4 17.19 17.57 17.72 17.73 70.21 Y4.. =

A4 6 16.78 17.57 17.79 18.27 70.41 211.39

8 17.86 16.85 18.12 17.94 70.77

280.37

Y..k 209.21 207.84 207.89 212.09 837.03 837.03 837.03

SOLUCIÓN: 1. Hipótesis: H 0 : α i = 0 Vs

Ha : α i ≠ 0

H0 : β j = 0 Vs Ha : β j ≠ 0 H0 : ( αβ )ij = 0 Vs Ha : ( αβ )ij ≠ 0 2. Nivel de significación:

α = 0.05

3. Prueba estadística de contraste:

F( A ) =

CM A CM B CM A× B , F( B ) = , F( A × B ) = CM E ( a ) CM E ( b ) CM Re siduo

4. Región de aceptación y rechazo: Si

F ( A ) > F( ar −−11 )( a −1 ),α , entonces se acepta la Ha:

Si

F ( A ) ≤ F( ar −−11 )( a −1 ),α , entonces se acepta la Ho:

Si

F ( B ) > F(br−−11 )( b −1 ),α , entonces se acepta la Ha:

Si

F ( B ) ≤ F(br −−11 )( b −1 ),α , entonces se acepta la Ho:

Si

( a −1 )( b −1 ) F ( A × B ) > FGL , entonces se acepta la Ha: Re siduo ,α

Si

( a −1 )( b −1 ) F ( A × B ) ≤ FGL , entonces se acepta la Ho: Re siduo ,α

- 392 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

5. Cálculo de Análisis de Varianza. a) Grados de Libertad (GL) GLBloque = r − 1 = 4 − 1 = 3

GL A = a − 1 = 4 − 1 = 3

GLE ( a ) = ( r − 1 )( a − 1 ) = 3 × 3 = 9

GLB = b − 1 = 3 − 1 = 2

GLE ( b ) = ( r − 1 )( b − 1 ) = 3 × 2 = 6

GL A × B = ( a − 1 )( b − 1 ) = 3 × 2 = 6 GLRe siduo = ( r − 1 )( a − 1 )( b − 1 ) = 3 × 3 × 2 = 18

GLTOTAL = abr − 1 = 4 × 3 × 4 − 1 = 47

Para facilitar los cálculos, se construyen los siguientes cuadros auxiliares: k

i A1 A2 A3 A4 Y..k

I 52.47 52.44 52.47 51.83 209.21

II 52.13 51.49 52.23 51.99 207.84

III 52.16 51.38 50.72 53.63 207.89

IV 52.79 52.22 53.14 53.94 212.09

Yi.. 209.55 207.53 208.56 211.39 837.03

i A1 A2 A3 A4 Y.j.

j

j B1 B2 B3 Y..k

k

I 69.44 68.69 71.08 209.21

II III IV 70.19 69.2 70.41 70.10 68.32 70.31 67.55 70.37 71.37 207.84 207.89 212.09

B1 B2 B3 69.94 68.87 70.74 70.04 68.7 68.79 69.05 69.44 70.07 70.21 70.41 70.77 279.24 277.42 280.37

Yi.. 279.24 277.42 280.37 837.03

Yi.. 209.55 207.53 208.56 211.39 837.03

b) Suma de cuadrados (SC)

TC =

2 Y••• (837.03) 2 = = 14596.23377 abr 4 × 3× 4

4 Y2 (209.21)2 +(20784 . )2 +( 20789 . )2 +( 21209 . )2 SCbloques = ∑ ••k − TC= − TC = 0992057 . 4 ×3 k=1 ab

Yi2•• (209.55)2 + ( 20753 . )2 +L+( 21139 . )2 − TC = − TC = 0675323 . 3× 4 i=1 br 4

SCA = ∑

4 4 Y2 (52.47)2 + (52.44)2 +L+(5314 . )2 + (53.94)2 − TC = 3284665 SC(A,Bloque) = ∑∑ i•k − TC = . b 3 i=1 k=11

SCError(a) = SC( A,Bloque ) − SCA − SCBloque = 3284665 . . . . − 0675323 − 0992057 = 1617285

----------------------------------------------------------------------------

Análisis y Diseño de Experimentos - 393 2 Y2 (279.24)2 +(277.42)2 + (280.37)2 • j• . . SCB = ∑ − TC = −TC = 1459651068 −TC = 0276913 4×4 j=1 ar 3 4 Y2 (69.44)2 + (70.19)2 +L+( 7137 . )2 − TC = 1459979628 − TC = 3562507 SC(B,Bloque) = ∑∑ • jk − TC = . . 4 j=1 k=11 a

SCError(b) = SC( B,Bloque ) − SCB − SCBloque = 3562507 . . . . − 0276913 − 0992057 = 2293537

---------------------------------------------------------------------------SCA×B =

F Y − TCI − SC − SC = F 69.94 + 6887 I . +L+7077 . − TCJ − SC − SC = 0616471 . GH GH∑∑ r JK 4 K 4

3

2 ij•

2

A

2

A

B

i=1 j=1

4

3

SCComb(A×B ) = ∑∑

Yij2•

i =1 k =1

4

2

B

3

r

− TC =

(69.94)2 + (68.87)2 +L+( 7077 . )2 − TC = 1568707 . 4

4

SCTotal = ∑∑∑Yijk2 −TC = (1767 . 2 +1723 . 2 +L+1794 . 2 ) −TC =146046585 . −TC = 8424732 . i=1 j=1 k=1

SCRe siduo = SCTOTAL − SCA − SCB − SCA×B − SCBloque − SCE( a ) − SCE( b ) = 8.424732-0.675323-0.276913-0.616471-0.992057-1.617285-2.293537 = 1.953146

RESUMEN EN LA TABLA DE ANALISIS DE VARIANZA F. de V. Bloque Surcos (A) Error (a) Densidades (B) Error(b) AxB R e s idual Total

G.L. 3 3 9 2 6 6 18 47

S.C. 0.992057 0.675323 1.617285 0.276913 2.293537 0.616471 1.953146 8.424732

C.M. 0.330686 0.225108 0.179698 0.138457 0.382256 0.102745 0.108508

Fc.

Signific.

1.253

n.s.

0.362

n.s.

0.947

n.s.

3 2 6 F9,0.05 = 386 . ; F6,0.05 = 514 . ; F18,0.05 = 2.66

Conclusión: No se encontró diferencia estadística alguna contrastados a través de la Prueba de F para los efectos principales y de interacción (Surcos, Densidades y Surcos por Densidades), esto nos demuestra que hay suficiente evidencia para afirmar que los factores en estudio son independientes.

- 394 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

IMPLEMENTACIÓN CON EL PROGRAMA SAS. DATA FRANJA; OPTIONS NODATE NOCENTER NONUMBER; INPUT SURCO $ DENSI BLOQUE Y; DATALINES; A1 4 1 17.67 A1 4 2 17.23 A1 4 3 17.43 A1 4 4 17.61 ....CONTINUAR ... A4 8 1 17.86 A4 8 2 16.85 A4 8 3 18.12 A4 8 4 17.94 ; PROC PRINT; RUN; PROC ANOVA; CLASS SURCO DENSI BLOQUE; MODEL Y = BLOQUE SURCO BLOQUE*SURCO DENSI BLOQUE*DENSI SURCO*DENSI; TEST H = SURCO E = BLOQUE*SURCO; TEST H = DENSI E = BLOQUE*DENSI; RUN;

SALIDA DE RESULTADOS The SAS System The ANOVA Procedure Class Level Information Class Levels Values SURCO 4 A1 A2 A3 A4 DENSI 3 4 6 8 BLOQUE 4 1 2 3 4 Number of observations 48 Dependent Variable: Y Source Model BLOQUE SURCO SURCO*BLOQUE DENSI DENSI*BLOQUE SURCO*DENSI Error Corrected Total R-Square Coeff Var 0.768165 1.888997

Sum of DF Squares Mean Square 29 6.47158542 0.22315812 3 0.99205625 0.33068542 3 0.67532292 0.22510764 9 1.61728542 0.17969838 2 0.27691250 0.13845625 6 2.29353750 0.38225625 6 0.61647083 0.10274514 18 1.95314583 0.10850810 47 8.42473125 Root MSE Y Mean 0.329406 17.43813

F Value 2.06 3.05 1.25 1.66 0.36 3.52 0.95

Pr > F 0.0563 0.0554 0.3473 0.1731 0.7104 0.0175 0.4869

Tests of Hypotheses Using the Anova MS for SURCO*BLOQUE as an Error Term Source DF Anova SS Mean Square F Value Pr > F SURCO 3 0.67532292 0.22510764 1.25 0.3473 Tests of Hypotheses Using the Anova MS for DENSI*BLOQUE as an Error Term Source DF Anova SS Mean Square F Value Pr > F DENSI 2 0.27691250 0.13845625 0.36 0.7104

Análisis y Diseño de Experimentos - 395 EJERCICIO: 1. Se desea analizar el largo de vida (Y) de componentes electrónicos al variar la temperatura (T) y el tiempo de horneado (H). Se analizan cuatro niveles de temperatura y tres niveles de tiempo de horneado. El experimentador decide realizar tres replicas. El siguiente cuadro muestra las respuestas obtenidas para cada uno de los arreglos. Tiempo Réplicas (minutos) I 5 10 15 II 5 10 15 III 5 10 15

580 217 233 175 188 201 195 162 170 213

Temperatura (°C) 600 620 158 229 138 186 152 155 126 160 130 170 147 161 122 167 185 181 180 182

640 223 227 156 201 181 172 182 201 199

a) Fijar el modelo lineal aditivo y explicar sus componentes, b) Plantear la hipótesis, c) calcular el ANOVA e interpretar los resultados en base al tenor del problema. 2. Los siguientes datos se refieren a la producción de trigo obtenido en un experimento, en el cual se utilizó un diseño bloques al azar con arreglo en bloque dividido, con el objetivo de estudiar el efecto de dos sistemas de riego (R1:Inundación y R2:Aspersión) y tres dosis de nitrógeno (N0, N1, N2), distribuidos en cuatro bloques.

- 396 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Dosis de Sistemas de Nitrógeno Riego 0 R1 0 R2 1 R1 1 R2 2 R1 2 R2

Bloques I 55 71 62 77 69 78

Analice, interprete los resultados.

II 63 77 66 79 77 81

III 63 77 70 78 79 80

IV 65 75 66 76 76 79

Análisis y Diseño de Experimentos - 397 -

10 ANÁLISIS DE COVARIANZA (ANCOVA) Es una técnica que combina los aspectos del análisis de variancia y de regresión, para manejar casos particulares, en los cuales se tiene una o más variables externas al experimento que no están afectas a los tratamientos e influyen en el valor observado. Muy útil en investigación, permite dar una mejor explicación del comportamietno de la variable de respuesta y a la vez, permite reducir el error experimental. Usos del análisis de covariancia. Se puede aplicar a cualquier diseño experimental. Mediante el ANVA se descompone la variación tota de la variable de respuesta en factores controlables y no controlables, en el factor no controlable se considera el error experimental. En el error experimental están todos aquellos factores y variables que no puedieron ser medidos o simplemente no semidieron. Sin embargo, si una variable es factible de medir en cada unidad experimental, esta debe ser considerada en el modelo, a menos que se pruebe estadísticamente que no tiene ningún efecto. El análisis de covariancia (ANCOVA) permiten el estudio de estas variables externas (concomitantes), si deben o no ser consideradas en el modelo y en que forma se las controla. Supongamos que en un experimento la variable de respuesta "Y" esta relacionada linealmente con la variable independiente "X", además el experimentador no

- 398 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

puede controlar la variable "X" pero puede medirla al mismo tiempo que a "Y", esto es a "X" se le conoce como covariable o variable concomitante, con el ANCOVA se busca adaptar el valor observado de la respuesta para tomar en cuenta el efecto de la variable concomitante. Para realizar el ANCOVA. a) Primeramente se realiza el análisis de regresión (prueba sobre el efecto de regresión), si este análisis resulta ser significativo entonces la variable "X" influye sobre la variable "Y" (concomitante), entonces se procede a realizar el ANCOVA. b) En caso de que la prueba sobre el modelo de regresión hubiera resultado ser no significativo, esto nos indica que la variable "X" no influye en la variable "Y", por lo tanto el análisis estadístico se realiza en la variable "Y" sin considerar la variable "X". Dentro de los posibles usos del ANCOVA están . EL ANCOVA se puede aplicar a cualquier diseño experimental. Mediante el ANVA se descompone la variación total de la variable "Y" en factores controlables y no controlables, en el factor no controlable se considera el error experimental. En el error experimental están todos aquellos factores y variables que no pudieron ser medidos o simplemente no se midieron. Sin embargo, si una variable es factible de medir en cada unidad experimental, esta debe ser considerada en el modelo, a menos que se pruebe estadísticamente que no tiene ningún efecto. El ANCOVA permite el estudio de estas variables externas (concomitantes), si deben o no ser consideradas en el modelo y en que forma se las controla. Dentro de los posibles usos del ANCOVA están: a)

Control de variables externas que implica una disminución del error que se traduce en una mayor precisión del análisis. b) Ajuste de las medias de tratamientos de la variable dependiente (Y) por las diferentes variables independientes (concomitantes). c) Ayudar en la interpretación de los datos, específicamente en la naturaleza del efecto de los tratamientos. SUPOSICIONES DEL ANCOVA. Los supuestos requeridos para que sea válido el ANCOVA son: - Independencia de los errores. - Normalidad en las variables aleatorias ε ~ N (0, σ ) - Que exista homogeneidad entre las varianzas. - Aditividad de los efectos involucrados en el modelo.

Análisis y Diseño de Experimentos - 399 - La variable X es fija, y medida sin error. - La variable X no esta influenciada por los tratamientos. - La variable Y esta relacionada con X en forma lineal. Ejemplos: El peso inicial (X) de animales relaciona el peso final (Y), cuando estos animales están sujetos a diferentes raciones. Se estudia el efecto de las raciones a través de los pesos observados. El número de plantas (X) por parcela, se estudia el rendiemiento total (Y) de la parcela. La incidencia de plagas (X) en el rendimiento de algunas variedades, el estudio es comparar las variedades. Porcentaje de germinación (X), esta medido en el rendimiento (Y). El rendimiento de las parcelas en una producción anterior (X), el estudio del rendimiento de las mismos parcelas al finalizar el experimento (Y).

La edad edad de los animales (X), en la determinación del peso corporal (Y). En cada caso se entiende que la variable X tiene un efecto en la variable Y, sin embargo, esta dependencia deberá ser probada estadísticamente mediante el ANALISIS DE REGRESIÓN. En algunos casos puede existir más de una variable externa, caso multivarial, ejemplo X1 X2, X3. Este caso puede resolverse matricialmente y con ayuda del computador porque los procesos manuales son tediosos. Modelos estadísticos para el análisis de covarianza. ANCOVA en el Diseño completamente al azar: Y ij = µ + τ

i

+ β(X

ij

− X .. ) + ε ij ;

i = 1, 2 , L , t ; j = 1 , 2 , L , ri

ANCOVA en el Diseño Bloque Completamente al Azar.

Yij = µ + β j + τ i + β ( X ij − X .. ) + ε ij ;

i = 1,2 , L , t ; j = 1,2 , L , r

- 400 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

ANCOVA en el Diseño Cuadrado Latino.

Yij ( k ) = µ + Fi + C j + γ k + β ( X ij ( k ) − X ) + ε ij ( k ) ;

i = j = k = 1,

Experimento factorial con dos factores con un modelo de Covarianza lineal simple. Diseño completamente al azar.

Yijk = µ + α i + γ j + (αγ ) ij + β ( X ijk − X ) + ε ijk ;

i = 1,2,L , a; j = 1,2,L , b k = 1,2,L , r

Diseño bloque completamente al azar.

Yijk = µ + ρ j + α i + γ k + (αγ ) ik + β ( X ijk − X ) + ε ijk ;

i = 1,2,L , a; j = 1,2,L , b k = 1,2,L , r

En todos los modelos

β es un parámetro que representa el coeficiente de

regresión. Se supone que β es distinto de cero, lo cual debe probarse, caso contrario en el modelo se elimina el término afectado por

β

.

Las hipótesis a formularse en ANCOVA son: Para la regresión: Para tratamientos.

H o: β = 0

v s.

H a: β ≠ 0

Ho:α i = 0 vs. Ha: α i ≠ 0, ∀ i =1,2 ,L,t

ANCOVA BAJO EL DISEÑO COMPLETAMENTE AL AZAR.

Para realizar ambas pruebas la hipótesi se realizará: a) Para la regresión Ho: β = 0 vs. Ha: β ≠ 0 y b) Para tratamientos: Ho:τ i = 0 vs. Ha: τ i ≠ 0 , se deben calcular las sumas de cuadrados y sumas de productos de las variables X e Y.

Análisis y Diseño de Experimentos - 401 -

ANALISIS DE REGRESION: Hipótesis: Ho: β = 0 vs. Ha: β ≠ 0 F. de V.

G.L.

Suma de Cuadrados

r-1

bE XY = SSRm = b$ ' X ' Y − NY 2

Error resid. N - r

EYY − bEXY = SSE = Y' Y − b$' X ' Y

Total

SSTm = Y ' Y − NY 2

Regresión

N-1

Cuadrados Medios SSRm = MSRm r −1 SSE = MSE r−N

Fobs. M SRm M SE

Para tratamientos el modelo estadístico lineal es:

Yij = µ + τ i + β ( X ij − X .. ) + ε ij ;

i = 1,2,L, t ; j = 1,2,L , r

donde: Yij = Es la j-ésima observación de la variable de respuesta tomada bajo el i-ésimo tratamiento o nivel del facto único.

µ = La media general o constante común.

τ i = Es el verdadero efecto del i-ésimo tratamiento. β = Es un parámetro que representa el coeficiente de regresión lineal que indica la dependencia entre Yij y Xij .

Xij = Es el valor de la covarianza o variable concomitante correspondiente a Yij, es decir es el ij-ésimo ensayo.

X = Es el promedio de las Xij . ε ij = Es un componente de error aleatorio ε ij ~ NI (0, σ 2e )

- 402 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Los cálculos para un ANCOVA basado en el modelo de la ecuación se resumen a continuación. ANALISIS DE COVARIANZA GENERAL PARA DISEÑO COMPLETO AL AZAR.

Suma de cuadrados y Productos cruzados F. de V.

G.L.

∑x

∑xy

Tratamientos

t-1

TXX

TXY

Error experimental

∑n − t EXX

Tratam.+ Error

∑n − 1

2

i

i

EXY

S XX = TXX + E XX

∑y

2

Desviaciones respecto a la regresión. ∑y

2



(∑ xy) 2

∑x

G.L.

2

C.M.

TYY EYY

SE = EYY −

S XY = TXY + E XY

Diferencias para probar entre

2 E XY E XX

S T + E = S YY − ST+E − SE = TYY −

∑n −t −1 i

2 S XY S XX 2 XY

SE =

∑n − 2 i

2 XY

S E + SXX EXX

t-1

medias ajustadas de tratamientos

SUMA DE CUADRADOS Y PRODUCTOS: PARA TRATAMIENTOS: t



T XX =

i =1

t

TXY = ∑ i =1

TYY =

X i2. X ..2 − ni ∑ n i (suma de cuadrados de tratamientos para X).

Xi.Yi. ( X.. )(Y.. ) − ni ∑ni (suma de productos de tratamientos para X e Y).

t



i =1

Yi .2 Y2 − .. (Suma de cuadrados de tratamientos para Y). ni ∑ ni

ERROR (Por diferencia: Error = Total - Tratamientos).

∑n

SE − t −1

i

Análisis y Diseño de Experimentos - 403 ni

t

t

E XX = ∑ ∑ X ij2 − ∑ i =1 j =1

i =1

ni

t

t

E XY = ∑∑ Xij Yij − ∑ i =1 j =1

E YY =

t

i =1

ni

Xi.Yi. ni (Suma de cuadrados del error experimental para X e Y)

t

∑ ∑ Yij2 − ∑ i =1 j = 1

X i2. ni (Suma de cuadrados del error experimental para X)

i =1

Yi .2 n i (Suma de cuadrados del error experimental para Y).

TRATAMIENTO + ERROR: La suma de estas fuentes de variación es:

S XX = TXX + E XX S XY = TXY + E XY SYY = TYY + EYY

∑ xy = ∑ X 2

∑ x =∑ X 2

Y −

ij ij

2 ij



(∑ X ij ) 2

∑n

i

∑ y =∑ Y 2

2 ij



(∑ Yij ) 2

∑n

d∑ X id∑ Y i ij

∑n

ij

i

OTRA FORMA DE CALCULAR: PARA LA VARIABLE X:

S XX = T XX =

E

XX

∑∑ ∑

X ..2 X − ∑ n i (suma de cuadrados total de X). 2 ij

X i2. − ni

X ..2 ∑ n i (Suma de cuadrados de tratamientos de X).

= S X X − T X X (Suma de cuadrados del error X).

PARA LA VARIABLE Y:

S YY =

∑∑Y

2 ij



Y..2 ∑ n i (suma de cuadrados total de Y).

i

- 404 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

TY Y =



Y i .2 − ni

Y ..2 ∑ ni

(Suma de cuadrados de tratamientos de Y).

E YY = S YY − TYY

(Suma de cuadrados del error X).

PRODUCTO CRUZADO DE XY:

S XY =

∑∑ X

T XY =



ij

Yij −

( X .. )(Y.. ) ∑ ni ( suma de producto total XY).

X i . Yi . ( X .. )( Y.. ) − ni ∑ ni

(Suma de producto para tratamiento XY).

E XY = S XY − T XY

(Suma de Producto del error XY).

Del cuadro se determina el valor de F calculado (Fc) para la prueba estadística: Ho: β = 0 F=

2 2 E XY E XY E XX E2 E = = XY 2 XX con v1 =1 S ( E XX ) S E ∑ni − t − 1 SE

d

2 E

i

y

v2 = ∑ni − t −1 grados de

libertad. PARA TRATAMIENTOS:

F=

bS

T+E

SE

g

− SE (t − 1)

d∑n − t −1i i

=

bS

H o: τ i = 0

T +E

g

− SE (t − 1) S

2 E

vs .

H a: τ i ≠ 0

con v1 = t −1 y v2 = ∑ni − t −1 grados

de libertad. A parte de realizar la prueba F es frecuente e importante presentar una tabla de medias de tratamientos ajustadas, como una ayuda para la interpretación de los resultados experimentales. Las medias de tratamientos ajustadas se pueden encontrar por medio de la siguiente fórmula:

Análisis y Diseño de Experimentos - 405 -

Yi .ajust = Yi − β ( X i − X );

i = 1,2 ,L , t .

Donde β es el coeficiente de regresión calculado a partir del error experimental de cuadrado y productos, esto es:

β =

E XY E XX

La varianza estimada de una media de tratamientos ajustada esta dada por:

c

LM 1 c X − X h OP MNn + E PQ 2

h

V$ ajus.Yi = S E2

i

i

XX

El error estándar de una media de tratamientos ajustada por:

c

h

S Ajust .Yi = V$ ajus. Yi = S E

LM 1 c X − X h MN n + E

2

i

i

XX

OP PQ

La varianza estimada de la diferencia entre dos medias de tratamiento ajustadas, esta dada por:

d

i

V$ ajus. Yi − ajust . Y j = S E2

LM 1 MN n

i

d

Xi − X 1 + + nj E XX

i OP PQ 2

j

EJEMPLO. En un experimento realizados en cerdos de las razas: Yorkshire, Hampshire y Criolla se evaluó el peso final (Y) de estos animales enla Estación Experimental Illpa - INIAA-Puno, para este experimento se pesó a los animales al inicio del experimento, registrándose a este peso inicial de los cerdos (X), estos animales fueron alimentados con residuos de la zona. La información se presenta a continuación.

- 406 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

1 2 3 4 Xi. Yi.

YORKSHIRE X Y 7.4 18.7 10.6 24.4 13.5 30.1 12.0 25.9 43.5 99.1

HAMPSHIRE X Y 8.4 20.2 10.8 22.5 12.4 22.9 10.3 20.1 41.9 85.7

CRIOLLO X Y 12.8 22.0 10.6 20.4 10.8 20.7 11.4 21.0 45.6 84.1

X.. Y.. 131 268.9

PRIMER PASO ES RESOLVER MEDIANTE LA REGRESION. El procedimiento se realiza agrupando en dos columnas X e Y. Los resultados son las siguientes:

∑X

2 i

= 1463.22,

∑Y

2

i

∑XY

= 6134.23,

X'X =

LM 12 N131

( X' X)−1 =

146322 . 1 12(146322 . ) −131*131 −131

β$ = ( X' X)−1 X'Y =

O, 1463.22 PQ

i i

131

LM N

= 2978.64,

∑X

LM 268.9 OP N2978.64 Q . −131O 1 L146322 ,= M P 12 Q 39764 . N −131

i

= 131,



X 'Y =

LM N

OP LM QN

OP Q

LM N

OP LM Q N

OP Q

−131 12

OP Q

. . . . 8193385977 −131 2689 1 146322 1 3258018 = = . . . 51778 1302132585 −131 12 297864 . . 39764 39764

⇒ SSRm = β$ ' X 'Y − NY 2 = 8193385977 1302132585 . .

LM 2689. OP −12FG 2689. IJ H 12 K . Q N297864

2

= 561848405 .

SSE = Y ' Y − β$ ' X ' Y = 6134.23 − 6081785674 . = 52.444326

. = 108.6291669 SSTm = Y' Y − NY 2 = 6134.23 − 6025600833 TABLA DE ANALISIS DE VARIANZA. F. De V. G.L. Debido a regresión 1 Error 10 Total 11

R2 =

S.C. 56.184841 52.444326 108.629167

C.M. Fobs. 56.184841 10.71** 5.244433

SSRm 561848405 . x100 = 5172 = . , SSTm 108.6291669

r = 0.72

0.05 0.01 4.96 10.04

Análisis y Diseño de Experimentos - 407 CONCLUSION: Como Fc = 10.71 > Ft = 10.04, entonces se rechaza la hipótesis nula, esto implica que β ≠ 0 , es decir que la variable Y esta influenciada por la variable X, por consiguiente se procede a efectuar el análisis de covarianza. Esta afirmación podemos corroborar con el coeficiente de determinación R 2 = 5172 . %, es decir el 51.72% de la variación de peso final depende de la variación del peso inicial, y en un 48.28% debe a otros factores como por ejemplo medio ambiente, condiciones de manejo y otros. Como se comprobó que la Fc es significativo, entonces se procede a efectuar el ANCOVA. PARA TRATAMIENTOS: t



TXX =

i =1

t

TXY = ∑ i =1

X i2. X ..2 43.52 + 41.9 2 + 45.6 2 131 − = − = 1.7216667 ni 4 12 ∑ ni

Xi.Yi. ( X.. )(Y.. ) (435 . )(991 . ) + (419 . )(857 . ) + (456 . )(841 . ) (131)(2689 .) − = − = −13316666 . ni 4 12 ∑ni

Yi .2 Y2 99.12 + 85.7 2 + 84.12 (268.9) 2 − .. = − = 33.9266667 4 12 i =1 ni ∑ ni t

TYY = ∑

ERROR (Por diferencia: Error = Total - Tratamientos). ni

t

t

EXX = ∑∑Xij2 − ∑ i =1 j =1

t

i =1

ni

t

EXY = ∑∑ Xij Yij − ∑ i =1 j =1

IJ K

h FGH

c

Xi2. 435 . 2 + 419 . 2 + 456 .2 = 74 = 31415 . 2 + 106 . 2 +135 . 2 +L+108 . 2 +114 .2 − . ni 4

i =1

Xi.Yi. = (74 . )(187 . ) + (106 . )(244 . )+L+(108 . )(207 . ) + (114 . )(210 .) ni

FG 435. *991. + 419. *857. +L+456. *841. IJ = 4448 H K . 4 c991. +857. +841. h = 747025 = c187 . + 244 . +L+207 . + 210 . h− . −

t ni t Y2 EYY = ∑∑Yij2 − ∑ i. i=1 j=1 i=1 ni

2

2

2

2

2

2

4

2

- 408 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

TRATAMIENTO + ERROR: La suma de estas fuentes de variación es:

. + 31415 . = 331366667 . S XX = TXX + E XX = 17216667 . + 44.48 = 431483334 . S XY = TXY + E XY = −13316666 SYY = TYY + E YY = 33.926667 + 74.7025 = 108.629167 TABLA DE ANALISIS DE COVARIANZA (ANCOVA). Suma de Cuadrados y Productos Correg. Desviación respecto a Regres.

∑x

2

∑ xy

∑y

2

F. De V. G.L. Tratamientos 2 1.7216667 -1.3316666 33.9266700 Error exptal. 9 31.4150000 44.4800000 74.7025000 Trat. + Error 11 33.1366667 43.1483334 108.6291700 Diferencias para probar entre medias ajustadas de tratamientos

∑y

2



d ∑ xy i ∑

2

x2

G.L.

11.7239733 8 52.4443132 10 40.7203424 2

C.M. 1.465497 20.36017

2 E XY (44.48) 2 S E = EYY − = 74.7025 − = 1172397382 . E XX 31415 .

S E2 = 1.465496727 , S T + E

= SYY −

2 S XY = 52.44431618 , S − S = 4072034236 . T +E E S XX

F-calculado para TRATAMIENTOS:

F=

(ST+E − SE ) (t −1) 2036017118 . . **, = = 1389 1465496727 . SE2

. con F82(0.01) = 8649

F-calculado para REGRESION: F=

2 EXY E2 E (4448 . )2 = = XY 2 XX = 4297418413 . **, S (EXX ) 1465496727 SE . *31415 . 2 E

con F81(0.01) = 11259 .

Para resumir los datos analizados en un tabla necesitamos efectuar los siguientes cálculos.

SCTOTAL sin corregir = ∑ Yi 2 = SST = 6134.23

SCde la Media = SSM =

Y..2 (268.9) 2 = = 6025.600833 12 ∑ ni

Análisis y Diseño de Experimentos - 409 -

SCError exp tal. = SSE = EYY −

2 E XY 44.482 = 74.7025 − = 1172397382 . E XX 31415 .

SCREGRESION = SSRm = SST − SSM − SSE = SCTotal − SCMedia − SCError = 6134.23 − 6025600833 . − 1172397383 . = 96905193 . SCTrat ./ β = ST + E − S E = 52.44431618 − 1172397382 = 40.72034236 . − 4072034236 = 5618485081 SCDebidoa β = SCregresión − SCTrat./ β = 9690519317 . . . TABLA DE ANALISIS DE VARIANZA. F. de

V.

G.L.

S.C.

C.M.

∑n

Media

1

SC(µ) = Y..2

Regresión.

t

SC (τ 1 , τ 2 ,...., τ t −1 , β ) / µ )

Debido a

β

Error exptal.

SC ( β µ )

1

Tratamiento/ β

t-1

∑n

Total

i

SC(τ1,τ2 ,....,τt−1 µ,β)

c

2 EYY − EXY EXX

−t −1

∑n

i

∑Y

i

SC Trat β ( t − 1)

h

E YY ( ∑ ni − t − 1)

2

Numéricamente tenemos en la siguiente Tabla: F. De V. Media REGRESION Debido a ß Tratamientos/ß Error Exptal. Total

G.L. 1 3 1 2 8 12

S.C. 6025.6008330 96.9051932 56.1848508 40.7203424 11.7239738 6134.2300000

C.M.

Fc.

20.3601712 13.89** 1.4654967

- 410 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Ajuste de los promedios de los tratamientos mediante el uso de fórmula:

c

Yi .ajust . = Yi . − β X i . − X ..

h

donde:

Yi. Ajust = Promedio ajustado de cada tratamiento. Yi . = Promedio de cda tratamiento sin ajustar.

β

= Coeficiente de regresión.

X i. = Promedio del número de observaciones en cada tratamiento (o variable X). X .. = Promedio general del número de observaciones por unidad experimental. El ajuste siempre es ventajoso, aún cuando la prueba de F, para la variable X no sea significativa: β = E XY E XX = 44.48 31.415 = 1.415884132

c

h

Y$i = Yi . − 1.415884132 X i . − X .. ,

Tratamientos

X i.

Xi. − X..

X .. =

c

β X

i.

− X

131 = 10.91666667 12

..

h

Yi .

Yi . Ajustado

Yorkshire 43.5/4 = 10.875 -0.04167 -0.05899517 99.1/4 = 24.775 24.833995 Hampshire 41.9/4 = 10.475 -0.44167 -0.62534882 85.7/4 = 21.425 22.05034 Criollo 45.6/4 = 11.40 0.48333 0.684343997 84.1/4 = 21.025 20.340656

c

h

La suma de las desviaciones debe ser cero β X i. − X .. = 0 La suma de promedios observados experimentalmente también debe ser igual a la suma de los promedios ajustados.

C.V . =

S E2 Y..

x100 =

1465496727 . x100 = 5.40% 268.9 12

Análisis y Diseño de Experimentos - 411 La varianza estimada de una media de tratamientos ajustada está dada por:

c

h

V$ ajus.Yi = S

Tratamientos

LM 1 c X − X h OP MN n + E PQ 2

2 E

i.

..

i

X i.

XX

c

Xi. − X..

β X

i.

− X

..

h

Yorkshire 10.875 -0.04167 -0.05899517 Hampshire 10.475 -0.44167 -0.62534882 Criollo 11.40 0.48333 0.684343997

Yi .

Yi . Ajustado

24.775 24.833995 0.605355408 21.425 22.05034 0.612759406 21.025 20.340656 0.614224749

El error estándar de una media de tratamientos ajustada por:

S Ajust .Yi

c

c

h

h

LM 1 c X − X h OP MN n + E PQ 2

= V$ ajus.Yi = S E

i.

i

..

XX

LM b MN

g OP = 036645517 . PQ

. − 1091666667 . 1 10875 V$ ajus.Y1 = 1465496727 . + . 4 31415

S Ajust .Y1 = 0.36645517 = 0.605355408

c

h

LM b MN

2

g OP = 037547409 . PQ

. − 1091666667 . 1 10475 V$ ajus.Y2 = 1465496727 . + . 4 31415

S Ajust .Y2 = 0.37547409 = 0.612759406

c

h

S Ajustado .Yi

LM b MN

g OP = 0377272043 . PQ

. −1091666667 . 1 1040 V$ ajus.Y3 = 1465496727 . + . 4 31415

S Ajust .Y3 = 0.377272043 = 0.614224749

2

2

- 412 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

La varianza estimada de la diferencia entre dos medias de tratamiento ajustadas está dada por:

LM MN

d

Xi − X j 1 1 + + V$ ajus.Yi − ajust.Yj = S E2 ni n j E XX

d

i

i OP PQ 2

PROGRAMA EN SAS. DATA CERDOS; OPTIONS NODATE NOCENTER NONUMBER; INPUT RAZA $ X Y; CARDS; Y 7.4 18.7 Y 10.6 24.4 Y 13.5 30.1 Y 12.0 25.9 H 8.4 20.2 H 10.8 22.5 H 12.4 22.9 H 10.3 20.1 C 12.8 22.0 C 10.6 20.4 C 10.8 20.7 C 11.4 21.0 ; PROC PRINT; RUN; PROC REG; MODEL Y = X /XPX I COVB; RUN; PROC GLM; CLASS RAZA; MODEL Y = RAZA X /SOLUTION SS3; LSMEANS RAZA /STDERR PDIFF; RUN; /* PRESIONE F3 PARA EJECUTAR EL PROGRAMA */

Análisis y Diseño de Experimentos - 413 EJEMPLO. Aplicación. En un experimento en cerdos se evalúo el peso (Y) de estos animales cuando se aplicaron 4 tipos de alimento balanceado “2”, “3”, “4”, “5” y un testigo identificado como “1”, Se peso a los animales al iniciar el experimento, registrándose a este peso inicial como la variable X. 1 1 2 3 Xi.

Yi.

2

3

4

5

X 15 18 21

Y 55 60 63

X 16 22 26

Y 65 62 69

X 14 23 27

Y 80 95 100

X 13 15 12

Y 80 95 79

X 16 19 15

Y 83 94 98

54

178

64

196

64

275

40

254

50

275 272 1178

Y..

X..

Cuadro de ANVA para la regresión Fuentes

g.l.

S.C.

C.M.

Fc

Regresión Residual

1 9

248.64 306.69

248.64 34.08

7.30

Fc>Ft, se rechaza la Ho: b=0. Se afirma estadísticamente que el peso inicial tiene una influencia en el peso final del animal. Prueba de hipótesis : Ho : ti=0 vs ti¹0 Según el resultado de la regresión, el análisis continua con el ANCOVA.

Fuentes

g.l.

∑x

Alimentos Error

4 10

137.1 170.6

2

Al. + error 14 307.7 Alimento ajustado CV=7.43% F =3.63 0.05(4,9)

∑ xy

∑y

-139.0 206.0

2776.4 555.3

66.9

3331.7 3010.45

2

∑y

2

− ( ∑ xy ) 2

∑x

306.69

2

g.l.

CM Fc

9

34.0

4

752.6 22

3317.14

- 414 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Comparaciones de los promedios Peso (X) Peso (Y) Peso Ajustado Inicial Final Final 1 18.00 59.33 59.33-1.207(18.00-18.13)=59.49 2 21.33 65.33 61.47 3 21.33 91.67 87.81 4 13.33 84.67 90.46 5 16.67 91.67 93.43 Comparación Dif

s

0.05

0.01

Signif

11.99 11.99 10.79 13.48 11.76 11.99

16.22 16.22 15.50 19.37 16.90 16.22

ns ** ** ns ns ns

d

1 vs 2 1 vs 3 2 vs 3 3 vs 4 3 vs 5 4 vs 5

1.98 28.32 26.34 2.65 5.62 2.97

4.99 4.99 4.77 5.96 5.20 4.99

El alimento tstigo y el alimento balanceado “2” responden en forma semejante, los alimentos balanceados “3”, “4” y “5” no muestran diferencias, sin embargo, este grupo difiere muy significativamente del grupo testigo y alimento “2”. PROGRAMA EN SAS. DATA ANCOVAM; OPTIONS NODATE NOCENTER NONUMBER; TITLE ‘Alimento para cerdos EN UN D.B.C.A.’; DO ALIMENTO = 1 TO 5; INPUT INICIAL FINAL @; OUTPUT; END; CARDS; 15 55 16 65 14 80 13 80 16 83 18 60 22 62 23 95 15 95 19 94 21 63 26 69 27 100 12 79 15 98 ; PROC GLM; CLASS ALIMENTO; MODEL FINAL=ALIMENTO INICIAL/SOLUTION SS3; LSMEANS ALIMENTO/STDERR PDIFF; RUN;

Análisis y Diseño de Experimentos - 415 ANALISIS DE COVARIANZA EN UN ARREGLO FACTORIAL En esta parte vamos a describir y aplicar el análisis de covarianza en un arreglo factorial con dos factores, en un diseño completamente al azar. Consideramos ahora la combinación de efectos para definir tratamientos o estímulos, tomando en cuenta que la respuesta de los mismos puede ser afectada por una variable, la cual se pretende controlar a través de covarianza. El modelo estadístico para este análisis es el siguiente:

Yijk = µ + α i + β j + ( αβ )ij + β( X i .. − X ... ) + ε ijk i = 1,2,3,.., a j = 1,2,3,.., b k = 1,2,3,.., r

β = Coeficiente de regresión

EJEMPLO: En la Granja de Animales Menores de la Facultad de Medicina Veterinaria y Zootecnia de la UNA - Puno, se ensayó dos razas de conejos: California y Nueva Zelandia, para este experimento se ha suministrado tres raciones de tratamientos: T1 = Forraje hidropónico, T2 = 25% de concentrado y 75% de forraje hidropónico y T3 = Puro concentrado, el objetivo del presente estudio fue evaluar el incremento de peso vivo durante las 8 semanas. La información se presenta a continuación:

T1 X 1 749.5 2 614.7 3 477.7 4 726.5 5 767.4 Total 3335.8 XY 5449586

Y 1996.5 1503.7 1096.4 1807.9 1552.9 7957.4

Raza California T2 T3 X Y X 423.7 1411.7 757.7 550.8 1558.5 391.1 712.6 1834.7 622.5 685.8 1882.1 738.0 691.5 1923.9 627.3 3064.4 8610.9 3136.6 5385087 6042370.6

Y 2197.3 1410.9 1734.4 2132.4 1868.8 9343.8

T1 X 708.0 574.1 692.1 738.8 618.9 3331.9

Y 1490.0 1030.0 1790.5 2070.5 1570.0 7951.0

Raza Nueva Zelandia T2 T3 X Y X 675.5 1418.5 786.4 496.9 1799.1 807.3 609.3 1685.0 698.6 747.4 1498.7 749.7 778.7 1977.7 749.5 3307.8 8379.0 3791.5 5539003 7203000 X... = 19968.0 Y... = 51746.6

Y 1900. 1820. 1893. 2200. 1691. 9504.

- 416 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

1) Suma de cuadrados para «X».

a) TC = b)

X 2 ... ( 19968 )2 = = 13290700.8 abr 2x3x5

2 SCTotal = ∑ Xijk − TC

2) Suma de cuadrados para «Y»

a) TC =

b) SC Total =

= 749.52 + 614.7 2 +L+749.7 2 + 749.52 − TC

2

br

3x5

∑Y

2 ijk

2 2 2 c) SC = ∑Yi.. − TC = 25912.1 + 25834.5 − TC A

br

3x5

=26665.05 d) SC = B =

∑X

2 . j.

ar

=200.73

− TC

=

= 15471.774

e) SC Int(AB) = SC comb(AB) − SC A − SC B

=

∑X r

2 ij.

∑Y

2 . j.

d) SC B =

.2 6667.7 2 + 6372.2 2 + 69281 − TC 2x5

SCcomb(AB) =

− TC

. 2 − TC = 1996.52 + 1503.7 2 +L+2200.02 + 16912 = 2461716.71

= 345884.08

.2 c) SC = ∑ Xi.. − TC = 9536.82 + 104312 − TC A

Y 2 ... ( 51746.6 )2 = = 89257020.39 abr 30

ar

− TC

15908.4 2 + 16989 .9 2 + 18848.32 − TC 2x5

= 442210.16 e) SCInt(AB) = SCcomb(AB) − SCA −SCB SCcomb(AB) =

− TC

. 2 + 37915 .2 3335.82 + 3064.42 +L+33078 − TC 5

=

= 64287.052

∑Y

2 ij.

r

− TC

7957.42 + 8610.92 +L+83792 + 9504.52 − TC 5

= 450174.47

SC int(AB) = 64287.05 - 26665.05-15471.774 SCint(AB) = 450174.47 - 200.73 -442210.16 = 22150.23

f) SC Error = SCTotal − SC Comb(AB) = 345884.08 - 64287.052 = 281597.028

= 7763.58

f)

SCError = SCTotal − SCComb(AB) = 2461716.71 - 450174.47 = 2011542.25

Análisis y Diseño de Experimentos - 417 3) Suma de Cuadrados para calcular:

a) TC =

(Producto cruzado)

(X...)(Y...) (19968.0)(51746.6) = = 34442536.96 abr 30

∑ xy

b)

∑ xy

Total

∑X

=

ijk

Yijk − TC

= (749.5)(1996.5) + ........ + (749.5)(1691.2) - TC = 563316.89

∑ xy

c)

A

∑X

= =

∑ xy

d)

B

=

e)

=

i..

Yi..

br

− TC =

(X 1.. )(Y1.. ) + (X 2.. )(Y2.. ) − TC br

(9536.8)(25912.1) + (10431.2)(25834.5) − TC = -2313.515 15

∑X Y

.j. .j.

ar

− TC =

(X.1. )(Y.1. ) +(X.2. )(Y.2. ) +(X.3. )(Y.3. ) − TC ar

(6667.7)(15908.4) +(6372.2)(16989.9) +(6928.1)(18848.3) − TC= 49301.709 2x5

SC Int(AB) = SC comb(AB) − SC A − SC B SC comb(AB) = =

∑X

ij.

Yij.

r

− TC

(3335.8)(7957.4) +(3064.4)(8610.9) + L+(3307.8)(8379.0) +(3791.5)(9504.5) −TC 5

SC int(AB) = 54184.002 + 2313.515 - 49301.709 = 7195.808 f)

SC Error = SC Total − SC Comb(AB) = 563316.89 - 54184.002 = 509132.888

- 418 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

La salida con el Sistema de Análisis Estadístico S.A.S. se presenta a continuación: Primeramente se realizará el Análisis de Regresión para detectar, si la variable X influye sobre los tratamientos en estudio.

Model: MODEL1 Dependent Variable: Y Sumof Source DF Squares Model 1 917434.29926 Error 28 1544282.4154 C Total 29 2461716.7147 Root MSE 234.84664 Dep Mean 1724.88667 C.V. 13.61519 Parameter Estimates Variable INTERCEP X

R-square Adj R-sq

Mean Square 917434.29926 55152.94341

F Value 16.634

0.3727 0.3503

Parameter Standard TforH0: DF Estimate Error Parameter=0 1 640.871114 269.22243225 2.380 1 1.628629 0.39931816 4.079

Covariance of Estimates COVB INTERCEP INTERCEP 72480.718025 X -106.1332431

Prob>F 0.0003

Prob > |T| 0.0243 0.0003

X -106.1332431 0.1594549926

Se observa que la Fc = 16.634 es mayor que F-tabla, entonces se procede a realizar el Análisis de Covarianza. Class Level Information Class Levels Values RAZA 2 CALI ZELA ALIM 3 CONC CPURO REP 5 12345 Number of observations in data set = 30

HIDRO

Análisis y Diseño de Experimentos - 419 Dependent Variable: Y Source Model Error Corrected Total

Sumof Squares 6 1370696.602 23 1091020.112 29 2461716.715

Mean Square 228449.434 47435.657

DF

R-Square 0.556805

C.V. 12.62676

Root MSE 217.7973

F Value Pr > F 4.82 0.0026

Y Mean 1724.88667

Dependent Variable: Y Type III SS Source DF Mean Square F Value RAZA 1 87451.7603 87451.7603 1.84 ALIM 2 312978.1754 156489.0877 3.30 RAZA*ALIM 2 50597.7288 25298.8644 0.53 X 1 920522.1358 920522.1358 19.41 TforH0: Estimate Parameter=0 385.3720360 B 1.33 -0.1302551 B -0.00 0.0000000B . . 94.3146535 B 0.68 CPURO 144.5068573 B 1.01 HIDRO 0.0000000B . . 1.8080194 4.41

Parameter INTERCEPT RAZA CALI ZELA ALIM CONC X

Least Squares Means RAZA Y

Std Err LSMEAN CALI 1781.37642 57.55088 ZELA 1668.39692 57.55088

ALIM

Y

CONC 1750.30159 CPURO 1835.63379 HIDRO 1588.72462

LSMEAN 69.85157 69.77310 68.87522

Pr>|T| 0.1974 0.9993 0.5004 0.3222 0.0002

Pr > |T| LSMEAN H0:LSMEAN=0 0.0001 0.0001

Std Err Pr > |T| LSMEAN H0:LSMEAN=0 0.0001 0.0001 0.0001

Least Squares Means for effect ALIM Pr > |T| H0: LSMEAN(i)=LSMEAN(j) Dependent Variable: Y i/j 1 2 3 1 . 0.4025 0.1133 2 0.4025 . 0.0191 3 0.1133 0.0191 .

StdErrorof Estimate 290.32814569 137.74746933 . 137.76130216 142.82004148 . 0.41042937 Pr > |T| H0: LSMEAN1=LSMEAN2 0.1877

LSMEAN Number 1 2 3

Pr > F 0.1877 0.0550 0.5937 0.0002

- 420 -

V. Ibañez Q. - Docente FINESI - UNA - Puno General Linear Models Procedure Least Squares Means RAZA ALIM Y Std Err Pr > |T| LSMEAN LSMEAN H0:LSMEAN=0 CALI CONC 1817.49878 99.77639 0.0001 CALI CPURO 1937.97098 98.66091 0.0001 CALI HIDRO 1588.65949 97.40401 0.0001 ZELA CONC 1683.10440 97.41602 0.0001 ZELA CPURO 1733.29660 104.56907 0.0001 ZELA HIDRO 1588.78974 97.40243 0.0001 Least Squares Means for effect RAZA*ALIM Pr > |T| H0: LSMEAN(i)=LSMEAN(j) Dependent Variable: Y i/j 1 2 3 4 5 1 . 0.3913 0.1146 0.3443 0.5803 2 0.3913 . 0.0192 0.0786 0.1796 3 0.1146 0.0192 . 0.4999 0.3214 4 0.3443 0.0786 0.4999 . 0.7294 5 0.5803 0.1796 0.3214 0.7294 . 6 0.1147 0.0192 0.9993 0.5004 0.3222

6 0.1147 0.0192 0.9993 0.5004 0.3222 .

LSMEAN Number 1 2 3 4 5 6

Análisis y Diseño de Experimentos - 421 A NÁLISIS DE COVARIANZA MÚLTIPLE. En situaciones generales, es posible que sobre cada unidad experimental se observen los valores de p variables concomitantes, simultáneamente con el valor observado de la característica en estudio.

Yij = µ + ρi + τ j + β 1 X1ij + β 2 X 2ij + L + β p X pij + ε ij Con los resultados del experimento se debe preparar, en primer lugar la siguiente tabla: Las sumas de cuadrados:

R x1x1 , Tx1x1 , E x1x1 , R x2 x2 , Tx 2 x 2 ,K , R yy , Tyy y E yy , de la Tabla resumen pueden ser obtenidos como en cualquier diseño de Bloque completo al azar.

Sx1x1 = Tx1x1 + Ex1x1 ; Sx1x2 = Tx1x2 + Ex1x2 ;K; Ux1x1 = Rx1x1 + Ex1x1 ; U x1x 2 = R x1x 2 + E x1x 2 ;L Las sumas de productos pueden ser calculadas a partir de las ecuaciones: r

∑X Y .j

R xiy =

j=1

t t

t

.j



Txi y =

∑X Y i.

i=1

t

r

∑∑X Y ij

E xi y =

(X..)(Y..) rt

,

i =1 j =1

t

ij

− Txy − R xy −

(X..)(Y..) rt

i.



(X..)(Y..) rt

- 422 -

G.L.

Bloques

r- 1

Rx1x1

Rx1x2

Rx1y

Rx2x2

Rx2y

Tratamientos

t- 1

Tx1x1

Tx1x2

Tx1y

Tx2x2

Tx2y

Ex1x2

Ex1y

Ex2x2

Ex2y

Tox1x2

Tox1y

Tox2x2

Tox2y

Error exptal. Total

(r - 1)(r - 1) Ex1x1 Tox1x1 rt - 1

Tratamiento + Error

r(t-1)

Sx1x1

Sx1x2

Sx1y

Sx2x2

Sx2y

Bloque + Error

t(r - 1)

Ux1x1

Ux1x2

Ux1y

Ux2x2

Ux2y

V. Ibañez Q. - Docente FINESI - UNA - Puno

F. De V.

SUMAS DECUADRADOS YDEPRODUCTOS CORREGID ∑x12 ∑x1x2 ∑x1y ∑x22 ∑x2y

RYY TYY EYY SYY

r- 1 t-1 (r - 1)(t - 1) r(t - 1)

Bloque Tratamientos (T) Error Exptal. (E) i =1

i(T + E)

( b iE E

∑ (b

k

i=1



k

t(r - 1)

UYY i =1

∑ (b

i(B+ E)

Diferencia para probar entre medias de bloques ajustados

B+E

k

)

S x iy )

xiy

S.C. Debido a la regresión ..... .....

U xiy )

Diferencia para probar entre medias de tratamientos ajustados

T+ E

S.C.

G.L.

Fuentes de Variación

k

k

i =1

∑ (b

iE

E xiy ) = W

Z- W i=1

X- W

Uyy −∑(bi(B+E)Uxyi )=X

k

i=1

Syy −∑(bi(T+E)Sxiy ) =Z

S yy −

S.C. De las desviaciones respec. A la regr. ..... .....

G.L.

r- 1

t(r - 1)

t-1

r(t - 1) - 2

(r - 1)(t - 1) - 2

ANALISIS ABREVIADO DE COVARIANCIA PARA LOS DATOS DEL EXPERIMENTO

Análisis y Diseño de Experimentos - 423 -

- 424 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

ANALISIS DECOVARIANCIAPARALOS DATOS EXPERIMENTALES. Fuentes de Variación Media Regresión

G.L.

Suma de Cuadrados 2 ..

X rt

1 r+ t

Por diferencia

C.M. ..... .....

k

Debido a β1 ,β2 Bloques/ β 1 ,β 2 Tratamientos/β1 ,β2 Error exptal. Total

k r- 1 t-1 (r - 1)(t - 1) -2 rt



( b iT o T o

i=1

x iy

Por diferencia Z- W** W*

∑∑X

2 ij

)

..... (Z - W) (t - 1) W =E (r -1)(t -1) - 2

.....

EJEMPLO. Se probaron 5 líneas de soya, conducidas en un Diseño Bloque Completo al Azar con 4 repeticiones. Los datos que se registaron fueron : X1 : maduración, medida en días posteriores al de la variedad testigo X2 : acame, medido en una escal de 0 a 5. Y : infección por gangrena del tallo medida como porcentaje de tallos infectados. El objetivo principal es saber cual de los dos, la madurez o el acame, está más intimamente relacionadao con la infección. Determine esto a partir de la regresión múltiple del error. Pruebe la hipótesis de que no existen diferencias entre los promedios de infección ajustados para las variedades. Resultados ordenados del experimento de soya conducido en D.B.C.A.

Análisis y Diseño de Experimentos - 425 Línea Tratamiento A B C D E TOTAL

X1 9 10 10 8 12 49

Bloque I X2 Y 3 19.3 3 10.1 2.5 13.1 2 15.6 2.5 4.3 13 62.4

X1 10 10 9 5 11 45

Bloque II X2 Y 2 29.2 2 34.7 1.5 59.3 2 49 1 48.2 8.5 220.4

X1 12 9 12 8 13 54

Bloque III X2 Y 3 1 2 14 2.5 1.1 2 17.4 3 6.3 12.5 39.8

X1 9 9 10 6 10 44

Bloque IV X2 Y 2.5 6.4 3 5.6 2.5 8.1 2 11.7 2.5 6.7 12.5 38.5

El programa SAS, que nos permite realizar este análisis es el siguiente :

DATA ANCOVAM; OPTIONS NODATE NOCENTER NONUMBER; TITLE ‘ANCOVA MULTIPLE EN UN D.B.C.A.’; DO TRAT =’A’,’B’,’C’,’D’,’E’; DO REP=1 TO 4; INPUT X1 X2 Y @; OUTPUT; END; END; CARDS; 9 3.0 19.3 10 2.0 29.2 12 3.0 1.0 9 2.5 6.4 10 3.0 10.1 10 2.0 34.7 9 2.0 14.0 9 3.0 5.6 10 2.5 13.1 9 1.5 59.3 12 2.5 1.1 10 2.5 8.1 8 2.0 15.6 5 2.0 49.0 8 2.0 17.4 6 2.0 11.7 12 2.5 4.3 11 1.0 48.2 13 3.0 6.3 10 2.5 6.7 ; PROC PRINT; RUN, PROC REG; MODEL Y = X1 X2/ALL; RUN; PROC GLM; CLASS REP TRAT; MODEL Y=REP TRAT X1 X2/SOLUTION; LSMEANS TRAT/STDERR PDIFF; RUN; PROC GLM; CLASS REP TRAT; MODEL Y=REP TRAT X1 X2/SS1; RUN;

- 426 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

EJERCICIOS: 1. El presete trabajo de investigación se realizó en el Centro Experimental Quimsachata de la Estación Experimental ILLPA - INIA Puno, ubicado en el distrito de Santa Rosa, Provincia de Lampa, Dpto. de Puno. El objetivo fue determinar las medidas biometricas de altura a la cabeza, altura a la cruz, largo de cuerpo, perímetro toráxico (cm) respectivamente, desde el primer mes (marzo) hasta el destete (octubre) en llamas. La información corresponde a la primeras pariciones (Enero). Los factores que se han considerado son: Raza de llamas (Ch’acu y K’ara); Sexo ( Machos y Hembras). Y = PEVI = Peso vivo (kg), X1 = A_CAB = altura a la cabeza (cm), X2 = A_CRUZ = Altura a la cruz (cm), X3 = LCUERP = Largo del cuerpo (cm), X4 = PTOR = Perímetro toráxico (cm). Raza Sexo Repet. 1 2 3 4 1ra_Par_Mar

5 6 7 8 9 10 11 12 13 14 15

Raza Sexo Repet. 1 2 3 4 1ra_Par_Oct

5 6 7 8 9 10 11 12 13 14 15

Y

Ch'acu Machos X1 X2 X3 X4 Y

14.0 17.5 17.0 15.5 19.5 22.0 16.5 14.5 15.0 14.5 19.0 12.0 12.0 18.5 17.5

95.0 107.0 106.5 104.0 109.0 112.0 106.5 96.0 107.0 96.5 107.5 98.0 97.0 106.0 112.5

Y

Ch'acu Machos X1 X2 X3 X4 Y

30.0 27.0 38.0 38.0 40.0 48.5 32.0 32.0 42.0 31.0 32.5 26.0 25.0 33.0 30.5

114.5 123.5 130.0 128.0 129.0 133.5 128.5 121.5 127.0 127.0 121.5 111.0 116.5 121.0 127.0

57.5 69.0 68.5 68.0 72.0 71.5 68.5 62.5 67.0 63.0 65.0 65.0 60.0 63.5 64.0

71.5 70.0 82.0 81.5 83.0 84.5 82.0 76.5 76.0 73.0 79.0 74.0 74.5 80.5 78.5

43.5 54.0 52.0 52.0 53.5 54.0 56.0 52.0 52.5 49.5 56.0 49.0 51.0 54.0 52.5

65.0 66.0 72.0 68.0 71.0 78.5 70.0 68.0 69.0 68.5 70.0 66.0 62.5 68.0 63.5

57.0 58.0 61.0 57.0 60.0 64.0 56.0 54.0 58.0 53.0 60.0 56.0 57.0 67.0 57.0

78.0 86.0 95.0 84.0 87.0 89.0 87.0 77.5 83.0 84.0 82.5 79.0 76.5 82.0 78.0

13.0 16.0 16.0 17.5 20.0 12.5 12.5 19.0 19.5 22.5 24.5 20.0 18.5 16.5 20.0

31.0 31.0 35.5 38.0 41.0 26.0 42.5 33.0 42.0 34.0 47.5 33.0 36.0 30.5 27.5

Hembras X1 X2 X3 X4 99.5 105.0 103.0 99.0 112.5 95.5 101.5 107.5 107.0 110.5 116.0 108.0 105.0 107.5 105.0

62.5 68.0 64.0 64.5 72.0 65.0 61.0 70.0 68.5 69.0 76.0 69.0 68.0 69.5 69.0

21.0 15.0 22.0 10.5 20.5 19.5 18.5 18.5 19.0 21.0 19.0 18.0 18.5 20.5 16.5

107.0 101.5 106.5 98.0 114.0 103.0 106.0 106.5 111.0 113.0 112.5 107.5 111.0 113.5 98.5

Hembras X1 X2 X3 X4

Y

K'ara Machos X1 X2 X3 X4 Y

120.5 124.0 119.5 123.5 133.0 117.0 133.5 126.0 135.0 129.5 131.5 122.0 132.0 122.5 124.0

44.0 30.5 49.0 22.0 47.0 38.5 38.0 38.0 39.0 35.0 40.5 43.5 40.5 47.5 33.0

69.5 80.0 77.0 76.5 87.0 73.0 81.0 76.5 83.5 80.5 87.5 76.5 81.5 81.0 78.0

49.0 51.5 52.0 57.0 57.5 46.0 55.0 55.0 54.5 56.0 59.0 56.0 59.0 50.0 52.0

64.0 65.5 72.5 70.5 77.0 61.5 78.0 72.0 78.0 71.5 80.0 70.0 69.0 68.0 65.0

56.0 62.0 62.0 59.0 67.0 53.0 60.0 61.0 60.0 62.0 66.0 57.0 57.0 55.0 58.0

Y

K'ara Machos X1 X2 X3 X4 Y

80.0 92.0 84.0 82.0 96.0 91.0 91.0 82.0 94.0 81.0 96.0 82.0 86.5 82.0 80.0

138.5 123.5 130.5 114.0 144.0 123.5 132.0 133.0 138.5 134.0 137.0 134.5 129.5 136.5 133.5

66.5 74.0 69.5 59.0 74.0 65.5 67.5 69.0 71.0 75.5 76.0 70.0 71.0 76.5 57.5

87.0 79.5 84.0 71.0 92.0 84.5 85.5 82.0 86.5 89.0 86.5 86.5 83.5 88.0 82.0

52.5 54.5 52.0 46.0 59.0 55.5 54.0 54.0 57.0 51.5 55.0 58.0 52.5 53.0 53.5

76.5 71.0 77.0 61.0 92.0 70.0 75.0 73.0 75.5 71.5 77.0 80.5 74.0 73.0 75.0

62.0 56.0 52.0 56.0 59.0 57.0 59.0 62.0 59.0 61.0 59.5 59.0 58.0 60.0 56.0

100.0 72.0 91.0 84.0 91.0 94.0 93.0 93.0 93.0 95.0 93.5 89.0 93.0 91.0 88.0

Hembras X1 X2 X3 X4

19.0 17.5 15.0 16.0 17.5 16.0 20.0 13.5 19.0 16.0 17.0 23.5 15.0 18.0 15.5

40.0 37.0 28.5 36.0 35.5 35.5 42.5 33.5 40.5 35.5 38.0 49.0 29.5 37.0 38.5

111.0 110.5 106.0 112.5 108.0 108.5 110.0 101.5 109.0 109.5 109.0 113.0 107.5 109.5 92.0

71.5 70.0 64.0 66.5 67.5 65.5 72.5 65.0 67.5 71.5 68.0 72.0 69.5 69.5 65.0

56.0 56.0 51.0 52.5 56.0 45.0 57.0 53.0 55.0 54.0 54.0 63.0 51.0 52.0 51.0

61.0 63.0 59.0 62.0 61.0 59.0 62.0 58.0 53.0 59.0 62.0 63.0 50.0 63.0 56.0

Hembras X1 X2 X3 X4 134.5 127.5 123.0 126.5 122.5 124.0 136.5 128.5 132.5 130.0 129.5 133.0 119.0 130.5 129.0

82.0 77.0 74.0 79.0 79.0 80.5 86.0 78.5 84.5 83.0 81.5 87.0 78.5 82.5 82.5

69.0 72.0 68.0 72.0 70.5 70.0 77.0 68.0 74.5 72.0 73.0 79.5 64.0 72.0 73.0

90.0 89.0 85.0 84.0 76.0 90.0 94.0 81.0 89.0 87.0 88.0 96.0 74.0 91.0 94.0

Análisis y Diseño de Experimentos - 427 Raza Sexo Repet. 1 2 3 4 Ul_Par_Mar

5 6 7 8 9 10 11 12 13 14 15

Raza Sexo Repet. 1 2 3 4 Ult_Par_Oct

5 6 7 8 9 10 11 12 13 14 15

Y

Ch'acu Machos X1 X2 X3 X4 Y

17.0 19.0 17.5 18.5 13.5 15.5 14.0 19.0 14.5 15.5 18.0 16.0 16.0 20.0 18.0

100.5 102.5 106.0 101.0 101.0 97.0 97.0 105.0 103.5 103.5 107.0 105.5 107.5 115.5 112.0

62.5 66.0 69.5 68.0 63.0 64.0 61.5 70.0 66.0 62.5 66.0 72.0 65.0 74.0 72.0

48.0 51.0 54.0 50.0 51.5 51.0 49.0 52.0 52.0 52.0 50.0 51.5 51.0 61.5 59.0

Y

Machos X1 X2 X3

56.0 60.0 59.0 62.0 52.0 59.0 55.0 62.0 63.0 57.0 61.0 60.0 59.0 67.0 66.0

18.5 15.0 12.0 17.0 16.0 18.0 18.0 14.0 20.0 16.0 20.0 18.0 18.0 17.0 15.0

Hembras X1 X2 X3 X4 106.5 108.0 93.0 106.0 105.5 104.0 103.5 103.0 118.0 104.0 113.0 105.5 111.0 108.0 102.5

68.0 67.0 58.0 68.5 67.5 63.0 65.5 63.0 74.0 66.5 72.5 68.5 69.0 67.5 62.5

55.5 50.5 45.0 50.5 53.0 52.0 52.0 51.0 58.0 51.5 60.0 57.0 55.5 53.0 49.0

61.0 59.0 57.0 55.0 59.0 60.0 65.0 59.0 71.0 59.0 70.0 58.0 61.0 61.0 59.0

Y

K'ara Machos X1 X2 X3 X4 Y

15.0 14.5 17.5 18.0 19.0 16.0 23.0 16.0 21.0 17.0 18.0 20.0 18.0 16.0 14.0

101.0 99.5 106.0 106.0 107.0 103.5 111.0 104.0 115.0 114.5 111.5 109.5 114.5 109.5 104.0

66.0 62.0 69.0 67.0 68.0 67.5 74.0 65.0 74.0 74.5 73.0 67.0 76.5 70.0 66.0

49.0 51.0 54.0 52.0 53.5 55.5 61.0 51.5 57.5 60.0 59.0 60.0 57.0 57.5 49.0

X4

Y

Machos X1 X2 X3

94.0 83.0 75.0 85.0 93.0 87.0 86.0 79.0 91.5 80.0 87.0 86.0 87.0 85.0 73.0

34.0 34.0 37.0 38.0 31.0 37.0 45.5 30.0 36.0 40.5 39.0 37.5 42.0 34.0 28.5

Ch'acu

34.5 42.5 39.0 35.5 30.0 35.5 35.0 41.0 35.5 31.0 36.0 40.5 37.0 40.5 34.0

126.0 135.5 135.5 128.5 123.0 125.0 118.5 132.0 122.0 130.5 122.5 129.5 128.0 136.0 128.0

80.0 81.0 87.0 83.0 77.5 80.5 77.0 84.5 76.0 77.0 78.0 84.5 80.5 83.0 83.0

69.0 71.0 74.0 78.0 66.0 67.5 70.0 75.0 70.0 66.5 69.5 76.0 70.5 75.0 70.0

X4

Y

84.0 93.0 90.0 95.0 79.0 82.0 88.0 71.0 87.0 87.0 86.0 90.0 91.0 90.0 90.0

43.5 33.5 23.0 34.0 39.0 26.5 38.5 26.0 44.5 27.5 39.0 29.0 36.0 32.5 24.5

58.0 54.0 60.0 56.0 64.0 62.0 66.0 60.0 67.0 66.0 66.0 74.0 65.0 56.0 50.0

18.5 14.0 18.5 16.5 18.0 20.5 12.5 19.0 19.0 17.0 21.0 17.0 19.0 15.0 18.5

Hembras X1 X2 X3 X4 109.5 106.0 110.0 106.5 111.0 108.0 106.0 118.0 105.0 120.5 114.0 109.5 117.5 112.5 113.0

66.0 66.5 67.5 66.0 71.0 71.0 65.0 76.5 68.0 79.5 75.5 67.5 78.5 74.5 72.5

54.0 55.0 58.0 54.0 55.5 59.0 51.5 61.0 58.0 58.0 55.5 60.5 62.0 57.0 59.0

57.0 66.0 59.0 60.0 59.0 66.0 51.0 69.0 68.0 71.0 65.0 67.0 65.0 69.0 67.0

K'ara Hembras X1 X2 X3 132.0 121.5 116.0 126.5 130.5 117.5 123.0 115.5 136.0 118.0 134.0 122.0 128.5 128.5 113.0

83.0 77.0 73.0 78.0 84.0 71.5 76.0 72.5 85.5 71.0 79.0 78.0 82.5 77.0 75.5

76.5 68.0 60.5 70.0 74.0 65.5 74.5 63.0 74.5 67.5 75.5 67.5 71.0 72.0 62.0

127.5 122.5 129.5 131.5 123.0 129.5 137.0 124.0 134.0 135.0 128.0 131.0 136.0 127.0 119.5

80.5 83.0 83.5 81.0 78.0 82.0 91.0 71.5 85.5 85.5 83.0 81.5 85.0 80.5 77.0

68.5 69.0 72.0 68.0 68.0 71.5 79.5 62.0 74.0 71.0 73.0 69.0 73.0 74.0 63.0

Hembras X2 X3

X4

Y

X1

92.0 87.0 93.0 83.0 89.0 85.5 100.0 78.0 91.0 90.5 95.0 87.0 85.0 85.0 82.0

42.0 34.0 38.0 44.0 38.0 44.0 30.5 39.5 36.0 41.5 31.0 32.5 33.5 38.0 24.5

135.0 134.5 137.0 136.0 132.0 136.0 127.0 135.5 124.0 140.0 123.5 126.5 133.0 129.0 124.0

84.5 85.0 87.0 82.0 88.0 85.0 78.5 88.0 77.5 87.5 80.0 75.0 82.5 83.0 82.5

78.0 79.0 74.0 78.0 76.0 74.0 68.0 73.0 73.0 74.5 68.5 70.0 74.5 71.0 68.0

X4 92.0 100.0 90.0 92.0 85.0 96.0 82.0 94.0 86.0 91.5 83.0 87.5 87.0 91.0 80.0

2. El presete trabajo de investigación se realizó en el Centro Experimental Quimsachata de la Estación Experimental ILLPA - INIA Puno, ubicado en el distrito de Santa Rosa, Provincia de Lampa, Dpto. de Puno. El objetivo fue determinar las medidas biometricas de altura a la cabeza, altura a la cruz, largo de cuerpo, perímetro toráxico (cm) respectivamente, desde el primer mes (marzo) hasta el destete (octubre) en llamas. La información corresponde a la primeras pariciones (Enero). Los factores que se han considerado son: Epocas de pariciones (Primeras y últimas), Raza de llamas (Ch’acu y K’ara); Sexo ( Machos y Hembras). Y = PEVI = Peso vivo (kg), X1 = A_CAB = altura a la cabeza (cm), X2 = A_CRUZ = Altura a la cruz (cm), X3 = LCUERP = Largo del cuerpo (cm), X4 = PTOR = Perímetro toráxico (cm). Calcule el ANCOVA.

Raza Sexo Repet. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Pariciones

Repet. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Sexo

Raza

Pariciones

Y 30.0 27.0 38.0 38.0 40.0 48.5 32.0 32.0 42.0 31.0 32.5 26.0 25.0 33.0 30.5

Y 14.0 17.5 17.0 15.5 19.5 22.0 16.5 14.5 15.0 14.5 19.0 12.0 12.0 18.5 17.5

X2 57.5 69.0 68.5 68.0 72.0 71.5 68.5 62.5 67.0 63.0 65.0 65.0 60.0 63.5 64.0

Machos X1 X2 114.5 71.5 123.5 70.0 130.0 82.0 128.0 81.5 129.0 83.0 133.5 84.5 128.5 82.0 121.5 76.5 127.0 76.0 127.0 73.0 121.5 79.0 111.0 74.0 116.5 74.5 121.0 80.5 127.0 78.5

X1 95.0 107.0 106.5 104.0 109.0 112.0 106.5 96.0 107.0 96.5 107.5 98.0 97.0 106.0 112.5

Machos

X3 65.0 66.0 72.0 68.0 71.0 78.5 70.0 68.0 69.0 68.5 70.0 66.0 62.5 68.0 63.5

X3 43.5 54.0 52.0 52.0 53.5 54.0 56.0 52.0 52.5 49.5 56.0 49.0 51.0 54.0 52.5

Y 13.0 16.0 16.0 17.5 20.0 12.5 12.5 19.0 19.5 22.5 24.5 20.0 18.5 16.5 20.0

X4 78.0 86.0 95.0 84.0 87.0 89.0 87.0 77.5 83.0 84.0 82.5 79.0 76.5 82.0 78.0

Y 31.0 31.0 35.5 38.0 41.0 26.0 42.5 33.0 42.0 34.0 47.5 33.0 36.0 30.5 27.5

Ch'acu

X4 57.0 58.0 61.0 57.0 60.0 64.0 56.0 54.0 58.0 53.0 60.0 56.0 57.0 67.0 57.0

Ch'acu

X2 62.5 68.0 64.0 64.5 72.0 65.0 61.0 70.0 68.5 69.0 76.0 69.0 68.0 69.5 69.0

Hembras X1 X2 120.5 69.5 124.0 80.0 119.5 77.0 123.5 76.5 133.0 87.0 117.0 73.0 133.5 81.0 126.0 76.5 135.0 83.5 129.5 80.5 131.5 87.5 122.0 76.5 132.0 81.5 122.5 81.0 124.0 78.0

X1 99.5 105.0 103.0 99.0 112.5 95.5 101.5 107.5 107.0 110.5 116.0 108.0 105.0 107.5 105.0

Hembras

X4 56.0 62.0 62.0 59.0 67.0 53.0 60.0 61.0 60.0 62.0 66.0 57.0 57.0 55.0 58.0

Y 21.0 15.0 22.0 10.5 20.5 19.5 18.5 18.5 19.0 21.0 19.0 18.0 18.5 20.5 16.5

X3 64.0 65.5 72.5 70.5 77.0 61.5 78.0 72.0 78.0 71.5 80.0 70.0 69.0 68.0 65.0

X4 80.0 92.0 84.0 82.0 96.0 91.0 91.0 82.0 94.0 81.0 96.0 82.0 86.5 82.0 80.0

Y 44.0 30.5 49.0 22.0 47.0 38.5 38.0 38.0 39.0 35.0 40.5 43.5 40.5 47.5 33.0

Machos X1 X2 138.5 87.0 123.5 79.5 130.5 84.0 114.0 71.0 144.0 92.0 123.5 84.5 132.0 85.5 133.0 82.0 138.5 86.5 134.0 89.0 137.0 86.5 134.5 86.5 129.5 83.5 136.5 88.0 133.5 82.0

X2 66.5 74.0 69.5 59.0 74.0 65.5 67.5 69.0 71.0 75.5 76.0 70.0 71.0 76.5 57.5

Machos X1 107.0 101.5 106.5 98.0 114.0 103.0 106.0 106.5 111.0 113.0 112.5 107.5 111.0 113.5 98.5

Primeras Pariciones

X3 49.0 51.5 52.0 57.0 57.5 46.0 55.0 55.0 54.5 56.0 59.0 56.0 59.0 50.0 52.0

Primeras Pariciones

X3 76.5 71.0 77.0 61.0 92.0 70.0 75.0 73.0 75.5 71.5 77.0 80.5 74.0 73.0 75.0

X3 52.5 54.5 52.0 46.0 59.0 55.5 54.0 54.0 57.0 51.5 55.0 58.0 52.5 53.0 53.5

Y 19.0 17.5 15.0 16.0 17.5 16.0 20.0 13.5 19.0 16.0 17.0 23.5 15.0 18.0 15.5

X4 100 72.0 91.0 84.0 91.0 94.0 93.0 93.0 93.0 95.0 93.5 89.0 93.0 91.0 88.0

Y 40.0 37.0 28.5 36.0 35.5 35.5 42.5 33.5 40.5 35.5 38.0 49.0 29.5 37.0 38.5

K'ara

X4 62.0 56.0 52.0 56.0 59.0 57.0 59.0 62.0 59.0 61.0 59.5 59.0 58.0 60.0 56.0

K'ara

X2 71.5 70.0 64.0 66.5 67.5 65.5 72.5 65.0 67.5 71.5 68.0 72.0 69.5 69.5 65.0

Hembras X1 X2 134.5 82.0 127.5 77.0 123.0 74.0 126.5 79.0 122.5 79.0 124.0 80.5 136.5 86.0 128.5 78.5 132.5 84.5 130.0 83.0 129.5 81.5 133.0 87.0 119.0 78.5 130.5 82.5 129.0 82.5

X1 111.0 110.5 106.0 112.5 108.0 108.5 110.0 101.5 109.0 109.5 109.0 113.0 107.5 109.5 92.0

Hembras

X3 69.0 72.0 68.0 72.0 70.5 70.0 77.0 68.0 74.5 72.0 73.0 79.5 64.0 72.0 73.0

X3 56.0 56.0 51.0 52.5 56.0 45.0 57.0 53.0 55.0 54.0 54.0 63.0 51.0 52.0 51.0

X4 90.0 89.0 85.0 84.0 76.0 90.0 94.0 81.0 89.0 87.0 88.0 96.0 74.0 91.0 94.0

X4 61.0 63.0 59.0 62.0 61.0 59.0 62.0 58.0 53.0 59.0 62.0 63.0 50.0 63.0 56.0

Y 34.5 42.5 39.0 35.5 30.0 35.5 35.0 41.0 35.5 31.0 36.0 40.5 37.0 40.5 34.0

Y 17.0 19.0 17.5 18.5 13.5 15.5 14.0 19.0 14.5 15.5 18.0 16.0 16.0 20.0 18.0

X2 62.5 66.0 69.5 68.0 63.0 64.0 61.5 70.0 66.0 62.5 66.0 72.0 65.0 74.0 72.0

Machos X1 X2 126.0 80.0 135.5 81.0 135.5 87.0 128.5 83.0 123.0 77.5 125.0 80.5 118.5 77.0 132.0 84.5 122.0 76.0 130.5 77.0 122.5 78.0 129.5 84.5 128.0 80.5 136.0 83.0 128.0 83.0

X1 100.5 102.5 106.0 101.0 101.0 97.0 97.0 105.0 103.5 103.5 107.0 105.5 107.5 115.5 112.0

Machos

X3 69.0 71.0 74.0 78.0 66.0 67.5 70.0 75.0 70.0 66.5 69.5 76.0 70.5 75.0 70.0

X3 48.0 51.0 54.0 50.0 51.5 51.0 49.0 52.0 52.0 52.0 50.0 51.5 51.0 61.5 59.0

Y 18.5 15.0 12.0 17.0 16.0 18.0 18.0 14.0 20.0 16.0 20.0 18.0 18.0 17.0 15.0

X4 84.0 93.0 90.0 95.0 79.0 82.0 88.0 71.0 87.0 87.0 86.0 90.0 91.0 90.0 90.0

Y 43.5 33.5 23.0 34.0 39.0 26.5 38.5 26.0 44.5 27.5 39.0 29.0 36.0 32.5 24.5

Ch'acu

X4 56.0 60.0 59.0 62.0 52.0 59.0 55.0 62.0 63.0 57.0 61.0 60.0 59.0 67.0 66.0

Ch'acu

Hem X1 X 132.0 8 121.5 7 116.0 7 126.5 7 130.5 8 117.5 7 123.0 7 115.5 7 136.0 8 118.0 7 134.0 7 122.0 7 128.5 8 128.5 7 113.0 7

X 6 6 5 6 6 6 6 6 7 6 7 6 6 6 6

Hem X1 106.5 108.0 93.0 106.0 105.5 104.0 103.5 103.0 118.0 104.0 113.0 105.5 111.0 108.0 102.5

- 428 V. Ibañez Q. - Docente FINESI - UNA - Puno

Análisis y Diseño de Experimentos - 429 -

Bibliografía consultada AYALA, J. y PARDO, R. (1995). “Optimización por diseños experimentales: con aplicaciones en ingeniería”. Primera Edición. Edit. A & B S.A. CONCYTEC. Lima - Perú. BALLUERKA, N. y Vergara, A. (2002). “Diseños de Investigación Experimental en Psicología”. 1ra. Edición. Edit. Prentice-Hall. Madrid – España BECKER, W.A. (1986). "Manual de genética cuantitativa". Academic enterprises. Pullman Washington U.S.A. BOWERMAN, B.L., O’CONNELL,R.T. y KOEHLER,A. (2007). "Pronósticos, Series de tiempo y Regresión: un enfoque aplicado". Cuarta Edición. CENGAGE Learning. México. CALZADA, B.J. (1970). "Métodos Estadísticos para la investigación". Edit. Jurídica. Lima Perú. COCHRAN, W.G. (1978). "Métodos Estadísticos". Primera Edición. Editorial Continental S.A. de C.V. México. COCHRAN, W. G. y COX, G. M. (1978). Diseños experimentales. Editorial Trillas. S.A. México. DRAPER, N. and H. SMITH (1969). "Applied regression analysis". 2nd. Ed. New York: McGraw-Hill Book Company. FALCONER, D.S. (1983). "Introducción a la genética cuantitativa". Tercera edición. Impresión en Español. Edit. CECSA. México. GARCIA, R.M. (2004). "Inferencia Estadística y diseño de Experimentos". Primera Edición. Edit. Universitaria de Buenos Aires - Argentina. GUTIERREZ, H. y DE LA VARA, S. (2004). “Análisis y Diseño de Experimentos”. Primera Edición. Edit. McGraw-Hill.

- 430 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

HENDERSON, C.R. (1952). "Estimation of variance and covariance components". Presented at North Carolina Staties. Conference. Cornell University. HERRERA, H.J.G. (1985). "Introducción al Mejoramiento Genético Animal". Colegio de Postgraduados Centro de Ganadería. Chapingo - México. IBAÑEZ, Q.V. (1996). "Estimación de Indices de Herencia en Rumiantes". Primera Edición. Editorial Universitaria. UNA-Puno. IBAÑEZ, Q.V. (1998). "Modelos Lineales". Primera Edición. Facultad de Ingeniería Estadística e Informática UNA - Puno. IBAÑEZ, V. (2003). “Diseños Estadísticos con el SAS”. Primera Edición. Maestría Ganadería Andina. UNA – Puno. IBAÑEZ, V. (2004). “Estadística Inferencial Aplicada a la Ganadería“. Primera Edición. Maestría Ganadería Andina. UNA – Puno. IBAÑEZ, V. (2005). “Bioestadística“. Primera Edición. Edit. Universitaria. UNA Puno. IBAÑEZ, V. (2005). “Estadística No Paramétrica“. Primera Edición. Edit. Universitaria. UNA - FMVZ - Puno. IBAÑEZ, V. (2006). “Estadística Inferencial Aplicada a la Salud“. Primera Edición Edit. Universitaria. UNA - Puno. IBAÑEZ, V., y ZEA, F.W. (2006). “Aplicaciones con el Sistema de Análisis Estadístico SAS“. Universidad Nacional Micaela Bastidas de Apurimac. SegundaEdición. Edit. Abancay-Apurimac. IBAÑEZ, V. (2007). “Estadística Inferencial Aplicada a la Educación“. Primera Edición Edit. Universitaria. UNA - Puno. IBAÑEZ, V. (2008). “Guía de prácticas de Métodos Estadísticos para la Investigación“. Primera Edición Edit. Universitaria. Facultad de Ciencias Agrarias. UNA Puno.

Análisis y Diseño de Experimentos - 431 KUEHL, R.O. (2001). “Diseño de experimentos: Principios estadísticos de diseño y análisis de investigación”. Segunda Edición. Editorial Thomson y Learning. LITTLE, T.M. y HILLS, F.J. (1985). "Métodos Estadísticos para la Investigación en la Agricultura". Editorial TRILLAS S.A. de C.V. México. LOPEZ, E.A. (2008). "Diseño y Análisis de Experimentos: Fundamentos y aplicaciones en agronomía". Primera Edición. Edit. Facultad de Agronomía. Guatemala. MANZANEDA, J. (2000). “Diseño Experimental. Estadística Aplicada”. MARTINEZ, G.A. (1988). "Diseños Experimentales. Métodos y elementos de teoría". Primera Edición. Editorial TRILLAS S.A. de C.V. México. MONTGOMERY, D.C. (2002). «Diseño y Análisis de Experimentos». 2da. Edición. Edit. Limusa Wiley, México. NETER, J. y WASSERMAN, W. (1977). "Applied Linear Statistical Models: Regression, Analysis of Variance, and Experimental Designs". Octava Edición. Editorial Irwin-Dorsey Limited. USA. OSTLE, B. (1981). " Estadística Aplicada". Primera Edición. Editorial LIMUSA México. PEREZ-TEJADA, H.E. (2000). Estadística para las ciencias sociales y del comportamiento. 2da. Edic. Edit. Oxford University Press México, S.A. de C.V.

REYES, C.P. (1985). "Diseño de Experimentos Aplicados". Primera Edición. Editorial TRILLAS S.A. de C.V. México. Tercera Reimpresión. RODRIGUEZ DEL ANGEL, J.M. (1991). "Métodos de Investigación PECUARIA". Primera Edición. Editorial TRILLAS S.A. de C.V. México. SAS/STAT (2002). "User's Guide". SAS Institute Inc., Cary, NC., USA. Versión 9.12. Fourth Edition. Volume 2. SIEGEL, S. y CASTELLAN, N.J. (1995). Estadística No Paramétrica. 2da. Edic. Edit. Trillas, México.

- 432 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

STEEL, G.D.R. y TORRIE, H.J. (1996). "Bioestadística principios y procedimientos". Segunda Edición. Editorial McGraw-Hill/Interamericana de México, S.A. de C.V. SUSAN, M.J. (1994). "Estadística para Biología y de la Salud". Segunda Edición. Editorial Interamericana McGraw-Hill. España. TINEO, A.L. (2001). “Manual para el Análisis de Diseños Experimentales de Superficie de Respuesta”. 1ra. Edic. Edit. VRAC-OSA. UNSCH. Ayacucho, Perú. VASQUEZ, A.V. (1990). "Experimentación Agrícola". Primera Edición. Editorial AMARU Editores S.a. Lima - Perú. VENTURA, E.R. y ZAVALA, Z.A. (1994). "Métodos Estadísticos Básicos en la Investigación". Dpto. Académico de Estadística e Informática. UNA La Molina. Lima - Perú. WAYNE, D. (2002). Bioestadística: Bases para el análisis de las ciencias de la salud. 4ta. Edic. Edit. UTEHA-México. WINER, B. J. (1962) Statistical Principles in Experimental Design. McGraw-Hill Book Company, Inc. 672 p. ZEA, F.W. (1995). "Estadística y Diseños Experimentales". Primera Edición. Facultad de Ciencias Agrairias - UNA - Puno. ZEA, F.W. e IBAÑEZ, Q.V. (1996). "I Curso de Sistema de Análisis Estadístico SAS para la Investigación Experimental". Universidad Nacional Jorge Basadre Grohomann Tacna. Facultad de Ciencias Agrícolas. ZEA, F.W. e IBAÑEZ, V. (2003). "Tablas Estadísticas". Segunda Edición. Edit. Universitaria. Fac. Ciencias Agrarias - Puno - Perú.

Análisis y Diseño de Experimentos - 433 -

Tablas Estadísticas

- 434 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

Análisis y Diseño de Experimentos - 435 -

0.25 gl

0.50 1 1.0005 2 0.816 3 0.765 4 0.741 5 0.727

TABLA A: Valores críticos de t Nivel de significación para una prueba unilateral 0.20 0.15 0.10 0.05 0.025 0.01 0.005 0.0005 Nivel de significación para una prueba bilate ral 0.40 0.30 0.20 0.10 0.05 0.02 0.01 0.001 1.376 1.963 3.078 6.314 12.706 31.821 63.657 636.619 1.061 1.386 1.836 2.920 4.303 6.965 9.925 31.598 0.978 1.250 1.638 2.353 3.182 4.541 5.841 12.941 0.941 1.190 1.533 2.132 2.776 3.747 4.604 8.610 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.859

6 7 8 9 10

0.718 0.711 0.706 0.703 0.700

0.906 0.896 0.889 0.883 0.879

1.134 1.119 1.108 1.100 1.093

1.440 1.415 1.397 1.383 1.372

1.943 1.895 1.860 1.833 1.812

2.447 2.365 2.306 2.262 2.228

3.143 2.998 2.896 2.821 2.764

3.707 3.499 3.355 3.250 3.169

5.959 5.405 5.041 4.781 4.587

11 12 13 14 15

0.697 0.695 0.694 0.692 0.691

0.876 0.873 0.870 0.868 0.866

1.088 1.083 1.079 1.076 1.074

1.363 1.356 1.350 1.345 1.341

1.796 1.782 1.771 1.761 1.753

2.201 2.179 2.160 2.145 2.131

2.718 2.681 2.650 2.624 2.602

3.106 3.055 3.012 2.977 2.947

4.437 4.318 4.221 4.140 4.073

16 17 18 19 20

0.690 0.689 0.688 0.688 0.687

0.866 0.863 0.862 0.861 0.860

1.071 1.069 1.067 1.066 1.064

1.337 1.333 1.330 1.328 1.325

1.746 1.740 1.734 1.729 1.725

2.120 2.110 2.101 2.093 2.086

2.584 2.567 2.552 2.540 2.528

2.921 2.898 2.878 2.861 2.845

4.015 3.965 3.922 3.883 3.850

21 22 23 24 25

0.686 0.686 0.685 0.685 0.684

0.859 0.858 0.858 0.000 0.856

1.063 1.061 1.060 1.059 1.058

1.323 1.321 1.319 1.318 1.316

1.721 1.717 1.714 1.711 1.708

2.080 2.074 2.069 2.064 2.060

2.518 2.508 2.500 2.492 2.485

2.831 2.819 2.807 2.797 2.787

3.819 3.792 3.767 3.745 3.725

26 27 28 29 30

0.684 0.684 0.683 0.683 0.683

0.856 0.855 0.855 0.854 0.854

1.058 1.057 1.056 1.055 1.055

1.315 1.314 1.313 1.311 1.310

1.706 1.703 1.701 1.699 1.697

2.056 2.052 2.048 2.045 2.042

0.000 2.473 2.467 2.460 2.457

2.779 2.771 2.763 2.756 2.750

3.707 3.690 3.674 3.659 3.646

35 40 45 50 55

0.682 0.681 0.680 0.680 0.679

0.853 0.851 0.850 0.849 0.849

1.052 1.050 1.048 1.047 1.047

1.306 1.303 1.301 1.299 1.297

1.690 1.684 1.680 1.676 1.673

2.030 2.021 2.014 2.008 2.004

2.438 2.423 2.412 2.403 2.396

2.724 2.704 2.690 2.678 2.669

3.591 3.551 3.520 3.496 3.476

60 70 80

0.679 0.678 0.678

0.848 0.847 0.847

1.046 1.045 1.044

1.296 1.294 1.293

1.671 1.667 1.665

2.000 1.994 1.990

2.390 2.381 2.374

2.600 2.648 2.638

3.460 3.435 3.416

- 436 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

1 1 162 2 18.50 3 10.10 4 7.71 5 6.61 6 5.99 7 5.59 8 5.32 9 5.12 10 4.96

2 200 19.00 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10

TABLAB1: DISTRIBUCIONF, Nivel de significacióndel 5% Grados de libertadparael numerador 3 4 5 6 7 8 9 10 11 12 13 216 225 230 234 237 239 241 242 243 244 245 19.20 19.20 19.30 19.30 19.40 19.40 19.40 19.40 19.40 19.40 19.40 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89

11 12 13 14 15

4.84 4.75 4.67 4.60 4.54

3.98 3.89 3.81 3.74 3.68

3.59 3.49 3.41 3.34 3.29

3.36 3.26 3.18 3.11 3.06

3.20 3.11 3.03 2.96 2.90

3.09 3.00 2.92 2.85 2.79

3.01 2.91 2.83 2.76 2.71

2.95 2.85 2.77 2.70 2.64

2.90 2.80 2.71 2.65 2.59

2.85 2.75 2.67 2.60 2.54

2.82 2.72 2.63 2.57 2.51

2.79 2.69 2.60 2.53 2.48

2.76 2.66 2.58 2.51 2.45

2.74 2.64 2.55 2.48 2.42

2.72 2.62 2.53 2.46 2.40

16 17 18 19 20

4.49 4.45 4.41 4.38 4.35

3.63 3.59 3.55 3.52 3.49

3.24 3.20 3.16 3.13 3.10

3.01 2.96 2.93 2.90 2.87

2.85 2.81 2.77 2.74 2.71

2.74 2.70 2.66 2.63 2.60

2.66 2.61 2.58 2.54 2.51

2.59 2.55 2.51 2.48 2.45

2.54 2.49 2.46 2.42 2.39

2.49 2.45 2.41 2.38 2.35

2.46 2.41 2.37 2.34 2.31

2.42 2.38 2.34 2.31 2.28

2.40 2.35 2.31 2.28 2.25

2.37 2.33 2.29 2.26 2.22

2.35 2.31 2.27 2.23 2.20

21 22 23 24 25

4.32 4.30 4.28 4.26 4.24

3.47 3.44 3.42 3.40 3.39

3.07 3.05 3.03 3.01 2.99

2.84 2.82 2.80 2.78 2.76

2.68 2.66 2.64 2.62 2.60

2.57 2.55 2.53 2.51 2.49

2.49 2.46 2.44 2.42 2.40

2.42 2.40 2.37 2.36 2.34

2.37 2.34 2.32 2.30 2.28

2.32 2.30 2.27 2.25 2.24

2.28 2.26 2.24 2.22 2.20

2.25 2.23 2.20 2.18 2.16

2.22 2.20 2.18 2.15 2.14

2.20 2.17 2.15 2.13 2.11

2.18 2.15 2.13 2.11 2.09

26 27 28 29 30

4.23 4.21 4.20 4.18 4.17

3.37 3.35 3.34 3.33 3.32

2.98 2.96 2.95 2.93 2.92

2.74 2.73 2.71 2.70 2.69

2.59 2.57 2.56 2.55 2.53

2.47 2.46 2.45 2.43 2.42

2.39 2.37 2.36 2.35 2.33

2.32 2.31 2.29 2.28 2.27

2.27 2.25 2.24 2.22 2.21

2.22 2.20 2.19 2.18 2.16

2.18 2.17 2.15 2.14 2.13

2.15 2.13 2.12 2.10 2.09

2.12 2.10 2.09 2.08 2.06

2.09 2.08 2.06 2.05 2.04

2.07 2.06 2.04 2.03 2.01

40 50 60 70

4.08 4.03 4.00 3.98

3.23 3.18 3.15 3.13

2.84 2.79 2.76 2.74

2.61 2.56 2.53 2.50

2.45 2.40 2.37 2.35

2.34 2.29 2.25 2.23

2.25 2.20 2.17 2.14

2.18 2.13 2.10 2.07

2.12 2.07 2.04 2.02

2.08 2.03 1.99 1.97

2.04 1.99 1.95 1.93

2.00 1.95 1.92 1.89

1.97 1.92 1.89 1.86

1.95 1.89 1.86 1.84

1.92 1.87 1.84 1.81

14 245 19.40 8.71 5.87 4.64 3.96 3.53 3.24 3.03 2.86

15 246 19.40 8.70 5.86 4.62 3.94 3.51 3.22 3.01 2.85

Análisis y Diseño de Experimentos - 437 -

16 1 246 2 19.40 3 8.69 4 5.84 5 4.60 6 3.92 7 3.49 8 3.20 9 2.99 10 2.83

17 247 19.40 8.68 5.83 4.59 3.91 3.48 3.19 2.97 2.81

TABLAB1: DISTRIBUCIONF, Nivel de significacióndel 5%(Cont.) Grados de libertadparael numerador 18 19 20 30 40 50 60 70 80 100 200 247 248 248 250 251 252 252 252 253 253 254 19.40 19.40 19.40 19.50 19.50 19.50 19.50 19.50 19.50 19.50 19.50 8.67 8.67 8.66 8.62 8.60 8.58 8.57 8.57 8.56 8.55 8.54 5.82 5.81 5.80 5.75 5.72 5.70 5.69 5.68 5.67 5.66 5.65 4.58 4.57 4.56 4.50 4.46 4.44 4.43 4.42 4.41 4.41 4.39 3.90 3.88 3.87 3.81 3.77 3.75 3.74 3.73 3.72 3.71 3.69 3.47 3.46 3.44 3.38 3.34 3.32 3.30 3.29 3.29 3.27 3.25 3.17 3.16 3.15 3.08 3.04 3.02 3.01 2.99 2.99 2.97 2.95 2.96 2.95 2.94 2.86 2.83 2.80 2.79 2.78 2.77 2.76 2.73 2.80 2.79 2.77 2.70 2.66 2.64 2.62 2.61 2.60 2.59 2.56

11 12 13 14 15

2.70 2.60 2.51 2.44 2.38

2.68 2.58 2.50 2.43 2.37

2.67 2.57 2.48 2.41 2.35

2.66 2.56 2.47 2.40 2.34

2.65 2.54 2.46 2.39 2.33

2.57 2.47 2.38 2.31 2.25

2.53 2.43 2.34 2.27 2.20

2.51 2.40 2.31 2.24 2.18

2.49 2.38 2.30 2.22 2.16

2.48 2.37 2.28 2.21 2.15

2.47 2.36 2.27 2.20 2.14

2.46 2.35 2.26 2.19 2.12

2.43 2.32 2.23 2.16 2.10

2.42 2.31 2.22 2.14 2.08

2.40 2.30 2.21 2.13 2.07

16 17 18 19 20

2.33 2.29 2.25 2.21 2.18

2.32 2.27 2.23 2.20 2.17

2.30 2.26 2.22 2.18 2.15

2.29 2.24 2.20 2.17 2.14

2.28 2.23 2.19 2.16 2.12

2.19 2.15 2.11 2.07 2.04

2.15 2.10 2.06 2.03 1.99

2.12 2.08 2.04 2.00 1.97

2.11 2.06 2.02 1.98 1.95

2.09 2.04 2.00 1.97 1.93

2.08 2.03 1.99 1.96 1.92

2.07 2.02 1.98 1.94 1.91

2.04 1.99 1.95 1.91 1.88

2.02 1.97 1.93 1.89 1.86

2.01 1.96 1.92 1.88 1.84

21 22 23 24 25

2.16 2.13 2.11 2.09 2.07

2.14 2.11 2.09 2.07 2.05

2.12 2.10 2.08 2.05 2.04

2.11 2.08 2.06 2.04 2.02

2.10 2.07 2.05 2.03 2.01

2.01 1.98 1.96 1.94 1.92

1.96 1.94 1.91 1.89 1.87

1.94 1.91 1.88 1.86 1.84

1.92 1.89 1.86 1.84 1.82

1.90 1.88 1.85 1.83 1.81

1.89 1.86 1.84 1.82 1.80

1.88 1.85 1.82 1.80 1.78

1.84 1.82 1.79 1.77 1.75

1.82 1.80 1.77 1.75 1.73

1.81 1.78 1.76 1.73 1.71

26 27 28 29 30

2.05 2.04 2.02 2.01 1.99

2.03 2.02 2.00 1.99 1.98

2.02 2.00 1.99 1.97 1.96

2.00 1.99 1.97 1.96 1.95

1.99 1.97 1.96 1.94 1.93

1.90 1.88 1.87 1.85 1.84

1.85 1.84 1.82 1.81 1.79

1.82 1.81 1.79 1.77 1.76

1.80 1.79 1.77 1.75 1.74

1.79 1.77 1.75 1.74 1.72

1.78 1.76 1.74 1.73 1.71

1.76 1.74 1.73 1.71 1.70

1.73 1.71 1.69 1.67 1.66

1.71 1.69 1.67 1.65 1.64

1.69 1.67 1.65 1.64 1.62

40 50 60 70

1.90 1.85 1.82 1.79

1.89 1.83 1.80 1.77

1.87 1.81 1.78 1.75

1.85 1.80 1.76 1.74

1.84 1.78 1.75 1.72

1.74 1.69 1.65 1.62

1.69 1.63 1.59 1.57

1.66 1.60 1.56 1.53

1.64 1.58 1.53 1.50

1.62 1.56 1.52 1.49

1.61 1.54 1.50 1.47

1.59 1.52 1.48 1.45

1.55 1.48 1.44 1.40

1.53 1.46 1.41 1.37

1.51 1.44 1.39 1.35

500 254 19.50 8.53 5.64 4.37 3.68 3.24 2.94 2.72 2.55

Inf 254 19.50 8.53 5.63 4.37 3.67 3.23 2.93 2.71 2.54

- 438 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

1 1 4052 2 98.50 3 34.10 4 21.20 5 16.30 6 13.70 7 12.20 8 11.30 9 10.60 10 10.00

2 4999 99.00 30.80 18.00 13.30 10.90 9.55 8.65 8.02 7.56

3 5403 99.20 29.40 16.70 12.10 9.78 8.45 7.59 6.99 6.55

TABLAC1: DISTRIBUCIONF, Nivel de significacióndel 1% Grados delibertadparaelnumerador 4 5 6 7 8 9 10 11 12 13 5625 5764 5859 5928 5981 6023 6056 6083 6106 6126 99.30 99.30 99.30 99.40 99.40 99.40 99.40 99.40 99.40 99.40 28.70 28.20 27.90 27.70 27.50 27.30 27.20 27.10 27.10 27.00 16.00 15.50 15.20 15.00 14.80 14.70 14.50 14.50 14.40 14.30 11.40 11.00 10.70 10.50 10.30 10.20 10.10 9.96 9.89 9.82 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.66 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.41 7.01 6.63 6.37 6.18 6.05 5.91 5.81 5.73 5.67 5.61 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.05 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.65

11 12 13 14 15

9.64 9.33 9.07 8.86 8.68

7.20 6.93 6.70 6.51 6.36

6.21 5.95 5.74 5.56 5.42

5.67 5.41 5.21 5.04 4.89

5.31 5.06 4.86 4.69 4.56

5.07 4.82 4.62 4.46 4.32

4.88 4.64 4.44 4.28 4.14

4.74 4.50 4.30 4.14 4.00

4.63 4.39 4.19 4.03 3.89

4.54 4.30 4.10 3.94 3.80

4.46 4.22 4.02 3.86 3.73

4.39 4.16 3.96 3.80 3.67

4.34 4.10 3.90 3.75 3.61

4.29 4.05 3.86 3.70 3.56

4.25 4.01 3.82 3.66 3.52

16 17 18 19 20

8.53 8.40 8.29 8.18 8.10

6.23 6.11 6.01 5.93 5.85

5.29 5.18 5.09 5.01 4.94

4.77 4.67 4.58 4.50 4.43

4.44 4.34 4.25 4.17 4.10

4.20 4.10 4.01 3.94 3.87

4.03 3.93 3.84 3.77 3.70

3.89 3.79 3.71 3.63 3.56

3.78 3.68 3.60 3.52 3.46

3.69 3.59 3.51 3.43 3.37

3.62 3.52 3.43 3.36 3.29

3.55 3.46 3.37 3.30 3.23

3.50 3.40 3.32 3.24 3.18

3.45 3.35 3.27 3.19 3.13

3.41 3.31 3.23 3.15 3.09

21 22 23 24 25

8.02 7.95 7.88 7.82 7.77

5.78 5.72 5.66 5.61 5.57

4.87 4.82 4.76 4.72 4.68

4.37 4.31 4.26 4.22 4.18

4.04 3.99 3.94 3.90 3.85

3.81 3.76 3.71 3.67 3.63

3.64 3.59 3.54 3.50 3.46

3.51 3.45 3.41 3.36 3.32

3.40 3.35 3.30 3.26 3.22

3.31 3.26 3.21 3.17 3.13

3.24 3.18 3.14 3.09 3.06

3.17 3.12 3.07 3.03 2.99

3.12 3.07 3.02 2.98 2.94

3.07 3.02 2.97 2.93 2.89

3.03 2.98 2.93 2.89 2.85

26 27 28 29 30

7.72 7.68 7.64 7.60 7.56

5.53 5.49 5.45 5.42 5.39

4.64 4.60 4.57 4.54 4.51

4.14 4.11 4.07 4.04 4.02

3.82 3.78 3.75 3.73 3.70

3.59 3.56 3.53 3.50 3.47

3.42 3.39 3.36 3.33 3.30

3.29 3.26 3.23 3.20 3.17

3.18 3.15 3.12 3.09 3.07

3.09 3.06 3.03 3.00 2.98

3.02 2.99 2.96 2.93 2.91

2.96 2.93 2.90 2.87 2.84

2.90 2.87 2.84 2.81 2.79

2.86 2.82 2.79 2.77 2.74

2.81 2.78 2.75 2.73 2.70

40 50 60 70 80

7.31 7.17 7.07 7.01 6.96

5.18 5.06 4.98 4.92 4.88

4.31 4.20 4.13 4.07 4.04

3.83 3.72 3.65 3.60 3.56

3.51 3.41 3.34 3.29 3.25

3.29 3.19 3.12 3.07 3.04

3.12 3.02 2.95 2.91 2.87

2.99 2.89 2.82 2.78 2.74

2.89 2.78 2.72 2.67 2.64

2.80 2.70 2.63 2.59 2.55

2.73 2.62 2.56 2.51 2.48

2.66 2.56 2.50 2.45 2.42

2.61 2.51 2.44 2.40 2.36

2.56 2.46 2.39 2.35 2.31

2.52 2.42 2.35 2.31 2.27

14 6143 99.40 26.90 14.20 9.77 7.60 6.36 5.56 5.01 4.60

15 6157 99.40 26.90 14.20 9.72 7.56 6.31 5.52 4.96 4.56

Análisis y Diseño de Experimentos - 439 -

16 1 6169 2 99.40 3 26.80 4 14.20 5 9.68 6 7.52 7 6.28 8 5.48 9 4.92 10 4.52

17 6182 99.40 26.80 14.10 9.64 7.48 6.24 5.44 4.89 4.49

TABLAC1: DISTRIBUCIONF, Nivel de significacióndel 1%(Cont.) Grados de libertadparael numerador 18 19 20 30 40 50 60 70 80 100 200 6192 6201 6209 6261 6287 6303 6313 6320 6326 6335 6350 99.40 99.40 99.50 99.50 99.50 99.50 99.50 99.50 99.50 99.50 99.50 26.80 26.70 26.70 26.50 26.40 26.40 26.30 26.30 26.30 26.20 26.20 14.10 14.00 14.00 13.80 13.70 13.70 13.70 13.60 13.60 13.60 13.50 9.61 9.58 9.55 9.38 9.29 9.24 9.20 9.18 9.16 9.13 9.08 7.45 7.42 7.40 7.23 7.14 7.09 7.06 7.03 7.01 6.99 6.93 6.21 6.18 6.16 5.99 5.91 5.86 5.82 5.80 5.78 5.75 5.70 5.41 5.38 5.36 5.20 5.12 5.07 5.03 5.01 4.99 4.96 4.91 4.86 4.83 4.81 4.65 4.57 4.52 4.48 4.46 4.44 4.41 4.36 4.46 4.43 4.41 4.25 4.17 4.12 4.08 4.06 4.04 4.01 3.96

11 12 13 14 15

4.21 3.97 3.78 3.62 3.49

4.18 3.94 3.74 3.59 3.45

4.15 3.91 3.72 3.56 3.42

4.12 3.88 3.69 3.53 3.40

4.10 3.86 3.66 3.51 3.37

3.94 3.70 3.51 3.35 3.21

3.86 3.62 3.42 3.27 3.13

3.81 3.57 3.37 3.22 3.08

3.77 3.54 3.34 3.18 3.05

3.75 3.51 3.32 3.16 3.02

3.73 3.49 3.30 3.14 3.00

3.70 3.47 3.27 3.11 2.98

3.65 3.41 3.22 3.06 2.92

3.62 3.38 3.19 3.03 2.89

3.60 3.36 3.17 3.00 2.87

16 17 18 19 20

3.37 3.27 3.19 3.12 3.05

3.34 3.24 3.16 3.08 3.02

3.31 3.21 3.13 3.05 2.99

3.28 3.19 3.10 3.03 2.96

3.26 3.16 3.08 3.00 2.94

3.10 3.00 2.92 2.84 2.78

3.02 2.92 2.84 2.76 2.69

2.97 2.87 2.78 2.71 2.64

2.93 2.83 2.75 2.67 2.61

2.91 2.81 2.72 2.65 2.58

2.89 2.79 2.70 2.63 2.56

2.86 2.76 2.68 2.60 2.54

2.81 2.71 2.62 2.55 2.48

2.78 2.68 2.59 2.51 2.44

2.75 2.65 2.57 2.49 2.42

21 22 23 24 25

2.99 2.94 2.89 2.85 2.81

2.96 2.91 2.86 2.82 2.78

2.93 2.88 2.83 2.79 2.75

2.90 2.85 2.80 2.76 2.72

2.88 2.83 2.78 2.74 2.70

2.72 2.67 2.62 2.58 2.54

2.64 2.58 2.54 2.49 2.45

2.58 2.53 2.48 2.44 2.40

2.55 2.50 2.45 2.40 2.36

2.52 2.47 2.42 2.38 2.34

2.50 2.45 2.40 2.36 2.32

2.48 2.42 2.37 2.33 2.29

2.42 2.36 2.32 2.27 2.23

2.38 2.33 2.28 2.24 2.19

2.36 2.31 2.26 2.21 2.17

26 27 28 29 30

2.78 2.75 2.72 2.69 2.66

2.75 2.71 2.68 2.66 2.63

2.72 2.68 2.65 2.63 2.60

2.69 2.66 2.63 2.60 2.57

2.66 2.63 2.60 2.57 2.55

2.50 2.47 2.44 2.41 2.39

2.42 2.38 2.35 2.33 2.30

2.36 2.33 2.30 2.27 2.25

2.33 2.29 2.26 2.23 2.21

2.30 2.27 2.24 2.21 2.18

2.28 2.25 2.22 2.19 2.16

2.25 2.22 2.19 2.16 2.13

2.19 2.16 2.13 2.10 2.07

2.16 2.12 2.09 2.06 2.03

2.13 2.10 2.06 2.03 2.01

40 50 60 70 80

2.48 2.38 2.31 2.27 2.23

2.45 2.35 2.28 2.23 2.20

2.42 2.32 2.25 2.20 2.17

2.39 2.29 2.22 2.18 2.14

2.37 2.27 2.20 2.15 2.12

2.20 2.10 2.03 1.98 1.94

2.11 2.01 1.94 1.89 1.85

2.06 1.95 1.88 1.83 1.79

2.02 1.91 1.84 1.78 1.75

1.99 1.88 1.81 1.75 1.71

1.97 1.86 1.78 1.73 1.69

1.94 1.82 1.75 1.70 1.65

1.87 1.76 1.68 1.62 1.58

1.83 1.71 1.63 1.57 1.53

1.80 1.68 1.60 1.54 1.49

500 6361 99.50 26.10 13.50 9.04 6.90 5.67 4.88 4.33 3.93

Inf 6366 99.50 26.10 13.50 9.02 6.88 5.65 4.86 4.31 3.91

- 440 -

V. Ibañez Q. - Docente FINESI - UNA - Puno

1 2 3 4 5

0.995 0.00 0.01 0.072 0.207 0.412

TABLAD: Distribucion de Chi-cuadrada Probabilidadde un valor más alto de chi-cuadrado 0.99 0.975 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.025 0.00 0.00 0.00 0.016 0.102 0.455 1.32 2.71 3.84 5.02 0.02 0.051 0.103 0.211 0.575 1.39 2.77 4.61 5.99 7.38 0.115 0.216 0.352 0.584 1.21 2.37 4.11 6.25 7.81 9.35 0.297 0.484 0.711 1.06 1.92 3.36 5.39 7.78 9.49 11.10 0.554 0.831 1.15 1.61 2.67 4.35 6.63 9.24 11.10 12.80

6 7 8 9 10

0.676 0.989 1.34 1.73 2.16

0.872 1.24 1.65 2.09 2.56

1.24 1.69 2.18 2.70 3.25

1.64 2.17 2.73 3.33 3.94

2.20 2.83 3.49 4.17 4.87

3.45 4.25 5.07 5.90 6.74

5.35 6.35 7.34 8.34 9.34

7.84 9.04 10.20 11.40 12.50

10.60 12.00 13.40 14.70 16.00

12.60 14.10 15.50 16.90 18.30

14.40 16.00 17.50 19.00 20.50

16.80 18.50 20.10 21.70 23.20

18.50 20.30 22.00 23.60 25.20

11 12 13 14 15

2.60 3.07 3.57 4.07 4.60

3.05 3.57 4.11 4.66 5.23

3.82 4.40 5.01 5.63 6.26

4.57 5.23 5.89 6.57 7.26

5.582 6.30 7.04 7.79 8.55

7.58 8.44 9.30 10.20 11.00

10.30 11.30 12.30 13.30 14.30

13.70 14.80 16.00 17.10 18.20

17.30 18.50 19.80 21.10 22.30

19.70 21.00 22.40 23.70 25.00

21.90 23.30 24.70 26.10 27.50

24.70 26.20 27.70 29.10 30.60

26.80 28.30 29.80 31.30 32.80

16 17 18 19 20

5.14 5.70 6.26 6.84 7.43

5.81 6.41 7.01 7.63 8.26

6.91 7.56 8.23 8.91 9.59

7.96 8.67 9.39 10.10 10.90

9.31 10.10 10.90 11.70 12.40

11.90 12.80 13.70 14.60 15.50

15.30 16.30 17.30 18.30 19.30

19.40 20.50 21.60 22.70 23.80

23.50 24.80 26.00 27.20 28.40

26.30 27.60 28.90 30.10 31.40

28.80 30.20 31.50 32.90 34.20

32.00 33.40 34.80 36.20 37.60

34.30 35.70 37.20 38.60 40.00

21 22 23 24 25

8.03 8.64 9.26 9.89 10.50

8.90 9.54 10.20 10.90 11.50

10.30 11.00 11.70 12.40 13.10

11.60 12.30 13.10 13.80 14.60

13.20 14.00 14.80 15.70 16.50

16.30 17.20 18.10 19.00 19.90

20.30 21.30 22.30 23.30 24.30

24.90 26.00 27.10 28.20 29.30

29.60 30.80 32.00 33.20 34.40

32.70 33.90 35.20 36.40 37.70

35.50 36.80 38.10 39.40 40.60

38.90 40.30 41.50 43.00 44.30

41.40 42.80 44.20 45.60 46.90

gl

0.01 0.005 6.63 7.88 9.21 10.60 11.3 12.80 13.30 14.90 15.10 16.70

26 11.20 12.20 13.80 15.40 17.30 20.80 25.30 30.40 35.60 38.90 41.90 45.60 48.30 27 11.80 12.90 14.60 16.20 18.10 21.70 26.30 31.50 36.70 40.10 43.20 47.00 49.60

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF