Tar3 Laura Elena Puentes Prado

April 26, 2017 | Author: Aide L. Hurtado | Category: N/A
Share Embed Donate


Short Description

Download Tar3 Laura Elena Puentes Prado...

Description

LAURA ELENA PUENTES PRADO

UNIVERSIDAD DE GUANAJUATO DIVISIÓN DE CIENCIAS NATURALES Y EXACTAS MAT-2051 1 (DISEÑO DE EXPERIMENTOS) TAREA #3. DISEÑOS EN BLOQUES I.

Problemas del libro. Capítulo 4

1. ¿En qué situación se aplica un diseño de bloques completos al azar? ¿En qué difieren los factores de tratamiento y de bloques? Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor, es deseable que las posibles diferencias se deban principalmente al factor de interés y no a otros factores que no se consideran en el estudio. Cuando se quiere nulificar el efecto de estos otros factores se realiza un bloqueo. Por ejemplo, supongamos que se quieren compara varias máquinas, si cada máquina es manejada por un operador diferente y se sabe que éste tiene influencia en el resultado, entonces la forma de anular el efecto operador en la comparación (bloquear) consiste en que cada operador trabaje durante el experimento con cada una de las máquinas. Los factores de bloque son aquellos factores adicionales al factor de interés que se incorporan de manera explícita en un experimento comparativo. No se quiere analizar su efecto si no es un medio para estudiar de manera adecuada y eficaz al factor interés (tratamiento).

2. ¿Qué diferencia hay entre un DBCA y los diseños en cuadro latino? En un diseño de bloques completos al azar (DBCA) se consideran tres fuentes de variabilidad: el factor de tratamientos, el factor de bloque y el error aleatorio. En el diseño en cuadro latino (DCL) se controlan: dos factores de bloque y se estudia un factor de tratamientos, así que se tienen cuatro fuentes de variabilidad que pueden afectar sobre la respuesta observada.

3. De acuerdo con el modelo estadístico para un diseño en bloques, ¿por qué a través de este diseño se reduce el error aleatorio?

Porque en el diseño de bloques se analizan posibles factores (bloques) que pueden influir de manera significativa en nuestro experimento entonces en base a ellos decidir si nuestros resultados son válidos o no.

4. A continuación se muestra parte del ANOVA para un diseño de bloques, que tiene tres tratamientos y cinco bloques con una sola repetición por tratamiento-bloque. Fuente de variación Tratamiento Bloque Error Total

S. de cuadrados 600 850 500 1950

G. de libertad 2 4 (

)(

8 14

)

C. medio

Razón F0

Valor-p

F critica

600/2= 300 850/4= 212.5

4.8 3.4

¿? ¿?

F2,8=4.46 F4,8=3.84

500/8=62.5

a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las fuentes de variación. b) Interprete en forma práctica para cada caso, lo que está estimando el cuadrado medio. Si la hipótesis nula es verdadera el cuadrado medio puede estimar la varianza (ζ2). c) Escriba el modelo estadístico y las hipótesis pertinentes. Modelo: {

}

Hipótesis: Tratamiento

para algún

d) Apóyese en las tablas de distribución F para aceptar o rechazar la hipótesis. Como Fcritica < F0 entonces H0 se rechaza. Es decir que SI existe diferencia significativa entre los tratamientos.

e) Con apoyo de un software obtenga el valor-p para cada caso. Interprete los resultados. 5. (6) Aunque en el análisis de varianza para un diseño en bloques completos al azar también se puede probar la hipótesis sobre si hay diferencia entre los bloques, se dice que esta hipótesis se debe ver con ciertas reservas. Explique por qué. Porque ésta no es una prueba F exacta, sino aproximada, debido a la restricción de aleatorización (sólo se aleatoriza dentro del bloque no de manera completa a causa de que no es práctico e incluso imposible aleatorizar totalmente dada la existencias de los bloques). Sin embargo, en la práctica se recomienda su interpretación porque es evidencia en favor o en contra de que valió la pena el esfuerzo de controlar el factor de bloque. Si resulta significativa significa que el factor de bloque si tiene influencia sobre la variable respuesta, y debe ser tomado en cuenta para mejorar la calidad de ésta.

6. (7) Explique por qué se utiliza el adjetivo azar en el nombre del diseño en bloques completos al azar. Porque aunque es imposible aleatorizar de bloque a bloque, si se aleatoriza dentro del mismo bloque, y también se aleatorizan los tratamientos. La imposibilidad de aleatorizar de bloque a bloque se aprecia claramente cuando se bloquean factores como día o turno, ya que no tiene sentido pensar en seleccionar al azar el orden de los días o los turnos porque es imposible regresar en el tiempo.

7. (10) Se hace un estudio sobre la efectividad de tres maracas de atomizador para matar moscas. Para ello cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hicieron seis réplicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta fuente de variación. Los datos obtenidos se muestran a continuación: Marca de atomizador 1 2 3

1 72 55 64

Número de réplica (día) 2 3 4 5 65 67 75 62 59 68 70 53 74 61 58 51

6 73 50 69

a) Suponiendo un DBCA, formule las hipótesis adecuadas y el modelo estadístico.

Modelo: {

}

Hipótesis: Tratamiento

para algún

b) ¿Existe diferencia entre la efectividad promedio de los atomizadores? Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3

Cuenta 6 6 6

Columna 1 Columna 2 Columna 3 Columna 4 Columna 5 Columna 6

3 3 3 3 3 3

Suma Promedio Varianza 414 69 26 355 59.1666667 66.9666667 377 62.8333333 66.1666667 191 198 196 203 166 192

63.6666667 66 65.3333333 67.6666667 55.3333333 64

72.3333333 57 14.3333333 76.3333333 34.3333333 151

ANÁLISIS DE VARIANZA Origen de las variaciones Tratamiento Bloques Error Total

Suma de Grados de cuadrados libertad 296.333333 2 281.333333 5 514.333333 10 1092

Promedio Valor de los crítico para cuadrados F Probabilidad F 148.166667 2.88075178 0.10280442 4.10282102 56.2666667 1.09397278 0.42071775 3.32583453 51.4333333

17

Como entonces se acepta, es decir que no existe diferencia significativa entre los atomizadores para matar moscas.

c) ¿Hay algún atomizador mejor? Argumente su respuesta. En base al análisis anterior se concluye que no existe diferencia significativa entre los atomizadores. Entonces no hay ningún atomizador mejor

d) ¿Hay diferencias significativas en los resultados de diferentes días en qué se realizó el experimento? Argumente su respuesta. Hipótesis: Bloques

para algún

Como entonces se acepta, es decir que no existe diferencia significativa entre los bloques, es decir, los días en que se realizó la prueba.

e) Verifique los supuestos de normalidad y de igual varianza entre las maracas. Normalidad

(

)

[∑

(

)]

i

Datos en orden

Coeficientes Shapiro-Wilks

xn-i+j-xi

ai(xn-i+j-xi)

1 2 3 4 5

50 51 53 55 58

0.4886 0.3253 0.2553 0.2027 0.1587

25 23 20 17 12

12.215 7.4819 5.106 3.4459 1.9044

59 61 62 64 65 67 68 69 70 72 73 74 75

6 7 8 9 10 11 12 13 14 15 16 17 18

0.1197 0.0837 0.0496 0.0163

10 7 5 1 Σ

1.197 0.5859 0.248 0.0163 32.2004

64.235 Entonces

0.9495

Y de tablas Por lo tanto si

0.982 la hipótesis nula se acepta. Es una distribución normal.

Varianza constante Como los datos tienen una distribución normal se utiliza el estadístico de Bartlett.

para algún

Dónde:

(

(

)

) ∑

)

[∑(

) ]

)

∑(

(

(

)

Para tratamiento: si2

log si2

26 66.9666667 66.1666667 Σ 159.133333 (

)

(

) ( )

1.41497335 1.82585868 1.82063926 5.06147129

21.2178 ( )(

(

)

)

9.7775

1.0944 20.571

De tablas

5.991

Por lo tanto, como

entonces, la hipótesis nula se rechaza, esto quiere decir que no

existe Homocedasticidad en los datos.

Para bloque: Σ si2 log

72.3333333

si2

57 14.3333333 76.3333333 34.3333333

1.85933848 1.75587486

(

)

(

) ( )

(

( )( )

151 405.333333

1.1563472 1.88271423 1.53571597 2.17897695 10.3689677

135.1111 )

-19.8845

1.0178 - 44.9862

De tablas

11.070

Por lo tanto, como entonces, la hipótesis nula se acepta, esto quiere decir que hay homogeneidad de varianza en los datos con respecto a los bloques.

Independencia El método analítico de comprobar el supuesto de independencia se realiza con la prueba DurbinWatson. (



1 2 3 4 5 6 7 8 9 10 11 12 13

)

( ∑

) ( )

Datos

yi

ei

ei2

(ei-ei-1)2

72 65 67 75 62 73 55 59 68 70 53 50 64

69.000 69.000 69.000 69.000 69.000 69.000 59.167 59.167 59.167 59.167 59.167 59.167 62.833

-3.00 4.00 2.00 -6.00 7.00 -4.00 4.17 0.17 -8.83 -10.83 6.17 9.17 -1.17

9.00 16.00 4.00 36.00 49.00 16.00 17.36 0.03 78.03 117.36 38.03 84.03 1.36

49 4 64 169 121 66.6944444 16 81 4 289 9 106.777778

14 15 16 17 18

74 61 58 51 69

62.833 62.833 62.833 62.833 62.833

-11.17 1.83 4.83 11.83 -6.17 Σ

124.69 3.36 23.36 140.03 38.03 795.667

100 169 9 49 324 1630.472

2.049 De las tablas obtenemos para p=2,

y

Por lo tanto, siendo que

, es decir no existe correlación entre los datos.

se acepta

8. (12) Se diseñó un experimento para estudiar el rendimiento de cuatro detergentes. Las siguientes lecturas de “blancura” se obtuvieron con un equipo especial diseñado para 12 cargas de lavado, distribuidas en tres modelos de lavadoras: Detergente

A B C D

Lavadora 1 45 47 50 42

Lavadora 2 43 44 49 37

Lavadora 3 51 52 57 49

a) Señale el nombre del diseño experimental utilizado. Diseño en bloques completos al azar. {

}

b) Formule la hipótesis que se quiere probar en este problema. Tratamiento:

para algún Bloques:

para algún

c) Realice el análisis estadístico más apropiado para estos datos y obtenga conclusiones. Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4

Cuenta 3 3 3 3

Columna 1 Columna 2 Columna 3

4 4 4

Suma Promedio Varianza 139 46.3333333 17.3333333 143 47.6666667 16.3333333 156 52 19 128 42.6666667 36.3333333 184 173 209

46 11.3333333 43.25 24.25 52.25 11.5833333

ANÁLISIS DE VARIANZA Origen de las variaciones

Suma de cuadrados

Tratamiento 133.666667

Grados de libertad

Promedio de los cuadrados

F

Valor Probabilidad crítico para F

3 44.5555556 34.1276596 0.00036333 4.75706266

Bloque Error

170.166667 7.83333333

Total

311.666667

2 85.0833333 65.1702128 6 1.30555556

8.5228E-05 5.14325285

11

En tratamiento: Dado que , la hipótesis nula es rechazada, esto quiere decir que si existe diferencia significativa entre los diferentes tipos de detergentes. En bloque: Como , la hipótesis nula se rechaza, esto se interpreta en que la lavadora que se utilice si tiene influenza en el resultado del tratamiento (detergente).

9. (15) Un aspecto crítico para que se conserve la leche es la temperatura de almacenamiento. De manera tradicional se han usado termómetros de mercurio (Mer) para verificar que la temperatura sea la adecuada, pero ahora se han comprado termómetros electrónicos (Rtd) para facilitar el proceso de medición. Sin embrago, se duda de las mediciones de estos nuevos dispositivos. Para aclarar dudas y diagnosticar la situación, durante cinco días se toman mediciones con ambos tipos de termómetros en varios silos (a la misma hora). Los datos para cinco silos se muestran a continuación: Silo

A B C D E

Día 1 Mer Rtd 4.0 2.6 5.0 6.4 4.5 3.3 2.5 3.1 4.0 0.0

Día 2 Mer Rtd 4.0 2.8 6.0 6.4 4.0 1.4 4.0 5.0 4.0 0.4

Día 3 Mer Rtd 5.0 5.0 2.0 2.3 3.5 1.8 6.5 6.6 3.5 0.6

Día 4 Mer Rtd 0.5 0.0 4.0 4.2 2.0 -1.9 4.5 2.7 2.0 -4.0

Día 5 Mer Rtd 3.0 2.4 4.0 4.0 3.0 -7.6 4.0 6.3 4.0 -6.3

a) Observe los datos y establezca una conjetura acerca de la confiabilidad de las mediciones con Rtd (del termómetro de mercurio no hay duda). A primera vista, si comparamos el termómetro de Mer con el Rtd se aprecian diferencias grandes, incluso el termómetro Rtd marca temperaturas inferiores a 0°C, cosa que nunca sucede con el otro termómetro.

b) Es claro que el silo se puede ver como tratamiento y día como bloque. Considere sólo los datos de Rtd y establezca el modelo estadístico. También haga el ANOVA correspondiente y obtenga conclusiones. El tipo de análisis sería Diseño en bloques completos al azar (DBCA), cuyo modelo es: {

Hipótesis: Tratamiento:

para algún Bloques:

para algún

Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5 Columna 1 Columna 2 Columna 3 Columna 4 Columna 5

Cuenta 5 5 5 5 5

Suma 12.8 23.3 -3 23.7 -9.3

Promedio 2.56 4.66 -0.6 4.74 -1.86

Varianza 3.148 3.068 18.915 3.203 9.728

5 5 5 5 5

15.4 16 16.3 1 -1.2

3.08 3.2 3.26 0.2 -0.24

5.197 6.18 6.078 11.085 39.653

}

ANÁLISIS DE VARIANZA Origen de las variaciones Filas Columnas Error

Promedio Valor Suma de Grados de de los crítico para cuadrados libertad cuadrados F Probabilidad F 182.532 4 45.633 8.09095745 0.00091159 3.00691728 62.008 4 15.502 2.74858156 0.06486529 3.00691728 90.24 16 5.64

Total

334.78

24

En tratamiento: Dado que diferente.

, la hipótesis se rechaza, esto significa que la temperatura en los silos es

En bloque: Como , la hipótesis nula se acepta, esto se interpreta en que el día no tiene un efecto en la medición de la temperatura.

c) Repita el inciso anterior pero ahora para las mediciones Mer. El tipo de análisis sería Diseño en bloques completos al azar (DBCA), cuyo modelo es: {

Hipótesis: Tratamiento:

para algún Bloques:

para algún

}

Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5

Cuenta

Columna 1 Columna 2 Columna 3 Columna 4 Columna 5

5 5 5 5 5

Suma 16.5 21 17 21.5 17.5

Promedio 3.3 4.2 3.4 4.3 3.5

Varianza 2.95 2.2 0.925 2.075 0.75

5 5 5 5 5

20 22 20.5 13 18

4 4.4 4.1 2.6 3.6

0.875 0.8 2.925 2.675 0.3

ANÁLISIS DE VARIANZA Origen de las variaciones Filas Columnas Error

Promedio Valor Suma de Grados de de los crítico para cuadrados libertad cuadrados F Probabilidad F 4.46 4 1.115 0.69040248 0.60921239 3.00691728 9.76 4 2.44 1.51083591 0.24602212 3.00691728 25.84 16 1.615

Total

40.06

24

En tratamiento: Dado que es diferente.

, la hipótesis se acepta, esto significa que la temperatura en los silos no

En bloque: Como , la hipótesis nula se acepta, esto se interpreta en que el día no tiene un efecto en la medición de la temperatura.

d) ¿Las conclusiones obtenidas en los incisos anteriores coinciden? Comente su respuesta. No las conclusiones con respecto a los tratamientos (silos) fue distinta, en el caso del termómetro Rtd había variación en los silos; mientras que con el termómetro Mer, eso no se detectó, los silos

eran estadísticamente iguales. Esto quiere decir que los termómetros son distintos entre sí, ya que muestran conclusiones diferentes.

e) Datos pareados. Para comprara los dos métodos de medición (Mer y Rtd) obtenga como variable de respuesta a la diferencia de temperaturas que registran los métodos para cada día en cada silo. Considerando esto, establezca el modelo estadístico, haga el ANOVA correspondiente y obtenga conclusiones. Para |MER-RTD| Día 1 Silo Dif.

Día 2

Día 3

Día 4

Día 5

Dif.

Dif.

Dif.

Dif.

A

1.4

1.2

0

0.5

0.6

B

1.4

0.4

0.3

0.2

0

C

1.2

2.6

1.7

3.9

10.6

D

0.6

1

0.1

1.8

2.3

E

4

3.6

2.9

6

10.3

El tipo de análisis sería Diseño en bloques completos al azar (DBCA), cuyo modelo es: {

Hipótesis: Tratamiento:

para algún Bloques:

para algún

}

Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5

Cuenta

Columna 1 Columna 2 Columna 3 Columna 4 Columna 5

5 5 5 5 5

Suma 3.7 2.3 20 5.8 26.8

Promedio 0.74 0.46 4 1.16 5.36

Varianza 0.318 0.298 14.665 0.793 8.953

5 5 5 5 5

8.6 8.8 5 12.4 23.8

1.72 1.76 1 2.48 4.76

1.732 1.708 1.6 5.997 27.703

ANÁLISIS DE VARIANZA Origen de las variaciones Filas Columnas Error

Promedio Valor Suma de Grados de de los crítico para cuadrados libertad cuadrados F Probabilidad F 96.8136 4 24.2034 6.65998927 0.00235744 3.00691728 41.9616 4 10.4904 2.88661723 0.05639643 3.00691728 58.1464 16 3.63415

Total

196.9216

24

En tratamiento: Dado que , la hipótesis nula se rechaza esto se interpreta en que, la diferencia entre las temperaturas de los termómetros, en los silos es diferente, es decir, hay diferencias entre cada tratamiento. En bloque: Como , la hipótesis nula se acepta, esto se interpreta en que el día no tiene un efecto en la medición de la temperatura. En conclusión, se puede inferir por los resultados en los incisos anteriores, que el termómetro Rtd es diferente al termómetro Mer, y considerando que sobre éste último no hay duda de su funcionamiento, entonces, el termómetro Rtd, está dañado y no registra las temperaturas correctas.

10. (16) Se requiere estudiar el efecto de cinco catalizadores diferentes (A, B, C, D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material sólo permite cinco corridas y cada corrida requiere aproximadamente 1.5 horas, por lo que sólo se pueden realizar cinco corridas diarias. El experimentador decide correr los experimentos con un diseño en cuadro latino para controlar activamente a los lotes y días. Los datos obtenidos son:

Lote

1 2 3 4 5

1 A=8 C=11 B=4 D=6 E=4

2 B=7 E=2 A=9 C=8 D=2

Día 3 D=1 A=7 C=10 E=6 B=3

4 C=7 D=3 E=1 B=6 A=8

5 E=3 B=8 D=5 A=10 C=8

a) ¿Cómo se aleatorizó el experimento? Primero se construyó el cuadro latino estándar, y después se aleatoriza el orden de los renglones, y después el de las columnas. La regla fundamental es que cada letra debe aparecer sólo una vez en cada renglón y en cada columna.

b) Anote la ecuación del modelo y las hipótesis estadísticas correspondientes. El tipo de análisis es Diseño en cuadro latino (DCL), cuyo modelo es:

Hipótesis: Tratamiento:

para algún Bloque 1:

para algún

Bloque 2:

para algún

c) ¿Existen diferencias entre los tratamientos? ¿Cuáles tratamientos son diferentes entre sí? Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5

Cuenta

Suma 5 5 5 5 5

26 31 29 36 25

Promedio 5.2 6.2 5.8 7.2 5

Varianza 9.2 13.7 13.7 3.2 8

Columna 1 Columna 2 Columna 3 Columna 4 Columna 5

5 5 5 5 5

33 28 27 25 34

6.6 5.6 5.4 5 6.8

8.8 11.3 12.3 8.5 7.7

sA= sB= sC= sD= sE=

5 5 5 5 5

42 28 44 17 16

8.4 5.6 8.8 3.4 3.2

1.3 4.3 2.7 4.3 3.7

ANÁLISIS DE VARIANZA Origen de Promedio las Suma de Grados de de los variaciones cuadrados libertad cuadrados Tratamiento 141.44 4 35.36 Días (B1) 12.24 4 3.06 Lotes (B2) 15.44 4 3.86 Error 37.52 12 3.1267 Total

206.64

24

Valor crítico para F F 11.3092 3.26 0.9787 3.26 1.2345 3.26

En tratamiento: Dado que diferentes entre sí.

, la hipótesis nula se rechaza, es decir, los tratamientos (catalizadores) son

En bloque 1: Como catalizadores.

, la hipótesis nula se acepta, es decir, en que el día no tiene un efecto en los

En bloque 2: Como , la hipótesis nula se acepta, es decir, que el número de lote no tiene eecto sobre el catalizador.

d) ¿Los factores de ruido, lote y día afectan el tiempo de reacción del proceso? No, lo efectos de ruido (lote y día) no tienen influencia significativa sobre la reacción del procesos (catalizadores), es decir no influyen en los resultados de los tratamientos.

e) Dibuje los gráficos de medias para los tratamientos, los lotes y los días. ¿Cuál tratamiento es mejor?

Hipótesis:

⁄ (

⁄ (

)(

2.1788128

)

3.12667

√ (

)

2.4366

)(

)√

Utilizando LSD LSD

µi-µj µA

µB

µA µA

µC µD

µA µB

µE µC

µB µB

µD µE

µC µC

µD µE

µD

µE

H0

2.8 0.4

> <

2.43663628 2.43663628

 

5 5.2

> >

2.43663628 2.43663628

 

3.2 2.2

> <

2.43663628 2.43663628

 

2.4 5.4

< >

2.43663628 2.43663628

 

5.6 0.2

> <

2.43663628 2.43663628

 

En base a esta comparación los catalizadores E, D y B son estadísticamente iguales y los que resultan mejores, ya que el tempo de reacción es menor.

f)

Verifique los supuestos del modelo, considerando que los datos se obtuvieron columna por columna, día por día.

Normalidad

(

i 1 2 3 4 5

yij

ai 1 1 2 2 3

0.4450 0.3069 0.2543 0.2148 0.1822

)

xn-i+1-xi 24 23 21 20 18

[∑

(

ai(xn-i+1-xi) 10.6800 7.0587 5.3403 4.2960 3.2796

)]

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

3 3 4 4 5 6 6 6 7 7 7 8 8 8 8 8 9 10 10 11

0.1539 0.1283 0.1046 0.0823 0.0610 0.0403 0.0200 0.0000

17 16 14 13 11 9 8 7 Σ

2.6163 2.0528 1.4644 1.0699 0.6710 0.3627 0.1600 0.0000 39.0517

8.61 Entonces

7.3802

Y de tablas Por lo tanto si distribución normal.

0.985 la hipótesis nula se rechaza. Estos datos no provienen de una

Varianza constante Como los datos no tienen una distribución normal se utiliza el estadístico de Levine. Para tratamiento:

para algún

Desviaciones de cada valor respecto a la media (tratamiento) 0.4 1.4 1.8 2.4 0.2 1.4 2.4 2.2 0.4 1.2 0.6 1.6 1.2 1.6 2.2 1.6 0.4 0.8 2.6 2.8 0.4 2.6 0.8 1.4 0.8

Análisis de varianza de un factor RESUMEN Grupos Columna 1 Columna 2 Columna 3 Columna 4 Columna 5

Cuenta 5 5 5 5 5

Suma 4.4 8.4 6.8 8.4 7.2

Promedio 0.88 1.68 1.36 1.68 1.44

Varianza 0.332 0.772 0.388 0.772 1.108

ANÁLISIS DE VARIANZA Promedio Origen de las Suma de Grados de de los variaciones cuadrados libertad cuadrados Tratamientos 2.1504 4 0.5376 Error 13.488 20 0.6744 Total

15.6384

Valor crítico para F Probabilidad F 0.797 0.54104084 2.8660814

24

Por lo tanto si la hipótesis nula se acepta. Por lo tanto si existe homogeneidad de varianza con respecto a los tratamientos.

Para bloque 1 (Días):

para algún

Desviaciones de cada valor respecto a la media (Días) 1.4 1.4 4.4 2.0 3.8 4.4 3.6 1.6 2.0 1.2 2.6 3.4 4.6 4.0 1.8 0.6 2.4 0.6 1.0 3.2 2.6 3.6 2.4 3.0 1.2

Análisis de varianza de un factor RESUMEN Grupos Columna 1 Columna 2 Columna 3 Columna 4 Columna 5

Cuenta 5 5 5 5 5

Suma 11.6 14.4 13.6 12 11.2

Promedio 2.32 2.88 2.72 2.4 2.24

Varianza 2.072 0.932 3.052 1.3 1.428

ANÁLISIS DE VARIANZA Origen de las variaciones Entre grupos Dentro de los grupos Total

Grados Promedio Valor Suma de de de los crítico para cuadrados libertad cuadrados F Probabilidad F 1.5104 4 0.3776 0.21493625 0.92702704 2.8660814 35.136

20

36.6464

24

1.7568

Por lo tanto si la hipótesis nula se acepta. Por lo tanto si existe homogeneidad de varianza con respecto al día.

Para bloque 2 (Lotes):

para algún

Desviaciones de cada valor con respecto a la media (Lotes) 2.8 1.8 4.2 1.8 2.2 4.8 4.2 0.8 3.2 1.8 1.8 3.2 4.2 4.8 0.8 1.2 0.8 1.2 1.2 2.8 1.0 3.0 2.0 3.0 3.0

Análisis de varianza de un factor RESUMEN Grupos Fila 1 Fila 2 Fila 3 Fila 4 Fila 5

Cuenta 5 5 5 5 5

Suma 12.8 14.8 14.8 7.2 12

Promedio 2.56 2.96 2.96 1.44 2.4

Varianza 1.008 2.748 2.748 0.608 0.8

ANÁLISIS DE VARIANZA Origen de las variaciones Entre grupos Dentro de los grupos Total

Grados Promedio Valor Suma de de de los crítico para cuadrados libertad cuadrados F Probabilidad F 7.7696 4 1.9424 1.22750253 0.33073341 2.8660814 31.648

20

39.4176

24

1.5824

Por lo tanto como la hipótesis nula se acepta. Por lo tanto si existe homogeneidad de varianza con respecto a los lotes.

Independencia El método analítico de comprobar el supuesto de independencia se realiza con la prueba DurbinWatson. (



Datos

yi 8 9 7 8 10 4 7 3 6 8 11 8 10 7 8 6 2 1 3 5 4 2 6 1 3

8.4 8.4 8.4 8.4 8.4 5.6 5.6 5.6 5.6 5.6 8.8 8.8 8.8 8.8 8.8 3.4 3.4 3.4 3.4 3.4 3.2 3.2 3.2 3.2 3.2

)

( ∑

) ( )

ei

ei2

(ei-ei-1)2

0.40 -0.60 1.40 0.40 -1.60 1.60 -1.40 2.60 -0.40 -2.40 -2.20 0.80 -1.20 1.80 0.80 -2.60 1.40 2.40 0.40 -1.60 -0.80 1.20 -2.80 2.20 0.20 Σ

0.16 0.36 1.96 0.16 2.56 2.56 1.96 6.76 0.16 5.76 4.84 0.64 1.44 3.24 0.64 6.76 1.96 5.76 0.16 2.56 0.64 1.44 7.84 4.84 0.04 65.200

1.0 4.0 1.0 4.0 10.2 9.0 16.0 9.0 4.0 0.0 9.0 4.0 9.0 1.0 11.6 16.0 1.0 4.0 4.0 0.6 4.0 16.0 25.0 4.0 167.480

2.5687 De las tablas obtenemos para p=2,

y

Por lo tanto, siendo que

se acepta

, es decir no existe correlación entre los datos.

11. (21) Se quieren comparar tres dietas (A, B, C) a base de proteínas de origen vegetal utilizando 18 ratas de laboratorio de una misma camada. Primero se observa por un tiempo el apetito para formar tres grupos de seis ratas, según su voracidad; y cada uno de estos grupos se clasifica a su vez en tres grupos de dos ratas, de acuerdo a su peso inicial. Se plantea un experimento donde la variable de respuesta es el peso en gramos ganado por las ratas después de cierto período, con los siguientes resultados: Apetito/ Peso inicial

A1

A2

A3

67 72

(C)

105 112

(A)

95 86

(B)

P1

(A)

75 67

(B)

88 110

(C)

P2

85 98

(B)

68 91

(C)

108 120

(A)

P3

66 47

a) Analice los datos. ¿Cuáles factores influyen en el peso ganado por las ratas? El tipo de análisis es Diseño en cuadro latino (DCL), cuyo modelo es:

Hipótesis: Tratamiento:

para algún Bloque 1:

para algún

Bloque 2:

para algún

Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN

Cuenta

A B C

3 3 3

Suma Promedio Varianza 628 209.333333 550.333333 436 145.333333 1164.33333 496 165.333333 900.333333

Fila 1 Fila 2 Fila 3

3 3 3

537 179 1524 523 174.333333 840.333333 500 166.666667 3350.33333

Columna 1 Columna 2 Columna 3

3 3 3

435 145 1252 518 172.666667 1546.33333 607 202.333333 566.333333

ANÁLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Tratamiento 6432 2 Peso inicial (B1) 232.666667 2 Voracidad (B2) 4932.66667 2 Error 64.6666667 2 Total

11662

Promedio Valor de los crítico para cuadrados F F 3216 99.4639175 6.94427191 116.333333 3.59793814 6.94427191 2466.33333 76.2783505 6.94427191 32.3333333

8

En tratamiento: Dado que diferentes entre sí.

, la hipótesis nula se rechaza, es decir, los tratamientos (dietas) son

En bloque 1: Como el resultado.

, la hipótesis nula se acepta, es decir, que el peso inicial no tiene un efecto en

En bloque 2: Como , la hipótesis nula se rechaza, es decir, que la voracidad de las ratas si es un factor que influye en los resultados.

b) ¿Cuál dieta es mejor? Utilizando LSD LSD

µi-µj µA µA

µB µC

µB

µC

64 44 20

> > >

19.9763391 19.9763391 19.9763391

H0   

Por lo tanto, se puede concluir que la dieta B es la mejor, ya que el incremento de peso es el menor.

c) ¿Alguno de los factores de bloque puede ser ignorado? Argumente su respuesta. Como el peso inicial no tiene influencia en los resultados, este factor de bloque puede ser ignorado. d) Si ése fuera el caso, analice de nuevo el experimento y saque conclusiones. Hipótesis: Tratamiento:

para algún

Bloques

para algún Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3

Cuenta

Columna 1 Columna 2 Columna 3

3 3 3

Suma Promedio Varianza 628 209.333333 550.333333 436 145.333333 1164.33333 496 165.333333 900.333333

3 3 3

435 145 1252 518 172.666667 1546.33333 607 202.333333 566.333333

ANÁLISIS DE VARIANZA Origen de Promedio Valor las Suma de Grados de de los crítico para variaciones cuadrados libertad cuadrados F Probabilidad F Filas 6432 2 3216 43.264574 0.00195228 6.94427191 Columnas 4932.66667 2 2466.33333 33.1793722 0.00323209 6.94427191 Error 297.333333 4 74.3333333 Total

11662

8

En tratamiento: Dado que diferentes entre sí.

, la hipótesis nula se rechaza, es decir, los tratamientos (dietas) son

En bloque: Como

, la hipótesis nula se rechaza, es decir, que él apetito si influye en el resultado.

Es decir los resultados siguen siendo los mismos.

e) Verifique los supuestos del modelo. Normalidad

(

)

[∑

i

Datos en orden

Coeficientes ShapiroWilks

xn-i+j-xi

1 2 3 4 5

50 51 53 55 58

0.5888 0.3244 0.1976 0.0947

14 11 8 4

6 7 8 9

59 61 62 64

Entonces Y de tablas

0.00644 0.978

)]

ai(xn-i+j-xi)

Σ

3680.125

(

8.2432 3.5684 1.5808 0.3788 13.7712

Por lo tanto si distribución normal.

la hipótesis nula se acepta. Estos dato provienen de una

Varianza constante Como los datos tienen una distribución normal se utiliza el estadístico de Bartlett.

para algún

Dónde:

(

(

)

[∑(

) ∑

(

∑( )

)

(

)

) ]

Para tratamiento: si2

log si2

550.333333 1164.33333 900.333333 Σ 2615

2.74062582 3.06607733 2.95440333 8.76110648

log sp2= 2.94035044

sp2= 871.666667 q= -5212.3579 c= 1.05555556 χ2= 11370.2924

De tablas

5.991

Por lo tanto, como entonces, la hipótesis nula se rechaza, esto quiere decir que no existe Homocedasticidad en los datos.

Para bloque: Σ si2 log

si2

1252 1546.33333 566.333333 3364.66667 3.09760433 3.18930312 2.75307212 9.03997957

sp2= q= c=

1121.55556 0.2189656 1.11111111

χ2=

0.45377118

De tablas

log sp2=

3.04982079

5.991

Por lo tanto, como entonces, la hipótesis nula se acepta, esto quiere decir que hay homogeneidad de varianza en los datos con respecto a los bloques.

Independencia El método analítico de comprobar el supuesto de independencia se realiza con la prueba DurbinWatson. (



)

( ∑

) ( )

independencia Datos 1 2 3

yi

183 209.333333 217 209.333333 228 209.333333

ei

ei2

(ei-ei-1)2

-26.33 7.67 18.67

693.44 58.78 348.44

1156 121

4 5 6 7 8 9

113 142 181 139 159 198

145.333333 145.333333 145.333333 165.333333 165.333333 165.333333

-32.33 -3.33 35.67 -26.33 -6.33 32.67 Σ

1045.44 11.11 1272.11 693.44 40.11 1067.11 5230.000

2601 841 1521 3844 400 1521 12005.000

2.2954 De las tablas no viene el valor correspondiente, para concluir el método analítico. Gráficamente: en base al valor de

y

, por lo tanto, no se pudo

se puede concluir que no hay correlación entre los datos.

12. (23) Un investigador está interesado en el efecto del porcentaje de lisina y del porcentaje de proteína en la producción de vacas lecheras. Se consideran siete niveles en cada factor. 

% de lisina: 0.0 (A), 0.1 (B), 0.2 (C), 0.3 (D), 0.4 (E), 0.5 (F), 0.6 (G).



% de proteína: 2 (α), 4 (β), 6 (χ), 8 (δ), 10 (ε), 12 (φ), 14 (γ).

Para el estudio se seleccionan siete vacas al azar, a las cuales se les da un seguimiento de siete períodos de tres meses. Los datos en galones de leche fueron los siguientes:

Vaca/ período 1 2 3 4 5 6 7

1

2

3

4

5

6

7

304 (Aα) 381 (Bβ) 432 (Cχ) 442 (Dδ) 496 (Eε) 534 (Fφ) 543 (Gγ)

436 (Bε) 505 (Cφ) 566 (Dγ) 372 (Eα) 449 (Fβ) 421 (Gχ) 386 (Aδ)

350 (Cβ) 425 (Dχ) 479 (Eδ) 536 (Fε) 493 (Gφ) 352 (Aγ) 435 (Bα)

504 (Dφ) 564 (Eγ) 357 (Fα) 366 (Gβ) 345 (Aχ) 427 (Bδ) 485 (Cε)

417 (Eχ) 494 (Fδ) 461 (Gε) 495 (Aφ) 509 (Bγ) 346 (Cα) 406 (Dβ)

519 (Fγ) 350 (Gα) 340 (Aβ) 425 (Bχ) 481 (Cδ) 478 (Dε) 554 (Eφ)

432 (Gδ) 413 (Aε) 502 (Bφ) 507 (Cγ) 380 (Dα) 397 (Eβ) 410 (Fχ)

a) Analice este experimento. ¿Qué factores tienen efecto en la producción de leche? Se utiliza un análisis de diseño en cuadro greco-latino (DCGL) Modelo:

Hipótesis: % Lisina:

para algún % Proteína:

para algún

Vaca:

para algún

Período:

para algún

A B C D E F G

α 304 435 346 380 372 357 350

Β 340 381 350 406 397 449 366

Χ 345 425 432 425 417 410 421

δ 386 427 481 442 479 494 432

Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5 Fila 6 Fila 7 Columna 1 Columna 2 Columna 3 Columna 4 Columna 5 Columna 6 Columna 7

Cuenta 7 7 7 7 7 7 7

Suma 2635 3115 3106 3201 3279 3299 3066

Promedio 376.428571 445 443.714286 457.285714 468.428571 471.285714 438

Varianza 3940.95238 2057.66667 4887.2381 4051.57143 5728.95238 4704.57143 4638.66667

7 7 7 7 7 7 7

2544 2689 2875 3141 3305 3587 3560

363.428571 384.142857 410.714286 448.714286 472.142857 512.428571 508.571429

1587.95238 1383.80952 887.571429 1456.57143 1629.14286 518.285714 5363.61905

Ε 413 436 485 478 496 536 461

φ 495 502 505 504 554 534 493

γ 352 509 507 566 564 519 543

Vaca/ período

1

2

3

4

5

6

7

1 2 3 4 5 6 7

304 381 432 442 496 534 543

436 505 566 372 449 421 386

350 425 479 536 493 352 435

504 564 357 366 345 427 485

417 494 461 495 509 346 406

519 350 340 425 481 478 554

432 413 502 507 380 397 410

F 7.2322 24.6598 1.4799 0.2977

Valor crítico para F 2.51 2.51 2.51 2.51

Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5 Fila 6 Fila 7 Columna 1 Columna 2 Columna 3 Columna 4 Columna 5 Columna 6 Columna 7

Cuenta 7 7 7 7 7 7 7

Suma 2962 3132 3137 3143 3153 2955 3219

Promedio 423.142857 447.428571 448.142857 449 450.428571 422.142857 459.857143

Varianza 5925.47619 5777.61905 6361.80952 4415.33333 4055.28571 4501.14286 4644.47619

7 7 7 7 7 7 7

3132 3135 3070 3048 3128 3147 3041

447.428571 447.857143 438.571429 435.428571 446.857143 449.571429 434.428571

7373.28571 4611.14286 4937.61905 7151.61905 3555.80952 6674.28571 2542.95238

ANÁLISIS DE VARIANZA Origen de Promedio las Suma de Grados de de los variaciones cuadrados libertad cuadrados % Lisina 42783.551 6 7130.5918 %Proteína 145879.551 6 24313.2585 Vaca 8754.408 6 1459.0680 Período 1760.980 6 293.4966 Error 23662.776 24 985.9490

Total

222841.265

48

En %Lisina: Dado que , la hipótesis nula se rechaza, es decir, el porcentaje de lisina no es igual para cada nivel, es decir, si tiene un efecto significativo. En % Proteína: Como , , la hipótesis nula se rechaza, lo que significa que, el porcentaje de proteína si tiene un efecto en la producción de vacas lecheras. Vaca: Como , la hipótesis nula se acepta, es decir, que la vaca (que vaca es) no es un factor que influye en los resultados. Período: Como , la hipótesis nula se acepta, es decir, que el período tampoco es un factor que influye en los resultados.

b) Interprete los datos usando gráficos de medias.

c) ¿Cómo puede explicar la falta de efectos en vacas y período? Estos factores que no influyen en la producción de las vacas.

d) ¿Qué porcentajes de lisina y proteína dan los mejores resultados? Utilizando diferencias mínimas significativas Utilizando LSD LSD

µi-µj 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

µA µA

µB µC

µA µA

µD µE

µA µA

µF µG

µB µB

µC µD

µB µB µB µC µC µC µC µD

µE µF µG µD µE µF µG µE

µD µD

µF µG

µE µE

µF µG

µF

µG

68.571

>

33.872

67.286 80.857 92.000 94.857 61.571 1.286 12.286 23.429

> > > > > < < <

33.872 33.872 33.872 33.872 33.872 33.872 33.872 33.872

26.286 7.000

< <

33.872 33.872

13.571 24.714

< <

33.872 33.872

27.571 5.714 11.143 14.000 19.286 2.857 30.429 33.286

< < < < < < < <

33.872 33.872 33.872 33.872 33.872 33.872 33.872 33.872

H0                     

Entonces se concluye que el porcentaje de lisina A es el que proporciona menor producción de las vacas, pero el resto son significativamente iguales.

e) Verifique los supuestos del modelo. Normalidad

Homogeneidad de varianza

Independencia

II.

Problemas marcados con asterisco

1. (2) Un equipo de especialistas en remotivación, en un hospital psiquiátrico, condujo un experimento para comprobar cinco métodos para remotivar a los pacientes. Estos fueron agrupados de acuerdo con el nivel de motivación inicial. En cada grupo, los pacientes fueron asignados al azar a los cinco métodos. Al final del periodo experimental, un equipo de trabajo formado por un psiquiatra, un psicólogo, una enfermera y un trabajador social evaluaron a los pacientes. Ningún miembro del equipo de evaluación sabia de los métodos que fueron asignados a los pacientes. El equipo asignó a cada paciente una calificación como medida de su nivel de motivación. Los resultados fueron los siguientes: Nivel de motivación inicial Nulo Muy bajo Bajo Promedio

Método de motivación A B C D E 58 68 60 68 64 62 70 65 80 69 67 78 68 81 70 70 81 70 89 74

¿Proporcionan estos datos evidencia suficiente que indique una diferencia en las calificaciones medias entre los métodos? Sea α = 0.05

2. (3) La enfermera supervisora de un departamento de salud local quería analizar el efecto de la hora del día en la duración de las visitas domiciliarias realizadas por el personal de enfermería. Pensaba que las diferencias individuales entre las enfermeras podían ser grandes, por lo que utilizó a las enfermeras como un factor de formación de bloques. Recolecto además los siguientes datos:

Enfermera A B C D

Duración de la visita domiciliaria Temprano En la A medio Por la por la mañana día tarde tarde 27 28 30 23 31 30 27 20 35 38 34 30 20 18 20 14

¿Proporcionan estos datos evidencia suficiente para indicar una diferencia en la duración de las visitas domiciliarias en las diferentes horas del día? Sea α = 0.05 3. (5) Se realiza un experimento para investigar el efecto de la temperatura de secado en granos de trigo con la finalidad de mejorar la calidad en el horneado para producir pan. Se utilizaron tres niveles de temperatura y la variable de respuesta medida fue el volumen de la pieza de pan obtenida. Los datos obtenidos fueron los siguientes:

Temperatura (°C) 70.0 75.0 80.0

Volumen (cm3) 1245 1235 1225

1235 1240 1200

1285 1200 1170

1242 1220 1155

1235 1210 1095

a) ¿La temperatura de secado afecta el volumen de pan? Usar un α=0.01 b) Utilizar el método de LSD para determinar la diferencia de medias y cuál es el tratamiento más adecuado que cumple con los fines de obtener un mayor volumen. c) Analizar el cumplimiento de normalidad y homogeneidad de varianzas por los métodos gráficos y matemáticos.

4. (9) Un artículo en “Agricultural Engineering” (diciembre 1964, pp672-673)

describe un experimento en el cual el peso ganado diariamente por los cerdos es evaluado en los diferentes niveles de temperatura de su vivienda. El peso promedio de cada grupo de cerdos al inicio del experimento es considerado como un factor de ruido. Los datos obtenidos de este experimento se muestran a continuación:

Peso (lbs) 100 150 200

Temperatura promedio del aire de la vivienda (°F) 50 60 70 80 90 100 1.37 1.58 2.00 1.97 1.40 0.39 1.47 1.75 2.16 1.82 1.14 -0.19 1.19 1.91 2.22 1.67 0.88 -0.77

a) ¿La temperatura promedio de la vivienda afecta al peso promedio ganado? Usa α=0.05 b) Utiliza el método de LSD de Fisher para determinar qué niveles de temperatura son diferentes. c) Analiza los residuos de este experimento y haz comentarios sobre la adecuación del modelo.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF