Tar3 Laura Elena Puentes Prado
April 26, 2017 | Author: Aide L. Hurtado | Category: N/A
Short Description
Download Tar3 Laura Elena Puentes Prado...
Description
LAURA ELENA PUENTES PRADO
UNIVERSIDAD DE GUANAJUATO DIVISIÓN DE CIENCIAS NATURALES Y EXACTAS MAT-2051 1 (DISEÑO DE EXPERIMENTOS) TAREA #3. DISEÑOS EN BLOQUES I.
Problemas del libro. Capítulo 4
1. ¿En qué situación se aplica un diseño de bloques completos al azar? ¿En qué difieren los factores de tratamiento y de bloques? Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor, es deseable que las posibles diferencias se deban principalmente al factor de interés y no a otros factores que no se consideran en el estudio. Cuando se quiere nulificar el efecto de estos otros factores se realiza un bloqueo. Por ejemplo, supongamos que se quieren compara varias máquinas, si cada máquina es manejada por un operador diferente y se sabe que éste tiene influencia en el resultado, entonces la forma de anular el efecto operador en la comparación (bloquear) consiste en que cada operador trabaje durante el experimento con cada una de las máquinas. Los factores de bloque son aquellos factores adicionales al factor de interés que se incorporan de manera explícita en un experimento comparativo. No se quiere analizar su efecto si no es un medio para estudiar de manera adecuada y eficaz al factor interés (tratamiento).
2. ¿Qué diferencia hay entre un DBCA y los diseños en cuadro latino? En un diseño de bloques completos al azar (DBCA) se consideran tres fuentes de variabilidad: el factor de tratamientos, el factor de bloque y el error aleatorio. En el diseño en cuadro latino (DCL) se controlan: dos factores de bloque y se estudia un factor de tratamientos, así que se tienen cuatro fuentes de variabilidad que pueden afectar sobre la respuesta observada.
3. De acuerdo con el modelo estadístico para un diseño en bloques, ¿por qué a través de este diseño se reduce el error aleatorio?
Porque en el diseño de bloques se analizan posibles factores (bloques) que pueden influir de manera significativa en nuestro experimento entonces en base a ellos decidir si nuestros resultados son válidos o no.
4. A continuación se muestra parte del ANOVA para un diseño de bloques, que tiene tres tratamientos y cinco bloques con una sola repetición por tratamiento-bloque. Fuente de variación Tratamiento Bloque Error Total
S. de cuadrados 600 850 500 1950
G. de libertad 2 4 (
)(
8 14
)
C. medio
Razón F0
Valor-p
F critica
600/2= 300 850/4= 212.5
4.8 3.4
¿? ¿?
F2,8=4.46 F4,8=3.84
500/8=62.5
a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las fuentes de variación. b) Interprete en forma práctica para cada caso, lo que está estimando el cuadrado medio. Si la hipótesis nula es verdadera el cuadrado medio puede estimar la varianza (ζ2). c) Escriba el modelo estadístico y las hipótesis pertinentes. Modelo: {
}
Hipótesis: Tratamiento
para algún
d) Apóyese en las tablas de distribución F para aceptar o rechazar la hipótesis. Como Fcritica < F0 entonces H0 se rechaza. Es decir que SI existe diferencia significativa entre los tratamientos.
e) Con apoyo de un software obtenga el valor-p para cada caso. Interprete los resultados. 5. (6) Aunque en el análisis de varianza para un diseño en bloques completos al azar también se puede probar la hipótesis sobre si hay diferencia entre los bloques, se dice que esta hipótesis se debe ver con ciertas reservas. Explique por qué. Porque ésta no es una prueba F exacta, sino aproximada, debido a la restricción de aleatorización (sólo se aleatoriza dentro del bloque no de manera completa a causa de que no es práctico e incluso imposible aleatorizar totalmente dada la existencias de los bloques). Sin embargo, en la práctica se recomienda su interpretación porque es evidencia en favor o en contra de que valió la pena el esfuerzo de controlar el factor de bloque. Si resulta significativa significa que el factor de bloque si tiene influencia sobre la variable respuesta, y debe ser tomado en cuenta para mejorar la calidad de ésta.
6. (7) Explique por qué se utiliza el adjetivo azar en el nombre del diseño en bloques completos al azar. Porque aunque es imposible aleatorizar de bloque a bloque, si se aleatoriza dentro del mismo bloque, y también se aleatorizan los tratamientos. La imposibilidad de aleatorizar de bloque a bloque se aprecia claramente cuando se bloquean factores como día o turno, ya que no tiene sentido pensar en seleccionar al azar el orden de los días o los turnos porque es imposible regresar en el tiempo.
7. (10) Se hace un estudio sobre la efectividad de tres maracas de atomizador para matar moscas. Para ello cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hicieron seis réplicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta fuente de variación. Los datos obtenidos se muestran a continuación: Marca de atomizador 1 2 3
1 72 55 64
Número de réplica (día) 2 3 4 5 65 67 75 62 59 68 70 53 74 61 58 51
6 73 50 69
a) Suponiendo un DBCA, formule las hipótesis adecuadas y el modelo estadístico.
Modelo: {
}
Hipótesis: Tratamiento
para algún
b) ¿Existe diferencia entre la efectividad promedio de los atomizadores? Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3
Cuenta 6 6 6
Columna 1 Columna 2 Columna 3 Columna 4 Columna 5 Columna 6
3 3 3 3 3 3
Suma Promedio Varianza 414 69 26 355 59.1666667 66.9666667 377 62.8333333 66.1666667 191 198 196 203 166 192
63.6666667 66 65.3333333 67.6666667 55.3333333 64
72.3333333 57 14.3333333 76.3333333 34.3333333 151
ANÁLISIS DE VARIANZA Origen de las variaciones Tratamiento Bloques Error Total
Suma de Grados de cuadrados libertad 296.333333 2 281.333333 5 514.333333 10 1092
Promedio Valor de los crítico para cuadrados F Probabilidad F 148.166667 2.88075178 0.10280442 4.10282102 56.2666667 1.09397278 0.42071775 3.32583453 51.4333333
17
Como entonces se acepta, es decir que no existe diferencia significativa entre los atomizadores para matar moscas.
c) ¿Hay algún atomizador mejor? Argumente su respuesta. En base al análisis anterior se concluye que no existe diferencia significativa entre los atomizadores. Entonces no hay ningún atomizador mejor
d) ¿Hay diferencias significativas en los resultados de diferentes días en qué se realizó el experimento? Argumente su respuesta. Hipótesis: Bloques
para algún
Como entonces se acepta, es decir que no existe diferencia significativa entre los bloques, es decir, los días en que se realizó la prueba.
e) Verifique los supuestos de normalidad y de igual varianza entre las maracas. Normalidad
(
)
[∑
(
)]
i
Datos en orden
Coeficientes Shapiro-Wilks
xn-i+j-xi
ai(xn-i+j-xi)
1 2 3 4 5
50 51 53 55 58
0.4886 0.3253 0.2553 0.2027 0.1587
25 23 20 17 12
12.215 7.4819 5.106 3.4459 1.9044
59 61 62 64 65 67 68 69 70 72 73 74 75
6 7 8 9 10 11 12 13 14 15 16 17 18
0.1197 0.0837 0.0496 0.0163
10 7 5 1 Σ
1.197 0.5859 0.248 0.0163 32.2004
64.235 Entonces
0.9495
Y de tablas Por lo tanto si
0.982 la hipótesis nula se acepta. Es una distribución normal.
Varianza constante Como los datos tienen una distribución normal se utiliza el estadístico de Bartlett.
para algún
Dónde:
(
(
)
) ∑
)
[∑(
) ]
)
∑(
(
(
)
Para tratamiento: si2
log si2
26 66.9666667 66.1666667 Σ 159.133333 (
)
(
) ( )
1.41497335 1.82585868 1.82063926 5.06147129
21.2178 ( )(
(
)
)
9.7775
1.0944 20.571
De tablas
5.991
Por lo tanto, como
entonces, la hipótesis nula se rechaza, esto quiere decir que no
existe Homocedasticidad en los datos.
Para bloque: Σ si2 log
72.3333333
si2
57 14.3333333 76.3333333 34.3333333
1.85933848 1.75587486
(
)
(
) ( )
(
( )( )
151 405.333333
1.1563472 1.88271423 1.53571597 2.17897695 10.3689677
135.1111 )
-19.8845
1.0178 - 44.9862
De tablas
11.070
Por lo tanto, como entonces, la hipótesis nula se acepta, esto quiere decir que hay homogeneidad de varianza en los datos con respecto a los bloques.
Independencia El método analítico de comprobar el supuesto de independencia se realiza con la prueba DurbinWatson. (
∑
1 2 3 4 5 6 7 8 9 10 11 12 13
)
( ∑
) ( )
Datos
yi
ei
ei2
(ei-ei-1)2
72 65 67 75 62 73 55 59 68 70 53 50 64
69.000 69.000 69.000 69.000 69.000 69.000 59.167 59.167 59.167 59.167 59.167 59.167 62.833
-3.00 4.00 2.00 -6.00 7.00 -4.00 4.17 0.17 -8.83 -10.83 6.17 9.17 -1.17
9.00 16.00 4.00 36.00 49.00 16.00 17.36 0.03 78.03 117.36 38.03 84.03 1.36
49 4 64 169 121 66.6944444 16 81 4 289 9 106.777778
14 15 16 17 18
74 61 58 51 69
62.833 62.833 62.833 62.833 62.833
-11.17 1.83 4.83 11.83 -6.17 Σ
124.69 3.36 23.36 140.03 38.03 795.667
100 169 9 49 324 1630.472
2.049 De las tablas obtenemos para p=2,
y
Por lo tanto, siendo que
, es decir no existe correlación entre los datos.
se acepta
8. (12) Se diseñó un experimento para estudiar el rendimiento de cuatro detergentes. Las siguientes lecturas de “blancura” se obtuvieron con un equipo especial diseñado para 12 cargas de lavado, distribuidas en tres modelos de lavadoras: Detergente
A B C D
Lavadora 1 45 47 50 42
Lavadora 2 43 44 49 37
Lavadora 3 51 52 57 49
a) Señale el nombre del diseño experimental utilizado. Diseño en bloques completos al azar. {
}
b) Formule la hipótesis que se quiere probar en este problema. Tratamiento:
para algún Bloques:
para algún
c) Realice el análisis estadístico más apropiado para estos datos y obtenga conclusiones. Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4
Cuenta 3 3 3 3
Columna 1 Columna 2 Columna 3
4 4 4
Suma Promedio Varianza 139 46.3333333 17.3333333 143 47.6666667 16.3333333 156 52 19 128 42.6666667 36.3333333 184 173 209
46 11.3333333 43.25 24.25 52.25 11.5833333
ANÁLISIS DE VARIANZA Origen de las variaciones
Suma de cuadrados
Tratamiento 133.666667
Grados de libertad
Promedio de los cuadrados
F
Valor Probabilidad crítico para F
3 44.5555556 34.1276596 0.00036333 4.75706266
Bloque Error
170.166667 7.83333333
Total
311.666667
2 85.0833333 65.1702128 6 1.30555556
8.5228E-05 5.14325285
11
En tratamiento: Dado que , la hipótesis nula es rechazada, esto quiere decir que si existe diferencia significativa entre los diferentes tipos de detergentes. En bloque: Como , la hipótesis nula se rechaza, esto se interpreta en que la lavadora que se utilice si tiene influenza en el resultado del tratamiento (detergente).
9. (15) Un aspecto crítico para que se conserve la leche es la temperatura de almacenamiento. De manera tradicional se han usado termómetros de mercurio (Mer) para verificar que la temperatura sea la adecuada, pero ahora se han comprado termómetros electrónicos (Rtd) para facilitar el proceso de medición. Sin embrago, se duda de las mediciones de estos nuevos dispositivos. Para aclarar dudas y diagnosticar la situación, durante cinco días se toman mediciones con ambos tipos de termómetros en varios silos (a la misma hora). Los datos para cinco silos se muestran a continuación: Silo
A B C D E
Día 1 Mer Rtd 4.0 2.6 5.0 6.4 4.5 3.3 2.5 3.1 4.0 0.0
Día 2 Mer Rtd 4.0 2.8 6.0 6.4 4.0 1.4 4.0 5.0 4.0 0.4
Día 3 Mer Rtd 5.0 5.0 2.0 2.3 3.5 1.8 6.5 6.6 3.5 0.6
Día 4 Mer Rtd 0.5 0.0 4.0 4.2 2.0 -1.9 4.5 2.7 2.0 -4.0
Día 5 Mer Rtd 3.0 2.4 4.0 4.0 3.0 -7.6 4.0 6.3 4.0 -6.3
a) Observe los datos y establezca una conjetura acerca de la confiabilidad de las mediciones con Rtd (del termómetro de mercurio no hay duda). A primera vista, si comparamos el termómetro de Mer con el Rtd se aprecian diferencias grandes, incluso el termómetro Rtd marca temperaturas inferiores a 0°C, cosa que nunca sucede con el otro termómetro.
b) Es claro que el silo se puede ver como tratamiento y día como bloque. Considere sólo los datos de Rtd y establezca el modelo estadístico. También haga el ANOVA correspondiente y obtenga conclusiones. El tipo de análisis sería Diseño en bloques completos al azar (DBCA), cuyo modelo es: {
Hipótesis: Tratamiento:
para algún Bloques:
para algún
Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5 Columna 1 Columna 2 Columna 3 Columna 4 Columna 5
Cuenta 5 5 5 5 5
Suma 12.8 23.3 -3 23.7 -9.3
Promedio 2.56 4.66 -0.6 4.74 -1.86
Varianza 3.148 3.068 18.915 3.203 9.728
5 5 5 5 5
15.4 16 16.3 1 -1.2
3.08 3.2 3.26 0.2 -0.24
5.197 6.18 6.078 11.085 39.653
}
ANÁLISIS DE VARIANZA Origen de las variaciones Filas Columnas Error
Promedio Valor Suma de Grados de de los crítico para cuadrados libertad cuadrados F Probabilidad F 182.532 4 45.633 8.09095745 0.00091159 3.00691728 62.008 4 15.502 2.74858156 0.06486529 3.00691728 90.24 16 5.64
Total
334.78
24
En tratamiento: Dado que diferente.
, la hipótesis se rechaza, esto significa que la temperatura en los silos es
En bloque: Como , la hipótesis nula se acepta, esto se interpreta en que el día no tiene un efecto en la medición de la temperatura.
c) Repita el inciso anterior pero ahora para las mediciones Mer. El tipo de análisis sería Diseño en bloques completos al azar (DBCA), cuyo modelo es: {
Hipótesis: Tratamiento:
para algún Bloques:
para algún
}
Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5
Cuenta
Columna 1 Columna 2 Columna 3 Columna 4 Columna 5
5 5 5 5 5
Suma 16.5 21 17 21.5 17.5
Promedio 3.3 4.2 3.4 4.3 3.5
Varianza 2.95 2.2 0.925 2.075 0.75
5 5 5 5 5
20 22 20.5 13 18
4 4.4 4.1 2.6 3.6
0.875 0.8 2.925 2.675 0.3
ANÁLISIS DE VARIANZA Origen de las variaciones Filas Columnas Error
Promedio Valor Suma de Grados de de los crítico para cuadrados libertad cuadrados F Probabilidad F 4.46 4 1.115 0.69040248 0.60921239 3.00691728 9.76 4 2.44 1.51083591 0.24602212 3.00691728 25.84 16 1.615
Total
40.06
24
En tratamiento: Dado que es diferente.
, la hipótesis se acepta, esto significa que la temperatura en los silos no
En bloque: Como , la hipótesis nula se acepta, esto se interpreta en que el día no tiene un efecto en la medición de la temperatura.
d) ¿Las conclusiones obtenidas en los incisos anteriores coinciden? Comente su respuesta. No las conclusiones con respecto a los tratamientos (silos) fue distinta, en el caso del termómetro Rtd había variación en los silos; mientras que con el termómetro Mer, eso no se detectó, los silos
eran estadísticamente iguales. Esto quiere decir que los termómetros son distintos entre sí, ya que muestran conclusiones diferentes.
e) Datos pareados. Para comprara los dos métodos de medición (Mer y Rtd) obtenga como variable de respuesta a la diferencia de temperaturas que registran los métodos para cada día en cada silo. Considerando esto, establezca el modelo estadístico, haga el ANOVA correspondiente y obtenga conclusiones. Para |MER-RTD| Día 1 Silo Dif.
Día 2
Día 3
Día 4
Día 5
Dif.
Dif.
Dif.
Dif.
A
1.4
1.2
0
0.5
0.6
B
1.4
0.4
0.3
0.2
0
C
1.2
2.6
1.7
3.9
10.6
D
0.6
1
0.1
1.8
2.3
E
4
3.6
2.9
6
10.3
El tipo de análisis sería Diseño en bloques completos al azar (DBCA), cuyo modelo es: {
Hipótesis: Tratamiento:
para algún Bloques:
para algún
}
Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5
Cuenta
Columna 1 Columna 2 Columna 3 Columna 4 Columna 5
5 5 5 5 5
Suma 3.7 2.3 20 5.8 26.8
Promedio 0.74 0.46 4 1.16 5.36
Varianza 0.318 0.298 14.665 0.793 8.953
5 5 5 5 5
8.6 8.8 5 12.4 23.8
1.72 1.76 1 2.48 4.76
1.732 1.708 1.6 5.997 27.703
ANÁLISIS DE VARIANZA Origen de las variaciones Filas Columnas Error
Promedio Valor Suma de Grados de de los crítico para cuadrados libertad cuadrados F Probabilidad F 96.8136 4 24.2034 6.65998927 0.00235744 3.00691728 41.9616 4 10.4904 2.88661723 0.05639643 3.00691728 58.1464 16 3.63415
Total
196.9216
24
En tratamiento: Dado que , la hipótesis nula se rechaza esto se interpreta en que, la diferencia entre las temperaturas de los termómetros, en los silos es diferente, es decir, hay diferencias entre cada tratamiento. En bloque: Como , la hipótesis nula se acepta, esto se interpreta en que el día no tiene un efecto en la medición de la temperatura. En conclusión, se puede inferir por los resultados en los incisos anteriores, que el termómetro Rtd es diferente al termómetro Mer, y considerando que sobre éste último no hay duda de su funcionamiento, entonces, el termómetro Rtd, está dañado y no registra las temperaturas correctas.
10. (16) Se requiere estudiar el efecto de cinco catalizadores diferentes (A, B, C, D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material sólo permite cinco corridas y cada corrida requiere aproximadamente 1.5 horas, por lo que sólo se pueden realizar cinco corridas diarias. El experimentador decide correr los experimentos con un diseño en cuadro latino para controlar activamente a los lotes y días. Los datos obtenidos son:
Lote
1 2 3 4 5
1 A=8 C=11 B=4 D=6 E=4
2 B=7 E=2 A=9 C=8 D=2
Día 3 D=1 A=7 C=10 E=6 B=3
4 C=7 D=3 E=1 B=6 A=8
5 E=3 B=8 D=5 A=10 C=8
a) ¿Cómo se aleatorizó el experimento? Primero se construyó el cuadro latino estándar, y después se aleatoriza el orden de los renglones, y después el de las columnas. La regla fundamental es que cada letra debe aparecer sólo una vez en cada renglón y en cada columna.
b) Anote la ecuación del modelo y las hipótesis estadísticas correspondientes. El tipo de análisis es Diseño en cuadro latino (DCL), cuyo modelo es:
Hipótesis: Tratamiento:
para algún Bloque 1:
para algún
Bloque 2:
para algún
c) ¿Existen diferencias entre los tratamientos? ¿Cuáles tratamientos son diferentes entre sí? Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5
Cuenta
Suma 5 5 5 5 5
26 31 29 36 25
Promedio 5.2 6.2 5.8 7.2 5
Varianza 9.2 13.7 13.7 3.2 8
Columna 1 Columna 2 Columna 3 Columna 4 Columna 5
5 5 5 5 5
33 28 27 25 34
6.6 5.6 5.4 5 6.8
8.8 11.3 12.3 8.5 7.7
sA= sB= sC= sD= sE=
5 5 5 5 5
42 28 44 17 16
8.4 5.6 8.8 3.4 3.2
1.3 4.3 2.7 4.3 3.7
ANÁLISIS DE VARIANZA Origen de Promedio las Suma de Grados de de los variaciones cuadrados libertad cuadrados Tratamiento 141.44 4 35.36 Días (B1) 12.24 4 3.06 Lotes (B2) 15.44 4 3.86 Error 37.52 12 3.1267 Total
206.64
24
Valor crítico para F F 11.3092 3.26 0.9787 3.26 1.2345 3.26
En tratamiento: Dado que diferentes entre sí.
, la hipótesis nula se rechaza, es decir, los tratamientos (catalizadores) son
En bloque 1: Como catalizadores.
, la hipótesis nula se acepta, es decir, en que el día no tiene un efecto en los
En bloque 2: Como , la hipótesis nula se acepta, es decir, que el número de lote no tiene eecto sobre el catalizador.
d) ¿Los factores de ruido, lote y día afectan el tiempo de reacción del proceso? No, lo efectos de ruido (lote y día) no tienen influencia significativa sobre la reacción del procesos (catalizadores), es decir no influyen en los resultados de los tratamientos.
e) Dibuje los gráficos de medias para los tratamientos, los lotes y los días. ¿Cuál tratamiento es mejor?
Hipótesis:
⁄ (
⁄ (
)(
2.1788128
)
3.12667
√ (
)
2.4366
)(
)√
Utilizando LSD LSD
µi-µj µA
µB
µA µA
µC µD
µA µB
µE µC
µB µB
µD µE
µC µC
µD µE
µD
µE
H0
2.8 0.4
> <
2.43663628 2.43663628
5 5.2
> >
2.43663628 2.43663628
3.2 2.2
> <
2.43663628 2.43663628
2.4 5.4
< >
2.43663628 2.43663628
5.6 0.2
> <
2.43663628 2.43663628
En base a esta comparación los catalizadores E, D y B son estadísticamente iguales y los que resultan mejores, ya que el tempo de reacción es menor.
f)
Verifique los supuestos del modelo, considerando que los datos se obtuvieron columna por columna, día por día.
Normalidad
(
i 1 2 3 4 5
yij
ai 1 1 2 2 3
0.4450 0.3069 0.2543 0.2148 0.1822
)
xn-i+1-xi 24 23 21 20 18
[∑
(
ai(xn-i+1-xi) 10.6800 7.0587 5.3403 4.2960 3.2796
)]
6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
3 3 4 4 5 6 6 6 7 7 7 8 8 8 8 8 9 10 10 11
0.1539 0.1283 0.1046 0.0823 0.0610 0.0403 0.0200 0.0000
17 16 14 13 11 9 8 7 Σ
2.6163 2.0528 1.4644 1.0699 0.6710 0.3627 0.1600 0.0000 39.0517
8.61 Entonces
7.3802
Y de tablas Por lo tanto si distribución normal.
0.985 la hipótesis nula se rechaza. Estos datos no provienen de una
Varianza constante Como los datos no tienen una distribución normal se utiliza el estadístico de Levine. Para tratamiento:
para algún
Desviaciones de cada valor respecto a la media (tratamiento) 0.4 1.4 1.8 2.4 0.2 1.4 2.4 2.2 0.4 1.2 0.6 1.6 1.2 1.6 2.2 1.6 0.4 0.8 2.6 2.8 0.4 2.6 0.8 1.4 0.8
Análisis de varianza de un factor RESUMEN Grupos Columna 1 Columna 2 Columna 3 Columna 4 Columna 5
Cuenta 5 5 5 5 5
Suma 4.4 8.4 6.8 8.4 7.2
Promedio 0.88 1.68 1.36 1.68 1.44
Varianza 0.332 0.772 0.388 0.772 1.108
ANÁLISIS DE VARIANZA Promedio Origen de las Suma de Grados de de los variaciones cuadrados libertad cuadrados Tratamientos 2.1504 4 0.5376 Error 13.488 20 0.6744 Total
15.6384
Valor crítico para F Probabilidad F 0.797 0.54104084 2.8660814
24
Por lo tanto si la hipótesis nula se acepta. Por lo tanto si existe homogeneidad de varianza con respecto a los tratamientos.
Para bloque 1 (Días):
para algún
Desviaciones de cada valor respecto a la media (Días) 1.4 1.4 4.4 2.0 3.8 4.4 3.6 1.6 2.0 1.2 2.6 3.4 4.6 4.0 1.8 0.6 2.4 0.6 1.0 3.2 2.6 3.6 2.4 3.0 1.2
Análisis de varianza de un factor RESUMEN Grupos Columna 1 Columna 2 Columna 3 Columna 4 Columna 5
Cuenta 5 5 5 5 5
Suma 11.6 14.4 13.6 12 11.2
Promedio 2.32 2.88 2.72 2.4 2.24
Varianza 2.072 0.932 3.052 1.3 1.428
ANÁLISIS DE VARIANZA Origen de las variaciones Entre grupos Dentro de los grupos Total
Grados Promedio Valor Suma de de de los crítico para cuadrados libertad cuadrados F Probabilidad F 1.5104 4 0.3776 0.21493625 0.92702704 2.8660814 35.136
20
36.6464
24
1.7568
Por lo tanto si la hipótesis nula se acepta. Por lo tanto si existe homogeneidad de varianza con respecto al día.
Para bloque 2 (Lotes):
para algún
Desviaciones de cada valor con respecto a la media (Lotes) 2.8 1.8 4.2 1.8 2.2 4.8 4.2 0.8 3.2 1.8 1.8 3.2 4.2 4.8 0.8 1.2 0.8 1.2 1.2 2.8 1.0 3.0 2.0 3.0 3.0
Análisis de varianza de un factor RESUMEN Grupos Fila 1 Fila 2 Fila 3 Fila 4 Fila 5
Cuenta 5 5 5 5 5
Suma 12.8 14.8 14.8 7.2 12
Promedio 2.56 2.96 2.96 1.44 2.4
Varianza 1.008 2.748 2.748 0.608 0.8
ANÁLISIS DE VARIANZA Origen de las variaciones Entre grupos Dentro de los grupos Total
Grados Promedio Valor Suma de de de los crítico para cuadrados libertad cuadrados F Probabilidad F 7.7696 4 1.9424 1.22750253 0.33073341 2.8660814 31.648
20
39.4176
24
1.5824
Por lo tanto como la hipótesis nula se acepta. Por lo tanto si existe homogeneidad de varianza con respecto a los lotes.
Independencia El método analítico de comprobar el supuesto de independencia se realiza con la prueba DurbinWatson. (
∑
Datos
yi 8 9 7 8 10 4 7 3 6 8 11 8 10 7 8 6 2 1 3 5 4 2 6 1 3
8.4 8.4 8.4 8.4 8.4 5.6 5.6 5.6 5.6 5.6 8.8 8.8 8.8 8.8 8.8 3.4 3.4 3.4 3.4 3.4 3.2 3.2 3.2 3.2 3.2
)
( ∑
) ( )
ei
ei2
(ei-ei-1)2
0.40 -0.60 1.40 0.40 -1.60 1.60 -1.40 2.60 -0.40 -2.40 -2.20 0.80 -1.20 1.80 0.80 -2.60 1.40 2.40 0.40 -1.60 -0.80 1.20 -2.80 2.20 0.20 Σ
0.16 0.36 1.96 0.16 2.56 2.56 1.96 6.76 0.16 5.76 4.84 0.64 1.44 3.24 0.64 6.76 1.96 5.76 0.16 2.56 0.64 1.44 7.84 4.84 0.04 65.200
1.0 4.0 1.0 4.0 10.2 9.0 16.0 9.0 4.0 0.0 9.0 4.0 9.0 1.0 11.6 16.0 1.0 4.0 4.0 0.6 4.0 16.0 25.0 4.0 167.480
2.5687 De las tablas obtenemos para p=2,
y
Por lo tanto, siendo que
se acepta
, es decir no existe correlación entre los datos.
11. (21) Se quieren comparar tres dietas (A, B, C) a base de proteínas de origen vegetal utilizando 18 ratas de laboratorio de una misma camada. Primero se observa por un tiempo el apetito para formar tres grupos de seis ratas, según su voracidad; y cada uno de estos grupos se clasifica a su vez en tres grupos de dos ratas, de acuerdo a su peso inicial. Se plantea un experimento donde la variable de respuesta es el peso en gramos ganado por las ratas después de cierto período, con los siguientes resultados: Apetito/ Peso inicial
A1
A2
A3
67 72
(C)
105 112
(A)
95 86
(B)
P1
(A)
75 67
(B)
88 110
(C)
P2
85 98
(B)
68 91
(C)
108 120
(A)
P3
66 47
a) Analice los datos. ¿Cuáles factores influyen en el peso ganado por las ratas? El tipo de análisis es Diseño en cuadro latino (DCL), cuyo modelo es:
Hipótesis: Tratamiento:
para algún Bloque 1:
para algún
Bloque 2:
para algún
Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN
Cuenta
A B C
3 3 3
Suma Promedio Varianza 628 209.333333 550.333333 436 145.333333 1164.33333 496 165.333333 900.333333
Fila 1 Fila 2 Fila 3
3 3 3
537 179 1524 523 174.333333 840.333333 500 166.666667 3350.33333
Columna 1 Columna 2 Columna 3
3 3 3
435 145 1252 518 172.666667 1546.33333 607 202.333333 566.333333
ANÁLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Tratamiento 6432 2 Peso inicial (B1) 232.666667 2 Voracidad (B2) 4932.66667 2 Error 64.6666667 2 Total
11662
Promedio Valor de los crítico para cuadrados F F 3216 99.4639175 6.94427191 116.333333 3.59793814 6.94427191 2466.33333 76.2783505 6.94427191 32.3333333
8
En tratamiento: Dado que diferentes entre sí.
, la hipótesis nula se rechaza, es decir, los tratamientos (dietas) son
En bloque 1: Como el resultado.
, la hipótesis nula se acepta, es decir, que el peso inicial no tiene un efecto en
En bloque 2: Como , la hipótesis nula se rechaza, es decir, que la voracidad de las ratas si es un factor que influye en los resultados.
b) ¿Cuál dieta es mejor? Utilizando LSD LSD
µi-µj µA µA
µB µC
µB
µC
64 44 20
> > >
19.9763391 19.9763391 19.9763391
H0
Por lo tanto, se puede concluir que la dieta B es la mejor, ya que el incremento de peso es el menor.
c) ¿Alguno de los factores de bloque puede ser ignorado? Argumente su respuesta. Como el peso inicial no tiene influencia en los resultados, este factor de bloque puede ser ignorado. d) Si ése fuera el caso, analice de nuevo el experimento y saque conclusiones. Hipótesis: Tratamiento:
para algún
Bloques
para algún Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3
Cuenta
Columna 1 Columna 2 Columna 3
3 3 3
Suma Promedio Varianza 628 209.333333 550.333333 436 145.333333 1164.33333 496 165.333333 900.333333
3 3 3
435 145 1252 518 172.666667 1546.33333 607 202.333333 566.333333
ANÁLISIS DE VARIANZA Origen de Promedio Valor las Suma de Grados de de los crítico para variaciones cuadrados libertad cuadrados F Probabilidad F Filas 6432 2 3216 43.264574 0.00195228 6.94427191 Columnas 4932.66667 2 2466.33333 33.1793722 0.00323209 6.94427191 Error 297.333333 4 74.3333333 Total
11662
8
En tratamiento: Dado que diferentes entre sí.
, la hipótesis nula se rechaza, es decir, los tratamientos (dietas) son
En bloque: Como
, la hipótesis nula se rechaza, es decir, que él apetito si influye en el resultado.
Es decir los resultados siguen siendo los mismos.
e) Verifique los supuestos del modelo. Normalidad
(
)
[∑
i
Datos en orden
Coeficientes ShapiroWilks
xn-i+j-xi
1 2 3 4 5
50 51 53 55 58
0.5888 0.3244 0.1976 0.0947
14 11 8 4
6 7 8 9
59 61 62 64
Entonces Y de tablas
0.00644 0.978
)]
ai(xn-i+j-xi)
Σ
3680.125
(
8.2432 3.5684 1.5808 0.3788 13.7712
Por lo tanto si distribución normal.
la hipótesis nula se acepta. Estos dato provienen de una
Varianza constante Como los datos tienen una distribución normal se utiliza el estadístico de Bartlett.
para algún
Dónde:
(
(
)
[∑(
) ∑
(
∑( )
)
(
)
) ]
Para tratamiento: si2
log si2
550.333333 1164.33333 900.333333 Σ 2615
2.74062582 3.06607733 2.95440333 8.76110648
log sp2= 2.94035044
sp2= 871.666667 q= -5212.3579 c= 1.05555556 χ2= 11370.2924
De tablas
5.991
Por lo tanto, como entonces, la hipótesis nula se rechaza, esto quiere decir que no existe Homocedasticidad en los datos.
Para bloque: Σ si2 log
si2
1252 1546.33333 566.333333 3364.66667 3.09760433 3.18930312 2.75307212 9.03997957
sp2= q= c=
1121.55556 0.2189656 1.11111111
χ2=
0.45377118
De tablas
log sp2=
3.04982079
5.991
Por lo tanto, como entonces, la hipótesis nula se acepta, esto quiere decir que hay homogeneidad de varianza en los datos con respecto a los bloques.
Independencia El método analítico de comprobar el supuesto de independencia se realiza con la prueba DurbinWatson. (
∑
)
( ∑
) ( )
independencia Datos 1 2 3
yi
183 209.333333 217 209.333333 228 209.333333
ei
ei2
(ei-ei-1)2
-26.33 7.67 18.67
693.44 58.78 348.44
1156 121
4 5 6 7 8 9
113 142 181 139 159 198
145.333333 145.333333 145.333333 165.333333 165.333333 165.333333
-32.33 -3.33 35.67 -26.33 -6.33 32.67 Σ
1045.44 11.11 1272.11 693.44 40.11 1067.11 5230.000
2601 841 1521 3844 400 1521 12005.000
2.2954 De las tablas no viene el valor correspondiente, para concluir el método analítico. Gráficamente: en base al valor de
y
, por lo tanto, no se pudo
se puede concluir que no hay correlación entre los datos.
12. (23) Un investigador está interesado en el efecto del porcentaje de lisina y del porcentaje de proteína en la producción de vacas lecheras. Se consideran siete niveles en cada factor.
% de lisina: 0.0 (A), 0.1 (B), 0.2 (C), 0.3 (D), 0.4 (E), 0.5 (F), 0.6 (G).
% de proteína: 2 (α), 4 (β), 6 (χ), 8 (δ), 10 (ε), 12 (φ), 14 (γ).
Para el estudio se seleccionan siete vacas al azar, a las cuales se les da un seguimiento de siete períodos de tres meses. Los datos en galones de leche fueron los siguientes:
Vaca/ período 1 2 3 4 5 6 7
1
2
3
4
5
6
7
304 (Aα) 381 (Bβ) 432 (Cχ) 442 (Dδ) 496 (Eε) 534 (Fφ) 543 (Gγ)
436 (Bε) 505 (Cφ) 566 (Dγ) 372 (Eα) 449 (Fβ) 421 (Gχ) 386 (Aδ)
350 (Cβ) 425 (Dχ) 479 (Eδ) 536 (Fε) 493 (Gφ) 352 (Aγ) 435 (Bα)
504 (Dφ) 564 (Eγ) 357 (Fα) 366 (Gβ) 345 (Aχ) 427 (Bδ) 485 (Cε)
417 (Eχ) 494 (Fδ) 461 (Gε) 495 (Aφ) 509 (Bγ) 346 (Cα) 406 (Dβ)
519 (Fγ) 350 (Gα) 340 (Aβ) 425 (Bχ) 481 (Cδ) 478 (Dε) 554 (Eφ)
432 (Gδ) 413 (Aε) 502 (Bφ) 507 (Cγ) 380 (Dα) 397 (Eβ) 410 (Fχ)
a) Analice este experimento. ¿Qué factores tienen efecto en la producción de leche? Se utiliza un análisis de diseño en cuadro greco-latino (DCGL) Modelo:
Hipótesis: % Lisina:
para algún % Proteína:
para algún
Vaca:
para algún
Período:
para algún
A B C D E F G
α 304 435 346 380 372 357 350
Β 340 381 350 406 397 449 366
Χ 345 425 432 425 417 410 421
δ 386 427 481 442 479 494 432
Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5 Fila 6 Fila 7 Columna 1 Columna 2 Columna 3 Columna 4 Columna 5 Columna 6 Columna 7
Cuenta 7 7 7 7 7 7 7
Suma 2635 3115 3106 3201 3279 3299 3066
Promedio 376.428571 445 443.714286 457.285714 468.428571 471.285714 438
Varianza 3940.95238 2057.66667 4887.2381 4051.57143 5728.95238 4704.57143 4638.66667
7 7 7 7 7 7 7
2544 2689 2875 3141 3305 3587 3560
363.428571 384.142857 410.714286 448.714286 472.142857 512.428571 508.571429
1587.95238 1383.80952 887.571429 1456.57143 1629.14286 518.285714 5363.61905
Ε 413 436 485 478 496 536 461
φ 495 502 505 504 554 534 493
γ 352 509 507 566 564 519 543
Vaca/ período
1
2
3
4
5
6
7
1 2 3 4 5 6 7
304 381 432 442 496 534 543
436 505 566 372 449 421 386
350 425 479 536 493 352 435
504 564 357 366 345 427 485
417 494 461 495 509 346 406
519 350 340 425 481 478 554
432 413 502 507 380 397 410
F 7.2322 24.6598 1.4799 0.2977
Valor crítico para F 2.51 2.51 2.51 2.51
Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Fila 1 Fila 2 Fila 3 Fila 4 Fila 5 Fila 6 Fila 7 Columna 1 Columna 2 Columna 3 Columna 4 Columna 5 Columna 6 Columna 7
Cuenta 7 7 7 7 7 7 7
Suma 2962 3132 3137 3143 3153 2955 3219
Promedio 423.142857 447.428571 448.142857 449 450.428571 422.142857 459.857143
Varianza 5925.47619 5777.61905 6361.80952 4415.33333 4055.28571 4501.14286 4644.47619
7 7 7 7 7 7 7
3132 3135 3070 3048 3128 3147 3041
447.428571 447.857143 438.571429 435.428571 446.857143 449.571429 434.428571
7373.28571 4611.14286 4937.61905 7151.61905 3555.80952 6674.28571 2542.95238
ANÁLISIS DE VARIANZA Origen de Promedio las Suma de Grados de de los variaciones cuadrados libertad cuadrados % Lisina 42783.551 6 7130.5918 %Proteína 145879.551 6 24313.2585 Vaca 8754.408 6 1459.0680 Período 1760.980 6 293.4966 Error 23662.776 24 985.9490
Total
222841.265
48
En %Lisina: Dado que , la hipótesis nula se rechaza, es decir, el porcentaje de lisina no es igual para cada nivel, es decir, si tiene un efecto significativo. En % Proteína: Como , , la hipótesis nula se rechaza, lo que significa que, el porcentaje de proteína si tiene un efecto en la producción de vacas lecheras. Vaca: Como , la hipótesis nula se acepta, es decir, que la vaca (que vaca es) no es un factor que influye en los resultados. Período: Como , la hipótesis nula se acepta, es decir, que el período tampoco es un factor que influye en los resultados.
b) Interprete los datos usando gráficos de medias.
c) ¿Cómo puede explicar la falta de efectos en vacas y período? Estos factores que no influyen en la producción de las vacas.
d) ¿Qué porcentajes de lisina y proteína dan los mejores resultados? Utilizando diferencias mínimas significativas Utilizando LSD LSD
µi-µj 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
µA µA
µB µC
µA µA
µD µE
µA µA
µF µG
µB µB
µC µD
µB µB µB µC µC µC µC µD
µE µF µG µD µE µF µG µE
µD µD
µF µG
µE µE
µF µG
µF
µG
68.571
>
33.872
67.286 80.857 92.000 94.857 61.571 1.286 12.286 23.429
> > > > > < < <
33.872 33.872 33.872 33.872 33.872 33.872 33.872 33.872
26.286 7.000
< <
33.872 33.872
13.571 24.714
< <
33.872 33.872
27.571 5.714 11.143 14.000 19.286 2.857 30.429 33.286
< < < < < < < <
33.872 33.872 33.872 33.872 33.872 33.872 33.872 33.872
H0
Entonces se concluye que el porcentaje de lisina A es el que proporciona menor producción de las vacas, pero el resto son significativamente iguales.
e) Verifique los supuestos del modelo. Normalidad
Homogeneidad de varianza
Independencia
II.
Problemas marcados con asterisco
1. (2) Un equipo de especialistas en remotivación, en un hospital psiquiátrico, condujo un experimento para comprobar cinco métodos para remotivar a los pacientes. Estos fueron agrupados de acuerdo con el nivel de motivación inicial. En cada grupo, los pacientes fueron asignados al azar a los cinco métodos. Al final del periodo experimental, un equipo de trabajo formado por un psiquiatra, un psicólogo, una enfermera y un trabajador social evaluaron a los pacientes. Ningún miembro del equipo de evaluación sabia de los métodos que fueron asignados a los pacientes. El equipo asignó a cada paciente una calificación como medida de su nivel de motivación. Los resultados fueron los siguientes: Nivel de motivación inicial Nulo Muy bajo Bajo Promedio
Método de motivación A B C D E 58 68 60 68 64 62 70 65 80 69 67 78 68 81 70 70 81 70 89 74
¿Proporcionan estos datos evidencia suficiente que indique una diferencia en las calificaciones medias entre los métodos? Sea α = 0.05
2. (3) La enfermera supervisora de un departamento de salud local quería analizar el efecto de la hora del día en la duración de las visitas domiciliarias realizadas por el personal de enfermería. Pensaba que las diferencias individuales entre las enfermeras podían ser grandes, por lo que utilizó a las enfermeras como un factor de formación de bloques. Recolecto además los siguientes datos:
Enfermera A B C D
Duración de la visita domiciliaria Temprano En la A medio Por la por la mañana día tarde tarde 27 28 30 23 31 30 27 20 35 38 34 30 20 18 20 14
¿Proporcionan estos datos evidencia suficiente para indicar una diferencia en la duración de las visitas domiciliarias en las diferentes horas del día? Sea α = 0.05 3. (5) Se realiza un experimento para investigar el efecto de la temperatura de secado en granos de trigo con la finalidad de mejorar la calidad en el horneado para producir pan. Se utilizaron tres niveles de temperatura y la variable de respuesta medida fue el volumen de la pieza de pan obtenida. Los datos obtenidos fueron los siguientes:
Temperatura (°C) 70.0 75.0 80.0
Volumen (cm3) 1245 1235 1225
1235 1240 1200
1285 1200 1170
1242 1220 1155
1235 1210 1095
a) ¿La temperatura de secado afecta el volumen de pan? Usar un α=0.01 b) Utilizar el método de LSD para determinar la diferencia de medias y cuál es el tratamiento más adecuado que cumple con los fines de obtener un mayor volumen. c) Analizar el cumplimiento de normalidad y homogeneidad de varianzas por los métodos gráficos y matemáticos.
4. (9) Un artículo en “Agricultural Engineering” (diciembre 1964, pp672-673)
describe un experimento en el cual el peso ganado diariamente por los cerdos es evaluado en los diferentes niveles de temperatura de su vivienda. El peso promedio de cada grupo de cerdos al inicio del experimento es considerado como un factor de ruido. Los datos obtenidos de este experimento se muestran a continuación:
Peso (lbs) 100 150 200
Temperatura promedio del aire de la vivienda (°F) 50 60 70 80 90 100 1.37 1.58 2.00 1.97 1.40 0.39 1.47 1.75 2.16 1.82 1.14 -0.19 1.19 1.91 2.22 1.67 0.88 -0.77
a) ¿La temperatura promedio de la vivienda afecta al peso promedio ganado? Usa α=0.05 b) Utiliza el método de LSD de Fisher para determinar qué niveles de temperatura son diferentes. c) Analiza los residuos de este experimento y haz comentarios sobre la adecuación del modelo.
View more...
Comments