(Anova) 2
November 8, 2022 | Author: Anonymous | Category: N/A
Short Description
Download (Anova) 2...
Description
EXPERIMENTOS FACTORIALES ANOVA ANOV A Análisis de la Varianza Varianza
EAAA
1
Comprender la noción general del análisis de varian var iancia cia (AN (ANOV OVA). A). Realizar una prueba de hipótesis para determinar si dos variancias muestrales provienen de las mismas poblaciones o de poblaciones iguales. Establecer y organizar datos en una tabla de ANOVA. ANOV A. Realizar una prueba para determinar si existe diferencia entre tres o más medias de tratamiento. Realizar una prueba de hipótesis para determinar si hay alguna diferencia entre medias de bloques. EAAA
2
EXPERIMENTOS FACTORIALES
Los experimentos son esenciales para desarrollar y mejorar los métodos científicos y de ingeniería. Sólo mediante la experimentación se pueden comparar las diferentes variantes de un método con el fin de comprobar cuál es el más efectivo. Para que sea útil, un experimento se debe diseñar adecuadamente, y los datos que se obtienen de éste se deben analizar en forma correcta. En este capítulo se analizan el diseño y el análisis de datos a partir de una clase de experimentos conocidos como experimentos factoriales. EAAA
3
ANÁLISIS DE LA VARIANZA ANOVA)
Es una potente herramienta estadística, de gran utilidad tanto en la industria, para el control de procesos, como en el laboratorio de análisis, para el control de métodos analíticos .
EAAA
4
Aplicación: -Para la comparación de múltiples columnas de datos -Para la estimación de los componentes de variación de un proceso.
-El análisis análisis de la varianz varianzaa (o Anova: Analysi Analysiss of variance) variance) es un método para comparar dos o más medias.
EAAA
5
EAAA
6
Comparación de múltiples poblaciones La comparación de diversos conjuntos de resultados resu ltados es habitual en los:
Laboratorios analíticos. Así, por ejemplo, puede interesar comparar diversos métodos de análisis con diferentes características, diversos analistas entre sí, o una serie de laboratorios que analizan una misma muestra con el mismo método ensayos colaborativos). También sería el caso cuando queremos analizar una muestra que ha estado sometida a diferentes tratamientos o ha estado almacenada en diferentes condiciones. En todos estos ejemplos hay dos posibles fuentes de variación: una es el error aleatorio en la medida y la otra es lo que se denomina
factor controlado tipo de mé todo, diferentes
cond iciones, analista o laboratorio,...).
Una de las herramientas he rramientas estadísticas más utilizadas que permite la separación de las diversas fuentes de variación es el análisis de la varianza ANOVA, del inglés Analysis of Variance) [Massart, 1997]. EAAA
7
EAAA
8
EAAA
9
EAAA
10
EAAA
11
EAAA
12
EAAA
13
EAAA
14
EAAA
15
EAAA
16
EAAA
17
EAAA
18
EAAA
19
EAAA
20
EAAA
21
EAAA
22
EAAA
23
EAAA
24
EAAA
25
EAAA
26
EAAA
27
EAAA
28
EAAA
29
EAAA
30
a parte del error propio de Cuando tengamos un factor, controlado aleatorio, aparte la medida, hablaremos del ANOVA de unofactor.
En el caso de que estuviésemos desarrollando un nuevo método colorimétrico y quisiéramos investigar la influencia de diversos factores independientes sobre la absorbancia, tales como la concentración de reactivo A y la temperatura a la que tiene lugar la reacción, entonces hablaríamos de un ANOVA de dos factores. En los casos donde tenemos dos o más factores que influyen, se realizan los experimentos para todas las combinaciones de los factores estudiados, seguido del ANOVA. Se puede deducir entonces si cada uno de los factores o una interacción entre ellos tienen influencia significativa en el resultado.
EAAA
Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de hipótesis, aunque se aceptan ligeras desviaciones de las condiciones ideales:
1. Cada conjunto de datos debe ser independiente del resto.
2. Los resultados obtenidos para cada conjunto deben seguir una distribución normal.
3. Las varianzas de cada conjunto de datos no deben diferir de forma significativa.
31
EAAA
32
EAAA
El análisis de la varianza (ANOVA) de un conjunto de muestras consiste en contrastar: La hipótesis nula “todas las medias poblacionales de las que provienen las muestras son iguales”.
Contra
La hipótesis alternativa “no todas las medias son iguales.
Con un nivel de significación a prefijado.
33
EAAA
34
La lógica del ANOV ANOVA A El contraste de hipótesis del ANOVA se basaen comprobar si las medias de las muestras difieren más de lo que cabe esperar cuando es cierta, la hipótesis nula. w Esta cuestión acerca de las medias se responde analizando las varianzas. w
Nos fijamos en las varianzas, porque, cuando queremos saber si algunas medias difieren entre sí, tenemos que valorar la varianza entre estas medias.
EAAA
Dos Fuentes de Variabilidad w En ANOVA, un estimador de la variabilidad entre grupos se compara con la variabilidad dentro de los grupos. 1- La variación Entre Grupos e es s la variacion entre las media medias s de los diferentes tratamientos debidas al azar (error de muestreo ) y al efecto de los tratamientos, si es que existe. 2. La variación Dentro de los Grupos es la variacion debida al azar (error de muestreo) entre individuos a los que se ha dado el mismo tratamiento.
35
EAAA
Variabilidad V ariabilidad Ent Entre re Grupos Hay mucha variabilidad entre las medias. w
Las diferencias entre las medias de los grupos son demasiado grandes para atribuirlas al azar. w Es difícil imaginar que los seis grupos son muestras aleatorias tomadas de la misma población. w Se rechaza la hipótesis nula, es decir decir,, existe efecto del tratamiento al menos en uno de los grupos. w
36
EAAA
37
EAAA
38
ANO VA de un factor factor
Tomemos como ejemplo la comparación de 5 laboratorios queenanalizan nk ve vece ces s con el mismo procedimiento la concentración de Pb una misma muestra de agua de río.
El objetivo del ANOVA aquí es comparar los errores sistemáticos con los aleatorios obtenidos al realizar diversos análisis en cada laboratorio.
Condiciones importantes que cada laboratorio analice sus muestras de manera independiente y con precisiones parecidas a las del resto de laboratorios.
En la tabla 1 se muestran los resultados obtenidos (expresados en mg/L).
EAAA
39
RESULTAD OS 1 2 3 4 5 6 7 VALOR MEDIO n
x
LABORAT 1 2.3 4.1 4.9
LABORAT 2 6.5 4.0 4.2
LABORAT 3 1.7 2.7 4.1
LABORAT 4 2.1 3.8 4.8
LABORAT 5 8.5 5.5 6.1
2.5 3.1 3.7 --
6.3 4.4 ---
1.6 4.1 2.8 --
2.8 4.8 3.7 4.2
8.2 ----
3.4
5.1
2.8
3.7
7.1
6
5
6
7
4
k suma
20.6 25.4 Aritmetica De todos
17.0 26.2 Resultados X= 4.2
28.3
Media
los
X EAAA
40
Observando los valores medios todo parece indicar que existen diferencias entre los laboratorios. Ahora bien, ¿son dichas diferencias significativas? El ANOVA responde a esta cuestión.
El objetivo del ANOVA es e s comparar los diversos valores medios para determinar si alguno de ellos e llos difiere significativamente del resto.
Para ello se utiliza una estrategia bien lógica: lóg ica: si los resultados proporcionados por los diversos laboratorios no contienen errores sistemáticos, los valores medios respectivos no diferirán mucho los unos de los otros y su dispersión, debida a los errores aleatorios, será comparable a la dispersión presente individualmente en cada laboratorio.
EAAA
41
ANOVA PARA UN FACTOR Prueba de hipótesis para probar la igualdad de medias de varias poblaciones para un factor Se trata de probar si el efecto de un factor o Tratamiento en la respuesta de un proceso o sistema es Significativo, al realizar experimentos variando Los niveles de ese factor Temp. 1, Temp. 2, Temp.3, Temp.3, etc.), presiones
a 3 ......... Ha H a : A lg unas. ' s. s son on.diferentes 1 Ho H o:
2
EAAA
CONDICIONES Todas las pobla poblacion ciones es son son norm normales ales
Todas las poblaciones tiene la misma varianza Loss error Lo errores es son son in inde depe pend ndie ient ntes es co con n di dist stri ribu buci ción ón norm normal al de media cero La varianza se mantiene constante para todos los niveles del factor
42
EAAA
43
ANOVA Suma de cuadrados total SST es la suma de las diferencias al cuadrado de cada resultado individual respecto a la media de todos los
resultados y por tanto, representa la variación total de los datos. 2
SStotal
2
x
x
n
EAAA 44
suma de los cuadrados de los tratamiento tr atamientoss
Es la suma de los cuadrados de la diferencias entre cada media de tratamiento y la media total
T 2
SCTr
r
n r
x
2
n
Cuando se divide SSTr por los correspondientes grados de libertad, (N - K ),), se obtiene el cuadrado medio (o MS, del inglés Mean Square) entre los laboratorios", MSR.
CUADRADO MEDIO MEDIO DE LOS LOS TRATAMI TRATAMIENTO ENTOS S = MSR = SSTr SSTr / k-1)
EAAA
45
SUMA DE LOS CUADRADOS DEL ERROR E RROR SSE
La otra furnte furnte de variacion variacion se conoce conoce como como el compone componente nte aleator aleatorio io o el componente de error. Se determina por la suma de los cuadrados cuadrados de las diferencias, entre cada observacion observacion y su media de tratamiento. En forma simplificada su calculo esta dado:
SUMA DE LOS CUADRADOS DEL ERROR
SSE = SSTotal SSTr
obtiene ne el Cuando se divide SSE por los correspondientes grados de libertad, (N - K), se obtie cuadrado medio "dentro de los laboratorios", MSE.MSE = SSE/ N K)
EAAA
46
ANOVA PROCEDIMIENTO DE ANOVA Paso 1: Plantear (H0) y l a ( H1) 0 H reesdaiaq ass; essigd ne ifc icira,tivas entre las venteaxspm sudee lnoos th reasy vd einfe dreednocrie
Ho H o : 1
2
3
.........
a
Ha H a : A lg unas. ' s. so son n.diferentes
Paso 2: Seleccionar el nivel de significación Se usara el nivel 0.05 o 0.01valores de uso convencional
Paso 3: Proporcionar el estadístico de prueba El estadístico de prueba es la distribución F.
EAAA
47
Fuente Entre laboratori o Dentro de los laboratori o Total .
Suma de Grados cuadrado de s libertad 53.13 4
29.64
23
82.77
27
Cuadrado medio 13.28
Fcal
10.30
p
0.3
1.29
F tab tab = 2.80 (a ( a = 0.05, 4, 23, 1 cola )
Como F cal > F tab, tab, en es te caso cas o s e podría podrí a concluir conc luir que al al menos menos uno de los los laboratorios ha producido resultados la media de los cuales difiere de forma estadísticamente significativa significativa del resto de laboratorios. l aboratorios. El valor de probabilidad que aparece en la Tabla Tabla 3 indica aquel valor de alfa a partir del cual el ANOVA ANOVA no detectaría ni ninguna nguna diferencia significativa. Así pues, a menor valor de probabilidad, mayor seguridad de que existen diferencias
significativas. 48
EAAA
Ejemplo : Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión arterial, comparándola con la de una dieta sin sal. Para ello se seleccionan al azar 25 hipertensos y se distribuyen aleatóriamente en 5 grupos. Al primero de ellos no se le suministra ningún tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al cuarto el fármaco a una dosis determinada y al quinto el mismo fármaco a otra dosis. Las presiones arteriales sistólicas de los 25 suje su jeto tos s al fi fin naliz alizar ar los los tra tratam tamient ientos os son: son: Grupo 1
2
3
4
5
180
172
163
158
147
173
158
170
146
152
175
167
158
160
143
182
160
162
171
155
181
175
170
155
160
EAAA
49
La tabla de anova es: Fuente de variación
GL
Tratamiento
SS
MS
F
4
2010.64
502. 66
11.24
Error
20
894.40
44. 72
Total
24
2905.04
00,0 55(4, (44,20 ,220) 0)) =2,8 =2,87 ,877 y y11,24> 114>2 ,224,87 >27,8re 7cha re ha zasmla oship ipis ótenula sisla ynula y Como F ComoF ,0 ,05( =2 ,2 ,8 rech ac zamo za mos hilpaótes óth esis nu conc co nclu luim imos osos que qu e los lo resu re ltad ados os de los s tr trat atam ient ntos osient son so nos dife di fere rent es. .rent conc co nclu luim imos que qu eslo los ssult resu re sult ltad ados oslo de los lo samie tr trat atam amie ntos son so nntes di dife fere ntes es..
EAAA
50
Un fabricante de papel para hacer bolsas para comestibles, se encuentra interesado en mejorarla resistencia a la tensión del producto. El departamento de ingeniería del producto piensa que la resistencia a la l a tensión t ensión es una función de la concentración de madera dura en la pulpa y que el rango de las concentraciones de madera dura de interés práctico está entre 5% y 20%. El equipo de ingenieros responsable del estudio decide investigar cuatro niveles de concentración de madera dura: 5%, 10%, 15% y 20%. Deciden hacer seis ejemplares de prueba con cada nivel de concentración, utilizando una planta piloto. Las 24 muestras se prueban, en orden aleatorio, con una máquina máquina de laboratorio para probar la resistencia. En la tabla 12-1 se muestran los datos de este experimento.
Tabla 12-1
Resistencia a la tensión del papel (psi)
Concentración e madera dura (%)
1
2
3
4
5
6
Totales
Promedios
5
7
8
15
11
9
10
60
10.00
10
12
17
13
18
19
15
94
15.67
15
14
18
19
17
16
18
102
17.00
20
19
25
22
23
18
20
127
21.17
383
15.96
Observaciones
EAAA
51
a ) Diagramas de caja de los datos de la concentración de madera dura, b) Gráfica del modelo de la ecuación 12-1 para el experimento completamente autorizado con un solo factor.
EAAA
HIPOTESIS NULA Puede usarse el análisis de varianza para probar la hipótesis de que diferentes concentraciones de madera dura no afectan la resistencia a la tensión media del papel. Las hipótesis son;
Las formulas para calcular las sumas de cuadrados para el análisis de varianza con tamaños de las muestras n1 diferentes en cada tratamiento son: Solución
a
a
yij2
SS T =
y2
− N y y − = n N i=j i=j
a
SS Trat Tratam amie ient nt
os
i=j
SSE = SST
2 i
− SS
1
Tr Trat atam amie ient ntos os
2 i
52
EAAA
53
EAAA
54
Tabla 12-4
Análisis de varianza para los datos de la resistencia a la tensión
Fuente de
Suma de
Grados de
Cuadrado
variación
cuadrados
libertad
medio
1
f o
Valor P
Concentración de
madera 382.79
3
127.60 6.51
19.60
3.59 E-6
dura Error
130.17
20
Total
512.96
23
Puesto que el valor P = 3.59 x 10 -6 es considerablemente más pequeño que α = 0.01, se cuenta con evidencia sólida para concluir que Ho no es verdadera.
EAAA
55
Un intervalo de confianza del 100(1 - a) por ciento para la media del tratamiento ,
p es:
La ecuación se usa para calcular los intervalos de confianza Las estimaciones de la media de la resistencia a la tensión para el experimento del ejemplo son las siguientes:
El intervalo de confianza de 95% para la resistencia a la tensión media con 20% de madera dura será:
Por lo tanto, el intervalo de confianza deseado es
EAAA
56
Un intervalo de confianza del 100(1 - a) por ciento para la diferencia de las medias de dos tratamientos
i, - i,
es:
Un intervalo de confianza de 95% para la diferencia de las medias la ecuación 12-13 como sigue:
3, - 2,
se calcula con
Por tanto, el intervalo de confianza de 95% para (i3 - fi, es -1.74
≤ 3,
-
2 ≤
4.40
Puesto que el intervalo de confianza incluye al cero, se concluiría concluir ía que no
hay diferencia en la resistencia a la tensión media en estos es tos dos niveles de
madera dura particulares. EAAA
.
57
EAAA
58
Análisis de residuales y verificación del modelo
En el análisis de varianza del modelo simple o de un solo factor, se supone que las observaciones siguen una distribución normal e independiente con la misma varianza para cada tratamiento o nivel del factor.
Estos supuestos deberán verificarse examinando los residuales.
Un residual es la diferencia entre una observación Y ij y su valor estimado (o ajustado) en el modelo estadístico bajo estudio, denotado como y ij . Para el diseño completam compl etamente ente aleat aleatoriz orizado ado Y ij Y ij cada residual es e ij = y ij - y, es decir decir,, la difere diferencia ncia entre una observación y la media observada del tratamiento correspondiente correspondiente
EAAA
59
En la tabla 12-6 se muestran los residuales para el experimento del porcentaje de madera dura. Al utilizar y j. para calcular cada residual en esencia, se elimina el efecto de la concentración de utilizar madera dura de esos datos; por consiguiente, los residuales contienen información acerca de la variabilidad no explicada.
Tabla 12-6
Residuales para el experimento de la resistencia a la tensión
Concentración de madera dura
Residuales
5%
-3.00
-2.00
5.00
1.00
-1.00
0.00
10%
-3.67
1.33
-2.67
2.33
3.33
-0.67
15%
-3.00
1.00
2.00
0.00
-1.00
1.00
20%
-2.17
3.83
0.83
1.83
-3.17
-1.17
En la figura 12-2 se muestra la gráfica de probabilidad normal de los residuales del experimento de la resistencia a la tensión del papel. En las figuras 12-3 y 12-4 se presentan los residuales granea graneados dos contra los niveles del factor y el valor ajustado y.., respectivamente. Estas gráficas no revelan ninguna falta de adecuación del modelo ni
algún problema excepcional con los supuestos. EAAA
60
EAAA
Diseño de experimentos. •1. Anális nálisis is de varia arianz nza. a. Suponga que un experimento industrial un ingeniero está interesado en cómo la absorción media de humedad en concreto varía entre cinco mezclas diferentes de concreto. Las muestras se exponen a la humedad por 48 horas y se decide que se prueben seis muestras para cada mezcla, por lo que se requiere probar un total de 30 muestras. Los datos de este experimento se muestran en la siguiente tabla.
Tabla 1
Absorción de humedad en mezclas de concreto. Mezcla
1 551.00 457.00 450.00 731.00 499.00
2 595.00 580.00 508.00 583.00 633.00
3 639.00 615.00 511.00 573.00 648.00
4 417.00 449.00 517.00 438.00 415.00
5 563.00 631.00 522.00 613.00 656.00
632.00
517.00
677.00
555.00
679.00
61
EAAA
62
El modelo para esta estimación se puede pu ede considerar como sigue. Hay 6 observaciones que se toman cada una de d e las cinco poblaciones con medias m , m ,..m respectivamente y deseamos probar 1
2
5
H0 : m 1 = m 2 = m 3 = m 4 = m 5
H1 : al menos dos de las medias no son iguales.
Además, nos podemos interesar en realizar comparaciones individuales entres estas cinco medias poblacionales. En el procedimiento de análisis de varianza, se supone que cualquier variación que exista entre los promedios de las mezclas se atribuye a
EAAA
63
Formulas para el cálculo de sumas de cuadrados.
A continuación continuación presentamos un conjunto de formulas mas simples para calcular la suma de cuadr
k
n
2
y i j SST yij ij
n
k
1
2
1
nk
i 1 j 1
k
n
i j y SSA n yi k
ij
2
i 1
SSE SST SSA
1
1
nk
2
EAAA
64
ANALISIS DE VARIANZA DE DOS VÍAS o DIRECCIONES ANOVA 2 VIAS) 1. Introducción En este caso las fórmulas son parecidas a la del ANOVA de una vía pero ahora agregando el cálculo por renglones adicional al de columnas donde se inclu incluye ye la variable variable de de bloqueo. bloqueo. Se trata de bloquear un factor externo que probablemente tenga efecto en la respuesta pero que no hay interés en probar su influencia, sólo sólo se bloquea bloquea para minimizar la variabilidad de este factor externo, evitando que contamine la prueba de igualdad entre los tratamientos. Los tratamientos se asignan a las columnas y los bloques a los renglones. Un bloque indica condiciones similares de los sujetos al experimentar con diferentes tratamientos.
EAAA
LAS HIPÓTESIS SON:
Ho: No hay diferencia en las medias del factor de columna
Ha: Al menos una media del factor de columna c olumna es diferente
Ho: No hay diferencia en las medias de la variable de renglón
Ha: Al menos una media de la variable de renglón r englón es diferente
65
EAAA
La SSTotales y SSTr columnas)se determina de la misma forma que para la ANOVA de una dirección o factor En forma adicional se determina la suma de cuadrados del factor de bloqueo renlgones) ) de forma similar a la de los renglone rengloness
La
SSE = SSTOTALES SSTr SSBi
66
EAAA
67
2
SSBi
B x n i n i
gl .SSBi b 1 MSB MS B SSB /(b 1
2
EAAA
68
SSE SST SSTr SSBi
gl . M MSE SE (n k )( n b)
MSE M SE M MSB SBii /( n k )( n b)
EAAA
Fc
MSTr
MSE
MSB M SBi Fc
MSE M SE
69
EAAA
70
FUENTE DE VARIACIÓN
SUMA DE GRADOS DE CUADRADO CUADRADOS LIBERTAD MEDIO
VALOR F
Entre mue stra s (tra ta m.)
S S Tr
a -1
MSR
SSTr/MSR
Entre Bloque s (Fa ctor Bl)
SSBi
b-1
MSB
MSB/MSR
De ntro de mue stra s (e rror)
SSE
(a -1)(b-1)
MS E
SSTota l
n-1
MS T
Va ria ción tota l
Regla:: No rechazar Regla rechaz ar si la F de la mues mue stra es menor me nor que la F de Exce Excell para una cie ciert rtaa alf a lf
EAAA
71
Tabla de Análisis de varianza para dos criterios de clasificación Fuente de variación
Suma de Cuadrados
G Grrados de libertad
Cuadrados Medios
F calculada
Tratamientos
SCA
t-1
CMA = SCA / t-1
CMA / CME
Bloques
SCB
b -1
CMB = SCB / b-1
CMB / CME
Error Experimental
SCE
(t - 1)(b-1)
Total
SCT
t.b -1
( yij y..) i
j
Variación total
2
2
2
. j y..) ( yij yi. y. j y.. ) t ( yi . y..) b ( y i
j
Variación debida a los tratamientos
SCT
CME = SCE / (t-1)(b-1)
SCA
i
Variación debida a los bloques SCB
j
Variación propia de las observaciones SCE
2
EAAA
Si Fc Tr o Bi) es mayor que F del niv nivel el de confianza se rechaza Ho Aceptando Ha donde las medias son diferentes O si el vvalor alor de p correspondient correspondientee a Fc Tr o Bi) es menor de Alfa se rechaza Ho
72
EAAA
73
Un químico desea probar el efecto que tienen cuatro agentes químicos sobre la resistencia de un tipo particular de tela. Como puede existir variación entre un rollo de tela y otro, decide utilizar un diseño aleatorizado por bloques, considerando los rollos de telas comoa bloques. El químico de cinco les aplica A loscontinuación cuatro agentes químicos sendas porciones de dispone cada rollo, en unrollos ordeny aleatorio. se proporcionan los resultados de la resistencia resistencia a la tensión: Rollos de Tela Agente Químico 1 2 3 4
1 64 73 75 73
2 68 67 78 71
3 67 75 68 75
4 67 72 73 75
5 67 70 68 69
a) Determine el modelo apropiado para el análisis de este experimento y estime los parámetros del modelo modelo b) Analice el experimento experimento en la forma más ccompleta ompleta posible (5% de significación) c) Suponer que falta la observación correspondiente al agente químico 2 y al rollo de
tela 3. Analice este problema estimando el valor faltante. EAAA
74
Las hipótesis son: Ho: 1 = Ho: = 2 = = 3 = = 4 vs la H1 : al menos un un i j donde i i j j.. Est Esto o se se pru prueb ebaa con con:: CMA / CME
F=
Ho: 1 = Ho: = 2 = = 3 = = 4 = 5 vs la H1 : al menos un un i j donde i i j. j. Esto se se prueba prueba con con:: F = CMB / CME k 2 y i
SC A
2
i 1
2
y = (333)
ni
n
2
(352)
5
2
(362)
2
2
(363)
(287) 2
(1410) 20
116,20
k 2 y j
SC B
i 1
donde n =k ni k
ni
y2
i 1 j 1
(284) 2
2 ij
(280) 2
(274) 2
5
n
SC T y
=
(285) 2
y2 n
2
2
(1410) 2 20
2
(64) (68) ..... (69)
(1410) 2 20
251,00
26,50
SCE SCT SCA – SCB 251,00 – 116,20 – 26,50
108,30 EAAA
75
Grados Suma de Cuadrados Fuente de Variación de Cuadrados Medios Fobserv Ftabla Libertad (SC) (CM) Tipo de circuito (k - 1) 3 116,20 38,73 *3,93 3,59 Bloques (b – 1) 4 26,50 6,62 0,67 3,36 Error (k - 1) (b – 1)-1 11 108,30 9,84 Total (n - 1)-1 18 251,00
F(0,05; 3, 11) F(0,05; 4, 11)
Como Fo > Ftabla, entonces, se rechaza Ho, existen diferencias significativas en las resistencias de las telas, con un 95 % de confianza, los agentes químicos tienen influencia sobre las telas seleccionadas
EAAA
76
Suponiendo que se quiere investigar si la producción de tres diferentes máquinas es igual, tomando en cuenta la experiencia de los operadores a un nivel de significancia del 5%.
Experiencia
Máquinas
de ops. En años
Maq 1
Maq 2
Maq 3
Promedios
1
27
21
25
24.33333
2
31
33
35
33
3
42
39 39
4
38
41
37
38.66667
5
45
46
45
45.33333
36.6
36
36.2 36.2
36.26667
Promedios
40
EAAA
77
TABLA ABL A ANOVA Conclusión: No hay diferencia entre máquinas a pesar de la diferencia en experiencia de los operadores. SS
GL
CM
Fc
Falfa
SCTR=
0.933333
2
CMTR=
0.466667 F Fttr = 0.09
4.46
SCBL=
764.9333
4
CMBL=
191.2333 F Fb bl = 37.25
3.84
SCE =
41.06667
8
CME=
5.133333
SCT =
806.9333
14
CMT=
57.6381
EAAA
78
Ejemplo: Para el ensamble de un artículo se considera comparar 4 máquinas diferentes. Como la operación de las máquinas requiere cierta destreza se anticipa que habrá una diferencia entre los operarios en cuanto a la velocidad con la cual operen la maquinaria. Se decide que se requerirán 6 operarios diferentes en un experimento de bloques aleatorizado para comparar las máquinas. Tiempo en segundos para el ensamble del producto Operario Máquina
1
2
3
4
5
6
Total
Medias
1
42,5
39,3
39,6
39,9
42,9
43,6
247,8
41,3
2
39,8
40,1
40,5
42,3
42,5
43,1
248,3
41,4
3
40,2
40,5
41,3
43,4
44,9
45,1
255,4
42,6
4
42,3
43,2
44,5
45,2
46,9
43,3
265,4
44,2
Total
164,8
163,1
165,9
170,8 177,2
175,1
1016,9
Medias
41,2
40,775 41,475
42,7
43,775 254,225
44,3
42,4
EAAA
Si las máquinas no difieren en cuanto a la velocidad de ensamblado de la pieza, tendrían igual velocidad promedio y las curvas se superpondrían exactamente. H0 : µ1= µ2 = µ3= µ4 ó H0 = α1=α2=α3=α4=0
µ
Pero si las máquinas difieren en cuanto a la la velocidad de ensamblado de la pieza, pensaríamos que las muestras provienen de poblaciones diferentes, e H1: algún promedio es distinto de los restantes
79
EAAA
80
EAAA
81
EL MODELO (DE EFECTOS FIJOS) Yij = µ + αi + β j + eij Modelo lineal aditivo: cada respuesta es la suma de los otros términos.
Donde Y es la variable respuesta o dependiente, tiempo medido en segundos, e Y es la observación perteneciente al j-ésima bloque bajo ij el tratamiento i; las observaciones son independientes. in dependientes. µ es la media general común a todas las máquinas y a todos los operarios. αi es el efecto del tratamiento en el nivel i, propio de cada máquina. β j es el efecto del bloque en el nivel j, propio de cada oper operario. ario.
eij es la variable aleatoria del error e rror con distribución normal, con media = 0 y varianza σ2 N (0 ; σ2 ) e independiente.
EAAA
Consideremos que se lleva a cabo un experimento para comparar el tiempo que tardan tres marcas de ordenadores de diferente marca en cargar un mismo sistema operativo. Se toma una muestra de cuatro ordenadores de la marca A, es decir, decir, se mide el tiempo (ensegundos) que tardan en cargar el sistema operativo cuatro ordenadores de esta marca. De la marca B se toman seis medidas y cinco de la marca C. La tabla siguiente registra los resultados del experimento:
Marca A 10,7 11,2 12,0 15,5 Marca B 13,4 11,5 11,2 15,1 13,3 12,9 Marca C 11,5 12,7 15,4 16,1 15,2 EXISTE DIFERENCIA ENTRE LAS MARCAS
82
EAAA
83
Muestra j Muestra j = 1 Muestra j=2 x 11 = 10,7 11 x12 = 13,4 x 21 = 11,2 x22 = 11,5 x31 = 12,0 x32 = 11,2 x41 = 15,5 x42 = 15,1 x52 = 13,3 x53 = 15,2 x62 = 12,9 Media = 12,35 = 12,90 Varianza = 4,70 x 1 x 2 x 3 s1 2 s2 2 s3
= 2,02
Muestra j=3 x13 = 11,5 x23 = 12,7 x33 = 15,4 x43 = 16,1
= 14,18 = 3,90
EAAA
84
EAAA
Es posible representar esta situación mediante los diagramas de caja de las tres muestras:
85
EAAA
86
Un experimento en el que se prepararon nudos de soldadura con diferentes composiciones químicas. Se hicieron varias soldaduras utilizando cada flujo sobre metal con base de acero AISI-1018. La tabla 9.1 presenta los resultados de las mediciones de la dureza, en la escala de Brinell, de cinco soldaduras que usan cada uno de los cuatro flujos. TABLA 9.1 Dureza de Brinell de soldaduras que utilizan cuatro flujos diferentes Flujo
Valores de la muestra
Media muestral
Desviación estándar muestral
A B C
250 263 257
264 254 2/9
256 267 269
260 265 273
239 267 277
253.8 263.2 271.0
9.7570 5.4037 8.7178
D
253
258
262
264
273
262.0
7.4498
Se puede concluir que hay diferencias en las medias poblacionales entre los cuatro tipos de flujos?
Determine un intervalo de confianza del 95% para la media de la dureza de soldaduras producidas producidas con el flujo A.
EAAA
87
EXPERIMENTOS DE DOS FACTORES En los experimen experimentos tos de un factor, factor, analizados, analizados, el propósito propósito es determinar si al cambiar el nivel de un solo factor sólo se afecta la respuesta. Muchos experimentos implican variar algunos factores, cada uno de ellos puede afectar la respuesta. Se analizará el caso en el que existen dos factores. Los experimentos, naturalmente suficientes, son llamados
experimentos de dos factores EAAA
88
Un ingeniero químico está estudiando los efectos de varios reactivos y catalizadores en la producción de cierto proceso. Esta última se expresa como un porcentaje de un máximo teórico. Se hicieron cuatro operaciones del proceso para cada combinación de tres reactivos y cuatro catalizadores. Los resultados se presentan en la tabla 9.2. En este experimento hay dos factores, el catalizador y el reactivo. El primero se llama factor rengl ón, ya que su valor varía de renglón a renglón en la tabla; el segundo se denomina factor columna. Estas designaciones son arbitrarias, en la tabla se podía haber presentado tan f ácilmente como que los renglones representen los reactivos y las columnas, los catalizadores Producciones para varias operaciones operaciones de un proceso quí mico mico con varias combinaciones de reactivos y catalizador catalizadores es Catalizador
1
2
3
A
86.8 82.4 86.7 83.5
93.4 85.2 94.8 83.1
77.9 89.6 89.9 83.7
B
71.9 72.1 80.0 77.4
74.5 87.1 71.9 84.1
87.5 82.7 78.3 90.1
C
65.5 72.4 76.6 66.7
66.7 77.1 76.7 86.1
72.7 77.8 83.5 78.8
D
63.9 70.4 77.2 81.2
73.7 81.6 84.2 84.9
79.8 75.7 80.5 72.9 EAAA
89
TABLA Promedio de las producciones ij para operaciones de un proceso químico utilizando diferentes combinaciones de reactivos y catalizadores
Reactivo Catalizador
A B C D Media de la columna X,
1
84.85 75.35 70.30 73.18 75.92
2
89.13 79.40 76.65 81.10 81.57
3
85.28 84.65 78.20 77.23 81.34
Media del renglón X,..
86.42 79.80 75.05 77.17 Gran media muestral X... =79.61
Cada número en el cuerpo de la tabla es el promedio de los cuatro números en la celda correspondiente de la tabla A Éstos se llaman las medias de las celdas. Utilizando un ANOVA de dos sentidos para probar hipótesis
Un análisis de varianza de dos sentidos está diseñado para responder tres preguntas principales: 1. ¿El modelo aditivo vale? 2. ¿Si es así, la media del resultado es la misma para todos los
3.
niveles del factor renglón? ¿Si es así, la media del resultado es la misma para todos los niveles del factor columna? EAAA
90
1Para probar si el modelo aditivo vale se prueba la hipótesis nula de que todas las in inttera eracci cion ones es son ig igu uale ales a 0: Si esta hipótesi tesis s nula es verdadera, el modelo aditivo val vale. 2Para probar si la media del resultado es igual para todos los niveles del factor renglón, se prueba la hipótesis nula de que todos los efectos renglón son iguales a 0: S isensiv taeles hes ipódel telsfact is ctor nor ulare ensgl vóenrd. adera, entonce ces s la media del resultado es igu igual para todos lo los ivel de fa ren gló
3Para probar si la media del resultado es igual para todos los niveles del factor columna, se prueba la hipó ipótesis nula de que todos los efectos columna son iguales a 0: Si esta hipótesis nula es verdadera, entonces la media del resultado es igual para todos los niveles del factor columna
EAAA
91
Igual que con un ANOVA de un sentido, las pruebas usuales para estas hipótesis nulas están basadas en las sumas de los cuadrados. Específicamente, son la suma de los cuadrados de renglón (SSA), de los cuadrados de columna (SSB), de los cuadrados de interacción (SSAB), y de los cuadrados del error (SSE). También es de interés la suma total de los cuadrados (SST), que es igual a la suma de las otras. La identidad del análisis de varianza
SST = SSA + SSB + SSAB + SSE
EAAA
92
El siguiente resultado de MI-NITAB presenta la tabla ANOVA para los datos de la tabla 9.2.
Las etiquetas DF, SS, F y P se refieren a los grados de libertad, suma de cuadrados, media cuadrática, los estadísticos F, y P-valor, respectivamente. Como en un ANOVA de un sentido, la media cuadrática para el error (MSE) es una estimación de la varianza del error 2, la cantidad S representa la raíz cuadrada de MSE y es una estimación de la desviación estándar del error. Las “
”
cantidades R-sq y R-sq(adj) se calculan con fórmulas similares a las del ANOVA de un sentido. “
”
“
”
EAAA
93
1. (Ejemplo1) Supóngase que el administrador de una planta industrial conjetura que el rendimiento (en número de artículos producidos por turno de 8 horas) de una línea de producción depende de dos variables cualitativas: el supervisor de la línea (de los cuales hay dos, digamos A1 y A2) y el turno para el cual se mide la producción. Denotaremos los tres turnos, de 8:00 am a 4:00 pm, de 4:00 pm a 12:00 am y de 12:00 am a 8:00 am, por B1;B2 y B3: El administrador desea establecer si existen diferencias entre las producciones de los distintos turnos, con cada supervisor y si existe interacción entre los dos factores, para ello efectuó r = 3 réplicas de un experimento factorial 23 para investigar el efecto de supervisor.(con dos niveles) y .turno.(con tres niveles). Las observaciones se dan en la tabla a continuación .
View more...
Comments