(Anova) 2

November 8, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download (Anova) 2...

Description

 

EXPERIMENTOS FACTORIALES  ANOVA  ANOV A  Análisis de la Varianza Varianza

EAAA

1

 

Comprender la noción general del análisis de varian var iancia cia (AN (ANOV OVA). A). Realizar una prueba de hipótesis para determinar  si dos variancias muestrales provienen de las mismas poblaciones o de poblaciones iguales. Establecer y organizar datos en una tabla de  ANOVA.  ANOV A. Realizar una prueba para determinar si existe diferencia entre tres o más medias de tratamiento. Realizar una prueba de hipótesis para determinar  si hay alguna diferencia entre medias de bloques. EAAA

2

 

EXPERIMENTOS FACTORIALES

Los experimentos son esenciales para desarrollar y mejorar los métodos científicos y de ingeniería. Sólo mediante la experimentación se pueden comparar las diferentes variantes de un método con el fin de comprobar cuál es el más efectivo. Para que sea útil, un experimento se debe diseñar adecuadamente, y los datos que se obtienen de éste se deben analizar en forma correcta. En este capítulo se analizan el diseño y el análisis de datos a partir de una clase de experimentos conocidos como experimentos factoriales. EAAA

3

 

ANÁLISIS DE LA VARIANZA ANOVA)

Es una potente herramienta estadística, de gran utilidad tanto en la industria, para el control de procesos, como en el laboratorio de análisis, para el control de métodos analíticos .

EAAA

4

 

Aplicación: -Para la comparación de múltiples columnas de datos -Para la estimación de los componentes de variación de un proceso.

-El análisis análisis de la varianz varianzaa (o Anova: Analysi Analysiss of variance) variance) es un método para comparar dos o más medias.

EAAA

5

 

EAAA

6

 

Comparación de múltiples poblaciones La comparación de diversos conjuntos de resultados resu ltados es habitual en los:

Laboratorios analíticos. Así, por ejemplo, puede interesar comparar diversos métodos de análisis con diferentes características, diversos analistas entre sí, o una serie de laboratorios que analizan una misma muestra con el mismo método ensayos colaborativos). También sería el caso cuando queremos analizar una muestra que ha estado sometida a diferentes tratamientos o ha estado almacenada en diferentes condiciones. En todos estos ejemplos hay dos posibles fuentes de variación: una es el error aleatorio en la medida y la otra es lo que se denomina

factor controlado tipo de mé todo, diferentes

cond iciones, analista o laboratorio,...).

Una de las herramientas he rramientas estadísticas más utilizadas que permite la separación de las diversas fuentes de variación es el análisis de la varianza ANOVA, del inglés Analysis of Variance) [Massart, 1997]. EAAA

7

 

EAAA

8

 

EAAA  

9

EAAA  

10

EAAA  

11

EAAA  

12

EAAA  

13

EAAA  

14

EAAA  

15

EAAA  

16

EAAA  

17

EAAA  

18

EAAA  

19

EAAA  

20

EAAA  

21

EAAA  

22

EAAA  

23

EAAA  

24

EAAA  

25

EAAA  

26

EAAA  

27

EAAA  

28

EAAA  

29

EAAA

30

 

a parte del error propio de Cuando tengamos un factor, controlado aleatorio, aparte la medida, hablaremos del ANOVA de unofactor.

En el caso de que estuviésemos desarrollando un nuevo método colorimétrico y quisiéramos investigar la influencia de diversos factores independientes sobre la absorbancia, tales como la concentración de reactivo A y la temperatura a la que tiene lugar la reacción, entonces hablaríamos de un ANOVA de dos factores. En los casos donde tenemos dos o más factores que influyen, se realizan los experimentos para todas las combinaciones de los factores estudiados, seguido del ANOVA. Se puede deducir entonces si cada uno de los factores o una interacción entre ellos tienen influencia significativa en el resultado.

EAAA  

Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de hipótesis, aunque se aceptan ligeras desviaciones de las condiciones ideales:

1. Cada conjunto de datos debe ser independiente del resto.

2. Los resultados obtenidos para cada conjunto deben seguir una distribución normal.

3. Las varianzas de cada conjunto de datos no deben diferir de forma significativa.

31

EAAA  

32

EAAA  

El análisis de la varianza (ANOVA) de un conjunto de muestras consiste en contrastar: La hipótesis nula “todas las medias poblacionales de las que provienen las muestras son iguales”.

Contra

La hipótesis alternativa “no todas las medias son iguales.

Con un nivel de significación a prefijado.

33

EAAA

34

 

La lógica del ANOV ANOVA A El contraste de hipótesis del ANOVA se basaen comprobar si las medias de las muestras difieren más de lo que cabe esperar cuando es cierta, la hipótesis nula. w Esta cuestión acerca de las medias se responde analizando las varianzas. w

Nos fijamos en las varianzas, porque, cuando queremos saber si algunas medias difieren entre sí, tenemos que valorar la varianza entre estas medias. 

EAAA  

Dos Fuentes de Variabilidad w En ANOVA, un estimador de la variabilidad entre grupos se compara con la variabilidad dentro de los grupos. 1- La variación Entre Grupos e es s la variacion entre las media medias s de los diferentes tratamientos debidas al azar (error de muestreo ) y al efecto de los tratamientos, si es que existe. 2. La variación Dentro de los Grupos es la variacion debida al azar  (error de muestreo) entre individuos a los que se ha dado el mismo tratamiento.

35

EAAA  

 Variabilidad  V ariabilidad Ent Entre re Grupos Hay mucha variabilidad entre las medias. w

Las diferencias entre las medias de los grupos son demasiado grandes para atribuirlas al azar. w Es difícil imaginar que los seis grupos son muestras aleatorias tomadas de la misma población. w Se rechaza la hipótesis nula, es decir decir,, existe efecto del tratamiento al menos en uno de los grupos. w

36

EAAA  

37

EAAA

38

 

ANO VA de un factor factor

Tomemos como ejemplo la comparación de 5 laboratorios queenanalizan nk ve vece ces s con el mismo procedimiento la concentración de Pb una misma muestra de agua de río.

El objetivo del ANOVA aquí es comparar los errores sistemáticos con los aleatorios obtenidos al realizar diversos análisis en cada laboratorio.

Condiciones importantes que cada laboratorio analice sus muestras de manera independiente y con precisiones parecidas a las del resto de laboratorios.

En la tabla 1 se muestran los resultados obtenidos (expresados en mg/L).

EAAA

39

 

RESULTAD OS 1 2 3 4 5 6 7 VALOR MEDIO n

x

LABORAT 1 2.3 4.1 4.9

LABORAT 2 6.5 4.0 4.2

LABORAT 3 1.7 2.7 4.1

LABORAT 4 2.1 3.8 4.8

LABORAT 5 8.5 5.5 6.1

2.5 3.1 3.7 --

6.3 4.4 ---

1.6 4.1 2.8 --

2.8 4.8 3.7 4.2

8.2 ----

3.4

5.1

2.8

3.7

7.1

6

5

6

7

4

k suma

20.6 25.4 Aritmetica De todos

17.0 26.2 Resultados X= 4.2

28.3

Media

los

X EAAA

40

 

Observando los valores medios todo parece indicar que existen diferencias entre los laboratorios. Ahora bien, ¿son dichas diferencias significativas? El ANOVA responde a esta cuestión.

El objetivo del ANOVA es e s comparar los diversos valores medios para determinar si alguno de ellos e llos difiere significativamente del resto.

Para ello se utiliza una estrategia bien lógica: lóg ica: si los resultados proporcionados por los diversos laboratorios no contienen errores sistemáticos, los valores medios respectivos no diferirán mucho los unos de los otros y su dispersión, debida a los errores aleatorios, será comparable a la dispersión presente individualmente en cada laboratorio.

EAAA

41

 

ANOVA PARA UN FACTOR Prueba de hipótesis para probar la igualdad de medias de varias poblaciones para un factor Se trata de probar si el efecto de un factor o Tratamiento en la respuesta de un proceso o sistema es Significativo, al realizar experimentos variando Los niveles de ese factor Temp. 1, Temp. 2, Temp.3, Temp.3, etc.), presiones





 





a  3   .........  Ha  H a :  A lg unas. ' s. s  son on.diferentes 1    Ho  H o:

 2

EAAA  

CONDICIONES Todas las pobla poblacion ciones es son son norm normales ales

Todas las poblaciones tiene la misma varianza Loss error Lo errores es son son in inde depe pend ndie ient ntes es co con n di dist stri ribu buci ción ón norm normal al de media cero La varianza se mantiene constante para todos los niveles del factor

42

EAAA

43

 

ANOVA Suma de cuadrados total SST es la suma de las diferencias al cuadrado de cada resultado individual respecto a la media de todos los

resultados y por tanto, representa la variación total de los datos. 2

SStotal  

 

2

 x  

 x

n 

EAAA 44

 

suma de los cuadrados de los tratamiento tr atamientoss

Es la suma de los cuadrados de la diferencias entre cada media de tratamiento y la media total

 T     2

SCTr 



      n     r 

  x 

2

n

Cuando se divide SSTr por los correspondientes grados de libertad, (N - K ),), se obtiene el cuadrado medio (o MS, del inglés Mean Square) entre los laboratorios", MSR.

CUADRADO MEDIO MEDIO DE LOS LOS TRATAMI TRATAMIENTO ENTOS S = MSR = SSTr SSTr / k-1)

EAAA

45

 

SUMA DE LOS CUADRADOS DEL ERROR E RROR SSE

La otra furnte furnte de variacion variacion se conoce conoce como como el compone componente nte aleator aleatorio io o el componente de error. Se determina por la suma de los cuadrados cuadrados de las diferencias, entre cada observacion observacion y su media de tratamiento. En forma simplificada su calculo esta dado:

SUMA DE LOS CUADRADOS DEL ERROR

SSE = SSTotal   SSTr

obtiene ne el Cuando se divide SSE por los correspondientes grados de libertad, (N - K), se obtie cuadrado medio "dentro de los laboratorios", MSE.MSE = SSE/ N K)

EAAA

46

 

ANOVA PROCEDIMIENTO DE ANOVA Paso 1: Plantear (H0) y l a ( H1) 0 H reesdaiaq ass; essigd ne ifc icira,tivas entre las venteaxspm sudee lnoos th reasy vd einfe dreednocrie

 Ho  H o :  1



 2



 3  



.........



 a

 Ha  H a :  A lg unas. ' s. so  son n.diferentes

Paso 2: Seleccionar el nivel de significación Se usara el nivel 0.05 o 0.01valores de uso convencional

Paso 3: Proporcionar el estadístico de prueba El estadístico de prueba es la distribución F.

EAAA

47

 

Fuente Entre laboratori o Dentro de los laboratori o Total .

Suma de Grados cuadrado de s libertad 53.13 4

29.64

23

82.77

27

Cuadrado medio 13.28

Fcal

10.30

p

0.3

1.29

F tab tab = 2.80 (a ( a = 0.05, 4, 23, 1 cola )

Como F cal > F tab, tab, en es te caso cas o s e podría podrí a concluir conc luir que al al menos menos uno de los los laboratorios ha producido resultados la media de los cuales difiere de forma estadísticamente significativa significativa del resto de laboratorios. l aboratorios. El valor de probabilidad que aparece en la Tabla Tabla 3 indica aquel valor de alfa a partir del cual el ANOVA ANOVA no detectaría ni ninguna nguna diferencia significativa. Así pues, a menor valor de probabilidad, mayor seguridad de que existen diferencias

significativas. 48

EAAA  

Ejemplo : Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión arterial, comparándola con la de una dieta sin sal. Para ello se seleccionan al azar 25 hipertensos y se distribuyen aleatóriamente en 5 grupos. Al primero de ellos no se le suministra ningún tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al cuarto el fármaco a una dosis determinada y al quinto el mismo fármaco a otra dosis. Las presiones arteriales sistólicas de los 25 suje su jeto tos s al fi fin naliz alizar ar los los tra tratam tamient ientos os son: son: Grupo 1

2

3

4

5

180

172

163

158

147

173

158

170

146

152

175

167

158

160

143

182

160

162

171

155

181

175

170

155

160

EAAA

49

 

La tabla de anova es: Fuente de variación

GL

Tratamiento

 

SS

MS

F

 

4

2010.64

502. 66

11.24

Error

20

894.40

44. 72

Total

24

2905.04

00,0 55(4, (44,20 ,220) 0)) =2,8 =2,87 ,877 y y11,24> 114>2 ,224,87 >27,8re 7cha re ha zasmla oship ipis ótenula sisla ynula y Como F  ComoF  ,0 ,05( =2 ,2 ,8 rech ac zamo za mos hilpaótes óth esis nu conc co nclu luim imos osos que qu e los lo resu re ltad ados os de los s tr trat atam ient ntos osient son so nos dife di fere rent es. .rent conc co nclu luim imos que qu eslo los ssult resu re sult ltad ados oslo de los lo samie tr trat atam amie ntos son so nntes di dife fere ntes es..

EAAA

50

 

Un fabricante de papel para hacer bolsas para comestibles, se encuentra interesado en mejorarla resistencia a la tensión del producto. El departamento de ingeniería del producto  piensa que la resistencia a la l a tensión t ensión es una función de la concentración de madera dura en la pulpa y que el rango de las concentraciones de madera dura de interés práctico está entre 5% y 20%. El equipo de ingenieros responsable del estudio decide investigar cuatro niveles de concentración de madera dura: 5%, 10%, 15% y 20%. Deciden hacer seis ejemplares de  prueba con cada nivel de concentración, utilizando una planta piloto. Las 24 muestras se  prueban, en orden aleatorio, con una máquina máquina de laboratorio para probar la resistencia. En la tabla 12-1 se muestran los datos de este experimento.

Tabla 12-1

Resistencia a la tensión del papel (psi)

Concentración e madera dura (%)

1

2

3

4

5

6

Totales

Promedios

5

7

8

15

11

9

10

60

10.00

10

12

17

13

18

19

15

94

15.67

15

14

18

19

17

16

18

102

17.00

20

19

25

22

23

18

20

127

21.17

383

15.96

Observaciones

EAAA

51

 

a ) Diagramas de caja de los datos de la concentración de madera dura, b) Gráfica del modelo de la ecuación 12-1 para el experimento completamente autorizado con un solo factor.

EAAA  

HIPOTESIS NULA Puede usarse el análisis de varianza para probar la hipótesis de que diferentes concentraciones de madera dura no afectan la resistencia a la tensión media del papel. Las hipótesis son;

Las formulas para calcular las sumas de cuadrados para el análisis de varianza con tamaños de las muestras n1 diferentes en cada tratamiento son: Solución

a

a

yij2

SS T   =

y2

 

 − N y y − =    n N i=j i=j

a

SS Trat Tratam amie ient nt

os

i=j

SSE = SST

2 i

−   SS

1

Tr Trat atam amie ient ntos os

2 i

52

EAAA  

53

EAAA

54

 

Tabla 12-4

Análisis de varianza para los datos de la resistencia a la tensión

Fuente de

Suma de

Grados de

Cuadrado

variación

cuadrados

libertad

medio

1

 

f o

Valor P

Concentración de

madera 382.79

3

127.60 6.51

19.60

3.59 E-6

dura Error

130.17

20

Total

512.96

23

Puesto que el valor P = 3.59 x 10 -6 es considerablemente más pequeño que   α = 0.01, se cuenta con evidencia sólida para concluir que Ho no es verdadera.

EAAA

55

 

Un intervalo de confianza del 100(1 - a) por ciento para la media del tratamiento ,

 p es:

La ecuación se usa para calcular los intervalos de confianza Las estimaciones de la media de la resistencia a la tensión para el experimento del ejemplo son las siguientes:

El intervalo de confianza de 95% para la resistencia a la tensión media con 20% de madera dura será:

Por lo tanto, el intervalo de confianza deseado es

EAAA

56

 

Un intervalo de confianza del 100(1 - a) por ciento para la diferencia de las medias de dos tratamientos

i, - i,

es:

Un intervalo de confianza de 95% para la diferencia de las medias la ecuación 12-13 como sigue:

3, - 2,

se calcula con

Por tanto, el intervalo de confianza de 95% para (i3 - fi, es -1.74

≤ 3,

-

2 ≤

4.40

Puesto que el intervalo de confianza incluye al cero, se concluiría concluir ía que no

hay diferencia en la resistencia a la tensión media en estos es tos dos niveles de

madera dura particulares.  EAAA  



.

57

EAAA

58

 

Análisis de residuales y verificación del modelo

En el análisis de varianza del modelo simple o de un solo factor, se supone que las observaciones siguen una distribución normal e independiente con la misma varianza para cada tratamiento o nivel del factor.

Estos supuestos deberán verificarse examinando los residuales.

Un residual es la diferencia entre una observación Y ij  y su valor estimado (o ajustado) en el modelo estadístico bajo estudio, denotado como y ij . Para el diseño completam compl etamente ente aleat aleatoriz orizado ado Y ij  Y ij  cada residual es e ij  = y ij  - y, es decir decir,, la difere diferencia ncia entre una observación y la media observada del tratamiento correspondiente  correspondiente 

EAAA

59

 

En la tabla 12-6 se muestran los residuales para el experimento del porcentaje de madera dura. Al utilizar    y j. para calcular cada residual en esencia, se elimina el efecto de la concentración de utilizar  madera dura de esos datos; por consiguiente, los residuales contienen información acerca de la variabilidad no explicada.

Tabla 12-6

Residuales para el experimento de la resistencia a la tensión

Concentración de madera dura

Residuales

5%

-3.00

-2.00

5.00

1.00

-1.00

0.00

10%

-3.67

1.33

-2.67

2.33

3.33

-0.67

15%

-3.00

1.00

2.00

0.00

-1.00

1.00

20%

-2.17

3.83

0.83

1.83

-3.17

-1.17

En la figura 12-2 se muestra la gráfica de probabilidad normal de los residuales del experimento de la resistencia a la tensión del papel. En las figuras 12-3 y 12-4 se  presentan los residuales granea graneados dos contra los niveles del factor y el valor ajustado y.., respectivamente. Estas gráficas no revelan ninguna falta de adecuación del modelo ni

algún problema excepcional con los supuestos. EAAA  

60

EAAA  

Diseño de experimentos. •1. Anális nálisis is de varia arianz nza. a. Suponga que un experimento industrial un ingeniero está interesado en cómo la absorción media de humedad en concreto varía entre cinco mezclas diferentes de concreto. Las muestras se exponen a la humedad por 48 horas y se decide que se prueben seis muestras para cada mezcla, por lo que se requiere probar un total de 30 muestras. Los datos de este experimento se muestran en la siguiente tabla.

Tabla 1

Absorción de humedad en mezclas de concreto. Mezcla

1 551.00 457.00 450.00 731.00 499.00

2 595.00 580.00 508.00 583.00 633.00

3 639.00 615.00 511.00 573.00 648.00

4 417.00 449.00 517.00 438.00 415.00

5 563.00 631.00 522.00 613.00 656.00

632.00

517.00

677.00

555.00

679.00

61

EAAA

62

 

El modelo para esta estimación se puede pu ede considerar como sigue. Hay 6 observaciones que se toman cada una de d e las cinco poblaciones con medias m , m ,..m respectivamente y deseamos probar 1

2

5

H0 : m 1 = m 2  = m 3  = m 4  = m 5 

H1 : al menos dos de las medias no son iguales.

Además, nos podemos interesar en realizar comparaciones individuales entres estas cinco medias poblacionales. En el procedimiento de análisis de varianza, se supone que cualquier variación que exista entre los promedios de las mezclas se atribuye a

EAAA

63

 

Formulas para el cálculo de sumas de cuadrados.

 A continuación continuación presentamos un conjunto de formulas mas simples para calcular la suma de cuadr 

 



 

n

2

 y      i   j   SST     yij  ij

n



1

2

1

nk 

i 1  j 1

 



 

n

    i   j   y    SSA  n  yi   k 

ij

2

i 1

SSE   SST   SSA

1

1

nk 

2

EAAA

64

 

ANALISIS DE VARIANZA DE DOS VÍAS o DIRECCIONES ANOVA 2 VIAS) 1. Introducción En este caso las fórmulas son parecidas a la del ANOVA de una vía pero ahora agregando el cálculo por renglones adicional al de columnas donde se inclu incluye ye la variable variable de de bloqueo. bloqueo. Se trata de bloquear un factor externo que probablemente tenga efecto en la respuesta pero que no hay interés en probar su influencia, sólo sólo se bloquea bloquea para minimizar la variabilidad de este factor externo, evitando que contamine la prueba de igualdad entre los tratamientos. Los tratamientos se asignan a las columnas y los bloques a los renglones. Un bloque indica condiciones similares de los sujetos al experimentar con diferentes tratamientos.

EAAA  

LAS HIPÓTESIS SON:

Ho: No hay diferencia en las medias del factor de columna

Ha: Al menos una media del factor de columna c olumna es diferente

Ho: No hay diferencia en las medias de la variable de renglón

Ha: Al menos una media de la variable de renglón r englón es diferente

65

EAAA  





La SSTotales y SSTr columnas)se determina de la misma forma que para la ANOVA de una dirección o factor En forma adicional se determina la suma de cuadrados del factor de bloqueo renlgones) ) de forma similar a la de los renglone rengloness

La

SSE = SSTOTALES   SSTr SSBi

66

EAAA

67

 

2

SSBi 

 B      x        n  i   n i

 gl .SSBi  b  1  MSB  MS B  SSB /(b  1

2

EAAA

68

 

SSE  SST  SSTr  SSBi 





 gl . M  MSE  SE  (n k )( n b) 





 MSE   M SE   M  MSB SBii /( n k )( n b) 





EAAA  

 Fc

 MSTr    

 MSE 

 MSB  M SBi  Fc



 MSE   M SE 

69

EAAA

70

 

FUENTE DE VARIACIÓN  

SUMA DE GRADOS DE CUADRADO CUADRADOS LIBERTAD MEDIO

VALOR F

Entre mue stra s (tra ta m.)

S S Tr

a -1

MSR

SSTr/MSR

Entre Bloque s (Fa ctor Bl)

SSBi

b-1

MSB

MSB/MSR

De ntro de mue stra s (e rror)

SSE

(a -1)(b-1)

MS E

SSTota l

n-1

MS T

Va ria ción tota l

Regla:: No rechazar Regla rechaz ar si la F de la mues mue stra es menor me nor que la F de Exce Excell para una cie ciert rtaa alf  a lf 

EAAA

71

 

Tabla de Análisis de varianza para dos criterios de clasificación Fuente de variación

Suma de Cuadrados

G Grrados de libertad

Cuadrados Medios

F calculada

Tratamientos

SCA

t-1

CMA = SCA / t-1

CMA / CME

Bloques

SCB

b -1

CMB = SCB / b-1

CMB / CME

Error Experimental

SCE

(t - 1)(b-1)

Total

SCT

t.b -1

  ( yij   y..) i

j

Variación total

2

2

2

   . j   y..)    ( yij   yi.   y. j  y.. )  t  ( yi .   y..)   b ( y i

 j

Variación debida a los tratamientos

SCT

CME = SCE / (t-1)(b-1)

SCA

i

Variación debida a los bloques SCB

j

Variación propia de las observaciones SCE

2

EAAA  





Si Fc Tr o Bi) es mayor que F del niv nivel el de confianza se rechaza Ho Aceptando Ha donde las medias son diferentes O si el vvalor alor de p correspondient correspondientee a Fc Tr o Bi) es menor de Alfa se rechaza Ho

72

EAAA

73

 

Un químico desea probar el efecto que tienen cuatro agentes químicos sobre la resistencia de un tipo particular de tela. Como puede existir variación entre un rollo de tela y otro, decide utilizar un diseño aleatorizado por bloques, considerando los rollos de telas comoa bloques. El químico de cinco les aplica A loscontinuación cuatro agentes químicos sendas porciones de dispone cada rollo, en unrollos ordeny aleatorio. se  proporcionan los resultados de la resistencia resistencia a la tensión: Rollos de Tela  Agente Químico 1 2 3 4

1 64 73 75 73

2 68 67 78 71

3 67 75 68 75

4 67 72 73 75

5 67 70  68  69 

a) Determine el modelo apropiado para el análisis de este experimento y estime los  parámetros del modelo modelo  b) Analice el experimento experimento en la forma más ccompleta ompleta posible (5% de significación) c) Suponer que falta la observación correspondiente al agente químico 2 y al rollo de

tela 3. Analice este problema estimando el valor faltante. EAAA

74

 

Las hipótesis son: Ho:   1  =  Ho:   =   2 =  =   3  =  =   4  vs la H1 : al menos un  un   i    j donde i  i    j  j.. Est Esto o se se pru prueb ebaa con con:: CMA / CME

F=

Ho:   1 =  Ho:   =   2 =  =    3 =  =    4 =   5   vs la H1 : al menos un  un   i    j donde i  i   j.  j. Esto se se prueba prueba con con:: F = CMB / CME k  2  y  i

SC  A 

2

i 1

2

  y  = (333)

ni



n

2

(352)



5

 

2

(362)



2

2

(363)



(287) 2



(1410) 20



116,20  

k  2  y   j

SC  B 

i 1



donde n =k ni  k 

ni

 y2

i 1  j 1



(284) 2

2 ij



(280) 2

  

(274) 2

5

n

SC T     y   

=

(285) 2

 y2 n

2

2



(1410) 2 20

2

 (64)  (68)  .....  (69) 

(1410) 2 20

 251,00  



26,50  

SCE  SCT  SCA  –  SCB  251,00  –  116,20  –  26,50

108,30 EAAA

75

 

 

Grados Suma de Cuadrados Fuente de Variación de Cuadrados Medios Fobserv  Ftabla  Libertad (SC) (CM) Tipo de circuito (k - 1) 3 116,20 38,73 *3,93 3,59 Bloques (b –  1) 4 26,50 6,62 0,67 3,36 Error (k - 1) (b –  1)-1 11 108,30 9,84 Total (n - 1)-1 18 251,00

F(0,05; 3, 11) F(0,05; 4, 11) 

Como Fo > Ftabla, entonces, se rechaza Ho, existen diferencias significativas en las resistencias de las telas, con un 95 % de confianza, los agentes químicos tienen influencia sobre las telas seleccionadas

EAAA

76

 

Suponiendo que se quiere investigar si la producción de tres diferentes máquinas es igual, tomando en cuenta la experiencia de los operadores a un nivel de significancia del 5%.

Experiencia

Máquinas

de ops. En años 

Maq 1

Maq 2

Maq 3

Promedios

1

27

21

25

24.33333

2

31

33

35

33

3

42

39 39

4

38

41

37

38.66667

5

45

46

45

45.33333

36.6

36

36.2 36.2

36.26667

Promedios

40

EAAA

77

 

TABLA ABL A ANOVA Conclusión: No hay diferencia entre máquinas a pesar de la diferencia en experiencia de los operadores. SS

GL

CM

Fc

Falfa

SCTR=

0.933333

2

CMTR=

0.466667 F Fttr = 0.09

4.46

SCBL=

764.9333

4

CMBL=

191.2333 F Fb bl = 37.25

3.84

SCE =

41.06667

8

CME=

5.133333

SCT =

806.9333

14

CMT=

57.6381

EAAA

78

 

Ejemplo: Para el ensamble de un artículo se considera comparar 4 máquinas diferentes. Como la operación de las máquinas requiere cierta destreza se anticipa que habrá una diferencia entre los operarios en cuanto a la velocidad con la cual operen la maquinaria. Se decide que se requerirán 6 operarios diferentes en un experimento de bloques aleatorizado para comparar las máquinas. Tiempo en segundos para el ensamble del producto Operario Máquina

1

2

3

4

5

6

Total

Medias

1

42,5

39,3

39,6

39,9

42,9

43,6

247,8

41,3

2

39,8

40,1

40,5

42,3

42,5

43,1

248,3

41,4

3

40,2

40,5

41,3

43,4

44,9

45,1

255,4

42,6

4

42,3

43,2

44,5

45,2

46,9

43,3

265,4

44,2

Total

164,8

163,1

165,9

170,8 177,2

175,1

1016,9

Medias

41,2

40,775 41,475

42,7

43,775 254,225

44,3

42,4

EAAA  

Si las máquinas no difieren en cuanto a la velocidad de ensamblado de la pieza, tendrían igual velocidad promedio y las curvas se superpondrían exactamente. H0 : µ1= µ2 = µ3= µ4 ó H0 = α1=α2=α3=α4=0

µ

Pero si las máquinas difieren en cuanto a la la velocidad de ensamblado de la pieza, pensaríamos que las muestras provienen de poblaciones diferentes, e H1: algún promedio es distinto de los restantes

79

EAAA  

80

EAAA

81

 

EL MODELO (DE EFECTOS FIJOS)  Yij = µ + αi + β j + eij Modelo lineal aditivo: cada respuesta es la suma de los otros términos.

Donde Y es la variable respuesta o dependiente, tiempo medido en segundos, e Y es la observación perteneciente al j-ésima bloque bajo ij el tratamiento i; las observaciones son independientes. in dependientes. µ es la media general común a todas las máquinas y a todos los operarios. αi es el efecto del tratamiento en el nivel i, propio de cada máquina. β j es el efecto del bloque en el nivel j, propio de cada oper operario. ario.

eij es la variable aleatoria del error e rror con distribución normal, con media = 0 y varianza σ2 N (0 ; σ2 ) e independiente.

EAAA  

Consideremos que se lleva a cabo un experimento para comparar el tiempo que tardan tres marcas de ordenadores de diferente marca en cargar un mismo sistema operativo. Se toma una muestra de cuatro ordenadores de la marca A, es decir, decir, se mide el tiempo (ensegundos) que tardan en cargar el sistema operativo cuatro ordenadores de esta marca. De la marca B se toman seis medidas y cinco de la marca C. La tabla siguiente registra los resultados del experimento:

Marca A 10,7 11,2 12,0 15,5 Marca B 13,4 11,5 11,2 15,1 13,3 12,9 Marca C 11,5 12,7 15,4 16,1 15,2 EXISTE DIFERENCIA ENTRE LAS MARCAS

82

EAAA

83

 

Muestra j Muestra  j = 1 Muestra j=2  x 11 = 10,7 11 x12 = 13,4  x 21 = 11,2 x22 = 11,5  x31 = 12,0 x32 = 11,2  x41 = 15,5 x42 = 15,1  x52 = 13,3 x53 = 15,2   x62 = 12,9 Media = 12,35 = 12,90 Varianza = 4,70  x 1 x 2 x 3 s1 2 s2 2 s3

= 2,02

Muestra j=3 x13 = 11,5  x23 = 12,7  x33 = 15,4 x43 = 16,1

= 14,18  = 3,90 

EAAA  

84

EAAA  

Es posible representar esta situación mediante los diagramas de caja de las tres muestras:

85

EAAA

86

 

Un experimento en el que se prepararon nudos de soldadura con diferentes composiciones químicas. Se hicieron varias soldaduras utilizando cada flujo sobre metal con base de acero AISI-1018. La tabla 9.1 presenta los resultados de las mediciones de la dureza, en la escala de Brinell, de cinco soldaduras que usan cada uno de los cuatro flujos. TABLA 9.1 Dureza de Brinell de soldaduras que utilizan cuatro flujos diferentes Flujo

Valores de la muestra

Media muestral

Desviación estándar muestral

 A B C

250 263 257

264 254 2/9

256 267 269

260 265 273

239 267 277

253.8 263.2 271.0

9.7570 5.4037 8.7178

D

253

258

262

264

273

262.0

7.4498

Se puede concluir que hay diferencias en las medias poblacionales entre los cuatro tipos de flujos? 

Determine un intervalo de confianza del 95% para la media de la dureza de soldaduras producidas producidas con el flujo A.

EAAA

87

 

EXPERIMENTOS DE DOS FACTORES En los experimen experimentos tos de un factor, factor, analizados, analizados, el propósito propósito es determinar si al cambiar el nivel de un solo factor sólo se afecta la respuesta. Muchos experimentos implican variar algunos factores, cada uno de ellos puede afectar la respuesta. Se analizará el caso en el que existen dos factores. Los experimentos, naturalmente suficientes, son llamados

experimentos de dos factores EAAA

88

 

Un ingeniero químico está estudiando los efectos de varios reactivos y catalizadores en la producción de cierto proceso. Esta última se expresa como un porcentaje de un máximo teórico. Se hicieron cuatro operaciones del proceso para cada combinación de tres reactivos y cuatro catalizadores. Los resultados se presentan en la tabla 9.2. En este experimento hay dos factores, el catalizador y el reactivo. El primero se llama factor rengl ón, ya que su valor varía de renglón a renglón en la tabla; el segundo se denomina factor columna. Estas designaciones son arbitrarias, en la tabla se podía haber presentado tan f ácilmente como que los renglones representen los reactivos y las columnas, los catalizadores Producciones para varias operaciones operaciones de un proceso quí mico mico con varias combinaciones de reactivos y catalizador catalizadores es Catalizador

1

2

3

A

86.8 82.4 86.7 83.5

93.4 85.2 94.8 83.1

77.9 89.6 89.9 83.7

B

71.9 72.1 80.0 77.4

74.5 87.1 71.9 84.1

87.5 82.7 78.3 90.1

C

65.5 72.4 76.6 66.7

66.7 77.1 76.7 86.1

72.7 77.8 83.5 78.8

D

63.9 70.4 77.2 81.2

73.7 81.6 84.2 84.9

79.8 75.7 80.5 72.9 EAAA

89

 

TABLA Promedio de las producciones ij para operaciones de un proceso químico utilizando diferentes combinaciones de reactivos y catalizadores

Reactivo Catalizador

 A B C D Media de la columna X,

1

84.85 75.35 70.30 73.18 75.92

2

89.13 79.40 76.65 81.10 81.57

3

85.28 84.65 78.20 77.23 81.34

Media del renglón X,..

86.42 79.80 75.05 77.17 Gran media muestral X... =79.61

Cada número en el cuerpo de la tabla es el promedio de los cuatro números en la celda correspondiente de la tabla A Éstos se llaman las medias de las celdas. Utilizando un ANOVA de dos sentidos para probar hipótesis

Un análisis de varianza de dos sentidos está diseñado para responder tres preguntas principales: 1. ¿El modelo aditivo vale? 2. ¿Si es así, la media del resultado es la misma para todos los

3.

niveles del factor renglón? ¿Si es así, la media del resultado es la misma para todos los niveles del factor columna? EAAA

90

 

1Para probar si el modelo aditivo vale se prueba la hipótesis nula de que todas las in inttera eracci cion ones es son ig igu uale ales a 0: Si esta hipótesi tesis s nula es verdadera, el modelo aditivo val vale. 2Para probar si la media del resultado es igual para todos los niveles del factor renglón, se prueba la hipótesis nula de que todos los efectos renglón son iguales a 0: S isensiv taeles hes ipódel telsfact is ctor nor ulare ensgl vóenrd. adera, entonce ces s la media del resultado es igu igual para todos lo los ivel de fa ren gló

3Para probar si la media del resultado es igual para todos los niveles del factor   columna, se prueba la hipó ipótesis nula de que todos los efectos columna son iguales a 0: Si esta hipótesis nula es verdadera, entonces la media del resultado es igual para todos los niveles del factor columna

EAAA

91

 

Igual que con un ANOVA de un sentido, las pruebas usuales para estas hipótesis nulas están basadas en las sumas de los cuadrados. Específicamente, son la suma de los cuadrados de renglón (SSA), de los cuadrados de columna (SSB), de los cuadrados de interacción (SSAB), y de los cuadrados del error (SSE). También es de interés la suma total de los cuadrados (SST), que es igual a la suma de las otras. La identidad del análisis de varianza

SST = SSA + SSB + SSAB + SSE

EAAA

92

 

El siguiente resultado de MI-NITAB presenta la tabla ANOVA para los datos de la tabla 9.2.

Las etiquetas DF, SS, F y P se refieren a los grados de libertad, suma de cuadrados, media cuadrática, los estadísticos F, y P-valor, respectivamente. Como en un ANOVA de un sentido, la media cuadrática para el error (MSE) es una estimación de la varianza del error 2, la cantidad S   representa la raíz cuadrada de MSE y es una estimación de la desviación estándar del error. Las “



cantidades R-sq   y R-sq(adj)   se calculan con fórmulas similares a las del ANOVA de un sentido. “







EAAA

93

 

1. (Ejemplo1) Supóngase que el administrador de una planta industrial conjetura que el rendimiento (en número de artículos producidos por turno de 8 horas) de una línea de producción depende de dos variables cualitativas: el supervisor de la línea (de los cuales hay dos, digamos A1 y A2) y el turno para el cual se mide la producción. Denotaremos los tres turnos, de 8:00 am a 4:00 pm, de 4:00 pm a 12:00 am y de 12:00 am a 8:00 am, por B1;B2 y B3: El administrador desea establecer si existen diferencias entre las producciones de los distintos turnos, con cada supervisor y si existe interacción entre los dos factores, para ello efectuó r = 3 réplicas de un experimento factorial 23 para investigar el efecto de supervisor.(con dos niveles) y .turno.(con tres niveles). Las observaciones se dan en la tabla a continuación .

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF