Diseño de Experimentos de Un Factor

September 17, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Diseño de Experimentos de Un Factor...

Description

 

 

 

Diseño de experimentos de un factor Competencias

1.  Identificar dentro de la familia de los diseños experimentales, aquellos utilizad utilizados os en la comparación de tratamientos. tratamientos. 2.  Diferenciar los distintos modelos estadísticos y los análisis de varianzas en experimentos con un sólo factor. 3.  Realizar las diversas pruebas de rangos múltiples y la comparación por contrastes. 4.  Verificar los supuestos del modelo estadístico en diseños con un solo factor.

2.1. Familia de diseños para comparar tratamientos. Los diseños experimentales más utilizados para comparar tratamientos son: 1. Diseño completamente al azar (DCA) 2. Diseño en bloque completamente completamente al azar (DBCA) 3. Diseño en cuadro latino (DCL) 4. Diseño en cuadro grecolatino (DCGL (DCGL))

La diferencia fundamental entre estos diseños es el número de factores de bloque que incorporan o controlan de forma explícita durante el experimento. La comparación de los tratamientos en cuanto a la respuesta media que logran, en cualquiera de estos diseños, se hace mediante la hipótesis

que se prueba con la técnica estadística llamada Análisis de Varianza (ANOVA) con uno, dos, tres o cuatro criterios de clasificación, dependiendo del número de factores de bloques incorporados al diseño.

 

  El modelo estadístico que describe el comportamiento de la variable observada Y en cada diseño, incorpora un término adicional por cada factor de bloqueo controlado. De acuerdo con los modelos dados en la l a tabla, para cada diseño comparativo se tienen al menos dos fuentes de variabilidad: los tratamientos tratamientos o niveles del factor de interés y el error aleatorio. Se agrega una nueva fuente de variabilidad por cada factor de bloque que se controla directamente. Se observa que los diseños suponen que no hay efectos de interacción entre los factores, lo cual sería lo deseable que ocurra; de no ocurrir así, tal efecto se recarga al error y el  problema de comparación comparación no se resuelve con éxito. éxito.

Un efecto de interacción entre dos factores hace referencia a que el efecto de cada factor depende del nivel en que se encuentra el otro.

2.2. El modelo de efectos fijos El modelo de efectos fijos (es cuando se estudian todos los posibles tratamient tratamientos) os) de análisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a varios factores, cada uno de los cuales le afecta sólo a la media, permaneciendo permaneciendo la "variable respuesta" con una distribución normal.

Este modelo se supone cuando el investigador se interesa únicamente por los niveles del factor presentes en el experimento, por lo que cualquier variación observada en las puntuaciones se deberá al error experimental.

 

 

2.3. Diseño completamente al azar y ANOVA Muchas comparaciones, como las antes mencionadas, se hacen con base en el diseño completamente al azar (DCA), que es el más simple de todos los diseños que se utilizan para comparar dos o más tratamientos, dado que sólo consideran dos fuentes de variabilidad: los tratamientos y el error aleatorio. En la siguiente unidad veremos diseños que consideran la influencia de otras fuentes de variabilidad (bloques). Este diseño se llama completamente al azar porque todas las corridas experimentales se realizan en orden aleatorio completo. De esta manera, si durante el estudio se hacen en total N pruebas, éstas se corren al azar, de manera que los posibles efectos ambientales y temporales se vayan repartiendo equitativamente entre los tratamientos. Ejemplo 1 Comparación de cuatro métodos de ensamble. Un equipo de mejora investiga el efecto de

cuatro métodos de ensamble A, B, C y D, sobre el tiempo de ensamble en minutos con un nivel de significancia de 0.05. En primera instancia, la estrategia experimental es aplicar cuatro veces los cuatro métodos de ensamble en orden completamente aleatorio (las 16 pruebas en orden aleatorio). Los tiempos de ensamble obtenidos se muestran en la tabla 2.1. Si se usa el diseño completamente al azar (DCA), se supone que, además del método de ensamble, no existe ningún otro factor que influya de manera significativa sobre la variable de respuesta (tiempo de ensamble)

 

Ejemplo 2 Comparación de cuatro tipos de cuero. Un fabricante de calzado desea mejorar la calidad de

las suelas, las cuales se pueden hacer con uno de los cuatro tipos de cuero A, B, C y D disponibles en el mercado. Para ello, prueba los cueros con una máquina que hace pasar los zapatos por una superficie abrasiva; la suela de éstos se desgasta al pasarla por dicha superficie. Como criterio de desgaste se usa la pérdida de peso después de un número fijo de ciclos. Se prueban en orden aleatorio 24 zapatos, seis de cada tipo de cuero. Al hacer las pruebas en orden completamente al azar se evitan sesgos y las mediciones en un tipo de cuero resultan independientes de las demás. Los datos (en miligramos) sobre el desgaste de cada tipo de cuero se muestran en la tabla 2.2

El análisis de la varianza de un criterio (ANOVA de un criterio) es una metodología para analizar la variación entre muestras y la variación al interior de las mismas con varianzas, en lugar de rangos. Como tal, es un método estadístico útil para comparar dos o más medias poblacionales. El objetivo del análisis de varianza en el DCA es probar las hipótesis de igualdad de los tratamientos con respecto a la media de la correspondiente variable de respuesta:

Nota: Primeramente explicare el cálculo manual tradicional para ANOVA, posteriormente el simplificado y más práctico, así como su solución utilizando un paquete computacional.

 

  Método dentro

El método dentro de estimación de la varianza produce una estimación válida sin importar si la hipótesis nula de las medias poblacionales iguales es cierta. Esto se debe a que la variabilidad de los valores de la muestra se determina comparando cada elemento en los datos con la media muestral. Cada valor de la muestra obtenido de la población A se compara con la media muestral A; cada elemento obtenido de la población B se compara con la media muestral B, y así sucesivamente. La ecuación para calcular la estimación de la varianza con el método dentro es:

 

El número adecuado de grados de libertad para el método dentro se calcula como c(n-1) si el número de observaciones en cada grupo es igual. Como a cada elemento del grupo se le resta la media de ese grupo, sólo (n-1) elementos de cada grupo pueden variar. Además, como se tienen c grupos, c se multiplica por (n-1) para obtener los grados de libertad para el método dentro.

 

La tabla ANOVA contiene columnas con las fuentes de variación, las sumas de cuadrados, los grados de libertad, las estimaciones de la varianza y el valor F para el procedimiento de análisis de varianza. Retomando el problema del efecto de cuatro métodos de ensamble A, B, C y D, sobre el tiempo de ensamble en minutos tenemos:

 

 

El valor de F calculado por tabla cuando tenemos un nivel de significancia de 0,05 y 3 grados de libertad en el numerador y 12 grados de libertad en el denominador es F 0,05 (3,12) = 3,49 Como nuestro estadístico de prueba F (9,42) excede el valor crítico tabulado (3,49), rechazamos la hipótesis nula y aceptamos la alterna, concluyendo que sí hay diferencia o efecto de los métodos de ensamble en cuanto a su tiempo promedio. Ahora veremos el procedimiento y notación más comúnmente utilizado para la solución de ANOVA

 

  ANOVA Como ya lo mencionamos el objetivo del análisis de varianza en el DCA es probar la hipótesis de igualdad de los tratamientos con respecto a la media de correspondiente variable de respuesta.

Para probar la hipótesis dada por la relación:

mediante la técnica de ANOVA, lo primero es descomponer la variabilidad total de los datos en sus dos componentes: la variabilidad debida a tratamientos y la que corresponde al error aleatorio (equivalente al método entre y método dentro), como se hace a continuación.

 

 

 

 

Análisis del ejemplo 1 (comparación de cuatro tipos de métodos de ensamble). La interrogante que se planteó en el problema de la comparación entre los cuatro tipos de métodos de ensamble fue: ¿existen diferencias entre el tiempo promedio de los diferentes métodos de ensamble? La respuesta a esta pregunta es el resultado de contrastar las hipótesis:

 

 

 

Resultados arrojados en un paquete computacional (Excel y Minitab), para el ejemplo 1 de los tiempos de ensamble para los cuatro métodos.

Diagrama de cajas simultáneos

Los diagramas de cajas es una herramienta para describir el comportamiento e unos datos, y es de suma utilidad para comparar procesos, tratamientos y, en general, para hacer análisis por estratos (lotes, proveedores, turnos). En el resultado arrojado por Minitab se observa en la figura (figura 2.1) que el método C parece diferente al los métodos A y B en cuanto a sus medias; la media del método D también se ve diferente a la media del método A. Por otra parte, se observa un poco más de variabilidad en el método C que en todos los demás. Lo que sigue es

 

verificar que lo que se observa en el diagrama de cajas implica diferencias significativas entre los distintos tratamientos; por lo tanto, es necesario hacer pruebas estadísticas porque los datos que se analizan en los diagramas de cajas son muestras.   En general, cuando los diagramas no se traslapan es probable que los tratamientos correspondientes sean diferentes entre sí, y la probabilidad es mayor en la medida que los diagramas están basados en más datos. Cuando se traslapan un poco puede ser que haya o no diferencias significativas, y en cualquier caso es conveniente utilizar una prueba estadística para determinar cuáles diferencias son significativas. Estas pruebas se verán en la siguiente sección.

Análisis del ejemplo 2 (comparación de cuatro tipos de cuero). La interrogante que se planteó

en el problema de la comparación entre los cuatro tipos de cuero fue: ¿existen diferencias entre el desgaste promedio de los diferentes tipos de cuero? La respuesta a esta pregunta es el resultado de contrastar las hipótesis:

 

 

 

 

 

 

 

 

 

En el resultado de comparación de parejas arrojado por minitab, por el método de LSD, observamos que este nos indica los intervalos de confianza para las comparaciones de cada par de muestras, por lo que debemos tomar el punto medio de cada comparación (centro) y contrastarlo con el valor del estadístico t de student obtenido en tablas (2,42) y tomar la decisión que corresponda

 

 

 

 

 

 

En las comparaciones donde la diferencia observada es mayor que el rango respectivo, se concluye que esas medias son significativamente diferentes. Si dos medias caen entre otras

 

dos que no son muy diferentes, entonces esas dos medias poblacionales también se consideran estadísticamente iguales. Ejemplo. Supongamos que nos interesa probar las seis hipótesis para los cuatro métodos de ensamble del problema anterior.

Estos rangos se comparan con las diferencias de medias de acuerdo al método descrito anteriormente.

 

  Método de Dunnet (Comparación de tratamientos con un control). En muchos problemas científicos y de ingeniería no interesa extraer inferencias con respecto a todas las posibles comparaciones entre las medias de los tratamientos. En su lugar, el experimento a menudo dicta la necesidad de comparar de manera simultánea cada tratamiento con un control. Por ejemplo, al comparar varios medicamentos para el resfriado es conveniente que uno de los tratamientos sea que los pacientes no utilicen ningún medicamento, esto sirve como referencia para decidir la posible utilidad de los medicamentos medicamentos.. Un procedimiento de prueba desarrollado por C.W. Dunnett determina diferencias significativas significativ as entre cada media del tratamient tratamiento o y el control, en un solo nivel de significancia.

Ejemplo. Para ilustrar el procedimiento de Dunnett , consideremos los datos experimentales de la siguiente tabla para la clasificación unilateral donde se estudia el efecto de tres catalizadores sobre el rendimiento de una reacción. Un cuarto tratamiento, sin ningún catalizador, se utiliza como control.

 

 

 

 

2.5. Verificación de los supuestos del modelo La validez de los resultados obtenidos en cualquier análisis de varianza queda supeditada a que los supuestos del modelo se cumplan. Estos supuestos son: A) Normalidad B) Varianza constante (igual varianza de los tratamientos) C) Independencia

 

 

Para comprobar cada supuesto existen pruebas analíticas y gráficas que veremos a continuación. Por sencillez, muchas veces se prefieren las pruebas gráficas. Éstas tienen el inconveniente de que no son exactas, pero aun así , en la mayoría de las situaciones prácticas proporcionan la evidencia suficiente en contra o a favor de los supuestos.  

 

 

las escalas de tal manera si los residuos distribución al graficarlos a quedar alineados en unaque línea recta; por losiguen tanto, una si claramente no normal, se alinean se concluyetienden que el supuesto de normalidad no es correcto.

Cabe enfatizar el hecho de que el ajuste de los puntos a una recta no tiene que ser perfecto, dado que el análisis de varianza resiste pequeñas y moderadas desviaciones al supuesto de normalidad.

 

 

Independencia La suposición de independencia en los residuos puede verificarse si se grafica el orden en que se colectó un dato contra el residuo correspondiente. De esta manera, si al graficar en el eje horizontal el tiempo (orden de corrida) y en el eje vertical los residuos, se detecta una tendencia o patrón no aleatorio claramente definido, esto es evidencia de que existe una correlación entre los errores y, por lo tanto, el supuesto de independencia no se cumple. Si el comportamiento de los puntos es aleatorio dentro de una banda horizontal, el supuesto se está cumpliendo. La violación de este supuesto generalmente indica deficiencias en la planeación y ejecución del experimento; asimismo, puede ser un indicador de que no se aplico en forma correcta el principio de aleatorización, o de que conforme se fueron realizando las pruebas experimentales aparecieron factores que afectaron la respuesta observada. Por ello, en caso de tener problemas con este supuesto, las conclusiones que se obtienen del análisis son endebles y por ello es mejor revisar lo hecho y tratar de investigar por qué no se cumplió con ese supuesto de independencia, a fin de reconsiderar la situación. En el ejemplo para comparar los cuatro tipos de cuero, las gráficas resultantes figuras 2.2 y 2.3. Se observa el cumplimiento de los supuestos de normalidad y varianza constante, sin embargo, en las dos gráficas es notorio un punto que se aleja bastante del resto, el cual es un punto aberrante cuyo origen debe investigarse

Elección del tamaño de la muestra Una decisión importante en cualquier diseño de experimentos es decidir el número de replicas que se hará por cada tratamiento (tamaño de muestra). Por lo general, si se esperan diferencias  pequeñas entre tratamientos tratamientos será necesario necesario un mayor mayor tamaño de muestra. muestra. Aunque existen varios métodos para estimar el tamaño muestral, muchas veces tienen poca aplicabilidad porque requieren cierto conocimiento previo sobre la varianza del error experimental.

 

Si recurrimos a la experiencia vemos que el número de réplicas en la mayoría de las situaciones experimentales en las que se involucra un factor varía entre cinco y diez; incluso, en algún caso puede llegar hasta 30. La tendencia podría inclinarse por un extremo de este rango e incluso salirse de éste, de acuerdo con las siguientes consideraciones:   A menor diferencia que se espera en los tratamientos, mayo mayorr será la cantidad de réplicas



si se quieren detectar diferencias significativas, y viceversa, es decir, si se esperan grandes diferencias quizá con pocas replicas sea suficiente

  Si se espera mucha variación dentro de cada tratamiento, debido a la variación de fuentes



no controladas como métodos de medición, medio ambiente, materia prima, etc., entonces se necesitarán más réplicas

  Si son varios tratamientos (cuatro o más), entonces éste es un punto favorable para reducir



el número de réplicas.

Además de lo anterior, es preciso considerar los costos y el tiempo global del experimento. De aquí que si toman en cuenta las consideraciones antes expuestas se podrá establecer el tamaño de muestra que permita responder en una primera fase las preguntas más importantes que se plantearon con el experimen experimento to

 

 

 

 

2.6. Uso de un software estadístico Excel a) En una hoja de Excel capturar primeramente la tabla de datos  b) En la misma hoja hoja de cálculo se seleccionar leccionar del cintillo cintillo superior Datos, Datos, luego Análisis de datos c) Seleccionar análisis de varianza de un factor en la ventana desplegada

 

  d) En rango r ango de entrada (en ventana de captura) seleccionar todos los grupos, incluyendo su rótulo (sombrearlos con el mouse), automáticamente automáticamente se incluyen. e) En el siguiente recuadro seleccionar seleccionar si nuestros datos están ordenados en filia o columnas, además indicar si tenemos rótulos en los encabezados, e indicar que los resultados los arroje en una hoja nueva

Nota: Si no aparece Análisis de datos en la parte superior derecha de la hoja de cálculo, se deberá de activar de la siguiente manera: En el símbolo del sistema en la parte superior izquierda de los encabezados dar clic.

  En la ventana desplegada seleccionar opciones de Excel en la parte inferior dando un clic.



  De la ventana desplegada señalar en el menú del lado izquierdo complementos



  De la ventana desplegada en el lado derecho, señalar en la parte inferior de la misma ir



con un clic.

  De la ventana desplegada palomear el recuadro de herramientas para análisis, y aceptar



  Nota como no está instalada esta herramienta el sistema nos preguntara si queremos



instalarla a lo que indicaremos que si, y la instalara en un par de minutos.

 

Minitab   En la hoja de cálculo que despliega Minitab capturar nuestra tabla de datos indicando sus



correspondientes rótulos en la primer fila que no está numerada

  En el cintillo superior indicar con el mouse Estadísticas



  Del menú desplegado seleccionar ANOVA, en el menú desplegado seleccionar Un solo



factor (Desapilado) y dar clic con el mouse

 



En ventana de captura desplegada (Análisis de varianza- Un solo factor), en la parte izquierda aparecerán automáticamente automáticamente los grupos de tabla de datos

  En el cuadro superior derecho (Respuestas (en columnas separadas)) indicar separando



 por un espacio (sin (s in comas) los nombres de las columnas que generalmente generalmente son letras, esto también se logra dando doble clic en cada letra del cuadro de la izquierda, automáticamente automáticam ente son capturadas

  En nivel de confianza por default es 95%



  Señalar Aceptar y nos arrojara el resultado ANOVA en la parte superior de la hoja de



calculo

 

 

  Si queremos hacer comparaciones de rango múltiples, entonces señalamos de la ventana



anterior comparaciones dando un clic.

  En la ventana desplegada señalaremos las comparaciones que queramos, y en control



nivel del grupo indicamos la A, y damos clic en aceptar

 

 

  Si queremos las gráficas del supuesto del modelo entonces, damos clic a gráficas



(antepenúltimaa ventana) y señalamos tres en uno y damos clic en aceptar (antepenúltim

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF