Descripción: El objetivo primordial del presente libro es presentar los conceptos para diferentes situaciones reales que...
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
ESTADÍSTICA EXPERIMENTAL
Aplicada a ciencia e ingeniería
EEddiicciióónn C CO ON NC CY YT TEEC C
PPA ALLA AC CIIO OSS C C.. SSEEV VEE1RRO O
Palacios C. Severo
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería EIRL
© PALACIOS C. Severo CEO Proceso SEVERO
[email protected] [email protected] (+511) 996696214, Lima – Perú (+5152) 952672846, Tacna – Perú (+505) 84566216 – Centro América Primera edición: ISBN: Hecho el Depósito Legal en la Biblioteca Nacional del Perú N° © PALACIOS C. Severo – CONCYTEC en la presente edición Tiraje: 1000 ejemplares Subvención CONCYTEC N° Consejo Nacional de Ciencia, Tecnología e Innovación TecnológicaCONCYTEC Presidente: Dr. Augusto Mellano Méndez Av. Del Aire 485, San Borja, Lima – Perú Telefax: (51) 01-2251150 www.concytec.gob.pe Impreso por: Derechos Reservados. Prohibida la reproducción de esta publicación por cualquier sistema conocido sin la autorización escrita del autor; y del editor en la presente edición.
2
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
La presente obra esta dedicada a la Memoria de: Juan de la Cruz Palacios Avendaño Adelaida Calisaya Flores Luz Lucila Zeballos Argandoña Camila Palacios Zeballos Ceferina Chambilla Chambilla Gustavo Vallenas Casaverde “Con mucho amor a quienes amor nos dio, que Dios lo tenga en su gloria y nosotros en nuestro corazón”
3
Palacios C. Severo
Un reconocimiento muy especial al Rector de la Universidad Nacional Micaela Bastidas de Abancay Dr. Leoncio Carnero Carnero
4
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
CONTENIDO
§1 I. II. III. IV. V. VI. VII. VIII. IX. X. XI. XII. XIII. XIV. XV. XVI. XVII. XVIII. XIX. §2 I. II. III. IV. V. VI. VII. VIII. IX. X. XI.
CONTENIDO Prólogo Introducción Estadística básica Introducción Recopilación de datos Cuestionario como fuente de datos Presentación de datos Análisis de datos Distribución de frecuencia Criterios de distribución de frecuencia Medias de tendencia central Medidas de disepersión Problemas Estimación de parámetros Diferencias significativas Dispersión de los datos problemas Problemas Distribuciones Intervalos de confianza Muestreo Métodos de muestreo Toma de decisiones Principios para la toma de decisión Planificación Problemas Análisis de regresión Introducción Métodos de mínimos cuadrados Modelos de regresión Modelo de regresión lineal con k variables Regresión lineal simple Regresión lineal múltiple Regresión polinomial Regresión polinomial cuadrática Regresión no lineal Coeficiente de correlación múltiple R² Prueba de significancía
Página 9 11 13 13 14 15 15 16 17 19 19 26 29 39 39 40 43 50 54 55 55 59 62 62 64 67 67 67 70 70 71 73 74 75 76 77 77 5
Palacios C. Severo
§3 I. II. III. IV. V. VI. VII. VIII. IX. X. XI. XII. XIII. XIV. §4 I. II. III. IV. a) b) c) V. VI. VII. VIII. IX. X. XI. XII. §5 I. II. 6
Problemas Principios de diseño experimental Introducción Tipo de experimentos Unidades experimentales y muéstrales Fuente de variación Control de la variación del no tratamiento Propiedades del diseño estadístico Replicación Aleatorización Control local Clasificación de los diseños Estrategia del diseño Diseño de tratamientos Diseño de muestreo Estudio experimental Problemas Diseño experimental aplicado a ciencias Introducción Limitaciones Predicción Diseño experimental Diseño aleatorizado Diseño unifactorial con n niveles Diseño de parcelas divididas Problemas Diseño totalmente aleatorizado Problemas Diseño de bloques aleatorizados Problemas Diseño cuadrado latino Problemas Diseño cuadrado greco – latino Problemas Prueba de intervalos múltiples de Duncan Diseño doble reverso Problemas Estimación de parámetros del modelo Polinomio ortogonal Métodos de análisis Introducción Métodos no paramétricos
81 83 83 84 86 87 90 92 96 97 99 101 103 104 105 106 110 111 111 111 112 113 113 114 118 121 129 131 134 141 143 147 151 153 154 154 157 158 159 161 161 162
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería III. IV. V. VI. §6 I. II. III. IV. V. VI. VII VIII. IX. X. XI. XII. XIII. XIV. XV. XVI. XVII. XVIII. XIX. XX. XXI. XXII. A. B. C. D.
Prueba U de Mann – Whitney Prueba H de Kruskal – Wallis Métodos multivariables Correlación de Spearman Problemas Diseños experimentales aplicado a ingeniería Introducción Problemas Diseños bifactoriales Comparación múltiple Diseño anidado Problemas Diseños factoriales Diseño factorial 2n Diseño factorial 2² Problemas Diseño factorial 2³ Problemas Diseño factorial 2k replicado Problemas Diseño 2k con pruebas centrales Diseño confundido Diseño factorial 2k con dos bloques Diseño factorial 2k con cuatro bloques Diseño factorial 2k con bloques replicados Algoritmo de Yates Problemas Diseño factorial fraccionado Medio fraccionado del diseño 2k Cuarto fraccionado del diseño 2k Problemas Diseño Plackett – Burman Problemas Diseños factoriales 3n Problemas Diseños rotables Diseños rotables con dos factores Diseño trigonal Diseño pentagonal Diseño hexagonal Problemas Diseño octogonal
162 165 166 168 171 173 173 176 177 180 182 184 186 188 189 195 205 221 225 228 231 233 233 235 236 237 239 244 245 247 250 258 263 266 270 275 275 275 276 276 280 281 7
Palacios C. Severo E. F. G.
§7 I. II. III. IV. V. VI: VII: VIII: IX. X. XI. XII. XIII.
8
Diseño compuesto centrado Problemas Diseño experimental comercial – EXCO Diseño Severo Diseño factorial centrado de dos factores Diseño Factorial centrado de tres factores Diseño rotable centrado de n factores Problemas Superficie respuesta Introducción Superficie respuesta Polinomio de primer orden Prueba de significancia Prueba de falta de ajuste Máxima pendiente ascendente Polinomio de segundo orden Caracterización de la superficie respuesta Diseño de superficie respuesta cuadrático Superficie de respuesta cuadrática Exploración de superficie respuesta Punto estacionario Criterio de formas cuadráticas Anexo Referencias
282 291 295 298 300 305 308 311 323 323 323 324 325 326 328 331 333 340 350 354 367 368 387 393
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
PRÓLOGO El objetivo primordial del presente libro es presentar los conceptos para diferentes situaciones reales que se ven a diario en el campo social, industrial y experimental. Se ha concebido primordialmente como un texto introductorio en planificación y control de operaciones a nivel laboratorio, bach e industrial. También se ha proyectado como un libro de referencia para agronomomos, alimentarios, pesqueros, biologos, medicos, civiles, geógrafos, ambientalistas, mecánicos, mineros, metalurgistas y químicos de Pre, Postgrado y Maestría, practicantes y científicos encargados de la planificación y operación de sistemas productivos tanto en la ciencia como en la ingeniería.
El libro es el resultado de conferencias ofrecidas en diferentes centros académicos latinoamericanos. Se ha intentado resaltar los conceptos técnicos y afirmando sin duda y sin excusas que la presentación es exactamente fidedigna. Se presentan los conceptos que considero pueden contribuir más a la comprensión de los principios, con referencia a los que pueden realizarse con los conocimientos básicos y las posibilidades e instrumentos de la tecnología actual. Se ha intentado presentar un marco conceptual que estimule la habilidad del lector de las diversas ramas del saber (Biología, Medicina, Ciencias Sociales, Economía, Administración, Ingenierías y áreas Técnicas) para entender la manera en que los factores (variables) interactúan en un sistema real de trabajo. La orientación del libro, no esta matemáticamente sofisticado. Los conocimientos previos necesarios como el cálculo, probabilidades y estadística descriptiva. En algunas secciones se realiza el uso de operaciones elementales de matrices. El libro está diseñado como un manual dividido en partes con capítulos para su mejor comprensión. Se propone servir como fuente de referencia para tratar casos específic0s de los lectores. Los ejemplos resueltos (fueron desarrollados aplicando los programas estadísticos Statgraphics Centurion y ESPC elaborado para el presente libro), sirven para ilustrar y ampliar las teorías, sin lo cual el lector sentiría un vació. Las demostraciones de procesos industriales se in9
Palacios C. Severo cluyen en ello. Los problemas suplementarios completan la revisión del material tratado en cada tema. El material cubre un curso habitual con el fin de flexibilizar, ampliar y mejorar los sistemas curriculares, siendo este un libro de consulta para interés de otros temas. No deseo finalizar sin agradecer a mi amigo Luis Solórzano Espinola por la revisión minuciosa y detallada de la presente edición del presente libro, su tiempo y esfuerzo es un aporte a la ciencia y tecnolgía como él siempre viene desarrollando en las aulas con los estudiantes de pre grado. Finalmente deseo agradecer a CONCYTEC por tan importante aporte a la educación a nivel de nuestro país, así mismo estoy en deuda con muchas universidades latinoamericanas gubernamentales como privadas por la cooperación para la elaboración del presente, de igual manera con prestigiosos colegas por su colaboración para la culminación de tan importante tema. EIRL
Palacios C. Severo CEO Proceso SEVERO Móvil: (+511) 996696214
[email protected]
10
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
INTRODUCCIÓN Si su trabajo tiene que ver con la investigación científica – tecnológi-
ca (ciencias e ingeniería). Probablemente se ha dado cuenta que la mayoría de los libros de estadística (básica y avanzada) son abstractos y no ayudan mucho en el tratamiento de la base de datos, pero usted sabe que el proceso al cual estudia funciona (de manera eficiente y sin problemas), es por ello que se tuvo que realizar el esfuerzo a fin de brindar al amable lector un texto con características nuevas a fin de poder llenar muchos vacíos, los cuales son parte de la experiencia. Lo que desea saber el investigador es como analizar e interpretar los datos de un proceso para tomar una decisión sobre los rangos óptimos, pero necesita saber cómo llevar a cabo una prueba experimental (laboratorio, bach e industrial); sabe que la estadística experimental le ayudara a seleccionar los rangos (niveles) y variables (factores) significativas del procesos innovativo, pero requiere ideas sobre como seleccionar estos. En la presente obra le explicaremos y despejaremos sus dudas. La palabra estadística se origina, en las técnicas de recolección, organización, conservación, y tratamiento de las diversas bases de datos propios, con que los antiguos gobernantes controlaban sus súbditos y dominios económicos. Estas técnicas evolucionaron a la par con el desarrollo de las matemáticas utilizando sus herramientas en el proceso del análisis e interpretación de la información. Estadística Experimental aplicada a ciencia e Ingeniería, el libro que en esta ocasión presento a los lectores de habla hispana, es un importante aporte. Por lo útil y por la novedad de su enfoque, a la falta de bibliografía. Para comprender los beneficios que pueden derivarse de la utilización de los conceptos (fundamentos) presentados, conviene tener presente la complejidad creciente de nuestras industrias (automatización), impuesta por los diferentes factores que están incidiendo en el cambio vertiginoso que caracteriza a nuestra época (competitividad) y que, en mayor o menor grado, con mayor o menor velocidad, llega a todas las regiones y países del mundo. Veamos algunos de los factores de complejidad en operaciones industriales. La planta recibe órdenes de producción que deban ser procesados y cumplidos en un 11
Palacios C. Severo lapso determinado, utilizando recursos internos y externos casi siempre escasos. La importancia de los resultados, anticipado en la toma de decisiones, empieza a buscar respuestas a otro tipo de preguntas ¿Qué es lo mejor? ¿Cómo optimizar un determinado conjunto de variables para alcanzar un fin específico? Que significan nuestros datos y que grado de confianza podemos tener en ello visto una predicción. El mundo actual requiere otras herramientas analíticas, aquellas que nos permitan crear modelos (lenguaje de comunicación) y definir relaciones entre diversos factores (interacciones). Esto requiere entre otras cosas que podamos guardar conjuntos particulares de datos aparte de las rutinas de análisis (numérico y sostenible) que se realicen en base a ella. El presente texto no pretende teorizar el saber estadístico, desde luego, no es un libro para estadísticos, ya que, adrede se obvia el rigor científico de lo expuesto en beneficio de la sencillez necesaria para el neófito; con un lenguaje coloquial se conduce al lector a través del contenido, a partir de dos o tres ejemplos que ilustran la aplicabilidad de los temas tratados. El avance tecnológico en la informática ha contribuido enormemente al desarrollo de la estadística, sobre todo en la manipulación de la información, pues en el mercado existen paquetes estadísticos de excelente calidad, como el SAS, SPSS, SCA, Statgraphics, amén de otros, que corren en un ordenador sin mayores exigencias técnicas, permitiendo el manejo de grandes volúmenes de información y de variables.
12
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
§1 ESTADÍSTICA BÁSICA (...) Conseguimos obtener así la fórmula estadística para conocer aproximadamente la posición de un electrón en un instante determinado. Pero, personalmente, no creo que Dios juegue a los dados. Albert Einstein
I.
INTRODUCCIÓN
En las últimas décadas la estadística ha alcanzado un alto grado de
desarrollo, hasta el punto de incursionar en la totalidad de las ciencias e ingeniería; inclusive, en la lingüística se aplican técnicas estadísticas para esclarecer la paternidad de un escrito o los caracteres más relevantes de un idioma. La estadística es una ciencia auxiliar para todas las ramas del saber humano; su utilidad se entiende mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre y la estadística ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un determinado grado de confianza. Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa que sucede en la naturaleza, lo cual es un concepto profano que se deriva de la ignorancia en este campo y de lo polifacético de los métodos estadísticos. Sin embargo muchos investigadores tendenciosos han cometido abusos con la estadística, elaborando investigaciones de intención, teniendo previamente los resultados que les interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por ignorancia o negligencia, abusan de la estadística utilizando modelos inapropiados o razonamientos ilógicos y erróneos que conducen al rotundo fracaso de sus investigaciones. A veces nuestras vidas parecen estar controladas por estadísticas. De informes sobre el tiempo, lectura de las presiones sanguíneas, todos tenemos que ver rutinariamente con una amplia variedad de medidas estadísticas. 13
Palacios C. Severo El análisis estadístico es útil para la investigación (tecnológica y científica), pues ayuda a resumir e interpretar el gran volumen de cifras que resultan aún en la encuesta más pequeña. Los principios estadísticos que se usan en la investigación provienen en gran escala de las ciencias sociales, economía e ingeniería. Como resultado hay gran cantidad de libros enteros sobre estadística, probablemente más que sobre cualquier otro aspecto de la investigación. El propósito de la presente obra es darle a usted una visión panorámica de los tipos de medidas estadísticas más importantes que se usan. Si usted requiere información más detallada, consulte algunos de los muchos libros buenos en estadística que están disponibles1. Aunque existen centenares de medidas y pruebas estadísticas que pueden utilizar los investigadores, nosotros estudiaremos los de amplia aplicación para desarrollar los trabajos prácticos. II.
RECOPILACIÓN DE DATOS
El primer paso para describir un fenómeno natural es reunir los datos estadísticos necesarios. La fuente de los datos puede clasificarse como internas o externas. Los datos internos incluyen estadísticas sobre las operaciones de la empresa, tales como estadísticas de producción, comercialización, transformación, etc. Los datos estadísticos no vinculados con el funcionamiento de la empresa propiamente dicha se llaman datos externos. La gerencia de producción de una fábrica de fundición puede necesitar información sobre la cantidad de cierto metal en el mercado nacional, con el propósito de estimar las ventas a 10 años plazo. Hay enormes cantidades de datos comerciales, empresariales, farmacéuticos, que pueden consultarse en las bibliotecas públicas y en las universidades. El gobierno es el mayor editor de estadísticas anuales, mensuales, semanales, diarias. Una publicación anual del Instituto Nacional de 1
Ver referencias bibliográficas
14
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Estadística contiene más de mil páginas de datos sobre precios, educación, producción y otros puntos, que son de utilidad para los que procesan datos: economistas, analistas y demás profesionales. III. CUESTIONARIO COMO FUENTE DE DATOS Los datos estadísticos relativos a la opinión corriente de los consumidores sobre determinados programas de televisión, nuevos productos, candidatos políticos y otros, no pueden hallarse en publicaciones. Por ello, este tipo de información debe reunirse a través de la entrevista personal, por cuestionarios o algún otro medio. La ventaja de ello es el alto porcentaje de respuestas posibles. Sin embargo, es por regla general más costosa que enviar cuestionarios por correo. Las firmas de analistas y consultores saben que es inconveniente el formulario postal como instrumento para recopilar datos por ser relativamente bajo el porcentaje de respuestas a ciertos cuestionarios. La conveniencia principal del cuestionario como técnica de recopilación de datos es sus costos relativamente bajo. IV. PRESENTACIÓN DE DATOS Gráfica de líneas simples y de barras simples. Cualquiera de estos dos tipos de gráfico puede utilizarse ventajosamente para representar la tendencia general de la producción. El cúmulo de datos estadísticos dentro de una empresa, de fuentes publicadas, o recopilados por entrevistas personales, no está usualmente apta para un análisis. Los datos deben organizarse y presentarse en una tabla o gráfico, antes de efectuar ningún análisis ni interpretación. Si se necesitan cifras exactas de un informe convendría presentar los datos en una tabla. En caso contrario, es preferible un gráfico para atraer la atención del lector. Gráfico de líneas múltiples y de barras múltiples. La tendencia o movimiento de las exportaciones de dos comercializadoras se pueden representar gráficamente. Gráfico de barras de componentes. El gerente de ventas de una embotelladora desea graficar el total de ventas en tres años y también la variedad de los productos en relación con el total. Podría utilizar un gráfico de líneas o un gráfico de barras. 15
Palacios C. Severo Gráfico de barras bi direccionales. Para indicar los cambios porcentuales puede utilizarse un gráfico bi direccional, que también es útil para ilustrar ganancias y pérdidas, producción o ventas cobre lo normal o bajo lo normal de un período a otro. Por ejemplo, se representan los cambios porcentuales de ventas correspondientes a cinco años de ventas: Sucursales Mercado Central Mercado Sur Mercado Norte Mercado Este Mercado Oeste
V.
2005 10 5 2 6 10
Ventas
2010 8 7 4 3 11
Cambio Porcentual -20 +40 +100 -50 +10
ANÁLISIS DE DATOS
Un análisis de datos suele seguir los siguientes pasos: Análisis exploratorio de datos: Estadística descriptiva de cada variable por separado. Se obtienen medidas de tendencia central, variabilidad, representación gráfica, etc. Se pretende conocer cada variable así como detectar errores, valores extremos. Estadística Bivariable: Estudia las relaciones entre pares de variables, utilizando estadísticos como el coeficiente de correlación Chi– cuadrado, t de Student, etc. y representaciones gráficas diversas. Análisis Multivariante: Analiza simultáneamente dos o más variables. Los métodos pueden ser predictivos cuando existe una variable criterio o independiente que se explica o identifica por un conjunto de variables independientes, predoctoras o explicativas (Regresión lineal, Regresión cuadrática, análisis discriminante, análisis de varianza) o reductivos cuando se estudian las relaciones entre un conjunto de variables o casos sin que exista una variable a identificar (componentes principales, análisis factorial, correspondencia binaria, correspondencia múltiple). Usos de variables en el análisis Las variables pueden ser definidas para medir una determinada salida o respuesta o bien para explicar por que se obtiene una determinada salida. Por ejemplo en el estudio de una enfermedad, las variables edad, antecedentes, severidad del estado, tratamiento son variables 16
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería explicativas o independientes. Las variables discretas sana/no sana es la variable dependiente. En ciertos análisis exploratorios todas las variables se usan como un único conjunto, sin distinción entre independientes y dependientes. Análisis apropiado de datos Son dos motivos por lo que resulta difícil la elección de la técnica estadística adecuada para un investigador con datos reales. El primero es que los libros de estadística y los cursos curriculares se presentan en un orden lógico desde el punto de vista de la enseñanza de las materias, pero desde el punto de vista del proceso del análisis de datos. La segunda es que los datos reales contienen mezcla de tipos de datos que hacen la elección del análisis arbitrario. Una buena estrategia consiste en aplicar diferentes análisis al mismo conjunto de datos, lo que nos proporcionará información variada sobre el fenómeno en estudio. Para decidir el análisis apropiado se clasifican las variables como:
Independiente frente a dependientes Nominal u ordinaria frente intervalos
VI. DISTRIBUCIÓN DE FRECUENCIA Los problemas industriales abarcan una gran masa de datos cuantitativos a los que deben darse ciertas formas significativas antes de poder efectuar ningún análisis e interpretación. Una forma de uso corriente es la distribución de frecuencia. Existen dos tipos de variables, a saber: discretas y continuas. El análisis de la distribución de frecuencia se refiere a datos continuos. Ordenamiento Los datos que se haya sin agrupar son difíciles de analizar. Sea, por ejemplo, determinar los ingresos bajos y los elevados y un punto central de concentración, si lo hubiere. 17
Palacios C. Severo Por lo tanto es esencial, para analizar las entradas, organizar los datos que están sin agrupar en una forma agrupada llamada distribución de frecuencia. Según la naturaleza de la variable estudiada las distribuciones de frecuencias pueden ser: Datos no agrupados: se presentan cuando el número de valores que puede presentar la variable no es muy elevado, y en ese caso podemos observar todos los valores de esa variable. Este caso se presenta cuando la variable es discreta y continua no presenta excesivos valores. Datos en intervalos: se presenta cuando la variable es continua o cuando es discreta pero con elevado número de valores. En esta situación se agrupan dichos valores en intervalos o clases. Los intervalos se notan: ei1 eies intervalo i-ésimo. Se llama amplitud del intervalo a la distancia que existe entre los extremos.
ai ei ei1 Se llama marca de clase al punto medio de un intervalo. Este punto es importante porque es el representante del intervalo.
x
e
i 1
i
e 2
i 1
Se llama densidad de frecuencia de un intervalo a la frecuencia correspondiente a cada unidad de la variable en dicho intervalo.
di
ni ai
Los intervalos se suelen tomar abiertos por la izquierda y cerrados por la derecha, salvo el primero que se toma cerrado por los dos lados. En este tipo de distribuciones se pierde parte de la información al 18
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería agruparlas en intervalos, ya no se puede hablar de valores concretos sino de intervalos. Cuanto mayor sea la amplitud de los intervalos menos intervalos habrá, y por tanto menos precisión tendremos. En cambio, cuanto menor sea la amplitud de los intervalos menos intervalos habrá, y mayor será la precisión, sin embargo la distribución será mas grande y más difícil de manejar. Intervalo de clase Con el propósito de preparar una distribución de frecuencia a partir del ordenamiento y el apuntado, los ingresos podrían agruparse arbitrariamente en clases con un intervalo digamos 250 dólares. Este valor se denomina amplitud de clase. El intervalo de clase es, sencillo, la amplitud de los ingresos mensuales para cada clase. Una manera conveniente de determinarlo es encontrar la diferencia entre los límites inferiores de dos clases adyacentes o la diferencia entre las marcas de clase adyacente. VII. CRITERIOS DE DISTRIBUCIÓN DE FRECUENCIA En la práctica, la cantidad total de clases varía usualmente de un mínimo de 5 a un máximo de 20. El hecho de que sean muy pocas o muchas clases no nos aclara la característica esencial de los datos. Por ejemplo, si organizamos los ingresos de los operadores de computadoras solamente en dos clases: Ingreso Mensual (US$) De 250 a 400 De 400 a 600
Cantidad de operarios 25 23
Un análisis de distribución de frecuencia no revelaría mucho acerca de la estructura de los ingresos de los operarios. Siempre que sea posible, el intervalo entre todas las clases se la distribución de frecuencia deberá ser igual. Los intervalos desiguales originan problemas al graficar y al calcular promedios y otras medias estadística. VIII. MEDIDAS DE TENDENCIA CENTRAL Una medida de tendencia central es un número que representa el valor central de un conjunto de valores. Habitualmente, estas medidas se 19
Palacios C. Severo llaman promedios. He aquí algunos ejemplos: el ingreso promedio de una familia, es de US$ 1500 por año; para el peso promedio de 60 fardos de fibra de llama utilizados para el tejido de alfombras y un diámetro promedio de pistones maquinados durante un jornal. En el presente se consideran las herramientas estadísticas que más comúnmente se usan: Media aritmética Generalmente se le llama media o promedio. La media es simplemente la suma de una serie de datos numéricos dividida por el número total de ellos. Es apropiado usar la media cuando los resultados son simétricos y tienen una distribución normal. Pero existen casos que estudiaremos a continuación: Datos no agrupados: Si los datos no están agrupados la media aritmética se calcula tomando todas las mediciones y dividiendo la suma por el número de éstos. Datos agrupados: La resistencia a la tracción de varios filamentos son 6, 6, 7, 7, 8, 8, y 9,4. Estos valores se agrupan en una distribución de frecuencia. El punto medio de cada clase se usa para representar la clase. El punto medio de la clase se multiplica entonces por el número de frecuencia en esa clase. La suma de estos productos se divide por la cantidad total de datos para obtener la media aritmética. Ejemplo 1.1 La tabla 1.1 muestra los puntajes de tres artículos en una prueba de degustación, usando preguntas cualitativas de escalas, a fin de cuantificar los valores. Todos los productos probados tienen la misma media. La media de 20 es esta escala es bastante descriptiva de la distribución normal del producto 1, pero sería engañoso si se usara para describir el producto 2 ó el producto 3. La mayoría de los resultados en una investigación tienen una distribución normal (es decir, en forma de campana alrededor de un punto medio) pero otras distribuciones son lo bastante 20
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería comunes como para que se deba verificar siempre, antes de usar la media, si ésta es en realidad descriptiva.
X
Xi n
i 1,2,...n
La media tiene otra debilidad sobre la que se debe estar alerta: se ve afectada por las observaciones extremas. Tabla 1.1 Puntaje de tres productos en preguntas de degustación Nivel de Producto degustación 1 2 3 5 10 20 0 4 5 20 50 3 70 20 50 2 5 20 0 1 10 20 0 Media 20 20 20
Ejemplo 1.2 Si los ingresos de dos profesionales se promedian con los ingresos de diez peones, el ingreso para todos los doce será de más de US$ 250, que obviamente es una cifra engañosa, si se evita usar la media para datos que no tengan una distribución normal o para datos que incluyan observaciones extremas, ésta es la medida estadística más útil para describir el promedio. Tabla 1.2 Mano de obra por día para cada producto Personal Jornal (US$) Producto 1 Producto 2 Calificado 20 8 8 Semi calificado 10 5 5 No calificado 5 3 2
Media aritmética ponderada Permite calcular un promedio que toma en cuenta la importancia o el factor que tiene cada valor sobre el total. Todas las medias aritméticas son ponderadas. Si no se dan factores específicos a todos y cada uno de los valores de la serie. X
X i mi mi
Ejemplo 1.3 Una empresa desea contratar tres tipos de personal: calificado, semi calificado y no calificado, para la producción de ciertos artefactos. La 21
Palacios C. Severo gerencia desea conocer el costo promedio de mano de obra por día para cada producto. El promedio aritmético simple es: Y 0,644 1,661X1 0,0160X2
El costo de mano de obra promedio del producto 1 es, 11,678 5 3 187,72 US $
Y para una unidad del producto 2 es, 2 Ag Fe 2 AgO Fe 2
El análisis de esta manera es incorrecto, ya que no se toma en cuenta que se trabaja con diferente personal. Ejemplo 1.4 Se compra material de construcción a tres empresas comercializadoras siendo sus costos: 80 kilo a 0,5 dólares por kilo, 20 kilo a 0,7 dólares y 10 kilos a 0,9 dólares. Determine el precio promedio por kilos de alambrón. Tabla 1,3 Precio por kilo de alambrón Precio por kilo (Xi) Kilo comprado (mi) 0,5 80 0,7 20 0,9 10 Total 110
Aplicando la fórmula X
X i mi mi
X 0,50,8 / 110 ... 0,910 / 110/80 / 110 ... 10 / 110 0,5727 US$ / kilo
Comparando con el promedio simple X1 X 900/10 22
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería X 0,580 0,720 0,910/ 110 0,5727 US$ / kilo
Media armónica Es el inverso del valor medio, se la utiliza con frecuencia para la medición y análisis de flujos volumétricos. H n
1 Xi
Ejemplo 1.5 Calcular el flujo volumétrico medio (FVM) de dos bombas que entregan combustible 10000 litros a razón de 500 litros por minuto y 10000 litros a razón de 100 litros por minuto, n = 2 1 H 2 166,7 litros / min 1 / 500 1 / 100
El resultado también puede obtenerse calculando el tiempo necesario para bombear 10000 litros con los dos flujos volumétricos y dividiendo el resultado por el número total de litros bombeados, es decir: r1 = 10000/500 = 20 min r2 = 10000/100 = 100 min FVM = (10000 + 10000)/120 = 166,7 l/min
Obsérvese que el valor medio es de 300 litros por minuto, casi el doble de la media armónica. Media geométrica La media geométrica Xg es la n-raíz de los productos de la n observaciones medidas, de amplia utilidad en economía. X g n Xi
En forma logarítmica Log X g
nLogX i n
Una aplicación importante es determinar el incremento porcentual promedio en ventas, producción u otras variables correspondientes a un lapso dado. 23
Palacios C. Severo Una modificación de la fórmula es: Último Lapso 1 1 Log X g Log n 1 Pr imer Lapso
Ejemplo 1.6 Supongamos que durante cinco años de una economía inflacionaria, las entidades crediticias pagan tasas altas de interés de 10, 20, 25, 30 y 40 por ciento. Hallar la tasa de interés promedio anual de un depósito de 1000 dólares. Año 1 2 3 4 5
Tasa de interés 10 20 25 30 40
Tabla 1.4 Economía inflacionaria Factor de crecimiento Ahorro al final de año (US$) 2 1000*2 = 2000 3 2000*3 = 6000 3,5 6000*3,5 = 21000 4 21000*4 = 84000 5 84000*5 = 420000
El factor de crecimiento anual, será: X 2 3 3,5 4 5/ 5 3,5 veces cada año
Pero 3,5 = 1 + 25/10 Corresponde a una tasa de interés promedio de 20% anual. Entonces, el depósito de 1000 dólares crecerá en cinco años:
SCcolumna 37 2 412 392 412 / 4 158 / 16 2,75 2
Este es un valor excedente al real en más de US$ 10521 - 8,75 un error muy considerable. Usando la media geométrica, el factor de crecimiento promedio Anual corresponde a una tasa de interés promedio de 235% anual o 3,35 = 1 + 235/100 entonces el depósito de 1000 dólares crecerá en cinco años a:
SCtratamientoo 352 312 562 362 / 4 158 / 16 94,25 24
2
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Siendo está la media más apropiada para el caso. Media cuadrática De un conjunto de números Xn es denotado por la raíz cuadrada de la media cuadrática y es definida como: Xq
X n
2
Ejemplo 1.7 Evalué los datos que se muestran a continuación 1, 5, 7 y 9 X q 6,24
Mediana Se llama mediana de una variable estadística a aquel valor de la variable tal que el número de observaciones menores que él es igual que el número de observaciones mayores. Se nota Me y se puede considerar como el punto de abscisas cuya ordenada en la curva vale ½.
N / 2 N i1 M e ei1 a AB´ AC´ i M e ei1 ai BB´ CC´ N / 2 N i1 ni ni
Datos no agrupados: La mediana es el valor correspondiente a un punto de una escala con respecto al cual la mitad superior agrupa igual cantidad de valores que la mitad inferior. Para determinar la mediana de datos no agrupados se ordenan, en primer lugar, de menor a mayor. 25
Palacios C. Severo Datos agrupados: Ordenar algunas observaciones no agrupadas de menor a mayor y elegir el valor central representa poco trabajo. Sin embargo, si son muchas las observaciones siempre es un problema ordenarla y encontrar el punto medio. En cambio, en datos cuantitativos es posible clasificarla directamente en clases y hallar una aproximación de la mediana en función de la distribución de frecuencia resultante. La mediana se puede clasificar con la fórmula siguiente: n / 2 F Mediana L i f
Donde: L n F f i
Límite inferior de la clase en que se ubica la mediana Cantidad de datos Frecuencia acumulativa para la clase inmediata inferior Frecuencia en la clase media Amplitud del intervalo de clase
Ejemplo 1.8 Ordene los valores por su magnitud, obtenga la mediana. 92,3 92,6 92,5 92,8 92,4. Resulta ser la mediana 92,5 Moda La moda es la única medida que se puede definir para caracteres cualitativos. Se define la moda de una distribución como aquel valor que se ha presentado más veces, es decir, es aquel que su frecuencia absoluta es máxima. Si la distribución es agrupada en intervalos se habla de intervalo modal. Una moda en una distribución no tiene por qué ser única, puede haber más de una en una misma distribución, y entonces se habla de distribuciones bimodales, trimodales, o en general plurimodales. Datos no agrupados: El modo se define como el valor de la observación que aparece con mayor frecuencia. Cuando existe solo un mo26
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería do, la distribución se llama unimodal, si existen dos valores que aparecen con frecuencia, la distribución recibe la denominación bimodal. Datos agrupados: El modo observado para datos agrupados en una distribución de frecuencia es el punto medio de la clase en donde se encuentra el mayor número de frecuencia. IX.
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión nos van a informar sobre el grado de esparcimiento de la distribución, es decir, nos van a decir si los valores que aparecen están más o menos concentrados. Por tanto, nos van informar también sobre el grado de representatividad de la medida de posición, pues cuanto más concentrados estén los valores que toma la variable mejor representará un solo valor a toda la distribución. Varianza La varianza es una medida de dispersión que mide el grado de esparcimiento de una distribución alrededor de la media aritmética. Cuanto más grande sea la varianza más esparcidos estarán los valores de la variable. La varianza se suele notar σ2 y se calcula: ²
X
i
X ² ni N
X i X ² f i
Al igual que en la media aritmética los Xi representan a los valores de la variable si es una distribución no agrupada y a las marcas de clase si es una distribución agrupada en intervalos. La varianza es la suma de las desviaciones de los valores de la variable sobre la media aritmética ponderada por las frecuencias. Por lo tanto, cuanto menor sea la varianza más agrupada estará la distribución en torno a su media aritmética. La varianza viene expresada en las mismas unidades que la variable pero al cuadrado. Desviación típica La desviación típica se define para obtener una medida de dispersión que venga expresada en las mismas unidades que la variable. Se define como la raíz cuadrada de la varianza. 27
Palacios C. Severo
² Coeficiente de variación Tanto la varianza como la desviación típica son medidas de dispersión absoluta, es decir, nos hablan de la dispersión de la variable que estamos estudiando, pero no nos permiten comparar la dispersión de dos distribuciones distintas. El coeficiente de variación es una medida de dispersión relativa que nos va permitir comparar dos distribuciones distintas, se define como el cociente entre la desviación típica y la media aritmética.
CV
X
El coeficiente de variación es un coeficiente adimensional y solo se puede definir cuando la media aritmética es distinta de cero. Para comparar la dispersión de dos distribuciones basta con comparar sus coeficientes de variación, aquella que su coeficiente de variación sea menor es la que esta más concentrada en torno a su media aritmética.
28
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Problemas (1) (2)
(3)
Un operario que trabaja a jornal gana por mes US$ 150, otro mes US$ 120 y otro mes US$ 140. ¿Cuánto gana en promedio mensualmente? Los ingresos sobre ventas en una tienda comercial se evalúan cada semestre. Los siguientes datos representan, los ingresos (en dólares) por cada mes: 300, 280, 350, 320, 290 y 325 Determine el ingreso medio de la muestra. Durante dos semanas se ha observado la temperatura en °C al medio día, siendo los resultados: 12 8
(4) (5)
(6)
(8) (9)
14 11
18 10
9 11
8 10
Determine la temperatura media de la muestra. Calcular la media de los datos agrupados: Y n
40 3
41 4
42 6
43 2
44 2
45 3
46 1
47 1
48 2
10 11
49 2
50 4
Un grupo de micro empresarios, trabajan con obreros eventuales. Ciertos días trabajan con seis, ocho y cuatro. En la mayoría de las veces trabajan con siete obreros, siendo en total ocho micro empresas. Cuál es el promedio de obreros por micro empresa Supongamos que se han registrado 50 observaciones referentes a los pesos de 50 garrafas de gas licuado, la muestra fue obtenida de la producción por hora y las unidades están dadas en kilogramo 9.8 9,2 9,4 9,4 9,4
(7)
10 9
9.3 9,3 9,5 9,2 9,3
9,5 9,5 9,4 9,5 9,4
9,2 9,3 9,4 9,3 9,3
9,4 9,4 9,2 9,2 9,4
9,2 9,3 9,4 9,3 9,3
9,3 9,2 9,6, 9,2 9,3
9,3 9,1 9,6 9,3 9,4
9,5 9,3 9,3 9,4 9,2
9,4 9,3 9,1 9,6 9,4
Calcule el peso promedio de las garrafas Si el peso estándar es de 10 kilos cuanto de gas falta en promedio La temperatura registrada en un vivero, a cierta hora de un día cualquiera, en grados centígrados, fueron 30, 32, 39, 32, 33, 31, 38, 37, 32 y 31. Determine la media en grados Fahrenheit. Un proyecto económico muestra que el consumo de alimentos de un barrio marginal de 350 personas es en promedio de US$ 120 mensuales. Halle la media del gasto diario en alimentación. El ingreso percapite mensual en un país es US$ 250. El sector del magisterio constituye el 60% de la población que percibe el 29
Palacios C. Severo
(10)
(11)
(12)
(13)
(14)
30
2/5 del ingreso total. Calcule el ingreso medio por habitante del sector. Una empresa A tiene 80 empleados con un sueldo promedio mensual de 180 dólares por empleado. La empresa B tiene 120 empleados con un sueldo promedio mensual por empleado de 200 dólares por empleado, calcular: Cuál es el sueldo promedio mensual de las dos empresas en conjunto Se agrega una tercera empresa con 40 empleados y un sueldo promedio mensual de 250 dólares por empleado. ¿Cuál es el sueldo promedio de las tres empresas en conjunto? Se compran 100 kilos de carne de res a 2,3 dólares por kilo, 50 kilos de carne de cerdo a 2,8 dólares por kilo y 20 kilos de carne de cordero a 1,8 dólares por kilo. Un plato de Buffet tiene un costo de 8 dólares en donde se incluyen los tres tipos de carnes a razón de 1:0,5:0,2 respectivamente. ¿Determine el promedio de platos Buffet que podrán prepararse y cuanto de carne sobra? Una empresa industrial fabrica azulejos a 60 dólares por metro cuadrado, jarrones a 20 dólares la unidad y floreros a 5 dólares por unidad. Un decorador desea adquirir dichos productos pero cuenta tan sólo con 500 dólares y tiene un ambiente de 20 metros cuadrados. ¿Determine el promedio de cada producto para la decoración del ambiente? Un proyecto minero posee cuatro ingenios auríferos. El ingenio A tiene una ley de cabeza de 8 gramos por tonelada y trabajan 20 mineros. El ingenio B tiene una ley de cabeza de 4 gramos por tonelada y trabajan 12 mineros. El ingenio C tiene una ley de cabeza de 12 gramos por tonelada y trabajan 25 mineros. El ingenio D tiene una ley 2 gramos por tonelada y trabajan 25 mineros. ¿Determine la media aritmética y la media geométrica de la ley de cabeza? Si el costo real del oro es de 30,2 dólares por gramo. ¿Evalué el costo de mano de obra, siend0 la relación de producción de A=2B, C=5D, A=3D en cada ingenio? ¿En que ingenio se trabaja a perdida? Se tiene sospecha de que en las aguas subterráneas las concentraciones de nitritos superan las normas establecidas para la crianza de peces, dicha concentración es de 0,03 mg NO2/l. Para tratar de verificar la sospecha, se midieron los niveles de nitritos
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería en diez puntos aleatorios del acuífero y se obtuvieron los siguientes datos.
0,02
(15)
0,05
0,03
0,05
0,04
0,06
0,07
0,03
0,04
0,03
Estime el nivel de confianza al 90% que las concentraciones de nitritos superan las normas establecidas para que sea factible la existencia de vida piscícola en la zona. Los datos obtenidos de una muestra aleatoria simple de tamaño 30 de la distribución X, porcentaje de incremento del contenido de alcohol en la sangre de una persona, después de ingerir cuatro cervezas es. X 41,2
s 2,1
Calcular un intervalo de confianza del 90% para el porcentaje medio de alcohol en la sangre de una persona, después de tomar cuatro cervezas. Si se calcula un intervalo de confianza del 95%, cual será el de mayor o menor amplitud. (16) El 2000 se reforestaron más de 3 millones de acres con dos mil millones de plantas de viveros. Una grave sequía durante las siguientes estaciones mató a muchas de estas plantas. Se obtuvo una muestra de 1000 plantas y se descubrió que 300 estaban muertas. Obtener un intervalo de confianza del 90% de la proporción de plantas del vivero muertas. Utilizar dicha información para estimar el número de plantas muertas en la población. (17) La capacidad de los equipos de vidrio producido en una determinada empresa de vidrio tiene una distribución normal. Una muestra aleatoria de 7 de ellas dio como resultado un varianza de 62 mililitros. Dar una estimación, mediante un intervalo de confianza del 95% de la varianza de la capacidad del equipo de vidrio que fabrica dicha empresa. (18) Se quiere estudiar la eficacia de un tratamiento para eliminar una bacteria de un pino. En una muestra aleatoria de 150 pinos sometidos al tratamiento, 118 resultaron sanos. En otra muestra aleatoria de 130 pinos no tratados, los pinos sanos fueron 91. Construir un intervalo de confianza del 95% para la diferencia en la taza de pinos sanos entre los tratados y los no tratados. A que conclusión llega respecto a la efectividad del tratamiento. (19) Para estudiar el rendimiento de dos tipos de cereales se hacen 20 determinaciones en parcelas donde se ha sembrado cereal del tipo A y 18 determinaciones en parcelas con cereales tipo B con los resultados siguientes. X A 14,5
X B 15,3
Kg / área
s A 3,23
Kg / área
Kg / área
s B 1,85
Kg / área
31
Palacios C. Severo Son igualmente efectivos para el cultivo los cereales A y B al nivel de confianza del 90% (20) Se realizó un estudio para comparar en lácteos el contenido de sodio en el plasma y en leche. Se obtuvieron las siguientes observaciones sobre el contenido de sodio (mili moles por litro de leche), en 10 envases aleatoriamente seleccionadas. Envase Leche Plasma
1 93 147
2 104 157
3 95 142
4 81 141
5 95 142
6 95 147
7 76 148
8 80 144
9 79 144
92 84
96 93
10 87 146
Hallar un intervalo de confianza del 95% de la diferencia media de los niveles de sodio en los fluidos del lácteo (21) En el departamento de control de calidad de una empresa, se quiere determinar si ha habido un descenso significativo de la calidad de su producto entre las producciones de dos semanas consecutivas a consecuencia de un incidente ocurrido durante el fin de semana. Deciden tomar una muestra de la producción de cada semana, si la calidad de cada artículo se mide en una escala de 100, obtienen los resultados siguientes: Semana I Semana II
93 93
86 87
90 97
90 90
94 88
91 87
Suponiendo que las varianzas de la puntuación en las dos producciones son iguales, construye un intervalo de confianza para la diferencia de medias al nivel de 95%. Interpreta los resultados obtenidos. (22) Sospechamos que nuestro cromatógrafo está estropeado, y queremos determinar si los resultados que nos proporciona son lo suficientemente precisos. Para ello, realizamos una serie de 8 mediciones del contenido de una solución de referencia que, sabemos, contiene 90% de un determinado compuesto. Los resultados que obtenemos son: 93,3 86,8 90,4 90,1 94,9 91,6 92,3 96,5 Construir un intervalo de confianza al nivel de 95% para la varianza poblacional. ¿Qué conclusiones podemos realizar? (23) Se ha hecho un estudio sobre la proporción de enfermos de cáncer de pulmón detectados en hospital que fuman, obteniéndose que de 123 enfermos 41 de ellos eran fumadores. Obtener un intervalo de confianza para dicha proporción. Estudiar si dicha proporción puede considerarse igual a la proporción de fumadores en la población si ésta es de un 29%. (24) Para estudiar la efectividad de un medicamento contra la diabetes se mide la cantidad de glucemia en sangre antes y después de la administración de dicho medicamento, obteniéndose los resultados siguientes: 32
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Antes Después
7,2 5,2
7,3 5,4
6,5 5,3
4,2 4,7
3,1 4,1
5,3 5,4
5,6 4,9
507 507
513 461
492
Estimar la reducción producida por el medicamento. (25) Eres el encargado de un departamento de producción en una fábrica y recibes un lote de 2000 piezas necesarias para la fabricación de un artículo. Tienes la responsabilidad de aceptar o rechazar el lote, si estimas que la calidad de éste no es suficiente. El fabricante te asegura que, en este lote, no hay más de 100 piezas defectuosas, pero decides tomar una muestra para estimar la proporción de las mismas. a) ¿Cuántas piezas decides examinar para que, con un nivel de confianza del 95%, el error que cometas en la estimación de la proporción poblacional de defectuosas no sea mayor que 0.05? b) Si decides tomar una muestra de 100 artículos escogidos al azar en el lote y realizas el recuento de piezas defectuosas en esta muestra, encontrado 4 artículos defectuosos. Construye para la proporción de defectuosos en el lote, un intervalo de confianza al nivel de 95% de confianza. ¿Se debe rechazar el lote? (26) Los tiempos de reacción, en mili segundos, de 17 sujetos frente a una matriz de 15 estímulos fueron los siguientes: 448 534
460 523
514 452
488 464
592 562
490 584
Suponiendo que el tiempo de reacción se distribuye Normalmente, determine un intervalo de confianza para la media a un nivel de confianza del 95%. (27) Se considera una población representada por una variante ε, de suerte que la media poblacional es igual a 25 y la varianza poblacional es igual a 240. Supuesto extraídas muestras de tamaño 100, muestreo aleatorio simple, determinar la probabilidad de que el estadístico media muestral, Ax, este comprendido entre los valores 23; 55 y 28,1. (28) La duración aleatoria de las unidades producidas de un artículo, se distribuye según la ley normal, con desviación típica igual a seis minutos. Elegidas al azar cien unidades, resulto ser la duración media de 14,35 minutos. Elaborar el intervalo de confianza del 99% para la duración media de las unidades producidas. (29) Se estudiaron 40 muestras de aceite crudo de determinado proveedor con el fin de detectar la presencia del níquel mediante una prueba que nunca da un resultado erróneo. Si en 5 de dichas muestras se observo la presencia de níquel ¿podemos creer al proveedor cuando asegura que a lo sumo el 8% de las muestras contienen níquel? 33
Palacios C. Severo (30) La resistividad eléctrica de ciertas barras de aleación de Cromomolibdeno es una variable N(12,5; 4,1).Un investigador acaba de calibrar un aparato que mide dicha resistividad y para comprobar que lo ha hecho bien utiliza el sistema consistente en medir cuatro barras y aceptar que el calibrado es bueno si encuentra al menos un valor inferior y otro superior a 12,5. Determinar el nivel de significación del contraste que esta llevando a cabo. ¿Es sensible el contraste a una mayor o menor dispersión de la variable resistividad? (31) En una muestra de 65 sujetos las puntuaciones en una escala de extroversión tienen una media de 32,7 puntos y una desviación típica de 12,64. a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la población. b) Indique, con un nivel de confianza del 95%, cual sería el máximo error que podríamos cometer al tomar como media de la población el valor obtenido en la estimación puntual. (32) En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en ayunas. Se obtiene X 132 mg/dl y s2=109. Construir el intervalo de confianza al 95%. (33) Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo. Se eligen 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la gripe. Construir un intervalo de confianza al 95% para la probabilidad de pasar la gripe si se esta vacunado. En los otros 100 pacientes sin vacunar la pasan 20. ¿Es eficaz la vacuna? (34) Se analizan 9 zumos de fruta y se ha obtenido un contenido medio de fruta de 22 mg por 100 cc de zumo. La varianza poblacional es desconocida, por lo que se ha calculado la desviación típica de la muestra que ha resultado ser 6,3 mg de fruta por cada 100 cc de zumo. Suponiendo que el contenido de fruta del zumo es normal, estimar el contenido medio de fruta de los zumos tanto puntualmente como por intervalos al 95% de confianza. (35) Una firma comercial encuesta a 100 individuos para conocer sus opiniones sobre la elección de dos productos alternativos A y B recientemente fabricados. El resultado de la encuesta arroja que el producto A lo han elegido 55 individuos y el producto B 45. Hallar un intervalo de confianza al 95% para la proporción de individuos que eligen cada producto. (36) En un proceso de fabricación de pilas alcalinas se sabe que su duración media es de 1100 horas y que dicha duración sigue una distribución normal. El nuevo proceso busca reducir la disper34
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(37)
(38)
(39)
(40)
(41)
sión de la duración de las pilas por lo que se hace necesario construir intervalos de confianza para la citada dispersión con coeficientes de confianza 90% y 98%. Construir dichos intervalos a partir de una muestra de tamaño 20 cuya dispersión es 2240 horas. Se sabe que la longitud de los diámetros de los tornillos fabricados por una máquina sigue una distribución normal y se busca un intervalo en el cual se encuentre la variabilidad de las longitudes de los tornillos fabricados por la máquina con una probabilidad del 80%. Construir dicho intervalo sabiendo que una muestra de 16 tornillos presenta una variabilidad cuantificada en 30. Un granjero dispone de dos criaderos diferentes A y B con varias granjas cada una para la cría de pollos. Con el objetivo de estudiar la mortalidad de los pollos en las dos criaderos observa el número de pollos muertos tomando una muestra de 4 granjas en el criadero A y otras 4 granjas en el criadero B obteniendo los siguientes resultados: Nº de pollos muertos en las granjas del criadero A: 16 14 13 17 Nº de pollos muertos en las granjas del criadero B: 18 21 18 19 Suponiendo normalidad en los criaderos, se trata de estudiar si la mortalidad de los pollos puede considerarse diferente en los dos criaderos con un nivel de confianza del 95%. Resolver el problema bajo la hipótesis adicional de varianzas iguales en los criaderos. Al analizar 40 muestras de una aleación de bajo punto de fusión de tipo “babit” se ha detectado ausencia de cadmio en 12 de ellas. Determinar un intervalo de confianza para la proporción de muestras de dicha aleación que no contienen cadmio. La cantidad de azufre encontrado en plantas secas de mostaza sigue una distribución normal X. se ha observado una muestra de extensión 9 con los siguientes resultados 0,7 0,8 0,6 0,95 0,65 1 0,9 0,2 0,55. Si aceptamos como valor de σ el valor calculado de la desviación típica muestral S , ¿Cuál sería el tamaño mínimo de la muestra que habría de ser considerada para que el intervalo de confianza al 95% para el nivel medio de azufre tenga una longitud inferior a 0,1? La pérdida de peso de un determinado producto dietético en 16 individuos después de un mes fue (en kg): 3,2 2 2,5 3,3 5 4,3 2,9 4,1 3,6 2,7 3,5 4,2 2,8 4,4 3,3 3,1 35
Palacios C. Severo
(42)
(43)
(44)
(45)
Determinar un intervalo de confianza para la varianza con nivel de confianza del 99%, si la pérdida de peso es aproximadamente normal. Se consideran lo siguientes tiempos de reacción de un producto químico, en segundos: 1,4 1,2 1,2 1,3 1,5 1,3 2,2 1,4 1,1 Obtener un intervalo de confianza del 90% para el tiempo de reacción. Suponer la variable normal con desviación típica poblacional conocida σ = 0,4. El tiempo, en minutos, que esperan los clientes de un determinado banco hasta que son atendidos sigue distribución normal de media desconocida y desviación típica igual a 3. Los tiempos que esperaron diez clientes elegidos al azar fueron los siguientes: 1,5 2 2,5 3 1 5 5,5 4,5 3 3 Determinar un intervalo de confianza de coeficiente de confianza 0,95, para el tiempo medio de espera. La duración en minutos de un determinado viaje es una variable aleatoria con distribución normal de media desconocida y desviación típica igual a 3. En una muestra tomada al azar de diez realizaciones del viaje en cuestión se obtuvieron los siguientes tiempos: 10,1 6,5 5,5 7,9 8,2 6,5 7,0 8,1 6,9 7,7 a) Realizar la estimación de máxima verosimilitud de la duración media del viaje. b) Calcular la probabilidad de que, en valor absoluto, la diferencia entre media estimada la real sea menor que 1 minuto. Las velocidades de difusión del bióxido de carbono a través de la porosidad del suelo son distintas.
Arenoso Arcilloso
20 19
27 30
22 32
23 28
23 15
28 26
23 35
26 18
22 25
26 35
20
19
22
Comprobar si se puede afirmar que las velocidades de difusión son distintas al nivel de confianza del 95% (46) Una transformadora de productos lácteos recibe diariamente la leche de dos granjas. Se desea estudiar la calidad del producto acopiado, se extraen dos muestras al azar y se analiza el contenido en materia grasa, obteniéndose los siguientes resultados. Granja A
X A 8,7%
s A2 1,02% 2
Granja B
X B 10,9%
s B2 1,73% 2
n A 33 nB 27
Se pide construir un intervalo de confianza del 95% para la diferencia del contenido medio en grasa de leche de ambas granjas. (47) En una determinada raza de ganado vacuno los terneros incrementan 12 kg. de peso cada semana, en los primeros meses de 36
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería vida. Para comprobar se sometió al pesado de ocho terneras al cumplir las cuatro semanas y posteriormente dos semanas. Ternero Peso 4 semanas Peso 6 semanas
(48)
(49)
(50)
(51)
(52)
1 130 138
2 125 140
3 128 139
4 127 141
5 129 137
6 123 137
7 131 142
8 130 142
Comprobar si la suposición es cierta calculando los intervalos de confianza al 95% para la diferencia media de peso. Se ha realizado un estudio sobre la tasa de supervivencia de pájaros adultos en trópico y en zonas templadas. Inicialmente se marcaron 500 pájaros adultos en las patas y se liberaron a una región tropical. Un año después, se volvió a capturar 445. Suponiendo que los no recuperados fueron victimas de un depredador, la tasa de supervivencia estimada de un año para los pájaros adultos en la región es 0,80. Un experimento similar en otra zona templada, dio como resultado de 252 de los 500 pájaros con una tasa de supervivencia estimada de 0,504. Hallar un intervalo de confianza del 90% de la diferencia en las tasas de supervivencia de un año para las dos zonas. Una muestra de tamaño 10 de una población de mujeres presenta una altura media de 172 cm. y una muestra de 12 varones de otra población presenta una altura media de 176,7 cm. Sabiendo que ambas poblaciones son normales con varianzas 225 y 256 respectivamente, se trata de analizar si con una probabilidad del 95% se puede asegurar que los varones son más altos en media que las mujeres o viceversa. Los responsables municipales de la salud miden la radiactividad en el agua de una fuente natural en una zona abundante en granito. Realizadas 12 mediciones en diferentes fechas del año se observó una media de 3,6 picocurios con una desviación típica de 0,82. Determinar, al 95% y al 99%, intervalos de confianza para la radiación media y para la varianza. En una muestra de 65 sujetos las puntuaciones en una escala de extroversión tienen una media de 32,7 puntos y una desviación típica de 12,64. a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la población. b) Indique, con un nivel de confianza del 95%, cual sería el máximo error que podríamos cometer al tomar como media de la población el valor obtenido en la estimación puntual. Los tiempos de reacción, en mili segundos, de 17 sujetos frente a una matriz de 15 estímulos fueron los siguientes: 448, 460, 514, 488, 592, 490, 507, 513, 37
Palacios C. Severo 492, 534, 523, 452, 464, 562, 584, 507, 461 Suponiendo que el tiempo de reacción se distribuye normalmente, determine un intervalo de confianza para la media a un nivel de confianza del 95%. (53) De una población cuya distribución se desconoce se obtiene una muestra aleatoria de 2000 valores en que la media muestral resulta ser 225 y la desviación típica muestral 10. Suponiendo que la varianza muestral coincida con la de la población, estimar un intervalo para la media de la población con un nivel de confianza del 95% (54) En una muestra de 100 personas de un barrio de Lima se ha observado una proporción de 0,18 personas que leen el periódico diariamente. ¿Puede ser que la verdadera proporción de personas que leen el periódico en ese barrio sea 0,20?
38
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería X.
ESTIMACIÓN DE PARÁMETROS
Otra cosa que los investigadores tratan de hacer con frecuencia es obtener inferencias sobre la población con base en los resultados de una experiencia a partir de una muestra. El hecho de que 50 personas en una prueba prefieran el producto A al producto B por un margen de dos a tres, es importante solo en la medida en que le permita concluir en que la población como un todo también prefiere el producto A. Esto es se llama inferencia estadística, tomar una decisión sobre la población entera en base a las características de una muestra. Para hacer una inferencia sobre la población, usted debe de aplicar un límite de confianza o un intervalo de confianza al resultado que encontró en el estudio. Ejemplo 1.9 En un estudio X se encontró que el 30% de los informantes tienen conocimiento del producto A, es poco factible que exactamente el 30% de la población entera tenga ese conocimiento del producto A, pero la cifra de la población deberá estar cerca del 30%. Sí la muestra es lo suficientemente grande y estuvo bien tomada. A la diferencia entre los resultados de la muestra y la población se la llama error muestral. El intervalo que se conexa al resultado de la encuesta para estimar o inferir la cifra de la población se llama intervalo de confianza. XI. DIFERENCIAS SIGNIFICATIVAS A veces en un proyecto de investigación se propone comparar resultados entre dos muestras. Las comparaciones más comunes son: Dos o más subgrupos dentro de una misma muestra ¿Tienen las personas con ingresos superiores de US$ 10000, opiniones diferentes de las que tienen las personas con ingresos por debajo de Sus 10000? ¿Son distintas las evaluaciones de productos confeccionados por los varones a las evaluaciones hechas por las mujeres? Muestras tomadas en diferentes puntos en el tiempo ¿Aumentó el conocimiento del producto durante el año pasado? ¿Es la participación en las Universidades mayor de lo que era hace cinco años? Lo primero que usted hace, es observar los resultados en forma simple y directa. 39
Palacios C. Severo Si las respuestas de los hombres y mujeres son iguales, usted no necesita de una prueba estadística adicional. Si la participación en las Universidades no ha cambiado desde hace cinco años usted ya tiene una respuesta. Pero si los resultados son distintos entre cualquiera de sus sub-grupos entonces usted tiene que confrontar dos preguntas básicas ¿Es la diferencia de los resultados tan pequeña como para sugerir que ésta probablemente ocurrió por azar? está si usted repite la prueba. ¿Hay una buena probabilidad de que el resultado sea el contrario? ¿Es el resultado lo bastante grande como para que probablemente sea el resultado de una verdadera diferencia? sí usted repite la prueba varias veces, ¿Es muy factible que ésta resulte igual cada vez? Antes de hacer una prueba estadística, usted debe tener una hipótesis es decir una relación que usted querrá probar como verdadera o falsa. En estadística, usualmente se supone que dos poblaciones son iguales hasta que se pruebe lo contrario. Esto se llama hipótesis nula. Empezamos con la hipótesis nula, si la diferencia entre dos muestras es lo bastante pequeña como para que fácilmente pudiera haber ocurrido por azar, entonces la hipótesis nula no puede ser rechazada y usted debe concluir que la diferencia entre las dos muestras no es estadísticamente significativa al nivel de significación del 95 por ciento (o cualquier nivel de, significación que usted elige). En cambio, si la diferencia en los resultados de la toma de datos es tan grande que no es factible que esto haya ocurrido por azar, usted rechaza la hipótesis nula y concluye que la diferencia entre las dos muestras es estadísticamente significativa al nivel de significación del 95 por ciento. Además de estas medidas de la diferencia en dos muestras, hay otras pruebas estadísticas que son útiles para evaluar diversas clases de resultados. XII. DISPERSIÓN DE LOS DATOS PROBLEMAS La varianza mide la dispersión de los datos con respecto a la media aritmética y la desviación estándar es simplemente la raíz cuadrada positiva de la varianza. Daremos las definiciones para su aplicación. Datos no agrupdos: La varianza también se basa en desviaciones a partir de medias. Para hallar la varianza a de un producto, se eleva al cuadrado las desviaciones a partir de las medias X X , luego también 2
40
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería se suman X X 2 y se promedian dividiendo por el número total de productos, o sea n.
X X n i
2
Como la media verdadera no se conoce prácticamente, la desviación estándar verdadera es una magnitud teórica. Sin embargo a puede obtenerse aproximadamente a partir de la desviación estándar estimada S(X). S X
X X n 1 i
2
En el análisis estadístico se utiliza una cantidad denominada grados de libertad que designaremos para el futuro como GL. Esta cantidad permite tener en cuenta y corregir, desde el punto de vista matemático, las restricciones impuestas a los valores. En este caso al calcular la desviación estándar, el número n de observaciones ésta fijado y la desviación estándar estimada se puede calcular a partir de la media. De la n observaciones sólo n-1 pueden variar, el último valor queda determinado por X y n. Por lo tanto al estimar la desviación estándar a partir de una muestra de la población de datos, solo hay n-1 grados de libertad. Elevando al cuadrado la desviación estándar estimada se tiene la varianza estimada S X 2 . Ejemplo 1.10 Se han realizado cinco análisis de un producto para determinar la concentración de un componente X. Los resultados fueron: 98 97,7 87 96 y 93 X 94,32 S X
982 97,7 2 87 2 96 2 932 471,6 2 4,54 5
Datos agrupados: Para ilustrar el cálculo de la desviación estándar para datos agrupados veamos los siguientes jornales de obreros. En primer término se hallan los puntos medios X de cada clase de jornal. Luego se eleva al cuadrado las X X 2 se multiplican por el número adecuado de frecuencia de clase para dar f X 2 . 41
Palacios C. Severo S X Jornal (US$) 3a5 5a7 7a9 Total
fX X2 n 2
Cantidad (f) 2 5 3 10
S X
2
X
X
4 6 8
16 36 64
2
fX
32 180 192 404
8 30 24 62
fX
404 62 1,4 US$ 10 10 2
La desviación estándar puede emplearse como denominador común para colectar la dispersión de las dos distribuciones y la representatividad de las dos medias. Otra aplicación es la desviación estándar como instrumento de análisis se da en su relación con la media de una distribución normal. Una relación se halla en función del porcentaje de observaciones dentro de una desviación estándar debajo de la media y una desviación estándar incluye un 95% de las observaciones. La X 3(S ) incluye alrededor de 99,7% de las observaciones. Desviación media Otra medida de la dispersión de los valores es la desviación media real, se trata simplemente de la media aritmética de las desviaciones de las medias sin tener en cuenta lo siguiente: md X X i
X mediana n
Para una desviación normal, la desviación estándar verdadera es aproximadamente igual 1,25 veces la desviación media. Ejemplo 1.11 Calcular la desviación media del ejemplo 1.10. md = 3,456 La dispersión de los resultados será ±3,456 42
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Problemas (55) Calcule el valor medio, mediana y moda de la siguiente distribución de datos: X 110 -119 100 – 109 90 – 99 80 – 89 70 – 79 60 – 69 50 – 59 40 – 49 30 – 39 20 – 29 10 - 19
Y 1 0 2 5 10 13 9 4 5 0 1
(56) Se recibe materia! de dos fuentes de abastecimiento. Los análisis de muestras provienen de las dos fuentes que se indican a continuación. Se desea saber si se justifica que existe diferencia entre las dos fuentes. Fuente 1 Fuente 2
85 79
74 71
76 75
88 77
73 79
84 77
77 78
(57) El análisis de gas natural indica el siguiente concentrado de CO2 en volumen: 24,6 23,7 23,4 23,8 24,1 23,9 ¿Calcule el intervalo de confiabilidad de la media verdadera? (58) En una refinería de plata, se analiza el contenido de plata en los residuos para establecer su concentración en los lingotes. Las muestras obtenidas durante dos turnos dieron los resultados. Hora Turno 1 Turno 2
1 89 87
2 92 87
3 98 97
4 97 97
5 98 97
6 97 98
7 97 97
8 98 97
Trate de saber si la diferencia entre los análisis de los dos turnos es significativa. (59) La información obtenida de cuatro reactores químicos diferentes, acerca del efecto de la temperatura sobre cierta reacción es la siguiente: Temperatura (°C) 800 900 980
1 10,4 10,9 12,1
Rendimiento del reactor 2 3 4 12,9 11,7 13,5 10,8 10,6 13,5 11,6 12,8 10,2
Determinar mediante análisis de varianza de dos caminos, si la varianza entre los reactores y entre la temperatura es altamente significativo. (60) Un fabricante de hipoclorito sabe que la cantidad de cloro contenido en su producto decrece con el tiempo y eventualmente se 43
Palacios C. Severo estabiliza en torno al 0,3%. El fabricante desea estimar la cantidad de cloro en el hipoclorito para un tiempo dado, con el fin de informar a los vendedores y retirar el producto caducado. Para ello se analizan sobre los porcentajes de cloro disponible por unidad de producto restante de 8 a 42 semanas después de fabricado. Semanas desde la fabricación 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42
Cantidad disponible de cloro (%) 0,49 0,48 0,46 0,45 0,44 0,46 0,42 0,41 0,42 0,41 0,41 0,4 0,41 0,40 0,41 0,40 0,39 0,39
0,49 0,47 0,46 0,43 0,43 0,45 0,42 0,41 0,40 0,40 0,40 0,40 0,40
0,48 0,45 0,43 0,43
0,47 0,43
0,43 0,40 0,40 0,41 0,38
0,38 0,40
Realizar el análisis de regresión y anotar la ecuación del modelo lineal, el coeficiente de correlación. (61) Se sabe por experiencia, que el incremento de peso de los embriones de pollo al transcurrir el tiempo sigue la ley de tipo exponencial. En un experimento se obtuvieron los pesos (gramos) de un embrión desde el sexto día de su nacimiento hasta e decimosexto que aparecen a continuación. Día Peso
6 0,02
7 0,05
8 0,07
9 0,13
10 0,18
11 0,26
1 47
2 65
3 92
12 0,43
13 0,74
14 1,13
15 1,88
16 2,81
Crear una tabla con la variable días y peso con datos anteriores. Realizar un análisis de regresión para comprobar que valores siguen la ley exponencial. Gráfique los datos y la línea de regresión ajustada. Estime el peso de un pollo a los 7,5 a los 16 y a los 18 días de su nacimiento. Justificar si alguna de las estimaciones obtenidas es poco fiable. (62) En la siguiente tabla se refiere al número Y de bacterias por unidad de volumen presentes en un cultivo después de X horas. X Y
44
0 32
4 132
5 190
6 275
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Ajustar los datos a una curva del tipo Y = aXb Calcular los valores del coeficiente de correlación Visualizar la línea de regresión y los datos obtenidos Estimar el valor de Y para un valor de X = 3,5 (63) La tabla adjunta muestra cinco observaciones de un fenómeno cinético U T
103 0
102 1
10 2
1 3
0,1 4
El investigador sugiere un modelo de ajuste del tipo U = ke-bT Estimar los parámetros k y b. (64) La presión de un correspondiente a diferentes volúmenes V se dan en la tabla. V (cm³) P (Kg/cm²)
50 60
60 54
70 46
90 24
100 10
Obtenga por regresión el coeficiente de correlación de los modelos lineales, exponenciales y cuadráticos. (65) En una reunión medica se probo con una droga fue tomada por 14 personas, de las cuales 6 lo hacen por primera vez y 8 ya son habituales de ella. La droga produjo en el primer grupo sueños de duración 11, 12, 13, 16, 17 y 15 horas, mientras que en el segundo grupo 8, 7, 9, 10, 6, 7, 9 y 8 horas. a) Media y desviación típica de cada grupo b) Formar el estadístico que se distribuye según una t de Student de 12 grados de libertad, sabiendo que las poblaciones tienen la misma media y desviación típica. (66) Según una encuesta realizada sobre una muestra de 2500 personas elegidas al azar, el 80% está decidido a votar en las últimas elecciones. a) ¿Puede ser cierto que llegue a votar el 85% de la población? b) Con un 99% de nivel de confianza ente qué valores estará el porcentaje de los votantes de la población (67) Suponga que de una población consistente en los valores 0, 2, 4, 6 y 8, se toman muestras de tamaño 2 con reemplazo. X 0 2 4 6 8
Frecuencia 1 1 1 1 1
Frecuencia relativa 1/5 = 0,2 1/5 = 0,2 1/5 = 0,2 1/5 = 0,2 1/5 = 0,2
Demostrar que es razonable aproximar la distribución muestral de por una distribución normal, una vez que se conoce la media y la desviación estándar de la distribución muestral. (68) En un experimento de laboratorio se mide el tiempo de una reacción química. Se ha repetido el experimento 98 veces y se 45
Palacios C. Severo obtiene que la media de los 98 experimentos es de 5 segundos con una desviación de 0,05 segundos. ¿Cuál es la probabilidad de que la media poblacional m difiera de la media muestral en menos de 0,01 segundos? (69) Se establece un control de calidad para un proceso de producción de balas. Se ha dispuesto que cuando el proceso está bajo control, el diámetro de las balas es de 1 cm., con una desviación típica de 0,003 cm. Cada hora se toman muestras de nueve balas y se miden sus diámetros. Los diámetros de media de diez muestras sucesivas, en centímetros, son: 1,0006 0,9997 0,9992 1,0012 1,0008 1,0012 1,0018 1,0016 1,0020 1,0022 Establecer cuáles son los límites de control y explicar qué concluyes sobre el proceso de producción en estos instantes. (70) Un investigador quiere estimar la media de una población usando una muestra suficientemente grande para que la probabilidad de que la media muestral no difiera de la media poblacional en más del 25% de la desviación típica sea 0,95. Hallar el tamaño de muestra necesario. (71) La efectividad en días de un determinado antibiótico, sigue una distribución normal de media 14 días y desviación típica desconocida. Fue administrada a 16 enfermos, obteniéndose una desviación típica muestral de 1,4 días. Determinar la probabilidad de que la efectividad media en la muestra no supere los 3 días, que es el tiempo mínimo de efectividad requerido. (72) Se realiza un análisis de la duración de 40 pilas alcalinas obteniéndose los siguientes resultados: Duración Xi 1,55 – 1,95 1,95 – 2,45 2,45 – 2,95 2,95 – 3,45 3,45 – 3,95 3,95 – 4,45 4,45 – 4,95
Frecuencia absoluta nj 2 1 4 15 10 5 3
Ajustar las duraciones de las pilas alcalinas a una distribución normal con media 3,5 y desviación típica 0,7. (73) Un estudio de genética con reses consistió en varios machos apareados con grupos separados de hembras. Cuando nacían terneros, se usaban en un estudio de pesos hereditarios. En la siguiente tabla se presentan los pesos al nacer de ocho terneros de cada uno de los cinco grupos de apareamiento. Macho 177
46
61
100
56
Peso al nacer 113 99
103
75
62
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 200 201 202 203
75 58 57 59
102 60 56 46
95 60 67 120
103 57 59 115
98 57 58 115
115 59 121 96
98 54 101 105
94 100 101 75
Escriba el modelo lineal, explique cada término, calcule el análisis de varianza y muestre los cuadrados medios esperados. Pruebe la hipótesis nula Ho: σ2 = 0 para los machos. (74) Los datos del ejercicio 3.5 corresponden a las concentraciones de colesterol en análisis de laboratorio a 2 muestras de cada uno de 8 pacientes. Suponga un modelo aleatorio para el estudio. Escriba el modelo lineal, explique cada término, calcule el análisis de varianza y muestre los cuadrados medios esperados. Estime las componentes de la varianza para pacientes y muestras y determine intervalos de confianza medios al 90%. (75) Un patólogo de plantas tomó cuatro muestras, de 3 libras cada una, de lotes de 50 toneladas de semilla de algodón acumulada en varias cosechas durante la temporada de limpia. Las muestras se analizaron en el laboratorio para buscar aflatoxin, que es una toxina producida por organismos asociados con las semillas. A continuación se proporcionan las concentraciones de aflatoxin en partes por billón para las muestras de ocho lotes. Lote 3469 – 72 3849 – 52 3721 – 24 3477 – 80 3669 – 72 3873 – 76 3777 – 80 3461 - 64
39 56 64 29 38 11 23 10
Afloxin (ppb) 57 63 13 25 83 88 55 21 66 53 49 34 0 5 11 23
66 31 71 51 81 10 20 37
(76) Suponga que los lotes y sus muestras son efectos aleatorios. Escriba el modelo lineal para el estudio, explique los términos, calcule el análisis de varianza completo y muestre los cuadrados medios esperados. (77) Piense en problemas de investigación en su área de interés que requieran muestras (u observaciones) de la unidad experimental debido a que no sea posible medir la unidad en su totalidad. Escriba un modelo lineal para su estudio; identifique los términos y bosqueje el análisis de varianza, muestre las fuentes de variación, los grados de libertad y los cuadrados medios esperados. (78) Se realizó en conjunto un estudio sobre cartuchos para filtrado de partículas de alta energía, usados en respiradores comercia47
Palacios C. Severo les para protección contra partículas de materia. Una prueba específica incluyó tres filtros elegidos al azar de cada uno de dos fabricantes, se hicieron tres réplicas de prueba independientes de cada filtro, las medidas fueron el porcentaje de penetración por medio de una prueba estándar de aerosol. Filtro
1 1,12 1,10 1,12
Fabricante I 2 3 0,16 0,15 0,11 0,12 0,26 0,12
4 0,91 0,83 0,95
Fabricante II 5 6 0,66 2,17 0,83 1,52 0,61 1,58
Escriba un modelo lineal para este estudio, explique los términos, calcule el análisis de varianza y muestre los cuadrados medios esperados. Pruebe la hipótesis de que no existen diferencias entre la penetración porcentual promedio de los filtros de los dos fabricantes. Calcule las medias, sus errores estándar y las estimaciones del intervalo de confianza de 95% para las medias de cada fabricante. (79) Un científico de suelos estudió el crecimiento de plantas de cebada en tres niveles diferentes de salinidad en un medio controlado. Tenía dos contenedores réplica de cada tratamiento, en un diseño totalmente aleatorizado y midió tres plantas de cada réplica. Los pesos en seco de las plantas, en gramos, son los siguientes: Salinidad Control 6 barras 12 barras
Contenedor 1 2 3 4 5 6
11,29 7,37 5,64 4,20 4,83 3,28
Peso (g) 11,08 6,55 5,98 3,34 4,77 2,16
11,10 8,50 5,69 4,21 5,66 2,69
Escriba un modelo lineal para un análisis de datos, explique los términos, calcule el análisis de varianza y muestre los cuadrados medios esperados. Pruebe la hipótesis de que no hay diferencia entre las medias de los niveles salinos. Calcule el error estándar de una media de nivel salino. Haga una partición de las sumas de cuadrados para la salinidad en dos sumas de cuadrados polinomiales ortogonales (lineal y cuadrática), cada una con 1 grado de libertad y pruebe la hipótesis nula de que no hay regresión lineal o cuadrática. (80) El índice de porosidad es una medida usada por los científicos de suelos para ayudar en la predicción del movimiento, almacenamiento, disponibilidad del agua y las condiciones de oxigena48
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería ción del subsuelo. Un científico de suelos usó un diseño de muestreo especial para tomar muestras del suelo de una de las granjas experimentales de la universidad para medir el índice de porosidad del suelo. Se hizo una partición de la granja en campos de aproximadamente 4 hectáreas, cada una con 8 secciones. El plan de muestreo incluyó una selección aleatoria de los campos dentro de las secciones. A continuación se presenta el índice de porosidad de cada sub muestra:
Campo 1 2 3 4 5 6 7 8
Sección 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Porosidad 3,846 3,712 5,629 2,021 5,087 4,621 4,411 3,357 3,991 5,766 5,677 3,333 4,355 6,292 4,940 4,810 2,983 4,396 5,603 3,683
Campo 9 10 11 12 13 14 15
Sección 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Porosidad 5,942 5,014 5,143 4,061 3,835 2,964 4,584 4,398 4,193 4,125 3,074 3,483 3,867 4,212 6,247 4,730
Suponga que todos los efectos son aleatorios. Escriba un modelo lineal para el estudio, explique cada término, calcule el análisis de varianza para los datos y muestre los cuadrados medios esperados. Estime las componentes de la varianza para campos, secciones y muestras.
49
Palacios C. Severo XIII. DISTRIBUCIONES Al tratar con grandes cantidades de datos, es conveniente ordenarlos de tal manera que la frecuencia de la aparición de rangos de valores dados, puedan ser tabuladas y graficadas. Este ordenamiento se realiza estableciendo rangos llamados intervalos de clase la frecuencia relativa de los intervalos de clase se denomina distribución empírica y se utilizan para estimar las distribuciones teóricas. Ensayos estadísticos Existen varios tipos de ensayos estadísticos que se emplean para determinar si la diferencia entre dos conjuntos de valores es real y significativa o a errores azarísticos. Ensayo t La distribución t de Student aparece al comprobar la hipótesis de la media de una totalidad general de distribución normal siendo incógnita la varianza. n 1 1n 2 X² 2 f (X ) 1 N n a 2
Ejemplo 1.12 Consideremos los datos del ejemplo 1.10, se trata de saber si la diferencia entre el valor medio y el supuesto valor medio 96 es significativa. X 94,32
S X 2,03 S X 4,54 Hipótesis : o GL 4
t
X o
SX 0,82
50
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería El valor tabulado de t para un nivel de significación del 99% y 4 GL, es igual 3,75, como el valor calculado de t es inferior al valor tabulado, la hipótesis no es rechazada. Chi-cuadrado Esta prueba puede utilizarse para comparar los resultados de una encuesta con frecuencia teórica o esperada. f f ´ f´
2
X2
Ejemplo 1.13 La alimentación de flujo continuo que se realiza a cuatro reactores industriales que han sufrido un total de cuarenta fallas durante un año, la distribución de las fallas, por bombas fue: Bomba 1: Bomba 2: Bomba 3: Bomba 4:
16 9 6 9
El capataz de mantenimiento sostiene que la bomba 1 ha sufrido un número excesivo de fallas, en comparación con los resultados posteriores se trata de saber si esta afirmación es justificada. Como hay cuatro categorías posibles de números y como el número total está dado, el número de GL es tres. Esto corresponde a un número de probabilidades aproximadamente igual a 0,25 e indica que, si todas las bombas operan en las mismas condiciones, el valor del Chicuadrado sería de 5,4 es decir una vez cada cuatro, por la sola acción del azar. Por lo tanto la probabilidad que la hipótesis de mantenimiento esta equivocado es del 25 por ciento en la población, La prueba puede usarse siempre que los resultados, las respuestas o los encuestadores se pueden organizar en varias categorías. Distribución F El análisis de varianza que se realiza mediante el ensayo F permite la separación de la varianza total de un proceso, en sus componentes. Con el ensayo F el número de GL correspondiente a las dos varianzas no necesita ser idénticas. 51
Palacios C. Severo La mayoría de los textos de estadística tabulan valores de F para los niveles de probabilidad 0,05 y 0,01. El número de GL, con la varianza en el numerador, se indica normalmente en la parte superior de la tabla, mientras que el número de GL con la varianza en el denominador se encuentra en la columna de la izquierda. Ejemplo 1.14 Para un ensayo de laboratorio de rutina, se ha propuesto un procedimiento analítico simplificado. Es necesario determinar si el procedimiento propuesto arroja los mismos resultados que el convencional, es decir, si los valores medios de un ensayo por duplicado son iguales y si la precisión del ensayo propuesto es igual al antiguo. Convencional 89,7 89,6 89,5 89,6 89,8
Propuesto 89,8 89,6 89,4 89,5 90,0 89,7 89,2 X 1 89,6
X 1 89,64 GL 4
GL 6
S12 ( X ) 0,013
S 22 ( X ) 0,07
Los valores medios de las muestras con los dos métodos son similares pero la diferencia con la varianza es significativa al nivel del 0,05 de probabilidad. Consultado la tabla de valores F indica el valor de 6,2 para el nivel de probabilidad correspondiente y el número de GL existente. Para determinar si los valores de varios conjuntos de medición, es necesario el cálculo de varianza de los valores medios de los conjuntos. Si la varianza de los valores medios es sólo normal resulta. Ejemplo 1.15 Tres reactores ubicados en diferentes lugares, que emplean sin embargo el mismo proceso. Se desea saber si los valores medios correspondientes a los tres reactores son similares. Entre valores medios
S 2 X 3,825 52
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Entre conjuntos S X 0,3988 2
F Reactor
Suma de conjunto Media
9,59
S2 X
S X 2
1 10,4 10,0 11,8 11,2 43,4 10,85 2 SC / K 1490,61
2 11,6 12,4 12,9 11,9 48,8 12,2
3 9,80 10,9 10,4 10,1 41,2 10,3
2 X / K 1482 ,96
2 X 1492,2
La tabla F para los GL establecido indica los valores de 4,26 y 8,02 respectivamente. Como el valor calculado es mayor que el valor tabulado, se concluye que los valores medios de los tres reactores son significativamente diferentes. Logaritmo normal La distribución logarítmica normal es de amplio uso en la física estadística, geología estadística, estadística económica, biología. Logística La función de distribución se diferencia un poco de la función normal de distribución, se utiliza en las investigaciones médico-biológicas para analizar la eficiencia de diferentes medicamentos, nutrientes, venenos, etc. Pareto La distribución de Pareto encuentra amplia aplicación en los problemas de la estadística económica. Weibull-Gnedenko Se usa con frecuencia en la teoría de fiabilidad para describir el tiempo de funcionamiento sin fallo de los instrumentos. 53
Palacios C. Severo Pearson Se usa ampliamente en la estadística matemática para suavizar las distribuciones de los datos empíricos. XIV. INTERVALOS DE CONFIANZA El desarrollo del análisis estadístico implica la determinación teórica de la distribución de ciertos valores, como el valor medio, la desviación estándar y la varianza, que se puede esperar si sólo actúa al azar. La teoría estadística constituye una herramienta poderosa, para determinar, en un grado razonable de certidumbre, si las diferencias observadas son debidas al azar. Por definición: Reordenando Z X n
Intervalo de confianza Z X / n
Por lo tanto, para un cierto nivel de probabilidad que determina el valor de Z, puede afirmarse que el intervalo de confiabilidad de estará dado por, X
Z Z X n n
Si no se conoce la desviación estándar verdadera, aún puede determinarse un intervalo de confiabilidad. Esta estimación utiliza la distribución t en lugar de la distribución Z porque el concepto t incluye la variación adicional introducida por la estimación de la desviación estándar, reordenando: X
tS X n
X
tS X n
Ejemplo 1.16 Establecer el intervalo de confiabilidad para la media verdadera de los datos del ejemplo 1.10. GL 4 S X 4,54 t0,95 2,78 t0,99 4,6 54
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Nivel
95%
Intervalo 94,32 2,784,54 / 5 99,96 y 88,68
99%
94,32 4,604,54 / 5 103,65 y 84,94
Se observa que para un nivel de confiabilidad del 95% será más correcto afirmar el resultado del análisis como ± 5,64 por ciento en lugar de 94,32%. XV. MUESTREO Nadie necesita beber todo un vaso de leche dañada para poder decir que esta mala - una muestra es suficiente. Realizar un muestreo es más barato y más rápido que hacer un censo de toda una población. Y en la mayoría de los casos, desde luego, tomar una muestra es la única alternativa factible para la investigación simplemente no es práctico pensar siquiera en encuestas a toda la población. Pero si la muestra se desarrolla con propiedad, ésta puede proporcionar suficiente precisión para propósitos de toma de decisiones. El muestreo en la investigación requiere estas dos dimensiones: a) Seleccionar las unidades de la población que se incluirá en el estudio. b) Interpretar los resultados del estudio con el fin de estimar los parámetros de la población a partir de los datos de la muestra y probar hipótesis, usualmente sobre la diferencia entre dos muestras o entre una muestra y un resultado esperado. XVI. MÉTODOS DE MUESTREO Hay dos grandes métodos de muestreo: Probabilístico y no probabilístico. a)
Muestreo probabilístico
Este es el tipo de muestreo más objetivo y científico. Un requisito del muestreo probabilístico es que cada unidad en la población tenga una probabilidad igual y conocida a ser seleccionada para la muestra. El criterio de investigador no debe influir en la selección de los informantes. Hay varias formas de muestreo: 55
Palacios C. Severo Muestreo simple al azar Es el tipo más básico. Implica seleccionar informantes completamente al azar; es tal como si los nombres se sacarán de un sombrero. Obviamente, esto requiere un marco de muestreo perfecto; es decir, una lista completa de todas las unidades en el universo. Muestreo estratificado al azar Implica primero agrupar la población en segmentos homogéneos y luego hacer el muestreo de datos de cada segmento o estrato. Muestreo de agregados Implica tomar muestras de grupos de entrevistados como unidad y no como elemento individual. Con el fin de lograr eficiencia en entrevistas de muestreo a muestreo. Muestreo sistemático Se incluye cada n-ésimo elemento de la población en la muestra. Este es un procedimiento común que se puede combinar con un muestreo de agregados y muestreo estratificado. La ventaja principal del muestreo probabilística es su precisión. Es el mejor camino para desarrollar una muestra que sea perfectamente representativa de la población. El muestreo probabilística tiene varias desventajas importantes que resulta su utilización amplia: a) Para seleccionar una muestra probabilística es necesario tener una lista o un marco de muestreo, correspondiente a toda la población. b) A pesar de los mejores intentos de muestreo, los errores de no respuesta pueden afectar la precisión del resultado. c) El muestreo probabilística es muy costoso de realizar, es especial para estudios de muestra a muestra. Errores Si bien es cierto que buenos métodos de muestreo pueden producir resultados muy costosos, ninguna muestra es absolutamente precisa.
56
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Ejemplo 1.17 Supongamos que una muestra probabilística local indica que el 40% de los hogares entrevistados se tiene un gato para erradicar las ratas transmisoras del virus Hanta. Es poco probable que un censo de todos los hogares revele que exactamente en el 40% de ellos haya un gato. Si la muestra original fue bien tomada, bien ejecutada y fue suficientemente grande hay una buena probabilidad de que el número real de hogares con gatos, revelado al censo esté cerca del 40%; pero probablemente no será exacta mente esa cifra. Estos errores o diferencias entre los resultados de la encuesta y las cifras comparables de la población, viene de dos fuentes: factor de muestreo y factor no muéstrales. Error de muestreo En el ejemplo 1.17 sobre posesión de gatos es posible medir el error muestral del estudio y anexar un límite de confianza a la cifra de la encuesta, a fin de estimar los datos de la población total. Supongamos que el estudio sobre la posesión de gatos ha utilizado una muestra probabilística de 1000 hogares. En este caso la cifra de 40 por ciento de poseedores de gatos tendría un intervalo de más o menos 3 por ciento a un nivel de confianza del 95 por ciento. En otras palabras las probabilidades son 95 en 100 de que el intervalo de confianza incluya el verdadero porcentaje de hogares que poseen gatos, en la población total. Eso es el error de muestreo: el intervalo que debe anexarse a cualquier resultado de una encuesta, debido a que proviene de una muestra. Las muestras grandes tienen menos errores de muestreo que las muestras pequeñas. Error no muestral La importancia y el impacto del error no muestral generalmente son sub-estimados por los investigadores, Entre los errores no muéstrales se pueden mencionar lo siguiente: a) Incapacidad de localizar informantes correctos. b) Negativa de los informantes a empezar la investigación. c) Terminación de la encuesta por los informantes durante la investigación porque consideran que es muy larga, muy tediosa. 57
Palacios C. Severo d) e) f) g) h) i) j)
Mentiras intencionales de los informantes. Mala memoria, suposiciones insesgadas. Mal entendimiento del procedimiento. Manipulación por parte del investigador. Sesgos introducidos por el investigador. Errores de anotación. Errores de codificación.
Es decir, la precisión de los mejores métodos de muestreo probabilístico pueden anularse por algún problema de alguna de estás áreas. Sin embargo, el impacto de estos errores potenciales no muéstrales en mayor parte se pasa por alto en todo muestreo. Para solucionar los errores muéstrales, consiste básicamente en una planeación cuidadosa y una atención estrecha a los detalles de realización del proyecto. Error en la predicción En un diagrama de dispersión en el que no todos los puntos caen en la línea de regresión. Si todos los puntos hubiesen caído sobre la recta y si la cantidad de observaciones hubiera sido lo suficientemente grande, no se habría dado error en la predicción del proceso. La predicción perfecta es prácticamente inexistente. Aún en los casos que nos ocupa, existen factores que no son de predicción perfecta, quizás se deba a causas de imperceptibilidad en la composición de los factores. Lo que necesita, entonces, es una medida que pudiera indicar hasta qué punto es precisa la predicción de Y, basada en X, o viceversa, cuán imprecisa podría ser. Esta medida se llama error de estimación. S yx
Y Yp
N 2
2
Syx representa la desviación estándar de las Y sobre la base de las X. Esta medida de error es similar a la desviación estándar que mide la dispersión alrededor de un promedio; el error de la estimación mide la dispersión alrededor de una línea promedio, llamada línea de regresión. b)
Muestreo no probabilístico
Existen tres tipos de muestreo no probabilística: 58
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Muestreo por conveniencia Deja la selección de los informantes primordialmente a los investigadores. Muestreo por criterio Implica seleccionar únicamente cierto tipo de informantes para participar en el estudio. Muestreo por cuotas Se estructura la muestra de tal modo que incluya números específicos de informantes con características que se sabe o se cree que afecta al tema de la investigación. XVII. TOMA DE DECISIONES Los ejecutivos de muchas empresas están empezando a tomar en serio la importancia de las aproximaciones cuantitativas en la toma de decisiones. Este es un cambio importante. Así probablemente no es por puro accidente que el tema esté ganando importancia en la gestión empresarial - investigación - consultoría. El énfasis se debe a las herramientas estadísticas que reducen la incertidumbre de la toma de decisiones, con problemas que pueden ser parcialmente estructuradas. Estas herramientas intentan ir más allá que simplemente proporcionen información del que tome la decisión. El fin es el de ayuda a que se pueda alcanzar una decisión reconociendo, por supuesto, el juicio profesional. Los problemas que se ajustan bien a los sistemas de toma de decisiones son aquellas en las que existe suficiente estructuración de forma que las ayudas analíticas sean de gran utilidad requiriendo siempre el juicio del profesional. Un aspecto muy importante de toma de decisiones es que se da la efectividad más que la eficiencia. Entonces hay que aumentar el número 59
Palacios C. Severo de posibles soluciones para que el ejecutivo pueda mejorar la efectividad de una decisión. El informe sobre evaluación de los distintos resultados para la toma de decisiones como un punto clave para la implementación de los grupos de trabajo que han de compartir la información. Distinguiendo especialmente las tareas administrativas - gestión de calendario planificación - agenda. Principios de decisión Cuando existe una situación en el cual se pueden distinguir dos o más alternativos, una decisión consiste en seleccionar una de estas alternativas de acción excluyente el otro a los otros. Con esta definición podemos proceder a examinar el proceso completo de toma de decisiones, el cual puede concebirse integrando por las siguientes etapas: a) Recolección de datos. b) Establecimiento de alternativas. c) Asignación de medidas de utilidad para cada alternativa en relación con algún criterio de efectividad. d) Decisión (selección de una alternativa). e) Aplicación de la alternativa. Este proceso de complemento general, podría descomponerse en decisión de diseño y operativo y para dicho propósito, decisiones personales. Ejemplo 1.18 Consideremos un proceso de una persona que está próximo a salir de su casa, para ir al trabajo un día cualquiera de agosto y desea determinar si ponerse abrigo y, en tal caso cual de ellos. Recolección de datos Nuestro individuo se asoma a la ventana y observa que el sol brilla pero a través de nubes espesas. A través del noticiero de su televisor se informa que la temperatura actual es de 8°C y que se predice alcanzará un máximo de 12°C. La oficina metereológica menciona un 40% de probabilidad de lluvia. 60
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Sabe que ira y volverá en movilidad al trabajo y que tendrá que caminar dos cuadras entre la ruta y su oficina. No tiene paraguas para protegerse. Establecimiento de alternativa La alternativa del individuo basado en su disponibilidad de vestuario: a) Usar un sobre todo. b) Usar un impermeable, y c) No usar ningún abrigo. Asignación de medidas con algún criterio de efectividad El criterio de efectividad del individuo, será en este caso el de comodidad personal, que es una medida subjetiva. El determinará a continuación, de alguna manera intuitiva, la utilidad de su comodidad personal para cada alternativa. Decisión (selección de la alternativa) Supongamos que el individuo, en camino al trabajo, ha asignado medidas de utilidad para cada alternativa, de tal manera que una de ellas posee una utilidad mayor que cualquiera de las otras, la decisión o selección de una alternativa, se tomará en favor de aquella que tenga la mayor medida de utilidad. Si dos alternativas tienen igual medida de utilidad y esta es mayor que la de la tercera, se deberá emplear entonces algún método aleatorio de selección. En este caso el lanzamiento de una moneda podría servir. Ejecución de la alternativa escogida En nuestro ejemplo la ejecución es sencilla. El hombre toma el abrigo escogido de su armario o simplemente se va al trabajo si ha decidido no llevar abrigo. Visto de esta manera el proceso de decisión entramos ahora a establecer algún principio general de utilidad en el diseño de la estructura de las decisiones en un sistema Montecarlo. Alguno de estos principios puede aparecer obvios o triviales, y sin embargo no violados con frecuencia en el diseño. 61
Palacios C. Severo XVIII. PRINCIPIOS PARA LA TOMA DE DECISIONES 1. 2. 3. 4. 5.
6.
7.
Los datos son base necesaria para la decisión. Sin algún dato es imposible establecer alternativas o asignar medidas de utilidad a las mismas. Los datos recolectados deben ser de dos clases: aquellos que sirven para establecer las alternativas y los que se pueden usara para fijar las medidas de utilidad. Los datos recolectados deben se directamente aplicables o tales que, mediante una transformación, puedan hacerse aplicables para el criterio de efectividad que se usan. Suponiendo que se ha establecido alternativas y asignado medidas de efectividad, los datos adicionales serán útiles que afectan las utilidades asignadas. La recolección de datos deberá tomarse antes de establecer alternativas y averiguar utilidades. Aunque este principio parece obvio, realce la exigencia frecuentemente escuchada acerca de la oportuna recolección de datos. La exactitud que se requiera en los datos en función de las técnicas utilizadas parece asignar medidas de utilidad a las alternativas. Este principio refuerza el análisis de la sensibilidad de los modelos matemáticos. Sin un modelo dado es relativamente sensible a un parámetro dado, o si este parámetro es ponderado ligeramente, se disminuye la exigencia de exactitud. Asumiendo que, para una decisión determinada, las cinco etapas del proceso de decisión están bien definidas y que esta decisión es de naturaleza repetitiva, la totalidad del proceso de decisión puede delegarse a un nivel más bajo de la organización. Nótese que en cada uno de estos casos debe tomarse una decisión de diseño. Las alternativas son: Retorne al proceso de decisión o delegarlo a un sistema automático. AL tomar la decisión, el diseñador del sistema deberá asignar medidas de utilidad a las alternativas.
XIX. PLANIFICACIÓN La planificación de una operación propone asegurar que todos los recursos necesarios para producir, se encuentran y en las cantidades necesarias y, además, que el desperdicio de los recursos sea mínimo. El plan de operaciones suministra solo el marco general dentro del cual las actividades específicas habrán de desarrollarse. 62
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería En torno al plan de operaciones asigna recursos disponibles a los diferentes requerimientos de producciones. Tipos de planificación Existen diferentes categorías de planeamiento para diferentes períodos: Planificación a largo plazo Se relaciona con el mantenimiento de la línea apropiada por medio de la investigación y desarrollo, y en el suministro de las factibilidades para las actividades. El plan incluye planeamiento para al expansión, modernización. Planificación intermedia Se relaciona con la asignación de recursos a las necesidades del proyecto, tales como la adquisición de materiales, equipos y nuevos productos. Planificación a largo plazo Establece programas que asignan recursos, a los proyectos actuales. Este tipo de plan, que usualmente cubre seis meses a dos años, establece el nivel general de actividades.
63
Palacios C. Severo Problemas (81) Calcular los valores tα correspondientes a una distribución t de Student en los siguientes casos: a) El área a la derecha de tα es 0,20 y n = 10 b) El área a la izquierda de tα es 0,40 y n = 8 c) El área a la derecha de tα es 0,05 y n = 50 (82) Calcular los valores de Fα correspondientes a una distribución F de Snédecor en los casos siguientes: a) α = 0,01 y (2,8) grados de libertad b) α = 0,05 y (7,3) grados de libertad (83) Elegidas 26 personas al azar de una población y sometidas a un test de modernismo dan como media X 40 y S 6 . Se quiere saber si la verdadera media de la población puede ser tan alta como 44. (84) El fabricante de una dieta de adelgazamiento dice que su producto permite una reducción media de peso de 3,5 kg. Con objetivo de investigar su eficacia, se seleccionaron al azar 40 personas, observando en ellas el peso antes de aplicar la dieta, X y el peso después de acabar el tratamiento, Y, lo que proporcionó una varianza para la diferencia de S d3
1 39
X 40
1
i
Yi X Y
2
1,8
Si suponemos que tanto X como Y siguen distribuciones normales, determinar la probabilidad de que los individuos de la muestra haya una reducción media de masa de 3 kg. (85) La efectividad en días de un determinado antibiótico, sigue una distribución normal de media 14 días y desviación típica desconocida. Fue administrada a 16 enfermos, obteniéndose una desviación típica muestral de 1,4 días. Determinar la probabilidad de que la efectividad media en la muestra no supere los 3 días, que es el tiempo mínimo de efectividad requerido. Preocupados por una posible subestimación de la varianza poblacional, que podría llevar a subestimar la probabilidad de que no se alcance la efectividad mínima, se desea determinar la probabilidad de que con una muestra de 16 enfermos se subestime la varianza en más de un 20%. Si la muestra es de 61 pacientes, esta probabilidad ¿aumenta o disminuye? Determinar el tamaño de muestra necesario para que la probabilidad anterior sea 0,05. (86) En una muestra de 19 individuos se observa que un determinado trastorno emocional se produce a partir de una edad media de 64
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(87)
(88)
(89)
(90)
(91)
50 años y una desviación típica de 6 años. Se supone que estamos ante un fenómeno que sigue la ley normal. Fijar los límites del intervalo de confianza para la varianza con un nivel de confianza del 99% Realizar lo mismo que en el apartado anterior para n = 200 En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de actividades de ocio que gustan más a sus habitantes. Para ello van a ser encuestados 100 individuos elegidos al azar. Explicar qué procedimiento de selección sería más adecuado utilizar: muestreo con o sin reposición. Como los gustos cambian con la edad y se sabe que en el barrio viven 2500 niños, 7000 adultos y 500 ancianos, posteriormente se decide elegir la muestra anterior utilizando un muestreo estratificado. Determinar el tamaño muestral correspondiente a cada estrato. Sea la población de elementos 22 24 26 Escriba todas las muestras posibles de tamaño dos, escogidas mediante muestreo aleatorio simple. Calcule la varianza de la población. La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribución normal de media 1,62 m y la desviación típica 0,12 m. Cuál es la probabilidad de que la media de una muestra aleatoria de 100 alumnas sea mayor que 1,60 m Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios: 95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110. Suponiendo que los precios de este producto se distribuyen según una ley normal de varianza 25 y media desconocida: ¿Cuál es la distribución de la media muestral? Determine el intervalo de confianza, al 95%, para la media poblacional. La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es una variable aleatoria que sigue una distribución normal con varianza σ2 = 0,16 m2. Construye un intervalo, de un 95% de confianza, para la media de las estaturas de la población. Cuál sería el mínimo tamaño muestral necesario para que pueda decirse que la verdadera media de las estaturas está a menos de 2 cm de la media muestral, con un nivel de confianza del 90% 65
Palacios C. Severo (92) Las ventas mensuales de una tienda de electrodomésticos se distribuyen según una ley normal, con desviación típica US$ 900. En un estudio estadístico de las ventas realizadas en los últimos nueve meses, se ha encontrado un intervalo de confianza para la media mensual de las ventas, cuyos extremos son US$ 4663 y US$ 5839. ¿Cuál ha sido la media de las ventas en estos nueve meses? ¿Cuál es el nivel de confianza para este intervalo? (93) Se desea estimar la proporción, p, de individuos daltónicos de una población a través del porcentaje observado en una muestra aleatoria de individuos, de tamaño n. Si el porcentaje de individuos daltónicos en la muestra es igual al 30%, calcula el valor de n para que, con un nivel de confianza de 0,95, el error cometido en la estimación sea inferior al 3,1%. Si el tamaño de la muestra es de 64 individuos, y el porcentaje de individuos daltónicos en la muestra es del 35%, determina, usando un nivel de significación del 1%, el correspondiente intervalo de confianza para la proporción de daltónicos de la población. (94) En una población una variable aleatoria sigue una ley normal de media desconocida y desviación típica 2. Observada una muestra de tamaño 400, tomada al azar, se ha obtenido una media muestra al igual a 50. Calcule un intervalo, con el 97 % de confianza, para la media de la población. Con el mismo nivel de confianza, ¿qué tamaño mínimo debe tener la muestra para qué la amplitud del intervalo que se obtenga sea, como máximo, 1? (95) Una marca de nueces afirma que, como máximo, el 6% de las nueces están vacías. Se eligieron 300 nueces al azar y se detectaron 21 vacías. Con un nivel de significación del 1%, ¿se puede aceptar la afirmación de la marca? Si se mantiene el porcentaje muestral de nueces que están vacías y 1-α = 0,95, ¿qué tamaño muestral se necesitaría para estimar la proporción de nueces con un error menor del 1% por ciento? (96) La duración de las bombillas de 100 W que fabrica una empresa sigue una distribución normal con una desviación típica de 120 horas de duración. Su vida media está garantizada durante un mínimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de significación de 0,01, ¿habría que rechazar el lote por no cumplir la garantía? 66
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
§2 ANÁLISIS DE REGRESIÓN La falacia del cuadro estadístico estriba en que es unilateral, en la medida en que representa sólo el aspecto promedio de la realidad y excluye el cuadro total. La concepción estadística del mundo es una mera abstracción, y es incluso falaz, en particular cuando atañe a la psicología del hombre. Carl Jung
I.
INTRODUCCIÓN
Las técnicas estadísticas estudiadas hasta ahora tenían por objeto fundamental la comprobación de ciertas hipótesis.
Un campo más útil e importante del análisis estadístico en el diseño consiste en el desarrollo de modelos matemáticos que representen situaciones físicas. Este tipo de análisis se denomina análisis de regresión, se ocupa de desarrollar una cierta relación matemática que incluye el modelo matemático, su significación estadística y su confiabilidad. Se puede demostrar que está íntimamente relacionada con el modelo del análisis de varianza. II. MÉTODOS DE MÍNIMOS CUADRADOS Se predice una variable dependiente en función de una variable independiente simple; en muchos problemas de este tipo la variable independiente se observa sin error o con error que es despreciable se compara con el error de la variable independiente. Ejemplo 2.19 Al medir la cantidad de óxido formado en la superficie de un menaje de aluminio, las variables de anodinado electrolítico suelen ser cantidades, pero la medición del espesor del óxido anodizado esta sujeto a variables aleatorias consideradas. 67
Palacios C. Severo Así, a pesar que la variable independiente puede ser estable en X, las mediciones repetidas de ella pueden atribuirse a diversas causas, principalmente a errores de medición y a la existencia de otras variables incontrolables capaces de influir en el valor de X cuando este fija. En esta forma la medición del espesor de la capa anodizada pueden variar en toda la superficie para el mismo período a la misma variable ejecutada. Estudiemos el caso de regresión Y sobre X lineal, esto es, para cualquier X dada la media de la distribución de las Y esta dada por:
Y X ε es el valor de una variable aleatorizada y podemos elegir a tal que la media de la distribución de esta variable aleatoria sea igual a cero. Ejemplo 2.20 Consideremos una regresión de Y sobre X sea lineal, suponiendo un fenómeno físico de tensores, se flexiona variando la carga. X Y
1 35
2 64
3 96
4 124
5 156
6 182
Consideremos n pares de observaciones (Xi,Yi), deseamos determinar la línea que de el mejor ajuste. Si predecimos y por medio de la ecuación:
Y bo bX Donde
i YI Y i 68
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Puesto que no podemos minimizar cada εi por separado, debemos tratar de hacer una sumatoria Σεi; tan cerca de cero como sea posible, minimicemos la suma de cuadrados de las εi.
Yi bo bX i
2
Nótese en la figura, que la minimización de la suma de cuadrados de las distintas verticales a partir de los puntos respecto a la línea. Una condición necesaria para que exista un mínimo relativo es la acumulación de las derivadas parciales con respecto a bo y b.
2Yi bo bXi X i 0 2Yi bo bXi 1 0 Siendo las ecuaciones normales, Y nb b X i
o
1
i
X Y b X b X i
j
o
i
1
2 i
Este conjunto de ecuaciones lineales con la incógnita b i denominados casos normales, da los valores para la línea con el mayor ajuste a un conjunto de datos. Ejemplo 2.21 Ajuste una línea recta a los datos por el método de mínimos cuadrados, utilice para estimar el coeficiente de evaporación de una gota de combustible, cuando la velocidad del aire proveniente de una turbina es de 190 cm/seg. X Y
20 0,18
60 0,37
100 0,35
140 0,78
180 0,56
220 0,75
260 1,18
300 1,36
340 1,17
380 1,65
X 2000 X ² 532000
Y 8,35 XY 2175,4
69
Palacios C. Severo 8,35
10 bo
2000 b
2175 , 4
2000 bo
532000 b
Resolviendo bo = 0,069,
b = 0,0038
Y 0,069 0,0038(190) 0,79 mm² / seg
III. MODELOS DE REGRESIÓN En las aplicaciones de la estadística se exige estimar el carácter de la dependencia entre las variables estadísticas observadas. Ejemplo 2.22 Entre los parámetros de los procesos tecnológicos, la producción acabada, la luminosidad de las estrellas y sus dimensiones, la cantidad de precipitación fluvial en sectores, el rendimiento de cosecha, el engorde de ganado, la recuperación de material valioso de un mineral, la transformación de un producto, etc.
Y bo
bX
Y bo
bi X i
Y bo
bi X i
Y bo
bLogX
Y bo
bi X
Y bo
Y 1 / bo bX
2
bij X ij
bii X ii
bij X ij
bii X ii
b j1/ X
bi X i
2
Y 1 / bo bi X i ... bn X n
Y 1 / bo bi X i bij X ij2 bij X ij LogY bo
bX
LogY bo
bLogX
3
En este caso, el problema fundamental consiste en el aislamiento de los datos experimentales con ayuda de curvas especialmente elegidas llamadas líneas o superficie de regresión que con mayor o menor seguridad caracteriza la dependencia de correlación entre las variables en observación. 70
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Las funciones más usadas en el análisis de regresión estadística son: IV. MODELO DE REGRESIÓN LINEAL CON K VARIABLES Generalizando el modelo de regresión lineal de dos y tres variables, el modelo de regresión de K-variables que tiene la variable dependiente Y y K- 1 variables independientes X1, X2, …, Xk, puede escribirse de siguiente manera.
Y bo bi X i ... bk1 X k1 i Donde: bo es el intercepto bi a bk-1 son las pendientes, y εi la perturbación La regresión lineal se debe interpretar como ya se ha visto, nos proporciona la media o valor esperado de Y condicional a los valores fijos (en muestras repetidas) de X1, X2, ..., Xk-1 es decir E(Y/X1,X2, ..., Xk-1) V.
REGRESIÓN LINEAL SIMPLE
Determina la relación entre una sola variable de regresión X y la respuesta Y. Usualmente se supone que la variable X es continua y controlada por el investigador. Si el experimento esta diseñado se eligen los valores X y se observan los valores correspondientes a Y. El valor esperado de Y para cada valor de X es:
E(Y / X ) bo bX En donde los parámetros de la recta bo son constantes desconocidas. Se supone que cada observación Y puede describirse mediante el modelo,
Y bo
bX
Donde ε es un error aleatorio con media cero y varianza δ2. Los parámetros del modelo bo y b pueden estimarse mediante mínimos cuadrados si se tiene n pares de datos. 71
Palacios C. Severo Ejemplo 2.23 El forjado de hierro a cierta temperatura afecta en la dureza del templado, para investigar esta relación se ha tomado las siguientes muestras: X Y
6 68
9 67
11 65
13 53
22 44
26 40
28 37
X 183 X ² 4665 Y 440 Y ² 23232 XY 7701 X 20,33 Y 48,89
Suma de cuadrados de los factores: S X2 1 / 84665 1 / 9183² 118 S Y2 1 / 823232 1 / 9440² 215,11
Suma de cuadrados de los productos cruzados S XY 1/ 87701 1/ 9183(440) 155,71
S YY 1 / 823232 440 / 9² 215,11
La pendiente es: b1 155,71 / 118 1,32
En el origen: bo Y 48,89
Y Y bi X X Y 48,89 1,32 X 20,33
Y 75,73 1,23X 72
33 34
35 32
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería La prueba de significancía de regresión de los datos, es: Tabla 2,5 Análisis de varianza SC GL CM Fo Ft(99%) 205,53 1 205,53 150,153 > 12,2 9,58 7 1,3688 215,11 8 R² = 95,54%
Fuente Regresión Error Total
VI. REGRESIÓN LINEAL MÚLTIPLE Muchos problemas de regresión en la vida real son con más de dos variables. El problema general se ajusta al modelo lineal, Y bo
b1 X 1 b2 X 2
... bk X k
Se conoce como regresión lineal múltiple. El método de mínimos cuadrados se usa para estimar los coeficientes de regresión, las ecuaciones normales en el método son: Nbo
X 1b1
X 2b2
X 3b3
Y
X 1bo X 2bo
X b
X 1 X 2b2
X 1 X 3b3
X 1Y
X 1 X 2b1
X 22b2
X 2 X 3b3
X 2Y
X 3bo
X 1 X 3b1
X 2 X 3b2
X 32b3
X 3Y
2 1 1
Ejemplo 2.24 Determine la función múltiple de la relación entre dos factores X1 y Xz a partir de los siguientes datos: X1
X2
4 7 9 12 32
1 2 5 8 16
Y 7 12 17 20 56
X 12
X 22
X1X 2
X 1Y
X 2Y
16 49 81 144 290
1 4 25 64 94
4 14 45 46 159
28 84 153 240 505
7 24 85 160 276
X2 4
X1 8
Y 14
Ecuación normal 4bo 32bo
32b1 16b2 290b1 159b2
56 505
16bo
159b1
276
94b2
Resolviendo la determinante obtenemos los coeficientes: 73
Palacios C. Severo bo = 0,6440 b1 = 1,6610 b2 = 0,0169
Resultando el modelo lineal múltiple Y 0,644 1,661X 1
0,0160 X 2
El procedimiento para el análisis de varianza es: Fuente Regresión Error Total
Tabla 2.6 Análisis de varianza SC GL CM Fo Ft(95%) 95,556 2 47,778 19,55 > 19 2,444 1 2,444 98,000 3 R² = 97,51%
Se concluye que al menos una variable afecta significativamente a la regresión. Fuente Regresión bo b1 b2 Error Total
Tabla 2.7 Análisis de varianza SC GL CM Fo 95,556 2 47,778 19,55 784,000 1 784,000 320,78 11,036 1 11,036 4,52 0,001 1 0,001 > <
Ft(95%) 19 161 161
VII. REGRESIÓN POLlNOMIAL La aplicación práctica de la regresión polinomial tiene un objeto esencial el incremento de los grados de alisamiento que exige realizar de nuevo todos los cálculos. En este caso es útil emplear los polinomios ortogonales en el modelo: Y bo bi X i
bij X ij2 bij X ij
Aplicando el criterio de mínimos cuadrados, igualando a cero las derivadas parciales de Y con respecto a los coeficientes bo, b1,.. .,b12, reacomodando algunos términos, se tiene las k+1 ecuaciones normales.
74
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Resolviendo el sistema, por cualquier método, se obtiene bo, b1, b2,..., b12 que son los estimadores mínimos cuadrados que nos permiten estimar Y a partir de la ecuación matriz. Nbo
b1 X 1
b2 X 2
b11 X 12
b22 X 22
b12 X 1 X 2
Y
X 1bo
b1 X 12
b2 X 1 X 2
b11 X 13
b22 X 1 X 22
b12 X 12 X 2
X 1Y
X 2 bo
b1 X 1 X 2
b2 X 22
b11 X 12 X 2
b22 X 23
b12 X 1 X 22
X 2Y
2 X 1 bo
b1 X 13
b2 X 12 X 2
b11 X 14
b22 X 12 X 22
b12 X 13 X 2
X 12Y
2 X 2 bo
b1 X 1 X 22
b2 X 23
b11 X 12 X 22
b22 X 24
b12 X 1 X 23
X 22Y
X 1 X 2 bo
b1 X X 2
b2 X 1 X
b11 X X 2
b22 X 1 X
b12 X X
X 1 X 2Y
2 1
2 2
3 1
3 2
2 1
2 2
Las pruebas estadísticas son las mismas que para los casos de regresión múltiple con sólo dos cambios en los grados de libertad, en lugar de un F con (r-2, n-r) grados de libertad tendremos una F con (r-k-1, n-r) grados de libertad, donde k es el grado del polinomio que se ajusta. VIII. REGRESIÓN POLINOMIAL CUADRÁTICO Un polinomio de grado k en una variables Y bo
bi X i
bii X ii2
bij X ij
que se aplica para estimar los efectos polinomiales de un factor cuantitativo. Ejemplo 2.25 Ajustar los siguientes datos a un polinomio de segundo orden restando mil al factor X y 23,2 al factor Y, para facilitar los calculas: X Y
850 0
860 8,2
870 16,6
890 27
890 39,7
900 52,8
910 68,6
920 82,5
930 99,6
940 108,5
950 128,5
4 108,5
5 128,5
desarrollando un artificio matemático para X, siendo X 1 X 900 / 10 X1 Y
-5 0
-4 8,2
-3 16,6
-2 27
-1 39,7
0 52,8
1 68,6
2 82,5
3 99,6
X 0 2 X 110
75
Palacios C. Severo XY 1429,8 2 X Y 9209 Y 886,8
11bo
0b1
110b2
886,8
0bo
11b1
0b2
1429,8
11bo
0b1
1958b2
9290
resultando los coeficientes bo = 76,64 b1 = 13 b2 = 0,3974
el modelo polinomial de segundo orden es: Y 76,64 16 X 0,3974X ²
reemplazando con el valor original
Y 11952,78 13,8X 0,003474X ² IX. REGRESIÓN NO LINEAL Es una práctica común de la ingeniería bosquejar parejas de datos sobre varias clases de hojas para graficar, con el fin de determinar si para una escala de transformación adecuada, los puntos caerán cerca de una línea recta. De ser así el tipo de transformación nos lleva a una forma funcional de la ecuación de regresión y las constantes necesarias pueden determinarse aplicando el método de mínimos cuadrados a los datos transformados. Sí un conjunto de datos que consta de n puntos se linealiza cuando son graficados sobre el papel semi logarítmico indica que la curva de regresión es exponencial para cualquier X considerada, la medida de la distribución de las Y está dada por αβX, entonces la ecuación predictiva será:
LogY Log XLog Ejemplo 2.26 Una fabrica de llantas decide analizar una variedad de sus productos para saber cuanto tiempo se puede usar después de un recorrido estándar. 76
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Recorrido Porcentaje
ΣX ΣX² ΣLog Y ΣXLog Y
= = = =
1 98,2
2 91,7
158 5530 130312 2121224
5 81,3
10 64
20 36,4
30 32,8
130312
8 Logb o
158 Logb
2121224
158 Logb o
5530 Logb
40 17,7
50 11,3
cuya solución es
LogY 2,002 0,0188X en forma exponencial: Y 100(0,96) X X.
COEFICIENTE DE CORRELACIÓN MÚLTIPLE R2
En el caso de dos variables se define R2 como la bondad de ajuste de la ecuación de regresión; es decir, nos da la proporción o porcentaje de variación total en la variable dependiente Y explicada por las variables independiente X. Este sentido de R2 puede fácilmente extenderse a modelos de regresión de más de dos variables. Por consiguiente, en el modelo de tres variables estamos interesados en conocer la proposición de las variables en Y explicada conjuntamente con las variables X1 y X2. El valor que nos da esta información se conoce como el coeficiente de correlación múltiple y se denota por R2, conceptualmente es igual que R2. La suma total de cuadrados es igual a la suma de cuadrados de las dependientes más la suma de cuadrados residuales. Por definición.
R² SCerror / SCtotal Dado que los valores de la ecuación son generalmente computados en forma rutinaria, R2 puede calcularse fácilmente. Note que R2 esta comprendido entre 0 y 1. Si es uno, significa que la línea de regresión ajustada explica el ciento por ciento de la variación de Y. De otro lado, si es cero, el modelo no explica nada de la variación en Y. Típicamente, sin embargo, R2 esta entre estos valores extremos. 77
Palacios C. Severo
Se dice que el ajuste del modelo es mejor mientras más cerca de uno está R2. XI. PRUEBAS DE SIGNIFICANCIA No podemos utilizar la prueba t para verificar la hipótesis conjunta según la cual las pendientes de las distintas variables son simultáneamente cero. Sin embargo esta hipótesis conjunta puede verificarse mediante la técnica de ANAVA y puede demostrarse del modo siguiente. Recordemos la identidad (ver el libro Manual de la Teoría del Diseño Experimental publcado por el Autor).
SCtotal SCerror SCresidual SCtotal tiene como es costumbre N-1 grados de libertad. SCresidua tiene N-3 grados de libertad por motivos ya conocidos y SCerror tiene 2 grados de libertad en razón de que es función de b1 y b2.
Por lo tanto, siguiendo el procedimiento ANAVA, podemos elaborar las tablas.
F b1 Yi X 1i b2 Yi X 2i / 2/ i2 /( N 3) Fuente Regresión Error Total
Tabla 2.8 Cálculo de análisis de varianza SC GL CM b1 Y1 X 1i b2 Y2 X 2 i
2
i
2
N 3
2 Yi
N 1
SC / GL
R² =
Fo
SC / GL / 2
b1 Y1 X 1i b2 Y2 X 2 i / Yi 2
Puede demostrarse ahora que bajo el supuesto de que los εi distribuidos normalmente y de que la hipótesis nula b1=b2=0, la variable. La aplicación práctica de la regresión tiene por objeto esencial el incremento de los grados del modelo, el alizamiento exige realizar calculas precisos. Para estimar los parámetros:
Y , bo , b1 , b2 ,..., b11 , b22 ,..., b12 ,..., b13 78
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Para obtener los coeficientes aplicamos las matrices aquí detalladas, FUNCIÓN MATEMÁTICA: DISEÑO FACTORIAL 22 Y
Y1 Y2 Y3 Y4
1 1 1 1 4
Y
X1
X2
X 12
X 22
X1 X 2
X 1Y
X 2Y
+ +
+ +
1 1 1 1 4
1 1 1 1 4
+ +
+ +
+ +
X 1Y
X 2Y
Nbo
b1 X 1
b2 X 2
Y
X 1bo X 2 bo
b1 X
b2 X 1 X 2
X 1Y
b2 X
X 2Y
2 1
b1 X 1 X 2
Ejemplo 2.27 Evalué los datos 4bo = 300 4b1 = 30 4b2 = 10
2 2
Y 65 80 70 85 Σ 300
bo = 75 b1 = 7,7 b2 = 2,5
X1Y - 65 + 80 - 70 +85 Σ 30
X2Y - 65 - 80 + 70 + 85 Σ 10
Resultando el modelo
SCtotal 9,32 9,42 ... 102 10,22 153,4 /16 1,18 2
FUNCIÓN MATEMÁTICA: DISEÑO FACTORIAL 23 Y
Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y
1 1 1 1 1 1 1 1 8
Nbo X 1bo X 2 bo X 3bo
X1
X2
X3
X 12
X 22
X 32
X 1Y
X 2Y
X 3Y
+ + + +
+ + + +
+ + + +
1 1 1 1 1 1 1 1 8
1 1 1 1 1 1 1 1 8
1 1 1 1 1 1 1 1 8
+ + + +
+ + + +
+ + + +
X 1Y
X 2Y
X 3Y
b1 X 1 b1 X 12 b1 X 1 X 2 b1 X 1 X 3
b2 X 2 b2 X 1 X 2 b2 X 22 b2 X 2 X 3
b3 X 3 b3 X 1 X 3 b3 X 2 X 3 b3 X 32
Y X 1Y X 2Y X 3Y
79
Palacios C. Severo
Ejemplo 2.28 Evalué los datos 8bo = 548,74 8b1 = - 0,86 8b2 = 4,24 8b3 = - 2,48
Y 68,72 69,06 69,44 67,75 67,93 68,73 68,72 68,39 Σ 548,74
bo = 68,59 b1 = - 0,11 b2 = 0,53 b3 = - 0,31
X1Y
X2Y
X3Y
- 0,86
4,24
- 2,48
el modelo es:
Y 68,59 0,11X 1 0,53 X 2 0,31X 3 FUNCIÓN MATEMÁTICA: DISEÑO HEXAGONAL Y
Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y
1 1 1 1 1 1 1 1 1 9
X1
X2
X 12
0
0
3
X 22
X 14
X 24
X 12 X 22
2,9
2,3
2,3
0,75
X 12Y
X 22Y
X 1Y
X 2Y
X 1 X 2Y
Σ
Σ
Σ
Σ
Σ
Para mayor detalle ver el tópico de Diseño Hexagonal. FUNCIÓN MATEMÁTICA: DISEÑO COMPUESTO CENTRADO DE DOS FACTORES X1
Y
Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 Y11 80
1 1 1 1 1 1 1 1 1 1 1
X2
X 12
X 22
X 12Y
X 22Y
X 1Y
X 2Y
X 1 X 2Y
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Y12 Y13 Y
1 1 13
0
Problemas
0
8
8
Σ
Σ
Σ
Σ
Σ
(97) Se dan los datos correspondientes al tiempo de secado de cierto barniz y a un aditivo que reduce el tiempo de secado, al aplicarlo sobre un producto que es novedoso. Barniz Secado
0 12
1 10,5
2 10
3 8
4 7
85 3 42 3
59 4 59 4
5 8
6 7,5
7 8,5
8 9
(98) Se realiza un tratamiento a un cierto tipo de aleación, requiriendo cierta fuerza de ruptura, dicho producto es una pieza como parte de un componente de autopartes. Fuerza Aleación Fuerza Aleación
38 1 31 1
48 2 35 2
40 1 18 1
60 2 34 2
68 3 29 3
53 4 42 4
(99) Los datos corresponden al tiempo que tardan diez técnicos en ensamblar computadoras por las mañanas, los cuales trabajan 8 horas como jornada laboral. Tiempo Maquina
11,1 10,9
10,3 14,2
12,0 13,8
15,1 21,5
13,7 13,2
18,5 21,1
17,3 16,4
14,2 19,3
14,8 17,9
(100) Al problema (98) adicione otra aleación siendo los datos: Aleación Aleación
5 15
5 15
5 15
5 15
10 20
10 20
10 20
10 20
(101) Al problema (99) adicione los datos de trabajo en la tarde Tarde
9,6
15,1
12,6
24,5
12,8
22,1
15,6
15,3 19,0
21,6
16,9
20,6
(102) Un gerente de ventas tiene la responsabilidad de seleccionar nuevos vendedores. Con el fin de lograr una mejor selección posible de un grupo de aspirantes, diseño un test. Su objeto era predecir el volumen de ventas de un individuo sobre la base del puntaje. Sin embargo para determinar si existía alguna relación entre su test y las ventas pidió a varios vendedores antiguos que se sometieran al test. En la tabla se registran los puntajes de sus respectivos test y sus ventas semanales. Vendedor Nataniel Alberto Hugo Emilio Carlos
Test 3 4 2 3 4
a) Cuál es la variable dependiente
Venta semanal 5 7 4 6 4
81
Palacios C. Severo b) Represente gráficamente con las variables independientes y dependientes. c) Determine la ecuación de la recta. d) Si Nataniel es un aspirante al puesto a vendedor. Obtuvo 3 puntos en el test, sobre la base de la ecuación de regresión. ¿Cuál será la cifra de sus ventas semanales medias según pronóstico? e) Obtenga el coeficiente de correlación e interprete. (103) Supongamos que una ecuación de regresión múltiple es: Y 16,18 0,06 A 21,18B 2,14C 3,47D 0,7 E Qué significa el coeficiente 3,47 Qué significa cada uno de los coeficientes de los factores Qué significa 16,18 en la ecuación de regresión Si todos los factores se hacen cero cual es el valor inicial con que se empieza el desarrollo de la ecuación de regresión. (104) Interprete un coeficiente de correlación igual a 0,99 0,98 0,88 0,79 0,67 0,56 0,45 -0,89 -0,78 -0,06
82
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
§3 PRINCIPIOS DE DISEÑO EXPERIMENTAL (...) Demostrar que la realidad nos pasa delante de los ojos como un relato, en el que hay diálogos, enfermedades, amores, además de estadísticas y discursos. Tom Wolfe
I.
INTRODUCCIÓN
Diseñar estadísticamente un experimento, es realizar una prueba o
una serie de pruebas, buscando caracterizar las variables o factores de mayor influencia en un ensayo de interés, evaluado a través de varias variables respuesta tal que, si deliberada o sistemáticamente se introducen cambios controlados en algunas de las variables explicativas del proceso, siempre sea posible observar o cuantificar los cambios que éstos generan en las variables respuesta buscando adicionalmente, minimizar el efecto de las variables no controlables, procurando con ello estabilizar y minimizar la variabilidad de las respuestas. Aunque la aplicación o uso del diseño experimental se da en cualquier área del conocimiento, este debe cumplir las siguientes fases: 1.
Caracterización de un proceso. En esta fase, se busca determinar los rangos de las variables o factores controlables de mayor influencia en las variables respuesta que a la vez minimizan el efecto de las variables no controlables (factores o variables). 2. Depuración y optimización de un proceso ya caracterizado. En esta fase se hallan los niveles de los factores estudiados que proporcionan la respuesta óptima a la solución del proceso caracterizado en la fase anterior.
83
Palacios C. Severo En cualquier aplicación de la estadística en el diseño y análisis de un experimento, es necesario que quienes lo desarrollen entiendan claramente el problema objeto de estudio, que posean un amplio conocimiento del material experimental a usar, que conozcan las posibilidades existentes para procesar los datos y además posean el conocimiento estadístico necesario para interpretar adecuadamente los resultados del experimento. II.
TIPOS DE EXPERIMENTOS
Se clasificó los experimentos como pertenecientes a dos tipos. a) El experimento absoluto en el cual el interés principal es la estimación y las propiedades físicas de la población a ser estudiada. Estas propiedades se esperan que sean constantes, de acá el término absoluto. En estos experimentos un factor singular es estudiado frecuentemente para examinar un número reducido de niveles de un factor. La selección de los tratamientos se hace generalmente mediante procesos aleatorios, por tanto, si el experimento puede ser repetido, el mismo grupo de tratamientos no necesariamente será utilizado. Por esta razón, el tratamiento es considerado una variable aleatoria y el modelo señalado es un modelo de efectos aleatorios o Modelo II, bajo el cual se detectan y estiman componentes de variación asociada a una población compuesta. b) El experimento comparativo. Frecuentemente cuando se estudia un grupo de tratamientos, los resultados absolutos varían erráticamente mientras que los resultados relativos permanecen razonablemente estables. En tales situaciones es posible establecer, que en circunstancias similares se espera que ciertos tratamientos sean sustancialmente mejores que otros. En tales campos de la experimentación, los experimentos tienden a ser comparativos y tienen un interés secundario dado por los resultados absolutos. La teoría estadística del diseño de experimentos se relaciona inicialmente con este tipo de experimentos. Los experimentos comparativos son básicamente experimentos en los cuales los tratamientos se comparan por sus efectos medios sobre una variable respuesta con el objeto principal de determinar cuál de ellos es mejor en algún sentido. El propósito de este tipo de experimento es proveer información necesaria para tomar decisiones administrativas satisfactorias. La principal característica de este tipo de experimentación es que todos los tratamientos de interés están incluidos en el expe84
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería rimento. Consecuentemente, la estructura matemática básica es el modelo de efectos fijos ya que bajo experimentos repetidos se seleccionarían los mismos tratamientos. En este caso, es de interés la detección y estimación de relaciones constantes entre las medias del universo de objetos considerados, Para estos modelos, el interés primordial es probar varias hipótesis relacionadas con las medias de los tratamientos. El experimento comparativo comienza con un planteamiento exacto del problema a ser resuelto. Esto es, se debe hacer una especificación detallada de los objetivos del experimento con una formulación precisa de la hipótesis a probar. Es insuficiente solamente establecer en forma simple comparar estos tratamientos. Esta especificación define la población a la cual las conclusiones serán aplicadas, determina los factores, tratamientos y sus niveles, especifica las variables respuesta a ser medidas y establece las diferencias críticas a ser detectadas. Sin estas especificaciones, ningún experimento podrá ser diseñado adecuadamente. Como lo fundamental en la decisión sobre las hipótesis son los experimentos planeados, es necesario que se tenga en cuenta las siguientes características generales para estos ensayos. 1.
Simplicidad: Acá se debe tener en cuenta que tanto la selección de los tratamientos como la disposición experimental deberá hacerse lo más simple posible. 2. Grado de precisión: El experimento deberá tener la capacidad de medir diferencias entre tratamientos con los grados de precisión que desee el investigador. Para cumplir con este propósito se deberá tener entonces un diseño apropiado y un número de repeticiones adecuado. 3. Ausencia de error sistemático: Se debe planear un experimento con el propósito de asegurar que las unidades experimentales que reciban un tratamiento no difieran sistemáticamente de aquellas que reciben otro, procurando de esta manera obtener una estimación insesgada del efecto de tratamientos. 4. Rango de validez de las conclusiones: Las conclusiones deberán tener un rango de validez tan amplio como sea posible. Los experimentos que contribuyen a aumentar éste rango son los experimentos replicados y los experimentos con estructuras factoriales. 85
Palacios C. Severo 5.
III.
Cálculo del grado de incertidumbre: En todo experimento existe algún grado de incertidumbre en cuanto a la validación de las conclusiones. El experimento deberá ser concebido de modo que sea posible calcular la posibilidad de obtener los resultados observados debidos únicamente al azar. UNIDADES EXPERIMENTALES Y MUÉSTRALES
El elemento básico en los experimentos comparativos es la unidad experimental. Este concepto se usará en la siguiente definición. Los elementos sobre los cuales se hacen las mediciones y a los cuales un tratamiento puede ser asignado independientemente se denomina unidad experimental y al conjunto de unidades experimentales se les denomina material experimental. Cada unidad experimental contiene una o más unidades muéstrales en las cuales las condiciones experimentales planeadas previamente se realizan. Ejemplo 3.29 a) En un experimento agrícola para evaluar el rendimiento de algunas variedades de olivo, la unidad experimental puede ser una porción de terreno de tamaño óptimo preestablecido, usualmente denominada parcela, o un número de plantas o un número de mazorcas. b) En un estudio farmacéutico, un paciente sometido a un tratamiento de un fármaco puede ser considerado como una unidad experimental. c) En un trabajo de plaguicida la unidad experimental puede ser un insecto, una colonia o toda una especie. En general la definición de la unidad experimental depende de los objetivos de la investigación. Por definición, las unidades experimentales deben estar en capacidad de recibir diferentes tratamientos. En la conducción del experimento existen dos grupos de variables. 1) Las variables respuestas que proporcionan las mediciones del experimento, las cuales varían debido a la diversidad presente entre las unidades experimentales. 2) Las variables explicativas que influyen en las respuestas y que se denominan factores. Entre estos existen los denominados factores de clasificación que según sus valores definen los niveles de clasificación sobre los cuales se hace la inferencia. 86
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Por su naturaleza las unidades muéstrales de la misma unidad experimental deben recibir el mismo tratamiento, consecuentemente la asignación del tratamiento a estas unidades muéstrales no es independiente. Esta distinción es importante dado que para hacer inferencia sobre los efectos del tratamiento, se requiere tener un conocimiento de la estimación de la variabilidad inherente al material experimental, esta variabilidad es conocida como el error experimental. Esta estimación es dada por la variación entre unidades idénticamente tratadas las cuales inicialmente pudieron haber sido tratadas de manera distinta. Solo la unidad experimental considerada como un todo satisface este requisito. La variación entre las unidades experimentales provee una estimación del error experimental. En general, la variación entre unidades muéstrales dentro de las unidades experimentales es un valor muy pequeño al calcular los errores de estimación de los efectos del tratamiento. IV.
FUENTES DE VARIACIÓN
Los tratamientos se asignan a las unidades experimentales para determinar si tienen un efecto sobre la respuesta de interés. Cualquier efecto podrá resultar en diferencias sistemáticas de respuesta entre unidades experimentales. Será obvio que para detectar estas diferencias, las unidades experimentales deberán ser lo más homogéneas posibles; esto es, que la variación entre unidades experimentales uniformemente tratadas va a ser menor en relación con las diferencias de tratamiento. Si esto no ocurre, la variación de las unidades experimentales pueden resultar en un fracaso para encontrar diferencias de tratamientos; los cuales van a ser importantes para la investigación. Desafortunadamente, las unidades experimentales generalmente no serán homogéneas porque, ellas poseen diferentes propiedades físicas inherentes para una o más características. Frecuentemente detrás del control del experimentador, estos factores inherentes causan diferencias sistemáticas entre las unidades experimentales creando fuentes de variación no deseadas. Estas fuentes son de escaso interés práctico y no están relacionadas con el estudio. Por esta razón, se conocen como fuentes extrañas de variación. No es necesariamente cierta que todas estas fuentes de variación sean conocidas por el experimentador. Sabemos que estos factores pueden ser usados para clasificar las unidades experimentales en subgrupos más homogéneos, aunque también 87
Palacios C. Severo son conocidos como factores de clasificación, hasta tanto ellos sean de interés para el experimentador. Mientras el error experimental es una variación aleatoria, no toda variación aleatoria es error experimental. La variación entre unidades muéstrales dentro de las unidades experimentales es también una variación aleatoria, pero, no debe dársele mucho valor al juzgar los efectos de los tratamientos. Los tratamientos son parte de la estructura de la unidad experimental y hay una diferencia básica entre la clasificación y los factores de tratamiento. Los factores de clasificación son propiedades inherentes a la unidad experimental y solo raramente pueden ser cambiados por el experimentador. Cada combinación específica de niveles de factores se denomina tratamiento. Ejemplo 3.30 Se planea un experimento para evaluar el rendimiento de un tubérculo en función del tipo de variedad V1, V2 y V3 y los nutrientes N y P a los niveles (10; 30) y (20; 40) respectivamente. Los posibles 12 tratamientos VNP son: (V1 ,10,20) (V2 ,10,20) (V3 ,10,20) (V1 ,30,20) (V2 ,30,20) (V3 ,30,20) (V1 ,10,40) (V2 ,10,40) (V3 ,10,40) (V1 ,30,40) (V2 ,30,40) (V3 ,30,40)
El concepto de tratamiento implica que: 1.
Cualquier unidad experimental esta en capacidad de recibir cualquier tratamiento. 2. La asignación de tratamientos a la unidad experimental esta bajo el control del experimentador. Bajo esta definición, en un experimento que compare medicamentos por ejemplo, el género nunca podrá ser considerado como un factor (tratamiento). El género de un sujeto particular es una propiedad intrínseca del sujeto que no podrá ser asignado al experimentador. Los medicamentos, sin embargo, constituyen un tratamiento dado que a cada sujeto incluido en el estudio (unidad experimental) se le puede asignar un medicamento. 88
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería La distinción entre tratamiento y factores de clasificación no es absoluta. Estos tratamientos serán aplicados a muestras de madera con superficies ásperas o suaves. La superficie de madera no representa un factor tratamiento a menos que el experimentador pueda especificar los tipos de superficies de las piezas. Así, si el experimentador tiene una oferta de pedazos ásperos de madera y puede decidir cuales son suaves, entonces el tipo de superficie será un factor tratamiento. Si el tipo de superficie es una propiedad intrínseca de las especies maderables elegidas, entonces será un factor de clasificación. Como afirman Cochran y Cox (1957), los tratamientos deben tener las siguientes particularidades: 1.
Presentar la finalidad, es decir si pretende simplemente mostrar al ganador entre los diferentes tratamientos o si además se desean encontrar indicios acerca del comportamiento de los tratamientos. Un caso particular, es el ensayo con un fertilizante compuesto de dos sustancias A y B principalmente. El resultado no muestra si la efectividad del fertilizante se debe a alguno de los dos componentes o a los dos conjuntamente. Será necesario un experimento más extenso, con tratamientos adicionales que den luces sobre éste hecho. Si el propósito es encontrar el mejor de los tratamientos prácticos, entonces ciertos tratamientos pueden omitirse por su no practicidad. 2. La respuesta en algunos casos, puede deberse a las condiciones bajo las cuales se aplica un tratamiento dependiendo del medio circundante a este, tal vez habrá un favorecimiento en su efecto sobre las unidades experimentales. Esta situación es muy frecuente en trabajos con sustancias químicas aplicadas sobre suelos, en los que su efecto sobre las plantas se ve comprometido con los componentes del terreno, o de las plantas mismas. Luego debe decirse si habrá controles sobre el terreno, por ejemplo homogenizando el suelo mediante la aplicación de estos componentes en cantidades considerables (estas decisiones se toman previo un análisis de suelos). No se debe perder de vista la población sobre la cual se desea hacer inferencia, porque un procedimiento como el descrito, tal vez cambie la población objetivo. 3. Los tratamientos propuestos, generalmente no son los que en la práctica se prueban. Por desconocimiento, por descuido, por materiales, instrumentos, etc., se obtienen tratamientos diferentes a los de interés. Un caso muy común es cuando un tratamien89
Palacios C. Severo to está definido para ser aplicado de una forma específica y resulta aplicándose de otra; por ejemplo una sustancia para controlar plagas, la cantidad aplicada puede ser alterada, o el momento de su aplicación puede ser diferente. Aquí, de una parte se ha modificado la dosis, y de otra, el tiempo hace que los animales a controlar estén posiblemente en una etapa de su desarrollo diferente a la prevista. Siendo extremistas, se puede afirmar que la mayoría de los tratamientos en el acto no corresponden a la definición original; por más cuidado que se tenga en mantener una cámara de muchas temperaturas, se procura naturalmente, que estas estén muy cerca de 20oC durante el ensayo, por ejemplo. 4. En muchos experimentos se presenta la necesidad de un tratamiento testigo o control. Este término se refiere a un tratamiento en el que no se tiene un interés particular, pero puede servir de comparación para revelar si los demás tratamientos son efectivos. Se recomienda la inclusión de un testigo cuando las condiciones físicas, químicas, ambientales, etc., donde se apliquen los tratamientos enmascaran la relevancia de éstos; por ejemplo, el caso donde la fertilidad de un terreno sea muy alta tenderá a esconder el efecto del nutriente adicional. Otras situaciones se presentan en animales, en los cuales sus rasgos genéticos, condiciones fisiológicas o morfológicas, no revelarán claramente la efectividad de las dietas en la ganancia de peso. Otra justificación para la consideración de un testigo suele ser cuando existe un desconocimiento muy alto acerca de la efectividad de los tratamientos objetos de estudio. V.
CONTROL DE LA VARIACIÓN DEL NO TRATAMIENTO
Para hacer valida la comparación entre tratamientos, se deben separar los efectos de fuentes extrañas de variación de los efectos de tratamientos y de la estimación del error experimental. Si esto no se puede hacer, se obtendrán estimaciones sesgadas tanto de las diferencias de tratamientos como del error experimental. Lo que se necesita son métodos a través de los cuales la variación debida a fuentes distintas a los tratamientos sea controlada, de tal forma que los efectos de tratamiento puedan ser estimados en forma segura y adecuada. Los métodos que hacen esta distinción, están referenciados en forma conjunta como control del error.
90
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería El objetivo principal de estos métodos, es obtener un estimador insesgado del error experimental resultante de mejorar la precisión asociada con la estimación de diferencias de tratamiento. Estos métodos pueden ser técnicos (experimentales) o estadísticos. Los métodos técnicos son aquellos impuestos por el experimentador. Selección de más unidades experimentales homogéneas. Esto incluye hacer condiciones ambientales más uniformes para mantener las variables potenciales constantes. El criterio para la selección del material deberá ser el de obtener el máximo beneficio con unos recursos dados (generalmente escasos). Sin embargo, el experimentador esta limitado a la disponibilidad de material con el cual debe realizar el estudio, aunque tenga pocas alternativas de elección en la unidad experimental a ser usada. Consecuentemente, el uso de más unidades experimentales homogéneas no siempre es posible. Las unidades experimentales deben ser lo más representativas de la población para la cual el experimento va a sacar conclusiones. Por esta razón, controlando experimentalmente algunos factores extraños y manteniéndolos constantes en algún valor específico puede seriamente limitar la aplicabilidad de los resultados experimentales. La técnica experimental es responsabilidad del experimentador y debe ser siempre examinada para asegurar que esta sea lo más precisa posible. En la mayoría de ocasiones, la variabilidad asociada con una técnica determinada es relativamente pequeña, y hasta ahora solo se ha podido obtener un muy limitado mejoramiento en la precisión del experimento. Hay casos, donde los errores de técnica aumentan considerablemente la variabilidad. Tales errores deben prevenirse pero no sobredimensionarse. Las técnicas estadísticas son métodos que deben obtener ventajas de las características de las unidades experimentales (diseño experimental) y cuando hay información disponible adicional de tipo cuantitativo o cualitativo se tienen más ventajas. Una función básica de los diseños de experimentos es la de reducir la necesidad de control exacto del ambiente experimental, dado que el control de dichos factores es costosa y tediosa. Es a través del diseño de experimentos que las fuentes conocidas de variabilidad se controlan. Esto se consigue arreglando las unidades experimentales en subgrupos más homogéneos conocidos como bloques los cuales están basados en valores comunes de los factores de clasificación. Haciendo esto, algunas de las variaciones naturales entre unidades experimentales son asociadas con otro factor 91
Palacios C. Severo cuya contribución a la estimación del error experimental puede ser eliminada. En muchos experimentos la precisión de la comparación de tratamientos puede ser aumentada usando variables concomitantes y/o auxiliares, este tipo de análisis, conocido como el análisis de varianza se recomienda usar cuando la variación entre unidades experimentales es, en parte, debida a la variación en algún otro carácter medible no suficientemente controlable, para ser usada en la asignación de unidades experimentales a los bloques sobre las bases de resultados similares. Frecuentemente, la agrupación de estas variables cuantitativas en bloques, construidos a partir de rangos de valores no es efectiva ya que la variación dentro de bloques puede ser más grande. Más aún, se puede requerir mucho más grados de libertad para controlar este factor. Este aumento de los grados de libertad puede ser usado para estimar el error experimental. El control estadístico a través del uso del bloqueo y/o el análisis de la varianza elimina la variación debida a fuentes extrañas conocidas. Es a través de la aplicación de la aleatorización, como las fuentes de variación desconocidas para el experimentador pueden ser controladas. El concepto de aleatorización y su función se discuten mas adelante. Como última consideración, el incremento en la repetición, no reduce el error de la varianza, pero mejora la precisión de las estimaciones dado que el error estándar se disminuye proporcionalmente a la raíz cuadrada del tamaño de la muestra. Este incremento en la cantidad de reducción que debe realizarse aumentando las replicaciones, solo deberá realizarse cuando todas las demás opciones han sido eliminadas y la precisión deseada no ha sido obtenida. VI.
PROPIEDADES DEL DISEÑO ESTADÍSTICO
Finney (1955) establece que por el diseño de experimentos se entiende: a) Especificaciones de las unidades experimentales a las cuales los tratamientos han sido aplicadas. b) Especificaciones de mediciones que pueden ser tomadas en cada unidad experimental. Selección de un grupo de tratamientos para comparación. Mientras la responsabilidad principal es del experimentador, la estadística contribuye respecto a la elección óptima de las combinaciones de tratamien92
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería tos a ser usadas, por ejemplo, en un experimento factorial fraccionado o en la exploración de superficies de respuesta. Esto se conoce como un diseño de tratamientos. La asignación de los tratamientos a las unidades experimentales (aleatorización), esto es lo que caracteriza el diseño estadístico de experimentos. El diseño estadístico de experimentos es esencialmente el plan para poner a funcionar el experimento, especificando el arreglo de las unidades experimentales en el tiempo y/o espacio y el patrón de observaciones que van a reportar información. El diseño, por lo tanto, es una secuencia compleja de etapas tomadas para garantizar que los datos serán obtenidos de la forma que permitan un análisis objetivo, soportado en inferencias válidas respecto al planteamiento del problema, el cual debe ser lo más preciso posible y además viable económicamente. El diseño de un experimento es una función importante, dado que ninguna técnica estadística puede revelar información no implícita inicialmente en los datos. Para cualquier grupo de datos, el análisis apropiado de los mismos es determinado por el diseño de experimentos. La habilidad, por lo tanto, de obtener un análisis significativo se basa inicialmente en la forma en que se han recolectado los datos. Un buen diseño experimental, es aquel que proporciona la información requerida con el mínimo esfuerzo experimental. Muchos criterios han sido propuestos para contar con un experimento estadísticamente válido. En general, los requisitos estadísticos para el buen diseño de experimentos son:
Proveer estimaciones insesgadas para los efectos del tratamiento. Hasta donde es posible la comparación de tratamientos deben estar libres de sesgos sistemáticos. Es la comparación de tratamientos el interés principal, por lo tanto es de primordial importancia que estas comparaciones reflejen diferencias debidas a los tratamientos, y no a las diferencias inherentes a las unidades experimentales. Es importante que el experimento este diseñado para asegurar que las unidades experimentales que reciban un tratamiento especifico no difieran de otros tratamientos. 93
Palacios C. Severo
Requerir que la precisión asociada con la estimación de efectos este de terminada al mismo tiempo que las estimaciones mismas. En este sentido, el experimento esta auto contenido. Para esto, debe haber una medición del error experimental. Esta estimación es necesaria para asegurar la significancía estadística de las diferencias de tratamientos. Si esta estimación no es insesgada, se presentará una pérdida de eficiencia del experimento lo cual conllevara a un desperdicio de tiempo, materiales y dinero. Si el experimento no provee una estimación del error experimental, será necesario usar una estimación de un experimento previo. La validez del procedimiento se basa en el hecho que la magnitud del error experimental deberá permanecer invariante desde el último experimento (un supuesto que frecuentemente es insostenible).
Las comparaciones de tratamientos, deben de ser lo suficientemente precisas para detectar las mínimas diferencias de importancia práctica para el investigador. Cuando se comparan tratamientos, si existen unas mínimas diferencias esto proveerá una ganancia real. Así, si un tratamiento debe ser cambiado por otro, este debe ser mejor, aunque sea por una mínima diferencia. Claramente el experimento deberá tener suficiente precisión para detectar tales diferencias o de lo contrario no tiene sentido realizarlo. La precisión de un determinado experimento dependerá de: 1.
La variabilidad intrínseca del material experimental y de la precisión del trabajo experimental. 2. La cantidad de replicaciones del tratamiento, y 3. El diseño del experimento. Las conclusiones tienen un rango amplio de validez. Las condiciones encontradas en la práctica, nunca serán exactamente las obtenidas cuando se lleva a cabo el experimento. Deben procurarse que las conclusiones sobre los resultados del experimento se hagan sobre condiciones similares del experimento. Si las conclusiones se aplican, deberá haber confiabilidad de que las condiciones donde se apliquen sean similares. Cumpliendo esto el experimento debe tener un rango amplio de validez. Entre más amplio sea el rango de condiciones investigadas en el experimento, mayor será la confiabilidad de estas conclusiones cuando no cumplan las condiciones de homogeneidad, en aquellos casos donde las condiciones sean algo distintas. 94
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Se debe tener cuidado, para verificar que la organización del experimento no se torne muy compleja y tener en cuenta además que si un grupo de tratamientos no es investigado totalmente, no se podrán obtener conclusiones significativas. El diseño debe ser lo más simple posible para alcanzar los objetivos del experimento. La selección del diseño depende de la naturaleza de las fuentes de variación en el material experimental. Se debe elegir el diseño más simple posible que permita controlar adecuadamente la variabilidad conocida. A medida que el diseño experimental se torna más complejo, hay una menor flexibilidad haciendo difícil la organización lo cual puede llevar a cometer errores cuando se realiza el experimento. Entre más simple el diseño, más fácil será llevar a cabo ajustes por las equivocaciones que siempre suelen aparecer. Una consecuencia general de los experimentos comparativos es que puede conducir a decisiones administrativas, mientras es verdad que la hipótesis nula para igualdad de efectos de los tratamientos siempre será rechazada dados determinados recursos, se debe recordar que el manejo de la no significancía implica equivalencia. Algunas acciones deberán tomarse siempre sobre la base de los resultados obtenidos; bien sea, mantener todo tal cual o cambiar por un nuevo tratamiento. Las decisiones diarias son un proceso de dos etapas: 1.
Examen (análisis) de las probabilidades asociadas a los datos estimados con las conclusiones (acción estadística). 2. Basados en estos resultados, se toma la decisión para implementar una acción (decisión de gestión). El trabajo del estadístico es el de presentar las probabilidades de la primera etapa lo más acertadamente posible para lograr minimizar el número de decisiones incorrectas a tomar en la segunda etapa. Un buen diseño de experimentos puede ser obtenido al aplicar los principios básicos establecidos por Fisher (1935). Ellos son: 1.
Replicaciones de algunos o todos los tratamientos para estimar la magnitud del error experimental. 2. Aleatorización de los tratamientos a las unidades experimentales para tener así una estimación válida del error experimental 95
Palacios C. Severo así como estimaciones insesgadas de los efectos de los tratamientos. 3. El uso del control local de fuentes de variación extrañas conocidas a través del uso de sub-grupos homogéneos de unidades experimentales. En el diagrama de Fisher, según las condiciones del experimento, se escoge el diseño experimental, se formula un modelo lineal apropiado y se lleva a cabo el análisis estadístico basado en la escogencia del diseño y del modelo.
Diagrama de Fisher Principios de la experimentación
Para mayor claridad se lleva a cabo en las siguientes secciones una explicación más amplia de estos principios. VII. REPLICACIÓN Es el proceso de repetir en condiciones similares el experimento para cada tratamiento se denomina replicación. Cuándo el número de replicaciones es igual para todos los tratamientos el diseño se denomina balanceado, en caso contrario se dice que es desbalanceado. Un número adecuado de replicaciones permite al experimentador obtener una estimación del error experimental. La replicación es la asignación del mismo tratamiento a más unidades experimentales, o sea que hace referencia al número de unidades experimentales de cada tratamiento, no al número de observaciones. El propósito de la replica es proveer una estimación del error experimental. Se obtiene de comparar unidades experimentales tratadas igual pero que antes del experimento tenían la oportunidad de ser tratadas de manera diferente. Las múltiples mediciones tomadas en una unidad experimental no satisfacen esta definición, dado que esto no es replicación; las repeticiones reducen la variación asociada con mediciones 96
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería y/o errores muéstrales, pero no proveen ninguna información relacionada con los errores experimentales. Además de proveer una estimación de error experimental, las replicaciones aportan la precisión del experimento al reducir el error estándar asociado con la comparación de tratamientos. Esto se desprende del hecho que la varianza de la media disminuye inversamente proporcional a la raíz cuadrada del número de replicas. Esto provee una forma para controlar el tamaño de la varianza del error. A pesar de que el incremento en el número de replicaciones da precisión a las estimaciones, éstas no se pueden incrementar indefinidamente. Un punto para su disminución se alcanza cuando el incremento en los costos de la experimentación no es compensado con una reducción en la varianza. Cuando el número de replicas se torna demasiado grande, y las diferencias entre tratamientos detectadas son demasiado pequeñas, la importancia práctica que resulta es una pérdida de recursos valiosos. Las replicaciones también proveen formas para incrementar el rango de las condiciones estudiadas en el experimento. No hay requisitos para que las replicaciones sean adyacentes en tiempo o espacio, dado que cuando se usan conjuntamente con el control local se puede investigar un mejor rango de condiciones experimentadas. VIII. ALEATORIZACIÓN La aleatorización es fundamental para que el diseño de un experimento sea válido. Es el procedimiento que permite que cada unidad experimental tenga iguales condiciones para recibir cualquier tratamiento. Esto no significa que el experimentador podrá escribir como quiera la identificación de tratamientos (nombres o símbolos) en el orden que se le ocurra. La aleatorización es un proceso físico que asegura que cada tratamiento tenga igual probabilidad de ser asignado a cualquier unidad experimental. Este es el punto en el cual, el procedimiento experimental con las leyes de azar son explícitamente introducidas. De acuerdo con Brownlee (1957) una de las principales contribuciones que el estadístico puede hacer es insistir en la aleatorización del experimento. La aleatorización es necesaria ya que provee las bases para obtener un tests válido de significancía al destruir cualquier sistema de corre97
Palacios C. Severo lación que pueda existir entre las unidades experimentales. Un supuesto valido que resalta el análisis de varianza es que los errores experimentales son independientes. Es bien sabido que los errores asociados con las unidades experimentales adyacentes en tiempo y/o espacio están correlacionados. Una correlación positiva entre las unidades experimentales va a tener una mayor varianza del tratamiento que si las observaciones fueran independientes. Consecuentemente la probabilidad del error tipo I será mayor que el valor preestablecido. Con una correlación negativa, los efectos son opuestos a aquellos con una correlación positiva. Con la asignación de tratamientos al azar con las unidades experimentales, posiblemente sujetas a las restricciones, el efecto de la correlación se disminuye entre las unidades experimentales. La aleatorización no hace que los errores sean independientes pero asegura que, en promedio, las correlaciones sean cero. Como resultado, los datos pueden ser analizados si el supuesto de independencia de los errores es verdadero. Una segunda función de la aleatorización es la de proveer medios para evitar sesgos en la estimación del error experimental y los efectos de tratamiento. La estimación del error experimental se obtiene comparando las unidades experimentales tratadas de manera similar. Para que esta estimación sea válida, es necesario garantizar que las unidades experimentales tratadas de manera similar no sean diferenciables de manera relevante de las unidades experimentales tratadas de manera distinta. La forma de asegurar que la estimación del error sea válida se obtiene realizando una asignación aleatoria de los tratamientos. La aleatorización también provee estimaciones insesgadas de los efectos de tratamiento al controlar los efectos de fuentes de variación desconocidas. Esto provee la seguridad de haber asignado adecuadamente estas fuentes de variación, las cuales deben ceñirse a normas donde el experimentador no tiene ni el tiempo ni el conocimiento para investigar, pero que de otra forma, podrán conducir a conclusiones erradas. Esta es la única forma de asegurar que la comparación entre tratamientos no sean sesgadas por un tratamiento que fue asignado de manera premeditada, para hacer mejores o peores algunas unidades experimentales. La aleatorización romperá cualquier patrón asociado con factores desconocidos de tal forma que ningún tratamiento será favorecido frente a los demás. La aleatorización nunca elimina la variación causada por factores extraños desconocidos, pero distribuye
98
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería sus efectos en promedio, equitativamente sobre todos esos factores extraños. Finalmente, la aleatorización es necesaria para abolir los sesgos personales, conscientes e inconscientes, de las personas que intervienen en el experimento, incluyendo al experimentador. La historia cuenta con un gran número de experimentos en Inglaterra sobre efectos de comida suplementaria para colegios de niños de distritos pobres que fueron inválidos porque la selección de los niños fue dejada en manos de los profesores. Parece ser que se les asignó el mejor suplemento a los niños más desnutridos. Hay un problema que aparece al aplicar la aleatorización cuando el número de unidades experimentales es muy pequeño. En estos casos es posible que los arreglos producidos por la aleatorización aparezcan al experimentador como bien, deseables o inaceptables. Por ejemplo, la secuencia:
XXXYYYZZZ Es apenas una forma de las 1670 secuencias posibles de tres tratamientos con tres replicas en el tiempo. Este patrón sin embargo, probablemente no será aceptado por la mayoría de experimentos. Tal relación sugiere, una falta de conocimiento por parte del experimentador. Youden (1964) sugiere tres formas para manejar esta dificultad, todas ellas, colocando restricciones a la aleatorización: 1) Incorporar al diseño de experimentos la condición que hace el arreglo inaceptable, esta sería la mejor forma para manejar el problema. Tal vez no sea práctico o deseable, sin embargo, para introducir estas futuras restricciones al diseño puede ocurrir que: a) Pierde grados de libertad en la estimación del error experimental debido a la eliminación de la otra fuente de variación que puede no estar completamente compensada. b) El experimento se vuelve más complicado, o c) Que se hayan usado hasta ahora distintos sistemas de agrupación. 2) Rechazar arreglos extremos cuando ellos ocurran y realeatorizar: el mayor problema aquí será el de determinar subjetivamente lo que es un arreglo extremo. Si esto se puede hacer, entonces esta será una solución más razonable. 99
Palacios C. Severo 3) Seleccionar un diseño al azar de un grupo predeterminado de arreglos aceptables. IX.
CONTROL LOCAL
Al proceso de clasificación de las unidades experimentales en grupos homogéneos, se le denomina Control Local. Ejemplo 3.31 Un ejemplo de control local en el ejemplo 3.30 puede ser controlar el nivel de fertilidad del terreno. Para esto se determinan unidades homogéneas de terreno llamadas bloques según el grado de fertilidad, cada bloque se subdivide en parcelas de igual área preferiblemente y sobre estas se aleatorizan los tratamientos buscando que cada unidad experimental reciba un único tratamiento y que la totalidad de los tratamientos estén en el bloque (caso de bloques completos). Una función primaria del diseño de experimentos es el de reducir el control exacto del ambiente experimental debido a que tal control es un hecho costoso y tedioso, y presume que todos los factores que influyen han sido identificados. La función principal del control local es la de eliminar los efectos de fuentes conocidas de variación extrema. El control se acompaña del bloqueo de las unidades experimentales. El bloqueo es un arreglo de unidades experimentales en grupos más homogéneos, basados en características comunes, de los factores de clasificación. Los tratamientos se asignan a las unidades experimentales, basadas en la estructura de bloques, así el uso de control local coloca algunas restricciones en la aleatorización de tratamiento a las unidades experimentales. Para alcanzar la máxima eficiencia con el bloqueo, es necesario el conocimiento relacionado con varios factores extraños que afectan las unidades experimentales, información que solo el experimentador puede proveer. El bloqueo a las unidades experimentales se debe hacer de tal manera que se asocien a fuentes asociadas de variación extrema con diferencias entre bloques, en este caso se debe cumplir que: 1) Una estimación más precisa del error experimental debe ser obtenida, puesto que la contribución de estos factores, extraños se eliminan, introduciendo además eficiencia al experimento debi100
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería do a que se podrán detectar menores diferencias entre los tratamientos y 2) Las comparaciones de tratamiento no serán sesgadas por diferencias en las unidades experimentales debido a los factores externos. La aplicación de control local (bloqueo) no remueve el requisito de aleatorización, solo impone restricciones al tope de aleatorización que se llevará a cabo. Para todos los diseños, la asignación aleatoria de tratamientos a las unidades experimentales dentro de los límites impuestos por el control local es esencial para poder tener así una interpretación válida de los resultados. La relación de los tres principios básicos de un buen diseño de experimentos es la clave de la estructura que provee una estimación del error experimental y a través de la aleatorización, se asegura la validez de las estimaciones y de las pruebas de significancía. La replicación también trae consigo una reducción de los errores de la estimación directamente por medio de la relación / n e indirectamente a través de la determinación de un sistema de control local. X.
CLASIFICACIÓN DE LOS DISEÑOS
El diseño de un experimento depende solamente de los supuestos relacionados con las propiedades de las unidades experimentales; esencialmente tales características, determinan las restricciones que deben ser colocadas al aleatorizar los tratamientos a las unidades experimentales, las cuales a su vez determinan el tipo de diseño experimental, los cuales pueden ser clasificados como: sistemáticos y al azar. Los diseños sistemáticos poseen un patrón regular para la asignación de tratamientos a las unidades experimentales. Las razones dadas para usar un diseño sistemático frecuentemente son: 1) Simplicidad, siendo extremadamente sencillo de aplicar. 2) Provee muestreo adecuado del material experimental. 3) Lleva a colocaciones inteligentes u ordenamiento natural de los tratamientos. 4) La aleatorización no es necesaria, dada que la heterogeneidad de las unidades experimentales por si solas aleatorizan los efectos de tratamientos. Las desventajas de los diseños sistemáticos son: 101
Palacios C. Severo
1) El arreglo de los tratamientos, puede combinarse con un patrón en variaciones no controladas que producen errores sistemáticos en la estimación de los efectos del tratamiento. 2) No hay una estimación válida de la varianza del error. En los experimentos al azar, la aleatorización elimina esta desventaja, esta es la razón para que estos experimentos sean de tanta importancia. Estos experimentos pueden ser subdivididos, de acuerdo con las siguientes restricciones: ninguna (irrestricto), única y múltiple. De acuerdo con las restricciones impuestas los diseños pueden ser clasificadas como completos e incompletos, dependiendo si los tratamientos ocurren con la misma frecuencia o no, dentro de cada restricción que se le impone al experimento que se ha definido. Los diseños de bloques incompletos serán clasificados después como balanceados o parcialmente balanceados, dependiendo de la varianza asociada con las comparaciones pareadas. Al seleccionar un diseño, se deberá elegir el más simple posible que satisfaga los requisitos del experimento elegido. Si ningún diseño conocido esta disponible para el análisis, este deberá ser construido. Un axioma básico es el de diseñar para el experimento y no experimentar para el diseño. Hay investigadores que piensan que la elección del diseño y/o tratamientos experimentales deberán ser limitados para aquellos que aparecen publicados en la literatura especializada, de esta forma se forzó innecesariamente al experimentador a modificar el experimento y ajustarlo al diseño conocido. Aún cuando un diseño estándar haya sido usado para determinar si los objetivos del experimento han sido logrados, siempre se hace necesario la verificación y su análisis estadístico. 1.
Sistemático. Los tratamientos son asignados a las unidades experimentales de acuerdo a algún patrón predeterminado. Tales diseños no proveen estimaciones válidas del error experimental. 2. Aleatorizados. La asignación de los tratamientos a las unidades experimentales depende de algún patrón de aleatorización. Solo para estos diseños, las técnicas de análisis de varianza son validas. a) Irrestrictos. La aleatorización no está restringida a ningún arreglo de las unidades experimentales. b) Restricción Única. La aleatorización se restringe a un único requisito determinado en el arreglo de las unidades experimentales. Estos son los diseños de bloques. 102
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
XI.
c) Balanceado. Se obtiene la misma precisión para cada par de comparaciones entre tratamientos. d) Parcialmente Balanceado. La precisión no es constante para cada par de comparaciones, pero depende de los tratamientos involucrados. e) Restricciones múltiples. La aleatorización se restringe a dos o más requisitos localizados en los arreglos de las unidades experimentales. La misma subclase general existe para estos diseños como en el caso de los diseños de bloques. ESTRATEGIA DEL DISEÑO
En la selección de un diseño experimental se debe tener en cuenta las características propias de la disciplina en donde se realiza; a pesar que los principios estadísticos son los mismos, las estrategias frecuentemente son distintas. La estrategia experimental depende del tiempo para realizar el experimento, el costo de la experimentación y la cantidad de variación en el material experimental, como así mismo el factor climático a la cual se someten los experimentos. El hecho de que no haya una única estrategia de experimentación, puede ser ilustrada por la comparación entre los experimentos agrícolas y los industriales. En general, los experimentos agrícolas: 1.
Requieren un tiempo más largo, frecuentemente meses, y en algunos casos se extienden hasta años, cuando se relacionan con cultivos perennes 2. Por ejemplo. Usualmente presentan una mayor variabilidad entre las unidades experimentales. Es casi imposible alterar o modificar estos experimentos una vez ha comenzado. Consecuentemente, el campo de la experimentación agrícola debe estar autocontenido, y así frecuentemente involucran diseños más amplios, comprensivos y complejos, de tal manera se puede obtener mucha información de cada experimento. Por el otro lado, la mayoría de experimentos industriales satisfacen que:
103
Palacios C. Severo 1.
La capacidad para realizar experimentos pueden ser muy rápidos, el tiempo de intervalo puede ser solo uno o unos pocos días inclusive horas, y 2. La variación natural entre las unidades experimentales es generalmente muy pequeña. Más aún la mayoría de la experimentación se hace secuencialmente, dado que los resultados están disponibles para su análisis antes de terminar el experimento. Como resultado, hay una gran flexibilidad. Como cada observación o grupo de observaciones están disponibles, la situación puede ser revisada antes de comenzar un próximo grupo de ensayos. Con base en los resultados, una decisión como que hacer luego permite hacer ajustes respectivos en el diseño de experimentos. Consecuentemente, se puede usar secuencias de experimentos más pequeños, y simples, esta es una ventaja. Box (1957) notó una paradoja interesante respecto al diseño de programas experimentales; el único tiempo en el cual el programa de experimentación puede ser diseñado adecuadamente es después de haber sido culminado. Es común encontrar en la culminación de un programa que: 1.
Una o más variables probablemente hayan sido omitidas del experimento. 2. Una o más variables originalmente incluidas en el experimento aparezcan con un pequeño efecto, por lo tanto no son tan importantes como se pensó al principio. 3. Un diseño experimental más complejo se necesita para solucionar adecuadamente los problemas. 4. Algunas transformaciones a las variables podrán ser apropiadas. La experimentación deberá involucrar indeterminaciones como el hecho que dos experimentadores, que estudian el mismo problema, tendrán la misma opinión relacionada con estos items. Si determinara una serie de normas sobre sistemas de experimentación rígidos que puedan abolir estas dificultades, tendrán como único resultado el sacrificio en el conocimiento del experimentador, su experiencia e imaginación. XII. DISEÑO DE TRATAMIENTOS 104
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Cada uno de los diseños que controlan el error mencionados en la tabla 3.9 se usa con el fin de comparar los tratamientos entre si. Sin embargo los tratamientos son seleccionados según alguna estructura, en particular una estructura factorial, la cual se refiere al diseño de los tratamientos. Estos se seleccionan de acuerdo a las metas ó intereses de la investigación, el material experimental y los factores disponibles. La escogencia de los tratamientos estará enmarcada dentro de un apropiado diseño que controle el error. Dentro de la estructura factorial de tratamientos se conocen dos clases. Las estructuras factoriales simétricas y las estructuras factoriales asimétricas. En la primera, se tienen k factores cada uno s niveles, donde s es un entero, en este caso se tienen sk tratamientos. En la segunda estructura, se tienen k1 factores con s1 niveles, k2 factores con s2 niveles, … km factores con sm niveles, el cual tiene en total t s1k1 s2k2 ...smkm mj1 s kj j tratamientos. Tabla 3.9 Efecto de diseño de control del error Factores de control del Tipo de diseño Caracterización diseño aleatorizado 0 Diseño completamente aleatorizado 1. Diseño Bloque Aleatorizado. 2. Diseño Bloque Aleatorizado generalizado Diseño en bloque 1 3. Diseño Bloque Incompleto aleatorizado 4. Diseño Bloque extendido 5. Diseño Bloque por franjas. 2
3 >3
Diseño cuadrado latino Diseño cuadrado latino replicado. Cuadrado grecolatino Cuadrado latino mutuamente ortogonales
1. Diseño cuadrado latino. 2. Diseño cuadrado latino incompleto 3. Diseño Cross - Over
Cuando se desea reducir el tamaño del experimento considerado por motivos muchas veces de tiempo y costos, se trabaja con un diseño de tratamientos factorial fraccionado. XIII. DISEÑO DE MUESTREO Lo más importante de un diseño de control del error con sub muestreo es la separación del error experimental y el error observacional (o de 105
Palacios C. Severo muestreo), o más precisamente, la separación de la varianza del error experimental y el observacional. La noción de sub muestreo puede obviamente ser extendida a más de un nivel, por ejemplo, para cada unidad experimental se puede tener algunas unidades muéstrales y luego para cada unidad muestral se pueden tener algunas unidades observacionales. XIV.
ESTUDIO EXPERIMENTAL
Para que el experimento sea exitoso, se deben tener en cuenta lo siguiente: 1) Conocimiento claro del material experimental. Aunque parezca obvio en la práctica, no siempre el desarrollo de un problema requiere de experimentación ni es simple presentar un claro y apropiado estado del problema. Es necesario abordar todas las ideas sobre los objetivos del trabajo. Un claro estado del problema frecuentemente contribuye a un mejor entendimiento del fenómeno y a una solución del problema. 2) Escogencia de factores y niveles. El experimentador debe seleccionar las variables independientes o factores a ser estudiados, estos pueden ser cuantitativos o cualitativos. En el caso cualitativo hay que tener en cuenta como se controlarán estos valores en los valores de referencia y como van a ser medidos. Es importante seleccionar los rangos de variación de los factores y el número de niveles a considerar, los cuales pueden ser predeterminados o escogidos aleatoriamente del conjunto de los posibles niveles. 3) Selección de las variables respuesta según los objetivos. En la escogencia de la variable respuesta o variable dependiente, el experimentador ha de estar seguro que la respuesta a medir realmente provee información sobre el problema de interés. Es necesario suministrar la forma como se mide esta variable y de ser posible la probabilidad de ocurrencia de estas medidas. 4) Selección del diseño experimental. Este paso es de primordial importancia en el proceso de investigación. Se debe indicar la diferencia a la respuesta verdadera (que tan lejos se admite la realidad de lo observado), que se desea detectar y la magnitud de los riesgos tolerados (grado de confiabilidad), en el orden a escoger un tamaño de muestra apropiado (replicaciones); es procedente señalar también el orden de recolección de los datos y el método de aleatorización a emplearse. Siempre es necesario mantener un equilibrio entre la exactitud y los costos. Se deben 106
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería recomendar planes que sean eficientes estadísticamente y económicamente viables. En la conducción de un estudio experimental es de esencial importancia la escogencia del diseño, esta escogencia depende de cuatro componentes: El diseño de tratamientos. En esta etapa se determinan los tratamientos a ser medidos en el estudio, es decir se establecen cuales y cuantos tratamientos se deben aplicar teniendo en cuenta la naturaleza del experimento. El interés del investigador en el sentido de decidir cuántos factores deben incluirse, cuántos niveles de factores se deben identificar en cada factor y cuál es el rango razonable de cada factor. Los aspectos del diseño de tratamientos están estrechamente ligados con el diseño para controlar el error. Diseño de control del error. Por diseño de control del error se entiende la distribución aleatoria de los tratamientos en un plan experimental usando la regla de asignación aleatoria de los tratamientos a las unidades experimentales. Como ejemplos de control de error se tienen los diseños completamente aleatorizados, bloques completos aleatorizados y cuadrados latinos. La escogencia del diseño depende de la variabilidad de las unidades experimentales, la estructura de estas unidades y la precisión de la estimación deseada por el investigador. Estructura del control del error. Por esta se entiende la asignación aleatoria de los tratamientos a las unidades experimentales. Muestreo y diseño de observaciones. Hace referencia a determinar el número de observaciones tomadas por tratamiento y unidad experimental, lo cual caracterizará los planes experimentales, con sub muestreo. Una vez definidas los componentes anteriores, la respuesta del vector R para el análisis seleccionado satisface la formulación del modelo estadístico apropiado está íntimamente relacionado con la estructura del diseño de tratamientos, el diseño del control del error y el muestreo de las observaciones. El diseño seleccionado se asocia a un modelo lineal de la forma Y X si el modelo es de efectos fijos, se descompone la variabilidad de la respuesta (variabilidad total) como una partición ortogonal de las diferentes fuentes de variabilidad, es decir, q
SCtotal SC (i) i 1
107
Palacios C. Severo Donde: SCtotal Y´Y y SC(i ) Y´PXiY
siendo PXi Xi( X it X i ) X it , i=1, …, q el proyector ortogonal en el espacio columna de X i ; y para X i el bloque X asociado con el i-ésimo factor de clasificación X X 1 : X 2 : ... : X 4 5) Conducción del experimento. Es el proceso de muestreo de recolección de datos. Sé entenderá que en el proceso haya un ajuste al plan (control). En la mayoría de las veces, la realización de un experimento no es lo suficientemente fiel al proyecto de investigación, porque surgen situaciones no consideradas previamente, como en el caso de un cultivo atacado por plagas, el agotamiento producido sobre una unidad experimental que se esta evaluando, o la aparición de una característica no determinada. De todas formas, se debe tener en cuenta si estos imprevistos alteran los propósitos del ensayo; de otra forma hay que tenerlos en cuenta en el análisis de los resultados. 6) Análisis de datos. Las variables que intervienen, o mejor, que se procura sean considerados en un ensayo, pueden relacionarse matemáticamente de alguna forma. El problema no está en la consecución de una expresión matemática sino en que tanto explica la realidad dicha expresión. Es preferible renunciar a un bello modelo que aceptar una realidad deformada por el. En esta etapa se busca una fórmula matemática que explique el comportamiento de una(s) variable(s) a través del comportamiento de otras. Existen técnicas estadísticas, como el análisis de regresión que suministran estas relaciones. Se debe buscar que el modelo se analice junto con el especialista que lo está investigando. Una vez se ha seleccionado el diseño experimental, se establece la matriz de diseño X, el vector de parámetros β y se asocia a un modelo Y X el cual generalmente resulta ser de rango incompleto y estimado por el método denominado mínimos cuadrados a través de una matriz inversa generalizada de X. Para la estimación del modelo y análisis estadístico de los datos, se debe tener en cuenta: 1. Estimación del modelo. Estimar mediante los métodos de mínimos cuadrados o máxima verosimilitud los parámetros asociados al modelo, en este último método, se tiene en cuenta la distribución de la variable respuesta; por este motivo la mayoría de los desarrollos realizados en este texto se hacen asumiendo que la variable respuesta sigue 108
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería una distribución normal multivariada. Cuando el modelo es de rango incompleto, se realizan cálculos muy similares al caso de rango completo, con lo cual simplemente los estimadores son adaptados a este modelo. 2. La teoría de estimabilidad. Conocer los principales criterios para caracterizar las funciones estimables. 3. Pruebas de hipótesis. Conocer la estructura distribucional de los estadísticos de prueba para las hipótesis de interés. Una parte del análisis es el chequeo adecuado del modelo propuesto, lo cual conlleva a un examen crítico de las bases del modelo estadístico y su relación con los supuestos. En esta etapa recientemente el computador ha jugado un papel importante. Existen diferentes procedimientos y paquetes estadísticos que facilitan el análisis de los datos. Un paquete estadístico es un conjunto de programas elaborados para el procesamiento de información, los cuales se manipulan por medio de una serie de instrucciones y comandos dirigidos a resolver problemas de la estadística. Entre los paquetes estadísticos de más amplia difusión en el área experimental podemos mencionar: el SPSS (Statistical Package for Social Science), SAS (Statistical Analysis System), Statgraphics. 7) Conclusiones y recomendaciones. Hecho el análisis de los datos, el experimentador puede extraer conclusiones (inferencia) sobre los resultados. Las inferencias estadísticas deben ser físicamente interpretadas y su significancía práctica evaluada. Las recomendaciones deben de hacerse con base en los resultados. En la presentación de estos se deben evitar el empleo de terminología estadística seca y en lo posible presentar los resultados de manera simple. La elaboración de gráficos y tablas evita la redacción de resultados y recomendaciones extensas y confusas.
109
Palacios C. Severo
Problemas (105) Desarrolle un bloque completo para el ejemplo 3.31 para el control del nivel de fertilidad del terreno. (106) Determine el bloque de fertilidad para cada bloque que se subdivide en parcelas. (107) Que los tratamientos del problema 100 sean unidades experimentales y reciban un único tratamiento y que estén por bloques. (108) Una empresa farmacéutica desea evaluar por bloques una nuevo producto para el control de la natalidad para ello recurre a un investigador conocedor del tratamiento de dichos productos. El análisis lo desarrolla en una comunidad cercana a la población y obtiene datos que se tienen que corroborar a nivel macro. Se desea determinar el mejor bloque con el producto. (109) Una capsula para el tratamiento del AH1N1 esta siendo probada en una población para el cual se desarrolla un diseño por bloques, y cada bloque se subdivide en zonas de tratamiento. Se desea determinar el bloque en donde se desarrolla con efectividad el tratamiento de dicha capsula. (110) Un plaguicida para el control de la mosca blanca se viene aplicando en la zona agrícola de la población en donde se comprobó que dicha mosca viene desarrollando una plaga sin control. Se desea desarrollar un diseño por bloques a fin de contrarrestar dicha plaga. (111) Un producto químico se desea probar para el control de la mosca de la fruta, el investigador desea desarrollar un diseño por bloques en diversas zonas agrícolas, para el cual trabaja en varios puntos con dicha plaga. Se desea evaluar dicho diseño con bloques a fin de eliminar dicha plaga.
110
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería (112) Un investigador se encuentra con un problema doble, ya que la siembra de un producto viene infectado por una plaga, como así mismo las semillas están contaminadas con un producto químico que no permite el desarrollo sustancial de la planta. Para ello desarrolla un diseño por bloques a fin de descartar dichos males y obtener un buen producto al cosechar.
§4 DISEÑO EXPERIMENTAL APLICADO A CIENCIAS No existe la suerte. Sólo hay preparación adecuada o inadecuada para hacer frente a una estadística. Robert Heinlein
I.
INTRODUCCIÓN
Fenómenos naturales. Al fin de esta definición y revisada correspon-
den a la meta de la mayoría de los proyectos de investigación en las ciencias de la ingeniería. Y como se logra todo esto. En la ciencia esto se hace a través de experimentos definidos. La definición de experimento científico es una prueba que se hace a fin de demostrar una verdad conocida o por conocer, examinar la validez de una hipótesis, o determinar la eficacia de algo previamente ensayado. Los físicos, químicos agrónomos, metalurgistas, mineros, geólogos, y muchos científicos comparten el objetivo de entender y predecir causa y efecto. II.
LIMITACIONES 111
Palacios C. Severo
Los científicos en ciencias de la ingeniería tienen más facilidad en construir y llevar a cabo sus experimentos que los investigadores en las ciencias sociales. Las sustancias químicas y los tubos de ensayo son más fáciles de controlar que los consumidores y las campañas de publicidad. Algunas de las diferencias entre ambas ciencias que crea obstáculo para un experimento perfecto son: Dispositivos imperfectos de medición: Los científicos pueden medir y pesar sus resultados. En cambio las ciencias sociales a menudo tienen que obtener sus datos preguntando a sus sujetos (cualitativos). Influencia de la medición en los resultados: Cuando se pesa un tubo de ensayo esto no afecta ni altera el tubo de ensayo. Pero cuando se pregunta a una persona si alguna vez ha oído a un artista popular esto si afecta a la persona, pues habiendo escuchado anteladamente no lo asociaría. Limitaciones de corto tiempo: Los científicos a menudo se demoran años, generaciones y hasta siglos en hacer descubrimientos concluyentes. En cambio casi todos los problemas de la sociedad requieren soluciones en días, semanas, a lo sumo en meses. Por esto, rara vez existe el tiempo o el dinero para realizar un experimento en forma tranquila y detallada. Complejidad y control de las variables: El resultado esperado de todos los esfuerzos es el resultado de muchos factores diferentes que incluyen el producto, el precio y venta. Cada uno de estos factores a su vez, esta afectado por muchas otras. Comprenden o siquiera identificar, todas las posibles causas es virtualmente imposible, y más aún el poder controlar con precisión en un experimento continuo. Por esto y otras razones la experimentación científica de las ciencias de la ingeniería proporciona un estándar para los experimentos y siempre que sea posible se debe tratar de traer los atributos de esos experimentos para la aplicación III. PREDICCIÓN Los proyectos de investigación pueden considerarse en una jerarquía según el grado en que proporcionan hallazgos predictivos, la jerarquía tiene tres etapas: 112
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Investigación descriptiva: Simplemente plantea lo que existe o describe algo que ha ocurrido en el pasado. No intenta inferir causa y efecto. Investigación evolutiva: Añade juicio de valor a los datos descriptivos a fin de crear una dimensión de comparado con. Determina si algo es mejor. Añade un elemento analítico implícito de causa y efecto. Investigación predictiva: Da significado absoluto a los resultados de las investigaciones. Pone causa y efecto en el tiempo futuro. Si usted hace esto, entonces sucederá tal y tal caso. La investigación siempre aspira a alcanzar este nivel predictivo. Los experimentos en la investigación constituyen un forma de mover los proyectos a lo largo de las jerarquías y hacerla evaluativo y, a veces hasta predictivo. IV. DISEÑOS EXPERIMENTALES El uso del diseño experimental es esencial en el tratamiento de unidades experimentales (cuantitativo) en investigación científica. Si deseamos comparar n poblaciones se efectúa los diseños experimentales. Dichos diseños son conjuntos de reglas (estructurado) que sirven para asociar unidades experimentales. Las unidades experimentales son datos a los cuales se aplica una causa y efecto. Para el análisis de las unidades experimentales procedemos a describir cada uno de los diseños. a)
DISEÑO ALEATORIZADO
Todo experimento se determina por cierto complejo de condiciones, los cuales bien se crean artificialmente o bien se realizan independientemente de la voluntad del experimentador, y por los resultados del experimento, es decir, por unos sucesos determinados que se observan como resultado de haberse ejecutado dicho experimento de condiciones. Un experimento se considera dado, si están determinadas sus condiciones e indicado los sucesos. 113
Palacios C. Severo Los experimentos se pueden dividir a grandes rasgos en dos clases. En una de ellas las condiciones del experimentador determinan el modo unívoco la aparición o no de los sucesos que se emplean. Los resultados de tales experimentos pueden pronosticarse de antemano a base de las leyes de las ciencias naturales. Los experimentos de esta índole se denominan deterministas. En otra clase de experimentos, con iguales condiciones, es posible la aparición de los sucesos que entre si se excluyen. El estudio teórico de tales experimentos constituye precisamente el objeto de la teoría probabilística, esta última lleva el nombre de experimento aleatorio. Ventajas b) Se pueden trabajar con un pequeño número de muestras de la población, sin que esto disminuya la exactitud de los datos. c) Se elimina la influencia del factor tiempo (cinética) sobre los resultados del experimento, las variantes cambian de lugar en los diferentes períodos. d) Es económico, ya que se trabaja con pocas muestras de la población. b)
DISEÑO UNIFACTORIAL CON n NIVELES
En dichos diseños se analizan ciertos experimentos que se usan para comprobar dos condiciones. A menudo se denominan experimentos de comprobación simple, los datos tienen pequeñas variaciones. En la experimentación donde participan dos clases distintas de equipos, probeta, muestras, etc. con dos métodos distintos de niveles. Muchos experimentos de estos tipos implican más de dos niveles del factor. En el presente explicaremos con detalle los diseños aleatorizados. Ejemplo 4.32 Se desea maximizar la fibra de llama que se emplea en una manufactura de alfombras. Se sabe por experiencia que la resistencia es influida por el porcentaje de algodón presente, además se sospecha que elevar el contenido de algodón incrementará la resistencia, el contenido de algodón debe variar aproximadamente entre 10 y 40 por ciento para que la alfombra resultante tenga otras características de calidad que se desean.
114
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Se desea probar muestras a cinco niveles de porcentaje de algodón 15, 20, 25, 30, 35 por ciento. Así mismo, decide ensayar cinco muestras a cada nivel de contenido de algodón. Este es un experimento unifactorial con a=5 niveles del factor y n=5 repeticiones. Las 25 corridas deben hacerse al azar. Se elige un número aleatorio entre 1 y 25 ver tabla 4.10. Supóngase que este número es 8. Entonces la observación número, 9 (20% de algodón) se corre primero. El proceso se repite hasta que se ha asignado una posición en la secuencia de prueba a cada una de las 25 observaciones. Tabla 4.10 Influencia del % de algodón a la fibra de llama % algodón Corrida experimental Total Media 15 1 2 3 4 5 20 6 7 8 9 10 25 11 12 13 14 15 30 16 17 18 19 20 35 21 22 23 24 25
La secuencia de pruebas aleatorizadas es necesaria para evitar que los resultados sean contaminados por los efectos de variables inconvenientes desconocidas, que puedan salir del control durante el experimento. Supongamos que se corren las 25 pruebas en el orden no aleatorizado original (esto es, las 5 muestras con 15 por ciento de algodón se prueban primero, luego las 5 muestras con 20 por ciento de algodón y así sucesivamente). Tabla 4.11 Maximizar la fibra de llama por la Influencia del % de algodón % algodón Corrida experimental Total Media 15 7 7 15 11 9 49 9,8 20 12 18 12 18 18 77 15,4 25 14 18 18 19 19 88 17,6 30 19 25 22 19 23 108 21,6 35 7 10 11 15 11 54 10,8 Total 376 15,04
Si la maquina que dan los resultados presenta un efecto de calentamiento tal que ha mayor tiempo de funcionamiento menor lectura se tendrá (influencia perturbadora), entonces dicho efecto contaminará los datos de respuesta e invalidará el experimento. Si se efectúa en orden aleatorio. Es bueno representar gráficamente los datos experimentales, en la figura se muestran los diagramas de dispersión a cada nivel de porcentaje de algodón. 115
Palacios C. Severo
Diagrama de dispersión
Interpretando la gráfica indica que la resistencia aumenta con el aumento del algodón, hasta un valor aproximado de este último de 30 por ciento. Más halla del 30 por ciento ocurre un notable decremento en la resistencia. No hay una fuerte evidencia que sugiera que la variabilidad en la resistencia al rededor del promedio dependa del porcentaje de algodón. En base a este sencillo análisis gráfico, sospechamos que: a) El porcentaje de algodón influye en la respuesta, y b) Un porcentaje aproximado de 30 por ciento de algodón daría por resultado la máxima resistencia. Análisis de varianza Si se desea comparar a-tratamientos o niveles de un factor único. La respuesta que se observa en cada uno de los tratamientos es una variable aleatoria. Los datos se muestran en la tabla 4.10 Es útil describir las observaciones mediante el modelo estadístico2
Yij i ij i, j 1,2,3,4,..., n Donde: Yij es el ij-ésima observación, µ es un parámetro común a todos los tratamientos denominados media global, Ti es un parámetro único para el i-ésimo, y εij es el componente aleatorio del error.
2
Polinomino ortogonal
116
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Nuestro objetivo será probar una hipótesis apropiada con respecto a los efectos del tratamiento, y hacer una estimación de ello. Para probar la hipótesis, se supone que los errores del modelo son variables aleatorias independientes con distribución normal, con media cero y varianza δ2. Se supone que esta última es constante para todos los niveles del factor. Este modelo se denomina, análisis de varianza de clasificación en un sentido porque sólo se investiga un factor. Además se requiere que el experimento se realice en orden aleatorio, de manera que el medio en que se usan las unidades experimentales (tratamiento) sea lo más uniformemente posible. Por lo tanto, este diseño experimental es un diseño completamente aleatorizado. Para ilustrar este análisis de varianza, recordemos que deseamos determinar si al variar el contenido de algodón es una fibra de llama influye en la resistencia. La suma de cuadrados requeridos para el análisis de varianza se calcula como sigue:
SCtotal YIJ2 Yi / N 2
SCtratamiento YIJ2 / n Yi / N 2
SC error SC total SC tratamient o Donde SCtotal SCtratamiento SCerror ΣYij ΣYi n N
suma de cuadrados del total suma de cuadrados del tratamiento suma de cuadrados del error sumatoria de los componentes del tratamiento sumatoria total de los tratamientos número de datos por columna número total de datos del tratamiento
SCtotal 7 2 7 2 ... 152 112 376 / 25 636,96 2
SCtratamiento 492 772 882 1082 542 / 5 376 / 25 475,76 2
SC error 636,96 475,76 161,20
En la tabla 4.12 se muestran los resultados del procedimiento. 117
Palacios C. Severo
Fuente % algodón Error Total
Tabla 4.12 Análisis de varianza SC GL CM Fo Ft(99%) 475,76 4 118,94 14,76 > 4,43 161,20 20 8,06 636,96 24 R² = 74,6923%
Hay que notar que la media de cuadrados entre tratamientos (118,94) es mucho mayor que la media de cuadrados dentro del tratamiento (8,06). Esto indica que es probable que las medias de tratamiento sean iguales. Más formalmente, es posible calcularlas razón Fo=14,76 y comparando con Ft(99%)=4,43, debe rechazarse Ho y concluir que la media de tratamientos difieren; en otras palabras el porcentaje de algodón en la fibra de llama afecta significativamente su resistencia media. c) DISEÑO DE PARCELAS DIVIDIDAS Los diseños en parcelas divididas y subdivididas se emplean frecuentemente en experimentos factoriales en las que las condiciones del material experimental, o las operaciones experimentales contempladas dificultan el manejo de toda la combinación de factores. El diseño básico de una parcela dividida involucra la asignación de tratamientos de un factor a parcelas principales o parcelas grandes, las cuales se disponen en diseños experimentales clásicos. Los experimentos de parcelas divididas se utilizan cuando se quiere dar mayor precisión o importancia a un factor en comparación con otro. Este diseñó se divide en parcelas denominado grande y chicas correspondiendo a estas últimas la mayor precisión. En algunas ocasiones este es el diseño óptimo a elegir ya sea porque un factor requiere de áreas grandes para su evaluación o por razones económicas: láminas de riego y variedad de arroz, sistema de cultivo y fertilización. Cabe mencionar que la diferencia entre un experimento factorial y uno de parcela dividida está en el proceso de aleatorización de los tratamientos. Así mientras que en un diseño factorial se hacen todas las combinaciones de tratamiento y se distribuyen aleatoriamente a las unidades experimentales, en el experimento de parcelas divididas primero se distribuyen aleatoriamente los tratamientos de las parcelas grandes y luego los tratamientos de las parcelas chicas dentro de las parcelas grandes. Ejemplo 4.33 118
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Se desea estudiar el efecto de la frecuencia de corte (parcela grande) y tres alturas de corte (parcela chica) en una producción de materia seca del pasto. El primer paso es localizar el área donde se realizará el experimento. Si el terreno es homogéneo entonces es factible utilizar un diseño completamente al azar, si el terreno muestra un gradiente de variación la solución pudiera ser un diseño de bloque al azar. Tabla 4.13 Experimento de parcelas divididas Altura Replicas Corte (cm) I II III 5 3,69 5,98 5,37 10 3,72 3,20 3,90 155 3,66 2,85 2,60 Total 13,07 12,03 11,87 5 6,48 7,92 4,74 10 3,86 4,54 4,42 15 11,15 3,54 3,91 Total 21,49 16,00 13,07 5 4,90 5,73 12,00 10 5,34 4,28 6,16 15 3,40 5,47 4,78 Total 13,64 15,48 22,94
Frecuencia Corte (días) 20
40
60
IV
6,30 4,51 3,83 14,64 6,30 5,06 3,66 15,03 8,56 6,34 3,75 18,65
23,34 15,33 12,94 51,61 25,44 17,88 22,26 65,58 31,19 22,12 17,40 70,71
Tabla de doble entrada para totales de tratamiento Frecuencia corte 20 40 60 Total
5 23,34 25,44 31,19 52,60
Altura de corte 10 15 15,33 12,94 17,88 22,26 22,12 17,40 55,33 79,97
Total 51,56 65,68 70,71 187,90
Factor de corrección FC
187,90² 35306,41 980,73 36
36
Suma de cuadrados debido a las replicas SC replica
48 , 20 ² 43 ,51 ² 47 ,88 ² 48 ,31 ² FC
SCreplica
9
8842,71 980,73 982,52 980,73 1,79 9
119
Palacios C. Severo Suma de cuadrados debido a las parcelas grandes (frecuencia de corte) SC pg SC replica
51,61² 65,58² 70,71² FC 12
2663,59 4300,74 4999,90 980,73 16,29 12
Suma de cuadrados debida a las parcelas chicas (altura de corte) SC pch SC pch
79,97² 55,33² 52,60² FC 12
6395,20 3061,40 2766,76 980,73 37,88 12
Suma de cuadrados debida a las interacciones de los tratamientos (frecuencia de corte y altura de corte) SCint
23,34² 15,33² ... 17,40² FC SC 4
SCint SC pgx Re p
pg
SC pch
4174,45 980,73 16,29 37,88 8,71 4
13,07 ² 12,03² ... 22,94² 18,65² FC
SC pgx Re p
3
3084,74 980,73 1028,25 980,73 47,52 3
SCerrorpg 47,52 SC rep SC pg 47,52 1,79 16,29 29,44 SCtotal 5,69² 5,98² ... 4,78² 3,75² FC
SCtotal 1129,74 980,73 149,01
SC errorpch SC total SC pgxrep SC pch SC int SC errorpch 149,01 47,52 37,88 8,71 54,9 Tabla 4.14 Análisis de varianza Fuente SC GL CM Replica 1,79 3 0,60 Frecuencia corte 16,29 2 8,15 Error pg 29,44 6 4,90 Altura corte 37,88 2 18,94 Interacción (f x a) 8,71 4 2,19 120
Fo 1,65 6,21 0,72
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Error pch Total
54,90 149,01
18 35
3,05
Los efectos de bloque (replica) y frecuencia de corte se prueban utilizando la SCepg; mientras que los efectos de altura de corte (parcela chica) y de la interacción de frecuencia de corte de altura de corte se prueban utilizando la SCepch. FC
FC
CM fre.cort CM error. pg
8,15 1,65 4,90
CM int 2,19 0,72 CM error. pch 3,05
Problemas (113) Un industrial textil utiliza un gran número de telares. Se desea que los telares sean homogéneos con el objeto de producir telas de resistencia uniforme. El industrial supone que, aparte de la variación usual en la resistencia de la tela en muestras del mismo telar, puede existir una variación significativa de la resistencia entre los distintos telares. Para investigar esto, selecciona cuatro telares al azar y realiza cuatro determinaciones de la resistencia. Este experimento es realizado en orden aleatorio. Realice un análisis de varianza y vea si existe diferencia significativa. Telar 1 2 3 4
98 91 96 95
Corrida experimental 97 99 90 93 95 97 96 99
Total 390 366 383 388
96 92 95 98
(114) Una fabrica de calzados cuenta con cinco tipos de cuero curtido. Cada cuero tiene una forma de proceso. Para investigar se escogen cinco cueros al azar, y se mide la cantidad de cuero producido en cinco tiempos diferentes. Obteniéndose los datos. Cuero 1 2 3 4 5
14,0 13,9 14,0 13,6 13,8
Corrida experimental 14,0 14,2 14,0 13,8 13,9 14,0 14,2 14,1 14,0 13,8 14,0 13,9 13,6 13,9 13,8
Estime la varianza del error experimental
14,1 14,0 13,9 13,7 14,0
Total 70,3 69,6 70,2 69,0 69,1
121
Palacios C. Severo (115) Se pide a cuatro químicos qué determinen el contenido de nitrógeno de un fertilizante cada uno realiza tres determinaciones y los resultados son los siguientes: Químico 1 2 3 4
Corrida experimental 44,49 44,04 44,38 45,15 45,13 44,88 44,72 44,48 45,16 44,20 44,10 44,55
Total 133,41 135,16 134,36 132,85
Difieren significativamente los resultados Que análisis químico debe ser seleccionado. (116) Un ingeniero de producción esta interesado en maximizar una aleación. Sabe por experiencia que la aleación contiene 3 elementos metálicos. Desea determinar si variando el contenido de un elemento metálico se incrementa la resistencia a la corrosión. Por bibliografía sabe que el contenido de dicho elemento metálico debe variar entre 10 a 30 por ciento para que la aleación tenga buenas características. % metal 1 2 3 4 5
9 23 19 18 11
Corrida experimental 15 12 22 18 7 11 19 14 15 11 7 12 19 19 18
10 17 7 18 25
Total 68 76 74 66 92
Producto 1 2 3 4
200 700 300 400
Corrida experimental 150 300 100 200 180 500 150 100 200 800 600 150
700 300 250 350
Total 0,89 0,79 0,96 0,85
Materia A B C D
20 18 15 25
30 25 20 35
Colegio 25 18 27 32
27 33 32 35
Nota 50 40 35 43
Existe diferencia significativa entre las medias (117) Una panadería desea averiguar la tendencia de sus productos para el siguiente año, bajo las siguientes encuestas, para la diversidad de sus productos en cinco diferentes distritos.
Describa las observaciones con un modelo matemático Existe diferencia significativa entre las medias Si existe diferencia aplicar las pruebas de Duncan (118) Se desea evaluar el rendimiento de los estudiantes de cinco colegios en cuatro materias A: matemáticas, B: física, C: química y D: lenguaje 29 35 27 35
(119) Se realizó un estudio de ingeniería de tránsito sobre los retrasos en las intersecciones con semáforos en las calles de una ciudad. 122
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Se usaron tres tipos de semáforo: a) programado, b) semiautomático y c) automático. Se usaron cinco intersecciones para cada tipo de semáforo. La medida de retraso utilizada fue el promedio de tiempo que cada vehículo permanece detenido en cada intersección (segundos/vehículo). Los datos son los siguientes: Programado 38 37 31 36 35
Semiautomático 18 21 19 26 23
Automático 16 11 19 11 17
Escriba el modelo lineal Calcule el análisis de varianza. Calcule las medias de mínimos cuadrados del retraso en el tránsito y sus errores estándar para cada tipo de semáforo. Calcule el intervalo de confianza del 95% estimado para las medias de los tipos de semáforo. Pruebe la hipótesis de que no hay diferencia entre las medias de retraso para los tipos de semáforo; a un nivel de significación de 0.05, con la prueba F. Escriba las ecuaciones normales para los datos. (120) Se llevó a cabo un experimento para probar los efectos de un fertilizante nitrogenado en la producción de lechuga. Se aplicaron cinco dosis diferentes de nitrato de amonio a cuatro parcelas (réplicas) en un diseño totalmente aleatorizado. Los datos son el número de lechugas cosechadas de la parcela. Tratamiento 0 50 100 150 200
104 134 146 147 131
Lechuga 114 90 130 144 142 152 160 160 148 154
140 174 156 163 168
Escriba el modelo lineal estadístico para este estudio y explique sus componentes. Calcule el análisis de varianza. Calcule el intervalo de confianza del 95% estimado para las medias de los niveles de nitrógeno. Pruebe la hipótesis de que no hay diferencia entre las medias de los niveles de nitrógeno con una prueba F a un nivel de significancía de 0.05. Escriba las ecuaciones normales para los datos. Este experimento se llevó a cabo con un diseño totalmente aleatorizado de las parcelas en un arreglo rectangular. Muestre una 123
Palacios C. Severo aleatorización de los cinco tratamientos con nitrógeno de las 20 parcelas, usando una permutación aleatoria de 1 a 20. (121) Un fisiólogo de animales estudió la función pituitaria de las gallinas, bajo el régimen estándar de muda de pluma forzada que usan los productores de huevo para mantenerlas en producción. Se usaron 25 gallinas en el estudio. Cinco se utilizaron para la medición, una previa al régimen de muda forzada y una al final de cada una de las cuatro etapas del régimen. Las cinco etapas del régimen fueron: 1. Premuda (control), 2. Ayuno de 8 días, 3. 60 gramos de salvado al día durante 10 días, 4. 80 gramos de salvado al día por 10 días y 5. Mezcla de malta durante 42 días. El objetivo era dar seguimiento a las respuestas fisiológicas asociadas con la función pituitaria de las gallinas durante el régimen para explicar por qué vuelven a producir después de una muda forzada. Uno de los compuestos medidos fue la concentración de suero T3. Los datos de la tabla son las medidas de suero T3 en las cinco gallinas sacrificadas al final de cada etapa del régimen. Tratamiento Premuda Ayuno 60 g salvado 80 g salvado Mezcal malta
94,1 98,8 197,2 102,9 83,1
90,5 103,6 207,3 117,5 89,6
Suero T3 99,4 115,3 177,5 119,9 87,8
73,6 129,1 226,1 112,1 96,4
74,4 117,6 222,8 101,1 82,2
Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo. Calcule el análisis de varianza. Calcule un intervalo de confianza de 95% estimado para las medias de los tratamientos. Pruebe la hipótesis de que no hay diferencia entre las medias de los cinco tratamientos con la prueba F a un nivel de significancía de 0,05. Escriba las ecuaciones normales de los datos. Este experimento se llevó a cabo en un diseño totalmente aleatorizado, con una gallina en cada una de las 25 jaulas. Proporcione una asignación aleatoria de los cinco tratamientos a las 25 jaulas, con una permutación aleatoria de los números 1 a 25. (122) Se recolectaron datos de estudiantes de pedagogía en cuanto a su uso de ciertas estrategias de enseñanza estudiadas antes de sus prácticas. Había 28 estudiantes que habían aprendido las 124
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería estrategias (9 en 2002, 9 en 2003 y 10 en 2004). El 2001 había 6 profesores que no habían aprendido el uso de estas estrategias y se usaron como grupo de control. El investigador registró el número promedio de estrategias por semana que cada estudiante usaba durante sus prácticas. El investigador quería saber si el número de estrategias usadas variaba con el tiempo. Número promedio de estrategias usadas Control 2001 2002 2003 2004 6,9 7,3 10,9 7,5 5,6 10,6 7,5 14,9 15,9 8,6 6,8 6,1 9,8 8,7 7,6 5,2 7,8 8,8 7,8 5,7 5 7,1 5,7 14,2 11,2 8,9 9,3 7,3 5,9 5,6 10,5 7,3 7,3 10,8
Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo. Calcule el análisis de varianza. Calcule un intervalo de confianza del 95% estimado para las medias de los tratamientos. Pruebe la hipótesis de que no hay diferencia entre las medias de los cuatro tratamientos, con la prueba F a un nivel de significancía de 0.05. Escriba las ecuaciones normales de los datos. (123) En cierto estudio de calibración de espectroscopia de absorción atómica, las medidas de respuesta fueron las unidades de absorción de un instrumento según la cantidad de cobre diluido en una solución ácida. Se usaron cinco niveles de cobre con cuatro réplicas del nivel cero y dos réplicas de los otros cuatro niveles. En la siguiente tabla se dan los datos de espectroscopia para cada nivel de cobre como microgramos de Cu/mililitro de solución. 0,00 0,045 0,047 0,051 0,054
0,05 0,084 0,087
Cobre mg/ml 0,10 0,115 0,116
0,20 0,183 0,191
0,50 0,395 0,399
Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo. Calcule el análisis de varianza. Calcule las medias de mínimos cuadrados y sus errores estándar para cada tratamiento. 125
Palacios C. Severo Calcule un intervalo de confianza del 95% estimado para las medias de los tratamientos. Pruebe la hipótesis de que no hay diferencia entre las medias de los cinco tratamientos, con la prueba F(95%). Escriba las ecuaciones normales de los datos. (124) Considere el experimento del ejercicio 121. Suponga que se perdieron algunas gallinas durante el transcurso del mismo, lo que dio como resultado el siguiente conjunto de observaciones. Tratamiento Premuda Ayuno 60 g salvado 80 g salvado Mezcal malta
94,1 98,8 197,2 102,9 83,1
90,5 103,6 207,3 117,5 89,6
Suero T3 99,4 115,3 177,5 119,9 87,8
73,6 129,1 112,1 96,4
117,6 101,1
Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo. Calcule el análisis de varianza. Calcule las medias de mínimos cuadrados y sus errores estándar para cada tratamiento. ¿Cómo afectó la pérdida de gallinas a las estimaciones de las medias? Calcule un intervalo de confianza de 95% estimado para las medias de los tratamientos. Pruebe la hipótesis de que no hay diferencia entre las medias de los cinco tratamientos; con la prueba F a un nivel de significancía de 0,05. Escriba las ecuaciones normales de los dato (125) Utilice los datos del ejercicio 51 para determinar cuántas gallinas necesitaría el biólogo en cada tratamiento para rechazar la hipótesis nula a un nivel de significancía de 0.05, si la diferencia entre el tratamiento de control y cualquier tratamiento nuevo es de 30 unidades de T3. (126) Use los datos del ejercicio 49 para determinar cuántas intersecciones necesita el ingeniero de tránsito con cada tipo de semáforo para rechazar la hipótesis nula a un nivel de significancía de 0.01, si los retrasos medios respectivos en los tres tipos de señal fueron 20, 18 y 16 segundos. (127) Se quiere probar el efecto de cinco dietas en el aumento de peso en cerdos pero se tiene diferente peso inicial en las unidades experimentales. Aquí el factor peso inicial es medible y no puede utilizarse como un criterio de clase (nivel de un factor) por lo que es mejor utilizar un diseño completamente al azar con peso inicial de las unidades experimentales como covariables. De esta manera se ajusta respecto a peso inicial, se tiene más grados 126
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería de libertad para el cuadrado medio del error y se maneja un diseño más sencillo. Si además del peso inicial, la edad se los animales fuese otro factor de importancia podría incluirse teniendo así un diseño completamente al azar con dos covariables. (128) Suponga que un investigador en fisiología esta interesado en planear un experimento para medir el efecto del área necrótica sobre la fotosíntesis de 8 variedades de café susceptibles a la roya. Planea usar parcelas experimentales de 4 plantas en un lote ubicado en una pendiente del 70 %. Por experimentos anteriores se sabe que la roya es más agresiva en la zonas bajas que en este caso además son las más húmedas y por lo tanto más favorables para el desarrollo de la enfermedad. El investigador cuenta con 320 plantas y solo puede sembrar grupos de 32 plantas para distribuirlas a lo largo de la pendiente. Por otra parte cuenta solo con 8 equipos para la medir la fotosíntesis y decide medir entre 10:00 y 10:15 a.m. Se sabe que tarda en medir la fotosíntesis de cada hoja afectada 3 minutos. ¿Qué diseño experimental le recomendaría al investigador? De acuerdo con lo recomendado, indíquele como hacer el análisis de los datos y las comparaciones de tratamientos. (129) Un investigador plantea la hipótesis de que el gusano blanco de la papa se puede controlar biológicamente usando tres especies de nematodos. Para su aplicación, quiere ensayar tres sistemas diferentes: en la superficie, en la parte media y en el fondo de cada matera formando un círculo. La efectividad del sistema puede variar de acuerdo con el nematodo. Para evitar complejidad, el investigador esterilizara el suelo, aplicara soluciones nutritivas a todas las materas e infestara cada matera con igual número de larvas. La infestación con las larvas se hará 8 días después de la floración del cultivo de papa y la aplicación de los nematodos se hará 15 días antes de la infestación. Se consideró la matera con 2 kg de suelo y una planta, como unidad experimental. Por tratamiento va a tener 10 unidades experimentales en un invernadero. Qué diseño experimental recomendaría. Como asignaría los tratamientos a las unidades experimentales Que variable(s) mediría Escriba una tabla de análisis mostrando solamente las fuentes de variación y los grados de libertad. Son los factores cualitativos o cuantitativos Considere los factores aleatorios y escriba como calcular las componentes de varianza y las pruebas de F 127
Palacios C. Severo (130) Para determinar la permanencia del controlador biológico beauveria bassiana sobre las hojas del cafeto después de un aguacero, se piensa hacer un experimento en el cual se usará un solo simulador de lluvia para despachar una misma cantidad de agua con diferentes tiempos de duración, para una intensidad dada. Los tiempos de duración son: 30, 60 y 90 minutos en horas de la tarde. Se asperjarán 3 dosis del hongo (108, 1010 Y 1012 esporas por mililitro) debidamente calibradas, donde se espera tener una distribución uniforme del número de gotas por centímetro cuadrado en las hojas. La unidad experimental estará constituida por 10 plántulas de 6 meses de edad. Se quiere medir el número de esporas promedio en 5 campos de la hoja. El simulador de lluvia logra regar 30 plantas a la vez. El investigador cuenta con 450 plantas para su experimento. ¿Que diseño experimental recomienda? ¿Qué le indicaría al investigador para hacer el análisis de los datos? (131) Suponga que un ingeniero está interesado en la comparación de tres procesos químicos para la manufactura de cierto compuesto. Se sospecha que la impureza de la materia prima usada en el proceso puede afectar el producto final, sin embargo se espera ajustar el proceso al final del análisis. Usando un diseño completamente aleatorizado con 15 unidades experimentales obtuvo la siguiente información: Tratamiento 1
2
3
Impurezas 4,1 2,9 1,5 4,1 2,2 6,8 2,7 3,8 6,4 5,6 6,6 2,2 3,5 3,5 4,6
Producción 12,5 10,3 9,6 12,6 11,3 11,5 8,6 7,2 11,6 8,9 6,8 4,8 5,6 7,5 6,2
Estime la línea de regresión para cada tratamiento Lleve a cabo la prueba de hipótesis de que las tres líneas de regresión tienen la misma pendiente Obtenga la estimación combinada de la pendiente. Obtenga las medias sin ajustar y ajustadas de los tratamientos y compárelos comentando los resultados respectivos. 128
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Obtenga la tabla de análisis de la varianza e interprete cada uno de los resultados de esta tabla. (132) A continuación se analizan los datos de un experimento en caña de azúcar. En las parcelas grandes se ensayaron dos tratamientos. C: Con compuesto orgánico S: Sin compuesto orgánico En las sub parcelas se ensayaron cuatro tratamientos. 1 Testigo. 2 Cal 1,5 Ton/ha. 3 Cal 3,0 Ton/ha. 4 Cal 4,5 Ton/ha. La respuesta de interés fue el rendimiento del campo en kilogramos por parcela chica de 100.8 m2, y se generó la variable R: para el rendimiento de caña en toneladas por hectárea. V.
DISEÑO TOTALMENTE ALEATORIZADO
Se usa cuando los datos tienen pequeña variación, y además cuando el número de tratamientos también es pequeño. Si tenemos N-tratamientos, y queremos ubicar n-elementos para los N-tratamientos procedemos de la siguiente manera. Se eligen aleatoriamente n-unidades experimentales para aplicarle un tratamiento digamos t, luego tenemos n-elementos de las Nn-n restantes para aplicarles el tratamiento t2 y así sucesivamente hasta agotar las Nn unidades experimentales. En muchos problemas es necesario diseñar experimentos en los que pueda controlarse sistemáticamente la variabilidad producida por diversas fuentes extrañas. Ejemplo 4.34 Se desea determinar la alimentación de terneras con productos distintos para el engorde artificial. El experimentador ha decidido obtener cuatro observaciones para cada alimentación. Solo existe un factor - alimentación artificial, y el diseño de un factor completamente aleatorizado consiste en asignar aleatoriamente cada uno de los 4x4=16 ensayos a una unidad experimental, o sea la alimentación de terneras, el engorde artificial correspondiente. 129
Palacios C. Severo
Por lo tanto, se requerirán 16 formas de alimentación para realizar este experimento, una para cada ensayo. En principio existe un problema serio en el diseño. Como las terneras son distintas, las unidades experimentales contribuyen a la variabilidad observada en la lectura de alimentación. Como resultado, el error experimental reflejará tanto el error aleatorio como la variabilidad entre los animales. Ternera 1 2 3 4
Tabla 4.15 Datos de alimentación de terneras Corrida experimental Total 9,3 9,4 9,6 10 38,3 9,4 9,7 9,8 9,9 38,8 9,2 9,4 9,5 9,7 37,8 9,7 9,6 10 10,2 39,5
Media 9,575 9,700 9,450 9,875
Se desea que el error experimental sea lo más pequeño posible; en otras palabras, se busca sustraer del error experimental la variabilidad producida por las terneras. Un diseño que logre esto requiere que el experimentador pruebe cada alimentación, una vez, en cada uno de las cuatro terneras diferentes. El diseño que aparece en la tabla 4.15, se conoce como diseño aleatorizado. La respuesta observada es el incremento de peso diario en gramos. El análisis estadístico se lleva a cabo en función de la prueba F, el valor de Fo se compara con el valor de Ft en función de los grados de libertad de los tratamientos y del error experimental. Debemos calcular la varianza total y descomponerla para el tratamiento y el error. SC total 9,3 2 9,4 2 ... 10 2 10,2 2 153,4 / 16 1,18 2
SC tratamientoo 38,3 2 38,3 2 37,8 2 39,5 2 / 4 153,4 / 16 0,395 2
SCerror 1,18 0,395 0,785
130
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería GL : N 16 n 4 Total : N 1 15 Tratamiento : n 1 3 Error : N n 12 Tabla 4.16 Análisis de varianza SC GL CM Fo Ft(99%) 0,395 3 0,128 1,96 < 5,95 0,785 12 0,065 1,18 15 R² = 66,5254%
Fuente Terneras Error Total
El análisis de la prueba F indica que puede ser rechazado la hipótesis Ho por lo que puede afirmarse que existe diferencia entre las medias de los tratamientos comparados; sin embargo el investigador puede concluir entre cuales tratamientos es que existe diferencia.
Problemas (133) Un técnico textil desea probar el efecto que tiene cuatro productos químicos sobre la resistencia de un tipo de tela. Como puede haber variabilidad entre un rollo de tela y otro, decide utilizar un diseño aleatorizado, seleccionando cinco rollos al azar y les aplica los cuatro productos químicos en orden aleatorio. A continuación, se proporcionan los resultados de la resistencia. Analice estos datos y haga las conclusiones apropiadas. Químico 1 2 3 4
73 73 75 73
Análisis 1 2 3 4
58,7 64,5 57,3 61,4
Corrida experimental 68 74 71 67 75 72 68 78 73 71 75 75
67 70 68 69
Total
Media
(134) Se emplean cuatro laboratorios para realizar un análisis químico como parte de un estudio, para determinar si los laboratorios dan en promedio los resultados mínimos, se le envía a cada uno una muestra del mismo material. Los resultados analíticos son: Corrida experimental 62,7 55,9 60,7 56,1 60,3 60,9 60,9 59,1 59,2 58,2 60,3 58,1
61,4 63,1 55,2 62,3
Total
Media
Existe diferencia significativa entre los laboratorios Realice un análisis de varianza 131
Palacios C. Severo (135) Tres diferentes soluciones para lavar están siendo comparadas con objeto de estudias su efectividad en el retraso de crecimiento de bacterias en envases de leche. El análisis se realiza en un laboratorio y sólo puede efectuarse tres pruebas en un sólo día, el experimentador recupera las observaciones durante cuatro días y los datos aparecen a continuación. Químico 1 2 3
13 16 5
Corrida experimental 18 39 22 17 44 24 1 22 4
Total
Media
(136) Se desea estudiar la adición sistemática para la obtención de peltre (aleación de estaño, plomo, cobre antimonio) de muy buena calidad, se comparan cinco estándares con el suministro de estaño (Sn) y cobre (Cu): a) Sn=92, Cu=2; b) Sn=93, Cu=1; c) Sn =93, Cu=2; d) Sn=94, Cu=1, e) Sn=94, Cu=2 Aleación A B C D E
1,18 1,45 1,36 1,45 1,96
Corrida experimental 1,20 1,03 0,92 1,27 1,23 1,76 1,62 1,34 1,23 1,41 1,25 1,51 1,78 1,56 1,74 1,67 2,12 1,78 1,83 2,07
1,24 1,60 1,44 1,46 1,76
(137) Se realizó una prueba de la vida útil, a temperatura acelerada, de un tipo de calentador tubular. Se probaron seis calentadores, cada uno a cuatro temperaturas distintas: 1520°F, 1620°F, 1660°F y 1708°F. Se registró el número de horas transcurridas hasta que se presentó falla en los 24 calentadores utilizados en el estudio. temperatura 1520 1620 1660 1708
1953 1190 651 511
2135 1286 837 651
Horas hasta la falla 2471 4727 6134 1550 2125 2557 848 1038 1361 651 652 688
6314 2845 1543 729
Investigue las suposiciones necesarias para un análisis de varianza de los datos. Realice un análisis de varianza de los datos transformados, y haga una partición de la suma de los cuadrados de la temperatura en contrastes polinomiales ortogonales, para determinar la mejor relación entre la temperatura y su variable de respuesta. Como las temperaturas de prueba tenían espaciamientos desiguales, use los siguientes coeficientes de contraste: Temperatura Lineal Cuadrática Cúbica
1520 -0,773 0,382 -0,078
1620 -0,051 -0,637 0,584
1660 0,238 -0,328 -0,765
1708 0,585 0,583 0,259
(138) Un entomólogo contó el número de huevos que pone cada una de las 15 hembras de polillas en días sucesivos, en tres variedades 132
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería de gusano de tabaco (USDA, campo y resistente). Los siguientes datos son el número de huevos puestos en el tercer día después del apareamiento de cada hembra en cada variedad. Variedad USDA Campo Resistente USDA Campo Resistente
448 211 0 29 0 0
906 276 9 522 253 348
Número de huevos por polilla 28 227 634 48 415 787 18 118 143 1 26 127 319 242 261 566 61 0 275 0 0 14 21 0
369 1 161 734 153 218
137 151 294
El entomólogo desea realizar un análisis de varianza del número de huevos. (139) Un criador de plantas evaluó la capacidad de enraizar de nueve clones de pasto en un experimento de laboratorio. Cultivó dos réplicas de cada clon en una solución oxigenada en un diseño totalmente aleatorizado. Clon 1 2 3 4 5 6 7 8 9
Replica I Enraizado No enraizado 15 49 13 51 13 51 6 42 16 48 14 50 8 56 9 55 8 40
Replica II Enraizado No enraizado 11 53 11 53 6 58 4 60 12 52 9 55 18 46 10 54 16 48
El cultivador quiere analizar la proporción de cultivos enraizados o la proporción de nodos enraizados. (140) Dada la siguiente muestra aleatoria de N = 15 observaciones, ordenadas de menor a mayor: 14,3 20
16 20,8
17,3 21,4
17,5 22,7
17,8 23,2
18,7 25,6
18,8 27,8
18,9
2 39
3 63
4 87
5 97
10 112
28 156
34 188
35 253
Determine los valores f y sus cuantiles normal estándar. Grafique las observaciones contra los cuantiles normal estándar. Interprete la gráfica respecto a la forma de la distribución a partir de la cual se muestrearon las observaciones. (141) Dada la siguiente muestra aleatoria de N = 16 observaciones, ordenadas de menor a mayor: Determine los valores f y sus cuantiles normal estándar. Grafique las observaciones contra los cuantiles normal estándar.
133
Palacios C. Severo Interprete la gráfica respecto a la forma de la distribución a partir de la cual se muestrearon las observaciones.
VI. DISEÑO DE BLOQUES ALETORIZADOS El concepto de bloques fue introducido en agricultura; al observarse que los campos experimentales en agricultura marcaban una heterogeneidad de fertilidad, lo que complicaba la asignación de los tratamientos de un punto a otro, de aquí que el bloque permitía la partición de la variabilidad inherente en el campo experimental después de la asignación de los tratamientos en las siguientes componentes: 1. Diferencias entre tratamientos-Variación entre tratamientos. 2. Variación dentro de bloques. 3. Variación entre bloques. De esta forma nació el concepto de diseño en bloque completos aleatorizados. El término bloque es usado más ampliamente para referirse a un grupo de unidad experimental que tienen un conjunto de características que provocan un problema efectivo de respuesta, una vez que han sido aplicados los tratamientos. El diseño de bloques aleatorizados constituye una de las variantes para el agrupamiento de las unidades experimentales que se utilizan cuando en la conformación de los grupos en un experimento de com134
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería paración por grupos, se detecta que existen diferencias en cuanto a una característica determinada entre los objetos. A partir de ello se estructura la formación de los grupos, en función de establecer bloques de tratamiento semejantes en cuanto a las características en cuestión para que compongan cada bloque en forma aleatoria en cada uno de los grupos experimentales posteriores. Esta distribución permite llevar a cabo un control más preciso de los efectos de esta característica variable a través del agrupamiento en bloques elevando con ello la precisión del experimento. Ejemplo 4.35 Se realizo un experimento con el objeto de comparar el efecto del suministro de diferentes niveles de concentrado a las aves de corral para lo cual se aplicaron las siguientes variantes: A; Sin concentrado (dieta normal) B: 250 gramos de concentrado por cada kilo de ave viva C: 300 gramos de concentrado por cada kilo de ave viva D: 500 gramos de concentrado por cada kilo de ave viva
El experimento se monto utilizando 80 aves de corral, los que fueron agrupados en 5 bloques de acuerdo al peso inicial, que vario entre 1 a 2 Kg. teniendo en cuenta este agrupamiento se formaron unidades experimentales de cuatro aves por corral. Lográndose obtener los resultados en el aumento de peso diario durante la prueba (alimento de concentrado), expresado en Kg/día de peso vivo. Concentrado A B C D Total
I 0,8 1,0 1,2 1,4 5,2
II 1,0 1,1 1,3 1,4 4,8
Bloque III 0,9 1,0 1,1 1,8 4,4
IV 0,8 1,1 1,3 1,6 4,8
V 1,0 1,3 1,1 1,8 4,8
Total
Media
4,5 5,5 6 8 24
0,9 1,1 1,2 1,6
SCtotal 12 0,9 2 ... 1,6 2 1,4 2 24 / 20 1,6 2
SCtratamiento 4,52 5,52 6 2 82 / 5 24 / 20 1,3 2
SCbloque 5,22 4,82 4,42 4,82 4,82 / 5 24 / 20 0,08 2
135
Palacios C. Severo
SCerror 1,6 1,3 0,08 0,22 GL : N 20 n 4 m 5 Total : N 1 19 Tratamiento : n 1 3 Bloque : m 1 4 Error : N n m 1 12
Fuente Concentrado Bloque Error Total
Tabla 4.17 Análisis de varianza SC GL CM Fo Ft(99%) 1,30 3 0,43 23,4 > 5,95 0,08 4 0,02 5 < 5,41 0,22 12 0,018 1,09 1,6 19 R² = 81,25%
Al comparar los resultados de los valores de F encontramos que los efectos de los tratamientos resultan significativos lo que indica que existe una influencia diferente entre los efectos de las diferentes dietas comparadas en cuanto al incremento de peso diario de las aves de corral durante las pruebas. Referente al efecto del agrupamiento en bloque resulto no significativo por lo que las aves de corral se comportan en forma semejante independiente de su peso inicial del experimento. A partir de los resultados podemos concluir desde un punto de vista biológico el efecto obtenido con la utilización de concentrados en la dieta para aves de corral, sin embargo debe de estudiarse con detenimiento los factores que provocan los resultados obtenidos al comparar las dietas. Ejemplo 4.36 Un agrónomo desea determinar el efecto de diferentes fuentes de nitrógeno en la producción de una materia seca sobre cebada forrajera. Hay cinco fuentes a ser comparadas: (NH4)2SO4, NH4NO3, CO(NH2)2, Ca(NO3)2 y NaNO3 y con un tratamiento control sin nitrógeno. Se deseo aplicar los resultados sobre un rango bastante amplio de condiciones, se hicieron ensayos sobre cuatro tipos de suelo. Para el diseño experimental se eligió un diseño en bloques completamente aleatorizado con los tipos de suelo como factor de bloqueo, se localizaron seis parcelas en cada uno de los cuatro tipos de suelo, y se 136
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería asigno aleatoriamente los tratamientos a las parcelas dentro de cada tipo de suelo. La variable de interés es la producción de cebada bajo varias fuentes de nitrógeno. Los datos obtenidos de realizar este experimento se presentan en la tabla 4.18. Tabla 4.18 Producción (kg/parcela) de cebada bajo varias fuentes de nitrógeno Tipo de suelo Tratamiento I II III IV (NH4)2SO4 32,1 35,6 41,9 35,4 NH4NO3 30,1 31,5 37,1 30,8 CO(NH2)2 25,4 27,1 33,8 31,1 Ca(NO3)2 24,1 33,0 35,6 31,4 NaNO3 26,1 31,0 33,8 31,9 Control 23,2 24,8 26,7 26,7
Las sumas de cuadrados se obtienen de la siguiente manera:
Y
2
SC
Y 2
total
ij
ij
n
ij
SCtotal 23323,52
SC tratamient o
SCtratamiento
740,2² 4945183 24
Y ij 1 2 Y ij b n ij
2
1 145² 129,5² 117,4² 124,1² 122,8² 110,4² 740,2² 2561533 4 24
SC
SCbloque
2
bloque
Y 1 Y t n
2
ij
ij
ij
1 161² 183² 208,9² 187,3² 740,2² 1927483 6 24
SCerror SCtotal SCtratamiento SCbloque SCerror 4945183 2561533 1927483 456166
137
Palacios C. Severo
Tabla 4.19 Análisis de varianza SC GL CM Fo Ft(99%) 1927483 3 642494 21,13 > 5,42 2561533 5 512306 16,85 > 4,56 456166 15 30411 4945183 23 R² = 90,7755%
Fuente Suelo Tratamiento Error Total
Ejemplo 4.37 Un agricultor rocía hojas de manzana con diferentes concentraciones de un compuesto de nitrógeno, luego determina la cantidad de nitrógeno que permanecía en las hojas inmediatamente después de la aplicación y al final de ciertos tiempos preestablecidos. La finalidad de este experimento fue determinar la rapidez a la que el nitrógeno es absorbido por las hojas, hubo dos reproducciones de cada tratamiento según se muestra en la tabla 4.20 Tabla 4.20 Cantidad de nitrógeno que permanece después de la aplicación Concentración de nitrógeno Tiempo N1 N2 N3 t0 2,29 6,80 8,75 2,54 5,94 9,52 t1 0,46 3,03 2,49 0,19 1,00 2,04 t2 0,00 0,75 1,40 0,26 1,16 1,81
Asumiendo un bloqueo por tiempos, al llevar a cabo el análisis de varianza y probar la hipótesis de interés H0: µN1 = µN2 = µN3, los resultados del ANOVA se muestran en la tabla 4.21 SC
bloque
1 50,43² 35,84² 9,21² 5,83² 917576 6 18
SCtratamiento
1 5,74² 18,68² 26,01² 50,43² 351136 6 18
SCerror 2884143
1 4,83² 12,74² .. 3,21² 309755 2
SCerror exp er 2853167 1764016 2330456 1412880 171574
SCtotal 2884143 1412880 1471262 138
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Con base en éstos resultados, se obtiene la tabla 4.21 y a partir de la ésta, se concluye que la permanencia de nitrógeno en las hojas se ve afectada por la cantidad de nitrógeno aplicada, pues Fo = 4,09 < Ft(95%) = 6,9. Por otro lado, al parecer los tiempos (bloques) difieren de manera significativa, ya que el cuadrado medio es grande en relación con el error experimental.
Fuente Tiempo Nitrógeno Error exp Error Total
Tabla 4.21 Análisis de varianza permanencia de nitrógeno en las hojas SC GL CM Fo Ft(95%) 917576 2 458788 10,69 > 6,94 351136 2 175568 4,09 < 6,94 171574 4 42893 30975 9 3441 1471262 17 R² = 88,3383%
Ejemplo 4.38 Un ingeniero químico piensa que el tiempo de reacción de un proceso químico en donde los reactantes actúan espontáneamente esta en función directa del tipo de catalizador empleado, se emplean cuatro tipos de catalizadores a fin de realizar el presente estudio. Tabla 4.22 Tiempos de reacción del proceso Lote de materia prima Catalizador I II III IV Yoi 1 73 74 71 218 2 75 67 72 214 3 73 75 68 216 4 75 72 75 222 Yoj 221 224 207 218 Yoo=870
Se están investigando cuatro catalizadores, en cuatro lotes de materia prima y se observa el tiempo de reacción. Los datos obtenidos se presentan en la tabla 4.22 Para este conjunto de datos se tiene r = 3; k = 3 y el número de veces que cada par de tratamientos aparece en el mismo bloque es:
r k 1 32 2 t 1 3
Este diseño en bloques incompletos balanceado tiene una eficiencia relativa con respecto al DBCA de:
139
Palacios C. Severo E
t 24 0,889 kT 33
Prefiriendo de esta forma bloques incompletos balanceados. Para comprobar la hipótesis H0: τ1 = τ2 = τ3 = τ4, se construyen las diferentes sumas de cuadrados con base en la estructura de las siguientes matrices: C
2 4I 4 x 4 J 4 x 4 3
8 I 4x4 3
1
8 I 4x4 3
Con base en estos resultados, se encuentra que: SCtotal 63156 SCbloque
870² 8100 12
1 221² 207² 224² 218² 870² 5500 3 12
SCtratajus
1 81 49 16 400 2275 24
En la tabla 4.23 se resumen los resultados anteriores a través del análisis de varianza. Puesto que Fo = 11,66 > Ft(95%) = 5,41, se concluye que el catalizador empleado tiene un efecto significativo sobre el tiempo de reacción. SCerror SCtotal SCtratajus SCbloque 8100 2275 5500 325 Tabla 4.23 Análisis de varianza para los tiempos de reacción del proceso Fuente SC GL CM Fo Ft(95%) Bloque 5500 3 1833 28,2 > 5,41 Tratamiento(ajus) 2275 3 758 11,6 < 5,41 Error 325 5 65 Total 8100 11 R² = 95,9876 %
140
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Problemas (142) Se describe un experimento en el cual se determinó el factor de forma para distintos embutidos a seis niveles de velocidad. El interés se concentro en las diferencias potenciales del equipo, y la velocidad se consideró una variable problemática. Embutido 1 2 3 4 5
0,78 0,83 0,83 0,83 0,75
0,75 0,86 0,89 0,88 0,76
Velocidad 0,77 0,80 0,81 0,85 0,89 0,92 0,86 0,79 0,76 0,86
0,81 0,92 0,95 0,98 0,78
0,78 0,85 0,93 1,14 0,97
(143) Un fabricante produce nutrientes en cuatro reactores se sabe que cada reactor tiene sus propias características de procesamiento de modo que cada reactor se considera una variable problemática en cualquier corrida experimental en la fabricación que implica más de un reactor. El ingeniero de planta sospecha que la velocidad de agitación influye en la homogenización y dilución de los productos sólidos. Cada reactor puede operar a cuatro velocidades de agitación distinto.
141
Palacios C. Severo Se efectuó un diseño de bloques aleatorizados para una empresa exportadora, los datos son: Agitación 5 10 15 20
6 9 2 6
Reactor 5 8 6 14 9 14 3 7
4 5 6 9
Análisis 1 2 3 4 5
58,7 61,4 60,9 59,1 58,2
Laboratorio 62,7 55,9 64,5 56,1 63,1 57,3 59,2 55,2 60,3 58,1
60,7 60,3 60,9 61,4 62,3
Existe alguna evidencia de que la velocidad de agitación influya en la disolución de los productos. Que recomienda usted al ingeniero de planta respecto a la elección de la velocidad de agitación y el reactor para este proceso. Existe alguna evidencia de que la velocidad de agitación influya en la disolución de los productos. Que recomendaría usted al ingeniero de planta respecto a la elección de la velocidad de agitación y el reactor del proceso. (144) Se emplean cuatro laboratorios para efectuar un análisis químico. Como parte del estudio para determinar si los datos dan un promedio en los resultados, se le envía a cada uno una muestra del mismo material, los resultados son:
Existe alguna diferencia significativa entre los laboratorios. (145) Se estudia el rendimiento de cuatro detergentes diferentes. Se obtuvieron las siguientes lecturas de blanqueo para 12 cargas de lavado distribuidos en tres modelos de lavado. Detergente A B C D
45 47 48 42
Lavado 43 46 50 37
31 52 55 49
(146) Considere un experimento de 10 tratamientos y 5 replicaciones en el diseño experimental de bloques completos al azar. Muestre un plan de la aleatorización de los tratamientos en las réplicas (Bloques). (147) Quince variedades de maíz fueron sembradas en una estación experimental, con el propósito de seleccionar los de mayor producción. El ensayo se realizó teniendo en cuenta una estructura de bloques. Se midió el rendimiento de maíz tonelada/unidad de superficie y los resultados del ensayo se resumen en la siguiente tabla: Fuente
142
SC
GL
CM
Fo
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Bloque Variedad Error Total
VII.
2
38033,14
7,38
7082935
DISEÑO CUADRADO LATINO
El diseño en bloques aleatorios es adecuado cuando una fuente de variabilidad extraña se elimina comparando un conjunto de medias muéstrales. Una Característica importante de este tipo de diseño es su balance, que se logra asignando el mismo número de observaciones a cada tratamiento de cada bloque. La misma clase de balance puede lograrse en otros tipos de diseño más complicados, en los cuales es conveniente eliminar el efecto de varias fuentes extrañas de variabilidad. El diseño cuadrado latino se usa para eliminar dos fuentes de variabilidad problemática, en otras palabras, permite analizar sistemáticamente por bloques en dos direcciones. En este diseño los renglones y columnas representan, en realidad, dos restricciones a la aleatorización. En general, un cuadrado latino PxP, es un cuadrado que contiene P renglones y P columnas, dada una de la P2 celdas contiene una de las P letras que corresponde a un tratamiento, y cada letra aparece una sola vez en cada renglón y columna, ejemplo. 143
Palacios C. Severo
A C B C B A B A C
,
A B C D B C D A C D A B D A B C
,
A B E C D
E D B D C D E A A C B
D C
B
C
A
A B E
E
Su utilidad esta determinado por la búsqueda de ejercer un control efectivo de posibles fuentes de error en el experimento, derivadas éstas fundamentalmente de las características individuales del material experimental; se puede ampliar las posibilidades de control a dos posibles fuentes, con lo que resulta comparativamente con los diseños anteriores. Esta posibilidad de control de dos fuentes de error determinado por el agrupamiento de las unidades experimentales en un sistema de distribución bi direccional; de tal manera ejecutado, que permita una formación de los grupos que componen cada variante del experimento, con una distribución equitativa, teniendo en cuenta dos posibles fuentes de error. Ejemplo 4.39 Se realizó un experimento para investigar la influencia entre los tiempos medios para ensamblar 4 tipos de equipos aspersores distintos. Hay dos fuentes de variación moderada que afectan la respuesta, la variación entre los operarios y el efecto de la fatiga. Si una persona ensambla una serie de dispositivos durante un cierto tiempo, se desea evaluar dichas influencias. Por consiguiente cuatro operarios fueron seleccionados y cada uno ensambla los cuatro dispositivos de acuerdo al siguiente diseño. Filas 1 2 3 4 Total
Tratamiento Total Media 144
Ensamblado II III A=41 B=30 C=42 D=49 D=41 C=59 B=37 A=53 161 191
I C=44 B=41 A=59 D=58 202 A 202 50,5
B 142 35,5
Total
IV D=40 A=49 B=34 C=59 192 C 204 51
153 181 193 207 763 D 188 47
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Partiendo de la base de datos obtenemos: SCtotal 44 2 412 ... 532 59 2 763 / 16 1330 2
SC SC
153 181 193 207 / 4 763 / 16 365 2
fila
2
2
2
202 161 191 192 / 4 763 / 16 226,5 2
columna
2
2
2
2
2
SCtratamiento 2022 1422 2042 1882 / 4 763 / 16 626 2
SCerror 1330 365 226,5 626 112,5
GL : N 16 n 4 Total : N 1 15 Filas : n 1 3 Columna : n 1 3 Tratamiento : n 1 3 Error : N 3n 2 6
Como se aprecia en la tabla 4.24 del análisis de varianza la columna de fuente no resulto controlada significativamente ya que el valor de F es menor que el Ft(99). Fuente Tratamiento Fila Columna Error Total
Tabla 4.24 Análisis de varianza SC GL CM Fo Ft(99%) 626 3 208,66 11,12 > 9,78 365 3 121,66 6,48 < 9,78 226,5 3 75,5 4,02 < 9,78 112,5 6 18,75 1330 15 R² = 76,5037%
Ejemplo 4.40 Se presenta un experimento, en donde se probaron cuatro métodos distintos, A, B, C y D, para preparar mezclas de concreto. Consistieron los métodos de dos relaciones de cemento y agua, y dos duraciones de mezclado. Los cuatro métodos fueron controlados por cuatro lotes y cuatro días. El concreto se coló en cilindros y se midió la resistencia a la compresión en kg=cm2, a los 7 días de almacenamiento en cámaras especiales con 20°C de temperatura y 50% de humedad relativa. Los resultados del diseño que se uso se presentan en la tabla 4.25 Tabla 4.25 Resistencia del concreto a la compresión en kg=cm2 Días Ensamblado Total
145
Palacios C. Severo
1 2 3 4 Total
I A=303 B=280 C=275 D=304 1162
II B=299 A=321 D=315 C=293 1228
SCtotal 1433270 SCmétodo
SCdías
SClote
III C=290 D=313 A=319 B=295 1217
IV D=290 C=282 B=300 A=305 1177
1182 1196 1209 1197 4784
4784² 28540 16
1 1248² 1174² 1140² 1222² 4784² 17500 4 16 1 1182² 1196² 1209² 1197² 4784² 915 4 16
1 1162² 1228² 1217² 1177² 4784² 7455 4 16
SCerror SCtotal SCtrat SCdías DClote 2670
Con base en los anteriores resultados, se llega a la tabla 4.26 y a partir de la misma, con un nivel de significancía del 5% el valor F es Ft(95%) > 4,75 y puesto que Fo = 13,1, Se concluye que el método afecta la resistencia a la compresión. Además, al parecer los días no difieren significativamente en dicha resistencia (cuadrado medio es pequeño en relación al del error), mientras los lotes si, ya que el cuadrado medio es grande en relación con el error. Tabla 4.26 Análisis de varianza para la resistencia a la compresión en kg=cm2 Fuente SC GL CM Fo Ft(95%) Día 915 3 305 0,68 < 4,75 Lote 7455 3 2485 5.58 > 4,75 Método 17500 3 5833 13,1 > 4,75 Error 2670 6 445 Total 28540 15 R² = 90,6447%
146
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Problemas (148) Se encuentra en estudio el efecto que tienen 5 productos distintos A, B, C, D y E sobre el tiempo de reacción de un proceso. Cada lote de material nuevo es lo suficientemente grande para permitir que sólo se realicen cinco pruebas. Más aún cada prueba tarda hora y media; por lo que solo se pueden realizar cinco ensayos al día. El investigador decide efectuar el experimento usando un diseño cuadrado latino con el fin de controlar sistemáticamente las variables: lote de material y día. Obteniéndose los siguientes datos. Filas 1 2 3 4 5
I A=8 C=11 B=4 D=6 E=4
II B=3 E=8 A=5 C=10 D=8
Ensamblado III IV D=7 C=1 A=3 D=7 C=1 E=10 E=6 B=6 B=8 A=3
V E=7 B=2 D=9 A=8 C=2
(149) Un ingeniero agrónomo está investigando el efecto que tienen cuatro métodos de fumigado (A, B, C y D) sobre el tiempo de cu147
Palacios C. Severo rado de una plaga. Se selecciono cuatro operarios para realizar este estudio. Por otra parte, el ingeniero sabe que cada método produce cierto tipo de intoxicación, por lo que, el tiempo que se tarde en el último fumigado debe ser menor que el primero, independiente del método. En otras palabras, se produce un patrón en el tiempo de fumigado. Para controlar esta posible fuente de variabilidad el ingeniero utiliza el diseño cuadrado latino: Fumigado
Operario II III D=7 A=14 C=1 D=18 B=11 C=10 A=12 B=10
I C=2 B=8 A=9 D=14
1α 1β 1µ 1ε
IV B=10 A=7 D=5 C=10
(150) Se va efectuar un estudio de los movimiento para determinar el mejor diseño de trabajo para montar computadoras, cinco diseño se hallan en estudio. Se seleccionan cuatro estudiantes en ensamblaje aleatoriamente entre un grupo de sesenta, se le enseña minuciosamente a trabajar con los cinco diseños. Estudiante
I A=10 B=5 C=6 D=4
1 2 3 4
Diseño de trabajo III IV C=9 D=14 D=5 E=10 E=5 A=10 A=4 B=11
II B=3 C=10 D=12 E=8
V E=11 A=6 B=6 C=5
Cada estudiante sigue cada diseño durante dos días y se registra el número de computadoras montadas: (151) Se efectúa un experimento de soldadura, empleando el siguiente arreglo: Estudiante 1 2 3
Diseño de trabajo I II III A=14 B=16,5 C=11 B=9,5 C=17 A=15 C=11 A=12 B=13
(152) Se fabrica una cubierta de caucho para una avioneta y se experimenta un cuadrado latino, el experimento es descrito: Prueba 2 3 1 4
I A=251 D=234 C=236 B=195
I
II
Maquina II III B=241 D=227 C=273 A=274 D=236 B=218 A=270 C=230
IV C=229 B=226 A=268 D=225
Ingredientes IV V
VI
(153) Una investigación describe los métodos de preparación de cierto insecticida. Se usa un diseño cuadrado latino para analizar. Mezcla 148
III
VII
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 1 2 3 4 5 6 7
A=98 B=69 C=37 D=65 E=56 F=113 G=64
B=17 E=67 F=83 G=60 D=44 C=15 A=62
C=89 A=70 G=83 E=91 B=70 D=65 F=65
D=64 G=70 B=74 F=56 C=68 A=51 E=86
E=63 F=111 D=70 C=61 A=88 G=83 B=45
F=132 D=60 A=75 B=59 G=111 E=57 C=100
G=244 C=218 E=169 A=150 F=220 B=233 D=187
(154) Una agencia de control supone que existe diferencia en el contenido de nitrato en lotes de fertilizante que son suministrados por un proveedor. Existe en estos momentos gran cantidad de lotes en el almacén. Se han elegido aleatoriamente cinco de estos. Mediante un análisis químico sobre cada lote se obtienen: Análisis
I A=24,3 B=24,4 C=24,6 D=24,9 E=24,0
1 2 3 4 5
II B=24,7 C=24,3 D=24,5 E=24,4 A=24,2
Lote III C=24,3 D=24,9 E=24,7 A=24,5 B=24,8
IV D=24,4 E=24,4 A=24,5 B=24,4 C=24,6
V E=24,3 A=24,4 B=24,6 C=24,4 D=24,9
(155) En un fuelle de herrero se forjan 4 clases de aceros. A una misma temperatura, aunque se sospecha que cada uno de los tipos de acero tiene un punto de caldeo, se trabaja con cada uno de ellos al temple, lográndose los siguientes resultados Acero 1 2 3 4
I A=48 C=41 B=49 D=46
Caldeo II III B=43 D=47 D=48 A=43 A=45 C=41 C=41 B=46
IV C=41 B=47 D=49 A=46
I A=4,9 B=5,1 C=4,7
Fertilizante II III C=4,0 B=4,3 A=5,3 D=4,8 D=4,8 A=5,1
IV D=4,2 C=4,1 B=4,5
(156) Se evalúan tres muestras de tierra fertilizada con abono: químico, natural y compost. Siendo los resultados siguientes. Abono Químico Natural Compost
Analice y obtenga sus conclusiones. (157) Se realiza un experimento para determinar si la temperatura (°C), de horneado afecta en el vidriado de cierto tipo de azulejo. El experimento proporciono los siguientes datos: Temperatura 1300 1400 1500 1800
I C=23 A=24 D=25 B=28
Vidriado II III A=21 B=24 B=22 D=27 C=25 A=29 D=23 C=29
IV D=26 C=25 B=28 A=27
149
Palacios C. Severo (158) Se han preparado tres diferentes tipos de soluciones para eliminar el óxido de joyas (oro y plata). El análisis de realiza en un laboratorio, usando un diseño aleatorizado por bloques. Los datos se recopilaron durante tres días. Solución 1 2 3
I A=13 C=22 B=9,5
Días II B=44 A=12 C=22
III C=16 B=13 A=39
(159) Se utilizan cinco reactores distintos sobre una solución galvánica de dorado electrolítico. Para evaluar se utilizan varios lotes que sólo permiten realizar cinco ensayos por día. La investigación se realiza mediante un diseño cuadrado latino, con el fin de controlar sistemáticamente las variables de material y día. Reactor A B C D E
I A=8 C=6 B=10 D=2 E=8
II B=10 E=1 A=7 C=7 D=4
Lote 1 2 3 4 5
1 A=8 C=11 B=4 D=6 E=4
2 B=7 E=2 A=9 C=8 D=2
Días III D=5 A=3 C=1 E=8 B=6
IV C=8 D=7 E=6 B=2 A=4
V E=3 B=8 D=10 A=9 C=11
(160) Se encuentra bajo estudio el efecto que tienen 5 reactivos distintos (A, B, C, D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material nuevo es lo suficientemente grande para permitir que sólo se realicen 5 ensayos. Más aún, cada ensayo tarda, aproximadamente, 1 hora y media, por lo que sólo pueden realizarse 5 ensayos por día. La investigadora decide efectuar el experimento usando un diseño de cuadrado latino, con el fin de controlar las variables lote de material y día. Ella recolecta los siguientes datos: Día 3 D=1 A=7 C=10 E=6 B=3
4 C=7 D=3 E=1 B=6 A=8
5 E=3 B=8 D=5 A=10 C=8
Analice la tabla de ANOVA Diga que otro diseño experimental pudiera utilizarse. Diga que recomendaría respecto a la elección del reactivo químico, del día y lote para realizar el proceso químico en el menor tiempo posible. Realice un análisis de los residuos. (161) Complete la siguiente tabla de análisis de varianza, concluya e interprete. Se midió el rendimiento de trigo de 4 variedades (tratamientos) en kg/parcela. 150
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Fuente Filas Columnas Tratamiento Error Total
SC
GL
CM
2,72 90,40
Fo 1,44 5,04 58,4 7
VIII. DISEÑO CUADRADO GRECO-LATINO Consideremos un cuadrado latino NxN al que se le sobrepone un segundo cuadrado latino cuyos tratamientos se designan con letras griegas. Se dice que los cuadrados son ortogonales si al sobreponerse poseen la propiedad de que cada letra aparezca solamente una vez en cada letra latina. Este diseño se denomina cuadrado greca-latino. Cuadro 1 2 3 4
I Aα Bβ Cτ Dσ
Columna II III Bβ Cτ Cτ Dσ Dσ Aα Aα Bβ
IV Dσ Aα Bβ Cτ
El análisis de varianza es muy similar al de un cuadrado latino.
151
Palacios C. Severo El factor representado por la letra griega es ortogonal a los renglones, las columnas y los tratamientos de las letras latinas porque cada letra griega ocurre una sola vez en cada renglón, en cada columna y para cada letra latina. Por lo tanto, la suma de cuadrados debido al factor letra griega puede calcularse usando los totales de la letra griega. El error experimental se reduce en esta cantidad. Ejemplo 4.41 Un ingeniero sospecha que en el lugar de trabajo usado por cuatro operarios puede representar una fuerte adición de variabilidad. Es posible introducir al lugar de trabajo α, β, τ, σ a como un cuarto factor. Se produce el cuadrado greca latino que se muestra a continuación. Montaje 1 2 3 4 Total
I Cβ=11 Bα=8 Aσ=9 Dτ=9 37
Operario II III Bτ=10 Dσ=4 Cσ=12 Aτ=10 Dα=11 Bβ=7 Aβ=8 Cα=18 41 39
IV Aα=8 Dβ=12 Cτ=15 Bσ=6 41
Yi 33 42 42 41 158
SC total 9 2 10 2 ... 7 2 15 2 158 / 16 173,75 2
SC fila 332 422 422 412 / 4 158 / 16 14,25 2
SCcolumna 372 412 392 412 / 4 158 / 16 2,75 2
Tratamiento Total Media
A 35 8,75
B 31 7,75
C 56 14
D 36 9
SCtratamientoo 352 312 562 362 / 4 158 / 16 94,25 2
los totales de las líneas de montaje son: Letra Griega α β τ σ
Total de montaje Y1 = 45 Y2 = 38 Y3 = 44 Y4 = 31
SCmontaje 452 382 442 312 / 4 158 /16 31,25 2
152
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería SCerror 173,75 14,25 2,75 94,25 31,25 31,25 GL : N 16 n 4 Total : N 1 15 Filas : n 1 3 Columna : n 1 3 Montaje : n 1 3 Tratamiento : n 1 3 Error : N 4n 3 3
Fuente Tratamiento Fila Columna Montaje Error Total
Tabla 4.27 Análisis de varianza SC GL CM Fo Ft(99%) 94,25 3 31,41 3,017 < 29,5 14,25 3 4,75 0,456 < 29,5 2,75 3 0,91 0,087 < 29,5 31,25 3 10,41 1 < 29,5 31,25 3 10,41 173,75 15 R² = 82,0143%
En el análisis de varianza ninguna de las fuentes de variación controladas resultaron significativas al análisis ya que los valores calculados de F siempre son menores que los valores de Ft.
Problemas (162) Se desea saber si hay diferencia entre cuatro combustibles usados en cuatro sembradoras. Diseñar un experimento grecolatino. Montaje 1 2 3 4
I Aα=14 Bβ=16 Cτ=19 Dσ=15
Operario II III Bβ=16 Cτ=21 Cτ=16 Dσ=11 Dσ=18 Aα=16 Aα=11 Bβ=15
IV Dσ=14 Aα=23 Bβ=16 Cτ=15
(163) Con el fin de mejorar la calidad de las gallinas, se han añadido dos productos químicos en su alimentación. Las distintas cantidades del primero se indican con A, B, C y D. Las del segundo por α, β, τ y σ. Se alimenta a las gallinas ordenados en grupos de acuerdo con sus pesos iniciales 1 1,5 1,8 y 2 153
Palacios C. Severo kilogramos y cuatro especies diferentes. El incremento de peso por unidad de tiempo viene dado en el cuadro. Realice un análisis de varianza del experimento, sacar conclusiones de acuerdo a su criterio. Especies 1 2 3 4
I Aα=3 Bβ=4 Cτ=8 Dσ=6
Peso II III Bβ=6 Cτ=10 Cτ=6 Dσ=5 Dσ=10 Aα=5 Aα=3 Bβ=7
IV Dσ=6 Aα=6 Bβ=8 Cτ=3
IX. PRUEBA DE INTERVALOS MÚLTIPLES DE DUNCAN Procedimiento de uso amplio para comprobar las parejas de medias. Para aplicar dicha prueba en muestras del mismo tamaño, se disponen en orden ascendente los a - promedios del tratamiento y se determina el error estándar para cada promedio. Ejemplo 4.42 Consideremos los datos de la tabla 4.28, siendo el CMerror = 8,06 para N=25 y n=5, el error tiene 20 GL, organizando los promedios Y de tratamientos en orden ascendente se tiene Y1 Y5 Y2 Y3
= = = =
154
9,8 10,8 15,4 17,6
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Y4 = 21,6
Error estándar de cada promedio:
S Yi CM error / n 1,27
r0, 05 (2,20) 2,95 r0, 05 * SYi
r0, 05 (3,20) 3,10 r0, 05 * SYi r0, 05 (4,20) 3,18 r0, 05 * SYi
r0, 05 (5,20) 3,25 r0, 05 * SYi Tabla 4.28 Datos para tratamiento Tratamiento Y1 Y5 Y2 Y 9,8 10,8 15,4 Y4 21,6 11,8 10,8 6,2 Y3 17,6 7,8 6,8 2,2 Y2 15,4 5,6 4,6 Y5 10,8 1
Y3 17,6 4
Y3 y Y2 no existe diferencia significativa Y5 y Y1 no existe diferencia significativa X.
DISEÑO DOBLE REVERSO
En los experimentos de nuestro campo, sin duda, el estudio de la influencia de diferentes factores sobre la producción de ciertos procesos; ocupa uno de los principales lugares por su importancia económica y social. El costo alto de estos experimentos y su duración cuando se utiliza los métodos por grupos, ha exigido estudiar y ampliar nuevas técnicas que permitan reducir los mismos. Tales circunstancias han llevado a investigar un método experimental en grupo-tratamiento, con el objeto de abaratar los costos y reducir el tiempo de ejecución de los mismos. Estudios sobre la producción de leche, huevo, derivados de leche, empollado de huevos, mejoramiento genético, etc. Han permitido establecer una serie de particularidades propias de los mismos, las que uni-
155
Palacios C. Severo das a las técnicas experimentales, han dado origen a diseños que logran una medida importante al resolver los problemas planteados. El diseño doble reverso cumple los principios fundamentales del método de comparación por. grupo-tratamiento, aprovechando las características y la influencia de los diferentes factores sobre si misma. Ejemplo 4.43 Un total de 24 gallinas fueron seleccionadas para un experimento con el objeto de estudiar la influencia entre ponedoras y ordinarias. Con este fin se utilizo el diseño doble reverso que tuvo sub tratamientos experimentales de 30 días con duración semanal. Los tratamientos se identifican como: (a) ponedoras y (b) ordinarias. Gallinas 1 2 3 4 5 6 7 8 9 10 11 12 Total
Tabla 4.29 Sub experimentos I II II b=6 a=7 b=3 b=6 a=9 b=2 a=9 b=3 a=9 b=4 a=8 b=2 a=10 b=12 a=7 a=7 b=7 a=10 a=12 b=4 a=15 a=9 b=6 a=11 b=4 a=15 b=4 b=3 a=18 b=8 b=6 a=9 b=7 a=8 b=4 a=12
d = I – 2II + III d2 d2 -3 9 -10 100 12 144 -10 100 -7 49 3 9 19 361 8 64 -22 484 -25 625 -5 25 12 144 47 -75 2114 d1
Pasemos a continuación al análisis de los resultados de este experimento en relación a la producción de huevos por semanas. Los datos en el caso se organizan de acuerdo al esquema que se siguió en el experimento. Tratamiento A B
Total 185 93
Media 10,28 23,25
SCtotal 2114 47 75 / 12 2065 2
SCtratamientoo 47 2 752 / 6 47 75 / 12 1240,33 2
156
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería SCerror 2065 1240,33 824,67 Fuente Tratamiento Error Total
Tabla 4.30 Análisis de varianza SC GL CM Fo Ft(99%) 1240,33 1 1240,33 15,04 > 10,0 824,67 10 82,467 2065,00 11 R² = 60,0644 %
En función de los resultados existe diferencia significativa en cuanto a la producción de huevos de las gallinas sometidas a tratamiento y esta en función de los datos obtenidos respectivamente. Como puede apreciarse este diseño tiende a dar solución a las limitaciones en los métodos precedentes. Este método fue desarrollado ampliamente para la aplicación en estudios con más de 3 tratamientos y resulta de amplia utilidad en la práctica actual de trabajo.
Problemas (164) Elabore el diseño doble reverso para 14, 15, 20 y 24 pruebas (165) Simule el proceso con tres fertilizantes (Compost, Turba y Químicos) en la siembra de hortalizas. (166) Establezca la diferencia entre el diseño doble reverso y los diseños aleatorizados. (167) Elabore el modelo del ejemplo 4.43 (168) Aporte un criterio de evaluación útil del diseño doble reverso. (169) A los problemas de (156, 157, 158 y 159) elabore sus análisis de varianza.
157
Palacios C. Severo
XI. ESTIMACIÓN DE PARÁMETROS DEL MODELO Las herramientas principales para el diagnóstico de modelos unifactoriales esta basado en los residuos.
ij Yij Y ij Los residuos del i-ésimo tratamiento se determinan restando el promedio del tratamiento a cada observación dentro del tratamiento. Usualmente la comprobación de linealidad del promedio consiste en graficar los residuos, tal como se muestra. Se recomienda que tal comprobación de diagnostico sea un paso de rutina en cada proyecto de diseño experimental. 158
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Ejemplo 4.44 Analizar los datos de la tabla 4.10 % 15 20 25 30 35
7 12 14 19 7
1
-2,5 -3,4 -3,6 -2,6 -3,8
Tabla 4.31 Valores originales y residuos 2 3 4 7 -2,8 15 5,2 11 1,2 17 1,6 12 -3,4 18 2,6 18 0,4 18 0,4 19 1,4 25 3,4 22 0,4 19 1,4 10 -0,8 11 0,2 15 0,2 Orden K 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
εij -3,8 -3,6 -3,4 -3,4 -2,8 -2,8 -2,8 -2,6 -0,8 -0,8 +0,2 +0,2 +0,4 +0,4 +0,4 +1,2 +1,4 +1,4 +1,4 +1,6 +2,6 +2,6 +3,4 +4,2 +5,2
9 8 19 23 11
5
0,8 2,6 1,4 1,4 0,2
Yi 9,5 15,4 17,6 21,6 10,8
PK=(K-1/2)/25 0,02 0,06 0,10 0,14 0,18 0,22 0,26 0,30 0,34 0,38 0,42 0,46 0,50 0,54 0,58 0,62 0,66 0,70 0,74 0,78 0,82 0,86 0,90 0,94 0,98
Los residuos se organizan en forma ascendente y se calculan sus puntos de probabilidad acumulada Pk. La gráfica de probabilidad normal se deja al lector para que lo desarrolle, con los residuos graficados contra Pkx100 en la escala vertical derecha. En la parte inferior los puntos del residuo. XII. POLINOMIO ORTOGONAL 159
Palacios C. Severo
Cuando los niveles de los factores son equidistantes, puede simplificarse mucho el ajuste del modelo polinomial por el método de mínimos cuadrados. El procedimiento utiliza los coeficientes de los contrastes ortogonales. Además del ajuste de mínimos cuadrados del polinomio se obtiene el efecto lineal, cuadrático, cúbico, cuártico y así sucesivamente, así como la suma de cuadrados del factor. Esto permite probar la contribución de cada término al polinomio. Ejemplo 4.45 Los datos de la tabla 4.32 en este problema el factor independiente, porcentaje de algodón, tienen cinco niveles equidistantes. La suma de cuadrados de los efectos lineales, cuadráticos; cúbicos y cuárticos descompone la suma de cuadrados de tratamiento y pueden ser incorporados al análisis de varianza como se muestra. Cada efecto tiene un grado de libertad y puede ser probado comparando su suma de cuadrados en la media de cuadrados del error. % algodón
Total de tratamiento
15 20 25 30 35
49 77 88 108 54
τ Efecto Ci Y
SC CiY / n Ci2 2
Lineal -2 -1 0 1 2 1 41 33,62
Coeficiente de los contrastes ortogonales Ci Cuadrático Cúbico Cuártico 2 -1 1 -1 2 -4 0 0 6 1 -2 -4 2 -1 1 1 5/6 35/2 -155 -57 -100 343,21 64,98 33,95
El modelo polinomial cúbico ajustado a los datos es: Y o 1 P1 ( X ) 2 P2 ( X ) 3 P3 ( X ) SC o Y / N 376 / 25 15,04 SC 1 Ci Y / n Ci2 41/ 5(10) 0,82 SC 2 C i Y / n C i2 155 / 5(14 ) 2,2143
SC 3 CiY / n Ci2 57 / 5(10) 1,14
160
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Como se tiene a=5 niveles de X e Y entre los niveles, d=5 el modelo del polinomio ortogonal es:
Y 15,04 0,82( X 25) / 5 2,2143 X 25 / 5 52 1 / 12 2
1,14(5 / 6) X 25 / 5 X 25 / 5(3(5) 7) / 20 2
resultando el modelo Y 62,611 9,01 X 0,4814 X 2 0,00786 X 3 Fuente % Algodón Lineal Cuadrático Cúbico Cuártico Error Total
Tabla 4.32 Análisis de varianza SC GL CM Fo Ft(95%) 475,95 4 118,94 14,76 > 2,87 (33,62) 1 33,62 4,17 < 4,35 (343,4) 1 343,40 42,58 > 4,35 (64,98) 1 64,98 8,06 > 4,35 (33,95) 1 33,95 4,21 < 4,35 161,20 20 8,06 637,15 28 R² = 74,6998%
Los efectos cuadrático y cúbico del porcentaje de algodón son significativos.
§5 MÉTODOS DE ANÁLISIS Las cosas complejas y estadísticamente improbables, son por naturaleza más difíciles de explicar que las cosas simples y estadísticamente probables. Richard Dawkins
I.
INTRODUCCIÓN
161
Palacios C. Severo
No imite al ebrio que utiliza un poste de luz como apoyo, en vez de
usarlo como iluminación. No deje que el ANAVA (análisis de varianza) se convierta en muleta de un trabajo de campo mal hecho o como sustituto de pensar. Recuerde estas pautas:
Adapte la técnica al problema, no el problema a la técnica: evite enamorarse de un método y tratar de acomodarse siempre a cualquier estudio. No se convierta en tecnócrata. Los resultados son solo tan buenos como los datos: Las técnicas estadísticas no arreglan los malos datos. Por eso sea siempre cuidadoso en la elaboración del diseño y en la toma del vector respuesta. Piense ante, no después de haber hecho el experimento: no amontone todo lo que se le ocurra en el computador con la esperanza de que éste lo clasifique y lo haga intangible para usted. Primero desarrolle hipótesis; luego ensaye sus preguntas. Puede estar casi seguro de que siempre habrá algo que conseguir en un trabajo de investigación. Considere la investigación: usted siempre aprende conforme avanza - sobre cosas que usted hubiera querido añadir y sobre otras que hubiera querido dejar por fuera. Una o dos etapas piloto mejorarán la calidad de un gran estudio final. El análisis estadístico es costoso; por eso, proceda en forma planificada. Encuentre la forma de comunicar los resultados con claridad: La mayoría de los investigadores no están familiarizados con estas técnicas y por eso hay peligro de confundirlo con datos y con jergas. Busque maneras de comunicar las técnicas y sus resultados en una forma fácil de entender. Mantenga el análisis estadístico como un medio, no como un fin: "Correr un análisis conglomerado" no ayuda mucho si no contribuye al objetivo general del estudio. Empiece con el problema, no con la técnica.
Las técnicas estadísticas de análisis prueban ser herramienta muy valiosa. Su papel más útil generalmente es complementar análisis y juicios directos reuniendo variables complejas en un solo análisis. Es arriesgado hacer depender todo el estudio, de una sola técnica. Un procedimiento mejor es experimentar con estas técnicas como parte del estudio hecho con otros fines; luego, proseguir con un estudio más grande después de que el valor y la aplicabilidad de la técnica se hayan aprobado. 162
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería II.
MÉTODOS NO PARÁMETRICOS
En la práctica aparecen situaciones en las que los requisitos no están justificados, como es el caso de una población fuertemente asimétrica. A causa de ello, se han creado métodos que son independientes de las distribuciones de la población y de los parámetros asociados. Las pruebas no paramétricas se pueden usar como observaciones de contraste más complicada. Son especialmente útiles cuando se trata con datos no numéricos, por ejemplo, cuando los consumidores colocan productos por orden de preferencia. III. PRUEBA U DE MANN-WHITNEY Consideremos dos productos distintos de los cuales obtenemos dos muestras, queremos decidir si hay o no diferencia entre las muestras, o sea, si proceden o no de una misma muestra poblacional. Es conveniente una prueba no paramétrica consistente en los siguientes pasos: 1.
Combinar todos los valores muéstrales en una ordenación ascendente y asignar rangos a todos los valores. Si dos o más muestras son idénticas, se le asigna a cada uno un rango que es la media de los rangos que los ubica con tal coincidencia. 2. Hallar la suma de los rangos para cada muestra, denominándolo Rn y los tamaños muéstrales Nn. Por conveniencia elegimos N1 al menor. Una diferencia significativa entre la suma del rango R1 y Rz, implica una diferencia entre las muestras. 3. Para encontrar la diferencia entre las sumas de rangos, usamos: U Ni N j
N i ( N i 19) Ri 2
i j
La distribución muestral U es simétrica y tiene una media U
Ni N j 2
y una varianza U2
N i N j ( N i N j 1) 12
163
Palacios C. Severo Si Ni y Nj son ambas al menos iguales a 8, resulta que la distribución de U es aproximadamente normal z
U U U
Esta normalmente distribuido con media cero y varianza 1. Un valor correspondiente a otra muestra viene dada por. U Ni N j
N i ( N i 19) Ri 2
i j
Además U i U j Ni N j b33 0,676
Donde: N = Ni + Nj
Ejemplo 5.46 Se desea determinar si hay diferencia entre los telares I y II, al nivel de significancía del 0,05. 1 2 3 4 5
11,7 11,8 12,6 12,9 14,1
Tabla 5.33 Datos de telares I y II 6 14,7 11 17,8 7 15,2 12 18,3 8 15,9 13 18,9 9 16,1 14 19,6 10 16,9 15 20,5
16 17 18
22,7 24,2 25,3
Combinando los 18 valores de la muestra en ordenación ascendente, tal como se indica en la tabla 5.33, en la segunda fila se asignan los rangos. Donde N 8 1
N 10 2
Además R 106 1
164
R 65 2
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería U 8 10 8 9 / 2 106 10
U 8 * 10 / 2 40
U2 8 *10 *19 / 12 126,67
la distribución es z 10 40 / 11,25 2,67 Resistencia 18,3 16,4 22,7 17,8 18,9 25,3 16,1 24,2 Suma
Textil I
Rango 12 10 16 11 13 18 9 17 106
Textil II Resistencia 12,6 14,1 20,5 10,7 15,9 19,6 12,9 15,2 11,8 14,7 Suma
Rango 3 5 15 1 8 14 4 7 2 6 65
como la hipótesis Ho que estamos estudiando es que no hay diferencia entre los telares, entonces Ho
si
1,96
z
1,96
Rechazamos y concluimos que hay diferencia entre los telares al nivel del 0,05. IV. PRUEBA H DE KRUSKAL-WALLIS Con esta prueba podemos decidir si dos muestras provienen o no de la misma población. Una generalización para k muestras de KruskalWallis con sus pruebas. La prueba puede describirse como: sean k muestras de tamaño N k, con suma total N, supongamos que los datos de todas las muestras se ordenan y que las sumas de rangos para las k muestras son Rk respectivamente. Definido:
165
Palacios C. Severo Rj 12 3( N 1) N ( N 1) N j 2
H
Ejemplo 5.47 Una fabrica de tejidos desea comprar una de cinco maquinas diferentes. En un experimento diseñado para saber si hay diferencia en la eficacia de tales maquinas, cinco operarios expertos trabajan en cada maquina un tiempo determinado. Los resultados se escogen y ordenan en forma ascendente pero colocada por orden de presentación. 1 2,5 2,5 4
42 48 50 50
A B C D E
6,5 6,5 6,5 6,5
53 53 53 53
9 10 11 12
57 60 61 63
14 14 14 16
64 64 64 65
A B C D E
68 72 60 48 64
72 53 82 61 65
77 63 64 57 70
17,5 21 10 2,5 14
21 6,5 25 11 16
24 12 14 9 19
1 6,5 23 14 17,5
17,5 17,5 19 21
68 68 70 72
21 21 23 24 25
72 2 75 77 82
4253 5348 7572 6450 6853 6,5 2,5 21 4 6,5
Rango 70 48,5 93 40,5 73
H 6,44
Para K-1=4 grados de libertad al nivel de significación 0,05 X 02,96 . Puesto que 6,44 < 9,49 no podemos rechazar la hipótesis de igualdad entre las maquinas. Podemos aceptar la hipótesis de que no hay diferencia entre las maquinas. V.
MÉTODOS MULTIVARIABLES
Cuando varias variables se analizan juntas, el procedimiento se llama análisis multivariable. El primer paso analítico en la mayoría de los proyectos de investigación es una tabulación cruzada directa de los resultados. 166
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Las técnicas multivariables más utilizada en el análisis son:
Análisis de regresión múltiple Interacción automática Análisis discriminante Análisis de factores Análisis de conglomerados Escalas multidimensionales Análisis conjunta.
Las tres primeras técnicas miden la dependencia entre variables. Estos métodos tienen que ver con dos tipos de variables, y es importante entender la distribución entre ellos. Variables dependientes Estas son las variables que usted esta tratando de predecir o explicar. Un ejemplo típico es el volumen de utilización de un producto o de utilización de un cierto tipo de equipo. Variable independiente Estas son las variables que explican o predicen diferencias en las variables dependientes. Las otras cuatro técnicas, están diseñados para medir la interdependencia entre las variables. En este método no hay variable dependiente o independiente. Análisis de regresión múltiple Este tipo de análisis enfoca una ecuación de predicción que relaciona una variable dependiente y un conjunto de variables independiente. Esta es una de las técnica multivariable más básicas. Es muy útil para predecir el intervalo de una variable dependiente. El procedimiento proporciona la ecuación correspondiente a la línea recta que mejor se ajusta a los datos. La ecuación de esta línea recta se puede usar como ecuación de predicción. La ecuación se desarrolla mediante un procedimiento conocido como mínimos cuadrados y corresponde a una línea recta, no es apropiado para situaciones donde la relación entre las variables dependiente e independiente no es lineal. Interacción automática 167
Palacios C. Severo
Al igual que la regresión múltiple, la interacción automática es un método para analizar la relación entre una variable dependiente y varias variables independientes. Pero mientras el análisis de regresión múltiple produce una ecuación predictiva que describe la relación, la interacción automática genera una serie de ecuaciones de dos vías, seleccionado en cada división la variable independiente que explica la mayor variación en la variable dependiente. Análisis discriminante El procedimiento determina las variables predictivas más estrechas que identifican a un subgrupo en la muestra, es decir, identifica las variables que son las discriminadoras entre los miembros de los subgrupos cuyo comportamiento se quiere predecir. La técnica puede usarse con variables de dos grupos. Análisis de factores Sirve para analizar las interrelaciones entre variables e intenta reducirlas a un conjunto más pequeño. En procesos sociales es común medir un gran número de datos, por esta razón se cree que en la mayoría de los casos todas estas variables son facetas de un número menor de variables subyacentes. El propósito del análisis de factores es establecer la cantidad de variables que sustenten el fenómeno. Análisis de conglomerados Define los grupos naturales de objetos que son similares dentro de una población muestra. El análisis de conglomerado crea sub muestras cuyos miembros son similares entre ellos con los demás. Es decir identifica conglomerados de unidades homogéneas. Escalas multidimensionales Es un análisis matemático de percepciones y preferencias que los miembros tienen en el espacio muestra. Análisis conjunta Es una técnica que separa de sus componentes los juicios globales de los informantes sobre alternativas complejas, tales como característica de un producto. 168
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería VI. CORRELACIÓN DE SPEARMAN Se utiliza este método para medir la correlación de dos variables X e Y. En lugar de usar valores precisos de las variables, o cuando tal precisión no es alcanzable, a los datos se les puede asignar un rango de 1 a N ordenándolo por su tamaño, importancia, preferencia, etc. Dicha asignación viene dada por: rS 1
6 D 2 N ( N 2 1)
Ejemplo 5.48 Se analiza agua contaminada de 10 estanques, además para ver la confiabilidad de dicho análisis se procede a realizar los cálculos analíticos para ver su dispersión. Laboratorio Teórico
8 9
3 5
9 10
2 1
7 8
10 7
4 3
6 4
1 2
5 6
Diferencia de rangos: D D2
-1 1
-2 4
-1 1
1 1
-1 1
3 9
1 1
2 4
-1 1
-1 1
rS 1 (6 * 24) / 10 * (10 2 1) 0,8545
Indica que hay marcada relación entre los análisis de laboratorio y teórico. Análisis de varianza El análisis de varianza es una técnica que resulta útil para mejorar la precisión de un experimento. Supongamos que en un experimento la variable respuesta Y está relacionada linealmente con la variable independiente X. Además, el experimentador no puede controlar la variable X pero puede medirla al mismo tiempo que a Y. Con el análisis de varianza se busca adaptar el valor observado de la respuesta para tomar en cuenta el efecto de la variable concominante. Si no se lleva a cabo dicho ajuste, la variable concominante puede aumentar la media del cuadrado del error, con lo que hay mayor dificultad en la detección de diferencias reales en la respuesta debidos a los tratamientos. Por lo tanto, el análisis de covarianza es un método para tomar en cuenta el efecto de algunas variables que no pueden ser controladas. 169
Palacios C. Severo
Ejemplo 5.49 Se usan tres maquinas distintas para producir fibras para una empresa textil. El ingeniero de proceso esta interesado en determinar si existe diferencia en los resultados de la fibra producida por las tres maquinas. Sin embargo, la resistencia de la fibra depende del grosor de la misma, siendo más resistente las fibras de mayor grosor. Se selecciona una muestra aleatoria de cinco fragmentos para cada maquina siendo. Y: resistencia de cada fibra y X: grosor. Maquina I Y X 36 20 41 25 39 24 42 25 49 32 207 126
Maquina II Y X 40 22 48 28 39 22 45 30 44 28 216 130
Maquina III Y X 35 21 37 23 42 26 34 21 32 15 180 106
2
2
SCYY 362 412 ... 342 322 603 / 3(5) 436,40 SC XX 202 252 ... 212 152 362 / 3(5) 261,73
SC XY 20 * 36 2 25 * 412 ... 21 * 34 2 15 * 32 2 362 * 603 / 3(5) 282,60
YY 207 2 216 2 180 2 / 5 603 / 3(5) 140,40 2
XX 126 2 1032 106 2 / 5 362 / 3(5) 66,13 2
XY 126 * 207 130 * 216 106 *180 / 5 362 * 603 / 3(5) 96,00
YY SCYY YY 346,40 140,40 206,00 XX SC XX XX 261,73 66,13 195,50
XY SC XY XY 282,60 90,00 186,60 SC´ SCYY SC XY / SC XX 346,40 282,6 / 261,73 41,27 2
2
SC YY XY / XX 206 186,6 / 195,6 27,99 2
2
SC´ SC 41,27 27,99 13,28 170
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Fo SC´ SC /a 1 /SC / an 1 1
Fo 13,28 / 2 / 27,99 / 11 2,61
F90 , 2 ,11 2,86 XY / XX 186,6 / 195,6 0,954
Fo XY / XX / CM error 186,6 / 195,6 / 2,59 70,08 2
2
F90 , 2 ,11 9,65 Y1
Ajustada Y1 X 1 X 41,4 0,954 25,2 24,13 40,38
Y2
Ajustada Y2 X 2 X 43,2 0,954 26,0 24,13 41,42
Y3
Ajustada Y3 X 3 X 36,0 0,954 21,2 24,13 38 ,80
Fuente
GL
Maquina Error Total Maquina ajustada
2 12 14
Tabla 5.34 Análisis de varianza SC Y X XY Y 66,13 96,0 140,4 195,60 186,6 206,0 27,99 261,73 282,6 346,4 41,27 13,28
GL
CM
11 13 2
2,54 6,64
Problemas (170) Se dan los rangos de 10 estudiantes en mitad de semestre y a fin de semestre obtenido en los exámenes de estadística. Compute el coeficiente de correlación de Spearman e interprételo. Mitad de semestre Fin de semestre
1 5 4
2 4 1
3 8 10
4 2 5
Estudiantes 5 6 7 6 1 3 6 9 7
8 7 8
9 10 2
10 9 3
171
Palacios C. Severo (171) Una Empresa textilera desea comprar una de cinco maquinas diferentes. En un experimento diseñado para saber si hay diferencia en la eficacia de tales maquinas, cinco operarios trabajan en cada maquina un tiempo determinado. Los resultados se escogen y ordenan en forma ascendente pero colocada por orden de presentación 1 2 2,5 4
24 28 37 39
6 6,5 7 7,5
43 45 52 53
9 10 11 12
58 62 63 64
13 14 15 16
65 66 67 68
17 17,5 19 21
69 71 73 75
23 24 26 28 32
77 78 79 80 82
(172) Se analiza Aire contaminado de 10 Ingenios mineros, además para ver la confiabilidad de dicho análisis se procede a realizar los cálculos analíticos para ver su dispersión. Laboratorio Teórico
12 11
Laboratorio Teórico
0,011 0,011
8 6
9 12
7 4
9 12
18 14
6 4
9 6
3 4
5 6
(173) Se analiza Aire contaminado con ácido cianhídrico de una empresa minera aurífera, además para ver la confiabilidad del análisis químico se procede a realizar los cálculos analíticos para ver su dispersión. 0,08 0,06
0,09 0,012
0,07 0,04
0,09 0,012
0,018 0,014
0,06 0,04
(174) Se usan tres maquinas distintas para producir Queso cremo para una empresa Lechera. La ingeniera a cargo de la investigación esta interesada en determinar si existe diferencia en los resultados del Queso cremoso producido por las doss maquinas. Se selecciona una muestra aleatoria de cinco fragmentos para cada maquina siendo. Y: sabor y X: dureza. Maquina I Y X 0,31 0,29 0,40 0,27 0,32 0,22 0,49 0,20 0,48 0,39 2,00 1,37
Maquina II Y X 0,49 0,20 0,45 0,29 0,30 0,27 0,42 0,35 0,41 0,29 2,07 1,40
(175) Se usan tres maquinas distintas para producir Yogur para una empresa Heladera. La ingeniera de proceso esta interesada en determinar si existe diferencia en los resultados del Yogur producida por las tres maquinas. Se selecciona una muestra aleatoria de cinco fragmentos para cada maquina siendo. Y: consistencia y X: sabor. Maquina I Y X 31 29 40 27
172
Maquina II Y X 49 20 45 29
Maquina III Y X 39 28 35 26
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 32 49 48 200
22 20 39 137
30 42 41 207
27 35 29 140
49 43 47 213
29 24 19 126
(176) Se dan los rangos de 10 estudiantes en mitad de semestre y a fin de semestre obtenido en los exámenes de diseño experimental de una Universidad Estatal del Sur del Perú. Compute el coeficiente de correlación de Spearman e interprételo. Mitad de semestre Fin de semestre
1 15 14
2 14 11
3 18 10
4 12 15
Estudiantes 5 6 7 06 11 13 06 09 07
8 17 08
9 10 12
10 09 13
§6 DISEÑOS EXPERIMENTALES APLICADO A INGENIERÍA 173
Palacios C. Severo
La estadística ha demostrado que la mortalidad de los militares aumenta perceptiblemente durante tiempos de guerra. Alphonse Allais
I.
INTRODUCCIÓN
En muchos procesos experimentales de carácter exploratorio, el in-
vestigador se enfrenta con el problema de determinar el efecto de un gran número de variables. En estas condiciones, es necesario establecer un procedimiento aceptable para elegir las condiciones de cada uno de los ensayos experimentales. La estrategia estadística en el diseño de experimentos consiste en el procedimiento sistemático y controlado para desarrollar las combinaciones correctas de condiciones variables para que el análisis resulte confiable. En la industria se utilizan tres tipos de diseños fundamentales de experimentación estadísticamente diseñados, que son: a) Diseños Factoriales b) Diseños Rotables c) Operaciones Evolutivas Se ha desarrollado un nuevo diseño de mucha utilidad para los procesos industriales al cual he denominado Diseño Severo. Antes de estudiar con amplitud estos métodos conviene familiarizarse con la nomenclatura utilizada en este campo del análisis estadístico. A las variables experimentales las llamamos factores, el valor numérico del factor se denomina nivel. La combinación de factores que se utilizan en ciertos ensayos experimentales se llama tratamiento. El resultado del ensayo se llama efecto. Si la cantidad de material que se procesa es limitada, de manera que resulta necesario utilizar varios lotes de material, cuyas características son similares pero no idénticas, cada lote se llama bloque. Si el mismo experimento se repite en las mismas condiciones se llama replica. La aplicación de estas técnicas a una estrategia experimental puede ilustrarse considerando la optimización de las consideraciones operativa de un proceso. 174
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Ejemplo 6.50 Todo proceso científico, tecnológico y social esta vinculado bajo el siguiente esquema: a) b) c)
El insumo varia por su calidad, cantidad y la variedad. El proceso varia si es continuo (dinámico) o Bach (estacionario). El control si es de calidad, de rendimiento o eficiencia (cualitativo o cuantitativo).
Donde al variar el insumo en el proceso el control es muy distinto para cada caso.
Ejemplo 6.51 Se lixivia un desecho minero conocido como cola (relave, desecho, desmonte) con alto contenido de plata, estaño, plomo y cobre. En medio ácido bajo dos procesos distintos: a) Clorurado en donde los componentes lixiviados fueron complejos de plata. b) Nitratado en donde se forma compuestos de nitrato de plata. Siendo el insumo el desecho de mineral a diferentes dosificaciones de cloruros y nitratos. El procedo viene a ser la disolución al dosificarse el cloruro o nitrato en medio ácido, a fin de disolver la plata en forma de complejo clorurado de plata o nitrato de plata. El vector de control viene a ser la recuperación del metal valioso (plata) de la cola (relave, desecho, desmonte). 175
Palacios C. Severo
La recuperación de la plata de los dos medios acuosos (insumo en donde esta la plata en forma ionica) se efectúa por medio de la precipitación (cementanción) con chatarra de hierro obteniéndose los siguientes productos respectivamente. 2 Ag Fe 2 AgO Fe2 2 Ag Fe 2 Ag Fe 2
Dos productos distintos en donde el insumo es el mismo, produciendo un control distinto en la recuperación del metal valioso, en cada tipo de medio acuoso.
Problema (177) En un centro educativo se ve el rendimiento académico de los estudiantes alimentados y desnutridos, Obteniéndose el gráfico asintótico ascendente y descendente respectivamente. ¿Evalué el insumo en el proceso de aprendizaje? (178) Se procesa un mineral aurífero con dos reactivos con el fin de evaluar el rendimiento de recuperación de oro de dicho material. 176
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería ¿Plante un diseño factorial para el presente proceso? (179) Se realiza la comparación de dos procesos para la recuperación de oro, siendo el proceso convencional la cianuración y el proceso innovativo el Proceso SEVERO. Plantee un diseño experimental para los procesos mencionados. (180) Se tiene una solución ácida de cloruro de plata y desea precipitarse electrolíticamente dicho metal, se pide al lector que factores influyen en dicho proceso y a que niveles trabajaría. (181) Al problema 169 en vez del proceso electrolítico se desarrolla el proceso de cementación con chatarra de hierro, que factores y niveles utilizaría para desarrollar el proceso. (182) Se tiene una solución ácida de cobre, del cual se quiere recuperar el cobre por vía electrolítica, se pide que se evalué dos factores: densidad de corriente y concentración de cobre. ¿Proponga un tipo de diseño? (183) Se quiere recuperar cobre de una solución ácida, para el cual se adiciona chatarra de hierro, el cobre producto de dicha precipitación es de calidad comercial, a partir de dicho cobre se desea producir sulfato de cobre de calidad comercial. ¿Elabore un diseño que produzca una sola variación con los dos productos obtenidos?
II.
DISEÑOS BIFACTORIALES
Por diseño Bifactorial se entiende aquel en el que se investigan todas las posibles combinaciones de los niveles de los factores, en cada ensayo completo o réplica del experimento. Por ejemplo, si existen a-niveles del factor A y b-niveles del factor B, entonces cada réplica del experimento contiene todas las ab combina-
177
Palacios C. Severo ciones de los tratamientos. A menudo, se dice que los factores están cruzados cuando éstos se arreglan en un diseño factorial. El efecto de un factor se define como el cambio en la respuesta producida por un cambio en el nivel del factor. Este se conoce como efecto principal. Ejemplo 6.52 Consideremos los datos de la tabla 6.34. El efecto del factor A es la diferencia entre las respuestas promedio en el primero y segundo nivel de ese factor. Tabla 6.34 Experimento factorial a) Interactivo
b) Sin interacción
Numéricamente A 12 10/ 2 4 5/ 2 6,5
Interpretando este resultado nos indica que incrementando el factor A del nivel 1 al 2 produce un cambio en la respuesta promedio de 6,5 unidades. 178
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Para el efecto B: A 5 10/ 2 4 12/ 2 0,5
Interpretando este resultado indica un decremento del factor B del nivel 1 al 2 produciendo un cambio en la respuesta promedio de -0,5 unidades. Como en este caso la diferencia en la respuesta entre los niveles de un factor no es la misma en todos los niveles de otros factores. Cuando esto ocurre existe una interacción entre los factores. Gráficamente podemos visualizar este fenómeno,
Ejemplo 6.53 Un investigador diseña un calefactor eléctrico para mantener constante la temperatura de una Piscigranja debiendo este ser sometido a ciertas variaciones de temperatura. El único parámetro de diseño que él puede seleccionar en este punto es el material de la cubierta de calefacción, y tiene tres alternativas. Cuando el calefactor se manufactura y se envía a la Piscigranja, el investigador no tiene control sobre los extremos de temperatura a que será expuesto, sabe por experiencia que es probable que la temperatura influya en la duración efectiva del calefactor. El investigador decide probar los tres materiales de la cubierta a tres niveles de temperatura ( 2°C, 8°C y 12°C). Se prueban tres calefactores a cada combinación de material de la cubierta y temperatura y las 36 pruebas se ejecutan al azar. En la tabla 6.35 se presenta el experimento y los datos resultantes de duración observada de los calefactores. 179
Palacios C. Severo
Material 1 2 3 Total
Tabla 6.35 Datos para el experimento del calefactor eléctrico Temperatura 2 8 12 20 70 150 188 138 110 230 623 576 82 58 126 126 168 160 136 122 25 70 130 155 479 198 539 106 115 58 45 74 180 34 40 150 174 96 104 229 583 342 80 75 139 120 82 60 938 1404 1457
Yi 1429 1216 1154 3799
SCtotal 20 2 70 2 ... 82 2 60 2 3799 2 / 36 77646,79 SCmaterial 1429 2 1216 2 1154 2 / 3 * 4 3799 2 / 36 10683.72 SCtemperaturaa 9382 14042 14572 / 3 * 4 37992 / 36 39118,72 SCint eracción 230 2 ... 342 2 / 4 3799 2 / 36 10683.72 39118,72 9613,78
SCerror 77646,97 10683,72 39118,72 9613,78 18230,75
En la tabla 6.36 se muestran los resultados del procedimiento. Fuente Material Temperatura Interacción Error Total
Tabla 6.36 Análisis de varianza SC GL CM Fo 10683,72 2 5341,86 7,91 39118,72 2 19558,36 28,97 9613,78 4 2403,94 3,56 18230,75 27 675,21 77646,97 35
Ft(99) 5,53 5,53 4,14
Ft(95) 3,37 3,37 2,74
Se concluye que no existe interacción para un F t(99)=4,14 entre el tipo de material y la temperatura. Además son significativas los efectos principales del tipo de material y la temperatura para F t(99)=5,53. En cambio para Ft(95) existe interacción así como influencia de los efectos principales.
180
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Gráfica de tipo de material contra temperatura.
Como una interpretación auxiliar de los resultados en este experimento resulta útil la construcción de una gráfica de las respuestas promedio en cada combinación del tratamiento. El hecho de que las rectas no son paralelas indica una interacción significativa tan solo para Ft(95). En general a menos temperatura, mayor duración, independiente del tipo del material. Al variar la temperatura de baja a intermedia la duración aumenta con el material tipo 2 mientras que disminuye con el material tipo 1 y 3. Cuando la temperatura varia de intermedio a alta, la duración disminuye con los materiales tipo 3 y 2, mientras que con el tipo 1 permanece sin cambio, al parecer, el material tipo 2 da los mejores resultados. III.
COMPARACIÓN MÚLTIPLE
Si el análisis de varianza indica que hay diferencia en el nivel medio de los renglones y columnas, es de interés llevar a cabo comparación entre las medias individuales de renglón y columna para describir las diferencias significativas. Y22 = 9,8
Y32 = 10,8
Y12 = 15,4
Error estándar de cada promedio SYi CM error / N 675,21/ 4 12,99
Del apéndice obtenemos los valores críticos para 27 GL y 95% de significación 181
Palacios C. Severo r0,05 (2,27) 2,91*12,99 37,80
r0,05 (3,27) 3,06 *12,99 39,75
Tabla 6.37
Tratamiento
Yij 21,6 17,6
Y12 Y32
Y22 9,8 11,8 7,8
Y32 10,8 10,8
Y1 y Y3 no existe diferencia significativa El modelo estimado para el presente caso es: Material
Y1
1 2 3
1429 1216 1154
r Efecto ΣCiY SC[(ΣCiY)2/n ΣCi2]
Coeficientes de los contrastes ortogonales Lineal Cuadrático -1 1 0 -2 1 1 1 3 275 151 12604,16 1266,72
SCo Y / N 3799/ 36 105,52 1SC1 CiY / n Ci2 275/ 3(2) 45,83 2 SC2 CiY / n Ci2 3 *151/ 3(6) 25,164
El modelo del polinomio ortogonal es: Y 225,11 79,35X 1 25,164X 2 Fuente Material Lineal Cuadrático Error Total
Tabla6.38 Análisis de varianza SC GL CM Fo 10683,72 4 5341,86 7,91 12604,16 1 12604,16 18,66 1266,72 1 1266,72 1,83 18230,75 27 675,21 31
El efecto lineal es significativo. S mod elo SCmaterial SCtemp scint eracción 59413,22 R 2 SCmodelo / SCtotal 0,765
182
> >
Ft(65) 3,36 4,22 4,22
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería IV.
DISEÑO ANIDADO
En ciertos experimentos multifactoriales, los niveles de un factor son similares pero no idénticos pero diferentes del otro factor. Tal arreglo se conoce como diseño anidado con los niveles del factor. Ejemplo 6.54 Un industrial compra materia prima por lotes a tres proveedores. La pureza de la materia prima varia considerablemente, lo cual causa problemas en el control del producto terminado. Se desea determinar si la variabilidad en la pureza puede atribuirse a diferencias entre los proveedores. Cuatro lotes de materia prima de cada proveedor se seleccionan al azar y se hacen tres determinaciones de la pureza sobre cada lote. Esto por supuesto, corresponde a un diseño anidado. Los datos después de codificarse aparecen en la tabla. Lote
Tlote Tproveedor
1 94 92 93 279
Proveedor I 2 3 4 91 91 94 90 93 97 89 94 93 270 278 284 1111
Tabla 6.39 Proveedor II 1 2 3 4 94 93 92 93 91 97 93 96 90 95 91 95 275 285 276 284 1120
1 95 97 93 285
Proveedor III 2 3 91 94 93 92 95 95 279 281 1130
4 96 95 94 285
SC total 313935 33612 / 36 148,31 SC proveedor 11112 11202 11302 / 4 * 8 33612 / 36 15,06 SClote 279 2 270 2 ...2812 285 2 / 3 11112 1120 2 1130 2 / 4 * 8 69,92
SCerror 313935 2792 2702 ... 2812 2852 / 3 63,33
GL : N 36 n 4 m 3
Total : N 1 35 Pr oveedor : m 1 2
Lote: m(n 1) 9 Error : mn(2 1) 24
183
Palacios C. Severo
Fuente Proveedor Lote Error Total
184
Tabla 6.40 Análisis de varianza SC GL CM Fo 15,06 2 7,53 0,97 69,92 9 7,77 2,94 63,33 24 2,64 148,31 35
< >
Ft(99) 2,26 2,26
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Problemas (184) Un ingeniero de procesos sospecha que el acabado de una pieza no metálica (polietileno) depende de la alimentación y la temperatura. Selecciona tres niveles de alimentación y eligió aleatoriamente cuatro niveles de temperatura a continuación se realiza un experimento Bifactorial. Alimentación m/min 0,508 0,635 0,762
160 60 80 76 99 110 111 99 110 107
Temperatura (°) 180 200 74 99 64 104 60 96 119 104 88 99 92 95 98 114 104 108 88 110
240 98 108 99 92 86 88 104 88 102
Analice los datos. Elabore una gráfica de los residuos. Estime los componentes de varianza con la temperatura. (185) Se estudian factores que influyen en la resistencia de ruptura de una fibra. Se eligen al azar tres maquinas y dos operarios y se realiza un experimento Bifactorial usando la fibra de un mismo lote de producción. Operario
1 110 111 112 115
1 2
Maquina 2 111 109 114 119
3 114 112 120 117
(186) Un ingeniero electromecánico estudia la fuerza producida por un torno. Sospecha que los factores más importantes son las revoluciones del motor y la alimentación. Se selecciona aleatoriamente cuatro niveles de alimentación y se usan los niveles de velocidad de rotación baja y alta para representar las condiciones de operación extrema. Analice los datos. Velocidad Torno 980 1200
0,15 2,85 2,80 2,45 2,44
Rapidez alimentación 0,30 0,45 2,86 2,94 2,87 2,88 2,70 2,75 2,78 2,86
0,60 2,83 2,86 2,60 2,72
(187) Se realizó un experimento para determinar si la temperatura influye en la cocción de un azulejo ordinario producto de arcillas contaminadas. 185
Palacios C. Severo Azulejo
800 988 1026 1004 1063 1080 1043
1 2
Temperatura °C 850 526 538 532 565 510 590
900 528 547 521 570 565 583
(188) Un fabricante esta estudiando la tasa de combustible para tres tipos de estufas. Se seleccionan aleatoriamente tres lotes de combustible y se recopilan cuatro observaciones de la razón de calefacción en cada lote. Analice los datos y obtenga conclusiones. Lote
1 15 25 20 26
Proceso I 2 16 19 28 20
3 13 15 17 14
1 35 19 17 14
Proceso II 2 27 25 24 21
3 25 18 21 17
1 25 14 15 20
Proceso III 2 27 35 21 29
3 33 38 54 50
(189) Un Ingeniero está estudiando el calibrado y afino de un embolo producido por tres fresadoras. Cada fresadora tiene 2 ejes. Se seleccionan aleatoriamente cuatro componentes de cada eje. Analice los datos. Lote
186
Proceso I 1 2 9 15 10 13 8 19 16 14
Proceso II 1 2 10 10 11 12 13 11 12 14
Proceso III 1 2 15 9 15 11 14 12 8 12
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería V.
DISEÑOS FACTORIALES
El término experimento factorial o arreglo factorial hace referencia a la constitución de los tratamientos o combinaciones de tratamientos que se desean comparar. Este término no afecta lo que se conoce como diseño de tratamientos, pues este se refiere a la selección de factores que se desean estudiar los niveles de los factores a ensayar y combinación de éstos. De esta forma se debe dejar en claro que el diseño de tratamientos es independiente del diseño experimental, el cual hace referencia a la manera en que los tratamientos se aleatorizan a las diferentes unidades experimentales y la forma como se controla la variabilidad natural de las mismas. Así el diseño experimental puede ser completamente aleatorizado, bloques completamente aleatorizados, cuadrados latinos, etc., y para cada uno de éstos diseños se puede tener un arreglo factorial. En muchos experimentos el éxito o fracaso del ensayo depende más de la selección de los tratamientos que se desea comparar que de la elección del diseño. Sin embargo, la selección de ambos (del diseño y de los tratamientos) es importante por tanto ninguno de los dos debe descuidarse en la planeación del experimento. En un experimento factorial se investigan simultáneamente los efectos de cierto número de diferentes factores. La necesidad de estudiar conjuntamente varios factores obedece principalmente a dos razones: a. Encontrar un modelo que describa el comportamiento general del fenómeno en estudio. Esto se restringe al rango de variación de los niveles de los factores. b. Optimizar la respuesta o variable independiente, es decir, encontrar la combinación de niveles de los factores que optimizan esa respuesta. Los tratamientos en el análisis factorial consisten en todas las combinaciones se forman de los distintos niveles de los factores. Por ello, la característica esencial que hace necesario el estudio conjunto de factores es la posibilidad de que el efecto de un factor cambie en presencia de los niveles de otro factor, es decir, que los factores interactúen, lo cual conlleva al concepto de interacción entre ellos. Si se estudia un factor en forma separada el resultado puede ser diferente al que daría con un estudio conjunto, y es mas difícil describir el comportamiento general o encontrar el óptimo. 187
Palacios C. Severo Ejemplo 6.55 Se presenta un experimento de factores por separado que consiste en determinar las condiciones óptimas de almacenaje de los pescados en barcos pesqueros. Los factores estudiados fueron: temperatura, duración y método de empaque (proporción de hielo y pescado). La respuesta de interés es una medida de la calidad del pescado al descargue. Al investigar únicamente la temperatura se debe tener varios niveles de temperatura y mantener constante la duración y el empaque a niveles arbitrarios. Una vez obtenida una temperatura óptima (manteniendo los niveles constantes de duración y empaque) se investiga otro factor, por ejemplo el empaque con la temperatura óptima y un nivel arbitrario de duración. Si el empaque óptimo encontrado no es el que se seleccionó en la primera etapa se deberá estudiar de nuevo la temperatura haciéndose necesario ajustes sucesivos. Si el tiempo de obtención de la variable respuesta es corto y barato se puede seguir este procedimiento secuencial, en caso contrario es más conveniente el uso de experimentos factoriales. Los diseños experimentales factoriales son ampliamente utilizados por agrónomos, químicos, metalúrgicos, físicos, economistas, sociólogos, industriales, ingenieros y científicos. Ya sea en el laboratorio, planta piloto o nivel industrial. Prueba 1 2 3 4 5 6 7 8
Combinación 1 a b ab c ac bc abc
A + + + +
Notación 2 B + + + +
C + + + +
Los diseños factoriales son particularmente útiles en la primera fase del trabajo experimental, cuando es comprobado que hay muchos factores por investigar. Conlleva el menor número de corridas con las cuales pueden estudiarse n-factores en un diseño factorial completo. Debido a que sólo hay dos niveles para cada factor, debe suponerse que la respuesta (rendimiento, calidad, recuperación) es aproximadamente lineal en el intervalo de los niveles escogidos de los factores. 188
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Si cada variable es continua, existen dos niveles el superior e inferior. Las notaciones arriba mencionadas son obtenidas para asignar los niveles superior e inferior de los factores. La combinación 1 indica que todas las variables están en su nivel inferior. Las variables que no aparecen en el resto de combinaciones están en su nivel inferior. La combinación a indica los valores superior e inferior por + y - respectivamente. Un diseño experimental 2n puede combinarse geométricamente y cada combinación experimental corresponde a un punto en el espacio cartesiano cuyas coordenadas son ±1. VI.
DISEÑO FACTORIAL 2n
Los diseños factoriales se usan ampliamente en experimentos que incluyen varios factores cuando es necesario estudiar el efecto conjunto de los factores sobre la respuesta. Hay varios casos especiales del diseño factorial que son importantes debido a su uso generalizado en el trabajo de investigación y porque constituyen las bases de otros diseños de gran valor práctico. El más importante de estos casos especiales es el de n factores, cada uno con sólo dos niveles. Si todos los factores se estudian con dos niveles, se dice que es un experimento factorial 2n. Los niveles de estos factores pueden ser cuantitativos o bien cualitativos. La selección de únicamente dos niveles puede conducir a inferencias erróneas. Así cuando la respuesta se afecta en forma cuadrática, los niveles estudiados pueden indicar que no efecto el factor. Este es un riesgo que se corre al usar dos niveles por factor.
Diseño factorial 2n simple
189
Palacios C. Severo En el caso de n = 2, se tiene el factorial más sencillo 22. VII. DISEÑO FACTORIAL 22 A este diseño se le llama diseño factorial 22. Los niveles de los factores pueden denominarse arbitrariamente mínimo y máximo. Se tienen cuatro tratamientos que se denotan por cualquiera de los siguientes símbolos. El primer diseño de esta serie, es aquel que tiene Sólo dos factores, A y B, Cada uno con dos niveles, con cuatro combinaciones en el plano. Ejemplo 6.56 Un investigador desea estudiar la influencia de la temperatura y el tiempo de acondicionamiento en un experimento. Su vector respuesta Y¡ es la recuperación del proceso. Factores A = Temperatura (°C) B = tiempo (min)
20 1
Niveles
80 3
El número de experiencias de 22 = 4 y el diseño será:
Prueba 1 2 3 4
Tabla 6.41 Notación de un diseño 22 Diseño Niveles Combinación X1 X2 A B 1 20 1 a + 80 1 b + 20 3 ab + + 80 3
Yi 65 80 70 85
El análisis del diseño 22 nos permite obtener información sobre los efectos e interacciones de las variables. Efecto A = [-1+a-b+ab]/2 = [-65+80-70+85]/2 = 15 Efecto B = [-1-a+b+ab]/2 = [-65-80+70+85]/2 = 5 Interacción AB = [+1-a-b+ab]/2 = [65-80-70+85]/2 = 0
El efecto principal se calcula simplemente de las diferencias de los promedios de las respuestas cuando el efecto A esta en su nivel superior, menos el promedio de las respuestas cuando A está en su nivel inferior. No existe interacción con los factores en estudio. 190
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Ejemplo 6.57 Se desea evaluar un proceso donde se estudian dos factores a tres niveles. Para evaluar el error se corren pruebas centrales. A: B:
8 90
9 115
10 140
Tabla 6.42 Notación de un diseño 22 con pruebas centrales Diseño Niveles Prueba Combinación X1 X2 A B 1 1 8 90 2 a + 10 90 3 b + 8 140 4 ab + + 10 140 5 0 0 0 9 115 6 0 0 0 9 115 7 0 0 0 9 115
Yi 80 82 86 95 89 90 91
Para determinar la varianza media del error, evaluamos los puntos 5, 6 y 7 bajo la siguiente expresión: 2 Yi Yi N 1 N N 1 2
S2
892 902 912 270 1 2 6 2
S2
Efecto A = (-80+82-86+95)/2 = 5,5 Efecto B = (-80-82+86+95)/2 = 9,5 Interacción AB = (+80-82-86+95) = 3,5
Ejemplo 6.58 En una investigación se desea evaluar el efecto del SO2, sobre una población cercana a una empresa minera que monitorea dicho contaminante para lo cual estudia a la salida de la chimenea, la altura de la chimenea, la velocidad del viento y la distancia promedio a la población respecto de la chimenea y la dirección del viento. Los niveles elegidos para evaluar cada uno de los factores son los siguientes. Factores Q: Tasa de emisividad (g/s) H: Altura de chimenea (m) V: Velocidad del viento (m/seg) X: Distancia (m)
80 30 5 500
Niveles 0 + 120 60 45 60 7.5 10 650 800
La concentración de SO2 viene expresada por la relación: 191
Palacios C. Severo
C
2 H 106 Q exp 0,5 vK 1K 2 K 2
Donde: k1 = 36; k2 = 18,5: son constantes de proporcionalidad. Ejemplo 6.59 Un estudioso desea conocer la influencia de la temperatura y el tiempo de acondicionamiento en un experimento. Particularmente está interesado en entender como al elevar la temperatura del acondicionador cambia las características del medio produciendo un conjunto de condiciones no favorables para el proceso. Factores A: Tiempo (min) B: Temperatura (°C)
30 10
Niveles
+ 60 30
Se evalúan dos factores fijados a dos niveles, es decir se decide utilizar un diseño factorial completo, en donde N = 2n = 22 = 4 experimentos. Los valores de las variables a experimentar se codifican con valores +1 y –1. Con los recursos que se dispone se decide realizar el experimento por triplicado. Los resultados se visualizan en la siguiente tabla. Prueba 1 2 3 4
Tabla 6.43 Notación de un diseño 22 replicado A B Recuperación 30 10 0,17 0,16 0,15 + 60 10 0,22 0,20 0,21 30 + 30 0,30 0,29 0,31 + 60 + 30 0,37 0,36 0,38 Tabla 6.44 Efecto e interacciones Efectos Interacciones A = 0,06 AB = 0,01 B = 0,15 Bloque = -0,015 Bloque = 0,005 Basado en 1 grado de libertad
Fuente
A B AB Bloque Error Total 192
Tabla 6.45 Análisis de varianza SC GL CM Fo Ft(99) 0,0108 1 0,0108 144,00 > 13,74 0,0675 1 0,0675 900,00 > 13,74 0,0003 1 0,0003 4,00 < 13,74 0,00035 2 0,000175 2,33 < 13,74 0,00045 6 0,000075 0,0794 11 R2 = 99,4332%
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Ejemplo 6.60 Se estudia un proceso electrolítico en donde interactúan dos factores: densidad de corriente y temperatura, en la tabla 6.46 se dan las respuestas y los niveles de trabajo. Tabla 6.46 Notación de un diseño 22 con pruebas centrales Experimento Prueba X1 X2 Y 1 0,5 64 68,72 2 0,7 64 67,85 3 0,5 6 69,60 4 0,7 6 69,44 5 0,6 35 68,73 6 0,6 35 68,72 7 0,6 35 68,74
Varianza del error S 2 68,732 68,722 68,742 / 2 206,162 / 6 0,0001
el modelo lineal viene representado bajo un estudio de Yates. Y 68,83 0,25X 1 0,6175X 2 0,1775X 1 X 2
Ejemplo 6.61 La remoción del cobre y la recuperación de cianuro de los efluentes de cianuración son, sin duda de gran interés desde el punto de vista ambiental y económico. En este ejemplo se estudian dos objetivos, el primero es la evaluación preliminar de utilizar aminas para eliminar el cobre de las soluciones de cianuración por medio de la formación de un sólido que pueda separarse fácilmente por filtración. El segundo es hacer una evaluación con diferentes aminas seleccionando la mejor y realizar un diseño experimental 22 utilizando como variables el pH y la cantidad de reactivo adicionado para el compuesto que de mejores resultados en la evaluación preliminar. Los experimentos preliminares consistieron en adicionar 0,025 g de cada uno de los compuestos a 100 ml de solución a pH 12 y 8. Después de filtrar las soluciones con papel de filtrado lento (tamaño de poro de 1,5 micrones) se analizó el cobre remanente por absorción atómica. Una vez seleccionado el mejor compuesto, se realizó un diseño de experimentos factorial 22 utilizando como variables el pH (9 y 12) y la con193
Palacios C. Severo centración del compuesto (0,25 y 5 g/L). Todas las pruebas de este diseño experimental se realizaron por triplicado. Amina Quartamin 2050 Quartamin 60 Dodecilamina Quartamin D86P
Factores X1: pH solución X2: Amina (g/L)
Prueba 1 2 3 4
Experimento X1 X2 9 0,25 12 0,25 9 5 12 5
Fórmula R-N(CH3)3Cl R-N(CH3)3Cl CH3(CH2)11NH2 2R-N(CH3)3Cl Niveles 9 0,25
+ 12 5
Remoción cobre (%) 9,51 9,00 9,97 0,05 0,09 0,05 60,25 61,63 61,27 55,54 55,12 56,87
Efectos estimados para Y Efectos Interacciones X1: pH = -53,683 AB = -2,1116 X2: Amina = -7,318 Bloque = -0,305 Bloque = 0,855 Errores estándar con 6 GL
El primer paso para interpretar los efectos principales es comprobar que la variación observada en la respuesta es debida a un efecto real de cada factor y no al error experimental. Para no entrar en detalles, se considera que los dos efectos no son significativos y que no parecen fruto de la imprecisión de la experimentación. No existe interacción entre los factores. Fuente X1: pH X2: Amina X1X2 Bloque Error Total
SC 8640,87 160,674 13,3774 1,12655 2,03945 8818,09
Factor pH Amina 194
Análisis de varianza GL CM Fo Ft(99) 1 8640,87 25421,18 > 13,74 1 160,674 472,70 > 13,74 1 13,3774 39,36 > 13,74 2 0,56327 1,66 < 13,74 6 0,3399 11 R2 = 99,9769% Valor óptimo = 61,05 Bajo Alto Óptimo 9,0 12,0 9,0 0,25 5,0 0,25
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Y 215,327 17,1115X 1 1,5712X 2 0,2963X 1 X 2
De aquí puede verse que la amina y no así el pH afectan la eficiencia de eliminación de cobre. Un aumento en la cantidad de amina incrementará la remoción de cobre, de la misma manera que lo hará una disminución del pH. El efecto más importante es el de la cantidad de amina, por lo que valdría la pena explorar cantidades mayores a las estudiadas en este trabajo. Gráfica de Interacción para Y
Gráfica de Efectos Principales para Y 80
60 50
60
Y
Y
40 30 20
Amina=0.25 Amina=5
40 20 Amina=0.25
10 0
0
9
pH
12
0.25
Amina
9
5
Grafico de efectos principales
pH
Amina=5 12
Interacción de efectos principales
En el gráfico de efectos principales vemos que el pH no tiene efecto significativo, la Amina tiene efecto significativo. No existe interacción en el rango (niveles) trabajado, pero existe interacción a niveles inferiores de ambos factores. Contornos de la Superficie de Respuesta Estimada
Amina
4 3 2 1
Superficie de Respuesta Estimada 0.0-8.0 8.0-16.0 16.0-24.0 24.0-32.0 32.0-40.0 40.0-48.0 48.0-56.0 56.0-64.0 64.0-72.0 72.0-80.0 80.0-88.0
Y
80 60
Y
Y
5
40 20 0 9
0 9
9.5
10
10.5
11
11.5
12
9.5 10 10.5 11
11.5 12
0
1
2
5 4 3 Amina
0.0-8.0 8.0-16.0 16.0-24.0 24.0-32.0 32.0-40.0 40.0-48.0 48.0-56.0 56.0-64.0 64.0-72.0 72.0-80.0 80.0-88.0
pH
pH
Gráfico lineal con punto óptimo
Gráfico espacial con punto óptimo
En el gráfico lineal y espacial se puede visualizar la región óptima del proceso.
195
Palacios C. Severo Problemas (190) Se presume que el efecto del pH y la temperatura en el rendimiento de cierta reacción química no son independientes. Para determinar el grado de relación entre los factores estudiados (pH, T), se realizó un diseño experimental 22 donde se evalúan dos niveles de cada uno de estos factores y se mide el % de rendimiento de la reacción. Acá se muestran las condiciones del diseño, la matriz del mismo y los resultados experimentales de 2 determinaciones paralelas: pH + +
T (°C) + +
Rendimiento (%) Replica I Replica II 45 47 73 71 23 26 30 33
Haciendo uso del análisis de varianza, confirme el resultado. Escriba la ecuación de regresión teniendo en cuenta solamente los términos significativos. Analice los efectos principales de los factores estudiados y de la interacción entre estos sobre el rendimiento mediante los gráficos correspondientes. Determine las condiciones experimentales óptimas de T y pH que permiten obtener el mayor rendimiento. (191) Se llevó a cabo una investigación para estudiar el efecto que tienen la concentración de un reactivo cR y la presencia de un catalizador K sobre el rendimiento de un proceso químico. El estudio se realizó mediante un diseño factorial 2 2 en las siguientes condiciones experimentales: cR + +
mK + +
Replica I 28 36 18 31
Rendimiento (%) Replica II Replica III 25 27 32 32 19 23 30 29
Analice de manera cualitativa la significación de los factores de interés (cR, mK) y la interacción cRmK sobre el rendimiento de la reacción estudiada y compruebe estadísticamente el resultado de su análisis. Escriba la ecuación de regresión obtenida. ¿Qué información le brindan los signos de los coeficientes de la ecuación? ¿De que tipo es la interacción cRmK?. Analice los gráficos de efectos principales de los factores estudiados y de la interacción entre estos sobre el rendimiento. De196
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería termine las condiciones experimentales óptimas de c R y mK para obtener el mayor rendimiento. Reporte el valor del rendimiento y su intervalo de confianza en estas condiciones. (192) En la determinación potenciométrica simultánea de NH3 y CO2 con HCl se desea estudiar la influencia de Co(II) y Ni(II) presente en la muestra sobre los resultados obtenidos. Con este objetivo se realizan dos diseños experimentales 22 para estudiar el efecto de Co(II) y Ni(II) sobre la determinación del NH3 y sobre la determinación de CO2. Las condiciones del diseño son las siguientes: Ni(II) + +
NH3 Co(II) + +
NH3 75,9 76,1 36,7 36,5 66,8 66,5 36,2 36,3
Ni(II) + +
CO2 Co(II) + +
CO2 56,9 57,2 56,7 56,4 56,5 56,7 56,8 56,7
Analice de manera cualitativa la significación de los factores de interés (concentración de Ni y de Co) y la interacción entre estos sobre el resultado de la determinación de cada uno de los compuestos químicos analizados. Compruebe estadísticamente el resultado cualitativo obtenido. Escriba la ecuación de regresión obtenida. ¿Qué indican los signos de los coeficientes de la ecuación? ¿Cómo es la interacción Ni(II) Co(II)?. Analice los gráficos de efectos principales de los factores estudiados y de la interacción entre estos. Determine cuales son las condiciones experimentales óptimas tal que no se afecte la determinación de NH3 y de CO2. (193) Se desea estudiar el efecto sobre el rendimiento (expresado en %) de un proceso químico para obtener un compuesto inorgánico de tres factores de manera simultánea: concentración de un reactivo, pH de la mezcla reaccionante y temperatura de reacción. Con este objetivo se diseña un experimento factorial 23 bajo las siguientes condiciones experimentales: C (mol/L) + + + +
pH + + + +
T (°C) + + + +
56,0 52,5 37,8 54,2 69,0 72,0 49,1 70,6
Rendimiento (%) 58,0 54,2 39,4 53,0 66,0 70,8 48,2 71,9
59,6 55,5 40,1 55,6 67,5 74,5 47,0 73,2
Afectan de manera significativa los factores estudiados el rendimiento del proceso bajo investigación 197
Palacios C. Severo Actúan de manera independiente estos tres factores sobre el rendimiento de la reacción Cuáles son las condiciones experimentales óptimas (194) Un método nuevo de determinación de manganeso (Mn) fue desarrollado para conocer el contenido de este elemento en un mineral. Para validar el método se tomaron 8 muestras homogéneas del mineral y se determinó el porcentaje en masa de Mn por dos laboratorios diferentes. Los resultados obtenidos son: A + +
B + +
Mn (%) 1,70 1,72 1,75 1,77 1,68 1,67 1,72 1,73
Suponiendo que el contenido real de Mn en la muestra es de 1.71 %, compare el mismo con cada una de las 2 medias experimentales (en caso de existir diferencias significativas entre estas). (195) En muestras de licores amoniacales de níquel, obtenidos en la industria niquelífera mediante la digestión de los minerales, se determinó el contenido de este elemento por tres métodos analíticos diferentes: gravimetría, colorimetría y complejometría. Los resultados en % de níquel se encuentran abajo: A
B
C
+ + + +
+ + + +
+ + + +
Gravimetría 1,76 1,80 1,48 1,27 1,60 1,74 1,27 2,18
Mn (%) Colorimetría 4,44 4,06 5,79 4,34 4,64 5,12 5,57 4,39
Complejometría 1,78 1,85 2,12 1,40 1,72 1,60 1,58 1,23
Cuáles de los métodos pueden emplearse para la determinación de Ni (196) Consideremos un experimento donde el objetivo es estudiar la relación entre la frecuencia de oscilación de un reloj de cuarzo patrón y las condiciones de humedad y temperatura. En este caso el instrumento ya cuenta con un dispositivo para minimizar los cambios de temperatura, dado que los fabricantes conocen su impacto en la frecuencia de oscilación. Los factores seleccionados son temperatura (T) y humedad (H) y sus niveles de prueba se eligen de acuerdo a las condiciones del laboratorio; en este caso los niveles de temperatura son (22oC, 24oC) y para la humedad (20%, 50%).
198
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería La variable de respuesta es la frecuencia de oscilación (Y). El diseño experimental seleccionado es un factorial completo 22 con punto central que se muestran a continuación. Prueba 1 2 3 4 5 6
Temperatura (°C) 22 24 22 24 23 23
Humedad (%) 20 20 50 50 35 35
Frecuencia (Hz) 9,9706 9,9706 99704 9,9702 9,9704 9,9692
Factores Potencial (Vols) NaOH (g/L) DC (A/cm³)
Niveles + 2,5 3,5 10 20 0,025 0,075
En particular en el estudio presentado se muestra cómo evaluar experimentalmente la incertidumbre dada por el fabricante de un equipo para verificar su magnitud en las condiciones del propio laboratorio. Este tipo de estudios podrían llevar a mejoras tanto de los equipos como de las instalaciones del laboratorio, buscando tener un menor impacto de las fuentes de incertidumbre detectadas como las más importantes. (197) En la definición de las variables de estudio de electrodeposición de oro se tuvo en cuenta las condiciones impuestas por el proceso previo de desorción de oro, sobre todo en aquellas que tienen que ver con el electrolito, como la concentración de oro, la concentración de cianuro de sodio e hidróxido de sodio, la conductividad, el pH y la temperatura. Con estas queda definida la referencia base para la selección y rango de las variables de estudio. Entre las variables mencionadas se seleccionaron el potencial aplicado, la concentración de hidróxido de sodio y la Densidad de corriente catódica como las de mayor interés para este estudio, y como variables de respuesta se consideraron la eficiencia de corriente, el consumo de potencia, la cinética de la deposición del oro y su recuperación.
Prueba
Potencial (Vols) 2,5 3,5 2,5 3,5 2,5 3,5 2,5
NaOH (g/L) 10 10 20 20 10 10 20
DC (A/cm³) 0,025 0,025 0,025 0,025 0,075 0,075 0,075
Consumo energía (Watt-h) 3,43 9,38 4,33 13,94 3,29 9,38 5,73
Tiempo (min) 115,0 78,7 108,5 76,0 78,9 78,7 173,9
199
Palacios C. Severo 3,5 3,0 3,0 3,0 3,0 3,0
20 15 15 15 15 15
0,075 0,050 0,050 0,050 0,050 0,050
15,66 7,79 7,64 6,87 7,75 6,70
113,2 88,9 87,4 80,3 93,8 80,0
Se pretende minimizar el tiempo del proceso, de consumo de energía (mayor eficiencia de corriente) y menor cantidad de hidróxido de sodio a fin de optimizar las condiciones por medio de las ecuaciones logradas. Esto redunda en un beneficio económico y practico para la recuperación electroquímica de oro. (198) El reciclado electroquímico de los compuestos de partida en disolución ácido se ha monitorizado por análisis de la DQO (demanda química de oxígeno), cromatografía de placa fina, análisis de CG-MS y por espectroscopia de UV-VIS. El tiempo de cada electrólisis se ha calculado para circular la cantidad teórica de electricidad necesaria para oxidar completamente el sustrato, a partir de las leyes de Faraday, y una concentración de sustrato a tratar de 0,015 M en un volumen de 150 cm3. El tiempo de reacción se ha prolongado para aquellos casos en que se observó un mejor comportamiento de la disminución de la DQO al aumentar la carga eléctrica. El plan experimental escogido para estudiar la influencia de las principales variables de reacción es un diseño factorial completo 23 con ocho barridos experimentales, donde las variables escogidas y sus niveles fueron la temperatura (25 y 40ºC), la concentración de electrolito (50 y 96%) y la densidad de corriente (500 y 1000 A/m2). Factores X1: Temperatura (°C) X2: Concentración (%) X3: DC (A/m²) Prueba 1 2 3 4 5 6 7 8
Temperatura (°C) 25 40 25 40 25 40 25 40
Niveles + 25 40 50 96 500 1000
Concentración (%) 50 50 96 96 50 50 96 96
DC (A/m²) 500 500 500 500 1000 1000 1000 1000
DQO 32487 725 3075 2852 2775 6525 867 4425
La tecnología propuesta se presenta como una técnica universal para degradar compuestos nitratados aromáticos en contra de la biodegradación, en la que las especies microbianas encarga200
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería das de degradar son específicas para cada contaminante concreto y mucho más versátil y cómoda de escalar y diseñar a nivel industrial que tecnologías basadas en sistemas fotocalíticos. Del estudio experimental de la degradación de los sustratos de partida se realizó en base al diseño de experimentos detallados en la tabla adjunta. La influencia de las variables tenidas en cuenta, temperatura, densidad de corriente y concentración de electrolito, así como las interacciones entre ellas, se han estudiado estadística y comparativamente. Se pide demostrar la influencia de dichos factores (199) El propósito de este estudio fue evaluar la remoción de sólidos totales, presentes en la vinaza (destilado del alcohol), mediante procesos de electrocoagulación-electroflotación utilizando electrodos de aluminio y como variables de operación pH inicial, concentración de electrolito y densidad de corriente. Las variables evaluadas fueron densidad de corriente (DC), pH inicial y concentración de NaCl como soporte electrolítico, todas las variables en dos niveles. Los niveles usados para cada variable fueron: DC 20, 40 y 60 mA/cm2; pH 4, 7 y 9; [NaCl] 0, 2000 y 4000 ppm. Factores X1: DC (mA/cm²) X2: pH X3: [NaOH] (ppm) Prueba 1 2 3 4 5 6 7 8 9 10 11
DC (mA/cm²) 20 60 20 60 20 60 20 60 40 40 40
pH 4 4 9 9 4 4 9 9 7 7 7
20 4 0 [NaOH] (ppm) 0 0 0 0 4000 4000 4000 4000 2000 2000 2000
Niveles 0 40 7 2000
Al (g) 0,0663 0,0659 0,0245 0,1301 0,2139 0,0648 0,0658 0,0647 0,2109 0,2091 0,2173
+ 60 9 4000 % Sólidos totales Clarificado Espuma 19,81 22,73 20,95 23,49 22,59 24,00 22,09 23,77 21,73 22,77 15,05 17,25 14,56 17,92 15,23 18,69 22,00 23,12 16,88 16,80 20,16 19,15
Que factor influye en el mayor desprendimiento de aluminio al desarrollar la electrocoagulación-electroflotación. En que región del pH ocurre mejor el proceso. (200) La investigación se desarrolló con las aguas residuales de una industria láctea de la región. Se tomaron muestras tanto del tanque de descargas, como del tanque de homogeneización; este último toma las aguas del tanque de descarga de las aguas resi201
Palacios C. Severo duales de la empresa y las mezcla. A éstas se le analizaron: pH, DQO, conductividad eléctrica, grasas y aceites. Los análisis se realizaron el mismo día del muestreo; de acuerdo con los resultados, se decidió que las muestras de agua para la investigación serían recolectadas sólo del tanque de homogenización, por ser éste el más representativo en las características fisicoquímicas del agua residual láctea. La experimentación se llevó a cabo en un sistema para electrólisis. Este sistema opera como reactor discontinuo a escala prototipo, con capacidad para tratar dos litros de aguas residuales. Consta de una celda electrolítica de dos litros en la que están sumergidos los electrodos; estos electrodos son placas rectangulares metálicas de hierro y aluminio, dispuestas en paralelo y conectadas a una fuente de voltaje de corriente continua que proporciona la corriente eléctrica requerida para la electrocoagulación. Factores X1: pH X2: DC (A/m²) X3: tiempo (min) Prueba 1 2 3 4 5 6 7 8 9 10 11
pH 5 8 5 8 5 8 5 8 7 7 7
5 32,43 5 DC (A/m²) 32,43 32,43 43,23 43,23 32,43 32,43 43,23 43,23 37,83 37,83 37,83
Niveles 0 7 37,83 10
tiempo (min) 5 5 5 5 15 15 15 15 10 10 10
+ 8 43,23 15 DQO (%) 75,73 62,36 46,55 93,99 70,83 51,44 77,29 93,99 43,88 45,79 42,15
La electrocoagulación se vislumbra como un tratamiento eficiente para la remoción de contaminantes en las aguas residuales industriales, específicamente en el caso de la industria láctea como se muestra en esta investigación. Los tres factores bajo estudio (pH, densidad de corriente y tiempo) tienen efecto significativo sobre la remoción de DQO. El diseño de tres factores es bastante ajustado a los datos. En particular, si se tienen niveles óptimos del estudio para pH, tiempo y densidad de corriente. (201) La planificación de los experimentos se realizó aplicando el diseño experimental factorial 2n; se analizó la influencia de la 202
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería temperatura, la relación líquido/sólido y tiempo en la depuración de especies metálicas de efluentes, manteniendo fija la velocidad de agitación. Las variables de respuesta consideradas fueron: porcentaje de extracción de especies metálicas (E) y selectividad (S). Esta última, se determinó como la relación entre la recuperación de un componente dado y el grado de dilución del mineral. La extracción de Ni, Co, Fe y Mn como residuo de la depuración de efluentes. Las condiciones experimentales y niveles de las variables se muestran en la tabla. Factores X1: Temperatura (°) X2: tiempo (h) X3: Líquido/Sólido (L:S)
30 1 8
Niveles 0 45 2 10
+ 60 3 12
Condiciones fijas del experimento: Velocidad de agitación 600 rpm; pH 4,06. Los modelos que regulan el proceso son:
YNi 72,2433 6,4475 X 1 4,1325 X 2 0,0625 X 3 2,765 X 1 X 2 YCo 81,0333 3,58 X 1 2,255 X 2 0,3425 X 3 2,165 X 1 X 2
R ² 87,9058
R ² 96,5456
YFe 71,36 6,22625 X 1 5,24125 X 2 17,0613 X 3 1,51625 X 1 X 2 1,61125 X 2 X 3 R ² 90,0524 YMn 70,2356 6,5 X 1 4,6675 X 2 0,4925 X 3 3,2425 X 1 X 2 R ² 95,9567
Elabore un diseño experimental que satisfaga la depuración del efluente (202) Los residuos sólidos de la lixiviación o colas constituyen un gran problema para el ecosistema de la región industrial; su tratamiento, disposición y manejo son objeto de estudios con el fin de encontrar alternativas para minimizar los impactos negativos al medio ambiente. Una cuestión de interés lo constituye la recuperación de plata y el cobre contenidos en las colas residuales, las cuales son consideradas un mineral de baja ley. Con el objetivo de recuperar especies metálicas de las colas de los procesos de lixiviación, ya sean las resultantes del proceso ácido o del proceso amoniacal, se han realizado estudios de biolixiviación y lixiviación química con ácidos orgánicos producidos por los microorganismos en sus procesos metabólicos. En la tabla aparece la matriz experimental correspondiente al plan 23, y un experimento en el nivel central. Con este diseño de experimento se obtuvo el comportamiento de las variables de respuesta Selectividad y Extracción de Ag y Cu. La selectividad se consideró como la relación entre la recuperación de un componente dado y el grado de disolución total del mineral. En todos los experimentos se mantuvieron fijos los parámetros si203
Palacios C. Severo guientes: relación líquido:sólido: L/S=12/1 cm3 de solución/g de cola; velocidad de agitación: 630 rpm; tamaño de partículas (0,149+0,074) mm. Se realizó el estudio del comportamiento cinético de la disolución del Ag y Cu. Las muestras de licor de lixiviación se colectaron a determinados intervalos de tiempo, se filtraron y analizaron por espectroscopia de absorción atómica. Factores X1: Temperatura (°) X2: tiempo (h) X3: Líquido/Sólido (L:S) T (°) 30 60 30 60 30 60 30 60 45
Prueba 1 2 3 4 5 6 7 8 9
t (h) 1 1 5 5 1 1 5 5 3
Niveles 0 45 3 5
30 1 1
+ 60 5 9
% Extracción Ag Cu 62,96 77,38 71,60 80,53 69,07 77,93 82,40 87,39 64,24 77,58 70,45 80,09 63,72 77,39 87,12 90,91 78,63 80,10
L/S (cm³/g) 1 1 1 1 9 9 9 9 5
(203) Se controlaron 3 variables que permitieron conocer las condiciones óptimas del reactor para obtener altos porcentajes de descontaminación y realizar el escalamiento del reactor a nivel industrial. Las variables escogidas para el estudio fueron: Factores X1: [H2O2] (ml/L) X2: Volumen a tratar (L) X3: [TiO2] (mg/L) Prueba 1 2 3 4 5 6 7 8 9 10 11
204
[H2O2] (ml/L) 0 2 0 2 0 2 0 2 1 1 1
Volumen (L) 4 4 12 12 4 4 12 12 8 8 8
[TiO2] (mg/L) 0 0 0 0 200 200 200 200 100 100 100
0 4 0
Niveles 0 + 1 2 8 12 100 200
Radiación (W/m²) 36,5 44,5 18,0 44,83 26,03 61,83 52,83 35,41 40,17 50,83 34,17
pH 3,85 3,91 5,77 5,41 3,72 5,73 8,43 5,12 4,24 4,2 4,12
Degradación (%) 23,52 46,19 7,39 33,03 43,34 31,87 14,8 6,62 16,8 19,8 14,84
Para el estudio de estas variables se realizaron una serie de experimentos donde la variable de respuesta fue el porcentaje de degradación medido como el porcentaje de reducción en la DQO.
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Del análisis de los datos obtenga el ANAVA, estime la respuesta óptima, además de la superficie de respuesta, que permiten obtener un modelo estadístico que describe el comportamiento del sistema de fotodegradación respecto a las variables experimentales estudiadas y que permitan establecer el grado de confiabilidad de los datos obtenidos. (204) Se seleccionaron modelos lineales del tipo 2n, en los que n representa el número de variables a estudiar. Para un diseño experimental con 3 variables (pH, dosis de coagulante y floculante), el número de experimentos a realizar es igual a 8. En la tabla se especifica los niveles de cada experimento para una pareja coagulante-floculante determinada. Como se observa en esta tabla los valores probados para el pH son 6 y 9, las dosis de coagulante fueron 20 y 100 mg/L y las del floculante de 0,1 y 1,0 mg/L. Prueba 1 2 3 4 5 6 7 8
Floculante (mg/L) 0,1 1 0,1 1 0,1 1 0,1 1
Coagulante (mg/L) 20 20 100 100 20 20 100 100
pH 6 6 6 6 9 9 9 9
Concentración residual Color DQO 47,0 84,5 45 75,0 13 60,5 22,5 55,5 188,5 105,5 180,5 138,5 40,5 82,5 40,5 42,5
Debido a la buena calidad del efluente obtenido bajo las condiciones óptimas determine el modelo de remoción de los parámetros y, con el fin de disminuir el volumen de lodos y los costos del proceso, utilice dicho modelos para realizar un análisis de sensibilidad de respuesta con respecto a la variación de dosis para poder reducir la cantidad de coagulante a aplicar, de tal manera de conservar niveles de remoción aceptables para los derivados.
VIII. DISEÑO FACTORIAL 23
205
Palacios C. Severo Cuando se tienen tres factores, A, B y C, con dos niveles cada uno, entonces hay un total de 8 tratamientos en investigación. Al diseño se le llama diseño factorial 23, y en este caso la representación geométrica de las ocho combinaciones de tratamientos puede hacerse con un cubo como se muestra 7
3
8
4
6
1
2
Diseño factorial 23 simple
Al igual que en el diseño factorial 22, existen tres notaciones diferentes para los ocho tratamientos que son de uso general. La primera es la notación + y -, llamada con frecuencia notación geométrica. La segunda es el uso de las letras minúsculas para identificar las combinaciones de los tratamientos. La tercera notación utiliza 1 y 0 para denotar los niveles alto y bajo, respectivamente, de los factores, en lugar de +yEn este diseño se estudian tres factores A, B y C cada uno a dos niveles con ocho combinaciones de tratamiento que se representan gráficamente en un cubo. En este tipo de diseño se asume el error al valor de la mayor combinación, abad. Ejemplo 6.62 En un autoclave se desarrolla un experimento a nivel planta piloto con la finalidad de evaluar la influencia sobre la taza de filtración de un producto, se estudian tres variables. A: Concentración, B: Temperatura y C: Presión. Prueba 206
Tabla 6.47 Datos para un diseño 23 A B C Combinación
Y
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 1 2 3 4 5 6 7 8
+ + + +
+ + + +
+ + + +
1 a b ab c ac bc abc
71 65 60 65 90 95 86 96
Tabla 6.48 Efecto e interacciones Efectos Interacciones A = 3,5 AB = 4,0 B = -3,5 AC = 4,0 C = 26,5 BC = 2,0 Error estándar 1 GL Tabla 6.49 Análisis de varianza SC GL CM Fo Ft(99) 24,5 1 24,5 5,44 < 12,25 24,5 1 24,5 5,44 < 12,25 1404,5 1 1404,5 312,11 > 12,25 32,0 1 32,0 7,11 < 12,25 32,0 1 32,0 7,11 < 12,25 8,0 1 8,0 1,78 < 12,25 4,5 1 4,5 1530,0 7 R2 = 99,7059%
Fuente
A B C AB AC BC Error Total
Ejemplo 6.63 Al ejemplo 6.62 se le adiciona un factor de mezcla en un experimento a nivel planta piloto para estudiar los efectos que influyen sobre la taza de filtración de un producto. Prueba 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
A + + + + + + + +
Tabla 6.50 Datos para un diseño 24 B C D Combinación 1 a + b + ab + c + ac + + bc + + abc + d + ad + + bd + + abd + + cd + + acd + + + bcd + + + abcd Tabla 6.51 Efecto e interacciones Efectos Interacciones
Y 71 65 60 65 90 95 86 96 85 88 68 80 83 85 75 70
207
Palacios C. Severo A = 3,25 B = -7,75 C = 12,25 D = 0,75
AB + + + + + + + +
AC + + + + + + + +
AB = 2,25 AC = -0,25 BC = 1,25 AD = -0,25 BD = -4,25 CD = -14,25 ABC = -2,75 ABD = -1,75 ACD = -4,25 BCD = -0,75 ABCD = -1,25
Tabla 6.52 Matriz de variables independientes AD BC BD CD ABC ABD BCD ACD + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
ABCD + + + + + + + +
Los efectos importantes son B, C y CD. Fuente
B C CD Error Total
Tabla 6.54 Análisis de varianza SC GL CM Fo Ft(99) 240,25 1 240,25 10,79 > 9,33 600,25 1 600,25 26,98 > 9,33 812,25 1 812,25 36,51 > 9,33 267,00 12 1919,75 R2 = 86,09%
Ejemplo 6.64 Se lixivia un mineral argentífero en una salmuera clorurada, de desea evaluar tres factores con el fin de establecer el efecto significativo de cada uno de dichos factores y el rango de cada uno de ellos, A: NaCl (gr) B: H2SO4 (ml) C: FeCl3 (gr)
208
100 50 15
A 100
150 120 35
B 50
C 15
Y 68,71
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 150 100 150 100 150 100 150 125 125 125
50 120 120 50 50 120 120 85 85 85
15 15 15 35 35 35 35 25 25 25
67,39 64,93 62,16 61,05 65,82 69,21 70,35 64,13 64,88 64,27
Tabla 6.55 Efecto e interacciones Efectos interacciones A = 0,45 AB =-1,27 B = 0,92 AC = 2,50 C = 0,81 BC = 5,42 Errores estándar con 4 GL Tabla 6.56 Análisis de varianza SC GL CM Fo Ft(99) 0,414 1 0,414 0,21 < 21,20 1,692 1 1,692 0,87 < 21,20 1,312 1 1,312 0,67 < 21,20 3,225 1 3,225 1,66 < 21,20 12,5 1 12,5 6,42 < 21,20 58,561 1 58,561 30,21 21,20 7,792 4 1,948 85,798 10 R2 = 90,9175%
Fuente
A B C AB AC BC Error Total
Y 86,83 0,054A 0,089B 1,243C 0,0007AB 0,005AC 0,0077BC
Factor A B C
Valor óptimo = 70,1382 Bajo Alto Óptimo 100 150 150 50 120 120 15 35 35 Gráfica de Interacción para Y
Gráfica de Efectos Principales para Y 70
66.2 66
+
68
Y
Y
65.8
66
65.6 64
65.4
+ +
+
+
-
-
-
+ 62
65.2 100
A
150
50
B
120
15
C
35
100
AB
150
100
AC
150
50
BC
120
Efectos e interacciones significativas de factores principales
209
Palacios C. Severo Contornos de la Superficie de Respuesta Estimada
Contornos de la Superficie de Respuesta Estimada
C=25.0
B=85.0
Y
B
110 90 70
Y
35
64.0-64.3 64.3-64.6 64.6-64.9 64.9-65.2 65.2-65.5 65.5-65.8 65.8-66.1 66.1-66.4 66.4-66.7 66.7-67.0 67.0-67.3
31 27
C
130
23
64.0-64.3 64.3-64.6 64.6-64.9 64.9-65.2 65.2-65.5 65.5-65.8 65.8-66.1 66.1-66.4 66.4-66.7 66.7-67.0 67.0-67.3
19 50
100
110
120
130
140
15
150
A
100
110
120
130
140
150
A
Contornos de la Superficie de Respuesta Estimada A=125.0 35
Y
31
C
27 23
64.0-64.3 64.3-64.6 64.6-64.9 64.9-65.2 65.2-65.5 65.5-65.8 65.8-66.1 66.1-66.4 66.4-66.7 66.7-67.0 67.0-67.3
19 15 50
70
90 B
110
130
Superficie respuesta estimada en el plano con punto óptimo de factores principales Superficie de Respuesta Estimada C=25.0
Superficie de Respuesta Estimada B=85.0 Y
Y
66.5 66 65.5 65 64.5 130 64 110 100 110 90 70 120 130 140 150 50 B A
68 67
Y
Y
67
64.0-64.3 64.3-64.6 64.6-64.9 64.9-65.2 65.2-65.5 65.5-65.8 65.8-66.1 66.1-66.4 66.4-66.7 66.7-67.0 67.0-67.3
66 65
64.0-64.3 64.3-64.6 64.6-64.9 64.9-65.2 65.2-65.5 65.5-65.8 65.8-66.1 66.1-66.4 66.4-66.7 66.7-67.0 67.0-67.3
35 64 31 27 100 110 23 120 130 19 140 150 15 C A
Superficie de Respuesta Estimada A=125.0 Y 64.0-64.3 64.3-64.6 64.6-64.9 64.9-65.2 65.2-65.5 65.5-65.8 65.8-66.1 66.1-66.4 66.4-66.7 66.7-67.0 67.0-67.3
72
Y
70 68 66 64 62 50
70
90 B
110
130 15
19
23
27
31
35
C
Superficie respuesta estimada en el espacio de factores principales
Aplicación nanotecnologica Actualmente el desarrollo de la nanotecnología está asociado a la disponibilidad de nanoestructuras, o también, al dominio de las técnicas de fabricación de las mismas. En este entorno han aparecido diferentes modos de abordar la fabricación de nanoestructuras. Se puede trabajar en sentido descendente (de arriba abajo), desprendiendo o añadiendo material a una superficie para darle forma. O por el contrario, se puede partir desde el nivel más elemental (sentido ascendente, de abajo arriba), desde átomos o moléculas que se ordenan espontáneamente cuando las condiciones son apropiadas, hasta estructuras más complejas. Así, entre los nue210
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería vos materiales que se pueden obtener con esta tecnología, tienen especial importancia, los films cerámicos obtenidos por procesos de electrodeposición, bien sea electroforética o deposición electrolítica. En este último método se utilizan disoluciones de alta conductividad, la velocidad de deposición es del orden de 1 a 1000 nm/min y el espesor del depósito varía de 1 a 104 nm, que puede controlarse variando el tiempo de deposición, el voltaje o la densidad de corriente, en cuanto a la uniformidad del depósito ésta se controla por el campo eléctrico. Además, en la deposición electrolítica catódica, los iones metálicos o complejos se hidrolizan por los OH– generados para formar óxido, hidróxido o peróxido, finalmente los depósitos de hidróxidos y peróxidos se pueden convertir en los óxidos correspondientes por tratamiento térmico. Dentro de estos materiales se ha observado que las películas muy finas de óxido de cinc, ZnO, un semiconductor de gap elevado, presentan propiedades ópticas muy interesantes, lo que les hace especialmente útiles para determinadas aplicaciones ópticas y opto electrónicas como emisor de luz y diodos láser abarcando un amplio rango desde el rojo al ultravioleta debido a sus interesantes propiedades, particularmente su amplio band-gap de 3,37 eV a 300 ºK. En el presente ejemplo se ha aplicado una técnica de electrodeposición sobre un sustrato de vidrio conductor para obtener columnas de ZnO. Ejemplo 6.65 Con el fin de poder investigar, de forma rápida, la influencia que las variables del proceso (densidad de corriente, tiempo de exposición al electrolito y temperatura de desarrollo del proceso) tienen en la formación y crecimiento de las columnas obtenidas, se diseño un modelo experimental de tres variables a dos niveles (diseño factorial a dos niveles), de esta manera se ha conseguido optimizar el proceso. Es decir, este método permite con muy pocas experiencias de laboratorio obtener la información suficiente para poder abordar, con garantías de éxito, la fabricación de estas estructuras. Las muestras se obtuvieron por electrodeposición, sobre un sustrato de vidrio de entre 0,5 y 1 cm2, recubierto de una capa conductora de óxido de estaño y flúor. Con el fin de poder controlar la densidad de corriente aplicada, el tiempo de exposición y la temperatura se utilizó un potenciostato211
Palacios C. Severo galvanostato modelo 263 A y su correspondiente celdilla, introducida en una manta calefactora con termostato. El electrodo de referencia utilizado fue el de Ag/AgCl en una solución saturada de KCl/AgCl y contraelectrodo de Pt. Como electrolito se empleó una solución de concentración 510-3 M de ZnCl2 y 0,1 M de KCl en agua desmineralizada. Durante todo el proceso de electrodeposición se mantuvo la solución saturada de oxigeno. Los pH iniciales y final de la solución fueron 6,5 y 6,3 respectivamente. En la tabla se indican las variables a controlar. Factores X1: DC (mA/cm²) X2: Tiempo (seg) X3: Temperatura (°C)
1 600 65
Niveles 0 + 1,75 2,5 1200 1800 75 85
Prueba
X1
X2
X3
1 2 3 4 5 6 7 8
+ + + +
+ + + +
+ + + +
Altura (nm) 439 281 611 902 304 256 109 687
Los valores de la variable respuesta, altura de las columnas expresada en nanómetros (nm), se analizaron mediante el programa para computadoras STATGRAPHICS Centurion. Efectos estimados para Altura Efectos Interacciones A: X1 = 165,75 AB = 268,75 B: X2 = 257,25 AC = 79,25 C: X3 = -219,25 BC = -139,25 Errores estándar con 1 GL Fuente A: X1 B: X2 C: X3 AB AC BC Error Total 212
Tabla 4.12 Análisis de varianza SC GL CM Fo Ft(99%) 54946,1 1 54946,1 14,03 < 161,4 13235,5 1 13235,5 33,80 < 161,4 96141,1 1 96141,1 24,55 < 161,4 14445,3 1 14445,3 36,89 < 161,4 19701,1 1 19701,1 5,03 < 161,4 38781,1 1 38781,1 9,90 < 161,4 3916,13 1 3916,13 490294 7 R² = 99,2013%
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Altura 1271,33 744,083X 1 0,562118X 2 8,6166X 3 0,2986X 1 X 2 6,616X 1 X 3 0,0116X 2 X 3 Valor óptimo = 924,125 Bajo Alto Óptimo 1 2,5 2,5 600 1800 1800 65 85 65
Factor A: X1 B: X2 C: X3
Gráfica de Interacción para Altura 800
570
700
520
600 Altura
Altura
Gráfica de Efectos Principales para Altura 620
470
-
X1
2.5
600
X2
1800
65
X3
+
1
85
+
-
200
1
+
+-
300
370
-
-
500 400
420
320
+
AB
2.5
+ 1
AC
2.5
600
BC
1800
Efectos e interacciones significativas de factores principales
Contornos de la Superficie de Respuesta Estimada
Contornos de la Superficie de Respuesta Estimada X2=1200.0
X3=75.0 1800
1400 1200 1000
77 73 69
800 600
Altura 260.0-320.0 320.0-380.0 380.0-440.0 440.0-500.0 500.0-560.0 560.0-620.0 620.0-680.0 680.0-740.0 740.0-800.0 800.0-860.0 860.0-920.0
81
X3
1600
X2
85
Altura 260.0-320.0 320.0-380.0 380.0-440.0 440.0-500.0 500.0-560.0 560.0-620.0 620.0-680.0 680.0-740.0 740.0-800.0 800.0-860.0 860.0-920.0
1
1.3
1.6
1.9
2.2
65
2.5
X1
1
1.3
1.6
1.9
2.2
2.5
X1
Contornos de la Superficie de Respuesta Estimada X1=1.75 85
Altura 260.0-320.0 320.0-380.0 380.0-440.0 440.0-500.0 500.0-560.0 560.0-620.0 620.0-680.0 680.0-740.0 740.0-800.0 800.0-860.0 860.0-920.0
81
X3
77 73 69 65 600
800
1000
1200 X2
1400
1600
1800
Superficie respuesta estimada en el plano con punto óptimo de factores principales
La formación y crecimiento de columnas de ZnO sobre un sustrato de FTO se favorece con tiempos largos de exposición (≈ 30 minutos) de éste al electrolito. La densidad de corriente alta (≈ 2,5 mA/cm2) también favorece la formación y el crecimiento de las columnas. No obstante este factor tiene menor influencia que el tiempo de exposición. 213
Palacios C. Severo Superficie de Respuesta Estimada X3=75.0
Superficie de Respuesta Estimada X2=1200.0
Altura
760 660 560 460 360 260
1
1.3
1.6
X1
1.9
2.2
2.5
1800 1600 1400 1200 1000 800 600 X2
600 500
Altura
860
Altura 260.0-320.0 320.0-380.0 380.0-440.0 440.0-500.0 500.0-560.0 560.0-620.0 620.0-680.0 680.0-740.0 740.0-800.0 800.0-860.0 860.0-920.0
400 300 200
1
1.3
1.6
1.9
X1
2.2
2.5
65
69
73
77
81
85
Altura 260.0-320.0 320.0-380.0 380.0-440.0 440.0-500.0 500.0-560.0 560.0-620.0 620.0-680.0 680.0-740.0 740.0-800.0 800.0-860.0 860.0-920.0
X3
Superficie de Respuesta Estimada X1=1.75
780
Altura
680 580 480 380 280 600
800
1000 1200 1400 1600 1800 65
69
73
77
81
85
Altura 260.0-320.0 320.0-380.0 380.0-440.0 440.0-500.0 500.0-560.0 560.0-620.0 620.0-680.0 680.0-740.0 740.0-800.0 800.0-860.0 860.0-920.0
X3
X2
Superficie respuesta estimada en el espacio de factores principales
La temperatura alta (≈ 80 - 90 ºC) influye negativamente en la formación y crecimiento de las columnas. Siendo su efecto, en valor absoluto, superior al de la densidad de corriente alta y menor al del tiempo de exposición al electrolito. El tiempo de exposición y la densidad de corriente, considerados en conjunto, favorecen mucho la formación de columnas. Su efecto, en conjunto, es del orden del de el tiempo considerado sólo y mucho mayor que el de la densidad de corriente, también, considerada sola. Ejemplo 6.66 Los recubrimientos compuestos de Ni-D fueron electrodepositados desde una suspensión de nanopartículas de diamante (tamaño promedio 4 nm-sintetizado por PlasmaChem) en una solución típica Watts. Las nanopartículas se dispersaron en la solución mediante agitación magnética durante 24 horas y 5 minutos en el ultrasonido antes de la electrodeposición. Los recubrimientos de Ni y Ni-D fueron aplicados sobre un sustrato de acero AISI 1016 el cual se limpió y decapó según las normas ASTM B183 e ISO 9226. La electrodeposición se realizó empleando un electrodo de disco rotatorio acoplado a un potenciostato-galvanostato y la temperatura de la solución se controló empleando un baño termostatizado con recirculación. Una malla de platino con suficiente área efectiva se empleo como ánodo inerte y un electrodo de calomel saturado fue usado como electrodo de referencia. 214
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Siguiendo un diseño experimental factorial 2n completamente aleatorizado con replica, se depositaron los recubrimientos compuestos de NiD variando la densidad de corriente, la agitación del baño y la concentración de nanopartículas de Diamante en los niveles que se presentan en la tabla. Factores X1: DC (A/cm²) X2: Agitación (rpm) X3: Concentración (g/L)
2 400 10
Prueba
X1
X2
X3
1 2 3 4 5 6 7 8
2 5 2 5 2 5 2 5
400 400 900 900 400 400 900 900
10 10 10 10 20 20 20 20
Niveles 0 3,5 650 15
+ 5 900 20
Espesor película (µm) 14 40 15 40 14 39 15 39,5
Los recubrimientos compuestos de Ni-D presentan mejor resistencia a la corrosión que los recubrimientos de Níquel puro, cuando son obtenidos a altas velocidades de rotación del electrodo y alta concentración de partículas en el baño. Efectos estimados para Película Efectos Interacciones A: X1 = 25,125 AB = -0,375 B: X2 = 0,625 AC = -0,375 C: X3 = -0,375 BC = 0,125 Errores estándar con 1 GL Fuente A: X1 B: X2 C: X3 AB AC BC Error Total
Tabla 4.12 Análisis de varianza SC GL CM Fo Ft(99%) 1262,53 1 1262,53 40401,0 > 12,25 0,78125 1 0,78125 25,0 > 12,25 0,28125 1 0,28125 9,0 < 12,25 0,28125 1 0,28125 9,0 < 12,25 0,28125 1 0,25125 9,0 < 12,25 0,03125 1 0,03125 1,0 < 12,25 0,03125 1 0,03125 1264,22 7 R² = 99,9975%
Pelicula 4,4625 9,075X 1 0,00225X 2 0,0175X 3 0,0005X 1 X 2 0,025X 1 X 3 0,00005X 2 X 3
215
Palacios C. Severo
Factor X1 X2 X3
Valor óptimo = 40.0625 Bajo Alto 2,0 5,0 400,0 900,0 10,0 20,0
Óptimo 5,0 900,0 10,0 Gráfica de Interacción para Pelicula
44
39
39
34
34
Pelicula
Pelicula
Gráfica de Efectos Principales para Pelicula 44
29
29
24
24
19
19
14
14
2
5
X1
400
X2
900
10
X3
+
-+
20
-+
+
+ 2
+ 5
AB
2
AC
5
400
BC
900
Efectos e interacciones significativas de factores principales Superficie de Respuesta Estimada X3=15.0
Contornos de la Superficie de Respuesta Estimada X3=15.0 Pelicula 14.0-17.0 17.0-20.0 20.0-23.0 23.0-26.0 26.0-29.0 29.0-32.0 32.0-35.0 35.0-38.0 38.0-41.0 41.0-44.0 44.0-47.0
800
X2
700 600 500 400
44 39
Pelicula
900
34 29 24 19 14
2
2.5
3
3.5 X1
4
4.5
5
2
2.5
3
3.5
X1
4
4.5
5
900 800 700 600 500 X2 400
Pelicula 14.0-17.0 17.0-20.0 20.0-23.0 23.0-26.0 26.0-29.0 29.0-32.0 32.0-35.0 35.0-38.0 38.0-41.0 41.0-44.0 44.0-47.0
Superficie respuesta estimada en el plano y espacio de factores principales
La presencia de las nanopartículas en los recubrimientos de Níquel, mejora su microdureza hasta en un 243,3%. La incorporación de nanopartículas de Diamante en la matriz de Níquel, tiene un efecto positivo sobre el proceso de electrodeposición, haciéndolo más eficiente. El transporte de masa influye durante el proceso de electrodeposición de los recubrimientos compuestos Ni-D. Las nanopartículas de Diamante cambian la morfología de los recubrimientos de Níquel, haciéndolos más compactos. Ejemplo 6.67 El licor residual de la tecnología ácida de níquel y cobalto ocupa un lugar cimero entre los efluentes líquidos que poseen un mayor poten216
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
cial de impacto ambiental en éste proceso debido a su alta acidez y a la presencia de varios metales disueltos (Cr, Mn, Al, Zn, Fe, Ni, Co). En el ámbito mundial uno de los aspectos principales a tener en cuenta al diseñar los procesos de recuperación de níquel y cobalto usando la lixiviación ácida a presión de minerales oxidados de níquel está relacionado precisamente con el tratamiento a realizar al licor residual que se genera. Para realizar el estudio se utilizó una muestra compósito representativa del licor residual de la tecnología ácida de níquel y cobalto, con un contenido promedio de 8,2 g/L de H2SO4, 4,3 g/L de aluminio y 0,62 g/L de cromo. Como reactivo neutralizante se usó una muestra compósito representativa de los sólidos residuales industriales del proceso carbonato amoniacal, o sea, una muestra de la suspensión saliente de los alambiques de destilación de amoniaco que se envía al depósito de colas. En la tabla1 se muestra la composición química de dicha muestra. En ella se observa que el contenido de magnesio en dicha muestra fue 4,11%, siendo éste el elemento neutralizante principal. En el estudio experimental se analizó la influencia de varias variables en el proceso: la temperatura; la relación Mg/ácido, expresada en gramos de magnesio contenidos en los sólidos residuales industriales con respecto a los gramos de ácido libre en el licor residual; la inyección de un agente oxidante, oxígeno del aire y la agitación. Las principales respuestas que se analizan en el diseño son la neutralización del ácido libre (H2SO4) y la precipitación del aluminio y el cromo del licor residual. En el diseño de la matriz experimental se usó el método factorial completo (2n). En la tabla se muestran las variables y los niveles usados. Factores X1: Temperatura (°C) X2: Relación Mg/ácido (g/g) X3: Agitación (Re) X4: Inyección aire (L/min)
70 1 8000 5
Niveles 0 75 1,5 10000 7,5
+ 80 2 12000 10
La selección de la temperatura en el nivel medio de 75 °C estuvo basada en pruebas preliminares realizadas. La relación magnesio/ácido 217
Palacios C. Severo
fue establecida en el nivel básico en 1,5 gramos de magnesio contenidos en los sólidos residuales por gramos de ácido libre contenidos en el licor residual. Dicho valor se determinó sobre la base de cálculos estequiométricos con relación al ácido libre contenido en el licor residual y del ácido que se genera durante la hidrólisis del aluminio y el cromo. El nivel mínimo de este parámetro se fijó en 1 g/g y el nivel máximo en 2 g/g, para un intervalo de precisión de 33,33%. La intensidad de agitación fue determinada mediante el número de Reynolds, tomándose como nivel básico un valor de 10000 entre los regímenes transitorio y turbulento, con un grado de precisión de 20%, lo que corresponde a un Re de 8000 en el nivel mínimo y de 12000 en el nivel máximo. La inyección de aire se realizó para valorar su influencia en la disminución del contenido de hierro en el licor neutralizado. Se utilizó un reactor de 2 litros de capacidad de dimensiones estándar con un coeficiente de llenado del 85%, para un volumen útil de trabajo de 1,7 litros. En la tabla se muestra la matriz experimental descodificada. Prueba 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Temp (°) 70 80 70 80 70 80 70 80 70 80 70 80 70 80 70 80
Relación (Mg/ácido) 1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2
Agitación (Re) 8000 8000 8000 8000 12000 12000 12000 12000 8000 8000 8000 8000 12000 12000 12000 12000
Aire (L/min) 5 5 5 5 5 5 5 5 10 10 10 10 10 10 10 10
Al (g/L) 3,66 4,30 2,59 0,78 2,57 0,23 0,20 2,64 2,27 0,85 0,20 1,04 2,64 0,97 2,09 2,14
Cr (g/L) 0,12 0,62 0,31 0,14 0,32 0,06 0,06 0,32 0,32 0,14 0,06 1,04 0,31 0,15 0,31 0,33
pH 3,66 1,20 3,35 3,60 3,33 3,77 3,85 3,33 3,38 3,60 3,80 3,57 3,23 3,59 3,38 3,52
Para realizar los experimentos se midió el volumen de licor residual y se adicionó al reactor, secalentó la solución hasta alcanzar la temperatura de trabajo, se puso en funcionamiento el agitador y el compresor de aire, se adicionó la suspensión de sólidos residuales y se puso en marcha el cronómetro inmediatamente. Finalmente se tomaron las muestras para los análisis químicos. 218
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Se observa el incremento que tiene lugar en el pH del licor residual y la disminución que se produce en el contenido de aluminio y cromo en el licor. El pH aumenta de 1,2 a 3,47 y la concentración de aluminio y cromo disminuyen de 4,3 y 0,62 g/L a 1,5 y 0,21 g/L respectivamente como promedio general de todo el diseño. La concentración promedio de Ni y Co en el licor obtenido en el diseño es de 0,2 y 0,078 g/L respectivamente, produciéndose un incremento notable en el contenido de estos elementos en el licor tratado, de modo que el licor que se obtiene constituye una fuente potencial para recuperar éstos metales de alto valor en el mercado. En la tabla se muestra el porcentaje de disminución del ácido libre del licor residual y de precipitación del aluminio y el cromo. También se muestra la disolución que tiene lugar de metales de los sólidos residuales durante la neutralización. Prueba 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Ácido libre (%) H2SO4 99,4 99,7 99,5 99,1 99,0 99,7 99,4 98,7 99,1 99,4 99,5 99,0 99,0 99,5 99,6 98,8
Precipitación Al y Cr (%) Al Cr 37,5 35,3 92,9 85,5 69,9 66,6 33,6 36,7 22,8 36,7 93,1 85,8 65,9 64,7 22,9 38,5 38,8 39,7 63,3 62,1 78,8 71,1 25,0 36,9 24,2 39,7 72,4 67,8 92,1 85,1 36,9 41,8
Ni 43,0 25,2 18,1 27,4 22,4 21,3 16,5 22,6 28,0 16,2 19,4 20,7 20,4 17,6 20,5 26,2
Disolución de metales (%) Co Fe Mg 43,6 4,3 27,1 40,4 2,6 24,6 34,1 1,7 21,0 45,8 3,7 31,5 40,1 2,4 32,2 34,9 2,8 22,5 32,8 1,5 21,5 40,8 2,3 27,6 46,5 3,8 33,3 33,6 1,5 20,4 38,3 2,2 22,8 39,4 2,2 30,4 40,1 2,2 28,9 33,6 1,7 20,7 35,8 2,6 22,0 44,3 3,3 33,9
Mn 49,5 34,2 23,8 49,4 33,7 24,3 20,7 29,4 47,1 24,6 29,5 30,9 31,8 22,8 25,6 41,9
En la tabla se muestran los valores obtenidos de R2, el error estándar y las pruebas estadísticas Durvin Watson. Estadigráfo R² Error estándar Darwin-Watson
Ni 98,77 2,79 1,65
Co 99,86 0,64 1,48
Fe 99,51 0,23 2,20
Mg 99,63 1,14 1,83
Al 99,96 2,07 2,10
Cr 99,66 4,43 1,60
H2SO4 97,96 0,28 1,76
Los valores de R2, indicativos de la proporción de la varianza de las variables de salida (Y) con respecto a las variables de entrada (X), son 219
Palacios C. Severo
altos en todos los casos, lo que denota un buen porcentaje de adaptación de los datos experimentales a los modelos lineales. Los resultados de la prueba estadística Durvin – Watson indican que no existe correlación significativa entre los diferentes efectos escogidos como independientes, ya que los valores obtenidos en este estadígrafo son mayores que el valor mínimo de 1,4 que se utiliza como patrón comparativo. A continuación se presentan los modelos estadísticos de las variables de salida. Los mismos presentan un nivel de confiabilidad o significación estadística del 95% y se excluyen las variables e interacciones que no tienen una influencia estadísticamente significativa. Modelos estadísticos de la precipitación del aluminio y el cromo del licor residual % Al 54,38 48,35 Re l 17,18Temp %Cr 55,86 35,41Re lación 8,52Temp 8,07(Re l )(Temp)
y de la neutralización del ácido libre: % Ac 99,28 0,462 Re l
Modelos estadísticos de la disolución de magnesio, níquel, cobalto, hierro y manganeso del licor residual: %Mg 26,27 8,70 Re l 1,84Temp 2,23(Re)(Temp)
% Ni 22,84 7,07Temp 6,98 Re l %Co 39,02 7,13 Re l 4,39Temp 1,56 Aire 1,52(Temp)( Aire)
%Fe 2,56 1,25Temp 0,96 Re l 0,27(Temp)(Rel )
%Mn 32,45 13,5 Re l 10,45Temp 5,05(Temp)(rel)
Donde: Temp = Temperatura Rel = Relación Re = Reynolds En las ecuaciones anteriores se observa que la relación magnesio/ácido y la temperatura son las variables que ejercen una mayor 220
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
influencia en el proceso. El aumento de la relación magnesio/ácido favorece la neutralización del ácido libre y la precipitación del aluminio y el cromo que están disueltos en el licor residual e influye de forma negativa en la disolución de Mg, Ni, Co, Fe y Mn de los sólidos residuales industriales. El aumento de la temperatura favorece la precipitación del aluminio y el cromo del licor residual así como la disolución del Mg, Ni, Co, Fe y Mn de los sólidos residuales industriales. Existe una alta correlación entre las variables de entrada (temperatura, relación magnesio/ácido, agitación y aire) y las respuestas de salida, siendo el valor de R2 superior al 98%. Las variables que ejercen una mayor influencia sobre las respuestas analizadas son la relación magnesio/ácido y la temperatura. No obstante la inyección de oxígeno del aire y el Reynolds ejercen también una influencia significativa sobre algunas variables. El orden de influencia de las variables analizadas es en orden decreciente la relación magnesio/ácido, la temperatura, la inyección de aire y la agitación. A los 15 minutos de reacción, a la temperatura de 80 °C, relación magnesio/ácido de 2 g/g, agitación, Re: 12000 y un flujo de aire de 10 L/min., se neutraliza el 99,6% del ácido y precipita el 92,94% del aluminio y el 85,54% del cromo. Se recomienda completar la neutralización del licor residual con carbonato e hidróxido de calcio y recuperar el níquel y el cobalto a partir del licor neutralizado con los sólidos residuales.
221
Palacios C. Severo
Problemas (205) En un estudio del rendimiento para el desarrollo de un proceso se consideraron cuatro factores, cada uno a dos niveles: tiempo (A): 2,5 a 3, concentración (B): 14 a 18, presión (C): 60 a 80, y temperatura (D): 225 a 250. Se corrieron dos replicas de un diseño 24, y los datos resultantes se muestran en la siguiente tabla: A + + + + + + + +
B + + + + + + + +
C + + + + + + + +
D + + + + + + + +
Replica I 12 18 13 13 17 15 20 15 10 25 13 24 19 21 17 23
Replica II 14 16 15 17 18 14 19 17 13 22 16 25 21 23 22 26
Que factores y que interacciones influyen en el rendimiento. Elabore gráficas e interprete los efectos de los factores principales y las interacciones (206) Un equipo realizó un estudio del rendimiento de un proceso para establecer los parámetros óptimos de operación. El equipo decidió considerar tres factores, cada uno a dos niveles. Se corrieron dos réplicas y decidieron utilizar un diseño 23. A = Tiempo (2 h, 4 h) B = Concentración (10%, 20%). C = Presión (55 psi, 85 psi) A + + + +
B + + + +
C + + + +
Rendimiento I II 12 14 18 16 13 15 16 17 17 18 15 14 20 19 15 17
Que factores y que interacciones influyen en el rendimiento. Elabore gráficas e interprete los efectos de los factores principales y las interacciones 222
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(207) Un investigador químico desea determinar las condiciones experimentales óptimas para la determinación colorimétrica de Mn en un mineral. Tres de los factores más importantes que pueden afectar esta determinación son: la cantidad de oxidante añadido, la temperatura de calentamiento y la longitud de onda seleccionada para medir la absorbancia de la muestra. Realiza un experimento factorial 23 con diferentes niveles de los factores de interés, obteniendo 8 determinaciones replicadas para todas las posibles combinaciones estudiadas. A continuación se muestran las condiciones del diseño y los resultados obtenidos: Vox + + + +
λ + + + +
T + + + +
0,45 0,87 0,66 0,88 0,24 0,63 0,55 0,73
Mn (%) 0,46 0,89 0,66 0,90 0,22 0,65 0,55 0,73
0,44 0,89 0,68 0,91 0,25 0,61 0,51 0,71
Qué factores influyen significativamente de manera independiente en el rendimiento de la reacción Qué interacciones entre factores son estadísticamente importantes y cómo son estas Cuáles son las condiciones experimentales óptimas (208) Se realiza un experimento factorial 24 en una planta piloto para estudiar los efectos que se supone influyen sobre la rapidez de filtración de un producto. Se estudia el efecto de 4 factores, temperatura, presión, concentración de reactivo y rapidez de mezclado. Los resultados del diseño se muestran a continuación: A + + + + + + + +
Factores B C + + + + + + + + + + + + + + + +
D + + + + + + + +
Filtración 45 71 48 65 68 60 80 65 43 100 45 104 75 86 70 96
223
Palacios C. Severo
Plantee la ecuación de regresión teniendo en cuenta los resultados de la tabla de ANOVA y el error de cada coeficiente. Actúan de manera independiente los factores estudiados. Interprete el gráfico de efectos principales y el de las interacciones. Halle el valor óptimo de rapidez de filtración junto a su intervalo de confianza. Se puede simplificar este diseño 24 a un diseño experimental 23 Si su respuesta es positiva, realice partiendo de éste un diseño de experimentos 23. (209) Se aplicó un diseño factorial 24 para estudiar un proceso de corrosión selectiva con nitruro en un plasma corrosivo. En el proceso se utilizó C2F6 como gas reactivo y se tomaron como factores de interés el espacio entre ánodo y cátodo (A), la presión en la cámara del reactor (B), gasto de C2F6 (C) e intensidad de la corriente aplicada al cátodo (D). La variable de respuesta de interés es la rapidez de corrosión del nitruro de silicio. Los resultados obtenidos son los siguientes: A + + + + + + + +
Factores B C + + + + + + + + + + + + + + + +
D + + + + + + + +
Rapidez de Corrosión 550 669 604 650 633 642 601 635 1037 749 1052 868 1075 860 1063 729
Estime los efectos de los diferentes factores sobre la rapidez de corrosión. Realice el ANAVA y determine los factores importantes para el rendimiento Escriba la ecuación de la regresión, teniendo en cuenta los intervalos de confianza correspondientes. Determine las condiciones experimentales óptimas que permiten obtener la mayor rapidez de corrosión. Si no todos los factores son importantes, realice un nuevo diseño 2k con k 21,2 B 25,00 1 25,00 581,39 > 21,2 AB 0,00 1 50,8 1270,00 > 21,2 Curvatura 50,8 1 0,00 0,00 < 21,2 Error 0,17 4 0,04 Total 300,97 7
El análisis de varianza indica que ambos factores presentan efectos significativos y que no hay interacción AB = 0, existe evidencia de curvatura en la respuesta de la región explorada. XI. DISEÑO CONFUNDIDO Un diseño confundido es una técnica mediante el cual se confunden, deliberadamente, ciertos efectos sin importancia, con el propósito de fijar los efectos más importantes con mayor precisión. En el hecho, al calcular el valor de un efecto o interacción confundido estamos calculando la suma de los dos. Las situaciones que requieren el uso del presente diseño: a) Aquellos en los cuales no hay suficiente materia prima para efectuar una experimentación completa. En el diseño experimental se denomina bloque a una agrupación homogénea de experimentos. b) Aquellas en los cuales la experimentación se realiza usando dos o más tipos de maquinas. XII. DISEÑO FACTORIAL 2K CON DOS BLOQUES Si deseamos correr una sola replica del diseño 2n. Requerimos una cantidad de materia prima y cada lote de materia prima deberá cubrir una prueba de las combinaciones de tratamiento. 234
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Tabla 6.64 Diseño 24 con dos bloques, asignando las corridas Bloque I Bloque II (1) = 71 a = 65 ab = 65 b = 60 ac = 95 c = 90 bc = 86 d = 85 ad = 88 abc = 96 bd = 68 bcd = 75 cd = 83 acd = 85 abcd = 70 abd = 60 Σ 626 Σ 636 Σ 1262
Por lo tanto se requieren n lotes de materia prima. Si estos lotes se tratan como bloques, entonces debemos asignar la mitad de la n combinaciones de tratamiento a cada bloque no replicado. Los efectos e interacciones se calculan idénticamente a un diseño factorial simple no replicada. Ejemplo 6.71 Del ejemplo 6.67, el experimento factorial 24 deseamos tratarlo en bloques. Supongamos que no se pueden efectuar las 24 combinaciones en un mismo día. Decidiendo el experimentador realizar diariamente ocho combinaciones por bloque, por ser apropiado. Es lógico confundir la interacción de mayor orden ABCD con los bloques. Fuente Bloque (ABCD) A B C D AB AC AD BC BD CD Error Total
Tabla 6.65 Análisis de Varianza del Bloque SC GL CM Fo 6,25 1 6,25 0,21 42,25 1 42,25 1,14 240,25 1 240,25 8,21 600,25 1 600,25 20,52 2,25 1 2,25 0,08 20,25 1 20,25 0,69 0,25 1 0,25 0,01 0,25 1 0,25 0,01 6,25 1 6,25 0,021 72,25 1 72,25 2,74 812,25 1 812,25 27,77 117,00 4 1919,75 15
< < > > < < < < < < >
Ft(99) 7,71 7,71 7,71 7,71 7,71 7,71 7,71 7,71 7,71 7,71 7,71
La suma de cuadrados del bloque SCbloque 6262 6382 / 8 1262 / 16 6,25 2
SCA 42,25
SCB 240,25
SCC 600,25
SCD 2,25
SC AB 20,25
SCAC 0,25
SCAD 0,25
SCBC 6,25
SCBD 72,25
SCCD 812,25 235
Palacios C. Severo
Las sumas de cuadrados de los efectos e interacciones se proceden a analizar por diferentes técnicas (ver algoritmo de Yates). Se ha decidido que las interacciones de tres factores son despreciables, por lo que la suma del error es: SCerror SC ABC SC ABD SC ACD SC BCD SC error 30,25 12,25 72,25 2,25 117
Como podemos visualizar el bloque ABCD no influye en el análisis de las combinaciones de los tratamientos, siendo B, C y CD los efectos e interacciones que presentan significación, tal como concluimos en el mismo ejemplo del diseño 24. XIII. DISEÑO FACTORIAL 2k CON 4 BLOQUES Este tipo de diseño es de mucha utilidad cuando se desarrolla experimentos a nivel laboratorio y bach, el número de factores es relativamente grande con k>4. Ejemplo 6.72 Consideremos un diseño factorial 25, a cada bloque debemos asignar ocho combinaciones de tratamiento correspondientes, requiriendo un total de cuatro bloques para las 32 pruebas a desarrollar para efectuar el experimento.
1 ad bc abe ace cde bde abcd
Tabla 6.66 Diseño 25 con 4 bloques, asignando las corridas Bloque I Bloque II Bloque III Bloque IV = 2,152 a = 2,025 b = 2,111 e = 2,057 = 2,004 d = 2,170 c = 2,267 ac = 2,013 = 2,301 be = 2,037 ae = 2,033 bd = 2,164 = 1,991 ce = 2,210 de = 2,072 cd = 2,301 = 1,978 abc = 2,220 abd = 2,146 ab = 2,041 = 1,944 bcd = 2,332 acd = 2,114 ade = 2,057 = 2,215 abde = 1,857 abce = 2,025 bce = 2,236 = 2,161 acde = 1,919 bcde = 1,898 abcde = 1,944 Σ 16,746 Σ 16,770 Σ 16,666 Σ 16,813 Σ 66,995
SCbloque SCABCDE 0,01197 Fuente Bloque (ABCD) A B C 236
SCerror 0,0999
Tabla 6.67 Análisis de Varianza del bloque SC GL CM Fo 0,0119 1 0,0119 1,7955 0,1173 1 0,1173 17,595 0,0041 1 0,0041 0,0615 0,0167 1 0,0167 2,505
SCtotal 0,4898
< > < <
Ft(99) 4,54 4,54 4,54 4,54
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería D E AB AC AD AE BC BD BE CD CE DE Error Total
0,0050 0,1311 0,0005 0,0026 0,0007 0,0014 0,0045 0,0003 0,0077 0,0239 0,0352 0,0266 0,0099 0,4989
1 1 1 1 1 1 1 1 1 1 1 1 15 31
0,0050 0,1311 0,0005 0,0026 0,0007 0,0014 0,0045 0,0003 0,0077 0,0239 0,0352 0,0266 0,0067
0,750 19,665 0,075 0,390 0,1015 0,210 0,675 0,045 1,155 3,585 5,250 3,990
< > < < < < < < < < > <
4,54 4,54 4,54 4,54 4,54 4,54 4,54 4,54 4,54 4,54 4,54 4,54
XIV. DISEÑO FACTORIAL 2k CON BLOQUES REPLICADOS Es una variedad del diseño confundido en donde el vector respuesta se repite o replica dos, tres, …… veces. Para entender mejor este tipo de diseño aplicaremos un ejemplo. Ejemplo 6.73 Se realiza un estudio para determinar los efectos que tienen tres variables A, B y C. Se efectúan sólo cuatro combinaciones de tratamiento. Por lo tanto, cada réplica del diseño 23 debe recopilarse en dos bloques. Se realiza las reproducciones confundidas ABC en la replica I y AB en la replica II.
1 ab ac bc
= = = =
Tabla 6.68 Diseño 23 con bloques replicados Replica I Replica II 68,72 a = 67,85 1 = 68,66 a 69,44 b = 69,60 c = 68,17 b 67,93 c = 67,75 ab = 69,02 ac 68,73 abc = 68,72 abc = 68,66 bc Σ 548,74 Σ 548,75
= = = =
68,22 69,10 68,26 68,66
" SC ABC a b c abc ab ac bc 1 / n * 2 k 0,0125 2
" SC AB 1 abc ab c ac a b bc / n * 2 k 0,0169 2
SCreplica 548,74 2 548,752 / 8 1097,49 / 16 0,0001 2
" " SCbloque SCABC SCAB 0,0506 0,00456 0,005516
237
Palacios C. Severo
SC total 4,36655 Tabla 6.69 ANAVA diseño 2k con bloques replicados Fuente SC GL CM Fo Replica 0,00001 1 0,00001 9,94E C 0,8695 1 0,8695 8,6483 > AB (replica) 0,0269 1 0,0269 0,1381 < AC 0,2047 1 0,2047 2,0360 < BC 0,0650 1 0,0650 0,6465 < ABC (replica) 0,0125 1 0,0125 0,1243 < Error 0,5027 5 0,1005 Total 4,3665 15
Ft(99) 7,71 6,94 7,71 7,71 7,71 7,71 7,71 7,71 7,71
Los efectos principales B y C son significativos, vemos que la replica y los bloques no afectan el proceso. XV. ALGORITMO DE YATES Un método rápido para calcular los efectos e interacciones y que proporciona seguridad en el análisis de varianza posterior, de un diseño factorial. Construcción de Yates: La primera mitad de la columna se forma sumando el vector respuestas por pares. La segunda mitad de la columna se forma restando el vector respuestas por pares (el segundo menos el primero) y así sucesivamente. Las demás columnas se generan de la misma manera usando los datos de la columna anterior. Los efectos se calculan dividiendo la última columna por 2n-1, donde n es el número de factores. La suma de cuadrados se calcula, elevando al cuadrado los miembros de la última columna y dividiendo por 2n. Si en caso se realizan replicas en el proceso, entonces el calculo de los efectos deberá dividirse por k*2n-1, donde k es el número de replicas. De igual manera para el calculo de la suma de cuadrados multiplicar por k*2n. Ejemplo 6.74 Los datos de la tabla 6.70, analizarlo aplicando la técnica de Yates. 238
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Comprobación a. La suma total de la vector respuesta deberá ser igual al primer valor de la última columna, caso contrario se ha ejecutado un mal cálculo. b. La suma total de la suma de cuadrados debe ser igual a la suma de cuadrados del total, de la siguiente manera. Y 68,72 67,85 69,60 69,44 67,75 67,93 68,73 68,72 548,74
1 a b ab c ac bc abc
Tabla 6.70 Algoritmo de Yates I II III Efectos 136,57 275,61 548,74 139,04 273,13 -0,86 -0,215 135,68 -1,03 4,24 1,060 137,45 0,17 0,52 0,130 -0,87 2,47 -2,48 -0,620 -0,16 1,77 1,20 0,300 0,18 0,71 -0,70 -0,175 -0,01 -0,19 -0,90 -0,225
SC 0,0924 2,2472 0,0338 0,7688 0,1800 0,0612 0,1012 3,4847
SCtotal Yi 2 Yi / 2 n 2
Y 68,72 67,85 69,60 69,44 67,75 67,93 68,73 68,72 Σ+ ΣDiferencia Efectos
A + + + + 273,9 274,9 -0,86 -0,22
Tabla 6.71 Yates modificados B AB C AC + + + + + + + + + + + + + + + + 276,5 274,6 273,1 274,9 272,2 274,1 275,6 273,8 4,24 0,53 -2,48 1,2 1,06 0,13 -0,62 0,3
BC + + + + 274,0 274,7 -0,7 -0,18
ABC + + + + 273,4 274,8 -0,9 -0,23
SCtotal Yi 2 Yi / 2 n 37642,93 37639,4485 3,4847 2
239
Palacios C. Severo
Problemas (217) Se estudia la recuperación del cromo, níquel e hierro de los desechos de acero inoxidable. La disolución de dicho acero se realiza electrolíticamente, siendo las variables pH y temperatura, de acuerdo a los estudios termodinámicos el potencial de la aleaciones Ea = 2,897. Elabore el ANAVA y analice los efectos e interacciones del proceso. pH: 8,88 8,43 7,01 6,92 T: 23,9 28,3 24,3 27,5 Ed: 2,16 2,08 2,22 2,19 (218) Un relave con alto contenido de plata 300 g/ton, es tratado por flotación y cianuración siendo ambos procesos antieconómicos. Se procede a realizar un estudio de lixiviación en medio clorurante oxidante, siendo sus variables A: cloruro de sodio 50 - 150 g/l, B: Tiempo 5 - 10 h, C: Ácido sulfúrico 5 – 0 g/l. Y: 89 87 84 79 86 88 83 82 Elabore el diseño y analice. (219) En un laboratorio de investigación se produce un derivado químico, el investigador tiene interés en los efectos de los factores A: H2SO4 87 - 93 %, B: Tiempo 15 - 30 min, C: catalizador 35 45 min, D: Temperatura 60 - 80 °C. (220) Un investigador en Bacteriología esta interesado en el efecto que tienen dos diferentes medios de cultivo y dos lapsos sobre el crecimiento de un virus en particular. Realiza un diseño factorial 22 en orden aleatorio. Analice los datos que se muestran. A: 21 - 37, B: 26 - 34. (221) Se manufacturan circuitos integrados. El proceso básico de procedimiento consiste en depositar una capa epitaxial en el tablero de silicio pulido. Los tableros se colocan dentro de una campana en el cual se introduce vapores químicos. El receptor se hace girar y se aplica calor hasta que la capa epitaxial sea la adecuada. Se realizó un experimento empleando dos factores, A: Gasto de arsénico 55 59, B: Tiempo de depósito 1 - 2. Se corrieron cuatro replicas, y se midió el grosor de la capa epitaxial Replica 1: 14,1 13,8 14,8 14,2 Replica 2: 16,1 13,8 14,7 14,9 Replica 3: 13,9 14,0 14,8 14,4 Replica 4: 13,9 13,2 14,8 14,9 240
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(222) Se utiliza una aleación ligera de aluminio-titanio para la fabricación de componentes aeroespaciales. Se realizo un estudio sobre agrietamiento a fin de determinar el efecto de cuatro factores sobre las grietas. Los factores son A: Temperatura, B: Contenido de titanio, C: Tratamiento térmico, D: Contenido de aluminio. Se hicieron dos replicas de un diseño 24, se mide la longitud de grieta en mm. Replica I 1,7 1,4 1,3 1,6 1,2 1,2 1,4 1,2 2,0 1,8 1,7 1,4 1,8 1,3 1,4 1,3
Replica II 1,9 1,4 1,5 1,5 1,3 1,2 1,4 1,2 2,1 1,8 1,9 1,5 1,9 1,2 1,2 1,3
Estime los efectos de los factores. Realice un ANAVA. Existe algún indicio de que algún factor influya en la variabilidad de agrietamiento. (223) Se realizó un experimento en una prensa de dispositivos para microcomputadoras. Se estudian 5 factores, cada Uno a dos niveles los factores son A: Tiempo, B: Revelado C: Dimensión D: Corrosión, E: Material. 1 a b ab c ac bc abc
= = = = = = = =
8 10 32 50 18 21 44 61
d ad bd abd cd acd bcd abcd
= = = = = = = =
6 10 30 53 15 22 45 65
e ae be abe ce ace bce abce
= = = = = = = =
8 12 35 52 15 20 45 63
de ade bde abde cde acde bcde abcde
= = = = = = = =
7 9 34 55 16 20 40 60
Realice un ANAVA Interprete las interacciones significativas Desarrolle un diseño 25 y un diseño con bloques. (224) En un estudio del rendimiento de un proceso se consideran 4 factores, cada uno a dos niveles, A: Tiempo 2,5 - 3, B: Concentración 16 - 18, C: Presión 70 - 90, D: Temperatura 250 - 200. Se corre una sola replica de un diseño 24. Y: 12, 18, 13, 16, 17, 15, 20, 15, 10, 25, 13, 24, 19, 21, 17, 23
Realice un ANAVA
241
Palacios C. Severo
Pruebe realizar un diseño por bloques e interprete. (225) Se elabora galletas, y se desea saber si las variables tienen influencia en el proceso siendo A: Material vidrio-aluminio, B: Homogenizado pala-batidor, C: Harina popular-extra. El vector respuesta es lo crocante. Analice los datos de las replicas. Replica 1 Replica 2 Replica 3 Replica 4
11 9 10 10
15 10 16 19
19 12 11 11
16 17 15 12
10 11 15 18
12 13 14 13
10 12 13 10
15 12 12 13
(226) Se desea realizar una investigación con el fin de estudiar la influencia de tres factores en la vida media de un pesticida químico aplicado en el suelo. La unidad experimental lo constituirán recipientes que contienen el suelo sobre el cual se aplica el pesticida. Los niveles de los factores a estudiar son los siguientes: Factores A: Temperatura (°C) B: Humedad (%) C: Suelo (%)
Niveles + 25 35 15 35 1 3
Se desarrollan replicas con la finalidad de evaluar la vida media del proceso, siendo los resultados experimentales: Y1: 886, 188, 230, 130, 168, 65, 156, 32 Y2: 850, 190, 235, 127, 170, 60, 160, 30
¿Cual de las variables independientes influyen en el proceso? ¿Cuantas pruebas realizará para desarrollar el proceso? ¿Que temperatura, humedad y tipo de suelo el pesticida no es nocivo? (227) Se desea controlar la emisión gaseosa de SO2 de una planta por medio de inyección de sosa calcinada en la parte superior del emisor. Dicho método funciona en el laboratorio, pero cuando se implemento a nivel industrial, se formo ocasionalmente NO 2, provocando un gas tóxico. Con el fin de investigar las condiciones bajo las cuales se produce, se diseño un experimento factorial considerando los siguientes factores a tres niveles: Factores A: Concentración de SO2 (ppm) B: Temperatura (°C) C: Concentración de O2 (%) D: Humedad (%)
Niveles + 0 3000 150 350 0 6 0 20
Se realiza el experimento con la finalidad de controlar la emisión de NO2, siendo los resultados experimentales: 130 150 210 200 110 180 110 150 130 150 250 140 140 220 150 170
Además se desarrollaron pruebas centrales, siendo estos: 470 740 830 730
242
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
¿Se desea eliminar la presencia de NO2, por lo que se quiere saber que factores deben controlarse? (228) Se desea investigar la influencia de cuatro factores en la vida media del problema 226. Se desea efectuar dos bloques con la finalidad de mezclar los efectos. Se desea verificar los factores de mayor influencia en la vida media del proceso. A que temperatura, humedad y que tipo de suelo el pesticida no es nocivo. (229) En un laboratorio de corrosión se desea evaluar la eficiencia de un inhibidor para disminuir la corrosión de una tubería de hierro, utilizada para el transporte de agua en la industria petrolera. Una de las variables de mayor importancia fue la temperatura promedio del agua que se usa como refrigerante y la otra la concentración del inhibidor. Los niveles de ambos factores son: Factores A: Temperatura B: Inhibidor
Niveles + 60 90 10 15
Las respuestas obtenidas en diversas probetas de hierro fue la disminución del espesor a cierto tiempo de inmersión durante un tiempo constante para todas las probetas. 40,2 54,7 29,6 28,8 Desarrollando pruebas centrales con la finalidad de evaluar la varianza del error: 38,6 37,8 37,1 39,0 ¿Mediante un diseño factorial aplique el mínimo ascenso para averiguar en que zona debemos realizar pruebas adicionales para minimizar la corrosión de la tubería de hierro? (230) Se desea minimizar la vida media del problema 226, por el cual se corrieron pruebas adicionales con la finalidad de optimizar dicho proceso, siendo su vector respuesta: 462 298 424 343 247 479 219 313 256 402 491 292 250 484 Así mismo se corrieron pruebas centrales siendo estas: 348 340 337 ¿Se desea conocer el modelo y su forma geométrica? ¿Cuales son los niveles óptimos de las variables que eliminan la permanencia del pesticida? (231) Se desea maximizar la resistencia de un acero que depende de dos aleantes Mo y W. Factores A: Mo (%) B: W (%)
Niveles + 0.2 0.8 1.5 3.5
243
Palacios C. Severo
Un investigador decide experimentar pruebas secuenciales, para lo cual desarrolla las siguientes aleaciones: Suponiendo que la resistencia del acero es una función establecida por: R 1000 15W 0,5Mo 1²² 4,52 Mo² Se desea saber: Cual es la combinación óptima del aleante para alcanzar la máxima resistencia En cuantas pruebas se puede llegar al máximo (232) La eficiencia de un fertilizante depende de sus componentes minerales del suelo que se va a utilizar. Un estudioso decide preparar diversos tipos de suelos y aplicar el fertilizante a una variedad vegetal y la respuesta esta medida en función del rendimiento del fertilizante. El contenido de los minerales varia en los siguientes rangos: Factores
0.2 1.5 0.3 0.0
A: Fósforo (%) B: Fertilizante (%) C: Nitrógeno (%) D: Carbono (%)
Niveles
+ 0.6 3.0 0.9 0.6
Suponiendo que la eficiencia del fertilizante se puede estimar mediante la siguiente relación.
E 100 e f
A 0 , 05
B 0,5 100B C 1 Tan C D 1 A 0,5 D 1,5 4
6
8
4
2
¿Diga cual es la combinación óptima del suelo al alcanzar su máximo? ¿En cuantas pruebas se alcanza al objetivo? (233) Se desea estimar el efecto del SO2 sobre la población cercana a una fabrica monitoreando la concentración de este contaminante y considerando los siguientes factores: la tasa de emisividad Q del contaminante a la salida de la chimenea y la altura del la chimenea. Los niveles elegidos de cada uno de los factores son los siguientes: Factores A: Tasa de emisividad (g/s) B: Altura (m)
5 30
Niveles
+ 10 60
Siendo el vector respuesta: 140 180 200 310 130 320 170 300 280 270 265 275 266
244
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
XVI.
DISEÑO FACTORIAL FRACCIONADO
Los diseños factoriales simples requieren cantidades excesivas de tiempo, material, conviene encontrar otros diseños que requieran menores pruebas de diseño, pero que no desdeñar una gran cantidad de información sobre la naturaleza del vector respuesta que se expresa con los experimentos. Los diseños factoriales fraccionados permiten lograr este objetivo. Si se está dispuesto a conformarse con una investigación algo menos completa, incluyendo los efectos principales y las interacciones de dos factores y excluyendo los efectos de tres factores o interacciones de alto orden. Los diseños factoriales fraccionadas se usan principalmente para la depuración o selección, es decir, para identificar la variable más importante que influye en la respuesta. En cualquier diseño que utilice menos pruebas de los que requiera uno de tipo factorial completo, se tendrán los mismos efectos de confusión. Por ejemplo, un efecto principal se puede confundir con uno o más efectos de interacción de alto orden, esto es, la estadística que mide un ejemplo principal puede ser igual a la estadística que determina algunos de los efectos de las interacciones. Por lo tanto, la estadística en cuestión puede indicar que existe algún efecto, pero no señalará si está presente el efecto principal, el de interacción o alguna combinación aditiva de efectos. Todos los diseños, proporcionan estimaciones confusas. Por ejemplo, si los efectos cuadráticos y cúbicos, se confunden las estimaciones de la media y los efectos principales, respectivamente, siempre que no emplee un diseño factorial de dos niveles, las tendencias y otros efectos confunden las estimaciones. Cualquier fenómeno emitido en un modelo ajustado confunde ciertos parámetros estimados en el modelo, sea cual fuere el tipo de diseño empleado. Los buenos diseños factoriales fraccionados se arreglan cuidadosamente de tal manera que la estimación de los efectos que se piensa son importantes, se confunden por acción de los efectos que se consideran no importantes. 245
Palacios C. Severo
Puesto que en la investigación es de interés los efectos principales, es fundamental que éstos no se confundan con otros efectos principales. En casi todos los diseños factoriales fraccionados comúnmente usados, los efectos principales se confunden con interacciones de alto orden. Por lo tanto si un experimentador utiliza uno de estos diseños para medir los efectos principales, deberá estar dispuesto a suponer, cuando menos en forma tentativa, que las interacciones con las que se confunden los efectos principales son cero o muy pequeñas. Pocos experimentadores evitan usar los diseños factoriales fraccionados debido a la necesidad de hacer tales supocisiones respecto a los efectos de alto orden. XVII. MEDIO FRACCIONADO DEL DISEÑO 2k Se estudian a partir de k=3 factores en dos niveles cada uno, para lo cual utilizamos un diseño factorial fraccionado del tipo (1/2)n2k donde n es la cantidad que debe disminuirse la fracción. Ejemplo 6.75 Si tenemos un diseño 23=8 pero queremos una media fracción por lo tanto tendremos (1/2)*23=4 combinaciones de tratamiento. Tabla 6.72 Primer media fracción del diseño 23 A B C Combinación + c + a + b + + + abc
Nótese que el diseño 23-1 se forma al seleccionar sólo las combinaciones de tratamiento que producen la multiplicación de signos, donde C=AB. Es posible construir la combinación de tratamientos del diseño 2k-1 completo igualando el factor C por la interacción -AB, de amplia aplicación cuando los efectos principales son negativos, pero tienen una gran influencia en el proceso. Tabla 6.73 Segunda media fracción del diseño 23 A B C=-AB Combinación 1 + + ac + + bc + + ab
246
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
El uso del diseño factorial fraccionado a menudo conduce a una gran economía y eficiencia en la experimentación, especialmente si los ensayos pueden hacerse en sucesión. Por ejemplo, supongamos que se están investigando k=5 factores (25 ensayos). Es preferible realizar un diseño fraccionado 25-1 (16 ensayos) analizar los resultados y decidir el mejor conjunto de ensayos que deben recopilarse después. Ejemplo 6.76 Consideremos el experimento de la autoclave, el diseño mostrado en la tabla 6.74, consta de una réplica del diseño 24. En este estudio, los efectos principales B, C y la interacción CD resultaron diferentes de cero. Utilizaremos el diseño 24-1con D=ABC. Para construir el diseño primero se escribe el diseño base de 23 que se mueve en las primeras tres columnas tal como se indican en la tabla. A + + + +
B + + + +
Tabla 6.74 Diseño 24-1con D=ABC C D=ABC Combinación 1 + ad + bd ab + + cd + ac + bc + + abcd
Y 71 88 68 65 83 95 86 70
Los efectos e interacciones se calculan idem a las factoriales normadas. A 1 / 4 71 88 68 65 83 95 86 70 2,5 B 12
B ACD
C 10,5
C ABD
D 2
D ABC
AB 1,2
AB CD
AC 4,5
AC BD
BC 1,0
BC AD
A BCD
Podemos concluir que los efectos principales B y C son grandes y que la interacción AB también es significativa. 247
Palacios C. Severo
Para ver la efectividad de este diseño investigaremos un diseño 25-1con cinco factores. A + + + + + + + +
Tabla 6.75 Diseño 25-1con E=ABCD C D E=ABCD Combinación + e a b + abe + c + + ace + + bce + abc + d + + ade + + bde + abe + + + cde + + acd + + bcd + + + abcde
B + + + + + + + +
Y 12 18 13 16 17 15 20 15 10 25 13 24 11 21 17 23
Calculo de efectos e interacciones: A 5,5
A BCDE
D 2,25
D ABCE
AC 3,25
AC BDE
BC 1,25
BC ADE
CD 1,0
CD ABE
Fuente
A D AB AC AD Error Total
B 1,5
B ACDE
C 1,0
C ABDE
E 0,0 E ABCD AD 5,0 AD BCE
AB 1,75 AE 0,25
AE BCD
BD 1,0 BD ACE CE 0,25 CE ABD
BE 0,75
BE ACD
DE 0,0
DE ABC
Tabla 6.76 Análisis de varianza del diseño 25-1 SC GL CM Fo 121,00 1 121,00 4,73 > 20,25 1 20,25 0,79 < 12,25 1 12,25 0,48 < 42,24 1 42,24 1,65 < 100,00 1 100,00 3,91 > 256,00 10 25,60 550,75 15
La suma de cuadrados del modelo es: SCmodelo SCA SCD SCAB SCAC SCAD 295,75
XVIII.CUARTO FRACCIONADO DEL DISEÑO 2k
248
AB CDE
Ft(99) 3,29 3,29 3,29 3,29 3,29
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Cuando hay un número grande de factores. Hay que considerar una fracción de un cuarto del diseño 2k este diseño contiene 2k-2 ensayos. Este diseño se puede construir escribiendo primero las combinaciones de tratamiento asociado con el factorial completo con k-2 factores. Después se asocian las dos columnas adicionales con las interacciones elegidas apropiadamente, que incluyen los primeros k-2 factores. Los alias estructurados para un diseño 26-2 son: B ACE CDF ABDEF E ABC ADF BCDEF AC BE ABDF BDEF AF DE BCEF ABCD ABD CDE ACF BEF
A BCE DEF ABCDF D FBC AEF ABCDE AB CE ACDF BDEF
AE BC DF ABCDF
BF CD ACEF ABDE
C ABE BDF ACDEF F BCD ADE ABCEF AD EF BCDE ABCF BD CF ACDE ABEDF ACD BDE ABF CEF
Ejemplo 6.77 Se ha aplicado la técnica experimental para la optimización de un proceso en donde se consideran seis variables a dos niveles A: B: C:
1 5 5
3 15 15
D: E: F:
8 14 22
10 18 38
Elegimos un diseño factorial fraccionado del tipo (1/2)226= 24 en que confundimos los siguientes factores e interacciones E=-ABC, F=BCD. A + + + + + + + +
B + + + + + + + +
Tabla 6.77 Diseño 26-2con E=ABC y F=BCD C D E=ABC F=BCD Combinación 1 + aef + + bef + abf + + cdf + acf + bc + + bce + + df + + + abef + + bde + abd + + + cde + + acd + + + bcdf + + + + Abcdef
Y 92,0 90,0 91,0 91,2 90,3 92,0 90,2 89,5 92,3 92,8 90,7 90,4 91,6 92,6 91,6 92,0
Los efectos e interacciones son: 249
Palacios C. Severo
A 0,12 D 1,20 AB CE 0,17 AD EF 0,27 AF DE 0,66
B 0,87
C 0,01
E 0,66 AC BE 0,43 BD CF 0,32 ABD CED 0,17
F 0,73 BC AE BF 0,16 CD BF 0,43 ACD ABF 0,14
Obtenemos información clara sobre los efectos principales si se consideran que las interacciones de tercer orden y superior son insignificativas. Respecto a las interacciones de segundo orden observamos que están confundidas entre si y con interacciones de cuarto orden; su análisis permitirá comprobar el comportamiento lineal de nuestros vectores respuestas en la región experimental estudiada. El análisis de varianza se muestra en la tabla 6.78. Para decidir si una variable es o no significativa en el rango experimental estudiado, en el nivel de significancía del 99%, el cual nos proporciona esta seguridad en el análisis de varianza para el vector respuesta indican que A, C y E no son significativas en los niveles elegidos y podemos suponer que estamos en el rango elegido para estas variables. Tabla 6.78 Análisis de varianza para el diseño 26-2 Fuente SC GL CM Fo B 3.06 1 3.06 7,89 > D 4.20 1 4.20 10,83 > F 2,18 1 2,18 5,60 > AF+DE 1,76 1 1,76 4,53 < Error 4,27 11 0,39 Total 15,47 15
250
Ft(99) 4,85 4,85 4,85 4,85
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Problemas (234) Deseamos mejorar el rendimiento de un proceso, en un diseño 25-2 se investigan 5 factores, confundiendo E= ABCD siendo su vector respuesta. Y: 98, 99, 94, 82, 86, 92, 85, 90, 86, 90, 80, 90, 85, 81, 84, 93 (235) Se trabaja a nivel Bach un proceso catalítico, se asume que la respuesta de interés es la reacción de variables. Cuatro factores han sido propuestos como variables, a dos niveles. Aplique un diseño 26-3 siendo su nivel respuesta. Y: 53, 83, 62, 77, 75, 84, 75, 86 (236) Deseamos mejorar el rendimiento de un proceso, en un diseño 27-4 se investigan 7 factores, confundir D=AB, E=AC, F=BC, G=ABC. Y: 70, 65, 80, 95, 88, 91, 85, 87 (237) Se utiliza un diseño 25-2 para investigar el efecto sobre el rendimiento del proceso de A = temperatura de condensación, B = cantidad de material 1, C = volumen del solvente, D = tiempo de condensación y E = cantidad del material 2. Los resultados fueron los siguientes: e = 23.2 ad = 16.9 cd = 23.8 bde = 16.8 ab = 15.5 bc = 16.2 ace = 23.4 abcde = 18.1 Determine la relación generadora de este diseño. Escriba las relaciones de alias de este diseño. Calcule los efectos. Determine cuáles de ellos son importantes. Cómo llevaría a cabo el análisis para este experimento. (238) Es posible diseñar un experimento 25-2 en el cual no se realice ninguna medición en la cual los factores A y C se encuentren ambos en alto al mismo tiempo? (239) Usted acaba de ser contratado como jefe de planta en una fábrica de cerveza. Una de las primeras noticias que recibe es que el proceso tiene algunos problemas con el grado alcohólico de la cerveza, el cual es muy alto. La persona que ocupaba su puesto anteriormente había planteado la posibilidad de realizar un experimento factorial fraccionado de la forma 24-1 para estudiar la situación. La estructura de dicho experimento es la siguiente A = tiempo de fermentación. B = % de cebada presente. 251
Palacios C. Severo
C = % de arroz presente. D = % de maíz presente. (1), ab, c, abc, d, abd, cd, abcd Escriba la matriz de diseño del experimento anterior y diga cuales efectos se encuentran confundidos. ¿Es este un diseño ortogonal? ¿Cuál es la resolución del diseño? ¿Qué críticas le merece esta estructura de experimentación? Si alguien le propusiera utilizar un experimento de la forma 24–2 para investigar esta situación, ¿qué le respondería usted? Un par de semanas después, ya un poco más calmado y con un mayor conocimiento del proceso, usted decide que existe un quinto factor influyente: E = tiempo de maduración. Escriba la matriz de diseño un nuevo experimento, esta vez de la forma 25-2, que permita tomar en cuenta este factor adicional y que evite los problemas presentados en el diseño anterior. Encuentre los efectos confundidos en este nuevo diseño. ¿Cuál es la resolución del mismo? ¿Qué puntos se encuentran dentro de esta fracción? (240) Usted está recién graduado y acaba de entrar a trabajar en la empresa Soda, la cual elabora galletas. La compañía ha presentado algunos problemas económicos en los últimos tiempos, así que su misión es tratar de incrementar la calidad y la productividad. Se le pide estudiar la influencia de tres variables sobre la textura de la galleta: A = tiempo en el horno. B = % de leche. C = tipo de harina (nacional o importada) Escriba la matriz de diseño para un experimento 23 (completo). A partir de esa matriz de diseño tome las siguientes medidas: Nivel (1) a b ab c ac bc abc
Textura 10.0 13.0 8.0 15.1 11.0 12.9 8.1 15.0
Determine cuáles de los factores son influyentes sobre la textura de la galleta. En los datos anteriores el factor C no es significativo. ¿Cómo podría interpretarse el diseño anterior en función de un diseño 2 2, donde sólo estuviesen involucrados los factores A y B? 252
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(241) Usted es gerente de una planta de producción de detergentes. Se detectó que un problema de llenado se debía a la variabilidad en la densidad del detergente, por lo que se decidió realizar un experimento para determinar cuáles factores del proceso de producción afectan la densidad. Los factores (a 2 niveles) a considerar son los siguientes: A = tiempo en la torre de secado. B = homogeneidad de la mezcla antes de entrar en la torre. C = tiempo de reposo del detergente antes de ser enviado a la línea de empaque. D = contenido de carbonatos. E = velocidad del agitador de la mezcla. F = temperatura en la torre de secado. G = orden (normal o inverso) de adición de ciertos ingredientes. (242) Debido a que cada corrida corresponde a un día de producción, se decidió reducir el tamaño del experimento, de 27 = 128 corridas, a una fracción de 27-3. Los resultados del experimento son los siguientes: Nivel (1) adg bdf abfg cdfg acf bcg acbd efg adef bdeg abe cde aceg bcef abcdefg
Densidad (g/ml) 338.0 388.5 332.0 239.0 309.5 206.0 343.5 333.5 342.0 213.0 295.0 405.0 393.0 432.0 325.0 193.5
Diga cuál es la estructura de confusiones del experimento. Determine cuáles factores influyen significativamente en la densidad del detergente, así como cuáles interacciones (de segundo orden) son significativas. (243) Una empresa de consultoría debe llevar a cabo para un cliente un estudio experimental para determinar los efectos de seis variables sobre las propiedades físicas de cierto tipo de asfalto. Llamemos A, B, C, D, E y F a esas variables. Si se lleva a cabo un diseño factorial completo a dos niveles ¿cuántas corridas deben hacerse? 253
Palacios C. Severo
Escriba una cuarta fracción del diseño que requiera sólo 16 corridas. Escriba una relación generadora para este diseño. En el diseño que usted realizó, qué efectos están confundidos con A y con BD. (244) Considere un diseño factorial fraccional 25-2. Estudie la estructura de confusiones y la resolución de las fracciones que se obtienen de las siguientes formas: Partiendo de un 25 completo, se toman aquellos puntos donde las interacciones ABCDE y ABCD estén ambas a nivel alto. Partiendo de un 25 completo, se toman aquellos puntos donde dos interacciones de cuarto orden ABCD y BCDE estén en nivel alto. Partiendo de un 25 completo, tomando los puntos donde dos interacciones de tercer orden estén a nivel alto. Partiendo de un 23, asignando factores adicionales a dos interacciones de segundo orden, por ejemplo AB y AC. (245) Suponga que se le presentan las siguientes alternativas: Correr un diseño 26 completo. Correr un diseño 26-2 replicado cuatro veces. Comente en que condiciones es preferible utilizar uno u otro (246) Se describe un experimento en el cual se utilizó un diseño 25-1 con I = ABCDE para investigar los efectos de cinco factores sobre el color de un producto químico. Los factores son A: solvente/reactivo, B: catalizador/reactivo, C: temperatura, D: pureza del reactivo y E: pH del reactivo. Los resultados fueron como sigue: Punto e a b abe c ace bce abc
Color -0.63 2.51 -2.68 1.66 2.06 1.22 -2.09 1.93
Punto d ade bde abd cde acd bcd abcde
Color 6.79 5.47 3.45 5.68 5.22 4.38 4.30 4.05
Que efectos parecen ser significativos Calcule los residuos. Si uno o más de los factores son despreciables, contraiga el diseño 25-1 a un factorial completo con los factores significativos. Suponga que debe correr un experimento 25, pero que por restricciones en la elaboración de la materia prima debe hacerlo en 4 bloques. Indique los puntos del diseño que deben desarrollarse en cada bloque y cuales efectos están confundidos con los bloques. 254
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(247) Se estudia la influencia de 7 factores sobre la viscosidad de un aceite producido en una nueva planta experimental. Para ello se utilizó un diseño 27-3 donde I=-ABCE=BCDF=ACDG son los generadores utilizados. Los resultados obtenidos son: Analice los resultados obtenidos y determine los factores significativos sobre la viscosidad. Nivel e ag bf abefg cfg acef bce abc defg adf bdg abde cd acdeg bcdef abcdfg
Viscosidad 33,74 35,90 32,53 35,38 24,46 30,24 23,82 30,27 23,30 23,38 20,67 23,17 26,07 32,09 26,29 32,03
En caso de poder correr una nueva secuencia de puntos, ¿cuáles escogería? (248) Se describe un factorial fraccionado replicado para investigar el efecto de cinco factores sobre la altura libre de muelles de hojas utilizados en aplicación automotriz. Los factores son A: temperatura del horno, B: tiempo de calentamiento, C: tiempo de transferencia, D: tiempo de inmersión y E: temperatura del aceite de templar. Los datos se presentan enseguida: A + + + + + + + +
B + + + + + + + +
C + + + + + + + +
D + + + + + + + +
E + + + + + + + +
I 7,78 8,15 7,50 7,59 7,54 7,69 7,56 7,56 7,50 7,88 7,50 7,63 7,32 7,56 7,18 7,81
II 7,78 8,18 7,56 7,56 8,00 8,09 7,52 7,81 7,25 7,88 7,56 7,75 7,44 7,69 7,18 7,50
II 7,81 7,88 7,50 7,75 7,88 8,06 7,44 7,69 7,12 7,44 7,50 7,56 7,44 7,62 7,25 7,59
Determine la estructura de confusiones para este diseño. 255
Palacios C. Severo
Cuáles son los puntos incluidos en este diseño Qué factores influyen en la altura libre media Existe evidencia de que alguno de los factores influya en la variabilidad de la altura libre Analice los residuos de este experimento en cada caso y comente los resultados. (249) Se realiza un experimento para determinar la influencia de la presión (A), temperatura (B) y concentración (C) sobre la viscosidad de un detergente líquido. Para ello se ha decido utilizar un diseño 23 con una sola réplica, el cual debe desarrollarse en dos bloques. ¿Cuál de las siguientes dos opciones preferiría y por qué? Opción 1:
Opción 2:
Bloque I a abc
Bloque II (1) bc
Bloque III b c
Bloque IV ac ab
Bloque I (1) abc
Bloque II b ac
Bloque III a bc
Bloque IV ab c
(250) Si alguien le propone correr un experimento 26 en ocho bloques, ¿qué le diría? (251) En un esfuerzo por incrementar la producción se realizó un experimento en una planta de manufactura de dispositivos de semiconductor. Se estudiaron cinco factores, cada uno a dos niveles. Los factores y niveles son. A: apertura del diafragma (pequeña, grande), B: tiempo de exposición (20% abajo y arriba del valor nominal), C: tiempo de revelado (30 y 45 seg), D: dimensión de la pantalla (pequeña, grande) y E: tiempo de corrosión selectiva (14.5 y 15.5 minutos). El experimento se corrió en dos bloques: Punto a b c abc d abd acd bcd e abe ace bce ade bde 256
Bloque I Producción 9 34 16 60 8 50 21 44 8 52 22 45 10 30
Bloque II Punto Producción (1) 7 ab 555 ac 20 bc 40 ad 10 bd 32 cd 18 abad 61 ae 12 be 35 ce 15 abce 65 de 6 abde 53
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería cde abcde
15 63
acde bcde
20 41
Indique que efectos están confundidos con el bloque. Identifique los efectos significativos y realice recomendaciones sobre las condiciones de operación del proceso. Puede proyectarse este diseño en un 2k más pequeño. (252) Se desea realizar un experimento 25-1, pero los lotes de materia prima permiten correr un máximo de 10 puntos en cada uno. Indique como debería realizarse este experimento. (253) Una planta química produce oxígeno licuando aire y separándolo en los diferentes gases que lo componen por medio de destilación fraccionada. La pureza del oxígeno obtenido es una función de la temperatura del condensador principal y del cociente de presiones entre la columna superior y la inferior. Las condiciones actuales de operación son temperatura (1) = -220ºC y cociente de presión (2) = 1.2. Usando los datos que se dan a continuación, ajuste un modelo de primer orden, pruebe las hipótesis necesarias para comprobar su ajuste y determine el camino de ascenso máximo. Temperatura (1) -225 -225 -215 -215 -220 -220 -220 -220
Cociente de presiones (2) 1,1 1,3 1,1 1,3 1,2 1,2 1,2 1,2
Pureza (%) 82,8 83,5 84,7 85,0 84,1 84,5 83,9 84,3
(254) El diseño experimental para la lixiviación de minerales auríferos mediante un Factorial Fraccionado 28-4, toma las siguientes variables y rangos. Factores X1: Aglutinante (kg/t) X2: Sal oxidante (kg/t) X3: Tipo mineral X4: Humedad (%) X5: Aglomerante (kg/t) X6: Agente lixiviante ppm X7: Radio riego (l/h.m²) X8: tiempo curado (h) Prueba 1 2 3 4
X1 + +
X2 + +
X3 -
5 0,1 1/2 10 0,0227 0 5 16 X4 -
X5 + + -
Niveles 0 10 0,8 1/1 14 0,068 50 7,5 56 X6 + + -
+ 15 1,5 2/1 18 0,1134 100 10 96 X7 + +
X8 + +
Y 76,3 80,8 86,2 84,3 257
Palacios C. Severo 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
+ + + + + + 0 0 0 0
+ + + + + + 0 0 0 0
+ + + + + + + + 0 0 0 0
+ + + + + + + + 0 0 0 0
+ + + + + + 0 0 0 0
+ + + + + 0 0 0 0
+ + + + + 0 0 0 0
+ + + + + + 0 0 0 0
79,1 85,7 82,2 81,9 81,8 87,5 71,9 79,3 81,6 87,4 85,0 84,2 85,9 85,6 83,0 85,7
Analice los datos de % de recuperación de oro de todas las pruebas estadísticamente para determinar el grado de influencia de cada variable independientemente y sus interacciones.
258
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
XIX. DISEÑO DE PLACKETT – BURMAN Es posible construir diseños para investigar hasta K=N-1 factores con sólo N ensayos, en donde N es un múltiplo de 4. Frecuentemente estos diseños son útiles en la experimentación industrial. De particular importancia son las que requieren ocho ensayos para hasta siete factores y dieciséis ensayos para hasta quince factores. Se dice que este es una Variedad del diseño factorial fraccionado. Estas variedades son muy útiles para estudiar factores que no han sido estudiados. El primer diseño es una fracción de un diseño 2 7. Esta puede construirse escribiendo primero los niveles positivo y negativo de un diseño 23 completo con los factores ABC y después conocido los niveles de los otros cuatro factores con las interacciones de los tres factores originales como aparece: D=AB, E=AC, F=BC, G=ABC. El diseño constituye una fracción de dieciseisavo y, además, es una fracción principal los signos generadores son positivos. Es posible utilizar los siete grados de libertad de este diseño. Para estimar los siete efectos principales. Cada uno de estos factores tiene quince alias. Sin embargo, la estructura de los alias se simplifica considerablemente, si se supone que las interacciones de tres o más factores son despreciables. Haciendo esta suposición, cada combinación lineal asociada a los siete efectos principales de diseño realmente estima el efecto principal y tres interacciones bifactoriales. A+BD+CE+FG E+AC+BG+DF
B+AD+CF+EG F+BD+AG+DE
C+AE+BF+DG G+CD+BE+AF
D+AB+CG+EF
El diseños Plackett-Burman es útiles cuando N = 8, 12, 16, 20, 24, y 36. A continuación se presentan los renglones de signos positivos y negativos usados para construir los diseños de Plackett-Burman. K=7 K=11 K=15 K=19 k=23 K=35
N=8 N=12 N=16 N=20 N=24 N=36
----+++ ++-+++---+--------+++++++ ++--++++-+-+----+++++++-+-++--++--+-+----+-+++---+++++-+++--+----+-+-++--+-
259
Palacios C. Severo
El diseño de 12 corridas se proyectará en tres réplicas de un diseño 2 2 completo en cualquiera de los 11 factores originales. Tabla 6.79 Diseño PLACKETT-BURMAN para N=8 y k=7 Prueba A B C D E F G 1 + + + 2 + + + 3 + + + 4 + + + 5 + + + 6 + + + 7 + + + 8 + + + + + + +
Sin embargo, en tres factores el diseño proyectado es un factorial 2 3 completo más un factorial fraccionado 23-1. Los diseños Plackett-Burman se obtienen escribiendo el renglón apropiado N y k en forma de columna o renglón. Una segunda columna o renglón se genera a partir de la primera moviendo los elementos de la columna o renglón un lugar hacia abajo y colocando el último elemento en la primera posición. Simultáneamente, se genera una tercera columna o renglón a partir de la segunda. Este procedimiento se continúa hasta que se genera la columna o renglón k. A continuación se agrega un renglón de signos negativos para cada factor. Por ejemplo
XYZ
XYZ
ZXY YZX YZX
ZXY
Los diseños de Plackett-Burman tienen estructura de alias muy intrincada. En un diseño de doce pruebas, cada efecto principal tiene todo los alias parcial y toda interacción de dos factores en la que no participe el mismo, la interacción AB tiene como alias los nueve efectos principales C, D, ... Las propiedades de proyección de los diseños Plackett-Burman no son extraordinariamente atractivas. Consideremos el diseño de 12 pruebas. Este diseño se proyecta en tres replicas de un diseño 22 completo en cualquiera de los once factores originales. Sin embargo en tres factores el diseño proyectado es un factor 23 completo más un factorial fraccionado. Ejemplo 6.78 260
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Se estudia la flotación de un mineral sulfurado de cobre. Los factores que inicialmente se consideran importantes son: Colector (A), espumante (B), tiempo de acondicionamiento (C), agitación (D), temperatura (E), porcentaje de sólidos (F) y pH (G). Se consideran dos niveles de cada factor. Se sospecha que sólo unos cuantos de estos siete son despreciables. Se decide llevar a cabo el experimento con el propósito de identificar los factores más importantes para concentrar los estudios futuros sobre estos factores. Tabla 6.80Diseño PLACKETT-BURMAN para N=8 y k=7 Prueba A B C D E F G Y 1 + + + 92 2 + + + 90 3 + + + 91 4 + + + 91,2 5 + + + 91,6 6 + + + 92 7 + + + 91,6 8 + + + + + + + 92
Y2 31,8 35,8 29,1 36,2 44,5 36,1 38,1 31,6
Donde: Y porcentaje de recuperación. Y2 porcentaje de eficiencia de la recuperación, parámetro definido Como
Y2
C hY Cm h
C = Ley de concentrado obtenido Cm= Ley de cabeza h = Ley máxima de concentración obtenida Con los datos es posible estimar los siete efectos principales y sus alias: LA 1 A BD CE FG L 2,2 D AB CG EF ¡ D
LB 0,2 B AD CF EG LE 2,6 E AC BG DF LG 2,2 G CD BE AF
LC 3 C AE BF DG LF 0,2 F BC DG DE
Los tres efectos más grandes son C, D, E. La interpretación más simple de datos es que los efectos principales de C, D y E son significativos. Sin embargo, esta interpretación no es única, ya que se pude concluir 261
Palacios C. Severo
lógicamente que C, D y la interacción CD o quizás D, E y la interacción DE, o quizás C, E y la interacción CE son los efectos verdaderos. Tabla 6.81 Diseño PLACKETT-BURMAN para N=8 y k=7 Prueba A B C D E F G Y 1 + + + 94 2 + + + 91 3 + + + 94,6 4 + + + 92,2 5 + + + 92,5 6 + + + 93,2 7 + + + 92,6 8 + + + + + + + 92,6
Y2 3,2 11,7 55,3 48,4 48,4 48,6 35,8 45,0
Obsérvese que CDE en una palabra es la relación definitiva para este diseño. Por lo tanto, este diseño no se proyecta en una factorial 2 3 completo en CDE; más bien, se proyecta en dos réplicas de un diseño factorial fraccionado 23-1, de modo que las interacciones no puedan separarse de los efectos principales. Al parecer el experimentador no tuvo éxito al escoger los factores. Si hubiese asignado el nivel A en vez de D y B en vez de E, el diseño se habría proyectado en un diseño 23 completo. Para separar los efectos principales y las interacciones bifactoriales, se corre una replica fraccionada con todos los signos invertidos. Los efectos estimados para está fracción será: L¡A 4,2 A BD CE FG
L¡B 0,8 B AD CF EG
L¡C 1,4 C AE BF DG
L 0,4 D AB CG EF
L 6,6 E AC BG DF
L¡F 2,8 F BC DG DE
¡ D
¡ E
L 0,8 G CD BE AF ¡ G
Al combinar esta fracción con la original se obtiene las siguientes estimaciones de los efectos: i A B C D E F G
Ejemplo 6.79 262
Tabla 6.82 ½(Li+L´i) ½( Li+L´i) A = 1,6 BD+CE+FG = -2,6 B = -0,3 AD+CF+EG = 0,5 C = 2,2 AE+BF+DG = 0,8 D = 0,9 AB+CG+EF = 1,3 E = -2,0 AC+BG+DF = 4,6 F = 1,3 BC+AG+DE = -1,5 G = -0,7 CD+BE+AF = -1,5
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
El ejemplo 6.78 se desea estudiar mediante el diseño Plackett-Burman con bloques. Tabla 6.83 Diseño PLACKETT-BURMAN con bloque Prueba A B C D E F G 1 + + + 2 + + + 3 + + + 4 + + + 5 + + + 6 + + + 7 + + + 8 + + + + + + + def abd ace bcf
Bloque I = = = = Σ 366,8
Bloque II afg = beg = adg = abcdefg = Σ 364,6 Σ 731,4
92,0 91,2 92,0 91,6
Y 92 90 91 91,2 91,6 92 91,6 92
90,0 91,0 91,6 92,0
SCbloque 366,82 364,6 2 / 4 731,4 / 8 0,605 2
SCtotal 922 902 ... 91,6 2 922 731,4 / 8 3,315 2
SCerror SCB SCG 0,01 SCA 0,125
SCB 0,005
SCC 1,125
SCD 0,605
SCE 0,845
SCF 0,005
Efectos: A 0,25 E 0,65 Fuente Bloque A C D E Error Total
B 0,05 F 0,05
C 0,75 G 0,55
D 0,55
Tabla 6.84 Análisis de varianza SC GL CM Fo Ft(99) 0,605 1 0,605 121 > 98,5 0,125 1 0,125 25 < 98,5 1,125 1 1,125 225 > 98,5 0,605 1 0,605 121 > 98,5 0,845 1 0,845 169 > 98,5 0,010 2 0,005 3,315 7 R2 = 99,69%
Para el cálculo de los efectos e interacciones y suma de cuadrados, se procedió por la técnica de Yates. Se ha decidido que las interacciones 263
Palacios C. Severo
de valores mínimos son despreciables, por lo que la suma del error se tomo como la suma de cuadrados de B y F. Para el bloque se tomo la suma de cuadrados de G. Problemas (255) Al problema 193 del diseño factorial fraccionado. Evalué por el método de Plackett-Burman y concluya las diferencias. (256) Se estudia un proceso nuevo con siete factores aplique el método, siendo D=-AB, E=-AC, G=-ABC Y: 94, 91, 94, 92, 93, 91, 94, 95 (257) Se recupera oro por un método innovativo, se tienen siete factores, aplique Plackett-Burman, tome G=-ABC. Se obtiene dos vectores respuesta. Y1: 90,9 90,2 92,8 93,6 92,2 93,5 93,3 94,0 Y2: 92,0 90,0 91,0 91,2 90,3 92,0 90,2 89,5 (258) Se lixivio una cola sulfurada con contenido de plata, plomo y cobre, en medio clorurante-oxidante, con el fin de aumentar la solubilidad de la plata en forma compleja AgCI-. Efectuando el estudio de los diagramas de Pourbaix y estabilidad de los complejos. Estudiamos siete variables A: cloruro férrico, B: Cloruro de sodio, C: Temperatura, D: gas cloro, E: Tiempo, F: tamaño de grano, G: porcentaje de sólidos. Se decide efectuar el experimento con el propósito de identificar los factores importantes. Y: 85 89 92 95 83 86 92 98 (259) Se lixivio colas refractarias sulfuradas de oro con sales oxidantes en medio ácido (Patente del Autor) siendo las variables A: cloruro de sodio B: ácido sulfúrico, C: agente oxidante D: tiempo, E: tamaño de grano, F: porcentaje de sólidos, G: temperatura. El experimento se efectuó en un tanque de agitación, Obteniéndose el vector respuesta. Y: 94 90 92 96 93 98 95 97 (260) Se lixivio mineral refractario con contenido metálico valioso de oro, rutilo, germanio, indio adicionando sales oxidantes (Patente del Autor) siendo sus variables A: porcentaje de sólidos, B: ácido sulfúrico, C: ácido clorhídrico, O: cloruro de sodio, E: Agente oxidante, F: tiempo de acondicionamiento, G: Temperatura. Se efectuó el experimento con el propósito de identificar los factores importantes. Por ser un estudio innovativo se efectuó dos bloques, siendo: Bloque I, Y: 89 98 86 95 Bloque II, Y: 90 85 88 92 (261) Desarrolle un método para un diseño Plackett-Burman con bloque replicado. 264
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(262) Es factible adicionar variables ficticias a un diseño de PlackettBurman. (263) Elabore un modelo matemático para los problemas 170, 171 y 172. (264) En una planta de tratamiento de agua, se estudia un nuevo filtro que presenta problemas en su implementación, de tal manera que retarda el sistema de filtración. Después de realizar múltiples análisis se ha establecido que la causa se debe a Factores A: Tipo de agua B: Temperatura de filtración C: Reciclado D: Flujo de adición de base E: Material del filtro F: Tiempo de almacenamiento
Niveles + Pozo Canal Media Alta Sí No Media Alta Nuevo Usado Medio Alto
Se desea realizar la experiencia con el menor número de pruebas posibles y el menor tiempo posible, como mínimo 8 pruebas. ¿Establezca la estructura Alias, y verifique que efectos están mezclados entre sí y que efectos pueden estimarse como constantes? Suponiendo que las respuestas son las siguientes: Y1: 68, 78, 66, 81, 78, 41, 69, 39 Y2: 70, 80, 63, 85, 80, 45, 71, 41 ¿A que factores se debe el retardo de la filtración? (265) Una empresa tiene problemas en controlar el tamaño de cierto producto. Sus funcionarios han detectado que las variables están provocadas por la distribución irregular de la temperatura del horno de secado. Sin embargo en vez de resolver el problema directamente sugiere reducir la influencia de las variables sobre la temperatura, considerando los siguientes factores Factores A: Tipo de materia prima B: Granulometría del material C: Aglutinante D: Material usado E: Cantidad de carga F: Colorante G: Aditivo
Niveles + Original Usada Fina Gruesa 1 8 0 2 120 150 43 63 0 4
Después de realizar múltiples ensayos se midió el número de productos rechazados por cada 100. 10, 21, 17, 15, 30, 5, 12, 25, 36, 45, 28, 16 ¿Como se reduciría el número de productos rechazados producto de la mala distribución de la temperatura en el horno de secado? 265
Palacios C. Severo
(266) El diseño experimental para la lixiviación de minerales auríferos mediante el Plackett-Burman, toma las siguientes variables y rangos. Factores X1: Aglutinante (kg/t) X2: Sal oxidante (kg/t) X3: X4: Humedad (%) X4: Aglomerante (kg/t) X5: Agente lixiviante ppm X6: Radio riego (l/h.m²) X7: tiempo curado (h)
5 0,1 10 0,0227 0 5 16
Niveles 0 10 0,8 14 0,068 50 7,5 56
Se desarrolla el proceso con pruebas centrales.
+ 15 1,5 18 0,1134 100 10 96
YF 76,3 80,8 86,2 84,3 79,1 85,7 82,2 81,9 YC 85,9 85,6 83,0 85,7
Analice los datos de % de recuperación de oro de todas las pruebas estadísticamente para determinar el grado de influencia de cada variable independientemente y sus interacciones.
266
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
XX. DISEÑOS FACTORIALES 3n La inclusión de más factores al diseño de tratamientos aumenta la complejidad de los patrones de interacción entre los factores de tratamiento. El número de combinaciones de tratamientos aumenta tanto como se agregan factores al diseño, es decir, un diseño de tres factores con a niveles de A, b niveles de B y c niveles de C, tiene abc combinaciones. Un cuarto factor, D, con d niveles aumenta el número de tratamientos en un múltiplo de d. El diseño con dos factores permite la investigación de la interacción de primer orden o doble, AB. En el diseño con tres factores las dos interacciones de primer orden adicionales, AC y BC, amplían las inferencias del estudio y debe considerarse además una interacción de segundo orden o de tres factores (o triple), ABC. Las interacciones de tercer orden o de cuatro factores como ABCD, introducen mayor complejidad en la estructura de la inferencia de la interacción. Tabla 6.85 Cálculos de las particiones de sumas de cuadrados lineales y cuadráticas
Varios 0 6 12
Días 14 21 28 14 21 28 14 21 28
Medias 2,75 5,35 12,80 4,10 6,55 10,20 3,10 5,20 7,95 P Y ij
Cij
P
2 Cij
SC Efectos
Sl -1 -1 -1 0 0 0 1 1 1 -4,7 6,0 7,2 -0,78
Sq 1 1 1 -2 -2 -2 1 1 1 -4,6 18,0 2,3 -0,25
SC r PCij Y ij ² / PC2ij
Dl -1 0 1 -1 0 1 -1 0 1 21,0 6,0 147,0 3,50
Dq 1 -2 1 1 -2 1 1 -2 1 6,7 18,0 5,0 0,37
SlDl 1 0 -1 0 0 0 -1 0 1 -5,2 4,0 13,5 -1,30
SlDq -1 2 -1 0 0 0 1 -2 1 -4,2 12,0 2,9 -0,35
SqDl -1 0 1 2 0 -2 -1 0 1 2,7 12,0 1,2 0,23
SqDq 1 -2 1 -2 4 -2 1 -2 1 3,1 36,0 0,5 0,09
Efecto PCij Y ij / PC2ij
Cálculo de los coeficientes para contraste polinomial ortogonal de las interacciones Sl -1 -1 -1 0 0 0 1 1 1 Dl -1 0 1 -1 0 1 -1 0 1 SlDl 1 0 -1 0 0 0 -1 0 1
Ejemplo 6.80 267
Palacios C. Severo
El camarón desova en el mar y los huevos se transforman en lama mientras son transportados a la costa, pasada la etapa larvaria entran en los estuarios, donde crecen con rapidez y se convierten en preadultos que emigran de nuevo al mar para alcanzar ahí su madurez sexual. Como resultado de sus migraciones, el camarón encuentra una amplia variación de la temperatura y salinidad durante su ciclo de vida, por lo que es de gran importancia conocer cómo afectan su crecimiento para entender su vida y ecología. Cuando se realizó este experimento había un gran interés en el cultivo comercial del camarón y, desde el punto de vista de la acuacultura, otro factor importante era la densidad de almacenamiento en los tanques de cultivo, ya que esta afecta la competencia entre los ejemplares adultos y jovenes. Tabla 6.86 Aumento del peso de los camarones cultivados en acuarios T D S Aumento peso (mg) 25 80 10 86 52 73 25 544 371 482 40 390 290 397 160 10 53 73 86 25 393 398 208 40 249 265 243 30 80 10 439 436 349 25 249 245 330 40 247 277 205 160 10 324 305 364 25 352 267 316 40 188 223 281 Tabla 6.87 Análisis de varianza para el aumento de peso en los camarones cultivados Fuente SC GL CM Fo Ft(99) Temperatura 15376,00 1 15376,00 5,30 < 7,24 Salinidad 96762,50 2 48381,25 16,66 > 5,61 Densidad 21218,78 1 21218,78 7,31 > 7,24 TS 300855,17 2 150427,58 51,80 > 5,61 TD 8711,11 1 8711,11 3,00 < 7,24 SD 674,39 2 337,19 0,12 < 5,61 TDS 24038,39 2 12019,19 4,14 < 5,61 Error 69690,67 24 2903,78 Total 537327,01 35 Tabla 6.88 Aumento de peso en cuatro semanas de camarones Densidad Temperatura (80°C) Temperatura (160°C) Salinidad (%) 25 35 25 35 YK 268
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 10 25 40 Media TxD
70 466 359 298
408 275 243 309
71 333 252 219
331 312 231 291
220 346 271
Las interpretaciones deben estar condicionadas a alguna medida de significancía estadística junto con la significancía biológica de las respuestas. Se requieren los errores estándar de las medias de celdas y marginales para cualquier prueba estadística subsecuente de comparaciones específicas; el error estándar para cualquier media es SY CM e / n , donde n es el número de observaciones en la media y el error estándar de la diferencia entre cualquier par de medias es S Y i Y j 2CM e / n . Los errores estándar estimados para el experimento de cultivo de camarón se muestran en la tabla 6.89
T
Media TxD D 10 25 40
25 35
71 370
399 293
306 237
Yi 259 300
D 80 160
Media DxS S 10 25 40 239 201
370 322
301 242
Yi 303 255
Interpretaciones de los efectos de los factores La significancía de la interacción de estos factores indica que temperatura, salinidad y densidad se interrelacionan en cuanto a su efecto sobre el crecimiento del camarón. La interacción significativa de los tres factores implica que la interacción entre dos de ellos no es constante para los niveles del tercer factor. Considere la interacción entre la densidad y la salinidad por separado, a temperaturas de 25 y 35°C, como se muestra en las gráficas de medias de celdas de aumento en el peso de los camarones cultivados. Para interpretar los resultados se puede usar una comparación de los efectos simples de la salinidad sobre cada nivel de densidad y temperatura, los efectos simples de la salinidad se estiman mejor como contrastes polinomiales ortogonales lineales y cuadráticas para cada combinación de temperatura y densidad. Tabla 6.89 Errores estándar para las medias de celdas y marginales Temperatura: a=2 niveles; Densidad: b= 2 niveles; Salinidad: c= 3 niveles Medias de los factores principales Temperatura Salinidad Densidad CM e CM e CM e 2903,78 2903,78 2903,78 12,7 15,6 12,7 rbc 18 rab 12 rac 18 Medias marginales de dos factores 269
Palacios C. Severo Densidad por temperatura
Densidad por salinidad
CM e 2903,78 18,0 rc 9 Salinidad por temperatura
CM e 2903,78 22,0 ra 6 Medias de celdas
CM e 2903,78 22,0 rb 6
CM e 2903,78 31,1 r 3 35°C
25°C x
500
500
400
x
o 300
o
200 100
400
x o
o x
300
x o
200 x Densidad 80 o Densidad 160
x o
x Densidad 80 o Densidad 160
100
0
0 10
15
20
25
30
35
40
10
15
20
Salinidad
25
30
35
40
Salinidad
Aumento en el peso de los camarones cultivados en un arreglo factorial de 2x2x3 de temperatura, densidad y salinidad
Los coeficientes cuadráticos de salinidad se calcularon como contrastes polinomiales ortogonales para las cuatro combinaciones de temperatura y densidad, a partir de las medias de celdas de la tabla 6.86, con un patrón similar al que proporciona la tabla 6.88. Por ejemplo, el coeficiente cuadrático de salinidad a 25°C y densidad de 80 es:
70 2466 359 503 83,8 1² 2² 1² 6 con error estándar 2903, / 6(3) 12,7 . Las estimaciones de un ICS del 95% se calcularon para los cuatro coeficientes según la t 0,5,4,24 2,70 de Bonferroni. Las estimaciones de un ICS del 95% para los coeficientes cuadráticos de una salinidad a 25°C son (-118,1; -49,5) para una densidad de 80 y (-91; -22,9) para una densidad de 160, mientras que las estimaciones respectivas para esas densidades a 35°C son (-17,5; 51,1) y (44,6; 24,0). Es claro que la cuadratura a 25°C es significativa, ya que el ICS 270
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
del 95% no incluye al 0; y no significativa a 35°C, pues esos intervalos sí lo incluyen.
Problemas (267) Los datos representan el porcentaje de hombres entre 55 y 64 años con niveles auditivos de 16 decibeles por encima del cero métrico de sonido. Las categorías por renglón son los niveles de sonido en ciclos por segundo (hertz) y las columnas describen siete categorías ocupacionales.
Y
A
1
2
3
B 4
5
6
7
1 2 3 4 5 6 7 Yi
2,1 1,7 14,4 57,4 66,2 75,2 4,1 31,6 -6,6 6719
6,8 8,1 14,8 62,4 81,7 94,0 10,2 39,7 1,5 7730
8,4 8,4 27,0 37,4 53,3 74,3 10,7 31,4 -6,8 5046
1,4 1,4 30,9 63,3 80,7 87,9 5,5 38,7 0,5 7776
14,6 12,0 36,5 65,5 79,7 93,3 18,1 45,7 7,5 6850
7,9 3,7 36,4 65,6 80,8 87,8 11,4 41,9 3,7 7313
4,8 4,5 31,4 59,8 82,4 80,5 6,1 38,5 0,3 7192
i
y
pi
Yi 6,6 5,7 27,3 58,8 75,0 84,7 9,4
Y
i
y
-31,6 -32,5 -10,9 20,6 36,8 46,5 -28,8
Y 38,2
(268) Un proceso de producción química consiste en la primera reacción de un alcohol y una segunda reacción con una base. Se realizó un experimento factorial de 3x2, con tres alcoholes y dos bases, con cuatro reacciones réplica en un diseño totalmente aleatorizado. Los datos se reunieron como porcentaje de la reacción. Base 1 2
91,3 90,7 87,3 91,5
1
89,9 91,4 89,4 88,3
Alcohol 2 89,3 88,1 90,4 91,4 92,3 91,5 90,6 94,7
89,5 88,3 93,1 91,5
3
87,6 90,3 90,7 89,8
Escriba un modelo lineal para este experimento, explique los términos y calcule el análisis de varianza. Construya una tabla de medias de celdas y marginales. (269) Una compañía probó dos métodos químicos para determinar la glucosa en el suero. Se usaron tres recipientes con suero para el experimento, cada uno contenía distintos niveles de glucosa mediante la adición de glucosa al nivel base. Se prepararon tres muestras de suero de cada recipiente independientes del nivel de glucosa, con cada uno de los dos métodos químicos. Se midió la 271
Palacios C. Severo
concentración de glucosa (mg/dl) de todas las muestras en una corrida del espectrómetro. Glucosa
1 42,5 43,3 42,9
Método I 2 3 138,4 180,9 144,4 180,5 142,7 183,0
1 39,8 40,3 41,2
Método II 2 3 132,4 176,8 132,4 173,6 130,3 174,9
Escriba un modelo lineal para este experimento, explique los términos, realice un análisis de varianza para los datos y calcule los residuales. ¿Es necesaria una transformación de los datos? Explique. Si es necesaria, calcule la transformación de los datos y el análisis de varianza respectivo. (270) Se llevó a cabo un estudio del efecto de la temperatura sobre el porcentaje de encogimiento de telas teñidas, con dos réplicas para cada uno de cuatro tipos de tela en un diseño totalmente aleatorizado. Los datos son el porcentaje de encogimiento de dos réplicas de tela secadas a cuatro temperaturas. Tela 1 2 3 4
210
1,8 2,2 2,8 3,2
2,1 2,4 3,2 3,6
Temperatura (°C) 215 220 2,0 2,1 4,6 5,0 4,2 4,0 5,4 5,6 4,4 4,8 8,7 8,4 3,3 3,5 5,7 5,8
225 7,5 7,9 9,8 9,2 13,2 13,0 10,9 11,1
Escriba un modelo lineal para el experimento y calcule el análisis de varianza. Divida la suma de cuadrados del efecto principal de la temperatura en particiones con 1 grado de libertad para las sumas de cuadrados de regresión lineal y cuadrática. Haga una partición de sumas de cuadrados de la interacción temperatura x tela en sumas de cuadrados de interacción temperatura lineal x tela y temperatura cuadrática x tela y pruebe la hipótesis nula de que no hay interacción para las respectivas particiones. (271) Se realizó un experimento de microbiología de suelos para determinar el efecto de la fertilidad del nitrógeno en la fijación de nitrógeno por bacterias Rizhobium. El experimento se ejecutó con tres cosechas; alfalfa, soya y habas. Se inocularon dos plantas con el Rhisobium y se cultivaron en un frasco de Leonard con una de las tres siguientes tasas de nitrógeno en el medio: 0,50 y 100 ppm N. Se usaron cuatro réplicas de frascos de Leonard para cada una de las 12 combinaciones de tratamiento, los tratamientos se arreglaron en un diseño totalmente aleatorizado en una cámara de cultivo y se midió la reducción de acetileno para 272
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
cada tratamiento en la etapa de florecimiento de las plantas. La reducción de acetileno refleja la cantidad de nitrógeno que fija la bacteria en la relación simbiótica con la planta Nitrógeno 0 50 100
Alfalfa 2,6 1,1 0,9 1,2 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
Cultivo Soya 6,5 2,6 3,9 4,3 0,6 0,6 0,3 0,8 0,0 0,1 0,1 0,0
Habas 0,8 0,9 2,2 1,2 0,7 0,4 0,3 0,8 0,3 0,1 0,0 0,1
Escriba un modelo lineal para este experimento, explique los términos y calcule el análisis de varianza. Realice un análisis residual y determine si es necesaria una transformación de los datos. Si lo es, transforme los datos y calcule el análisis de varianza para los datos transformados. Pruebe la hipótesis nula de que no hay efectos de interacción de cultivo, nitrógeno o cultivo x nitrógeno. Divida la suma de cuadrados del efecto principal del nitrógeno y de la interacción nitrógeno x cultivo en particiones con 1 grado de libertad para regresión lineal y cuadrática. (272) Un agrónomo realizó un experimento para determinar los efectos combinados de un herbicida y un insecticida en el crecimiento y desarrollo de plantas de algodón (delta de hoja suave). El insecticida y el herbicida se incorporaron al suelo usado en los contenedores de cultivo; se usaron cuatro contenedores cada uno con cinco plantas de algodón, para cada combinación de tratamiento. Los contenedores se arreglaron dentro del invernadero en un diseño totalmente aleatorizado. Se usaron cinco niveles tanto de insecticida como de herbicida para obtener 25 combinaciones. Los datos que siguen son las medias de celdas para el peso de las raíces secas cuando las plantas tenían tres semanas. Herbicida Insecticida 0 0,5 1,0 1,5 2,0 0 122,0 72,50 52,00 36,25 29,25 20 82,75 84,75 71,50 80,50 72,00 40 65,75 68,75 79,50 65,75 82,50 60 68,00 70,00 68,75 77,25 68,25 80 57,50 60,75 63,00 69,25 73,25 Cuadrado medio del error experimental = 174 con 75 GL
Calcule las particiones de sumas de cuadrados de regresión con 1 grado de libertad para las sumas de cuadrados de herbicida, insecticida e interacción. Calcule un polinomio de grado no mayor a la regresión cúbica para el herbicida o el insecticida. 273
Palacios C. Severo
(273) Se realizó un experimento sobre la duración de tela recubierta sujeta a pruebas con abrasivos normales. El diseño factorial de 2x2x3 incluyó dos sustancias distintas (F 1, F2) en tres proporciones diferentes (25%, 50%, 75%) con y sin tratamiento de superficie (S1, S2); se probaron dos especimenes réplica de cada una de las 12 combinaciones en un diseño totalmente aleatorizado. Los datos corresponden a la pérdida de peso (mg) de los especimenes de tela por la prueba de abrasión. Proporción sustancia (%) 25 50 75
Tratamiento de superficie y sustancia S1 S2 F1
F2
F1
F2
194 208 233 241 265 269
239 187 224 243 243 226
155 173 198 177 235 229
137 160 129 98 155 132
Escriba un modelo lineal para el experimento, explique los términos y calcule el análisis de varianza. Prepare una tabla de medias de celdas y marginales con sus respectivos errores estándar. (274) Un científico de suelos realizó un experimento para evaluar una red de resistencias de cuatro electrodos y calcular la electrocondutividad (EC) del suelo en celdas conductivas de acrílico especiales. El objetivo del estudio era evaluar la relación entre la EC medida y la salinidad del agua en el suelo con diferentes cantidades de agua. Se incluyeron tres texturas básicas de suelo, ya que la EC es específica de la textura; se usaron dos celdas para cada combinación de tratamiento y los tres tipos de suelo fueron arena arcillosa, arcilla y barro. El agua salina, en tres niveles, se basó en la EC del agua a 2,8, y 16 dS/m (decisiemens/metro) y se establecieron tres niveles de contenido de agua en el suelo, 0%, 5% y 15%. El experimento resultante fue un arreglo factorial de 3x3x3 con dos réplicas en un diseño totalmente aleatorizado; los siguientes son los valores de EC del suelo determinados con base en las lecturas de la red de cuatro electrodos. Salinidad del agua Arena Arcilla Barro
274
0 0,60 0,48 0,98 0,93 1,37 1,50
2 5 1,69 2,01 2,21 2,48 3,31 2,48
15 3,47 3,30 5,68 5,11 5,47 5,38
0 0,05 0,12 0,15 0,26 0,72 0,51
8 5 0,11 0,09 0,23 0,35 0,78 1,11
15 0,06 0,19 0,40 0,75 2,10 1,18
0 0,07 0,06 0,07 0,21 0,40 0,57
16 5 0,08 0,14 0,23 0,35 0,72 0,88
15 0,22 0,17 0,43 0,35 1,95 2,87
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Escriba un modelo lineal para este experimento, explique los términos y calcule el análisis de varianza. Prepare una tabla de medias de celdas y marginales con sus respectivos errores estándar. (275) Se colocaron cinco varillas de níquel de 1 mm de diámetro en un sujetador metálico en una suspensión de óxido de aluminio y se aplicó una tensión de 100 volts entre las varillas de níquel y el contenedor con la suspensión de óxido de aluminio. Se registró el grueso de la capa de óxido de aluminio depositada en las varillas a tres posiciones de altura de las varillas; los datos que siguen son el grueso del depósito en micrones. Altura 1 2 3
Posición sujetador varilla de níquel 1 2 3 4 5 125 130 128 134 143 126 150 127 124 118 130 155 168 159 138
Escriba un modelo lineal para este experimento, explique los términos y establezca las suposiciones del modelo. Serán válidas las suposiciones del modelo para este experimento Admitiendo esas suposiciones como razonablemente válidas. Calcule el análisis de varianza para los datos. (276) Un entomólogo realizó un experimento sobre la energía consumida por las abejas de miel al beber, para determinar el efecto de la temperatura del ambiente y la viscosidad del líquido en el consumo de energía. Los niveles de temperatura fueron 20, 30 y 40°C, la viscosidad del líquido se controló por las concentraciones de sacarosa, que eran de 20, 40 y 60% del total de sólidos disueltos en el líquido que bebían las abejas de miel. El entomólogo registró la energía gastada por las abejas en joules/segundo. Los datos que siguen corresponden a tres réplicas de cada uno de los nueve tratamientos en un diseño totalmente aleatorizado. Temperatura (°C) 20 30 40
3,1 6,0 7,7
20 3,7 6,9 8,3
4,7 7,5 9,5
Sacarosa (%) 40 5,5 6,7 7,3 11,5 12,9 13,4 15,7 14,3 15,9
7,9 17,5 19,1
60 9,2 15,8 18,0
9,3 14,7 19,9
Calcule las particiones de regresión de sumas de cuadrados con 1 grado de libertad, las sumas de cuadrados para el % de sacarosa y la interacción.
275
Palacios C. Severo
XXI. DISEÑOS ROTABLES Para la forma de análisis de datos del modelo que sirve como ejemplo consiste sólo en adecuar una regresión de primer orden a los datos que genera el experimento de simulación, un diseño factorial completo de dos niveles o un fraccionado, Plackett-Burman proporcionarán la precisión suficiente para lograr una estimación de los coeficientes de la ecuación de regresión. No obstante si se adapta un polinomio de segundo orden o de un orden más alto a los datos de salida, un diseño factorial fraccionado puede producir estimaciones de parámetros de los coeficientes de los términos elevados al cuadrado con una precisión relativamente baja. Un diseño rotacional para ajustar un modelo de segundo orden debe tener por lo menos tres niveles de cada factor. Existen muchos diseños que podrían emplearse para ajustar un modelo de segundo orden. Uno de los niveles, el central en el cual se repiten las pruebas experimentales, sirven para evaluar la varianza del error experimental desarrollado durante las pruebas y así mismo la variación de los diversos tipos de materiales empleados en las pruebas experimentales. En este tipo de diseños existen, los que sirven exclusivamente para evaluar tan solo dos factores y otros para tres ó más factores. Se diferencias unos de los otros porque son exclusivos para sus tratamientos y sirven solo para tratar fenómenos cuadráticos, no sirven para tratar fenómenos lineales. Los diseños para tres o más factores se pueden acondicionar para modelar por bloque, o acoplar cualquier diseño que se desarrolle en el proceso de evaluación sistemática. XXII. DISEÑOS ROTABLES DE DOS FACTORES
276
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Es un diseño Ortogonal de primer orden, esta configurada en una figura regular equilatera con k+1 vértices en k dimensiones, estás figuras se dan en el plano cartesiano. A.
DISEÑO TRIGONAL
Este es el diseño más simple que existe en los proceso de evaluación de factores de primer orden. Si k=3 es un triángulo equilátero regular. X1 1 -0,5 0,5 0 0 0
B.
X2 0 -0,86 -0,86 0 0 0
DISEÑO PENTAGONAL
Es uno de los más simples de segundo orden, los puntos experimentales corresponden a un pentágono. Es un diseño con el cual se puede elaborar un nuevo tipo de análisis, se deja al estudioso a fin de poder evaluar e interpretar un nuevo diseño para el futuro, dicho diseño se puede aplicar desde dos factores a n factores como una alternativa de diseño experimental.
Representación esquemática del Diseño Pentagonal X1 1 0,31 -0,81 -0,81
X2 0 0,95 0,58 -0,58 277
Palacios C. Severo 0,31 0 0 0
C.
-0,95 0 0 0
DISEÑO HEXAGONAL
Es un diseño utilizado en investigación, cuando en el proceso se estudian solo dos factores, debiendo ser este siempre cuadrático, si el proceso es lineal dicha técnica no es aplicable. Si el proceso en estudio tuviera tres o más factores, no se puede desglosar y estudiar de par en par, es necesario para este caso desarrollar la técnica del Diseño Compuesto Central o Estrella. El diseño hexagonal consiste en desarrollar seis pruebas experimentales correspondientes a los vértices de un hexágono regular, siendo necesario replicar pruebas centrales para estimar el error experimental.
Representación esquemática del Diseño Hexagonal
Este diseño es de amplia utilidad a nivel experimental, como su nombre lo indica, los puntos corresponden a un hexágono, considerando de tres a cinco puntos centrales. X1 1 0,5 -0,5 -1 -0,5 0,5 0 0 0 278
X2 0 0,866 0,866 0 -0,866 -0,866 0 0 0
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Ejemplo 6.81 Se estudia dos factores con valores reales, los cuales son codificados por las ecuaciones de recta que se representan mediante las ecuaciones lineales que corresponden dos factores reales mediante las siguientes funciones. A = 0,375X1 + 1,125 B = 1X2 + 2 X1 1 0,5 -0,5 -1 -0,1 0,5 0 0 0
X2 0 0,86 0,86 0 -0,86 -0,86 0 0 0
A 1,5 1,31 0,94 0,75 0,94 1,31 1,25 1,25 1,25
B 2 2,87 2,87 2 1,13 1,13 2 2 2
Y 93,9 89,6 88,8 83,3 81,9 89,3 90,8 90,2 89,3
Ycal 94,51 90,28 88,40 84,70 81,82 89,93 90,17 90,17 90,17
Y - Ycal
(Y-Ycal)2
-0,63 -0,03 0,87 0,21
0,397 0,001 0,757 1,155
SCerror 1,155 0,212 / 3 1,14 SCtotal 70706,97 797,12 / 9 110,48 Fuente Regresión Error Total
Tabla 6.90 Análisis de varianza de regresión SC GL CM Fo Ft(99) 109,34 6 18,22 31,96 > 19,3 1,14 2 0,57 110,48 8 R2 = 98,96%
Fuente Ajuste Error Total
Tabla 6.91 Análisis de varianza de ajuste SC GL CM Fo Ft(99) 3,22 1 3,22 5,649 < 18,5 1,14 2 0,57 4,36 3 R2 = 73,85%
Ejemplo 6.82 Se procesa un mineral aurífero con sales oxidantes en medio ácido, se desea evaluar que factores son significativos (cloruro y nitrato de sodio), con el fin de llegar a establecer el óptimo de recuperación. A: NaCl B: NaNO3
25 5
50 15 Efectos e interacciones A: NaCl = -6263,28 B: NaNO3 = -2431,04
Cuadráticos AA = -895,833 BB = -229,854 279
Palacios C. Severo AB = -508,721 Errores estándar con 3 GL Tabla 6.92 Análisis de varianza de regresión SC GL CM Fo Ft(99) 13,0137 1 13,0137 54,73 > 34,12 26,3312 1 26,3312 110,74 > 34,12 9,86133 1 9,86133 41,47 > 34,12 12,25 1 12,25 51,52 > 34,12 24,6613 1 24,6613 103,72 > 34,12 0,71333 3 0,237778 128,76 8 R2 = 99,446%
Fuente A: NaCl B: NaNO3 AA AB BB Error Total
Au 89,3667 5,166 NaCl 1,453NaNO3 2,866 NaCl ² 4,597 NaNO3 ² 4,06 NaCl.NaNO3
La recuperación de oro depende de los dos factores para llegar al óptimo, esto en forma lineal, pero los factores cuadráticos y la interacción tienen efecto negativo para la extracción de dicho metal precioso. Factor NaCl NaNO3
Valor óptimo = 92,0389 Bajo Alto Óptimo -1,0 1,0 1,0 -0,28 0,86 -0,28 Gráfica de Interacción para Au (X 1000.0) -1
-3300
-3
NaNO3=5 NaNO3=15
-5
-5300
Au
Au
Gráfica de Efectos Principales para Au -1300
-7
-7300
NaNO3=5
-9 -9300 25
NaCl
50
5
NaNO3
15
Efectos significativos de factores principales
-11
NaNO3=15 25
NaCl
50
No existe interacción entre ambos factores principales
En el gráfico de interacciones podemos establecer que ambos factores están en su máximo, y se mantienen como constantes ya que al incremental del nivel mínimo al máximo la extracción de oro decrese y eso no es recomendable. No existe interacción entre ambos factores, por lo que se puede manipular independientemente cada uno de ellos.
280
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Superficie de Respuesta Estimada Contornos de la Superficie de Respuesta Estimada
Au Au -11000.0--10000.0 -10000.0--9000.0 -9000.0--8000.0 -8000.0--7000.0 -7000.0--6000.0 -6000.0--5000.0 -5000.0--4000.0 -4000.0--3000.0 -3000.0--2000.0 -2000.0--1000.0 -1000.0-0.0
NaNO3
13 11 9 7
(X 1000.0) -1 -3 -5
Au
15
-7 -9 -11 25
5 25
30
35
40
45
30
50
35 40 NaCl
45
50
5
7
11
9
13
15
-11000.0--10000.0 -10000.0--9000.0 -9000.0--8000.0 -8000.0--7000.0 -7000.0--6000.0 -6000.0--5000.0 -5000.0--4000.0 -4000.0--3000.0 -3000.0--2000.0 -2000.0--1000.0 -1000.0-0.0
NaNO3
NaCl
Superficie respuesta estimada en el plano con punto óptimo
Superficie respuesta estimada en el espacio
El óptimo de recuperación de oro es 92,0389, cuando se trabaja con un máximo de NaCl y un mínimo de NaNO3. Problemas (277) El estudio experimental que se presenta, estuvo orientado a determinar las granulometrías óptimas tanto en la etapa de Rougher como de Scanvenger. Se desea optimizar la recuperación y el grado de concentración en función de la molienda. X 72 70 66 64 66 70 68 68 68 1
X 76 84 84 76 68 68 76 76 76 2
Para optimizar estas dos variables, se obtuvo los modelos matemáticos: Y1 1,411 27,5 X 1 10,13X 2 0,22 X 12 0,08322 0,034 X 1 X 2 Y2 1,602 34,15 X 1 12,3 X 2 0,228X 12 0,06322 0,04 X 1 X 2
Desarrolle el ANAVA y la superficie respuesta Obtenga el óptimo cuando se alcanza un 66% (278) Se estudia un experimento de flotación a nivel laboratorio siendo sus factores A: tiempo, B: espumante. A: B: Y:
2 1,5 93,9
2,87 1,31 89,6
2,87 0,94 88,8
2 0,75 83,3
1,13 0,94 81,9
1,13 1,31 89,3
2 2 1,12 1,12 90,86 90,2
2 1,12 84,3
Obtenga el modelo del proceso Analice aplicando el ANAVA (279) Se efectuó un proceso electrolítico de fabricación de ocre, cuyo rendimiento esta en función de dos variables A: cloruro de sodio, B: intensidad de corriente. A:
10
9,2
7,7
7
7,7
9,2
8,5
8,5
8,5
B: Y:
42,5 57,7 57,7 42,5 27,3 27,3 42,5 42,5 42,5 85,5 90,6 75,4 78,8 80,3 86,6 81,5 83,5 82,6 281
Palacios C. Severo
Obtenga el modelo del proceso Analice aplicando él ANAVA Cree usted la temperatura influye en el proceso Elabore el diagrama Eh-pH De que color es el ocre producido Sin en vez de cloruro de sodio utiliza un electrolito de nitrato de sodio, cual es el producto final.
D.
DISEÑO OCTOGONAL
Es un diseño utilizado en investigación, cuando en el proceso se estudian tan solo dos factores, debiendo ser estos siempre cuadráticos (dinámicos), si el proceso es lineal dicho diseño no es aplicable. Si el proceso en estudio tuviera más de tres factores, no se puede desglosar y estudiar de par en par, es necesario para este caso desarrollar otra técnica de análisis de Diseño. Es un diseño de segundo orden, corresponde a un octágono regular en el plano.
Representación esquemática del Diseño Octogonal
Diseño de amplia utilidad a nivel experimental, como su nombre lo indica, los puntos corresponden a un octágono considerando de tres a cinco puntos centrales, para evaluar el error experimental. 282
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
X1 -0,71 0,71 -0,71 0,71 1 -1 0 0 0 0 0
X2 -0,71 -0,71 0,71 0,71 0 0 1 -1 0 0 0
Ejemplo 6.83 Se estudian dos factores dinámicos de un proceso en donde se desarrolla un novedoso trabajo, los cuales vienen establecidos mediante las funciones que a continuación se detallan. A = 0,005X1 + 0,025 B = 2X2 + 27,5 X1 -1 1 0 0 -0,71 -0,71 0,71 0,71 0 0 0 0
X2 0 0 -1 1 -0,71 0,71 -0,71 0,71 0 0 0 0
Y 90,90 92,20 92,80 93,60 92,20 93,50 93,30 94,00 94,10 94,30 93,90 94,00
Ycal 91,38 92,59 93,08 94,19 91,81 92,93 93,10 93,49 94,02 94,20 94,02 94,02
Y - Ycal
(Y-Ycal)2
-0,08 -0,28 0,12 0,02 -0,22
0,006 0,08 0,01 0,02 0,0964
SCerror 0,0964 0,22 / 4 0,0834 2
SCtotal 104320,94 1118 / 12 11,48667 2
Fuente Regresión Error Total
Tabla 6.93 Análisis de varianza de regresión SC GL CM Fo Ft(99) 11,40237 8 1,425 50,7 > 27,5 0,0843 3 0,0231 11,48667 11 R2 = 0,99266%
283
Palacios C. Severo
Fuente Ajuste Error Total
E.
Tabla 6.94 Análisis de varianza de ajuste SC GL CM Fo Ft(99) 1,5257 1 1,5257 54,24 > 34,1 0,0843 3 0,0231 1,61 4 R2 = 0,9476%
DISEÑO COMPUESTO CENTRADO
Si se desea cuantificar el efecto de una variable y sus interrelaciones para un producto dado, se puede hacer la suposición de que la respuesta que se quiere evaluar es una función de las variables más importantes que afectan el proceso y con base a ella se plantea un modelo matemático.
Representación esquemática del Diseño Compuesto Centrado
El modelo matemático que relaciona la respuesta buscada y las variables estudiadas es del tipo. Y Ao Ai X i Aii X ii2 Aij X i X j Ajjj X 3jjj Aijk X i X j X k
Donde: Y Estimación del vector respuesta buscada Ao, Ai, Aii, Aij, Ajjj, Aijk Son los coeficientes del modelo Xi, Xij Valores de las variables codificadas Para estimar los coeficientes del modelo se utiliza el diseño compuesto centrado rotacional que se construye a partir de tres componentes.
284
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
a-1) Un bloque factorial de 2k puntos, donde cada variable toma los valores codificados -1 y +1, hasta cinco variables como máximo. a-2) Un bloque factoriaI fraccionado 2k-1 puntos, donde cada variable toma los valores codificados -1 y +1, cuando hay más de cinco variables. b) Un conjunto de puntos adicionales cuyo número es 2k donde cada variable toma los valores codificados -2k/4 y +2k/4. La figura formada por estos puntos se llama estrella. c) Un punto central cuyos valores codificados es cero, este punto se repite las veces que sea necesario para la estimación del error experimental. Para explicar el concepto de rotabilidad, supóngase que el punto (0, 0,..., 0) representa el centro de la región en la cual la relación entre la respuesta buscada Ycal Y las variables independientes Xi que están siendo investigadas, está dada por la ecuación general que representa una superficie de alto orden. De los resultados de cualquier experimento se puede calcular S(Y) del error estándar de Ycal en cualquier punto de la superficie ajustada. Este error estándar será una función de las coordenadas del punto Xi, En un diseño rotacional, este error estándar es el número para todos los puntos que están a la misma distancia L del centro de la región; esto para todos los puntos tales que: X12 X 22 ... X k2 L Ctte
Así para un diseño de tres variables se tiene que cada variable asume los siguientes valores codificados: -1, +1, 0, -2k/4 y +2k/4
La ecuación del tipo: Y Ao A1 X 1 A2 X 2 A11 X 112 A22 X 222 A12 X 1 X 2
La codificación de las variables se obtiene de:
Xi
Vi a b
Donde: 285
Palacios C. Severo
Vi a b
Nivel de la variable real escogida Valor de la variable en el punto central Amplitud del valor real
Podemos indicar que los valores -1 y +1 corresponden a los niveles inferior y superior de un rango de experimentación encontrada bien sea por investigación de referencias especializadas en el proceso estudiado o por experiencia propia. Los puntos estrella -2k/4 y +2 k/4 son puntos por fuera del rango y se incluyen con propósitos exploratorios. El punto central con valor cero representa un nivel en el proceso con el que se supone se obtiene buenos resultados. Supongamos que un proceso depende de tres variables, una de las cuales es la temperatura con un rango de nivel de 30 a 50, se tiene que: a - 1 = 30 a + 1 = 50
El valor medio se obtiene por; [30+50]/2 = 40 = a
Luego 1 2k / 4 2k / 4
30 40/ b V1 40/ 10 V2 40/ 10
b 10 V1 23,18 V2 56,82
Así tenemos los cinco valores de la temperatura, que se usarán en el bloque de experimentación; de igual manera se procede para las otras variables. Ejemplo 6.84 Se estudia la lixiviación (lavado) de un suelo salino para utilizar dicho suelo en la siembra de hortalizas. Aplicaremos dos variables A: lavado alcalino y B: flujo de lavado. X1 286
X2 -
A 23
B 1,3
Y 50,00
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería + + -1,41 +1,41 0 0 0 0 0 0 0
+ + 0 0 -1,41 +1,41 0 0 0 0 0
37 23 37 20 40 30 30 30 30 30 30 30
1,3 2,7 2,7 2 2 1 3 2 2 2 2 2
85,61 97,62 85,76 73,39 76,92 52,92 82,53 78,02 84,61 79,12 64,84 88,46
Tabla 6.95 Análisis de varianza de regresión Fuente SC GL CM Fo Ft(99) Regresión 1759,2 5 351,8 5,14 > 3,97 Error 478,8 7 68,4 Total 2238 12 R2 = 0,786%
Ejemplo 6.85 El efecto de las interacciones comparadas con los efectos del primer y segundo orden estimado. Los efectos de alto orden no se pueden ignorar. Por lo que efectuamos puntos extras para obtener un diseño de segundo orden. A: B: C:
137 32,5 5,5
147 37,5 8,5
157 42,5 11,5 X1 0 2 -2 0 0 0 0
X2 0 0 0 2 -2 0 0
X3 0 0 0 0 0 2 -2
Y 66,9 65,4 56,9 67,5 65,0 68,9 60,3
Para estimar los coeficientes bo, b11, b22, b33 obtenemos la ecuación correspondiente. 15bo 16bo 16bo 16bo
16b11 40b11 8b11 8b11
16b22 8b22 4b22 8b22
16b33 8b33 8b33 40b33
976 1041,3 1055,1 1041,9
Obteniéndose
287
Palacios C. Severo
b 67,11
b1 1,944
b2 0,906
b3 1,069
b11 1,539
b22 0,264
b33 0,676
b12 3,088
b13 2,188
b23 1,212
o
Ejemplo 6.86 Un investigador analiza un proceso en donde influyen dos factores: tiempo y temperatura. Desea evaluar el efecto significativo de ambos factores. A: tiempo (min.) B: Temperatura (°F)
80 170 A: tiempo 80 90 80 90 77,9289 92,0711 85 85 85 85 85 85 85
90 180 B: Temperatura 170 170 180 180 175 175 167,929 182,071 175 175 175 175 175
Y 78,5 77,0 78,0 79,5 75,6 78,4 77,0 78,5 79,9 80,3 80,0 79,7 79,8
Efectos estimados para Y Efectos e interacciones Cuadráticos A: tiempo = 0,989949 AA = 2,50248 B: Temperatura = 1,03033 BB = -1,78252 AB: = 1,5 Errores estándar con 7 GL
Ambos factores tienen efecto sobre el proceso, pero el que tiene mayor efecto significativo es la temperatura, seguido del tiempo. Existe interacción entre ambos factores, por lo que si se manipula un factor el otro también es modificado. Tabla 6.96 Análisis de varianza de regresión Fuente SC GL CM Fo A: tiempo 1,96001 1 1,96001 3,70 B: Temperatura 2,1216 1 2,1216 4,01 AA 10,8913 1 10,8913 20,58 AB 2,25 1 2,25 4,25 BB 5,34129 1 5,34129 10,09 288
< < > < >
Ft(99) 5,59 5,59 5,59 5,59 5,59
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Error Total
3,7051 24,5277
7 12
0,5293
R2 = 84,8942%
En la tabla del análisis de varianza podemos establecer que para un 95% de la estadística de F, se puede notar que los dos factores principales no tienen influencia en dicho rango. Pero los efectos cuadráticos si tienen influencia en dicho rango para un coeficiente de correlación del 84,8942 por ciento. Y 935,283 3,35742 tiempo 9,82069Temperatur a 0,05tiempo ² 0,03505Temperatur a ² 0,03tiempo.Temperatur a
En el modelo matemático se puede notar que la constante esta en su máximo, el cual deberá de minimizarse hasta el valor medio de los niveles. Se ve que ambos factores tienen influencia para incrementar la constante hasta un valor positivo, la interacción también tiene efecto significativo sobre el proceso. Camino de Máximo Ascenso para Y tiempo Temperatura Y 85,0 175,000 79,9400 86,0 176,206 80,0984 87,0 177,825 80,1186 88,0 177,024 80,0336
Al incrementar el tiempo en una unidad y la temperatura de igual manera, se nota que a un tiempo de 88 minutos y una temperatura de 177,024 °F se obtiene una respuesta de 80,0336, cercano al valor óptimo de la maximización. Factor tiempo Temperatura
Valor óptimo = 80,133 Bajo Alto 77,9289 92,0711 167,929 182,071
Óptimo 86,6416 177,174
Al maximizar el proceso, se nota que para llegar al óptimo se requiere un tiempo de 89,9415 minutos y una temperatura de 177,174 °F, para obtener un valor óptimo de 80,133.
289
Palacios C. Severo Gráfica de Interacción para Y 80
80
79.5
79.6
79
79.2
78.5
Y
Y
Gráfica de Efectos Principales para Y 80.4
78.8
Temperatura=180
78 77.5 Temperatura=170
78.4
77 Temperatura=180 80
78 80
tiempo
90
170
180 Temperatura
Efectos significativos con tendencia cuadrática
Temperatura=170 90
tiempo
Existencia de Interacción en proceso cuadrático
En la figura se puede notar que ambos efectos no tienden al máximo, ya que tienden al nivel promedio en ambos casos, al incrementar sobre el máximo la respuesta tiende a minimizarse, por lo que es necesario realizar el estudio hasta el valor medio. En la figura de interacción esta entre el valor mínimo y el valor promedio en ambos factores, por lo cual se confirma que deberá trabajarse entre el valor medio y el promedio de ambos factores. En la figura del plano el óptimo esta a un tiempo de 87 minutos y una temperatura de 177 °F para obtener una respuesta sobre 80. Superficie de Respuesta Estimada
Contornos de la Superficie de Respuesta Estimada Y
Temperatura
178 176 174 172
Y 77.0-77.4 77.4-77.8 77.8-78.2 78.2-78.6 78.6-79.0 79.0-79.4 79.4-79.8 79.8-80.2 80.2-80.6 80.6-81.0 81.0-81.4
80 79 78 77 80
170 80
82
84
86 tiempo
88
90
Superficie respuesta estimada en el plano
77.0-77.4 77.4-77.8 77.8-78.2 78.2-78.6 78.6-79.0 79.0-79.4 79.4-79.8 79.8-80.2 80.2-80.6 80.6-81.0 81.0-81.4
81
Y
180
82
84
tiempo
86
88
90
170
172
174
176
178
180
Temperatura
Superficie respuesta estimada en el espacio
En la figura del espacio se puede establecer que para llegar al óptimo, ambos factores tienden al valor promedio de los niveles para llegar al óptimo. Ejemplo 6.87 Se investiga un proceso con el fin de optimizar los factores X 1 y X2 si son significativos y los rangos en donde están dichos valores óptimos. Se dan los niveles de dichos factores y el vector respuesta. X1: X2: 290
1,5 0,1
8,5 0,3
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
X1 1,5 8,5 1,5 8,5 0,0502 9,9497 5,0 5,0 5,0 5,0
X3 0,1 0,1 0,3 0,3 0,2 0,2 0,0585 0,3415 0,2 0,2
Y 1,23 1,891 1,085 1,095 0,848 1,132 2,169 1,228 1,413 1,139
Efectos estimados para Y Efectos e interacciones Cuadráticos A = 0,2682 AA = -0,2954 B = -0,5680 BB = 0,4130 AB = -0,3257 Errores estándar con 4 GL Fuente
A B AA AB BB Error Total
Tabla 6.97 Análisis de varianza de regresión SC GL CM Fo Ft(95) 0,1439 1 0,1439 8,69 > 7,71 0,6454 1 0,6454 38,94 > 7,71 0,0997 1 0,0997 6,02 < 7,71 0,10611 1 0,10611 6,40 < 7,71 0,19499 1 0,19499 11,7 > 7,71 0,06629 4 0,01657 1,46927 9 R2 = 95,4879%
Y 1,711 0,2519 X 1 8,774 X 2 0,0120 X 12 20,653 X 22 0,4653 X 1 X 2
El vector respuesta depende del factor X1 para llegar al óptimo, esto en forma lineal, pero el factores cuadráticos X1 y la interacción tienen efecto negativo sobre dicho vector. Camino de Máximo Ascenso para Y X1 X2 Y 5,0 0,2 1,276 6,0 0,11522 1,7309 7,0 0,0025 2,853 8,0 -0,1193 4,741 9,0 -0,244 7,416 10,0 -0,372 10,884
X1 X2
Factor
Valor óptimo = 2,31558 Bajo Alto 0,05025 9,9497 0,05857 0,34142
Óptimo 9,3195 0,0585
291
Palacios C. Severo Gráfica de Efectos Principales para Y
Gráfica de Interacción para Y
1.79
2
1.59
1.8
X2=0.1
Y
Y
1.6 1.39
1.4 1.19
X2=0.1
1.2
0.99 1.5
8.5
X1
0.1
X2
X2=0.3
1
0.3
Efectos significativos con tendencia cuadrática
0.18 0.14
0.7-0.85 0.85-1.0 1.0-1.15 1.15-1.3 1.3-1.45 1.45-1.6 1.6-1.75 1.75-1.9 1.9-2.05 2.05-2.2 2.2-2.35
Y 0.7-0.85 0.85-1.0 1.0-1.15 1.15-1.3 1.3-1.45 1.45-1.6 1.6-1.75 1.75-1.9 1.9-2.05 2.05-2.2 2.2-2.35
2.2 1.9 1.6
Y
X2
0.22
8.5
Superficie de Respuesta Estimada Y
0.26
X1
Interacción en proceso cuadrático
Contornos de la Superficie de Respuesta Estimada 0.3
X2=0.3
1.5
1.3 1 0.7 0
0.1 0
2
4
6
8
10
Problemas
4
X1
X1
Superficie respuesta estimada en el plano con punto óptimo
2
6
8
10
0.1
0.3 0.22 0.26 0.14 0.18
X2
Superficie respuesta estimada en el espacio
(280) Se estudian tres variables A: 6 - 10, B: 70 - 90 y C: 780 - 1080 rangos establecidos en base a experiencia. a) Analizar el bloque factorial: si existe curvatura, utilice el método de pendiente ascendente e incremente el bloque estrella. b) Analice el punto estacionario y el análisis canónico. YF : 62 80 60 79 76 82 59 83 YC : 77 76 78 75 75 73 Y : 53 82 70 75 78 74
c) Obtenga el modelo correspondiente. d) Desarrolle el análisis de varianza. e) Analice, interprete y opine. (281) Se estudian cuatro variables A: 1,5 - 3, B: 15 - 25, C: 0, 5 - 1, D: 800 - 1000. Evalué tal como el problema 256. (282) Se quiere evaluar un proceso en donde se nota la influencia de dos factores A: 400 - 600 y B: 3,5 - 5. Y : 92 98 89 99 89 90 85 97 89 93 91 92 88
Obtenga el modelo
Y 92 3 A B A² 0,9 B ² 0,9 AB
Analice mediante los métodos de punto estacionario y canónico. 292
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(283) Un proceso electrolítico, cuyo rendimiento esta en función de las variables A: 20 - 40 Y B: 1 - 3. Obtenga el modelo y analice. X 1 : 85 90 75 78 80 81 80 81 83 82
(284) Con el estudio experimental se desea determinar las condiciones óptimas siendo sus factores X 1 : 72 70 66 64 66 70 68 68 68 X 1 : 76 84 84 76 68 68 76 76 68
El modelo es:
Y 1,411 27,5 X 1 10,13 X 2 0,22 X 12 0,083 X 22 0,034 X 1 X 2
(285) Se estudia un experimento a nivel laboratorio siendo sus factores. X 1 : 1,5 1,31 0,94 0,75 0,94 1,31 1,13 1,13 1,13 X2 :2 2,9 2,9 2 1,13 1,13 2 2 2 Y : 93,9 89,7 88,8 83,3 81,9 89,3 90,9 90,2 89,3
Siendo el modelo YCu 30,98 42,39 X 1 25,9 X 2 4 X 12 3,1X 22 10,16 X 1 X 2
(286) Se estudia la lixiviación con ácido sulfúrico, de una calcina, obtenida y de la tostación en presencia de aire, con adición de óxido de calcio, en horno monosolera Bach, de un concentrado de calcopirita rico en pirita. La calcina es de la siguiente composición: 15,91 % de cobre, 38,06% de hierro, 11,45% de azufre y 3,55% de insolubles. (287) Se estudia las variables A: concentración de ácido; B: temperatura, C: velocidad de agitación. Siendo su vector respuesta. Y : 62 80 60 79 67 82 59 83 77 77 78 75 75 73
Obtenga el modelo Analice el ANAVA Aplique el método para evaluar la curvatura (288) Dado el alto contenido de hierro de los licores de lixiviación, que se obtienen, se procede a la purificación del cobre con Lix 64N, a partir de licores con 3,59 g/l de cobre y 1,14 g/l de hierro, en lo que se relaciona con el efecto de alguna variables como el pH, concentración de extracción, relación de fases, agitación y concentración de ácido. Obteniéndose los modelos. YCu 96,94 1,23 X 1 2,23 X 2 1,15 X 12 1,16 X 22 0,5 X 1 X 2 YFe 12,74 1,25 X 1 1,37 X 2 3,89 X 12 4,11X 22 1,95 X 1 X 2
Analice mediante el ANAVA Establezca los rangos de las variables (289) Se quiere evaluar un proceso de tostación de un concentrado sulfuroso de zinc, se requiere evaluar la temperatura y la adición de aire, para la experimentación se evaluaron los factores 293
Palacios C. Severo
A: temperatura, B: aire. Siendo su vector respuesta. Y : 92,4 98,5 89,9 99,5 89,1 90,5 85,7 97,8 89,2 93,8 91,1 92,4 88,6
Obtenga el modelo Analice mediante el ANAVA Establezca los rangos de las variables (290) Considere el modelo de primer orden
Y 50 1,5 X1 0,8 X 2
Donde 1 X i 1 . Determine la dirección de máximo ascenso y planifique un conjunto de experimentos siguiendo dicha dirección (291) Los siguientes datos fueron recogidos por un ingeniero de planta. La respuesta Y es el tiempo de filtrado, X1 es la temperatura y X2 es la presión. X1 -1 -1 1 1 -1,414 -1,414 0 0 0 0 0 0 0
X2 -1 1 -1 1 0 0 -1,414 1,414 0 0 0 0 0
Y 54 45 32 47 50 53 47 51 41 39 44 42 40
Qué tipo de diseño usó el ingeniero, cuáles son sus ventajas. Ajuste un modelo de segundo orden, verifique su validez y analice la superficie ajustada. Cuáles serían sus recomendaciones si se desea minimizar el tiempo de filtrado. (292) Se desea minimizar el valor de la ceniza en la pulpa de papel (una medida de las impurezas inorgánicas). Se estudian dos variables: temperatura en ºC y tiempo en horas. Estas variables se codifican como se indica a continuación: Estas variables se codifican como se indica a continuación: temperatura 775 , tiempo 3 X X 1
2
115
1 .5
Se lleva a cabo un experimento cuyos resultados se muestran a continuación: X1 -1 1 -1 1
294
X2 -1 -1 1 1
Y 211 92 216 99
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería -1,5 1,5 0 0 0 0 0 0
0 0 -1,5 1,5 0 0 0 0
222 48 168 179 122 175 157 146
Qué tipo de diseño experimental se ha usado. Es rotable. El modelo cuadrático ajustado es Y 150,0445 58,47059 X 1 3,3529 X 2 6,5281 X 12 10,5829 X 22 0,5 X 1 X 2 Fuente Modelo Error Total
SC 30688,7 1478,22 32166,92
GL 5 6 11
CM 6137,74 246,37
Fo 24,91
>
Ft(99) 8,75
R2 = 95,40
¿Es bueno el ajuste de este modelo? Calcule el punto estacionario. ¿Qué tipo de punto es? (puede usar que los autovalores de la matriz son -6,8982802 y 0,6201222) - 6.528158 0.25
0.25 10.58295
(293) Un ingeniero está investigando la influencia de la temperatura, la presión y la concentración del catalizador en tiempo que tarda una reacción en llevarse a cabo. Tras varios experimentos, el investigador ajustó la función Y 630 6,4989 X 1 5,2241X 2 1,3165 X 3 1,8089 X 1 X 2 7,078 X 1 X 3 4,706 X 2 X 3 6,091X 12 5,12 X 22 3,717 X 32
Usando un diseño central compuesto con cinco puntos centrales. Las variables codificadas son las siguientes:
X1
temperatur a (C ) 350 8
X2
presión ( psi ) 612 20
X3
concentración 0.15 0.03
Hágale al ingeniero las sugerencias que considere adecuadas.
295
Palacios C. Severo
F.
DISEÑO EXPERIMENTAL COMERCIAL – EXCO
En muchos países latinoamericanos, existe una discontinuidad en el proceso de transferencia de tecnología en el sector agropecuario. En la mayoría de los casos los resultados de las investigaciones efectuadas a nivel de centros de investigación, estaciones experimentales, etc., no son sometidos a los diferentes pasos del proceso, los cuales conllevan a la adopción o revisión de la tecnología. Esta situación obedece a factores que casi siempre escapan al alcance de los investigadores. De allí se desprende la iniciativa de implementar procedimientos para la validación de resultados experimentales, que representen un avance en el proceso de investigación. En este contexto se enmarca la metodología del Diseño Experimental Comercial (EXCO). El objetivo de el presente estudio es el de aplicar el Diseño EXCO en la validación de los resultados de un experimento en el que se investiga el efecto de la fertilización nitrogenada y la densidad de siembra en el cultivo de maíz. Con el objetivo de determinar los mejores niveles de fertilización nitrogenada y densidad de siembra en el cultivo de maíz), se llevó a cabo un ensayo bajo el diseño experimental de bloques al azar con dos repeticiones, y unidades experimentales de 30 m 2 con 10 m2 de área efectiva. En cada bloque fueron distribuidos al azar 24 tratamientos, los 296
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
cuales fueron el resultado de la superposición de los diseños Factorial 32, Compuesto Central Rotable (k=2, no=5) y Compuesto Central Rotable Doble Estrella con un nuevo núcleo estrella añadido (k=2, c=2, no=4). Tratamiento Tratamiento Nivel real Nivel real diseño diseño ensayo 32 DCR DCRE D N ensayo 32 DCR DCRE D N 1 1 1 66 40 13* 5 13 80 120 2 2 2 66 200 14* 5 80 120 3 3 3 94 40 15 1 66 0 4 4 4 94 200 16 2 66 120 5 5 13 60 120 17 3 66 240 6 6 14 100 120 18 7 94 0 7 4 7 15 80 0 19 8 94 120 8 6 8 16 80 240 20 9 94 240 9* 5 9 9 80 120 21 5 70 120 10* 5 10 10 80 120 22 6 90 120 11* 5 11 11 80 120 23 7 80 60 12* 5 12 12 80 120 24 8 80 180 D: Densidad de siembra (Plantas/ha)x 103 ; N: Nitrógeno (kg/ha); * Tratamientos centrales
La situación antes descrita se aprecia fácilmente al observar la tabla anterior, en el que se ilustran las 24 combinaciones de los niveles reales de los factores, comunes y no comunes para los arreglos de tratamiento señalados. De forma simultánea al establecimiento del experimento, se sembró una parcela comercial de 7000 m2 aproximadamente. A dicha parcela se le aplicó la combinación de niveles de los factores correspondientes al tratamiento central del ensayo. Si la producción de la parcela arroja un valor comprendido en el intervalo de confianza generado a partir de las repeticiones del tratamiento central del experimento, se consideran validados los resultados. Este intervalo de confianza está dado por la siguiente expresión: P X
TC
t
S
TC
/ 2 ( n 1 ) GL
n
o
X
TC
t
1 n
S / 2 ( n 1 ) GL
TC
o
Donde: STC no
Desviación típica de la variable para las no réplicas del tratamiento central. Número de réplicas del tratamiento central. 297
Palacios C. Severo
t / 2 ( n 1) GL
Valor tabulado de "t Student", a la derecha del cual
1–a µ
hay un área de a/2. Coeficiente de confianza. Parámetro a estimar.
Se realizó la validación general del experimento y para cada uno de los arreglos de tratamiento involucrados. El la tabla 6.98 contiene la información del rendimiento obtenido para las réplicas del tratamiento central del ensayo, el cual, como se expresó en la metodología, es el mismo tratamiento aplicado a la parcela comercial. Tabla 6.98. Rendimiento (kg/ha de maíz al 12 % de humedad) para las replicaciones del tratamiento central del ensayo experimental tratamiento Bloque Rendimiento tratamiento Bloque Rendimiento 9 1 3886 9 2 4883 10 1 3320 10 2 5972 11 1 2929 11 2 5281 12 1 3750 12 2 4663 13 1 4146 13 2 4256 14 1 3263 14 2 4517 X TC
4239 Kg/ha
µ = 0,05
STC
886,6 kg/ha
no = 12
Con estos datos se calcularon los promedios y desviaciones típicas necesarias para obtener los intervalos de confianza. Intervalo de Confianza General IC(95%): 3675,68 kg/ha
4082,32 kg/ha
Intervalo de Confianza para el Factorial 32 IC(95%): 2057,16 kg/ha
5586,70 kg/ha
Intervalo de Confianza para el Diseño Central Rotable IC(95%): 3691,10 kg/ha
4799,51 kg/ha
Intervalo de Confianza para el Diseño Central Rotable Estrella IC(95%): 3508,64 kg/ha
298
4912,36 kg/ha
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
El rendimiento de la parcela comercial fue de 3714 kg/ha, valor que está comprendido en todos los intervalos de confianza generados a partir de los datos experimentales, por lo tanto se consideran validados los resultados. Ello implica que la respuesta obtenida a nivel experimental puede ser reproducida en una escala mayor, bajo las mismas condiciones de manejo del cultivo. Trabajando en el campo hortícola han llegado a conclusiones similares y satisfactorias al aplicar la metodología. Estos resultados son muy favorables ya que permiten hacer inferencia sobre la posibilidad de aplicación de tecnologías en medio real, circunstancias en las que la inferencia a partir de los resultados experimentales solamente, se ve ciertamente limitada. El diseño EXCO es aplicable en ensayos con el cultivo de maíz, permitiendo la formulación de recomendaciones más cercanas a la realidad y facilitando el ajuste de los tratamientos con la finalidad de realizar una mejor caracterización de la región de exploración en experiencias futuras. G. DISEÑO SEVERO Propuesto por el Autor, como un diseño de n-niveles para ajustar superficies respuestas lineales y polinomiales de una misma estructura de diseño. Este diseño esta formado por los puntos medios de un cubo, dicha figura geométrica es establecida para el presente estudio. La figura geométrica de un diseño convencional es un cubo de 1 unidad por 1 unidad, en el caso del diseño SEVERO al cubo normal de 1 por 1, se le achura los vértices, a partir del centro de los lados del cubo, tal como se visualiza en la figura. Al cubo de 1 por 1 se le achura las aristas al medio del cubo, es decir a la mitad (0,5) obteniéndose de esa manera la siguiente figura geométrica.
299
Palacios C. Severo
Estructura del Diseño SEVERO
El presente diseño no solo trabaja con los máximos y mínimos tal como los diseños convencionales (+1, -1), aquí se trabaja con el rango de +0,5 y -0,5 logrando con dicho rango disminuir en el consumo de reactivos, materiales, insumo, tiempo, etc. Beneficiando de dicha manera cualquier proceso que se desarrolle en el ámbito experimental tanto a nivel de laboratorio como industrial. Es importante mencionar que el presente diseño nace como una herramienta para poder cuantificar los procesos productivos, ya que en estos momentos padecemos de insumos y sobre todo del tiempo necesario para desarrollar experimentos amplios. Siendo los puntos extremos del nuevo vértice (puntos oscuros) los puntos factoriales y rotacionales y los puntos sobresalientes (puntos claros) los puntos estrellas para una rotacional n factorial. Observemos que el Diseño SEVERO no tiene puntos en los vértices de la figura creada por los niveles inferior y superior para cada variable. Esto es ventajoso cuando los puntos en los vértices representan combinaciones de factor-nivel por ser antieconómico e imposible de probar debido a restricciones del proceso.
300
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Geometría del Diseño SEVERO
Los efectos de las interacciones de tercer orden no existen en el presente caso, por estar confundidos. Los diseños descritos son de mucha utilidad en procesos en donde el insumo, personal y material son restringidos, ya que los niveles del proceso se acortan hasta en un cincuenta por ciento, siendo esto muy loable y económico para analizar cualquier investigación. Se estudia en primer lugar el diseño factorial centrado con dos factores, en la tabla se muestran los valores codificados del diseño factorial centrado con dos factores, principio fundamental del denominado diseño Severo, además se ilustra gráficamente las coordenadas por donde se desarrolla el presente trabajo. DISEÑO FACTORIAL CENTRADO DE DOS FACTORES
301
Palacios C. Severo
X1 -0,5 +0,5 -0,5 +0,5 0 0 0
X2 -0,5 -0,5 +0,5 +0,5 0 0 0
El diseño factorial centrado de dos factores, se crean las siguientes condiciones, al establecer los puntos de los vértices (puntos oscuros) y como punto central el vértice (punto claro), como podrá notar que los punto oscuros están configurados en los puntos extremos del nuevo vértice del cubo, por lo cual viene a ser el punto central del cubo principal (±0,5) (similar al diseño factorial) y el punto central (0, 0) el cual forma la campana de Gauss. De acuerdo a ello podemos visualizar que el punto central no recae directamente en el plano sino que esta formando una campana de Gauss, con lo cual se establece que dicho punto no esta en el plano sino en el espacio, lo cual favorece notablemente en el análisis no es como en los diseños convencionales. Esa pequeña diferencia entre el diseño convencional y el diseño presente es una nueva alternativa para demostrar que el punto central nos configura un diseño rotable directamente. Ejemplo 6.88 En un proceso de electrodeposición de cobre, se procedió a evaluar los factores a tres niveles: Factores A: Voltaje (Voltios) B: Densidad corriente (A/m²) Prueba 1 2 3 4 5 6 302
X1 -0,5 +0,5 -0,5 +0,5 0 0
X2 -0,5 -0,5 +0,5 +0,5 0 0
1 30 A 1,5 2,5 1,5 2,5 2 2
Niveles 0 2 35 B 32,5 32,5 37,5 37,5 35 35
+ 3 40 Y 85 86 98 97 89 89
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 7
0
0
2
35
88
Los valores reales para desarrollar las pruebas experimentales, las obtenemos utilizando la siguiente expresión: X i
V a b i
El análisis para el desarrollo del presente diseño fue se efectúo mediante el programa ESPC plus statistics experimental for PC Efecto Estimado X1:A 0,0 X2: B 12,0 AB -0,5 Errores estándar con 3 GL
Interpretación de los efectos3 Si visualizamos los signos de los efectos A y B, notamos que ambos son positivos, por lo tanto están en su nivel mínimo, por lo cual deberán ser maximizado, es decir que ambos factores son variables, y deberán ser optimizados y establecidos sus rangos de trabajo óptimo. En este caso solamente estamos evaluando y no así optimizando, para desarrollar la optimización deberá seguirse otro camino, el cual será desarrollado en el próximo acápite. El factor B es el que tiene mayor significancía por tener un mayor valor numérico. a) Caso Maximización (+) (-)
Indica que la variable se encuentra al nivel mínimo y debe ser maximizado hasta el óptimo y establecer su rango de trabajo. Indica que el factor ya no es una variable, por lo tanto viene a ser una constante en el proceso, por lo que se encuentra en el nivel máximo y debe mantenerse como tal.
b) Caso Minimización (+) (-) 3
Indica que el factor ya no es una variable, por lo tanto viene a ser una constante en el proceso, por lo que se encuentra en el nivel máximo y debe de mantenerse como tal. Indica que la variable se encuentra al nivel mínimo y debe ser maxi-
Análisis de signos de los coeficientes de los efectos, según el caso.
303
Palacios C. Severo
mizado hasta el óptimo y establecer su rango de trabajo.
A fin de ver la influencia de los factores, se analiza la interacción 4 de los factores, esto quiere decir si, existe cruce de información entre los factores y a la vez estos puedan controlarse de una manera independiente a fin de manipular el proceso. Interpretación de la interacción5 Notamos que el signo de la interacción AB es negativo, esto nos indica que no existe interacción, lo cual lo hemos deducido al visualizar que no existe intersección entre los valores numéricos, por lo tanto no existe cruce de información entre los factores en estudio. a) Caso Maximización (+) (-)
Indica que sí existe interacción entre las variables, uno depende del otro. Indica que no existe interacción entre las variables.
b) Caso Minimización (+) (-)
Indica que no existe interacción entre las variables. Indica que sí existe interacción entre las variables, uno depende del otro.
Para corroborar los análisis desarrollados es que aplicamos el Análisis de Varianza del proceso. Tabla 6.99 Análisis de varianza SC Gl CM Fo Ft(99%) X1: A 0,0 1 0,0 0,0 < 98,49 X2: B 144,0 1 144,0 436,37 > 98,49 AB 0,25 1 0,25 0,75 < 98,49 Curvatura 13,76 1 13,76 41,69 < 98,49 Error total 0,66 2 0,33 Total (corregido) 158,67 6 R2 = 90,2857% Fuente
El que tiene mayor significancía es B = X2, seguido de A = X1 para un coeficiente de correlación del 90,2857%, el factor A tiene valor cero, por lo cual se le considera una constante en el rango de trabajo.
4 5
Es importante que no exista interacción, y de esa manera podamos trabajar con los factores principales. Análisis de signos de los coeficientes de las interacciones, según el caso.
304
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
La varianza del error viene a ser el cuadrado medio del error, siendo este igual a 0,333 dicho valor es menor que la unidad por lo cual la variabilidad de los datos es bastante adecuada para el trabajo realizado. Él cálculo de la Suma de Cuadrados del Total se desarrolla mediante la siguiente relación:
Y
2
SC
Y 2
Total
i
i
N
La suma de cuadrados del total nos sirve para comprobar que los valores: suma de cuadrados de los factores e interacciones, más el error deben ser igual a dicho valor numérico. El valor de F de tabla para un 99% de significancía es 98,49 vemos que el F experimental del factor principal B es mayor por lo tanto dicho factor es significativo, por lo que se corrobora que dicho efecto principal está en su mínimo debiendo ser maximizados y a la vez ambos son variables en el proceso. Siendo el modelo matemático6 lineal para el presente análisis. Y 90,2857 0,0 A 6,0B 0,25AB
La constante del modelo matemático, viene a ser el promedio de los valores del vector respuesta, así mismo es el valor inicial del proceso en estudio, el signo negativo de la constante nos indica que esta en el máximo y debe ser minimizado. a) Caso Maximización (+) (-)
Indica que dicho valor es el inicio del proceso y se encuentra en su mínimo y debe ser maximizado hasta el óptimo. Indica que es el máximo valor del vector respuesta, no se puede subir sobre dicho valor, más al contrario se puede bajar.
b) Caso Minimización (+)
Indica que es el máximo valor de la vector respuesta, no se puede subir sobre dicho valor, más al contrario se puede bajar.
6 Análisis de signos de la constante del modelo matemático, según el caso.
305
Palacios C. Severo
Indica que dicho valor es el inicio del proceso y se encuentra en su mínimo y debe ser maximizado hasta el óptimo.
(-)
En el modelo matemático también podemos visualizar que la interacción es negativa, o sea que no tiene influencia en el proceso. Además podemos visualizar que los factores principales son positivos tal como se visualizo en el análisis de los factores principales. Coeficiente de regresión para Y Y 90,2857 0,0 A 6,0 B 0,25 AB
Interpretación del modelo matemático Si A y B son iguales a cero, entonces el modelo será igual a la constante, si visualizamos el signo de dicha constante notamos que es positivo, lo cual nos indica que esta en su mínimo y debe maximizarse. Optimizar Respuesta Factor A B
Valor óptimo = 96,7857 Bajo Alto Óptimo -0,5 0,5 -0,5 -0,5 0,5 0,5 Gráfica de Interacción para Y
Gráfica de Efectos Principales para Y 99
98
96
95
93
92
B=0.5
Y
Y
B=0.5
90
89
87
86
84
83
B=-0.5 -0.5
0.5 A
-0.5
0.5 B
Efectos significativos de factores principales
B=-0.5 -0.5
0.5 A
Interacción de factores principales
En la superficie respuesta visualizando el gráfico (isolíneas), podemos interpretar lo siguiente: el valor óptimo está a menor A y mayor B.
306
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Contornos de la Superficie de Respuesta Estimada
Superficie de Respuesta Estimada Y
Y 83.0-84.5 84.5-86.0 86.0-87.5 87.5-89.0 89.0-90.5 90.5-92.0 92.0-93.5 93.5-95.0 95.0-96.5 96.5-98.0 98.0-99.5
0.3
B
0.1 -0.1 -0.3 -0.5 -0.5
-0.3
-0.1
0.1 A
0.3
0.5
Superficie respuesta estimada en el plano con punto óptimo
98 95 92 Y
0.5
89 86 83 -0.5 -0.3 -0.1
0.1
0.3
0.5 0.3 0.1 -0.1 -0.3 -0.5 B 0.5
83.0-84.5 84.5-86.0 86.0-87.5 87.5-89.0 89.0-90.5 90.5-92.0 92.0-93.5 93.5-95.0 95.0-96.5 96.5-98.0 98.0-99.5
A
Superficie respuesta estimada en el espacio
La superficie respuesta a nivel espacial nos muestra la forma en que están ubicados los puntos experimentales, así mismo la dirección en la cual se orienta el proceso. Notamos que la zona de mayor recuperación se ubica a menor A y mayor B. DISEÑO FACTORIAL CENTRADO DE TRES FACTORES X1 -0,5 +0,5 -0,5 +0,5 -0,5 +0,5 -0,5 +0,5 0 0 0 0 0 0 0
X2 -0,5 -0,5 +0,5 +0,5 0 0 0 0 -0,5 -0,5 +0,5 +0,5 0 0 0
X3 0 0 0 0 -0,5 -0,5 +0,5 +0,5 -0,5 +0,5 -0,5 +0,5 0 0 0
Este es una nueva estrategia estadística elaborada para los procesos donde se tiene tres factores, en este diseño se ahorra mucho tiempo, personal e insumo porque el factor de mayor orden no existe. El presente es un aporte para que la industria logre mejorar su productividad y sea de gran provecho para los estudiosos. Ejemplo 6.89 Se evalúa el experimento del ejemplo anterior con tres factores a dos niveles. 307
Palacios C. Severo
Factores A: Voltaje (Voltios) B: Densidad corriente (A/m²) C: Agitación (RPM) Prueba 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
X1 -0,5 +0,5 -0,5 +0,5 -0,5 +0,5 -0,5 +0,5 0 0 0 0 0 0 0
X2 -0,5 -0,5 +0,5 +0,5 0 0 0 0 -0,5 -0,5 +0,5 +0,5 0 0 0
X3 0 0 0 0 -0,5 -0,5 +0,5 +0,5 -0,5 +0,5 -0,5 +0,5 0 0 0
1 30 700
Niveles 0 2 35 1100
A 1,5 2,5 1,5 2,5 1,5 2,5 1,5 2,5 2 2 2 2 2 2 2
+ 3 40 1500
B 32,5 32,5 37,5 37,5 35 35 35 35 32,5 32,5 37,5 37,5 35 35 35
C 1100 1100 1100 1100 900 900 1300 1300 900 1300 900 1300 1100 1100 1100
Y 85 86 98 97 86 88 98 96 88 89 90 92 89 89 88
Interpretación de los efectos Si visualizamos los signos de los efectos A, B y C, notamos que son positivos, por lo tanto están en su nivel mínimo, por lo cual deberán ser maximizado, es decir que dichos factores son variables, y deberán ser optimizados y establecidos sus rangos de trabajo óptimo. Efecto Estimado X1:A 0,0 X2:B 7,25 X3:C 27,75 AB -0,25 AC -0,5 BC 0,125 Errores estándar con 8 GL
En este tipo de diseño el efecto de tercer orden no existe. Por lo tanto la suma de cuadrados para dichos efectos tampoco existe. El que tiene mayor significancía es B, seguido de C para un coeficiente de correlación del 98,47%. Fuente A: X1 B: X2 C: X3 308
Tabla 6.100 Análisis de varianza SC GL CM Fo 0 1 0 0 105,125 1 105,125 318,56 1540,125 1 1540,125 4667,05
< > >
Ft(95%) 98,49 98,49 98,49
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería AB AC BC Curvatura Error Total
0,125 0,5 0,03125 13,14 0,66 1659,71
1 1 1 1 2 9
0,125 0,5 0,03125 13,14 0,33
0,38 1,51 0,095 39.82
< < < <
98,49 98,49 98,49 98,49
R² = 90,6%
Siendo el modelo matemático para el presente caso: Y 90,6 0,0 A 3,625B 13,875C 0,125B 0,25 AC 0,0625BC
Interpretación del modelo matemático Si A, B y C son iguales a cero, entonces el modelo será igual a la constante, si visualizamos el signo de dicha constante notamos que es negativo, lo cual nos indica que esta en su máximo y debe minimizarse. Factor A B C
Valor óptimo = 109,378 Bajo Alto Óptimo 1,0 3,0 1,204 30,0 40,0 40,0 700,0 1500,0 1500,0
El punto óptimo del presente proceso viene establecido por la tendencia de la hipótesis planteada en un principio, siendo esto que A está en el máximo debe de minimizarse, B y C deben de maximizarse y establecer el óptimo. En la superficie respuesta visualizando el gráfico (isolíneas), podemos interpretar lo siguiente: el valor óptimo está a mayor B y C. Dejando constante al factor A. A=2.0
1100
900
700 30
32
34
36
38
40
81.0-83.0 83.0-85.0 85.0-87.0 87.0-89.0 89.0-91.0 91.0-93.0 93.0-95.0 95.0-97.0 97.0-99.0 99.0-101.0 101.0-103.0
B
Superficie respuesta estimada en el plano con punto óptimo
108
Y
1300
C
A=2.0
Y
1500
103 98 93 88 83 78 30
32
34 B
36
38
1500 1300 1100 900 C 40 700
81.0-83.0 83.0-85.0 85.0-87.0 87.0-89.0 89.0-91.0 91.0-93.0 93.0-95.0 95.0-97.0 97.0-99.0 99.0-101.0 101.0-103.0
Superficie respuesta estimada en el espacio
En el grafico espacial podemos visualizar el comportamiento de las isolíneas de igual manera, debe de incrementarse B y C, manteniendo constante el factor A. 309
Palacios C. Severo
DISEÑO ROTABLE CENTRADO DE n FACTORES X1 -0,5 0,5 -0,5 0,5 -0,5 0,5 -0,5 0,5 -0,75 0,75 0 0 0 0 0 0 0
X2 -0,5 -0,5 0,5 0,5 -0,5 -0,5 0,5 0,5 0 0 -0,75 0,75 0 0 0 0 0
X3 -0,5 -0,5 -0,5 -0,5 0,5 0,5 0,5 0,5 0 0 0 0 -0,75 0,75 0 0 0
El presente diseño rotable para ajustar un modelo de segundo orden debe tener por lo menos tres niveles en cada factor. El presente diseño es una alternativa frente a los diversos diseños existentes. El presente diseño es simple en el proceso de evaluación de factores desde K>2, el diseño rotable esta extraído de la figura geométrica. Ejemplo 6.90 En un proceso electrolítico para la fabricación de sales de aluminio se procedió a evaluar dos factores a tres niveles. A: B:
0,75 1
1,25 2
Prueba 1 2 3 4 5 6 7 8 9 10 11
1,5 3 X1 -0,5 0,5 -0,5 0,5 -0,75 0,75 0 0 0 0 0
X2 -0,5 -0,5 0,5 0,5 0 0 -0,75 0,75 0 0 0
A 1,00 1,50 1,00 1,50 0,88 1,63 1,25 1,25 1,25 1,25 1,25
B 1,50 1,50 2,50 2,50 2,00 2,00 1,25 2,75 2,00 2,00 2,00
Y 95,2 93,4 97,2 95,7 92,5 98,1 93,5 95,7 89,5 89,6 89,4
Si visualizamos los signos de los efectos A=X1, y B=X2, notamos que X2 tiene signo positivos, por lo tanto están en su nivel mínimo, por lo cual 310
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
deberán ser maximizado, es decir que dicho factor es variable, y deberán ser optimizados y establecidos sus rangos de trabajo óptimo, y el factor X1 es una constante. Efecto e Efectos interacciones cuadráticos A: X1 = -6,767 AA = 12,572 B: X2 = 3,426 BB = 19,732 AB = 0,45 Errores estándar con 5 GL
El que modelo matemático así como la falta de ajuste son significativos y por lo tanto se ajustan al proceso con un coeficiente de correlación del 82,611%. Fuente A: X1 B: X2 AA AB BB Error Total
Tabla 6.101 Análisis de varianza SC Gl CM Fo Ft(95%) 18,4802 1 18,4802 5,52 < 6,61 4,0733 1 4,0733 1,22 < 6,61 52,2002 1 52,2002 15,59 > 6,61 0,0225 1 0,0225 0,01 < 6,61 40,6668 1 40,6668 12,14 > 6,61 16,745 5 3,34899 96,2964 10 R² = 82,611%
Tabla 6.102 Análisis de varianza de falta de ajuste SC Gl CM Fo Ft(95 %) Falta ajuste 16,725 3 5,575 557,5 > 19,16 Error 0,02 2 0,01 Total 16,745 5 R² = 82,611% Fuente
Siendo el modelo matemático para el presente caso: Y 194,097 110,805X 38,426 X 44,703X 9,8617 X 0,6 X X 2
1
2
1
2
2
1
2
Si X1, y X2 son iguales a cero, entonces el modelo será igual a la constante, si visualizamos el signo de dicha constante notamos que es positivo, lo cual nos indica que esta en su mínimo y debe maximizarse. Factor X1 X2
Valor óptimo = 103,886 Bajo Alto Óptimo 0,88 1,63 1,63 1,25 2,75 2,75
El punto óptimo del presente proceso viene establecido por la tendencia de la hipótesis planteada en un principio, siendo que X1 esta en su 311
Palacios C. Severo
máximo y debe mantenerse constante y X2 tambien esta en su máximo y deben de minimizarse y establecer el óptimo. Ambos factores tienen efecto significativo significativo en el proceso. Gráfica de Efectos Principales para Y
Gráfica de Interacción para Y 112
101
109
98
106
95
B=1 B=3
103
92 89
B=3
Y
Y
104
B=1
100 0.75
A
1.5
1
97
3
B
0.75
Efectos significativos con tendencia cuadrática
1.5
A
Interacción en proceso cuadrático
No existe interacción entre ambos factores, por lo que cada factor es independiente en el proceso, si se modifica el factor X1, se mantiene el factor X2, y así sucesivamente. En la superficie respuesta visualizando el gráfico (isolíneas), podemos interpretar lo siguiente: el valor óptimo está a un valor máximo de X1 y un valor promedio de X2. Superficie de Respuesta Estimada
Contornos de la Superficie de Respuesta Estimada 3
B
2.2 1.8 1.4
113 109 105
Y
89.0-91.4 91.4-93.8 93.8-96.2 96.2-98.6 98.6-101.0 101.0-103.4 103.4-105.8 105.8-108.2 108.2-110.6 110.6-113.0 113.0-115.4
2.6
1 0.75
Y
Y
101 97 93 89 0.75
0.95
1.15 A
1.35
1.55
Superficie respuesta estimada en el plano con punto óptimo
0.95
1.15
A
1.35
1.55
1
3 2.6 2.2 1.8 1.4
89.0-91.4 91.4-93.8 93.8-96.2 96.2-98.6 98.6-101.0 101.0-103.4 103.4-105.8 105.8-108.2 108.2-110.6 110.6-113.0 113.0-115.4
B
Superficie respuesta estimada en el espacio
En el grafico espacial podemos visualizar el comportamiento de las isolíneas de igual manera, debe de incrementarse X1 y manteniendo constante el factor X2.
312
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Problemas (294) El estudio experimental que se presenta, estuvo orientado a determinar las granulometrías óptimas tanto en la etapa de Rougher como de Scanvenger. Se desea optimizar la recuperación y el grado de concentración en función de la molienda. X1 -0,5 +0,5 -0,5 +0,5 0 0 0
X2 -0,5 -0,5 +0,5 +0,5 0 0 0
Y 72 70 66 64 68 68 68
Para optimizar estas dos variables, se obtuvo los modelos matemáticos: Y1 68,0 02 X 1 0,6 X 2 0,0 X 1 X 2
Desarrolle el ANAVA y la superficie respuesta Obtenga el óptimo cuando se alcanza un 68,4% (295) Se estudia un experimento de flotación a nivel laboratorio siendo sus factores A: tiempo, B: espumante. A: B: Y:
2 2,87 2,87 2 1,13 1,13 2 2 2 1,5 1,31 0,94 0,75 0,94 1,31 1,12 1,12 1,12 93,9 89,6 88,8 83,3 81,9 89,3 90,8 90,2 84,3
Obtenga el modelo del proceso Analice aplicando el ANAVA (296) Se efectuó un proceso electrolítico de fabricación de ocre, cuyo rendimiento esta en función de dos variables A: cloruro de sodio, B: intensidad de corriente. A:
10
9,2
7,7
7
7,7
9,7
8,5
8,5
8,5
B: Y:
42,5 57,7 57,7 42,5 27,3 27,3 42,5 42,5 42,5 85,5 90,6 75,4 78,8 80,3 86,6 81,5 83,5 82,6
Obtenga el modelo del proceso Analice aplicando él ANAVA Cree usted la temperatura influye en el proceso Elabore el diagrama Eh-pH De que color es el ocre producido Sin en vez de cloruro de sodio utiliza un electrolito de nitrato de sodio, cual es el producto final. (297) Se quiere evaluar un proceso en donde se nota la influencia de dos factores A: 400 - 600 y B: 3,5 - 5. Y : 92 98 89 99 89 90 85 97 89 93 91 92 88
Obtenga el modelo 313
Palacios C. Severo
Y 92 3 A B A² 0,9 B ² 0,9 AB
Analice mediante los métodos de punto estacionario y canónico. (298) Un proceso electrolítico, cuyo rendimiento esta en función de las variables A: 20 - 40 y B: 1 - 3. Obtenga el modelo y analice. X 1 : 85 90 75 78 80 81 80 81 83 82
(299) Con el estudio experimental se desea determinar las condiciones óptimas siendo sus factores X 1 : 72 70 66 64 66 70 68 68 68 X 1 : 76 84 84 76 68 68 76 76 68
El modelo que gobierna el estudio experimental es:
Y 1,411 27,5 X 1 10,13 X 2 0,22 X 12 0,083 X 22 0,034 X 1 X 2
(300) Se estudia un experimento a nivel laboratorio siendo sus factores. X 1 : 1,5 1,31 0,94 0,75 0,94 1,31 1,13 1,13 1,13 X2 :2 2,9 2,9 2 1,13 1,13 2 2 2 Y : 93,9 89,7 88,8 83,3 81,9 89,3 90,9 90,2 89,3
Siendo el modelo
YCu 30,98 42,39 X 1 25,9 X 2 4 X 12 3,1X 22 10,16 X 1 X 2
(301) Se estudia la lixiviación con ácido sulfúrico, de una calcina, obtenida y de la tostación en presencia de aire, con adición de óxido de calcio, en horno monosolera Bach, de un concentrado de calcopirita rico en pirita. La calcina es de la siguiente composición: 15,91 % de cobre, 38,06% de hierro, 11,45% de azufre y 3,55% de insolubles. (302) Se estudia las variables A: concentración de ácido; B: temperatura, C: velocidad de agitación. Siendo su vector respuesta. Y : 62 80 60 79 67 82 59 83 77 77 78 75 75 73
Obtenga el modelo Analice el ANAVA Aplique el método para evaluar la curvatura (303) Dado el alto contenido de hierro de los licores de lixiviación, que se obtienen, se procede a la purificación del cobre con Lix 64N, a partir de licores con 3,59 g/l de cobre y 1,14 g/l de hierro, en lo que se relaciona con el efecto de alguna variables como el pH, concentración de extracción, relación de fases, agitación y concentración de ácido. Obteniéndose los modelos. YCu 96,94 1,23 X 1 2,23 X 2 1,15 X 12 1,16 X 22 0,5 X 1 X 2 YFe 12,74 1,25 X 1 1,37 X 2 3,89 X 12 4,11X 22 1,95 X 1 X 2
Analice mediante el ANAVA Establezca los rangos de las variables 314
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(304) Se quiere evaluar un proceso de tostación de un concentrado sulfuroso de zinc, se requiere evaluar la temperatura y la adición de aire, para la experimentación se evaluaron los factores A: temperatura, B: aire. Siendo su vector respuesta. Y : 92,4 98,5 89,9 99,5 89,1 90,5 85,7 97,8 89,2 93,8 91,1 92,4 88,6
Obtenga el modelo Analice mediante el ANAVA Establezca los rangos de las variables (305) Considere el modelo de primer orden
Y 50 1,5 X1 0,8 X 2
Donde 1 X i 1 . Determine la dirección de máximo ascenso y planifique el experimento siguiendo dicha dirección (306) Los siguientes datos fueron recogidos por un ingeniero de planta. La respuesta y es el tiempo de filtrado, X 1 es la temperatura y X2 es la presión. X1 -0,5 0,5 -0,5 0,5 -0,75 0,75 0 0 0 0 0
X2 -0,5 -0,5 0,5 0,5 0 0 -0,75 0,75 0 0 0
Y 54 45 32 47 50 53 47 51 41 39 40
Ajuste un modelo de segundo orden, verifique su validez y analice la superficie ajustada. Cuáles serían sus recomendaciones si se desea minimizar el tiempo de filtrado. (307) Se desea minimizar el valor de la ceniza en la pulpa de papel (una medida de las impurezas inorgánicas). Se estudian dos variables: temperatura en ºC y tiempo en horas. Estas variables se codifican como se indica a continuación: Estas variables se codifican como se indica a continuación: temperatura 775 , tiempo 3 X X 1
2
115
1 .5
Se lleva a cabo un experimento cuyos resultados se muestran a continuación: X1 -0,5 0,5 -0,5
X2 -0,5 -0,5 0,5
Y 211 92 216
315
Palacios C. Severo 0,5 -0,75 0,75 0 0 0 0 0 0 0
0,5 0 0 -0,75 0,75 0 0 0 0 0
99 222 148 168 179 122 175 157 146 130
Qué tipo de diseño experimental se ha usado. Es rotable. El modelo cuadrático ajustado es
Y 150,0445 58,47059 X 1 3,3529 X 2 6,5281X 12 10,5829 X 22 0,5 X 1 X 2 Fuente Modelo Error Total
SC 30688,7 1478,22 32166,92
GL 5 6 11
CM 6137,74 246,37
Fo 24,91
>
Ft(99) 8,75
R2 = 95,04
¿Es bueno el ajuste de este modelo? Calcule el punto estacionario. ¿Qué tipo de punto es? (Puede usar que los autovalores de la matriz son -6,89 y 0,62) - 6.528158 0.25
0.25 10.58295
(308) Un ingeniero está investigando la influencia de la temperatura, la presión y la concentración del catalizador en tiempo que tar7 (309) da una reacción en llevarse a cabo. Tras varios experimentos, el investigador ajustó la función Y 630 6,4989 X 1 5,2241X 2 1,3165 X 3 1,8089 X 1 X 2 7,078 X 1 X 3 4,706 X 2 X 3 6,091X 12 5,12 X 22 3,717 X 32
Usando un diseño central compuesto con cinco puntos centrales. Las variables codificadas son las siguientes: X1
temperatur a (C ) 350 8
X2
presión( psi) 612 20
X3
concentración 0.15 0.03
Hágale al investigador las sugerencias que considere. (310) Consideremos un experimento donde el objetivo es estudiar la relación entre la frecuencia de oscilación de un reloj de cuarzo patrón y las condiciones de humedad y temperatura. En este caso el instrumento ya cuenta con un dispositivo para minimizar los cambios de temperatura, dado que los fabricantes conocen su impacto en la frecuencia de oscilación. Los factores seleccionados son temperatura (T) y humedad (H) y sus niveles de prueba se eligen de acuerdo a las condiciones del laboratorio; en este caso los niveles de temperatura son (22oC, 24oC) y para la humedad (20%, 50%). 316
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
La variable de respuesta es la frecuencia de oscilación (Y). El diseño experimental seleccionado es un factorial completo 22 con punto central que se muestran a continuación. Temperatura (°C) -0,5 0,5 -0,5 0,5 -0,75 0,75 0 0 0 0 0
Prueba 1 2 3 4 5 6 7 8 9 10 11
Humedad (%) -0,5 -0,5 0,5 0,5 0 0 -0,75 0,75 0 0 0
Frecuencia (Hz) 99,706 99,706 99,704 99,702 99,704 99,692 99,715 99,657 99,687 99,689 99,688
En particular en el estudio presentado se muestra cómo evaluar experimentalmente la incertidumbre dada por el fabricante de un equipo para verificar su magnitud en las condiciones del propio laboratorio. Este tipo de estudios podrían llevar a mejoras tanto de los equipos como de las instalaciones del laboratorio, buscando tener un menor impacto de las fuentes de incertidumbre detectadas como las más importantes. (311) En la definición de las variables de estudio de electrodeposición de oro se tuvo en cuenta las condiciones impuestas por el proceso previo de desorción de oro, sobre todo en aquellas que tienen que ver con el electrolito, como la concentración de oro, la concentración de cianuro de sodio e hidróxido de sodio, la conductividad, el pH y la temperatura. Con estas queda definida la referencia base para la selección y rango de las variables de estudio. Entre las variables mencionadas se seleccionaron el potencial aplicado, la concentración de hidróxido de sodio y la Densidad de corriente catódica como las de mayor interés para este estudio, y como variables de respuesta se consideraron la eficiencia de corriente, el consumo de potencia, la cinética de la deposición del oro y su recuperación. Factores
Potencial (Vols) NaOH (g/L) DC (A/cm³) Prueba 1 2 3
Potencial (Vols) -0,5 0,5 -0,5
NaOH (g/L) -0,5 -0,5 0,5
2,5 10 0,025 DC (A/cm³) -0,5 -0,5 -0,5
Niveles
+ 3,5 20 0,075
Consumo energía (Watt-h) 3,43 9,38 4,33
Tiempo (min) 115,0 78,7 108,5 317
Palacios C. Severo 4 5 6 7 8 9 10 11 12 13 14 15 16 17
0,5 -0,5 0,5 -0,5 0,5 -0,75 0,75 0 0 0 0 0 0 0
0,5 -0,5 -0,5 0,5 0,5 0 0 -0,75 0,75 0 0 0 0 0
-0,5 0,5 0,5 0,5 0,5 0 0 0 0 -0,75 0,75 0 0 0
13,94 3,29 9,38 5,73 15,66 7,79 7,64 6,87 7,75 6,70 5,9 6,8 6,9 6,7
76,0 78,9 78,7 173,9 113,2 88,9 87,4 80,3 93,8 80,0 82,1 79,4 79,8 79,6
Se pretende minimizar el tiempo del proceso, de consumo de energía (mayor eficiencia de corriente) y menor cantidad de hidróxido de sodio a fin de optimizar las condiciones por medio de las ecuaciones logradas. Esto redunda en un beneficio económico y practico para la recuperación electroquímica de oro. (312) El reciclado electroquímico de los compuestos de partida en disolución ácido se ha monitorizado por análisis de la DQO (demanda química de oxígeno), cromatografía de placa fina, análisis de CG-MS y por espectroscopia de UV-VIS. El tiempo de cada electrólisis se ha calculado para circular la cantidad teórica de electricidad necesaria para oxidar completamente el sustrato, a partir de las leyes de Faraday, y una concentración de sustrato a tratar de 0,015 M en un volumen de 150 cm3. El tiempo de reacción se ha prolongado para aquellos casos en que se observó un mejor comportamiento de la disminución de la DQO (demanda química de oxígeno) al aumentar la carga eléctrica. El plan experimental escogido para estudiar la influencia de las principales variables de reacción es un diseño factorial completo 23 con ocho barridos experimentales, donde las variables escogidas y sus niveles fueron la temperatura (25 y 40ºC), la concentración de electrolito (50 y 96%) y la densidad de corriente (500 y 1000 A/m2). Factores X1: Temperatura (°C) X2: Concentración (%) X3: DC (A/m²) Prueba 1 2 318
Temperatura (°C) -0,5 0,5
25 50 500
Niveles
Concentración (%) -0,5 -0,5
+ 40 96 1000
DC (A/m²) 0 0
DQO 32487 725
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 3 4 5 6 7 8 9 10 11 12
-0,5 0,5 -0,75 0,75 0 0 0 0 0 0
0,5 0,5 0 0 -0,75 0,75 0 0 0 0
0 0 -0,5 -0,5 +0,5 +0,5 -0,5 +0,5 -0,5 +0,5
3075 2852 2775 6525 867 4425 6320 897 4560 6871
La tecnología propuesta se presenta como una técnica universal para degradar compuestos nitratados aromáticos en contra de la biodegradación, en la que las especies microbianas encargadas de degradar son específicas para cada contaminante concreto y mucho más versátil y cómoda de escalar y diseñar a nivel industrial que tecnologías basadas en sistemas fotocalíticos. Del estudio experimental de la degradación de los sustratos de partida se realizó en base al diseño de experimentos detallados en la tabla adjunta. La influencia de las variables tenidas en cuenta, temperatura, densidad de corriente y concentración de electrolito, así como las interacciones entre ellas, se han estudiado estadística y comparativamente. Se pide demostrar la influencia de dichos factores (313) El propósito de este estudio fue evaluar la remoción de sólidos totales, presentes en la vinaza (destilado del alcohol), mediante procesos de electrocoagulación-electroflotación utilizando electrodos de aluminio y como variables de operación pH inicial, concentración de electrolito y densidad de corriente. Las variables evaluadas fueron densidad de corriente (DC), pH inicial y concentración de NaCl como soporte electrolítico, todas las variables en dos niveles. Los niveles usados para cada variable fueron: DC 20, 40 y 60 mA/cm2; pH 4, 7 y 9; [NaCl] 0, 2000 y 4000 ppm. Factores X1: DC (mA/cm²) X2: pH X3: [NaOH] (ppm) Prueba 1 2 3 4 5 6 7
DC (mA/cm²) -0,5 0,5 -0,5 0,5 -0,5 0,5 -0,5
pH -0,5 -0,5 0,5 0,5 -0,5 -0,5 0,5
20 4 0 [NaOH] (ppm) -0,5 -0,5 -0,5 -0,5 0,5 0,5 0,5
Niveles 0 40 7 2000
Al (g) -0,5 -0,5 -0,5 -0,5 -0,5 -0,5 -0,5
+ 60 9 4000 % Sólidos totales Clarificado Espuma 19,81 22,73 20,95 23,49 22,59 24,00 22,09 23,77 21,73 22,77 15,05 17,25 14,56 17,92 319
Palacios C. Severo 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
0,5 -0,5 0,5 -0,5 0,5 -0,5 0,5 -0,5 0,5 -0,75 0,75 0 0 0 0 0 0 0 0
0,5 -0,5 -0,5 0,5 0,5 -0,5 -0,5 0,5 0,5 0 0 -0,75 0,75 0 0 0 0 0 0
0,5 -0,5 -0,5 -0,5 -0,5 0,5 0,5 0,5 0,5 0 0 0 0 -0,75 0,75 0 0 0 0
-0,5 0,5 0,5 0,5 0,5 0,5 0,5 0,5 0,5 0 0 0 0 0 0 -0,75 0,75 0 0
15,23 22,00 16,88 20,16 21,01 22,15 23,42 18,96 17,87 12,01 19,01 13,5 15,7 12,6 14,8 15,6 17,2 15,7 15,8
18,69 23,12 16,80 19,15 18,15 18,75 19,21 17,65 15,23 12,54 17,25 13,57 14,23 14,78 16,75 14,89 19,24 14,7 14,9
Que factor influye en el mayor desprendimiento de aluminio al desarrollar la electrocoagulación-electroflotación. En que región del pH ocurre mejor el proceso. (314) La investigación se desarrolló con las aguas residuales de una industria láctea de la región. Se tomaron muestras tanto del tanque de descargas, como del tanque de homogeneización; este último toma las aguas del tanque de descarga de las aguas residuales de la empresa y las mezcla. A éstas se le analizaron: pH, DQO, conductividad eléctrica, grasas y aceites. Los análisis se realizaron el mismo día del muestreo; de acuerdo con los resultados, se decidió que las muestras de agua para la investigación serían recolectadas sólo del tanque de homogenización, por ser éste el más representativo en las características fisicoquímicas del agua residual láctea. La experimentación se llevó a cabo en un sistema para electrólisis. Este sistema opera como reactor discontinuo a escala prototipo, con capacidad para tratar dos litros de aguas residuales. Consta de una celda electrolítica de dos litros en la que están sumergidos los electrodos; estos electrodos son placas rectangulares metálicas de hierro y aluminio, dispuestas en paralelo y conectadas a una fuente de voltaje de corriente continua que proporciona la corriente eléctrica requerida para la electrocoagulación. Factores
X1: pH X2: DC (A/m²) X3: tiempo (min) 320
5 32,43 5
Niveles 0 7 37,83 10
+ 8 43,23 15
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Prueba 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
pH -0,5 0,5 -0,5 0,5 -0,5 0,5 -0,5 0,5 -0,75 0,75 0 0 0 0 0 0 0
DC (A/m²) -0,5 -0,5 0,5 0,5 -0,5 -0,5 0,5 0,5 0 0 -0,75 0,75 0 0 0 0 0
tiempo (min) -0,5 -0,5 -0,5 -0,5 0,5 0,5 0,5 0,5 0 0 0 0 -0,75 0,75 0 0 0
DQO (%) 75,73 62,36 46,55 93,99 70,83 51,44 77,29 93,99 43,88 45,79 42,15 44,26 47,25 48,26 47,62 48,01 48,06
La electrocoagulación se vislumbra como un tratamiento eficiente para la remoción de contaminantes en las aguas residuales industriales, específicamente en el caso de la industria láctea como se muestra en esta investigación. Los tres factores bajo estudio (pH, densidad de corriente y tiempo) tienen efecto significativo sobre la remoción de DQO. El diseño de tres factores es bastante ajustado a los datos. En particular, si se tienen niveles óptimos del estudio para pH, tiempo y densidad de corriente. (315) La planificación de los experimentos se realizó aplicando el diseño experimental factorial 2n; se analizó la influencia de la temperatura, la relación líquido/sólido y tiempo en la depuración de especies metálicas de efluentes, manteniendo fija la velocidad de agitación. Las variables de respuesta consideradas fueron: porcentaje de extracción de especies metálicas (E) y selectividad (S). Esta última, se determinó como la relación entre la recuperación de un componente dado y el grado de dilución del mineral. La extracción de Ni, Co, Fe y Mn como residuo de la depuración de efluentes. Las condiciones experimentales y niveles de las variables se muestran en la tabla. Factores X1: Temperatura (°) X2: tiempo (h) X3: Líquido/Sólido (L:S)
30 1 8
Niveles 0 45 2 10
+ 60 3 12
Condiciones fijas del experimento: Velocidad de agitación 600 rpm; pH 4,06. 321
Palacios C. Severo
Los modelos que regulan el proceso son:
YNi 72,2433 6,4475 X 1 4,1325 X 2 0,0625 X 3 2,765 X 1 X 2
YCo 81,0333 3,58 X 1 2,255 X 2 0,3425 X 3 2,165 X 1 X 2
R ² 87 ,9058
R ² 96,5456
YFe 71,36 6,22625 X 1 5,24125 X 2 17,0613 X 3 1,51625 X 1 X 2 1,61125 X 2 X 3
YMn 70,2356 6,5 X 1 4,6675 X 2 0,4925 X 3 3,2425 X 1 X 2
R ² 90,0524
R ² 95,9567
Elabore un diseño experimental que satisfaga la depuración del efluente (316) Los residuos sólidos de la lixiviación o colas constituyen un gran problema para el ecosistema de la región industrial; su tratamiento, disposición y manejo son objeto de estudios con el fin de encontrar alternativas para minimizar los impactos negativos al medio ambiente. Una cuestión de interés lo constituye la recuperación de plata y el cobre contenidos en las colas residuales, las cuales son consideradas un mineral de baja ley. Con el objetivo de recuperar especies metálicas de las colas de los procesos de lixiviación, ya sean las resultantes del proceso ácido o del proceso amoniacal, se han realizado estudios de biolixiviación y lixiviación química con ácidos orgánicos producidos por los microorganismos en sus procesos metabólicos. (317) En la tabla aparece la matriz experimental correspondiente al plan 23, y un experimento en el nivel central. Con este diseño de experimento se obtuvo el comportamiento de las variables de respuesta Selectividad y Extracción de Ag y Cu. La selectividad se consideró como la relación entre la recuperación de un componente dado y el grado de disolución total del mineral. En todos los experimentos se mantuvieron fijos los parámetros siguientes: relación líquido: sólido: L/S=12/1 cm3 de solución/g de cola; velocidad de agitación: 630 rpm; tamaño de partículas (0,149+0,074) mm. Se realizó el estudio del comportamiento cinético de la disolución del Ag y Cu. Las muestras de licor de lixiviación se colectaron a determinados intervalos de tiempo, se filtraron y analizaron por espectroscopia de absorción atómica. Factores X1: Temperatura (°) X2: tiempo (h) X3: Líquido/Sólido (L:S) Prueba 1 2 3 4 5 322
T (°) -0,5 0,5 -0,5 0,5 -0,5
t (h) -0,5 -0,5 0,5 0,5 -0,5
30 1 1 L/S (cm³/g) -0,5 -0,5 -0,5 -0,5 0,5
Niveles 0 45 3 5
+ 60 5 9
% Extracción Ag Cu 62,96 77,38 71,60 80,53 69,07 77,93 82,40 87,39 64,24 77,58
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 6 7 8 9 10 11 12 13 14 15 16 17
0,5 -0,5 0,5 -0,75 0,75 0 0 0 0 0 0 0
-0,5 0,5 0,5 0 0 -0,75 0,75 0 0 0 0 0
0,5 0,5 0,5 0 0 0 0 -0,75 0,75 0 0 0
70,45 63,72 87,12 78,63 76,35 77,25 79,56 77,95 78,45 79,36 79,46 79,58
80,09 77,39 90,91 80,10 85,26 89,01 89,90 87,54 88,65 89,74 89,87 89,95
(318) Se controlaron 3 variables que permitieron conocer las condiciones óptimas del reactor para obtener altos porcentajes de descontaminación y realizar el escalamiento del reactor a nivel industrial. Las variables escogidas para el estudio fueron: Factores X1: [H2O2] (ml/L) X2: Volumen a tratar (L) X3: [TiO2] (mg/L) Prueba 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
[H2O2] (ml/L) -0,5 0,5 -0,5 0,5 -0,5 0,5 -0,5 0,5 -0,75 0,75 0 0 0 0 0 0 0
Volumen (L) -0,5 -0,5 0,5 0,5 -0,5 -0,5 0,5 0,5 0 0 -0,75 0,75 0 0 0 0 0
[TiO2] (mg/L) -0,5 -0,5 -0,5 -0,5 0,5 0,5 0,5 0,5 0 0 0 0 -0,75 0,75 0 0 0
0 4 0
Niveles 0 1 8 100
Radiación (W/m²) 36,5 44,5 18,0 44,83 26,03 61,83 52,83 35,41 40,17 50,83 34,17 56,25 57,2 56,3 55,7 55,9 55,2
+ 2 12 200 pH 3,85 3,91 5,77 5,41 3,72 5,73 8,43 5,12 4,24 4,2 4,12 4,25 4,72 3,98 4,25 4,26 4,28
Degradación (%) 23,52 46,19 7,39 33,03 43,34 31,87 14,8 6,62 16,8 19,8 14,84 18,36 22,15 21,85 18,25 18,92 18,75
Para el estudio de estas variables se realizaron una serie de experimentos donde la variable de respuesta fue el porcentaje de degradación medido como el porcentaje de reducción en la DQO. Del análisis de los datos obtenga el ANAVA, estime la respuesta óptima, además de la superficie de respuesta, que permiten obtener un modelo estadístico que describe el comportamiento del sistema de fotodegradación respecto a las variables experimentales estudiadas y que permitan establecer el grado de confiabilidad de los datos obtenidos. 323
Palacios C. Severo
(319) Se seleccionaron modelos lineales del tipo 2n, en los que n representa el número de variables a estudiar. Para un diseño experimental con 3 variables (pH, dosis de coagulante y floculante), el número de experimentos a realizar es igual a 8. En la tabla se especifica los niveles de cada experimento para una pareja coagulante-floculante determinada. Como se observa en esta tabla los valores probados para el pH son 6 y 9, las dosis de coagulante fueron 20 y 100 mg/L y las del floculante de 0,1 y 1,0 mg/L. Prueba 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Floculante (mg/L) -0,5 0,5 -0,5 0,5 -0,5 0,5 -0,5 0,5 -0,75 0,75 0 0 0 0 0 0 0
Coagulante (mg/L) -0,5 -0,5 0,5 0,5 -0,5 -0,5 0,5 0,5 0 0 -0,75 0,75 0 0 0 0 0
pH -0,5 -0,5 -0,5 -0,5 0,5 0,5 0,5 0,5 0 0 0 0 -0,75 0,75 0 0 0
Concentración residual Color DQO 47,0 84,5 45 75,0 13 60,5 22,5 55,5 188,5 105,5 180,5 138,5 40,5 82,5 40,5 42,5 35,46 36,89 33,25 42,15 36,87 45,24 39,48 46,78 42,6 44,7 45,4 46,8 42,1 47,8 43,6 47,9 42,9 48,0
Debido a la buena calidad del efluente obtenido bajo las condiciones óptimas determine el modelo de remoción de los parámetros y, con el fin de disminuir el volumen de lodos y los costos del proceso, utilice dicho modelos para realizar un análisis de sensibilidad de respuesta con respecto a la variación de dosis para poder reducir la cantidad de coagulante a aplicar, de tal manera de conservar niveles de remoción aceptables para los derivados.
324
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
§7 SUPERFICIE DE RESPUESTA En estadística, lo que desaparece detrás de los números es la muerte. Günter Grass
I.
INTRODUCCIÓN
La metodología de superficie de respuesta es un conjunto de técnicas
matemáticas y estadísticas utilizadas para modelar y analizar problemas en los que una variable de interés es influenciada por otras. El objetivo es optimizar las variables de interés. Esto se logra al determinar las condiciones óptimas de operación del sistema. II. SUPERFICIE DE RESPUESTA La relación Y=f(X1, X2,…, Xk), entre Y y los niveles de los k factores representa una superficie. Con k factores la superficie está en k+1 dimensiones. Por ejemplo cuando se tiene Y=f(X1) la superficie esta en dos dimensiones como se muestra en la superficie de respuesta lineal, mientras que si tenemos Y=f(X1, X2) la superficie está en tres dimensiones, esto se observa en la superficie de respuesta. Superficie de Respuesta Estimada Y 0.7-0.85 0.85-1.0 1.0-1.15 1.15-1.3 1.3-1.45 1.45-1.6 1.6-1.75 1.75-1.9 1.9-2.05 2.05-2.2 2.2-2.35
2.2 1.9
Y
1.6 1.3 1 0.7 0
2
4
X1
Superficie respuesta lineal
6
8
10
0.26 0.3 0.18 0.22 0.1 0.14
X2
Superficie respuesta espacial 325
Palacios C. Severo
Gráfica de contorno La grafica de contornos facilita la visualización de la forma de una superficie de respuesta de tres dimensiones. En esta las curvas de los valores iguales de respuesta se grafican en un plano donde los ejes coordenados representan los niveles de los factores. Cada curva representa un valor específico de la altura de la superficie es decir un valor especifico de Y. Esto se muestra en el grafico de contornos. Esta grafica nos ayuda a enfocar nuestra atención en los niveles de los factores a los cuales ocurre un cambio en la altura de la superficie. Región experimental La región experimental especifica la región de los valores para los niveles de los factores. Esto se puede hacer empleando los niveles actuales de operación para cada factor, si se desea explorar el vecindario se incrementa y decrece el valor del nivel en una cantidad determinada. III. POLINOMIO DE PRIMER ORDEN Generalmente se desconoce la relación entre la respuesta y las variables independientes, por ello requieren un modelo que aproxime la relación funcional entre Y y las variables independientes. Este modelo provee las bases para un nuevo experimento que nos lleva hacia un nuevo modelo y el ciclo se repite. Si la respuesta se describe adecuadamente por una función lineal de las variables independientes se utiliza el modelo de primer orden. Y Ao A1 X 1 A2 X 2 Ak X k Contornos de la Superficie de Respuesta Estimada Y
0.3 0.26
X2
0.22 0.18 0.14 0.1 0
2
4
6 X1
8
Grafico contornos 326
10
0.7-0.85 0.85-1.0 1.0-1.15 1.15-1.3 1.3-1.45 1.45-1.6 1.6-1.75 1.75-1.9 1.9-2.05 2.05-2.2 2.2-2.35
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Los parámetros del modelo se estiman mediante el método de mínimos cuadrados. Una vez que se tiene los estimadores se sustituyen en la ecuación y obtenemos el modelo ajustado. Y Ao A1 X 1 A2 X 2 Ak X k
Este modelo se utiliza cuando queremos estudiar el comportamiento de las variables de respuesta únicamente en la región y cuando no conocemos la forma de la superficie. IV. PRUEBA DE SIGNIFICANCÍA Para estimar los coeficientes se requieren N>k+1 valores de respuesta Y. El análisis de los datos de las corridas se presenta en una tabla de análisis de varianza. La tabla presenta las diferentes fuentes de variación que contribuyen a la variación total de los datos. La variación total recibe el nombre de la Suma de Cuadrados Total SC, se calcula de la siguiente manera:
SC Yij Y
2
Donde Yij
es el valor observado de la ij-ésima corrida.
La suma de cuadrados se compone por la suma de cuadrados debido a la regresión y la suma de cuadrados no toma en cuenta el modelo ajustado. La formula de la suma de cuadrados debido a la regresión es.
SC
regresión
Y Y c
2
La suma de cuadrado error, que corresponde a la no tomada en cuenta, se calcula de la siguiente manera.
SC
error
Y Y ij
c
2
En la tabla se observa un análisis de varianza, en ella p representa el número de términos del modelo ajustado 327
Palacios C. Severo Tabla 6.103 Análisis de varianza Fuente SC Gl CM Regresión SCregresión p-1 SCR/p-1 Error SCerror N-p SCE/N-p Total SCtotal N-1
La prueba de significancía de la ecuación de regresión ajustada tiene la siguiente hipótesis nula Ho: Todas las As (excluyendo Ao) son cero contra la alternativa HA: al menos una de las As (excluyendo Ao) es diferente de cero. La prueba supone que el error se comporta normalmente, en ésta se utiliza la prueba estadística F, el cual se calcula. SCregresión F
p 1 SCerror Np
Se compara con una F de tabla (95 ó 99%), si F calculada excede este valor la hipótesis nula se rechaza con un nivel de confianza de γ. Esto significa que la variación explicada por el modelo es significativamente mayor que la variación inexplicable. Además de esta prueba se puede hacer un análisis de ajuste del modelo con la R² que es la proporción total de la variación de las Ys con respecto a la media que se puede explicar con la ecuación de regresión ajustada. Esta se calcula de la siguiente manera.
R2
SCregresión SCtotal
V. PRUEBA DE FALTA DE AJUSTE La falta de ajuste se presenta por la no linealidad o la curvatura de la superficie de respuesta, ésta no se detecta debido a la exclusión de los términos cuadráticos como Bii X i2 o de los términos de productos cruzados Bijk X i X j X k que se refieren al efecto de la interacción entre los factores. La prueba de falta de ajuste requiere que el diseño del experimento satisfaga: 328
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
1. 2.
El número de los distintos puntos del diseño n, debe exceder el número de términos en el modelo ajustado, es decir n>k+1, y Al menos e réplicas deben recolectar en uno o más puntos del diseño para estimar la varianza del error.
Además, los valores del error aleatorio deben asumir una distribución normal e independiente con una varianza común σ². Al cumplirse las condiciones anteriores la suma de cuadrados del error se compone de dos fuentes de variación. La primera es la falta de ajuste del modelo ajustado (por la exclusión del término de mayor orden) y la segunda es la variación del error puro. Para calcularlas necesitamos la suma de cuadrados calculada de las replicas que recibe el nombre de error puro de la suma de cuadrados y sustraer de la suma de cuadrados del error éste para obtener la suma de cuadrados de la falta de ajuste. SCerrorpuro Yij Y j
2
Donde Yij
es la i-ésima observación del j-ésimo punto del diseño
SC faltaajuste SCerror SCerrorpuro SC faltaajuste ri Y Y i
2
La prueba adecuada del modelo ajustado es:
SC faltaajuste F
n p SCerrorpuro N n
La hipótesis de suficiencia de ajuste con un nivel γ de significancía se rechaza cuando el valor calculado del estadístico es mayor a F tabla. Cuando F calculada no es mayor al cuadrado medio residual es utilizado para estimar σ² y también se usa para probar la significan cía del modelo ajustado. 329
Palacios C. Severo
Cuando la hipótesis de suficiencia de ajuste se rechaza, se debe de elevar el grado del modelo aumentando términos de productos cruzados y/o términos de mayor grado en X1, X2, … , Xk. Si se quieren puntos adicionales para estimar todos los coeficientes éstos se añaden. Se colocan los datos y se vuelve a hacer el análisis. Si no se rechaza la hipótesis podemos inferir que la superficie es lineal. Una vez que se tiene la ecuación y se ha comprobado el ajuste se buscan niveles que mejoren los valores de respuesta. VI. MÁXIMA PENDIENTE ASCENDENTE Frecuentemente la estimación inicial de las condiciones de operación óptima está alejada del óptimo real, en este caso se desea moverse rápidamente a la vecindad del óptimo. El método de máxima pendiente ascendente es un procedimiento para recorrer secuencialmente la trayectoria de la máxima pendiente, que nos lleva en dirección del máximo aumento de la respuesta. Cuando se desea la minimización se habla de la mínima pendiente de descenso. La dirección de ascenso máximo es en la que Y aumenta más rápido, ésta es paralela a la normal de la superficie respuesta ajustada. Los incrementos a lo largo de la trayectoria son proporcionales a los coeficientes de regresión A1, A2, A3. Los experimentos se llevan a cabo hasta que deje de observarse un incremento en la respuesta, entonces se ajusta un nuevo modelo de primer orden con el que se determina una nueva trayectoria y se continúa con el procedimiento. Finalmente, se consigue llegar a la cercanía del óptimo, esto ocurre cuando existe falta de ajuste del modelo de primer orden. Determinar trayectoria de máxima pendiente ascendente Supongamos que el punto X1=X2=…= Xk=0 1.
Se elige un tamaño de incremento en una de las variables del proceso, digamos ∆X j, usualmente se elige la variable de la que más se sabe, o la que tiene el mayor coeficiente de regresión. 2. El tamaño de incremento en las otras variables es A X i i Aj X j 3. Se convierte ∆X i de variable codificada a variable natural 330
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Ejemplo 7.91 Un investigador desea determinar las condiciones de operación que maximicen el rendimiento de una reacción. Dos variables controlables influyen en éste: tiempo y temperatura de reacción. Actualmente el proceso opera con un tiempo de reacción de 35 minutos y una temperatura de 155 °F, lo que produce un rendimiento del 40%. El investigador decide que la región de exploración sea de 30 a 40 minutos y 150 a 160 °F. En la tabla se muestran los datos, se utiliza un diseño factorial 2² aumentado en cinco puntos centrales. Las observaciones centrales sirven para estimar el error experimental y permiten probar la adecuación del modelo de primer orden. Variables codificadas X1 X2 + + + + 0 0 0 0 0 0 0 0 0 0
Variables naturales t T Y 30 150 39,3 40 150 40,0 30 160 40,9 40 160 41,5 35 155 40,3 35 155 40,5 35 155 40,7 35 155 40,2 35 155 40,6
Por método de mínimos cuadrados se obtiene: Y 40,44 0,755 X 1 0,325 X 2
En la tabla se muestra el análisis de varianza, donde se observa que F de regresión es significativa al 99% Tabla 7.104 Análisis de varianza para el modelo de primer orden Fuente SC Gl CM Fo Ft(95%) Regresión 2,825 2 1,4125 32,84 > 18,00 Residual 0,1772 6 Falta ajuste (0,0052) 2 0,0026 0,06 < 18,00 Error puro (0,1720) 4 0,0430 Total 3,0022 8 R² = 94,0976%
El modelo indica que hay que trasladarse 0,775 unidades en dirección de X1 por cada 0,325 unidades en dirección de X 2. Sabemos que la trayectoria pasa por el punto (X1=0, X2=0) y tiene pendiente 0,325/0,775. En el ejemplo se decide usar 5 minutos como incremento en el tiempo de reacción lo que equivale a la variable codificada ∆X1=1. 331
Palacios C. Severo
Los incrementos a lo largo de la trayectoria son: X 1 1 y X 2 (0,325 / 0,755) 0,42
El investigador calcula puntos a lo largo de esta trayectoria y observa el rendimiento en cada punto hasta notar un decremento en la respuesta. Los resultados aparecen la siguiente tabla. Los incrementos de muestran tanto para las variables codificadas como para las naturales, esto es porque las codificadas son más fáciles de manejar matemáticamente y las naturales son las que utilizamos para llevar a cabo el proceso.
incremento Origen ∆ Origen + ∆ Origen + 2∆ Origen + 3∆ Origen + 4∆ Origen + 5∆ Origen + 6∆ Origen + 7∆ Origen + 8∆ Origen + 9∆ Origen +1o∆ Origen + 11∆ Origen + 12∆
Tabla 7.105 Pendiente ascendente Variable codificada Variable natural X1 X2 t T 0 0 35 155 1,00 0,42 5 2 1,00 0,42 40 157 2,00 0,84 45 159 3,00 1,26 50 161 4,00 1,68 55 163 5,00 2,10 60 165 6,00 2,52 65 167 7,00 2,94 70 169 8,00 3,36 75 171 9,00 3,78 80 173 10,00 4,23 85 175 11,00 4,62 90 177 12,00 5,04 95 179
Y 41,00 42,90 47,10 49,70 53,80 59,90 65,00 70,40 77,60 80,30 76,20 75,10
Se observa un incremento en la respuesta hasta el décimo incremento, a partir del decimoprimero se produce un decaimiento en el rendimiento. Por lo tanto se debe ajustar otro modelo de primer orden en la cercanía del punto (t=85, T=175) Se ajusta un nuevo modelo de primer orden alrededor del punto (t=85, T=175). La región de exploración para t es 80 a 90 y para T es 170 a 180. Por lo tanto las variables codificadas son: X 1 (t 85) / 5 X 2 (T 175) / 5
Nuevamente se utiliza un diseño 2² con cinco pruebas centrales, los datos se adjuntan en la siguiente tabla. 332
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Variables codificadas X1 X2 + + + + 0 0 0 0 0 0 0 0 0 0
Variables naturales t T 80 170 90 170 80 180 90 180 85 175 85 175 85 175 85 175 85 175
Y 76,5 77,0 78,0 79,5 79,9 80,3 80,8 79,9 79,8
El modelo de primer orden ajustado es: Y 79,97 1,00 X 1 0,50 X 2
En la tabla se muestra el análisis de varianza. Tabla 7.106 Análisis de varianza para el modelo de primer orden Fuente SC Gl CM Fo Ft(95%) Regresión 5,00 2 2,50 47,16 > 18,00 Residual 11,12 6 Falta ajuste (10,908) 2 5,454 102,91 > 18,00 Error puro (0,212) 4 0,053 Total 16,1200 8 R² = 31,01%
El resultado de la prueba de falta de ajuste implica que el modelo de primer orden no es una aproximación adecuada, por lo que se trata de una superficie con curvatura y logramos llegar a la cercanía del óptimo. VII. POLINOMIO DE SEGUNDO ORDEN El modelo de segundo orden es: Y Ao Ai X i Aii X i2 Aij X i X j
En éste caso los Ai son los coeficientes de regresión para el término de primer orden, los Aii son los coeficiente para los términos cuadráticos, los Aij son los coeficientes para los términos con interacciones y ε es el término del error aleatorio. Los términos cuadráticos y las interacciones son de segundo orden. El número de términos en la ecuación esta dado por p=(k+1)(k+2)/2 Los parámetros del modelo se estiman mediante el modelo de mínimos cuadrados. Una vez que se tienen los estimadores se sustituyen en la 333
Palacios C. Severo
ecuación y obtenemos el modelo ajustado con valore óptimos de respuesta. Y Ao Ai X i Aii X i2 Aij X i X j
La significancía de los coeficientes estimados y el ajuste del modelo se prueban con la estadística F. Una vez verificado que el modelo tiene suficiente ajuste y que los coeficientes son significativos, se procede a localizar las coordenadas del punto estacionario y se lleva a cabo un análisis más detallado del sistema de respuestas. Punto estacionario Suponiendo que se desea maximizar la respuesta, el máximo, si es que existe, será el conjunto X1, X2, …, Xk tal que las derivadas parciales Y Y Y ... 0 X 1 X 2 X k
Dichos puntos X1,o, X2,0, …, Xk,0 se denominan puntos estacionarios. El punto estacionario puede ser: a) b) c)
Un punto de máxima respuesta Un punto de mínima respuesta Un punto silla b) Pendiente ascendente
a) Pendiente descendente
55
X2
50 45 40
60
44.0-47.0 47.0-50.0 50.0-53.0 53.0-56.0 56.0-59.0 59.0-62.0 62.0-65.0 65.0-68.0 68.0-71.0 71.0-74.0 74.0-77.0
Y
55 50
X2
Y
60
45 40
130.0-154.0 154.0-178.0 178.0-202.0 202.0-226.0 226.0-250.0 250.0-274.0 274.0-298.0 298.0-322.0 322.0-346.0 346.0-370.0 370.0-394.0
35
35
30
30 5
6
7
8
9
5
10
6
7
8
9
10
X1
X1 d) Silla de montar Y
12
X2
11 10 9 8
4
6
8
10
12
86.0-87.0 87.0-88.0 88.0-89.0 89.0-90.0 90.0-91.0 91.0-92.0 92.0-93.0 93.0-94.0 94.0-95.0 95.0-96.0 96.0-97.0
14
X1
Grafica de punto estacionario de superficie respuesta de segundo orden ajustado a) Máxima b) Mínima c) Silla de montar 334
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Podemos obtener el punto estacionario usando la notación matricial para el modelo de segundo orden. Y Ao aX aBX X1 X X 2 M X K
A1 A a 2 M Ak
y
A11 A / 2 A 21 M Ak 1 / 2
A12 / 2 A22
k k
Ak 2 / 2 k
A1k / 2 A2 k / 2 Akk
En otras palabras, a es el vector (kx1) de coeficientes de regresión de primer orden, y A es una matriz simétrica (kxk) cuya diagonal principal está formada por los coeficientes de los términos cuadráticos puros (Aii), mientras que los elementos fuera de ésta corresponden a un medio del valor de los coeficientes cuadráticos mixtos (Aij, i≠j). La derivada de Y con respecto al vector X igualando a cero es: Y a 2 Ax 0 X
El punto estacionario es la solución de la ecuación, es decir: Xo
1 1 A a 2
Sustituyendo ésta en la ecuación matricial para el modelo de segundo orden tenemos: Yo Ao
1 X oa 2
VIII. CARACTERIZACIÓN DE SUPERFICIE DE RESPUESTA Habiendo encontrado el punto estacionario es necesario caracterizar la superficie de respuesta es decir determinar si se trata de un punto de respuesta máximo, mínimo o silla. La forma directa de hacer esto es mediante la gráfica de contornos del modelo ajustados, sin embargo es útil un análisis más formal. Como una alternativa se puede expresar la forma de la superficie respuesta usando un nuevo conjunto de variables Z1, Z2, …, Zk cuyos ejes representan los ejes principales de la superficie de respuesta, los cua335
Palacios C. Severo
les se interceptan en el punto estacionario como se observa. Esto da por resultado el modelo ajustado. Y Yo 1 Z 12 2 Z 22 ... k Z k2
Donde: Zi λi
Son las variables independientes transformadas, y Son constantes
Dicha ecuación se llama forma canónica. Las λi son los valores propios y se obtienen de la matriz A.
60 70 80 90 óptimo
Superficie de respuesta en forma canónica
La naturaleza de la superficie de respuesta puede determinarse a partir del punto estacionario y del signo y magnitud de las λ i. Si todas las λi son positivas, entonces es un punto de respuesta mínima, si todas las λi son negativas, entonces es un punto de respuesta máxima y si las λ i tienen signos distintos entonces es un punto de respuesta silla. Ajuste de superficie de respuesta El ajuste y análisis de una superficie de respuesta se facilita con la elección apropiada de un diseño experimental. Un diseño es el conjunto específico de combinaciones de los niveles de las k variables que se utilizan al llevar a cabo el experimento. Ajuste del modelo de primer orden Una clase única de diseño que minimiza la varianza de los coeficientes de regresión son los diseños ortogonales de primer orden. Por ortogo336
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
nal se entiende que los elementos fuera de la diagonal de la matriz son iguales a cero, lo cual implica que los productos cruzados de la columna de la matriz x son igual a cero. Ajuste del modelo de segundo orden Un diseño experimental para ajustar un modelo de segundo orden debe tener al menos tres niveles de cada factor (-1, 0 +1). Así como el diseño de primer orden se desea la ortogonalidad, en éste se desea que sea un diseño rotable. Se dice que un diseño es rotable cuando la varianza de la respuesta en algún punto es función solo de la distancia del punto al centro y no es una función de la dirección. La rotabilidad es una propiedad importante, dado que la finalidad de la superficie de respuesta es optimizar y desconocemos la localización del óptimo, tiene sentido utilizar un diseño que proporcione estimaciones precisas en todas las direcciones. Ejemplo 7.92 La conversión de un proceso factorial con superficies de respuesta lineal se ilustran con dos factores, presión y temperatura. El diseño de tratamientos fue un factorial 22 con rango de temperatura de 130 y 160°C y presión de 325 y 475 psi como factores principales, además se realizaron cuatro pruebas centrales a temperatura de 145°C y presión de 400 psi para proporcionar una estimación de la varianza del error experimental y evaluar si el modelo de respuesta lineal es adecuado. Las combinaciones de tratamientos y el porcentaje de conversión se muestran en la tabla 7.107. Tabla 7.107 Conversión de un proceso con temperatura y presión Temperatura Presión X1 X2 % conversión (°C) (Psi) 130 325 8 + 160 325 24 + 130 475 16 + + 160 475 32 0 0 145 400 21 0 0 145 400 23 0 0 145 400 20 0 0 145 400 24
Niveles de factores codificados Los niveles de factores codificados proporcionan un marco de trabajo uniforme para investigar los efectos de los factores en cualquier con337
Palacios C. Severo
texto experimental, ya que los valores reales de los niveles dependen de los factores específicos en el estudio. Los niveles codificados de los factores de un diseño factorial 2n son: Xi
Vi a b
Donde: Vi a b
Viene a ser el valor real del factor principal Viene a ser el valor promedio del factor principal Viene a ser el salto o rango entre el mínimo nivel y el promedio
Los niveles codificados de temperatura (T) y presión (P) en la tabla 7.107. X1
T 145 15
X2
P 400 75
Estimaciones de las respuestas lineales Las estimaciones de los coeficientes para el modelo de primer orden son: Ao
1 8 24 16 32 20 4
A1
1 8 24 16 32 8 4
A2
1 8 24 16 32 4 4
Las estimaciones de los coeficientes lineales, A1 y A2, es la media de las estimaciones del efecto factorial para una factorial 2n. La varianza del error de las cuatro observaciones centrales del diseño y una estimación del error estándar para las estimaciones de los coeficientes es 2 Yi Yi N 1 N N 1 2
S2 338
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
212 232 202 242 88 3,334 3 12 2
S2
S
S
N 2 S N2
4 3,334 0,91 42
Es importante el hecho de que la varianza del error tenga una estimación adecuada, con réplicas centrales del factorial. Si la varianza de la respuesta depende en alguna forma del nivel de factor, entonces se recomienda la réplica del diseño con las combinaciones a niveles alto y bajo del factor para detectar cualquier variabilidad heterogénea entre las combinaciones del mismo. Las estimaciones de los coeficientes de regresión indican que el incremento de la temperatura o la presión, aumentará el porcentaje de conversión. La ecuación estimada del modelo de primer orden es: Y 20 8 X 1 4 X 2
La interacción entre temperatura y presión TxP mide la falta de ajuste con el modelo lineal y se representa mediante el término A12X1X2 en el modelo cuadrático. La estimación del coeficiente A12 es un medio de la interacción TxP, es decir: A12
1 8 24 16 32 0 4
El error estándar de A12 es 0,91, el mismo que para los coeficientes lineales. La componente de interacción estimada de 0 indica que temperatura y presión son independientes sobre el porcentaje de conversión. Puntos centrales del diseño para curvatura de la superficie Las pruebas centrales del diseño no sólo proporcionan una estimación del error experimental, también proporcionan un mecanismo para medir el grado de curvatura en la región experimental. Sea Y F el promedio de las combinaciones del tratamiento del factorial 22 y Y C el promedio de los puntos centrales; existe evidencia de curvatura en la superficie de respuesta si la respuesta promedio en las coordenadas 339
Palacios C. Severo
del centro del diseño, Y C es mayor o menor que la respuesta promedio en los niveles extremos de los factores, Y F . La diferencia del valor absoluto Y F Y C es una estimación de β11+β22, donde β11 y β22 son los coeficientes de regresión cuadrática. Las medias observadas son YF 20 y Yc 22 , con una diferencia de Y F Y C 2 . El error estándar de la diferencia se estima como 3,334(1 / 4 1 / 4) 1,29 ;
la respuesta lineal parece describir de manera
adecuada la superficie de la zona. En la gráfica de las curvas de nivel para la ecuación de respuesta lineal estimada. Los valores de los contornos ascienden conforme aumentan los niveles de temperatura y presión, las curvas de nivel crecientes indican que puede existir una combinación de temperatura y presión para maximizar la conversión en una dirección perpendicular a las curvas. Pendiente ascendente hacia una respuesta óptima Por último, el investigador querrá determinar la zona de respuesta óptima; para hacerlo, se requiere localizar la región de niveles de los factores que producen las condiciones óptimas. El método de pendiente ascendente es un procedimiento desarrollado para llevar la región experimental de la respuesta variable en una dirección de cambio máximo hacia el óptimo. Con base en la ecuación lineal estimada Y 20 8 X 1 4 X 2 , la trayectoria de mayor pendiente, perpendicular a las curvas de igual respuesta, traslada 4 unidades en la dirección de X 2 por cada 8 unidades en la dirección de X1. De manera equivalente, la trayectoria tiene un movimiento de 4/8 = 0,5 unidades en X2 por cada unidad de movimiento en X1. La trayectoria de mayor pendiente inicia en el centro del diseño con (X1, X2) = (0, 0). En la grafica de curvas de nivel, el centro del diseño para los valores de temperatura y presión es (T, P) = (145, 400). Un cambio de ΔX1 = 1 unidad en la dirección X1 es un cambio de 15°C en la temperatura y ΔX2= 0,5 unidades en la dirección X2 es un cambio de 37,5 psi en la presión. El objetivo es moverse a lo largo de la trayectoria de mayor pendiente hasta que se observe una respuesta máxima. El investigador realizará 340
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
experimentos con las combinaciones de temperatura y presión a lo largo de la trayectoria de mayor pendiente.
Gráfica de curvas de nivel para la respuesta lineal del % de conversión para temperatura (T) y presión (P)
En la tabla 7.108 se muestran, los niveles de temperatura y presión, a partir de (T, P) = (145, 400), puntos centrales del diseño, con cambios de 1 unidad en X1, y de media en X2, en el supuesto de que el investigador desea realizar los cambios relacionados con la modificación de una unidad en X1. Tabla 7.108 Pendiente ascendente de región de respuesta máxima en % de conversión Paso X1 X2 T P 0 0 0 145 400,0 1 1 0,5 160 437,5 2 2 1,0 175 475,0 3 3 1,5 190 512,5 4 4 2,0 205 550,0 . . .
. . .
. . .
. . .
. . .
Conforme el investigador avanza por la trayectoria de la pendiente ascendente, el aumento en la respuesta es menor hasta que observa una disminución real en ella, lo que indicará que la región de respuesta máxima está en la proximidad de esas condiciones de temperatura y presión. En este punto del proceso, se puede diseñar un experimento para estimar una ecuación polinomial cuadrática que aproxime la superficie de respuesta. 341
Palacios C. Severo
IX. DISEÑOS DE SUPERFICIE RESPUESTA CUADRÁTICO Una vez que se identifica la región de respuesta óptima, debe diseñarse un nuevo experimento para caracterizar la superficie de respuesta. En general, la superficie se aproxima por medio de una ecuación cuadrática para determinar la curvatura de la superficie. Los factoriales 2n o sus fracciones son diseños útiles para identificar los efectos significativos y las regiones de respuesta óptima. Sin embargo, en la región de respuesta óptima, estos diseños no proporcionan información suficiente para estimar las ecuaciones de respuesta cuadrática, pues se requieren al menos tres niveles para cada factor y el diseño debe tener 1 2n nn 1 / 2 puntos distintos para estimar los parámetros con un modelo de regresión cuadrática para aproximar la curvatura. Las propiedades de los diseños experimentales convenientes para la estimación de superficies de respuesta incluyen la capacidad para estimar el error experimental y tener en cuenta una prueba de la falta de ajuste del modelo. Los diseños también deben proporcionar estimaciones eficientes de los coeficientes del modelo y predecir las respuestas. En esta sección se estudian varias clases de diseños desarrollados con las propiedades convenientes para la aproximación de la superficie de respuesta de segundo orden. Factoriales 3n para estimar superficies cuadráticas Los factoriales 3n se pueden usar para estimar las ecuaciones polinomiales cuadráticas, pero el número de combinaciones de tratamientos que requieren produce un experimento poco práctico de gran tamaño; pues mientras los diseños 3n con dos factores requieren sólo 9 combinaciones de tratamientos, un diseño con tres factores requiere 27, y uno con cuatro factores requiere 81. Diseños centrales compuestos a los factoriales 3n Box y Wilson (1951) propusieron diseños centrales compuestos, que requieren menos combinaciones de tratamientos que los factoriales 3 n, para estimar las ecuaciones de la superficie de respuesta cuadrática. Los diseños centrales compuestos son diseños de tratamientos factoriales 2n con 2n combinaciones adicionales, llamadas puntos estrella, 342
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
a lo largo de los ejes coordinados de los niveles de factor codificados. Las coordenadas de los puntos estrella de los ejes del factor codificado son (±α, 0, 0, …, 0), (0, ±α, 0, …, 0), . . ., (0, 0, 0, …, ±α). En general, se agregan m réplicas al centro del diseño en las coordenadas (0, 0, …, 0). Los diseños centrales compuestos se usan para aprovechar la experimentación secuencial, el primer paso de la secuencia consiste de una serie de pruebas realizadas a lo largo de la trayectoria de mayor pendiente, como la mostrada en la tabla 7.108 En algún momento, las pruebas conducen hacia un conjunto de niveles de factores que proporciona un máximo aparente en la trayectoria. Por ejemplo, suponiendo que las respuestas en la trayectoria de mayor pendiente son las que se muestran en la grafica de mayor pendiente, con una respuesta máxima de 36 observada en T = 190°C y P = 512,5 psi.
Trayectoria de mayor pendiente y un diseño central compuesto
Como segundo paso en la secuencia, el investigador realiza un nuevo experimento factorial 22, con varias réplicas al centro del diseño (T, P) = (190; 512,5). Si la diferencia Y F Y C calculada en el nuevo experimento indica un alto grado de curvatura en la superficie, el tercer paso en el experimento secuencial consiste en pruebas adicionales del experimento en lo puntos estrella (±α, 0) y (0, ±α), mostradas con cuadros en la grafica de mayor pendiente. Este último conjunto de combinaciones de 343
Palacios C. Severo
tratamientos en los ejes, junto con el factorial 22 y los puntos centrales, constituye el diseño central compuesto como resultado de la experimentación secuencial. Una réplica de un diseño central compuesto consiste de N F 2 n combinaciones de tratamientos del factorial 2n, N 2n combinaciones de tratamientos en los puntos estrella del diseño y m réplicas en el centro para obtener un total de N N F N m observaciones. Las coordenadas en los ejes codificados X1 y X2, para el diseño central compuesto con dos factores se muestra en la tabla 7.108, y la gráfica donde se describe la localización de las coordenadas para los niveles de factores codificados del diseño central compuesto de dos y tres factores. Debido a que cada factor tiene cinco niveles, se puede estimar una ecuación cuadrática a partir de este diseño. Codificado X1 X2 + + + + 0 0 0 0 0 0
Diseño Factorial
Estrella Central
Además, como se vera en la siguiente sección, se puede evaluar cualquier desviación significativa de la aproximación cuadrática. Las N 2 n 2n m unidades experimentales necesarias para el diseño central compuesto con n factores son menos que las requeridas por los factoriales 3n con tres factores o más. Así, los diseños centrales compuestos son más económicos en cuanto al uso de materiales y proporcionan la capacidad de estimar las ecuaciones de respuesta. Se pueden usar fracciones de los diseños 2n con interacciones de orden mayor con alias como base del diseño 2n cuando hay más factores en el estudio. Diseños rotatorios exploratorio de superficie de respuesta Una propiedad deseable al establecer cualquier diseño es la misma precisión para todas las estimaciones de las medias. Sin embargo, la 344
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
precisión de los valores estimados sobre la superficie de respuesta basada en la ecuación de regresión estimada no será constante en toda la región experimental. Una propiedad rotatoria desarrollada para los diseños centrales compuestos requiere que la varianza de los valores estimados sea constante en puntos equidistantes del centro del diseño con coordenadas codificadas (0,0, ..., 0).
Diseños centrales compuestos a) dos factores y b) tres factores
La rotación de un diseño es importante en la exploración de una superficie respuesta porque la precisión de la superficie estimada no depende de la orientación del diseño con respecto a la superficie respuesta real o a la dirección de la búsqueda de las condiciones óptimas. Los factoriales 2n usados como diseño exploratorios para aplicar el método de búsqueda de la mayor pendiente en zonas de respuestas óptimas son diseños rotatorios. Así, la orientación del diseño no dificulta el método de búsqueda de la pendiente ascendente porque algunas respuestas se estiman con menor precisión que otras. El diseño central compuesto es rotatorio estableciendo los valores de los puntos estrella como 2n 1/ 4 , El valor de α para un diseño de dos factores es 41 / 4 2 1,414 , y para un diseño de tres factores 1/ 4 8 1,682 . Si hay rF réplicas del factorial 2n y rα, réplicas de las combinaciones estrella, una forma más general para α es 1/ 4 rF 2 n / r , si se usa un factorial fraccionario 2n-p como base para el diseño central compuesto, entonces rF 2 n p / r . 1/ 4
345
Palacios C. Severo
Ejemplo 7.93 Establecida la trayectoria de mayor pendiente para el estudio de % de conversión en la tabla 7.109 se proporcionó una respuesta máxima en T = 190°C y P = 512,5 psi y debe construirse un diseño central compuesto con centro en (T, P) = (190; 512,5); y que la relación entre las coordenadas del diseño (X1, X2) y los niveles de temperatura y presión (T, P) se conservan como antes, donde un cambio de una unidad en X 1, es 15°C y un cambio de una unidad en X2 es 75 psi. Con 2 , las coordenadas del diseño y la temperatura y presión requeridas serán: Codificado X1 X2 + + + + 0 2 0 2 0 2 0 2 0 0
Original T P 175 437,5 205 437,5 175 587,5 205 587,5 168 512,5 211 512,5 190 406,4 190 618,6 190 512,5
Diseño Factorial
Estrella Central
Punto estacionario en el centro del diseño Como se estableció antes, la varianza de la superficie estimada no es constante para toda la superficie. Box y Hunter (1957) mostraron que el número de puntos centrales en los diseños centrales compuestos rotatorios puede elegirse de manera que proporcione un diseño con precisión uniforme para la superficie estimada de una unidad alrededor de las coordenadas del centro del diseño en la escala codificada. Tabla 7.109 Diseños centrales compuestos rotatorios con precisión uniforme Factores 2 3 4 5 5 6 6 Factor 2n 1 1 1 1 ½ 1 ½ 1,41 1,682 2,00 2,378 2,00 2,828 2,378 N 4 8 16 32 16 64 32 N 4 6 8 10 10 12 12 5 6 7 10 6 15 9 m 13 20 31 52 32 91 53 N F
Su razonamiento fue que el investigador está más interesado en la superficie de respuesta cerca del centro del diseño cuando un punto estacionario de la superficie se localiza cerca del centro; el punto estacionario es un punto de respuesta máxima, mínima o con forma de silla. En la tabla 7.109 se muestran algunos diseños centrales rotatorios compuestos con precisión uniforme. 346
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Los diseños centrales compuestos requieren cinco niveles de cada factor, codificados como - a, - 1, 0, 1, +a. En algunos casos, preparar cinco niveles para algunos factores puede ser difícil, costoso y mucho tiempo. El diseño de cubo con cara centrada es una variación del diseño central compuesto con a = 1 que requiere sólo tres niveles de cada factor. Si se sustituye a = 1 en la tabla 7.109, el diseño de dos factores se convierte en un factorial 32, diseño más atractivo cuando la región de interés tiene forma de cubo producida por este diseño en lugar de la región esférica producida por el diseño central compuesto. El diseño no es rotatorio, pero la ausencia de esta propiedad se compensa por el deseo de poder hacer inferencias cuboidales y por el ahorro en recursos experimentales. El cubo con cara centrada requiere menos corridas en el punto central que el diseño central compuesto para lograr una varianza estable de los valores estimados en la región del diseño, pero debe recordarse que se necesitan corridas réplica en algún punto o puntos del diseño para estimar la varianza del error experimental. Un diseño de cubo con cara centrada para tres factores o más requiere menos combinaciones de tratamientos que los factoriales 3n; entonces, ésta es otra alternativa para los diseños 3 n que requiere menos unidades experimentales. Diseños Box-Behnken, alternativa para los factoriales 3n Box y Behnken (1960) propusieron una clase de diseños de tres niveles para estimar las superficies de respuesta de segundo orden. Los diseños son rotatorios, o casi rotatorios, con menor número de unidades experimentales en comparación con los diseños 3n. Se forman con la combinación de diseños 2n y diseños de bloques incompletos; los detalles de la construcción se encuentran en Box y Draper (1987) y los niveles de factores codificados para las combinaciones de tratamientos necesarios en un diseño para tres factores, donde se presenta un conjunto completo de las combinaciones de tratamientos para un factorial 2n para cada par de factores acompañados por el nivel 0 de los factores restantes. Se incluyen varias réplicas del centro del diseño (0, 0, ..., 0). Estos diseños son esféricos más que cuboidales puesto que los puntos del diseño se encuentran en las orillas de un cubo en lugar de las esquinas como los del diseño de cubo con cara centrada. El diseño de 347
Palacios C. Severo
Box-Behnken sólo debe usarse si no se tiene interés en predecir las respuestas en las esquinas de la región cuboidal. Factor Nivel codificado
A X1 + + + + 0 0 0 0 0 0 0
Factorial 22 para A y B Factorial 22 para A y C Factorial 22 para B y C Central
B X2 + + 0 0 0 0 + + 0 0 0
C X3 0 0 0 0 + + + + 0 0 0
Diseños de bloques incompletos Los diseños de bloques incompletos son útiles para reducir la varianza del error experimental cuando el número de tratamientos es grande o cuando las condiciones experimentales impiden la ejecución de réplicas completas bajo circunstancias constantes. Box y Hunter (1957) presentaron las condiciones de bloques de los diseños de superficie de respuesta de segundo orden, de manera que los efectos de los bloques no afectan las estimaciones de los parámetros para la ecuación de la superficie de respuesta. Mostraron que deben satisfacerse dos condiciones para que los bloques sean ortogonales a las estimaciones de los parámetros de la ecuación de la superficie de respuesta. Sea nb, el número de tratamientos en el b-ésimo bloque; las dos condiciones necesarias son: 1.
Cada bloque debe ser un diseño ortogonal de primer orden. Para cada bloque debe cumplirse la siguiente relación para cada par de variables de diseño x, y x,: nb
X k 1
ik
Xj 0 k
i j 0,1,1,..., n
2. La fracción de la suma de cuadrados total para cada variable de diseño que aporta cada bloque debe ser igual a la fracción de las observaciones totales colocadas en el bloque. Entonces, debe 348
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
cumplirse la siguiente relación entre las variables de diseño y el número de observaciones para cada bloque: nb
X k 1
2 ik
N
XX k 1
2 ik
nb N
i 1,2,..., n
Una estrategia sugerida para los bloques de diseños centrales compuestos coloca los tratamientos NF para el diseño 2n y mF puntos centrales en un bloque, y los N, tratamientos axiales con m, puntos centrales en un segundo bloque. Este arreglo de bloques satisface la primera condición. El diseño rotatorio central compuesto para dos factores dispuestos en dos bloques se muestra en el siguiente cuadro. El primer bloque se compone de NF = 4 combinaciones de tratamientos del factorial de 2n más mF = 2 puntos centrales, y el segundo bloque consiste en N α = 4 combinaciones de tratamientos estrella más mα = 2 puntos centrales. Los cálculos necesarios para evaluar la primera condición de un diseño de bloques ortogonal son las sumas de los productos cruzados entre X1, y X2 en cada bloque. Es sencillo verificar que ΣX1X2 = 0 en ambos bloques. Factor Nivel codificado
A X1 + + +1,414 -1,414 0 0 0 0 0
Bloque I
Bloque II
Central
B X2 + + 0 0 +1,414 -1,414 0 0 0
Para el diseño completo: 12
12
k 1
k 1
X i2k X 22k 8 y tanto para el bloque 1 como el bloque 2: 349
Palacios C. Severo 6
X k 1
6
2 ik
X 22k 4 k 1
El número de observaciones del tratamiento en los bloques 1 y 2 es n1 = n2 = 6 y el número total de observaciones es N = 12, con una razón n1/N = 6/12 = 1/2. La segunda condición, requiere de la razón de las sumas de cuadrados de X1 y X2 en cada bloque para que todo el experimento sea igual a ni/N. Para ambos bloques la razón de la suma de cuadrados es 4/8 = 1/2, que es equivalente a la razón para ni/N, por tanto, el diseño es ortogonal. Para que se satisfaga la segunda condición, debe cumplirse la siguiente relación:
1 p 2 n 1 pF Donde: pα = ma/Nα y pF = mF/NF. Para que el diseño satisfaga las dos condiciones y sea rotatorio 1/ 4 2 n rF / r . No siempre es posible encontrar un diseño que cumpla con exactitud con
S²
Yi ² , Yi N 1 N ( N 1) 2
pero en la práctica, los valores del
número de observaciones del diseño se pueden determinar de forma que se obtengan diseños con bloqueos casi ortogonales y rotatorios. Box y Draper (1987) ofrecen las proporciones relativas de rF y rα necesarias para los diseños rotatorios y bloques ortogonales cuando pα=pF. Para el diseño rotatorio central compuesto, la fracción de observaciones centrales en cada bloque es pα=pF=1/2 y 2 . Al evaluar la condición de rotabilidad y ortogonalidad se tiene:
1 p 1 1 / 2 2 n 2 2 1 1 / 2 1 p F Y
2
350
como lo requiere la rotabilidad.
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Los diseños centrales compuestos rotatorios enumerados en la tabla 7.110 se pueden colocar en diseños de bloques incompletos útiles para obtener diseños centrales compuestos casi ortogonales y rotatorios. El factorial 2n o el factorial fraccionario 2n-p se coloca en uno o más bloques incompletos y las combinaciones de tratamiento axiales se colocan en un bloque separado. En la tabla 7.108 se muestran el número de bloques y el número de puntos centrales sugeridos en cada bloque para el factorial 2n o el factorial fraccionario. Tabla 7.110 Diseño de bloques incompletos para diseños centrales compuestos Número factores 2 3 4 5 5 6 6 Fraccionado 2n 1 1 1 1 ½ 1 ½ NF 4 8 16 32 16 64 32 mF 2 2 2 4 2 2 2 Número bloques 1 2 2 4 1 8 2 a 1,414 1,682 2,00 2,378 2,00 2,828 2,378 Nα 4 6 8 10 10 12 12 mα 2 2 1 1 4 1 4
Reducción del número de puntos de diseño El costo, la dificultad y el tiempo con cierto tipo de experimentos pueden obligar a reducir el tamaño del experimento, pero tal reducción está limitada por el modelo estadístico que estima la superficie de respuesta. La ecuación de la superficie de respuesta de segundo orden para n factores tiene un término constante, n términos lineales, n términos cuadráticos y n(n-1)/2 términos de interacción, con un total de (n+1)(n+2)/2 términos. Así, el número mínimo de puntos de un diseño para estimar la superficie de respuesta de segundo orden es (n+1)(n+2)/2. La mayoría de los diseños se basan en factoriales fraccionarios 2 n-p incrementados con puntos de diseño para estimar los modelos de superficie de respuesta de segundo orden. En muchos casos los diseños se saturan con puntos de diseño con pocas o ninguna réplica y se requiere una estimación independiente del error experimental para probar la eficacia del modelo de la superficie de respuesta, a menos que el diseño tenga réplicas. Además, los diseños saturados no permiten probar la falta de ajuste del modelo hipotético de la superficie de respuesta de segundo orden. Evaluación de los diseños de superficie de respuesta Myers et al. (1992) usaron la predicción de la varianza de la ecuación de la superficie de respuesta de segundo orden para evaluar muchos 351
Palacios C. Severo
de los diseños conocidos de esta superficie, considerando que un diseño era superior si la varianza de los valores pronosticados era menor que la de los otros diseños. Los diseños centrales compuestos fueron superiores en general para superficies esféricas cubiertas por puntos de diseño. Cuando los diseños se restringieron a las regiones cuboidales (a=1), el diseño de cubo con cara centrada formado por el diseño central compuesto, en general, era superior que el diseño de Box-Behnken en la región cuboidal. X.
SUPERFICIE DE RESPUESTA CUADRÁTICA
Cuando se ha identificado la región de respuesta óptima mediante el método de la pendiente ascendente o algún otro método de experimentación, suele ser necesario determinar la superficie de respuesta en esa región de los factores. Con los diseños descritos en la sección anterior, se pueden realizar experimentos y obtener datos para estimar una aproximación cuadrática de la superficie de respuesta. La ecuación de respuesta estimada permitirá al investigador localizar un punto de respuesta estacionario que quizá sea un máximo, un mínimo o un punto de deflexión en la superficie. Un examen de las curvas de nivel indicará qué tan sensible es la variable de respuesta a cada factor y el grado en que los factores afectan a las variables de respuesta. Ejemplo 7.94 Una compañía usaría una nueva herramienta de corte que ofrece un proveedor, éste asegura que la nueva herramienta reducirá los costos de producción porque durará más que el modelo anterior y el costo de reemplazo de la herramienta se reducirá. La vida de una herramienta de corte de metales depende de varias condiciones de operación como la velocidad del torno y la profundidad de corte. Tabla 7.111 Duración de una herramienta, en función de la velocidad del torno y la profundidad de corte como factores de tratamiento, en un diseño central compuesto Codificados Originales Vida de herramienta X1 X2 Velocidad Profundidad + + 600 0,100 154 + 600 0,050 132 + 200 0,100 166 200 0,050 83 0 683 0,075 156 2 0 117 0,075 144 2 400 0,110 166 2 0 352
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 0 0 0 0 0 0 0
400 400 400 400 400 400 400
2
0 0 0 0 0 0
0,040 0,075 0,075 0,075 0,075 0,075 0,075
91 167 175 170 176 156 170
El ingeniero de planta había determinado mediante estudios anteriores que la vida máxima de la herramienta se lograba, para la herramienta actual, con una velocidad de 400 y una profundidad de corte de 0,075. El ingeniero, que deseaba determinar la situación óptima para la nueva herramienta, usó un diseño central compuesto en un experimento para determinar la vida de la nueva herramienta al variar las velocidades del tomo y las profundidades de corte dentro de la región de condiciones de operación óptimas urgentes para la vida máxima de la herramienta. Los datos del experimento se muestran en la tabla 7.111. Ecuación de superficie de respuesta estimada El modelo de la superficie de respuesta de segundo orden se ajusta a los datos mediante los procedimientos de regresión de mínimos cuadrados. La ecuación se puede estimar con un programa de computadora para análisis de regresión. La ecuación de la superficie de respuesta de segundo orden estimado para los datos de la vida de la herramienta de la tabla 7.111 es: Y 169 6,747X1 26,385X2 10,875X12 21,625X22 15,25X1 X2
Sumas de cuadrados para el análisis de regresión La suma de cuadrados en el análisis de varianza para el modelo de regresión se muestra en la tabla 7.112. Las sumas de cuadrados para el modelo de segundo orden completo son: SC R X
1
, X 2 , X 12 , X 22 , X 1 X 2
10,946
Se hace una partición de la suma de cuadrados de regresión en reducciones para el modelo lineal y las componentes cuadráticas del mode-
353
Palacios C. Severo
lo, con el principio de particiones de sumas de cuadrados del modelo reducido y el modelo completo. La partición para las componentes lineales del modelo, X1 y X2, o: SCR X 1 , X 2 5,933 Tabla 7.112 ANAVA para modelo se superficie respuesta cuadrático Fuente SC Gl CM Fo(99%) Regresión 10946 5 2189,2 > 47,18 Lineal 5933 2 2966,5 > 63,93 Cuadrático 5013 3 1671,0 > 36,01 Error 371 8 46,4 Falta de ajuste 111 3 37,0 Error puro 260 5 52,0 Total 11317 13 R² = 96,7217%
Es la suma de cuadrados de la regresión para el modelo reducido de primer orden Y Ao A1 X 1 A2 X 2 . La partición para las componentes cuadráticas es la diferencia entre la suma de cuadrados de regresión para el modelo completo y el modelo reducido, es decir: SC R ( X 2 X 2 X X 1
2
1
2
X1 X 2 )
10946 5933 5013
Se hace una partición de la suma de cuadrados para el error, SC E = 371 en dos partes. La suma de cuadrados para el error puro, SC E(error puro) = 260, con 5 grados de libertad se calcula a partir de las seis réplicas observadas en el centro del diseño con coordenadas de factor (V, D)=( 400; 0,075). Las suma de cuadrados para el error con los 3 grados de libertad restantes, SCE(falta de ajuste) = 111, se pueden atribuir al error en la especificación del modelo de superficie de respuesta. Como los seis puntos centrales del diseño proporcionan una estimación del error experimental puro, la suma de cuadrados designada como falta de ajuste se puede usar para probar la significancía de la falta de ajuste en el modelo cuadrático. Pruebas de hipótesis para el modelo de segundo orden Las hipótesis de interés en el análisis son:
Significancía del modelo completo de segundo orden:
H o : A1 A2 A11 A22 A12 0 354
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Fo
2189,2 42,1 52
Ho se rechaza, ya que Fo > F(95%) = 5,05
Significancía de las componentes lineales para el modelo:
Ho : A1 A2 0 Fo
2966,56 57,04 52
Ho se rechaza, ya que Fo > F(95%) = 5,0579
Significancía de las desviaciones cuadráticas del modelo lineal: H o : A11 A22 A12 0 Fo
1671 32,1 52
Ho se rechaza, ya que Fo > F(95%) = 5,41
Significancía de la falta de ajuste al modelo cuadrático: Fo
37 0,71 52
Ho se rechaza, ya que Fo > F(95%) = 5,41 El modelo de regresión cuadrática completo es significativo y la falta de ajuste al modelo cuadrático no lo es; entonces se puede concluir que el modelo de segundo orden es una aproximación adecuada a la superficie de respuesta real. Una gráfica de curvas de nivel del modelo de superficie de respuesta cuadrático descrito en la grafica de curvas de nivel muestra una superficie máxima con la máxima duración de la herramienta en el centro de las curvas. Las coordenadas de la gráfica de las curvas de nivel se despliegan para los valores codificados de los dos factores. La orientación de los contornos indica cierta interacción entre la velocidad del torno X1 y la profundidad de corte X2; por ejemplo, la vida de una herramienta de 355
Palacios C. Severo
corte de 150 se puede mantener para velocidades mayores, si se incrementa X1 y se disminuye la profundidad de corte, X2.
Gráfica de curvas de nivel de la superficie de respuesta para la ecuación de respuesta en el experimento de la vida de la herramienta.
Las curvas también indican la sensibilidad relativa de la vida de la herramienta a los niveles de los factores codificados X1 y X2. Las curvas de la vida de la herramienta aumentan con mayor rapidez cerca del máximo sobre el eje de profundidades codificadas X2 que sobre el eje de las velocidades codificadas X1. XI. EXPLORACIÓN DE SUPERFICIES DE RESPUESTA La ecuación cuadrática significativa y la gráfica de curvas de nivel de la ecuación proporcionan un panorama general de la relación entre la vida de la herramienta y los dos factores del diseño, velocidad del torno y profundidad de corte. Las estimaciones de las coordenadas del punto estacionario en la superficie y una estimación de la respuesta en ese punto proporcionan una definición más específica de la superficie de respuesta. En ocasiones, es útil conocer la dirección y cantidad de cambio hecho en uno o varios niveles de los factores para lograr el cambio máximo en la respuesta. Es posible determinar de manera más específica la sensibilidad de la respuesta a los factores del diseño con la forma canónica de la ecuación de respuesta. Localizar las coordenadas del punto estacionario y derivar la forma canónica de la ecuación de respuesta requieren cierto conocimiento de cálculo y álgebra matricial. 356
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Sin embargo, los resultados de los cálculos se entienden cuando se presentan con la forma gráfica de curvas de nivel. Punto estacionario de la superficie de respuesta Las coordenadas X1 y X2 del punto estacionario se obtienen de las derivadas parciales de la función de respuesta estimada respecto a X1 y X2. La respuesta estimada para la duración de la herramienta es: Y 169 6,747 X 1 26,385X 2 10,875X 12 21,625X 22 15,250 X 1 X 2
Las derivadas parciales se igualan a 0: Y 0 X 1 Y 0 X 2
para producir las ecuaciones: 2 10,875X 1 15,250X 1
10,250X 2 2 21,625X 2
6,747 26,385
Las soluciones de las ecuaciones para X1 y X2 son X1S=-0,156 y X2S=0,665. Estos valores son las coordenadas de la respuesta máxima sobre la superficie en el punto estacionario indicado en la Gráfica de curvas de nivel. La respuesta estimada en el punto estacionario se encuentra al sustituir X1S=-0,156 y X2S=0,665 en el modelo; la respuesta estimada en el punto estacionario es. YS 169 6,747 0,156 26,3850,665 10,875 0,156 21,6250,665 2
2
15,250 0,1560,665 177,25
Dado: X 1 V 400 / 200
X 2 D 0,075/ 0,025 357
Palacios C. Severo
Los valores de la velocidad del torno (V) y la profundidad de corte (D) en el punto estacionario son: V 0,156200 400 368,8 D 0,6650,025 0,075 0,092
Análisis canónico para simplificar la ecuación cuadrática La forma canónica de una ecuación cuadrática es eficaz para visualizar la superficie y determinar la sensibilidad relativa de las variables de respuesta a cada factor. Es difícil visualizar la superficie mediante el examen de los coeficientes estimados para la forma normal de la ecuación de respuesta cuadrática. De la misma manera, es difícil determinar los cambios necesarios en los niveles de los factores para producir un cambio específico en la respuesta. El análisis canónico gira los ejes de las variables Xi a un nuevo sistema de coordenadas y el centro de este nuevo sistema se coloca en el punto de respuesta estacionario de la superficie. La forma canónica de la ecuación con dos variables es:
Y YS 1Z12 2 Z 22 Donde: Z1 y Z2 son las variables de los ejes rotados. Observe que sólo se incluyen los términos cuadráticos de las variables canónicas Z1 y Z2 en la forma canónica de la ecuación de respuesta. La forma canónica para la ecuación de respuesta de la vida de la herramienta es: Y 177,25 25,58Z12 6,92Z 22
Donde el centro del nuevo sistema de coordenadas se localiza en X1=0,156 y X2=0,665 en el sistema de coordenadas original mostrado en la gráfica de curvas de nivel. Se determinó que la relación entre los dos sistemas de coordenadas es: 358
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Z1 0,4603X 1 0,8877X 2 0,5185 Z 2 0,8877X 1 0,4603X 2 0,4446
Observe que los ejes canónicos Z1 y Z2 están orientados junto con las curvas de nivel de la superficie. Los tamaños y signos de las λ, indican el tipo de superficie de respuesta cuadrática que se estimó. Los coeficientes λ, para la superficie de la vida de la herramienta son λ1 =-25,58 y λ2 = -6,92, un examen de la superficie en la Gráfica de curvas de nivel revela que cualquier movimiento que se aleja del centro del sistema de coordenadas Z1, Z2 tiene como resultado una disminución en la respuesta. Así, cuando todos los coeficientes λ, son negat ivos la superficie es máxima, como en el caso de la superficie de la vida de la herramienta. Si los coeficientes λ, son positivos, entonces el resultado de cualquier movimiento que se aleja del centro del sistema de coordenadas Z1, Z2 es un incremento en la respuesta y la superficie es mínima como se muestra en la figura 7.2a. Si un coeficiente es positivo y los demás negativos, digamos λ1 > 0 y λ2 < 0, entonces cualquier movimiento que se aleja de (0, 0) a lo largo del eje Z, aumenta la respuesta y si se aleja por el eje Z, la disminuye. Así, la superficie es minimax o con forma de silla en el punto estacionario. Si una de las λ1 = 0, la superficie es una cresta estacionara porque la respuesta no cambia en los ejes Z1. Las longitudes de los ejes principales de las elipses formadas por las curvas de nivel son proporcionales a 1/ 2 . Para la superficie de la vida de la herramienta
25,58
1 / 2
0,20
y
6,92
1 / 2
0,38 ,
y la superficie ajustada
se atenúa a lo largo del eje Z, como se ve en la gráfica de curvas de nivel. Para explicarlo, supongamos que la velocidad del torno y la profundidad de corte para una vida máxima en las coordenadas X 1 0,156 y X 21 0,665 no eran prácticas. El menor cambio en la duración de la herramienta cuando cambian la velocidad del torno y la profundidad de corte se exhibe en la superficie en la dirección del eje Z 2 cuando Z1 = 0. Las coordenadas X1 y X2 en el eje Z2 cuando Z1 = 0 se pueden obtener de la primera ecuaciones canónica. La pérdida mínima en la vida de la herramienta se encuentra en los valores de X 1 y X2 que satisfacen 0,4603X1 + 0,887X2 - 0,5185 = 0. 359
Palacios C. Severo
Los coeficientes de X1 proporcionan información acerca de las relaciones de velocidad del torno y la profundidad de corte con la vida de la herramienta. Considerando que los coeficientes para la ecuación que relacionan Z2 con X1 y X2, Z2 = 0,887X1 – 0,4603X2 + 0,4446. El par de coeficientes (0,8877; -0,4603) indican una compensación entre la velocidad del torno y la profundidad de corte en la vida útil, porque en cierto grado, un incremento en la velocidad del torno se puede compensar con una disminución en la profundidad de corte sobre el eje Z2. La ecuación de respuesta estimada en forma original o en forma canónica sólo es válida para la zona de los niveles de los factores incluida en el experimento. Cualquier intento para estimar la vida de la herramienta fuera de los límites acotados por las velocidades de 117 a 683 y las profundidades de 0,04 a 0,1 1 será engañoso, por lo que es necesario un modelo de respuesta por completo diferente para determinar la duración de la herramienta fuera de la región de este estudio. Ejemplo 7.95 Se estudian dos factores a tres niveles, con la finalidad de maximizar la recuperación de iones metálicos contaminantes que se encuentran presentes en un efluente natural a través de la resina AO, así mismo se requiere minimizar dicha contaminación natural. El tercer nivel (central) sirve para evaluar la varianza del error de las pruebas desarrolladas experimentalmente. De esa manera también evaluamos el error que cometemos cada uno de nosotros. Factores Resina Orgánica AO pH
0.4 2.5
Niveles 0 0.6 3
+ 0.8 3.5
En este caso se quiere optimizar el proceso por lo que deberá desarrollarse los siguientes pasos: Primero: visualizamos los factores y vemos el comportamiento individual de cada uno de ellos, en función del tiempo, con la finalidad de poder establecer la influencia que tienen las variables sobre el proceso y de esa manera desarrollar el análisis que nos reafirmara lo acontecido. 360
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
La Resina Orgánica AO en función del tiempo varía en forma polinomial, por lo tanto es un factor cuadrático. El pH de cualquier proceso en función del tiempo es siempre lineal.
Por lo tanto como una función cuadrática tiene mayor influencia sobre una función lineal entonces el proceso es cuadrático. Segundo: verificamos sí existe o no interacción en el proceso. Sí no existe interacción entonces dicha prueba será acumulada en el análisis en el error. Tercero: analizamos la varianza del error mediante las pruebas repetidas los cuales deberán ser mayores de 3 y menores de 6 experimentos para cualquier caso. La evaluación de la varianza del error se desarrolla aplicando la siguiente relación: S²
Y
2
i
N 1
Y ² i
N N 1
Cuarto: visualizamos los valores del vector respuesta, tan solo los valores del factorial, los puntos (1,3) y (2,4), intercalado, si los valores 361
Palacios C. Severo
son ascendentes el proceso es lineal, pero si los valores son descendentes el proceso el cuadrático. Lo cual confirmará o rechazará nuestra hipótesis planteada en primer término. Prueba 1 2 3 4 5A 5B 5C
AO 0.4 0.8 0.4 0.8 0.6 0.6 0.6
pH 2.5 2.5 3.5 3.5 3 3 3
Y 75.93 94.58 30.33 62.34 70.82 71.28 69.71
Nota: al analizar el vector respuesta, solo los valores del factorial, tendremos en cuenta las siguientes características con el fin de poder establecer la linealidad o cuadratura del proceso en estudio. 1 100 . . . . . . 100 1 Comportamiento Ascendente Descendente
Lineal
Cuadrático
Como notamos los valores del vector respuesta nos da una idea que el proceso es cuadrático, debiendo de confirmar dicho análisis numéricamente, ver Análisis de Linealidad de los Factores. Calculo de varianza Para el cálculo de varianza deberá procesar los valores repetidos del vector respuesta: S²
70,82² 71,28² 69,71² 211,81² 0,64745 2 6 GLerror N 1 2
SCerror S ²N 1 0,647452 1,2949
Interpretación: notamos que el valor de la varianza del error es pequeño 0,64745, (tal como se visualiza en la campana de Gauss el error debe fluctuar entre 0 a 1 para desarrollar un trabajo óptimo) por lo 362
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
tanto las pruebas del error demuestran que el proceso esta siendo desarrollado de una manera adecuada.
La campana Gauss, nos indica que el valor de la varianza del error se encuentra dentro del área de aceptación, si se ubica fuera de esta entonces el error que se comete no es aceptable para poder comparar valores con los factores. Al realizar pruebas experimentales factoriales y centrales (error), se establece la existencia de curvatura o linealidad, debiendo desarrollar la siguiente ecuación en valor absoluto a fin de comprobar lo establecido. Y
F
Y
C
Existen dos casos: > 1, cuando es mayor de uno es cuadrático < 1, cuando es menor de uno es lineal YF YC
Representa el promedio de los valores del vector respuesta del factorial. Representa el promedio de los valores del vector respuesta de las pruebas centrales.
Como primera fase a fin de determinar cual de las variables son más significativas a cierto nivel, desarrollamos primeramente un diseño factorial simple. Con el fin de evaluar la variabilidad de los datos se corren pruebas centrales con la finalidad de evaluar el error cometido y establecer si existe curvatura o linealidad, y posteriormente debe desarrollarse una 363
Palacios C. Severo
nueva técnica denominado Diseño Central Compuesto a fin de desarrollar el análisis estadístico. Calculo de efectos e interacciones: Efectos Interacciones A = +25,33 AB = +6,68 B = -38,92 Error estándar con 3 GL
Interpretación de los efectos Como se quiere maximizar la extracción de los iones metálicos a través de la resina AO, desarrollamos el siguiente análisis: visualizamos los signos de los efectos de AO y pH. El factor AO es positivo, por lo tanto está en su nivel mínimo, por lo cual deberá ser maximizado, es decir que este factor es una variable, y deberán ser optimizado y establecido su rango de trabajo óptimo.
Efectos significativos de factores principales
Interacción de factores principales
El factor pH es negativo, por lo tanto está en su máximo, ósea esta en su punto óptimo, dicho factor viene a ser una constante con el valor máximo de su nivel, si incrementamos dicho factor en el proceso el vector respuesta decae. Entonces debemos evaluar con mayor amplitud el factor AO para establecer el rango óptimo donde debe trabajar con mayor eficiencia. Interpretación de la interacción Notamos que el signo de la interacción AB es positivo, esto nos indica que no existe interacción en el rango estudiado, por estar minimizando la contaminación en el efluente natural. 364
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Análisis de linealidad de los factores Seguidamente evaluamos la curvatura del proceso lo cual quedo establecido a simple vista, cuando analizamos de una manera objetiva los valores del vector respuesta, por lo que debemos reafirmarlo desarrollando los cálculos necesarios, aplicando la siguiente relación, sí: Y
F
Y
C
Y
F
Y
C
Es pequeño no existe curvatura Es grande existe curvatura Y F 65,795
Y C 70,6033
La diferencia es 4,8083 siendo este valor grande, por lo tanto existe curvatura
Análisis: los puntos factoriales de las pruebas los visualizamos de frente (1-2, 3-4), el punto central, de las pruebas repetidas, lo vemos de canto (5) con la finalidad de observar que no siempre se encuentra en el plano sino que este varía de acuerdo al trabajo desarrollado (observamos que la curva de Gauss varia de 0 a 1), por lo que el valor de la diferencia entre los promedios de los puntos factoriales y centrales deben estar dentro de dicho rango. Visualizando nuestro experimento verificamos que no se encuentra dentro del rango 0-1 por lo tanto es un proceso cuadrático. Por consiguiente Los puntos centrales nos sirven para verificar la Linealidad supuesta de los factores en el experimento. Así mismo nos sirve para analizar la varianza del error experimental desarrollado durante el experimento, de tal manera de poder conocer cuanto error cometemos al desarrollar los trabajos experimentales. 365
Palacios C. Severo
Como existe curvatura en nuestro proceso experimental, entonces debemos adicionar pruebas con la finalidad de desarrollar un análisis espacial. Dicho incremento de pruebas se denomina puntos estrella, la adición de dichas pruebas al diseño factorial con pruebas centrales se le denomina Diseño Compuesto Central. Ejemplo 7.96 De acuerdo al ejemplo 7.94, complementamos los puntos estrella o axiales, los cuales están representados en el cuadro siguiente, seguidamente analizamos el diseño Pruebas 7 8 9 10
AO 0,317 0,883 0,6 0,6
pH 3 3 2,293 3.707
Y 50,60 87,34 89,99 34,75
El hecho de haber adicionado pruebas estrella al diseño factorial con pruebas centrales, el nuevo diseño se denomina compuesto central, un diseño rotable que nos proporciona mucho más información que un diseño factorial simple. El presente caso es con la finalidad de incrementar el rango de los niveles a ambos lados sin tener que mover los datos originales y a la vez establecer las condiciones necesarias del proceso a fin de visualizar los efectos, interacciones y cuadraturas en el amplio rango en estudio. El rango de 0,317157 a 0,882843 de estudio para la resina (AO), nos amplia el ámbito al cual es importante desarrollar el proceso, así mismo el rango del pH de 2,29289 a 3,70711, como se podrá visualizar en el grafico, se puede establecer que el rango real en el cual estamos estudiando, ya que en el análisis inicial del diseño factorial el rango era muy pequeño y con este nuevo diseño tenemos el rango real de trabajo. Del valor total de pruebas del Diseño Compuesto Central vamos a analizar los efectos principales, interacciones y cuadraturas los cuales se muestran a continuación en el cuadro adjunto: Efectos e Efectos interacciones cuadráticos A =25,6545 AA = -1,5708 B =-38,990 BB = -8,1707 AB = +6,68 Errores estándar con 5 GL 366
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Interpretación de los efectos: Visualizamos los signos de los efectos de AO y pH: Notamos que el factor AO es positivo, por lo tanto está en su nivel mínimo, el cual deberá ser maximizado, es decir que este factor es una variable, y deberán ser optimizado y establecido su rango de trabajo óptimo. El factor pH es negativo, por lo tanto está en su máximo, ósea esta en su punto óptimo, dicho factor viene a ser una constante con el valor máximo de su nivel.
Efectos de factores principales
Interacción de factores principales
Interpretación de la interacción: Notamos que el signo de la interacción AB es positivo, esto nos indica que dicha interacción esta en su mínimo, por lo tanto hay que maximizarlo, entonces no existe intersección entre los valores numéricos. Análisis de las cuadraturas: Notamos que el signo de la cuadratura AO y pH son negativos, esto nos indica que ambas cuadraturas están en su máximo, entonces están en el rango óptimo, con el valor máximo, por lo que viene a ser una constante en el proceso, además esto nos indica que existe curvatura, lo cual lo hemos deducido al desarrollar la diferencia entre los valores promedios del factorial y la prueba central. El análisis de varianza nos confirma lo desarrollado, así mismo el coeficiente de correlación establece que el modelo matemático se ajusta al proceso, la varianza del error (cuadrado medio del error CM)
367
Palacios C. Severo
esta dentro de la curva de Gauss, podemos decir el trabajo esta bien desarrollado y se puede reconfirmar dicho proceso cuantas veces sea. Fuente A B AA AB BB Error Total
Tabla 7.113 Análisis de varianza SC Gl CM Fo Ft(99%) 1316,31 1 1316,31 4233,59 > 16,26 3040,49 1 3040,49 9778,97 > 16,26 3,4836 1 3,4836 11,20 < 16,26 44,6224 1 44,6224 143,52 > 16,26 94,253 1 94,253 303,14 > 16,26 1,5546 5 0,3109 4498,3 10 R² = 99,9654%
El hecho de haber adicionado pruebas estrella al diseño factorial con pruebas centrales, el nuevo diseño se denomina Compuesto Central, un diseño rotable que nos proporciona mucho más información que un diseño factorial simple. El presente caso es con la finalidad de incrementar el rango de los niveles a ambos lados sin tener que mover los datos originales y a la vez establecer las condiciones necesarias del proceso a fin de visualizar los efectos, interacciones y cuadraturas en el amplio rango en estudio. El rango de 0,317157 a 0,882843 de estudio para la resina, nos amplia el ámbito al cual es importante desarrollar el proceso, así mismo el rango del pH de 2,29289 a 3,70711, como se podrá visualizar en el grafico, se puede establecer que el rango real es el cual estamos estudiando, ya que en el análisis inicial del diseño factorial el rango era muy pequeño y con este nuevo diseño tenemos el rango real de trabajo. Modelo matemático El primer paso consiste en desarrollar un modelo matemático, el cual debemos analizarlo. Debido a la curvatura de la superficie respuesta, el experimento requiere un modelo cuyo grado sea mayor e igual a 2, para aproximar la respuesta cuando se encuentre relativamente cercana al óptimo. Y 55,0693 12,5009 AO 39,0191 pH 19,6356 AO ² 16,3416 pH ² 33,4 AOpH
Determinación de condiciones óptimas Se define las condiciones de operación óptima, maximizando o minimizando los resultados del mismo. Una condición inicial es remover 368
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
los niveles de operación y determinar los resultados óptimos mediante la aplicación de técnicas para determinar los nuevos niveles operacionales (pendiente ascendente o descendente). Factor AO pH
Valor óptimo = 8,47071 Bajo Alto Óptimo 0,317157 0,882843 0,317157 2,29289 3,70711 3,70711
El problema consiste en eliminar el contaminante del efluente, por lo que se tiene que minimizar el contenido metálico de dicho efluente y maximizar la extracción con la resina, por lo que optimizando el proceso se puede dejar hasta un 8,47071% del contenido metálico y además maximizando la capacidad de adsorción de la resina se llega hasta un 99,8925% de eficiencia, lo cual es loable para la eliminación de contaminante metálico del efluente que se quiere reutilizar. Si en la optimización intervienen dos o más variables independientes, frecuentemente puede prepararse superficies que muestren la relación existente entre las variables. Uno de los métodos de amplia aplicación es la máxima pendiente ascendente o descendente. XII. PUNTO ESTACIONARIO Si se desea maximizar las respuestas del modelo ajustado, si existe, serán el conjunto de las Xi tal que las derivadas parciales sean iguales a cero. Dicho punto, es decir X1S, X2S, X3S ... XiS se denomina punto estacionario
Y a11 X 1 a12 X 2 a13 X 1 Y a21 X 1 a22 X 2 a23 X 2 Desarrollando las derivadas parciales obtenemos la siguiente relación: 39,2712X1 33,4000X 2 12,5009 33,4000X1 32,6832X 2 39,0191 369
Palacios C. Severo
Desarrollando matricialmente, obtenemos el punto estacionario: X1 = 5,327 X2 = 6,6377 R(P) = 151,27
Una vez obtenido el punto estacionario (ósea la intersección del nuevo eje de planos Zi) debemos hallar el ángulo de giro de las nuevas coordenadas, aplicando la siguiente relación:
Tan2
A12 A11 A22
Reemplazando valores obtenemos:
2126´12,5"
Donde R(P) viene a ser el punto estacionario, así mismo viene a ser el punto de intersección del nuevo eje real en el cual está inscrito el modelo matemático. XIII. CRITERIO DE FORMAS CUADRÁTICAS Se requiere como condición necesaria y suficiente para que la forma cuadrática sea definida positiva es que se cumpla:
a11 a21
a12 0 a22
Para desarrollar la matriz derivamos por segunda vez la ecuación diferencia parcial, obteniéndose: 370
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
²Y 33,4 X 1X 2
²Y 39,2712 X 1X 1 ²Y 33,4 X 2 X 1
²Y 39,6832 X 2 X 2
Entonces: a11
a12
a 21
a 22
167,94
Análisis del coeficiente de regresión: La relación AO está en su mínimo por lo tanto tiende a ascender, el pH del medio esta en su máximo por lo tanto tiende a bajar, dicho análisis lo desarrollamos con la finalidad de poder establecer los niveles de ascendencia o descendencia hasta llegar al valor óptimo. Al visualizar los signos de las cuadraturas notamos que ambos tienen el signo negativo por lo tanto deducimos que es una elipse o cáscara de huevo, y un elipsoide en el espacio. Si la relación AO y el pH del medio fuesen cero, la recuperación del proceso está en su mínimo (R = 55,0693), por lo tanto hay que desarrollar la pendiente ascendente hasta llegar al óptimo (para el caso de maximizar la capacidad de adsorción de la resina, y si fuere el caso de minimizar la contaminación se tendrá que desarrollar la pendiente descendente). Camino de Máximo Ascenso para y AO pH Y 0,6 3,0 70,603 0,635 2,87 77,462 0,67 2,74 83,199 0,705 2,63 87,904 0,74 2,53 91,685 0,775 2,44 94,659
Visualizamos el gráfico espacial que representa a un sector de la elipse estando la región óptima de recuperación en una relación AO a 0,8 y un pH de 2,5 lo cual confirma el análisis establecido, cuando es el caso de maximizar la capacidad de adsorción de la resina, si fuere el caso de eliminar el contaminante metálico se tendrá que trabajar con el valor mínimo de AO y el valor máximo de pH. Se debe de analizar de acuerdo si se quiere maximizar o minimizar el proceso. 371
Palacios C. Severo
Estimated Response Surface 110
pH
Y
90 70 50 30 0.4
Contours of Estimated Response Surface
30.0-38.0 38.0-46.0 46.0-54.0 54.0-62.0 62.0-70.0 70.0-78.0 78.0-86.0 86.0-94.0 94.0-102.0
0.5
0.6
0.7
0.8
3.5 3.3 3.1 2.9 2.7 pH 2.5
Y
3.5
30.0-38.0 38.0-46.0 46.0-54.0 54.0-62.0 62.0-70.0 70.0-78.0 78.0-86.0 86.0-94.0 94.0-102.0
3.3 3.1 2.9 2.7 2.5 0.4
0.5
AO
0.6
0.7
0.8
AO
Superficie respuesta estimada en el plano con punto óptimo
Superficie respuesta estimada en el espacio
Tal como establecimos que la relación AO tiene que subir y el pH del medio tiende a bajar con la finalidad de llegar a una alta capacidad de adsorción de la resina. En este caso se ha establecido que en un cuarto paso se llega a una recuperación de 99,743 variando la relación AO en forma ascendente con 0,87 y un pH descendente en 2,25 de esa manera se obtiene dicha máxima capacidad de la resina. En el presente grafico en el plano, se puede establecer claramente que la máxima capacidad de adsorción de la resina se ubica cuando se mantiene constate en el mínimo nivel el pH y en el máximo nivel el AO, pero si se quiere la eliminación del contaminante metálico se tiene que trabajar con el máximo nivel del pH y con el mínimo nivel del AO, con el fin de desarrollar un trabajo acorde al proceso a desarrollar. El modelo matemático nos demuestra que inicialmente la contaminación se encuentra sobre 55,0693%, así que el factor de mayor significancía para eliminar dicho contenido metálico es la resina con una pendiente negativa de -19,6356, lo cual hace disminuir dicha contaminación hasta un porcentaje adecuado para rehusar dicho producto acuífero. Ejemplo 7.97 Se desarrolla una investigación sobre la flotabilidad de un mineral sulfurado, se desea conoce los niveles óptimos de dos factores tiempo de acondicionamiento y pH con la finalidad de optimizar la recuperación del mineral Factores A: Tiempo (min) B: pH 372
5,0 8,5
Niveles 0 6,5 9,5
+ 8,0 10,5
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Para n = 2 factores, se ha de utilizar un diseño central compuesto equivalente a 2²+2*2+5 = 13 pruebas experimentales, con cinco pruebas centrales a fin de evaluar el error experimental y el error cometido por el investigador. Prueba 1 2 3 4 5 6 7 8 9 10 11 12 13
A 5.0 8.0 5.0 8.0 4.37868 8.62132 6.5 6.5 6.5 6.5 6.5 6.5 6.5
B 8.5 8.5 10.5 10.5 9.5 9.5 8.08579 10.9142 9.5 9.5 9.5 9.5 9.5
Y 75,9 72 78 79,5 78,4 75,6 72 79,9 79,5 85,1 85 79,1 79,8
Efectos e Efectos cuainteracciones dráticos A = -1,59 AA = -4,762 B = 5,193 BB = -5,812 AB = 2,70 Errores estándar con 7 GL Fuente A B AA AB BB Error Total
Tabla 7.114 Análisis de varianza SC Gl CM Fo Ft(95%) 5,055 1 5,055 0,92 < 5,59 53,935 1 53,935 9,86 > 5,59 39,445 1 39,445 7,21 < 5,59 7,29 1 7,29 1,33 < 5,59 58,756 1 58,756 10,74 > 5,59 38,304 7 5,472 191,304 12 R² = 80,0199% Camino de Máximo Ascenso para y A B Y 6,5 9,5 81,7 6,46 9,59 81,92 6,42 9,68 82,09 6,40 9,77 82,20 6,39 9,86 82,26 6,43 9,95 82,28 6,38 10,04 82,24 6,23 10,13 82,14 6,25 10,22 81,97
373
Palacios C. Severo
Gráfica de Interacción para y
Gráfica de Interacción para y 83
83
81
81 B=10.5
79
Y
77
Y
B=10.5
79
B=10.5
B=10.5
77 B=8.5
B=8.5
75
75
73
73 B=8.5
71 5
B=8.5
71 5
8
8 A
A
Efectos significativos de factores principales
Interacción de factores principales
Y 190,953 4,678 A 51,965B 1,058 A² 2,906B² 0,9 AB Superficie de Respuesta Estimada
Contornos de la Superficie de Respuesta Estimada
y
10.5
y
10.1
B
9.7 9.3
83 81 79 Y
71.0-72.2 72.2-73.4 73.4-74.6 74.6-75.8 75.8-77.0 77.0-78.2 78.2-79.4 79.4-80.6 80.6-81.8 81.8-83.0 83.0-84.2
77 75
8.9
73 71 5
8.5 5
5.5
6
6.5 A
7
7.5
5.5
6
6.5
8
7
7.5
8
8.5
8.9
9.3
9.7
10.5 10.1
71.0-72.2 72.2-73.4 73.4-74.6 74.6-75.8 75.8-77.0 77.0-78.2 78.2-79.4 79.4-80.6 80.6-81.8 81.8-83.0 83.0-84.2
B
A
Superficie respuesta estimada en el plano con punto óptimo Factor A B
Superficie respuesta estimada en el espacio
Valor óptimo = 82,2841 Bajo Alto Óptimo 4,378 8,621 6,435 8,085 10,914 9,936
Ejemplo 7.98 Se desea evaluar un lecho de filtración, para lo cual se estudian dos factores, altura de lecho y velocidad de flujo Factores A: Altura de lecho B: Velocidad de flujo A 20 30 20 374
20 140 B 140 140 220
Niveles
Y 6,22 5,57 9,51
+ 30 220
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 30 25 25 25
220 180 180 180
8,15 6,15 6,18 6,12
Efectos Interacciones A = -1,005 AB = -0,355 B = 2,935 Errores estándar con 3 GL Tabla 7.115 Análisis de varianza SC Gl CM Fo Ft(95%) 1.01002 1 1.01002 1,20 < 10,13 8,61423 1 8,61423 10,25 > 10,13 0,126025 1 0,126025 0,15 < 10,13 2,52207 3 0,84068 12,2723 6 R² = 79,4492%
Fuente A B AB Error Total
Y 1,24 0,059 A 0,058B 0,00088 AB Camino de Máximo Ascenso para y A B Y 25 180 6,84 25,5 167,73 6,34 26 153,93 5,80 26,5 137,72 5,19 27 116,82 4,43 27,5 72,29 2,87 28 66,68 2,68 28,5 230,66 8,19 29 223,15 7,87
Factor A B
Valor óptimo = 82,2841 Bajo Alto Óptimo 20 30 20 140 220 220 Gráfica de Interacción para Y 9
8.3
8
7.3
7
Y
Y
Gráfica de Efectos Principales para Y 9.3
6.3
6
5.3
5
20
A
30
140
B
220
Efectos de factores principales
B=220
B=220
B=140 B=140 20
A
30
Interacción de factores principales 375
Palacios C. Severo
Contornos de la Superficie de Respuesta Estimada
200
B
Superficie de Respuesta Estimada Y
180 160
5.0-5.4 5.4-5.8 5.8-6.2 6.2-6.6 6.6-7.0 7.0-7.4 7.4-7.8 7.8-8.2 8.2-8.6 8.6-9.0 9.0-9.4
22
24
26
28
9 8 7 6 5 20
140 20
Y
Y
220
30
22
A
Superficie respuesta estimada en el plano con punto óptimo
24 26 A
28
30
220 200 180 160 140 B
5.0-5.4 5.4-5.8 5.8-6.2 6.2-6.6 6.6-7.0 7.0-7.4 7.4-7.8 7.8-8.2 8.2-8.6 8.6-9.0 9.0-9.4
Superficie respuesta estimada en el espacio
Ejemplo 7.99 Se desea estimar el efecto del SO2 sobre la población cercana a una fábrica de tostación de concentrados sulfurosos, con el fin de monitorear dicho contaminante se han considerando los siguientes factores: Tasa de emisividad Q del contaminante a la salida de la chimenea y la altura de la chimenea. Factores A: Tasa de emisividad (g/s) B: Altura (m) A 5 10 5 10 3,96 11,03 7,5 7,5 7,5 7,5 7,5 7,5 7,5
B 30 30 60 60 45 45 2,37 66,21 45 45 45 45 45
5 30
Niveles
Y 140 180 200 310 130 320 170 300 280 270 265 275 266
Efectos e Efectos Cuainteracciones dráticos A = 104,675 AA = -57,4506 B = 93,4619 BB = -47,4500 AB = 35,000 Errores estándar con 7 GL 376
+ 10 60
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Tabla 7.116 Análisis de varianza SC Gl CM Fo Ft(95%) 21913,6 1 21913,6 52,22 > 5,59 17470,3 1 17470,3 41,63 > 5,59 5740,03 1 5740,03 13,68 > 5,59 1225,0 1 1225,0 2,92 < 5,59 3915,65 1 3915,65 9,33 > 5,59 2937,24 7 419,605 52110,9 12 R² (%) = 94,3635
Fuente A B AA AB BB Error Total
Y 340,558 68,8757 A 9,1054 B 4,596 A² 0,105 B ² 0,466 AB Camino de Máximo Ascenso para Y A B Y 7,5 45,00 271,2 8,5 50,65 304,43 9,5 56,99 328,08 10,5 64,13 340,43 11,5 72,23 338,87 12,5 81,78 318,71 Factor A B
Valor óptimo = 341,554 Bajo Alto Óptimo 3,964 11,035 10,854 23,786 33,213 66,213 Gráfica de Interacción para Y 370
290
330
270
290
250
250
Y
Y
Gráfica de Efectos Principales para Y 310
230
B=60
210
210
B=30
B=60
170
190 5
10
A
30
B=30
130
60
B
Efectos de factores principales
5
A
10
Interacción de factores principales Superficie de Respuesta Estimada
Contornos de la Superficie de Respuesta Estimada
Y
60 55
B
50 45 40
130.0-154.0 154.0-178.0 178.0-202.0 202.0-226.0 226.0-250.0 250.0-274.0 274.0-298.0 298.0-322.0 322.0-346.0 346.0-370.0 370.0-394.0
35 30 5
6
7
8 A
9
10
Superficie respuesta estimada en el plano con punto óptimo
370
Y
Y
330 290 250 210 170 130
5
6
7 A
8
9
10
60 5055 45 3540 B 30
130.0-154.0 154.0-178.0 178.0-202.0 202.0-226.0 226.0-250.0 250.0-274.0 274.0-298.0 298.0-322.0 322.0-346.0 346.0-370.0 370.0-394.0
Superficie respuesta estimada en el espacio 377
Palacios C. Severo
Ejemplo 7.100 Los experimentos de lixiviación con sales oxidantes en medio acido a minerales auríferos procedentes de la Concesión Minera Huaracane – Moquegua - Perú, fueron realizados para establecer el efecto de los factores de los agentes lixiviantes y el ácido sobre la disolución del oro metálico. Todas las pruebas se desarrollaron a temperatura ambiente y con agitación constante, y a un tiempo establecido. El mineral previamente fue molido con la finalidad de liberar el oro que se encuentra incrustado, ya que dicho material se encuentra en forma microscópica encapsulado en cuarzo, con una ley promedio de 15 g/t, las sales oxidantes en medio ácido sirven para desarrollar el proceso y son de calidad comercial (fertilizantes). En todas las pruebas se llegan a desarrollar reacción exotérmica (espontánea) con el fin de acelerar el proceso de disolución del oro (cinética). El contenido de oro en la solución lixiviada se analizo por electrogravimétria. Para determinar el efecto de los factores se estudio a dos niveles la concentración de las variables con el fin de no interferir en el análisis del oro. Factores A: H2SO4 B: NaNO3 C: NaCl
100 20 70
Niveles
+ 120 30 90
Resultados y discusión Al concluir con las pruebas experimentales, se procedió analizar la extracción de oro de l material aurífero, para lo cual se utilizó el programa estadístico Statgraphics Plus, de cuyo tratamiento de datos se obtuvo la estimación de los efectos de cada uno de los factores siendo este el resultado de dicho análisis: Acido sulfúrico El efecto de la concentración de ácido sulfúrico se estudia en el rango de 110 a 120, manteniendo constante la temperatura, el tiempo de lixiviación así como la agitación del proceso. 378
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
El efecto de la concentración de ácido sulfúrico es positivo con una pendiente pequeña, evaluando dicho factor podemos llegar a la siguiente conclusión, que dicho factor está en su mínimo nivel, debiendo ser maximizado hasta llegar al óptimo, pero no deberá de exceder de un rango ya que el exceso de dicho producto también es perjudicial y antieconómico, con el fin de poder obtener una máxima extracción de oro del material aurífero. Efectos e interacciones A: H2SO4 0.885365 B: NaNO3 1.48441 C: NaCl -12.7076 AB 0.25 AC 4.75 BC 11.25
Efectos Cuadráticos AA -7.32279 BB -8.73692 CC -18.6366
Nitrato de sodio Los resultados obtenidos al desarrollar el experimento factorial con el fin de establecer el efecto de dicho factor, se llegan a la siguiente conclusión, si se incrementa fuera del rango establecido se genera gases tóxicos de dióxido de nitrógeno, altamente contaminante para el medio ambiente. El objeto de adicionar nitrato de sodio es la generación de ácido nítrico, el cual al interactuar con el ácido clorhídrico genera agua regia in situ, compuesto altamente corrosivo, debiendo de controlarse la dosificación de dicha sal a fin de evitar la formación de gases tóxicos. El efecto de la concentración del nitrato de sodio esta en su nivel mínimo, debiendo maximizarse hasta llegar al óptimo y obtener buenas extracciones del material valioso. Cloruro de sodio La dosificación del cloruro de sodio es con la finalidad de producir cloruro de nitrosilo y cloro naciente in situ, los experimentos se llevaron a cabo manteniendo constante la temperatura, el tiempo de lixiviación así como la agitación. La disolución del oro se incrementa al incrementarse la dosificación de dicha sal, la concentración tiene efecto significativo sobre la solubilidad del oro, debido a que el ión cloro tiene habilidades de formar especies complejas con el oro. 379
Palacios C. Severo
El efecto de dicha sal nos indica que esta en su nivel máximo, indicándonos que al incrementarse sobre el máximo se disminuye la recuperación de oro. Interaction Plot for Au Main Effects Plot for Au
102
100
97
97
92
Au
Au
94 91
+ -
+-
-
87
+ +
82
88
77
85
+
72
82 100 120 H2SO4
20
30 NaNO3
70
90 NaCl
Efectos medios de los factores en recuperación de oro, Proceso SEVERO
100
120 AB
100
120
+ 20
AC
30 BC
Interacciones de factores principales, Proceso SEVERO
Tal como visualizamos el análisis gráfico del efecto medio podemos establecer que la mayor recuperación para el ácido sulfúrico y nitrato de sodio este cercano al promedio, en cambio el cloruro de sodio esta en su máxima concentración debiendo de ser disminuido hasta llegar al óptimo. Fuente A; H2SO4 B: NaNO3 C: NaCl AA AB AC BB BC CC Error Total
Tabla 7.117 Análisis de varianza SC Gl CM Fo Ft(95%) 2,6763 1 2,6763 0,04 < 5,12 7,5231 1 7,5231 0,11 < 5,12 551,334 1 551,334 8,21 > 5,12 182,993 1 182,993 2,72 < 5,12 0,125 1 0,125 0,00 < 5,12 45,125 1 45,125 3,88 < 5,12 260,497 1 260,497 3,77 < 5,12 253,125 1 253,125 17,64 > 5,12 1185,25 1 1185,25 604,753 9 67,1948 2827,15 18 R² = 78,6091%
Entre los factores en estudio existe interacción, por lo que no es posible manipular cada factor independientemente, ya que todos los factores están entrelazados para poder desarrollar el Proceso SEVERO. El análisis de varianza (ANAVA) confirma la importancia que tienen los factores, así mismo las interacciones y cuadraturas del proceso. El modelo matemático, con un coeficiente de correlación aceptable, si igualamos a cero los tres factores, nos indica que la extracción de oro 380
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
está en su máximo, debiendo ser regulado este por las dosificaciones del ácido sulfúrico y las sales oxidantes. Au 556 ,86 6,136 H 2 SO 4 0,389 NaNO 3 8,848 NaCl 0,0366 H 2 SO 4 ² 0,174 NaNO 3 ² 0,093 NaCl ² 0,002 H 2 SO 4 * NaNO 3 0,023 H 2 SO 4 * NaCl 0,112 NaNO 3 * NaCl
En el análisis gráfico se visualiza que la máxima recuperación de oro en encuentra señalada por el signo más que esta dentro de la zona azul (98 a 99% Au). Debiendo de dosificarse adecuadamente con el fin de llegar a dicha recuperación.
Estimated Response Surface
Contours of Estimated Response Surface Au 89.0-90.0 90.0-91.0 91.0-92.0 92.0-93.0 93.0-94.0 94.0-95.0 95.0-96.0 96.0-97.0 97.0-98.0 98.0-99.0
NaNO3
30 28 26 24 22 20 100
104
108
112
116
120
H2SO4 Respuesta en el Plano de extracción de oro con punto óptimo
NaCl=80.0
Au
NaCl=80.0
99 97 95 93 91 89 100104 28 30 108112 24 26 11612020 22
H2SO4
89.0-90.0 90.0-91.0 91.0-92.0 92.0-93.0 93.0-94.0 94.0-95.0 95.0-96.0 96.0-97.0 97.0-98.0 98.0-99.0
NaNO3
Respuesta espacial de extracción de oro con punto óptimo
Ejemplo 7.101 Se desea evaluar un proceso de lixiviación por agitación de un mineral refractario de oro, para lo cual se estudian tres factores que son los que influyen en el proceso de disolución del oro, siendo estos: temperatura, concentración del agente lixiviante y tiempo de agitación. Desarrollándose replicas en la respuesta de recuperación, a fin de contrastar el grado de solubilidad del material valioso. Factores A: Temperatura (°C) B: Concentración (%) C: Tiempo Agitación (Hr)
Niveles + 20 60 0,5 1 0,25 1
En la tabla se muestra las dosificaciones con sus respectivos resultados de recuperación del material valioso tanto para la prueba original como para la replica, todos bajo las condiciones establecidas de variables (factores) y constantes. 381
Palacios C. Severo Temperatura (oC) 20 60 20 60 20 60 20 60 20 60 20 60 20 60 20 60
Concentración (%) 0,5 0,5 1 1 0,5 0,5 1 1 0,5 0,5 1 1 0,5 0,5 1 1
Tiempo agitación (Hr) 0,25 0,25 0,25 0,25 1 1 1 1 0,25 0,25 0,25 0,25 1 1 1 1
Y 42,83 56,93 78,92 81,00 64,17 72,13 87,17 88,25 41,67 56,14 78,33 80,00 63,33 70,37 86,67 87,72
Los tres factores tienen efectos sobre el proceso, pero el de mayor efecto significativo es la concentración seguido del tiempo de agitación y finalmente la temperatura. Por lo que tengo que tener mucho cuidado con los dos primeros factores. -Efectos A = 6,18 B = 25,06 C = 12,99
Interacciones AB = -4,711 AC = -1,898 BC = -5,108 Bloque = -0,896 Error estándar con 8 GL
El block de pruebas desarrollado no tiene efecto significativo sobre el proceso, el hecho de haber corrido pruebas replicadas no tiene efecto sobre el proceso. Fuente A B C AB AC BC Bloque Error Total
Tabla 7.118 Análisis de varianza SC Gl CM Fo Ft(99%) 152,83 1 152,83 128,19 > 11,26 2515,27 1 2512,27 2107,15 > 11,26 675,87 1 675,87 566,88 > 11,26 88,78 1 88,78 74,47 > 11,26 14,42 1 14,42 12,10 > 11,26 104,39 1 104,39 87,56 > 11,26 3,21 1 3,21 2,69 < 11,26 9,53 8 1,19 3561,32 15 R² = 99,7322%
El análisis de varianza nos confirma la interpretación obtenida del los efectos principales sobre el proceso, si nos fijamos en F-Ratio, las fuen382
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
tes de los tres factores principales notamos que la concentración es el que tiene mayor efecto significativo seguido del tiempo de agitación y finalmente la temperatura. Notamos así mismo que el R2 es 99,7322 %, un coeficiente de correlación optimo para el proceso. En referencia al valor del Error 1,19226, nos confirma que en el experimento se han debido de realizar pruebas centrales a fin de establecer un error experimental de mayor utilidad en el experimento, en vez de las replicas realizadas. Y 13,698 0,5869 A 85,996 B 42,83C 0,471 AB 0,1265 AC 27 ,246 BC
En el modelo matemático nos fijamos en las constantes de los factores principales, si A = B= C = 0, entonces Y = -13,6988. Nos indica que el valor que ha de hacer crecer este valor hasta un valor positivo y se incremente hasta un máximo esta en función directa de la concentración, seguido del tiempo de agitación y por último de la temperatura. Camino de Máximo Ascenso para y A 40 41,66 42,64 42,88 42,34 41,03 40,10
B 0,75 0,85 0,95 1,05 1,15 1,25 1,3
C 0,625 0,689 0,731 0,813 0,852 0,877 0,885
Y 70,97 77,22 82,73 87,27 92,34 96,85 99,14
Partiendo del punto central de cada factor, se pude llegar al óptimo variando la concentración de 0,05 en 0,05 y se llega a un optimo del 99,1413. Factor A B C
Valor óptimo = 87,6669 Bajo Alto Óptimo 20 60 20 0,5 1 1 0,25 1 1
Como hemos establecido en las opiniones desde un comienzo, se llega a la conclusión que el óptimo del proceso para llegar en el presente caso hasta un 87,6669 se tiene que trabajar con el valor mínimo de la temperatura, con una máxima concentración y un tiempo de agitación máximo. 383
Palacios C. Severo
Main Effects Plot for Y 88 83
Y
78 73 68 63 58 20 60 0.5 1 0.25 1 Temperatura ConcentracionTiempo agitacion
Efectos significativos de factores principales
Tal como hemos establecido en el análisis numérico, podemos visualizar gráficamente lo que hemos establecido en la parte analógica, se puede observar que la mayor pendiente para poder obtener una máxima reucperación lo tiene la concentración seguido del tiempo de agitación y finalmente la temperatura, por lo cual el que tiene mayor efecto significativo es la concentración, al cual hay que controlarlo en todo el proceso, esto no quiere decir que los otros factores no influyan en el proceso, por lo que se tiene que controlar hasta llegar al óptimo de la recuperación. Contours of Estimated Response Surface Contours of Estimated Response Surface
Concentracion=0.75 Y
1
Concentracion
Tiempo agitacion
Tiempo agitacion=0.625 53.0-57.0 57.0-61.0 61.0-65.0 65.0-69.0 69.0-73.0 73.0-77.0 77.0-81.0 81.0-85.0
0.9 0.8 0.7 0.6
Y
1.05
57.0-61.0 61.0-65.0 65.0-69.0 69.0-73.0 73.0-77.0 77.0-81.0
0.85 0.65 0.45 0.25
0.5 20
30
40
50
20
60
30
40
50
60
Temperatura
Temperatura
Contours of Estimated Response Surface Temperatura=40.0 Y
Tiempo agitacion
1.05
53.0-57.0 57.0-61.0 61.0-65.0 65.0-69.0 69.0-73.0 73.0-77.0 77.0-81.0 81.0-85.0 85.0-89.0
0.85 0.65 0.45 0.25 0.5
0.6
0.7
0.8
0.9
1
Concentracion
Superficie respuesta estimada en el plano, manteniendo constante una variable
Para un tiempo de agitación constante en el promedio, se puede llegar a un máximo de extracción manteniendo en su mínimo a la temperatura y en su máximo a la concentración. 384
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Estimated Response Surface
Estimated Response Surface
Concentracion=0.75
Tiempo agitacion=0.625 93
Y
83 73 63 53 20
30
40
50
60
Temperatura
1 0.9 0.8 0.7 0.6 0.5
Y
53.0-57.0 57.0-61.0 61.0-65.0 65.0-69.0 69.0-73.0 73.0-77.0 77.0-81.0 81.0-85.0
57.0-61.0 61.0-65.0 65.0-69.0 69.0-73.0 73.0-77.0 77.0-81.0
84 80 76 72 68 64 60 20
30
40
50
60
Temperatura
Concentracion
1.05 0.85 0.65 0.45 0.25
Tiempo agitacion
Estimated Response Surface Temperatura=40.0
89
Y
79 69 59 49 0.5
0.6
0.7
0.8
0.9
Concentracion
1
1.05 0.85 0.65 0.45 0.25
53.0-57.0 57.0-61.0 61.0-65.0 65.0-69.0 69.0-73.0 73.0-77.0 77.0-81.0 81.0-85.0 85.0-89.0
Tiempo agitacion
Superficie respuesta estimada en el espacio manteniendo constante una variable
Para una concentración constante en el promedio, se puede llegar al máximo de extracción manteniendo en su mínimo a la temperatura y en su máximo al tiempo de agitación. Para una temperatura constante en el promedio, se puede llegar al máximo de extracción manteniendo en su máximo al tiempo de agitación y en su máximo a la concentración. Temperatura (oC) 20 60 20 60 20 60 20 60 20 60 20 60 20 60 20 60
Concentración (%) 0,5 0,5 1 1 0,5 0,5 1 1 0,5 0.5 1 1 0,5 0,5 1 1
Tiempo agitación (Hr) 0,25 0,25 0,25 0,25 1 1 1 1 0,25 0,25 0,25 0,25 1 1 1 1
Y 42,83 56,93 78,92 81,00 64,17 72,13 87,17 88,25 41,67 56,14 78,33 80,00 63,33 70,37 86,67 87,72 385
Palacios C. Severo 6,36 73,64 40 40 40 40 40 40 40
0,75 0,75 0,33 1,17 0,75 0,75 0,75 0,75 0,75
0, 625 0,625 0,625 0,625 -0,0057 1,26 0,625 0,625 0,625
61,25 85,36 68,47 96,59 38,71 92,57 85,36 85,02 85,47
El proceso es cuadrático, por lo tanto se tienen que realizar complementariamente tres pruebas centrales para evaluar el error y seis pruebas estrella a fin de completar el modelo cuadrático. Ejemplo 7.102 Diseño compuesto centrado para ejemplo 7.101 Efectos e Efectos cuainteracciones dráticos A = 9,631 AA = -9,226 B = 21,465 BB = -2,703 C = 20,886 CC = -14,647 AB = -4,725 AC = -1,785 BC = -5,26 Error estándar con 7 GL Fuente A B C AA AB AC BB BC CC Error Total
Tabla 7.119 Análisis de varianza SC Gl CM Fo Ft(99%) 316,723 1 316,723 5,28 > 12,25 1573,08 1 1573,08 26,22 > 12,25 1489,42 1 1489,42 24,82 > 12,25 239,946 1 239,946 4,00 < 12,25 44,6513 1 44,6513 0,74 < 12,25 6,3724 1 6,3724 0,11 < 12,25 20,606 1 20,606 0,34 < 12,25 55,3352 1 55,3352 0,92 < 12,25 604,631 1 604,631 10,08 < 12,25 420,001 7 60,0002 4608,82 13 R² = 90,887%
Y 55,1058 1,592 A 111,811B 118,746C 0,0115 A² 21,631B ² 52,078C ² 0,742 AB 0,119 AC 28,053BC
A 40,0 41,0 386
Camino de Máximo Ascenso para y B C Y 0,75 0,625 85,393 0,779 0,665 87,858
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 42,0 43,0 44,0 45,0
0,813 0,855 0,919 0,583
Factor A B C
0,705 0,744 0,784 0,772
90,148 92,353 94,802 82,541
Valor óptimo = 100,868 Bajo Alto Óptimo 6,364 73,635 41,079 0,329 1,170 1,170 -0,005 1,255 0,776
Gráfica de Efectos Principales para Y
Gráfica de Interacción para Y
97
102
92
92
+
82 -
Y
Y
87 82
72
77
62
72 52
67 20
60
A
0.5
1
B
0.25
C
1
Efectoo de factores principales
20
71
20
30
40
A
50
60
0.7 0.6 0.5
1 0.9 0.8
20
AC
60
0.5
1
BC
Superficie de Respuesta Estimada B=0.75 Y
97
Y
87 77 67 57 20
B
30
40
A
50
60
1.05 0.85 0.65 0.45 0.25 C
61.0-66.0 66.0-71.0 71.0-76.0 76.0-81.0 81.0-86.0 86.0-91.0 91.0-96.0 96.0-101.0 101.0-106.0 106.0-111.0 111.0-116.0
Superficie de Respuesta Estimada A=40.0 Y
102 92 82
Y
Y
81
60
AB
Interacción de factores principales
61.0-66.0 66.0-71.0 71.0-76.0 76.0-81.0 81.0-86.0 86.0-91.0 91.0-96.0 96.0-101.0 101.0-106.0 106.0-111.0 111.0-116.0
91
-
+
-
Y
101
+ -
-
Superficie de Respuesta Estimada C=0.625
61
+
+ +
72 62 52 0.5
0.6
0.7
B
0.8
0.9
1
1.05 0.85 0.65 0.45 0.25 C
61.0-66.0 66.0-71.0 71.0-76.0 76.0-81.0 81.0-86.0 86.0-91.0 91.0-96.0 96.0-101.0 101.0-106.0 106.0-111.0 111.0-116.0
Superficie respuesta estimada en el espacio manteniendo constante una variable
387
Palacios C. Severo Contornos de la Superficie de Respuesta Estimada B=0.75
Contornos de la Superficie de Respuesta Estimada C=0.625 1
61.0-65.0 65.0-69.0 69.0-73.0 73.0-77.0 77.0-81.0 81.0-85.0 85.0-89.0 89.0-93.0 93.0-97.0 97.0-101.0 101.0-105.0
B
0.8 0.7 0.6
Y 61.0-65.0 65.0-69.0 69.0-73.0 73.0-77.0 77.0-81.0 81.0-85.0 85.0-89.0 89.0-93.0 93.0-97.0 97.0-101.0 101.0-105.0
0.85
C
0.9
0.5
1.05
Y
0.65 0.45 0.25
20
30
40 A
50
20
60
30
40 A
50
60
Contornos de la Superficie de Respuesta Estimada A=40.0 1.05
Y 61.0-65.0 65.0-69.0 69.0-73.0 73.0-77.0 77.0-81.0 81.0-85.0 85.0-89.0 89.0-93.0 93.0-97.0 97.0-101.0 101.0-105.0
C
0.85 0.65 0.45 0.25
0.5
0.6
0.7
0.8
0.9
1
B
Superficie respuesta estimada en el plano manteniendo constante una variable
388
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
ANEXO
389
Palacios C. Severo
p = 0.1 (99%) 1
2
3
4
5
6
7
8
9
10
1
4052.18
4999.34
5403.53
5624.26
5763.96
5858.95
5928.33
5980.95
6022.40
6055.93
2
98.50
99.00
99.16
99.25
99.30
99.33
99.36
99.38
99.39
99.40
3
34.12
30.82
29.46
28.71
28.24
27.91
27.67
27.49
27.34
27.23
4
21.20
18.00
16.69
15.98
15.52
15.21
14.98
14.80
14.66
14.55
5
16.26
13.27
12.06
11.39
10.97
10.67
10.46
10.29
10.16
10.05
6
13.75
10.92
9.78
9.15
8.75
8.47
8.26
8.10
7.98
7.87
7
12.25
9.55
8.45
7.85
7.46
7.19
6.99
6.84
6.72
6.62
8
11.26
8.65
7.59
7.01
6.63
6.37
6.18
6.03
5.91
5.81
9
10.56
8.02
6.99
6.42
6.06
5.80
5.61
5.47
5.35
5.26
10
10.04
7.56
6.55
5.99
5.64
5.39
5.20
5.06
4.94
4.85
11
9.65
7.21
6.22
5.67
5.32
5.07
4.89
4.74
4.63
4.54
12
9.33
6.93
5.95
5.41
5.06
4.82
4.64
4.50
4.39
4.30
13
9.07
6.70
5.74
5.21
4.86
4.62
4.44
4.30
4.19
4.10
14
8.86
6.51
5.56
5.04
4.69
4.46
4.28
4.14
4.03
3.94
15
8.68
6.36
5.42
4.89
4.56
4.32
4.14
4.00
3.89
3.80
16
8.53
6.23
5.29
4.77
4.44
4.20
4.03
3.89
3.78
3.69
17
8.40
6.11
5.19
4.67
4.34
4.10
3.93
3.79
3.68
3.59
18
8.29
6.01
5.09
4.58
4.25
4.01
3.84
3.71
3.60
3.51
19
8.18
5.93
5.01
4.50
4.17
3.94
3.77
3.63
3.52
3.43
20
8.10
5.85
4.94
4.43
4.10
3.87
3.70
3.56
3.46
3.37
21
8.02
5.78
4.87
4.37
4.04
3.81
3.64
3.51
3.40
3.31
22
7.95
5.72
4.82
4.31
3.99
3.76
3.59
3.45
3.35
3.26 3.21
23
7.88
5.66
4.76
4.26
3.94
3.71
3.54
3.41
3.30
24
7.82
5.61
4.72
4.22
3.90
3.67
3.50
3.36
3.26
3.17
25
7.77
5.57
4.68
4.18
3.85
3.63
3.46
3.32
3.22
3.13
26
7.72
5.53
4.64
4.14
3.82
3.59
3.42
3.29
3.18
3.09
27
7.68
5.49
4.60
4.11
3.78
3.56
3.39
3.26
3.15
3.06
28
7.64
5.45
4.57
4.07
3.75
3.53
3.36
3.23
3.12
3.03
29
7.60
5.42
4.54
4.04
3.73
3.50
3.33
3.20
3.09
3.00
30
7.56
5.39
4.51
4.02
3.70
3.47
3.30
3.17
3.07
2.98
31
7.53
5.36
4.48
3.99
3.67
3.45
3.28
3.15
3.04
2.96
32
7.50
5.34
4.46
3.97
3.65
3.43
3.26
3.13
3.02
2.93
33
7.47
5.31
4.44
3.95
3.63
3.41
3.24
3.11
3.00
2.91
34
7.44
5.29
4.42
3.93
3.61
3.39
3.22
3.09
2.98
2.89
35
7.42
5.27
4.40
3.91
3.59
3.37
3.20
3.07
2.96
2.88
36
7.40
5.25
4.38
3.89
3.57
3.35
3.18
3.05
2.95
2.86
37
7.37
5.23
4.36
3.87
3.56
3.33
3.17
3.04
2.93
2.84
38
7.35
5.21
4.34
3.86
3.54
3.32
3.15
3.02
2.92
2.83
39
7.33
5.19
4.33
3.84
3.53
3.30
3.14
3.01
2.90
2.81
40
7.31
5.18
4.31
3.83
3.51
3.29
3.12
2.99
2.89
2.80
60
7.08
4.98
4.13
3.65
3.34
3.12
2.95
2.82
2.72
2.63
100
6.90
4.82
3.98
3.51
3.21
2.99
2.82
2.69
2.59
2.50
120
6.85
4.79
3.95
3.48
3.17
2.96
2.79
2.66
2.56
2.47
∞
6.64
4.61
3.78
3.32
3.02
2.80
2.64
2.51
2.41
2.32
390
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
p = 0,25 (97,5%) 1
2
3
4
5
6
7
8
9
10
1
647.79
799.48
864.15
899.60
921.83
937.11
948.20
956.64
963.28
968.63
2
38.51
39.00
39.17
39.25
39.30
39.33
39.36
39.37
39.39
39.40
3
17.44
16.04
15.44
15.10
14.88
14.73
14.62
14.54
14.47
14.42
4
12.22
10.65
9.98
9.60
9.36
9.20
9.07
8.98
8.90
8.84
5
10.01
8.43
7.76
7.39
7.15
6.98
6.85
6.76
6.68
6.62
6
8.81
7.26
6.60
6.23
5.99
5.82
5.70
5.60
5.52
5.46
7
8.07
6.54
5.89
5.52
5.29
5.12
4.99
4.90
4.82
4.76
8
7.57
6.06
5.42
5.05
4.82
4.65
4.53
4.43
4.36
4.30 3.96
9
7.21
5.71
5.08
4.72
4.48
4.32
4.20
4.10
4.03
10
6.94
5.46
4.83
4.47
4.24
4.07
3.95
3.85
3.78
3.72
11
6.72
5.26
4.63
4.28
4.04
3.88
3.76
3.66
3.59
3.53
12
6.55
5.10
4.47
4.12
3.89
3.73
3.61
3.51
3.44
3.37
13
6.41
4.97
4.35
4.00
3.77
3.60
3.48
3.39
3.31
3.25
14
6.30
4.86
4.24
3.89
3.66
3.50
3.38
3.29
3.21
3.15
15
6.20
4.77
4.15
3.80
3.58
3.41
3.29
3.20
3.12
3.06
16
6.12
4.69
4.08
3.73
3.50
3.34
3.22
3.12
3.05
2.99
17
6.04
4.62
4.01
3.66
3.44
3.28
3.16
3.06
2.98
2.92
18
5.98
4.56
3.95
3.61
3.38
3.22
3.10
3.01
2.93
2.87
19
5.92
4.51
3.90
3.56
3.33
3.17
3.05
2.96
2.88
2.82
20
5.87
4.46
3.86
3.51
3.29
3.13
3.01
2.91
2.84
2.77
21
5.83
4.42
3.82
3.48
3.25
3.09
2.97
2.87
2.80
2.73
22
5.79
4.38
3.78
3.44
3.22
3.05
2.93
2.84
2.76
2.70
23
5.75
4.35
3.75
3.41
3.18
3.02
2.90
2.81
2.73
2.67
24
5.72
4.32
3.72
3.38
3.15
2.99
2.87
2.78
2.70
2.64
25
5.69
4.29
3.69
3.35
3.13
2.97
2.85
2.75
2.68
2.61
26
5.66
4.27
3.67
3.33
3.10
2.94
2.82
2.73
2.65
2.59 2.57
27
5.63
4.24
3.65
3.31
3.08
2.92
2.80
2.71
2.63
28
5.61
4.22
3.63
3.29
3.06
2.90
2.78
2.69
2.61
2.55
29
5.59
4.20
3.61
3.27
3.04
2.88
2.76
2.67
2.59
2.53
30
5.57
4.18
3.59
3.25
3.03
2.87
2.75
2.65
2.57
2.51
31
5.55
4.16
3.57
3.23
3.01
2.85
2.73
2.64
2.56
2.50
32
5.53
4.15
3.56
3.22
3.00
2.84
2.71
2.62
2.54
2.48
33
5.51
4.13
3.54
3.20
2.98
2.82
2.70
2.61
2.53
2.47
34
5.50
4.12
3.53
3.19
2.97
2.81
2.69
2.59
2.52
2.45
35
5.48
4.11
3.52
3.18
2.96
2.80
2.68
2.58
2.50
2.44
36
5.47
4.09
3.50
3.17
2.94
2.78
2.66
2.57
2.49
2.43
37
5.46
4.08
3.49
3.16
2.93
2.77
2.65
2.56
2.48
2.42
38
5.45
4.07
3.48
3.15
2.92
2.76
2.64
2.55
2.47
2.41
39
5.43
4.06
3.47
3.14
2.91
2.75
2.63
2.54
2.46
2.40
40
5.42
4.05
3.46
3.13
2.90
2.74
2.62
2.53
2.45
2.39
60
5.29
3.93
3.34
3.01
2.79
2.63
2.51
2.41
2.33
2.27
100
5.18
3.83
3.25
2.92
2.70
2.54
2.42
2.32
2.24
2.18
120
5.15
3.80
3.23
2.89
2.67
2.52
2.39
2.30
2.22
2.16
∞
5.03
3.69
3.12
2.79
2.57
2.41
2.29
2.19
2.11
2.05
391
Palacios C. Severo
p = 0.05 (95%) 1
2
3
4
5
6
7
8
9
10
161.45
199.50
215.71
224.58
230.16
233.99
236.77
238.88
240.54
241.88
2
18.51
19.00
19.16
19.25
19.30
19.33
19.35
19.37
19.38
19.40
3
10.13
9.55
9.28
9.12
9.01
8.94
8.89
8.85
8.81
8.79
4
7.71
6.94
6.59
6.39
6.26
6.16
6.09
6.04
6.00
5.96
5
6.61
5.79
5.41
5.19
5.05
4.95
4.88
4.82
4.77
4.74
6
5.99
5.14
4.76
4.53
4.39
4.28
4.21
4.15
4.10
4.06
1
7
5.59
4.74
4.35
4.12
3.97
3.87
3.79
3.73
3.68
3.64
8
5.32
4.46
4.07
3.84
3.69
3.58
3.50
3.44
3.39
3.35
9
5.12
4.26
3.86
3.63
3.48
3.37
3.29
3.23
3.18
3.14
10
4.96
4.10
3.71
3.48
3.33
3.22
3.14
3.07
3.02
2.98 2.85
11
4.84
3.98
3.59
3.36
3.20
3.09
3.01
2.95
2.90
12
4.75
3.89
3.49
3.26
3.11
3.00
2.91
2.85
2.80
2.75
13
4.67
3.81
3.41
3.18
3.03
2.92
2.83
2.77
2.71
2.67
14
4.60
3.74
3.34
3.11
2.96
2.85
2.76
2.70
2.65
2.60
15
4.54
3.68
3.29
3.06
2.90
2.79
2.71
2.64
2.59
2.54
16
4.49
3.63
3.24
3.01
2.85
2.74
2.66
2.59
2.54
2.49 2.45
17
4.45
3.59
3.20
2.96
2.81
2.70
2.61
2.55
2.49
18
4.41
3.55
3.16
2.93
2.77
2.66
2.58
2.51
2.46
2.41
19
4.38
3.52
3.13
2.90
2.74
2.63
2.54
2.48
2.42
2.38
20
4.35
3.49
3.10
2.87
2.71
2.60
2.51
2.45
2.39
2.35
21
4.32
3.47
3.07
2.84
2.68
2.57
2.49
2.42
2.37
2.32
22
4.30
3.44
3.05
2.82
2.66
2.55
2.46
2.40
2.34
2.30
23
4.28
3.42
3.03
2.80
2.64
2.53
2.44
2.37
2.32
2.27
24
4.26
3.40
3.01
2.78
2.62
2.51
2.42
2.36
2.30
2.25 2.24
25
4.24
3.39
2.99
2.76
2.60
2.49
2.40
2.34
2.28
26
4.23
3.37
2.98
2.74
2.59
2.47
2.39
2.32
2.27
2.22
27
4.21
3.35
2.96
2.73
2.57
2.46
2.37
2.31
2.25
2.20
28
4.20
3.34
2.95
2.71
2.56
2.45
2.36
2.29
2.24
2.19
29
4.18
3.33
2.93
2.70
2.55
2.43
2.35
2.28
2.22
2.18 2.16
30
4.17
3.32
2.92
2.69
2.53
2.42
2.33
2.27
2.21
31
4.16
3.30
2.91
2.68
2.52
2.41
2.32
2.25
2.20
2.15
32
4.15
3.29
2.90
2.67
2.51
2.40
2.31
2.24
2.19
2.14
33
4.14
3.28
2.89
2.66
2.50
2.39
2.30
2.23
2.18
2.13
34
4.13
3.28
2.88
2.65
2.49
2.38
2.29
2.23
2.17
2.12
35
4.12
3.27
2.87
2.64
2.49
2.37
2.29
2.22
2.16
2.11
36
4.11
3.26
2.87
2.63
2.48
2.36
2.28
2.21
2.15
2.11
37
4.11
3.25
2.86
2.63
2.47
2.36
2.27
2.20
2.14
2.10
38
4.10
3.24
2.85
2.62
2.46
2.35
2.26
2.19
2.14
2.09
39
4.09
3.24
2.85
2.61
2.46
2.34
2.26
2.19
2.13
2.08
40
4.08
3.23
2.84
2.61
2.45
2.34
2.25
2.18
2.12
2.08
60
4.00
3.15
2.76
2.53
2.37
2.25
2.17
2.10
2.04
1.99
100
3.94
3.09
2.70
2.46
2.31
2.19
2.10
2.03
1.97
1.93
120
3.92
3.07
2.68
2.45
2.29
2.18
2.09
2.02
1.96
1.91
∞
3.84
3.00
2.61
2.37
2.21
2.10
2.01
1.94
1.88
1.83
392
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
Distribución Chi - Cuadrado alfa = área a la derecha de x2 (GL, alfa) X~X2 (GL) GL
P(X > X2(GL, alfa)) alfa 0.025
0.010
1
2.7055
3.8415
5.0239
6.6349
2
4.6052
5.9915
7.3778
9.2104 10.5965
3
6.2514
7.8147
9.3484 11.3449 12.8381
4
7.7794
9.4877
11.1433 13.2767 14.8602
5
0.100
0.050
0.005 7.8794
9.2363 11.0705 12.8325 15.0863 16.7496
6
10.6446 12.5916 14.4494
7
12.0170 14.0671 16.0128 18.4753 20.2777
16.8119 18.5475
8
13.3616 15.5073 17.5345 20.0902 21.9549
9
14.6837 16.9190 19.0228 21.6660 23.5893
10
15.9872 18.3070 20.4832 23.2093 25.1881
11
17.2750 19.6752 21.9200 24.7250 26.7569
12 18.5493 21.0261 23.3367 26.2170 28.2997 13
19.8119 22.3620 24.7356 27.6882 29.8193
14
21.0641 23.6848 26.1189 29.1412 31.3194
15
22.3071 24.9958 27.4884 30.5780 32.8015
16 23.5418 26.2962 28.8453 31.9999 34.2671 17 24.7690 27.5871 30.1910 33.4087 35.7184 18 25.9894 28.8693 31.5264 34.8052 37.1564 19 27.2036 30.1435 32.8523 36.1908 38.5821 20 28.4120 31.4104 34.1696 37.5663 39.9969 21
29.6151 32.6706 35.4789 38.9322 41.4009
22 30.8133 33.9245 36.7807 40.2894 42.7957 23 32.0069 35.1725 38.0756 41.6383 44.1814 24 33.1962 36.4150 39.3641 42.9798 45.5584 25 34.3816 37.6525 40.6465 44.3140 46.9280 26 35.5632 38.8851 41.9231 45.6416 48.2898 27 28
36.7412 40.1133 43.1945 46.9628 49.6450 37.91
393
Palacios C. Severo
T~t(GL) GL
P(T > t(GL, alfa)) alfa
0.1000
0.0500
0.0250
0.0100
0.0050
0.0010
0.0005
1
3.078
6.314
12.706
31.821
63.656
318.289
636.578
2
1.886
2.920
4.303
6.965
9.925
22.328
31.600
3
1.638
2.353
3.182
4.541
5.841
10.214
12.924
4
1.533
2.132
2.776
3.747
4.604
7.173
8.610
5
1.476
2.015
2.571
3.365
4.032
5.894
6.869
6
1.440
1.943
2.447
3.143
3.707
5.208
5.959
7
1.415
1.895
2.365
2.998
3.499
4.785
5.408
8
1.397
1.860
2.306
2.896
3.355
4.501
5.041
9
1.383
1.833
2.262
2.821
3.250
4.297
4.781
10
1.372
1.812
2.228
2.764
3.169
4.144
4.587
11
1.363
1.796
2.201
2.718
3.106
4.025
4.437
12
1.356
1.782
2.179
2.681
3.055
3.930
4.318
13
1.350
1.771
2.160
2.650
3.012
3.852
4.221
14
1.345
1.761
2.145
2.624
2.977
3.787
4.140 4.073
15
1.341
1.753
2.131
2.602
2.947
3.733
16
1.337
1.746
2.120
2.583
2.921
3.686
4.015
17
1.333
1.740
2.110
2.567
2.898
3.646
3.965
18
1.330
1.734
2.101
2.552
2.878
3.610
3.922
19
1.328
1.729
2.093
2.539
2.861
3.579
3.883
20
1.325
1.725
2.086
2.528
2.845
3.552
3.850
21
1.323
1.721
2.080
2.518
2.831
3.527
3.819
22
1.321
1.717
2.074
2.508
2.819
3.505
3.792
23
1.319
1.714
2.069
2.500
2.807
3.485
3.768
24
1.318
1.711
2.064
2.492
2.797
3.467
3.745
25
1.316
1.708
2.060
2.485
2.787
3.450
3.725
26
1.315
1.706
2.056
2.479
2.779
3.435
3.707
27
1.314
1.703
2.052
2.473
2.771
3.421
3.689
28
1.313
1.701
2.048
2.467
2.763
3.408
3.674
29
1.311
1.699
2.045
2.462
2.756
3.396
3.660
30
1.310
1.697
2.042
2.457
2.750
3.385
3.646
31
1.309
1.696
2.040
2.453
2.744
3.375
3.633
32
1.309
1.694
2.037
2.449
2.738
3.365
3.622
33
1.308
1.692
2.035
2.445
2.733
3.356
3.611
34
1.307
1.691
2.032
2.441
2.728
3.348
3.601
35
1.306
1.690
2.030
2.438
2.724
3.340
3.591
36
1.306
1.688
2.028
2.434
2.719
3.333
3.582
37
1.305
1.687
2.026
2.431
2.715
3.326
3.574
38
1.304
1.686
2.024
2.429
2.712
3.319
3.566 3.558
39
1.304
1.685
2.023
2.426
2.708
3.313
40
1.303
1.684
2.021
2.423
2.704
3.307
3.551
60
1.296
1.671
2.000
2.390
2.660
3.232
3.460
120
1.289
1.658
1.980
2.358
2.617
3.160
3.373
∞
1.282
1.645
1.960
2.327
2.576
3.091
3.291
394
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
REFERENCIAS (1)
(2) (3)
(4)
(5) (6) (7) (8) (9) (10) (11) (12) (13)
(14) (15)
Aguirre, Y.C.; S.Z. Marrero M. 1991. Efecto de la fertilización química y orgánica sobre el rendimiento de lechuga (Lactuca sativa L.) bajo un diseño compuesto central rotable a cinco niveles. Trabajo presentado para optar al título de Ingeniero Agrónomo Facultad de Agronomía, Universidad Central de Venezuela. 151 p. Álvarez J., Bases del Diseño Experimental American Public Health Association, apha; American Water Association, awwa; Water Pollution Control Federation, WPCF. Métodos normalizados para el análisis de aguas potables y residuales, 1994. Ascanio, M., F. Chacin, & W. Machado, 1996.- Comparison between the orthoghonal central composite designs (OCCD) and the rotable central composite design (RCCD) in experiments with vegetable tissue culture. Biometric Bulletin International Biometric Society 13: 2. Aymerich, S. M. Conceptos para tratamiento de residuos lácteos. CNp. Costa rica. p.12 (2000) Bowker, A.H., Lieberman, G.J., 1981, Estadística para ingenieros, Prentice Hall Internacional. Box, G.E.P. y Draper, N.R., 1969, Evolutionary operation Wiley Box, G.E. and Wilson, K. B., 1951. On Experimental Attainment of Optimum Conditions J. R. S. S. B. 13 1-45. Box, G.E. P. y J.S. Hunter (1951): Multifactor experimental designs for exploring response surfaces. J.R.S.S. ser. B, vol. 13, No. 1, 195-240. Box, G. E. P., Hunter, W. G., and Hunter, J. S. 1978. Statistics for Experimenters. New York: John Wiley & Sons, Inc. Bacon, D.W., Collection and Interpretation of Industrial Data Bernard O., Evolutionary Operation Bergoña M., Martín-García, D. Bellido-Milla, A. JiménezJiménez and Hernández-Artiga, María P.. (1999) Application of factorial design to the determination o lubricating oil by continuous flow hydride generation atomic absorption spectrometry J. Anal. Chem. 364: 527-532. Bradley, E.L. and Blackwood, L. G. 1989. Comparing paired data: A simultaneous test for means and variances. The American Statistician, 43, pp 234-235. Brito, M.; F. Rocha. 1991. Efecto de la fertilización con N, K, Caliza agrícola y materia orgánica, sobre algunas característi395
Palacios C. Severo
(16) (17) (18) (19) (20) (21) (22) (23)
(24)
(25) (26) (27)
(28)
396
cas del cultivo de ajo (Allium sativum L.) sobre la población del nematodo (Ditylenchus dipsaci) bajo un diseño de superficie compuesto central rotable. Trabajo presentado para optar al título de Ingeniero Agrónomo Facultad de Agronomía, Universidad Central de Venezuela. 167 p. Brown, M.B. and Forsythe, A. B. 1974. Robust Tests for Equality of Variances. Journal of the American Statistical Association, 69, pp 364 - 367. Box G.E.P., Statistics for Experimenters Box, G.E.P. y Wilson, K.B. 1951.On the Experimental Attainment of Optimum Conditions Surfaces. Journal of the Royal Statistical Society. 13 (1):1-45. Box, G.E.P. y Hunter, J.S. 1957. Multifactor Experimental Designs for Exploring Response Surfaces. Annals of Mathematical Statistics. 28:195-241. Box, G. E. P., Hunter, W. G. y J. S. Hunter, Statistics for Experimenters, Wiley, New York, 1978. Brown, M. B. and Forsythe, A. B. 1974. Robust Tests for Equality of Variances. Journal of the American Statistical Association, 69, pp 364 - 367. Brownlee, K.A. 1957. The Principies of Experimental Design Industrial Quality Control, 13, pp 1-9. Candal, R., Bilmes, S. Y BlesA, M. Semiconductores con Actividad Fotocatalítica: Eliminación de Contaminantes por Fotocatálisis Heterogénea. Editor: Miguel Blesa, Red CYTED VIII-G, 79-101, 2001. Cirelli, A.F. y Portier, C. Evaluación de la condición del agua para consumo humano en Latinoamérica, En: Tecnologías solares para la desinfección y descontaminación del agua. Solar Safe Water, 11-26, 2005. Carroll Croakin, M. y Tobias, P., Engineering Statistics Handbook. http://www.itl.nist.gov/div898/ handbook. Carroll Croakin, M., Statistics and Measurements, Journal of Research of the NIST 106, 2001, pp. 279-292. Chacín, F. 1991. Planificación experimental y comercial (Diseño EXCO) para ensayos con fertilizantes. En: Reuniáo Anual da Regiáo Brasileira da Sociedade Internacional de Biometría, 36a. Simpósio de Estadística Aplicada á experimentaçáo agronómica, 4to. Goiánia Gaias (Brasil). Jul. 15-19.1991. Resúmenes. Goiánia. p. 32. Chacín, L. F., 1998.- Análisis de regresión y superficie de respuesta. UCV. Facultad de Agronomía. Maracay, Venezuela. 274 pp.
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(29) Cochran, W.G. and Cox, G. M. 1957. Experimental Designs. Second Edition, New York. John Wiley & Sons. (30) Cochran, W.G. y Cox, G. M. 1974. Diseños Experimentales. Editorial Trillas, México. (31) Cochran – Cox, Experimental Designs Second Edition, New York. (32) Conover, W. J., Johnson, M. E., and Johnson, M. M. 1981. A Comparative Study of Tests for Homogeneity of Variances, with Applications to the Outer Continental Shelf Bidding Data. Technometrics, 23, pp 351 - 361. (33) Cornell, John A,. (1990.): How to apply response surface methodology. Milwaukee, WI. (34) Cornell, J. A., Experiments with Mixtures, Wiley, New York, 1990. (35) Cox, D.R. 1958. Planning of experiments. John Wiley and Sons. New York. (36) Cramer, S. G. and Swanson, M. R. 1973. Evaluation of Ten Pairwise Multiple Comparison Procedures by Monte-Carlo Methods. Journal of the American Statistical Association, 68, pp 66 74. (37) Davies, O., Aplicación de la Técnica Experimental de la Superficie Respuesta (38) Davies C., The Design and Analysis of Industrial Experimental, Oliver and Boyd. London 2da. Edit. 1967. 636 p. (39) Díaz, M.; A. Mijares. 1991. Efecto de diferentes niveles de fertilización química y orgánica sobre el rendimiento de remolacha (Beta vulgaris L.) bajo un diseño compuesto central rotable a cinco niveles. Trabajo presentado para optar al título de Ingeniero Agrónomo Facultad de Agronomía, Universidad Central de Venezuela. 153 p. (40) Doménech X., Jardim W.F. Y Litter M. Procesos Avanzados de Oxidación para la eliminación de contaminantes, En: Eliminación de Contaminantes por Fotocatálisis Heterogénea. Editor: Miguel Blesa, Red CYTED VIII-G, 3 – 26, 2001. (41) Douglas C. Montgomery.- Diseño y Análisis de experimentos.Editorial iberoamericana 1991. (42) Draper, N.R. and Smith, H. 1998. Applied Regression Analysis. Third Edition. New York: John Wiley & Sons, Inc. (43) Duncan, D.B. 1975. t Tests and Intervals for Comparisons Suggested by the Data. Biometrics, 31, pp 339 - 359. (44) Dunnett, C.W. 1955. A Multiple Comparisons Procedure for Comparing Several Treatments with a Control. Journal of the American Statistical Association, 50, pp 1096 - 1121. 397
Palacios C. Severo
(45) Dunn, O.J. and Clark, V. A. 1987. Applies Statistical Analysis of Variance and Regression. 2da edition, John Wiley and Sons. New Cork. (46) Dunnett, C.W. 1980. Pairwise Multiple Comparisons in the Homogeneous Variance, Unequal Sample Size Case. Journal of the American Statistical Association, 75, pp 789 - 795. (47) Einot, I. and Gabriel, K. R. 1975. A Study of the Powers of Several Methods of Multiple Comparisons. Journal of the American Statistical Association, 70, pp 574-583. (48) Eisenhart, C. 1947. The Assumptions Underlying the Analysis of Variance. Biometrics, 3, pp 1 - 21. (49) Eisenhart, C. 1984. The assumptions Underling Analysis of Variance. Biometrics 3,1. (50) Esplugas, S. Y Ollis, D.F. Economical Aspects of Integrated (Chemical + Biological) Processes for Water Treatment, Journal of Advanced Oxidation Technologies, 4 (2), 197 – 202, 1997. (51) Federek, W.T. 1955. Experimental Design Theory and Applications. McMillan Company. (52) Finney, D.J. 1955. An Introduction to the Theory of Experimental Design. The University of Chicago Press. Chicago. (53) Finney, D.J. 1960. An introduction to the theory of experimental design. The university of Chicago Press. Chicago. (54) Fisher, R.A. 1925. Statistical Methods for Research Workers. Edinburgh: Oliver & Boyd. (55) Fisher, R.A. 1935. The Design of Experiments. Edinburgh: Oliver and Boyd. (56) Fisher, R.A. and Yates, F. 1957. Statistical tables for biological, agricultural and medical research. 5th edition. New York: Hafner Public Co., Inc. (57) Folks, J.S. 1958. Comparison of Designs of Exploration of Relation Ships. Disertación Doctoral no publicada. Iowa State University. (58) Gill, J.L. 1978. Design and analysis of experiments. Vols 1 and 2. Ames Iowa: Iowa State University Press. (59) Grossa, H. Disponibilidad y características de la radiación solar en Sudamérica: Tecnologias solares para la desinfección y descontaminación del agua. Solar Safe Water, 85-92, 2005. (60) Hashemi P., Baheri S., Reza Fat’hi M. Factorial design optimization of experimental variables in preconcentration of cooper by a chromotropic acid loaded Q-Sepharose adsorbent. Talanta 68 (2005) 72-78. Published by Elsevier B.V. (2005). (61) Heckman, J.; Smith, J. Experimental and nonexperimental evaluation. En: Schmid, G. et al. (Eds.) International handbook of 398
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(62)
(63) (64) (65) (66) (67) (68) (69) (70) (71)
(72)
(73)
(74)
labour market policy and evaluation. New York: Elsevier Science, 1996. Herrmann, J.M. Destrucción de contaminantes orgánicos por Fotocatálisis Heterogénea, En: Tecnologías solares para la desinfección y descontaminación del agua. Solar Safe Water, 147164, 2005. Hopkins, K.D, Hopkins, B.R. y Glass, G.V., Estadística básica para las ciencias sociales y del comportamiento (3a Edición) Hunter, W.G., 1976, Some ideas about teaching design of experiments with 25 examples of experiments conducted by students, American Statistician, 31, 12. ISO TAG4 WG3: Guide to the Expression of Uncertainty in Measurement, 1992. John, R.C. and Draper, N.R. 1975. D-optimality for Regression Designs: A Review. Technometrics. 17 (1):15-23. Kackar, R. N., Off-Line Quality Control, Parameter Design and the Taguchi Method, Journal of Quality Technology 17, 1985, pp. 176-188 Khuri, André I. y John A. Cornell. (1996): Response surfaces: designs and analyses. Marcel Dekker, New York. Kiefer, J. 1959. Optimum Experimental Designs. Journal of the Royal Statistical Society.B21 (2):272-319. Koroliuk, Manual de la Teoría de Probabilidad y Estadística Matemática. Machado, W. 1992. Comparación teórica y práctica de algunos diseños de tratamiento utilizados para estimar superficies de respuesta en ensayos de fertilización nitrogenada y densidad de siembra en el cultivo de maíz (Zea mays L.) y su validación comercial. Trabajo presentado para optar al título de Ingeniero Agrónomo Facultad de Agronomía, Universidad Central de Venezuela. 151 p. Machado, W.; F. Chacín; M. Ascanio.1997. El Diseño EXCO aplicado en la validación de ensayos de fertilización nitrogenada y densidad de siembra en el cultivo de maíz (Zea mays L.). Rev. Fac. Agron. (Maracay) 23:61-66. Machado, W. 1998. Planificación y análisis de experimentos de campo en grandes parcelas sin repetición. Tesis Magister Scientiarum. Facultad de Agronomía, Universidad Central de Venezuela. Maracay, Venezuela. 84 p. Madriz, P. 1996. Caracterización y evaluación de genotipos de frijol mungo (Vigna radiata (L.) Wilczek). Trabajo de ascenso. Facultad de Agronomía. Universidad Central de Venezuela. Maracay. 149 p. 399
Palacios C. Severo
(75) Martínez Garza, Ángel. 1988. Diseños Experimentales. Métodos y Elementos de Teoría. Editorial Trillas México. (76) Marin, J.M; Montoya, J.F; Monsalve, E; Granda, C.F; Rios, L.A; Restrepo, G.M. Degradación de Naranja de Metilo en un Nuevo Fotorreactor Solar de Placa Plana con Superficie Corrugada; Scientia et Technica, XIII (34), 435-440, 2007. (77) Matthews, R. Kinetics of Photocatalytic Oxidation or Organic solutes over Titanium Dioxide, Journal of Catalysis, 111, 264272, 1987. (78) Ministerio del Medio Ambiente. Normatividad 1594-1984.pdf. (79) Montgomery, 2003, Diseño y Análisis de Experimento México, Segunda Edición, Grupo Editorial Limusa, S. A. (80) Montgomery, D. C., Design and Analysis of Experiments, Wiley, New York, 2001. (81) Mothes. J., 1960, Estadística aplicada a la ingeniería, Ariel. (82) Montoya Vargas, A., Diseño de Experimentos en la Metrología, Taller de Metrología, CIMAT. (83) Myers, Raymond H. y Douglas C. Montgomery.(1995.): Response surface methodology : process and product optimization using designed experiments. Wiley, New York. (84) Myers, R.H. 1971 Response Surface Methodology. Allyn and Bacon, Boston. (85) Palacios C.S., Diseño y Análisis de Experimentos Industriales (86) Palacios C.S., Curso Postgrado “Diseño Experimental” (87) Palacios C.S., Estadística Aplicada (88) Palacios C.S., 2004 Diseño Experimental (Aplicado a ciencia e ingeniería), CONCYTEC (89) Peterson Roger G., 1985. Design and analysis of experiments. (90) Scott, J.P. Y Ollis, D.F. Integration of Chemical and Biological Oxidation Processes for Water Treatment: Review and Recommendations, Environmental Progress, 14 (2), 88 – 103, 1995. (91) Statgraphics, Manugistics Inc. and Statistical Graphics Corporation (92) Scheffe, H., 1959. The Analysis of variance. John Wiley & Sons, Inc. New York. (93) UNESCO. Water for people, water for lives – UN World Water Development Report. Paris, 2004. (94) Villasmil, J.J. 1978. Estructura, Eficiencia Relativa y Análisis Estadístico del Diseño San Cristóbal Ortogonalizado. Universidad del Zulia, Facultad de Agronomía. Maracaibo. (95) Voller, V.R. and Prakash C., 1987, A fixed grid numerical modeling methodology for convection diffusion mushy region phase400
ESTADÍSTICA EXPERIMENTAL Aplicada a ciencia e ingeniería
(96) (97) (98) (99) (100)
change problems. Int. J. Heat Mass Transfer, Vol. 30, No 8, pp 1709 - 1719. Winer, B.J., 1991. Statistical Principles in Experimental Design. Mc Graw Hill. Wine R.L., Statistics for Scientists and Engineers. Wu, J. C. F y M. Hamada, Experiments, Wiley, New York, 2000. Yates, F., 1934. Design and analysis of factorial experiments. London: Tech Communication. No 35, Imperial Bureaus of Soil Sciences. Young H., Statistical Treatment of Experimental data.
401
Palacios C. Severo
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería Se termino de imprimir en los talleres Gráficos de …………………………, ubicado en la Av. …………………….., Teléfono ………………….. Con un tiraje de 1000 libros Noviembre 2010 402