Diseño Experimento Solis
July 24, 2022 | Author: Anonymous | Category: N/A
Short Description
Download Diseño Experimento Solis...
Description
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
UNID AD A D II. CONCEPTOS FUND AM A MENT AL A L ES 1.1. IINTRODUCCIÓN En este este pu punto nto
se d dan an d definiciones efiniciones de lo loss co conceptos nceptos fundamentales
relacionadas con el diseño de experimentos:
TR AT A MIENTO. Elemento o sujeto sometido a estudio o aun ensayo de comparación, ejemplo estudiar 5 variedades, 5 dosis de fertilizantes, 5 herbicidas (Reyes, 1992). Cuando se mide el efecto de un tratamiento, se mide en u una na unidad de muestreo, muestreo, cierta fracción de la unidad experimentan. Por lo tanto, la unidad de muestreo puede ser la unidad completa, tal como un animal sometido a una ración de tratamientos, o muestra aleatoria de hojas de un árbol tratado o la cosecha de 6 pies de surco central de la un unida ida experimental de 3 surcos. En algunos casos, la unidad experimental será tan grande que su uso no será práctico como unidad de muestreo, en tanto que una sola unidad de muestreo pequeña es inadecuada. En tales ca casos, sos, se miden dos o más subdivisiones aleatorias de la unidad unidad experimental. Por ejemplo: al estudia estudiarr prácticas de cultivo para establecer la densidad de las especies forrajeras se cuentan separadamente las plántulas en dos o más áreas pequeñas, aleatorias dentro de una unidad experimental. Así mismo, cuando sse e debe distribuir una unidad de muestreo, como en el caso caso de la calida calidad d de frutos, legumbres o productos alimen alimenticios ticios para el mercado, se toman unidades de muestreo dentro de cada unidad experimental. Al seleccionar un conjunto de tratamientos, es importante definir cada tratamiento cuidadosamente y considerarlo con respecto a cada uno de los demás tratamientos para asegurarse, en lo posible, que el conjunto dé respuestas relacionadas con los objetivos del experimento (Steel y Torrie, 1995). Ostle (1983), hace mención de la siguiente serie de tratamientos que deben imponerse a una unidad experimental dentro de los confines del diseño seleccionado. 1
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
1) En experimentación agronómica, un tratamiento puede referirse: a) a una marca de fertilizante, b) a una cantidad de fertilizante, c) a la profundidad de sembrado ó d) d) a una comb combinación inación de (b) y (c). El último ejemplo se sería ría llamado más apropiadamente una combinación de tratamiento. 2) En experimentación d de e nutrición animal, un tratamiento puede puede referirse a: a) a una cría de ganado lanar, b) el sexo de los animales, c) el padre del animal experimental ó d) la ración particular del alimento de un animal. 3) En estudios psicoló psicológicos gicos y sociológicos sociológicos,, un tratamiento se puede referir a: a) edad, b) sexo, c) grado de educación. 4) En un experimento para estudiar el rendimiento de cierto p proceso roceso químico, los tratamientos pueden ser toda la combinaciones de: a) la temperatura a la cual se ejecuta el proceso y b) la cantidad de catalizador usada.
TESTIGO. Sujeto o tratamiento de comparación. Al realizar u un n e experimento, xperimento, siempre se debe incluir un testigo para medir el resultado de un experimento o el avance del programa.
Por ejemplo: si se van a usar 5 tratamientos con
fertilizantes, el testigo será aquél tratamiento que no incluirá fertilizante, teniendo un experimento con 6 tratamientos. Si se comparan 8 variedades de sorgo, introducidas o experimentales, es necesario incluir variedades más comerciales de la región como testigo. La elección del trata tratamiento miento es de gran imp importancia ortancia en cualquier investigación (Reyes,1992). sobre obre el cual sse e aplican los UNID AD A D EXPERIMENT AL A L . Es el material o lugar s tratamientos en estudio.
Por ejemplo una parcela, una mace maceta ta o grupo de
macetas, un cerd cerdo o o grupo de cerdos, un conjunto de sem semillas, illas, etc.
Es
característico de las unidades experimentales que muestren variación aun cuando se les aplique el mismo tratamiento (Reyes, 1992). A menudo, el material se prepara especialmente para propósitos experimentales, como en el desarrollo de líneas puras en laboratorios encargados de la e experimentación xperimentación animal.
Alternativamente, el experimentó puede ser
reducido a una muestra, escogida por homogeneidad, de un gran lote de material 2
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
experimental. Si los resultados del ex experimento perimento van a ser ap aplicados licados a material no seleccionado, estos estos tipos de es especialización pecialización tienen desventajas poten potenciales. ciales. Las respuestas obtenidas para tratamientos sobre material experimental altamente seleccionado, pueden ser las mismas que se obtienen del material no seleccionado (Cochran y Cox, 1980). Cuando se trabaja con macetas en un invernadero o con cajas petrí en un laboratorio, por ejemplo, estos materiales pueden ser relativamente uniformes, pero no es difícil que se presente un gradiente de luz o de temperatura de los muros o ventanas d del el local.
En estas condiciones, el experimentad experimentador or puede
formar franjas uniformes perpendiculares a los gradientes y distribuir en estas franjas las macetas o cajas las cuales se les aplican los tratamientos en estudio. La estadística dispone de métodos para eliminar la variación entre las franjas, y el sorteo de los tratamientos en la franjas reduce los errores. Cuando se trabaja con animales, un importante factor de variación es la capacidad fisiológica de cada animal; por ejemplo, si se necesita aplicar varios tratamientos a un grupo de animales y medir los efectos causados por los aumentos de peso, existirá el problema de que uno de los animales aumentará más que otros, aun cuando se les aplique el mismo tratamien tratamiento. to.
En tales
condiciones, es aconsejable hacer estudios previos mediante ensayos en blanco, que consisten en someter a todos los animales a un régimen de alimentación y manejo uniforme por un tiempo determinado, y al final localizar a los animales menos aumentadores. aumentadores. Esto permitirá formar g grupos rupos de anima animales les o estratos muy similares en sus aumentos y dentro de cada grupo uniforme, sortear los tratamientos en estudio.
La estadístic estadística a dispone de métodos para eliminar la
variación entre entre grupos o extractos.
Es recomen recomendable dable utilizar animales d de e la
misma camada y de igual peso y sexo, cuando sea posible (Reyes, 1995). Como regla general, las unidades experimentales grandes presentan menos variación variación que la lass más p pequeñas. equeñas. Esta regla se cumple, en particular, cuando los errores aleatorios se distribuyen normalmente con varianza común, y 3
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
es una consecuencia de la relación σ2 ⎯ x = σ2/n. Sin embargo, aun aumentando el tamaño de la unidad experimental trae a menudo como consecuencia una reducción en el número de repeticiones que pueden tenerse debido a lo limitado del material experimental de que suele disponerse en un experimento dado. Generalmente es más útil lograr una repetición adecuada de parcelas pequeñas que de parcelas grandes (Steel y Torrie, 19 1995). 95). Sobre esto mismo, Rey Reyes es (1992) menciona que el tamaño de la unidad experimental influye en la variabilidad, y la variación es menor menor cuanto más sse e dispersa en e ell campo. Si se dispone de un área de terreno limitada, es preferible sacrificar el tamaño de la parcela y aumentar el número de repeticiones. Así mismo, cuando se trabaje con animales, animales, si se tienen 24 animales y 4 tratamientos, deben usarse 6 repeticiones con un animal, y no 2 animales y 3 tratamientos.
REPETICIONES. Steel y Torrie (1995), mencionan que cuando un tratamiento aparece más de una vez en un experimento se dice que esta repetido. Las funciones de la repetición son:
1) 1) P ermit rmitir ir una eestimació stima stimació ción n de dell eerror rror rror eexperim xperime xpe rimenta ntal. l. Permi Pe tir estimación xperimental. ental. 2) Mejorar Mejo jora rarr la pprecisión rre ec isió isión n de d e un u n eexperimento xp pe eri rime men n to to mediante me med d iia an te te la red re d u cc cc iió ón reducción de la de desv svia iaci ción ón estándar est stá ánda ndar de un una a me medi dia a de tra trata tami mie ento. nto.. desviación media tratamiento tratamiento. 3) 3) Au Aumen mentar tar el alcanc alc ance e de la in inf f erenci eren cia a del exp erimen mentt o a trtravés avés de Aumentar alcance inferencia erencia del experi experimento de la sele se lecc cció ión n y eell us uso o aapropiado pr prop opia iado do de unid un ida ade dess e xpe xperi rime ment nta ale less má máss selección unidades experimentales variables. 4) E jerce jercerr con contro trol sob va rianz nza a de dell eerro rror. rror. Ejercer control cont roll sobre sobrree la varia varianza Reyes
(1995),
menciona
que
las
repeticiones
de
las
unidades
experimentales que reciben idénticos tratamientos reducen, en general, el error experimental y, en consecuencia, aumentara la precisión del experimento. Cuando mayor sea el número de repeticiones, mayor probabilidad habrá de obtener resultados que se acerquen a la realidad.
4
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
En general es mejor aumentar aumentar el número de repe repeticiones ticiones aunque la unidad experimental sea más más pequeña. Las ventajas de usar repeticione repeticioness son:
1) 1) H ay ma mayo yorr pr prob oba aabilidad bilid bilida aad d de aajustar ju just sta ar lo loss resu re sulta ltado doss a la rea re aalidad: lida lidad: la Hay Ha mayor probabilid result ados realidad: x y el el S x me mere rece cen n más más confi con nza aa.. merecen cconfia onfifianz anza. anz
2) 2) D ism isminu inuye ye eell eefecto fe fecto cto de he hete terog roge eneida neidad d de dell suelo. suelo. Dismin uye heterogeneidad 3) 3) Au Aumen menta ta la preci ecisi sión ón del exp experi eri ment men t o al dism smin in ui uir or. or . Aumenta la pr precisión experimento experimento al di disminu irr el err error. error. 4) P ermit rmite e un una a mejor mejor dis distrib tribuci ución ón de los trata tra tamie miento ntos. s. Permit Pe distribu ción tratamie tamientos. Para determinar el número óptimo de repeticiones se hacen ensayos en blanco y se determina el coeficien coeficiente te de variación (CV). En ocasiones se utilizan formulas o se consulta bibliografía para información.
En general varios
investigadores han concluido que el número de repeticiones debe ser tal que el número de grados de libertad (GL) para el error sea de preferencia mayor de 10 y nunca menor de 4. Por lo tanto para determinar el número de repeticiones es necesario:
Revisar la bibliografía respectiva.
Consultar con investigadores de experiencia. experiencia.
Diseñar ensayos en blanco.
Considerar que los grados de libertad para el error sean mayores que 10.
Sacrificar el tamaño para mayor núme número ro de repeticiones.
Considerar la distribución de los tratamientos y su número. Destacar la importancia de dell costo de la unidad ex experimental. perimental.
Considerar el manejo de los objetivos de dell experimento.
Dar importancia a las ventajas y desventajas del uso de un alto número de repeticiones.
La finalidad de hacer una correcta distribución de los tratamientos es:
F acilitar cilitar la inte interpre rpreta tación ción de los re resulta sultados dos experimentales. expe xperime rimenta ntale les. s. Facilitar interpretación resultados
R educirr eell eerror rror eexperimental. xperime xperimenta ntal. l. Reduci Re 5
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
ERROR EXPERIMENT AL A L . Los resultados de los experimentos están afectados no solamente por la acción de los tratamientos, si no también por las variac variaciones iones extrañas que tienden a e encubrir ncubrir sus efectos.
El término error experimental se
aplica frecuentemente a estas variaciones, donde la palabra “error” no es sinónimo de “equivocaciones”, sino que incluye todos los tipos de variaciones extrañas. Ni la presencia de errores experimentales ni sus causas deben preocupar al investigador, siempre que sus resultados sean suficientemente aproximados para alcanzar conclusiones definitivas. En muchos campos de la investigación, y a pesar del tiempo y del trabajo que pueda dedicarse a un experimento, los resultados son tan grandemente influidos por errores experimentales, que solamente las diferencias notables entre tratamientos pueden detectarse y aún éstas, pueden estar sujetas a una gran incertidumbre (Cochran y Cox, 1980). Reyes (1992), menciona que al aplicar tratamientos a las unidades, en los resultados se manifiestan variaciones, las cuales se pueden clasificar en dos grandes grupos:
a) Var i ac i o n es p er t i n en t es . Variaciones debidas a los efectos de los tratamientos si estos producen efectos distintos.
b ) Var i ac i o n es n o p er t i n en t es . Variaciones debidas a causas extrañas que disfrazan los efectos de los tratamientos.
Los métodos estadísticos han
desarrollado técnicas que controlan, por lo menos parcialmente, sus efectos sobre los tratamientos y los reducen. Muchas de esas variaciones extrañas constituyen el error experimental, el cual puede tener dos fuentes:
1) 1) V ar i ac ac i o n es dde e llas as uunidades n i d ad es e x p er im im en t al es (en (en eexperimentos x p er iim m en t o s de de Variaciones experimentales campo, la hete campo, he teroge rogene neida idad d de dell sue suelo) lo).. heterogeneidad su elo). 2) V aria ri ac io ioones ne nes ppor o r la falt fa lta a dde e uunif nif nifo oorm rrmi mid d ad ad een n eell man ma nnejo e ejo jo dde e la lass uunidades nid nida ad es Variaci Va riaciones falta ormidad idad manejo experimentales. 6
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Existen métodos para incrementar la exactitud de los experimentos, estos
pueden clasificarse en 3 tipos: el primero consiste en aumentar la magnitud del experimento; bien sea por medio de más repeticiones, o bien por la adición de más tratamientos. tratamientos. El seg segundo undo cconsiste onsiste e en n refinar la técnica experimental. Como tercero se puede manejar el material experimental de tal manera que los efectos de la variabilidad se reduzcan. reduzcan. Esto se puede hac hacer er por medio de una se selección lección cuidadosa del material, tomando medidas adicionales que den información respecto al material o, finalmente, por un agrupamiento hábil de las unidades experimentales, en tal forma que las unidades a las que se les aplique un tratamiento queden estrechamente comparables con aquellas a las que se les aplique otro tratamiento (Cochran y Cox, 1980). Reyes (1992) supone que el error experimental es uniforme para todas las unidades experimentales, su distribución es normal, su media ( μ) es cero, y su variación esta estimada por medio de la varianza ( σ2). No se puede eliminar el error experimental, pero si reducir sus efectos con el fin de obtener una mejor estimación de los efectos d de e los tratamientos.
Entre las modalidades más
recomendables para la reducción del error están:
Utilización de las unidades experimentales tan uniformes como sea posible (suelo homogéneo).
Tamaño adecuado de las unidades experimentales.
Eliminación del efecto de orilla y la de competencia mutua entre tratamientos (uso de parcela útil).
Utilización de un número de repeticiones eficientes para cada tratamiento.
Manejo de las unidades e experimentales xperimentales tan uniformes como ssea ea posible (riego, densidad de siembra, fertilización, control de plagas, herbicidas, etc.)
Aplicación d de e todos los tratamien tratamientos tos en igual ccondicione, ondicione, d de e mane manera ra que sí alguno es superior a los demás tenga la oportunidad de demostrarlo.
Adecuada distribución de los tratamientos, por medio de sorteos, estratificaciones, etc. 7
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Aplicación de métodos estadísticos que permitan separar las diversas causas de variación y obtener el mejor provecho de los resultados.
COEFICIENTE D DE V AR A R AC I ACIÓN. Es la relación entre la desviación estándar y la media, A expresada en porcentaje conforme a la siguiente formula: CV =
σ
X 100 μ
Se usa cuando se desea comparar la variación de dos poblaciones independientes de la m magnitud agnitud de sus medias.
Valores altos de altos de CV
pueden ser debidos a errores o deficiencias en el proceso de colectar los valores individuales, y por lo tanto t anto resultan datos de escasa confiabilidad (Reyes, 1995).
PRUEB AS A S D DE H HIPÓTESIS. Hacer una hipótesis significa suponer algo o tener alguna teoría o idea para, a p partir artir de ella, o obtener btener una o vvarias arias consecuencias (Reyes, 1992). El propósito de las pruebas de hipótesis es ayudar al médico, investigador o administrador a tomar una decisión en torno a una población, examinando una muestra de ellas (Daniel, 1993). Con los valores estadísticos obten obtenidos idos o con los resultados experimentales, la teoría estadística ha desarrollado métodos o técnicas para probar dichas hipótesis relativas a parámetros poblacionales. Tales métodos se conocen como pruebas de significancia estadística. Las pruebas de hipótesis están basadas en la nulidad de las diferencias, es decir, la diferencia de promedios de las muestras es cero o estima a cero (o la diferencia entre lo experimental y lo teórico esperado es cero, o situaciones similares). Dicha diferencia de promedios de poblacio poblaciones nes se simboliz simboliza a por Ho y se conoce conoce como hipótesis nula.
La hipótesis contraría se cconoce onoce como
alternativa, se expresa como H A y esta basada en la no nulidad de las diferencias (Reyes, 1992). Daniel (1993) señala que, en general, ni las pruebas de hipótesis ni la inferencia estadística conducen a la prueba de una hipótesis, sino simplemente 8
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
indican si está es apoyada o no por los datos disponib disponibles. les. Por lo tanto cuando no es posible rechazar una hipótesis nula, no se dice que es verdadera, sino que puede ser verdadera. verdadera. Cuando se hab habla la de aceptar un una a hipótesis nula, se tiene presente esta limitación y no se desea comunicar la idea de que la aceptación implica la demostración. Un juego de hipótesis puede ser:
H o : μ 1 = = μ 2 ó μ 1 -- μ 2 = = 0 0 H A : μ1 ≠ μ 2 ó μ 1 -- μ 2 ≠ 0 0 H A excluye a H o , o viceversa. También se dice que se acepta H A y se rechaza H o , o viceversa. Según Reyes (1992) y Daniel (1993), al probar hipótesis, pueden ocurrir los cuatro casos siguientes:
u e H o sea s ea ea ccierta ie iert rta a y que q u e la la prueba p rru u eb eb a estadística es tad tad ís ís tic tica a la la acepte ac ep ep te te (rechace (rec rec h ha ac e H A ). Si 1) Q Que en realidad (aun cuando se ignore) H o es cierta y la prueba estadística la acepta, la conclusión será correcta.
2) Q u e lla a H o ssea ea ccierta, ie iert rta a, ppero e ero ro que q u e la prueba p ru rue eb a estadística es tad tad ís ís tic tica a la la rechace rec rec h ac e (acepte (ac ep te Que l a rechaza, aceptando H A ). Si en realidad H o es cierta y la prueba estadística la H A se corre el riesgo de cometer un error, conocido como error α.
La
probabilidad de α se conoce como límite de significancia y el investigador lo fija por adelantado, según el riesgo que este dispuesto a correr de rechazar una cosa que en realidad es cie cierta. rta. Cuanto más pequeñ pequeño o sea el error α, más riesgo se corre de caer en el error β. La mayoría mayoría de los inve investigadores stigadores fijan como valores para α 0.05 ó 0.01 (5 % y 1 %). Es decir, ccorren orren el riesgo de equivocarse en promedio 5 veces en 100 (una vez en 20) o una vez en 100, y en raras ocasiones aceptan equivocarse 10 veces en 100 ó 2 veces en 20, ya que es un riesgo alto. Por tal m motivo, otivo, Ho se acepta si la probabilidad de error es mayor de 5 %, en cuyo caso caso se dice que la diferencia no es significativa. significativa. Si existiera un valor, éste estimaría a cero, lo cual se interpreta como una 9
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
variación por cas casualidad ualidad o por az azar. ar. H o se rechaza si la probabilidad de error es igual o menor a 5 %, y entonces se dice que la diferencia es significativa. Si la probabilidad de error es menor o igual a 1 %, entonces se dice que la diferencia es altamente altamente significativa. En ambos ca casos sos se interpreta co como mo una variación debida a una una causa, y no al azar o a la cas casualidad. ualidad. En resumen se tiene:
H o s i p > > 5 5 % % NS H A s i p ≤ 5 5%
*
H A s i p ≤ 1 1 % %
**
3) Q u e H o sea sea se a fa fals lsa a, pe pero ro q qu e la pru prue eba eestadística sta stadíst dístic ica a la acepte ace cept pte e ((rechace rech recha ace a H A ). Que falsa, que ue pr ueba prueba Si en la realidad H o es falsa y la prueba estadística la acepta, se comete un error β. No es posible conocer la magnitud del error β, pues depende de los valores reales de los parámetros de la población, estimados por los valores estadísticos de la muestra, y del tamaño de está, por lo cual se recomienda siempre tomar muestras lo más grandes y manejables posible.
4) Q u e H o sea s ea fa fals lsa a y que qu ue e la la prueba p rru ue eb b a estadística es ta tad ís ti ticc a la la rechace rec rec h ac ac e (acepte (ac ep te a H A ). Si Que falsa en la realidad (aun cuando se ignore) H o de nulidad es falsa y la prueba estadística la rechaza, rechaza, la conclu conclusión sión será correcta. En general, en la decisión de aceptar o rechazar una hipótesis es necesario considerar:
La informa información ción disp disponible onible al alcance del inves investigador. tigador.
La experiencia y conocimiento del inv investigador. estigador.
El riesgo que se este dispuesto a correr de que la decisión se sea a errónea. Los métodos estadísticos de uso común emplean la distribución de t, el análisis de varianza con prueba de F, las pruebas de Duncan, Tukey, de Ji cuadrada (X2), etc.
10
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
1.2 .. B BIOEST ADÍSTIC A C COMO C CIENCI A A La estadística es la Ciencia, pura y aplicada, que crea, desarrolla y aplica técnicas de modo que pueda evaluarse la incertidumbre de diferencias inductivas (Steel y Torrie, 1995). Por otro lado, Daniel (199 (1993) 3) la define como un campo del estudio relacionado con 1) La recopilación, organización y resumen de los datos y 2) La obtención de inferencias acerca de un conjunto de datos cuando sólo se observa un par de ellos. Reyes (1995), define la estadística como el arte y la ciencia de recoger datos o reunir observaciones cuantificables (medibles o numéricas) y clasificables; es decir susceptibles de ser estudiadas, tabuladas e interpretadas.
De igual
manera menciona que cuando las observaciones se refieren a los seres vivos o a los fenómenos biológicos, la estadística recibe el nombre de bioestadística (biometría). La investigación científica consiste en la búsqueda permanente de la verdad mediante métodos métodos y objetivos, adecuados adecuados y precisos. precisos. La experimentación es un método científico de investigación que consiste en hacer operaciones y prácticas destinadas a demostrar, comprobar o descubrir fenómenos o principios básicos. La experimentac experimentación ión agrícola, e en n particular com comprende prende las pruebas de ensayo, observaciones, análisis o estudio práctico de todo aquello que interesa a la agricultura. Se considera un experimento probar con la práctica una hip hipótesis ótesis formulada (por ejemplo, determinar el tamaño de la parcela más eficaz para ensayar variedades variedades de alfalfa). En un e experimento xperimento se observa únic únicamente amente los efectos y es de aplicación práctica inmediata, ya sea para el científico o para la comunidad. Por su parte, una investiga investigación ción es aplica aplicación ción mediata y puede ser evolucionista, o sea, puede conducir a idear nuevas técnicas o modificar las existentes. Comúnmente ambos términos se confunden y son inseparables (Reyes, 1992). Reyes (1995), menciona que las etapas sucesivas de todo trabajo de investigación se puede resumir de la siguiente manera: 11
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Especificación del problema.
• Antecedentes. • Importancia. • Objetivos.
• Número e intensidad de los tratamientos. Revisión bibliográfica respectiva.
Planteamiento (o diseño) del experime experimento nto (material y métodos métodos). ).
• Lugar de la experiencia. • Tamaño de la parcela experimental o unidad experimental. • Número de repeticiones por tratamiento. • Distribución de los tratamientos. • Instrumentos, equipos, semillas, etc. • Métodos de evaluación ddee resultados experimentales (prue (pruebas bas de hipótesis, niveles de significancia). campo po y labora laboratorio. torio. Ejecución y desarrollo de las operaciones en el cam
Recolección de datos y observac observaciones, iones, mues muestreos, treos, etc.
Ordenamiento de los resultados experimentales.
Interpretación y ev evaluación aluación de lo loss res resultados. ultados.
Discusión de los resu resultados ltados en relación con los conocimientos agronó agronómicos, micos, con los principios de razonamiento riguroso o con resultados obtenidos en otros experimentos similares realizados en diferente lugar y tiempo por otros investigadores, etc.
Análisis econ económico ómico y d de e utilidad prác práctica tica como ccontribución ontribución a la comunidad. Conclusiones. Reyes (1992) menciona que la bioestadística es un arte y una ciencia: arte,
por la habilidad y el conjunto de artificios necesarios para la recolección de datos, ajustados lo más posible a la realidad, eliminando o reduciendo todas las fuentes de error; y ciencia, por la aplicación del método científico (observación, experimentación, hipótesis, prueba, error y deducción), las matemáticas, principios y leyes de las probabilidad probabilidades. es.
De igual manera hace mención del 12
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
método científico como la búsqueda de hechos, la formulación de hipótesis y la obtención de principios y le leyes yes que rige rigen n tales hechos hechos.. Comprende do dos s pasos principales: A ) MÉTODO INDUCTIVO Mediante éste, se buscan hechos a través de la O
observación y la experimentación. B ) MÉTODO D DEDUCTIVO. Consiste en calificar y ordenar los hechos por medio
de una relación. Sí ésta es constante d de e manera que se pue pueda da predecir un hecho y confirmarlo mediante la experimentación, puede ser general y formularse en postulado básico o una ley. La aplicación del método científico ha conducido al descubrimiento de las leyes que rigen el proc proceso eso biológico; por ejemplo, Grego Gregorio rio Mendel formuló sus hipótesis, relativas a la herencia biológica, después de efectuar una serie de observaciones y experimentos; así encontró las relaciones conocidas. Cuando sus hipótesis, hipótesis, formuladas
luego de observar el desarrollo de las plantas del
chícharo, fueron confirmadas en diversos organismos animales y vegetales, se establecieron las dos leyes de Mendel en que se basa la herencia biológica. Según Reyes (1995), la utilidad de estadística en general y de la bioestadística en particular se pueden manifestar en varias situaciones:
Estudios de la variación de un una a poblac población. ión.
Estudios de mu muestras estras pa para ra caracte caracterizar rizar poblac poblaciones. iones.
Comparación de distintas po poblaciones blaciones o muestras de e ellas llas para estimar su semejanza o su diferencia.
Interpretación de resultados experimentales biológicos y agropecuarios en donde se comparen poblaciones o muestras sometidas a diferentes tratamientos o pertenecientes a diferentes variedades o razas.
Determinación de la relación que existe entre dos o más variables (correlación y regresión).
Aplicación de métodos para reducir las fuentes de error en una recolección de datos. 13
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
En poblaciones segregantes, evalu evaluar ar la variación atribuible a la acción de los genes y aquella atribuible a la acción del medio.
Estudiar la concordancia entre lo teórico esperado y
lo observado
experimentalmente. Por otro lado, Labastida (1991) hace referencia a que la estadística (bioestadística) conceptualmente no se puede considerar como ciencia, ya que no establece sus propias leyes, en sí es una rama de las matemáticas y toda su teoría se desarrolla den dentro tro de la ciencia matemática. Se le puede con considerar siderar como una técnica científica que es utilizada por otras áreas de estudio en su proceso de investigación. Se debe tener en cuenta que la estadística se ha propuesto como instrumento de investigación. investigación.
La in investigación vestigación puede ser ge genética, nética, me mercadeo, rcadeo, nutrición,
agronómica, etc. Es el campo de la investigación, no e ell instrumento, el que de debe be proporcionar los los porque del problema de la investigación.
La estadística sin
embargo, ayuda a los investigadores a diseñar experimentos y a evaluar objetivamente los datos numéricos resultantes (Steel y Torrie, 1995).
14
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
1.3. APLIC ACIÓN D DE L L A B BIOEST ADÍSTIC A A L L AS C CIENCI A AS La estadística proporciona proporciona conocimientos a los investigadores. Es un tema nuevo y estimulante, p producto roducto del siglo XX. Para el científico, particularme particularmente nte para el científico en biología, la estadística comenzó aproximadamente en 1925 cuando apareció el libro de Fisher, Statistical Methods for Research Workes. La estadística es un tema de rápido crecimiento con mucho material original que todavía no se encuentra en textos; crece a medida que los estadísticos encuentran respuestas a más y más problemas propuestos por los investigadores. En la ap aplicación licación de la estadística, los principios son generales aun cuando las técnicas pueden diferir, y la necesidad de formación estadística crece a medida que se incrementa la aplicación a las ciencias biológicas y sociales, la ingeniería y la industria. Este tema nuevo y vigoroso afecta a todos aspectos de la vida moderna. Por ejemplo, el planteamiento estadístico y la evaluación de la investigación contribuyen a los avances tecnológicos en el cultivo y procesamiento de los alimentos; el control estadístico de la ccalidad alidad de los productos manofacturados hace confiable los equipos au automotores tomotores y eléctricos. La estadística ayuda a los encuestadores a recolectar datos para determinar las preferencias de esparcimiento del público; proporciona información para los estudios de impacto ambiental y ayuda a la evaluación de las exigencias gubernamentales para que la industria farmacéutica demuestre que un producto es benéfico y no sólo inofensivo. Cada vez más son los grupo gruposs que de investiga investigación ción en los cua cuales les se encuentra un estadístico. Las observaciones constituyen la materia prima con la cual trabajan los investigadores. Para que se puede aplicar la esta estadística dística a es esas as observacione observaciones s ésta deben ser ser en forma numérica. El mejoramiento de ccultivos, ultivos, los números bien bien pueden ser rendimientos por parcela; en la investigación médica, pueden ser tiempos de recuperación bajo varios tratamientos; en la industria pueden ser 15
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
cantidades de efectos de varios lotes de un artículo producido en una línea de montaje (Steel y Torrie, 1995). Es conveniente discernir en dos grandes campos del diseño experimental, por una parte las ciencias biológicas y agrícolas, en las cuales se utilizan los diseños completamente al azar, bloques al azar y cuadro latino, y en segundo lugar las ciencias: químicas, físicas, etc., en las cuales por la posibilidad de controlar un número finito de variable se usan, frecuentemente los diseños factoriales (López, 1994).
16
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
UNID AD A D III. DISEÑOS EXPERIMENT AL A L ES 2.1. P PRINCIPIOS F FUND AMENT ALES López (1994), (1994), menciona que el diseño de un experimen experimento to consiste en planificar los experimentos de la forma más racional posible, de manera que todos los datos obtenidos pueden ser procesados adecuadamente y que mediante un análisis objetivo conduzcan a la adecuación aceptable del problema planteado. Por otro lado, Ostle (1983) hace mención de que diseñar un experimento significa planear un experimento de modo que se reuna la información que sea pertinente al problema bajo investigación, y define el diseño de un experimento como la secuencia completa de pasos tomados de antemano para asegurar que los datos apropiados se obtendrán de modo que permitan un análisis objetivo que conduzca a deducciones válidas con respecto al problema establecido. Este mismo autor considera que el propósito de cualquier experimento es proporcionar una cantidad máxima de información pertinente al proble problema ma b bajo ajo inv investigación. estigación.
De igual
importancia es también que el diseño o plan, o programa de prueba sea tan simple como sea posib posible. le. La investigació investigación n debería cconducirse onducirse lo más eficiente posible y debería hacerse todo el esfuerzo para ahorrar tiempo, dinero y material experimental. En este mismo sentido, Steel y Torrie (1995) mencionan que al diseñar un experimento, se establecen claramente los objetivos como preguntas que han de responderse, hipótesis hipótesis que han de probarse y efec efectos tos que han de de estimarse. Es aconsejable clasificar los objetivos como mayores o menores ya que ciertos diseños experimentales dan más precisión para ciertas comparaciones de tratamientos que otros. López (1994), re recomienda comienda
que no se de debe be co comenzar menzar ningún trabajo
experimental sin hacer previamente algún tipo de diseño, pues puede ocurrir que la final los datos obtenidos no sean capaces de permitir el análisis de los efectos buscados. 17
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Se puede decir que hay tres principios del diseño experimenta (Ostle, 1983):
Reproducción. Es la repetición del experimento básico para poder estimar el error puro o aleatorio, que permitirá determinar si las diferencias observadas son significativas o no.
Al Aleato eatori zaci zació n.. eatorrir izac izació ióó n
En la mayoría de la prueba pruebass estadísticas se supone que
las muestras son independientes unas de otras y que sólo están afectadas por los parámetros q que ue se controlan. Para garantiza garantizarr esto se requiere tomar las muestras al azar o aleatoriamente de la población investigada.
C ontrol local loca l . Se refiere, implícitamente, en primer lugar, al tipo de diseño local. Control experimental que se haya realizado y en segundo lugar, a las medidas que se toman para controlar el proceso experimental, como por ejemplo:
Utilizar
material
o
bloqueo
experimental
homogéneo
para
la
estratificación cuidadosa del material disponible.
Dirigir el experimento cuidadosamente. Considerar las posibles variables aleatorias. Emplear las técnicas analíticas y los equipos de control de los parámetros independientes más adecuados.
Reyes (1992) considera que las diferentes variables que influyen en la producción agrícola, en el desarrollo de un experimento de campo o de laboratorio es necesario tener en cuenta:
a) E plante ntea amie miento nto de dell probl proble ema ma.. Ell pla planteamiento problema. pro blema. b ) L L a iin t er p r et ac i ó n yy e ev al u ac i ó n d d e llo s r r es u l t ad o s . Ostle (1983) da la siguiente lista de pasos a seguir para la realización de un diseño experimental: 1) Enunciado del problema. 2) Formulación de la hipótesis. 3) Sugerencia d de e la técnica experimental y el diseño. 18
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
4) Examen de los sucesos posibles y referencias en que se basan las razones para la indagación que asegure que el experimento proporciona la información requerida y en la extensión adecuada. 5) Consideración de lo loss posibles resultados desd desde e el punto de vista de los procedimientos estadísticos que se les aplicará, para que se satisfagan las condiciones necesarias para que sean válidos estos procedimientos. 6) Ejecución del experimento. 7) Aplicación de la técnica e estadística stadística a lo loss resultados experimentales. 8) Extracción de
conclusiones con
medidas
de
confiabilidad de
estimaciones de cantidades valuadas cualesquiera.
Deberá darse
cuidadosa consideración a la validez de las conclusiones para la aprobación de objetos o eventos a la cual se va a aplicar. 9) Valuación de la investigación completa, particularmente con otras investigaciones del mismo problema o similares.
19
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
2.2. E EXPERIMENTOS S SIMPLES. Reyes (1992), menciona que en la planificación agrícola o biológica y en el desarrollo de una investigación en particular, son de interés las siguientes orientaciones:
1) E spe specific cifica ar eell pr prob oble lema ma. En la planeación de la experimentación y en la Especificar problema investigación de problemas, con el fin de probar hipótesis o encontrar respuestas, es necesario considerar que los experimentos sean: Experi erimen mentos tos sim simple ples. s. Cuando se estudia un solo factor de variación; por a) Exp Experimentos simples ejemplo, probar ccinco inco va variedades riedades de so sorgo, rgo, estud estudiar iar cinco
dosis de
nitrógeno, etc. Experimen rimentos tos factor factoriale iales. s. Cuando se estudian simultáneamente dos o más b) Expe Experimentos factoriales factores que influyen en la producción, por ejemplo, estudiar tres variedades, cada una sembrada a tres densidades de siembra o bien tratamientos de fósforo, nitrógeno y potasio, ccada ada una a cuatro dosis por unidad de superficie o al estar e estudiando studiando los efectos de tres dosis de cierto medicamento sobre el tiempo de reacción. Experi erimen mentos tos com comple plejo jos. s. Cuando se estudian factores de la producción, c) Exp Experimentos complejos considerando la acción conjunta o la interacción de los factores y el efecto de cada factor independiente.
2) Localiz Loca liza ación de dell luga lugar Localiza Localización lugarr adecuado para la realización de los experimentos. 3) R ed u c i r llas as ffuentes u en t es dde e eerror, r r o r , tanto del experimento como errores o Reducir equivocaciones operacionales.
ant nte ener ner co cons nsta tant nte es lo loss fact fa ctor ore es que que pu pue eden den aafectar fect fecta ar a la pr oduc ucci ción ón o la 4) M Mantener constantes factores pueden la prod producción ca calid lida ad del del pr prod oduc ucto to,, de manera que el único factor de variación sean los calidad producto, tratamientos objetos de estudio.
xtre xt rema marr pr pre eca cauc ucio ione ness y se serr ca caut utos os een n lo loss resu re sult lta ado doss eexperim xpe xperi rime ment nta ale less , 5) E precauciones precaucio cautos resultados expe rimentales entales Extremar considerando que un experimento es una observación de una muestra en una población de experimentos.
20
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
2.3. D DISEÑO C CON T TR AT AMIENTOS AP ARE ADOS Un método que suele utilizarse para averiguar la efectividad de un tratamiento o procedimiento experimental, es el que utiliza observaciones relacionadas que que se obtienen obtienen de mues muestras tras no independ independientes. ientes. Una prueba de hipótesis basada en este tipo de datos se conoce como prueba de comparaciones apareadas. El objetivo de la prueba es eliminar el número máximo de fuentes de variación extrañas, haciendo a las parejas semejantes con respecto a tantas variables como sea posible (Daniel, 1993). Reyes (1992), menciona que esta distribución se utiliza cuando se tienen únicamente dos tratamientos por comparar; es recomendable bajo las siguientes circunstancias:
a) a) Cuando Cu an d o las l as as unidades u n i da dad es experimentales ex p er i me men t al al e ess o parcelas, p ar c el as , o eell ssuelo u el o se sea an mu muyy hete he tero rogé géne neos os pe pero ro haya haya si simi milit litud ud entre entre ntre la lass pa parc rce ela lass sean heterogéneos similitud parcelas ccontiguas o n t i g u as
o
l as las
u n i d ad es unidades
e x p er i m en t al es experimentales
eestén s t én
correlacionadas. b) C u anndo d o sse e ttenga en g a uun n rreducido ed u c i ddo o nú núm er o dde e uunidades n i ddades ad es Cuando Cua reduci mero uni eexperimentales. x p er i me men t a all es es . S at er i al al eess m u y hheterogéneo, et er o g én eo , dde e sser er Sii eell m material muy pos posible usa ran n má máss pare pa ress cua cuanto nto más máás s hete he terog rogé éneos neos se sea an. posiible ble se usara usaran pares m heterogéneos sean. c) c) C ua uando ndo se sea a posib posible le aapa pa pare rea ar. Cuando Cua posi ble aparear. rear.
El método consiste en aparear unidades experimentales contiguas o muy similares y aplicar a cada una el tratamiento en estudio, haciendo la aplicación por sorteo; emplear emplear
el may mayor or núme número ro de pares posibles y luego estudiar las
diferencia entre los pares, considerando a dichas diferencias como muestras de una población. Las observaciones observaciones a menudo se apare aparean. an.
Por ejemplo ejemplo:: dos raciones
alimenticias pueden compararse utilizando dos animales de cada una de 10 camadas de cerdos, asignando al azar animales de cada camada, uno a cada ración; o puede compararse el porcentaje de aceite de dos variedades de soya 21
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
producidas en parcelas pare pareadas adas de 12 localidades. El apareamiento se hace antes de comenzar el experimento con base a las respuestas similares cuando no hay efecto efecto de los tratamien tratamientos. tos.
Si los miembros d de e los pares tien tienden den a
correlacionarse positivamente, es decir, si los miembros de cada par tienden a ser grandes o pequeños conjuntamente, entonces puede aumentar la capacidad del experimento para detectar detectar la pequeña diferencia (Steel y Torrie, 1995). Los casos más relacionados se estudian midiendo en un mismo individuo un par de caracteres, tales como (en humanos) longitud del pie y perímetro del puño, o altura y longitud de los brazos extendidos, peso a cada jugador antes y después de correr 10 ó más minutos, minutos, etc. En todos los caso casoss anteriores a cada par se le considera una observación y se calcula la diferencia; cuanto más diferentes sean los pares, mayor número de observac observaciones iones se deberán realiza realizar. r.
El resultado
sería la obtención de una población o muestra de diferencias con media y desviación estándar. estándar. Se supone una muestra de una p población oblación de diferencias. Las hipótesis por probar serían:
Ho :
= 0 0 μd =
H A
0 μd ≠ 0 d
t =
Sd
d = media de las diferencia Sd = error estándar de la media GL = grados de libertad
Se acepta H o si:
⎢ t ⎢
<
t α(n-1)
calculada de los valores
obtenida de las tablas
experimentales
de Student
Por el contrario se rechaza H o y se acepta H A si:
⎢ t ⎢
≥
t α(n-1)
calculada de los valores
obtenida de las tablas
experimentales
de Student
22
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
En las representaciones anteriores n = número de pares; cada par es una representación y se deberá usar el mayor de ellos cuanto más diferencia exista. Donde t se calcula a partir de:
d =
∑
D n
Sd =
S n
2
2
2
S 2
d =∑ n −1
∑
d 2
= ∑ D 2 − (∑ D n )
Pudiéndose emplear:
t =
d Sd / n
∑ D − (∑ D)
2
2
Sd =
n −1
/n
23
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejemplo 1. En el cultivo del camarón blanco ( Penaeus vannamei ) en jaulas sumergidas se alimento con 2 dietas, una de ellas a base base de harina de pescado y la otra a base de harina de cabeza de camarón, ambas con un 25 % de proteína . Dando los siguientes resultados en incrementos de peso (grs) por semana: Semana Sema na
Incremento con Harina de pescado (grs)
Incremento con Incremento harina de cabeza de camarón (grs)
Diferencias X 1 -X 2 = D
D2
1 2 3 4 5 6 7 8 9 10
0.99 0.89 0.86 1.14 1.79 0.81 0.40 0.30 0.49 0.35
0.83 0.02 1.88 0.65 1.34 0.50 0.51 0.31 0.26 0.06
0.16 0.87 -1.02 0.49 0.45 0.31 -0.11 -0.01 0.23 0.29
0.025 0.756 1.04 0.24 0.202 0.96 0.012 0.0001 0.052 0.084
∑D = 1.66
∑D2 =2.510
¿Es significativa la diferencia de los promedios entre de las diferentes muestras? Sea α= 0.05. Probar la hipótesis: H o : μd = 0
μd ≠ 0
H A : d
t =
d =
−
Sd
x1
X =∑
1
n
=
7.08 10
= 0.708
−
x 2
=∑
X 2
n
10
= 0.73
10
n
∑ d = ∑ D 2
(∑ D )
2
−
2
2
2
(1.66 )2
= (0.16) + (0.87) + ...(0.29) −
d =∑
2
Sd =
n −1 2
Sd
= =
2.234 9
2
= 0.248
0.0248
= 2.234
10
n
S
7.3
∑ D = 1.66 = 0.166 2
2
=
2
Sd
=
S
=
n
= 0.157
0.248
= 0.0248
10 t =
d Sd
=
0.166 0.157
= 1.057
GL = n − 1 = 10 − 1 = 9
t c 1.057
t <
0.05(9)
2.262; p> 5 % NS
Se acepta H o , pues la diferencia entre las medias no es significativa (p>5 %). Los incrementos de los pesos medios por semana son iguales. 24
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejemplo 2. Se determino la talla promedio de la tortuga golfina (Lepidochelys
olivacea) durante 10 años en Puerto Vicente Guerrero, Gro., midiendo las longitudes del largo recto del caparazón y la longitud curva del caparazón. Teniendo los siguientes resultados:
Año Añ o
Largo Lar go rect rec t o d del el caparazón (cm)
Long. curva del caparazón (cm)
Diferencias X 1 -X 2 =D
D2
1986 1987 1988 1989 1990 1991 1992 1993 1994
73.42 73.00 72.60 71.77 74.89 64.70 67.60 68.23 62.45
62.20 63.90 68.00 68.18 71.10 69.20 64.20 64.82 64.80
11.22 9.10 4.6 3.59 3.79 -4.5 3.4 3.41 -2.35
125.888 82.810 21.160 12.888 14.364 20.250 11.560 11.628 5.522
1995
65.83
68.66
∑ =-2.83 29.43
∑= 8.008 314.08
Probar la hipótesis:
t =
d Sd /
n
D 2 Sd =
t =
d =
∑ 2 .943
4 .99 / 10
− ( D ) 2 n− ∑1
Ho :
μd = 0
H A :
μd ≠ 0
∑ D = 29 .43 = 2 .943 10
n
(121 .881 )
/n
=
2
+ (82 .81) + ...( 8 .008 ) − 2
10
= 1.852
GL
tc 1.852
2
−1
( 29 .25 ) 2 10
=
5 .027
= n − 1 = 10 − 1 = 9
t (0.05)(9) <
2.262 ; p > 5 % NS
Se acepta H o , de manera que no existen diferencias significativas entre los valores medios del largo del caparazón y la longitud de la curva del caparazón.
25
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejemplo 3. 3. Se determino la concentración de azúcar de néctar en medias cabezas de trébol rojo a diferentes presione presioness de vapor durante 8 h horas. oras. Probar la hipótesis que de no hay diferencia de las medias poblaciones contra la alternativa de que las diferentes presiones de vapor indican concentraciones diferentes, a partir de los siguientes datos. Considerar α= 0.05.
Número de Presión de vapor muestras 4.4 mmHg X 1 9.9 mmHg X2 1 2 3 4 5 6 7 8 9 10
62.5 65.2 67.6 67.6 69.9 69.4 70.1 67.8 67.8 67.0 67.0 68.5 68.5 62.4
51.7 54.2 53.3 57.0 56.4 61.5 57.2 56.2 58.4 55.8
Probar la hipótesis:
d
∑ D
=
−
n
=
x 1
=
sd
t =
108 . 7
=
670 . 4 10
10
=
∑ D
2
n d
Sd / n
=
H o :
μ = 0
H A :
μ ≠ 0
10.8 11.0 14.3 12.9 13.0 8.6 10.6 10.8 10.1 6.6
116.64 121.0 204.49 166.41 169.0 73.96 112.36 116.64 102.01 43.56
∑D2= 1226.07
= 10 . 87 −
−
D2
∑D= 108.7
67 . 04
(
Diferencias X 1 - X 2 = D
x 2
∑ D )
561 . 17 10
=
56 . 17
2
n
=
−1 10 . 87
2 . 223 /
=
10
1226 . 07
(108 . 7 ) 2 / 10
10
= 15 . 4
tc 15.4
−
−1 GL
=
=
2 . 223
n
− 1 = 10 − 1 =
9
t (0.05)(9) >
2.262; p < 5 %*
Se acepta H A de manera que existen diferencias significativas entre las medias de las presiones de vapor. 26
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejercicio Ejercici o 1. En un cultivo de 5 días con la microalga diatomea Chaetoceros muelleri se evaluó la cantidad de carbohidratos (%) y la cantidad de proteínas (%), con el medio de cultivo F2 en volúmenes de 20 l. Dando como resultado los siguientes datos:
Día de cultivo
Población 106 cel/m l
Car b ohidrat o s (%)
Proteína (%)
1 2 3 4 5 6
0.05 2.49 4.05 6.56 7.80 9.07
24.95 13.14 9.42 28.78 16.63 10.41
6.26 6.52 6.15 30.24 24.72 1.69
Determine si existen diferencias significativas entre las medias de los carbohidratos y la cantidad cantidad de proteína presente en la población. Sea α = 0.05.
Ejercicio Eje rcicio 2. Las constantes de enfriamiento de ratones recién sacrificados y las de los mismos
ratones
recalentados
hasta
la
temperatura
del
cuerpo
fueron
determinadas arrojando los siguientes resultados: r esultados:
Número de pares
Ra Ratones tones recién sacrificados
Ratones recalentados
1 2 3 4 5 6 7 8 9 10
573 482 377 390 535 414 438 410 418 368
481 343 383 380 454 425 393 435 422 346
Determine si existen diferencias entre las medias de los tratamientos. Sea
α=0.05. 27
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejercicio Eje rcicio 3. En los estudios realizados con Nardus stricta (cervudo), se observó que dicha planta crecía en colonias bien definidas y se sospechaba que su crecimiento se limitaba en aquellos puntos en que el suelo era más profundo. Para probar esta hipótesis se hicieron dos mediciones de profundidad del suelo, para cada una de las 50 50 colonias estudiadas. estudiadas. Una medición se realizó dentro del área de la colonia y la otra fuera de dicha área. La suma de las diferencias para los 50 pares de medidas ∑d= 637 cm.
La sum suma a de los cua cuadrados drados de estas
diferencias son de ∑d2=14 433. Examinar la significancia de las medias de las diferencias por medio de trata tratamientos mientos aparead apareados. os. Sea α = 0.05.
28
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
2.4. DISEÑO CON GRUPOS SORTE A AD DOS Reyes (1992), menciona que está comparación se lleva acabo en aquellos casos que se estudian d os o más tratamientos en un grupo de unidades experimentales, como son:
aa)) C u an d o llas as u n i d ad es ex p er i m en t al es s o n r el at i v am en t e Cuando ho mogéneas. b) b) C ua uand ndo o no ees s posi po sible aapare parea parear. r. Cuando Cua posible aparear. ar. cc)) C u an d o sse e ccomparan o m p ar an m ed i as dde e ddo o s p o b l ac i o n es o Cuando medias mu eestras stras independientes, indepe pendien ndientes, tes, no aapa pa parea reada das. s. iinde ndependientes, apareada readas. dd)) C u anndo do Cuando Cua
oocasio c as i o nnalmente al m en t e ocasionalmente
eell
nnúmero ú m er o
de
u n i d ad es
ex p er i m en t al es p p o r ttr at am i en t o e es d d i f er en t e. El método consiste en dividir el número de unidades experimentales en dos grupos, sortear los tratamientos para cada grupo y luego comparar las medias de cada grupo considerando a cada uno de éstos como una muestra de una población, por lo cual se están comparando dos muestras poblacionales independientes. La interpretación de los resultados experimentales se lleva acabo por dos métodos:
1) Pr u eb a d d e tt d d e S St u d en t . −
t =
−
x1 − x 2
Diferencia Diferenci a de las medias
− = − Error estándar de las difrencias S x 1 − x 2
Si t ≥ t α (n1+ n2-2) se acepta H A ; en caso contrario se acepta H o .
2) Po r m ed i o d el an ál i s i s d e v ar i an za ( AN A A V A) A ). En es t e c as o s e AN AV supone una distribución completamente al azar y se a plica le metodología de clasificación simple. Se debe verificar la igu igualdad: aldad:
29
t = √ F
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
o bien, t 2 = F
En ambos casos, cada tratamiento es considerado como una muestra de una población, por lo que cada media estima a una μ; además, se deben x 1 estime a μ 1 y ⎯ x 2 a considerar dos muestras independientes de tal forma que ⎯
μ2.
H o :: μ 1 = μ 2
La hipótesis por probar seria:
H A : μ 1 ≠ μ 2 Si n 1 = n 2 se aplica : −
t =
−
x1 − x2 S 1
2
+ S 2
2
n(n − 1)
− − ⎞ ⎛ También: t = ⎜ x1 − x 2 ⎟ ⎠ ⎝
∑
x1
+ ∑ x 2 2
2
n
(
2
Donde:
∑ x = ∑ X 1
1
−
X 1 )
∑n
(
2 2
∑ x = ∑ X 2
2
−
X 2 )
2
∑n
GL = 2 (n-1) Si el númer o de repeticiones en cada tratamiento es diferente, es decir, sí
n 1 ≠ n 2 entonces:
⎛ − ⎝
−
n1 n2 (n1 + n2 − 2) ⎞ ⎠ (n + n )⎛ x− + x − ⎞ ∑ 2 ⎠⎟ 1 2 ⎜∑ 1 ⎝
t = ⎜ x1 − x 2 ⎟
ó
t =
x 1 − x 2 S 1
2
n
+
S 2
2
n
GL = (n 1 + n 2 – 2) La H o se rechaza si
⎢t ⎢ ≥ t α(n1 + n2 –2)
Se acepta si:
⎢t ⎢ t α(n1 + n2 –2)
30
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejemplo 4. En un experimento con 22 pollos de un día de nacidos se probaron dos hormonas sexuales: sexuales: la A y la C C.. Los efectos sse e estimaron pesan pesando do las crestas después de 15 15 días. Un lote de 11 po pollos llos recibió la hormona A y el otro lote la C. ¿ Producen las hormonas iguales efectos o es significativa la diferencia de medias de los pesos de cada grupo?. Los resultados fueron los siguientes: α= 0.05. Peso de la cresta (en miligramos) de 22 pollos después de 15 días que recibieron,
al
nacer,
las
hormonas
sexuales
A
(testosterona)y
C
(dihidroendrosterona).
X 1
X 2
A
57 120 101 137 119 117 104 73 53 68 118
∑ X 1 = 1067 ⎯x 1 = 97 Las hipótesis a probar serían:
C
89 30 82 50 39 22 57 32 96 31 88
∑ X 2 = 616 ⎯x 2 = 56
Ho :
μ 1 = μ 2
H A :
μ 1 ≠ μ 2
31
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
n(n − 1)
− − ⎞ ⎛ t = ⎜ x1 − x 2 ⎟ ⎠ ⎝
∑
x1
2
GL = 2( n − 1)
+ ∑ x2 2
= 2(11) − 1 = 20
Donde : X
∑
x1 2
∑ x
2
∑ x
2
1
2
2
X
= ∑ X 1 2 − (∑ n 1 ) 2
∑
x 2 2
2
2
(1067 )2
= (57 ) + (120 ) + ...(118 ) −
2
2
2
(616)2
= (89) + (30) + ...(88) −
t = (97 − 56 )
11(11 − 1)
8 472 + 7 748
11
11
= ∑ X 2 2 − (∑ n 2 )
= 8 472
= 7 748
= 3.38
tc
2
t 0.05(20)
3.38
>
2.086; p< 5 %*
La diferencia de 4 miligramos es significativa. Las hormonas producen efectos diferentes; la hormona A influye en un mayor peso en la cresta.
Ejemplo 5. El peso de cabritos de dos razas diferentes, al mes de nacidos fue el siguiente (datos en kgs):
Raza n
1
2
3
4
5
6
7
8
9
10
⎯x
1 2
23 17
43 14
24 10
19 9
29 3
47 18
6 3
14 19
29 11
26
26.0 11.56
10 9
Probar la hipótesis de que la diferencia de las medias no es significativa siendo α=0.01.
Ho :
μ 1 = μ2
H A :
μ 1 ≠ μ 2
Para la raza 1.
32
∑ x
2
2
2
2
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
(260)2
= (23) + (43) + ...(26) −
1
10
= 1354
S 1
x =∑
2
2
1
=
n −1
1354 9
= 150.444
S 1
−
= 12.265
S x1
S 1
=
2
n
150.444
=
10
= 3.878
Para la raza 2.
∑ x S 2
2 2
2
2
(104)2
= (17 ) + (14) + ...(11) −
9
= 288.222
−
= 6.002
GL = n1
S x 2
−
x1 − x 2 S 1
=
S 2
S 2 n
2
x =∑
2
1
n −1
2
36.027
=
9
=
288.222 8
= 36.027
= 2.0
+ n2 − 2 = 10 + 9 − 2 = 17
−
t =
2
2
n1
+
S 2
2
=
26 − 11.56 36.027 9
n2
+
150.444
= 3.308
10
tc 3.308
t 0.01(17) >
2.898; p< 1 %**
alt amente significativa. La diferencia de las medias es altamente
Ejercicio Ejercici o 4. En un estudio hecho para comparar el porcentaje de la grava fina que presentaban dos tipos de suelos superficiales uno catalogado como buen suelo y el otro tipo como suelo pobre. Los resultados de la concentración concentración de grava se dan a continuación:
Buen
5.9
3.8
6.5
18.3
18.2
16.1
7.6
33
suelo Suelo pobre
7.6
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
0.4
1.1
3.2
6.5
4.1
4.7
Determinar si existen diferencias en el porcentaje de los suelos. Sea
α=0.05. Ejercicio Ejercici o 5. A continuación se dan los datos de la comparación química de la orina de simios de ácido glutámico por miligramos de creatina.
Chimpancés Gorilas
n
⎯x
S
37 6
0.115 0.511
0.017 0.0144
Compruebe si existe diferencia entre las medias de las concentraciones de ácido glutámico en las po poblaciones blaciones represe representadas. ntadas. Sea α = 0.05.
Ejercicio Ejercici o 6. Dos tipos de soluciones químicas, A y B fueron ensayadas para ver su pH (grado de acidez acidez de la so solución lución ). Análisis de 6 muestras de A dieron un pH medio de 7.52 con con una desvia desviación ción estándar de 0.02 0.024. 4. Análisis de 5 muestras de B dieron un pH promedio de 7.49 con una desviación estándar de 0.032. Mediante un nivel de significancia del 0.05 determine si los dos tipos de soluciones tienen diferentes valores de pH.
34
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
2.5. D DISTRIBUCIÓN C COMPLET AM AMENTE AL AL AZ AZ AR AR Este diseño es útil cuando las unidades experimentales son esencialmente homogéneas, es decir, cuando la variación entre ellas es pequeña y agruparlas en bloques sería poco más que un proce proceso so aleatorio. Este es el caso de m muchos uchos tipos de experimentos de laboratorio, en los que la cantidad de material está completamente mezclado y luego se divide en proporciones pequeñas para formar las unidades experimentales a las cuales se asignan los tratamientos en forma aleatoria, o en un experimento con animales y plantas con condiciones ambientales muy parecidas (Steel y Torrie, 1995). Por otra parte, esto estoss diseños rara vez se utilizan en experimento de campo; el método de bloques al azar brinda consistentemente consistentemente una mayor precisión. Un hecho compensa h hasta asta cierto punto los errores experimentales elevados, con respecto a otros diseños (Cochran y Cox, 1980).
Debe señalarse también que, aún cuando las técnicas de análisis de varianza se aplican con más frecuencia a los datos que resultan de experi mentos controlados, las técnicas pueden utilizarse también para analizar los d atos reunidos a través de una encuesta, siempre que se satisfaga razonablemente las suposiciones fundamentales (Daniel, 1993). Reyes (1992), menciona que esta distribución es usada cuando se estudian tratamientos mientos bajo las siguientes condiciones: dos o más trata
a) L u g ar y u n i d ad es ex p er i m en t al es m u y u n i f o r m es (s u el o h o m o g én eo , en l ab o r at o r i o s i n v er n ad er o s , g al l i n er o s , et c .) . h o m o g én eo , en l ab o r at o r i o s i n v er n ad er o s , g al l i n er o s , et c .) .
35
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
b ) Cu an d o s ea p r o b ab l e q u e u n a p ar t e d el ex p er i m en t o s e p ierda. cc)) C u an d o sse e ttiene i en e uun n eexperimento x p er i m en t o ppequeño eq u eñ o y ddonde o n d e llaa m ay o r Cuando mayor pprecisión rec isió re isión n ddee ootras ttra rass ddistri is ttri is rib u c i o n es n o c o m p en s a l a p ér d i d a d e g rado rados libertad ra doss de lib libe erta rtad d del del eerror. rror. rror.
Hurley et al., (1981) ( 1981) y Padrón (1985), coinciden en mencionar que el diseño completamente al azar presenta las siguientes ventajas y desventajas.
Ventajas. e ntajas.
Permite gran flexibilidad, es decir, puede usarse cu cualquier alquier número de tratamientos y repeticiones y se puede variar el número de repeticiones de un tratamiento a otro.
El análisis estadístico es sencillo, aun cuando el número de
tratamientos y repeticiones no es el mismo para cada tratamiento. El análisis estad estadístico ístico es sencillo, sencillo, aun cuand cuando o los datos de de algunas de las unidades experimentales o algunos tratamientos completos se hayan perdió o se rechacen por alguna causa.
Es el diseño que se basa en m más ás grados de libertad para la estimación del cuadrado medio del error.
Des v en t a ja j a.
Para usar este diseño se necesitan unidades experimentales muy homogéneas, porque de otra manera la variación entre ellas pasa a formar parte del erro rror exper imental.
Ejemplo: supóngase que existen a tratamientos y n repeticiones; se tendrán an unidades experimentales si:
a=4
A,B,C,D tratamientos
n = 5
I,II, II,IV, V repeticiones
Usando cualquier sistema de sorteo, se puede tener la siguiente distribución:
20
19
18
17
16
36
C 11
B 12 B 9
C
C 2
15 B
A
B
B C
7
3
A
A 14
8
D 1
D 13
A 10
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
6 D
A
4 D
5 C
D
El registro de la distribución en que se indique el número de tratamientos, y el número de la unidad experimental o parcela, quedará así: Estudio de 4 variedades de sorgo para grano, tratadas con una hormona común para e estudiar studiar ssus us efe efectos ctos so sobre bre la plántula
bajo ccondiciones ondiciones de
invernadero. Distribución completamente al a azar zar ccon on 5 repeticiones.
Tratamientos Tratamien tos A B C D
I
II
1 2 4 3
6 12 9 5
Repetic ion es III IV 8 14 13 7
11 16 15 10
V 17 1 19 9 20 18
La variedad A irá sembrada en las unidades experimentales numeradas con el 1,6,8,11 y 17. Lo mismo para la lass demás varied variedades. ades.
37
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
2.6. D DISTRIBUCIÓN E EN B BLOQUES AL AL AZ AZ AR AR El diseño en bloques al azar es un diseño en el que las unidades experimentales, a las que se les aplican los tratamientos, se subdividen en grupos homogéneos llamados bloques, de modo que el número de unidades experimentales en un bloque es igual al número de tratamientos (o algún múltiplo del mismo) mismo) que se es están tán estu estudiando. diando.
Se a asignan signan e entonces ntonces al aza azarr los
tratamientos de las unidades experimentales dentro de cada blo bloque. que. Debe tenerse en cuenta que cada tratamiento aparece en todos los bloques y cada bloque recibe todos los tratamientos. Siendo el o objetivo bjetivo de e este ste d diseño iseño el d de e aislar y eliminar el término error de la variación atribuible a los bloques, a la vez que se asegura que las medias de los tratamientos estén libres de los efectos del bloque (Daniel, 1993). Reyes (1992), menciona que esta distribución tiene grandes ventajas cuando el número de tratamientos no excede de 15 y cuando es posible agr upar las unidades experimentales en estratos o bloques uniformes, de tal manera que la variabilidad en las unidades experimentales es mínima, aun cuando la variación entre los estratos o bloques sea alta. En general la distribución se usa en los siguientes casos:
C ua uand ndo o eell n ú m er o d d e ttr at am i en t o s e es d d e 3 3 a a 1 15. Cuando
Cu an d o el n ú m er o d e t r at am i en t o s es d e 3 a 5, en c u y o c as o d eb e t en er s e c o m o m ín i m o 6 r ep et i c i o n es p ar a c o n t ar c o n s u f i c i en t es g g r ad o s d d e lli b er t ad d d el e er r r o r . 38
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Cu an d o s e c o n o c e el g r ad i en t e d e v ar i ab i l i d ad , en c u y o c as o l o s b b l o q u es d d eb en o o r i en t ar s e p p er p en d i c u l ar m en t e a al g g r ad i en t e y l as u n i d ad es ex p er i m en t al es d eb en t en er s u m ay o r d i m en s i ó n en l a m i s m a d i r ec c i ó n y s en t i d o d e d i c h o g r ad i en t e.
La flexibilidad de la distribución es tal que si se pierde una repetición o bloque, se pueden utilizar los resultados r esultados de los demás bloques. En experimentos sobre terreno, usualmente cada bloque consiste en un grupo compacto compacto de parce parcelas las aproximadamen aproximadamente te cuadradas. De igual man manera, era, en muchos experimentos con animales, los animales se colocan en grupos de resultados o bloques con base en características tales como peso inicial, condiciones del animal, raza, sexo o edad, o como etapa de lactancia y producción de leche en el ganado, y como camadas de cerdos (Steel y Torrie, 1995). En experimentos en los que intervienen seres humanos, si se des ean eliminar las diferencias que resultan de la edad, pueden agruparse entonces los individuos de acuerdo con su edad, de modo que una persona de cada edad reciba cada tratamiento. tratamiento. Puede utilizarse este diseño también conve convenientem nientemente cuando un experimento debe llevarse acabo en más de un laboratorio (bloqu e) o cuando se requieren de varios días (bloques) para concluirlo (Daniel, 1993). Reyes (1992), menciona que para usar la distribución en bloques al azar deben realizarse los siguientes pasos:
+ D ivid ividir ir las las unidades un unid ida ades des e xper i m en t al es o l u g ar d e l a ex p er i en c i a Dividir exp en bbloques; l o q u es ; el el número n ú m er o de d e bloques b l o q u es es es igual i g u al al al núme n ú m er o d e r epeticiones. e peticiones.
+ D i vi vi di di r el el b l oq oq u e en en ttantas a an n t as uunidades n i d ad es eexperimentales x p er im im en t al al es ccomo omo Dividir bloque bblo l o qques u es sse e rrequieran eq u i er an eestudi s t u d i aar. r. C adda a ttratamiento r at am i en t o ddebe eb e bloques estudiar. Cada Ca aapare pare parece cerr una una so sola la vez vez een n ca cada da bl bloq oque ue.. aparecer bloque. + S o r t ear Sortear
iindependientemente, n d ep en d i en t em en t e,
tratamientos.
een n
ccada ad a
bbloque, l o q u e,
llos os 39
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
+ En el m an e jo j o d el ex p er i m en t o l o s t r ab a j jo o s d eb en h ac er s e p o r r ep et i c i o n es o o b b l o q u es . + Nu m er ar cco r r r el at i v am en t e llas u u n i d ad es e ex p er i m en t al es . + A l es t u d i ar l a v ar i ac i ó n t o t al , d i v i d i r l a en v ar i ac i o n es en t r e bl ooques, q u es , vvariaciones ar i ac i o n es eentre n t r e uunidades n i d ad es eexperimentales x p er i m en t al es ppor or eefecto f ec t o dde e llos o s ttratamientos r at am i en t o s (si (s i existen), ex i s t en ), y variaciones v ar i ac i o n es en en la la uuni n id iddad a ad d eexperimental. x pe peri rim m en ta tal. l. E s ta eestim s ttim ima a eell eerror rro rro r eexperim xp pe eri rime men n ta tal y ssu u unidad Esta estima expe rimental ental va valo lorr dependerá de depe pend nde erá de la va vari ria ación ción de d i c h a u n i d ad ex p er i m en t al valor variación y d e su ma mane nejo jo.. manejo. Hurley et al (1981), mencionan las siguientes ventajas y desventajas de este diseño:
Ventajas . 1) La ventaja principal de este d diseño iseño es que toma en cuenta el efecto de los bloques, mientras que el diseño completamente al azar incluye este efecto en el error, es decir, se puede obtener mayor sensibilidad al utilizar el diseño en bloques aleatorios. 2) El análisis de este diseño es sencillo, aun cuando exista el problema de datos perdidos.
Desventaja. 1) La principal des desventaja ventaja es que que el número d de e tratamientos tiene que ser el mismo que el número de unidades experimentales en cada bloque. Supongamos que se tienen 5 variedades de sorgo de grano. Se requier e una precisión tal que con 6 repeticiones se logre y se conozca el sentido y la dirección del gradiente de fertilidad del suelo. a= 5 trata tam mientos
n= 6 repeticiones
A ,B, C, D y E
I, II, III, IV, V y VI
A
D 1
C
A 10
B
C 11
E
A 20
A
B 21
E
30 D
40
2
9
D
E 3
12 C
8
B
C 4 5I
D 18
14
A
C 17
28 C
24
D 15 III
29
23
B
D I6I
22
E
B
A
19
13
7
E
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
B 16 IV
27 E
25 V
26 VI
Registro de las unidades experimentales, variedades y bloques del estudio de variedades de sorgo de grano en un experimento de campo con distrib ución en bloques al azar.
Bloques Número de variedad
Nombr Nom bre e
I
II
III
IV
V
VI
1 2
Caprok Dekalb
1 4
6 9
11 14
19 17
21 25
28 30
3 4 5
CIA CIA CIA
2 3 5
7 10 8
13 15 12
20 16 18
24 23 22
27 29 26
La posición relativa de los bloques puede ser cualquiera, siempre que sigan las normas descritas y que además fac iliten el manejo del experimento.
41
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
2.7. D DISTRIBUCIÓN E EN C CU AD ADRO L L AT ATINO En este sistema de distribución el número de repeticiones es igual al número de tratamientos qu que e se han de comparar en la experienc experiencia. ia.
Si este
número es n , el número total de parcelas serán n 2. La división del campo en parcelas se hace de modo que haya el mismo número de filas de parcelas que de columnas de ellas, es decir, de tal manera que cada hilera de parcela cuente con el mismo número de ellas, tanto a lo largo del campo como a través del mismo (De la Loma,1980). En este mismo diseño la restricción para controlar la variabilidad está en dos direcciones, hileras y columnas columnas.. Se arreglan los tratamientos tratamientos en bloques en dos sentidos apareciendo cada tratamiento una sola vez en cada hilera y en cada columna. El análisis de los datos puede rem remover over del error la variabilida variabilidad d debida a hileras y columnas (Padrón, 1985). Reyes (1992), menciona que esta distribución es muy eficaz cuando el número de tratamientos esta entre 4 y 10 y se conoce la variabilidad en dos sentidos perpendiculares, por lo cual es muy deseable reducir o controlar el efecto de dicha variabilidad para disminuir el valo valorr del error experimental. Por otro lado, De la Loma (1980), recomie recomienda nda usar este d diseño iseño en expe experimentos rimentos en los cua cuales les el número de tratamientos tratamientos en comparac comparación ión varia de 4 a 7. Cuando es menor, la distribución resulta imperfecta y la precisión del análisis estadístico escasa: cuando es mayor , resulta un número de parcelas y repeticiones excesivo.
42
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
La principal desventaja del cuadro latino es que el número de filas,
muchos hos tratamientos, el columnas y tratamientos debe ser el mismo. Así, si hay muc número de parcelas parcelas pronto se hace impracticable. Los cuadros más ccomunes omunes van de 5 x 5 a 8 x 8; cuadros mayores de de 12 x 12 se usan muy rara vez. Los cuadros latinos pequeños proporcionan pocos grados de libertad par estimar el error experimental, y así debe lograrse una distribución sustancial en el error experimental para compensar el corto número de grados de libertad (Steel y Torrie, 1985). Reyes (1992), establece que para aprovechar las ventajas de esta distribución, es indispensable: ☯ D ivid ividir ir Dividir
el lote lote lote o lugar luga lu garr de de la eexperiencia xp xpe eri rie encia ncia een n nú núme mero ro de un unid ida ades des el número unidades
eexperimentales x p er i m en t al es qque u e ssea ea iigual g u al aall ccuadrado u ad r ad o ddel el nnúmero ú m er o de de tratamientos. n ú m er o d e r ep et i c i o n es d eb e s er i g u al al n ú m er o d e
☯ El
t r at am i en t o s . ☯ Fo r m ar
h i l er as y c o l u m n as d e u n i d ad es ex p er i m en t al es
i g u al es e en n n ú m er o a a llas r r ep et i c i o n es yy a a llo s ttr tr rat am i en t o s . ☯ Di s t r i b u i r l o s t r at am i en t o s d e t al f o r m a q u e n i n g u n o s e r ep i t a
en ll a f f i l a n n i e en ll a cc o l u m n a. ☯ So r t ear
l as h i l er as y en el c u ad addr r o as í o b t en i d o s o r t ear l as
c o l u m n as . Es t o p er m i t e u n a d i s t r i b u c i ó n d e l o s t r at am i en t o s m ás d d i s p er s a e en e el cc am p o . Usando el cuadro base de las permutaciones horizontales:
1 2 3 4 5
A E D C B
B A E D C
C B A E D
D C B A E
E D C B A
43
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Mediante cualquier método de sorteo se supone que el sorteo de hileras numeradas del 1-5 quedando de la siguiente manera:
1 B E C A D
5 2 4 1 3
2 C A D B E
3 D B E C A
4 E C A D B
5 A D B E C
Numerando las columnas del 1-5 en este cuadro, se sortean las columnas, las cua cuale less que ueda dara ran na assí:
tratamiento
D
A 21
B E
20
22 D B
11 C
C 19
10 A
23 A D
12 E
18
B
C
E C
17
8
C A
16 15
D 7
D 3
25
14 A
E 2
E 24
13
9
1
B
6 B
4
5
núm. de unidad experimental
El anterior sería el cuadro final para la distribución de cuadro latino de 5x5 ; las unidades experimentales, experimentales, siguen un sistema que facilita su manejo. El registro de los tratamientos, repeticiones, número de unidades experimentales, etc., se realiza en forma similar a las distribuciones descritas. La distribución en cuadro latino es útil para realizar experimentos de campo, donde se experimentan fertilizantes, herbicida, insecticidas o se conoce la dirección de la variación variación en dos sentidos perpe perpendiculares. ndiculares. Cuando se tengan 3 ó 4 tratamientos y sea conveniente usar el cuadro latino, deberán hacerse varios cuadros latinos simultáneos. El estudio se hace en cad cada a cuadro en particular y luego en conjunto. 44
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Se utiliza el CU AD A DRO L AT A TINO MODIFIC AD A DO,
cuando se tienen de 20-30
tratamientos y el número de repeticiones es de 4-6, o el número de tratamientos es múltiplo del de repeticiones. Tiene la ventaja de aprovechar la eficacia de la distribución en bloques y del cuadro latino. El método consiste en dividir el número de tratamientos en grupos de tratamientos iguales al número de repeticiones. El número de tratamientos por grupo es el coeficiente de dividir en número de tratamientos entre el número de repeticiones (Reyes, 199 2). Si se ti tien enen en 20 trata tami mie entos con 5 re rep petici cio one nes s, se fo form rmar ara a un cuadro lati atin no de 5 x 5, es decir, 5 grupos x 5 repeticiones; cada grupo tendrá 20/5 = 4 tr atamientos en cada grupo:
1234 G1
5678 G2
9 10 11 12 G3
13 1 4 15 16 G4
repetición
V IV III II I
17 18 19 20 G 5
tratamiento
19 3 7 11 13
17 2 8 9 16
20 1 5 12 15
18 4 6 10 14
5 9 1 17 7 16 9
8 11 20 15 12
6 10 18 13 11
7 12 19 14 10
16 17 1 8 9
14 19 4 6 12
1
2
3
4
5
6
7
8
9
10 1 0 11 12 13 14 15 16 17 18 19 20
13 20 3 5 11
15 18 2 7 10
9 6 16 3 18
12 5 13 1 20
11 8 15 2 17
10 7 14 4 19
1 1 13 3 9 20 5
4 16 12 17 8
2 15 11 19 6
3 14 10 18 7
Unidad experimental
La distribución es tal que no repiten los tratamientos, ni en fila ni en columna. Se utilizarán 100 unidades experimentales, numeradas del 1-100. El registro de los tratamientos, repeticiones y de las unidades experimentales es similar a lo descrito en otras distribuciones.
45
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
2.8. D DISTRIBUCIÓN E EN B BLOQUES IINCOMPLETOS Cuando el número de tratamientos tr atamientos es alto, como cuando se evalúan líneas, cruzas, etc., en programas de genetecnia, la distribución en bloques que inclu yan todos los tratamientos es poco eficaz, porque los bloques resultarían muy largos y se afectarían más los tratamientos por la acción de la heterogeneidad del suelo, ya que la primera unidad experimental quedaría muy lejos de la última (Reyes, 1992). No se podría controlar la exagerada variación existente dentro de cada bloque (Padrón, 1985). En tales circunstancias, se han ideado distribuciones en las cuales se usan bloques pequeños que solo incluyan parte del número total de tratamientos, generalmente la raíz cuadrad cuadrada a del número total. Dentro de estas distribucion distribucione es esta el grupo de distribuciones de látice o bloques incompletos (Reyes, 1992). Existen varios tipos de látice, el simple repetido y el triple, q ue son, en general, diseños en equilibrio. Durante este curso solo se vera la aplicación del primero. De la Loma (1980) y Reyes (1992), mencionan las
siguientes
características para el diseño de bloques incompletos:
1) Ten er u n n ú m er o d e t r at am i en t o s i g u al a u n c u ad r ad o p er f f ec t o ; p o r e ej je 6,, 49, 64, 81, et c . L o s m ás jj em p l o : 25, 36 c o m u n es s o n el l át i cce e c on on 25, c o n 49 y c o n 81 t r at am i en t o s q u e sse lll am an ll át i c e 5 5 x 5 5, 7 7 x 7 7 yy 9 9 x 9 9 r r es p ec t i v am en t e.
46
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
2) Cad a bb l o q u e ii n c o m p l et o cc o n t i en e l a r r aíz cc u ad r ad a dd el n n ú m er o t o t al d e t r at am i en t o s y s e d es i g n a c o n l a l et r a k , es d ec i r k 2 p u ed e s er 25, 36, 49, et c ., y en t o n c es c ad a b l o q u e i n c l u i r á ú n i c am en t e 5 5, 6 6, ó ó 7 7 ttr at am i en t o s r r es p ec t i v am en t e. 3) Fo r m ar g r u p o s d2en o m i n ad o s g r u p o X y g r u p o Y, i n c l u y en d o c ad a g g r u p o ll o s kk ttr at am i en t o s . El grupo X se organiza en hileras
a b c d e
1 2 3 4 6 7 8 9 11 12 13 14 16 17 18 19 21 22 23 24 Grupo X básico
5 10 15 20 25
El grupo Y se organiza en columnas.
a b c d e
1 2 3 4 5
6 11 16 7 12 17 8 13 18 9 14 19 10 15 20 Grupo Y básico
21 22 23 24 25
En el grupo X, el bloque incompleto a siempre contiene los tratamientos 1, 2, 3, 4 y 5; y el b , los tratamientos tratamientos 6, 7, 8, 9 y 10, e etc. tc. El grupo Y, el bloque incompleto a siempre contiene los tratamientos 1, 6 11, 16 y 21; el b , los tratamientos 2, 7, 12,17, y 22, etc. En cada grupo X y Y se sortean independientemente los bloques incompletos y en cada bloque incompleto se sortean independientemente los tratamientos; por ejemplo: si los grupos básicos X y Y antes descritos se sortean y numeran las unidades experimentales, los arreglos pueden ser los siguientes:
ué és del sorteo Grupo X desp u
sorteos Grupo Y después del so
de bloques y tratamientos.
de bloques y tratamientos. Tratamiento
a b c d
7
10 6 9 8 21 22 23 24 25 24 21 25 22 23 20 19 18 17 16 13 14 12 15 11 11 12 13 14 15 1 4 3 5 2 10
9
8
7
6
a b c d
4
24 14 19 9 46 47 48 49 50 17 2 22 12 7 45 44 43 42 41 15 10 25 5 20 36 37 38 39 40 1 16 11 21 6 35
34
33
32
31
47
e
19 1
16 2
18 3
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
20 4
17 5
e
8 26
23 18 18 3 27 28 29 30
Unidad experimental
Los cuadros anteriores se pueden repetir haciendo los sorteos de bloques
y tratamientos independientes. independientes. Si se necesitara un látice 5 x 5, con 4 repeticiones se tendrían 2 grupos X y 2 grupos Y. La posición en el camp campo o debe ser tal que conserven los tratamientos en cada bloque incompleto. En frecuentes ocasiones no se tiene el número de tratamientos que sea un cuadrado perfecto, en cuyo caso se pueden incluir otros tratamientos para lograrlo.
48
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
2.9. E EXPERIMENTOS F F AC ACTOR AL I ALES A Los experimentos en los que se investigan dos o más factores simultáneamente se conocen como experimentos factoriales. El diseño factorial es un diseño de los tratamientos que se caracterizan por utilizar como tratamientos a todas las combinaciones posibles de las diferen tes modalidades (conocidas como niveles) de cada uno dos o más variables (conocidas como factores) que posiblemente afectan la variable de respuesta X en un experimento. Es decir, en un experimento en el que se intentan estudiar 2 factores A y B con a niveles y b niveles respectivamente, se ensayan todas las a x b posibles combinaciones de de niveles como trata tratamientos mientos (Hurley et al., 1981). Factor
Niveles
A
a 1 a 2 a a 3 ...a n
B
b 1 b b 2 b b 3 ...b n
Un factor es una clase de tratamiento, y en un experimen to factorial, todo factor proporcionara varios tratamientos. Por ejemplo, si la dieta es un fac factor tor en un experimento, entonces se usarán varias dietas; si la temperatura de horneado es un factor, entonces el horneado se hará a varias temperaturas (Steel y Torrie, 1995). En un experimento factorial no solo se pueden estudiar los efectos de los factores individuales sino, si el experimento se lleva acabo apropiadamente, puede estudiarse la interacción entre los factores (Daniel, 1993).
49
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Reyes (1992) menciona que cuando es necesario evaluar 3 variedades de sorgo, para producción de grano, cada una sembrada a dos densidades diferentes. En este caso, se tiene un experimento bifactorial. Si se necesitara estudiar la acción conjunta de 3 variedades de soya, cada una sembrada a 3 densidades de siembra y fertilizada con dos dosis de nitrógeno, se tendrá un experimento trifactorial, etc. Para los experimentos bifactoriales, las distribuciones más comúnmente usadas son: completamente al azar, bloques al azar y cuadro latino. Suponiendo que hay 3 variedades de sorgo, cada una sembrada a 2 densidades.
Variedad a 1 =Caprok a 2 = H-D50
Densidad b 1 =8 kg/ha b 2 = 12 kg/ha
a 3 = H-Exp. El método consiste en hacer todas las combinaciones posibles y considerar cada una como un tratamiento; con el número de tratamientos obtenidos se hace la distribución. De tal man manera era que qu quedaran edaran 6 tratam tratamientos. ientos.
Variedad a1 a2 a3
Densidad b 1 b2 a1 b 1 a 1 b 2 a2 b 1 a2b2 a3b1 a3b2
Estudiando los experimentos factoriales con experimentos simples o completamente al azar con A = 4, B = 3 y n =4 (repeticiones). Considerando cada combinación como tratamiento, se tendrían a x b = 12 tratamientos; si n = 4, el número de unidades experimentales será a x b x n = 48. Teniendo las siguientes causas de variación:
Causas de variación Tratamientos Error
GL ab-1 ab(n-1)
Total
abn-1
50
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Sin embargo se pueden tener interés en los siguiente:
a) Cu al e es lla m m e j o r vvar i ed ad b ) Cu al e es lla m e j o r d en s i d ad c ) Es t u d i ar el ef ec t o d e l a i n t er ac c i ó n o l a ac c i ó n c o n j ju u n t a d e v ar i ed ad – – d d en s i d ad . d En tales casos, el estudio de la variación se tiene que extender:
Causas de variación Tratamientos A B A x B Error Total
GL ab-1 a-1 b-1 (a-1) (b-1) ab (n-1)1 abn-1
La interacción significa la acción conjunta de 2 ó más factores, o la modificación del efecto de un factor por la acción del efecto de otro o más factores.
Los efectos pueden ser aditivos, multiplicativos o interactivos.
Suponiendo que hay 2 variedades de trigo, a 1 y a 2 y 2 densidades de siembra, b 1 = 100 kg/ha y b 2 = 120 kg/ha. Las siguientes tablas de doble doble entrada presentan el efecto.
Caso A. Variedad a 1 a2
Kg/ha
Densidad b 1(100) b 2(120) 15
35 = 20
5
25 = 20
- 10 -10 = 0
Respuesta Diferencia =0
40
a1
30 20
10
a2 100 120 Densidad
Cuando las diferencia de dos diferencias es cero (o puede estimar a cero), se dice que los efectos de los dos factores son aditivos o los factores son independientes; las líneas líneas de tendencia son p paralelas. aralelas. En el ejemplo, se conclu concluye ye 51
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
que las variedades se comportan de manera similar en densidades diferentes: las 2 incrementan su pr prod oduc ucci ció ón al a aum umen enta tarr la densidad de siembra.
1
Cuando se aplica el diseño de bloques al azar, los GL e se calcula a partir de: (ab-1)(n-1)
Caso B.
Kg/ha
a2
40
Variedad a1 a2
Densidad b 1(100) b 2(120) 35
5 = -30
Respuesta Diferencia =-60
30 20
10
a1
5 35 = +30 100
- 30 +30 = -60
120
Densidad
Los factores no son independientes y la densidad de siembra esta relacionada o depende depende de la varieda variedad d . En estos casos se dice que lo loss efectos variedades riedades se comportan comportan de son interactivos (o multiplicativos). En el ejemplo, las va modo diferente en densidades distintas en tanto que a 2 incrementa su producción al aumentar su densidad de siembra. Kg/ha
Caso C. Variedad a1 a2
Densidad b 1(100) b 2(120) 10
5 -5
Respuesta
40 = +30 Diferencia = 20 15 = +10 -25 = 20
40
a1
30
20
10
a2 100 120 Densidad
La diferencia de dos diferencias no es cero, los datos sugieren efectos interactivos; las 2 variedades aumentan la producción al incrementar la densidad
52
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
de siembra, pero a 1 aumenta más que a 2 . El estudio de la variación indic indicara ara si la diferencia es significativa o no. En general cuando se estudia dos o más factores, es recomendable ver si las líneas de tendencia sugieren ser paralelas (efectos aditivos) o sugieren cruzarse (efectos interactivos). El estudio de la variación mediante la técnica de ANAVA indicará si la diferencia de dos difer encias no es cero ni estima a cero (interacción). En el primer caso (A), la F no sería significativa, y las líneas de tendencia serían paralelas o manifestarían paralelismo; en el segundo caso (B), la F sería significativa y las líneas de tendencia o se cruzan o manifiestan no ser paralelas (casos B y C).
Daniel (1993), menciona que existe interacción entre 2 factores si un
cambio en uno de los factores produce un cambio en respuesta a nivel del otro factor distinto del produ producido cido en otros nive niveles les de ese fac factor. tor. Considera las siguientes ventajas del experimento factorial: ☯
Pu ed en e es t u d i ar s e lla iin t er ac c i ó n d d e 2 2 f f ac t o r es .
☯
Se a ah o r r es f u er zo . r a tt i em p o yy e
☯
Dad o a a qq u e ll o s d d i v er s o s f f ac t o r es ss e cc o m b i n an e en u u n e ex p er i m en t o , l o s r r es u l t ad o s tti en en u u n cc am p o d d e a ap l i c ac i ó n m m ás a am p l i o .
Por otro lado Hurley et al. (1981), menciona la siguiente desventaja: ☯
Si el nn ú m er o dd e f ac t o r es o n i v el es es g r an d e, c ad a r ep l i c a ii m p l i c a m u c h as u n i d ad es ex p er i m en t al es q u e p u ed en n o es t ar f ác i l m en t e d i s p o n i b l es o o r r es u l t an ss er m m u y h h et er o g én eas .
53
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
A D III. A Á L ISIS D DE V AR A R AN I ANZ A A UNID AD AN ÁL
3.1. IINTRODUCCIÓN El Análisis de Varianza (ANAVA) se define como la técnica mediante la cual la variación presente en un conjunto de datos se distribuye en varios componentes. Asociados en cada uno de estos comp componentes onentes hay una fuente específica de variación, de modo que en el análisis es posible averiguar la magnitud de las contribuciones de cada una de estas fuentes de variación total. El ANAVA se utiliza con dos fines distintos: 1) estimar y probar la hipótesis acerca de las varianzas de las poblaciones y 2) estimar y probar hipótesis acerca de las medias de las poblaciones, siendo esta última la más empleada (Daniel, 1993). A pesar de su nombre, el ANAVA no incluye al análisis de la misma varianza sino de de la participación de la suma total de los ccuadrados. uadrados. Consiste en una comparación entre dos estimas de la varianza total (es decir, del conjunto completo de medidas incluidas en el análisis), una de ellas basada en la varianza de las medias muestrales alrededor de la media (la varianza entre tratamientos ó tratamiento), y la otra basada en la varianza de las medidas individuales alrededor de sus medias de tratamiento (la varianza error o intratamiento).
Las
suposiciones más importantes sobre las que se basa el ANAVA para poder ser aplicada correctamente son: 1) que los efectos son aditivos, por ejemplo, un valor individua uall (d (de e xx)) se co cons nsid ider era a q que ue es esta ta ffor orma mado do a e exp xpen ensa sas s de de la gr gran an me medi dia a + efecto del tratamiento + error no controlado. 2) que el error no controlado se 54
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
distribuye normalmente y tiene la misma varianza para todos los tratamientos. Estas suposiciones se satisfacen en gran número de experimentos e investigaciones, por tanto, las conclusiones obtenidas a partir del análisis de los datos resultantes son válidas.
Cuando algunas veces no
satisfacen
completamente, se hacen ajustes que se basan en una transformación, la cual consiste en convertir, antes del análisis, los contajes y las medidas originale s en una cierta función matemática de los mismos (Bishop, 1966). Reyes (1992), menciona que cuando se tienen dos o más tratamiento s, la interpretación más actualizada es considerarlos como problemas de muestreo, en cuyo caso se utilizara la técnica de Fisher conocida también como ANAVA. El método consiste en separar, de la variación total observada, las diferentes cau sas o factores de variación que influyen en cu alquier experimento y que afectan en distinto grado el efecto efecto de los tratamientos. A fin de sepa separar rar las diversas ccau ausas de variación, se sigue el método siguiente:
1) 1) S epa para rarr los los gr gra aados do doss de lilibe bert rta ad ((GL) GL) para para ca cada da fact fa ctor or o ca caus usa as de Separar Se parar grados libertad factor causas variación. 22)) CCalcular al c u l ar lla a ssuma u m a dde e ccuadrados u ad r ad o s dde e llas as ddesviaciones es v i ac i o n es ddee llas as oobservaciones b s er v ac i o n es con c o n respecto r es p ec t o aa la l a media, m ed i a, para p ar a cada c ad a causa c au s a de de variación.
33)) C al c u l ar lla a vvarianza ar i an za oo ccuadrados u ad r ad o s m ed i o s para p ar a ccada ad a ffactor ac t o r de de Calcular medios variación. 44)) P r o b ar hhipótesis i p ó t es i s por p o r medio m ed i o de d e la l a prueba p r u eb a de d e F o r el ac i ó n d e Probar v ar i an zas . 5) Co m p ar ar l as m ed i as d e l o s t r at am i en t o s (d i s c r i m i n ac i ó n d e v ar i ab l es ). Cu an d o h ay ú n i c am en t e d o s t r at am i en t o s , s i l a F r es u l t a s i g n i f i c at i v a, l as c o n c l u s i o n es s o n eq u i v al en t es a i n d i c ar q u e l o s t r at am i en t o s t i en en ef ec t o d i s t i n t o o q u e l as d i f er en c i as en t r e ll as m m ed i as d d e ll o s tt r at am i en t o s ss o n ss i g n i f i c at i v as ss i p p < < 5 5 % % (*) o al t am en t e s i g n i f i c at i v as s i p < 1 % (**). Cu an d o l o s t r at am i en t o s s o n n u m er o s o s , s e s i g u en d i f er en t es m ét o d o s p ar a d i s c r i m i n ar v ar i ab l es yy cc l as i f i c ar llo s tt r at am i en t o s . 55
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Para realizar el ANAVA, es necesario usar la siguiente nomenclatura: a = número de tratamientos i = 1,2,...a tratamientos n = número de repeticiones j = 1,2,...n repeticiones an = número de unidades experimentales X = observaciones X ij = valor de la muestra i para la observación j
∑X ij =X... gran total o suma de las an observaciones X i = suma de los valores para las n repeticiones de la muestra i
⎯ x i = X i /n, promedio para cualquiera de las muestras i x⎯ = X../an. Promedio general de las an observaciones A = se presentan casos (lo más común o lo ideal ) en los qe n es igual para todas las muestras; es decir, n = n1 = n 2 = n 3 , etc. B = hay casos, poco deseables pero que pueden ocurrir, en los cuales n 1 ≠ n 2 ≠ n 3 Cuando se tienen varios tratamientos se presenta el problema de hacer la comparación de medias de los tratamientos, a fin de discriminar variables y clasificar los tratamientos para elegir el mejo mejorr si es necesario. La prueba de F significativa indica realmente que la variable entre los tratamientos no se debe al azar, sino a un efecto distinto de dichos tratamientos, lo cual es equivalente a indicar que las diferencias son significativas entre las medias de las poblaciones, estimadas por las medias de las muestras; sin embargo, la prueba de F no indica cuáles medias son iguales o cuáles medias son diferentes, ya que puede suceder que en una serie de tratamientos la prueba de F indique diferencias en conjunto, pero en un par par en particular sea igual. Con los datos del ANAVA se hacen las
p r u eb as d e s i g n i f i c an c i a d e l as d i f er en c i as o l as c o m p ar ac i o n es en t r e l as 1995). 95). Para m ed i as d e l o s t r at am i en t o s (Reyes, 1992 y 1995; Steel y Torrie, 19 ello, existen varios métodos como son: la prueba de t, prueba de Tukey, prueba 56
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
de Duncan, comparación de ortogonales, prueba de Scheffé, etc., aquí se verán únicamente las tres primeras.
PRUEB A A DE t .
Esta prueba se aplica cuando F e ess significativa, cuando las
comparaciones entre las medias son independientes y se ha planteado dichas comparaciones antes de que los datos sean examinados. El número de comparaciones independientes (ortogonales) que pueden hacerse es igual a a-1 o al número de GL para los tratamientos. Con a tratamientos se pue pueden den ob obtener tener que e las compa comparaciones raciones a (a-1)/2 diferencias o comparaciones múltiples. Se dice qu son
independientes
cuando
cada
media
aparece
únicamente
en
una
comparación. Para hacer la prueba de t se pueden seguir dos métodos: 1) Hacer comparaciones múltiples calculando una
diferencia
mínima
significativa común (DMS) con la siguiente fórmula: DMS = t α (GLe )
2CM e n
n = número de repeticiones
a) Dos promedios son estadísticam estadísticamente ente distintos si su diferen diferencia cia es mayor que la DMS. D
>
DMS
b) Dos promedios son estadísticamente iguales; si su dif erencia estima acero, si su diferencia es menor que la DMS. D
<
DMS
2) Planear comparaciones independientes.
Este es el mejor método y
consiste en también en calcular una DMS, pero para cada comparación.
DMS = t α ( GLe )
CM e n
+
CM e n
aplicable si n 1 = n 2 o n 1 ≠ n 2
Las mismas reglas descritas se aplican para determinar la significancia de las diferencias.
Ejemplo 7.
57
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Incremento de peso cuando se someten a cerdos a un tratamiento con vitamina B 12 .
Niveles de vitamina B 12 (mg)
Tr at am i en t o
Xi
0 5 10
1 2 3
2.73 4.62 4.74
n=3
GL e = 6 CM e = 0.0131
⎯x i 0.91 1.54 1.58
a(a-1)/2= 3(3-1)/2=3 α = 0.05
Comparación múltiple: DMS = t α (GLe ) −
2CM e n
2(0.0131)
= t 05(6)
3
= 2.447(0.0932) = 0.228
−
x 3 − x 2 = 1.58 − 1.54 = 0.04 < 0.228 NS −
−
−
−
x 3 − x1 = 1.58 − 0.91 = 0.67 > 0.228 ∗ x 2 − x1 = 1.54 − 0.91 = 0.63 > 0.228∗ Conclusión:
1. N No h hay d dif er encia ssignif icativa e entr e llos n niveles yy llos e ef ectos sson iiguales. 2. C Cualquier n de B B 12 e es ssuper ior a al ttestigo. nivel d Comparaciones iin ndependientes:
a) Tratamientos en oposición al testigo. −
−
x 3 + x 2 − − = x 3 + x 2 − x1 = 4.62 + 4.74 − 2.73 = 0.65 x1 2 6 3 6 3
DMS = 2.447
0.0131 6
+
0.0131
3 0.65
>
= 0.199 0.199 ∗
b) Entre tratamientos. −
−
x 3 − x 2 = 1.58 − 1.54 = 0.04 < 0.228 NS 58
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Conclusiones:
1. E El p pr omedio d de llos n niveles e es ssuper ior a al d del ttestigo. 2. No hay dif er encias entr e los niveles 5 y 10 mg de vitamina B 12 ; los incr ementos sson iiguales. Cuando GL t es 1, la t calculada con los datos experimentales es igual a √F, calculada con dichos datos. Cuando n 1 ≠ n 2 se emplea: DMS = t α
CM e
2
⎛ 1 1 ⎞ ⎜⎜ + ⎟⎟ ⎝ n 1 n 2 ⎠
PRUEB A DE TUK EY. Este método se emplea para hacer todas las comparaciones múltiples que son posibles con a tratamientos mediante a(a-1)/2, poniendo las medias en orden creciente o decreciente y se resta de la media mayor todas las demás medias. El procedimiento consiste en ccalcular alcular un valor te teórico órico común o diferencia mínima significativa mediante la aplicación de la siguiente fórmula: Cuando n 1 ≠ n 2
Cuando n 1 = n 2 −
−
D
= qS x = W ; W = qα ( a ,GL ) S x
q
= valor tabular (α , a GLe ) en tablas de Tukey.
W = qα
e
CM e
2
⎛ ⎞ ⎜⎜ 1 + 1 ⎟⎟ ⎝ n1 n2 ⎠
Si D (diferencia e entr ntre e las medias) medias) > q 05 S x * Si D (diferencia entre las medias) < q 01 S x ** En caso contrario las medias deben considerase iguales o equivalentes, o la diferencia observada estima a cero y, por tanto es NS.
PRUEB A D A D DE DUNC AN A N. Esta prueba es llamada también prueba de rangos múltiples o prueba de t modificada.
Permite hace hacerr todas las compa comparaciones raciones m múltiples últiples
posibles con a promedios, conforme conforme a la fórmula a(a-1)/2. Esta prueba se utiliza cuando el número de muestras (tratamientos) (t ratamientos) o promedios es considerable (a ≥ 6) y cuando la prueba de F (AN AVA) no sea significativa, pero este cerca del valor significativo. Utilizando el valor de t por Du Duncan ncan para α = 0.05 y α = 0.01 y para GL e .
59
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
La prueba consiste en ordenar las medias de tratamientos en serie por
magnitud creciente o decreciente.
Posteriormente se calcula el límite de
significancia (LS) para cada 2 medias que se comparan considerando su posición o lugar en la serie y el número de medias en las serie que separan a las medias que se están comparando. El valor se calcula. Cuando n 1 = n 2
Cuando n 1 ≠ n 2 2
−
LS = t α S x
LS = t α
S
2
⎛ 1 1 ⎞ ⎜⎜ + ⎟⎟ ⎝ n1 n2 ⎠
2
−
=
S x
S
n
3.2. D DISTRIBUCIÓN AL AZ AR A
continuación
se
dan
ejemplos
aplicados
de
la
distribución
completamente al azar y de la comparación de medias, de igual manera se proponen una serie de ejercicios para comprobar el aprendizaje. Para esta distribución distribución se tienen las ssiguientes iguientes causa causass de variación que se aplicaran para el ANAVA:
Causas de Grados de variación Libertad (GL) a-1 Tratamiento
Suma de cuadrados (SC)
∑ X
2
− FC
i
n
Error
a(n-1)
Total
an-1
Factor de Corrección:
= SC T − SC t
SC e
∑
X ij
FC =
2
X 2 ... an
− FC
Cuadrado medio (CM) SC t GL
SC e
= A
F A B
= B
GL
Cuando se tienen que n 1 ≠ n 2 :
GL e = n-a
GL T = n-1
60
FC =
2 X ...
∑n
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
SC t
i
=∑
X i ni
2
⎡ X 1 2 X 2 2 X 3 2 ⎤ − FC = ⎢ + + ⎥ − FC n2 n3 ⎥⎦ ⎢⎣ n1
Ejemplo 8. En un estudio del efecto de la glucosa sobre la liberación de insulina, se trataron muestras de tejidos pancráticos de animales de laboratorio con cinco estimulantes distintos. liberada.
Posteriormente, se determino la cantidad de insulina
Se desea saber si se debería concluir que existe una diferencia
significativa en las cinco poblaciones con respecto a la cantidad media de insulina liberada, y si fuera asi, determinar cual es el mejor tratamiento mediante la prueba L os datos se dan en la siguiente tabla: Sea α = 0.05. de Tukey. Lo
1
2
Estimulante 3
1.53 1.61 3.75 2.89 3.26
3.15 3.96 3.59 1.89 1.45 1.56
13.04 ⎯x = 2.608
15.60 ⎯x = 2.6
4
5
3.89 3.68 5.70 5.62 5.79 5.33
8.18 5.64 7.36 5.33 8.82 5.26 7.10
5.86 5.46 5.69 6.49 7.81 9.03 7.49 8.98
30.01 ⎯x = 5.0
47.69 ⎯x =6.81
56.81 ⎯x = 7.10
El juego de hipótesis sería:
H o : μ 1 =μ 2 =μ 3 =μ 4 =μ 5 o todas las medias son iguales H A : μ 1 ≠ μ 2 ≠ μ 3 ≠ μ 4 ≠ μ 5 o todas las medias son diferentes 61
2
FC =
X ...
∑n SC = ∑ X
=
(163.15)2 32
i
T
X i 2
∑n
i
= 831.810
− FC = (1.53) 2 + (1.61) 2 + (3.75) 2 + ...(8.98) 2 − 831.810 = 162.542
ij
S C t =
SC e
2
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
13.04)2 (15.6)2 (30.01)2 (47.69)2 (56.81)2 ⎤ ( ⎡ − FC = ⎢ + + + + ⎥ − 831.810 = 121.185 5 6 6 7 8 ⎣ ⎦
= SC T − SC t = 162.542 − 121.185 = 41.356 Causas de variación Tratamientos Error Total
GL
SC
CM
F
4 27 31
121.185 41.356 162.542
30.296 1.531
19.79*
Fc 19.78
F 05(4,27) 2.69; p< 5 % * s e ac ep t a H A
>
CV =
S
x... 163.15 x = = ni 32
(100)
x
= 5.098
CV =
CM e
=
x
1.531 5.098
(100) = 24.3%
x5 ⎯
x4 ⎯
x3 ⎯
x2 ⎯
x1 ⎯
7.10
6.81
5.0
2.608
2.6
Se tienen a(a-1)/2= 5(5-1)/2= 10 combinaciones
W = q 05(5, 27 )
1.531 ⎛ 1
1 ⎜ + ⎞⎟ = 1.852 Para las medias 5 y 4. 2 ⎝ 8 7 ⎠
x 5 - ⎯ x 4 = 7.10 – 6.81 = 0.29 < 1.852 NS ⎯ x 5 - ⎯ x 3 = 7.10 – 5.0 = 2.1 > 1.936 * ⎯
⎯ x 2 = 7.10 – 2.608= 4.49 > 1.936 * x 5 - ⎯ x 5 - ⎯ x 1 = 7.10 – 2.60 = 4.5 > 2.044 * ⎯
⎯ x 4 - ⎯ x 3 = 6.81 – 5.0 = 1.81 < 1.995 NS ⎯ x 4 - ⎯ x 2 = 6.81 – 2.608 = 4 4.202 .202 > 1.995 *
62
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
x 4 - ⎯ x 1 = 6.81 – 2.60 = 4.21 > 2.099 * ⎯ x 3 - ⎯ x 2 = 5.0 – 2.608 = 2.392 > 2.070 * ⎯ x 3 - ⎯ ⎯ x 1 = 5.0 – 2.60 = 2.392
> 2.171 *
x 2 - ⎯ x 1 = 2.608 – 2.60 = 0.008 < 2.171 NS ⎯
⎯x 5
⎯x 4
⎯x 3
⎯x 2
⎯x 1 7.10
6.81
5.0
2.608
Los tratamientos 5 y 4 son los que liberaron mayor cantidad de insulina
2.6
Ejemplo 9. Se recolectaron muestras de agua en cuatro lugares distintos de un río para determinar si la cantidad de oxígeno disuelto, esto es una medida de la contaminación del agua, varía varía de un lugar a otro. Los lugares 1 y 2 se escog escogieron ieron passar por una p pllanta iin ndustrial, u un no cce erca de la o orril illla y el o ottro a la mitad antes de pa del río; el lugar 3 se tomó adyacente a la descarga de agua industrial de la planta y el lugar 4 se tomó río abajo a mitad del río. Se seleccionaron en cada lugar cinco muestras de agua, pero se perdió una muestra del lugar 4 en el laboratorio. Los datos se presentan en la siguiente tabla (a mayor contaminación, menores las lecturas de oxígeno oxígeno disuelto). ¿Proporcionan los datos evidencia suficiente para indicar una diferencia entre las cantidades medias de oxígeno disuelto para los cuatro lugares?. Determinar el CV, la comparación de medias por el método de Tukey, siendo α = 0.05.
Lugar 1 2 3 4
Contenido medio de oxígeno disuelto 5.9 6.3 4.8 6.0
6.1 6.6 4.3 6.2
6.3 6.4 5.0 6.1
6.1 6.4 4.7 5.8
6.0 6.5 5.1
∑ 30.4 32.2 23.9 24.1
⎯x 6.08 6.44 4.78 6.02
63
FC =
(110.6) 2 19
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
= 643.808
⎡ (30.24)2 (32.2 )2 (23.9 )2 5 (24.1)2 ⎤ + + + SC t = ⎢ ⎥ − 643.808 = 7.836 5 5 5 4 ⎣ ⎦ SC T
= (5.9) 2 + (6.1) 2 + ...(5.8) 2 − 643.808 = 8.452
SC e
= 8.452 − 7.836 = 0.616
Cuando n1
≠ n2 : GLe = n − a = 19 − 4 = 15
GLT
= n − 1 = 19 − 1 = 18
Fuentes de variación Tratamientos
GL
SC
CM
F
3
7.836
2.612
63.707
Error Total
15 18
0.616 8.452
0.041
Fc
F 05(3,15)
63.707
>
3.29; p< 5 % *
Existe diferencia significativa entre la concentración de oxígeno disuelto el los 4 lugares muestreados.
CV =
0.041 5.821
(100) = 3.47 %
Para el número de comparaciones : a( a − 1) / 2 = 4( 4 − 1) / 2 = 6
⎯x 4
⎯x 3
⎯x 2
⎯x 1
6.44
6.08
6.02
4.78
Para las med medias ias 4 y 3 se ti tiene: ene: W = q05( 4,15)
1 ⎞ ⎜ + ⎟ = 0.364 ⎝ 5 5 ⎠
0.041⎛ 1
2
x 4 - ⎯ x 3 = 6.44 – 6.08 = 0.360 < 0.364 NS ⎯ ⎯ x 4 - ⎯ x 2 = 6.44 – 6.02 = 0.42
> 0.387 * 64
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
x 4 - ⎯ x 1 = 6.44 – 4.78 = 1.66 > 0.364 * ⎯ x 3 - ⎯ x 2 = 6.08 – 6.02 = 0.06 < 0.387 NS ⎯ ⎯ x 3 - ⎯ x 1 = 6.08 – 4.78 = 1.3
> 0.364 *
x 2 - ⎯ x 1 = 6.02 – 4.78 = 1.24 ⎯
>
0.387 *
⎯x 4
⎯x 3
⎯x 2
⎯x 1
32.2
30.4
24.1
23.9
Las concentraciones de oxígeno fueron mayores para las medias 4 y 3 , las medias 3 y 2 son iguales.
jempl plo o 10. E jem En una investigación del efecto del NaCN (cianuro sódico) sobre la incorporación in in vitro de un aminoácido particular por preparaciones de intestino de una cierta especie de pez, se encontró que cada pez podría suministrar únicamente seis preparaciones. Como sería necesario utilizar más de un pez en cada experimento, se llevó a cabo un test preliminar para examinar la variación entre las preparaciones procedentes para cada uno de cuatro peces distintos. Los resultados obtenidos, expresados en μmol g-1 de peso seco para un período de 20 minutos, fueron los siguientes:
Réplica Réplic a
P e 1
1 2 3
∑ ⎯x
2
z 3
4
2.53 2.04 2.34
2.02 1.92 2.03
1.66 1.92 1.47
1.36 1.15 1.16
6.91 2.303
5.97 1.99
5.05 1.683
3.67 1.223
65
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Analizar estos datos y explicar si existen diferencias entre la incorporación del NaCN y la especies de pez. Comparar las media por el método de Duncan, y el CV, siendo α = 0.05.
FC =
SC t
=
(21.6)2 = 38.88 4(3)
(6.91) 2
+ (5.97) 2 + (5.05) 2 + (3.67) 2 3
− 38.88 = 1.906
SC T
= (2.53) 2 + (2.04) 2 + ...(1.16) 2 − 38.88 = 2.166
SC e
= 2.166 − 1.906 = 0.260
Fuentes de variación Tratamientos Error Total
GL
SC
CM
F
3 8 11
1.906 0.260 2.166
0.635 0.032
19.843
Fc
F 05(3,8)
19.843
>
4.07; p< 5 % *
Existen diferencias significativas en la incorporación del NaCN entre las especies de peces. CV =
0.032 X 100 = 9.93 % 1 .8
a(a-1)/2= 4(4-1)/2= 6
⎯ x 4
⎯x 3
⎯x 2
⎯x 1
6.91
5.97
5.05
3.67
0.032
= 0.103
LS = = t α S x LS = t 05(3,8) S x
S x
=
CM e n
=
3
LS = 3.26(0.103) = 0.335 para un par de medias.
66
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Nu m . d e p r o m e d i o s t 0.0 0.05 5 multi ple LS 6.91 5.97 3.67 3.24 2.3 0.357 0.349 0.92 0. 5.05 1.86 0.349 0.335 0 5.97 0.94 0.335 6.91 0
2
3
4
3.26 0.335
3.39 0.349
3.47 0.357
5.05 3.67 1.38 0.335 0 0
x4 ⎯
x 3 ⎯ x2 ⎯
x1 ⎯
6.91
5.97
3.67
5.05
Todas las medias son diferentes. La media 4 in incorpora corpora mayor ca cantidad ntidad de NaCN.
Ejercicio Ejercici o 7. Se hicieron determinaciones de la glucosa en la sangre de 10 ejemplares de cada 5 razas de cierto tipo de animal experimental. Los resultados fueron los siguientes:
A
B
C
D
E
124 116 101 118 118 120 110 127 106 130
111 101 130 108 127 129 122 103 122 127
117 142 121 123 121 148 141 122 139 125
104 128 130 103 121 119 106 107 107 115
142 139 133 120 127 149 150 149 120 116
¿Aportan Estos datos evidencia suficiente para indicar una diferencia en el nivel promedio de glucosa sanguínea entre razas?. Sea α = 0.05. Realice el ANAVA, determine el CV y compare las medias medias por el método de Duncan. Duncan.
67
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejercicio Ejercici o 8. Se comparó la sobrevivencia de las larvas de camarón blanco Penaeus
vannamei a base de tres tipos de alimento siguiendo la dieta tradicional: alimento vivo, microencápsulado y una combinación de ambos en igual proporción, a partir de Protozoea II. Teniendo 4 repeticiones pa para ra cada dieta, en tanques de 800 l y a una densidad de 100 larvas/l, teniendo una población de inicial de 8000 larvas en cada ca da ta tanq nque ue.. Los res esul ulta tado doss son los sigu siguie ient ntes es:
Al iment im ento o vviv ivo o (% sobrev.) Microencápsulado (% sobrev.) 50 % ali. vivo/ 50% ali. me. (% sobrev.)
1
2
3
4
2 775 (35) 906 (11 ) 3100 (39)
2 289 (29) 566 (7 ) 2960 (37)
1 642 (21) 37 (0.5 ) 3300 (41 )
1925 (24) 1 302 (16 ) 3700 (46 )
Determine si existen diferencias significativas entre las sobrevivencia medias logradas con los tres tipos de alimen alimentos. tos. Determine el CV y compare las medias por por el mé método todo de Tukey. Sea α = 0.05.
Ejercicio Ejercici o 9. En un zoológico se muestreo la cantidad de alimento consumido (en kg por día) de ciervos adultos en cada estación del año, dando los siguientes resultados:
Febrero Fe brero
Mayo Mayo
Agosto Agos to
Noviembre
4.7 4.9 5.0 4.8 4.7
4.6 4.4 4.3 4.4 4.1 4.2
4.8 4.7 4.6 4.4 4.7 4.8
4.9 5.2 5.4 5.1 5.6
Probar la hipótesis de que el consumo de alimento sea igual en las cuatro estaciones. Hacer el ANAVA, determina determinarr el CV y compara las medias por el método de Tukey. Siendo α = 0.01.
E jer jerci cici cio o 10 .
68
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Realizar los ejercicios 4 y 5, de los grupos sorteados, mediante este
= método para comprobar que t =
2 F o t = F.
3.3. B BLOQUES AL AZ AR A continuación se dan ejemplos aplicados de la distribución en bloques al azar y de la comparación de medias, de igual manera se proponen una serie de ejercicios para comprobar el aprendizaje. El modelo de ANAVA para un experimento con distribución en bloques al azar de a variedades y n tratamientos, es el siguiente:
Fuentes de variación Tratamientos
GL a-1
SC
∑ X
2
i
− F C
n
Bloques
n-1
∑ X
j
a
2
− F C
CM SC t GL SC b GL
F
= A = B
A C
69
Error
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
(a-1) (n-1) SC e = SC T − ( SC b + SC t )
Total
SC e GL
= C
∑ X − FC
an-1
2
ij
Ejemplo 11. Cuatro diferentes catalizadores A, B, C, y D son utilizados en un experimento para comparar los rendimientos de una reacción química. Supóngase que uno de los lotes de materiales es suficiente para efectuar 4 pruebas. Si se utilizan cuatro lotes de materiales (como los cuatro bloques bloques), ), cada lote es dividido en cuatro partes y a cada parte se le asigna aleatoriamente un catalizador, de tal forma que en cada lote estén asignados los cuatro tipos de catalizadores, se tiene un diseño en en bloques aleatorio aleatorios. s. Sea α = 0.05.
Tratamie Tra tamientos ntos A B C D ∑x j x j FC =
⎜⎛ 1440 ⎞⎟ ⎝ ⎠
I
B lo q u e s II III
IV
89 86 89 88
90 88 92 90
92 90 93 94
86 90 91 92
352 88.00
360 90.00
369 92.25
359 89.75
∑x i ⎯x i 357 354 365 364 1 440
89.25 88.50 91.25 91.00 90
2
= 129600
4( 4)
(357) 2
+ (354) 2 + (365) 2 + (364) 2
− 129600 = 21.5
SC t
=
S C T
= (89) 2 + (86) 2 + (89) 2 + ...(92) 2 − 129600 = 80
4
(352) 2
+ (360) 2 + (369) 2 + (359) 2
SC b
=
SC e
= 80 − (21.5 + 36.5) = 22.0
4
− 129600 = 36.5
Las hipótesis por probar son:
H o : Todos los métodos métodos son iguales iguales H A : Todos los métodos m étodos son dif difere erentes ntes 70
Fuentes de variación Tratamientos Bloques Error Total
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
GL
SC
CM
F
3 3 9 15
21.5 36.5 22.0 80.0
7.167 12.167 2.444
2.93
Fc 2.93
F 05 (3,9) <
3.86; p< 5 % NS
Se acepta la hipótesis nula, es decir no existen diferencias significativas entre los catalizadores. catalizadores. Por lo tanto no se realiza la prueba de com comparación paración de medias.
Ejemplo 12.
iliina. Se desea saber si existe diferencia entre 6 distintas muestras de penicil
Para probar estas se utilizará el método de la placa Bacilo subtilis.
En este
método de laboratorio se vierte una solución inoculada en una caja de petri de 9 mm de diámetro aproximadamente.
Después se disponen 6 pequeños tubos
cilíndricos huecos (de 0.4 cm aprox. de diámetro) sobre la superficie a intervalos iguales. Se chocan unas cuantas gotas de penic penicilina ilina que van a ser comparadas en los cilindros y la caja de petri se coloca durante cierto tiempo en una incubadora. La penicilina se difu difunde nde de los cilindros a la caja, lo que produce una zona circular de crecimiento de los organismos que se puede medir fácilmente.
En esta investigación las 6 muestras (tratamientos) se comparan en 5 cajas
(bloques). Los diámetros del círculo en mm aparecen en la siguiente tabla (se ha restado de cada observación una cantidad constante de 20 mm). 71
Tratamiento Trata mientoss A B C D E F x j x j
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
I
B lo q u e s II III IV
V
7 3 6 3 3 1
4 2 5 3 2 -1
6 3 6 3 3 0
5 2 4 3 3 -1
4 1 4 2 2 0
23 3.83
15 2.5
21 3.5
16 2.6
13 2.16
∑x i
⎯x i
26 11 25 14 13 -1 88
5.2 2.2 5.0 2.8 2.6 -0.2
Probar con un nivel de significancia α = 0.01 si existe diferencia entre las distintas muestras de penicilina.
FC =
Las hipótesis por probar son:
H o : To d o s l o s m ét o d o s s o n i g u al es
a = 6 n = 5
H A : To d o s l o s m ét o d o s s o n d i f er en t es
(88)2 6(5) ( 26) 2
= 258.14 = 258.14 + (11) 2 + (25) 2 + ...(−1) 2
− 258.14 = 99.46
SC t
=
SC T
= (7) 2 + (3) 2 + (6) 2 + ...(2) 2 − 258.14 = 117.86
SC b
2 2 2 = (23) + (15) + ...(13) − 258.14 = 11.86
SC e
= 117.86 − (99.46 + 11.86) = 6.54
5
6
Fuentes de variación Tratamientos Bloques Error Total
GL
SC
CM
F
5 4 20 29
99.46 11.86 6.54 117.86
19.892 2.965 0.327
60.83
72
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Fc
F 01 (5,20)
60.83
>
4.10; p> 1 % **
Las medias de las soluciones de penici lina presentan una diferencia altamente significativa. significativa. Por lo que se pr ocede a la comparación de las medias por el método de Duncan.
⎯x 1
LS = t α S x
⎯x 3 ⎯x 4
5.2
S x =
CM e
Tratamientos T (0.01) (0.01) múltip le LS
-0.2 2.2 2.6 2.8 5.0
5.0
=
n
⎯x 5 ⎯x 2
2.8 0.327 5
2.6
2.2
= 0.255
-0.2
a(a-1)/2= 6 (6-1)/2 = 15
2
3
4
5
6
4.02 1.025
4.22 1.076
4.33 1.104
4.40 1.122
4.47 1.139
5.2
5.0
2.8
2.6
2.2
5.4
5.2
3.0
2.8
2.4
1.139
1.122
1.104
1.076
1.025
3 1.122 2.6
2.8
0.6
0.4
0
1.104
1.076
1.025
2.4
0.2
1.104
1.076
1.025
2.4
2.2
1.076
1.025
0.2
⎯x 6
0
0
0
-0.2 0
Todas las medias encerradas en el mismo cuadro son diferentes, las restantes son iguales.
1.025 5.2
0
⎯x 6
5.2
⎯x 5 ⎯x 4 5.0
2.8
⎯x 3 ⎯x 2 2.6
2.2
⎯x 1 -0.2
Las medias 6 y 5 dieron los valores más altos de penicilina, las medias 4, 3 y 2 son iguales. 73
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejercicio 10 Se comparó el efecto de varios herbicidas sobre el peso de las flores de gladiolos. El peso promedio por inflorescencia en onzas se da a continuación para los cuatro tratamientos.
Tratamiento Trata miento
Bloques II III
I Control 2,4-D TCA DN/Cr Sesin
1.25 2.05 1.95 1.75
1.73 1.56 2.00 1.93
IV
1.82 1.68 1.83 1.70
1.31 1.69 1.81 1.59
Determinar si existen diferencias entre los tratamientos, calcular el CV y realizar la comparación de medias por e ell método de Tuk Tukey. ey. Sea α = 0.05.
E jer jerci cici cio o 11.
Los siguientes resultados fueron obtenidos
en un experimento para
determinar si los diferentes operadores obtenían diferentes resultados, en varias muestras de suelo para analizar en el laboratorio el efecto de fósforo.
O p e r a do r e s B C
Semana
A
1
430
350
2 3
472 539
427 525
D
E
570
390
485
389 518
517 498
308 489
a) Hacer el ANAVA para medir el efecto de los operadores tomando la lass semanas como repeticiones. b) Probar H o : μ= 0 con α = 0.05 c) Comparar las medias de los tratamientos por el método de Duncan d) Determinar el CV.
Ejercicio Eje rcicio 12. 74
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Dieciséis personas excedidas de peso participaron en un estudio para
comprobar 4 regímenes para bajar de peso. Las personas se agruparon de acuerdo con el peso inicial y cada una de las 4 personas de cada grupo de peso inicial fue asignada la azar a uno unoss de los 4 regímen regímenes es reductores. Al término del periodo experimental, se registraron las sig uientes perdidas de peso en lbs.
Peso Pe so inicial ini cial (lbs) 150-174 175-199 200-225 más de 225
A
Regímenes B C
D
12 15 15 18
26 29 27 38
23 25 24 31
24 23 25 33
Después Desp ués de elimin eliminar ar las difer diferencia encias s debid debidas as al peso inici inicial al ¿Propo ¿Proporcionan restos datos la evidencia suficiente que indique una diferencia en los efectos de los regímenes?. Sea α = 0.0 0.01. 1. De Dete term rmin ine ee ell CV CV y co com mpar are e llas as me medi dias as por el méto todo do de Tukey.
3.4. C CU ADRO L L ATINO A continuación se dan ejemplos aplicados de la distribución en cuadro latino y de la comparación de medias, de igual manera se proponen una serie de ejercicios para comprobar el aprendizaje. El ANAVA para un experimento con distribución en cuadro latino se lleva acabo bajo las siguientes fuentes de variación:
Fuentes de variación Tratamientos
GL a-1
SC
∑ X
2 t
n
Columnas
a-1
∑ X
Error
a-1
∑ X
SC t
− FC
GL
2
SC c
− FC
j
n
Hileras
CM
GL
2
SC h
− FC
i
n (a-1) (a-2) S C e = S C T − ( SC h + SC c
GL
+ S C t )
SC e GL
F
C M t CM e
75
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
a2-1
Total
∑
X ij − FC 2
FC
=
X a
2 2
Ejemplo 3. Se re real aliz izo o un cu cult ltiv ivo o de Tilapia en jaula lass fl flot otantes donde se probaron 5 dieta alimenticias a base de proteína (20, 25, 30, 35 y 40 %) para determinar con cual de ellas se logran los mejores incrementos de peso (grs) en 6 meses de cultivo. Los resultados son los siguientes: Sea α =0 =0.05 E
A 300
B
D 250
C 275
A
E
335
B
355
350
325
1480 1465
C
B
325 D
300
305 C
340 D
D
260 E
300
230
1465
B
E
320
225
C
275 A
B
D
C
xh
325
1500
A 275
A
240
1530
E
300
360
280
260
330
1435
1515
1415
1485
1590
7440
x C
H o : No existe diferencia entre los tratamientos H A : Existe di fere ferencia ncia entre los tratamie tratamientos ntos I
Repeticiones II III IV
Tratamient os A B C D
250 340 300 275
230 275 320 355
225 260 325 350
240 275 325 335
E
300
300
305
325
260 280 300 360
X 1205 1430 1570 1675
⎯x 241 286 314 335
330
1560
312
V
76
2
FC =
X a
(7440) 2
=
2
(5) 2
∑ X SC =
2 t
t
∑ X SC =
2
− FC =
i
h
= 2214144
− FC =
n
n
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
(1205) 2
+ (1430) 2 + ...(1560) 2 5
(11465) 2
− 2214144 = 26066
+ (1480) 2 + ...(1530) 2 5
− 2214144 = 606
∑ X SC =
2
j
c
− FC =
n
(1435) 2
+ (1515) 2 + ...(1590) 2 5
− 2214144 = 3856
SC T
= ∑ X ij 2 − FC = (250) 2 + (340) 2 + ...(330) 2 − 2214144 = 37106
SC e
= SC T − ( SC t + SC h + SC c ) = 37106 − (26066 + 3856 + 606) = 6578 Fuentes de variación Tratamientos Hileras Columnas Error Total
CV =
CM e
(100) =
x
548.166
297.6
GL
SC
CM
F
4 4 4 12 24
26066 3856 606 6578 37106
6516.5 964 151.5 548.166
11.887
(100) = 7.86 %
F 05(12,4)
Fc 11.887 Se acepta H A :
3.26; p < 5 % *
>
Por lo que existen diferencias significativas entre los
tratamientos. Se comparan las medias por el método de Tukey a(a-1)/2 = 5 (5-1)/2= 10
.
⎯x 5 335
⎯x 4 314
⎯x 3
⎯x 2
⎯x 1
312
286
241 77
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
D
C
E
B
A
⎯x 2
⎯x 1
286
241
W = qα S x
S x =
CM e
=
548.166 5
n W = q05(5,12) 10.470 W = 4.20(10.470)
= 10.470
= 47.219
⎯ x 5 - ⎯ x 4 = 335 – 314 = 21 < 47.219 NS
⎯ x 5 - ⎯ x 3 = 335 – 312 = 23 < 47.219 NS ⎯ x 5 - ⎯ x 2 = 335 – 286 = 49 > 47.219 * ⎯ x 5 - ⎯ x 1 = 335 – 241 = 94 > 47.219 *
⎯ x 4 - ⎯ x 3 = 314 – 312 = 2 < 47.219 NS ⎯ x 4 - ⎯ x 2 = 314 – 286 = 28 < 47.219 NS x 1 = 314 – 241 = 73 > 47.219 * x 4 - ⎯ ⎯ ⎯ x 3 - ⎯ x 2 = 312 – 286 = 26 < 47.219 NS
⎯ x 3 - ⎯ x 1 = 312 – 241 = 71 > 47.219 * ⎯ x 2 - ⎯ x 1 = 286 – 241 = 45 < 47.219 NS
⎯x 5
⎯x 4
335
314
⎯x 3 312
Las medias 5, 4 y 3 son iguales y mostraron los mayores rendimientos en peso promedio de las Tilapias.
Ejemplo 14 14.. En un experimento llevado acabo con 25 vacas para analizar 5 tratamientos (dietas) y medir medir el incremento de pes peso o en kg. Los datos que sse e dan a continuación analizarlos analizarlos en un d diseño iseño en cua cuadro dro latino. Sea α = 0.05. X h B
D 280
C
300 A
310 D
C 295 B 316
E
A 340 E 296
A
300
1588
D 286
C
1515
E 380 B
1565
78
320
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
370
A
B
365 E
319
D
313
E
C
195
314 D
315
1583
C 316
B
321
1722
A
390
360
325
317
330
1619
1659
1595
1454
1646
7973
X c
H o : No ex i s t e d i f er en c i a en t r e l o s t r at am i en t o s
H A : Ex i s t e d i f er en c i a en t r e l o s t r at am i en t o s Tr at am i en t o s A B C D E
FC =
X 2 2 a
340 280 295 300 300
316 296 310 380 286
365 315 195 320 370
319 313 321 316 314
V 330 317 360 325 390
⎯x 334 304.2 296.2 328.2 332
X 1670 1521 1481 1641 1660
2
= (79732) = 2542,749.16 (5)
∑ X SC =
2 t
t
I
Repeticiones II II III IV
n
− FC =
(1670) 2
+ (1521) 2 + ...(1660) 2 5
− 2542,749.16 = 6087.44
∑ X SC =
2
∑ X SC =
2
− FC =
i
h
n
j
c
− FC =
(1515) 2
+ (1588) 2 + ...(1722) 2 5
(1619) 2
+ (1659) 2 + ...(1646) 2
− 2542,749.16 = 5430.64
5
n SC T
− 2542,749.16 = 4724.24
= ∑ X ij 2 − FC = (340) 2 + (280) 2 + ...(390) 2 − 2542,749.16 = 35,755.84
SC e
= SC T − ( SC t + SC h + SC c ) = 35,755.84 − (5430.64 + 4724.24 + 6087.44) = 19,315.52 Fuentes de variación Tratamientos Hileras Columnas Error
GL
SC
CM
F
4 4 4 12
6087.44 4724.24 5430.64 19513.52
1521.86 1181.06 1357.66 1626.61
0.935
79
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Total
24
35755.84
CV =
CM e
(100) =
x
1626.61
318.92
(100) = 12.64 %
Fc 0.935
<
F 05(12,4) 3.26; p > 5 % NS
Se acepta H o : No existen diferencias entre las medias de los tratamientos,
por lo que estos no producen efectos diferentes.
jerci cici cio o 13. E jer
En una granja acuícola se desea probar el efecto de 5 dosis de fertilizantes
en la productividad primaria del agua en los tanques de cultivo. Los tratamientos en la fertilización de arranque son: (en kg/ha). A) Muy alto: 100 de Urea y 25 de Super fosfato triple. B) Alto: 40 de Urea y 10 de Super fosfato triple C) Medio: 25 de Urea y 7.5 de Super fosfato triple D) Bajo: 10 de Urea y 5 de Super fosfato triple 80
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
E) Muy bajo: 3 de Urea y 1 de Super fosfato triple. La productividad se estima en mg/l, teniendo los siguientes resultados para cada tratamiento: E
90
B
A
150
C 260
A
137
168
C
D 153
95
C
B
B
100
110
150
125 A
300 A
280
220
D
D
C
B
82
80
75
120
E
E
E
C
175
275
90
98
A
B
D
D
145 E
180
70
Realizar el ANAVA, determinar el CV y compare las media por el método de Duncan.
E jer jerci cici cio o 14.
En un experimento experimento se desea analizar el efecto d de e 5 híbridos de Tilapia en
6 meses de aplicar el tratamiento. tratamiento. Se dispone de 25 an animales imales para medir el peso (en grs) del animal al conclu concluir ir el tratamien tratamiento. to. B
D 420
C
E 330
B 380
A 440
D 435
C 505
E 325
360 A
430
500 81
A
E 510
E
B 455
A 460
D
C 415
C 505
C 350
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
360
315
D 370
A 365
D B 300
390
B 520
E 400
440
Hacer el ANAVA , calcular el CV y compare las medias por el método de Duncan.
3.5. D DISTRIBUCIÓN E EN B BLOQUES INCOMPLETOS Dentro de esta distribución solamente se mencionará un ejemplo, ya que su procedimiento es largo y requiere de un mayor espacio. S Su u aplicación se lleva acabo específicamente en la práctica agrícola.
Para el análisis de varianza se utilizan las siguientes formulas:
Fuentes de variación
GL
SC
CM
F 82
Tratamientos
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
∑ X
a-1
2 t
− FC
n
Bloques
∑ X
n-1
Error
GL
2
SC b
− FC
b
(a-1) (n-1)
SC t
n b SC T − ( SC
GL
+ S C t )
CM t
CM e
SC e GL
Total
∑ X
an-1
ij
2
− F C
Ejemplo 15. En un estudio con 49 variedades de maíz con distribución en látice simple 7 x 7 y 4 repeticiones, se obtuvieron los valores presentados en las tablas siguientes.
L Lo os números enteros corresponden al número de variedad y los
valores con decimales escritos inmediatamente a bajo de cada variedad corresponden al rendimiento de grano seco en kg por parcela útil, que dicha variedad produjo. Grupo X Número de block incompleto 1 2 3 4 5 6 7 Suma de rendimientos
Repetición I Suma de rendimientos
1 4.7 8 5.2 15 5.9 22 4.4 29 5.4 36 3.9 43
2 5.1 9 4.7 16 3.8 23 5.1 30 4.6 37 5.0 44
3 5.4 10 4.5 17 4.1 24 6.0 31 5.8 38 4.4 45
4 4.2 11 4.6 18 5.2 25 5.1 32 4.9 39 4.4 46
5 5.2 12 3.4 19 4.7 26 5.5 33 5.5 40 3.3 47
6 1.6 13 2.9 20 3.9 27 3.5 34 4.7 41 4.0 48
7 4.9 14 2.7 21 6.6 28 6.5 35 4.2 42 5.3 49
6.0
5.8
5.7
5.5
5.4
4.4
5.8
35.5
34.1
35.9
33.9
33.0
25.0
36.0
Grupo Y Número de block incompleto 1 2 3 4 5 6
31.1 28.0 34.2 36.1 35.1 30.3 38.6 233.4
Repetición II Suma de rendimientos
49 6.4 3 6.4 22 4.4 44 6.2 39 4.7 27 5.3
35 4.8 24 6.3 36 4.5 16 4.2 18 6.0 48 3.6
28 6.6 45 6.2 29 5.8 23 5.4 25 7.0 41 3.4
14 3.9 31 6.0 1 5.1 2 6.2 32 5.3 13 4.9
21 5.3 17 4.8 8 5.8 37 5.1 4 4.8 6 2.0
7 5.9 38 4.1 43 5.8 9 5.8 46 6.0 20 4.0
42 6.6 10 7.0 15 5.2 30 6.0 11 5.4 34 4.6
39.5 40.8 36.6 38.9 39.2 27.8
83
7 Suma de rendimientos
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
47 5.8
12 4.7
33 4.5
26 5.2
19 3.7
40 3.3
5 4.6
31.8
39.2
34.1
38.9
36.6
31.5
34.9
39.4
254.6
Grupo X Número de block incompleto 1 2 3 4 5 6 7 Suma de rendimientos
Repetición II IIII Suma de rendimientos
36 2.8 21 5.3 45 6.7 23 5.4 11 5.2 4 5.7 33 4.9
37 3.8 20 3.8 44 6.0 28 6.7 8 5.7 6 2.4 32 5.3
39 2.5 19 3.5 48 4.6 22 4.9 9 5.4 2 6.6 31 6.5
42 6.4 16 3.6 43 6.9 24 5.9 12 4.9 1 5.7 34 4.9
40 1.6 15 5.9 47 6.3 27 4.8 10 6.1 3 6.0 29 6.3
38 3.2 17 3.6 49 5.5 25 5.4 14 4.1 7 5.9 35 4.6
41 3.0 18 4.7 46 7.0 26 5.8 13 4.4 5 5.3 30 5.1
36.0
33.7
34.0
38.3
37.0
32.3
35.3
Grupo Y Número de block incompleto 1 2 3 4 5 6 7 Suma de rendimientos
23.3 30.4 43.0 38.9 35.8 37.6 37.6 246.6
Repetición IV Suma de rendimientos
33 5.2 29 6.0 25 5.4 35 4.4 3 6.3 23 4.4 6 1.4
12 5.3 43 5.7 39 3.6 21 4.8 17 4.4 30 4.7 13 3.2
5 4.8 22 4.7 11 5.9 49 6.1 24 6.3 9 4.6 34 3.5
26 5.5 1 5.9 18 4.7 28 6.1 10 5.5 16 3.3 48 2.8
19 4.6 15 5.9 46 6.4 14 3.6 45 6.2 2 5.2 20 3.0
40 3.4 36 3.4 4 4.9 42 5.7 38 4.6 44 5.4 41 2.7
47 6.3 8 6.4 32 6.2 7 5.5 31 6.4 37 4.0 27 3.8
33.1
31.7
35.9
33.8
34.9
30.1
38.6
35.1 38.0 37.1 36.2 39.7 31.6 20.4 238.1
Suma de los rendimientos de cada variedad para el grupo X en las repeticiones I y III, ordenadas. Hileras 1
Suma de Hileras
68.7
5
1 10.4 8 10.9 15 11.8 22 9.3 29
2 11.7 9 10.1 16 7.4 23 10.5 30
3 11.4 10 10.6 17 7.7 24 11.9 31
4 9.9 11 9.8 18 9.9 25 10.5 32
5 10.5 12 8.3 19 8.2 26 11.3 33
6 4.0 13 7.3 20 7.7 27 8.3 34
7 10.8 14 6.8 21 11.9 28 13.2 35
72.7
6
11.7 36
9.7 37
12.3 38
10.2 39
10.4 40
9.6 41
8.8 42
53.6
2 3 4
63.8 64.6 75.0
84
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
7
6.7 43 12.9
8.8 44 11.8
7.6 45 12.4
6.9 46 12.5
4.9 47 11.7
7.0 48 9.0
11.7 49 11.3
81.6
Suma de columnas
73.7
70.0
73.9
69.7
65.3
52.9
74.5
480.0
Suma de los rendimientos de cada variedad para el grupo Y en las repeticiones II y IV, ordenadas. Columnas Hileras 1 2 3 4 5 6 7 Suma de columnas
Suma de Hileras (1) 1 11.0 2 11.4 3 12.7 4 9.7 5 9.4 6 3.4 7 11.4
(2) 8 12.2 9 10.4 10 12.5 11 11.3 12 10.0 13 8.1 14 7.5
(3) 15 11.1 16 7.5 17 9.2 18 10.7 19 8.3 20 7.0 21 10.1
(4) 22 9.1 23 9.8 24 12.6 25 12.4 26 10.7 27 9.1 28 12.7
(5) 29 11.8 30 10.7 31 12.4 32 11.5 33 9.7 34 8.1 35 9.2
(6) 36 7.9 37 9.1 38 8.7 39 8.3 40 6.7 41 6.1 42 12.3
(7) 43 11. 44 11.6 45 12.4 46 12.4 47 6.4 48 6.4 49 12.5
69.0
72.0
63.9
76.4
73.4
59.1
78.9
74.6 70.5 80.5 76.3 66.9 48.2 75.7 492.7
Suma de los rendimientos de las cuatro repeticiones, ordenadas. Sumas 1 21.4 8 23.1 15 22.9 22 18.4 29 23.5 36 14.6 43 24.4
148.3
2 23.1 9 20.5 16 14.9 23 20.3 30 20.4 37 17.9 44 23.4
140.5
3 24.1 10 23.1 17 16.9 24 24.5 31 24.7 38 16.3 45 24.8
154.4
4 19.6 11 21.1 18 20.6 25 22.9 32 21.7 39 15.2 46 24.9
146.0
5 19.9 12 18.3 19 16.5 26 22.0 33 20.1 40 11.6 47 23.8
132.2
6 7.4 13 15.4 20 14.7 27 17.4 34 17.7 41 13.1 48 15.4
101.1
7 22.2 14 14.3 21 22.0 28 25.9 35 18.0 42 24.0 49 23.8
150.2
137.7 135.8 128.5 151.4 146.1 112.7 160.5 972.7
85
FC =
SC T
SC t
2 X ...
an
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
(972.7 )2 = = 4827.27 49(4 )
= (4.7 )2 + (5.1) 2 + ... + (3.8) 2 − 4827.27 = 255 =
( 21.4 )2
+ (23.1) 2 + ... + (23.8) 2 4
(233.4) 2
− 4827.27 = 203.27
+ (254.6) 2 + (246.6) 2 + (238.1) 2
SC b
=
SC e
= 255.0 − (203.27 + 5.38) = 46.35
49
Fuentes de variación Tratamientos Bloques (rep.) Error Total
− 4827.27 = 5.38
GL
SC
CM
F
48 3 144 195
203.27 5.38 46.25 255
4.235 1.79 0.322
13.15
Fc 13.15
F 05(48,144) >
1.39 ; p< 5 %
Se acepta acepta la H A : existen dif diferenc erencias ias sign significat ificativas ivas entr entre e los tratami tratamientos entos.. La prueba de medias dará a conocer cual es el mejor de ellos.
CV =
0. 322 x100 = 11.43% 4.96
Este valor es relativamente bajo, que indica adecuado manejo del experimento, al eliminar la variación entre los bloques incompletos, el CV se reduce aún más.
86
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
3.6. E EXPERIMENTOS F F ACTOR A I ALES A continuación se da e ell procedimiento para la ap aplicación licación de e este ste tipo de diseño experimental a partir del siguiente cuadro de ecuaciones.
Causas de variación Tratamientos
GL
SC
∑ X
ab-l
2
∑ X
a-1
2 j
an
AxB Error Total
(a-1)(b-1)
ab(n-1)
SC A
− FC
∑ X
b-1
GL
2
i
bn
B
SC t
− FC
ij
n
A
CM
GL SC B
− FC
GL
⎛ ∑ X ij 2 ⎞ ⎜ − Fc ⎟ − ( SC A + SC B ) ⎜ n ⎟ ⎝ ⎠ SC SC − T
∑ X
abn-1
t
CM e
GL SC e
CM t
SC AB
GL
2 ijk
F
CM A CM e CM B CM e CM AB CM e
− FC
Cuando se utiliza el diseño de bloques al azar los GL e = (ab-1)(n-1).
2
FC =
X ... abn
Se calcula la prueba de F en forma usual, se acepta H A , sí:
Para Pa ra el factor A:
Fc
≥
F (GL A,GL e)
Para Pa ra el factor B:
Fc
≥
F (GL B,GL e)
Par a el f ac t o r Ax AxB: B: F c
≥
F (GL AxB ,GL e)
87
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
En cualquier experimento factorial se pueden presentar 8 diferentes casos, relativos a la significancia de los factores A, B y AB.
Causas Ca usas de variación A B AB
Casos Casos posi ble N1S NS NS
*2 NS NS
N3S * NS
4* * NS
NS = No significativa
5 NS NS *
6*
N7S * *
NS *
8* * *
* = Significativa
C A AS SO 1. Si se han hecho las pruebas de Duncan, la conclusión será que no hay efecto entre los niveles de los factores ni interacción. interacción; ión; los C A AS SO 2, 3 Y 4. Los datos se interpretan indicando que no hay interacc factores actúan independientemente. Para el caso 2, hay que ver la diferencia entre los niveles del factor A; para el caso 3, entre los niveles del factor B; y para el caso 4, estudiar las diferencias entre los niveles de A y B, respectivamente. Las pruebas de significancia se hacen por medio de las pruebas de Duncan y Tukey. x 1 -⎯ Diferencias entre los niveles A. Ejemplo (⎯ x 2 ). α ( GLe )
a) Duncan: LS = t
CM e bn
α ( a ,GLe)
b) Tukey: W = q
M e C bn
Diferencias entre los niveles de B. Ejemplo (⎯ x 1 -⎯ x 2 ).
a) Duncan: LS = t α (GLe )
C A AS SOS 5, 6, 7 Y 8.
CM e an
b) Tukey: W = qα ( a ,GLe )
CM e an
Existe interacción, los efectos de los factores no son
independientes. Para cierto nivel A hay que estu estudiar diar cual es el me mejor jor nivel B. 88
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejemplos: ⎯ x 11 -⎯ x 12 ; ⎯ x 11 -⎯ x 13
O estudiar las diferencias entre niveles A para un mismo nivel B.
E jemplos: ⎯x 11 -⎯ x 21 ; ⎯ x 11 x 41 11 -⎯
a) Duncan: LS = t α ( GLe )
CM e n
b) Tukey: W = qα ( a ,G Le )
CM e n
Ejemplo 16 16.. En un experimento con arreglo combinatorio y distribución en 5 bloques al azar, se estudiaron 4 especies de microalgas del género Chaetoceros, cultivándose con 3 dosis d de e vitaminas en ml/l de medio de cultivo cultivo..
Los
rendimientos se dan en cel/ml. Sea α= 0.05.
Trat. Tra t. 1 2 3 4 5 6 7 8 9 10 11 12
Espe Especies cies C. gracilis C. ceratosporum
C. calcintrans C. muelleri Xk
Dosis
Bloques (10 (10 cel/ cel/ml) ml) II III IV V
X ij
80 95 110 75 92 113 65
85 100 125 80 99 110 62
90 110 115 85 88 110 66
90 98 112 88 95 100 68
85 110 123 90 95 105 60
430 513 585 418 469 538 321
78 85 67 80 90
75 88 72 78 89
80 90 65 85 92
83 88 70 88 95
80 86 65 83 90
1030
1063
1076
1075
1072
396 437 339 414 456 5316
(ml/l) Vitaminas
I
0.5 1.0 1.5 0.5 1.0 1.5 0.5 1.0 1.5 0.5 1.0 1.5
H 0 : No No e exis xiste te interacción entre las especies y las dosi dosiss de vit vitaminas aminas H A : Existe interacción int eracción entre las espe especies cies y las dosi dosiss de vitaminas
89
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Interacción entre especies
Especie
Dosis 0.5 1.0 1.5
C. gra C. cerat.
430 418
513 469
585 538
Promedios con base en la unidad exper.
Xi 1528 1425
C. 321 414 396 456 437 1209 1154 C. calct. mue. 339 X j 1508 1792 2016 5316
Es p ec i e
Do s i s 0.5 1.0 1.5
⎯x i
C. gra 86 102.6 117 101.86 C. cerat. 83.6 93.8 107.6 95.00 C 67 4..8 2 C.. cmaulcet.. 6
72 9..8 2 8
81 7..2 4 9
76.93 80.60
75.4 89.6 100.8
x j
Produc. media 4 Cel/ml (10 )
120 115 110
C. gracilis C. Ceratosporu Ceratosporu m
105 100 95 90 85 80 75 70 65 60
C. calcintrans C. muelleri
0.5
1 Dosis de Vitaminas
1.5
La interacción tiende a ser paralela según esta línea de tendencia lo cual habrá de compararse con el ANA VA.
90
FC =
SC t
SC b
SC A
SC B
( 4)(3)(5)
=
=
=
=
SC AxB SC T
(5316) 2
(430) 2
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
= 470997.6
+ (513) 2 + ... + (456) 2
− 470997.6 = 12902.8
5 (1030) 2
+ (1063) 2 + ... + (1072) 2 12
(1528) 2
+ (1425) 2 + (1154) 2 + (1209) 2 15
(1508) 2
− 470997.6 = 123.566
+ (1792) 2 + (2016) 2 20
− 470997.6 = 6256.133
− 470997.6 = 6481.6
= 12902.8 − (6256.133 + 6481.6) = 165.067
= (80) 2 + (85) 2 + ... + (90) 2 − 470997.6 = 13882.4
SC e
= 13882.4 − (12902.8 + 123.566) = 856.034
Fuentes de variación Tratamientos Bloques A B AxB Error Total
GL
SC
CM
F
11 4 3 2 6 44 59
12902.8 123.566 6256.133 6481.6 165.067 856.034 13882.4
1172.981 30.891 2085.377 3240.8 27.511 19.455
60.292
Factor Fa ctor A
F 05(3,44)
107.189
>
Factor Fa ctor B
166.579
Factor Fa ctor AxB 1.414
2.84: p< 5 % * Todas la lass especies se compo comporta rtan de F 05(2,44)
>
107.189 166.579 1.414
manera diferente.
3.23; p < 5 % * Todas las dosis tienen diferentes efectos F 05(6,44)
<
2.34;p> 5 % NS NS Cualquier especie co con n cualquier dosis tienen los mismos efectos. 91
CV =
19.455 88.6
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
variación ariación bajo, indica un adecuado x100 = 4.97 % El coeficiente de v
manejo de los tratamientos.
Las co Las comp mpar arac acione nes s de media se llllev evan an ac acab abo o en lo loss cas asos os en lo loss qu que e existan diferencias entre los factores sean A, B o AxB.
E jem jempl plo o 17. En un experimento se analizó, mediante un diseño completamente al azar, la capacidad de porcentaje de digestión (%) de diferentes nutrientes, en truchas de 2 años, a diferentes temp temperaturas eraturas de cultivo.
Los resultad resultados os se dan a
continuación. Siendo α = 0.05.
Trat. Contenido del Alim Al iment ento o 1 2 3 4 5 6 7 8 9 10 11 12
Carbohidratos
Grasa cruda
Proteína cruda
Celulosa cruda
X j
To C
R e p e t i c i o n e s (%) I II III IV
17 22 27 17 22 27 17 22 27 17 22 27
19.0 47.9 30.6 78.6 78.2 86.4 81.7 80.0 75.1 53.9 49.6 46.5
19.2 47.4 31.1 77.2 77.5 85.9 82.3 81.2 74.8 52.8 48.7 45.5
18.9 46.9 29.9 78.5 78.6 86.3 81.5 79.9 74.3 53.7 49.2 46.7
19.5 47.6 30.5 77.9 78.1 86.6 80.9 80.3 76.2 54.0 49.6 47.0
727.5
723.6
724.4
728.2
Xi 76.6 189.8 122.1 312.2 312.4 345.2 326.4 321.4 300.4 214.4 197.1 185.7 2903.7
H o : Todos los tratamie tratamientos ntos producen los mismos efe efectos ctos H A : Todos los l os tr trata atamientos mientos pro ducen efectos efectos diferente diferentess
92
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Interacción entre nutrientes Temperatur Temperaturas as (oC) 17 22 27
Nutriente Nutrient e
Xi
Nutriente Nutri ente
Te Temperatura mperatura ( oC ) 17 22 27
⎯x i
388.5 969.8 948.2
Carbohidratos Grasa cruda Proteína cruda
19.15 47.45 30.52 32.37 78.05 78.1 86.3 80.81 81.6 80.35 75.1 79.01
197.1 185.7 18 5.7 597.2 929.6 1020.7 953.4 2903.7
Celulosa cruda
53.6
Carbohidratos Grasa cruda Proteína cruda
76.6 312.2 326.4
Celulosa cruda
214.4
X j
Promedio con base en la unidad exp.
189.8 122.1 312.4 345.2 321.4 300.4
⎯x j
49.27 46.42 58.1 63.79 59.51 49.76
Promedio de digestibilidad (%)
90 85 80 75 70
Grasa cruda Proteína cruda
65 60 55 50 45 40 35 30 25 20 15
Celulosa cruda
Carbohidratos
17
22 Temperaturas (o C)
27
En la grafica se puede apreciar que los efectos parecen ser multiplicativos o aditivos. Los porce porcentajes ntajes de digestibilidad d de e los nutrientes se comportan de modo diferente en las las diferentes tempe temperaturas. raturas. El estudio d de e la variación indicará si la diferencia es significativa o no.
93
( 2903.7) 2
FC =
SC t
SC A
SC B
= 175655.701
(4)(3)(4)
=
=
=
SC AxB
(76.6) 2
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
+ (189.8) 2 + ... + (185.7) 2
− 175655.701 = 21944.546
4 (388.5) 2
+ (969.8) 2 + (948.2) 2 + (597.2) 2 12
(929.6) 2
+ (1020.7) 2 + (953.4) 2 16
− 175655.701 = 19942.246
− 175655.701 = 279.062
− (19942.246 + 279.062) = 1723.238 = 21944.546
SC T
= 197610.55 − 175655.701 = 21954.849
SC e
= 21954.849 − 21944.546 = 10.303 Fuentes de variación Tratamientos A B AxB Error Total Factor Fa ctor A 23242.709
> >
Factor Fa ctor AxB 1004.216
CV =
SC
CM
F
11 3 2 6 36 47
21944.546 19942.246 279.062 1723.238 10.303 21954.849
1994.958 6647.415 139.531 287.206 0.286
6975.377 23242.709 487.870 1004.216
F 05(3,36)
Factor Fa ctor B 487.870
GL
2.96; p < 5 % *
Todos los nutrientes se digieren en
F 05(2,36)
diferentes porcentajes.
3.32; p < 5 % * *
Todas las temperaturas producen
F 05(6,36) 05(6,36)
>
efectos diferentes. 2.42; p < 5 % * Existe interacción entre los factores A y B, los tratamientos
0.286 x 100 = 0.884 % 60.493
producen efectos diferentes
La comparac ración ión de me med dias determinara cual es la mejor combinación entre factores. Las comparac comparaciones iones serán: a(a-1)/2=12(11)/2= 66. los | factores.
94
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejercicio Ejercici o 15. Se llevo acabo un estudio con el fin de comparar las capacidades de 3 medicamentos para retardar el tiempo de reacción de animales de laboratorio a cierto estímulo.
La misma raza de animales fue entrenada a responder por
medio de 3 métodos distintos y se utilizaron 3 animales por cada combinación método de entrenamiento/medicamento. entrenamiento/medicamento. La siguiente tabla muestra el tiempo en segundos después de la administración del medicamento:
Método de Método entrenamiento I II III
A
M ed i c a m e n to B
C
5 8 7 6 8
8 8 10 10 12
10 12 10 15 14
6 7 8 10
11 12 12 14
14 16 16 18
Lleve acabo el ANAVA de estos datos, pruebe las hipótesis con α= 0.05, grafique las líneas de tendencia, determine el CV y compare las medias por el método de Tukey.
Ejercicio Ejercici o 16.
En un experimento se llevo acabo el estudio para analizar el efecto de la
inyección de Thyroxina y el sexo en peces durante un cultivo de 6 meses, los resultados son datos en gramos. Analizar los resultados mediante un diseño completamente al azar y con arreglo combinatorio de 2 x 2 con 6 repeticiones.
Macho: Ma cho: con inyección sin inyección Hembra: He mbra: con inyección sin inyección
I
II
III
IV
V
VI
540 354 450 350
350 450 532 496
400 540 495 375
480 462 384 480
550 386 496 495
424 495 385 580
Realice el ANAVA, determine las líneas de tendencia, pruebe las hipótesis con α= 0.05, determine el CV y compare las medias por el método de Duncan. 95
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
2 UNID AD A D IIV. PRUEB A A DE X
4.1. CARACTERÍSTICAS 4.1. CAR CARACT ACTERÍ ERÍSTI STICAS CAS NECESARIAS NEC NECESA ESARIA RIAS S Los datos obtenidos en los traba jos y experimentos biológicos son de dos tipos principales. En un tipo cada individuo se caracteriza por una me medida dida o alguna otra especificación cuantitativa. En el otro, cada individuo se coloca en una clase particular, y los resultados se expresan como frecuencias en las cuales los individuos se encuentran dentro de cada clase.
En un gran número de
trabajos biológicos, las hipótesis que más interesan comprobar no están relacionadas con la caracterización cuantitativa de los individuos o de la muestras, sino con las probabilidades, y por tanto con las frecuencias de los individuos u observaciones
que
pertenecen
a
determinadas
clases,
previamente
especificadas. Por lo q que ue cuando se desea comprobar la significancia de la desviación de una proporción simple entre dos frecuencias de lo que espera según la hipótesis, cuando se utilizan más de dos frecuencias se emplea el estadístico ji-cuadrada (X2) (Bishop, 1966). Steel y Torrie (1995) , definen a la X2 como la suma de los cuadrados de las variables independientes, normalmente distribuidas con medias y varianza 1. Reyes (1995), menciona que la prueba de X2 es aplicable a una serie de situaciones en donde se hacen conteos y en donde los datos no obedecen a la distribución normal y constituyen lo que se conoce como estadística paramétrica. Es muy común tratar de probar si los valores observados experimentalmente (O) están de acuerdo con los valores esperados (E) conforme a una teoría determinada. Para determinar el grado de concordancia se necesita un medio que permita conocer los limites de que no debe exceder la discrepancia entre los valores reales observados y los valores teóricos calculados o conocidos, para que tanta discrepancia pueda considerarse como un juego exclusivo del azar y no 96
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
debido a diferencias fundamentales entre los hechos reales y las hipótesis adoptadas.
Con tal o objeto, bjeto, se emplea la X2, propuesta por Karl Pearson a
principios de siglo (De la Loma, 1980).
A S DE Reyes (1992), hace mención de los siguientes ejem plos de PRUEB AS CONCORD AN A NC A I A simple:
1)
En tod todos os los animales la relación de sex sexo o es 1:1, es decir, la mitad so son n hembras y la mitad son macho machos. s.
Si en un muestreo de sexo sexoss en 200
animales no hay 100 hembras y 100 machos sino, por ejemplo, hay 110 hembras y 90 machos, al investigador le interesa probar si la falta de concordancia entre lo experimental y lo teórico obedece a causas al azar o de muestreo, o si tales desviaciones obedecen a otras causas, esto es, sino cumplen la relación 1:1. 2)
En la generación F 2 de un monohíbrido, la relación fenotípica teórica debe ser 3:1. Si esta relación no se manifiesta, el genetista d dispone ispone de la prueba de X2, una herramienta estadística para desechar o aceptar una hipótesis.
3)
En un dihíbrido, cuando los caracteres son independientes, la relación fenotípica debe ser 9:3:3:1; las desviaciones de esta relación pueden deberse al azar, a la casualidad, a errores de muestreo o al tamaño de la muestra, pero también pueden deberse a que los genes no sean presen ente ten n liliga gami mien ento to fa fact ctor oria iall y, por tan anto to,, no sse e ma mani nifi fies estte independientes y pres la relación 9:3:3:1.
4)
Las desviaciones entre lo experimentan y lo teórico al arrojar monedas, ados,, etc., se p prueba rueban n media mediante nte X2. dados Bishop (1966), señala que el tipo más sencillo en el cual se utiliza la prueba
de X2 es aquella en la que una hipótesis hipótesis particular conduce conduce a esperar que los individuos u observaciones caigan en una serie de clases en unas frecuencias determinadas. Cuando se realizan observacio observaciones, nes, estás producen un una a serie de frecuencias observadas.
El problema radica entonces en comparar la
significancia de una desviación dada entre las frecuencias observadas y 97
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
esperadas, es decir, determinan la probabilidad de obtener tal desviación o una mayor, si la hipótesis es correcta. La expresión matemática del estadístico a utilizar es: 2
X
=∑
(Oi − E i ) 2 E i
2
; también se puede calcular con : X
O 2 i ⎞ ⎛ ⎟⎟ − n = ⎜⎜ ∑ E ⎝ i ⎠
Donde:
O = Frecuencia observada E = Frecuencia esperada i = 1,...k (número de clases) El valor obtenido se busca en las tablas de X2 para (n-1) grados de libertad, donde:
n = Núm. de clases de frecuencias esperadas o núm. de términos de la suma Las hipótesis por probar serían:
H o : O = E ; hay concordancia H A : O ≠ E; no hay concordancia
Se r r ec h aza H H o ss i :
X2 ≥ X2
Se a ac ep t a H o ss i :
X2 < X2
(GL ) (GL)
Cuando se aplican a datos discretos los resultados para distribuciones continuas deben deben hacerse ciertas correccio correcciones. nes. Para la X2 la corrección se conoce como corrección de Yates y consiste en: 2 X (corregida )
=
( o1
− e1 − 0.5)
2
e1
( o − e − 0.5)
2
+
2
2
e2
( o − e − 0.5)
2
+ ... +
k
k
ek
En general la corrección se hace solamente cuando el número de grados de libertad es igual igual a uno. En muestras gra grandes ndes se obtienen obtienen prácticamente los mismos resultados que la X2 no corregida, pero pueden aparecer dificultades en relación con los valores valores críticos. Para muestra pequeñ pequeñas, as, donde cada frec frecuencia uencia 98
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
esperada se encuentra entre 5 y 10, quizá sea mejor comparar los valores de X2 corregido y no corregido.
Si ambos valores conducen a la misma conclusión,
según una hipótesis, tal como rechazarla a el nivel de 0.05, raramente se presentan dificultades. Si se conducen a conclusiones diferentes, se puede o bien incrementar los tamaños muestrales o si esto no es posible, se puede emplear métodos de probabilidad exactos. Reyes (1992), menciona que las PRUEB A S DE INDEPENDENC A I A se aplican cuando se estudian datos de una población que caracterizan a los individuos con respecto a dos atributos observados conjuntamente, el cálculo de X2 permite independientes ientes entre sí, o si alguno de ellos tiene probar si dichos atributos son independ influencia sobre otro.
Cada carácter, atributo o factor puede manifestar dos o más clases, de manera que los individuos de una muestra pueden ser clasificados de acuerdo con una de las categorías o clases de cada carácter. Es decir, si se conoce la frecuencia observada de individuos con el par de caracteres, s e puede calcular la frecuencia teórica. Para lograr lo anterior es necesario hacer una tabla de contingencia o tabla de doble entrada a x b .
E jemplo.
Factor o carácter a b
Clases i = 1,...a j = 1,…b
99
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Tabla de contingencia: a = 4, b = 3
Clases a1 a2
b1 f 11 11
b 2 b 3 f 12 f 13 12 13 f 21 X ij
a3 a4 X j
f 41 41
X1
f 31 X2
Sumas X i X1 X2
f 43
X3 X4
X3
X..
f ijij = Frecuencia observada o experi rim mental ((O O) d de e in ind dividuos con características que varían conjuntamente.
F ij = Frecuencia teórica esperada (E), si las características son independientes. F ij =
( X i .)( X j .) X ..
GL = (a-1)(b-1)
Las hipótesis se prueban de manera similar a las pruebas de concordancia. La prueba de X2 puede ser empleada para determinar de qué forma distribuciones teóricas, tales como la normal, binomial, de Poisson, etc., se ajustan a las distribuciones empíricas, es decir, aquellas que se obtienen de los datos muestrales (Spiegel, 1986).
100
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
4.2. APLIC ACIONES 4 Ejemplo 18. Los siguientes datos son las cantidades de un organismos particular que se ha encontrado en 100 muestras de agua tomadas de un estanque.
Núm. de organismos por muestra
Frecue Frecuenci ncia a (O (O))
0 1 2 3 4 5 6 7
15 30 25 20 5 4 1 0
Probar la hipótesis de que los datos fueron extraídos de una distribución de Poisson.
H o : O = E; hay conc ordanci a H A : O ≠ E; no h ay concordancia Núm. de organismos por mu estra
Frecuencia Observada (O)
Frecuencia relativa esperada
Frecuencia esperada (E)
0 1 2
15 30 25
0.155 0.289 0.270
15.5 28.9 27.0
3 4 5 6 7
20 5 4 1 0 100
0.166 0.080 0.03 0.008* 0.002* 0.100
16.6 8.0 3.0 1.0 100
frecuencias uencias esperadas menores a 1. Los *Las frecuencias menores a 1 deben combinarse para evitar tener frec grados de libertad apropiados son 7-1= 6.
Se aplica la ecuación de Poisson: f ( x )
=
− λ x e λ
X !
λ =
∑ fx = 186 = 1.86 f
100
101
f ( 0 )
f (1)
=
e
=
e
−1.86
1.86 0
= 0.155
0! −1.86
1.861
1!
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
= 0.289
.
. f ( 7 )
2
X
=
e
−1.86
1.86 7
7!
=∑
= 0.002
(Oi − E i ) E i
=
(15 − 15.5) 2 15.5
+
(30 − 28.9) 2 28.9
+ ... +
(0 − 0.2) 2 0 .2
= 2.359
GL= n-1= 7-1=6
X2
X2 05(7)
2.359
<
14.067
Se acepta la H o Los datos observados concuerdan con los esperados, con un riesgo de error que tiene una p < 5 %.
Ejemplo 19. Gregorio Mendel cultivo 929 vegetales, procedentes de la autofecundación de plantas de guisantes heterocigóticas para el color de la flor; 705 de éstas tenían tenía n flore floress colo coloradas radas y las 24 rrestan estantes tes ten tenía ían flore flores s blancas.
¿ ¿S Son estas
proporciones consistentes con la hipótesis de una proporción 3:1 entre las plantas coloradas y de flor blanca?.
Desviación sviación (O – E) /E Semillas Frecuencia Relación Frecuencia De (O –E) esperada observada teórica (E) (O) Coloradas Blancas Sumas (n)
705.0 224.0 929.0
3 1 4
696.75 232.25 929.0
+ 8.25 - 8.25 0.0
0.0976 0.293
0.3906
H o : O = E; hay concordancia concor dancia H A : O ≠ E; no hay concordancia
102
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
GL = n-1= 2-1= 1
X2
X2 05(1)
0.3906
Se
<
3.841; p < 5 % los datos, se ajustan
acepta H o existe concordancia entre
aceptablemente a la hipótesis.
Ejemplo 20. De 160 familias con cuatro hijos cada una se obtuvieron los siguientes datos tomándolos como resultados:
Mujeres Varones Famili as
4 0 7
3 1 50
2 2 55
1 3 32
0 4 16
¿ La distribución familiar concuerda con la hipótesis de los número s iguales de varones y de mujeres?. Aplíquese la distribución binomial. Sea α= 0.05. a = ½ probabilidad de que sea mujer b = ½ probabilidad de que sea varón (a + b)4 =
a4
+
4 a3b
4 ab3 +
b4
4 mujeres
3 mujeres
2 mujeres
1 mujer
0 mujeres
0 varones
1 varón
2 varones
3 varones
4 varones
4
= =
6 a2b2 +
+
3
2
4(1/2) (1/2)
6(1/2) (1/2)
+ + 1/16 + 4/16 + 6/16 +
(1/2)
2
3
+
4(1/2) (1/2)
+
4
(1/2)
4/16 + 1/16
El número esperado con 4 mujeres y o va varones rones = 1/16 (160)= 10 3 mujeres y 1 varón
= 4/16 (160) = 40
2 mujeres y 2 varones = 6/16 (160) = 60 1 mujer y 3 varones
= 4/16 (160) = 40
0 mujeres y 4 varones = 1/16 (160) = 10
2
X
=
(7 − 10 ) 2 10
+
(50 − 40) 2 40
+ ... +
(16 − 10) 2 10
= 9.01
GL = 5-1= 4 103
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
X2
X2 05(4)
9.01
<
9.488 9.488;; p > 5 %
Se acepta H o existe concordancia entre los datos.
Ejemplo 21. Los rendimientos (%) de la eclosión pa para ra quistes de Artemia salina, bajo diferentes condiciones de temperatura son los siguientes: Sea α = 0.05
Eclosió n
Temperatura Temperatura (oC) 15 20 10
Mala (< 50 %) Buena (> 50 %) X j
75
90
65
230
80
87
50
217
155
177
115
447
Xi
H o : O = E; E; el por centaje de e eclos closión ión es independiente de la temperatura porc entaje de e eclo closión sión depende de la temperatura H A : O ≠ E; el porcentaje
F ij
F 11
= =
( X i )( X j )
X
(155)( 230) 447
= 79.753
2
X
2
X
⎛ Oij 2 ⎞ = ⎜∑ ⎟ − n ⎜ ⎟ ⎝ E ij ⎠
⎛ (75) 2 (90) 2 (50) 2 ⎞ ⎟⎟ − 447 =1.794 = ⎜⎜ + + ... + 79 . 753 91 . 073 55 . 827 ⎠ ⎝
. GL = ( a − 1)(b − 1) = (2 − 1)(3 − 1) = 2
. . F 23
=
(115)( 217) 447
= 55.827 X2 05(2)
X2 1.794
<
5.991; p > 5 %
Se acepta H o el porcentaje de eclosión no depende de la temperatura.
104
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejercicio Ejercici o 17. A 96 muestras de 4 peces cada una (n=4) se les inóculo un organismo que podía originar que el pez viviera o muriera con igual probabilidad ( p = q). En los siguientes datos, X= 0 indica una muestra con cero vivos, X =1 una muestra con un pez vivo, et c.
Núm. de vivo s en la muestra
Frecuencia experimental
0 1 2 3 4
1 20 41 25 9
96 Analice los datos mediante la distribución Poisson , prueba las hipótesis pertinentes con α =0.05.
E jer jerci cici cio o 18.
La densidad de una cierta suspensión bacteriana se estimó mediante un
conteo por placas. placas. Después de agitar completamente la suspensión, se se tomaron muestras de un volumen de 0.5 ml cada una y se extendieron, asépticamente, sobre una superficie superficie de una placa d de e agar nutritivo. Después de un periodo de incubación se contó el número de colonias formadas sobre cada una de las 100 placas. Los resultad resultados os se dan en la siguiente tabla, en forma de una distribución de frecuencias:
Núm. de colo nia por placa Frecuencia
0
1
2
3
4
5
6
7
8
9
10
11
3
9
17
22
20
14
8
4
2
1
0
0
Analizar los l os datos anteriores mediante la distribución de Poisson y probar las hipótesis correspondiente. Sea α = 0.05.
105
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
E jer jerci cici cio o 19.
En un experimento se analizo el efecto de la vacunación de animales en
laboratorio contra una determinada enfermedad.
Mediante un nivel de
significancia del 0.01 y 0.05, ensayar la h hipótesis ipótesis de qu que e no haya diferencias entre los grupos vacunados y no vacunad os, es decir, la vacunación y esta enfermedad son independientes.
Pasaron la No pasaron enfermedad enfermedad Vacunados No vacunados
9 17
la
42 28
Ejercicio Ejercici o 20. Se analizó el incremento de peso de peces machos y hembras de una especie de T Tilapia ilapia con alimento a diferentes porcentajes de p proteína. roteína.
Los
resultados se dan en gramos de peso alcanzado durante un periodo de cultivo de 5 meses.
Sexo 20 Machos hembras
340 320
Proteína Prot eína (% (%)) 25 30
35
355 345
360 355
385 370
Determinar si el incremento de biomasa depende del sexo a diferentes porcentaje de proteína. Sea α = 0.01.
106
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
UNID AD A D V. CORREL AC A CIÓN Y Y REGRESIÓN 5.1. D DEFINICIÓN D DE C CORREL ACIÓN En una muestra o en una población es posible estudiar a los individuos atendiendo a la variación sim simultánea ultánea de 2 o más características. Por ejemplo, la longitud de la espiga de trigo y el número de gramos de la misma espiga, el peso de un grupo de animales y el incremento i ncremento de peso después de un cierto número de días, la estatura de una persona persona y la long longitud itud de sus brazos extendido extendidos, s, etc. El estudio de la variación simultánea de 2 o más características puede hacerse por medio del estudio de la correlación y de la regresión (Reyes, 1995). La teoría de la correlación tiene por objeto determinar la interdependencia pueden n ser las manifestaciones d de e2 entre las variaciones de 2 variables. Estas puede caracteres distintos de los individuos de una misma población, o los valores de dos series independientes, tales que cada valor de una de ellas puede oponerse a un valor determinado de la otra (De la Loma, 1980). El término correlación de debe Karl Pearson y se usa para indicar aquellos casos en que los cambios de una variable van asociados con cambios en la otra variable, existiendo una relación concreta entre dichas variables.
107
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
5.2. T TIPOS D DE R REL ACIÓN Reyes (1995) (1995) menciona que cuando 2 variables camb cambian ian juntas, en en tal forma que un aumento de una de ellas va asociado con un incremento en la otra, se dice que las do doss varia variables bles e están stán co correlac rrelaciona ionadas das po positiva sitivamente mente.. Si el au aumento mento en una variable coincide con la disminución de la otra, se dice que las dos variables están correlacionadas negativamente, Si no hay relación entre las dos variables se dice que son independientes o que no están correlacionadas. Ejemplos de correlación positiva: En física: ☯ Temperatura
y longitud de una barra de hielo.
☯ Temperatura
y presión de gas.
En biología (en humanos): ☯ Estatura
y peso.
☯ Estatura
y longitud del antebrazo.
☯ Estatura
entre hermanos y hermanas.
Eda ad ☯ Ed
y presión ssa anguín íne ea.
☯ El
nivel de consumo de algún nutriente y la ganancia de peso.
☯ La
intensidad de un estimulo y el tiempo de reacción.
Ejemplos de correlación negativa: En Agronomía: ☯
Precocidad y rendimiento.
☯ Porcentaje
de aceite y proteína de algunos granos.
☯ Contenido
de Lisina y proteínas en el grano de maíz.
☯ Contenido
de Triptófano y proteína en el grano de maíz.
Este mismo autor señala que es importante el conocimiento de la pues ues dicha asociación tiene un valor predictivo predictivo.. Es asociación de dos caracteres, p decir, sabiendo que existe la correlación se puede estimar el valor de una variable si se encuentra el valor de la otra. 108
5.3.
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
FÓRMUL AS P AR A DETERMIN AR EL COEFICIENTE DE CORREL AC ACIÓN ““r ”
Steel
y To Torrie rrie (1995 (1995)) y Reyes (1995), d describen escriben dos métodos para
determinar la correlación.
1. D A I AGR A M A D DE DISPERSIÓN. La elaboración de un diagrama es un método grafico para encontrar la disper sión de los valores determinados por las variables X y la variable Y, si los puntos definidos por X y Y se distribuyen en los 4 cuadrantes de la manera siguiente: Y 1
2
Considerando los 4 cuadrantes numerados en sentido directo (a favor del movimiento de las manecillas del reloj), si los puntos se distribuyen en línea recta la correlación es positiva y perfecta.
4
3
X
Y 1 4
Si los puntos se dispersan en los cuadrantes 2 y 4; el diagrama sugiere una correlación positiva. Si el número de valores fuere infinitamente grande los puntos se dispersarían en un área elíptica, tanto más estrecho cuanto más asociados o
2 3 X
correlacionados estén los caracteres
Y 1
2
4
3
Si los puntos se dispersan en los 4 cuadrantes y el número de valores es infinitamente grande, tales puntos se distribuyen en un círculo. El diagrama indicará no correlación entre las variables X y Y. X
109
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Y 1
2 Si los puntos se dispersan en los cuadrantes 1 y 3; el diagrama sugiere una correlación negativa.
4
3 X
Y 1
2 Si los puntos se distribuyen en una línea recta invertida la correlación es negativa perfecta.
4
3 X
2. COEFICIENTE DE CORREL AC A CIÓN. Los diagramas dan una idea de la correlación existente entre las dos series de valores, una indica la no existencia de ésta, pero para medir de un modo matemático y más preciso el grado de correlación existente, es necesario dete determinar rminar un va valor lor numérico qu que e lo exprese. exprese. Esto se consigue mediante la obtención del coeficiente de correlación. Se deben considerar varios casos posibles entre la asociación de las dos variables:
a) El v al o r d el c o ef i c i en t e d e c o r r r el ac i ó n es c er o o es t i m a a c er o . L as vvar i ab l es sso n iin d ep en d i en t es n n o h h ay cco r r r el ac i ó n . b ) El v al o r d el c o ef i c i en t e d e c o r r r el ac i ó n es +1. Hay u n a c o r r p o s i t i v a p p er f f ec t a. r el ac i ó n p c ) El v al o r d el c o ef i c i en t e d e c o r r ––1. Hay u n a r el ac i ó n es –1 c o r r n eg at i v a p p er f f ec t a. r el ac i ó n n d ) Val o r es d e 0 a +1 y d e 0 a ––1 s u g i er en c i er t o t i p o d e c o r r r el ac i ó n .
Si l a m u es t r a f u e t o m ad a al azar d e u n a
p o b l ac i ó n , s er á n ec es ar i o p l an t ear y p r o b ar l a h i p ó t es i s q u e d e d i c h a m u es t r a f u e t o m ad a d e u n a p o b l ac i ó n c u y as v ar i ab l es o o ccar ac t er es e es t án cc o r r r el ac i o n ad o s . 110
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
En una población de seres vivos o de objetos, cuyos caracteres cuantitativos están correlacionados, el símbolo del coeficiente de correlación se representa por la letra griega ρ (rho); el parámetro estadístico que estima a ρ se simboliza por r y y se calcula con las siguientes fórmulas: r =
∑ ( X − x ) (Y − y ) = ∑ xy (∑ x )(∑ y ) (∑ x )(∑ y ) 2
2
∑ x = ∑ X − 2
2
2
(∑ X )
2
n
2
(X-⎯x) = x, desviaciones de la variable X (Y-⎯y) = y, desviaciones de la variable Y xy = productos de las desviaciones.
(∑ Y ) = − y Y ∑ ∑ n
2
2
2
∑ xy = ∑ XY −
(∑ X )(∑ Y ) n
∑ xy = Sumas de los productos. ∑x 2 = Suma de los cuadrados de las desviaciones de X.
∑y 2 = Suma de los cuadrados de las desviaciones de Y.
GL = n − 2 n = número de pares.
111
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
5.4. G GR ADOS D DE S SIGNIFIC ANCI A A Spiegel (1986) y Daniel (1993), señalan que los n pares de valores (X,Y) de dos variables pueden ser concebidos como una muestra de una población de todos los posibles pares. pares. Puesto que están implicada implicadass dos variables, se dice que es una población de doble variación, que se supone es una distribución normal de doble variación. Se puede pensar en un coeficiente de correlación poblacional teórico de la muestra. denotado por ρ, que se estima por el coeficiente de correlación r de Los ensayos de significación o hipótesis concernientes a distintos valores de ρ requieren el conocimiento de la distribución muestral de r . Para ρ = 0, esta distribución es simétrica y puede utilizarse un estadístico con una distribución de Student. Para ρ ≠ 0 la distribución es sesgada. En tal caso, una trans transformación formación debida a F Fisher isher
origina un estadístico que se distribuye aproximadamente
normal. Los siguientes e ensayos nsayos resumen los procedimientos cconsidrados. onsidrados. que ue el estadístico 1. Ensayos de hipótesis ρ = 0. Se basa en el hecho de q t =
r n − 2
1 − r
2
tiene u una na d distribución istribución de Student con GL= n n-2. -2.
2. Ensayos de hipótesis ρ σ 0 ≠ 0. Se basa en el hec hecho ho de qu que e el estadís estadístico tico
1.1513 log10 ⎛ Z = 1 log e ⎛ ⎜ 11 +− r ⎜ 11 +− r 2 r ⎞ r ⎞ ⎝ ⎠⎟ = ⎝ ⎠⎟
donde e = 2.711828..., se distribuye aproximadamente normal con media y desviación típica dada por μ z =
1 2
⎛ 1 + ρ 0 ⎞ ⎟⎟ = 1.1513 ρ − 1 0 ⎠ ⎝
log e ⎜⎜
σ z
=
1 n−3
Estos hechos pueden también utilizarse para hallar los límites de confianza para los coeficientes de correlación. La transformación sse e llama Z de Fis Fisher. her. 3. Significancia de una diferencia entre coeficientes de correlación.
112
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Para determinar si dos coeficientes de correlación r 1 y r 2 obtenidos de muestras de tamaños n 1 y n 2 , respectivamente, difieren significativamente uno de otro, se calcula Z 1 y Z 2 correspondientes a r 1 y r 2 . Haciendo después uso del hecho de que el estadístico
z
=
donde μ z1 - z2 = μ z1 - μ z2 y σ z1 - z2 =
Z 1 − Z 2
−
z1 − z 2
σ z1 − z2 2
σ z1 + σ z2
2
=
1 n1
−3
+
1 n2
−3
se distribuye normalmente.
El juego de hipótesis sería el siguiente: Se rechaza H o y se acepta H A si.
r c
Calculada
≥
r α(GL)
obtenida de los valores tabulados
113
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejemplo 22. Se tiene los los datos de la ed edad ad
y peso del camarón blanco del Golfo
(Litopenaeus setiferos). Determinar si existe correlación entre la edad y el peso del camarón. Sea α = 0.05.
Longitud (cm)
Peso (grs)
XY
X
Y
5.8 9.2 11.7 13.7 15.1 16.3 17.2 17.8 18.4 18.8 19.1 19.2
0.6 2.4 5.0 8.1 11.2 14.0 16.5 18.6 20.3 21.6 22.7 23.6
3.48 22.08 58.5 110.97 169.12 228.2 283.8 331.08 373.52 406.08 433.57 453.12
33.64 84.64 136.89 187.69 228.01 265.69 295.84 316.84 338.56 353.44 364.81 368.64
0.36 5.76 25.0 65.61 125.44 196.0 272.25 345.96 412.09 466.56 515.29 556.96
∑X = 182.3 ⎯x =15.191
∑Y = 164.6 ∑ = 2873.52 ∑ = 2974.69 ∑ = 2987.28 ⎯y =13.716 La hipótesis a probar es: H o : ρ = 0; no hay correlación H A : ρ ≠ 0; hay correlación 24.5 22.5
Dispersión de la longitud y el peso del camarón blanco.
20.5 18.5 16.5 ) g14.5 ( o s12.5 e P 10.5
8.5 6.5 4.5 2.5 0.5 5
7.5
10
12.5
15
17.5
20
Longitud (cm)
Se puede apreciar que la mayoría de los datos de distribuyen dentro de tres cuadrantes (2 y 4), por lo que sugiere una correlación positiva. 114
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
∑ xy = 2873.52 − (182.312)(164.6) = 372.971 2
∑
x 2
∑ y r =
2
.3) = 205.249 = 2974.69 − (182 12
= 2987.28 −
(164.6)2 12
372.971
(205.249)(729.516)
= 729.516
= 0.963
GL = n − 2 = 12 − 2 = 10
r c 0.963
>
r 05(10) 0.576; p< 5 % *
Se acepta H A , existe correlación significativa y positiva entre la longitud y el peso del camarón (p< 5 %). La muestra fue tomada d de e una población don donde de hay una correlación positiva.
115
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Ejemplo 23.
Se reunieron los siguientes datos durante un experimento en el cual se
inóculo un animal de laboratorio con un pa patógeno. tógeno. Las variables so son n el tiempo en el cual el patógeno se desarrolla (horas), después de la inoculación y la temperatura (0C) a la cual se desarrollo. Sea α = 0.05.
X Tiempo (hrs)
Y To C
XY
X2
24 28 32 36 40 44 48 52
38.8 39.5 40.3 40.7 41.0 41.1 41.4 41.6
931.2 1106 1289.6 1465.2 16 1640 40 1808.4 1987.2 2163.2
576 784 1024 1296 1600 1936 2304 2704
1505.44 1560.25 1624.09 1656.49 1681 1689.21 1713.96 1730.56
56 60
41.8 41.9
2340.8 2514
3136 3600
1747.24 1755.61
∑ = 420 ⎯x = 42
Y2
∑ = 408.1 ∑ = 17245.6 ∑ = 18960 ⎯y = 40.81
La hipótesis a probar es:
∑ = 16663.85
H o : ρ = 0; no hay correlación H A : ρ ≠ 0; hay correlación
42 41.6
Dispersión del tiempo de incubación con respecto a la temperatura. temperatura.
41.2 ) 40.8 C ° 40.4 ( a r u t 40 a r e p 39.6 m e T 39.2
38.8 38.4 38 20
24
28
32
36
40
44
48
52
56
60
Tiempo (hrs)
La dispersión de los valores se distribuye en su mayoría en los cuadrantes 2 y 4, por lo que sugiere una correlación positiva. 116
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
∑ xy = 17245.6 − (420 )()10(408.1) = 105.4 2
∑ x ∑ y r =
2
2
= 18960 − (420 ) = 1320 10 = 16663.85 −
105.4
(1320 )(9.289)
(408.1)2 10
= 9.289
= 0.951
GL = n − 2 = 10 − 2 = 8
r c 0.951
r 05(8) 05(8) >
0.632; p< 5 % *
significati ficativa va y p positiv ositiva a el tiempo tiempo de dell la Se acepta H A , existe correlación signi patógeno (p< 5 %). La mue muestra stra fue inoculación y la temperatura de cultivo del patógeno tomada de una población donde hay una correlación po sitiva.
117
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Para los siguientes ejercicios: a) Prepare el diagrama de dispersión. b) Calcule el coeficiente de correlación de la muestra. c) Pruebe que H o : ρ = 0 al nivel de significancia de 0.05 y saque sus conclusiones.
Ejercicio Ejercici o 22. En un estudio llevado acabo durante 8 meses de captura del Cazón de Ley (Rizoprionodon terraenovae) se quiere determinar si existe una relación entre la longitud promedio encontrada en los organismos y el peso promedio de los mismos. Meses
X Longitud prom. (cm)
Y Peso Peso prom .(grs)
89.6 78.6 89.2 98.0 101.0 59.5 59.6 70.5
2476.5 3200.0 3000.0 3210.0 3775.0 925.6 776.5 1428.5
Abril Mayo Junio Julio Septiembre Octubre Noviembre Diciembre
Ejercicio Ejercici o 23. En un estudio sobre el efecto de un componente de la dieta sobre la composición de los lípidos del plasma, se obtuvieron los siguientes datos en una muestra de 15 animales experimentales: Medida del componente de la dieta (X)
Medida de la concentración de lípidoss en el plasma lípido plasm a (Y) (Y)
18 21 28 35 47 33 40 41 28 21 30 46 44
38 40 47 54 66 52 59 60 47 40 49 65 63
118
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
38 19
57 38
5.5. R REGRESIÓN Se da el nombre de regresión de una variable sobre otra a la expresión de la variación de la primera, como consecuencia de la variación de la segunda. El estudio de la regresión permite predecir, sobre la base de hechos pasados, la variación de una variable en el porvenir, al variar otra, cuya relación con la primera se ha comprobado. comprobado. La función de la re regresión gresión es aquella que expresa el valor medio que puede esperarse en los valores de la variable dependiente, para valor que tome la variable independiente. cada valor
Una vez vez determinad determinada a esta
función, podrá predecirse el valor probable de la variable dependiente para cada uno de los valores que puedan darse a la variable independiente (De la Loma, 1980 y Daniel, 1993). En la regresión lineal, los valores de Y se obtienen de varias poblaciones, cada una determinada po porr un valo valorr correspondiente de X. Para que la teoría probabilística sea sea aplicab aplicable, le, es e esencial sencial qu que e Y sea aleatoria.
Así mismo, se
supone que la poblaciones Y son normales y tienen varianza común (Steel y Torrie, 1995). En análisis de regresión define el tipo de relación entre las variables y luego determina si los datos se se ajustan o no a esta supue supuesta sta relación. Cuando se calcula el coeficiente de correlación (r) se establece el ajuste de los l os datos con una relación determinada, la cual se supone que es básicamente rectilínea, pero el coeficiente no dice nada acerca de la línea recta hacia la cual tienden los datos, salvo si su gradiente es positivo o negativo. En el análisis de regresión se reconoce la asimetría de la situación, distinguiendo entre las variable inde independiente pendiente y la variable dependiente.
Las
suposiciones que se hacen en este análisis, y que por tanto deben ser satisfechas antes que pueda aplicars aplicarse e el mismo, son las sig siguientes. uientes.
Si X es la variable
independiente e Y es la variable dependiente, se supone que a) X puede medirse 119
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
sin cometer error, b) para cada valor de X existe un “auténtico” valor de Y que se a justa a una relación rectilínea entre la X y la Y, c) las medidas de Y presentan una variación aleatoria y se distribuyen normalmente respecto a su “auténtica” media, y d) que la varianza de los valores individuales de Y respecto al “auténtico” valor es la misma para todos los valores de X (Bishop, 1966).
120
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
5.6. E ECU AC ACIÓN D DE L L A L A L LÍNE A R A R RECT A
El método que se utiliza por lo común para obtener la recta deseada se
conoce como el método de mínimos cuadrados y la recta resultante se conoce como recta de mínimos cuadrados . La ecuación general de una recta esta dada por la expresión y = a + bx , donde y es un valor sobre el eje vertical, x un valor sobre el eje horizontal, a el punto donde la recta cruza el eje vertical y b iin ndica la cantidad con la cual y cambia por cada unidad de cambio en x , a se se conoce como la ordenada al origen y b como la pendiente de la recta. P Pa ara trazar una recta en base a la anterior ecuación, se necesitan los valores numéricos de las constante s a y b . Dadas estas cons onstan tantes tes,, puede eden n ssust ustitu ituirs irse e vva arios valores de x en la ec ecua uac ció ión n para obtener los correspondiente valores de y . Luego, pueden graficarse los puntos resultantes. Dado que dos p parejas arejas cualesquiera de esas coordena coordenadas das determinan una reta, pueden seleccionarse dos cualesquiera, localizarse en sistema coordenado y unirse para obtener la recta correspondiente a la ecuación.
Longitud (cm)
Peso (grs)
XY
X2
5.8 9.2
0.6 2.4
3.48 22.08
33.64 84.64
0.36 5.76
11.7 13.7 15.1 16.3 17.2 17.8 18.4 18.8 19.1 19.2
5.0 8.1 11.2 14.0 16.5 18.6 20.3 21.6 22.7 23.6
58.5 110.97 169.12 228.2 283.8 331.08 373.52 406.08 433.27 453.12
136.89 187.69 228.01 265.69 295.84 316.84 338.56 353.44 364.81 368.64
25.0 65.61 125.44 196.0 272.25 345.96 412.09 466.56 512.29 556.96
∑X = 182.3 ⎯x =15.191
Y2
∑Y = 164.6 ∑ = 2873.52 ∑ = 2974.69 ∑ = 2987.28 ⎯y =13.716
121
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
A partir de un conjunto de datos, correspondientes al ejemplo 22, se obtiene los valores de a y b .
∑ y
i
= na + b∑ xi
164.6 = 12a + 182.3b
∑
yi xi
= a∑ xi + b∑ xi 2
2873.52 = 182.3a + 2974.69b
Pueden resolverse estas ecuaciones por cualquier método conocido para obtener:
a = -13.886
b = 1.817
La ecuación de la línea recta de mínimos cuadrados que describe la relación entre los pesos y las longitudes obtenidas pueden escribirse entonces como:
Y c = -13.886 + 1.817x Esta ecuación indica que, dado que a es negativa, la línea cruza el eje Y debajo del origen y que dado que b , la pendiente, es positiva, la recta se extiende de la parte inferior izquierda de la gráfica a la parte superior derecha de la misma. Se observa además que, para cada unidad de incremento en X, Y aumenta en una cantidad igual a 1.817. Se agrega el ssubíndice ubíndice a Y para indicar que es un valor calculado a partir de la ecuación, más que un valor observado de Y. Sustituyendo los valores convenientes de X en la ecuación, pueden obtenerse las coordenadas coordenadas nec necesarias esarias para trazar la recta. Supóngase, prime primero, ro, que X = 5.8, de lo que se obtiene:
Y c = -13.886 + 1.817(5.8) = -3.347 Si se supone que X = 19.2, se tiene:
Y c = -13.886 + 1.817(19.2) = 21.0 122
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
La recta, junto con los datos originales se muestran en la siguiente gráfica:
25 23 21
Dispersión de la longit ud y el peso del camarón blanco.
19 17 15
) g 13 ( o 11 s e 9 P
7 5 3 1 -1 -3 0
2.5
5
7.5
10
12.5
15
17.5
20
Longitud (cm)
Ahora que se ha obtenido lo que se conoce como la mejor recta para describir la relación que existe entre las dos variables, se necesita determinar bajo qué criterio se considera considera mejor. Se observa que que la recta de m mínimos ínimos cuadrados no pasas por punto alguno de los que se graficaron en el diagram a de dispersión. En otras palabras, los puntos observados se d esvían de la recta en diversas cantidades. La recta que sse e ha trazado a través de los puntos es mejor en este sentido:
d e ll as d d es v i ac i o n es vv er t i c al es , e el ev ad as a al cc u ad r ad o , d d e L a ss u m a d l o s p u n t o s c o r r r es p o n d i en t es a l o s d at o s o b s er v ad o s (y i ) c o n r es p ec t o a l a r ec t a d e l o s m ín i m o s c u ad r ad o s es m en o r q u e l a s u m a d d e llas d d es v i ac i o n es vver t i c al es , e el ev ad as a al ccu ad r ad o , d d e llo s p u n t o s d d e llo s d d at o s q q u e f f o r m an cc u al q u i er o o t r a r r ec t a. En otras palabras, si se eleva al cuadrado la distancia vertical desde cada punto observado (y i ) hasta la recta de mínimos cuadrados y se suman los valores obtenidos para todos los puntos, el total resultante será menor que el total calculado en forma semejante para cualquier otra recta que pueda trazarse a
123
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
través de los puntos. Por esta razón, la recta que se se ha trazado recibe el nombre nombre de recta de mínimos cuadrados (Daniel, 1993 y Bishop, 1966).
5.7. F FORM AS P P AR A D DETERMIN AR a a Y Y b b
Reyes (1995) menciona que el uso de la regresión en muy amplia en
biología, química, medicina, medicina, agronomía, etc. La regresión se mide por medio del coeficiente de regresión. En una población se simboliza con β y en una muestra como b . Su valor indica el incremento promed promedio io de Y al aumentar X en la unidad. Se calcula por medio de expresión: bY / X
=b=
∑ xy ∑ x 2
b Y/X = b se lee: “regresión de Y sobre X” en donde Y es la variable dependiente y X la independiente. Daniel (1993) Propone las siguientes ecuaciones para determinar los valores de a y b :
b=
n
∑ xy − (∑ x )(∑ y ) n∑ x − (∑ x ) 2
a
2
=∑
y − b
∑ x
n
b=
12( 2873.52) − (182.3)(164.6) 12( 2974.69) − (182.3)
2
= 1.817
a=
164.6 − 1.817(182.3) 12
= −13.88
Ejemplo: cálculo del coeficiente de regresión del peso (Y) sobre la longitud (X) del ejemplo 22, donde se describió la correlación. b=
∑ xy = 372.971 = 1.817 ∑ x 205.249 2
El valor de 1.817 es el incremento en peso por cada centímetro de longitud.
124
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
El valor del coeficiente b también es la pendiente de una línea recta que pasa por ⎯ x, ⎯ y. La ecuación d de e la línea recta esta determinada por la fó fórmula: rmula:
Y c = y + b (X- x) Donde: Y c = Valor teórico de la ordenada de la línea de regresión. Y = Valor observado de la variable dependiente. Y – Y c = Desviación de la regresión = y.
∑Y – Y c = 0 ⎯ y = Promedio de la variable dependiente. ⎯ x = Promedio de la variable independiente. coeficiente eficiente de regresió regresión n b = Pendiente de la línea de regresión de la muestra o co que estima a β. Aplicando al ejemplo que se ha ha descrito, se tiene:
y = 13.716
x = 15.1 15.191 91
Cualquier punto de la línea recta que pasa por x y y tiene como ordenada:
Y c = 1.817x –13.88 Es posible calcular la regresión de X sobre Y, en donde X sería la variable independiente. La expresión y la fórmula pa para ra el coeficiente dependiente y Y la independiente. de regresión serían:
b X / Y
=
∑ xy = 372.971 = 0.511 ∑ y 729.516 2
El incremento promedio de la longitud por cada gramo de peso es de 0.511 centímetros. La ecuac ecuación ión de la línea recta sería sería::
X c = x + b (Y- y) X c = 15.191 + 0.511(Y-13.716)
X c = 8.178 + 0.511Y 125
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
En los datos muestreados se observa que para 0.6 grs de peso la longitud fue de 8.48 cm. Es decir, ha hayy una estrech estrecha a concordanc concordancia ia entre lo teórico y lo observado. En muchos fenómenos biológicos es posible considerar indistintamente a Y variables independientes o dependientes, respectivamente. En algunos o X como variables casos no es posible o resulta un gran error tal consideración. Conociendo el coeficiente de regresión b Y/X =b o b X/Y , el coeficiente de correlación se calcula por medio de media geométrica de dichos valores.
r =
b b X / Y o
=
1.817 (0.511)
= 0.963
Valor prácticamente igual al calculado previamente, en donde r = 0.963. El coeficiente de determinación es un valor que se calcula con el cuadrado del valor del coeficiente de correlación y se expresa como porcentaje.
CD = r 2 x 1000 CD = (0.963)2 x 100 = 92.736 % Efecto del medio = 100 – 92.736 = 7.264 El valor del coeficiente de determinación indica qué porcentaje de la
variación de la variable Y es atribuible a la variación de la variable X; el complemento a 100 es atribuible a otras causas, tales como errores de muestreo, al medio o a causas no conocidas.
En el eje ejemplo, mplo, las desviaciones de u una na
perfecta correlación r =1 y CD = 100 indican que influyen el medio y otros factores; es decir, puede haber organismos de menor longitud con mayor peso o organismos de mayor longitud con menor peso.
126
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
5.8. D DETERMINA MINAC CIÓN D DEL VAL VALOR P PREVIS EVIST TO D DE Y Y Conociendo la ecuación de la línea de regresión se constru ye la siguiente tabla para el ejemplo 22.
Y c = 1.817x –13.886 Y c = 1.817 (5.8) –13.886 = -3.34 Y c = 1.817(9.2) –13.886 = 2.83
. . . Y c = 1.817(19.2) –13.886 = 21.0
Longitud
Peso
Peso
Desviación
(cm)
(grs)
teórico (Y c )
(Y-Y c )
5.8 9.2 11.7 13.7 15.1 16.3 17.2 17.8 18.4 18.8 19.1 19.2
0.6 2.4 5.0 8.1 11.2 14.0 16.5 18.6 20.3 21.6 22.7 23.6
-3.34 2.83 7.37 11.0 13.55 15.73 17.36 18.45 19.54 20.27 20.81 21.0
3.94 -0.43 -2.37 -2.90 -2.35 -1.73 -0.86 0.15 0.76 1.33 1.89 2.60
∑ = 0 La diferencia de las sumas de los valores observados y los de los valores calculados debe ser igual a 0.
127
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
5.9. D DETERMIN AC ACIÓN D DEL E ERROR T TÍPICO De la Loma (1980), menciona que una vez obtenido el coeficiente de regresión de una variable sobre otra, es necesario comprobar si el coeficiente hallado es o no significativo significativo.. La significación, en este cca aso, revelará que la recta determinada como recta de regresión representa con suficiente exactitud la variación de una de las series en función de la otra. Para determinar dicha significancia es preciso empezar por calcular el error típico del coeficiente de regresión Si Y c representa el valor de Y estimado de Y c = ⎯ y + b (X - ⎯ x) par a valores de X dados, una medida de la dispersión alrededor de la recta de regresión de Y sobre X viene dada por la cantidad: S Y / X
(Y − Y ) = ∑
c
n−2
2
que se llama error típico de la estima de Y sobre X Si la recta de regresión X c = ⎯ x + b (Y-⎯ y) la utilizada, se obtiene el error típico de la estima de X sobre Y, que queda definida por: S X / Y
( X − X ) = ∑
(Spiegel, 1986 y; Steel y Torrie,1995).
c
2
n−2
Aplicando este procedimiento para para determinar el error típico (error estándar o desviación estándar ) al ejemplo que se ha venido siguiendo, se tiene:
S Y / X
(Y − Y ) = ∑
c
n−2
2
=
(0.6 − (3.347 )2 + (2.4 − 2.83)2 + ... + (23.6 − 21)2
12 − 2
= 2.274
Que la desviación estándar de Y para X fijo o la desviación estándar de Y manteniendo X constante. 128
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
En la evaluación del modelo, a través del ANAVA de Y, el objetivo que se persigue al construir el modelo es el explicar y predecir las diferencias en cuanto al incremento de peso peso del camarón. Es decir, se trata de e explicar xplicar las variacione variaciones s de Y observadas entre los camarones de la muestra. La variabilidad total de Y se puede cuantificar mediante (Daniel, 1993):
SC T
= ∑ Y
2 i
(∑ Y )
2
−
i
n
= 2987.28 −
(164.6 )2 12
= 729.516
El modelo propuesto explica una cierta fracción de la diferencias en cuanto al incremento de peso entre los camarones. Es decir, el modelo explica una porción de la variabilidad total de Y. La variabilidad explicada por el modelo sse e puede cuantificar mediante:
SC ex
2 ⎤ ⎡ ( ) X ⎡ (182.3) 2 ⎤ ∑ i 2 2 2 ⎥ = (1.817) − ⎢2974.69 − = b ⎢∑ X i − ⎥ = 677.53 12 n ⎢⎣ ⎥⎦ ⎣ ⎦
Permanecen, sin embargo, algunas variaciones en los valores de Y que el
modelo no es capazas de explicar y están representadas por las diferencias entre los valores observados y los predichos por el modelo.
La variabilidad no
explicada por el modelo se puede cuantificar mediante:
SC ln
= SC T − S C ex = 729.516 − 677 .53 = 51.986
Un buen modelo debe ser capaza de: a) explicar una fracción sustancial de la variabilidad total de Y, y b) explicar una fracción significativa de la variabilidad total de Y.
Análi An álisi siss d e Vari Varianza anza d del el mod m odelo elo de rregr egresi esión ón Fuentes de variación Explicada No explicada
GL
SC
CM
F
1 n-2
SC explicada SC residual
CM m =SC exp /1 CM r = = SC res /n-2
CM m /CM r
Total
n-1
SC
total
129
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
Para el ejemplo:
Fuentes de variación Explicada No explicada Total
GL
SC
CM
F
110 11
61 7.79.8 56 3 5 729.516
657.1 79 .583
130.344
El valor del cociente de F = CM m /CM r debe debe compararse con el valor crítico de la distribución de F correspondiente al nivel de significancia α deseado (usualmente 0.05 ó 0.01) y a (1, n-2) grados de libertad. Para el ejemplo:
Fc 130.344
F 05(1,10) >
4.96, p < 5 % *
Se concluye que el modelo explica una fracción significativa de la variación total de la variable de r espuesta.
Ejercicio Ejercici o 24. Para el ejemplo 22, los ejercicios 22 y 23, determinar: A) El coeficiente de regresión. B) La ecuació ecuación n de la línea recta. C) La grafica de d dispersión ispersión de los valores. D) El coeficiente de determinac determinación. ión. E) El valor previsto de Y. F) El error típico. G) La evaluación median mediante te el ANAVA.
130
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
BIBLIOGRAFÍA
Bishop, O.N. 1966. Estadística para Biólogos . Longmans, London.
Cochran,
G.W y Cox, M.G. 1980. Diseños Experimentales . 1a Edición.
TRILLAS.
Daniel, W.W. 1993. Bioestadística : Bases para el Análisis de las Ciencias d e la Salu Salud. d. 3a Edición. LIMUSA.
De La Loma, JJ.L. .L. 1980. Expe Experimentación rimentación Agrícola. 2a Edición. UTEH A.
Hurley, P.D., Aguilar, A., Garibay, J.L. y Landero Landeros, s, J. 1981. Técnicas de Diseños Experim entales . UNAM.
Labastida, L.N. 1991. Estadística I. IPN.
López, P.R. 1994. Diseños Estadísticos de Experimentos (Curso). UAY y U. de la Habana.
G.A. 1987. As pec pectt os Eco Econó nómi mico coss del Dis eño y An Análi áli si siss de a Experimentos . 1 Edición. LIMUSA.
Martínez,
Ostle, B. 1983. Estadística Aplicada. 1a Edición. LIMUSA.
Padrón, C.E. 1990. Diseños Experimentales con la Aplicación en la Ag ricu ri cull tu turr a y lla a Ganad Ganaderí ería a. UAAAN.
Reyes, C.P. 1992. Diseños de Experimentos Aplicado s . 3a Edición. TRILLAS.
__________ . 1995. Bioestadí Bioestadística stica Aplicada. 2a Edición. TRILLAS.
Spiegel, R.M. 1986. Estadística (Serie SCHAUM). McGRAW-HILL.
Torrie, J. 1995. Bioestadística: Procedimientos. 2a Edición. McGRAW-HILL. Steel,
G.R.
y
1a Edición.
Principios
y
131
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
A AP PÉNDICE Tabla 1. Probabilidad de obtener un valor mayor o igual a t. Tabla 2. Valores para F. Tabla 3. Valores de q α para para la prueba de Tukey. Tabla 4. Valores de t múltiple para la prueba de Duncan. Tabla 5. Valores de X2. Tabla 6. Coeficiente de correlación.
132
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
133
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
134
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
135
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
136
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
137
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
138
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
139
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
140
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
141
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
142
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
143
BIOL. J. LFREDO SOLÍS ECHEVERRÍ
View more...
Comments