N
M N
SOKAL/ROHLF
Intro duc ción a la
Bioestadística
•
Introducción a la
Bioestadística
Robert R. Sokal 8TATE U NI\'ERSITY
or
F. Jam es Rohlf NEW TORE AT 8TONT BRQOIr'
EDITORIAL REVERTÉ. S. A. Barcelona _Bogotá · Buenos Aires-Caracas- México · Rio de Janeiro
•
A Julie y Pat
Tí!lJo de la obra 009'naJ: Introduction to Biosta tistic s
Ed/CIÓI"J ooginal en lengua Inglesa publicada ooc W. H. Freeman and Company. San Franci sco
Copyright e W.H. Freeman and Com pany
V!ó'5ón española por: Joaquina Gabarrón
tjceocaca en Bdog..
secceo de CtogeoétJCa del centro de BlOQVÍITIica ClfiIca de Espm rdo (Murcia) Reservados tooos es oeecrcs. NngtrIa parte del matenat cubierto por este titulO de peopecad erana puede ser reoooocca. asneceoaoa en un SIStema de IOlormálica o transmitida de cualQuier lorma o por ~ rrecc eectrcoco. rrecáoco. JoIOCQPia , grabación u otros métodos Sin ~ previo
'; ecxeso penT'ISO por escmc del eoro. Propiedad de:
EDITORIAL REVERTÉ, SA
Le-etc 13-'5 Local B 08029 Barcelona. España Te! 419·33- 36 Fa)'" 4 19.5 1-89
E·Mad (lnt...net): 104164 23~.com
y
REVERTÉ EDICIONES, S.A. DE C.V. RíO Pánuco 141 Col. Cuauhlémoc
C.P. 06500 M éxico. D.F. Tel.: 55·33·56·58 al 60 Fax: 55·14·67·99 E·Mal (Internet): 101 54 5.236
[email protected]
Edic>On en espafl O REVERTÉ EDICIONES, S.A. DE C.V., 1999 ISBN 968·6708.42.1 (Méxic o) ISBN 84·29' ,1862.4 (Esp aña) ~mpr&ao en MéXICO
Printed in Mexico
Prólogo
La fa vorable acogida que nuestra extensa Biometrfa ha recibido d e profesores)' estudiantes, y la sugerencia de numerosos compañeros, nos ha animado a escribir esta mas breve Introducción a la Bioestad ística. Este libro 1'11 dirigido Q los estudiantes de estadística biológica qu e deberían poseer una base com pleta de la materia, requiriendo solamente
una preparación elemental en matemáticas. Esperamos que eí libro sea útil también en cursos breves de bioestadístíca como los que a menudo se imparten en facultaJes de medicina y otras escuelas prof esionales. Pese a la necesaria brevedad. hemos conservado el estilo sencillo de nuestro más amplio volumen y confia mos en que las diversas características pedagógicas puestas de manifiesto en aquél, serán también apreciadas en éste. Muchos de los enfoques descritos en el prólogo de nuestro volumen anterior se repiten en éste: sin embargo. algunos han sido modificados en [unci ón de las diferentes caracteristicas de los lectores a quienes nos dirigimos. Aunque suministramos esquema.~ de cálculo detallados para todos los métodos discutidos en el libro. hemos puesto menos énf asis en los aspectos de cálculos implicados en el tratamiento del material. Esto se ha hecho por dos razones: en muchos cursos para es tudiantes universitarios. éstos tienen relativam ente poca oportunidad y motivación para la realización de cálculos largas con material biológico de investigaci ón: por otra parte. el desarrollo de calculadoras electrónicas ha revotucionado tanto las metodologías para cálculos estadísticos. que WI tratamiento amplio de las diversas estrategias para cada tipo de calculadora disponible. caería fuera de los objetivos de este libro y además Quedaría anticuado poco después de su publicación: Por tanto, confiaremos en que el profesor del curso aconseje a los estudiantes los mejores procedimientos de cálculo a seguir de acuerdo con los medios disponibles. La materia está ordenada en cap itulas y secciones. numerados según el sistema decimal convencional: el "umero que precede al punto indico el capitulo y ~I ~ue sigue ,a.éste, la sección Los temas pueden encontrarse en el índice general y en el ",dlc~. alfab ético. I.as tablas también están numeradas según el sistema decim al. indicando et p rímer numero el
VII
\'Ill
Prólogo
. 1 . el segundo el " úmero de la tabla dentro del cap in/lo. Ciertas tablas especiales capttuto. ¡ d l b ·· · l si
d nominadas "cuadros" y están numera os como (a es, tam 1(: 11 segun e SlSl ema :;;m:l Estos cuadros cumplen uno ~oble ~w~ció,,: ilustran sobre los merod~~ para iver diversos tipos de problemas bioestadist ícos y. p or tamo. pueden ser u rrh::ados
;~ las personas que manejen el libro como modelos apropiados de cálculo. Normalmem e
contienen todos /os pasos necesarios desde el planteamiento d~1 problema hasta el resut. tado final: por esto. a los estudiantes fam iliarizados ~1J el libro, pueden servir Como reSlimenes recordatorios del método. Un segundo uso importante de lo s cuadros tiene su
origen en su utilidad como origi'U1~es. los cuales se multi~PiQbalJ. y el~ tregaba" a los estudiantes en tos cursos de biometria de los alltores. En el tiem po d isponible de clases es imposible dar ni la mitad de la materia abarcada en el curso, si ~l ~ontenido d e.estas hojas tiene que escribirse en la pe ana. De este modo, se puede rem u u a lo s estudian tes a los aladros v tablas del libro, con el consiguiente ahorro de tiempo y la posibilidad de dedicar Su atención a la comprensión del contenido de estas hojas en lugar d e copiarlas. Los profesores que utilicen este libro como tex to, pueden senirse de los cuadros de fo rma similar.
Las figuras están numeradas por el mismo sistema que.ta: tablas .~' cu.a~ros . e igualmente los experimentos (de muestreo). expresiones {matem áticas] y et erctctos (de practico). Los números de los apéndices ran precedidos de la letra A . Dado que el interés de este libro reside en las aplicaciones prácticas de la estad istíca a la biología: las discusiones de teoría estadística se atienden estrictamente al minimo. Las demostraciones de algunas fórmulas aparecen en el ap éndice A 1 Y deben ser estudiadas y reelaborodas por el estudiante. Las tablas estadísticas necesanas para /os merados tratados en este libro se encuentran en el apéndice A..? Suponemos que los estudiantes son capaces de utili:ar tablas matemá· ticas ordinarias que contengan logaritmos. raices cuadradas y funciones trigonom étricos: Las nuestras han sido extraídas de un volumen de tablas más amplio publicado separadamente (que incluye las tablas matemáticas y a mencionadas), titulado Stat istical Table s de Rholf y 50"01, W.H. Freeman and Companv, 1969_ Estamos agradecidos al editor de estas últimas Sir Ronaíd A. Físñer, F. RS.. al Dr. Fran k Yares. F.R.S.. y a Otiver & Boyd, de Edimburgo, por permitirnos copiar la Tabla 111 (nuestra Tabla UI) d e su libro Stat istical Tables for Biological Agricultura! and Med ical Research. Al {UUII de cada capitulo se dan ejercicios prácticos para los estud iantes que utilicen el libro en un curso de bioestadistica o individualmente: De acuerdo con nuestras propias convicciones, ~stos son en gran parte problemas de in vestigaci ón reales. Algunos de el/os por lo canto. requieren bastantes cálculos para su solución. La mayor parte de lo expuesto en este tex ro, está sacada de nuestro más amplio libro de btometria: Por sugerencia de numerosos compañeros se ha añadido una nuera sección de probabilidad. Nuestro orden de exposición pasa. de f ormo convenciona l. de la estadistu:a descriptna a las diuríbuciones fundamentales)' al contraste de hipótesis estadtsticas demenca/e1, para luego proceder inmed ia tamente al análisis de varianza: El familiar y rradícilJfIQ/ teJl-t se trata simplemente como un cOJO especial de análisis de varianza y q~ Telegado a rías secciones de diversos cap itutos apropiados del libro. Esto lo henos hecho dell.lJerrMiamente por dos razones: ( 1 J Es urgente que los estudian tes fe rel«ionen COI! el análisIS de la varianza /o más pronto posible. ya que actualmente es
Prólogo
IX
esencial para cada biólogo lUla buena base en el análisis de la varianza. (2) Si el análisis de la varianz a se ex pone y comprende desde el principio, la necesidad de emplear la distribu ción·t queda muy reducida. ex cepto para es tablecer limites de conf ianza y otras pocas situaciones especiales. Todos los test-t pueden resolverse como análisis de varianza y muchos son miÍs informativos ruando se realizan como tales. IAl cantidad de caículos es generalmente equivalente. En otros temas nos hemos preocupado de introducir nueras y mejoradas técnicas, haciendo miÍs hincapi é en estas que en m étodos anteriores que 1I0 S parecen menos adecuados. Ejemplos notables de tales innovaciones son: la adopción del procedimiento de tests de comparaciones múltiples a posteriori y el empleo del en odtmco-C para el análísís de f recuencias. en lugar de los tradicionales tests chi-cuadrelo que. por lo tanto. tratamos menOS ampliamente. Agradecemos a los Prof esores K.J. So nletm er. Theodore 1. Croveuo.y Albert J. Rowel/ sus amplias observaciones sobre la rersión inicial del manuscrito. Lo s Profesores Arnoid B. Larson y Gunter Schlager nos han proporcionado valiosas observaciones en el borrador de este libro. Estamos agradecidos también a Edwin Bryaru. Dav.. id Fisher, Koichi Fujü, John Kishpaugh y David Wool por la comprobación esmerada de la exactitud numéric~ de tablas l' esquemas. Nuestras esposas. Julie y Pat. nos han ayudado mucho en el trabaja d~ redacción. )' nuestra secretaria, Mrs. Ethel Savarese. ha sido imprescindible para conseguir la pue sta en prenso del manu scrito. Sto ny Brook. New York
Roben R. Soka l F. James Rohlf
Indice analítico
PRO LO G O
Capitulo
l.
VII I:"TRODVCCIO:-l I I 1.1 . Defini cione s 1.2. Desarrollo de la bi stadistica 1.3. Punto de vis ta estadístico
J
,-
Capilulo
'
LOS DATOS E:" BIOLOGIA , 2.1. Muestras y poblaciones ) 2.2. Variab les en bio logía 7 2.3. Ex acri tud v precis ión de los datos 9 2 ,4.. Va riab les derivadas 11 25. Distribuciones de frecuenc ias 13 2.6. El trat amiento de los d aros 22
Capítulo
,.
20 ESTA D ISTICA D ESCRI PTI \ A 2i :>.1 . La medi a aritmét ica 29 .> .- • Otra s media s 30 3.3. La med iana 32 3A. La moda J) 3.5. El rango H 3.6. La des, iación npica 30 3.7. Estad ísticas de muestras ~ paramet ::, 3~ 3.8. Codificación de dato) antes del cal.. u 3.9. M étodos pracricos para ca cuiar la ml.:JI8 )' la desv iacron t1p11..3 .t ·0 3.10. El COCfICIl.:ntC J o. vana.. n
•
-,
'\ 1
Indíce analítico
XII Capítulo
4.
INT ROD UCC i Ó N A LA S DI STRIBUCIO NES DE PROBA BI LI D A D: BI NOMIAL Y DE PO ISSON 46 4.1. Probabilidad. muestreo al aza r y co ntras te de hipó tesis 4.2 . La di stribución binomia l 53
4.3. Capitu lo
J.
5.3. S.,¡. J,J .
6.
Ca pítulo
9.
47
63
9 .2.
Deducción de la dis tri bución norm al 75 Propiedades de la d istribución normal 78 Aplicaciones de la distr ibución no rmal 82 Desviaciones de la norma lidad y métodos gráficos
ESTIMACiÓN Y CO, ' T RAS T E D E HIPÓT ESI S
6.1. Distribución y varianza de medias 9t 6.2. Distribución y varianza de o tras estadísticas 99 6.3. Introducc ión a lími tes de confianza 6.4. Distribución t de Student 103 6..5. Lim ites de confia nza basados en estadísticos de mue streo 105
9.3 . Ca pítu lo 10.
84
90
Capítulo 11 .
La di stribución ji-cuad ra do 108 6.7. Lím ites de confia nza p a ra va r ia nzas 111 6.8. Introducción al cont ras te d e h ipóte sis 112 6.9. Prueba s de hipótes is si m p les q u e ut ili za n 123 la d istribución I 6.10. Contraste de hipótesis 11 0 : '7 1 = '702 126 7
¿L
SU PUESTOS T EÓ RI CO S DEL A NALlSIS DE LA VAR IANZA 204 10.1. Los su pues tos teóricos del análi sis de la varianza 10.2. T ransfo rmacio nes 208 10. 3. Métod os no para métri cos cn luga r del a nálisis 212 d e la varianza
INTRODUCC iÓN AL ANA LI S IS DE LA V A R IAN Z A 131 7. 1. La s varia nzas d e mu estreo y sus me d ias 7.2 . La distrib ución F 13 5 7.3 . La hip ótesis H f): '7 12 = 140 7.4 . H eteregone idad e n tre me di a s d e mue streo 140 7.5. D escomposición d e la su m a d e cuad rados to ta l y los grados d e liberta d 148 7.6. Aná lisis de la va ria nza , model o 1 152 7.7. Análisis de la va r ia nza . mo d cl o 11 155 A. ALl SIS DE LA VA R IAN Z A D E C LAS IF IC A C i ÓN S IM PL e 1;) 8. 1 f órmula. para cl cálculo 158 1')9 8.2. Igual n 8.3. Diferente ti 162 8.4. Do grupo. 16'5 ti. ') ComparélClvnc entre med ias: tests a priori 170 l:S 6. lompilra¡,;uJOc entre medias: pru eb a s (J no stenorí
REGR ES iÓN 220 11.1. Intro d ucció n a la regresron 221 11.2. Modelos en regresión 222 11.3. Los cálculos básicos (u n solo }' para cada va lo r d e X) 224 11.4. M ás de un valor de Y para cada valor de X >-9 11. 5. Pru eba s de significación en regresión 247 I 1.6 . Las aplicaciones de la regresió n 249 I I.7. T ransfo rmaciones en regresión
-,
Ca pítu lo 12. 130
'7i
Capitulo
Análisis de la varianza d e clasifi caci ón doble con répli ca 182 Análisis de la varianza de clasificación d oble: prueba de signi ficación 192 Aná lisis de la varianza de clasificac ión doble sin réplica 194
205
97
6.6.
Capítulo
XII I
ANA LI S IS DE LA VAR IA NZA DE CLAS IF ICAC iÓN D OBL E 181 '
9.1.
LA DISTRIBUCIÓ;-'; DE PROBA B ILI D A D N O R M A L 73 73 J- . I . Di stribuciones de frec ue nc ias de va riables cont inuas J- ._J .
Capítulo
La distribución de Po isson
Indice ana/i tico
Ca p ítu lo 13
A PfN D IC ES
CO R RE LA C i ÓN 256 12. 1. Co rrelació n y regresión 256 12.2. El coef icien te d e corre lación product o-momento 12.3. Prueba d e signi ficac ión en correlación 269 12.4. Apl ica ciones de la correlación 273 12 .5. Coe ficiente d e co rrelación por rangos de Kcndal l ANA LI SI S D E FR ECU ENC IA S 282 13.1. Prueba s d e bondad de ajuste: int rodu cción . 28 3 1-J. 2 . Prueba d e bondad de ajuste de clasificaci ón srmpd1e 13.3. Pr uebas d e in depen dencia : tabl as d e doble entra a
300 Apéndi ce 1. Apénd ice matemá tico 311 A pnd ice 2. T ab las cstadislicas
BIBLIOG RA F IA
])3
IND ICE A LF,\ BtT ICO
17;
233
357
27 5
290 292
CapItulo 1
Introducción
Este cap ítulo inicia el est udio de bioestadística. En principio se definirá este campo en si (sec ció n 1.1) . Luego se revisará b reveme nte su desarrollo histórico (sección 1.2). La secció n 1.3 concluye el cap ítulo co n una d iscusión sob re las aportacione s que la persona ad ie st rada en esta díst ica hace a la invest igación biológica.
t .1 Definiciones
Se define la bioestadisrica como la aplicación de métodos estadistícos a la solución de problemas biológicos. Tamb ién se le llam a estadisttca biol ógica o biometria. No se puede co m prende r bien la defini ción de b ioestadística sin definir p reviame nte la " estad íst ica" . Es una ciencia cuyo nom bre resulta familiar incl uso para el no profesional. El número de d efin icione s q ue se pued en enco n trar está limitado solamente po r el número de libr o s que se desee co nsulta r. En su mod ern o sentido se p uede defi nir co mo el estud io científico de dato s numéricos basados en f enómenos naturales. Tudas la s parle s de esta definició n son impo rtant es y merecen resaltarse. Estudio cient ífico: se co nside ra de gran interés el comúnmente aceptado crite rio de validez de evide nc ia científ ica. La obje tiv idad en la presen tación y evaluación de datos, y el cód igo ético general de metodología cien t ífica deben tene rse en cuenta co nstantemente para no de spertar el viejo bulo de q ue " los número s nunca engallan, sólo lo s estad ís ticos lo hace n". Da tos: la esta dística trata gene ralmen te de poblaciones o grupos de individuos; por lo tanto, maneja cantidades de info nn ació n, no un simple dato. Así. la medida de un 5010 animal o la respuesta de una sola prueba bioquímica generalmente no serán de interés. Num éricos: si los datos de un estudio no pueden ser cuant ificados. no serán tratables po r análisis estadísticos. Los da tos num éricos pueden ser,"medidas" como la longitud o anchura de una estructura o la can tidad de una sustancia química en un fluido corporal, o SOKAl- I
I
IntroduCCión
2
"" corno el número de- cerd as o el número de d iente s. La s diferente s clases de . 1 .. . bies serán dix-utidas con detalle en el caprtu 0 ._ vana . rural: se U$.1 este t érmino en sent ido amplio . incluyendo lodo s aquellos Ft'raJ meno M ..,. . . . . ' I . "en en la naturaleza animada e inanimada sm e co nt rol del hombre v eventos_ que ocu .._.' .' como en Un adema"s.. aque00s alcanzaron una importancía creciente especialm e nte e n Inglaterra . p aís que prosper~ dura~te el desarrollo de su imperio. John Graun r (1620-1674 ) y William Petty (l6_~.168 ) fueron los pioneros de la estadística v o tros sigu ieron su línea. b Prácucameme al mismo tiempo se desarrolló la segu nda -raíz de la es ta d ís tica moderna: da~T1a matemática de !a probabilidad . nacida del inte rés por lo s j uegos de aza r entre las !Ie:~comoda as de la epoca . A esta teoría hiciero n apo rtaciones im port an tes lo s trance-
:ulli Ce
;76~~~ 06,3,166'1
Y Pene d. Fermat 0601-1665)" Un suizo. Jacques Ber05). puso los ctrmentos de la moderna teoría de p robabilidad en Ars
r-';~«. ',andl"IPUbhC¡do
después de su muerte . Abraham de Mo ivre ( 1667. 175.H. francés ..... n e en ngl.¡terra fue I . e probabilidad . e primero en co mb inar ~a estadística de su época co n la teon a apr mar b en - resolvendo problemas de anualidades. De Mo ivre fue el primero en 1 n e ·m 10 portante d nbuClOn normal por expansión de la binomial. _ posterIOr paT1 el desanoUo de la estadísltca su rgIÓ de la astronomía. en la ¡¡ \tf\'aclOnel mdlvdu¡Jes tenían que hacer~ encajar en una teo ría coheren·
Introdu cción
3
te. Entre lo s líd eres e n este ca mpo se cuentan astrónomos y matemáticos famosos del siglo XV III . tales co mo Pierre Simon Laplace (1 7-l9·1 S':7) en Francia y Kar! Friedrich Gau ss (1 77 7·1 8 55) en Alemania. l a última aportac ión a la estadística es el método de m ínimos cuadrados. que se tratará en posteriores capitu las de este libro . Se cree que el prime r person aje importante en bioestad fsrica fue Adolphe Quetelet (1 7Q6-I S7-l). astró no mo y matemá tico belga. q ue en su trabajo combi naba los m étod os te órico s ~ p ráct ico s de esta d istica ~ los apl icaba a problemas de biologí a. med icina. y sociología. r\ Francis Galton ( 18'::·1 911) primo de Charles DaN in. se le denominó padre de la b ioestad íst ica y eugenesia . dos materias que estudió in te rrelacicnadame nte. Lo imperfecto de las teor ías genéticas de Darwin estimuló a Galton para intentar resolver los problema s de herencia. La rnay or contribución de Galton a la biología es su aplicació n de la metodología es tadística al análisi s de la variació n biológica . aSI como el análisis de variabilidad y su estudio de regresión y correlación en medidas biológicas. Su esperanza de aclarar la s leyes de la genética por med io de est os procedimientos fue e n vano . Empezó co n el material má s difícil y con suposiciones erróneas. Sin embargo. su metodología fue el fundament o para la aplicación de la estadística a la biolog ía. Karl Pearson lI 8S-·1936). e n el Universitv Colleee de Londres. se intere só por la aplicación de m étodos estadisucos a la biología. particularmente en la demostración de la selección natural. por influencia de \\" .f .R. weloon (186()'1 (06). zoólogo de la misma institución . A Weldon se le ha atribuido incidentalmente la creación del término biometr ia para el tipo de estu dios a que se dedicaba. Pearson continuó en la tradición de Galton y sentó las bases para gran parte de la estadística descripti..'a y de correla ción. En este siglo la figura dominan,te en eS13dísti~a v biometr ia ha sido Ronald A. F isher t 189Q-196:). Sus muchas aportaciones a la tecrra ~stadística serán ob..-ias incluso para el que hojee por en cima este libro. . . Actu alme nte la estadística es un campo amplio y extremadamente acuvc cuyas aplicaciones co ncierne n a casi todas las ciencias e incluso a los estudios de humanidades. Constan temente se están encontrando o tras y nadie puede p redecir de que rama de la estad Istlca surgirá n nuevas aplicaciones a la biología.
1.3 Punto de ..-is ta esta díst ico La crecien te importancia y apli cación de la e S~Jd lst ic3 ~ los ~Jtos biol ógicos es e":ident~ incl uso al exam inar de pasada cualquier re..-rsta de bl~logl~. __ Por que ha habido u. incremento tan m arcado en el uso de la estadística en biclogfa? .\ pa.rt n ~eme n te ha SUrgl~ -- d que en biologia la acción reciproca de ..'ara bles de caUS3 ) d o por Ia comp ro b acjon e . .. . lo XL' E re uesta obedece a leyes que no están en el modelo clásico de la f ísica del igro . - n e sigl b¡_1 • Robe n Maver, Helmh oltz. y otros. tratando de demostrar que !?S ese SI o. 10 ogos como .. _ . .. . d ron 3 ·rear la ímpresscn . •• . tSmenos ItSl("V\Ulmll.'OS. 3" U a l. p rocesos biol óaicos no eran SIDO enom " ~"1 '. reducid . ... al . la fJ.Iosofía natural que hablan p UCI o un prog~e de que los m étodos experunent en biol - ra. . . es) f' . deber . ian ' r umitados plenamente ;u.. so tan espec tacular de las ~1~~CLaS meas. d vista fue confundida con el movimiento Lamentablemente. la oposlclOn a este punto e vi talis.ta. que condujo 30_ ~eorías LmP.roducti..-aS. hasta entonces la rradjc íón de conceptos ido A SI pues. muchos_blOlogos hab~an . ~anten detemunisu,s. mientns los fisiros.. debido 3 de pensamiento estTlctamente mel.3mCIS ta S )
4
IntrodUCCión
s '"elementales" , recurrie. que sus ciencias eran más refinadas y tra taba . n co n partícu • las má r lantcamientos estadísticos. En bio logfa la mayon a de Jo s reno meno s se ven afe ctados rcn amuchos p " ion ". y, a me nu do no id ifi factores causales inco nt ro lables en su vanac o no J entl lcab les. ~estadística es necesa ria para me dir" tales feno. me nos vana" bl es co n un error p re decible " La y ara descubrir la realidad de mínimas pero importan tes diferencias. P Una mala inte rp retación de estos pr incipio s ha llevado a algunos biólogos a pensar que, si las diferencias inducidas por un experimento u observadas en la natu raleza no SOn tan
Capítulo 2
grandes como para poder ser ap reciadas ~or s~ ple inspección (y por tanto, sin .ne~s id ad del análisis estadisucoj.nc vale la pena investigarlas. Hay pocos campos autenticng de
investigación en los que la estadística sea innecesaria debido a la naturaleza del fenómeno estudiado. Debe ría subrayarse que el pensamien to estadístico no es realmente de diferen te tipo que el pensamiento científico disciplinado ord inario, en el cual t ratamos de cua ntificar nuestras observaciones. En estadística exp resamos nuestro grado de co nfianza o desconfianza como una probabilidad, más que como un a vaga afirmación general. Por ejemplo, los biólogos hacen habitualment e afirmaciones de que las especies A son más grande s que las B, o que las hembras se encuen tran más frecuentemen te e n el árbo l M que en el N. Tales afirmaciones pueden y deber ían expresa rse más precisament e en fo rma cuantita tiva. En muchos aspectos, la mente human a es una máqui na estad ística ex traordina ria que absorbe muchos datos del mundo ex terio r, digiriéndolo s y arrojá ndo los en forma resumida. Sabemos por experie ncia que cie rtos sucesos ocurren con frecuencia y o tros raramente. "Un homb re que fuma" es frecuente mente observado, " un hom bre que resbala en una piel de plátano" es raro. Por expe rie ncia sabemos también qu e los japo neses son más bajos que 105 ingleses y que los egipcios son más moreno s que los suecos. Asociam os trueno con relámpago casi siempre, moscas con basura frecuentemente en veran o, pero es extremad amente raro asocia r nevadas con el desierto meridional califo rniano. Tales conoc imie ntos nos llegan como resultado de nuestra experiencia en la vida, tan to d irect a como indirectamente a través de ot ros, por comunicación direct a o por med io de la lect ur a. Todos esos datos han sido procesados por el ce rebro humano, extra ordina rio comp utador q ue pro. porciona un resumen. Este resumen se rev isa co nstantemente, y aunque ocasiona lmente dc.fectuoso y equivocado, en conj unto es sorprendentemen te bueno ; es nuestro conocímiento del momento. . Aunque la estadística apareció para sa tisfacer la s necesidades de la investigación cientíñca, la evolució n .de su me todología afec tó a las ciencias a q ue se aplicó . Así, po r un pro~!() ~e retroalImentación positiva, la estad ística, creada para se rv ir las necesidades de l~, ciencias na turales, ha afectado a la filosofía de las cienci as bio lógicas. Para ci tar un CJemp.lo : el análisis de la varia nza ha tenido gran efecto influenciando en los tipos de expenmentoj real izados por los in vestigadores; toda la ge nética cuantitativa uno de cuyos problemas el la separació n de efec tos ge néticos y ambient ales cuenta co n análisis de la vananza , y mucho, ' .' , , ro ncep t 01 de ge néuca cua nt "ita tiva han Sido elabo rados dire ctamente en torno al análiSISde la varianza.
;1
Los datos en biología
En la sección 2.1 expondremos el significado estadístico de los términos "muestra" y " pob lación" que seguire mos utilizando a lo largo de este libro. A co ntinuación entrarema s en los tipos de observaciones que obtenemos del material de investigación biológica, con los cuales realiza remos los diversos cálculos en el resto del libro (sección :!.2). El grado de exactitud necesario para la toma de datos y el procedimiento para redondear,los número s se discutirán en la sección 2.3. Entonces ya estaremos prepa rados para considerar en la secc ió n 2.4 ciertas clases de datos derivados, frecuentemente utilizados en biología, tal es como razones e índices, que representan prob lemas peculia r.es ~on ~e spect o a su exactitud y di stribu ción. Es importante sabe r ordenar los da~os en ~..stribucicnes de frecuencia s, porque tales ordenaciones nos permiten saca r una Im.rreslOn glo.bal. de .su aspecto ge neral y presentarl os para procedim ientos de cá lcu.l~ post efl ~re s.. L~ s dlStf1b u~I~ nes de frecuencias así como la pre senta ción de datos numencos se d lsc~t l ran en la proxIma sección (2.5) de este capítulo. Por último, en la sección 2.6 describ iremos breveme nte el trat amiento de los datos para el computado r.
2. 1 Muestra s y pob laciones
. ' . rios pa ra una compre nsión de Vamos a definir aho ra varios termmos ímpc rtantes ntce~ t basan en observaciones los datos biológicos. En bicestadistica. genera lmente os la os .~ u d de muestreo . didas tomadas de a mlnuna unlUa . individuales, que son observaciones o me l • . nidades de muestreo son tarn. . nte estas mIOmas u Con frecuencia, pero no ~ece~J1~m.e udi . S· esarnos 100 ratas, el peso de cada b ién ind iv iduos en el sen t ld~ biol ógico or 1~~IO ·I~rataSjUnlOS represe ntan la muestra rata es una obse rvación mdivjd ual; los pesos ~ as d obsenaciones índívíduates selecciode observaciones. que se defi ne c0".'l0' un conJunro e lo una observación índivid ual está í liadas por Ufl procedim ",uenro e.specifico .,, ~ , En este ejernp , 5
6
Los da tos en biol ogia
individuo en se nt ido bio lógico. esto es, u na rat a ; sin emba rgo, si h ub iésemos un d basa a en . ' d de fi 1 estudiado el peso de una sola rata a traves de u n peno o . e tie mpo, a muestra de observaciones individuales esta ría constitu ida por lo s pesos registrados e.n una sola rata en ntos sucesivos. Si deseamos medir la temperatura en u n estud io de co lo nias de
~:;'~gas
en el que cada colonia es una unidad básica de muestr~o. la
te~peratura
de cada
olonía es una observación individual y la muestra de observaciones esta formada por las
~emperaturas de todas las colonias c~nsideradas. Si, aceptamos que una e~~im~ d~1 ~Onteni.
do en DNA de una célula espe rm ática de mamffe rc es una observación individu a] . la muestra de observaciones puede estar constituida por las est imas del conte nido en DNA de todas las células esperm áticas estudiadas en un mamífero. Un sinónimo de observa. ción individual es ítem: Hasta el momento hemos evitado cuidadosamente especifica r qu é variable particular se estaba estudiando. porque los términos "observación individual" y "muestra de observaciones". tal como se han utilizado anterio rmente. sólo definen la es truc tura pero no la naturaleza de los datos en un estudio. La propiedad real medida por las observaciones individuales es el carácter o variable En estadística ge neral el térm ino más empleado es variable; sin embargo. en biología se utiliza frecuentemente como sinónimo la palabra carácter. En cada mínima unidad de muest reo puede med irse más de un carácte r. Así, en un grupo de ~ 5 ratones podemos medir el pH de la sangre y el número de eritrocitos. Cada uno de los ~ 5 ratones (un individ uo en se ntido b io lógico) e s la m ínima unidad de muestreo: el pH de la sangre y el número de células roja s serían los do s caracteres estudiados: las lecturas de pH y los recuentos de células son o bservacio nes individuales, dando lugar a dos muestras de 25 observacio nes o una mue stra bivariada de 25 ob servaciones, cada una de las cuales se refiere a una lectura de pH asociada co n un recuen to de eritrocitos. A continuación vamos a definir población La definición biológica de este térm ino es bien conocida. Se refiere a todos los ind ividuos de una espec ie de terminad a (o tal vez de una etapa del ciclo vital o de un sexo dete rm inad o) que se encue nt ra n en un área limitada en un mome nto dado. En estad ística, pob lac ió n se define como la totalidad de observa-
ciones individuales sobre las cuales se hacen inferencias. las cuales existen en cualquier parte del mundo o al menos dentro de Ufl área de muestreo claramente especificada, limitada en espacio y tiempo. Si se toma n cinco ho mbres y se estudia el número de leucocitos en su sa ngre pe riférfca.con la intenció n de sacar co nclu sio nes sobre todos los hombres a parti r de esta muest ra de cinco, en este caso la población de la qu e se ha extraído la muestra representa los recuento s de leu cocitos de tod o s los varon es de la especie lIomo sapiens: En cambio, si se restringe a mue st ra má s est rechame nte especificada, como por ejemplo cinco varones chinos de 20 año s, limitando las conclusiones a este grupo particular, la población muestr eada estará constit uida por los número s de leu cocitos de .todos los va rones chinos de 20 afias. En este se ntido estad ístico, la población se denomina a veces universo Una población puede referirse a va riables de un co njunto COncreto de objetos o individuos como.po r ejemplo. las lon gitude s de la co la de todo s los ratones blancos del mundo, los recuent os de leu cocit os de tod os los varone s ch inos de ~O anos. o el contenido en D ~ A de todas las células espe rmáticas de ham ster: o bien puede refe rirse a result ad os d e expenmentos . . de latido . s card iiacos tales como las Frecuencias producidu en cobayas por inyeccio . .nes ' de adrenalina. . ~. En los pnm ero s casos, la pob 1aCI·6 n
Los datos en biologia
7
es ge neralmente finita; aunque en la pra ctica seria imposible obte ner, contar y examinar todas las células espermáticas de hamster, todos los varones chinos de 10 anos. o todos los ratones blanco s del mundo, estas poblaciones son en realidad limitadas. Ciertas poblaciones mas peque ñas tales como todas las grulla s de una espe cie determinada de Nortearn érica o todos los geómidos de una colonia determinada. pueden so meterse perfectame nte a un censo total. En cambio , un experimento puede repetirse infinitas veces (al menos en teoría). Así por ejemplo, la administración de adrenalina a cobayas podría repetirse mientras el experimentador pudiese obtener material y su salud y paciencia resistiesen. La muest ra de experimentos realmente realizados es una muestra de número infinito de experimentos que podr ían realizarse. Algunos de los métodos estadísticos que se van a desarrollar posteriormente distinguen entre muestreo de poblaciones finitas e infinitas. Sin emba rgo, aunque las poblaciones son teóricamente finita s en la mayor parte de la s aplicacio nes biológicas, generalmente son tan ~peri~re~ ~ la s muestras extraídas de ellas, que de hecho pueden considera rse como poblaciones infinitas.
2.2 Varia bles en biología Cada disciplina bio lógica tiene su propia serie de varia~le s que ~uede incluir meJida.s mor fológicas conve ncionales. co ncent racione~ de su~tanc las en fluidos corporal~ s: velocidades de ciertos proceso s biológicos. frecuencias de ~Iert.0s. su:esos, com~ e~ gen~t.l_ca y en biología de las radiaciones, lectur as físicas de maqumana aplica o electr ónica utilizada en . I investigación biológica, y otras muchas. Ya hemos hecho referencia a variables biológicas de un modo general. pero aun no las hemos definido. Definiremos una variable como una propiedad ~" respe~to a ÚJ cual. os individuos de una muestra difieren de algUn modo verifícab íe: SI la propiedad no dlfl~~e dent ro de una muestra que tenemos a mano, o al me ~os entre la s muestr?s que : ~~ an~ . d d lnter és estadístico. Longitud. altura. peso, numero e le est udiando,. no pue. e ~r e 1 enoti os so n ejemplos de variables en grupos de crganistes, contenido en vítamma C Y g,. P " diferentes No lo es en cambio. la horneoterdi 'os genética y fenct ipicarne n e l · ' . . ma s or man ' . on todos iguales a este respecto. pero SI sena mia en un grupo de mamlferos, puesto que S if . 1 1 tu ra corporal de marr n eros. naturalmen te una variab e a temp er? . " Podemos div id ir la s variables biologlcas como sigue :
Variables Va riables medible s Variables continuas Variables discontinuas Varia bles c1asificables en rangos Atr ibutos
, s diferentes valores pueden expresarse ~e Variables medíbíes $On todas aquellas dos clases. Las primeras. llamadas )'anaJ Pueden ser de d forma numéricamente or ella a. lO CU.
I (J S t. deseable (explicada en la 6.1 j: te nderá a distnbuirse normalmente incluso 100 :;1'."rv aoorel datos_ ongutale s •no 10 estan. La media se ve marcadamente afectada por ob se . extran3.S: la mediana Yla moda no . Generahnente la media es más sensible a cambios enh
1; '7
~ción
fonTIa de biuna distribución de Fre cuencras - \ SI se ta es caro ' tener un e t ..di u lo; o q UC' re Il a media l-: quiere d . lO S puede ser recornend abl e l la 1me la. la mediana. v la mod d _.n ismbucone rrnetnca un d I id . _ • a son I enuc s. l:.1 uno a d conoC I a dís tnbucíón normal del capuu . Io li En a un mejor ejemplo de tU e Ia b len d como se p resenta en la figura 3.1.135 iciot a 1 rnbuci n a une mea npica t al son generalmente éstas: la media es la má o,nes relauv a de la moda medrana \ media la moda es la más lejana \ la med¡ n as. .proxlma al exuem e tirad de la dumbu I . . a a esta entre las d L ( , secuenCia es acordarse de que se prese _ na ~ rma f¡j¡C11 de rec rdar e ta ntan en orden altane¡ 1,:0 de el uem ma larg d e la distribución.
3.5 El ra n go
~
IO~
l
',e
-.. --
--e .::.---,;.:
"'~
~ I~ ¿
¿
,+ ~
l'l
n ::::
,
120
O
,I
•
10
:I
J
\,
12
,
11
:I ,
-- " , 1-- , o
:I \, :I
',-',- tO~
.~
o
\,
f' f-
I
f-
34
3.6
3,
4,0
O
I I
:I
:¡ :I, 4 .2
, 4 ,4
4 .6
4 ,8
5,0
f iI 3 1 O . Por centaje de grasa de la leche . .ra. la. rI uClon tu. 10' d de 1_ frece enctas a. ime í n ca íe51 u ada a la derecha) qut .. Idn 1Ie 1 dt'ben encontra rs -r . por lo tanto .q ue ." a de dispe rsió n es el rango. Es la di fe ren cia e n t re e l m ayor y e Una medIda sencill \ . el rango de los cuatro porcentajes de oxígeno apunt d 1 ~ a Os menor ítem en una .n:ue~strJ. n5 1. anteriorme nte (secrloo L l l es
Rango = ~3 ,3 - 10,8 = I ~ .s % •
y
el rango d e Ias 1o
neitudes de l fém ur de áfidos (cu adro 2 . 1) es ~
Rango = -,,7 - 3 .3 = 1,4 un id ades de 0, 1 m m . el arree es una medida de la ex tensió n d e las varia nte s a lo largo de la escala
puesto que esta t • " 1 El rango se ve ' iabl en las mismas unidade s q ue las medid I as o ng ma es. . ' de varta es.afectado incluso por un solo valor .alep claramente do, y por esta razon es solamente un es t
imador erosero de la dispe rsión de todos los rtems de la mu est ra. •
3.6 1.3 desviaci ón típica Una medida adecuada de dispersión tendrá en co nsideració n todos los iterns de una distribución. asignando a cada itern un valor relat ivo a su d istancia del ce ntro de la distribuc ión. Ahora trataremos de constru ir este estadístico . En la tabla 3 . 1 presentamos la distribución de frecuencias ag rupadas de las longitudes del fém ur de las hembras epemfcticas de áfidos del cuadro 2.1 . Las dos prime ras columnas mu estran las marcas de clase y las frecuencias. La tercera columna es necesaria para el cálculo de la media de la TABLA 3. !
Desviación de la media. Longitudes del fémur de áfi do s (del cuadro 2. 1), (J )
(f)
(8)
)'
f
f l'
.-
"" 4
2
" / ",
"",
4,0 4 ,,," 4/.
T t¡tAl
V
"
Y ~ I" -
6,k 2t1 /J 20 ,0 ~H , 4
,
2
'12
2'.,
I(XJ,O
>f!' >f
(é )
(j)
- 0 ,6 - 0 ,3 0,0
Y
0 ,3 II,G
fy
-3G,
Estadística de scriptiva
35
distribución de frecuencias (ver sección 3 9 . ·d.postenor). Es la marca de clase Y multiplicada por la frecuencia I. El cálculo de I longitud media de fé mur resulta se r : O,:eni~da:arece en la parte in ferior de la tabla. La S La distancia de cada marca de cla~ a Ia med:la se ca Icula como la desviación siguiente: y = y- y
Por convenio , cada. desviación individual ("del'iate")_ se calcula como 1a observaclOn . . IOdIVI.. . , 7" d.ual m.enos la media ) -:- ~ en lugar de la inversa. r - Y. Las desviaciones in dividuales se sunbohzan por letras m inúsculas correspondientes a las letras mayúscu las de las variable s. La columna .(4) de la tab~a 3.1 da las desviaciones in dividuales calculadas de este modo. Para ~omod l da d en el c~ lc~ lo . la columna se ha divid ido en desviaciones posit ivas y negativas. Ahora las desvlaclOnes.han de multiplicarse por sus respectivas frecuencias para que aquellas que se presentan mas frecuentemente contribuyan más a nuestra med ida de dispersión que las que só lo se presentan rara vez. Por esta razón multiplicamos las desviaciones individuales por sus frecuencias [. Los resultados de estos cálculos se exponen en la columna (5). que conserva la separación entre desviaciones positivas y negativas. Ahora nos prop onemos calcular una desviación medi a sumando todas las desviaciones individuales y dividiendo por el número de dichas desviaciones en la muestra. Sin embargo. cuando sumamos nue stras desviaciones. obse rvamos que las positivas y negat ivas se anulan , como se muestra en las sumas al fina l de la columna lS). Esto siempre es cierto para la suma de las desviaciones con respecto a la media. y está relacionado con el hecho de que la media es el centro de gravedad. Consecuen temente la desviación media también sería siempre igual a cero. Es recomendable estudiar el apéndice A1.1. el cual dem ue stra que la suma de la s desviaciones en torno a la med ia de una muestra es siempre igual a ce ro. Elevando al cuadrado las desviaciones ind ividuales se evita el que la suma de las de sviaciones en torn o a la media se a siemp re ce ro Y da com o resultado otras propiedades matemáticas deseables que consideraremos en una sección post erior. En la tabla 3.2 se present an de nuevo los datos de las longitudes del fémur de áfidos. Las columnas (1). (2) Y (3) son las marcas de clase, frecuencias y desviaciones. dete rminadas como se ha dicho previam ente. Las desviaciones no es tán separadas ahora en columnas posi tivas y nega tiv as . La columna (4) presenta sus cuadrados. los cuales so n. naturalmente. todos posi tivos. Finalme nte, la columna (5) presenta el cuadrado de las desviaciones multiplicado por s~ s frecuencias es deci r columna (4) multiplicada por columna (2) . la suma de estas desvíaciones elevad as al cuadrado es 2.88. Esta es una cantidad muy import ante en estad ística. que para ab reviar se denomin a sum a d e cuadrados y se simboliza por ~y.: . En ~ 3 tabla 3.2 . la suma de cuadrados se simboliza por ~fl' l pero habitualmente se omite la/ puest o qu e ~ indica suma de todos los items posible s. Otro súnbolo ordinario para la suma de cuadrados es SS tsum 01 squares ). . El próximo paso es obte ner la media de las fl des~'i~.;iones .al cuadrado. La can tidad que resulta se conoce como varianza o desvíacíón cuadraf¡ ca media. ' y2 :!" _'1 Varianza = -.,.-n
-
= ~
_~I
= 0 111.'-
Estadística descript .
IVa
36
. es una medida de fundamental importancia en estadística y la utilizare La vananza . ' d mOl a lo largo de este libro. De mom~n to solo necesnamos r~cor ar que p or haber elevado al cuadrado las desviaciones. la vananza se exp resa en unidades .a l cuad rado. Par a Contra. rrestar el efecto de elevar al cuadra.d? extraemos ahora la rarz cuad ra da p osit iva de la \arianza Y obtenemos la aesviacion npsca:
+ /LY!
Desviación típica =
\
n
= 0,339-1
Lna desviación típica se expresa asimismo en, l~s unidades ~e med ida origina les. puesto que es una raíz cuadrada de las unidades cuadráticas de la vananza. vota importante: \'0 utilizar la técnica recién ap rendida e ilust rada en la ta bla 3 .~ pan el cálculo manual de una varianza y desviación típica. Esta técnica es excesivamente tediosa.
Es posible que el lector haya notado que hemos evitado asignar símbolo alguno a la varianza y desviación típica. En la próxima sección explica remos porqué.
TABL"'- 3. :
La desviación tipica . Método largo no reco mend ado para cálculos rea les.pero presentado aquí para ad arar el significado de la desviación típica. Datos de la la bia 3. 1.
(J,
(2)
r
f
(8)
y
-,
-06 ,
o
3,4
3,7 4,0 4,3
r-f
~
(.5)
y'
f y' U - .,
5
0,0
Ó o
0,3
0 ,.% 0 /19 0/.10 O,W
0,6
O, ~J6
- 0,3
-
-l l i
W
-
" 0-"
.,
T IA.al
"-
Op O
0,i2
-
0 - ')
"
Estadistica de s criptiva
37
las 25 longitudes del fém ur es O.3394 unid ades cuandoo los . os ¡nems se agrupan c h amo se a expuesto. S¡n embargo, en biolog ía (o en esta d istíca en ene nos interesan medidas de localización y dispersión excl g. ral a este respec~o, . rara ve7. .. d 1 uuvamente como resúmenes desCriptiVOS e as muestras que hemos estudiado Casi sie 1 . han ext rai . 1 mpre nos in te resan as poblaciones de d¡ 1as que que . conoce r no es la di se án ext raído las' muestras . Por lo tanto ,lon o s gustarla me, la e os cuatro porcentajes de ox ígeno, sino el verdadero porcentaje de oxígeno del universo de lecturas han extraído estas cuatro. Igualme nt e, nos gustarla • sa b er . ddel cual .se. la verd adera 1ongn u ~edla del f émur de la población de hembras apomícticas de áfidos, n? sol~~ente la media de los 25 individuos que hemos medido. Cuando estudiamos dls~ rs lo n, generalmente deseamos conoce r las verdaderas desviaciones t ípicas de las poblaCIOnes. y no las de las mues,tras.. Estos estad ísticos de población, sin embargo, son desconocido s Y (hablando en terrrunos generales) imposíbles de conoce r. ' Quién se ría cap~ de co~e r todas las hembras apom icticas de esta población de áfidos(, particular y medirlas? A SI pues, necesitamos utilizar estadísticos de mueJlra como estimadores de estadísticos d e población o parámetro s. En estadística es co n ve ~c.io n a l utilizar letras griegas para parámetros de pob lació n ~ letras romanas para esta dísticos de muestra. De este modo, la media de la muestra Y estima la media param étrica de la población, 1J- , Igualmente, una varianza de muestra, simboliz.ada por S2 , estima una varianza paramétrica, simbolizada por o] _Estos estim adores deber ían se r inseszados. Con esto queremos decir que las muestras (independientemente del tamaño de muestra) extraídas de una población con un parámetro conocido, deberían dar estad ísticos de muestra que por t érmino medio diese n el valo r paramétrico. Un estimado r que no cumple esto se dice que es sesgado. la med ia Y de una muestra es un estimado r ínsesgado de la media param étrica 1J- . En cambio, la varianza de una muestra calculada como hemos visto (en la sección 3 .6) es sesgada. Por lo general subestim ará la magnitud de la varianza de la población 0 2 _ Para superar este error, los estadísticos matemáticos han demostrado que al dividir las sumas de cuadrados por n - I en vez de por n, las varianzas de muestras resultantes se rán estimadores insesgados de la varianza de la población , Por esta razón , es habitual calcu lar varianzas dividiendo la suma de cuadrados por n _ 1, La fórmula de la desviación típica se da pues habitualmente como sigue:
2 ,>sS
2~
8
y = 4,O Varianza • ..f
•
15)
Muestras de poblaciones normales. Ut ilizado cuando e v < 15.
'1n
6.3 Introdu cción a límites de confianza id
tales como las medias o las
. rsos est adísticos de muestra que hemos, obtems de o. població n IJ. o o. respecr¡rvalo s dive
deSViaciones típicas. so n est imadores de los ~~r~~~st OS estimadores. En pnmer I~gar ment e. Hasta aho ra no hemos discutido la fiabJlld . dores no sesgados de los pararnedeseamog sabe r si los estad "ísu cos de muestra " son, 7 estima - m,pIo que r fies blun Pero saber por eJe tros de población como se discutió en la secclOn - ' - , hallar hasta que pun to es la e . • e: . 'os gusta rla rrnanecen estnnador no sesgado de JJ no es suficiente- 1 'metrOS casi siempre pe . d . una medida de p . Lo s verdad eros valores d! blolSdPda r~e un estadístiCO muestral fga n o de· . s la lla l l a o I ~O~oC ldos y ordinariamente esoffiam aSO in frecuente e !Imites de confian za. carnes a comenzar con el cocidas IJ. \ o. Para iniciar nuestra dtscusi ón de este a s~nt o . ica paramétf1cas son con . . de u . d ,',-ion tlpl'" na pobla ción cuya media Y eS'I'"
Estimación Y con tras te d e hipótesis 100
La media de una muestra de 11 ít ems se simbo liza por Y. El error típico respect1\'amen e. . I di , I es rado de la media es a/"¡¡;. ('o ~o hemos VIS,t? , as me ras estar án norma ~ente distri. ped Por 1o tan. to según la sección 5.3 la regio n desde 1,96a/vn por debajo de u has" bwas. rias d e mu estreo d e tamaño - 11 Otn~ e 'una de " incluye el 95' % de las medias I 96 a/ V" por nc ~ , -, e . forma de establecer esto es considerar la razon (l - .p )/(a/v ll) . Esta es la de sviación . . d a media de muestreo respecto a la media parametnca. Puest o que están trprca e un .' . . h II . almen te distribuidas. el 95 % de tales desv iaciones trpi cas se a aran comprendidas ~~: - 1,96 Y + 1.96. Podemos expresar simbólicamente este enunciado como sigue: ,
t
P { -1 ,96 <
r -í:~ < +1,96 } = 09, o"
u/ '
11
Esto significa que la probabilidad P de que las medias de muestreo r difieran de la media paramétrica JI en no más de 1.96 errores típicos a/..jíi es igual a 0.95 . La expresión entre corchetes es una desigualdad. en la cual todos sus términos pueden mult iplicarse por (J/\ (,¡ para dar { - 1,96u/ v';; < (l - ~) < + 1,96u/ v';;}
-
Podemos vol.. .er a escribir esta expresión como
{ - 1,96u/v';;
< (~ -
l')
< + 1,96u/'í,;}
porque - Q ' " b '" o implica ~e o ;¡¡. - b ~ - o. que puede escrib irse como - o '" - b ~ Q. Y finalmente podemos pasar - r al otro lad o de los signos de desigualdad lo mismo qu: en una ecuación podría pasarse al otro lado del signo igual. Esto da la expresión final deseada :
P
{r _ ' 1,960 < v';; -
< Y + 1,96U} = ~v';;
0 9"
,~
(6,4)
o
p {r - 1,960 y
, o
1
Z
3
I
5
;
8
9
10
11
x'
Fig, 6.9. Cu rv as d e frecuencia de la d istribución X~ para 1, 2, 3 y 6 grados de libertad.
la distribución ji-cuadrado es una fun ción de de nsidad de probabi~ida~ .cuyos valo.res mían desde ce ro hasta el infinito positivo. Así, a diferencia de la distnbuclon normadl 1" . . ' . I . h izontal sólo en la cola derecha e a la función se aprox ima asmtottcamente a eje on ~ li d .' que describe curva no en ambas colas. La fu nción escn Ia dirsI níbució n .~ 2es 'comp teah 3. y no ' di t ibuci ón '( SIO O que ay una se ex pondrá aqu í. Co mo en t , no hay sola mente una IS n 1 f ,. del d lib d Por lo tanto \ es unción distribución para cada número de grados e 1 erta f . d de'ns','d3d de probabili. . La c: 69 muestra unciones e numero de grados de li bertad !J. ngura o. d lib t d Nótese que las curvas son dad de las distribuciones X~ ~ara l. 2 .3 Y6 gradoS ~el~~t ;i~cipiO' pe ro más o menos
°
marcada me nte inclinadas hacia la derecha, en forma , P acercándose a la simetría para grados de libertad supeno.r.es'd des\;aciones tjpicas norma. lb ucron ,. Xl de una poblaClon . (l'i - P. 1/0 . Podemos ge ne ra r una distri .' d e1 ,1, operación . bl )' «rrnetten o a ah Ies, Se recordará que tipifi camos una va na e i ,, _ r. _ p) o. Lmaginemos . ~.ra Vamos a simbolizar una variab le tipificada por ~ ! - l I al con media p. Y deS\l3C10n muestras repetidas de 11 variantes r, de una poblacl~n nonn·, en" ( coma hemos defulido l' . cada variante l I ' .. mo una Iplca o. Pa ra cada muestra transformamos d esrra se dislribulf3n ro .. • más arriba. las cantidades ~ )' }! cak ulJdas para ca 3 m)~1 "podemos \oher 3 esmblr l 1' d - . íó n de ' \'1 con 11 grados de libertad. Utilil.anJo la ehlllCI 1 ~ j COmo
r
(6,61
l
Otra d.i~ t.ri b ució n con t i n ~a de gra n importancia en estad ís tica es la distrib,u,ci611 ~~¡j~s (léase ti-cuadrado v. Necesita mos apre nde rla ahu rn e n relaci ón con la lIislrilHICltlll y \I n de confia nza de varia nzas.
ti
, (r , a'
L:
"l'
•
Estimación Y contraste
110
Cuando sustit uimos la media paramétrica
¡.J.
de híPÓtesia
por una media de muestreo en esta
.
eXpre_
sión. se convie rt e en 1 o --. " (Y, u. L-
y)'
. 'n Y contras te de hipótesis fsrímac lO
(6.;)
111
de confianza para varianzas
.. LiIJ'I.I t es 6.' vi é (n - 1)r tl d' "On anterior nernos eme s visto que la raz razon En b §tcet de libertad. Nos aprovecharnos de este hecho al fit:t I~t~buye como y con n _ 1 ~f1dos IJar lrnlte1 de confianza ¡ 1u
~~ r lugar podemos hacer la siguiente afirmación sobre la . ( En prilll< razon n - I)r a'
que es simplemente la suma de cuad.rados de la variabl e dividi.~a por una co nstante, la ..rarianza paramétrica. Otra forma comun de presentar esta expre si ón es
(n - 1)8'
(6~ )
u'
en la cual se ha reemplazado simplemente el numerador de la expresión 6.7 por n - 1 veces la varianza de muestreo, que naturalmente es la suma de cuadrados. Si fuésemos a muestrear repetidamente 11 ítems de una población normalmente distribuida. la expresión (6.8) calculada para cada muestra daría lugar a una distribuci ón jcon n - 1 zrados de libertad. . 'ótese que aunque tenemos muestras de " íterns, hemos • perdido un grado de libertad porque ahora estamos utilizando una media de muestreo en luear de la media paramétríca. La figura 6.5. una distribución de muestreo de varianza. tiene una seg nda escala en la abscisa, que es la primera escala multiplicada por la cons tante ( n - 1)';- . Esta escala convierte las varianzas de muestreo S2 de la primer: escala en la expresión (6.8 ). Puesto que la segunda escala es proporcional a S2, la distribución de la varianza de muestreo servirá para represent ar una distribución de muestreo que aproxima La distribución es marcadamente inclinada hacia la derecha como se esperaría en una distribución x' . Las tablas X2 convencionales, como se demuestra en la tabla IV, dan los niveles de probabilidad ordin aria mente requeridos y los grados de libertad como argumentos , y la ..¿ correspondiente a la probabilidad y a los gl como funciones. Cada ji-cuadrado en la tabla IV es el valor de a partir del cual el área bajo la distribución para v grados de
i.
x:
x:
libertad representa la probabilidad indicada. Lo mismo que hemos utilizado subíndices para indicar la proporción acumulativa del área así como los grados de libertad representarlos por un valor determinado de t , los utilizare mos para como sig ue : ¿ :.1 indica el valor X2 a la derecha del cual se halla la proporción Q del área bajo una distnbución ..¿ , para, grados de libertad. • Vamos a aprender cómo se utiliza la tabla IV. Al observa r la distribución de x~:: notamos que el 90 % de todo! los valores de X?2: estaría a la de recha de O,2Il ,.~ro solamente el 5 % de los valores serían superiores a 5,991. Los estadísticos matemaU~ han demostrado que el valor esperado de x'l., (la media de una distribución es igual a u grades de libertad 11 . Así el valor esperado de una distribución x~.s: es S. Cuand; examinamos valores del 50 % (las medianas) en la tabla observamos que generalrn en )fj mfenores al vaJo~ espe ra d~ (I~ ~di3Jl Así. para x~& el punto SO % es 4 .3 S I..Est~ dernue tra la iülmetrl3 de la d istribuci ón X • estand o la media a la derecha de la mediatU ~ 13 pr6 x.Jm2 sección se verá la prtmera aplicación de la distribución Sin embargo. SU utilidad verá en relación con el capítulo 13 .
x:
x: )
x: .
x: .
== 1 - a
esión es similar a la encontrada en la sección 63 e implica que la roo U",. ¡,a "pr . d dIal 1'·· • P a - 1_P ~ ... razón este entro e os v ores mute indicados de x' ,_ O",. 1_ ~ que .. ~.... . . . .. - . U , ; 7 LA umptll: ¡j!JlÍpulación algebraica de las cantidades de la desigualdad entre corchetes da p {(n - 1)8' /x ,",,( 0-'J < u' (O¡;lO (n -
1 ) s'
<
(n - l la' ·x'. - . T .•• •.' = 1 - a
(6.9)
: L •r ' , podemos simplificar la expresión (6.9, a
P{L y'/x.'.m:o - " < u' < L y'/ x',. • . :' - 'J
= 1- a
(6.101
Esu todavía pa rece una expresión complica da pero si~fica sen~ente que si ~ivj. 1i.1I05 la suma de cuadrados L y1 por los dos valores de X.:.. -1: que limitan I - Q.del ar~ íe la distribución X~" -1: , los dos cocientes encierran el verdadero valor de la varianza a:
conuna probabilidad de P = 1 - Q . , Un ejemplo numérico real aclarará esto. Suponga~os que tenemos una ~u~~a_~e ~. bnzitudes del ala de moscas domés ticas con una vananza de muestreo. d~ r hall ,)_. doe~ mos fijar límites de co nfianza del 95 % para la varianza par;mePrim ~nC3. calcuam~~ . ., (6 10 I rianza de muestreo s . ero nlor numerico de la expresro n . ) para .a va - 1 := 54 08. Después buscamos los la suma de cuadrados para esta muestra . 4 X 1.3.)_ . . . d fia nza del95 %. en _1 2 2 r ' Como se piden limites e con . meres para XO .02 ~~-l : y Xo 97.5,- l . . • .1 nos el 95 % del área bajo la este caso CJ: es igual a 0,05. Estos valores de x abarcan entre e 1 I'mites de la ex.presión curva X:. Corresponde n a 11,14 3 Y 0,484 . respectivamente. Y 05 1 (6.10) se convierte n entonces en L: ee ;4.0 " 0.454 y t. , = 54,08/11, 143 o • = 11 1."4 L v
i
l. , = 4 ,8 5
•
d "' qu< Ia.wanza Út . . o debemos ohiua.r J,Simi.e e mtervalo de co nfianza es muy amplio pero ademas que el intef\-a.1o es 105 leltreo está basada en 5 individuos solamente. 1 otest. contraposición respectO a al
?'
lrJco
o Esto esta. en . ros en torno en tomo a 13 52 la varianza de muestreo1 - ••Ie eran simetn ~" lo •• . ente . os ...-l"V1 s de conftanza encontrados anten Orm
....di .
1StICO
de muestreo.
Estimación y contras te de hipó/
t1 2
CUA UKU 6.3 - - - - - - - - -- --
-
-
-
-
-
-
Ión y con tras te de hipótesis
f 511mBC
eSI8
-.,
Límites de confianza para 0 2• Método de intervalos de confianza imparci31~ de mínima amplitud. Longitudes del fému r de hembras apomícticas de áfidos de los cuad ros 2.1 y 3.1 /1 ~ 25; s' = 0,1 337.
Los factore s de la tabla VII para v- n - 1 = 24 gl Y coe ficie n te de co nfianza (1
) = 0,95 so n
f, - 0,5943
f, - 1,8763
Y pa ra un coe ficie n te de co nfia nza de 0,99 so n
f, - 0,.\139
f , ~ 2,3.\13
Los límit es d e co nfianza de1 95 % para la vari anza de la pobla ción , vienen dad os por las ecua cione s
L J = (límite inferior) /.3'1 L, = Ilim ite su perio r)
¡,.'
=
O,,'J943(O,la37) = 0,079·11;
= 1,8763(O,1 33i) ~ 0,27,09
Los lím ite s de confianza del 99 % son
L, L, -
f,.' ~ f,.' =
O , 5 1 39(0 . 1:~1i)
- 0,068il
2,1.\1 3(0,1 33.) = 0,3144
El método descrito más arriba se denomina método de colas iguales porque en cada cola se sitúa el rrúsmo valor de probabilidad (por ejemplo, 2 JI, %). Puede dem ostrarse que ~n vista. de la asimetrfa de la distribución de varianzas, este método no produce 101 intervalos de confia nza más cortos posibles. Puede desearse que el intervalo de confW1U sea "el más corto" en el sentido de que la razón L dL¡ sea lo más pequeña posible. El cuadro 6.3. ~uestra cómo obtener estos intervalos de confianza imparciales más reducidos para o' u~ilil.ando la tabla VII , basada en el método de Tate y Klett !l959J. Esta ubla d2 In - )/x." _': ' donde p es un valor ajustado de a /2 ó 1 _ la/2J designada para prod\lCll los mas cortos intervalos de confianza imparciales. El cálculo es muy simple.
:: ~pI~c~n .,ms frecuent~ de la estad ística en investigación biológica es probar ci~= . potesu cientfficas. Los métod os eatadú tícos son importantes en biología porque or tJfl (lamente los resultados de experimentos no están bien definidos y por tanto se neces bJ . S para confirmar decisiones entre hipótesis alte 'r u e pr ue bs:11. esta. d¡1S1lca rnativas. Una .P . esladl itlca examina una se rie de dat os de muestreo y so bre la base de una dislnb uciCJ'l esperada de 101 dat os según una hipótesis determinada. lleva a la decisión de ace~W recha zar dicha hip~>t~ is Y aceptar una alternativa. La naturaleza de las pruebas var ~ dD 101 datos y las hlpOtC11S, pero el común a toda s ellas la misma fil O1Ofía genert
hipótesis, que se discuti rá en esta sección l' túd í d aste e ., . :.l U le\(: dele id OlIItr se da a continuaclO~ porque es fundamental para COm ni amente la mate. na ~e ue siguen en este libro, prender cada uno de 101 ,tulOl q I . b l a daría refrescar a memoria so re la muestra de 17 . ~Ol ~ 14 eran hembras Y 3 machos. Esto. dato. fueron e:nlmal~ de la e.peCle A, de .. (1U! la distribución binomial presentada en la sección 4 2 yamma 'le:". COn respecto a su ¡iTlde a De esta ta bla sacamos 1a conc Ius¡ , de que si. 1_ su ana nu le mue t 1_ ,-- 43 unon 'J S la en Lit ub" .' ( O5 I '" proporc1d de b ~n ~.u Ot ra de estas decisiones puede ser correcta ~epe ;clS~n (a«pur la hJpóttI ,de hecho la h ipó tesis I : l es correcta. ~ pr.une~a estaS cirCUnst.aJl(iaJ. come· ~JI U sera CO rrecta Si decid irnos rechazar la hipOteSlS baJO mma error de tipO I. por n er ro / . . 1 se de1W . de '1 Pirt . r. :1 rechazo de una hipótesú nula ClO o la blaóón es dlSunta l. la e,ll en realidad la ve rdade ra proporción de sexos de dt~m~dO t"or eh lfJO ~" ~"::era decisión I acep tar la hipótesis I • 1) es un 11 b hipóleas l. 1 • y de .act!Plación de lUlO tupá tesi: nula 10114 ftnl d.::..An correcta. AIJ. ha. cldirn nle IJ ~ ...... e • os recha/ arla, tomarnos nuevam
'm,,,
!
6Js Introd ucci ón al contra te de hipótesis
113
I
lb;
=:;
no;
t14
Estimación Y contras te de hiPót
es/!
. d d _. es correctas. aceptar una hipótesis nulahicierta y. rechazar una h¡rpOte.. . tipos e eC1Slon r I dos tipos de errores tipo 1, rechazar una ip ótesis nula cie rta y" olla · • 'J PoIJ I 13sa . Y aceptar una hipótesis nula fal sa. .. , . ' que magnitud de error de ti An , es de realizar una prueba tenemos que . decidir . lid t IPO I (rechazo de una hipótesis cierta) v~os a p'enmtlf. oc ~so cuan o ex raemos muestras de una población de parámetros c~nocld~s, slempr.e habra algunas muestras.que por caSUal¡. dad sean muy desviantes. Las mas desviantes de estas es p.robabl ~ ~ue nos mduzcan a error haciéndonos creer que nuestra hipóte sis H¿ es falsa . SI perrmumos que Un 5 % de lu muestras nos lleven a un error del tipo 1. entonces rechazaremos S de cada 100 muenr de la población, decidiendo que éstas no son de la población dada. En la distribución as se estudia . esto significa que rechazaríamos todas las muestras de 17 animales que tu: sen 13 de un sexo y ~ del otro. Esto puede verse recurriendo a la columna (3) de la tabb 63. donde se muestran las frecuencias esperadas ~e . !os diversos resultados según b hipótesis P9 = qó = 0,5. Esta tabla es una ampliación de la tabla 43 anterior, que presentaba solamente una cola de esta distribución. Efec tivamente , obtendríamos Un error tipo (ligeramente menor deiS % si sumásemos las frecuencias relativas espe radas de ambas colas, empezando por la clase de 13 de un sexo y 4 del otro. Según la tabla 63 puede verse que la frecuencia relativa esperada en las dos colas se rá 2 X 0,0245209 =: 0.04904 18. En una distribució n de frecue ncias discreta. tal como la binomial, no podemos calcular exactamente errores deiS % como en una distribución continua, en la ro podemos med ir exactamente el 5 % del área. Si nos decidimos por un error aproximado del 1 %. rechazaríamos la hipótesis P9 = qd para todas las !'"uestras de 17 animales que tuviesen 14 ó más de un sexo (en la tabla 6.3 vemos que la f rel. en las colas es igual a ~ X 0.0063629 = 0.0127258). Así. cuanto más pequeño sea el error de tipo 1 que estamos dispuestos a tolerar. más desvíanre tiene que ser una muestra para que rechacemos b hipótesis nula 110 , De modo natural puede que se tienda a tener un error lo más pequeño posible. Puede decidirse trabajar con un error de tip o I sumame nte pequeño, tal como 0,1 % o incluso 0.0 1 %, aceptando la hipótesis nula a no ser que la muestra sea extremadamente desviante. La dificultad de esta aproximació n es que a pesa r de precaver contra un error del primer tipo, se pudiera caer en un error del segu ndo tipo ( tipo 11) aceptando La hipótesis nula cuando en realidad no es cierta y sí lo es una hipó tesis alternativa Hl ' Luego veremos cómo sucede esto. Primero vamos a aprender alguna terminología más. El error de tipo I se exp resa mis frecuentemente como una probabilidad y se simboliza por 0:. Cuando se expresa como u~ porcentaje se conoce también como nivel de significación . Así, un error de tipo I de Q 0,05 corresponde a un nivel de significación deiS % para una prueba dete rminada. Cu.ando en una distribución de frecuencias separamos áreas proporcionales a a, el error lk tipo ." la ~rdón de la abscisa bajo el área que se ha se parado se llama región de '~?Ia~:~ regían crl!rca de una prueba, y la porción de la abscisa que llevar ía a la ace ptaClO n ~ hipótesis n~la .se den~mi.na regián de aceptación La figu ra 6.IOA es un diagr~~ ~ barras que indica la dist ribuci ón espe rada de resultados en el ejemplo de proporc1ó sexos, dada 110 - Las líneas discontinuas separan aproximadame nte las regiones de rechazo del I %, de la región de acepta ción del 99 %. ¡¡¡. Ahora vamos a echar una ojeada más detenida al error de tipo 11. Este es la pr obab 11 r dad de aceptar la hipóte sis nula cuando en real idad es falsa . Si se intenta evahl1
con traste de hipót esis y Estimación li S
TA BLA 6.3
Frecuencias rel ativas esperadas para m . d hiné . uestra'idel 7 aruma ' Ies segun o s rpo tests. Dl stn bución binom¡la I. (1)
(i)
99
d'd'
(.')
11, : PQ .- qrf -
t.;
¡¡ 16 15
U 1
° ,f(OJfJ76 U• OOOI ')(I~ _. I
2
O,I(HO:J j'6
"
3
O,l.Xl.;j I ~ 0,01"'1 ....,..0 O,fl.I i2 1(I'j
13 12
4
5 6
-•
O,(jlJH2 1 t 0,1-1,"176t.
O
8
O, l ~ ;06
8
6
O 10 11
O l ~ i Ot i • Otl-1 ,'r; G.) O/1.l H2 14
5 4
12 13
0,04 72107 O,OlSIS.~
3
14
O.OO51~SO
2
15 16 17
0,0010376 O,OOO1 21J;
11
10
-,
1 U
T otal
W i
11 1 Ji • • 2qd' • 1
-
l..•
0,00101."11
-.
O OO~ )-.)
'
~
O,O:W!JI lJ,O....f¡.!; 1:, Ol!hr''1 • 'u_ 01"1"1 • , _ J,- -• O, Jl, lf) ~'ij-" l. O,11J.I.!W4 O,I1Jf''''')'' 15 O ,( ~ o;,¡ l (MJ7
Om9'.:.63
0,0061 334 o,rOI:¡J.lJ O,r.O' J'!l: 1-4' I O,lmH:!1 0,(0)'10-11
°lOllOrl
0/X)I,) ')l 176
O,rro_OJ
1/)0')0002
0:0 1': 1':1':1':1
probabilidad de error de t ipo 11 , inmediatamente aparece un problema. Si la hipótesis.nula • . Pero a no ser que se pueda especificar Hoes falsa algu na otra hipotesis H I debe ser cierta. _ • d . 11 Un ejemplo aclarara esto Hr, no se está en condiciones de calcular el error e tipo . J~-" s sola . . d roporción de sexos ltnenlO '" . mrned13tamente. Supo ngamos que en nuestro ca~ . e ~ . = ó :!) una hipótesis mente dos posibilidades razonable s 1) nuestra hlpo tes1S Ho ·P9 qó, , . I a favor de lterreu '1 ocióndesexoses~. 1 ternat¡va H 1: P9 = '2L¡ d la cual formula que a prop r calcular frecuencias hembras, de modo que ; 9 = ¡ y q d = 1. Ahora te~).~ ~~a hallar la. probabili· esperadas para la distribució n binomial (P9 + qdf - (j T resentan gráficamente en dades de los diversos resultados según esta hipótesis. Estas ~a~efreeuencias esperadas de la lar~ura 6.108 Y en la tabla 6.3 se tabulan Ycomparan con dlS1Iíbución anterio r. . (Q ::::: 0.0 1 (::::: significa .. SU~ngamos que nos hemos decidido por un error ad~ A este nivel de ~iftCa. .aprQxunadame nte igual a") como se muestra en la ragur . t ngan 13 o menOSanimales : naCeptaríamos la 110 para todas las muestras de 17 que CO~a: caerán en esta categoría. Aproximadamente el 99 % de todas tu mues,e de la población rtprese~ta· PtroUn· sexo. . I "1 (Iaram en . o estu'IJtse da c.que Ocurre si 110 no es cierta YH1 SI o es ludas en que un sex por la hipótesis /1 1 también podríamos obtener resu
::r:.
Estimación Y contraste de hipót es,s '
1 16
Región cri t ica
Reg ión cr it ica
A
o de rechazo 1
o de rechazo Regió n de aceptación
_!!--i 0,2
2
f .ol 0, 1 OJOS
o
l'
I I I I
J
I I I I I I
0,15
,
I-a
I a 2
,
I
I I I
I
O 1 2 3 1-1
á 6
78 910111213!1 415161 7
II
~
1,
I
0,2 ,
I
1.. 1 0,1
I
I
I
I I
I
,
o o
I
I I I
DOS
I 2 3
I
I
I I
0,15
i' r' - ~ I I I
1 5
1.
{j
7 8 9 10 11 12 13 114 15
ie
17
Número d e h embr as en mue st ras d e J 7 an imales Fig. 6. 10 . Distribu ciones es peradas de resu ltado s cu a n do se ex t raen muest ras de do s po blaciones hi poté ticas. A . /Io : P9 = q d = j. B. H. : P9 = 2q d = J. Las línea s d iscont inuas separa n las regione s cr ític as d e la región d e ace p ta ción en la dist ribu ció n de la figura 1\ . El error del t ipo 1 o: es ap rox im ada mente
igual a 0 ,01.
represent ado 13 veces o men os en muest ras de 17 . Tenemo s qu e calcular qué p roporc~n de la curva que representa la hipótesis H I coinci dirá en parte con la región de ace ptaClon de la distribución que representa la hipótesis l/o . En este caso hallamos que 0.8695 d: la distribución que representa 1/ 1 se su pe ~po ne con la región de aceptación de 110 (vea; figura 6.108). A SI , SI realmente /1 1 es cierta {y correspo ndientemente H¿ fa lsa), 3eep ríamos erróneamente la hipótesis nula 86,95 % de las veces. Este porcentaje co rrespo(ld.~ I elOn la proporción de muestras de 1/ 1 que está entre los límites de las regiones de acepta
d.e 110 • Est a proporción se ll am a (J , el error de tipo 11 expresa do como proporción. E;s~:~~ 1 eJe,:"plo Oes. ba~ta.nte grande. Naturalmente, una mue stra de 17 animale s es poco 53. No tona para discr imlnar entre la s dos hipótesis. Aunque el 99 % de las muestras segun
11 7
, la región de acep tación, el 87 % lo haría según JI U flan en .,n .. , l . na sola mUestra . cJt tón de aceptac lo no nos perrr utír ía llega r a una d '., que ca iga tD 11 reg do de fiabilidad . Si la mue stra tuviese 14 hembr' seclsI~n entre las hipótesis COn altO gra o mas wncluínam H " ecta Si tuviese 3 hembras o menos, podríamos conclu¡ . os que I era, ¡;off' 1I 11 ( Ir que mHo ni 1/ e Al aproximarse 1 a o como en If I :P9 = 0 ,55, pore 'em lo) 1as . 1 .ran ,~erlas·se supe rpondrían cada vez más y la magn itud de n aum~ ,P 'h .dos dist ribu",nes ..., 1 hiné JJ nana, aciendo menos ibl aú n la disC fUTlI naCIOn entre as ipote sis. Por el contrario 5' 11 . ' ho m á ,1 I representase P9 = po S! lase distribUCiones estanan mu c o mas separadas y se reducir¡ el er d ' I O9' ' d da d ror e npo I Luego c1arament~ la magrutu e p epe ~de, entr.e ot ras cosas. de los parámetros de la hi " es;~ alte rnat iva 1/1 y no puede especifica rse SI no se conocen estos últim bl 1" ', ' a1 ' uso Cuando se esta ece a npc ~SIS ternativa como en el ejemplo anterior (JI¡ ' P9 = 'q ,\ la magnitud del erro r de tipo 1, a ,que estamos dispuestos a tolerar de' ': ' 1, , "', d ' 11 a e ' . ermtnara a magnitud del error e tipo _' p. u~~ to mas pequeña sea la región cr ítica Q en la distribución según H», mayor sera la regro n de aceptación l - Q en esta distribución Sin embargo, cuanto mayor sea l - a , ~ayor será, su so lapamien to con la distribución' que representa H 1 , y por tant o mayo r sera {j. Conv éncete de esto en la fig ura 6.10, Moviendo lucia fuera las líneas de trazos reducimos las regiones criticas que represe ntan el error de tipo 1, a, en el diagrama A. Pero al hacer esto , una parte mayor de la distribución de 1/1 en el diagrama B quedará dentro de la región de ace ptación de la hipótesis nula. Así. al reducir Q estamos aumentando fJ y en cierto sentido malogrando nuestras propias in tenciones. En la mayor parte de las aplicaciones, los científicos desearían mantene r pequeños los dos errores, puesto que no desean rechazar una hipótesis nula cuando es cierta ni aceptarla cuando otra hipótesis es correcta. Más adelante veremos qué medidas pueden tomarse para reducir {j al mismo tiempo que a se mantiene constante a un nivel preestablecido. Aunque los nive les de significación o: pueden variarse a volu ntad, los investigadores se encuentran frecuentemente limit ados porque para much as pruebas no se han tabu lado las probabilidades acumu lativas de las distribuciones apropiadas, y por tanto deben valerse de 105 niveles de probabilidad pu blicados. Estos son ordinariamente 0.05. O.~I,. y ~.OOI, aunque a veces se encuentran o tros diferentes. Cuando se ha rechazado una hip ótesis nula a un nivel indicado de e , decimos que la muestra es significaril'amente Ji/creme de la población paramétr ica o hip ot ética con probabilidad P ';;;: Q_ Gene ralmente, valo~es .de Q ~per' O . . . ;r, " s Un nivel de srgniHca.. lOres J ,OS no se co nsideran estadisticamente SIg1l1J1CO/110 . d 11 % "" pn deI S % (P = O05) corresponde a un error de tipo I en ~O pruebas, un filvellle 'II.(P ¡ • 0 01) ' , Id ' 'ficación menores que e "' O' ~ u~ erro r en 100 pruebas. Lo s ruve es .e sigo! I % el I % pueden cons·? I) casi siempre se juzgan significativos; los Situados entre e~ 5'fic;ción estadís tica he Iderarse significat ivos al arbitrio del investig ador. puesto que s¡gRil'" emos el adJ'et ivo ne Un se nt"d ' . h d a P __ a) ut izar 0 ~ifí' I o tecn íco particular (11 re~ . aza. ,a ' I~ v comunicaciones cienlifi catIVo solamente en este se ntido; su ur ílízacron en aru,c~ , nonifJeado técnico. debería unpe ' diIrse a no ser que este' c1araro ente impllelto este'ntencionado, ~ Par,casl'Ilnes . marcadese npnvos ' . . do generales sinó, nimos ta Ies como IJT1portant e, l ,notable y , dif d as )' efectos. .' u otros pueden servir para subrayar 1 eren da por distribUCiones 'vera se h h ipót Is nula represe nta de Probab . ace un breve come ntario de la I eS I . ótesis nula en el caso de propo rCIÍ. d ihdad asimétricas Supo ngamos que nuest ra hip .o nnente En la fl2ura e lex h ' h d'scutido anten . : os ubicra sido 110 P9 = i . corno se a I
,po-
Nú mero de hem b ra s en muest ras de 17 anima les
I I
amación y Es
contraste de hipótesis
Estim ación Y con tras /e d e hipó
J108;8
118
10 ll se pre se nta la distribución de muestras de 17 cría s de esta po blación. Es c1 aram u. " ," d f in¡ ' d ente , itr¡ y P'" esta raz ón las regiones Cri ticas llenen 4 UC e nur se In cpendientem asnnc TlC:1 .' • • d lic: ente Para un a determinada prueba de dos cojas pod ~mos: ~ Ie ll sea up leal la p robabil idad /I d' una desvia ción en la dirección del extrem o mas pro xrmo y c~Jm pa ra r co n a , el nivel / significac ió n conve nciona l, o bien comparar P co n 0 / 2, la m itad del nivel de signinca(6t convencional. En este últ imo caso el máximo va lor de P q ue se co nside ra con venc io~~ mente significativo es 0 ,025. . . Revisa remos lu que hemos aprcnd.ido po ~ medio de u~ segundo ejemplo, incluyendo esta vez una distribución de frecuencias contmua, las longitudes de l ala de moscas do é ri cas distribuidas normalmente, de me~ia paramé~rica Ji = 4 5,5 Y va~ianza 0 2 =: I S~r Las med ias basadas en muestra s de 5 items cxrrafda s de ésta s, tam bién estará n normal. men te dist ribuidas corno se ha demostrado en la tabla 6 .1 y e ~ la figura 6. 1. Vamos¡ suponer- que alguien se presenta con una sola mu estra de 5 longitud es del ala de moscas dom ésticas y se desea probar si podrían pertenecer a la po blación ind icada. La hipótesis nu la será l/u :P 45,S Ú 1I0 :p == /Jo , dond e /J es la ve rdadera media de la población deb q ue se ha mu estreado y Po representa la media paramétrica hipot éti ca de 45,S. De momen to supondremos que no tenemos ev idencia de que la va ria nza de nuestra rnuestn sea muy superior ó in ferior a la varianza paramétrica de la s longitudes del ala de moscas domésticas. Si fuese así, no sería lógico supo ner que nuestra mue stra procede de b población ind icada . Hay una prueba crítica de hipótesis sobre la varianza de muestreo de la que nos ocuparemos más adelante. En la figura 6.1 1, la curva de l centro representa la distribución esperada de med ias de muestras de 5 longitud es del ala de moscas domésticas de la población ind icada, A lo largo de la absci sa se delimita n las regiones de aceptación y crí tica para un error de tipo 1, a == 0 ,05. Los limi tes de las regio nes críticas se calculan como sigue (recuérdese q ue t I... ] es equivalente a la distrib ución normal) :
Estimación
y contrns ta d e hipót esis
/1.9
JI ; '"
r.
11 ,; "
2!)
y
Así, para ~ed ia s men ores que 42,O R o mayore s q ue 48,92 co nsideraríamos improbab}e que M: h~bJ e ~n mue streado de esta poblaci ón. Por lo tanto paru esta s medias rechazarl a· m/J ll, la hlp6tesis nula . La prueba que pre se ntamos es de do s colas pu rque no tenemoS noc iones a priori sobre las posibles alterna tiva s a nuestra hipótesis nula. Si pudiésemos ~u po ne r que la verdadera media de la poblaci ón de la cua l se ha tomado la muesll1 so la me nte puede ser ¡ . 1 igua e mayor que 4 5,5, la prueba se ría de una cola. . vamos a cxamin:ar d'tvcrsas IIJp ' 6tesis ' alternat ivas. Una hipó tesis alterna tiva ' pud.e. MICHa . O ra ser que la. verdadera medíla dee l:a POI}blaCI'6 n de la que proviene nuestra mu estra se a 5-', . pero la va na nza sea 1- . . JI 'P ~ 54 O ( / / d a rm sma que ante s. Podemos ex presar esta hip ó tesis como 1: Ja • J , ' 54 ,O. I \ parlJrdi~1 la tabf d1 IJ' , JJId' 1o nde IJ 1 repr ese n[ ,a l'a me d¡la pararnétnca alternativa a e arca , e a curva fIl r - 1 ' , l.mzn d 1 sIne tJ rod ern • ' 1 1 1 ) uta y nu estro COIlO(; IIn1e nlo de la vananza e a ..... ,- 1) ca cu ar a prorv r '(¡ d 1 d¡ , , ' 'J ifll ~ ,. h " d ,..J c.:l JIl e a ISlTlbu CI6n denotada pur I' I que comer 5 0í Parle con HI a regvm e aceptacl ó d d _ O 13 a . urudltde, de rntdldóJ de 4 ~'J2 n. ~ IliJ t a a ~(Jr I/IJ' 1'.Jlco ntramos cluC ~4 , es [stO , , el IUllIte IlJ pC flor de la reKillJl de aceptaCi ón de Jlo'
Long itud del ala (en unidades de 01 , mm, Fig,6,11. Distribució n esperada de med ias de muestras d 5 I " de po b lac¡ ..... e ongltudes del ala de moscas domesticas acrones normales indicadas por J), come se muestra en las curvas ante rio res, y ay == I 744 . La curva de) ce , _. ' , ,_ _' n ro representa la s hlpotesl nula , fI'J./J - 4 5,5,Ias curvas de los ladosreprescnun h 't I rpo esu a ter7 ' 54 L H 3 nativas, J.I. == o Ji , • ' , as Incas ve rticales delímuan regiones criticas del S % para la h ip ót esis nula (2 YJ % en cada cola. sombreadas] corresponde a 5,08/1 ,744 = 2,9 ) o y unidades, En la labia de áreas de la cu ria normal (tabla 11 ) encontramos qu e 0,001 8 del área estará más allá de 2,9 10 en una cola de la curva. Así, según es ta hipótesis alternat iva, 0,00 18 de la dist ribución de If l coincidirá en parte co n la regi ó n de aceptación de " o . Este es P, el error de tipo 11 seg ún esta hipótesis alternativa. Realme nte esto no es del todo correc to, Ya que la cola izqu ierda de la distribución 1/ 1 co nt inúa hasta el infi nito negativo, se sale de la región de acep tación y pasa a la región crítica de la parle izquie rda de l/o. No obstante. esto rep resen ta sclame nte una cantidad in fi nit esimal del área de II I (el límite critico inferior de 1/0 . 42,08. dista 6, 83u r unida des de /1 1 = 54 ) Y puede ignorarse , Nue~t ra hipótesis alte rna tiva 1/ 1 indicaba que J)I es 8,5 unidades mayor que 1hJ , ~ i~ embargo, como se ha dich o ant eriormente, puede que no tengamos fu ndamento a pnon pa ra creer qu e la ve rdade ra media de nuestra muestra sea mayor o me nor que J). Por esta , po de mos suponer simplemente que se apa rta 8 , ~ umid.3 des de ~e dida raz ón I e de ue45"5 En este caso de bemos calcular de igual manera Ppa ra la hip ótesis alte m~ lJva d q ~ l _ lhJ 85 ' 1as 1" ' alternat ivas se convierten ' en // 1 ,' ,,u - 54 /1" ~ib- ~' " " A", 1, upotesís ,O o 37 •O, 6 di donde J)I representa 54 Ó 37 la s medias paramétncas ' aIternativas Como las 1st n1UCIOrva ' nes so ' . ' . ' . It na tiva s Por lo tan to, e error a er d ual - de las dos hilpo t esrs ' de - n umetricas, ¡.Jn es el mismo para las dos hlpoteSlS • ah upo 1I para la hipótesis 1/ 1 es 0,001 8, indepc ndlcnteme~t e 1; ~ muestra5 lIevarían a er nativas sea Correc ta, Si II I es realm ente cierta, i 8 de ca a bai En la figura 6.11 se Una aceptació n incorrecta de 11 una proporción de erro r muy aja . 0 presenta . ' \' n estas relacio nes. creer que el valor param épada ra lado de ~ = 45,S, Se TIa' '( -' Os pod emos preguntar, justamente , q u é ral o. n tenemos .
r~ P > O025 S' más .. mve 5 %, Ó. expresado ca , ifl .. d 1 S % . • . I estuvoe",,"o, d n .,i1. ' el de sigm icacion e • co nsideraríamos el p rspueuor a acep tar un ..... . reparado s· 'fi . del patrono tgIl l ICatlvame nte por debajo
's
Puede que el mismo '· d I . ..sorprender U d i ' ejemplo • UIU IZan o os mísno d signiflC3clo n, eve a os conc u ssones diferentes d s atas y pruebas de ' Y pue e comeru.ar algunas de 1as cosas que se han an oíd 0 1 o sobre estad ísti .. se a pregunta r SI todo, correctas. La explicación reside en el hecho de ca qu:y les~d lSlICOS no son, después de a difere ntes preguntas. Si examinamos si nuestra mu os ~s '~suhados son respuestas del patrón en cualquier dirección, debemos concl uir esu:\: ;lgmfjc~l lvamente d~rerente para que rechacemos la hipótesis nula. Si r q s sufi~lentemente diferente q~e la v~rdade ra media de muestreo JJ. Pod;í~sero~:~~~e~e~~ ::s~~~~a;:sbl:lc~:~ho ~: dííerenc la encont rada. por nosot ros es claramente signifixa tiIVa. En este ejemplo queda "' . lar e o que en cualquie r prueba estadística debe expresarse c1ar.amente si se ha realiz do ~~ pru~ba de una co la, o de dos colas, en el caso de que la naturaleza del ejemplo f~ese doque . ubiese cualquie r duda sobre la cuestión. Deberíamos señalar también que esta ultado en los resultados no es necesariamente típica. Se debe solamente a que el resu ennc¡ este caso es ea en un area . 1"imitrofe entre cla ra Signi ' ficación y no significació n. S. la tado diíere I eren~¡a ~ nt re muestra y patrón hubiera sido de 10.5 unidades de acuvdad.Ja m~:stra habrfa Sido sin duda sig nifica tivamente diferente del patrón para la prueba de una 0014 o de dos colas. .La promulgación de una media patrón es ge neralme nte insuficiente pa ra el establecimiento . Rlfi ' de un patro. n nguroso para un pro ducto. Si la va rianza entre las muestras es telenlemente gran d e. nunca se ra' posible establece r una diuerencia . sig ' O!'r,' m di icanva en 1re Ia e 13 de muestreo y la patrón . Este es un punto importante que debería quedar complelam enle claro . Recuerdese . ' q ue el erro r típico puede aumentar de dos maneras, d'ISITl1nu. " Y Y!)en doel t amaño de muestra o aume ntando la desviación típica de los elementos repeuu1. Ambos ' ' . ' tal . La SOn aspectos indeseables de cualquier procedumento expenrnen en prueba descrita más arr iba para el preparado biológico nos lleva a una prue.ba par I ' . .. . ' if .. de una desvl3' lCW)neral d a a síg nífícact ór, de un estad ístico es decir, para 13 Slgnl lcaclOn I e cualq . • . .' l o c a erandes raigO' en e ""dro 6 ure r estadístico de un parámet ro, el cua se expo IY~ . I I de . .4 Est . . I s estadístICOS sigan a ey dotnib UClon ... a prueba se aplica siempre que se espere L . que ortir de 13 muestra. se ut'"'' ~ ¡¡ dittrib u .•norma l. Cuando el erro r t ípico se estuna a pa .) casoespecialtl-I de la dÍJ;t r~~on.~ . Sin emba rgo. cuando la distribución .nonnal ~St~b::n t con los vados UClon /. la mayoría de los estadísticos aplican b dlS
-.z---~
Estimación y contras te de hipót "
(:818
126
,--- CUADRO 6.4 - - -- - - - - - -- -- -- - - - - - , . ifi ión de un estadístico , es decir, la significación de Una de la slgm ICJ el . I diste¡ C00 r . d ráme trc Paro estadís ticos norma m ente Istnbuido s deS\;ac ió n respecto e un pa . . t aste
". y contras te de hipóte s is
. aClo rJ
{SI/m
127 l cnte
'fi ativan s~rll ¡C 'como JislribUye
superio r a l OO? Rccordando de la cxp "' d ' resion (6 8) ( ( - IJ • proce eremos Como siguc. En primer 1 ' ¡ue 11 I) s2/ U2 se ugar calculamos
xr..
X ' = (n - 1)8'/. '
Etapas del calculo
= (9) 1~;¡ ..I·I/ I(XJ
1. Calcu lar l J como la siguie n te razón .
= 11 ,2UO
l. =
SI - Sr" ,
"
donde S ( es un e srad istíco de mue streo , Srp es el valor para m étr ico. fre . nte al cuaj se va a co ntrastar el estad íst ico de mue streo, y S~ t es su erro r {l pI CO estimad o
o btenido en el cuadro 6. 1, o en o t ra part e de este libro . 2. Las hip óte sis pert inentes so n
UD: Sf = SIl'
Jl 1 : SI ~ SI"
para u na p rueba de d o s co las.
11 0 : S, = SI,.
11 1 : SI > Si"
11 0 : SI = Si"
u; S i < Sl"
o
ue calculamos la cant idad á ? en lugar de X2 para hacer hincap¡"c· d \'ólcse q , d' . e nuevo en que . ob teme ndo un esta ISt lCO de muestreo que compararemos con 1" di I "C ió (slamOS ,2 desi l ' a 15 nnuc r 11 ·¡rica, El uso de A para csignar e estad íst ico de mue streo que se ajusf " " me a . l· t blecid S· " a a un, .~ "bución X esta arnp lamen e esta eCI o, igui endn el esquema gene ral del cuad distü ". n esta blccemos nues1 " ' ·1 f co ntinuaclo ras'upotesis nu a y alte rnativa que son IJ :u1 'r la va ri:lIli'a entre grupos es superio r :1 la cst imada pur la V¡~ r1a rlla 1I.ltr:lgrupo s, 1:11 la sección 7.4 se explicará el fundame nto oc cstu hipót esis alt ernat iv a restr!t'l lva que co ud ucc n 1I11a prueba de Una cola. Calcula mos la rn zón de V:II,i:J111aS /:s = sUsi = :! 1,18 1/1 6 ,O:! o ~ ). la va rianl.a dc muestreo si pollría!tl tanto me nor co mo ma yor 411c s~ . Esto conduce a una pru eb a de do s colas)' en estol ca~.s un r lfor de lipo 1 del 5 % sig nifica qu e en cada co la dc la curva se hal b d n rt'gio llC l crit Icas del 2 '6 %, .
1.;1 fl~ur;1 7... 1 us t rc c.
A vrccs ~s nccpesar io ob lener va lores ,.' para Q > 0 ,5 (e s de cir , t' n la m itad il.q uierdadt la dlSl flbu Cl6 n ,.) l' ueslo . o h ace pocu , esto s va lu res rara \'e/st , 4 ue' , cumu 1lcmos d ICh tabu lan . puel1efl obtclle rltC por una regla ~ lIc l lla . f'
.["1. ...) -
1
,~
( U,\I>lW 7, 1 --;; , ~¡;;~~.;:::;~:;:::== -Cllltf;IS - te de sigru flcacrfl n de las diferen cias entre duus, \3r1a , . IlW 'i, lJpcrviVt'nd a , c u d ías, de la ,ni agua.
-
IIr:mb ras
11. -
10
~ ' a rho s
tll -
10
rl r, -
/0\ / 1
d ías
I,S día s
---,
I'a¡':a
CUando se munncm- sin cerní.
'1 ' -
:i,1l
'1 1
O,~l
La hipótesis alte rn at iva es qu e las dos varianza s so n diferente s. No tenemos tunda . ente para supo ne r q u e u n sexo sea más variable que el otro . A la VI'it,1 de la ip ótesis alt cr uativu ést u es una p rue ba de dos colas. Puesto qu e en la tabla V y en uchas o tras tab lus solame nte se ex po ne ampliamente la co la derecha ti c 101 dt stnbu -ión 1-', calcula mos co rno la ra z ón de la varianza mayor so bre la menor
, e¡
:1 ,11 _ ,1 00
s~
0, (1
.- , -
r .
'''s
I
Debido a l.J. UC la pru eba es de do s colas. buscamos el valor cr itico tic F.. fl[...n) don de Q es el error de ti po I ace ptad o , " 1 = 11 1 1 Y IJ2 = n 2 l . los grad os ti c libe rtad para la varianza superior e infe rior, respccttvamentc. LI que busque mos F.. f2{ ... ..,l o 1"../ 2\•.".,1 dep ende de qu e la mu estra I o la mue stra 2 h:n¡a la varianza mayor y est é situad a en el num er ador . En la tab la V enco nt ra mo s 1".07'1" ' 1 = 4 ,0 3 Y F 0." .'1 - 3. 18. Como és ta es una pru eba d e dos colas . dup licamo s es tas probabilidati es. Así, el valor F tic 4,03 represe nta una pro ba bilidad de Q .;::: O,O S, ya que el área tle la cola ,lk recha dc Q ::: 0,025 está eq uili brada po r un áre a si milar a la il quicrda de ¡. tU,...) ::: l/ F.ou [..., = O "'l 4 R I'o r lo ta nlo suponiendo que 13 hipóteSIS nula Sl' il clerla, la ., .. , '1 /400 -02 5c", probab lhdatl dl' o bservar un valor F mayor que 4 .00 Y menor qu~ , ' 0,10 > J' > OOS. lI abh ndu t"stfl.clamente , las uO'i " \arl3 . n"s de mue ~treo . no son "g ·r·· ' , . , ' ¡ables rn a su III Icallva mcnte di feren tes los do s sexos eran Igu3 men tc V3r ..cuanlo , 1 ,) ur ·6 ' I b lantc pro.'wllO a IlIve a.el n de supervivenc ia. Sin emba rgo, el resultado es o as ) . n. 's ·r· ., h ....,,,¡blrmenle 3S vana Ignl Ica Cl on de l 5 % co mo p'l r'l hal:crn os Súspec ar que ,.. la las f ' • , • le expeumento wn ucsen en realidad di fl"renl eS, Ser ia deseable repctlJ es ( ~peran 1 • ' l a .ue qU I: salil'se n resullados mas deelsl\'os.
(J .: I
"
¡. U- ..)[ .... ..,1
I'or ejemplo ,.. 1 (2 ,. , . 1Jr3 ~ y 24 grados'd' I°b··IU~! .. , ) SI qu erernos oh le ner P o"1& U) (el valor J l' . I di reSpel,; IIVamerI t i ;1 uerech:l .' " se hall a el t )5 oJ'" del• ar('3 la lllstTlhuc' 11e1-'11 crlau . ' . C,:I del cual , le ncrnos que busc' r ' l' . f o,M ll tI el el recí proco de 4 53 _ a prll1J cru '0,0.1'.,1) .l,5J. I: nto nct'5 , r , rJ SY 24 KJado! de Ilbe'r{' :.q.ucá la SI,.): unda a, o de1arr JI I -rchctes al cua rauv. (" 5 lo que -«rnbi¡ d " O amos los parént esis dent ro de us o ' !am en l e \,'01110 ante sl . llO e Slu lflCiII -e Y Ias Q . se a n ula n, d e jando IJ cvpr t-sion cvac 'rupl)\ r1IJ \ 3rla pese a os ' ión a nter ior "de que '"J \ J lIJ lIl J ,"1f3~ 'otd enUestra I (r "II ' o'l "scrvac ·
.l n ll ~ r ll n .
-- ~ Introducción al análisis de la 144
.
Var'anla
. h aleulado previame nte por la fó rm ula La varianza de la s med ias se a e
1
if (i: _
y )'
a - 1 . .. 1
Sin embargo. en la la bl a 7.-t vemos que la nueva media total es ig ual a
1 i-a
-L
a,_1
Cuando sust ituimos los nuevos valores para las medias de grupo y la media total, h fórmula aparece como 1
a -
- (y
+ a»)'
I análi s is de la varianza ción a In /lOdve .
ue por azar se ría la mayor, COmo la de la muestra 2 A . . 1)0 la lTIedl~ qpequ eña (muestra 4 ) no está asociada CO n el efec·l ' d on tSmo, la.media de ']1lUestrea roasl mente si la magrutu . d de Ios erectos de tratamiento sea e tratamIento . l . mas N'íltleño. So an las medias de muestreo (esto sería difícil de haceCOrre aC¡Klna se .delibe. r':'darnente ca , . d i .' r en e experm ento ra n el tercer terrnmo e a expreslOn, la covartanza tendr¡·a un •• diseñado aqUI" , Vr 'lb caso, fl J = 2,5, puesto que el valor real o serva o - . resperado 40 5 Ahora . . .. E n álisis de varianza modelo 1li expresaremos más formalment e esta relaclon. n un .a hav debidas a los POnemos I di d orupo SI las 3\, son tiecto d que _as diferencias entre las me la~ e e _ • El b-¡to del análisis de la . 5 el tratamiento fijo determinado por el mvestlgador.. da J po Cada variante . ~a es est imar las verdaderas diferencias entre las medas e gru . '~ual d pue e descompon erse como sigue: (7.3) } ".j = p.
+ a, + t,}
Introducción al enelisis de la 15'
'Varianl " a
._ representa una variable mdependiente, nOnn,>l_ a /' ee_ l . . - . . n. . QJ.Iuentt donde t"" l .. ···· . .€IJ. nza u·~ == a~ . Por lo tanto , una d e t ennmad I dia f " == O vv arta f d " "" (j' a ectur distribuida con me I l/. • -1 d la población. ¡J. , una esviacion IJ 3 Q¡ de la medo l .. n al eaton"a fU di " diTVlduo . está fo rmada por la media. tolaal ¡J.e v una desviaclo e m que Jadel 2ru po i respecto de I~ medl: to~ ~ valor esperado. que es (¡J + Cl¡ ). Recuérdese que~eupa el lucar j del grupo I respel,..t~ e o neeativos. El valor esperado (media) de los valo "'lo ueden ser • d e 1a po blaci Q¡ como Eij P . posrt IV0la5 ,-arianza pararn étrica acro. n, a 2 _ Para qresde v su \'anan.L3 es del análisis de la varianza. 1a diistnIb UClOn -. de E·· debue se f r¡ es cero wriftliuen todos los supuestos '/ e ser normal. ... 1 . fila modelo I examinamos diferencias del tipo Q I - Q e En un an álisis de a vana di . 2 nUt ias d probando la presencia de un componente a nrvo debido a t.. las medias e l!ropo. . h '" " S' ce ntramos que este compo nente esta presente, rec azamos la hipÓte," tratamientos. I en blacion "" y aeep t amo s 1a h iipotesk " , roceden de la misma po alternar P nula de que 1os "nos eru pos dlferente s entre sS íI, 1o que mdicaque " ' part e de las med ias de grupo son erentes entre \'3 de qu e al me . . dA " "" al menos aleunos de los valores de a¡ son diferentes en magrutu : ccnt muación general. eremos comprobar cuáles de los valores de Q¡ so n diferent es entre sí. Esto se mentepor qumed io de pruebas de significació . " n. con hin ótesi a Ite~nat lvas " hace ipcresrs toa1es como HI:Ql > 0. o H: (a l ";" Q: ) > a ). Es decir. estos comprueban SI la media del grupo 1 es sifnj¡k atrvamente mayor que la media del grupo :!. o bien si la media del grupo 3 es m-enor que el promed io de las med ias de los grupos l y 2. A co ntinuación siguen algunos ejemplos de análisis de la varianza modelo I en diversas discipl inas biológicas. Un experimento en el que ensayamo s lo s efectos de diferentes drogas en lotes de animales conduce a un anál isis de varianza modelo 1. Estamos interesados en los resultados de los tratamien tos y las diferencias entre ellos, Los tratamientos son fijos y determinados por el invest igador. Esto se verifica también cuando examinamos los efectos de diferentes dosis de un determinado factor, una sustancia química, o lr cantidad de luz a que ha sido expuesta una planta o las temperaturas a que se han mantenido botellas de cultivo de insectos. El tratamiento no tiene que ser completamen« co nocido } manipulado por el investigador; con tal de que sea fij o y repetible, se aplicará el modelo 1. Si hubié semos querido comparar los pesos de nacim iento de los niños chinos en el hos.pital de Malaya con los pesos de niños chinos nacidos en un hospital del conti nente ch ~, también habría sido un análisis de varianza mode lo l. Los efectos del trata~lemo ~r~an en este caS? "'continente re specto a Malaya" . que resumen toda una serie dt actore.s diferentes, geneucos y ambientales, algu no s conocidos por nosotros, pero b mayona de .ellos desconocidos. No obstan te, éste es un tratamiento definido que pod eIOOS describlf y además r- t" . d " " d uevo - - f"" ~ If, es eC lf, SI lo deseamos podemos mu estrear e n pesos de naCumento de niños la t MI ' " Otro 'em lo ... n o en a aya COmo en el conti ne nte Ch UlO. ara t) P d~ analtSlS de la varianza model o 1 sería un estudio de pesoS co rporal~ P grupos de anrrnales de difere t d d Lo d ue son fqas. Si hallamo h . n e e a . s tratamiento s serían las eda es, q . S que ay una diferenc' . 'f ' d odnaJl1°s completar esto con la " la SlgOl Icativa en peso entre las eda es, P de la edad 1 a la 2 E cUestK.l n de si ha y Una diferencia de la edad 2 a la 3 o solame nte ex perunento y 'den su ~aYI ar pane los análisis de varianza modelo I so n el resultado de u~ manlpu ación deliberad d f ,,! bstante. t d)l) de diferenciaS taltl La a e actores por el investigador. ... 0 o . So 51 ri no e un experlJTlento :m: com pa ració n de pesos de nacimiento de dos ~a lse P p men te dicho tamb ién cae dent ro de esta categona,
_.Iv !rUU
cción
al análisis de la varianza
. . ' de la \"3rianz.a . modelo 11 • • \n:diSlS . de la variació n en un análisis de varianza mod 1 11 u estrUctura eo ~I modelo 1:
155
es bastante similar él la (7.4 )
una variable independiente no rma1m ente dIStribuida " " de I":=: 1•• • . • a•j = n. .€¡¡ repre2 senta _ 2 don med'13 t- '_J- = O Jv van anza u, - Ia , y A i represe nta una- variable normal mente d¡atnibui ui",n. d ndiente de todo s los va ores de e, con media A . = Ov varianza a: La " 1~ 111 epe " fii l . A • diferen•:l1 "6encI"al es que en Iugar de e f ec tos d e t ratamiento IJOS Q ahora conside ¡, ramos ef ectos • " s,j " que difieren de un grupo a otro. Como los efectos son aleatorios - inútil ~e3to no ,. di h f al . ,"~ 1 estunar la magn itud de IC os e ecto s e a~o nos para ~n grupo cualquiera. o las diferen" dc Un grupo a ot ro, pero podemos estun ar su varianza. el componente aditivo de la cUS "y " . entre grupos 0A2 . Compro b amos su presencia estimamos su magnitud 52 ,así Ul
::~ porcentaje de con~ribución . a la. variación e~ ~~ análisi~ de la varianza mod:lo 11.
\ cunas ejemplos aclararan las aplicaciones del análisis de varianza modelo 11. Suponga., que queremos determ inar el contenido en DSA de células hepáticas de rata. Cogemos ratas " hacemos tres preparaciones de cada uno de los cinco higados obtenidos. La ~ utsua de "lecturas será de a = 5 grupos con" = 3 Iecturas por grupo. Probablemente las ~ co ratas se han extra ído al azar de la colonia disponible al investigador. Deben ser d~erentes en va rios aspecto s. ge nética y amb ientalmente; pero. no t~nemos informació~ recisa acerca de la naturaleza de estas diferencias. Por tanto, siavenguamcs que la rata , ;¡ene li2eramente más DiVA en sus células hepáticas que la rata 3. poco podemos hace r ron est; información porque es improbable que tengamos ninguna base ~ara llevar hasta el fin este problema. Sin embargo , estaremos interesados en estimar la varianza de. las tres réplicas dentro de un hígado cualquiera y la varianza entre las c~co ratas; es decir. ~~all , " 1 " 'spe ada basándose en las tres rep lnrianza O"A entre ratas ademas de a vananza o e r .. la "" b bl t suria solo de dlferenc13s en c sl La varianza entre las tre s replicas pro a eme n e 'J -' di . , " ·d d D\'-I en diferentes panes e trcnica y posiblemente de diferencias en content o e .... s¡ existiera hi ) L . nz ad itiva entre ratas. -~ . ígado (improbable en un homogenado. a .vana a , d s El erado relauvo de pudiera deberse a diferen cias en ploid ia o fen ómenvs re la~lon a o 'du~i~ia a planear mis variación entre rata s e "intrarratas" (= entre preparaCiones nos. ~~s / relatinmente mis ~studios de este tipo . Si hubiese poca varianza entre las p~eparac lO . ratas por otra parte. , . " . pre paraCiones \ mas · . anación entre las ratas necesitar íamos menos ·1" " "amOS menos ratas ~ mas si 1. . • • I t menor uH llarl liI. vananza entre rata s es proporCiona men e . PIeparacio nes por rata. 1 I en pobladones humanas E · . . . d I "gmento de a pie . . ea \ n. Un estudiO del grado de vanaclon e. ,pI de un e;rupo ra":lal ho~o gen .¡lGdJiamos que rer estudiar diferentes familias dentro . .- trafamilias se na la m.e~la za 10 hermanos y hermanas dentro de cada f amiTla. La V3T1an d' . o de \arian1a entre famlha . . s' euadr' t" ponente a Il l\ . . . ~ I!enetl..: as E a \.ca del error y probariamos un com. : rque ha~ d lttre~Cl a - cial. lperarr amos un componente aditivo de varianza o ~ .pode 1, pIel. E st3n 3~OS espe entre f .. d i ,menta\,.lon : . porque nos as ..... amillas que det erminan el grado e P ~ J I,s Jos \anan1 o ~ o", sde teo· ' Il:nte' . 1 .¡\al; e -untentO Ulteresados en las proporCiones re a . RUe·trOS ~-ono'" proporc" . .. 'netll."a St'i!Un IO nafl an importante inlormaclon ge ,-
"":0
y- - In troducción al análisis de la
varianza
156
, que la varianza entre familia s fue se mayor qu e la Va . s . nética esperaflamo fianza .. rI3 ge h ana s dentro de una fa milia . entre hermanos Y Icors~nt eriore s il ustran los dos tipos de prob le mas q ue co mprende el Los ,ejemp d I II que es mas , pro bable que surjan ' '. anal 1111 en 1fa bai ajo s b lOlogi de varianza mo e o • . 1 ces U blema genera l del diseno de un experimento y a magnitud del er . no 1t O I ocu pa de pr . .• I I , for exr.o 'ferentes nivel es de repli cación . la es como e e rro r en tre replíCllS d ~" menta I a dl · . ent ro d hí d s de ral a error entre lotes. ex pe rime ntos. Y J SI sucesivame n te . Los otro s se t-: ' Isa o , .. . h b . rClltr . ci ón entre e ¡ntcafamillas, entre e mira cm ras, ent re e mt rapoblacio en 1 a a vana I Id I Iac¡ nes y ¡ · varnente ocupándose del problema genera e a re acron en tre variación g :, 1I sucesr , enelu:a
~not ~ica ,
)
Caprtulo 8
Análisis de la varianza de clasificación simple
Ejercicios 7 7, 1
7,2
En un estudio que compara la composición qu ímica de la o rina de chimpa . gorilas (Gastler, Firschein. y Dobzh ansky , 1956) se obt uviero n los siguientesncesr tados. Para 37 chimpancés la varianza dc la cantidad de ácid o glutám ico enres~ . gramos por miligram os de creati nina fue 0,0 1069 . Un est ud io similar ba sad mi 1, seis gorilas dio una varia nza de 0. 12442 . ¿lIay una difer en ci a signifi cativa ent e~ variabilidad en chim pancés y gorilas? SOLUC ION. F, ;:; 11 639 F O" '1 re ::::: 2.90. • • , ,_1 pro ceden de un experiment o rea lizado po r Sew al ", n rlg' ht. eLo s , dat . os siguientes , rULOconejos gigant es polacos y fla mencos y ob tuvo 27 co nejos F I . Se cruzaron esto~ y se ob~uvle ron 112 conejos F 2 • Hemos o btenido los sig uientes datos de longitud del femur de estos co nejos
F, F,
7,J
7.4
n
y
27
83,39 SO,5
112
8
1,05
3,81
, ¿Hay un grad o de va riab Td d ' " I I a slgmflcatlvamente mayor en las longitudes del fémur entre los . co nejos de co nejos ne¡ de la F I ? ¿Que' fenomeno ' genetico bien conocid ' la , F 2 que en1re los os co Demuestra que es ~oO~lt ne Ilu strado por estos dat os? sigue : Y/; ::: (YJ + (rsl eyreprese ntar ~ I va lor de una varia nte individual como entre paréntesis en un /a '1' ! + (Y¡¡ - Y¡" ¿Qué estima cada uno de los t érmino! P i na ISIS de la va ., d ara os datos de la tabl a 73 h¡ na nza mo elo I y en un mo delo II ? , ,. del valor de cada va . , agan se tablas que represen ten la d e scom po S1C10~ en ,sus , res componentes Y - ( )'- , _ -y) (y .. - )--;i )' .. pnmera tabla co n', nante ' lA' -, arta pu es de 35 ' " " 1 1 segunda tabla tod as la ' valo res. Iodos iguales a la media total. En a dlferen: 11 entre la me~ ~ant~:d as de una determinada columna se- rían ig uales a II con¡\1 ara de las desvlaclon., d esa co lumna y la media to tal. Y la última ¡ab" ro .umna, I:stas tahlas r e, cada ,vaTlante ' ' mdlvidual respecto de su med'la d, e p r e~ nt él n esu , ,' - dl\ )' du~le s de L él expreslún (7 JI r , maClo ncs de uno dc los co mpo ncntv! 10 1 bl a a ' - a!cular l'a med 'la y SUm as de cuadrados para cadl
Yaestamos preparado s para estud iar casos reales de análisis de varianza en dive rsa s aplica. rones y modelos. El present e cap ítu lo trata del tipo más se ncillo de aná lisis de varianza, el a,ui/isis de varianza d e clasificación simple, Esto sig nifica que los grupos de muest ras se clasifican por un solo criterio , La s dos interpretaciones de las siete muestras de long itudes del ala de moscas dom ésticas estud iadas en el capitulo anterior, diferent es formulaciones del medio (modelo 1). y progenies de diferent es hembras (modelo 11). representa rían un criterio único de clasificación. Otro s ejemplos se rían diferentes temperat uras a las que se han criado grupos de an imale s o diferent es suelos en los que se han cult ivado muestras de plantas. ~? .Ia secció ~ 8.1 comenzaremos por establecer las fórmu~as básicas,de cál culo,para e~ ¡náhsls de la vananza , ba sadas en los tóp icos in cluidosen el capitulo anterior. La sección 8 ,~ da un ejemplo del caso o rdi nario co n tamaños de muestra iguales. llustrare ~~5 este caso por med io de un análisis de la varianza modelo 1. Puesto que los cálculos bas~cos .para el Ul3I: ' d . oenr la Ilustra.. USIS e la varia nza so n los mismos en los dos modelos. no es necesaClOrepe CKl ' .. 8 3 que expone las n COn un mode lo 11 . Este último modelo se destaca en la sección '. . "'mpl" . d ñ s de muest reo diferentes. ya ¡caclones de calculo secu ndarias que resu ltan e tarna o , el mi que todos los grupos en el aná lisis de la va rianza no han de tener necesarlamented Im llSffi l ~ t¡man d . I íales para un mo e o , tsr o e muestreo. Se ex po nen además algunos cálcu os especr . larmente sencillas par~~ ió n de compo nentes de la varianza . La s fórmulas resul~an p:rt~~ puede aplicarse tlrnb~' caso de dos mu estras (sección 8.4). En el modelo I e es e ie n la prueba 1 mate má ticamen te equivalente. d que es significa tivo. CUando bl . , . , 1 I ha encontra o Ikv. d Un análisis de la vananza rnode o se ' población es desea e nOa l ,. ' n de la rn lSl11a ' if COnt a conclusión de q ue las medias no so é es de medias son di erenlel lastar las medias de d iversas maneras para descubrir qu par ilon ificati\'amente difeentre . s que sean S"el Is lent, 51, y la s medias pueden separarse en gru~ "' Itiples se incluyen en a ' entre SI.' La s llamad as pruebas de corn parac\(Jncs rn 157
•
A
nálisis de la varia nza de clasific ació
n
. 8JrnPl~
158
d las llamadas comparaciones planificad . era trata e b . as di _ 8 5 v 8.6. La pflm d sección de prue as a postenori que se • lt4 secCIOnes ' . la rueba : la segun ,3, . proPo~ das anles de ha cer PidO de su anahsls. como resu la d al jn\'est íga oc Fónnulas para el cálculo S. I de cuadrados Y los grados de libertad tOtales ~ - . os que la suma . .. pUed~ En la sección J.) vun I que pertenecen a vanacron entre grupos y I . descomponerse aditlv~ente en oSLo más sencillo es calcular la suma de cuadrado0,' q", . .' n IJHra~rupos. b I entrt pertenecen a varucic ddrado s intragrupcs para o tener a por la SUStra grupoS. dejando la sum~st; r~~~a no se aplica a los comput~dores digitale s, en ellos b se 10111 S.Cgrupos- d adrados intragrupos no es de unportancia, pero la eUctJ. molestia de calcul.~r s~maUs os a las si2uientes fórmulas de cálculo para estas SUr1a1 tud sí. En la sección 1.5 ega am de cuadrados:
\CU
,
,
1 ( .
,
= L L P - an LLY s.e.,",o,
' (L ' l ') ' = ;;1 L
)'
1 (L ' L, an
o)'
1
Estas fórmulas supone n el mismo tamaño de mu estreo n para cada grupo y en la secciín 8.3 se modificarán para tamaños de muestras diferentes. No obstante, en su forma acnnl bastan para aclarar algunos puntos ge nerales acerca de los procedimientos de cálculcdrl análisis de la varianza. En primer lugar observamos que el segu ndo término restado en cad a suma de ~~dradlJl es idéntico. Este término representa la suma de todas Ja s variantes en el anahsl~ de b varianza Ila suma total), elevada al cuadrado y dividida por el número total de vanan:6 Es comparable al segundo término de la suma de cuadrado s ordinaria [expresión (3.I JI Este término se denom ina a veces término de corrección (abreviado T. C}, El primer término para la suma de cuadrados total es simp le. Es la suma de todosk» cuadrados de las variantes de la tabla de análisis de varianza . Así, la suma de euadnd05 t~ta l, que de scribe la variación de una sola muestra no estructurada de 011 item~. el sunplemente la fórmula familiar de la SUma de cuadrados de la expresión (3.7). 3d El primer término de la suma de cuadrados entre grupo s se ob tiene elevando al ~ ...~ do la suma de los ítem d . . . s e cada grupo , dividiendo cada cuadrado por su lamano . udemos preguntar cómo sería posible que la M. ·g rupos. S· hay componente na . . . d ndienres I no lItUe recordarse qu e los dos so n estimadores 10 epe "" d de la varianza entre ~nivo de la varianza entre grupo s, es tan probable q~e el estima or ~~pos sea menar como que sea mayor que la varia nza mt~agrupo:;átiCas se exponen tamo .las expresiones para los valores esperados de las med~s ~~ Son las expresiones que len en la primera tabla de análisis de la varianza del cua ro .. Ir: han aprendido en el cap ítulo anterior para un modelo 1. _¡ los cálculos del cuadro en ~ . . denrn ~d e parecer que llevamos un número mnecesano drados del error. cann a •• I Esto es necesario a veces para asegurar que Ia SU m' de coa . ~ sufiCiente exa ctitud . . d F se han calculado por ~te~' otno v · I crítiCOS Ie lactO ·'n annomca). 2 es relativamente grande, los va ores JII en interpa (Jo armónica en la tabla V (véase nota al pie de la tab a U-'
C
Análisis de la varianza
rSIs de
160
la varianza de clas if icación si mple 161
AORO 8,1 IconllflUaC¡ónl
~- CUADRO ~. I
I 'fi C3c ión simple, con tamaños de muestra igual '1' . de la \'3I1.1flZ.3 de ctast I ~. Ana ISIS . . " de diferent es azúcares e n la. lo ngit ud , en unid a El efecto de b a~~I~nI1 4 = mm), de seccio nes de guisant es crecida s en euld~s dt! micrómetro ocular . d uxína ' n = 10 (réplicas por gru po) . Este es un an · ~O lk lelidos y en presenCIa e a a tts :0 estar{amos en co ndicione s de interpretar difereecas entre larvas de ningún huésped. ya que no sabemos nada de los orígenes de los cotejos, .' obaante, los biólogos de poblaciones se interesan por es tos análisis porque ofrecen una respues a a las siguientes cuestiones. ¿Son las varianzas de las medias de 105 caracteres larvuio\ entre huéspedes mavcres que las esperadas basándose en la s varianzas de los caracteres intnhuéspedes? Pod e~o s calcular la varianz a media de la anchura dd escudo larval en un huésped. Este será nuestro término "error" en el análisis de la VifWIU. Después COntrastamos la media cuadrática entre grupos obse rvada Y vemos si x.mlent un componente _.1 d I dt d la P acurvo e a varianza. ¿Qué represe nta ría tal componente a I t' hui;d va.r~nu La media cuadrática int rah uéspedes (es decir , de las larvas en un exper (;~u~n, representa diferencias genéticas entre las larvas y diferencias en 1.!5 J.J a r le tale de esta la La ' d estn difere .liCito fK.¡f s rvas. var.lanza adit iva entre hu éspedes ernu . h élpedet ue a ent re las larvas, debjda posible mente a diferencias entre jQs e in a ¡¡ na Tamb ' d . . tre PI Iarv ~ ten pue e deberse a difere ncias ge netlcas en e re · Jra faroilta de garrapatas. o al meno s una població n C~ : r .J !pe rr en tre í de lo que lo está n co n las larvas de garrap.1U ~ e P el nteré e á en las magnit udes de las va rianzas- El! Vr ~ IJ de é te e un 1.:310 claro de análi 15 de la var
de clasificación simple
~ na II
la
. lamente para presen t ar un regi' stro COm 1 h n dado aqu r so . J P etc d~l Los valores nitk.'Os st a . ramos con est e eJemp~. no nos Preocupam el cal • _ ~ I - - orrlinarwnenlC'. 3I enJren~. . de la razón de vananzas obse rvada F :::::. 49 33"'. Jll41lSlS· F L! compara- lOO F bid ' , O) eSTOS" res de' . . . :onserv31ivo (13 13 U a a mmediata COn ' de • ~ . . el valor mUro lo. hioé Ia. La pro b abilidad dmerlOS = ss> . fa re-hazar la rpotesrs nu F . 1. • . fini eque dl nos :on\-encena p3 ~jos de libert a ._ ~ tanto romo lo h3 C'en,~r azar escas~ 10 lm~e s~~lment epe !te. los cinco grupos dIfieran red un efecto ad ínvo de tratamiento . Inhibiendo apar q, azúcares _,.lP ' ucen itud di ' fiJo S¡n duda )os nd en nsecuencia la Ionguu e as secCiones de gu-C'nlt. menU el cre.;lmieotO ~ r~une o l$ir¡.
la varia nza
.. ". -
37--t
3W
...
3.i l 34... J 4 'i ,
,r
.!~1 7 ,:,
.;.')44
o,
S
10
1 t o~ !I-'\O
I ,) - - -r-»
": P Futnt~;
_;J. _._
l {i4::! I::!I
Dat os de P. A. Th om as.
Tabla de análisis de la varianza Objeto d e la variaciÓ',~n
r - y Entre grup os (ent re hu éspedes) r - r lntragrupo s (error. ent re larvas en un huésped) r- Y Total
g.l. ....:~
F, .\I,e. S,e. -::::-_ _-=;-:---~;::
.'
3
b OS
ro'- -
""
3;;:'
t 14,5
36
S;!b ' •
55'6
4,-14 •• r
du ..
"'['.
I
I
o ...
"
"
e E o•
u
;:::~ :! ::: 1.. :::.:.--
:":.
!: "
x
-~
,,
~": :"l
Q,
,
-e
• v ~
•
~
"
••
~
::le • ¡:; -o 'O '¡; ::1 'ti
e O o .o
.....
--
'"
"'l . _
..\1 :':::e E :> :;¡
B
-
• •
• ::: 183
-
(l'\ 'IlI1111I~l l' IÚnl
ClI. \ Il R O Q.I
~
( u lcu l" .f nrelimínarrs 1. Suma " 'Ial-
"
~
, ~" )" -
¿
.!ti l. '.¡
: . Suma •r e lo s ..: lI 'Hl rit d n.~ dt' las Oh S..-rvacio ncs J . S um;i J ..' lo s
l'u ,¡d radl l S
de la s
S lI IlI llS
,L L"
"
L
)'2 -
(7 ,111)2
+ ... + ( 12 ,:\0 )1 _
5065,1530
de s ubg r upo ( ca si lla), d ivid ida po r e t t am añ o d e mu estre o d e lo s su h gru p o s
"' _ L_L
('-. ..\ ' ~ _ [(8-1 ,49)' + ... + (98,GI)'J
_
8
n
('
" " .... Su m a J(' los c uad rad os de las su m as d e fila d ivid id a por el tamaño de m uestreo de una fila = L-L~ L bn
- 46G3,G317
}')'
[(2-15,00) ' + (216,74)'J = (3 X 8) ~ 4458,3844
t s " )' L. \L L. y e
5..Suma de lo s c uad rado s de las su mas de fila d ividida por el ta maño d e muestreo de una fil a =
un
~ [(143,92)'
+ (121,82)' + (196,00)' ]
~ 4623 0674
(2X8)
,
6. Sum a total al cuadrado y dividida por el tamaño de muestreo total = térm in o de co rrecció n T.C.
1.
s.e. l o to \
=
• L. • L.• },) - T.e. L.
s .c.•..•,.." . .... . _ L" L" _(",n .,r. }'
M.
1 I
s . (- ~ (s . c:::
,( E 2). ste ca . . da co n una para el otro tratamiento . 51e par se e ~"in para un frata ml,C ?dIOva asoc l~nados dos veces o de do s individuo s COn Cx pc r ie no~pooe de ' os indivi UDS exam l . tlasco 1os rmsm d rdenar lógicamente los dato s como un analisis de la Va ' muo nes pa raque ~a moso TI3nQ de clasificación dobl"e. ste punto Supongamos que med iIrnos eI 1ano muscular de ti Vamos a exp1car e · .' f " di n &llJPo , di id los sometemos a varios ejercIc Ios rsrcos y me Irnos o tra Vez su de m IVIUOS. .individu " haa SI sid o exam .ma d o d os veces .poo tono l mismo grupo de os mu scu 1ar . eomO e l' ' emol r pa rejas nu est ras lect uras de tono muscu ar , representando cada parcJ'a I d po d o. en" , ícío ) E d l I t . d as , un individuo (antes y después.d,el e~~rc lc lo . S!OS a ? ~ ~, ra an apropia ame nle por Un aná lisis de la varianza de clasificac ió n doble sin repl icación, qu e en este caso sería una prueba de comparac io nes s mis . , y no se ex . • "n'"de afl3'lisis de. la vananza mu estra q ue hay Una dif . ponen COn detall L . 1 d I erencla ah ' e. a 11bb . jros cefa hcos entre os os grupos de edad S· amente Significativa une .. ' 'se supo . en kil per un co nsiderable com po nente aditivo de la varianz ne que la Interacc ió n es " t t ' . .a entre las níñ ,e[l), hay dableme nte d·f I ere nc ras an o ge net lcas Como amb ís t i m a s. que represe n. ' du l' In a es !I~1 método para ana IZar mode los de comparac"one 1: 01ro , la bi [.l pora comparacIones apareadas. Es muy sencill as apareadas d . es len conocida ptUe~ Imitad del cuadro 9.3, Comp rueba si la media de lasd; aphc.ar y se ilustra en la lI!un ' lectu ras en las do s colum nas es sig nificat ivamente dif erenclas de mu estreo entre de ves " - en cero . El error estándar COn el erente " P, e la hipótesis nu la sitúa al de una mediI~ hi'potetao q~.indar de la diferencia media. T iene que calcularse la co~u se dcont.rasta e~ta es el "'" eta en la co lum na (4) d e 1a ta bl a de datos del cuadro 9 um na e "1 diferenCiaS- y se 3 Lo ,[/Sta I . las m ¡ " s ca culos SOn .m. uy r illas y las co nc usiones son as mismas que para el análisis de la var¡ ,~ " 1 1 l a vananza de clasífíca c~n doble. Este es o tro ejernp 1) en e cua obtenemos el valor de F dentro del .• - '00 cua ndo elevamos al cuad rado el valor de I j ' s error de [NOIN , unque la prueba I de comparaciones apareadas es el método trad icíonal 1 .\ ~ . ... parareso ver !Sit tipo de problema, prererimos el análisis de la varianza de clasificación d bl S . pesado, evita " 1la 11 ar un~ raiz " cuadrada, y tiene la ventaja de proporeio. o e" u cilculo no es mas 0lI una media del compo nente de la varianza entre filas (bloques). Este conocimiento es útil por~ue s.i no hay c~~ ~one n t~ a_d itivo significativo de la varianza entre bloques, se fOlría simplificar el an álisis y dise ño de estudios posteriores similares, utilizando un milisis de la va rianza comple tamente alea rorizado .
f;rririos 9 1.1
Swanso n, Latshaw, y Tague ( 192 1) determinaron ele ctrcmétricamen te el pH del suelo para varias mue stras de suelo de Kansas. Más abajo se present a un extracto de sus datos (sue los ácidos ), ¿Difieren en pH los subsuelos de los suelos de la _ superficie? SO LUC ION . F j = 0,894 . pR en ]á pH en el Condado
Finney \lon.tgo mery 110'upban 1t'l' ell J" ,U Sbawnee Cherokee Greenwood
~ontgome ry
cb"tgomery (}¡erokee erokee Cbtrokee
Rico en sed imentos de arcilla Sedimento arcilloso en la cumbre Sed imen to de arcilla morena . Sed imento arci lloso con piedras precIOsas Sed imento arcilloso de Colby Sedimento arcilloso de Crawford Sedime nto arcilloso de Oswego Cumbre de sedi mento arcilloso Sedimento arcilloso Cherokee Sed ime nto arci lloso Oswego Sed imento arci lloso Bates Sed llne nlo arcilloso CheHll\ee
6,5'j' 6,77 6,53
6, 'j' I
.' -
6 _·'
0,01
,I)~.J
• 111
~, ,,.
.í,56 " J"' ", . - \l:'
.. l',55 ~
li,53
---~~~~-~Se d ime n to utciflo so Nel,sho
I var ianza de cla sif icación doble AnáliSis de a . 202
~,J
9. ~
203
Siguie ntes se han e xt ra ido de Un estudio . (..os datoS LoS dat os re p resent an pesos secos med ios mas (e amplío de So kal y Harten (1 9 64 ). , S Tri bolium castaneum, criados a una d e nd m g) de tres genotipos de rabaJ O , . nS1 ad de 20 e b ca es d harin a. Las cu at ro se n es de ex peri me ntos re pre .scara aros por ~ramo e 5entan rép li cas. Genotipo!
Guernsey Ho lstein·Friesian J Canadian Aysh ¡re '[ d uro 2 años Madu en2e>, ' 2 añ os ' 0 1 10 5 Madura J t a 2 años Madura Na dura fa anOl 5,30 3,40 4,54 3 ,79 4,29 3,92 1,44 3,74 4,80 ~,j5 , ' 4 4,50 3,55 5,1 8 3,66 4,95 4,37 4,01 6,45 ~ l' ' .3,83 4,59 5,75 4,43 3,58 4,47 4,25 3,17 5,18 5,25 "" 3,95 5,04 504 , 4,00 3,38 4,28 3,11 3,75 4 149 4,;6 4,83 4 43 4,64 , 3 ,7 1 , '4 4,62 4,07 4,08 4,10 ~t'" 5,18 4,55 4,79 3.iO 4,29 3,94 4,10 3,90 4,00 5,70 472 p 3 ,30 4,72 4,97 4,S5 3,59 4,38 4,41 5,4 1 5 ~s -' 3,93 3,88 5 , 3~ 4,66 3,95 3,55 4,11 3,94 4,77 4,SS ' '8 :J,_ 4,4ú 5,39 3,S8 4,46 3,5.5 4,37 4,11 5,1 8 6,.» 5,\)7 4,66 3,54 4,33 ." 4,25 5,05 3,;3 3,43 °" r'3 ;¡~_
-
Y
9.3
40,03 4,003
4J,I i 4,117
-n,66 4 ~66
-
4.5,1 1
...L
48,48
4,511
4,Sot8
50,52 5,052
37,2 1 3 ,721
36 ,18 3,61 8
52,45
5340 ,
5,245 5,WI
Y' = 2059,6109
Bla kestee ( 1921 ) estudió las razones longitud /an chura de las hojas de plantas de se millero de segunda clase de dos tipo s de hier bas lla m a d as gl obo (G) y nominal INI. Tres semillas de cada tipo se plantaron en 16 ma cetas . ¿H ay eviden cia suficrente para concluir que glo bo y nominal difieren en raz ón longitud /anchura? Numero de identificación Tipos de macela G N 11).')..1.3
1"...::..14
I,&i I,&S
If.ll'~
J ,.1 ~ 1lA;
1&;-:..'1)
11)71)7 Ifjif~ )f,77(J
)f/771 H'i7n 11177.'} Ifj77fj 11,777 11,7XJ, IfJ7's1 IfJ7fs7 )f,71fJ
1 ;1 ~
1,70 I :..~
1 ,4~~
l,4k I,2Js 1" J r ·' 1,1', I 'Jf' '" 1,47 1/,2 I;S7
1,;3 ] ,70
1,6 1 I 4~
1,76 1, 4M: J ,l.H J ,71 I ;,!J 1,!i2
1 1·~2
1,44 1,4.", ',·1.i I¡,7 1,2'¿ I,n 1/.01, I i"
,
I ,(J~,
1,fj4
1\71 I f 'l ~ I,fi'i I,.'i~
1,.'iIJ ',11 1,11 I,4 ) I 'fJ ,
J /,1;
1,411
++
1
0,958 0,97 1 0 ,927 0,97 1
2 3
Razas
[ r
S eries
2 11 8 2,00 2,41 1,93 2 ,32
2,48 2lJJ I p4
2,23 2,12 2 ,11 2,00 2 ,23 2,11 2,18
l,!J :~
2,13 1p;,
1,77
2 ,lJ:~
~ IOI ¡
I, ~fj
2 ,f1(¡ 1, ~ 7
1,!1 4 l ,si
2,2 -\
2,00
1 ,7~1
2,"'-' 2 , 10
I ,f'S!i
2;32
2 ,18 260 2 :00 1190
z.oo 2,1ü 2,2~1
2 ,10 2 ,O~
1,!Io¿ 1,SO 2';'ale que los €ij nen dos mu estras y en realí a e cualqu ie r tipo de " nt T - de 1.1 varianza para . d am isis d de an~ ISIS . Id J d l'on"Qn: as en un grupo e muestra s es un prerrequisit . e
la \'ananza. La tgua Q b e "d,'s'icas Sinónimos de esta condición son homoge" Odlmpor. , . e, ad de arias prue as e s · ran ~e para v edasticidad , Este término, etimol ógicamente griego, significa ' h I'oruzn:as u omosc . dd . Igual .. díc¡ contraria (deslgualda e van anzas en tre muestras) se de . disperslon' la con icion d ' d nomina ' .. ' 'cid. d Como suponemos que ca a vananza e muestreo es una estun neterosced'asnct a . h id d aClOn rni lanza paramétrica v a n ' el supuesto de orn ogenei a de las varianzas,'lene de laa nusma sen tido intuitivo. . . . Ya hemos visto cómo comprobar SI dos mues~ras son ho~~s~ed astlcas antes de realizar rueba { de las di ferencias entre dos medias o un anál isis de la varianza para d P una . H o : . 0 21 y 1/ l .. a 2....L 2 05 muestras: utilizamos una prueba F para 1as h¡rpotesrs l ..,... 02.como se ha demostrado en la sección 7.3 y en el cuadro 7. 1. Para mas de dos mu estras hay un método "rápido y malo" , preferido por muchos debido a su sim.plicidad . Se trata de la prueba Fmí •. Esta prueba cuenta con la distribu ción de probabilidad acumulativa de un eSladísneo. que es la razón de varianzas de la mayor a la menor de diferentes varianzas de muestreo. Esta distribución se presenta en la tabla VI. Vamos a supo ner que tenemos seis muestras an tropológicas de 10 longitudes de hueso cada una , para las cuales queremos hacer un análisis de la varianza. Las varianzas de las se is muestras varían de 1,2 a 10,8. Calculamos la máxima razón de varianzas s~ áx/S:n í n = 10 ,8/1 ,2 = 9 ,0 y la comparamos con Fm í l "¿a ,, j ,cuyos valores críticos se encuentra n en la tabla VI, Para a = 6 y IJ = /1 _ 1, Fmíl es 7,80 y 12 ,1 a los niveles de significación dei S % Y 1 %, respectivamente. Conclu~os que las varianzas de las seis muestras son significat ivame nte heterogéneas. ¿Qu~ puede causar tal heteroge neidad? En es te caso , sospecha mos que algunas de las poblaciones son inherentemente más va riab les que o tras. Ciertas razas o especies son re~atlvame~te u ni~ormes para un ca rácter mi entras que o tras son muy variab les para el si d ' mismo carac ter. En un análilIS e ai vananza que represen te los resultados de un expen' danzad es muy posible que una muest ra se haya obtenido bajo condiciones menos estan erizadas que las otras y , , h por consiguiente tenga una varianza supe rior. Hay tambl"len muc os casos en que. la he te rogene id . . , .lOcor ree13 di r ad de vananzas es función de una elección . , I, e a escala de medida las ' . ' . uas vananzas va nan como funciones de las medias. ASI pues a dI'ferencias ent re las med i . . . ' bl que sigue n l' d' 'h .. as orlglOan va rianzas heterogéneas. Por ejemplo, en las vana es ¡¡ IUn UC lon de Po' I ' d' Ylas pobl¡¡cifmes Con medo 15son, a va nanza es en realidad igual a la me la, , nes de l su puesto de las h mayores tendrán por Io tanto varia nzas mayores. Estas excePCl. ' f 3Cl ' " l1le n,epor .una tran rormatlrJ n adecu' d(lmllscedasticidad pued en a veces correglTse " · . ,O . Uo pnmIer eX¡¡men llIpldll C'JO rea a, Olmo . , se di M:ut e postenormente en este cap ltu " d ad es com proha r la co rrcl acJO " n entre as me dla y la Vanan/" pecl f) a a hel erosced asllcl . as (, entre la. med ' I , danzas i1umentan Con las media ( la s y os rangos de la s muestras. Si aS ,va ~_ (V (án apPJxlmadam cI,lmf J en una di slribución de l'o isSII Il ) h s ral. on es S2I r ó si ) JO lr d d t ri e u mslanle. I . • 20 . calculamos la siguiente cantlJ aJ
( u. _ n~nl) /11 '12(111
I I~
11 1 -\
I}
Supuestos teóricos del anális is de la varianZa 214
CUA DRO 10.1 (continuación) ., . islTibuc¡on normal. El denominador 1'" e d la te . jmad amen 111 - s Un que sIgue aprox a la si nifica ción de en la tab la respe ct ~ a los valo a co nstante. Se bu sc g prueba de una cola o de dos co las segu n requi res .. d para una . ' lera I Crl flCOS e "¡""d ece n valores ligados. la formula ant er tor SI:: mod ifica a hipótesis. Cuan o apa r como sigue :
's
í
)
En esta expresió n Ti es una función de, ti' el ~ úmero de variante s ligadas en el grupo de ligam ie nto t. (Esta t no esta relacionada con la t de St udent.) La función es Ti = tJ - ti , calculada má s sencillamente co mo (ti - I )t ·(I · + 1) Como en la mayoría de los casos el grupo ligado va riará de t = :2 ~ : = I ci ligamientos. damos una pequeña tabla de T sobre este rango ; la suma de T· se hace sobre los m ligam ie ntos diferentes. 1
3 24
1,
T,
6
4
UO
120
U
-,
S
o
210
33u
,50-1
720
10 000
•
Por ejemplo, SI tuviésemos que calcular L Ti para el pro blema anterior (no nec.esano puesto que n I < ~ O) , calcularíamos ti = 2 para las do s prim eras vanantes ligadas (1 07 un idades del mi crómetro). Igualment e. co nstruirí amos una tabla para todos los valores de ti y Ti de este problema. 1,
2
2
2
T,
6
6
6
-6
o
•
2
2
3
6
6
24
L T, = 6 + 6 + ... + 24 = 60
suces~amente . Si bien esto s dat I T . los metodos paramén¡ os ciasi icadc s u ordenados no podr ían ser nnal izados por . ICOS ya est udt d I ' . as del cuadro 10.1 so n completamente aplicables. la os. as técnic El
.
.. metodo de cilculo del estadístic . " y W¡Jcoxon es directo o de muestreo U para las pruebas de Mann-Wllltnt) COmo se demuest . r .. ara - l. \.• ,J se exponen en I 1 bl la en el cuadro 10 l Lo s valores cn rícos P de a a a XIII q . . 1 año muestreo mayor!1 l < 20 La . uue es adecuada para casos en lo s que e tarn de una cola. P3Ta una prue b'· d ' s probabilidad es de la labia X I II supo ne n una prueba probabilidad represe ntado e a e dos colas se debe ría mult ipli ca r por dos el valor de' la aparece cau al final del cuad" e"lotabla. Cua ndo " 1 > 20 se calcula la expresión que de·v lante ro _1. I'u t ' u03 normal , consúltese la tabl. d el¡ o que esta expresió n se d istribuye como des a e I (¡é1bla 11I ,. para t ,, (.; , ) util izaudu prubabilida , T
,
teóricOS de! análisis de la va r ianza
, .,eSIOS '~". 2 15 colas depend iendo de la hipót esis. Un . dos o 1 les reou ¡ a compllcac Ion " a d¡leional surge d lt 1l[l3 S I¡bllri3 ro 10.1. No obstante. se necesita un nÚmero considerable qu~ se muestra al fi nal Jd (U ad I esu1tado de la prueb a apreciableme nte. l as ~e ligamientos paraque . '[~ll :l r : po r 1o tanto la fórmul Co nceCClones lIt> I" cramcnte e l va io d r e t S' ' . para l¡Igamic ntos JomCl1lan I¡; a Sin corregir es más conserva. 1~1.
niente adq uirir un a comprensión intuitiva del f d ~'()nve . d un ame nto de 1 s E e Mann-Wh¡tney po emos co nsiderar dos Situac 'o es a prueba. En d Lo I1rUe ba . id 1 nes extrema s' e ur tras se so lapa n Y COlnC I en completamente' en el ot ' . n un caso las J smues . 1 ' ro están bastante se d o undo caso. SI to mamo s a muestra con las variantes d pac a as. r En el se la mu estra que se co ntra sta a su izquie rda' es d e. meno valor. no habrá nunlOS Je di ' b . . ecu, podemes pasar cada ~~ .....ación de la muestra e va ores m as ajes sin que tenga ningún üem d I d l1\IíC" •. d P I t ra r ¡ . h bié e a e valores IIlÍp llOSa su ízqu ier a. ~cf e . co n ran? SI u ~esemos empezado por la segu nda todos untos de la muestra m error estarían a la IZquierda de cada punto di ' . OSP 1 e a superior ~ue5trO rccuen to to.t a sert a po r ta nto el recuento tot al de una muestra multiplic ado por ot31de observaCio ne s de la segu nda muestra, lo cual da 111 fI" De este modo t I1 , .l I d 1 . pues o ~ue se nos ha die 10 q ue tom emo s ,e mayor e OSdos valores. la suma de los recuentos e onln: - C. nuestro resultado serta en este caso 1I ¡ 1l2 • Por otra parte. si las dos muestras coincidl.' n complet amente. entonces para cada punto de una muestra tendríamos los puntos ínfetiores a él má s med io punt o para el valor ligado que represe nta esa obse rvación cnla segunda muestra.el cual está ex actame nte al mismo nivel que la observación que se rcsdera. Una corta expe rimentac ió n de mostrará que este valor es [n(n - I )/~] + (nf2) =",2 /]. Nat uralmente el rango d e po sibles valores de U debe estar entre éste y ni n2• Y el norcrjticc debe estar en algún punto dent ro de este rango. Como resu ltado de las pruebas del cuad ro 10.1 nuestra concl usió n es que las dos muestras difieren sig nificativame nte en la distribución de la lo ngitud de la base del quel icero. Está claro que las maripo sas de la muestra A t ienen las bases del quelícero más largas que I3s de la muest ra B. Finalmente presentaremo s un método no param étrico para el modelo de ro,mp ar3ci~. !leS apareadas, disc ut ido en la secc ió n 9.3 e ilustrado en el cuadro 9.3. El m étodo mas IDIpliamente utiliz ado es la prueba de rangos con signo de U'ilCOXOfl , ilust rado en .1.'1 cuadro 10.2. El ejemplo al qu e se ap lic a aún no se ha encontrado. Registra eltamano .1' 1 . d 1 los • 11 de camada en do s razas de cobayas mant enid as en grandes ro omas ~ran e de 1IIOS 1916 hasta 1924 . Cad a uno de estos valores es el promedio de un gran numero '1"' 9 adas. Obsérvese el paralelismo e n los cambios de la variable en las dos razas~l~ur3nte 11 y 191 8 ( _ de cuidados v a limentos anos de gue rra para lo s EE.UU.), una escasez .. . conduJ'o a d d E ruante voln eron mejores rond. . un esce nso en el núm ero de crías por cama a. n , Iq.. .. 1ClOnes 1 ' nte Ob secvcse que en - e 0[.... . ' e tamaño medio de cam ada aumento nuevam . . . ' .1 l:'1u ~tuaci o' \1.'7 se r n . . . t U nriendo que o as ;1 \,. ," so'd e eja en ambas líneas un a caída substgUlen e. s ~ d tratados como n e causa um b iient al. Es p ues mu y CO llvemcn . te que los ar os sean Olmna ' e .' \' las diferencia s de r raclU nes a ' . rando i o s J ILOS " cluno re llh ¡;a¡; lllll~ S(.' ) del cuadro IO'.r1l.a~ pareati as, conside como lo 1 . t n La columna .' e . pr~nt 1 S rat amlcnt o s fijo s q ue se contras a . -b r de comparaC Iones a as dif . d ' , I ·Z ~H · ' una prut a . lParead ercnclas ('0 11 las cuales po ClJ rea I se difcrc \ -ias se ordenan Sin as co . '·1 . I 'sl:! S II('r\;1 \,. . 1 ClJl1liJ, nvc llclu na l. Pa ra la prueba lit' \\ 1 \,.' 1,1.\ 0 1 . e .. _, '¡'slfi 'acomú I.y a (fur el .' " . l . I t. 1ll11ll111:! ~t l J . \,. ·\ Ig llo de tund o que la d lk n'll l'l a ;l 1St) U .1 I
'Q
SupuestoS teór icos de l aná lisis de la varianza
S~p"
216
estOS
teóricoS de l análisis de la varianza 217
, 'bsolota máx ima (de las nueve diferencias) 1 if'i a d - d 1 fil se eras¡ lea co ( di:c n omo prome lOS e as l as; aSI pues si la cu me J. Las fila s ligad 1ula C l ' · '. arta y quinta d'f ' as ac ¡tc a nitud abso lut a ~e es a.slg na r l~ a ambas la fila 4,5. Un _ I erencla tienen la rníSJ11a rn ~ l'nal de cada diferencia se a sig na a la fila co ~ Vez calculadas las filas . no ong fil . ivas o d rrespondlente A ' ' d~ suma de las I as posut vas o e las negativas, la qu e sea . con tm uac iú n se ¡1leuJa lanlln , a T ) Y se com pa ra co n el valor crít ico de T e 1 tblaX en valo r absoluto denoI rrespondiente s ' de la significació n de lanSUata dla XIV (st . A Ia vista ' para eI tamano JIllestraB ~~cnc un tamaño de camada diferente del de la raz ~3a Ee fdas. es ev idente que , "" I 1 a . sta es una prueb '". calizar, pero natura men te no es tan efic iente Como I . a muy fjc~ d~etrJr'ca la cual sería preferible si se cumplie se n lo s rcq: ' ~Ot rrespondl~nte prueba t nlrarn tar, que se necesitan . , difet enc¡ia s Como min imo pISlas necesano s Hay rseis I erenc l¡ ' que r hlce no W'I E · ara Tea llar la prueba de co n signo de I coxo n. n SC IS comparacione s apareadas tod I dií . S .~ . 1 b . as as I erencus dtbenser del mismo slg nod Pa ra q ue a p r~l~ a sea sig nifica tiva al 5 %. d e ut üizar una aproximación a la curva una muestra gran e se pu e I 3 PlJ ID ' Ob . 1 norma .q ue se píesenta en el cuadro ._. serve se q ue as magnitudes absolutas de estas diferencias desempeñan un papel. solame nte en tanto en Cua nto afecte n a las posicio ne s de las cn' 13
(1) A ño
Raza B
Raza 1]
JIUG HIl j
2,68
2,36 2,4 1 2,39 •) 85
2,r.o 2,-13
1915 1919
-,
" "" -" 2,9-l ., -, '
nl".?O 1921 1u:.'2 1923 1924
-,o,¡"-
de Hg como función de la Fig . 11. 2. Presión sangu inea de un a~unal en mm\ tueSlreo -ependo para una co nce nt ració n de droga en p g por cm de sangre.. de terminada concentraCIión de droga. -
En . .. . a como si estas distribucio~s norma1.. _ reahdad hav clarame nte una disperslOn conunu . h hiendo despu és de todo. '" d í [ } . . as nas a otras. a . s . erentes estuviesen apiladas muy proxun u is cuale uiera. En los casos.~aro ;na mflTlidad de 'vala res in te rmedios de .r entre d~S d~~tríbuCiones de r estanan I~SJCr ...~ qUe la variab le independiente es discontinua. as Jo' 1...... 0 de aqueUos puntos ~ a ...-;:nte . SO lamente. a"'o - separadas ent re sí \" hallanan Un ejemplo de es I e caso sena eJ te¡ • - deO "eo ~
."
-- - - - - -- -: 1--: ., -: , -, ,,:: '. : , --.. - - --
ec
e•
-
e
11 .3 Los cálculos básicos (un solo Y para cada valor de X)
_
" o
•
"c.
'j
•
•
•
." oC "e •
-'"- -- .-l
..::
.." "
o
z '-
·:;~
l~
...
..
-
z
;::;
."JO"" " . ... 'l:.- 'f. ,=,1 ':'1 -: ':' 1 ~ __ _ . ,,"; - ~ '... - ' -," ' ;::;
~
_
_
. ;.:. :.:
---_
'
~
-.J:.
~
:= -
~OC'.
11
~2
u
o v e V
." .-"=
--
~.
-
~
--
_ ..... .:;
.
'l:. •..: ~
~_.
" -" = " ."-• ••""" •• -a • 'o '.• -a" "~ ~" "- E"o e • "• -"> o v o '. " • e -o -o
- ' ;:"' . -
,:.. ~ 1- ~ ". ' -";~~ '='1 _
."
."
~.
~
-."
1--,
- -'" 11
....¡ -' .
- ..: ~ e' -
~¡
.
-
=:""' := __ :'1 II
-.-.--••"
-''f.
'='1 _ ':'1 _ ':'1 _ '=' _ 1 ':'1 _ ,~ ':'1 '='1 ':'1 -
'o
~
Para. aprender l?s cá lculos básicos ne cesar io s para realizar una regresión lineal model~ 1. elegiremos U ?ejemplo con un solo valor de Y po r va riant e indep endiente X. ya queeste es ~as sencillo de calcular. En la próxima sección se m uestra la extensió n a valores replicados de Y por valor único de X. Lo s cálculos ilustrad o s en la tabla 11 .1 se presentan r~ razones ped~?ógieas para facil itar la comprensió n del sign ificado de la regresión. :\l mal de esta seCCK>n aparecen fó rmulas se ncillas de cálculo Los datos en los qu e 'aprend i a regre slon '" procede n de un estudio . de per ' d'da de. '. eremos I agua en el Tnbotiun, corfus I l ' l I Sde ~) role' t II . um , e co eo pte ro de la hari na. Se pesaron nueve o e op eros os coleóptero . di íd I . 'ble) se uardara _ dif s m ¡VI ua es no pcdrian pesa rse co n el equ ipo dispont . .d g 1" • d lis dias e n a erente¡ humed ad es re auva s, y se pesa ro n de nuevo desp ues e.se d ull3 inanición, Se calculó l' - di regresi6n m()d elo I 'I Per Ida de peso en miligramo s para cada lot e. Esto es Sin du ad,d en a que la pe' rd id , d . . y la hume rela tÍV¡¡ e¡ la variable' d , l a e peso es la variable dependiente y I del , In epend)C nte X f ' ' I contro Jn ve~!igad or. 1:1 fJbjcto del a : _, • un e ecto ~e tratam ie nto fijo baja e lativ3) pérdida de peso pu ed e dnal,IS,JS es establece r SI la relación ent re humedad r~ forJll J genera l Y (J + 'X I ser escrna ad ecuadamen te pur una regresión lin eal de a bIJ III. . .Se repre ~ntar ') . h ¡datos fHiu ' ' 1, I') de ,la taul1J ' r' 'gma es se expo ne n en las colum nas ( 1) y.. l' j( J gra Icarnente I f' eX Iste retac In negatriaentrepérd 'd' d en a 19ura 11.3 , en la cual se mu estra qu ~ ' uyeb 1n l i l e p e y) y hUJn ell ad ; al aumenta r la h um edad. dlsfll
225
I II
----: 1= __ -'='-, M:-:: . " -: . ' ="
w 'i:;:;":
>~
'
..
~i
'
-:: :F.' ..: 1': C' I :'l ' o'; ::: ;.. l· -
-'
-;:::"
,t:M .1
1 I
-
:"
'
I
I I
- "=-. .,. .--
- · .. .. · , - ·, .-- - , . :::¡ ' .
~
o
".-: .......... _ ' .• ~ .:.
':'1 _ C'I .,. ....
.:,: h;
...,. '
"; :"1
.....
. '; ,'; '''; : ~ l~ ~ "
-
~
-
~~ ~
•
-o -~
...
-~ ,~
,, .,
z .e -e
·,
..
l~
•
Regrts ~r
225
:;{}(esión
--
pérdjda d. peso. Las medias de pérdida de peso Yhumedad relativa y y X , r . te, se marcan a lo largo de Io~~es de. ~rdenadas. La humedad media es"io~~rv: . :>érdila d. peso med ia es 6.0.. mg.•Como podemos ajustar una linea d .. ) • • aJo d }' I e regr,, · estos dalos. que nos perruna ¡sumar un v r e para ,un va oc dado de X? A no ....n i US obser'\ a:J::)Qes reales se h!3en exactam ente en una l ínea recta, necesita !ler ,'. ro para determinar 12: mejOr colocación posible de la línea de regresión. Gerem~s :.Jr¡ cr », eiud~s han ~.f Q el pnnciplO de ~ín~o~ :ua rados, que vimos por ~~ merJte e - ltuJo 3 IllSlrul.'1lOS sobre la me la arrtme )Ca)' la varianza. Si trazá P era ve e. al ., r v deci l' II ~serno l Una l' . ~t.' 2 ~3 _ _.e . , ~~s eru~I_Jlana Im~a }~ara e a al eje X a la altura de YI ~ :1esv ~ nes. __ esa .Jne2 tI~ !s par4IC s a eje representar ían las deS\: taCKlneJ . ~ ,. LiK_C ?_U es as serreoo ees con respecto a la variable Y (véase fiJgura IIA ,. Er - . 4: . _
227
r ~
'--" "
•,,
s •,
•
~
-o --, 3 :' -2 "
•
"
•
4
,
_ ,3"
•
,
J
r 9
O
r
,· -
-,= , ~-=- f -S•
'% H umedad relativa
,
o
•
I I
• •
,
,
o o
,
, ,
••
~
3
r-
•
,
-,
•
?
x,
•
}(J
2fJ 3l'J -UJ
:A
f"ÁJ
'iO
isf)
~) I (~
X
F'J¡. J !.3. F'hdlda de peso (e 1e~..I:S de te d 'as de ,"an iciémg j de nueve lotes de 25 coleópteros Tr iboUUm U'. I on a nue h Ije .a tao . 1I 1 'Ve umed ades relativas diferentes. DatOS 4 de Iefvrn ( 1CUj.d 1 ••
3 e - idr. .
'~.~r
.J
.J ~_
· Jt
,;rr14_ Ije eitas . ...~l , .~ . • a , e sv"'c~me' " ( y _ Y -J =" y = O. La r ' ce liCll"Jr.e "\"(y _ . L, LiI r.ilI HI. )r (lfr- f Lo. Y/ = ¿ y 2 esmenorquebde'~ rea 4 JJITia de ex . ' - " de} t u. .. 1e' presar esto es que la media antm e UC3 J '""'" e f.I .. r (J d r (Jrd~ ;" :u~rado , Cualquier línea horizOntal traP· e Jidrát . dafla Jrra lU ma de derviacKJnt's dlSl1013 de ~ yer ~ ~4. ~aY1 de Y [distintos de los valores observados de Y en eualquíer caso real))..a des. d .. (r 1 , v se l.7.1)n e una observación Y _ respecto de la línea de regresen el I I • ITiXIIÍZa generalmente por d' Estas desviaciones aún pueden trazarle pa,raJeW al ~ Y y ·x ' 'ncmlo (veaJe f¡gu-r, pero COmo la línea de regresió n es oblicua la cruzan en un J.'Cla ': liS ). La SUma de estas desviacio nes sísue siendo cero l'[. dy.x = O). Y d Rlcum..a •• -. " d' '1 • la RIma e
':,.;' cuadrado¡ da una can¡idad í:( Y - y¡' = s: r.r 'C;;oga d nominllUnl3 ~ C'~ L,) 2 . ~or razones que se aclararán m~,s a~elante. ~ y.x;drí~)(2 entre' una lt1' drados Inexplicable. La recta de regreSlO n lineal mlnUTl2 ro d J teJ mini.le tie pu t . ' conduet J que __ }" x _. ( n os se define como la linea recta que l. ¡"'" una líoeJ que "' Jef • . ' eferillC" u ~ _. Jmetocamente la idea básica es que !itrJJ pr Par. k;)~ fines del -'r. f:Tl ci , ~}e de punTO i:'.'&t. de Itrto ~ntído próxima al mayor numero t""'~ en tirmJI)VJ de bs dllUncll ':l""" I~_ regreslon , es más conveniente defirur proxun h mm' lII1J!J suma de etul - oq d i o ' l ' e s puntos a una línea y utihzar la lota que "!l' crdtrJJ es que la 1"uJeJ · l'Joes ad " • pósltu de eile c:akuJar b 13 ~ pa cu ratl':,as. Lina con!ecuenc a pro: e hit' pero n. prac ~r por el punto X Y üna ~1 más ~nJ ~d r del P nlJX r ~ cal be de e dt regre ión correcta ~rando una reg.lJ alre me es P' (. adradO\ lOexphcahle I: dly \. p¡rJ cada') ~~ n J lit:' rtgr U pe I CICJn (tu dIe ~ I valor mini"' de __ uad ril dl
1,'n 0
228 r
'dad h ay una disminución de 0053"\1 en }' R I ' unl , , ' -e acto . d 1 r Je un I podemos decir qu e para un incremento del 1 % hnan o O COn nueUro ~plo ~:~~ de O.053~.:! mg en pérdida de peso. en umedad relativa. hay edul.l. demos comp1etar_Ia !cuacton ión }' ~ a 4. bX'I Hemos di ¡jDI r , o '[ o?, por el pu nto X, y , Po, lo lamo, Cuando X esu en 13 linea de ~1"es~n Pbién deber ía estar en su media. :\0 podemos decir si est m dlmla. estrn~os ' . o es reaAA ente 351 en ~u< } 13m d tos \ ' 3 qu e no tenemos nmguna vanan te X exaCtamente en 1_ ·trOS 3os •no J . ""'.. sena muy prob able que eI valor obserrado de r estura meutil . Incluso SI L1\;esem • • vese exactamente bI d;" Al fin y al cabo, recuerdese que los valores r de nueslr., b b me w · , .• o ~naclOnes :~ ente son una muest.ra d~ .una població n q~e se centra en torno a ~t Para r ~~ }' == 6.0~~: es decir , util izarn os Y. la media obsernda de CUma una e rmacion :.().j fje l'J ro ed ia . Podemos sustituir estas medias en la expresión (11 .11 :
9
3
,, -,
E -,
o ," 6
>
~rá
!
,," '. 2" 3 -c ." :,1 ')
- -
~u ~ue
r.
I
o
229
"9,e5
' X
\O :!O 30 ' O 50 60 ; 0 % Humedad re lativa
90 100
l =a+bX
r
Fíg, I U, Desviaciones de la línea de regresión para lo s datos de la figura 11.3.
La fó rmula de la pendiente de una línea basada en un valor mínimo de obtie ne por med io del cilculo diferencial. Esta es
= a
a =
+ b.\
r-
b.\
a ~ 6,022 - ( - 0,0532'~)(50,39)
Ld;-.x ~
~
8,i038
kl tanto
L XY br,x = LX'
1
(I1:,
Vamo s a calcular b = L X)' I: '(= para nuestro s datos de pérdida de peso. Primero calculamos las desviaciones de las respectivas medias de X e Y como se muestra en las columnas (3) y (..J ) de la tabla 11.1. Las sumas de estas deSV13CIOnes.L. " _r y",- I" . " " ligeramente diferentes de su valor esperado de cero po r erro res de redondeo. LoS~J~~ dos de estas desviaciones dan las sumas de cuadrados y varianzas en las colum nas ~ .
(7). ~n la columna (6) hemos calculado los productos xy, que en este ejemplo son t~; negativos porque las desviac iones son de distinto signo. Un aumento en la hll,{Tl 'es conduce a una disminución en la pérdida de peso. La suma de estos productos [ .t) o UIU nueva cantidad , denominada suma de productos. Este es un térm ino inadecu3~o ,~ bien establecido., ~ue hace referencia a L XY , 13. suma de los productos de Ia.s desv~~' ~ en lugar de L Ai . la suma de los productos de las variantes. Se recordara que ....¿ ks de~omina SUma de cuadrados, memras que L y2 es la suma de los cu~~r~dos ~ k,"fS vanantes. La SUma de productos es análoga a la SUma de cuadrados. Al dlVldrrb POd ,DI arados de libertad di ' . . resulta e - , , '. . a a COvanall; a por analog ia co n la vartanza que ~.J drvlSDn sím il d I d h encontn::: . lar e a SUma e cuad rados. Se puede recordar que ya se an covananzas ~~er iormente en la secció n 7.4. Obsérvese que la suma de productO,S p~e la ser ' S'I es negativa esto indica una pen ditente n>"(l3ttv1 .. 1, tanto d POSitIVa ". como negatIva. -e ~ mea e r renón: al au t X dism ¡ dífl e de un! d rnen ar • dtSrn muy e r ' Con respecto a esto alias 1 Jer e cuadradO! la al IOlame que _ ~41 ~ 176 ~ ~ _ me pue e ser positiva. En la tabla 11 .1 h am . en e! ,"'-x - 830 138 9.) b = L Xv L X' = 0.05322 , Asi. para un Ul,,,ro tO
"J1 :
~ 8,7038 - O.0532'~X,
e:
Esu es la ecuación que relaciona la pérdida de peso co n la humedad Obsérvese :.t cuando X es cero (humedad cero). la pérdida de pe~ ~st imadJ es ml:yo~~d~ae~~o~c: .~ ~ J a ~ 8,7038 mg. Pero al aumentar X hasta un maxtmo de 100. pe
~isminuiría hasta 3 ,3818 mg.
,. la línea de rearesi ón: simplemente Podemos utilizar la fórmula de regresión para trazar l' _ O : r = 100 \ tratarnos . de.r tale s corno ). ,vados \ .se muestra esmamo¡ y. para dos puntos conve nientes I d. - ob" ' recta entre e!los. Est a linea , alas para '"'" trazarJla.linea de ~~:J h~ea se ha adiICIO nado r ay osDe hecho. .nla fjgu ra 11.6. Obse rvese que pasa P?r el pun.t? dos med ias v otro punto. ;egr~ sión. fre cuentemente util izamos la tnrerseccrcn e as .
d"
Como
-
a = Y -b.\
»jemos escribir la expresión (t 1. 1). }; = a.l- bX. como
1 = (y - b.\) -,- bX =
y
+ b(.\' -
.\
•
• o
Regres'IOn. 230
r 9
n
RegleS IO
23 1
ayor parte de la varianza de Y respecto de la mu t Lo . ado la m . íí bl "d' estra . que falta" la dj¡t1lf1 drados tnexp Ica e t: r .x , que expresa la porción de la S e 1 tal d Y de el/a d'f ' ~ E ' [i b .. o e que. ~I'W' . 'f'c ada por 1 areneras en . . s mexp lea le con respecto a X La dif , 2 1 S.c. 'mexp l'tea ble' L y.x,sedenominala sumad I eren", ro"-ti JUSO 1total. ,L.Y , ya adra1,5 · , i b d 1 d . . eco ra en e elltr p/i~able, ~ ," - y estad asa 'd .as ..esviacionesji = r - Y. Ea las columnas (11) y JOS eX t a el cálculo e esta esviacion y su cuadrado. Obsérvese que " v se . , ' mues r 30 I . I 5 L. , aproxi¡IJ ~ ue L ¡.' = 23.5 1 . A sumar a esta a .C inexplicable = 0.6160 se obtiene ¡n.1 acero ~ 2 + x :=:: 24 .1290, que es igual (salvo errores de redondeo) al valor ~i:::= . ~ependien1emente de 24.1307 en la columna (7). En las secciones que seuen :J!culado 10 1significado de las sumas de cuadrados inexplicable y explicable. rolveremos a m OS a demo strar un método eficiente de cálculo para una ecuación de ..\h~~a ::~atos co n val~res únicos de. r para cada valor de .~ . ~reslonf" te de regre sion L., xy/ 'L.. x· puede volver a escribirse como El roe \Cleo
" d'
e
.
o
~
,
; 6
f
,
.; 3 -e
- -
.~
.)
1
O
L_--t--'-~~~X 10
ee
30 -t0
50 60
ro
-
t d1·.
SO 00 100
% Humedad relativa
hr,x
=
" I:(X - X )(Y - l')
O lA )
n
I:(X - XJ'
egresión lineal ajustada a los dato s de la figura 11.3. Fig. 1 I .6. R
.. o es la suma de cu adrados de X Su fórmula. encontrada
Asimismo
El den~m inador de esta e~presl~ es L X:! = LX2 _
f - r
=
=:~::r~í~:ae~a~a ~~c~ou~'rador
bx (11.3)
y = bx
donde l' se define como la desviación }; - Y. A continuación . u tilizando la ex~r esd'on . para cada uno de nuestros valores dad os d e L lores esHmJ1 os (I 1.1 )," estimamos} os va " 0 0 los va arel } se exponen en la columna (8) de la tabla 11 .1. Se puede n comparar e . observados de Y en la columna C~.). La concordanci.a glob a1 entre Ias do s columnas el. e- r por consbuena. ~ pone de manifiesto que , salvo errores de redo ndeo . L.} = L. Y dii enW guente ? = Y. Sin embargo. nuestros valores reales de Y o rdi nariame nte son I:~r de de los valores estimados Y. Esto es debido a la variac ión individual en torn o a la In" I" .. .. ~ b ede n ca1cu regresen. r- o o stante. la linea de regresión es una base sob re la q ue se pu el . . ' . id en euentJ desvacone s, mejor que a partir de la media aritmét ica Y , ya que se ha teru o valor de X al construirla. .lTlJ. euando ca lcu1amos de sviaciones de cada valor Y obse rvado respecto de su valar esll -uS do (y , Y) = d y. x Y las ponemos en una lista en la co lumna (9), observ~~oS~~e~ro desviaciones exhjoen una de las propiedades de la s desviaciones de una medIa . su . _ O A excepto por errores de redondeo. Asi L ti y . " = O del mismo modo que 'E.I.- 'de co t • ., , . cloneS VI3 n muacon . en la colum na no) calculamos los cuadrado s de estas des os P'O vaIo res obiervados de Y respecto de valores estimado s por regresió . . n Y los sulll 31ll . j-.....• :;; dar una nueva SU ma d d d ~O - , L )2 "' 4 1301 e~ua ra ?S, L. d y T = 0,6160 . Cuando comparamos -sunl3. dt uadTad~' e m ~n L.( Y y)l - ¿ti)' 1( = O,6160 ,observamosq ue la n~e~lino dt r 0r . n uc o menor que la anteno r (ju é ha causado esta reducción . ra con la rne- ~ dt un¡ le ne de med'\01 / una para t,cada valo r de \" cuando se coO1pa l' ~ ". " me ¡¡ antménca de Y Al ' d s de . tener en cue nta diferentes lIIa~nltu e ¿
2 ¡ II .•~ora
aprenderemos una
de la expresión (ti A ), la suma de productos.. La
fórmula habitual es
"
" 'Y
í: xy - L ·\
'o
"
-
"
(L X)(l: YJ
(15)
n
•
" '0
" 1
o:.n
1 do de las dos variables. La expreLa cantidad L X Y es simplemente el producto ~cum.~ a los propiamente dichos para una són (l1.5) se demuestra cn el apéndice A1. 6. os ca , u' l se ilustran en el cuadro l Ll , I I de l' por valo r de eruano n de regrestcn (un so o va or I 11 I . . '. : = utilizando los datos de p érd ida de peso de la tab a . ' de -uadradc! expho.:able [ \ .. . alcular la suma" "': E la EI.. cua~ro l l. l mu e str a t am b le n c?m~ c. le L:d1-.r= Llf - 1/ . s LO - Y)1 Y la suma de cuadrados mexphcab . • •
• o
o
(1\.6)
(LryJ'
L di"s = LY' - LI' .'
ue la suma aro q 1 btense\c.:
d . de01ostra':lon nrn emuestra en el apéndice Al. ? En esta decuadTados explicable es J' ( ~ .ry _ e- r 1 ~ b'X l = b1::rt :::: -(~ .r1) t í: Y' = L -
!f
L y1 ='"
"o " , •, --"- ü" -: •" " = " "" ? -"-.". " •" -
,
I
n= 9
•"
I
•
do en los errores estándar y grad os de libertad d I Basa e Cuadro 11 .3 ; utilizand o el e jtmpIo del cuad ro JI .I .
•
•
•
- e-
,
-.
,•
S10 .
I
•
,
li " ?
""
'"I •I
>.
.-
•
1~
I
e
~
• i><
•
. --
-e
.." -+
I
243
eba de significación Y cálculo de lími tes de conf", - -- - ...., ~n Un solo valor de Y para cada valor de X, TIZ3 de estadísticos de reare.
:.-,
" o s: "
,
I
I
>
-"-.- -.. o --= o "" " ,"'" , '. --- ---"-. -=" " -e -- -"--e ." , "o -" --" -.
'"I
'"I
'"r
o
_
~
-c
"" '"" " " -e" " ,
~
--'. ''-.. -"~
-o
"" t-:: •" -
-~
-="
-" -o "•
-"
"o
-
Sr =
"e
>
S,
o
" •....ra cr, t.
== ...¡¡;;
!
.. [I'~ll ·
I I'
6 Las aplicaciones de la regresión
l~entO S
estado tan ocupados aprendiendo la mecánica del ,'1" d .. id . .. ana ISl5 e regresron que n hemos tern o t lempo para pensar en las diversas aplicaciones d i " •_ o sección consideraremos cuatro aplicaciones más o me nos di t" asregres,JQn. En es ta , de regresión mode lo I IS LO as. e tratan todas en téml U10S . En ..primer lugar podríamos I iabl Y mencionar el estudio . de causalidad. S'1 qu eremos se ber er si SI a variacro rt . en una vana e . es causada por cambios en otra variable.. .l'. mampu ' 1amos .l' en un ex perunen.t o y vemos. SI podernos obtener una regresión significativa de r sobre .r. La idea de causalidad es una .I? ea compleja' .filosófica, que no trat aremos aquí. Indudablemente se ha llamado la atenc i ón desde la mas temprana experiencia cie nt ífica en no co nfu ndir variació n ~o n.~om itante con ca~ salidad . Las variables pueden variar simultáneamente, pero esta eovanacio n puede ser accidental o ambas pueden ser funciones de una causa común que las afecta. Los últimos casos so n ordinariamente regre sión modelo 11 con las dos variables variando librement e. Cuando manipulamos una variable y de scubrimos que estas manipulaciones afectan a una segunda variable, generalme nte estamos segu ros de que la variació n de la variab le independient e X es la causa de la variación de la variable depe ndiente r (no la causa de la variable). No obstante. incluso en este punto es mejo r ser precavido. Cuando ha llamos que la velocidad del latido cardíaco en un animal de sang re fría es una función de la tem peratura ambiente, podemos concluir que la temperatura es una de las causas de las diferencias en frecuencia cardíaca. Puede haber también otros factores que afecte n a la frecuencia cardíaca. Un posible error es invertir la relac ión causa-efecto. Es improb able que algu ien suponga que la frecuencia cardíaca afect~ a la temperatura del amb ie nte general. pero podríamos estar equ ivocados sobre las relaciones causa-efecto entre dos sustancias químicas en la sangre, por ejemplo.. ~\ pesar de estas precaucio nes el análisis de regresión es un mecanismo habituahnente u t illlad~ para e~po· • .. . nifi t · · de r en función de"\ no ner relacione s causales. Mientras que una regresión SJg tea 1\01 • f .. de Ias vari . nes de) 1.J a írmacicn demuestra que los cambios en X sean la causa e as vafla c~ . ' f " de l' .. . íficatlva de ) en unción " contraria es cierta Cuando encontramos regresron no slgn 1 idad . . leíos.: e ir co n bastante segun podemos en todos los casos excepto los mas comp ejos, 10 er d " de Y no • d ' 11) que las eSVIJCJones • (teniendo en cuenta la posibilidad de error e npo afectan a Y. . .. una segunda área general de La descripción de leves y predicciones Clentlf 1ca' es t hacia una descripción .. • .. . ., 1 .. íencias naturales apun an .' _ _A I li ap cacion del an álisis de regreslon. LAS CI I nálisis de regresiOn mece o • . de relaciones . . bles en la naturaleza. Ye. bl anar matemahca entre vana s una de las cuales está ' funci les entre. vana e, I nos penn ite estimar las relaciones uncona tido biológico claramente , ' 1 'empre tienen sen . , b¡ lé SUjeta a error. Estas relaciones funCiona es no SJ .f' il . nar una interpretacJOn Kl 0, I d esultar di IC nd,'entes aszg d podemos ID erpretable. Así en muchos casos pue e r a v R. Cuan o . • . s CO rfespo . 1-' po glca a los estadísticos a y b. o a sus parame~~ t rt uraí una de cuyas partes corn . hacer esto hablamo s de un modelo matematt'v es ni I e~rvas mat emáticas que n~ son , , ifi Sln embargo . as . de las lmeas nentes tiene claro sig nificado c¡cnt I ICO. I . Ia eie nea. la mayon a . I m d 1 ~ .. d importanelJ en .' re stnta simp eo e Os estructurales tambi én son e . J, en las que la función ~ep d dos) a de regresión son cun 'os emp,Ticamenle O/U sta. os.. al como el de mlOUllOS cua ra me . . r un ente no t nte el mejor ajuste matemallco (PO Una se rie de datos obser..-ados.
t
• 24B
Regresión
es otra aplicac i ón de la rcg rcS"l \ T l l 1 ' 1/,¡Jr¡]Clt lll , f ,,.• on. an / m I 111 1.1' 1" U1U Mtl'nn in:1Ja variable ('5 fu nci ón de otra Cú l1l\) e pl\)~ ' ~ l'S.t:l l' ('1.. :1 q l " de 1os co lec hll'l)Jlll.·" lS que• 1'1 sUIH'r\,in-I1C IJ coptcrus es• Una fu n el ". euadro I1 .. donde l'nl'\lnlr3l1h . ' , , nCl On d .- d '1' )l.li"JdO:1 pr('c,un t:lTsl' hasta que punt o cualq uier diferencia e eb Jtns.1J3 C'~ l t' ~ .. ' " d e 1a densid'd n su pen,.' " , uno da e I c d ,,, I11Ul'str3S de co1coptcros es f uncion \~nlI311b~'f\3 a en r.. l" . .. ' .. .. . en la que . 11 d 1 St'UJ 1I11US{ll(\)ll1paTJT role úptcrns de sarrullados en densid'd ~ han dl':WT\' al . • . " " .. . . , . mUYaI que tcncan baja supl'n'I\l' I1CIJ) con lo s criados bajo condicIones O'PI' 1, (\ st cSfl\'1'3 .. ' . " . unas d .:l.3)1 dt'nlel de Ufl3 CIIrva d ~j,.l""u r UC10nes de YI e Y e ~,
te,.
1, fespeCtiTa_
(1 : .:) puede escribirse como
f
que a veces es preferible para el calculo. Para estable.cer la expresión 0 2.2) de un CU:l más general. para las variables } "¡ e Yk • podemos escribirla como
r jJ:
=
¿:y,y, (n
"'-- r 11 2A)
l )s,s,
El coeficiente de co rrelación ' "k puede variar desde -+- 1 para asociación positiva petfecL1 hasta - 1 para asociación n~ativa perfecta. Esto es intuitivam ente evidente cuando consideramos la correlación de una variable y . consigo misma. La expresión (12.4) daría en este caso " i = ¿: y,y,', /¿:yJ¿: yJ = r!yJI¿: yJ = 1, lo cual da. una correlacóa perfecta de ~ 1. Si las desviaciones de una variab le se apareasen con deSV13C10neS idénticas pero opuestas representantes de otra variable, esto daría una correlación de - 1 porquela suma de productos del numerador sería negativa. La pru eba de q ue el coeficiente de correlación está limitado por + 1 y - 1 se dará en breve. 1 Si las variantes siguen una distnbución part icular , la distribución normal birariante. e coeficiente de correlación r j k estimará un parámetro de la dist ribución simbolizado por Pito Vamos a aproximar empíricamente la distribución . Supongamos que se han muestreado cien ñems y medido dos variables en cada ítem, obteniendo de esta manera dos mU~5tn5 de ) 00 variantes. Si se representan estos 100 ítems en una gráfica en la cual las variables y I e y 2 sean las coordenadas, se obtendrá un diagrama de esparcimiento de puntescoreo efr . rrnalro ti en la !gura 123A. Supongamos que ambas variables, Y I e y 2. se dístr íbuyen no ue un ~e ~ .~"IO completamente independientes una de ot ra, de modo que el hecho de ~o a SU individuo resulte . ser mayor que la media en el carácter Y I no afecta en absolu Uf 1! valo~ para la van~le Y 2. Así, este mismo individuo puede se r mayor o m;no\~. n i media para.la vanable Y 2 • Si no hay absolutamente ninguna relación entre ) I ,e . ' el las dos vaIl~bles se tipifican para hacer comparables sus escalas, se enconuar 1a qut!I1 perfil del d".'am. d. ,esparcU 'T .llento es aproximadamente circular. 1'", 3 turalmente. p --eo.' O. pero una mues ra de 100 rterm, el círculo estaría sólo imperfectamente dehr1U Ud n el cuanto más grande..a la muestra más claramente pod r ía . distmgu . 'rrse un círculoido J b re¡ central alrededor de la intersección y l. Y 2 intensamen te oscurecida deb c ' a
Fig. 12 .1. Distribució n de frecuencias normal bivariante. La correlaCIÓn pan. métrica p entre las variables r I e Y:2 es igual a cero . La d uoón de frecuencias puede visualizarse como un mont ículo acampanado.
Si supo nemos que las dos variables Y 1 e )'1 no son independientes sino que esun ;osrtn-ament e correlacionadas en cierto grado, entonces si un determinado iMiv~uo t)ene .;; nlor grande de Y I , es más probable que tenga también un valor g~e de.} 1 , que 00 h contrario. Iguahne nte un pequeño valor de )' I probablemente estará :uodado con U? • ' , b" " I darrama de. esparci~en o valor de Y 2. Si se muestreasen items de esta po 14C1On, e . E . '3 O) alaraarfa en forma de elipse. 0 0 i!!J.e nto resultante (rep resentado en la figura 1s e : '3D indh.iiuos altos par¡ ~Jtre porque aquellas parte s del circulo que prirn:ramente incluí resentws. El -:2 i4riable y bajos para la otra (y viceversa), está n ahora escasamenttec~~ elíptico tridio _co. .."reo ntmuado (con el modelo deI granode, arena) .. da un fmon Jtodos Ins datos se ~:!I3~nal presentado en la figura l :!.2. Si la ~rTelaclO~ r~a~:~¡,t ia b regresión " tan a lo largo de una sola línea de regresen (la m ularse en on modelo físico, ; }I sobre y 2 Y de Y 2 sobre Y 1)' Y si las deJ3mc~:' bídinensimaJ. tWlindose .... un por resultado un a cu rva normal plana. esen eSU línea de regresión .......iento" del mont íeu· u ¡ . . ' Id' rama deo'!'ar,... . "mbJes.) (l arma ehphca o circular del contorno de l3g bciSn entre las dos I:a re";'>Iltante es sin duda una función del grado ~ebca..%nre 'Por anaJo! ía con ''P . ~ el Paráme tro P,k de la dist ribución norrn J\ 2.2), el parámet ro PI' puede definirse como 0:;1
•
Correlac".
262
IOn
relación
• •
r
[ ·• ..•
, r f
263
A
.,
..
...
"
.. · · ·.. ... •" .•· .
., .
y,
- -
..
(
.'
..
...
,
Y,
..
.. "'--- ro
y,
..
D
Fig. 1 ~ . ~ . DIStribución de frecuencias normal b ivariante . La correlación paramétrica p entre las variables YI e }'2 es 0,9. El montículo acam panado de la f izura 12.1 se ha ataread - o.
Gjl<
es la covarianza pararnétrica de las variables Y¡ e Y,b Y
0i
. -:
desviacio es típicas param étricas de las variab les Y¡ e )' k' como antes. Cuando dos variales se distribuyen según la oormal bivariante, un coeficie nte de correlación de muestreo r,t. estima el roe ficiente de correlación pararnétricc Pjk' Podemos hacer ciertas afirrnscones sobre la distribución de muestreo de Pjk y darles límites de co nfianza. Lamentablemente. la forma elípt ica de los diagramas de esparcimiento de variables correlaconadas, ordínariarnente no es muy clara a m enos que se hay an cogido muestras muy gra..ndes o que la correlación pararnét rica (Jjk sea muy alta . Para ilustrar este. p~nto. en la fJg1.lr2. 1:3 presentarnos varías gráficas que represe ntan diagramas de esparcnmer¡¡:o resultantes de muestras de 100 ítems de poblaciones normales bivaríantes, con diferenm ,-.]ores de Pi" Obsérvese que en la primera gráfica (figura 123 A), con Pi' = O. h
,
[
-. . . , ·... -· .,., ·-". .... '. ".: .
y
...
•
..
Y 01< son las
distrib ción circular sólo está muy vagamente esbozada. Para demostrar más claramente 12 fOl1Il2. circular de la dístríb ció"o se· necesita una muestra mucho mayor. En la f~"2 1: .3B, bauda en P,. = 0.3 00 se obse rva ninsuna diferencia sustancial. Sabiendo que esa represe lG u~ ~rrebción positiva, puede v~se una pendiente positiva en el d ma de esparcarue to; pero sin conocimiento previo ésta se ría difícil de detectar '1isld mente. La próxima gráfica (figura 12.3C. basada en Pi' = 0,5) es un poco má~ clara. pe~~ a pesar de e o no muestra una tendencia inM'1uíVOC3. En aeneral la zorrelación no pue-; deduci ' " . ---, -' str'-' -' . ~se de la mspeccson de~ kts diagramas de esparcimiento basados en mue Este POOlacione'S COn p¡t entre - O,.) Y- 0,5, a no ser que la muestra sea muy nwn eroSl . :nw se de~ estra en la última gráfica (fogura 123G), extraída también de Ul13.~.~ n eon PJl - 0,5 pero basada en una muestra de 500 En ella la pendiente pOSlt~ . con 00 elíptico d I .,___ . . . • . La I~J" 1'3D \...-_..1_ e ~GUI4 de esparcenjenm IOn completamente evidentet- " d - la , ~ Y n = lOO ,e xh me la tendencia con mas . WDr _r., idau. d Ob"" ' . en p Ii( -- O' . esttI"" .~•. ~OX~~ICI(f~r. 123 EJ. buada en la misma magnitud de P" perodreptqu< ' '4lMJU ....I· .... I.iI(;JOn '--"lrva t· - b" . nd•• •~ , ..... 11 ten muestra la inclinación pero es mas ex te
..
· .!.': -'
donde
Y,
E
· .. ,
-"
L
Y,
,
r
-
y,
G
•
. ., . . " ' ..1'::;" "".""-' · .....,." -'. ;:'" .i...',.:.;.-.;::' ~ ,.. :-.- .... '~"
.~.
: ..'-.¡=;: ~i!' '''l-:;!:~: - , ·H" , t: :.
7?
'-:'I'~l·"··· , -!,.:..-••:., ¡p ,. :
.... = ""
,.
."; . ):f;:~!':l'~::':" · ... :.:
·. ::.:
..
.
•
•
,
!
,
Y1 lesrocY!~ F' DOnPaks brn:u.D d' JIl~eo" Pi. 12. 3. \ Iuestras al azar de di n uccnes . ....... ti TlI"'oos ~ 4 8.P-:: '_lIJables del coeficiente de oorrt.. ._" 00 " p - O' v aoR parUDeu,...... .. .. lOO G oue lIt~ • G ... .. en todas las gráficas excepto • ""- -o ~ F p::::: O . . #
0 ,3. (' P = 0.5. D.p = O,7 .E,P-
.. ::::: ;
.
_
-
~~
díf neta en la forma de la elipse no tiene relación co la .. dIe error de muest n ....". tlJraJ~ figura 1.' .3D' La "1_ reíó n: es simplemente un a runcion . de la corretac . . I " . reo y la negalJ",1l d fi~uras daría ciert a Idea de 3 van abtlidad a esperar ' COmp¡. i6 de estas os "e' .' F' 1m en el m rae n . distribución normal bivariante. ' 1113 ente, la figura 12 3F Uestr!fj aleatoriO de u~~ción de P"k = 0,9, muestra una fuerte asociación entre las ~ ~ qb ue representa una COfTCLJ I arra lesy . ién lógica a una elipse de puntos. Un¡ aproxunaCl .. de1 caefici te d i" lv ahora a la expresen reten e corre acron de muestreo Vo vamos do esta expresion ' . resulta presen'..l. 1~ ...hJ"n (!' 3) Elevando al cuadra ' , la m un suceso muy raro . y cene uunos que ha,'• unadeS\.uer.n ol'! s:e¡;'3 J3 es en . :-t.mst"l'Ut'ncIJ . . ". s~niiiC3ti\'3 de lo e-sperado. . . . . Un C'3J11ino mis cipi~o b~S3 do en el m~smo pnncrpio es busc~r limites de ('(Infi 3I3 135 proporciones bmomi:1.les romo se hIZO para la prueba del SIgno en la ". llIia P r -: ~. ' di se"", 10 ' L3 mterpc.. lación en 13 ~3bl.3 ~ '\ ffi C3 q~e para una .mudestra de " :::: 90. Un por.:e .~' observado de- S9 % d:1Il3 l ímites de conttanza aprox ima os al 99 % de 78 . 96 . porcentaje real de individuos tipo salvaje. Sin duda el valor hipotetizado de Op~' e fuera de los límites de confianza del 99 %. .. ~ Ahora \""3IIlOS 3 desarrollar un tercer método mediante una prueba de bondad d . La tabla 1;.1 muestra cómo podríamos proceder. En la primera columna se e~ ~ frecuencas observadas f Que representan el resultado del experimento. LJ Column3l' muestra las frecuencias esperadas ¡ basadas en la hipótesis particular que se oontmu. h este C3,9J. la hipótesis es una proporc ión .3 : t y )"3 hem os calculado las frñl1e1ll.1!! ,~,r;¡_J35 bajo estas co ndiciones como h = jJrl = 0.75(90) = 67.5 Yt. = •
' 1'
I OO lnI OO = ~ 60 .'
...... I Z~ . n
+ i ZIn i 2
+ 920 '~+30+ 93JUM '• • ,
-9- ." - , . ..........
Análisis de frecuencias
Anális is de fr ecu en cias
296
297
CUADRO 13.2 (continuación) id d 1 _ cantidad 2 + cant idad 3) 4. G ·:=: "" cann a " .: "4 _ ?[33_ ' , 30 . mt I . 1. '.0' .. tabla es tá d nc fl ada p ara int erpolación armó n ica. Así. para o b tener t ,_1611 in te rp ola r l'~oí~ ..' 120/ 43 2.0 21 Y I·_ !'tl - 2 .000. que 'C: dan e n la tublu. Trn n sfurmur lu s ¡lrgllJlll' nt~)S en I di l"Ir n : 2.79 1 e interpo lar en tre 120160 - 2.0 00 y 120 /4 0 _ 3 .00 0 p or Int e rp o lac i ón line a l or 11. ' t _ ..
- (1),7111
x
2 ,ft;.!!)
+
[ O _ ° (7111) X
:?,oun]
.
Arca
I
PU"?
I d Q'''' cada una in cluid os en do. ro " e \
a con
.:~
f :?
- 2,(¡17
di
(u ando .. > 120 . 1Ill er pl/br en t re 120 / ", _ 120 11 20 _ l . l.o s valo re s de e sl;~ ,.lhl:I, / ' lt r ií'III/11 ríll de o l r. má' e li te nla ltahla 111 , de 1': . A. 1 i\h e r y I Y;lle , S'Qri,'ica/ Tabtcs tor IlI,d,I,;lfíl , /, " ul'lrl'~ ~ • rgh , 19 5'0 co n I' crl11."'-' , de lo~ .. Qnd Mrdieal H."'·Q'CI,. 5 th cd. IOhvt'I & Uf/Vd . I dmbu ed ltor eL
ny
espondiente al porcentaje de
.
.
••
'\l. h all lllllla 1
.•'
•
, o
I
1
.~
TABLA V . V a lore s c ríticos de la d ist r ib u ción
320
"1 1 . 0'
• 02 ~ . 01
--
,e
. 02 !> . 01
--o -
.c,
3
. 025 • O1
e
1 16 1 6.8 40~ 0
18 .5
2 . 0' •e
F
-a
,
--"
"
, =
"O
. 0' • (12 5 • O1
4
38 .~
98. 5 10 .1 11 . 10 34 . 1
. 02 5
,.-
7. 11 12 .,z 2~ .,z
~ .bl
5 • (' 5
"
2
3
199 800
scoo 19 .0 39 .0 99 .0 9 .~5
16 . 0 30 .e
2 16 86 ' !>400 19 . 2 39 .2 99 .2 9 .28 lS . l bO
19 .3 39 .3 99 .) 9. 01 1 93a
6 234 937 !>abO
19 . 3 39 .3 9 9 .3 8 .9 4 10
101 0
993
997
100 U
1010
977
2 4. "8S
24 8
6290
6 110
6160
62 10
6230
6260
244
19 . 4
. 025
)9 . 4
. U1
99 . 4
19 .4 39 . 4 99 . 4
19 .4
19 . S
)9 .4
3 Y. :>
99 .4
91) .5
19 . ~ 39 .5 99 .5
, . adrática del numerador)
120
=
2> J
2> 4
a
rozo
. os 1
b310
101 0 6)40
6]70
19 .5
19 . ,
39 . ~
19 .~
39 . ~
19 . ~
99 .S
39 . 5
99 . S
99 .5
39 .5
8 . 59
8 .57 14 . 0 26 . 3
8 . 55 13 . 9
5 .72 8 .41 13 . 7
5 .60 9 8 .36
8 . 26
1 3 .7
5 .66 8031 13 . 6
4.4 6 6.1 8 9 .29
4 .43 6 . 12 9 .20
... 40 6. 0 7 9 . 11
4 . 3b b . 02 9 .02
. OS S . 025 . 01
). 70 4. 90 6 .97
3 .b7
4 . 85 6 . 88
. 0' 6 . 025 . 01
3- 27
). 23 10 .110
99 .,
.O 2 ~
. 01
. os 2 . 025 . 01
~
o"
-e •e
.-E o
e
8 . 74 14 . 3
a.7a
8 .6 6
14 .3
27 . 1
26 .9
. 0 25
5. 91 8 . 7S
5 .8 ó 8 . 6ó
• 01
14 .4
14 . 2
3 . os
. 025 •"1
14 .2 26 .7
8 .64 14 . 1
8 . 62 14 . 1
26 . 6
2&.5
5 .80 6 .5 6 14 . 0
5. 17 8 .5 1 1 3 .9
5 .1 5
• -e
--o• • .-" -e u
4 . os
8 .46
1 3. 8
14 . O 2b .lo
26 .2
B. S3 13 . 9 26 .1
• O, 3 . 025 . 01
5 .6 3
.os 4
I 3.
~
. 025 . 01
.~
• u .-"O• ~
•E --o•• "O
-.o•" -.--e•
us 5 .. Ul ; . 01
6 . os
. 025 . 01
".6 8 6 .52 9 .8 9 4. 00 5 .37 7. 72
4 .61 6 .4 3 9 . 72 3 .9 4 5 . 27 1 .56
es
•O
7 . us . 025 . 01
3 .5 7 4 .67 6 . 47
3 .51 4. 57 6 . 31
4 .~ 6
6. 33 9 . 5; 3. 8 7 ; .17 7. 4 0 2' .44 4 .47 6 . 16
4. ~ 3 6.l 8 9 .4 7 3 . 84 5.1 2 7. 31 3 . 41 4 . 42 6 .07
4. 5 0 6 .2 3 9 . 38 3 .8 1 ~ . 07 7 .13 3. 38 4.3 6 ;. '>' 9
3 .77 5 .01 7 .1 4 3 .3 4 4. 3 1 ; .9 1
3 .14 4. 90 7.06 3 .3 0 4. 2 5 j .d2
-c
,.•"
"
"
8 . os
. 025 . 01
9 . os
. 02; . 01
10 . os
. 025 • U1
3 .2 8 4 . 20 5. 67 3 . 07 3 . 87 5 . 11 2 .9 1 3 . 62 4 .7 1
3 . 22 4 . 10 ; . 52 3 .01 3 .77 4 . 96 2 .85 3 .52 4. 56
3 . 1; 4 . 00 5 . 36 7. .9 4 3. 6 7 10 . 8 1
3 .1 2 3 .95 5 . 28 2 . 90 3 . 61 4 . 7)
3 .0M 3 .89 ; . 20
2 .86 3 .56 4 . 05
2 . 77 3. 42
1 .7 4 3 .37
2 . 70 3 . 31
4 . 101
lo . ) )
10 . 2 5
3 . 04 3 .t:I 4 5 . 12 2 . 83 j .; l
/0 . 5 7 2 .66 3 .26 lo • 1 7
3 . 01 3 .7 8 5 .0 3 2 .79 3 . 4; .. . 4e 2 . 62 3 .20 ... Ob
4. 20 ~ . 7 1o
2 .97 3.
n
4 . 95 2 .75 3 . 3"
5 .b5
2 ."'3 3 . b7 4 . !'l b 2 .7!
.. . - o
) .B .. . 31
Z .58
l ·5-
) .1 " .. . 0 0
3 ·0 e ) .91
. C> . 025 •OI
-.,"o ,
.-Ee o e .,•
.,-• .•, .,
-.,"
,•u , .-,
• , .,• .,, 7 •" ,g .,•
. C> 8 . 02 ~
. Ol . C> 9 . 025 . 01 . 0' 10 . 025 . 01
E
-
-
•o
.,,
--, ~
-Tablas estad/'st leas '
324
rabIas es tad i sticas 325
T A BL A V VI
a
11
12
--• --,=-s -, ---'.
15
20
24
.,
30
40
'.
~
)~
.0' • 1J2 o; .0' . 02 5 •o1
~
-, --..
.0'
• I
-s
-r•
. 05
·
~
-7 .
' 0.
18 .6
19.7 3• •
20.7 37. 15 . 8
18. 1
33.
3 B.
33 . 6 79 .
1 2.1
13.7 25.
2 0 .8
22 .9
4 2.
'o • •
24 . 7 50 .
10 .8 18.4
15 . 0 27 •
l b. 3 30 .
17 .5 32 .
34 .
9 .03 14 .5
11 .8
12 .7
13 .5
110 .3
9 .7 0
l b. 5
lOó .
11 ].
120. 29 .9
20.
n.
23 .
2' .
,•.
10 . 5
12. 2
1~ . 9
11 . 1 17 .9
11 .7
12.1
9.78 1 5 .8
18 .9
19 .iI
12.1 21 .
B• •
6 .3 4 9 ••
6.92 10.4
8 .41 13 .1
8 .95 13 . 9
9 .45 14 . 7
9 .91 15 .3
10 . 3 16 . 0
10 .7 1b .b
4 .1 6 s,1
4 . 19 • •9
5 .) 0 7 ••
S.1 2 B. 2
1 .87 11 .8
8 .28 12 .4
8.b6 12 . 9
13."
9.)10 1309
15
2 . 8ó .. . 0 1
3 .54 4.9
4. 01 5. 5
4. 37 • •0
4.68 •• 4
t. .42 9 .1
ó .72 9 .5
7. 00 9. 9
7.25 10 . 2
7.48 10 .6
20
2 . 4ó ; . 32
2 . 95 3. B
3 . 2 '1
3.~4
5 .93
'o • •
5. 59 7. ,
5 . 71
4. 3
5 .19 7 .1
5 . 40 7 .3
7. ,
, .0
30
2 .0 7 2. ó3
2 . 40 3. 0
4 .14 5.5
4 .3 7 5.'
10 . 49 5. '
10 .5 9 5. '
60
1 .67 1 .9 6
3 .12 3.B
3 .21 3 .9
3.2 9 • •0
3 . 36
2 . 17 2 .5
2 . 22 2.5
,..
I . Ol' l .o
1. J O
9
1. 0 0 1 . 00
1 • d5 2 .2 1 . 00 , .0
8 . 12
13 .2 1 . 11 1~ • 1
2 .ó 1 3 03 1. 9 6 2 03 1. 00 1. 0
2 . 18 3. 4 2 .0 4 2.4 1. 0 0 1•o
7 .B O
3 .16 4 .9 2. 9 1 3• • 2.1 1 2 .4 1. 00 1. 0
Pau. M1 a valor de. (nu' mero de m Uest r~\1 y • (gr~do s d e libertad ) hay do s valo res en 'f I eo s 0de1 "_. que rt'prelt nt~n len p u ntos S, % y I %. Las p robabllidadescorre~ond ie nt es a a ._ 0.05. YO. 9: r Cl'u~ ~ nt~n Ltrw ro" de la dI t nbu »o n " _ • . Esta tabl a \C h41 cop iado d e H. A. David (BlOm~trlkiJ J 4 22-4 24 . 19'i2tl:O n perrneo del editor y auto r.
. uf.
333 . 17 05
8
1b .3
n.
4 . 99 8 .8 9
8
,
4
39 . 0 19 9 .
o
5
3
7 .4 l 11 .1
6 . 09 B.7 .. . 9) . .7 3 .94 5. , 3. 02 3. 7
10 5.3
Lo .
l. o
2 .16 ¡ . OO 1. 0
15 .1
9. 01
27.
, . I
..,
1. ' 0 2. '
1 .H
l.3ó
, .7
1· 7
1. 00 , .0
1. 00
1. 00 ~ .0
r-o
3 . 39
Ta blas estadísticas
330
Tablas es tadísticas 33 1
TA BLA VIn oValores críticos para coefic ientesd
TABLA
, 2
. 2 099 23 .6 0 5
3
•
,
. 2661
10 .12 7
• 7
8 9
10
11
13
. 150 S 114 .489 . 198 3
29 .68 9
, " l'
. 2 36 7 15 .154
lb
. 3 48 0
. 26 8 5
17
I O. OH>
. 3 77 4 4 . 21 1
. 2 9 56 7 . 637
18
. 4 025
. 31 9 2
19
3 .679
6 .238
. 4 242 3 .314
03" 0 0 5 .34 1
. 4 4 3l 3 .0loe . 4 60 2 2 .844
. 4 75 5 2 .~e3
12
0.99
. 31 2 5 6 .590 5 . 054
. 10 8 9 3 2 . 553 . 5 0 19 2 . 10 105
a
1
. 05 . 01
VII. lími tes de confianza , más cor tos. no sesgados , de la varianza .
Coeficientes de co nfianza
0.95
v
. 358 5 4 .72 0
. 37 52 10 .2 65 . 3 9 010 3 .91 9
. 10 0 10 3 3 .646 . 41 71 3 . 4 26
20 21
22
0.95
2'
2'
0.99
. 5 24 2 2 .276
v
2•
• 5135 2 . 35 4 . 4 39 9 3. 091
27
. 5 341 2 .2(18
.4 5 0 2 2 .961
28
. 543 3 2 . 149
. 4 59 8 2 .848
29
. 5 52 0 2 . 0 97
. 4689 2 .75 0
. 560 1 2 .05 0
.4 7 7 4 2 .66 4
. 5 6 77 2 .0 08 . 5 14 9 1.971
. 5 8 11 l . 9 ~6
23
Coeficientes de co nfianza
Coeficiente s de co nfianza
. 5 882 1 .9 05
. 4855 2 .588 .4 9 31 2 .519 . 50 0 4 2 . 4 58 . 5 0 73 2 .402
30 '0
'O bO 70
80
. 594 3 1 .876
. 5 13 9 2 .351
90
. 6 00 1 1.85 0
. 5 20 1
100
2 .30 5
0.95 . 6 05 7 1. 8 2 5 . 6 11 0 1. 8 0 2 . 61 6 0 1.7 8 2 . 6 2 09 1. 7 6 2 . 6255 1. 7 4 4 . 66 36 1 .608
. 6 9 13 1 .523
.71 28 1.4 64
. 13 00 1.4 21 . 744 3 1 . 38 7
0.99
2
. 5 31 9 2 .2 23
.5374 2 0181
.54 18 2 . 122 . 59 0 0 1. 89 6
. &2 13 1 .16 0 . 64 58 1 . 6 68
.1669 1. 33 8
. 1 0 90 1. 475
N f) ta- LoI factores de elta tabla ~ han obte nido div id iendo la ca ntidad n _ 1 p or 10 1 valores enco nt rados en una tabl a preparad a por D. V. Lmdlcy D A 1" ' 1 Y P A Hamilton (/liol1wlrika 41: 4 )3.4 37 . 19M)) . • . . ~". . . •
. 05
. 01
'3 5
. 05
40
. 01
. 959
. 05 .01
. 8 1l . 9 17
19
. 05 . 01
. 754 . 87 4
20
. 05 . 01
. 70 7 . 8 34
21
. 05 . 01
. 66 6 . 79 8
2Z
. 05 .01
. 6 '3 2 . 76 5
23
9
.0' .01
. 60 2 .735
24
. 05 . 01
100
10
.0'
. 576 .70 8
25
. 05
12'
.0'
. 55 3 . 684
26
4
5 6
1
A
.01
11
. 01
11
. 01
. 05 . 01
60
. 05
70
. 0 ., • OI
se
. C5
90
• OI
. 01 150
. 05
13
. OS . 01
. 5 14 . 64 1
28
"
. 05
.4 9 7 . 62)
2
,.,
..
•
o o ,o
,
.. ~
•
•
~
~
•
•
•
•
•
~
o •
o o • o
o
•
•
.•
.•
..
, .. ....
o
•
~
o ••
•• • •• • •
o o •
o o o•
~
•
~
o
•
e o •
o •
o • • ~
~
-o
•
>
•
~
o
•
•
~
o e • a
o
•
o •
~
e e • e
o •
• ~
~
~
•
•
•
•
•
•
o
o •
..•
o • ~
..
o •
•
~
8•
;tI\Ut l J ~J
o~
.. •
~
o • . . - .• •• .., -.•• ..-..•. . . .. . • •
"' U.IJurn :a
o•
..•
a • o
•
o•
•
?
.•
.• ?
•
e
.. •
?
• a
~
o o o
•
?
•
_•
•
•
•
•
•
•
o
~
a o
o
?
?
~
o
~
~
~
., ~
o
a •
•
~
~
a a • e
,
a
•
o o
?
e
~
, o •• ••
~
e • ?
a•
,,
o
~
•
a•
•
•
•
~
•• ,• •
o
~
-
•
.. . ~
~
~
•
o
-•
·
e-
• •~ ,,• ..,• ,• •
·• • .. • •• .. . - • • , , · · . . • • ·-· - ·· ..-- ... - . -- ,. , , •, • · , ,. . s • ,· , ·, , . •• , ,.. " ..---.. .. . ·• • · • , • • • , .. , . ... .... · .. · , . . .. • ,• .... · , , ·- , -.- .. . • • •. ,• , .. . ..• .• -· .. -• ..• -•• --• • • • •, , .. • . , , . .. . . ·• .. •· -• •. .... . ·..· -... ·-, ..... , - , . , ·- -. ·· ,, ,,• •. • ... ..•• -• .. .." • • • ,, , . .. .. . · . -, - • .... -, ..•• .. • a
-
~
•
•
•
•,
~
,-
•
•
a a a•
•
!.
~
o
•
•
•
• ?
o
~
o o
,
a a a•
," =
a•
•
~
a
~
o • ?
• o•
•
•
~
~
o a•
~
~
•
..
~
.
~
-• •
..o
•
••
•
•• ••
..
•- • •-,
..• •
.•
.•
•• ••
.•
.•
.•
,
•
.•
.•
,
•
.'"
e
.•
.
, • •
.•
.. e
.•
•• ••
....
.•
N
.•
•• ••
•• ••
•• ••
••
Tablas e s tadística s
Tabla s e stadis ticas
337
336 TAB LA
TABL A IX (cont inuación)
IX (continuación)
n
n 50
o
. 00 - 7 . 11 . 0 0- 10 . 0 ')
9' 99
I . OZ- 8 .!J81 I . OC-12 . 0 21
9' 99
1
, ,
. OS - l O. b b . 0 1- 1 : . 9 8
9' 99
1 .27 .1 2 .1 9 1 1 .16 -1S .b OI . 4 9- 13 . 72
9'
4
. 21 - 17 . 21
99
,
1 . 8 8 - 1') . 1 4 1 t . 4S - 1B .7bl
9' 9'
."
99
" , " " "
1
99
99
99
12 .78 -20 .;101 (1 .80 -2 4 • lobl
10
99
12
"99
"
99
13
11 .74 -17 .911 11 .0 4 -21 . 12 1 2 .23 -19 .25 1 .)8 -23 .13
9
11
1 .2 6 -16 . ; 7 . 6 9 - 20 . 32
"
99
'4 "99
3 .32 -2 1 .8 2 2 .22 -2') .8:> ( 3 . 9 3 - 23 . 0 b l 12 .7ú -27 .111 10 . ')10 - 24 . 31 3 .18 -28 . 102
1') . 18 - 27 . 0 3 1 13 .12 -29 .671
100 . 0 0 - 3 .b2 . 1,/0- 5 .16
. 0 2- 5 .4 5 . oc- 7 .21
. 00-
1 .83
. 00- Z . 6 2
.I Z-
) . ~l
. O~ -
4 .~')
. 0 0- 0 . 74
. 00 -
. 22- 2 . 8 0 1 .06 -
. 6 2 - 8 . ')] . 34- 10 . 5 7
1 .11 - 6 . 42 . 7 8- 7 . 6')
1 .7 9 -
. 21. - 1 .0 to . 10- e. 94
1 . O~
. 32- 2 . 32
5 .0 4 . 3 4 - 6 . 11
. ') ~ _
1000
500
200
) .56
. 8 7- 4 .12
. 0 0 - 0 .37 . 0 0- 0 .53
16
. 4 8 - 1. 8) . ) 7- 2 01)
11
200
500
1000
. 49
1 1 . Z2-21 .82 9 .91 -23 .11
12 .90-19 .~ 0
12 . 03 -20 .b:;
13 .19-18 . 42 13 01 " -19 019
( 7 . 8 8 - 30 . 2 8 1 10 . 2 5- Z5 . 79 Ib . OC-)4 .S4 1 8 .6) - 28 . 6;
1 2 . 09 -22 .92 10 .19 - 24 .11'o
13 .8 2- 2 0 .51 12 .92 -21 .12
14 .73 -19 ."1 14 . 07- 2 0 . 25
1 1 . 06 -Z6 .92 9 .37 -Z9 .8 0
12 .96 -2'0 . 0 2
110 .7 10 -21 . 610 13 .81 -12 .81
15 .67 -20 .~2
"
( 9 .31 -32 .581 1 1 .8& -le . 06 (7 .23 -)é .881 10 . 10- 3 0 . 9 6
13 .82 -2') .~ 2
lZ . 'o3 - 27 . 09
1') .bó-n .71 110 .11 -13 .90
IÓ.62 -1I .57 15 .92 -22 dtl
1 0 . 0 4 - 33 .7 2 7. 86 -3 B. 010
l Z . 6 6- Z9.1 9
ló .~6 -23 . 78
10 .8 10 -32 . 12
14 . &9- 2 b . 22 n . 2 6 - z e . 22
1') .60-2 10 .99
17 .5b -2 2 .62 lb .6 1o -23 . 4'
1 ) . ')1 - 30. 28 11 . 63 -33 .Z Io
1 ') . 5 8- 2 7 . 30 14 .11 -29 .31
17 .,2-2 10 .63 16 .,1 - 26 .05
17 .76 -2 4 .50
14 . 3 ') - 31 . )7 1 2 .4 1- 3.. . 3')
16 . 4t1 - 2t1 .31 14 .91 -30 . 100
18 . 10, - ] 5 .88 17 . 10 3- 21 . 12
19 . 41 -2 ... b9 18 .72 -25 ."
15 .1 9 - 3 2 . 107 13 . 6 0 -3 10 .8 2
1 7 . )7- 2 9 . 4 , 15 . 8) -)1 .!;l0
19 .39 -2 ~ .93
18 .3 10 -28 .18
tO . Io3 -Z, .13 19 .b7 -2b .,9
1& . 0) - 3) .56 13 .98 - )6 .57
18 . 27 -3 0 . 5 2 16 . &8 -3 2 . 59
20 . )) -27 .99 19 .2 6-29 .25
21 .}9-]b .71 20 . 6 1- Z1 · b 4
9') 113 . 84 - 3 9 . 27 1 16 . 8 8- 310 . 6 6 99 [ 11 .25 - 4 3 .6 5) 14 .77 -)7 .6 9
19 . 1 6- )1 .60 1 7 .')Io- )) . 6 B
2 1 .26-29 .0 10 20 .17-HI 031
22 .3 10 -2 1 .81 ZI .5, -28 .b9
11 .7 !;l -) ') .7Z 1 5 . !;l
22 .2 1-30 .08 21 . 10-31 .36
23 dl -28 .11) 22 .50-1':1 .13
20 .99 -)) .70 19 . 3 1- 35 . 8 1
Z) .lb -31 01 1 22 . 0 4 -32 . 10 1
24 .Z7-2 Q • 8 6
21 .91 -3 1o • 7 b 20 .2 ) -36 .88
210 .11 -32 .1';1 22 .91 -3) . 46
2') .2 10-30 .8 9 ZIo . .. I- 31 . 80
2' .Oó -~3 .19
26 .Z 1-31 . 91 15 .)7 -31 . 84
9!:l 99
"
99
1 .29- 3 .01 1.1)- ) .)6
"
99
7 .17 - Z9 .1 2
9.4~
5 . 40 - ) 3 . 36
7
8 .58 -31 .4 10 6 .&0 -3') .73
1 .5 2- 5 .4 4
2 . 1 1- 4 . 19 1 .88 - 4 . ')9
19
1 . 10 - 9 .93 . b 8 - 12. 0 8
1 .74 - 7 . 73 1. 31 - 9 .05
2 . 5 3 - 6. 0 5 2 . 17- b . 7':>
2 .92 - 5 .36 2 . 6 4- ') .82
'O
"
1 .64 - 11 .29 I ol O- D .53
2 . 4) - 9 .00 1 .!l 9 -1 0 . 4 0
3 .26 - 1.29
3 .7 3 - b.')1o ) .39- 7.0 ')
"
9 5 11 0 .7 9- 310 .8101 99 1 8. 5 3- ) 9 .1 81
3.18-1 0 . 21 2 .') 7- 1 1 . 6 6
1. .
2 .2 10 -12 . 6 0 1 .56 -1 4 .9 3 2 . 86- 13 . 90 z .0 8 -1b . 26
) .':I 1- 15 . 1b 2 .6 3 - 11 .61
4 .20 -1b . 4 0 3. 2 1-18 .92 4 . 9 0-11 .62 3 . 82- 2 0 . 20 5 . 65 - 18 . 80 4 . 48 - 2 1 . 42 6 . 40- 1 9 . 9 8 5 .15 -22 . 6 5 7 .11 -2 1 .20 5 .17 -23 .92
3088 -11 . 4 7 3 .11 - 12 .99 4 . 7 0 -12 .61 3 . 93 - 14 . 1 8 ') . 46 -13 .8 2 4 .6 1-15. 4 4
2 . 8 3-
1. .
81
e .07
11-8.4 )
3. 63- 9 .2 4
8 .73 ') 01 2- 9.31
4. 9 /)- 9 . 5 6 1. . 4 )- 1 0.4 2
5 .8 1- 10 . 70
6 . 42 - 9.83 ').96-10. 4 3
b . b ó - 11 . 8 3
6 .04- 1Z . 1 7
6 . 22 -1~ .02 ~ .29- 16 .7 0
7 . ') 1 - 12 . 91 6. 84-13.95
7 . 0')-lb. 16 6 . 06-17 .87
8. 4 1-14.06 7 . 10 - 15 .0 7
7 .87 - 17 .30 6 . 8 3- 19 .05
4.6 3 - 7.64 4. 2 ')- 8. 16 ') .')2 -
'::1 .2 3- 11 . 6 0
9 .30 - 1 5 . 16 8 .5 6 -1 6 . 1 9
7.32 - 1 0. 9 3 6.84-11 .;6 8.2 1- 12. 03 7.70 -12. b 9 9 . 14 - 13 . 10 8.& 0- 13. 78 1 0.Ob - l
l. .
16
9 .') I - I Io • 8b
10 .20- 16 . 2 5 9 .42 -}7 ·)1
10. 9 9 - 1 ') . 23 1 0. 41-1 '). 9 ')
9 . ')3 -19 .') 8 8 .3 8 -21 . 40
11 . 09 - 11 .3 4 10 .28 - 18 . 43
11. 9 2-16. 30 11 .3 1- 11 . 0 4
11 .98 - 18 . 4 4 1 1 .1 4 - 19 .55
12 .8 4 - 11 .3 7 12 .2 1- 1 8 • 13
8 .7 0 -18 .44 7 .60 -20 . 2 3
~ .82 -Z6 .7')
7 .87 -22 .37
4 .2'J -3 0 .?2
b . 46 -2 ~ .1)
Ib .~0-27 ,"' 41
8 . t. 4-2) .'))
10 .36 -Z0 . 72
( 4 .82 -32 01 41
1 .1~ -Z 6 .H
9 . 1~ -22 . ') 8
lOO
50
22
"
99 99
95 99
95 11 2 . 3 0- 37 . 0&1 99 19 . 88 -41 .1041
"
99
25
,. 11
11. 54 - 3 5 . 9 5 9 . 2'J- 40 .32
95 '/ 9 9') 99
1 3. 07 - 3 8 .1 7 1 0 . % -Io Z . 5&
14 . 63 - 100 .3 10 11 . 98 -44 .7)
ZIo .66
. ev-a t
f I 5.4 5 - 101 . 4 0) 1 8 . 6 2- 3 6 • 1 9 f I2 .1 1 - 1o') . 79 1 1 6 .4 2 - )9 . 84 1 6. 23-4 2. 4 8 1 ). 42 -46 .88
1 9. ~ 0- J 7. 8 ')
11 .bl - 2~ .'1b
"
95 99
19
9 95 11 7. 06-4 3 .5 4 1 Zo .37 - 38 . 2 99 99 11 4 . 18-4 7 . 9 Z1 1 8 . 07 - 4 1 .
21 . 0e -)1 ·'- Io
2 1 .Z'o -39 . 9 8 1 8 . 9 0- 4 3 . 06
2:; .1 4-36 . tO 2 1 . H - J9 • 0 1
95 99
17 . tl 1 -104.61 14. 9 1 -4 8. 9 9
1 7 . Z5- 4 0 . 9 1
Z2 .82 - ~5 .81
23 .90 -3 10 .,1 26 .01 - 34 • 23 2 4 .1:13 - 35 • 5 5
14 .99-21 .)2
18 .~2 -23 .b5
2~ .46 -30 .16
27 . 17-31 . 9 , 26 .31 -33 . 8 1
"-• e,..•
.. --
TA BLA IX (continuación)
e • u e ;';:0 • u
% 8~ JI
.,
200
500
118 .11 - 105 .651 22 .110- 10 1 .02 115 .608 -50 . 021 19 .76 -410 . 11
2 4 . 6 7-31 .90 22 . 88-4 0 .0S
26 .9 7-3 5 .25
20 .6 1-45 . 15
2 5 . ó l - 3 6 . 'J4 23 .79- 41 . 0 9
27 .9 3-3 6 . 2 8 26 .73 - ) 7 . 62
Z8. Z5-H.n
2ó .5 4 -3lJ . '}7 2 1. . 6 9 -4 2 .1 3
28 .90 -37 . 3 1 27 . b tl- 3 8 . ó !:l
3 0 . 0 9 - 3 6 .0 1 29.22 -36 .95
50
} 6 . 46 - 5 1 .05
100
120 .3 8 - 47 .72 1
9'
37
.,
" 38 ••" ,. ., •• 4 0 9' •• 41 ., •• ' 2 ., •• ., 4' •• •• ., ••
., .,., 4. ., .. 47
"••
•• .,9. ., ., 9. '0
., "
25 .1 8 -3 lh59
26 .15 -33 .97 2 7.29- H .90 2 ~ . 1 2 - 3 4 . 'J 9
22 .3) - 4 7 .2 4
12 2. -..1 6 -4 9. 8 01 25 .13 - 45 . 19 118 .78 -5 4 .141 23 .19 - 48 .28
2 8 . 4 1- 4 2 .0 4 2 b. 51 -44 . 22
3 0 .82 -39 .3 6 2 9 .5 7 - 4 0 . 72
32 . 04 - 38 .05 31 .14 -39 . 00
2 b . b 5 - 4 b .20 2 4 .08 - 49 . 30
29 . 3b -4h Ob 2 7 .44 -4 5 . 24
31.79 -40 .38 3 v .53 - 4 1 . 7 4
33 .02 -39 . 0b 32 . 12 - "'0 .02
22 .93 - 50 . 80 19.bO- 5 5.13
12 3 . 8 0 -51.611 27.57 -4 7 . 2 2 120 . 42 - 5b .12 1 24. ~b - ~ 0 . 31
3 0 .3 1- 4 4 .08 2 tl .3 7- 4 b . ,¿ b
2 4 . 67 -~2 . d l
2tl.4 9 -48 . 24
2 1 .23 -~7 010
2~ .8 5 -5 1 .3Z
31. 25 -4 5.1 0 29 . 3 0 - 4 7 . 29
29 .tl b - 3 8 . 3 3 2 tl . b2 -39 . b9
1000
2 7 . 4 7 - 4 1 .0 1 25 . bO - 43 .1 8
Zl. l Z-48. 76 18 .0 1 · 53 . 11
.,
r
n
•• 19. 55-4 b. 6 8 23 . 0 C¡ - 42 .0b 32 ., •• ., 23 .9) -43 01 0 " •• 117. 2 3-5 2. 0 8 1 2 1 . 4 7- 46 .19 2... 03 - 4 4 .15 34 ., •• ., " •• 36
TA BLA X. La transformación
3 1 .07 -37 .03 3 0.18 - 3 7.97
32 .7b- 4 1 .39 31.4 9 -42.7b
3 4 . 0 0 - 40 .07 33 .09 - 4 1 .03
33 .73 -42 . 41 32 .45 -43 . 7 tl
3 4 .911 -4 1 .09
. 00 .0, .02 . 03 . 04 . 0, . 06 .07 . 08 . 09
26 .41 -54 .8Z 22.d7-59 . 08
3 2 . Z0 - 4 &. 1 2 30 .2) -46031
34 .70 -43 . 43 33 .42 -4 4 . 80
0 .0000
· 52 · 53
0 .0500 0 .0 601 0 .0 711
· 55 • '6 . 57
0 . 6 18 4
0 . 6 32 8 0 . 6 4 75 0 . 6 62 5
01 ' 01 6
0 .~511
. 17
0 . 17 17 O.:i R20
. 55 . 66 . 67 . 6. . 69
0 .7753 0 . 79 2 8 e . 6 10? (1 .6291 0 .8 48 0
. 70 . 71
0 . 6 6 73 C. 8 a 72 0 . 90 7 6 (1 . 9 2 8 7 0 . 9 50 5
01 '
01 3 • 14
. 18 01 9
O ol ~ l "
Ool 9i']
34 . 07 - 42 .0~
H .97 - 4 2 . 10 35 .0 4- 43 .0 6
.' 4
0 .2 C 2 7 0 .213 2 0 .2 2 3 7 0 . 234 7 0 . 2448
. 74
· 25
0 . 2 554
. 75
.' 6 . 27
0 .2 6 &1 0 .2769
. 21 . 22 . 21
3 7 .b4 -4 6 . 4b 3b .3Z -47 .83
3 8 .9 2- 45 . 12 37.?8 - 46 .IO
. 29
0 .2 9 8 6
129 . 10 - 5 7 . 7 61 33 .1 5 -5 3 . 27 125 . 42 - 61 .951 30 . 3 7 -5 6 . 3 2
3&.0 5- 5 0 .16 34 .01 -52 .34
38 . 02 -47 .4 6 ) 7 .29 -48 .84
39 .9 1- 4 6 . 13 38 .9& - 4 7 010
03 e 031
003 095 0 0320 5 003316 0 . 1478 O oJ e:, 4 1
3 6 . 9 5 - 43 . 1 1 36 .02 - 4 4 .08
34. 09 -54 .27 31 . 28- 57.31
37 . 01-51 .17 34 . 95 -53 .34
39.&0 -48 .47 )8 .27 - 49 .8 5
4 0. 9 0 - 4701 4 39 .9 5 - 48 .1 1
1)0 .90 - 59 .7 11 35 .03 -55 . 2 7 12 7.12 · &) . tl &1 )2 . 19 - 5 8 . 3 0
37 .97-52 . 1 7
4 0. 5 tl-4 'h48 39 .24 - 50 .8b
41.89-48.1 '" 40 .9) - 109 . ll
l3 .13 -'}
41 .89 -50 01 4 39 . f7 - S ~ . l ll
410. , 10 - '.1] . lo 1 103 .11l- 51o .8 4
4 .. . 89 -'.13 .12
4 Z. 8(, - ~1.)t.
4S . ~ ] - S4 .47
100 .1 4 ~)'1 .lo
4 4 .1(;. - S S .84
4b .e ,>-S ) ·I" 4 ., .1l9-" .. · 1 1
]" .II] -b O.17 Jt. .ll'l ·bJ .1l
0 . 590 1 0 . 60 4 2
0 . 6 93 1 0 . 70 8 9 0 . 7 2 50 0 .7 41 '" 0 . 7 58 2
35 . 08 -4 9 .16 3hOb - 51 .)3
)S . SJ -b .. . 41 H .SS - t.b . 4S
0 .5763
. 60 . 61 . 6' . 53 . 64
32 . 21 - 52 .28 29 . 45 -55.)3
4 2 .IY - 53 .8~
0 .56027
0 .1 0 0 ':1; 0 . 110 4 0 .1 20 & 0 . 11 0 7 0 . 14 0 9
01 0 011
.n .00 - 4~ .0':l
29 .18 - b6 .bl
0 . 549 3
0 . 60 17 7
35 .3~ - 4 6 .83
H .68 ~b2 .S7
· 58
O.C 90Z
37 .93 -4 4 . 12
35 .99-~ 6 .2 ~
•' 4
0 .0 802
36.66-45 . 45
)1 .8) -60 . 67 28 . 00 -6 10 .78
•~1
0 .0 300 0 .0 400
34 .1 2-4 8 .1 5 3 2 .11-50 .33
)5 .9 0 -~4 .34
•' 0
0 . 0 10 0 0 .020e
127.31 - 55.1l 01 31 .21 - 51 .28 12 3 . 72 - 60 .0 41 21l .54-54.)4
30 .00 -5 8 .7 4 2&.27 - 6 2 . JO
¡ 4 g e . "1 ~ ~
l~OI" .Q77
' '' 71 .1 1'' 0 't> - , ~. "'Q 3b 9 7 .07j 1771 .6 5'>.
'>.8' 8 . !St:l ?-91 2 .11 0 398b . 4 ]6 .. Obo . e0 3 41;5 .,4 0
,fI ... ., ."''}ó 3 9 19 . 6 ;:> 4 39 93 .E>~ i
.. C 6a .2 ~J .. ¡ 4 l .Fl(\ 7
J li l . 7H 3 1'1 4 .022 }76 b .,C2 ,,""39 .17 .. 1417 . 0?-4 "I4il 5 . 0 7 9 3J7JH .30 1• 'ó:li .l0R 17 C5 .2dó 177 9 . C'>. 6 111"'7 _. . 95 '"; 917 .(1 1,0 4 J 01 .,tl 4 4 5 7 .596 1.o C, 3 2 . 9?4 1.o6 0 fl .41ó 4 6 84. 0 4 ::1 4 759 .8 0 5 4 8 3 5 . 7 .,) 8 4 'Hl .7 4 7 4 9f17 . 9 21 5 0 6 4 . ;' 28 'J140 .666 5 21 7 . 2 3 :3 57 93 .9 .868
345~101319
352l:1 .9Q2
9
f
H1Z 03!6 32 44 .7H 331 1 0353 1HO .157 3 461 .\ 46 353~ .3Je
'Ba "O
3tl'>'7 .'66
BO e , 797
"O
397 1 .~ 70
4 C4 S . 9 1 !:l 4 ! Z J . 4 Z0 4 P 'J . OP 1
~97"' .997 10 0 ~l . 3 5 9
4 6 38 . b 4 9 4 71".) 2 9 4 7 9 001 'J0 4 8b b .l 0 7 4 94 2 . 1 0 1
46 4!) . 2 10 4 72 1 . 9 0 5 .. 7 .. 7 .739 1.o !l 11 . 1 1 1 49 1.',1 .1117
4~'Jl .17 4
4 9 76 . 97 1
46 31 . 088 47 06 .70,5 47 8 2 . 5 6 1 4 B!J8 . ;;OS 4 9 )4 .0,8 5
4729 . "81 "~O. L
S OO;\ .]72
~'0 10 .709
50 1e . 4ZR
502b .0~8
503~ .611Q
5 0/9 .50 ~
SOf!7 . ! 1.o 6 ~ ! b 3 .ó 2Z
50~ 4 .7 87
51 02 .431 'J17B .933 5255 .56" 531;' .323
'JI1 0 .Ol~
5232 .5 b2 53(19 .282
~2 100 .7 2 fo.
=3 1 6 . 0 6 1
, 10 '20
"O
.. ; 4!l 6 .Zl3 5561. .3.:.3 56 40 .S9)
"41" .90 1 ;6 " 11 .)2~
830
~117 .96)
')115 .106
"O
;h 4 6 8 . 9 36 525 .614 583 .19 0 641 . ~89
70 0 .15 0
2 2 .29 1 ) 1 .511 70 .05 4 113 . 1 40 159 .354 207 .943
258 . '1'18
1 1O. , bO 3&4 .056 4 18 .761 1.7 4 .~6 1
5 31 .33 2 588 .994 64 7 . 472 70b .106
lo. lB !>
35 . 13 6 74. 19 0 111. 6 37 16 4.11 5
42 4 .2':19
1396 .68 1 14 6 2 .1 91 15 2 8 . 0 8 2 1 5 9 /• • 339 16 6 0 . 9 51
140 3 .2 1~
300 31 0 32 0 33 0 34 0
171c. . 1087 1781 .706 18 49 .2 10 1 1911 .1 01 1965 .256
1721 .194 1188 . 4 460 1856 .019 1923 .903 1992 . 06l:1
1 727 .905 1 79 5 .18 9 18 b 2. 1 9 3 19 3 0 .7 08 1998 .923
1734 .6 16
3>0 3bO 31 0
2 0 ~ 3 . 10 6
20 6 0 . ~ 6 1
206 7 . 1. 30 2 13 6 .22 1 220') .2 8 6 '}Z 14 .62 4 23 4 4 .221
2"0 0 .0 82 24 70 01 B 2 540 . 4 2 1 2(,IO .'Jb lJ
24 01 . 076
__ o
?b8 1 .1 2 ':1
-> 0 .0 0
215l .11t..
" 0
}ft '/S .H,d }'lb1 . 004
. 80 . 90
7 1l1) . 'J3 U
1 031J .Ji~ b
210 17 . 1~1
2 !:l 10 1 . 4 10 nla . on }",t8 .814 7 15 'J.b}8 /1131 .06) I'IOI . ~lb
l 'nlo .18 0 l 0 4 /• • 0 Sl
1 4 68 .76 3 1 5 3 /•• 691 l b OO.? tl 5
16 6 1. 6 3 1
l 8 0 1. 9 3 ~
1 8 6 9. 5 11 1 9 3 1. 51 6 200 ~ . 1 6 1
20 7 4 .2 9 7 1 143 . 1 16 22 12 . 2 10 2 2 8 1 . '.> 72 23 ~ 1 . 19 4
131 .302 118 .535
1 1:14 .1 5 3 8 4~ .~35
1l ~7 .6 73
7
8
15 . 112 50 .0 89 9 1 . 140 135 .'i) :3 l lt 3 .) 8 5
2:\2 .9 78 Z6 4 .) 19
1'~f:ll .]56
2 H 4 .0'.>1 2 l:1 l.5 .J3 1 lr,¡ lb .8J1 7988 .'.>3 6
Z7/tI . 17'.> 2 8 .., 2 . 4 71 2 91 3 . 9 9 ] 1 99 5 . 71 0
·t O ·)} . i' ~ l
JO bO . I.~l
J Ob 7. b,::!l.
2~1'::! .66 4
2b l.6 .3 13 2 71 7. 192
se
-o
560 .057 6 18 0llS 67 6 . 9 9 tl 73 b .590
Sb5 .B27 b23 .981 14 2 . 5 6 1
511 .bOb b29 .8 41 bija .8bO 14[:1 . 5',1 1
196 . 86 0 9 19 .2 6 7 9 6 1 .}] 4 10 43 .9 33
8°2 .922 8 6 30889 925 . 10 49 9 tH .S lO
1l0a .991 810 .019 93 1 . b36 ',19] .8 12
10~u .212
105b .~ 15
11 07 . 04 0 111 0 .b 2 8 12 3 4. b 17 12 9 9. 1b 5 136 4 . 014
1113 . 317 111 1.013 1210 1 . 10 b 13 05 .631 l 37 0 . 5 l:1 ij
11 19 . 72 0 11ij) . 402 12107 .5 100 1312 011 10 lH1 010;
230 " 0
1435 .9 101 15 01 .680 15 ( 101 9 ) 16 310 .26) 110 1 .083
1.. 10 2 .4 9 1 1508 . 215 1';)14 .10210 l bIo0 .9]1 1101 .183
1>0 2bO 210 280 190
l1 bo .23b 10]5 .714
1114 .00 HO l/ O 330 3· 0
1 1l 5 . S ~ ~
3> 0 lbO 310
6 12 .29 1 671 .078 130 .599 19 0 . 8 0 3 85 1 .6 41 9 13 .091 9 7~ .102
10 3 1.6 5 0 11 0 0 . 7 01 1164 . 210 8 12 2 8. 25 2 1 2 92. 6 9 1 13 5 1 .5 ~5
8~ 7 . 7b5
14 9 5. 0 8 9 15 61 01bS 16 27. 6 0 1 16 9 10 . 38 6 18 28 . ~) 2
b~2 .9lb
1 ~0 3 . 50 ~
202 6 .19 1
18 9 6. 1964 . 20)3 .
11 2 718 1101
1911 .601 20J'1 .9 'H
20 9 4 .9 1] 2 163 .8 1'.> 2232 . 9 Q l n02 . 4] 1 2372 . 131
2 10 1 .79 1 2 110 . 12 1 22]9 .923 2309 03YO 2319 . 11!:l
2 108 .671 2171 .61 9 }¿ lob .8:J8 2316 .])1 23l:1b .l01
24 49 .0'J2 25 19 .)1 " 258'J .715 2660 . .. 1 1 273 1 .]95
2 "~b .l 0J
2 52 b . ] " 'J 1)'Jb .dJ 5 2661 .'.>5} 2130 .'.>00
2802 .5 4 J 2873 . ~09 29 .. '.> ... tl9 JO ll .2 19 JOd9 .Z 1..
28 0'J .6 lO 28tl! . O ~ o 10 2b O 27 0 28 0 29 0
" O
7 6. 36 7
17 2 .613 833 . 329 89 4 . 59 1 9 56 . 4 4 1 1 01 8 .831
12 0 2 . 5 9 b 12 b6 . 8b1 1 3 3 1 . 56 8
2 129 .))0 '}1 'Ja .369 2261 .618 2 3 31 . 7 4 9
4 2 .... 83
5 102 . 1 96 6 00 .626 659 . 260 718 .b39
10b9 .1 17 1132 .10 19 1 19b . 194 1260 . (.20 1325 .019
2122 . 4 101 2191 . 1053 776 0 .1] 5 1 nO . 2 8 1
3 8 . 175
1. 8 0 . 196 5 3 1 . 0 60 59 4 . 806 6 5 3.36 3 1 12 . 6b 9
1062 .8 13 11 26 . 0b7 1169 .795 1253 .9 18 131 8 . 5 910
1 1 38 . 77~
9 .3 76
3 14 .906
200 2 10 22 0 230 240
1 07 5 .4 2 ~
6 .768
369 . 4 75
Ib O \1 0 18 0 19 0
688 . 44 4 950 .232 1012 .569
5
2 17 . 9 02 2 6 8 . 75 0 3 2 1 . 15 5
160 .6 19 821 .1 48 86 2 .296 9 44 . 028 1006 . 3 11
a2 7 .23~
4
2 12 .9 13 2 63. 59 1 3 1 5 . 8 50
754 .bOl 815 .066 876 .154 937 .82 9 100 0 . 059
1' 0
166 .6 43
3
402 .234
bO 10
"
4~ 1 . llb
90
~ 1 4 .20 4
lOO 110 120 IJO
210 " ';" 0 1l)} .19!:l lJ13 ·}l
lo
,-o
1>0
Iba 110 lOO 190
200 110
no
'"o
23"'] · 090
"O
2"010111 ¿ ) J) . ] 0 1 lbO] .8'J6 10 110 . 0 3 8
_00 _10 ..la lo JO
21 .. ; .60 7
..o
2816 . 79 9 ltldd .20 b
.'0 . bO _lO
19~9 .tIJ1
]031 .b 62 lI03 . 0 9 1
_ 80
. 90
f ABLA XIII (continuación)
346 TABLA XIII. Valores críticos de U, el estad ístico de Mann-Whitney . n, n, a 0.10 0.05 0.025 0.01 0.005 0.001 11
, ,2 , , ,
b 8
11 13
S
, 4
5 b
, 2
S b 7
, 2 4
5 b 7
8
•
1 2
, , 4
i
s
10
13 16 20
14 18 21
lb
21 25 29
13 17 22 27 31 36
14 19 24 29 34 38
14 19 25 30 35 10 0 10 5
•
e
20 24
25
11 22 21 31 20 25 30 36 41
23 28
24 29
"
'4
21 27
'2 '8
-,
,-
'9 -S
15 21 27 32 3B 43 49
16 2Z 28 34 40 46 51
b 7
• 9
10
18
22
2' 'O
2' '2 '8
'b
50
55
57
bO
3b
42 48 54
bO
43
9
Ioq "J6
10
b?
42 49 56 63
70
column:~
4~e
5 b
7b
9
79
84
80 89
..
'O
••
10 8 117
87
12> 1 )5
54 6372 81
21 11 10 1 51 67 16 86
28 40 50 60 71 81 90
93
90 99
95 10 4
l OO 11 0
10 2 11 0 119 127
l Oa 1 17 126 1)';
1)4 123 13 2 1 41
118
10 '
'808
'0
121 13 0
'l OO7
94
48
87
1" 12-
10 9
l OO
81
11 2
., 10'"
80 89 98
77
97 100 110
87
71
72
38 ., _9 -"2 '9 ., ' 0 " 'O Ob 08 02 55 " " '9 78 75 b7 11
8
l OO
115
12_
51
02
n
8' .3 , O, 113
1"
13 3 1_ 3
44
52 bO
14
b7
4
5 6 7
I~ ~ras crÍl~or~'
bl
)5
b11'
7
b'70 ,.
8
40
49 57
65
69
58 Ob
20 37
20 44 52 59 61 7
55
25
24 32 101 50
39 46 53 60 66
_9
42
2-
'O
"02
35
13 22
2 3
' 5
'2
1 2
,
92 l OO
"
23
1 13
14
33
88 '0
10 7
1
30 38 46 54 st
8_ 91
10 2
" ., " 54 29 37
81
95
13
27
" 8'
70
12
35 _2 49
19 26
b9
_7
" '"
10 3 1 11
bl b7
OS
70 '8 b ' ,. bb 70 7' 82 87
12
5b
bl
11
11
14
Los alorev c rü¡ b8 1) 7 lo 11 82 _ V ores cnucos están tabul d 1 81 84 90 iI a tl l _ tl2 = 20 Los I a ~ de pUllo dos muestree U tenga' mute supenores v 1 mut:' de tamaños '11 y na . donde n i ' fl2 la están k r mayor que un valor c rtncos se dan de mo do que el edadístico den asadu en un.. prueba de o etermmado. l.a\ probabilidade s qu e e ncabeU una cola y rep resenta n la prcporcron .. del'arca d e 1,
NOfQ h t
51
27
51 57 b_
"
"
-2 '0 5' 07 75
,.,'b '9 -, '2 "' 4 O, 28
2b 40
22 31
' 8 57
'b 10'
10 17 24 30 37
bl b8
-O
91 99
10 17
27
.-
54
50 '8 b5 72 79 87
'2
8b 94
-O 47 5_
" -, .,
22 'O '8 _b
81 88
4
44
_2
28
40
12 20
,
21 3b
1
31
'8
2b
81
2_
''Ob
19
11
5
_2 48
11
10
4
28
0.10 0.05 0.025 0.01 0.005 0.001
,.
2
lb
50
b 1
15 19 23
13
8
4 5
12 16
19 23 27
",45.
1 2,
9
12
b 7 9
10
5 b 1
12
•
11 15
2
8
v
8
2
7
,
8
4
b
1 2 4
2
4
a
347
9
10 11 12 13 14 tll _'flbul l\, n ..k U e n una cola rna
59 67 76 85
25 "3 '5 45
83 9.
55 67 le 89 10 0
10 "
111
61 1)
11 10 12 4
121 12 0 1J2 130 ¡) .. I "J 131; 1.. 4 153 1.. 9 15 4 1() " h ra un... prueba de dos
cob~ ~ unhaan los :'''m", '."0,"' " ,.,,," 1".'"" ",o'''p''' ' P"' do' b p,"b.b,hd'" '1"' ""beu 'O' ",'om"" .... .',0;' " 10, ,,,,,'"0 de o," m.; cv tr-nca ,,,b" 11." de o. B. 0_" . 1I•• J1>oo'l 01 S,""""" T.>I" U"lln- \\l"\k\ 1'1.lbli,¡,m•. ,'lO .,(' 'dlO" \13' '- 196~. C(lfl':~'I,Je L.s. -\,,'ml l'nefg) ComIU10n. ~ 'J n . .. ~~., . pC IIlII\U
de
1", aurorc v
all~ del valo r ~ ritl\o_
101 52
Tablas estad isticas
348
TAB LA XIII (continu ación)
n, 18
XIII (cont inuación)
TABLA
a
n,
1> 2> 3>
1
1>
z 3 4
'3 '3 7, 81 90 99 108 117 127 13b 14'
7 8 9 10 11 12 13 14 1> 1 2
'8 48 >7 b7 77 87 9b
ice
"'
12> 1 3" 1" 4 1>3
l ' 27 37 47 >7 61 1b 8' 9b
, ,, 4
7 8 9 10 11
ice
"' lZ5
iz
13 4 144 1> 4 lb 3
13 14 1> lb
"
27
.-
,,
lb
0.005 0.001 0.05 0.025 0.01 0.10
,, , 1
4
e 7
•
9 10 11
"
13 '4 1> lb
17
17 ' 8
29 40 'O bl 71 8' 92 102 112 122 132 14 3 1> 3 lb 3 173 31 42
'O ' O 71 81 91 101 112 122 132 142
>3
163 17' 183
'O 4' '3
'" 7> Bb 9' 107 11 7 l2B 138 1" 8 1>9 lb 9
31 42 >3
""
8b 97 10 7 118 129 139 1"9 1'0 1 70 18 1
b 7 8 9 10 11 12 13 14 1> lb 17 18
43
>9 71 83
"' 7 78 89 10 0 11 1 121 13 2 143 1>3 lb4 17"
9>
10b 118 ll ~
14 1 l~ l
lb 3 1 74 18'
19
>7 . B 80 91 102 113 12" 13> 146 1>7 lbB 17 9 19 0
"
32
"'b8 >7
1b 80 91 8' 9 7 102 108 114 1 1 9 12' 130 130 14 0 1 4 7 1>1 1>8 lbl 169 172 lOO '83 191 19' '02
3" "7 .0 72 8" 9b 10 8 12 O 132 14 , 1» 1"
".
109 '01 '1'
1 2 3 4
,
32
,,'
,, , 1
4
46 >9 71 83
..
10. 117 12 9 140 1> 1 lb3 174 lB' 19'
b 7 B 9 1O 11 12 13 14 1> lb 17 18 19
b2 7> 88 101 11 3 12>
'37 1"" lb l 173 lB' 1 97 2 06 20
39
1 ~}
,9 40 'O '1 71 81 91 10 1 11 1 121 13 1 1" 1 1> 1 lbl
a
49 b2
.. >l
1",
80 93 10b 119 13 2 14' 1>8 17 0 1" 19>
, 9>
ZOb
'07 219
220 232
7> B7 100 11 2 12 4 13 ' 14' 1'0 172
1 2
, ,s 4
7 8 9 10 11 12 13 14 1>
0.10 18 ,O 41
8' 9' 10;
118 129 13 9 1>0 1' 1 '72 182 19 3 2 04 18 31
'8 80 91 10 ' 114 12> 1 37 148 1> ' 17 0 l B' 19 3 '0 4 2 1> 19 34 47
" "
» '7 78 90 101
"' 13b 124
147 1>B lb9 181 192 ' 03 21 4 226 19
n
'"
72 B" 9b 10 B 12 O 13 7 144 1" lb7 179 191 '03 214 226
'"
'O lb
49 b2
'4 47 'O 72 84 9' 108 120 132 14 , 1» 1'7 17. 190 202 213 22> lb
'0 63 7b 89
10 1 114 126 13 ' 1>1 lb' 17>
" " " " " ,O
7, 89 10' 11 4
", '39
1>1 lb' ,7> 187 '00 21' 22 4 23b
"
>3 61 .0 ' 4 107 1'0
In
14' 1"
'"
200 2 12 22 4 2 36 2 4'
18 4 197 210 222 23> ' 4' " O
ae
39
ise
.."
94
"
,,,,
22' ' 37
B' 10 1 1 13 13B 1>1 lb 3
". ".
,o0 2 13
22' 237 1>0 2 b'
.0
lO'
132 14' 1>B " 1 18 4 197 210 222
'"
7'
70 B4
126 140 1" 161 '"0
'"
201 220
,B
, .1 "O
'4 b9
..
84
10' 118 131 14 ,
1"
181
19' 'Ob 21' 232 ' 4'
", 13'
", 1" '" 1" 1"
''O, 94 21B 231 243
".
ae '4 b9
83 97
111 " 4 138 1>1 lb4 177 190 'O, 21. 230 2 42
,» l bS
" "
73
1O, 11. 1" 1'" lbl 17> 1" '02 2lb 230
'''''
'"
271 28 4
40
" "
" " ,. " "' ". "'
70 B2
11 19 'O
32 4'
" "
l O' 118 13 0 14 ' 1>4 lb' "B 19 0 '0 1 2 13
lb
0.05 0.025 0.01 0.005 0.001
>2
74
349
bO
72 87
77 93
lO' llb !JO 1. 4 1>'
lO' }2 4 1"
",
1" 200 213 227 ZOo I
n·
¡, . ,00 i eJ
1" 21'
'" ' .1
",
"O 28 · " b
,., ,,, ,., '" '" '" ' 4' ' 61
2b '
Tablas e stadisticas
350 TABLA XIV .
n
, 7
8
9
10
11
12
14
.2 3
s
,. I7
. 0 46 9
o
. 0 78 1
1
5
. 0 39 1
b
. O ~4
:3 4
7
. 0 10 8 8 . Ofo " ')
. 0 42 0 . 0 52 7
13
. 04 15
14
. 0 50 S
17
. 0 46 1
lB
. DS4 Q
21 22
. 0 4 71 . 0 549
25
. 0 4 503 . 0 52 0
30
. 047 3
31
. 0 53 5
35 lb
. 0467 . 0 5 23
41
. 0 49 2
42
. 0 54 /,
18
19
20
0.01 T
a
0.005
T
n
a
5 b
. 0 15 6 00 3 12 . 02 3 4 . 0391
. 01 9 5 . 0 2 13
. 01 9" . 021 3
22
o 1 1 2
3 4
8
. 0244
5
9
. 0 3 22
6
10 11
. 0 21 0 . 0 269
13 14
. 0 2 12
17
. 0 2 39
18
. 028 7
. al 6 !
7 8
. 0 078 . 0 156 . 0 078 . 0 11 7 . 0098 . 0 1 37 . 0098 . 0 13 7 . 0093 . 0 122
23
o 1
. 0 0 39 . 0 0 78
1
. 0 0 39
2
. 0 0 59
3
. 0049
"
. 0 06 8
s b
. 0 04 9 . 0 06 8
T
a
67 68
. 04 7 9 . 0 51 6
58 59
. 0 23 0 . 0251
10 9 50
. 00 9 7 . 0 10 11
75 76
. 0 4 92 . 0 52 7
65 66
. 0231 . 0 250
55 56
83 84
. 0 490 . 0 52 3
91 92
. 0 4 75 . 0 50 5
81 82
. 02 4 5
I DO 1 01
. 0 479 . 0 5 07
11 0 111
. 0 49 7
T
a
. 00 9 5 . 0 10 10
10 8 10 9
. 0010 6 . OO!! 2
62 63
. 0098 . 0 10 7
!! Io 55
. 0 046 . 0 05 1
. 00 97
. On 3
69 10
89 90
. 0241 . 0 2 58
lb
. 0 0 ... 10 . 0 10 1
MI 69
. 00 48 . 00 53
. 0 52 ~
98 99
. 02 4 7 . 026 3
. 00 9 5 . 0 10 1
15 lb
. 0 04 1 . 0 05 1
119 12 0
. 0 4 77 . 0 50 2
l U7 10 8
. 0 1 Co b . 0 1 60
'H
. 00 93 . 0 10 0
8] 84
. 00 48 . 00 52
. 0 1 () ~
77
810 85
"12
13 0 131
. 0 49 6 . 0 52 1
11 6 1 17
. 0 1 39 . 0252
Ivl 102
. 00 96 . 0 10 2
91 92
. 0 048 . 00 5 1
12 13
. 008 5 . 0 10 7
9 10
. 0 0ltO . 0 0 52
29
14 0 1 41
. 0 432 . 0 50 4
116 127
. 0 1 1,, 0
11 0
. 0253
111
. 00 9 5 . 0 10 1
100 10 1
. 0 049 . 00 53
'O
15 1 152
. 0 48 1 . OSOZ
137 13 8
. 0 2 40 9 . 02 6 1
120 121
. 0 0 9 t:l . 0 10Co
1 0~
110
. 0 050 . 00 53
31
16 3 16 4
. 049 1 . 0 5 12
l Co7 lCo 8
. 0 1 39
1 30 131
. 0 0 99 . 0 10 5
11 8 1 19
. 0 049 . 00 52
175 176
. 049 2 . 0 5 12
1~9
1400
16 0
. 01 49 . 01 60
) 40 1
. iJ 0 9 1 . 0 10 3
11 8 129
. 00 50 . 0 05 3
18 7 188
. 048 5 . 0 50 3
1 70 1 71
. Ol Co 2 . 01 5 3
15 1 152
. 00 9 9 • 1.11 (,; 4
1) 8 1]9
. 0 010 9 . OO!! 2
200 2 01
. OCo 8 8 • 18 1 18' . 0 5 0.6
. 0 1 40 1 . 0 252
,.2 ,.3
• OO ~ 8 . 0 10 ]
"8 1"
. 00~ b
159 IbO
. 02 4 0 . 0 2 71
19
. 0 0 90
15
. 0042
20
. iJ I 0 8
lb
. 0 0 51
19
. 0 046
20
. 0 0 55
23 24
. 0 047 . 0 0 55
29 30
. 0 22 2 . 025 3
23 24
. 0 0 91 . 0 10 7
)4
27
. 00 8 7
35
. 0 2 24 . 0253
28
. 0 10 1
40 41
. Oleo l . 0269
32 33
. 009 1 . 01 0 4
27
. 0 04 5
28
. 0 0 52
. 02 4 7 . 0273
37 38
. 0 0 90 . 0 102
32 33
. 0 0./07 . 0 0 54
. 02 41 . 0 2 b6
4:! 44
. 0096 . 0 10 7
37 38
. 0 041 . 0053
52 53
a
28
25 26
. 048 7 . 0 52 7
T
0.005
. 0 0 61
. 00 4) . 0 0 54
60 61
a
8
12 13
. 0 52 1
27
0.01
. 0 04 6
. 008 3 . 0 10 1
54
2.
0.025
7
15 16
46 47
24
0.0.1
. 0 0 81 . 0 10 5
. 0247 . 0290
. 0478
a
9 10
II 22
53
nomi nal
T 21
2 3
10 11
0.025 a
. 0 312 . 0 61 5
. 0 3 91 . 0 54 7
ze i
T
:3 "
8 9
35 '
TABLA XIV con tinuación
0.05 a a T 1
•
Valores críticos de la suma del rango de Wilcoxon.
nominal
o
Tablas estadistica s
Nota Lvta tabla da los valores crítICOS para la prueba de sígníñcací ón (de u na cola ) de 13 surna .d:: ra ngo T. obten ido a pulir de la prueba de lo s ta ngos con \igno apareados d e wücoxo n. Corno el .e de exacto de probabllldJd deseado no puede obtenerse enn u loles c rít icos e n tero.. d e T. se .d an d~:ión estos "a10r('s, y sus I,;On\'llulCntes probabliJdoldes pomcrdo e ntre corchetes el nivel de slgnLfic 1 rt'S dcwado. A\l, para hallar los valores ~l1/mfllallvos al 1 % p ar a TI _ I q ll b'iC IVamOS lo.. do s va o
32 ))
34
. 02 ~ 1
. 00 48 . 0051
. 0 2 10 7 1;~ . 0 10 ':> . 02 51 1 lo~do1VaJOfude T"un - d TC'{)0ndlt'nle J e 001 cr íncos d e T, 37 y 38 , e n la tabla. Las probablhd..1 es ~~r7 tendría UIUI proNbllubd InlerlOr J ;le ~ O 0090 y O 0 10 ' Sin d uda u na vuma de r,:In~o\ de ,T. ba~ de dos rolas en que la hIPO • . , -: ,.. I subk\:ído. Pua prue • •• rONbllidadt'1 tjllC se considerar ia slg mflcatlva por e crueoo e dueccson. "C' doblan ...\P d üenr en una u olla altemauva es que la s parejas pod· rra n > "O ~ calcula 1) e ncabeza n 1.1 labia Par a tamaño s de muestreo n •
35
2 13 2 1 Co
. 0 4 8 Co . 0 50 1
t... 1 - [ T. -
19 5 19 6
-I J/ ¡\
1"'11-0-11.. :?-I
"1'
Tebies estadís ticas 352
TABLA XIV continuación 0 .05
T
a
T
a
T
a
T
a
227 226
. 0 48 9 . 0 50 5
2v' 2u9
. 0 24 6
1 ti ~
. 02 ~6
1"
• lJO '>1 6 . 0 100
171 17 2
. 0 0 50 . 0 0 52
. 02 4~
. 00 9 9 . u I O)
182 183
. 0048 . 0 0 50
nominal a n
" "
Bibliografía
0 .005
0 .01
0.025
2_ 1 242
. 0 48 7 . 0 50 3
22 1 222
. 02 54
1"8 199
". 257
. 0 49 3 . 0 50 9
235 238
. 02 4 7 . 0 2 5b
2 11 212
. 00 9 9 . 0 10 4
1" 195
. 0 0 48 . 0 0 50
39
2 71 272
. 0 49 3 . 0 50 7
2·9
. 0 246 . 02 54
22 ' 225
. u099 . 0 10 3
20 7 208
. 0 0 49 . 0 051
.0
288 287
. 04 86 . 0 5 00
2. ' 2.5
• 02 4 9 . 0 2 57
"239.
. 0 10 0 . 0 10 4
22 0 221
. 0 0 49 . 00 51
_1
' 02 ' 0'
. 0 4 88 . 0 50 1
279 280
. 0 24 8 . 0 2 56
" 2 2"
. U10 U . 0 10 3
"3
,,-
• 0 048 . 0 0 50
_2
31 9 320
. 0 496 . 0 50 9
29_ 295
. 02 4 5 . 02 52
288 2. 7
. 009 8 . 0 10 2
247 2 _8
. 0049 . 0 0 51
N .S., 14,7- 2 1. Barita, A. ~L 1939. Stud ies 00 the pbys iology, gen ética , and evolution oí sorne Ciad-
,,,
. 0 49 8 . 0 5 11
' 1u
01 4
311
. 5 . 0 1 52
261 282
.00~8
. 0 10 1
2. 1 282
. 0 04 8 . 0 0 50
ocere. Ca rnegie lnstitutioo of Washington, Dept. Genetics, Peper 39. 2S5 pp. Blakeslee, A. F . 1921. The globe mutant in the J imscn Weed (Datura atramonium) .
ss s
".
. 0 49 5 . 0 50 7
327 32 8
. 0 2 50 • 0 2 57
2" ' 29 7
. uO'>l 7 . u 10 1
", 2 77
. 0 04 9 . 0 0 51
Block, B. C. 1966. The relation of temperature to the chirp-rete oí male snowy tree crickets, Oecanthus fuUoni (Orthoptera: Gryllidae). Ann. Entomol. Soc. Amer.,
"1 372
. 0 49 8 . 0 5 10
',O..,
. 0 244 . 01 5 1
,,,
. 0098 • Ol u l
29 1 192
. 0 04 9 . 0 0 51
389 '9 0
. 0 49 7 . 0 508
::62
. 01 49 . 0 2 56
'28 329
. 0 0 Q6 . 0 101
307 ' 08
. 0 0 50 . 0 0 52
59 ,56-59 . Brower, L. P. 1959 . Speciation in butterflies oí the Papüio glaUCUI group. l. Morpbological rela tionships and hybridization. Evoltdion, 13:40-63., "' Brown, B . E ., Y A. W. A. Brown. 1956. The e~ects oí insecticldal poiscmng on t~e level oí cytochrome oxidase in the Amer'caD cockroacb. J. Econ- Entomo .,
, o7 _08
. 0 490 . 0 50 1
" 8 "9
. 0 24 5 . 01 '> 1
. OO'>' Y . U10 2
322 323
. 0 04 8 . 0 0 50
'2.
. 0 49 0 . 0 500
. I,) U9 9 . 0 10 1
339
'97
. 0 24 10 • 0 2 '> 1
,-O
. 0 0 50 . 0 0 51
.»
. 0 2 101
• al s 3
379 380
. u Q'-l 8 . u 10 U
3"
,,.
. 0 04 9 . 0 0 50
. 02 4 7 . 0253
397 '9 8
. 00 9 8 . 0 10 1
'" ".
. 0 0 50 . 0 0 51
38
.,
.. -, ., ., _8
.. 50
'38
-" ...
"7
...."
. 0 10 9 '> . 0 50 5 . 0 49 , • 050 &
"O
,,,
,.. _1'
.,_"
312
,., 348 ,,, '"
Allee, W. C., y E. Bowen . 1932 . Studies in animal eggregatione: Masa prctecncn against colloidal silver among goldfishes. J. Exp. ZooI., 61: 1S5-207. Archibald , E. E . A. 1950. Plant populations. T he estimeríon oí tbe nurnber oí individua ls per unit a rea oí species in hete rogeneoue plant populations. Ann. BoL.
n.
G_u., 6,241- 2&4.
49 ,675-