Probabilidad y Estadistica Para Ingenieros

March 29, 2017 | Author: Martha Ligia González Torres | Category: N/A
Share Embed Donate


Short Description

Download Probabilidad y Estadistica Para Ingenieros...

Description

/"

"

PROBABILIDAD Y ESTADIST1CA PARAINGENIEROS

IRWIN jMllbER, "

ii

JOHN' E ..FREUNO Profesores de Matemáticas delaUniversidad de Arizona

EDITORIAL REVERTÉ MEXICANA, s. A .

MEXICO, D . F.

I

Versidn al español de: PROBABILITYANO5TATISTiCS

FOR ENGINEERS

Editada por: PRENTECE-HALL, INC. EnglewoodCliffs,NewJersey Traducida por: ING. CARLOS OADOÑEZROMERO R.

Se termino t a i m p r e s i h a e estaobra e l . d i a 15 de octubre de 1984, e l L o s talleres L i t o g r a f i c a Jornan, S.A. de C.V. Cornonfort No. 48 local 29-C Col. Morelos M6x;co 062W. D . F .

.

:: v.:

Derechos reservados en lengua española:

@

1967 EDITORIAL REVERTE MEXICANA, S . A . Río Panuco 14l-Mdstco 5, D. F.

T i r a j e 1,600 Ejemplares

,$

PREFACIO

Este librose ha escrito para un cursointroductorio en Cálculo de Prohahilidades y Estadística para estudiantes de ingenieria y ciencias físicas. Se ha experimentado reiteradamente tanto en cursos para estudiantes universitarios y como en cursos de entrenamiento para ingenieros. Los autoreshan visto que el material de este libro se puede dar en dos semestres o en tres trimestres cuando los cursos son de tres sesiones semanales. Sin embargo, seleccionando los temas. el libro puede servir también como texto para cursos más cortos, dirigidos ya sea a la teoría o a las aplicaciones. Los capítulos 2, 3, 4 y 7 dan una breve, pero rigurosa. introducción a la teoría dela Estadística y, junto con parte del material de los capítulos 5 y 16, son suficientes para un semestre de introducción a las Matemáticas de la Probabilidad y de la Estadística. Los capítulos 6, 8, 9, 10 y 11 contienenel material cornim de los métodos abreviados y no paramétricos. Los capítulos 12, 13 y 14 comprenden una introducción a algunos de los métodos normales, y más avanzados, de la estadística experimental, y los capítulos 5, 15 y 16 presentan aplicaciones especiales, algunas muy recientes, que se han venido haciendo cada vez mas importantes en los alios recientes. V

Los conocimientosmatemáticos que debe tener el lector son los de un curso anual de Cálculo; éste se requiere principalmente para los capítulos 4 y 7, que tratan de la teoría básica de las distribuciones en el caso continuo, para los capítulos 5 y 16 que tratan las aplicaciones especiales (procesos aleatorios, fiabilidad, etc.) y para los métodos de mínimos cuadrados de los capítulos 12 y 13. El tratamiento de la probabilidad en el capítulo 2 es moderno en el sentido de que está basado en la teoría elemental de conjuntos. Los autores desean expresar su agradecimiento a la D. VanNostrand Companypor permitir reproducir el material de latabla 11, a Sir RonaldA.Fisher, F. R. S., Cambridge, y a Messrs. Oliver and Boyd, Ltd.. Edimburgh, por permitir la reimpresión de la tabla IV de sus libros, Statistical Methods for Research Workers; al profesor E. S . Pearson y a las compañías Biometrika por permitir la reproduccicin del material de las tablas v , VI y VIII; a Donald B. Owen y AdissonWesly, Inc., por permitir la reproducción de una parte de la tabla de nilmeros aleatorios de su Handbook of Stcltistical Tables: a Frank J. Massey Jr., y al Journal of the American Statistical Association por permitir la reproducción del material de la tabla IX; a D. B. Duncan, H. L. Harter,y Biometrics porla reproducción de la tabla X; a la American Society for Testing Materials por la reproducción de la tabla XI; y a la McGraw-Hill Book Company por la reproducción de la tabla XII. Los autores desean expresar su agradecimiento también al equipo editorial de Prentice-Hall,Inc.,por su amable cooperación enla producción de este libro,a las diferentes secretarias que ayudaron a escribir el manuscrito, y sobretodoa sus esposas por no quejarse demasiado por las exigencias de sus esposos durante eltiempoen que se escribió este libro. IRWINMILLER y JOHN E. FREUND

vi

CONTENIDO

1

INTRODUCCION, 1

l . I Lamoderna estadística, 1 1.2 Estadística e Ingeniería, 3

2

PROBABILIDAD, 5

1.1 Espaciosdemuestras. 5 2.2 Sucesos, 8 2.3 Probabilidad, I3 2.4 Algunos teoremaselementales. 18 2.5 Probabilidadcondicional.23 2.6 Regla de Bayes, 27 2.7Espacios de muestreomásgenerales,

3

31

DlSfAlBUClONESDE PROBABILIDAD, 33

3.1 3.2 Distribucicin binomial,36 3.3 Distribuciónhipergeométrica, 42 3.4 Distribucicin de Poisson. 44 3.5 Media y varianza de unadistribucihn de probabilidad. 48 3.6Teorema de Chebyshev.53 3.7 Distribucicin multinomial. 56 3.1 Variablesaleatorias.

vii

APLICACIONES A LA INVESTIGACION OPERATIVA. 79

6

TRATAMIENTO DE

6. I 6.2 6.3 6.4

7

DATOS, 97

Distribuciones de fzecuencias. 07 Gráficas de distribuciones de frecuencias. 1 0 1 Medidas descriptivas, ]OX Cálculo de y S, 11 1

DlSTRlBUClON DE

MUESTRAS, 116

7.1Población y muestras, 116 7.2Distribuciónmuestral de la media ( u conocida), 1 19 7.3 Distribuciónmuestral de la media ( desconocida). 120 7.4Distribuciónmuestral de lavarianza, 129 J-

8

INFERENCIAS REFERENTES A

LAS MEDIAS, 133

8. I Estimación puntual, 133 8.2 Estimación de intervalos.136 8.3 Contraste de hipótesis, 141 8.4Hipótesisreferentes a unamedia, 150 8.5 Hipcitesisreferentes a dos medias,154

viii

9

INFERENCIAS REFERENTES A LAS VARIANZAS, 163

Eslimacihn de varianzas. 163 9.2Hiphtesisreferentes a unavarianza. 167 9.3 Hipc'ltcsis referentes a dos varianzas. 169 9.1

11

METODOS ABREVIADOS EMPLEADOS EN INFERENCIAS, 193

1 1. I I 1.7I 1.3 I I .4 I 1.5 I I.O

12

In1roduccicin. 193

Estirnaci6nrapida. IO5 Tests de los signos. 1 % Tests por suma de nllrnetos de orden, 200 Tests de las series de tcirninos iguales, 204 Tests de Kolmogorov Srnirnov. 207

AJUSTE DE CURVAS, 210

12. I Mktodos dr mínimos cuadradoh. 710 12.2 Inferencias basadas en los estimadores de mínimos cuadrados,,215 12.3Regresicincurvilínea,223 12.4 Regresiíh milltiple, 228 12.5 Correlacih. 236

13

ANALISIS DE LA VARIANZA, 242

13.1 Introduccitin. 242 13.2Clasificaciones en una sola direccicin, 24j 13.3Clasificaciones en dos direcciones. 254 13.4 Comparaciones rnilltiples, 259 13.5 Otros diseños de experimentos. 263

ix

14

EXPERIMENTACION FACTORIAL, 274

14.1Experimentacihn dedos factores, 274 14.2 Experimentosde varios factores, 281 14.3 Experimentos factoriales. 2". 290 14.4Elmezcladoen un experimento factorial 2". 301 14.5Replicas fraccionales, 305

15

APLICACIONESA LA GARANTIA DE CALIDAD, 313

15.1 Garantíadecalidad, 313 15.2Control decalidad, 314 15.3 Grificasde control de medidas,315 15.4 Gráficasde control de at-ibutos. 319 15.5Límites de tolerancia. 326 15.6Muestras de aceptacicin.328

16

APLICACIONESA LA FIABILIDAD V A PRUEBAS DE DURACION DE VIDA, 338

Introduccicin. 338 16.2 Distribucionesdeltiempo de fdllc.. 341 16.3Elmodeloexponencial de fiabilidad. 343 16.4El modeloexponencialen tests de dUrdciÓn dz vida, 348 16.5El modelo M'eibullen tests de duración de vida. 35 I

16.1

BIBLIOGRAFIA, 357 TABLAS DE ESTADISTICA, 361 RESPUESTAS, 391 INDICE, 403

X

I

1.1

La modernaestadística

El origen de la estadística está ligado a dos ramas del interés humano muy diferentes: los juegos de azar y lo que en la actualidad se llama “ciencia politica”. Los estudios hechos a mediados del siglo XVIII sobre probabilidades, condusieron a la teoría matemLica de’los errores en las medidas, .y las “leyes de los errores” derivadas de ella fueron la base de lo que hoy es la Estadistica matemhtica. En el mismo siglo, el analisis de las unidades políticas fue el punto de partida de la Estadísticadescriptiva. AI principio, estase limitaba, simplemente a la presentación de datos en tablas y grhficas; posteriormente amplid sus objetivos al -considerar . descripciones numéricas que condensaban las tablas y gráficas mencionadas. En décadas recientes, el crecimiento de la Estadística se ha dejado sentir en la mayor parte de las actividades humanas y el hecho más importante de su crecimiento hasido el paso de la Estadistica descriptiva a los métodos de inferencia estadística o Estadísticainductiva. La inferencia estadística tratadeobtener conclusiones generales a partir de los datos que se deducen de muestras: así, se aplica a problemas tales como el de hacer el cúlculo estirnativo del consumomedio de < ’

1

2

1NTRQDUCCION

combustiblede un proyectil apartirde los datosobtenidosen algunosvuelos de prueba, el de irlvestigar la demanda de un producto por medio de ensayos hechos con muestras del mismo y el de predecir la dureza de un metal, partiendo de los datosobtenidosdelas caracteristicas de los productos resultantes deun proceso anterior de producción. Las generalizaciones que se hacen en la inferencia estadística van más alla de la información contenida en un conjunto de datos. AI hacer inferencias inductivas de este tipo, se debe proceder con mucha cautela. Se ha de estudiar hasta dónde se puede ilegar con estas generalizaciones, a partir de un conjunto de datos, si realy justificables, si seráprudente esperar hastareunir mentesontodosrazonables nuevos datos, etc .En efecto, algunos de los problemas más importantes de inferencia estadística se refieren a la evaluación de los riesgos y las consecuencias a que se está expuesto, al hacer generalizaciones a partir de los datos de muestras. Esto incluye la evaluación de las probabilidades de tomar decisiones erróneas, la posibilidad de hacer predicciones incorrectas y la de obtener estimaciones que se salgan de los límites permisibles. En años recientes, se han hecho intentosparatratartodos estos problemas dcntro de la estructura de una teoría unificada llamada Teoría de la decisitin. Aunque esta teoría tiene muchas ventajas conceptuales y teóricas, existen algunos problemas en su aplicación difíciles de solventar. Para la comprensión de estos problemas, debemos tener en cuenta que, independientcnzeilte de la objetividad con que hayamos planeado 1111 experimento o una investigacibn, es imposible eliminar todos los elenlentos subjetivos. Basarun experimento (por ejemplo, la determinación de un calor específico) en 5, 12, 25, o más,medidas,es, al menosparcialmente, una decisión subjetiva. También intervienen invariablemente factores subjeti*rosen el proyecto de un equipo, la selección de personal, o en :a manera de ccimo se ha de formular una hipótesis y la alternativa que va a venir para contrastar la primera. Este importanteproblema se discutirá con algún detalle en el capítulo 8). Tambien entra un elemento de subjetividad ‘siempre que definimos términos tales como “bueno” o “mejor”, en relación con los criterios de decisión -porejemplo,enel capítulo 12, trataremos el casodela línea recta que “mejor” ajusta un conjunto 10s juicios subjetivos son inevitables cuando dado de paresdedatos.Sobretodo, se trata de establecer valores efectivos sobre los distintos riesgos que uno mismo corre. Enotras palabras,es imposible ser completamente objetivo al especificar (o cerca de ello) y “castigos” por estar equivocado “premios”porestaracertado (o muy alejado de lo correcto). Si se solicitara de un científico un juicio sobre la seguridad de una pieza de un equipo, ¿cómo podría dar un valor exacto de la posibilidad de no haber cometido un error, si tal error pudiera llevar a la pérdida de vidas humanas? Ahora bien, independientemente de que la inferencia estadística se trate o no, desdeelpunto de vista dela teoría de la decisión, depende en granmedida del cálculo de probabilidades. Llegaremos al contenidodela Estadística comouna ciencia, desarrollando cada idea estadística en lo posible, a partir de un fundamento probabilístico, yaplicandocada idea aproblemasde Física o Ingeniería tan

3

ESTADISTICA E INGENIERIA

pronto como lo hayamos desarrollado. Los métodos que usaremos para proponer y resolver estos problemas, se puedendenominar métodos ckísicos, porno tener encuenta, fornzaZmente, los ,factores subjetivos mencionados antes. Sin embargo, deberemos recordar continuamente al lector que dichos factores existen Y, siempre que sea posible, indicaremos la influencia que tienen en la decisión final. La subjetividad juega un papel muy importante en la elección entre Varios métodos estadísticos, o entre fórmulas que se hayan de emplear en un caso dado, en la decisih del tamaño de una muestra, en la especificacih de las probabilidades que se puedenaceptaren los errores posibles, etc. Estemétodode exponer la Estadística presenta SUS problemas en la forma que con tanto éxito ha contribuido al desarro110 de la Ingeniería, así como al de las Ciencias naturales y sOCialeS en 10s clltimos afios. 1.2

Estadistica e ingenieria

Hay pocas actividades en las que el impacto del reciente progreso de la Estadistica sehayadejado sentir conmhs fuerzaqueenla Ingeniería yla direccicin industrial. En efecto, es difícil sobreestimar las contribuciones delaEstadística a los problemas de producción, al uso eficiente de materiales y mano de obra, a la investigación básica y al desarrollo de nuevos productos. Lo mismo que en otras ciencias, la Estadística se ha convertidoen una herramienia vital para el ingeniero, y por consiguiente, se han hecho necesarios ciertos conocimientos de Estadística sin los que el ingeniero no podría apreciar, entender o aplicar gran parte del trabajo desarrollado en su campo. En este texto, pondremos especial atención en las aplicaciones a la Ingeniería. pero sin dejar de referirnos a otros temas, dando as¡ al lector una idea de l a gran generalidad de la mayoría de las tCcnicas estadisticas. Veremos que el mismo m& todo estadístico empleado para determinar el coeficiente de dilatacih de un metal, sirve también para saber el tiempo medio que tarda una secretaria en hacer un trabajo dado, o la longitud media de una iguana adulta. Análogamente, el metodo empleado para compararlas características de dosmotores sirve paracomparar la eficaciade dosmCtodos de enseñanza. las cualidades de dos fertilizantes o el interés del publico hacia dos tipos de programas detelevisicin. En contraste con la generalidad dela mayoría de las ticnicas estadísticas. existen también casos específicos en los que por las circunstancias de los campos de aplicacicin es necesario desarrollar mCtodos especiales. Así laprediccicinecon6micaha traído como consecuencia la creaclcin de nlCtodos especiales usadosenel análisis de series de datos financieros: el problema mCdico de establecer las dosis críticas, ha conducido a lo que se ha llamado "mCtodo del probit": para problemas de "tests" psicolcigicos, se haempleadoel andisis de factores. etc. En lo que resde pecta a la Ingeniería, estudiaremos tres campos que han requeridoelempleo tCcnicas especiales. El capítulo 5 contieneunaintroduccidn a la 1/1tvsr;gacitilr operutivu, una nueva tecnolog,a que se caracteriza por la aplicacicin de tkcnicas científicas (incluyendo Cilculo de probabilidades y Estadística)a los problemas refe-

4

rentes a las operaciones de un "sistema" considerado como un todo. Este método se aplica a la conducción de una guerra, a la dirección de una empresa, a la manufacturade un producto y aotrosmuchos casos. Por supuesto, se ha de hacer notar que este capítulo, así como los dos que se mencionan en el próximo párrafo, son 6nicamente una introducción a los temas tratados enellos. Existen libros dediccdos enteramente a cada uno de los temas. En el capítulo 15, trataremos someramente los métodos especiales empleados en los problemos de estabilidad de la calidad, incluyexlo el problema de controlar la calidad (establecerla y mantenerla) enla producción en masa, la determinación de límites de tolerancia, y algunos ejemplos de inspección de muestras. Finalmente, enel capítulo 16, presentaremos algunas técnicas especiales elaboradaspara satisfacer las necesidadesde seguridad y confianza requeridas en los productos extremadamente complejos de la tecnología de la era del espacio.

2.1

Espacios de muestras

En Estadística, recibe el nombre de experirne/rto cualquier proceso de observaci6n. Un experimento puede consistil., por ejemplo, en elsimpleproceso de observar si una conexión soldada está rota o no lo está: también puede consistir en determinarcuáles la proporción de un conjunto de amas de casa (considerado como muestra) que prefiere lamarca X a la marca Y ; o bien un experimento mucho más complicado, consiste en determinar la masa del electrón. Los resultados de cualquiera de estas observaciones, ya se trate de simples respuestas, “sí” o “no”, o de lecturasde instrumentos,etc., sedenominan wsdtndos de los experimentos respectivos. La totalidadde los resultados posibles de un experimento recibe el nombre de espacio de twccstrm o espacio rmestr‘crl del experimento y se denota por la letra S. Cuando se trata de problemasen los cuales se presentan incerteras ligadas a distintos resultados, es conveniente considerar los resultados delexperimento, clerne/?tos del espacio muestral, como puntos de un espacio geonrktrico de una o varias dimensiones.Porejcmplo, si- un experimento consiste en observar una co5

6

PROBABILIDAD

nexión soldada, ésta puede estar enbuenestado(loquedenotaremos conel nilmero O), o puede estar rota (lo que denotaremos con el número 1) y entonces, el espacio de muestreo es unidimensional, como se ve en la figura 2.1. Si en un circuito hay dosconexiones soldadas, habrá cuatro casos posibles, comoseve en el espacio de muestreobidimensional dela figura 2.2. En esta representación, cada coordenada corresponderá a una de las uniones y pondrán tomar los vqlores de O ó 1, En general, si UD circuito tiene 12 conex.iones saldacfas, habra 2n c&s posibles, que se representarán como puntos en un espacio n-dimensional. Es interesante notar que los espacios de muestreo usados en estos ejemplos para describir la inspección de conexiones soldadas, sirven igualmente paraanalizar los resultados deotros experimentos; por ejemplo. el número de caras obtenidas al tirar n vece-s una moneda, marcando ahora las “cruces” por O y las “caras” por l . Conexicn 2

-

1

O

Fig. 2.1. Espacio de muestreo unidimensional

-1

O

P

=

=

2

F I ~2.3. . Espacio de muestreo unidimensional

L

(0,l)

(0,O)

*(!,I)

(1,O)

Conexión 1

Fig. 2.2. Espacio de muestreo bidimensional

La configuracióngeométrica empleadapara representar los resultados de un experimento no es necesariamente única. En efecto, en el problema de las dos conexiones soldadas se hubiera podido considerar ‘como resultado el número total de conexiones rotas, y los resultados serían O, 1 y 2, tal como se indica en elespacio de muestrcls unidimensional de la figura 2.3. E1 punto 1 de esta figura corresponde a los dos puntos (1, O) y (O, 1 ) de la figura 2.2. Análogamente, para n conexiones, el punto 1 de un diagrama análogo al de la figura 2.3, corresponderá a los n puntos ( I , O, O,. . , O), (O, 1; O,. . ., O),. . ., (O, O,. . ., O, 1) de un diagrama ánslogo al de la figura 2.2). Generalmente, es deseable el empleo de espaciosmuestrales cuyoselementos no se puedan “subdividir’?, esto es, los elementos individuales de tal espacio no deben representar dos o más resultados que sepuedandiferenciar en alguna forma. En otras palabras, se preferirán espacios muestraIes del tipo de los de las figuras 2.1 y 2.2 a los del tipo de la figura 2.3. Con frecuencia, es conveniente clasificar los espzcios muestrales deacuerdo con el mimero de elemelztos que contienen. Los espacios de las figuras 2.1, 2.2 y 2.3, tienen, respectivamente, 2. 4 y 3 elementos, y todos sonespaciosmuestrales finitos. Otros ejemplos de espacios finitos son: el usado para representar las tiradas de u n par de dados (tiene 36 elementos), ‘el usado para representar la elección de ,

ESPACIOS DE MUESTRAS

7.

un presidente y un vicepresidente entre los 25 socios de un club (tiene 600 elementos), y el usado para representar la clasificación de cinco aparatos de televisión con las calificaciones de “bueno”, “regular” y “malo” (tiene Y =’ 243 elementos, como se explicará más adelante). Para presentar un problema en el que no .es suficiente up espacio muestral finito, consideremos que, una persona inspecciona conexiones sqldadas y que nos interesa saber el número de los que tendrá que inspeccionar antes de hallar la primera conexión rota. Esta podrá ser la primera, la segunda,. . ., la centésima,. . . , la millonésima, o más. Como no sabemos hasta qué valorse llegará en un ejemplo como éste, debemos tomar para nuestiro espacio de muestras el conjunto total de los números naturales. El núqero de elementos de este espacio muestral es infinito numerable. Damos un paso más adelante, si se trata de medir la resistencia en ohms de una conexión soldada, pues el espacio de muestras estará formado por todos los puntos deuna escala continua(unintervalodeterminadodela recta numérica real). Los elementos de este -espacio no se pueden contar, esto es, no se puede establecer una correspondencia biunivoca conel conjuntodenúmeros naturales. En general, se llamará espacip muestral discreto al que tenga un número finito o una infinidad numerablede elementos.Si los elementos (puntos)de un espacio muestral constituyen un continuo; por ejemplo, todos los puntos de la recta o de un segmento de recta, .o todos los puntos de un plano, etc.; se dice que el espacio es continuo. En el resto de este capítulo, sólo consideraremos espacios muestrales discretos y especialmente finitos. al menos pesado, determinar por enumeEn, muchas ocasiones, será dificil, -0. ración directa el número de elementos de un espacio finito de muestras. Para ilustrar un metodo que a veces simplifica este trabajo, consideremos el siguiente problema referente al lanzamiento de un coheti compuesto de tres slbsistemas: propula sión, dirección y fuselaje. Supongamos.que P,, P2 y P , representan las calificaciones de perfecto, bueno y malo, .respectivamente, ai comp6rtamiento del sistema de ,propulsión; que GI y G , son las notaciones para indicar que el proyectil responde, o no .responde,ia 10s mandos; y que Al, A ? - yA , representan respectivamente, que ellfuselaje no sufre daños, que una o más superficies de control resulta deteriorada, y que el fuselaje se rompa. Las .rfesultados!posibles se puedenrepresentarahora por medio de un diagrama ramificado como el de la figura 2.4. Siguiendo de izquierda a derecha una trayectoria a lo largo del diagrama, obtendremos uno de los resultados posibles,es decir, unode los elementos particulares del espacio muestral de nuestro experimento. Evidentemente, el árbol del diagrama tiene“ 18 ramas diferentes, por lo que el espacio muestral tiene 18 elementog. Hubi6ram6s podido P, que cada una de determinar también este número notando que hay tres ramas. éstas tiene dos ramas G, y que cada G tiene, a su .vez,trdb ramas A. Entonces, habrá 3 . 2 . 3 =:18 combinaciones de ramas .(o de trayectorias).Esteresultado se puede generalizar por medio del siguiente teorema:

0

PROBABILIDAD

Teorema 2.1. Si los conjuntos Al, A*, . . ., Ak contienen respectivamente n,, nz,, . ., nk elementos, entonces hay n, * n, . . . . n k formas diferentes de seleccionar, en primer lugar, un elemento de A l , después, un elemento de A?,. . . , y , finalmente, un elemento de Ak.

-

Este teorema se puede probar construyendo un diagrama ramificado similar al de la figura 2.4. Para ilustrar el uso de este teorema, nos referiremos nuevamen-

Fig. 2.4. Diagrama ramificado

te a dos de los ejemplos de la página 7. Un club de 25 miembros puede hacer la elección de su presidente de 25 maneras distintas (es decir, cada uno de los socios) y, por consiguiente, la elección del vicepresidente tendrá 24 posibilidades distintas; luego, la eleccidn total se Fodrá hacer de 25 . 2 4 = 600 formas diferentes. En el ejemplo de los cinco equipos de televisión del problema que tratamos en párrafos anteriores, cada uno de los aparatos se puede considerar bueno, regular o malo, por lo que en total habrá 3 3 . 3 . 3 . 3 = 35 = 243 maneras distintas de clasificarlos. Nótese que, si hubikramos estado interesados únicamente en conocer cuántos televisores quedan dentro de cada una de las categorías, eleSpaciomuestra1 contendría sólo 21 elementos (ver el problema 6 de la página 12).

-

2.2 suceso0

Las probabilidades esthn siempre asociadas al hecho dequeocurra, o no ocurra, un suceso; por ejemplo, el suceso de que en una muestra de 50 bolas de cojinetes de bolas, se encuentren 3 defectuosas; el de que una cubierta de coche dure por lo menos 20.000 millas antes de serrecauchutada; el deque en un panel telefónico se reciban 8 llamadas en un cierto periodo de tiempo; etc. Entonces, en relación con las probabilidades, se considerará como un suceso, a un resul-

9

SUCESOS

tado individual o a un conjunto de resultados Cle un experimento. (El suceso de obtener exactamente cero caras al tirar cinco veces una moneda, es un ejemplo de un resultado individuai, mientras que el de obtener.'una'cara en el mismo núniero de tiradas es un ejemplo de un tonjurito de cinco resultad6s.) En otras palabras, consideraremos como sucesoa un subconjunto de un adecuado espacio ntuestral. Para ilustrar mejor esto, supongamos :que un equipo está formado por dos "subequipos", que, a su vez, contienen 4 componentes el primero y 3 el segundo. Si nos

Númerodedefectosenelprimersub-equipo

Fig. 2.5. Sucesos en un',espacio de muestren

número^

interesamos exclusivamente del total de componentes defectuosas de cada subequipo (sin precisar cuáles de las componentes .son las defectuosas), el número de elementos del espacio muestra1 es 5 . 4 = 20,. que se pueden situar en un espacio bidimensional, como se ve en la figura 2.5. Designemos ahora por R eí suceso de que el equipo'completo tenga una sola componente defectuosa, por T ei suceso en que en el equipo se presenten exactamente tres componentes defectuosas, y por U el suceso de que el primer subequipo tenga más componentes defectuosaupe el segundo.. Los ele,rngntos d.el espacio muedral que corresponden a estos tres sucesos se indican en la figura 2.5 p?r los conjuntos de puntos limitados por una'línea continua, una gunteada y una de trazos respectivamentq$.NÓtese que R y .T no tienen elemento3..comuneQ; o sea, se trata de sdcesos que .mutuamente se excluyen. En muchos pbbiemas de Cálculo de' pro6abilidadq nos interesarán sucesos que son, a su vez, copbínaciones de das o más sucesos. Por ejemplo, ea el caso anterior, nos puede interesar el suceso de< queel equipo wmpletb tenga"f ó 3 componentes defectuosas, o el suceso de que el equipo completo tenga tres componentes defectuosas y al mismo tieinpo. que el primer subequipo tenga más componentes defectuosas que el segundo. Para 'tratar tales situaciones, definiremos la urlidn y la interseccibn de dos conjuntos. Formalmente, si A y B son dos sucesos cualesquiera

10

PROBABILIDAD

del espacio S, su unicin, A U B, es el subconjunto de S que contiene todos los eiementos queestán en A , en B, o en ambos. La interseccicin, A n B, es el subconjunto de S que contiene todos los elementos que están a la vez en A y B. Volviendo ahora a nuestro ejemplo, vemos que R U T contiene los elementos:

(O, 11, (O, 31, (1, 01, (1,2), @,1), (390) mientrasque R n T no tiene elementos. Denotandopor al conjunto vacío o conjunto nulo, tendremos R r lT = que es la forma matemática de indicar que R y T son mutuamente excluyentes. Notemos también que R n U tiene un solo elemento (1, O) y que T n U contiene los elementos (2, 1) y (3, O). Finalmente, nótese que los elementos (O, O), (O, I ) , (1, I ) , (O, 2), (1, 2), (2, 2), (O, 3), (1, 3 ) , (2, 3) y (3, 3) pertenecen a S, pero no a U . El subconjunto formado por estos 10 elementos se llama complementario de U con respecto a S y se designa por U’. En general, el complementario A’ de un conjunto A enun espacio muestra1 S, es el conjunto formado por todos los elementos de S que no son elementos de A. El complementario de S con respecto a sí mismo esel conjunto nulo, o sea, S’ =O.

a,

Fig. 2.6. Diagrama

dc Venn

S

S (a)

A es un subconjunto de B

(b)A y B son mutuamente excluyentes Figura 2.7

11

SUCESOS

LOS espacios muestrales y 10s sucesos y, en particular,las relaciones entre sucesos, se pueden representar grsficamente por medio de los diagramas de Venn, como los mostrados en las figuras 2.6, 2.7 y 2.8. El espacio muestra1 S se representa por un rectángulo, mientras que los subconjuntos o sucesos, por círcu\os! partes de circulos o combinaciones de ambos. Por ejemplo, la figura 2.7(a) nos indica la relación “ A es un subconjunto de B”, y la 2.7(b) “ A y B son disjuntos”. Las operaciones n y U para conjuntos se pueden representar por diagramas de Venn, como se veen la figura 2.8. Las operaciones con conjuntos que hemos

5 Fig. 2.R Operaciones con conjuntos

establecido, unidas a axiomas apropiados, dan lugar al Algebra de conjuntos, o 91gebra Boole, como también se denomina. NO haremos un estudio formal de la misma, pero si justificaremos, con ayuda de los .diagramas de Venn, algunos teoremas que se necesitan en el desarrollo del libro. Como un ejemplo, demostraremos

( A v B)’ = A’ n B’ que expresa que el complementario de la unión de dos conjuntos es igual a la intersecci6n de sus respectivos complementarios.’Notemos, ante todo, que la regi6n sombreada de la figura 2.9(a) representa el conjunto (A U B)’ (compárese con el de la figura 2.8(b)).La región cuadriculada de la figura 2.9(b) se obtuvo som-

S

S

(al ( A U B ) ’ Fig. 2.9 ( A U B)’

P

( b ) A ‘ n B’ A’ flB’

1.2

PROBABILIDAD

breando la región que representa A' con líneas en una direccih y, la que representa B', con líneas en dirección opuesta. Esta región cuadriculada representa, entonces, la intersección de A' y B', y se puede ver que es idéntica a la regicin sombreada de la figura 2.9(a).

EJERCICIOS desea probarcuatro tipos decubiertas con 1. Unfabricantedecubiertasdeautomóvil dibujosdiferentes cn tres clases diferentes de supdicies de carreteras y acinco velocidades distintas. ¿Cuántas carreras de prueba se deberánhacer? 2. Up. experimentadortiene 4 recubrimientosprotectoresdiferentes para aplicara ambos ladosdeuna lrimina de acero.Determinarde cuintos modos puede recubrir ambos lados de l a Iimina si: (a) los dos lados de la lámina se deben cubrir conelmismomaterial. (b) los dos' lados se pueden recubrir, sin que esto sea necesario, con el mismo material. (c) ambnslados se deben cubrir condiferentesmateriales. 3. Un cxperimcnto don6ste en tirar un dado y desputs lanzar una moneda si, y sdlo si, en el dado ha salidoalguno de los números nones ( l . 3 y 5). Dibujar un diagrama ramificado y contar el número de casos posibles. 4. Construir un diagrama ramificado nara determinar el número de formas en que se pueserie de detirar una moneda 4 veces seguidas, de tal manera que,a lo largodela tiradas, el número de caras sea siempre mayor o igual al niimero de cruces. 5. Enumerando todos los casos posibles, verificar la afirmación de la página 8, de que hay 21 casos distintos, si en el ejemploconsiderado sólo nosinteresaconocer cuántos de los cinco aparatos de televisibn se ajustanacada una de las tres especificaciones. 6. En cada uno de los experimentos siguientes, decidir cuándo sería apropiado usar un eso continuo: pacio de muestreofinito,numerable (a) Uno de los 12 vicepresidentes deuna compaiííavaaser elegido presidente. ( h j Se va a mcdir experimentalmedfk'cl coeficicbte dc dilatación de cierto tipo de ladrillos refractarios. (c) Medidas dela intensidad de radiacicin pormedio de un contador Geiger. ( d ) Un policía mide el contenidode alcohol en la sangre de un auinmovilista. ( e ) Se tira una moneda cierto número de veces hasta que aparece la primera cara. ( f ) En una ciudad sc,hace una inspxcibn de trhnsito para estimar el número de coches quc tienen defectos en los faros delanteros. l . Las seis personas siguientes han hecho una solicitud para ocupar un empleo: El Sr. Andrews, es casado, no juega al golf y n o tienecasa prirpia; el Sr. Bailey, es soltero. no juega algolf y ticne casa propia; el Sr. Clark. es casado, juega algolf y tiene casa propiaj,,el Sr@odds, es altero, juega al'.golf y no tienc casa propia; cl Sr. Bdi%r¿is, esti taka*, no juega al&lf y tiene casa propia: y el Sr. F o x . es soltero, jucga al &If y ticne @& propia. Un'o de e s t & aspirantes obtendrá e1 empleo y, por cjomplo, el SuccSo de quc éste se dé a un jugador de golf se denotará por {Clark, Dodds. Fox}. Indicar, de irna manerasimilar, los conjuntos que correspondena los sucesos dc que el empleo se dé a: . . (i),.aIguien quc tenga casa propia.. :,' ( b ) u%casado quc jucguc al golf. (e) u$;soltero que.,no tengrr .*sa propia. (d) yn' jugpdor 4.c .gol&.casa¿l.p,o' shftcro. 8. En relacifin con cY'pirrht¿ri?a 7, hdicar: (a) cl complcmcntario del donjunto dado cn el apartado (a). (b) la uni6n dc los conjuntos de los apartados (a) y ( h )

13

PROBABILIDAD

(c) la intersección de los conjuntos de los apartados (a) y (d). (d) la intenecci6n de los conjuntos de l o s apartados (b) y (c). 9. Un fabricante compra material , a cuatro vendedores diferentes que llamaremos 1, 2, 3 y 4. Refirihdonos a las 6rdenes de compra en dos días sucesivos, por ejemplo, se indicar& por (1, 4) el suceso de que el primer dia la orden se dioalvendedor ‘1, Y en el segundo día al vendedor 4. Si A representa el suceso de que el vendedor 1 t e n p , al menos, una de las dos 6rdenes; B el de que el mismo vendedot tenga. a m h brdents; y C el de que los vendedores 1 y 3 no tengan ninguna orden, hagase unp lista de 10s elementos de: (a) cl espacio muestra1 completo. (e) A’

o

B U c, (d A nB,

(b) A, (0)

B,

c,

(4 (h) A n C * 10. Usense diagramasde Venn para verificar que: (a) ( A B)’ A’ B’,

-

n u u ( A n B) = A, ( A n B) u ( A n B‘) = A,

(b) A (e)

(dl A U B = ( A f7 B) U ( A n B‘) U ( A n B), (0) A u ( B n c> ( A u B) n ( A u a.

-

2.3 PmbaMlidd En esta sección definiremos la probabilidad, empleando el concepto de función de conjunto, o m& exactamente, función aditivu de conjunto. Como posiblemente el lector está m& familiarizado con funciones en las que los elementos del dominio Y “-1 recorrido son nbmerm, consideraremosprimerounejemplo muy

15 Fig. 2.10 Distribución de elementos en S

simple en que los elementos del dominio son conjuntos y los elementos del recorrido números reales. En otras palabras,estudiaremosunafuncibn, es deciruna correspondencia,que asigna números realesa los subconjuntos deun conjunto dado (por ejemplo, a los subconjuntos de un espacio muestral, si nos 0cupamOS de

*

14

PROBABILIDAD

los resultados de un experimento dado). La función de conjunto que consideraremos es aquellaque asigna acadasubconjunto A de un conjuntofinitodado, el número de elementos de A , lo quedenotaremospor N ( A ) . SUpO~gamos,Pues, que una compañía tiene cincuenta empleados clasificados de acuerdo con SU estado civil (casado M , y no casados M ’ ) , y de acuerdo, también, con que se hayan graduado o no (G o G’): La distribución de estos 50 empleados se muestra en el diagrama de Venn de l a figura 2.10, y utilizando este diagrama podemos ahoradeterminar el valor de N ( A ) paracadaunadelas 16 categorías (subconjuntos) enlasquepueden ser clasificados los empleados. (En el ejercicio núm. 1 de la página 22, se pide al lector que compruebe que, en efecto: existen 16 subconjuntos,incluyendo el conjunio S formado por todos los empleados, y el conjunto vacío@.) Los ndmeros m.arcados en la figura 2.10 representanel número de empleados casados que no acabaron sus estudios, el número de empleados casados que acabaron sus estudios, el número de empleados no casados que no terminaron sus. estudios y el número de empleados no casados queterminaron sus estudios, esto es:

N ( M I? G’) = 20, N ( M nG) N ( M ’ A G’)

= 10, =.

N(”

nG)

= 5,

15

Para encontrar el numero de empleados casados, no tenemos más que añadir el número de empleados casados que son graduados al nlimero de empIeados casados que no son graduados, con lo que obtendremos: ,

~ ( 2 1 1=) .N ( M

n G) -+ N ( M n G I ) = 10 + 20

Análogamente, encontramosque el númerode estudios es:

N ( G ) -- N(IM A G )

+ N ( 2 ” n G)

= 30

empleados que acabaron sus 10

+ 5 = 15

y como N(S) = SO, donde S es el conjunto de los 50 empleados.obtenemos, por substraccih: N(”) = 50 - 30 = 20 ,y N(G’) = 50 - 15 = 35 La funciónde Conjunto que hemos introducidoen este ejemplo, se llama aditivq 10 que significa que el número que asignarnos a Ia unión de dos subconjuntos que no tienen elementos comunes es igual a la suma de 10s números asignados a los subconjuntos individuales.* Esta propiedad es la que nos permite G&Xlar el número de empleados casados, sumando el número de los empleados camios y graduados conelnilmero de los casados no graduados. Nótese que esta Propiedad se aplica solamente a subconjuntosque’ no tienen elementos C O ~ ~ n e s10s . cuales reciben e] nombredesubconjuntos disjuntos; como indicamosen la Página 8, los sucesos correspondientes a subconjuntos disjuntos se llaman S ~ X W S que ”+ Un ejemplo simple de función de conjunto que no es aditiva es aquelfa que asignaa cadasubconjunto el cuadrado del ndmero de elementos que Contiene. ’

15

PROBABILIDAD

nzutuamente se excluyen. Si se trata de dos subconjuntos A y B que puedan tener elementos comunes, emplearemos la fórmula más general: 1

N ( A UB ) = N ( A )

+ N ( B ) - N ( A nB)

que, aplicada .a nuestro ejemplo, nos da:

N(M u G ) = N ( M )

+ N(G) - N(M nG) = 30 + 15

-,

10 = .35

para el número de empleados que estan casados, o que están graduados, o ambas cosas. Nótese que restamos el número de los casados y graduados porque fueron contadosdos veces, la primeraentre los empleados casados y, la segunda. entre los graduados. ,. Usando el concepto de función. aditiva de conjunto, definiremos la probabilidad de un suceso. Dado un espacio muestraí finito S y un suceso A en S, definimos P ( A j , a la que llamaremos probabilidad de A , como un valor de una función aditiva de conjunto P llamada fltncicin de prohahilidad. Para que una función de conjunto sea una funci6n de probabilidad debe satisfacer las tres condiciones siguientes: Axioma 1. O I P ( A ) 5 1 para cada suceso Aen Axioma 2. P ( S )

E

S.

1.

Axioma 3. Si A y B son sucesos que mutuamente se excluyen en P(A U B ) = P ( A ) P(B).

+

I

S, entonces

)

El primer axioma establece que la función de probabilidad asigna a cada suceso A en S un número real comprendido entre O y 1, incluidos Cstos. El segundo axioma nos indica que al espacio muestral, como un todo, se le asigna el número 1, lo que expresa la idea de que la probabilidad de un suceso cierto es igual a 1. El tercer axioma nos dice que la función de probabilidad debe ser aditiva y, empleando la inducción matemática, se puede extender la aditividad acualquier nlimero finito de sucesos que mutuamente se excluyen. En otras palabras. se puede demostrar que ~

P(A1 u As u.. . U A,) = P(A1)

.

+ P(A2) + .. . + P ( A J

donde A , , Al, . . ,A,, son sucesos que mutuamente se excluyen en S. (En la sección 2.7 discutiremos cómo esta tercera propiedad se puede modificar cuando S no es finito.) Las tres propiedades anotadas son axiomas de la teoría deprobabilidades y no requieren demostración. Sin embargo, si esta teoria se aplica al mundo físico, podremos ver que estos axiomas corresponden a hechosreales,es decir, veremos que nos dan resultados razonables. Con este objeto, diremos algunas palabras de la llamada interpretacicinfrecuencia1 de la probabilidad. De acuerdo con esta interpretación generalmente aceptada, consideraremos una probabilidad como una proporcicin o freeacetlcia relativa, a partir de uttgran ntínxyp,.de casos. Asi, si decimos: “la probabilidad de que un hombrede 50 años viva hasta 10s 65 es de

16

PROBABILIDAD

0.72”, esto nos indica que, si las condiciones actuales no varían, el 72% de todos los hombres de 50 años vivirán hasta los 65; y si decimos: “la probabilidad de que unapersonaqueentre a unsupermercadocompreunproductodeterminado es 0.25”, esto nos indica que el 25% de un gran número de personas que entre en el supermercado comprará dicho producto. Nótese que “laprobabilidad de obtener cara con una moneda es OSO”, significa que haciendo un gran número de tiradas, la mitad de las veces saldrá cara y la otra mitad cruz. Sin embargo, esto no significa que necesariamente obtengamos 10 caras y 10 cruces al tirar’ 20 veces la moneda, 6 50 caras y 50 cruces al tirarla 100, pero si una moneda no defectuosa se tira muchisimas ‘veces, se puede esperar que obtendremos aproximadamente el mismo número de caras que de cruces. Para demostrar que los tres axiomas de probabilidad corresponden a las propiedades de las frecuencias, en la interpretación anterior,nos basta con observar que el porcentaje de las veces en que se presenta un suceso no puede ser negativo ni exceder a 1, y que un resultado u otro se presentará con un porcentaje de un 100% de las veces, esto es, con una probabilidad de 1. También, si A y B son sucesos que mutuamente se excluyen, el porcentaje de las veces que se presenta uno u otro es la suma del porcentaje de las veces en que se presenta uno y del porcentaje correspondiente al otro. Si la proporción de votantes que están a favor de una ley es 0.42 y la proporción de abstenciones es 0.19, entonces 0.61 es la proporci6n de votantes que están a favor de la ley o que se han abstenido. Antesdedar algunos ejemplos de funciones de probabilidad, es importantc aclarar que los tres axiomas no nos indican la manera de asignarlas probabilidades a los distintos resultados de un experimento, sino que restringen las formas en que esto se puede hacer. En la práctica, las probabilidades se asignan por la estimación de los resultados de las experiencias anteriores, por un análisis cuidadoso de las condiciones que rigen el experimento o haciendo la suposici6n común de que varios casos son equiprobables (es decir, que hay la misma probabilidad de que se presente cualquiera de ellos). Los siguientes, son tres ejemplos de formas aceptables de asignar las probabilidades en un experimento en que hay tres casos posibles que mutuamente se excluyen, A , B y C: (4

P(A) = 1/3,

P(B) = 1/3,

P(C) = 1/3

(b)

P ( A ) = 0.57,

P(B) = 0.24,

P(c)

(4

P ( A ) = 24/27, P ( B ) = 2/27,

= 0.19

P(C) = 1/27

sin embargo, (4

P ( A ) = 0.64,

(4

P ( A ) = 0.35,

P(B) = 0.38, P(C) P(B) .= 0.52, P(C)

-0.02

0.26 no son aceptables porque contradicen los axiomas 1 y 2, respectivamente.

Si un espacio muatral tiene n resultados, se puede demostrar que contiene 2“ subconjuntos, incluyendo el espacio completo y el conjunto vacio. Así, cuando

1!

PROBABILIDAD

n =. 20, hay más de un millón de sucesos en S, y el problema de determinar las probabilidades paracada suceso resultasumamente complicado, Afortunadamente, esto se puede simplificar considerablemente usando el siguiente teorema: Teorema 2.2. Si .A es un suceso de S, P ( A ) es igual a la suma de las probabilidades de .los.resultados individuales 'que constituyen A.

c2,. . .

.

,E,, los n resultados que compoPtira probar este teorema, sean El,, nen A; entonkes, podemos escribir A = El Ú E z U V E,. , Como las E'son casos individuales, se excluirhn mutuamente, y por la generalización del axioma 3, tendremos Y(A)

P(E1 V E2 U . = P(E1) P(Ed

+

. ..

. .UE.) + . . + P(EJ *

lo que completa la demostraci6n. Para ilustrar el empleo de este teorema, consideremos el ejemplo del proyectil de la página 7. Los 18 casos posibles y sus probabilidades se muestran en la tabla que sigue. (Las probabilidadesasignadas a cadaunode los casos se escogieron arbitrariamente en este ejemplo, pero de tal forma que los axiomas de probabilidad se satisfagan. En la prktica, estas probabilidades se podrían estimar por los resultados de experiencias anteriores, o también por hipótesis adecuadas: véasela página 28.) Probabilidad

Sucesos

0.336

Probabilidad

0.042 0.012 0.006 0.056 0.016 0.008 0.014 0.004 0.002

0.096 0.048 0.084

0.024 0.012 0.168 0.048 0.024

De esta tabla,podemos Calcular la probabilidad P(C,)deque e1 proyectilresponda a los mandos, sumando las probabilidades de los 9 casos en que interviene el suceso G,, con Io que obtendremos . ,

P(G1) = 0.336

+ 0.096 + 0.048 + 0.168 + 0.048 + 0.024 + 0.056 + 0.016 + 0.008 =. 0.800

Usando elteoremta 2.2, obtendremos sirnilarmente P(A1) = 0.336 0.084 +"0.168 0.042 $0.056 P(P1) = 0.33b 0.090 0.048 0.084 0.024 r(rln G,)'= 0.336 0.096 0.048 = 0.480

+ +

+

+

+

+ +

+

+ 0.014 = 0.700 + 0.012 = 0 . W

18

PROBABILIDAD

el idtimo valor es la probabilidad de que el sistema de propulsi6n del proyectil trabaje perfectamente y que el proyectil responda a los mandos.Paraencontrar la probabilidad de que dos, O más, de los componentesdelsistemaoperenimperfectamente.tenemossimplemente que sumar las probabilidades de todos los resultados que tienen 2 6 3 subindices distintos de !, lo que nos da 0.212. Otra ilustración nos da e! problema de la página 14 en eF que supondremos que uno de los 50 empleados va a ser elegido por sorteo para intervenir en un comitiobrero patronal. Considerando que cadaempleado tiene unaprobabilidad de’ 1/50 de ser elegido, es fácil verificar, por medio del teorema 2.2, que la probabilidad de que este cargo corresponda a un empleado casado es P ( M ) = 3/5, la probabilidad de que sea graduado es P ( G ) = 3/10, y la probabilidad de que el empleado sea casado, o graduado, o ambas cosas, es P ( M U G ) = 7/10. (Usando el teorema 2.2, cada una de estas probabilidades se obtiene sumando 1/50 tantas veces como resultados individuales se presentan en el suceso respectivo.) En este últimoejemplohubiéramos podido empleartambién e! siguiente teorema yue se aplica a experimentos en los que todos los resultados individuales son equiprobables: Teorenru 2.3. Si u11 experimento tiene n resultados posibles equiprobubles y .si S de estos resultados son “favorables”, entonces la prohahilidad de u11 resultado favorable es sjtr. Este teorema se deduce inmediatamente del teorema 2.2 y de la generalización del tercer axioma de probabilidad. Así hubiéramos podido encontrar que la probabilidad de que salga elegido un empleado casado es

P(M) =

w = 30 = 3/5 N ( S ) 50

y que la probabilidad .de que salga elegido un empleado casado y que sea graduado es

P(M n G )

=

N ( M G) ~

=

10 50 = 1/5

El teorema 2.3 es particularmente iltil en problemas de juegos de azar. en los que se supone, que si se ha barajado bien u n juego de cartas, cada carta tiene !a misma oportunidaddesalir;que si una monedasetiracorrectamentecadalado tiene también !a misma oportunidad: y que si un dado se tira correctamente, cada cara tiene las mismas posibilidades que las demás. Luego, la probabilidad de sacar unrey de una barajaordinariade S2 cartases 4/52, la probabilidad deobtener cara al tirar una moneda es 1/2. y la probabilidad de sacar un nilmero impar en un dado es 3/6. 2.4

Algunosteoremas

elementales

Usando los axiomas deprobabilidades posible desarrollar muchosteoremas que juegan un papel importante en!as aplicaciones. En primer lugar, consideraremos

ALGUNOS TEOREMAS €LEMENTALES

19

20

PROBABILIDAD

Notemos ahora en el diagrama de Venn de la figura 2.11 que A

v R - ( A n B ) u ( A n B’) u (A’ nB )

y también

A B

= =

( A n B ) u ( A n B‘) ( A A B ) U (A’ h B )

(El lector habra verificado estas importantes relaciones en las partes (c) y (d) del problema 10 de la página 14). Como es evidente que A n B, A n B’ y A’ n B se excluyen mutuamente, la generalización del axioma 3 nos da

+

+

P ( A u B ) = P ( A n B ) P ( A n B’) P(A‘ n B ) y después de sumar y restar P ( A n B ) , tendremos ~ (unB ) = [ P ( A A B ) P ( A nB’)] [ P ( A nB ) P(A’ n B ) ] - P ( A nB ) = IYA) P ( B ) - P ( A nB ) Cuando A y B se excluyen mutuamente, el teorema 2.5 se reduce al axioma 3, ya que, en tal caso, P ( A n B ) = O. Por esta razón, llamamos al axioma 3 k y pur-

+

+

+

+

ticular de adicih, mientras que el teorema 2.5 se llama ley general de adición. Para ilustrar el empleo de esta teoría, consideraremos nuevamente el ejemplo de1 pro-

S Fig. 2.11 Partición de A U B

yectil y determinaremos la probabilidaddeque el sistema de propulsión trabaje perfectamente, que el proyectil responda a los mandos, o ambas cosas. Llarnhreihos a esta probabilidad P(P, U G,), que se @odrá obtener a partir de Irt tabla de la página 18, sumando las probabilidades de todos aquellos casos en que aparecen al menos una de las letras P y G con e1 subíndice 1. Por otra parte;usando el teorema 2.5 y Jas probabilidades de la tabla, tendremos P(P1 U GI) 7 0.600 0:800 - 0.480

.+

= 0.920

Nótese que, si hubiesemos cometido el errordeusarla ley particularde adición en este ejemplo, se hubiera obtenido el resultado absurdo de que la probabilidad buscada era 1.400.

21

ALGUNOS TEOREMAS ELEMENTALES

EJERCICIOS 1. Hacer una lista de 10s 16 subconjuntos en que se pueden clasificar los ejemplo de la pagina 14. 2. Con respecto a la figura 2.10, hallar

50 empleados del

N(M U G’), (b) N (Jf’U G), (4

(c)

N [ ( M n WI.

3. Entre 100 estudiantesdeingeniería, 15 estudian para ingenierosquímicos, 60 e s a n estudiando el ciclo preparatorio para entrar a la escuela de ingeniería, y 5 de los que estudian el ciclo preparatorio van a estudiar ingeniería química. &‘u6ntos de estosestudiantes cumplen con las condiciones siguientes? (a) No estan estudiando para ser ingenieros químicos. (b) No estudian cursos preparatorios. (c) E s a n estudiando para ser ingenieros químicos, estudian cursos preparatorios, o ambas cosas. (d) Estudian cursos preparatorios pero no van a ser ingenieros químicos. (e) N o estudiancursos preparatorios y van a seringeaierosquímicgs. (f) No estudian cursos preparatorios y no van a ser ingenieros químicos. 4. Un distribuidor tiene 75 autombviles, de los cuales los de (A) tienen tracci6n delantera. los de ( B ) son compactos, y los de ( C ) tienen transmisión automfttica. Usando la información dada en la figura 2.12, hallar: (8)

NU),

@) N(B), (c) N(C)J

(d) (4

n B), N ( A n (3,

(r) w m m c > , (g)

u4

,

(h) N ( B U (3, (9 N U ‘ U B’ U C), 6 ) NtB n ( A u C)I.

5. Un experimento presenta exactamente cuatro casos distintos: casos las probabilidades asignadas son aceptables.

A , B. C

y,D.Indicar en que

P ( A ) = 0.36,P(B) = 0.18, P(C) = 0.21, P(D) = 0.25, (b) P ( A ) -- 0.29, P(B) = 0.35, P(C) = 0.18, P(D) = 0.15, (c) P ( A ) 0.43, P(B) 0.17, P(C) -0.08, P(D) 0.49, (d) P(A1 17/80, P(B) = 11/40, P ( Q = 1/2, P(D) = 1/80. (a)

J

muestra1 ilustrado en la figura 2.5, ‘denotaremos por (i, j) el resultado en elque hay i componentesdefectuosos en elprimersubequipo, y j en elsegundo (i = O, 1, 2, 3, 4; j = O, 1, 2 y 3). Suponiendoque la probabilidad del caso (O,O) es 1/2 y lasprobabilidadesde los resultados restantes son inversamenteproporcionalesa i + j, número total de componentes defectuosas en el equipo completo, hallar la probabilidad de cada resultado en el espacio de muestreo. ’. Con los resultados del problemaanterior,encontrarlasprobabilidades siguientes: (a) El primer subequipo tiene, a lo mis, una componente defectuosa. (b) El segundo subequipo tiene por lo menos doscomponentesdefectuosas. (c) El equipo completo tiene como mkximo una componente defectuosa.. (d) El segundosubequipo tiene mhs componentesdefectuosasque el primero. . En elejemplo de la phgina 18, se supusoquecadaunode los 50 empleadostenía la misma probabilidad de entrar en el comit6 obreropatronal. Si, en lugar de ello, supone-

i. En el espacio

.

22

PROBABtLlDAD

mos que un empleado que se gradub tiene probabilidad doble que el que no lo terminh, encontrar: ( a ) P ( M ) , ( b ) P ( G ) , fc) P ( M 17 G j , y ( d ) P ( M U G ) . 9. En la tabla de la página 18, determinar:

c

S

Fig. 2.12 Problema 4 10. AI tirar dos dados defectuosos, ¿cuál es ]a probabilidad deque los nfimeros sumen ( a ) 7, ( b ) 11, ( c ) 7 ó 11, ( d ) 2, 3 3 127 11. Conunabarajade S2 cartas,determinar la probabilidad de sacar (a) una reinanegra, ( b ) una carta roja, ( c ) un cinco, un seis O un siete, ( d ) un as negro o un rey rojo. 12. Para un sorteo de lotería se lenden números del uno x1 10000. ¿CuAl es la probabilidad de que el número premiado sea divisible entre 20? 13. Supongamos que uno de 10s automóvilesdelproblema 4 sufradañosduranteunatormenta. Considerando probabilidades iguales, determinar la probabilidad de que el coche dañado: ( a ) Sea compacto. ( b ) Tenga traccióndelantera. (c) Sea un compacto sin transmisión automática. ( d ) No sea compacto, pero tenga transmisión automhtica y tracción delantera. 14. Si A y B son sqcesos que mutuamente se excluyen, P ( A - ) = 0.20 y P ( B ) = 0.55, hallar: (c)

(b) P ( A U B), 15. Sean P ( A )

=

0.30, P ( B )

( 4 F(A UB),

(b) P ( A n B’),

16. L a probabilidaddequese dada por:

n

P ( A B), (dl P(A’ n B’).

(a)

=

0.78 y P ( A 17B )

=

0.16, encontrar:

u

P(A’ B’)J (d) P(A’ n B).

(C)

presente, al menos, uno de los tres sucesos A , B y C, está

23

PROBABILIDAD CONDICIONAL

Compn5bar esta fórmula con las probabilidades indicadas en la figura 2.13.

Fig: 2.13 Problema 16 17. En el control de calidad de una producción en masa de ladrillos de viilrio, la probabilidad .de que un inspector encuentre: un ladrillo rajado es, 0.0025, uno con burbujas de aire 0.0020, uno decolorado 0.0020, uno rajado y con‘burbujas de aire 0.0006, uno rajad o y decolorado 0.0005, uno con burbujas de aire y decolorado 0.0004, y uno con estas tres imperfecciones 0.0001. LGuril es la probabilidad deque encuentre unladrillocon una de estas tres imperfecciones por lo menos? 18. Demostrar que ( a ) P ( A ) 2 P ( A flBj, y (b) P ( A ) i P ( A U B ) . Sugerencia: Veanse losapartados(c) y ( d ) delproblema 10 de la página 4. 19. Supuesto que A , B y C son sucesos que mutuamente se excluyen, .explicar por qué no son admisibles ninguna de las siguientes asignaciones de probabilidades: (a) P(A) = 0.4, P(B) = 0.4, P ( A U 0 = 0.2, I

(b) P ( A ) = 0.7, P ( B ) 0.1,P ( 8 n c) = 0.3, (c) P ( A ) = 0.6, P ( A n B’) = 0.5. 2.5 Probabilidad condicional . . En la forma en que hemos definido la probabilidad, sÓ10 podremos .habls de ella con relación a un espacio Wuestral S dado. La probabilidad de que un ingeniero tenga un salario de 10 O00 dólares o más, no tiene sigrlificado, a menos que especifiquemos si nos referimos a toda una nación, a una industria en particular, a una fábrica dada, etc., y además, que precisemos cómo se hace la selección. Entonces, cuando usamos el símbolo P ( A ) para indicar la probabilidad de A , realmente nos estamos refiriendo a la probabilidad de A con respectoa algún espacio muestra1 dado, S. Como el precisar S no siempre es. evidente, y como hay problemas en que nos intresa la probabilidad de A con respecto a más de un espacio de, muestreo, usarems’la notaci6n P ( A 1 S) para ackirar a ,quC espaeio S nos referimos ‘en pgrtkular. Diremos’que P(A 1 S) es “la $robabiZidad coniiicional d e A con ‘respecto a S”, y, por consiguiente, cualquier probabilidad será una probabilidad condiciorial.

24

PROBABILIDAD

Naturalmente que se empleará la notaci6n simplificada P ( A ) cuando se sobreentiende el espacio S de referencia y no haya lugar a dudas. Para ilustrar algunas ideas referentes a probabilidades condicionales, consideraremos una vez más el conjunto de 50 personas ,algunas casadas y algunas que son graduadas como muestrala figura 2.10. Suponiendo probabilidadesiguales, vimos en la página 19, que la probabilidad de que una persona graduada sea elegida para el comité obreropatronial es P(G) = 3/10;. veamos ahora si esta probabilidad cambia al saber que una persona casada ha sido elegida. Para encontrar P(G 1 M ) , no tenemos más que analizar el espacio muestral reducido M , de la figura 2.14, y suponer

Fig. 2.14 Espacio de muestreo reducido

que cada uno de los 30 empleados casados, entre los que hay 10 que son graduados, tienen la misma probabilidad de ser elegidos. Así, usando el teorema 213 se obtiene

Nótese que si dividimos el numerador y el denominador de la 6ltima expresidn por N (S),tendremos

y se puede ver que la probabilidad condicional buscada es la razón de la probabilidad de que la persona elegida sea graduada, tomada con respecto al espacio muestrai reducidoM , a la probabilidad de que dicha bersona pertenezca a M , tomada con respecto al espacio muestral S. Considerando eSfe ejemplo desde otro punto de vista, podemos decir que, eon respecto al espacio de muestreo total S, se tiene

P(GAM)=

N(GAM) -5

suponiendo, como antes, Que cada uno de los 50 empleados tiene la misma pobabilidad de ser elegido para el comité. Así, las probabilidades de que la persona :legida, sea o no sea graduada, supuesto que es casada, deben estar en la raz6n 1:2 Como

25

PROBABILIDAD CONDICIONAL

deben dar 1, te-

P(d I M )

=

2

-31

P(G' I M ) = 5

* y lo que concuerdacon el resultado obtenido anteriormente. Esto explica tambítn por qué tuvimos que dividir por P ( M ) cuando escribimos

en la página 26. AI dividir por P ( M ) , o lo que es lo mismo, multiplicar por l / P ( M ) , estamos tomando en cuenta el factor de proporcionalidad que hace que la suma de las probabilidades en el espacio muestra1 reducido sea igual a 1. De acuerdo con lo anterior, daremos la siguiente definición formal:

Si A y B son dos sucesos cualesquiera de S y P ( B ) # O, la probabilidad condicional de A con respecto a B está dada por

Para 'ilustrar' esta definición, supongamos que se va a mandar una orden desde la Costa Este de&.U. a Los Angeles, pasando por Chicago. De experiencias pasadas se ha estimado que la probabilidad de que la orden llegue a tiempo a Chicago es 0.80, y la probabilidad de que habiendo llegado tarde a Chicago, llegue a tiempo a Los Angeles, es 0.10. Suponiendo que la orden llegue tarde a Chicago, queremos determinar la probabilidad de que llegue a tiempo a Los Angeles. Si L' representa la llegada a tiempo a Los Angeles y C la llegada tarde a Chicago, tenemos P ( C ) = 1 - 0.80 = 0.20, P ( L n C ) = 0.10 y, por lo tanto, o 10 f'(L I c> = % o = 0.50 Una consecuencia inmediata de nuestra definicidn de probabilidad condicional

es el teorema siguiente, que recibe el nombre de ley general de multiplicación: Teorema 2.6. *Si A y B son dos sucesos cualesquiera en S, se tiene P ( A nB )

P(A).P(BI A') = P(B)-P(A IB ) =

si P ( A ) z o si P ( B ) O

+

Sa segunda de estas relaciones se deduce de la definición de probabilidad cdndicioral, multiplicando ambos miembros por P ( B ) ; la primera se ha obtenido intercamliando las letras A y B en la misma definici6n y multiplicando después los dos mienhros por P ( A ) . Nótese que la definición de P ( B I A ) y P ( A I B j ' presupone que # ( A ) # O y P ( B ) O, respectivamente. ?ara ilustrar el uso del teorema 2.6 supongamos se trata de determinar la pro-

+

&

26

PROBABILIDAD

babilidad de hallar dos bombillas seguidas defectuosas al elegirlas sucesivamente.en un lote de 500, entre las que hay un total de 25 defectuosas. Suponiendo la igualdad de probabilidad es cada una de la elecciones de una bombilla entre las del lote, la probabilidad de que en la primera elección se encuentre una bombilla defectuosa es 25/500 y, la probabilidad en la segunda, 24/499, dado que enla primera se halla una bombilla defectuosa.Sustituyendo estos valores, obtenemos la probabilidad buscada, que es (25/500).(24/499) = 612495. Volvamos ahora al ejemplo del proyectil para el que las probabilidades de cada caso están dadas en la tabla de la página 18. Determinaremos ahora la probabilidad de que el proyectil responda a los mandos, supuesto que el sistema de propulsih trabaje correctamente. Empleando los datos de la tabla, obtenemos

y es interesante notar que este es el mismo valor que obtuvimos antes para P(G,). Ello significa que la probabilidad de que el proyectil responda a los mandos es la misma, independientemente de que el sistema de propulsión trabaje o no correctamente; en otras palabras, el funcionnrniento correcto de los mandos es independiente de las características del sistema de propulsión. En general, si A y B son dos SU=EOS un espacio muestra1 S, decimos que A es independiente de B si, y sólo si, P ( A I B ) = P ( A ). Empleando el teorema 2.6, podemos demostrar fácilmente que, si A es independiente de B, entonces B es independiente de A; es decir, P ( A I B ) = P ( A ) implica P ( B 1 A ) = P ( i ) , supuesto que P ( A ) # O. En este caso, diremos simplemente que A y B son independientes. En el caso especial en que A y B son independientes, el teorema 2.6 nos da la siguiente ley especial de rnultiplicacidn: Teorema 2.7. Si A y B son sucesos independientes, entonces, P ( A n B ) = P ( A )* P ( B ) Aplicando esta regla, vemos que, por ejemplo, la probabilidad de obtener dos Caras en dos tiradas sucesivas de una moneda es ( I 12) . (1/2) = 1/4 y que la probabilidad de obtener dos ases sucesivos en una baraja de 52 cartas es (4/52) . (4/52) = 1/169, siempre que se reponga la primera carta en la baraja, antes de sacar la segunda. La ley especial de multiplicación se puede generalizar para aplicarla a nás de dos sucesos independiente: si tres, o más, sucesos son independientes, la probdilidad de que todos ellos ocurran está dada por el producto de sus respectivas probabilidades. De hecho, esta ley es la que usamos al determinar las probabilidades de l a tabla de la página 18, suponikndolas independientes y haciendo P ( P 1 ) = 0.60, P(P2) 0.30, P(P:+) = 0.10, P(G,) 0.80, P(G2) 0.20, P ( A , ) = 0.70. P ( l 2 ) == 0.20 y P ( A a ) = 0.10. Subsistuyendo estos valores, se ohtuvo P(P1 A GI A A I ) = P(P~).P(G~).P(AI) (O.GO)(0.80)(0.70) 0.336

P(Pa A Gt n Az) = P(Pa)*P(GZ).P(Az) = (0.10)(0.20)(0.20) = 0.004 y las otras 16 probabilidades de ¡a página 18.

4

27

REGLA DE BAYES

2.6

Regla de Bares

La ley general de multiplicación es útil en la solución de muchos problemas en que el último resultado de un experimento depende de los resultados que se presentan en varias etapas intermedios. Supóngase, por ejemplo, que estamos interesados en conocer cómo trabajan los reguladores de voltaje instalados en una fábrica por dos abastecedores, B , y B,, estando en la proporción de 3 a 1 el número de los instalados por B, y B.2.En otras palabras, la probabilidad de que cualquier regulador de voltaje recibida por la planta, provenga del abastecedor B,, es 3/4, y la probabili-' dad de que provenga del B, es 114. Supóngase, además, que el 95% de los reguladores de B, y el 80% delos de B, trabajan de acuerdo con las especificaciones exigidas. Quisiéramos saber cuál es l a probabilidad del suceso A , de que un regulador cualquiera recibido en la fábrica trabaje de acuerdo con las especificaciones. Partiendo'de que A = (A n B , ) U ( A n B 2 ) y de que ( A f l 23,) y ( A n B,) se excluyen mutuamente (ver figura 2.11, poniendo B, y B , en lugar de B y B' respectivamente), la ley particular de adición nos da

P ( A ) = P ( A A B1)

+ P ( A nB2)

si ahora aplicamos la ley general de multiplicación a P ( A tenemos

P ( A ) = P(&).P(A I BI)

+

W n )

n

B,) y P ( A n B 2 ) , ob-

P ( A I &)

Substituyendo las probabilidades dadas P ( B , ) = 3/4, P ( B , ) = 1/4, 0.95, y P ( A I B2) = 0.80, se tiene

P ( A ) = Q(0.95)

P ( A I B,) =

+ i(0.80)= 0.9125

que es la probabilidad buscada de que uno cualquiera de los reguladores de voltaje recibidos cumpla con las especificaciones. ' En este ejemplo particular hay 2 alternativas en la etapa intermedia, los abaste. .. cedores B , y B,. En general, si hay n alternativas mutuamente excluyentes B,, BZ, B, en la etapa intermedia, pqdemos hallar la probabilidad del resultado final, suteso A , por medio de la fórmula * '

+

+

llamada algunas veces regla de eliminación. Esta situación se puede visualizar construyendo un diagrania ramificado como el mostrado en la figura 2.15, donde la probabilidad del resultado final A esta dado por la suma de los'productos de las prdbabilidades correspondientes a cada una ,de las ramas individuales. Como ilustración, supongamos que hay tres abastecedores en nuestro ejemplo y que las probabilida-

+

* Los símbolos se usan para hacer resaltar fórmulas o expresiones importantes que,de otra fornl'g,'no se distinguirían como partes de teoremas o definiciones.

28

PROBABILIDAD

des son las mostradas en la figura 2.16. Entonces, la probabilidad de que un regulador cumpla las especificaciones es

P ( A ) = (0.60)(0.95)

+ (0.30)(0.80)+ (0.10)(0.65)

= 0.875

Estudiaremos ahora un problemamuy relacionado con el anterior. Suponghmos que queremos determinar la probabilidad de que un regulador provenga del abaste-

Fig. 2.15 Regla de eliminación

Fig. 2.16 Regla de eliminación

cedor B3, cuando se sabe que cumple con las especificaciones. Refiriéndonos a la fiP(B, 1 A ) gura 2.16, usaremos la misma información que antes, pero ahora buscamos en lugar de P ( A ) . Para resolver este problema, escribimos

y substituimos

respectivamente, enel numerador y el denominador, de acuerdo con la ley general de.multiplicación y la regla de eliminación. Asi, obtendremos la fórmula P(B3 1 A ) =

P(B3) .,P(AI Ba)

Z P(Bi). P ( A I B J

i-1

que expresa la probabilidad buscada en función de las probabilidades dadas. Substituyendo los valores, dea l figura 2.i6, tendremos, finalmente, P'B3 I A )

+ (0.30)(0.80;, + (O0.lO)(0.65) (O. lO)(O.G5

= (0.60)(0.95) = 0.074

Nótese que la probabilidad de que un regulador provenga de B, disminuye de 0.10 a 0.074, una vez que sabemos que trabaja de acuerdo con las especificaciones.

El m6todo empleado para resolver este último ejemplo se puede generalizar obteniéndose la fórmula siguiente, llamada regla de Bayes: Teorema 2.8. Si B, y Bz, . . ., B, son sucesos que se excluyen mutuamente, de los cuales uno necesariamente debe ocurrir, esto es, $ p ( ~ =~ 1, ) entonces, i-1

para r

=

1, 2,. . ., ó n.

Esta regla nos da una fórmula para encontrar,la probabilidad de que el “efecto” A haya sido “causado” por el suceso B,. Así, en nuestro ejemglo, hallábamos la probabilidad de que un regulador de voltaje aceptable fuera suministrado porel abastecedor B3. Las probabilidades P(Bi) se llaman probabilidades “a priori” de las “causas” Bi, y, en la pdctica, es generalmente dificil asignarles valores numéricos. Durante muchos años se desconfió de la regla de Bayes porque se usaba haciendo la suposición, frecuentemente errónea, de que las probabilidades a priori eran todas iguales. Esta. dificultad se ha eliminado, ya que las probabilidades P(Bi) pueden determinarse por separado en cada caso, analizando la naturaleza del problema, preferentemente basándonos In experiencias pasadas. Volveremos a tratar este problema en el capítulo 8, donde daremos un ejemplo de inferencia Bayesiana Demos ahora otra ilustración de la regla de Bayes: supondremos que una oficina tiene cuatro secretarias que manejan, respectivamente, el 20, 6 0 , 15 y 5% de los archivos de todos los informes gubernamentales. .Las probabilidades de que estas secretarias los traspapelen son, respectivamente, 0.05, 0.10, 0.10 y 0.05 y se trata de encontrar la probabilidad de que se culpe a la secretaria núm. 1 de un informe traspapelado. Substituyendo estos valores en la fórmula de la regla de Bayes, obtenemos



p(B1 A)



0.20) (0.05

_ > ’

(0.20) (0.05)

+ (O.SO)(O!lO) + (O.I?5)(0.10) + (0.0!5)(0.05)

= 0.114

ES interesante notar que, aunque sólo el 5% de los informes manejados por la secretaria núm. 1 se han traspapelado, alrededor del 11 % del total de los informes traspapelados son de su responsabilidad.

EJERCICIOS

I

1

1. Refiriéndonos a la figura 2.10, hallar P(M G ) y P ( M G ’ ) : sup6ngase que, originalmen-

te, cada uno de los 50 empleados tenían la misma probabilidad de ser elegidos. 2. Si en el ejemplo de la p&gina27 se da también P ( L ) = 0.60, hallar la probabilidad de que un envío’haya llegado tarde a Chicago, sabiendo que llegó ir tiempo a Los Angeles. 3. Con respecto al ejercicio 1 3 de la pagina 24 y la figura 2.12, hallar las probabilidades de ’ que el autom6vil daiiado: (a) Sea un compacto, sabiendo’que tiene tracción delantera. ’ (b) Tenga transmisión automhtica, sabiendo que es compacto.

30

PROBABILIDAD

(c) Tenga tracción delantera o transmisión automática, sabiendo que es compacto. que no tienetracciónde( d ) Sea un compacto contransmisiónautomática,sabiendo lantera. ( e ) No sea compacto,sabiendo que tienetraccibn delantera ytransmisiónautomática. ( f ) N o sea compacto, sabiendo que tiene tracción delante, transmisión automática, o ambas cosas. 4. E n relación con las probabilidades dadas en la figura 2.13, determinar: ( 4 P ( A I B): (e) P ( A i B U C),

(b) P ( B I e), (c) P ( A n B I Q, (4 c I A’),

wu

5. Empleando 10s resultados del problema

P ( A I B n O, (g) P ( A n B n c I B (h) P ( A n B n c I B

n c), u c).

6 de la página 22, hallar la probabilidad de que: ( a ) El equipo completo tenga dos componehtes defectuosas, sabiendo que el primer subequipo tiene una componente defectuosa. ,’ ( b ) El primer subequipo tenga al menos dos componentesdefectuosas, sabiendo que el equipo completo tiene tres. ( c ) El equipo completotenga almenos.tres componentesdefectuosas, sabiendoque el primer subequipo tiene más defectos que el segundo. h. La probabilidad de que una construcción se acabe a tiempo es 17/20, la probabilidad de que no haya huelgas es 3/4, la probabilidad de que- la construcción se acabe a tiempo, partiendo del supuesto de que no haya huelgas, es 14/15. Hallar la probabilidad de que: ( a ) La construcción se termine a tiempo y que no haya huelgas. ( b ) N o haya huelgas, partiendo del hecho de que laconstruccibn se terminóa tiempo. 7. Una urna contiene 40 bolas blancas y 10 negras. Si se sacan dos bolas al azar (con iguales probabilidades), determinar la probabilidad de que las dos sean’blancas si: ( a ) La primera se vuelve a meter antes de sacar la segunda. ( b ) Se saca la segunda sin haber metido la primera. 8. ¿Cuál es la probabilidad de sacar 3 ases seguidos de una baraja de 52 cartas, si aquellos no se vuelven ameter en la baraja después de haber sido sacados? , 9. Supóngase que la probabilidad de que los Dodgers de Los Angeles ganen la Liga Ngcional es 0.25 y la de que la ganen los Gigantes de San Francisco e s 0.20. Además, la probabilidad de que el equipo de la Liga Nacional gane la Scrie Mundial es 0.45, 0.55 6 0.35, dependiendo esto de que el equipo sea, respectivamente, los Dodgers, los Gigantes, u otro cualquiera de la misma Liga. ¿Cuál es.la probabilidad de-que el equipo de la Liga Nacional gane la Serie Mundial? 10. En elproblema 2 anterior, hallar laprobabilidad dr: que el envío citado en él. lleguea tiempo a Los Angeles, sabiendo que llegó a tiempo a Chicago. [Sugerencia: Emplee la regla de eliminación.] 1 I . En la ilustración de la página 29 encontrar P ( B , 1 A ) y P ( B , 1 A ) . 12. Sabiendo que un equipo dela Liga Nacional ganó la Serie Mundial,emplear las probabilidades del problema9 anteriorpara determinarlaprobabilidadde que los Dodgers hayan ganado la Liga Nacional. 13. La probabilidad de que un accidente dd aviación debido a fallas estructurales se diagnostique correctamente es 0.85 y 1a.probabilidad de que un accidente no debido a estas fallas se diagnostique incorrectamente, atribuyendolo a fallas estructurales, es 0.35. Si. el 30% de todos los accidentes de aviaci6n se deben a fallas estructurales, hallar la probabilidad de que el accidente se deba a fallas de este tipo, sabiendo que el diagnóstico lo atribuye a ellas. 14. Un corredor usa un auto Corvette en el 50%) de las carreras en que participa; un Jaguar, en el 3 0 % ; un Alfa Romeo, en el 20% restante. De las 25 carreras en que ha corrido, u n Corvette ha ganado 5; de las I 5 que ha corrido con un Jaguar, ha ganado 4; y de las 10

ESPACIOS MAS DE MUESTRE0

GENERALES

31

que ha corrido con Alfa Romeo, tambiép ha ganado 4. Usando estQs números Para estimar las respectivas probabilidades, ¿cuál es l a probabilidad de que este corredor gane Su prbxima carrera? 15. Suponiendo que el corredor del pfoblema 14 gane la carrera, ¿cuál es la probabilidad de que ,haya corrido en un Corvette?

2.7

Espacios demuestre0 m i s generales

Hasta aquí, hemos discutido la teoría de probabilidades tal como se aplica a espacios muestrales finitos. Esta restricción se ha hecho para simplificar nuestra introduccian a la teoría; sin embargo, esto no implica ,que existan diferencias esenciales con las aplicaciones referentes a los espacios muestrales continuos o infinitos numerables. En esta sección trataremos varios ejemplos de ta!es espacios, indicando en cada caso qtiC modificaciones se debe' hacer a la teoría para definir las.funciones de probabilidad. Para dar un ejemplo de un experimento que se analiza más fiicilmente en un espacio muestra1 discreto pero infinito, supongamos'que nos interesa el nfimero de defectos (tales como soIdaduras o roturas) en 100 m de alambre. Es evidente que el espacio.de'muestreo es discreto y consta de casos o resultados posibles que se p u b den poner en correspondencia con los nilmeros O, 1, 2,. . . Como'no .bo¿lemos encontrar un número N tal que el ndmero máximo de defectos en los 100 m de alambre no exceda a N, si11 que este nlimero sen arbitrario, el espacio será infinito numerable. Para construir funciones de probabilidad en un espacio infinito cbmo el descrito, se modificará el axioma 3 de la manera siguiente, para incluir también la unión de una infinidad numerable de subconjuntos: '

Axioma 3'. Si A , , A , , A s , . . es unasucesibrr fiirita o infinita de SUcesos .que'se excluven mlttuamente en S, entonc&:

Un ejemplo de función de probabilidad que cumple con los axiomas 1, 2 y 3' se obtendría suponiendo, en la ilustración anterior, que la probabilidad de que hubiera x defectos en 100 metros de alambre fuera

para x = O, 1, 2,. . . (la letra griega X, lambdu es una constaote positiva). Como las probabilidades son no negativas y, además, probaremos que su suma es uno, la función de probabilidad dada cumple evidentemente con el axioma uno.'Para demostrar que también lo hace con el agoma ,2, nos bastará 'verificar que P ( S ) ,= 1, por lo que, usando el axioma 3', tendremos

32

PROBABILIDAD

Como la suma infinita anterior es el desarrollo en sene de Maclaurin de ex, se concluye que P ( S ) = 1. La función de probabilidad de este ejemplo tiene muchas aplicaciones importantes, como se verá en los capítulos 3, 5 y 16. El problema de definir probabilidades referentes a espacios muestrales continuos es algo más complicado. Por ejemplo, supongamos que ocurre un accidente en una carretera cuya longitud es de 200 kilómetros y nos interesa conocer la probabilidad de que el accidente ‘-?ya sucedido en determi:t>do lugar, o en un tramo fijado de la carxetera. Los resultados de este experimento se pueden considerar como los puntos de un continuo, tal como el intervalo de los números de O a 200. Se puede tomar como probabilidad de que el accidente. ocurra en cualquier intervalo de longitud L igual a L/200, con L. medido en kilómetros. Nótese que esta asignación arbitraria de la probabilidad cumple con los axiomas 1 y 2, ya que todas las probabilidades son no negativas y menores, o iguales, a uno, y P ( S ) = 200/200 = 1. Por supuesto, estamos considerando solamente sucesos representados por intervalos que forman parte del segmento de línea de O a 200. Usando e1 axioma 3’, podemos obtener también las.probabilidades de sucesos que no sean intervalos, pero que se puedan representar por la unión de varios intervalos finitos o de una infinidad numerable de intervalos. Así, para dos intervalos de longitudes L, y L, que no se superpongan, tendremos la probabilidad: LI Ls

+

200

y para una sucesión infinita de intervalos L,, Lz, LB,.. . , que no se superpongan, tendremos la probabilidad: Ll+Lz+La+ 200

...

Nótese que la probabilidad de que unaccidente Ocurra en cualquier punto .dado es igual a O, puesto que podemos considerar un punto como un intervalo de longitud O. Sin embargo, la probabilidad de que el accidente ocurra en un‘intervalo muy corto es positiva; por ejemplo, para un intervalo de un decímetro de longitud, la probabilidad es 9.5( Al ddinir una función de probabilidad en un espacio continuo, usaremos otra vez los axiomas 1, 2 y 3’ pero restringiremos el significado del término ‘suceso”. En lo quese refiere a la práctica, esta restricción no tiene consecuencias: simplemente, no se asignarán probabilidades a algunos conjuntos de puntos de naturaleza complicada, como son los que no se pueden expresar como uniones o intersecciones de un número finito o de una infinidad numerablede intervalos. La función de probabilidad empleada en el ejemplo .anterior, es efectivahente uncaso especial: y es similar en naturaleza’ a la función considerada en un espacio discreto con prdbabilihades iguales. En el capítulo 4 se darán otros ejemplos de funciones de probabilidad en espacios muestrales continuos.

,

3

.

DISTRIBUCIONES DE PROBABILIDAD'

I

"

3.1

Variabies'apatorias 1

.

En Ia mayoría de los experimehtos estamos. interesados' únicamente' en una descripción numérica particular (o en descripciones numéricas), de los casos que 'se presentan. Por ejemplo, en lainspecci6n de productos manufactdrados nos interesará sblo el n6mero t6faI de unidades defectubsas y no lanaturaleza de Ids'defectos; al estudiar la composicidn de'una aIeaci6n trataremos de determinar el dorc,entaje de cromo presente, sin importamos los dedibs elementos.que intervienen; en fa pruqba enLcarretera de un automóvil buscaremos el consumo medio de'combustible en varios terrenos, sin analizar otras características del funcionamiento del mísli.lo. Para ilustrar de manera' mis concrgtg 'esta' idea.'consideiaremos 'nuevamente e1 ejemplo del disparo del proyectil y los 18 'cisos indicados eh'la p@na 18. Supongamos ahora, quelo Únicó que nos interesa es el número total de,su&sistepqs qye fallan en vuelo. Repitiendo la lista de.los elementos del 'espacio muestra¡ y :us proiiabilidades, pero áiiadiendo ahora una-cólumna que'rios d t el número de subsistemas que nemos fallan. la tabla siguiénte:* .. I

,

I

4.

,

*

.

1 ,

.* . I

.,

t ' ,

,

;

..

Suponemos que un subsistema falla.si su funcionamiento no es perfecto.

33

34

DISTRIBUCIONES DE

Suceso

Probabilidad

Nimero de fallos

0.336

O

0.096 0.048 0.084 0.024 0.012

1 1 1

0.168

1 2 2

0.048 0.024

Probabilidad

'

0.042 0.012 0.006 0.056 0.016 0.008 0.014 0.004 0.002

PROBABILIDAD

Nimero de fallos 2 3 1

3 1

2 2 2

3

3

Nótese que sólo uno de estos casos corresponde a la ausencia de fallos, 5 corresponden a casos en los que falla un subsistema, 8 corresponden a fallos en dos subsistemas, y 4 a fallos en tres subsistemas. Empleando la ley especial de adición, vemos que la probabilidad de que falle exactamente un subsistema es

P(1) = 0.096 = 0.452

+ 0,048 + 0.084 + 0.168 + 0.056

Análogamente, obtenemos los valores de la tabIa siguiente: Fallos

I 2 3 0.452 0.188 0.024

Los numeros O, 1, 2 y 3 de esta tabla son valores de la variable uleatoriu que describe el número de subsistemas que faIfan. Observemos que a cada caso del espacio muestral corresponde un valor x de esta variable aleatoria y sólo uno. Luego, una variable aleatoria se puede considerar como una función definida en el conjunto de elementos de un espacio muestral. Notemos además, que para hal1,ar la probabilidad que,tom,a una variable aleatoria en cualquier valor de su recorrido, solamente hemos de h a k r uso he la función 'de probabilibad definida sobre los ,elementos del esaacio muestral y del axioma 3 o>del 3'. (Se supope, aquí lo,mismo que en el resto del capítulo, que los espacios muestrales son finitos o infinitos numerables:) Entonces podemos deffnir otra función,!que asocia a &da valor de una variable aleatoria'la probabilidad de .que la variable tome este valor. Esta funciiin, de la cual la tabía anterior es un ejemplo, se llama función d e probabilidad 0, 'también, ley de probabilidad. Tales funcione define? una distribucicin de probabilidad., Para indicár las funciones de probab,iliaad se usarán, los símbolos f(x), 4(z), g ( y ) ..~ Siempre que sea posible, trataremos de definir las funciones de probabilidad por medio de'ecuaciones; en .ocasiones será necesario 'dar una tabla que indique la; correspondencia entre los valores tomagos por la variable aleatoria y las proljabilidades ligadas a ellos. Por ejemplo, se puede comprobar fácilmente que la ecuación f(z) = 1/2 para z = O, 1

e(.),

35

VARIABLES ALEATORIAS

da la función de probabilidad del número de "caras" obtenido al lanzar al aire una moneda: por otra parte, sería dificil dar una expresión de la función de probabilidad del número ,de subsistemas que fallan enejemplo el del proyectil. Observemos también que, si ffx) es. un valor de unafunción d e probabilidad; se deben cumplir las ,propiedades siguientes: . .

(1) f(~)2 O para todas las x, (2)

,

z f ( 4 = 1.

toda x

Esto se deduce del hecho de que f(x) es una probabilidad y de que la suma de las probabilidades en el espacio muestra1 completo debe'ser igual a 1. . Generalmente es útil visualizar las .distribuciones de probabilidades por medio de grzlficas como las de las figuras 3-1 y 3-2. La primera de éstas recibe el nombre de histopamu Las alturas de los rectángulos son proporcionales a las probabilidades correspondientes y sus bases están puestas una a continuación de la d r a , de tal forma que no hayahuecos entre los rectángulos que representaahs valor- sucesivos de la variable aleatoria. La grafica de la figura 3.2 se llama diagrama de barras y las a las probabilidades coalturas de los rectángulos son, nuevamente;*proporcionales rreqxmdientes.

0.5

c

0.5

I-

. . . . Fig. 3.2 Carta de. barras J

Fig. 3.1 Histograrna

I

.

Como veremos más adelante, existen muchos problemasen los que no sólo nos interesa la probabilidad"f(x) de que el valor de una variable sea x, sino también la probabilidad de que el valor de una variable aleatoria sea menor o igual que x. In-dicando esta probabilidad por F ( x ) , la función que asigna un valor F ( x ) !a cada x del conjunto d l valares de la variable aleatoria, se denominafunridn de probabilidades rofales o funcitin de distribucicin. En el ejemplo dekfxoyectil. tendremos X

F(z)

1

1,

O.&

O.?f3$

2

3

0.976

l.Oq0

1.

,

.

'

36

DISTRIBUCIONES DE PROBABILIDAD

3.2

Distribucibnbinomial

Muchos problemas de estadistica se refierenasituacionesconocidas como “pruebas’ repetidas”. Por ejemplo, si deseamos conocer la probabilidad de que uno de 5 remaches se corte en un ensayo de tensidn, de que 9 de 10 tubos de vacío duren al menos 1 O00 horas, de que al menos 60 unidades de las 75 que forman un envío estén en buen estado, en cada caso estamos tratando con un niunero de “prue“casos favobas” y nos interesa la probabilidad de obtener un cierto número de rables”. Si n represew el número de pruebas y x el n w e r o d e casos favorables, los problemas de este tipo se pueden resolver utilizando la llamada distribución binomid, ya que se satisfacen las condiciones siguientes: Hay solamente dos casos posiblesen cada ensayo, llamados arbitrariamente casos “favorables” y “desfavorables”, sin inferir de esto que un caso favorable sea necesariamente un caso deseado. (Por ejemplo, la aparicidn de una unidad defectuosa en una mspeeidn puede considerarse como un caso “favdrable.) La probabilidad de un caso “favorable” es constante en todas- las pruebas; se denotará por la letra p , y por lo tanto, la probabilidaddel caso “desfavorable” será 1 - p . Hay n pruebas, siendo n una constante dada. Las n pruebas son independientes. Por supuesto, si qo se cumplen estas condiciones, el problema tendrá que resolverse con otro tipo :diferente de distribucibn de probabilidades adecuado., al caso. x casos favoratiies en n Empezaremos haliando la probabilidad de encontrar pruebas en un orden dudo. Denotando los casos favorables y los desfavorables respectivamente por las letras A y B, consideraremos la sucesión A O por otra parte

Hallar k, p y u2 en función de o! y p. electricidad (en millones de kilowatt-hora) se pue12. En cierta área, el consumo diario de de tratar como una variable aleatoria con distribución logaritmica normal con o = 3 "2 y p = 1/2. Silaplantamotrizque abastece esta Area tiene una capacidadiaria dc 10 millones de kilowatt-hora, ¿Cuál eslaprobabilidaddeque esteabastecimiento sea insuficiente en un dia dado? 13. Supongamos que las vidas de servicio deciertas unidadessemiconductoras tienen una distribución de Weibull conparámetros o = 0.005 y = 0.50 (ejercicio 11). Si 10 de estas unidades se ponen a prueba, determlnar la probabilidad de que al menos S estén en servicio satisfactorio al cabo de 40.000 horas.

4.5

Densidad de probabilidad conjunta de varias variables

Hay muchos experimentos en los que la descripción de los casos que pueden presentarse está dada por los valores de varias variables aleatorias. Por ejemplo, podemos medir la altura y el peso de un individuo; el volumen, presión, y temperatura de un gas; o el espesor, color y resistencia a la compresión de una pieza de vidrio. Si x,, x., ... . x k son los valores de k variables aleatorias, diremos que una función f con valores ,reales /(xl, x2. . dk), es Ia demidad de probabilidad corljutzta correspondiente a dichas variables, si la probabilidad de que al _< x1 _< b l . up x2 _< b,, y ak '2z k 5 bk está dáda por la integral múltiple.

<

.. .

o1

Ib'.. . jbb.f(X1, m

ab

22,

. . . , xk) dxl dx2 . . . dXk

76

DENSIDADES DE PROBABILIDAD

Nótese que, si f(xl, xz,. . ., Xk) 2 0 para todos los Valores de xl, para los que la densidad de probabilidad está definida, y

XZ.

. ., X k

esta definición es compatible con los axiomas de probabilidad modificados que vimos en la sección 2.7. Designando por F ( x l , x2, . . ., xk) la probabilidad de que la primera variable aleatoria tome un valor menor o igual que xi,la segunda menor o igual que x:, . . . , y la k-ésima menor o igual que Xk, diremos que tal funci6n F es la funcicin de diStribucicin conjutltu de las k variables. Como ilustración, consideremos la densidad de probabilidad conjunta de dos variables dada por para x1 > O, x2 > O en el resto La probabilidad de que la primera variable tome un valor entre 1 y 2 mientras que l a segunda lo hace entre 2 y 3, está dada por f(x1, x21

\23

2z1-3z3

=

Ge-2zl-3n

dxl dxz = (e” - e-4)(e-6

- e-9)

= o.ooo3

y la probabilidad de que la primera variable tome un valor menor que 2, mientras la segunda tiene uno mayor que 2, está dada por

/o” /2” 6e-2z1-3zr dzl dxz

= (1

- e-4)e-6

= 0.0025

Además, la función de distribución conjunta de este parde dado por F(z1,22) =

{ff’

F(x1,xz) =

{I: -

6e-2u-3u du dv

O parte e-2z1)(1

variables está

para z1 2 O, x2 2 O

otra

por

- e-3z9

para $1 2 O, x2 por otra parte

2O

De acuerdo con la definición de independencia dada en el capitulo 2, diremos que las k vuricrhles deutorius son (estocasticamente) independientes si, y d o si, F(zl, 22,

. . ,xk)

= Fl(x1) *FZ(zz).

. ‘F(xk)

para todos los valores de x,, x-, . . m i , . para los que están definidas las funciones, siendo Fi(xi) para i = 1, 2, . . . k el valor correspondiente de la función de distribución de la variable aleatoria i-ésima. Inmediatamente se deduce de esta definición que. si k variables son independientes, cualquier valor de la densidad de probabilidad conjunta de la6 k variables es igual al producto de los valores de las densidades de probabilidad de las variables individuales. En otras palabras, ,

77

ROBABILIDAD RIABLES ARIAS DENSIDAD CONJUNTA DE DE

f(X1,

. , * *

Xk)

= fl(Xl).fi(X2)

- ...

*fk(Xk)

donde fi (xi) para i = 1, 2, . . . k es el valor correspondiente de la densidad de probabilidad de la i-ésima variable. En el ejemplo numérico considerado, nótese que las dos variables son independientes. En general, la densidad de probabilidad de la i-ésima variable se puede obtezer a partir de la densidad conjunta integrandorespecto todas las demás variables, o sea,

Llamaremos a fi(xi) densidad marginal de la i-ésima variable. Por ejemplo, en el anterior la densidad marginal de la primera variable está dada por

para xl > O, y f , (x,) == O enel resto. El siguiente. es otro concepto de importancia al tratarcon k variables aleatorias. Si una varidble aleatoria toma el valor g(xl, x?, . . . xk) cuando las k variables aleatorias toman los valores xl, xz, . . . Xk, entonces, el promedio, o media, de la prime-

ra variable se define por la Integral

Por eje~nylo,si nos inreresa el valor promedio del producto de las dos variables del problema numérico antes citado, obtenemos

EJERCICIOS 1. Dos variables aleatorias tienenladensidadconjunta pgra O < x en resto el

4xy

9) =

{o

dada por

< 1; O < y < 1

(a) Hallar la probabilidad de que 0 5 .I: 5 1/2 Y 1/8 5 Y 5 li4. (b) Hallar laprobabilidad de que y X. 2. Dos variables aleatorias tienen la densidad conjunta dada por

>

f(x, Y)

=

k(x2

{o

+ y*)

para O < c cn el resto

< 3, 1 < y < 6

( a ) Hallar k. ( b ) Hallarla probabilidad de que 1 < x < 2 y 2 < g < 4. (c) Hallar la probabilidad de que 2 5 x 5 3. ( d ) Hallar laprobabilidad de que x > 5. 3. Tres variables dc azar ticncn la densidad de probabilidad conjunta dada por

+

78

DENSIDADES DE PROBABILIDAD

( a ) Hallar k . ( b ) Hallar la probabilidad deque L < g y z < 1. (c) Hallar la probabilidad de que z > 3. 4. Con respecto a la densidad conjunta del ejercicio I , ( a ) Encontrar una expresión para l a función de distribución de la primera variable. !b) Encontrar una expresión para l a función,de distribución de la segunda variable. ( c ) Demostrar que las dos variables son independientes. 5. Con respecto a ladensidadconjunta del problema 2, ( a ) Hallar una expresidn para l a función de distribución de la primera variable. ( b ) !fallar una expresión para la función de distribución de la segunda variable. ( c ) Demostrar que las dos variables son independientes. h. Un par de variablestienen“distribuciónnormalcircular” si su densidadconjunta está dada por

< %I < 30 y --so < x2 < m . = 1, p? = -3, y u = 10, utilice la tabla 111 para determinar la probabilidad de que ”14 < x1 < 16 y--Y < x2 < 15. (b) Si p1 = 11.2 = Oy u = 4, hallar la probabilidad de que (x,, xz) este contenido en la región entre los círculos .r: .ri = 4 yr: .r$ = 16.[Suyerencia: Usar coordenadas

para

--m

(a, Si

PI

+

7.

8. 9.

10.

+

polares. ] Una bomba dirigida hacia un punto que sirve de blanco, tiene u n área de destrucción con radio de 400 pies (122 m). Empleando el blanco corno origen de un sistema de coordenadas rectangulares, sup6ngase que las coordenadas Íx, y ) del punto en que hace impacto la bomba son los valores de un par de variables de azar que tienen una distribución normal circular con = ~2 = O y u = 250 pies. (Ver problema 6 ) . ¿Cuál es l a probabilidad de que el blanco sea destruido‘! Con respecto a la densidad conjunta del problema 1, hallar el valor promedio de la variable aleatoria cuyos valores estin dados por g(s, y) = z y. Con respecto a la densidadconjuntadelproblema 2, hallar elvalorpromedio de la variable aleatoria cuyos valores estin dados por g(.c y) = xzy. Si las medidas de altura y anchura de un rectingulo tienen la densidad conjunta,

+

+

io

resto en el

hallar la media y la variancia de la distribución correspondiente del

área del rectángulo.

5

APLICACIONESA LA INVESTtGAClON OPERATIVA

5.1

Introduccith

El desarrollo en las últimas décadas ha traído como consecuencia el fIorecimiento de una nueva tecnologia que es en parte Matemática, en parte Estadística,en parte Ingeniería y en parte algo nuevo. Se ha denominado lnvestigacidn operativa y se puede definir como la aplicación de las técnicas científicas modernas a problemas que tratan de la operación de un sistema considerado en su conjunto -por ejemplo, el desarrollo de una guerra, la dirección de una empresa, la producción de un artículo, la planificación econ.ómica, etc. Entre los temas de estudio incluidos normalmente bajo el título de Investigación operativa, encontramostemas tales como la manera de tomar decisiones “científicas”, la teoria de los juegos, la programación lineal, la teoría de los procesos de azar, los métodos para tratar los problemas de inventario, localización, transporte, Y otros. En este breve capítulo estudiaremos algunos de estos métodos como aplicaciones particulares de la teoria desarrollada en los caDítuloS anteriores. 79

80

APLICACIONES A LA INVESTIGACION OPERATIVA

5.2

Laesperanzamatemática y la toma de decisiones

Muchos problemah de cie:ncia. ingeniería y direccitin de negocios son de tal in( o consecuencias dz lasacciones tomadas) esta11 sujetos al azar. Supongamos. porejemplo.que. en lafabricdcicin de cierto producto. el costc) u!litario es de S 13. una unidad en buen estado, se puede vender en $ 17. la probabilidad de producir una unidad defectuosa es 0.20. -y una unidad defectuosgw pierde representa totalmente. Luego. considerando 10s beneficios. cadaunidadfabricada unaganancia de $ 5 o una perdida de 12 ( o sea.ur.a ganancia de - $ 12). Esta informaci6n. en sí. no nos permite decidir si conviene o no fabricar el producto. pero nos ayudar5 en una decisicin de este tipo. Notemos. por ejemplo. que alrededor del 80'; de las unidades representan una ganancia de !$ 5. y alrededor del 20') de las unidades representanunaperdida de 5 12, en consecuencia. a la larga. hay una ganancia media de j(0.80) - 12(0.30) = b 1.60 por unidad. Hemos obtenido este valor multiplicando cada caso posible (la ganancia de S dcilares o la pérdida de 12) por la probabilidad correspondiente, y Ilamatnos a este resultado t d o r c~.sperudodel beneficio o. simplemente, beneficio esperado. Comparando el metodo de medirtalvalor esperado conladefinicicin de que vimos en la pagina 49. observamos que cl t~rlorrsprrudo (le uttu l*nriahlr alentorin es .virlrplctlwtzte ltr tnrrlitr de s u tlistrihucicit1 ~ I prohuSilidurles P Para dar otra ilustracitin del c5lculo de u n valor esperado. supongamos que una Iirma de ingenierostiene la tarea de preparar una propuesta para u11 contrato de investigacitin: el costo de la preparacih de la propuesta es $ 5 000. y se supone conocido que los beneficios brutos potenciales de !$ 30,000, !$ 20300. !$ 10,000 6 $ 0. tienen probabilidades de 0.20. 0.50. 0.20 y 0.10. respectivamente, enel supuesto de que la propuesta se acepte. Partiendo de que la probabilidad de que se acepte la propuesta es 0.30. vemos que hay una probabilidad de (0.30) (0.20) = 0.06 de obtener u n beneficio neto de $ 25.000 $ 30.000 (menos el costo de la propuesta). Análogamente, las probabilidades de obtener beneficios netos de $ 15.000 y de $ 5,000 son.respectivamente, (0.05) (0.30) = 0.15 y (0.20) (0.30) 0.06. mientras que la 0.73. teniendo probabilidad de una pcrdida de S 5,OOO es (0.10) (0.30) 4~ 0.70 presente la posible eventualidad de que laproposicicin no se acepte. Entonces, nos encontramos en la situacidn descrita enla tabla siguiente: dole que los resultados

! J

y

-L

(25,000)(0.06)

+ (15,000)(0.15) + (5000)(0.06) - (5000)(0.73) = $4'00

Si es. o no, prudente arriesgar $ 5.000 para obtener unautilidad esperada de N 400, no escuesticinestadística. Si una compañía tiene capital y sdo puede hacer unas pocas propuestas de este tipo, el73'; de oFortunidades de perder S 5,000 puede haLer de esto una aventura nada atractiva. Por otra parte, si una compañia

81

LA ESPERANZA MATEMATICA Y LA TOMA DE DECISIONES

tiene un capital muy fuerte y prepara muchas de estas propuestas, puede tener sentido aceptar el riesgo. por la promesa de la devolucitin esperda del 8% de la inversicin inicial. En el ejemplo que sigue, se usan los valores esperados para determinar las condiciones bptimas de un problema típico de inventario. Supongamos que seconoce. por experiencias pasadas, que la demanda diaria de cierto producto perecedero tiene la siguiente distribucitin de Probabilidad Número de orden

Probabilidad



3

I

1

4

0.05 0.12

5 0.20 0.24

0.17

0.14

0.08

I

El costo de cada unidad es de $ X (incluyendo el costo de su transporte y almacenamiento), y se vende a 5 SO, y si una unidad permanece en el glmacén. pasado un día representa su perdida total. A partir de esta informacicin, se trata de determinar cuántas unidades deberán almacenarse cada dia para que e/ beneficio esperado sea illú.xifllo.

Con tres unidades almacenadas, el beneficio en dólares es. obviamente, 150 menos 105 = 45. ya que hay una probabilidad de 1.00 de que la demanda sea de tres unidades o más. Con cuatro unidades almacenadas, hay una probabilidad de 0.05 de que exactamente tres unidades puedan ser vendidas, una probabilidad de 0.95 de que la demanda sea de cuatro o más y. por consiguiente. hay un beneficio esperado de 150(0.05)

+ 200(0.95) - 140

57.50

Análogamente, con cinco unidades hay una probabilidad de 0.05 de que exactamente se vendan tres unidades, una probabilidad de 0. 12 de que se veldan exactamentecuatro unidades. unaprobabilidadde 0.83 deque la demanda sea de o más y. por consiguiente. el beneficio esperado es 5 9

150(0.05)

+ 200(0.12) + 250(0.83) - 175 = 64.00

Continuando de esta manera, podemos ver que el beneficio esperado con seis unidades es $ 60.50, con siete unidades $45.00, etc.: por lo que el beneficio esperado alcanza su máximocuandohay cinco unidadesen el almacén (viase también el ejercicio 6 de la página 83). En años recientes, los valores esperados (la esperanza matemúticu, como tambiOn se llama) han venido .ocupando una posición cada vez más importante en la toma “científica” de decisiones. Como hemos indicadoen el ejemplode la página 80, no sirven como criterio Único para tomar decisiones, pero dan una información muy importante para tomar las decisiones de una m’anera racional. Como ótra nueva aplicación, observemos cúmo se pueden utilizar los valores esperados para seleccionar la acción más ventajosa de un conjunto continuo de alternativas. Supongamos que un ingeniero puede escoger la velocidad del trabajodeunamáquina troqueladora automática de manera que haga r operaciones por hora, pero ocurre

82

APLICACIONES A LA INVESTIGACION OPERATIVA

que la proporción de operacionesdefectuosas p aumenta con r. Hay una utilidad $20.00 por de $ 1.00 por cada operación efectiva de la máquina, y una pérdida de cada operación defectuosa, y sabemos, por experiencias pasadas, que, para un número fijo r de operaciones por hora, la distribucih de probabilidad correspondiente al número p de operaciones defectuosas es, aproximadamente, (O.OO1)rpo~oolr-l para O < p < 1 por otra parte Con el objeto de encontrar la velocidad r que da mayor utilidad, determinaremos primero el beneficio esperado por hora para un valor dado de r, utilizando la fórmula de P de la página 62 en lugar de la dada en la página 49. Para valores fijos de r y p , el beneficio horario es (l.OO)r(l - p ) - (20.00)rp = r ( l - 21p) por lo que, para r fija, el beneficio esperado por hora es

/d r ( 1 - 21p)f(p) d p /d r(1 - 21p)(o.o01)rp0.~1~--1 dp =

1 0 0 0 ~- 20r2 1000 r

+

Finalmente, derivando con respecto a r e igualando a cero la expresión resultante, el beneficio esperado horario tiene un máximo cuarldo r = 25 y, para esta velocidad de troquelado, el beneficio esperado es de 12.10 $ por hora. Hay esencialmente dos limitaciones prácticas para aplicar los métodos de toma de decisión ilustrados en esta sección: primero, debemos tener la posibilidad de asignar “valores contables” a los distintos casos que se pueden presentar, y segundo, debemos tener la información adecuada sobre las probabilidades correspondientes a dichos casos. El problema de asignar valores contables a los diferentes casos puede ser mucho más complicado que en los ejemplos citados. Por ejemplo, un oficial de la Fuerza Aérea tuvo que tomar la decisión de cuántos bombarderos se debían mandar contra un blanco determinado; fue muy difícil dar valores contables para la destrucción del blanco y para la pérdida de un bombardero y su tripulación por la acción del enemigo. Para el valor contable del bombardero y su tripulación, fue necesario tener en cuenta los costos de gestión y entrenamiento, además del inestimable costo de la vida humana. También, puede ser igualmente difícil la especificación delasprobabilidades para los diversos casos. En el ejemplo anterior, postulamos cierta distribución para la proporción de operacionesdefectuosas con una velocidad r. En lapráctica,se hubiera requerido un gran ncmero de experimentos para descubrir tal distribución y, aún asj, sólo se hubiera conseguido una estimación (o una aproximación). Aunque la experiencia pasada se puede aprovechar frecuentemente para estimar las distribuciones de probabilidad (como hemos hecho en muchos.de nuestros ejemp!os), hay ocasiones en que esto conduce a caer en juicios subjetivos. Por ejemplo, e3 el

LA ESPERANZA MATEMATICA Y LA TOMA DE DECISIONES

83

problema de la página 80, que trata de la propuesta de investigación, resulta extremadamente difícil estimar la probabilidadde queunapropuestadeterminada se acepte. Esto no depende únicamente de la calidad de la propuesta, sino de muchos otrosfactores desconocidos, tales como la calidad y el númerodepropuestas de competidores, así como de la política seguida For la empresa a la que se presenta el proyecto. La estimación de 0.30, en nuestro ejemplo, es puramente subjetiva, basándose sólo en el “sentimiento” de algún ejecutivo por su propia experiencia. Aunque estas estimaciones de probabilidades no carecen de valor (presentándose en la misma situación y con la misma información) dejan abierta la posibilidad de que diferentes individuos lleguen a diferentes decisiones “ciptimas”.

EJERCICIOS 1. Un lote de 50 partes, entre lascuales hay 8 defectuosas, se Poneenventa ’Tal Como ’ sin permitir ninguna inspección. Si una parte defectuosa representa una Pérdida total de su precio de $ 12.50, y una parte en buen estado se puede revender a $ 14.509 Les conveniente comprar una de dichas partes (seleccionándola al azar)? 2. En un sorteo de lotería habrh cinco premios consistentes en: $1,000 el primero, $500 el segundo, $300 el tercero y $100 el cuarto y el quinto. Si se venden 1,500 boletos, ¿Cu&l es el valor de cada uno? 3. L a siguiente es una variante de un problema clasico del dlculo de probabilidades, Dos personas apuestan $ 8 cada una para jugarlos a “volados”. El ganador (que se llevará todo el dinero) sera el que gane 3 de 5 tiradas de la moneda. Por alguna razón, el juego se suspende después de la primera tirada, la cual fue ganada por el jugador A. (a) Dibujar un diagrama ramificado parademostrarque, después dehaberganadola primera tirada, la probabilidad de ganar del.jugador A es 11/16. ( b ) ¿Cómo deberln repartirse el dinero los dos jugadores, después de esta primera .tirada? 4. Sidos equipos de beisbol sonigualmente eficientes, las probabilidades de que la Serie Mundial termine en 4, 5, G ó 7 juegos, son, respectivamente, 1/8, 1/4, 5/16 y 5/16. ¿Cuál es la duración esperada (en número de juegos) de esta Serie Mundial? 5. Probar cierta parte de una máquina cuesta $ 50. Si en la máquina se instala una de estas partes defectuosas, la reparacióncostara $ loOO. ¿Sed ml convenienteinstalar la parte sin probarla si se sabe que el 3% de todas las componentes producidas son defectuosas? $3 el porcentaje es del 656? 6. En el ejemplo de la plgina 81, verificar que los beneficios esperados para 6 y ’r unidades, soh, respecdivamente, $60.50 y $45.00. 7. Un comerciante puede comprar un? unidad en $2.10 y venderla en $4.50. Las probabilidades de una demanda de O, 1, 2, 3, 4, ó “5, o niá$' unidades, son respectivamente, 0.05, 0.15, 0.30, 0.25, 0.15 y 0.10. Calcular los beneficios esperados, almacenando O, 1.. 2. 3. 4 6 5 unidades y determinar cuantas se deben almacenar para lograr el mziximo beneficio esperado. 8. Se emplean n vendedores para una campaña de ventas de puerta en puerta, el volumen bruto de ventas en miles de dólares se puede considerar como una variable aleatoria de distribución gamma con parametros a = 1W&y p = 1/2. Si los costos de ventas por vendedor son de $ 5 OOO, jculntos vendedores se deberin,emplear para lograr un maximo de utilidad? 9. IJna persona ha observado, por prop/a experiencia, que la oferta mínima para ufi trabajo de construcción se puede c w e r a r ‘como una variable aleatoria de densidad uniforme,

84

APLICACIONES A

(O

u\

INVESTIGACION OPERATIVA

por otra parte

donde C es su propia estimación del costo de la obra. ¿Que porcentaje debe añadir a su costo estimado, al someter s u oferta, lograr un mlximo en su utilidad esperada? 10. Una compañia alquila una computadora por períodos de f horas, a raz6n de $400 la hora El número de veces que la computadora se estropea durante r horas es una variable aleatoria de distribución de Poisson con X = (O.L()t, y si este número defallos es x, cuesta $ 5 0 . ~ 2volverla a poner enmarcha. ;Cbmo debe seleccionar la compañía el tiempo I, para lograr el máximo de beneficios esperados? [Sugerencia: Usar los resultados de la seccibn 3.5. ] I

5.3

Procesos aleatorios

Hablando en general, el término ‘‘proceso aleatorio” se emplea en relación con procesos fisicos que están completa o parcialmente controlados por cierta clase de mecanismo de azar. Se aplica a series de tiradas sucesivas de una moneda, a medidas repetidas de la calidad del producto de un fabricante sacado de una línea de montaje, a las vibraciones de alas de aviones, al “ruido” en señales de radio, y a otros muchos fenómenos. Lo que caracteriza estos procesos es su “dependencia del tiempo”, es decir, el hecho de que ciertos sucesos se presenten o no (según sus posibilidades) a intervalos regulares de tiempo o en un intervalo continuo del mismo. En esta sección trataremos de procesos que se desarrollan en un intervalo continuo de tiempo, tales como la presencia de imperfecciones en la fabricación continua de una pieza de tela, la medida de radiaciones con un contador Geiger, la llegada de llamadas telefónicas a un panel de conmutación o el paso de automóviles por un punto’ de coatrol electrónico. La distribución de Poisson, descrita en la sección 3.4, nos da una teoría matemática apropiada para muchos de estos problemas. Vamos a generalizar las hipótesis hechas en aquella sección; para ello, consideraremos que se estudian ciertos sucesos y que la probabilidad de que ocurran en unintervalo de tiempo At muy pequeño está dado por a . A t . Supondremos, además, que la probabilidad de que se presenten más de una vez el suceso en un intervalo de longitud A¿ es igual a cero, y que el que ocurra, o no, el suceso durante el intervalo de t a t A¿ no depende de lo que haya pasado antes del instante t. Repitiendo el razonamiento de la página 4S, deducimos de estas hipótesis que la distribución de probabilidad del número de veces que se presente el suceso durante un intervalo de tiempo, de longitud T , está dada por

+

f(x> =

e-aT(a?’)z

X!

para x = O, 1, 2 , 3 , . .:

Esta es la distribución de Poisson con media CYT, y de aquí podemos deducir que CY se puede interpretar como el número medio de veces que se presenta el suceso por unidad de tiempo. Un proceso de azar que satisfaga estas hipótexis recibe el nombre de proceso de Poisson con parámetro (Y.

85

PROCESOS ALEATORIOS

Aunque originalmente introdujimos la distribucih de Poisson para dar una aproximación de la distribución binómica, la hemos usado en algunos de los ejercicios de la página 48 relacionados con procesos aleatorios continuos. Así fue en los problemas que trataban ‘$e las imperfecciones en un ’proceso electrolítico continuo, de los fallos de un computador, de las radiaciones gamma emitidas por substancias radioactivas, y de la presencia de huracanes en la costa Este de los Eitados Unidos. En los problemas de procesos aleatorios es importante considerar el tiempo t entre dos veces sucesivas en que se presenta el suceso estudiado. En virtud de la naturaleza casual dé1 proceso, t es un valor de una variable aleatoria y debe tener algún tipo de densidad de probabilidad en un proceso aleatorio continuo. Para hallar esta densidad en un proceso de Poisson, observamos, en primer lugar, que la premisa: “el tiempo de espera entre la presencia de dos sucesos consecutivos es mayor que t” es equivalente a esta otra: “el nlimero de veces que s~ presenta un suceso desde el instante O hasta el instante t es igual a 0” Luego, si en un proceso de Poisson F ( t ) nos indica la probabilidad de que el tiempo de espera sea igual o menor que t, tenemos, 1 - F(t)

=

e-Uf(at)O

O!

O

F ( t ) = 1 - e-”’ Derivando con respecto a t (ver página 61), vemos que la densidad del tiempo de espera entre la presencia de dos sucesos consecutivos esta dada por la distrihu-

ponencial cibn

,

.

,

que ya habíamos introducido en la página 73. La media de estadistribuciónes p = l/a; luegoeltiempomedio de espera entre dos sucesossucesivoses 1/a, lo cuaI está de acuerdo con el hecho de que a sea el número medio de sucesos por unidad de tiempo. Una aplicación mpy interesante de un proceso de Poisson y de una distribucidn exponencial del tiempode espera, se encuentra en los problemas de colas, en los que la llegada para unoservicio constituye un proceso de Poissop, mientras que el tiempo requerido para realizar el servicio’ tiene una distribución exponencial. Esta teoría puede aplicarse a los clientes que llegan a una cafeteria, los barcos o camiones que esperan para ser descargados, los aviones que deben aterrizar en un aeropuerto, etc., también se puede aplicar a los casos que esperan para ser ventilados ante un tribunal penal. En muchos de estos problemas nos illteresaqán cosas tales como la longitud’p r o y d i o de la cola ‘‘O línea de espera”, la probabilidad de que exactamente x clientes estén esperando para recibir servicio 0 que estén siendo servidos, el tiempo medio que pasa un cliente esperando hasta ser servido, y otros. Para ilustrar un problema de colas de este tipo, supondremos que la llegada de automóviles a una estación de gasolina con una sola bomba, es un proceso de Pois-

86

APLICACIONES A LA INVESTIGACION OPERATIVA

son con un promedio de llegadas de O! automóviles por hora, y que estos pueden ser despachados a un promedio de ,8 por hora, siguiendo el tiempo requerido para dar el servicio una distribución exponencial. Además, supondremos que es O la probabilidad de que llegue un automóvil y se dC un servicio completo durante un intervalo pequeiio At. (En lo que sigue, supondremos también que (Y < p, esto es, que el número medio de llegadas por unidad de tiempo es menor que el número medio de servicios que se pueden completar por unidad de tiempo.) Nos interesará P ( k ) , probabilidad de que haya k automóvilesen la estaci6-1 or para cualquier valor del tiempo. Si k = O, no hay automóviles en la estación; lo que ninguno estará esperando para recibir servicio; pero si k > O hay k 1 en

-

Tiempo t t A t

Tiempo t

Fig. 5.1 Diagrama ramificado en problemas de colas

la “linea de espera”. Para encontrar P ( k ) , obtendremos primero un conjunto de “relaciones de recurrencia” que expresen P ( k ) en función de P(k - 1) y P ( k - 2). Para obtener estas relaciones, hallaremos la probabilidad de que no haya automóvilesenlaestación ( k = O) en el instante t At. Si k = O enel instante t At, por la hipótesis de que las llegadas siguen la ley de Poisson, los únicos valores que puedentener k enel instante t son O y 1. Si k = O enel instante t, no habrán llegado nuevos automóviles enel intervalo de I‘ a t At (con probabilidl - a -At), pero si k =I en el instante t, se habrá completado un servicio en este intervalo (con probabilidad @.At). Empleando laregla de eliminación de la página 27, concluimos yue P ( 0 ) P(O)(l - a * A t ) P(l)p.At

+

+

+

+

O

P(1) = ‘y P ( 0 ) P

71

OTRAS DENSIDADES DE PROBABILIDAD

Fig. 4.5 Función dedensidadlogarítmicanormal

Para encontrar la probabilidad de que una variable aleatoria de distribución logaritmica normal tome un valor entre a y b (0 < a < b ) , escribimos

Cambiando variables al hacer y =In x, y por consiguiente, d y tenemos

=

r1 dx, ob-

y podemos ver que esta probabilidad es igual a la probabilidad de que una variable aleatoriacon distribución normal con p = (Z y u = tomeun valor entre In a y In 6. Luego.

P(a O, y, por consiguiente, TI@) = (a - l)! cuando (Y es un entero positivo. En la figura 4.6 se muestran varias gráficas de distribuciones gamma y se ve que son sesgadas positivas. De hecho, laoblicuidad decrece al aumentar a para cualquier valor fijo de 0. La distribución especial gammacon a = 1 se llama distribucidn exponencial y se utilizó como una ilustración en la página 61 con /3 = 1/2. La distribución ex-

1-

I

O

1

2

3

4

5

6

7

4

Fig. 4.6 Fuciones de densidadgamma

ponencia1 se emplea en problemas de tiempos de espera, esto es, los intervalos de tiempo entre la aparición de dos fenómenos por cierta clase y la estudiaremos con más detenimiento en los capítulos 5 y 16.

MEDIAS Y VARIANZAS DE DISTRIBUCIONES ESPECIALES

73

Medias y varianzas de distribuciones especiales

4.4

En esta sección deduciremos fórmulas para determinar la medida y la variancia de las distribuciones introducidas en lasúltimasdos secciones. Primero, vamos a demostrar que los parámetros P y u2 de la distribución normal dados en la página 66, son, efectivamente la media y la variancia de esta distribución. De acuerdo con la definición de media, tenemos que la media de la distribución normal es

que, haciendo

z

= (x

-P) /U, se transforma en

a

Como el integrando delaprimera integral es unafunción impar, la integralde - 00 a 00 es igual a cero; la segunda integral es p veces el área entre el eje horizontal y una curva de distribución normal reducida y, por lo tanto, igual a p .1= p. De esta forma, hemos demostrado que el parámetro P de la ecuación de la distribucitjn normal es, efectivamente, la media de esta distribución. E n el ejercicio 6 de la página 75, el lector deberá demostrar, por medios semejantes, que el parlimetro u2 en la ecuación de la distribución normal es la variancia. Volviendo ahora a la distribuciútz unifornze, encontramos, por substitución directa, que su media es

Parahallar la variancia deesta Z = - p2, y obtendremos.

que, haciendo y

=

In x, se convierte en

distribución, haremos uso dela

fórmula

74

DENSIDADES DE PROBABILIDAD

Esta integra1 se puede resolver completando el cuadrado en el exponente y(y - a)2/2p, obteniendo así un integrando que tiene la forma de una densidad normal. El resultado final, que el lector deberá verificar en el problema S de la página 81 es =p+BW

Análogamente, pero de una manera más larga, los cálculos nos llevan a 0 2 = e2~+BZ(&*- 1) que es la variancia de la distribución logaritmica normal. En relación con el ejemplo de la página 78. la media dela distribución logaritmicanormal con a = 2 y 0 = 0.1, es p = $+(0.01)/2 = 7.4 y s u variancia es a2

e4+(0.01)(eO.O1

- 1) = 0.56

La media y la variancia de la distribucitirz gumma se obtienen usando la función gamma y las propiedades especiales de ésta que mencionamos en la página 72. Para la media obtenemos

Y después de hacer y

=

x/P

y, por consiguiente, dy =

dx/&

obtenemos

Por métodos, semejantes, se puede demostrar que la variancia de la distribución gamma está dada por a2

= a02

como la distribucich exponencid sedefiniócomocaso especial de distribución gamma en la que CY = 1, vemos que, para esta distribución,

EJERCICIOS 1. Hallar ]a función de distribución corespondiente a la densidad uniforme de la P&ina 70. 2 . Si una variable aleatoria tiene. una distribución logarítmica normal cona = -2 y b = 2, hallar: ( a ) La media y la desviacibn tipo de esta distribución 4.5 Y 9.8. ( b ) L a probabilidad de que esta variable tome unvalorentre 3. Si unavariable aleatoria tiene unadistribucióngamma con a = 2 Y b 3, hallar probabilidad de que tome un valor entre 1.8 y 11.1 4. Probar que II(a) = (a l)I'(a - 1). 5. Hallar lafunci6n de distribuclóncorrespondiente a la densidadexponencial

-

75

DENSIDAD DE PROBABILIDAD CONJUNTA DE VARIASVARIABLES

por otra parte Utilizarelresultado para hallar la probabilidad de que una variable aleatoria con esta 2p. distribución tome valores mayores que 6. Verificar queelparámetro u2 dela expresión dela densidad normaldela página 66 es efectivamente, su variancia. 7. Comprobarque ladensidad normal tiene unmáximo relativoen x = p y puntos de inflexibn en x = p & u. 8. Verificar la expresión dada en la Mgina 74 para la media de la distribución logaritmica normal. 9. Verificar que para la distribución gamma definida en la página 72 la variancia está dada por u2 = 10. Una variable aleatoria tiene una distrihucidn beta, si su densidad está dada por ( y a p 2 .

j(x)

=

{;-x"

(1

- x)@-1

para O < z < 1 por otra parte

donde CY > O y /3 > O. Hallar k para el caso especial en que CY = 12 y p = 2. Hallar, además, Q y oz para estadistribuciónbeta especial. 11. Unavariahlealeatoria tieneuna distribucidrt de Weibull si su densidad está dada p ~ r

f(x)

=

{ok . z f l - 1 e - d

para z > O por otra parte

Hallar k, p y o2en función de OL y 0. 12. En cierta área, el consumo diario de electricidad (en millones de kilowatt-hora) se puedetratarcomounavariablealeatoriacon distribuciónlogaritmicanormal con CY 3 '2 y P = 1/2. Si laplantamotrizqueabastece esta área tieneunacapacidadiaria dc 10 millones de kilowatt-hora, ¿Cuál es la probabilidad deque este abastecimientosea insuficiente en un día dado? 13. Supongamosquelas vidas de servicio de ciertasunidadessemiconductoras tienen una distribución de Weibull conparámetros CY 0.00.5 y 8 = 0.50 (ejercicio 11). Si 10 de estas unidades se ponen a prueba, determlnar la probabilidad de que al menos 8 estén en servicio satisfactorio al cabo de 40.000 horas.

4.5

Densidad de probabilidad conjunta de variasvariables

Hay muchos experimentos en los que la descripción de los casos que pueden presentarse está dada por los valores de varias variables aleatorias. Por ejemplo, podemos medir la altura y el peso de un individuo; el volumen, presión, y temperatura de un gas; o el espesor, color y resistencia a la compresión de una pieza de vidrio. Si xl, x2, .-. xk son los valores de k variables aleatorias, diremos que una función f con valores reales f (x,, x2. . .Xk), es la densidad de probabilidad conjunta correspondiente a dichas variables, si la probabilidad de que al x1 b , . a2 5 x2 bp, . y ak 5 Xk 5 bk esta dada por la integral múltiple.

.

..

< <

<

76

DENSIDADES

DE PROBABILIDAD

..

Nótese que, si f(xl, x2, ., Xk) 2 O para todos los valores de xl, para los que la densidad de probabilidad está definida, y

XZ.

. .,

xk

esta definición es compatible con los axiomas de probabilidad modificados que vimos en la sección 2.7. Designando por F ( x l , x?, . . ., xk) la probabilidad de que la primera variable aleatoria tome un valor menor o igual que x l , la segunda menor o igual que x?, . . . , y la k-ésima menor o igual que Xk, diremos que tal función F es la funcibn de distribucich conjunta de las k variables. Como ilustración, consideremos la densidad de probabilidad conjunta de dos variables dada por para x1 > O, x2 > O en el resto La probabilidad de que la pl'imera variable tome un valor entre 1 y 2 mientras que la segunda lo hace entre 2 y 3, está dada por f b l , 22)

=

(,_,x1-3=*

= 0.0003 y la probabilidad de que la primera variable tome un valor menor que 2, mientras la segunda tiene uno mayor que 2, está dada por

= 0.0025

Además, la funci6n de distribucich conjunta de este parde dado por F(Z1, ZZ)

=

{/ox'

1 ;

6e-2u-3u du dv

O parte

otra

- e-2=1)(1 - e--39

variables está

para z1 2 O, x2 >_ O por para XI >_ O, 2 2 por otra parte

2O

De acuerdo con la definición de independencia dada en el capítulo 2, diremos yue las k vuricrhles deutorias son (estocasticamente) independientes si, y sdo si, F(Z1, 22,

.

Zk)

= Fl(Zl).F2(ZZ)*

.

-

'F(2k)

para todos los valores de x,, x2, . . mi,. para los que están definidas Ins funciones, siendo F i ( x ; ) para i = 1, 2, . . . k el valor correspondiente de la función de distribución de la variable aleatoria i-ésima. Inmediatamente se deduce de esta definición que. si k variables son independientes, cualquier valor de la densidad de probabilidad conjunta de las k variables es igual al producto de los valores de las densidades de probabilidad de las variables individuales. En otras palabras, ,

77

DENSIDAD DE PROBABILIDAD CONJUNTA DE VARIAS VARIABLES

f(Z1,

.. .,

Zk)

= fl(Z1)'f2(52)

*

...

'fk(Xk)

donde fi(Xi) para i = 1, 2, . . k es el valor correspondiente de la densidad de probabilidad de lai-ésimavariable. En el ejemplo numérico considerado, nótese que las dos variables son independientes. En general, la densidad de probabilidad de Ia i-ésima variable se puede obtener a partir de la densidad conjunta integrando respecto todas las demás variables, o sea, ,

Llamaremos a fi(xi) densidad marginal de la i-ésima variable. Por ejemplo, en el anterior la densidad margina1 de Ia primera variable está dada por

f1(z1)=

/d" 6e-2zl-3n dxe

= 2e-2z1

para x I > O, y f, (xl) == O en el resto. El siguiente. es otro concepto de importancia al tratar con k variables aleatorias. si una variable aleatoria toma el valor g(xl, xer . . . .yk) cuando las k variables alestOriaS toman los Valores xl, &, . . . &, entonces, el promedio, 0 media, de la primera variable se define por la Integral

Por ejeinplo, si nos interesa el valor promedio del producto de las dos variables del problema numérico antes citado, obtenemos

EJERCICIOS 1. Dos variables aleatorias tienenladensidadconjunta

pára O

4xy

dada por

< x < 1, O < y < 1

( a ) Hallarla probabilidad de que 0 5 .x 5 1/2 Y 1/8 5 21 5 1iJ. ( b ) Hallar la probabilidad de que y x. 2. Dos variables aleatorias tienen la densidad conjunta dada por

>

+ y*)

para O < c en el resto

< 3, 1 < y < 6

( a ) HalIar k. ( b ) Hallar la probabilidad de que 1 < x < 2 y 2 < y < 4. (c) Hallar la probabilidad de que 2 5 x 5 3. ( d ) Hallar la probabilidad de que x y > 5. 3. Tres variables de azar ticncn la densidad de probabilidad conjunta dad;i por

+

78

DENSIDADESDEPROBABILIDAD

( a ) Hallar k . ( b ) Hallarla probabilidad deque 2 < y y ,z < 1. (c) Hallar la probabilidad de que z > 2. 4. Con rcspecto a la densidad conjunta del ejercicio 1, ( a , Encontrar una expresión para la funci6n de distribución de la primera variable. ( b ) Encontrar una expresión para la función de distribución de la segunda variable. ( e ) Dcmostrar que las dos variables son independientes. 5. Con respecto a la densidadconjuntadelproblema 2, ( a ) Hallar una exprcsión para la función de distribución de la primera variable. ( b ) Hallar una cxprcsión para la función de distribución de la segunda variable. ( c ) Demostrarque las dos variables son independientes. 6. Unpar devariables tienen “distribución normal circular” si su densidadconjunta está dada por

para --m < 2 1 < m y --m < z2 < O O . ( a ) Si = I , pz = “3, y u = 10, utilice latabla I11 para determinar laprobabilidad de que -14 < z1 < 16 y--S < x2 < 15. (b) Sip1 = p~ = Oy u = 4, hallar l a probabilidad de que (x1,x2) est6 contenidoen la = 4 y 2: 2; = 16.[bugerencia: Usar coordenadas rcgi6n entre loscirculos x: polares. I Una bomba dirigida hacia un punto que sirve de blanco, tiene un &rea de destrucción con radio de 400 pies (122 m ) . Empleando el blanco como origen de un sistema de coordenadas rectangulares, supjngase que las coordenadas (x,y ) del punto en que hace impacto la bomba son los valores de un par de variables de azar que tienen una distribución normal circular con ~1 = pz = O y u = 250 pies. (Ver problema 6 ) . ¿Cuál es la probabilidad de que el blanco sea destruido? Con respecto a la densidad conjunta del problema 1, hallar el valor promedio de la variable aleatoria cuyos valores están dados por g(z, y) = z y. Con respecto a la densidad conjunta del problema 2, hallar el valor promedio de la vay) = $y. riable aleatoria cuyos valores están dados por g(.c Si las medidas de altura y anchura de un rectángulo tienen la densidad conjunta,

+

7.

8. 9.

10.

+

+

+

[O

resto en el

hallar la media y la variancia de la distribución correspondiente del

área del rectángulo.

5.1

Introducci6n

El desarrollo en las últimas décadas ha traído como consecuencia el florecimiento de una nueva tecnología que es en parte Matemática, en parte Estadística, en parte Ingeniería y en parte algo nuevo. Se ha denominado Investigación operativa y se puede definir como la aplicación de las técnicas científicas modernas a problemas que tratan de la operación de un sistema considerado en su conjunto ”por ejemplo, el desarrollo de una guerra, la dirección de una empresa, la producción de un articulo, la planificación económica, etc. Entre los temas de estudio incluidos normalmente bajo el título de Investigación operativa, encontramos temas tales como Ía manera de tomar decisiones “científicas”, la teoría de los juegos, la programación lineal, la teoría de los procesos de azar, los métodos para tratar los problemas de inventario, localización, transporte, Y otros. En este breve capitulo estudiaremos algunos de estos métodos como aplicaciones particulares de la teoría desarrollada en los caDítulos anteriores. 79

80

APLICACIONES A LA INVESTIGACION OPERATIVA

5.2

La esperanzamatemhtica y la toma de decisiones

Muchos problema> de ciencia. ingeniería y direccihn de negocios son de tal indole que los resultados ( o consecuencias dz las acciones tomadas) estan s1ljetosal a7ar. Supongamos. por ejemplo. que. en la fabricacibn de cierto producto. el costo u!litario es de 5 12. una unidad en buen estado. se puede vender en $ 17. la probabilidad de producir una unidad defectuosa es 0.20. y una unidad defectuosa se pierde totalmente. Luego. considerando los beneficios. cadaunidadfabricadarepresenta una gananciade $ 5 o una perdidade 5 12 ( o sea. ucagananciade - $ 12). Esta informacicin. en si. no nos permite decidir si conviene o n o fabricar el producto. pero nos ayudara en una decisicin de este tipo. Notemos, por ejemplo. que alrededor del 8Oc; de las unidades representan una gananciade $ 5. y alrededor del 2OCi de las unidades representan una perdidade 12. en consecuencia. a la larga, hay una ganancia media de j(0.80) - 12(0.20) = b 1.60 por unidad. Hemos obtenido este valor multiplicando cada caso posible (la ganancia de 5 dcilares o la pCrdida de 12) por la probabilidad correspondiente, y Ilama[nos a este resultado vulor rspcrudo del beneficio o. simplemente, beneficio esperado. Comparando el metodo de medir tal valor esperado con la definicicin de P que vimos en la página 49. observamos que cl vtrlor rsperudo tic. utrn \.nriuhle alcatorin cs .sitnplet~t~t~tt~ ltr rnetliu (IC s u distrihucich tic. probnhilidarles Para dar otra ilustracicin del clilculo de u n valor esperado. supongamos que una lirnia de ingenieros tiene la tarea de prepararunapropuestapara u n contratode investigacicin: el costode la preparacicin de la propuesta es $ 5 000. y se supone conocido que los beneficios brutos potenciales de $ 30,000, $ 2OilOO. $ 10,000 ci $ O. tienen probabilidades de 0.20, 0.50. 0.30 y 0.10, respectivamente, en el supuesto de cluela propuesta se acepte. Partiendodeque la probabilidad de que se acepte la propuesta es0.30. vemos que hay una probabilidad de (0.30) (0.20) = 0.06 de obtener un beneficio neto de S 25,000 S 30.000 (menos el costo de la propuesta). Análogamente. las probabilidades de obtener beneficios netos de $ 15,000 y de $ 5,000 son. respectivamente, (0.05)(0.30) = 0.15 y (0.20) (0.30) - 0.06, mientrasque la probabilidad de una pkrdida de 5 5,000 es (0.10) (0.30) i0.70 = 0.73, teniendo presente la posible eventualidad de que laproposicicin no se acepte. Entonces, nos encontramos en la situacicin descrita en la tabla siguiente:

y encontramos que el Iwrwficio trrlo.rspc~rrrtloes (25,UU0)(0.06)

+ (15,000)(0.15). + (5000)(0.06) - (5000)(0.73)

Si es. o no. prudentearriesgar

!$

5.000 paraobtener

= $400

una utilidad esperadade

S 400, no es cuesticin estadística. Si unacompañía tiene capital y scjlo puedehacer unas pocas propuestas de este tipo, el 73'6 de oportunidades de perder !$ 5,000 puede hacer de esto una aventura nada atractiva. Por otra parte,

si una compañia

81

Y LA TOMA DE DECISIONES

ATEMATICA ERANZA LA

tiene u n capital muy fuerte y prepara muchas de estas propuestas, puede tener sentido aceptar el riesgo. por la promesa de la clewlucitin esperurla del 8 % de la inversicin inicial. Erl el ejemplo que sigue. se usan los valores esperados para determinar las condiciones óptimas de un problema típico de inventario. Supongamos que se conoce, por experiencias pasadas, que la demanda diaria de cierto producto perecedero tiene la siguiente distribuci6n de probabilidad Número de orden

I

Probabilidad

I

3

4

5

6

7

0.05 0.12 0.20 0.24 0.17

8

9

0.14 0.08

El costo de cada unidad es de $ 3 5 (incluyendo el costo de s u transporte y almacenamiento). y se vende a d 50, y si una unidad permanece en el .almacén. pasado un dia representa su pérdida total, A partir de esta información, se trata de determinar cuántas unidades debergn alnlacenarse cada día para que el beneficio esperflrlo sea mú.xin?o.

Con tres unidades almacenadas. el beneficio en dólares es, obviamente, 150 menos 105 = 45, ya que hay una probabilidad de 1.00 de que la demanda sea de tres unidades o más. Con cuatro unidades almacenadas, hay una probabilidad de 0.05 de que exactamente tres unidades puedan ser vendidas, una probabilidad de 0.95 de que la demanda sea de cuatro o más y. por consiguiente. hayun beneficio esperado de 150(0.05)

+ 200(0.95) - 140 = 57.50

Análogamente, con cinco unidades hay una probabilidad de 0.05 de que exactamente se vendan tres unidades. una probabilidad de 0.12 de que se vendan exactamentecuatrounidades,unaprobabilidadde 0.83 dequelademanda sea de o más y. por consiguiente. el beneficio esperado es 5 3

150(0.05)

+ 200(0.12) + 250(0.83) - 175 = 64.00

Continuando de esta manera, podemos ver que el beneficio esperado con seis unidades es $ 60.50, con siete unidades d 45.00, etc.: por lo que el beneficio esperado alcanzasumáximocuando hay cinco unidades en el almacén (véase también el ejercicio 6 de la página 83). En años recientes, los valores esperados (la esperanza matemática, como también se llama) han venido ocupando una posición cada vez más importante en la toma “científica” de decisiones. Como hemos indicado en el ejemplo de la página 80, no sirven como criterio Único para tomar decisiones, pero dan una información muy importante para tomar las decisiones de una manera racional. Como otra nueva aplicación, observemos cbmo se pueden utilizar los valores esperadospara seleccionar la acción más ventajosa de un conjunto continuo de alternativas. Supongamos queun ingeniero puede escoger la velocidad del trabajodeunamáquina troqueladora automática de manera que haga r operaciones por hora, pero ocurre

82

APLICACIONES A LA INVESTIGACION BPERATIVA

que la proporción de operaciones defectuosas p aumenta con T. Hay una utilidad de $ 1.00 por cada operación efectiva de la máquina, y una pérdida de $20.00 por cada operación defectuosa, y sabemos, por experiencias pasadas, que, para un número fijo r de operaciones por hora, la distribución de probabilidad correspondiente al número p de operaciones defectuosas es. aproximadamente, (O.OO1)rpo.ooll-l para O < p < 1 por otra parte

Con el objeto de encontrar la velocidad r que da mayor utilidad, determinaremos primero el beneficio esperado por hora para un valor dado de r, utilizando la fórmula de P de la página 62 en lugar de la dada en la página 49. Para valores fijos de r y p , el beneficio horario es (l.OO)r(l

- p ) - (20.00)rp = r(1 - 21p)

por lo que, para r fija, el beneficio esperado por hora es

=

IOOOr - 207-2 1000 r

+

Finalmente, derivando con respecto a r e igualando a cero la expresión resultante, el beneficio esperadohorario tiene un máximocuando r = 25 y. para esta velocidad de troquelado, el beneficio esperado es de 12.10 $ por hora. Hay esencialmente dos limitaciones prácticas para aplicar los métodos de toma de decisión ilustrados en esta sección: primero, debemos tener la posibilidad de asignar “valores contables” a los distintos casos que se pueden presentar, y segundo, debemos tener la información adecuada sobre las probabilidades correspondientes a dichos casos. El problema de asignar valores contables a los diferentes casos puede ser mucho más complicado que en los ejemplos citados. Por ejemplo, un oficial de la Fuerza Aérea tuvo que tomar la decisión de cuántos bombarderos se debían mandar contra un blanco determinado; fue muy difícil dar valores contables para la destrucción del blanco y para la pérdida de un bombardero y su tripulación por la acción del enemigo. Para el valor contable del bombardero y su tripulación, fue necesario tener en cuenta los costos de gestión y entrenamiento, además del inestimable costo de la vida humana. También, puede ser igualmente dificil la especificación de las probabilidades para los diversos casos. En el ejemplo anterior, postulamos cierta distribución para la proporción de operaciones defectuosas con una velocidad r. En la práctica,se hubiera requerido un gran número de experimentos para descubrir tal distribución y, aún así, sólo se hubiera conseguidc. una estimación (o una aproximación). Aunque la experiencia pasada se puede aprovechar frecuentemente para estimar las distribuciones de probabilidad (como hemos hecho en muchos de nuestros ejemp!os), hay ocasiones en que esto conduce a caer en juicios subjetivos. Por ejemplo, e3 el

LA ESPERANZA MATEMATICA Y LA TOMA DE DECISIONES

83

problema de la página 80, que trata de la propuesta de investigación, resulta extremadamente difícilestimar la probabilidad de que una propuesta determinada se acepte. Esto no depende dnicamente de la calidad de la propuesta, sino de muchos y elndmero de propuestas de otros factores desconocidos,talescomolacalidad competidores, asi como de la política seguida For la empresa a la que se presenta el proyecto. La estimación de 0.30, en nuestro ejemplo, es puramente subjetiva, basándose sólo en el “sentimiento” de algún ejecutivo por su propia experiencia. Aunque estas estimaciones de probabilidades no carecen de valor (presentándose en la misma situación y con la misma información) dejan abierta la posibilidad de que diferentes individuos lleguen a diferentes decisiones “óptimas”.

EJERCICIOS 1. Un lote de 50 partes, entre las cuales hay 8 defectuosas, se Pone en venta *Xa1Como esta

sin permitir ninguna inspección. Si una parte defectuosa representa una @rdida total de $14.503 ¿es conve-

su precio de $12.50, y una parte en buen estado se pucdc revender a niente comprar una de dichas partes (seleccionándola al azar) ’?

2. En un sorteo de lotería habrh cinco premios consistentes en: $1,000 el primero, $500 el segundo, $300 el tercero y $ 100 el cuarto y el quinto. Si se venden 1,500 boletos, ¿Cuál

es el valor de cada uno?

3. La siguiente es una variante de un problema

4. 5.

6. 7.

8.

9.

clásico del dlculo de probabilidades. Dos personasapuestan $ 8 cada una para jugarlosa “volados”. El ganador(que se llevará todo el dinero) será el que gane 3 de 5 tiradas de la moneda. Por alguna razón, el juego se suspende después de la primera tirada, la cual fue ganada por el jugador A. (a)Dibujarundiagramaramificadoparademostrarque, después dehaberganado ]a primera tirada, la probabilidad de ganar del jugador A es 11/16. ( b ) ¿Cómo deberiin repartirse el dinero los dos jugadores, después de esta primera tirada? Si dos equipos de beisbol son igualmente eficientes, las probabilidades de que la Serie Mundial termine en 4, 5, 6 ó 7 juegos, son, respectivamente, 1/8, 1/4, 5/16 y 5/16. ¿Cuál es la duración esperada (en número de juegos) de esta Serie Mundial? Probar cierta parte de una máquina cuesta $50. Si en la máquina se instala una de estas partes defectuosas, la reparación costarii $ loOO. ¿Será má conveniente instalar la parte sin probarla si se sabe que el 3% de todas las componentes producidas son defectuosas? ¿Si el porcentaje es del 6%? En el ejemplo de la piigina 81, verificar que los beneficios esperados para 6 y 7 unidades, son, respeativamente, $60.50 y $45.00. Un comerciante puede comprar un3 unidad en $2.10 y venderla en $4.50. Las probabilidades de una demanda de O, 1, 2, 3, 4, 6 “5, o miis” unidades, son respectivamente, 0.05, 0.15, 0.30, 0.25, 0.15 y 0.10. Calcular los beneficios esperados, almacenando O, 1. 2, 3. 4 b 5 unidades y determinar cuántas se deben almacenar para lograr el mPximo beneficio esperado, Se emplean IZ vendedores para una campaña de ventas de puerta en puerta, el volumen bruto de ventas en miles de dólares se puede considerar como una variable aleatoria de distribución gamma con parámetros (Y = 1OO&y @ = 1/2. Si los costos de ventas por vendedor son de $ 5 000, jcuiintos vendedores se deberiin emplear para lograr un miiximo de utilidad? IJna persona ha observado, por propia experiencia, que la oferta mínima para un trabajo de construcción se puede considerar como una variable aleatoria de densidad uniforme,

84

APLICACIONESA

(O

LA INVESTIGACIONOPERATIVA

por otra parte

donde C es su propia estimación del costo de la obra. ¿Que porcentaje debe añadir a su costo estimado, al someter su oferta, para lograr un mfiximo en su utilidad esperada? 10. Una compañía alquila una computadora por períodos de t horas, a raz6n de $400 la hora E1 número de veces que la computadora se estropea durante t horas es una variable aleatoria de distribución de Poisson con X = (0.8)f, y si este número de fallos es x, cuesta $ 5 0 . 9 volverla a poner en marcha.;(?hmo debe seleccionar la compañia el tiempo r, paralograrel máximo de beneficios esperados? [Sugerencia: Usar los resultados de la secciún 3.5.1

5.3

Procesos aleatorios

Hablando en general, el término “proceso aleatorio” se emplea en relación con procesos físicos que están completa o parcialmente controlados por cierta clase de mecanismo de azar. Se aplica a series de tiradas sucesivas de una moneda, a medidas repetidas de la calidad del producto de un fabricante sacado de una línea de montaje, a las vibraciones de alas de aviones, al “ruido” en señales de radio, y a otros muchos fenómenos. Lo que caracteriza estos procesos es su “dependencia del tiempo”, es decir, el hecho de que ciertos sucesos se presenten o no (según sus posibilidades) a intervalos regulares de tiempo o en un intervalo continuo del mismo. En esta sección trataremos de procesos que se desarrollan en un intervalo continuo de tiempo, tales como la presencia de imperfecciones en la fabricación continua de una pieza de tela, la medida de radiaciones con un contador Geiger, la llegada de llamadas telefónicas a un panel de conmutación o el paso de automóviles por un punto de control electrónico. La distribución de Poisson, descrita en la sección 3.4, nos da una teoria matemática apropiada para muchos de estos problemas. Vamos a generalizar las hipótesis hechas en aquella sección; para ello, consideraremos que se estudian ciertos sucesos y que la probabilidad de que ocurran en un intervalo de tiempo A¿ muy pequeño está dado por a . A t . Supondremos, además, que la probabilidad de que se presenten más de una vez el suceso en un intervalo de loagitud At es igual a cero, y que el que ocurra, o no, el suceso durante el intervalo de t a 1 At no depende de lo que haya pasado antes del instante t. Repitiendo el razonamiento de la página 45, deducimos de estas hipótesis que la distribución de probabilidad del númerode veces que se presente el suceso durante un intervalo de tiempo, de longitud T , está dada por

+

f(X> =

e-aT(aT)L. X!

para

X

=

O, 1, 2, 3,

...

Esta es la distribución de Poisson con media CYT,y de aqui podemos deducir que CY se puede interpretar como el número medio de veces que se presenta el suceso por unidad de tiempo. Un proceso de azar que satisfaga estas hipótcis recibe el nombre de proceso de Poisson con parámetro a.

85

PROCESOS ALEATORIOS

Aunque originalmente introdujimos la distribución de Poisson para dar una aproximación de la distribución binómica, la hemos usado en algunos de los ejercicios de la página 48 relacionados con procesos aleatorios continuos. Así fue en los problemas que trataban de las imperfecciones en un proceso electrolítico continuo, de los fallos de Un computador, de las radiaciones gamma emitidas por substancias radioactivas, y de la presencia de huracanes en la costa Este de los Estados Unidos. En los problemas de procesos aleatorios es importante considerar el tiempo t entre dos veces sucesivas en que se presenta el suceso estudiado. En virtud de la naturaleza casual del proceso, t es un valor de una variable aleatoria y debe tener algún tipo de densidad de probabilidad en un proceso aleatorio continuo. Para hallar esta densidad en un proceso de Poisson, observamos, en primer lugar, que la premisa: “el tiempo de espera entre la presencia de dos sucesos consecutivos es mayor que t” es equivalente a esta otra: “el número de veces que s~ presenta un sucexo desde el instante O hasta el instante t es igual a 0” Luego, si en un proceso de Poisson F ( t ) nos indica la probabilidad de que el tiempo de espera sea igual o menor que t, tenemos, 1 - F(t) =

e-ac (at)O

O!

O

F ( t ) = 1 - e--Ort Derivando con respecto a t (ver página 61), vemos que la densidad del tiempo de espera entre la presencia de dos sucesos consecutivos está dada por la distrihucicin exponencial

que ya habíamos introducido en la página 73. La media de estadistribuciónes p = l / a ; luegoeltiempomedio de espera entre dos sucesossucesivoses l / a , lo cual está de acuerdo con el hecho de que a sea el número medio de sucesos por unidad de tiempo. Una aplicación muy interesante de un proceso de Poisson y de una distribución exponencial del tiempo de espera, se encuentra en los problemas de colas, en los que la llegada para un ‘servicio constituye un proceso de Poisson, mientras que el tiempo requerido para realizar el servicio tiene una distribución exponencial. Esta teoría puede aplicarse a los clientes que llegan a una cafetería, los barcos o camiones que esperan para ser descargados, los aviones que deben aterrizar en un aeropuerto, etc., también se puede aplicar a los casos que esperan para ser ventilados ante un tribunal penal. En muchos de estos problemas nos interesarán cosas tales como la longitud promedio de la cola ‘‘O línea de espera”, la probabilidad de que exactamente x clientes estén esperando para recibir servicio o que estén siendo servidos, el tiempo medio que pasa un cliente esperando hasta ser servido, y otros. Para ilustrar un problema de colas de este tipo, supondremos que la llegada de automóviles a una estación de gasolina con una sola bomba, es un proceso de Pois-

36

APLICACIONES A OPERATIVA LA INVESTIGACION

son con un promedio de llegadas de (Y automdviles por hora, y que estos pueden ser despachados a un promedio de p por hora, siguiendo el tiempo requerido para dar el servicio una distribucih exponencial. Además, supondremos que es O la probabilidad de que llegue un automóvil y se dC un servicio completo durante un intervalo pequeño At. (En lo que sigue, supondremos también que a ip, esto es, que el número medio de llegadas por unidad de tiempo es menorque el número medio de servicios que se pueden completar por unidad de tiempo.) Nos interesará P ( k ) , probabilidad de que haya k automóviles en la estaciól para cualquier valor del tiempo. Si k = O, no hay automóviles en la estación; or lo que ninguno estará esperando para recibir servicio; pero si k > O hay k 1 e?

-

Fig. 5.1 Diagrama ramificado en problemas de colas

la “línea de espera”. Para encontrar P ( k ) , obtendremos primero un conjunto de “relaciones de recurrencia” que expresen P ( k ) en función de P ( k - 1 ) y P ( k - 2). Para obtener estas relaciones, hallaremos la probabilidad de que no haya automóviAt. Si k = O en el instante t At, les en la estación ( k = O) en el instante t por la hipótesis de que las llegadas siguen la ley de Poisson, los únicos valores que pueden tener k en el instante t son O y 1. Si k = O en el instante t, no habrán llegado nuevos automóviles enel intervalo de t a t At (con probabilidl - a . A t ) , pero si k =I en el instante t, se habrá completado un servicio en este intervalo (con probabilidad B-Al). Empleandola regla de eliminación dela página 27, concluimos yuc P ( 0 ) = P(O)(l- a . A t ) P ( l ) B . A , t

+

+

+

+

O

P(1) = cy P ( 0 ) B

E n general, la situación se puede representar por el diagrama ramificado mostrado en la figura 5.1 y la regla de eliminación nos da la relación de recurrencia siguientc:

ISTRIBUCIONES GRAFlCAS DE

DE FRECUENCIAS

103

sea simétrico o que la distribución detamaños de sombreros de hombre en EE.UU. tenga dos máximos. Las distribuciones totales o acumulativas se representan generalmente por medio de ojivas. Una ojiva es semejante a un polígono de frecuencias, con excepción de que marcamos las frecuencias acumulativas en las fronteras de clases, en lugar de las frecuencias ordinarias en las marcas de clase, Los puntos resultantes se unen, nuevamente, por segmentos de recta, como se muestra en la figura 6.4, que repre-

Indices de solución de hierro

Fig. 6.4 Ojiva

senta la distribución de frecuencias totales del tipo “menor que” de los indices de solución de hierro. Las ojivas tienen siempre la forma aproximada de una S maNscula, quedando el tamaño relativo de las dos colas de la S determinado por la simetría o falta de simetría de la distribución. Si una distribución sigue, aproximadamente, la forma de una curva normal, es posible convertir’la S en una “línea recta”, utilizando, para ello, una escala vertical especial llamada-escala de probabilidad. Esta escala se ha construido de tal forma. que cualquier distribucidn normal de frecuenciastotales aparece como una línea-recta. En el comercio, se puede encontrar un papel especial denominado papel cundriculado de probabiiidadaritmética: tiene una escala aritmkttica (nrdinaria)y unaescala de probabilidad (verfigura 6.5). En lafigura 6.5 se ha marcado la grifica de la distribuciónm porcentaje total del tipo “menor que” de los indices de solución de hierro marcados sobre iesteftipo d t papel. Nótese que los porcentajes totales están marcados en las fronteras de clase correspondientes. El papel cuadriculado de probabilidad se puede usar directamente con datos sin agrupar, para comprobar la “riormalidad” de éstos. En. tal caso; comenzamos por ordenar las observaciones de acuerdo con su tamaño y, si hay n observaciones,

w

(1002 - 50)

marcamos 100 6 por.ciento en la escalavertical corres?& pondiente a‘ la mayor observación i-Csima (ver el problema .16 de la phgina 108). Si .,

104

TRATAMIENTO DE DATOS

L

0.095 1

0.295

0.495 0695

0.895

1.095

1.295

1.495

Indicesdesolucióndehierro

Fig. 6.5 Gráfica de prcjbabilidad normal-datos

agrupados

t? es grande, no es necesario marcar todos los puntos; será suficiente marcarlos de cinco en cinco, o de diez en diez, para verificar que los datos caen aproximadamente en una linea recta, esto es, verificar que su distribución sigue, aproximadamente, la forma de una distribución normal. En la figura 6.6 se muestra una gráfica de probahilidades de los datos de indices de solución de hierro no agrupados en la que se marcan las observaciones de 10 en 10, comenzando con la primera y al mismo tiempo, mayor observación. Es evidente, observada esta gráfica. que los datos siguen aproximadamente una distribución normal. En vista de la simetría de la,distribución normal, la media de la misma que aproxima la distribución de los indices de solución de hierro, puede obtenerse viendo en la escala horizontal de.la figura 6.5 ó 6.6.el índice de la solución de hierro que correspondeal SO'/. de la escala vertical. E n la figura 6.6, obtenemos 0.80. TambiCn podemos encontrar aproximadamente la desviación típica de esta distribucicin, tomando la diferenciaentre los indices de solución correspondientes a 84% y 507;. en la escala deprobabilidad.Usandola gráfica dela figura 6.6, obtene-

mos 0.24.

Debe entenderse que el uso de papel cuadriculado de probabilidad, que se hubiera podido llamar papel cuadriculado de probabilidad normal, es un artificio apro-

105

GRAFICAS DE DISTRIBUCIONES DE FRECUENCIAS

ximado (y altamente subjetivo) para verificarsi una distribución si@-e la f o r m de una curva normal. Sólo separaciones grandes y obvias de la línea de esta gráfica son evidencias reales de que los datos no siguen una curva normal. Algunas veces, Se emplean otras escalas especiales para hacer las gráficas de distribuciones de frecuencias totales. Por ejemplo, si se espera que un conjunto de

Indices de soluci6n de hierro Fig. 6.6 GrAfica de probabilidadnormal-datos

no agrupados

datos siga una distribución logaritmica normal, el papel cuadriculado deberi tener una escala logaritmica. Este papel también se encuentra en el mercado. Otras varias escalas han sido construidas.para. verificar que los datos siguen otra distribución teórica. , .,

106

TRATAMIENTODE

DATOS

EJERCICIOS 1. Los pesos de ciertos embalajes se dan aproximándolos a la decima de libra más próxima; el menor y el mayor son, respectivamente, 15.1 y 30.9. Construir una tabla con 8 clases iguales en las que se puedan agrupar estos pesos. Dar el intervalo de clase, loslímites de clase, las fronteras de clase y las marcas de clase. 2 . El tiempo que tarda en quemarse un combustible d l i d o para cohete, se da aproximando al milisegundo m8s cercano. El valor menor y el mayor son, respectivamente, 4850 y 5072. Construir una tabla con 6 clases iguales en las que se puedan agrupar estos valores. Dar el intervalo de clase, los límites, fronteras y marcas de clase. 3. Los valores de la tabla siguiente son 100 medidas (en libras por unidad) del peso de la capa de estaño de una placa estañada electrolíticamente: 0.23 0.26 0.38 0.33 0.29 0.12 0.28 0.30 0.37 0.26

0.35 0.16 0.30 0.31 0.26 0.32 0.22 0.25 0.20 0.40

0,20

0.28 0.32 0.17 0.23 0.27 0.42 0.32 0.25 0.24

0.29 0.25 0.30 0.40 0:32 0.41 0.24 0.18 0.35 0.29

0.32 0.27 0.30 0.21 0.31 0.29 0.36 0.27 0.44 0.31

0.31 0.33 0.34 0.28 0.23 0.19 0.25 0.32 0.36 0.28

0.14 0.30 0.25 0.22 0.37 0.31 0.34 0.28 0.21 0.33

0.36 0.29 0.23 0.38 0.26 0.18 0.30 0.34 0.33 0.39

0.25 0.33 0.32 0.30 0.27 0.33 0.38 0.27

0.W

0.35

0.29 0.21 0.34 0.2s 0.30 0.22 0.25 0.35 0.48 0.33

Agrupar estos valores en una distribución que tenga un intervalo de clase de 0 . 0 5 y construir un histograma. 4. Convertir la distribución del ejercicio 3 enunadistribucióntotal del tipo “menor que” y dibujar su gráfica. 5. Convertirla distribucióntotaldel ejercicio 4 en una distribucih de porcentaje total y, haciendo su gráficaenpapel de probabilidadaritmktica,ver si es razonable aproximar esta distribucih aunadistribuciónnormal. 6. L a tabla siguiente correspondea los ingresos durante 1963 (en d6lares)de 80 familias que viven en una comu nidad. rur al : 1920 6250 8750 7400 2320 6430 5160 1380 4190 6430

11750 1200 2500 5620 1790. 2460 3810 8640 5400 9650

agrupar estos valores en

1420 4710 2460 8800 2110 3 100 5 120 1520 2200 4040

7350 9200 4500 6770 3240 4560 10600 5330

6370 5920

12800 7860 3620 5840 1470 3750 4540 6200 4320 2510

2800 1760 5110 3490

6400

5920 7950 3900 4110 8790

9450 2650 4720 6750 6900 5500 3870 4790 1580 2580

6850 5210 ,9700 4900 1700 3780 7410 11250 5090 7600

un número conveniente de clases iguales y construir un poligo-

no de frecuencia.

7. Convertir la distribucijn del ejercicio 6 en unadistribucióndeporcentaje total del tipo “menorque” y hacer su ojiva. 8. Marcar la distribución d e poruentaie total del ejercicio 7 cn papeles cuadriculados aritmttic0 y logarítmico. ¿Qué conclusiones se pueden sacar de estas gráficas con respecto a la

107

GRAFICAS DE DlSTRlBUClONES DE FRECUENCIAS

forma de la distribucidn? (Si no se puedeobtener papel logaritmico, marcar los logaritmos d e las fronteras de clase en papel aritmktico.) 9. Las siguientes son 15 medidas. del esfuerzo de compresión de ciertas piezas de acero (en libras por pulgada cuadrada) : 38,200 55,600 52,400

22,400 31,200 45,250

49,500 26,350 35,900

65,100 43,400 73,200

40,150 60,400 47,250

Dibujar los datos directamenteenpapel de probabilidad aritrndtica y analizar si siguen una distribución normal. 10. Las siguientes sonlas velocidades (en millas por hora)de 120 automóviles que pasan por un punto de vigilancia con radar en una carretera: 64 50

59 75 98 72 63 49 74 55

60 77 65 62 78 95 41 76 70

82 35 55 64 85 52 60 99 74 80

86 47 76 85 96 70

88

68 73 71

53

56 81 75

69 72 67

81

84

54 60

43 79 52 76

90

84

48 66 80 65 103

59 67 48 72 65.

62 78 82 54 -74 ..

37 73 69 75 S7

63 62 51 93

60 75 87 57 60 65

I

54

70 74 63

42 64 49 64 73 76 75 72 58 69

53 57 65 91 67 45 66 79 69 65

107 86 46 73 50

70 50 57 73 58

Agrupar estos valores en una tabla de frecuencias y dibujar su histograrna. 11. Convertir la distribución obtenida en el ejercicio I O en una distribución de porcentaje total del tipo “menor que” y dibujar su ojiva. 12. Dibujarla distribucibn total delproblema 11 en papelcuadriculado , d e probabilidad aritmttica einterpreteelresultado. 13. Los siguientes son los nQmeros .de imp,erfecciones observadas en 50 muestras tomadas de

rollos de tela: 2 o 1

o 3

0 1 6

o

1

4 1 2 3 3

4

1 1

2 4

o

4 0

5 1 2

0 1

3 4 0

3

2

2

4

4



0 1

0 4 21 ’ 2 5 6 3

’ ‘

. 1 0 0 2

( a ) Agrupar est98 dato6 en una tabla de fmuencias,,mostrando cuantas veces se presenta cada uno de los nameroe. ( b ) Construir una distribucibn total del tipo ‘‘O mas” y dibujar su ojiva. 14. Las distribuCiQnm de f r e c m i a polr-#Orfa~. 80 suelen representar por medio de grhficas circulares que coorieten en dividir un círculo en sectores proporcionales en tamaño a las frecuencias con PW @tan diatribuidoe los datos en las diferentes categorías. Construya una grhfica de cate tipo p Bn tepwantar 18 siguiente distribucibn: Clewirr & i s h Nlimrro de grados conferidos tn#enieifa 37,808 ’ Matemiticas F 1.437 Química 7,603 _I

~

Fioica Geolqia Geografía ¿.cuál Podría ser un buen título para esta gráfica?



4,308 2,428 973

108

TRATAMIENTO DE DATOS

15. El pictogramu de la figura 6.7 ilustra el hecho de que, en cierta área, el ingreso familiar medio se ha doblado de $ 3000 en 1950 a $ 6000 en 1960. i D a este pictograma una idea clara del aumento actual en los ingresosfamiliares? Si no es así, indicar cómodeberá modificarse.

1950

I960 Ingreso familiar medio

Fig. 6.7. Ingreso familiarmedio IfÍ. Dada u n conjuntode observaciones .y1, S , . . . . x, definimos su disftibucidrt tom/ o ucumulafiva empiricu como una función cuyos valores F ( x ) son iguales a la proporci6n de obscrvaciones menores o iguales que x. (a! Dibuiar la gráfica de la distribución total empírica de las 15 muestras del ejcrcicio 9. (1): ('omprobar que el método de ajustar curvas, usado en la página 112 ( l a verificacidn de "normalidad" de los datos no agrupados) se generaliza marcando los pujlfos med i m de los escalones de la distribuci6n total empirica.

17. Convertirladistribución

de los indices de solucijndehierrodelapigina 106 en una distribución que tenga las clases 0.10-0.29, 0.30-0.89, 0.90-1.29 y 1.30-1.49. Dibujardos histogramas de esta distribución, uno en que las frecuencias de clase se den por las alturus de los rectángulos y otro en que las frecuencias de clases estén dadas por las úreus de los rectángulos. ¿Por qué la primera gráfica da una idea bastante errada?

6.3

Medidas descriptivas

En la sección 3.5 introdujimos los conceptos de medii y variancia de una distribución de probabilidad como parámetros que determinan su centro y su dispersión. En esta sección, definiremos las medidas correspondientespara describir un conjunto de datos o su distribución. Dado un conjunto de )I medidas u observaciones, x , , x-. . . . x,,, hay diferentes modos de describir alrededorde qué centro se agrupan (es decir, su localización central). Los métodos más empleados son los que hacen uso de la media m i f m i tica y f a mediana, aunque también se emplean otras clases de "promedios" con fi-

1o9

MEDIDAS DESCRIPTIVAS

n

2 xi n

Nótese que hemos indicado la media de las x con Z Y no como P, símbolo 1 ~ do para la media de una distribución de probabilidades (o densidad de probabilidad). Seguiremos la práctica general de emplear letras latinas para denotar'descripcienes de datos reales y letras griegas para distribuciones teóricas. También, 'es interesante notar que la fórmpIa antepior nos daría la media de la distribución de 'una variable aleatoria que tomara los valores xi con probabilidades iguales de 1/n. Algunas veces, es preferible usar la mediana como una medida descriptiva del centro o localización de un conjunto de datos. Esto es particularmente cierto si queremos reducir todos los cálculos a un mínimo, o si deseamos eliminar el efecto de los valores extremos (muy grandes o muy pequeños). La mediana de n observaciones x,, x2. . . . x,,, se puede definir poco más o menos, como el valor "central". una vez que los datos se han ordenado con arreglo a su tamaño. Más precisamente. si las observaciones se ordenan por tamaños, y n es un número impar, la mediana es 21 n + l

valor de la observación numerada":si

es un número par, la mediana se defin n+2 ne como la media (promedio) de las observaciones cuyos números son 5 y 7 . n

Entonces, la mediana de las cinco observaciones 5, 4, 2, 7, 3 "escuatro (el valor de l a observacion que ocupa el tercer lugar, comenzando por la mayor). y la mediana de las 6 observaciones 7, 2, 5, 9, 4, 6 es 5.5 (la media entre la tercera ycuarta ohservaciones, comenzando por la mayor). La media y la mediana dan cada una un nilmero simple que representa u n conjunto entero de datos: la media es, generalmente, utilizada en problemas de estimación y otros problemas de inferencia estadística. Una razón intuitiva para preferir la media es que la mediana no utiliza toda la información contenida en las observaciones. Otra razón es que la mediana está sometida, en general, a mayores fluctuaciones, es decir, puedc variar más de una muestra a otra. Este importante concepto de "variabilidad de las muestras" seestudiaráen detalle en elcapítulo 7. Para dar un ejemplo en el que la mediana da una dcscripcitin mejor que la media. supongamos que un contratista de personal dice que el salario medio anual pagado a los ingenieros en su firma es $ 15 000. Esto da la impresión de que dicha firma es un buen lugar para trabajar, Sin embargo, en un exlamen mas detallado, se ve que es una compañía pequeña que paga $ 5 O 0 0 a cada ingeniero de los 4 que tiene, además del dueño, que recibe $55 O CXM. Luego, la distribucicjn de ingresos es muy asimktrica, 10 que significa que su media de S 15 000 realmente no es una representaci6n ittil, mientras que la mediana de $ 5 o00 es al menos, representativa de Io que un ingeniero joven puede ganar en dicha firma. I

-

110

TRATAMIENTO DE DATOS

.

L a varianciu de n observaciones x,, x., . . xn, mide, esencialmente, el promedio de sus desviaciones elevadas al cuadrado a partir de la media x, y se define por la f6r.mula

+

+ -

Existen diferentes razones para usar el divisor n 1 en lugar de 11. Primero, stilo IZ - 1 de las desviaciones. desde la media, xi -5, son independientes, ya que su suma de todas. siempre es igual a .cero (ver el ejercicio 1 de la página 123). En otras palabras, n - 1 de las desviaciones a partir de la media determinan automáticamente la ndsima. Otra razón es que consideramos las x como valores tomados por una variable aleatoria, y al dividir por n - 1 en la fórmula de s2 la varianza resulta una estimaci6n mejor de 8 , variancia de la distribución de esta variable aleatoria. Ampliaremos este asunto en los capítulos 8 y 9. De acuerdo con la terminología de los capítulos 3 y 4 definimos la desviacidn típica de 11 observaciones x,, x?, . . . X,, como la raíz cuadrada de su varianza, es decir,

+

+

Nótese que, si hubiésemos dividido por rz en lugar de n - 1, la fórmula resultante se habría podido emplear para la desviación típica de la distribución de una variable aleatoria que tomara los valores xi con probabilidades iguales a l / n . La desviación típica y la variancia son medidas de la variacicin absoluta, o sea, que miden la oantidad real de variación presente en un conjunto de datos y depencien de la escala de medida. Para comparar la variación en vaiios conjuntos de datos, será conveniente, en general, utilizar medidas de variaciones re[utivns. Con este obobjeto se usa el llamado coeficiente de vuriucitin 4

CT.' =

5S

*

100

+

Notemos que esta medida, que da la desviación típica como un porcentaje de la media, es independiente de la escala de medida. Luego, si un conjunto de datos tiene 5 = 12.0 y s = 1.5, el coeficiente de variacidn es CV = 12.574:en otras palabras, la desviación típica es 12.5% de la media. En esta sección, nos hemos limitado a la media, la mediana, la varianza y la desviación típica. Por supuesto, habrá muchas otras formas de describir un conjunto de datos. Por ejemplo, si queremos determinar un valor por debajo del cual haya el 2.576 de los datos, cakulamos el primer cuurtil (2,: si queremos determinar un valor por encima del cual se encuentren el 5% de los datos, calculamos el noventa y cinco percentif P!,5;etc. El cálculo de tales medidas se discutirá detalladamente en la sección 11.2. También tendremos ocasión de usar otras medidas de variabilidad. ta-

111

CALCULO DE I Y S

les como el recorrido de una muestra (el valor máximomenos el mínimo), una desviuciún promedio, o unrecorrido intercuartil. Cuandoes necesario, se aplican nuevos métodos para la descripción estadistica.de los datos. 6.4

Cdlculo de

R

y

S

En esta sección, discutiremos métodos para calcular Z y S, a partir de datos en bruto (no agrupados) y de datos agrupados. Los métodos que emplearemos están desarrollados particularmente para calculistas de oficinas, y son, al mismo tiempo. rápidos y exactos. El cálculo de Z a partir de datos no agrupados, no presenta problema: s610 tenemos que sumar los valores de ías observaciones y dividir por n. Por otra parte, el cálculo de S' es algo más complicado si utilizamos directamente la fórmula de la página 109. En su lugar, usaremos la forma algebráicamente equivalente

+

-

n(n

+

- 1)

que tiene la doble ventaja de necesitar menos trabajo y dar una exactitud mayor. En el ejercicio 3 de la página 114, el lector deberá demostrar que esta fórmula es equivalente a la de la página 109). La disminucibn en trabajo resulta del hecho de que con tal fórmula no tenemos que calcular las desviaciones respecto de la media: el aumento en exactitud se debe a la disminución del numero de divisiones y restas, y a que éstas sólo se realizan en los dos idtimos pasos del cálculo. Otra ventaja de la fórmula anterior es que sólo hace falta utilizar las observaciones una vez, poniendo cada valor de x en una tabla, elevándolo al cuadrado y acumular las sumas necesarias de las .Y y de sus cuadrados en una sola operación. Como ilustración. vamds a hallar la media y la desviacibn típica de las siguientes 20 pérdidas de peso (en gramos) de ciertas bolas de un molino de bolas: 0.094 0.117 0.126 0.113

0.108 0.099 0.122 0.109

0.114

0.093

0.125 0.111

0.132 0.105 0.115

0.130

0.128 0.119 0.007 0.120

Usando una máquina de calcular de mesa, vemos que la suma de estos valores es 2.277 y que la suma de sus cuadrados es 0.261919. En coqsecuencia. 2.277 -z = = 0.1138 20

Y

$2

20(0.261010) - (2.277)' = o.ooo1412 20.19

je donde S = 0.01 19. Nótese que. al realizar las sumas necesarias, lo hicimos con odos los decimales, redondeando sdo al final del cálculo al nílmero de decimales lue teníamos en la tabla original, añadiendo uno más.

112

TRATAMIENTO DE DATOS

Los cálculos que hemos realizado en el ejemplo se pueden simplificar aun más primero las observaciones. Por una transformación lineal, podemos eliminar los puntos decimales multiplicando cada pérdida de peso por mil; entonces podemos hacer de menor tamaño los números y trabajar más fácilmente, restando (arbitrariamente) 93 a cada valor. En lugar de los datos originales tenernos ahora 13s valores codificados. cifrado

15

1 33

21

29

32

39 22

24 20

35 4

6 16

12

0 18

37

26 27

2 cuyos valores Ilamarzmos u. Calculando la media y la desviación típica de las u por el mismo método que usamos antes, obtenemos como suma de las u 417 y de sus cuadrados 11,377 y, por consiguiente,

ü = 20.85,

S: =

141.2,

S,, = 11.1)

Para pasar de los valores codificados a los reales, observemos que las x y las u están relacionadas por la ecuación ~i

=

1 0 0 0 ~; O8

+ 0.093

6

x i = 0.001~;

El álgebra elemental nos muestra entonces, que Z = 0.001;ii + 0.093 y S: = (0.001)2s~, donde si y S; son, respectivamente, lasvarianzasde las x y las u. Sedeja a l lector verificar que, substituyendo a = 20.85 y S, = 11.9, en estas fórmulas se obtienen los valores antes calculados de Z = 0.1138 y sz = 0.0119. En el problema 5 de la página 114, el lector deberá verificar que, en general, cuando se tienen datos cifrados de tal forma que

xi = C ' U i $- a las fórmulas correspondientes para la media y la varianza son

+

z = c.ü

+a

y

=

c.s,,

+

Para calcular 5 y s a partir de datos agrupados, tendremos que hacer algunas hipótesis sobre la distribucicin de los valores dentro de cada clase. Si representamos todos los valores de una clase por su correspondiente marca de clase, la suma de las x y la suma de sus cuadrados se pueden escribir

+

+

+

+

113

CALCULO DE X Y 8

Como ilustracidn, volveremos a la tabla de frecuencias de los indices de solución de hierro de la página 98. Poniendo las marcas de clase xi en la primera columna, las frecuencias fi en la segunda y los productos xifi y zYi en la tercera y cuarLa columna, obtenemos. fi

Xi

.882500

0.585 0.195 0.395 0.595 0.795 0.995 8.365 1.195 6.975 1.395

3 13 17 32 23 7 5

79.500

100

Xifi

dfi

0. 114075 2.U28325 6.018425 20.224800 22.770575 9.996175 9.730125

5.135 10.115 25.440 22.885

Substituyendo n = 100 y las sumas necesarias en ias fórmulas de if y

S,

tenemos

-X = 79.500 -= 0.795 '

100

82

Y

r

= lOO(70.8825)

- (79.5)'

=

,

o.o78

100.99

Estos cálculos fueron muy tediosos y los hicimos únicamente para dar al lector una idea de las simplificaciones que se pueden lograr por medio del cifrado; en este caso, cifrando las marcas de clase. El cifrado que utilizamos en relacidn con las distribuciones ha de servir para representar las marcas de clase por medio de enteros sucesivos y, de preferencia, con el O cerca del centro de la distribucidn o cerca de la clase que tiene frecuencia más alta. Cifrando las marcas de clase de nuestra distribución por -3, -2, -1, O, 1, 2, 3, y designando estas marcas de clase cifradas. , . por la letra u, la tabla anterior se reduce a U¡

-3 -2 -1 O

27

fi

'l6ifi

3 13 17

-2G - 17

7L:j-i

-9 52 17

a2

ir

23

O

1 2 3

23

7

14

5

15

23 28 45

100

O

,

..,

192

Y la media y la varianza de las u son '

ü=o 8:

=

lOO(192)

- (O)'

100.99

=

:

114

TRATAMIENTO DE DATOS

como el cifrado que utilizamos es tal que xi = (0.20)ui + 0.795, las dos fórmulas de la página 112 nos dan Z = 0,795 y S: = 0.078, que concuerdan con los resultados obtenidos anteriormente. En general, si c es el intervalo de clase de una distribución y x,, es la marca de clase a la que hemos asignado el valor O en la nueva escala, el cifrado estará dado por xi = c . ui + x,,, y, por consiguiente, las fórmulas de la media y la desviación típica son

+

z=

c.’ii+zo

y

sz

+

= c.su

EJERCICIOS 1. Demostrarque

zn

(xi - E )

=

O.

i=l

2. Los siguientes son los números de trabajadores que han faltado encierta fábrica en 10 días consecutivos de trabajo: 12, 17, 24, 15, 16, 8, 13, 21, 30 y 14. ( a ) Hallar la media. ( b ) Hallar la mediana. (c) Hallar S, empleando la fórmula de la página 109. ( d ) Hallar 3 , empleando la fórmula de la phgina 111. 3. Demostrar que la fjrmula para s2 dada en la página 111 es equivalente a la dada en la página 109 4. Las siguientes son 20 lecturas de temperatura tomadas en varios puntos de un horno de gran tamaño, medidas en grados Fahrenheit:

( a ) Hallar Z. ( b ) Hallarla varianza. (c) Hallar el coeficiente de variación. 5. Si los datos de un problema están cifrados por la fórmula xi demostrar que

= cui

4-a (ver Página 112),

6. Repetir el ejercicio 4, utilizando el cifrado u = ( d 5 ) - 80 y comparar los resultados. 7. Calcular Z y S de los datos del ejercicio 9 de la pagina 107. 8. Calcular Z y S de los datos sin agrupar del ejercicio 13 de la pagina 108. 9. Utilizandolaagrupaciónobtenida en el ejercicio 13 de la pagina 116, calcular Z y S, Y comparar con los resultados del ejercicio 8. 10. Con los datos del problema 3 de la página 114, calcular Z partiendo de los datos sin agrupar y de los datos agrupados y comparar los resultados. 11. Utilizando la agrupación obtenida en el ejercicio 3 de la pagina 106 calcular s. 12. Utilizando la agrupacibn obtenida en el problema 10 de la pagina 107 calcular la media y la desviación normal de las 120 velocidades. 13. Si k conjuntos de datos constan, respectivamente, de PI,.n2 . . . Ilk observaciones y tienen &, el promedio total de todos los datos esta dado por la fórmula las medias Z1,Zz,

...,

115

CALCULO DE f Y S

(a) Los salarios medios anuales pagados a directivos de alto nivel en tres compañías son $24,000, $ 32,000 y $29,000. Si los n h e r o s de directivos respectivos s w 6, 15 y 9, hallar el salario medio pagado a los 30 directivos. ( b ) Compruebe la fórmula anterior. 14. La Mrmula del problema 13 es un caso especial de la fórmula siguiente para determinar medias ponderadas:

k

Z wixi i-1 XW = k

I: w i

i-1

donde )vi es un peso que indica la importanciarelativa de la i-ésima observacih. Usar esta fórmula para determinar el costo medio por caja de almuerzo, si un proveedor prepara 1 500 cajas para el día de campo de los empleados de una compañía, haciendo 800 cajas a un costo de $ 1.20 cada una, 500 cajas a $0.95 cada una y 200 cajas a $1.10 cada una.

7.1

Población y muestras

El empleo del término "población" en Estadística viene de la época en que esta ciencia se aplicci principalmentc alestudiode fenómenos económicos y sociales. Actualmente, se aplica a cualquier conjunto o colección de objetos, reales o conceptuales, y principalmente aconjuntosde números, medidas u observaciones. Por ejemplo, sinos interesa determinar el númcro medio deaparatosde televisión por casa, en los Estados Unidos, el total de estos números, uno por casa, constituye la población estudiada. Análogamente, la población de la cual los inspectores extraen una muestra para determinar alguna cualidad característica de un producto manufacturado, puede ser la medida correspondiente de todas las unidades de un lote dado: y dependiendo de los objetivos d e la inspección, puede consistir, también, en la medida de todas las unidades fabricadas. En algunos casos, como el anterior de los aparatos de televisión, la población es finita; en otros, como la medida de todas las unidades, pasadas, presentes y futuras que puede hacer una fábrica, la población debe considerarse infinita. Igualmente, los resultados obtenidos en una serie de tiradas en el juego de "cara y cruz", se con116

117

POBLACION Y MUESTRAS

siderarán como una muestra de una población hipotéticamente infitlira formada por todas las tiradas posibles. Las poblaciones se describen frecuentemente por las distribuciones de SUS valores y es práctica común referirse a la población en términos de su distribución. (Para poblaciones finitas, nos referimos a la distribución real de sus valores: para poblaciones infinitas, nos referimos a la correspondiente distribución de probabilidad, o a la densidad de probabilidad.) Por ejemplo, nos podemos referir a un número de tiradas con una moneda como una muestra de "población binómica", o a ciertas medidas como muestra de "población normal". De aquí en adelante, al hablar de una "población f(x)", nos referiremos a una población tal que sus elementos tienen una distribución de frecuencias, una distribucicin de probabilidad, o una densidad, con valores dados por f (x). En una población infinita, es imposible observar todos sus valores y. muchas veces, en una población finita resulta poco práctico o antiecónomico observarla enteramente. Por este motivo, es necesario, en general, emplear una muestra, una parte de la población, e inferir, de su análisis, resultados que pertenezcan a toda la poblacicin. Tales resultados sólo serán iltiles si la muestra es, en alguna forma, "representativa" de toda la poblacicin. No sería razonable, por ejemplo, esperar generalizaciones M e s sobre los ingresos familiares en 1964 en Estados Unidos. tomando como basedatos correspondientes sólo apropietarios de casas, Análogamente. es difícil esperar resultados correctos al pretender generalizar los resultados obtenidos por una llanta que sólo se ha probado en caminos suaves. Para tener la seguridad de que una muestra es representativa de la población de la que se ha obtenido, y para crear 1 i 1 estructura ~ en la que podamos aplicar la teoría de la probabilidad a problemas de muestras, limitaremos el uso del termino "muestra" a las llamadas n1w.rtru.r &utorius. Las muestras aleatorias se definen, para poblaciones finitas, en la forma siguimte: (JII( . c > t l j t ( t l t c j r t o olnerva(iot1c.sx,, .x2, . . . x,, constituye U I I U t m r r s t t u trleatoria d a tunruiio 11, puru uttu pohlacitinfinita de tanraiio N , .si sc e.r(~?:'e do tul forttlu quc cada subconjunto (le n alett1etrto.s entre los N de la poí&wi~;tt.t i o w /u n r i s n l c c probabilidad de ser oscvgido.

Nótese que esta definición de azar pertenece esencialmente a la manera conw los valores de la muestra son seleccionados. Esto es vrilido tambikn para la definici6n siguiente de muestra aleatoria para una poblacirin infinita: Un conjunto t i c of~sPr~~ac'iot?C.s x , , x2, . . . x,, cwrstitrryc de tamatio 11 de la poblucititl f(x) si:

u t 1 u tttml.jtr(1

u?cutoria

0.7 1111 valor de llttu rwiuble alwtoria cuya distribrr(i(il1 pstJ eluda f (x) . (2) Estas 11 variuhlcs ulcutorius SOII itltlppc'ttrlio1tP.s.

( 1 ) Cuda xi por

Hay varios modos de asegurar la selecci6n de una muestra que sea. al menos aproximadamente, aleatoria. Cuando se trata de una poblacibn finita. podemos numerar los elementos de lamisma y despuk seleccionar una muestra con la ayuda

118

DlSTRlBUClON DE MUESTRAS

de una tabla de números aleatorios (véase la discusión de la página 92). Por ejemplo, si una población tiene N = 500 elementos y queremos seleccionar una muestra aleatoria de tamaño n = 10, podemos usar tres columnas elegidas arbitrariamente en la tabla VI1 para obtener 10 números diferentes de 3 dígitos menores o iguales que 500, los cuales serán los números de los elementos que se incluirán en la muestra. Siel tamaño de la población es grande, el empleo de números aleatorios puede resultar laborioso y, en ocasiones, prácticamente imposible. Por ejemplo, si queremos probar una muestra de 5 casos tomados de entre los muchos miles almacenados en los depósitos del ejército, resultará demasiado difícil numerar todos los casos. hacer una selección por medio de los números aleatorios, y después sacar los 5 que hayan sido seleccionados. En una situación como ésta, no nos queda más remedio que hacer la selección relativamente al azar, esperando que no se violen seriamente las hipótesis básicas de la teoría estadística. Al tratar con poblaciones infinitas, la situación es diferente, ya que no podemos numerar físicamente sus elementos; pero se debe hacer todo lo posible para aproximar las condiciones de azar, empleando medios artificiales. Por ejemplo, al seleccionar una muestra de una línea de producción, posiblemente estaremos en condiciones de lograr una e!ección al azar, escogiendo una unidad cada media hora: al hacer una tirada de "cara y cruz", trataremos de tirar la moneda de tal forma que ningún lado salga favorecido intencionalmente, etc. El uso apropiado de sistemas mecánicos o artificiales para seleccionar ejemplos de azar se debe preferir a los criterios humanos, ya que es extremadamente difícil eliminar las predisposiciones inconscientes al hacer cualquier tipo de selección. Aún conlaselección cuidadosa de sistemas artificiales, es muy fácil cometer graves errores en la selección de una muestra de azar. Para ilustrar algunas de estas fallas, supongamos que debemos seleccionar troncos que son llevados por una correa de transporte de velocidad constante hasta una serrería, y que la selección se hace para obtener una muestra aleatoria de sus longitudes. Un sistema para selecc:lonar las muestras que, a primera vista, puede parecer conveniente, consiste en medir los troncosque pasan por un puntodadoalfinalde cierto númerode intervalos de 10 minutos. Sin embargo, un estudio más cuidadoso demuestra que este método favorece a los troncos más largos, puesto que éstos requieren más tiempo para pasar por el punto. Entonces, la muestra no está tomada completamente al azar, ya que los bloques más largos tienen más oportunidad de ser incluidos. Otro error común en la selección de muestras es el de tomarlas de una población equivocada O de una pobremente especificada. Como indicamos anteriormente, debemos poner el máximo inter& en obtener una muestra a partir de la que podamos generalizar nuestro resultados y, en el ejemplo de los ingresos familiares anterior, esto no será posible si tomamos nuestra muestra entre propietarios de casas. Análogamente, si queremos determinar el efecto de las vibraciones en un elemento de una estructura, debemos precisar la banda de frecuencias que nos interesa, y hacer las pruebas sólo entre las frecuencias seleccionadas al azar de dicha banda. El propósito de la mayoría de las investigaciones estadísticas es generalizar la información contenida en muestras aleatorias a la población de la cual obtuvimos

DlSTRlBUClON MUESTRAL DE LA MEDIA

119

( 0 CONOCIDA)

las muestras. En particular, estamos ordinariamente interesados en el problema de hacer inferencias acerca de los pmrimetros de las poblaciones, tales como la media 1.1 y la desviacicin típica U. Al hacer estas inferencias, generalmente usamos estadísticos, tales como Z y S, o sea, cantidades calculadas a partir dela observación de muestras. Como la seleccicin de una muestra aleatoria está regida, en gran parte, por el azar, los valores obtenidos de estos estadísticos tambien lo estarán. El resto de este capitulo lo dedicaremos a una discusión de distribuciones muestrales, es decir, distribuciones que describen las fluctuaciones casuales de las estadísticas calculadas a partir de muestras aleatorias. 7.2

Distribuciónmuestra1 de la media ( u conocida)

Supongamos que una muestraaleatoriade n observaciones se ha tomado de cierta poblaci6n y que hemos calculado Z; con objeto de estimar la media de la población. Debe aclararse que, si tomamos una segunda muestra de azar de tamaño n en esta poblacihn, resultará poco razonable esperar un valor identic0 de Z, y si hemos tomado varias muestras, probablemente no habrá dos Z iguales. Las diferencias entre estos valores se atribuyen, generalmente al azar y esto origina importantes cuestiones referentes a su distribucidn, y en concreto, a la extensión de tales fluctuaciones casuales. Para introducir esta cuestión de manera experimental. haremos un experimento sencillo en el que se toman 50 muestras aleatorias de tamaño tI = 10 de una población que tiene distrihuci&1 uniforme discreta. f(z)

=

1;

para x

=

O , 1, 2 , .

. . ,9

(0 por otra parte Un modo conveniente deobtener estas muesrras es utilizar una tabla de números aleatorios, como la tabla VII, haciendo quecada muestra sea un conjunto de 10 digitos consecutivos tomados de columnas escogidas arbitrariamente. Las medias obtenidas en esas S0 muestras son 4.4 3.1 3.0 5.3 3.6

3.2 5.3 3.0 5.5 2.7

5.0 3.8 4.6 4.8 4.0

3.5 4.3 5.8 6.4 5.0

4.1 3.3 4.6 4.9 2.6

y la siguiente es una tabladefrecuenciasque medias: E 2

2.0-2.9 3.0-3.9 4.0-4.9 5.0-5.9 6.0-6.9

4.4 5.0 4.0 6.5 4.2

3.6 4.9 3.7 3.5 4.4

6.5 4.8 5.2 4.5 5.6

5.3 3.1 3.7 4.9 4.7

muestra ladistribucicin Frcmutrcim

14 19 12 3 50

4.4 5.3 3.8 5.3 4.3

de estas

120

DlSTRlBUClON DE MUESTRAS

Es evidente, del histograma que representa esta distribución en la figura 7.1, que la distribución de las a: tiene aproximadamente forma de campana aunque la población misma tiene una distribución uniforme. Esto nos lleva a la cuestión de si este tipo de resultado es el resultado típico y el que se debe esperar en terminos generales; en otras palabras, ¿Debemos obtener una distribución similar si tomamos 100 muestras, 1000 muestras, o más? Para respondernos, debemos investigar la distribución muestra1 teórica de Z que, en el ejemplo dado, nos proporcionaría las probabilidades de obtener 3 cntre 2.0 y 2.9, entre 3.0 y 3.9,. . . . entre 5.0 y 6.9, y quizás 2oc

Fig. 7.1 Distribución de muestras del medio experimental

valores menores que 2.0 o mayores que 6.9. Aunque podríamos calcular efectivamente estas probabilidades, sin embargo, es suficiente referirnos a algunos teoremas generales sobre distribuciones de muestras. El primero de ellos, anunciado romo sigue, nos da expresiones para la media y lavarianzadelas distribuciones muestrales de 2:

Teorema 7.1 Si una muestra u!eatoria de tamaiio n se toma de una poblacicin que tiene la media p y la varianza 02, entonces, Z es un valor de una variahle uletoria cuya distribucitin tiene la media P. Para muestras de poblaciones infinitas, la 1.nrian:ct de esta distribucicin es d / n ; para muestrasdepoblau2 N - n cicin finitas de tamaiio N , la varianza es - . n- N - 1 Llamando pz a la media de la distribución muestra1 de Z, probaremos primero para el casocontinuoque pcl~= p. (La demostración para el caso discreto sigue pasos idénticos, poniendo sumas c en lugar de los signos de integral.) Usando la definición de l a página 77, tenemos

donde f(x,, x.,. . .x7,)es el valor de la densidad conjunta de las variables aleatorias cuyos va!ores constituyen la muestra aleatoria. Usando la hipótesis de aleatoriedad, podemos escribir

y ahora tenemos

Como cada integral, excepto la que tiene el integrando xi f(xi) es igual a 1. y la que tiene elintegrandoxi f(xi) es igual a p , obtenemos, finalmente,

y esto completa la demostración de la primera parte del teorema. Paraprobar que,paramuestrasaleatoriasde poblaciones infinitas. u;, varianza de la distribución muestra1 de f , es igual a d / n , haremos la hipótesis simplificadora de que p = O. Como el lector podrá comprobar en el problema 9 de la página 136, esto JW implica ninguna pérdida de generalidad: de hecho, establecimos un resultado semejante en la página 112, que nos demostró que la adición de una constante a cada valor no afecta Ia desviación típica (o la varianza) de un conjunto de datos. Usando la definición de la página 77, tenemos

y haciendo uso de

obtenemos

donde 2 Z se extiende para todas las i y j desde 1 hasta iP'i

11,

sin incluir los tCrminos

= f(x,)f(x,) . . .fcxtl). podemos en que i = j. Usando nuevamente !(x,, x., . . . xPL) escribir cada una de las integrales múltiples anteriores como un producto de integrales simples, siendo cada una de estas últimas que tiene un integrando de la forma f(x), igual a 1. Entonces, obtenemos:

igual a u2 mientras que cada integral igual a O, tenemos, finalmente:

y como cada integral de la primera suma es

delasegundaes

122

DlSTRlBUClONDEMUESTRAS

Esto completa la demostración de la segunda parte del teorema. No conprobaremos el resultado correspondiente para muestras aleatorias de poblaciones finitas,

N - es. apropero haremos notar que en la fórmula resultante para :u el factor __ N -I

ximadamente, 1 (y se puede omitir para la mayoría de las aplicaciones prácticas). a menos que la muestra constituya una porcicin grande de la poblaci6n. Por ejemplo. si se saca una muestra de azar de tamaño 10 de una poblaci6n de tamaño 1000. el factor N - n , llamado también factor de correccicin para poblacionesfinitas, es N -1 aproximadamente igual a 0.99 l . Aunque no resulta muy sorprendente el que la media de la distrihucit.:ln m w s tral teórica de Z sea igual a la media de la población, el hecho de que >u varianza sea d / n , para muestras aleatorias de poblaciones infinitas, es interesante e importante.Parahacerresaltar sus implicaciones. aplicaremos el teoremadeChebyshev a la distribución muestral de 3, poniendo Z en vez de x y u/& en vez de u en la densidad dada en la página 54. Así obtenemos. ~

y haciendo ku/.\/k =

t,

resulta

Luego. paracualquler e > U, dado, la probabilidaddeque Z difierade p en menos de E se puede hacer arbitrariamentecercanoa I , escogiendo n lo suficientementegrande. En un lenguaje menos riguroso. cuanto mayor sea el timañ0 de la muestra, más se aproximará 5 a la media de la poblacicin. En este sentido, podemos decir que Z se va haciendo cada vez más digna de confianza como una estimación de p a medida que crece el tamaño de la muestra. Esta confianza se mide también por la expresi6n u/ 0.50, porrencih de la distribución t, esnecesario tabular valores de que la distribución x-cuadrado no es simétrica.

130

DlSTRlBUCiON DE MUESTRAS

Para ilustrar elteorema 7.4, supondremos que una compañia de ciptica compra cristal para fabricar lentes, y que experiencias anteriores han demostrado que la variancia del índice de refracción de esta clase de cristal es 1.26-10-4. Para convertir el cristal en lentes de una longitud focal dada, es importante que las distintas piezas de cristal tengan, aproximadamente, el mismo índice de refracción; en consecuencia, supondremos que en envío de cristal de esta clase se rechaza si la variancia muestral de 20 piezas seleccionadas al azar excede a 2.00.10". Suponiendo, además, que los valores de las muestras se pueden tratar como si provinieran de una población normal con u2 = 1.26.10-4,la probabilidad de que un envío se rechace erróneamente se puede determinar de la manera siguiente. En primer lugar, obtenemos

y después encontramos, en la tabla V, que, para 19 grados de libertad, X.&

= 30.1. Entonces, la probabilidad de que un envio bueno se rechace erróneamente, por este criterio, es menor que 0.05. Un problema relacionado muy de cerca con el de encontrar la distribución de la variancia muestral es el de encontrar la distribución de la razdn de las variancias de dos muestras aleatorias independientes. Este problema es importante porque aparece en pruebas en las que queremos determinar si dos muestras provienen de poblaciones que tienen variancias iguales. Si esto ocurre, las dos muestras tendrán, aproximadamente, la misma varianza; esto es, su razón será, aproximadamente, 1. Para determinar si la razón de dos varianzas de muestras es muy pequeña o muy grande, utilizamos el teorema siguiente:

Teorema 7.5. Si S; y S; son las varianzas de muestras aleatorias independientes de tamaños n , y nz, respectivamente, tomadas de dos poblaciones normales que tienen la misma varianza, entonces

La distribución F tiene los dos parámetros vl, que representa los grados de libertad de la varianza de la muestra del numerador, y VZ, que representa los grados de libertad de la varianza de la muestra del denominador; al referirnos a una distribución F particular, damos, siempre en primer lugar, los grados de libertad del numerador. Como se necesitaría una tabla muy grande para dar los valores de F , correspondientes a muchas áreas a, de las diferentes colas de la derecha, y como a = 0.05 y a = 0.01 son los valoresusadosmáscomúnmente,noslimitamosen la tabla VI a dar los valores de F.oa y F.,,, para varias combinaciones de valores de v , y v2 (ver tambikn la figura 7.6).

DlSTRlBUClONMUESTRAL

(v, Y

D E LA VARIANZA

131

f (F) V2 grados de libertad)

Niitese que el teorema 7.4, lo mismo que el teorema 7.5, requiere rz la hipótesis de que las muestras provienen de poblaciones normales. Como en el caso de la clistribución t, esta hipótesis, se puede debilitar un poco en la práctica efectiva sin alterar materialmente las distribuciones muestrales respectivas. Una vez más, se sugiere el empleo de papel de probabilidad aritmética para investigar si es razonable tratar las muestras como si vinieran de poblaciones normales. EJERCICIOS 1. Unamuestraaleatoriadetamaño 16 proveniente deuna población normal tienemedía 48 y desviación típica 5.2. Basando la decisión en el estadístico t, decir si es razonable

indicar que esta informacih justifica la afirmación de que la media de la población es como mínimo 52. 2. Los tiempos durante los que está estropeado un computador (en horas) en cada uno de 5 meconsecutivos son: 28, 15, 19, 30, 23. Utilizarelestadístico t para verificar si es razonable la afirmacibn de que, en prornediu, se puede expresar que el computador esté fuera de servicio a lo más 20 horas por mes. 3. Un proceso de fabricación de muelles de compresión est& controlado si las longitudes libresde los resortestienen una media de 2.5 centímetros. ~Qut:podemosdecir de este proceso si una muestra de 10 de estos resortes tiene una media de 2.53 centímetros y una desviación típica de 0.02 centímetros? 4. Se rechazará la afirmación de que la varianza de una población normal es IT% = 64 si la variancia de una muestra aleatoria de tamaño 17 excede a 115.38. LCuAl es la probabilidad de que la afirmación sea rechazada aun cuando u2 = 64?

132

DlSTRlBUClON DE MUESTRAS

5. Se toma una muestra aleatoria de 27 observaciones de una población normal con varian-

za u2 = 1 6 3 . Hallar la probabilidad aproximada de obtener una desviación típica de la muestra entre 3.0 y 5.2. 6. Si de una población normal tomamos dos muestras aleatorias independientes de tamaños n , = 21 y n2 = 20, determinar la probabilidad aproximada de que la variancia de la primera muestra sea por lo menos el triple de la varianza de la segunda. 7. En el ejercicio 6, hallar la probabilidad de que cada varianza sea el triple de grande que !a otra. 8. La distribución t con un grado de libertad esta dada por

Verificar el calor correspondiente de t.osen la tabla IV. 9. La distribución X-cuadrado con 4 grados de libertad está dada por

Hallar la probabilidad de que la varianza de una muestra aleatoria de tamaño 5 proveniente de una poblaciónnormal con u = 10 exceda a 120. 10. La distribución F con 4 y 4 grados de libertad, está dada por

+ P)-4

F >O F C, si la hipófesis alternativa es p > po, y Z < C, ó Z > C2, si la hipótesis alternativa es p # PO, y las fórmulas para determinar C,C, y C2 están dadas en las páginas 154 y 158. Un método equivalente pero más sencillo, para determinar la región crítica, es basarse) en el estadístico '

+

,

+

en lugar de 2. Si el nivel de significación es (Y, ,y z a es, como antes, tal que el área a su derecha bajo la curva normal tipificada sea igual a u, las regiones criticas para contrastar H , p = po se,pueden expresarcomo 'se indica en la tabla siguiente: REGIONES CRITICAS PARA CONTRASTAR' Zio: r ( rue;aR;k, conocido)

p

Hipótesis alternativa

Rechazar

P 2,

..

r>PO

t

I

H o

si

F

pa

i

1,

Como ilustración,.volvamos al problema de la ,soldadora automática. La hipótesis nula es P = 5 y usaremos la alternativa P < 5, haciendo recaer el peso de la

HIPOTESIS A REFERENTES

153

UNA MEDIA

prueba en la soldadora automática. Supongamos que la decisión se ha de basar en una muestra de 64 conjuntos, cada uno de los cuales contiene 100 soldaduras, y que la media y la desviación típica de1 numero de soldaduras defectuosas por conjunto son, respectivamente, 4.8 y 1.2. Aunque en este momento no se conoce u , la muestra es lo suficientemente grande para aproximarla con S = 1.5 con lo que obtenemos $4.8.-5 z=

*2,dz = - 1.33

_>

Sielnivel de significaciónes = 0.05, en la tabla I11 encontramos que el wlur criticb es -,z.05 = 1.645; como el valor calculado de z no es menor que - 1.645, la hip6tesis nula no puede ser rechazada y, por lo tanto, decidimos qúe la máquina no debe ser instalada. (El lector deberá hacer una gráfica’de la curva OC de este test en, el , ejercicio9 de la página 160.) Si el tamaño de la muestra es pequeño y Q desconocido, no se puede utilizar el test que acabamos de describir. Sin embargo, si la muestra provienede una población normal (dentro de un grado razonable de aproximación), podemos emplear la teoría discutida en la sección 7.3 y basar el test de la hipótesis tlo: p = po en el estadistico

-

+

+

Las regiones críticas resultantes se muestran en la tabla siguiente, en la que t , se defini6 en la phgiha 127 el Brea a su’derecha bajo la curva de distribución t con n - l grados de libertad es igual a a ) . Como ilustración,‘ volveremos a considerar el problema de decidir cuándo se debe cambiar el proceso de llenar botes de jugo de fruta, es decir, el problema en el que la hip6tesis nula P = 20 se debe contrastar frente a la alternativa AI # 20. . . REGZONES CRITICAS PARA CONTRASTAR ]I0:p (Población normal,’ U desconocida) Hipótesis altertlalivcr

Rechazai. ‘Hosi para n - 1 grc~d(ls de lihrrtgd __. ;

I ’

P < M

< -tu 1 > tu t

P > w # # M

6

1 < “t,m 1>d/2

is

.

w I

154

INFERENCIAS REFERENTES A LAS MEDIAS

Para decidir si se ha de ajustar el proceso, calculamos

y como excede a 2.797, valor de t.OObcon 24 grados de libertad (ver tabla IV), la hipótesis nula deberd ser rechazada. (Es difícil’dibujar la curva OC de esta test porque la distribución muestral del estadístico del test no es la distribución t, a menos que sea P = 20. Sin embargo, en la Biometrika Table mencionada en la bibliografía hay una tabla especial de la que se pueden obtener las probabilidades necesarias.) No obstante el resultadoobtenido en esta prueba, el fabricantepreferira no ajustar su maquinaria, ya que la pérdida debida a sobrellenar los botes con una pequeña cantidad adicional será menor que el costo dz los experimentos de ajuste. Esto ilustra el hecho importante de que un resultado que es significativo estadísticamente. Muchas veces no es significutivocomercialn~rnte. En estas circunstancias. seria más apropiado contrastar la hipótesis nula P = 20 frente a una alternativa, tal como 11 < 19.95 ó P > 20.05,’si se nota que en algunos de los casos es necesario hacer un ajuste. 8.5

1

!

Hipótesis referentes a dos medias

AI tratar con medias de poblacicin, nos encontramos frecuentemente con el problema de tomar decisiones sobre los valores relativos de dos, o más, medias. Dejaremos ei problema general para resolverló en el capitulo 3. Esta sección l a dedicaremos a test referentes a la diferencia entre dos medias. Por ejemplo, si se han considerado dos tipos de acero para usarlos en ciertas vigas de estructuras metálicas, tornaremos muestras y decidiremos cuál es mejor, comparando sus resistencias medias; también, si se ha dado un test a u n grupo de ingenieros industriales y a otro de ingenieros civiles para juzgar el grado de perfección en sus trabajos, y trataremos de decidir sí la diferencia observada entre las medias de sus resultados es significativa o si se debe atribuir a la casualidad. Formulando el problema con más generalidad, consideraremos dos poblaciones que tienen medias PI y p. y las varianzas U: y U$, y deseamos contrastar la hipótesis nula PI - p2 = 6, donde 8 esunaconstante especificada, suponiendo independientes las muestras aleatmias de tamaños. n, y n,. En forma andoga a los test que se refieren a una sola media, consideraremos tests de estas hipótesis nulas frente a cada una de las alternativas Ic, - PZ < 6, PI - 1c2 > 6, y - pz # 6. El test, por sí mismo, dependerá de la diferencia entre las medias muestrales, - z2, y si ambas muestras son grandes y se conocen las varianzas de población. se podrá basar en el estadístico z=

(2, - 2,) G

I

-6

- zz

cuya distribuci6n muestral es (aproximadamente) la distribución normal. tipificada Aquí, uz,-z2 es la desviación tipica de la distribucicin muestral de la diferencia entre

155

HIPOTESIS REFERENTES A COS MEDIAS ' :

das medias muestrales y sU.valor para muestras aleatorias de poblaciones infinitas se puede obtener del siguiente teorema que enunciamos sin demostración. Teorema 8.1.Si las distribuciotm de dos variables alcatorias independieurcs tirnen medias p1 y p~ y varianzas.,a; y a& ladistribucicin de su suma ( o tlifclrencia) tiene por media p1 pz ( 6 11 - p2) y por variatrza u: u;.

+

+

Para encontrar la variama de la. diferencia entre, las medias de dos muestras aleatorias independiente?. ,$e :tamaño n, y n2 provinientes de poblaciones infinitas, , . notemos primero que las varlanzas de las dos medias son:

donde U? y rema 8.1:

U:

son las varianzas de las poblaciones respectivas. Luégo. por el teo-

y el estadístico del test se puede escribir como

+

+

En una forma análoga a la 'de la tabla de la pagina 153, las regiones criticas para contrastar la hipótesis nulaH,,: pl - pz = 6 será como sigue: REGIONES CRITICASPARACONTRASTAR IIo: p1 (Muestrasgrandes, UI y uz conocidasi

PI

- c(2

>8

PI

- PZ

# 6

-,pz

6

Para ilustrar este tipo de test, supongamos que se'hace un test de eficiencia a 50 ingenieros industriales (Grupo- 1) y a 60 ingMieros civiles .(Grupo 2) y que los resultados son los siguientes:

Si deseamos cbntrastar, Coir u n nivel de significaei6n de u n 0.05. sies significativa una diferencia observada d e ' 2 puntosentre las dos medias si se puedeatribuira

156

INFERENCIAS REFERENTES A LAS MEDIAS

la casualidad, la hipótesis nula y la hipótesis alternativaapropiadasson Ho: pI - p2 = O y H1: pl p2# O. De acuerdo con esto, ponemos 6 = O en la fórmula de z y el estadistico del test es:

-

(Nótese que hemos aproximado las variankas de población con S? y S;, Io que es justificable, puesto que las dos muestras son suficientemente grandes.) Como el valor que obtuvimos para el estadistico’ del test se encuentra entre los valores críticos -1.96 y 1.96, la hipótesis nula no puede ser rechazada y, por lo tanto, concluimos que la diferencia observada entre las medias no es significativa con un nivel de un 0.05, o, en otras palabras, se puede atribuir a la casualidad. Si una o ambas muestras son pequeñas y las varianzas de población son desconocidas, podemos basar el test de la hipótesis nula Ho: pl - p2 = S en un estadístico t, conveniente siempre que sea razonable suponer que ambas poblaciones son normales con ul = u2. En estas condiciones, se puede comprobar que la distribución muestra1 del estadístico $1 - z,) - 6 t = sz, -4

es la distribución t con n, + n2 - 2 grados de libertad. En esta fórmula, e] denominador implica una “estimación conjunta” de la varianza de la población. Para aclarar lo que significa “estimación conjunta” de la varianza de la población, consideraremos primero el problemade estimar varianza de la distribución de la diferencia entre dos medias muestrales. Suponiendo que u? = u% ( = u2), esta varianza está dada

y ahora estimamos u*“conjuntando’’ las dos sumas de desviaciones cuadráticas referidasalas respectivas medias muestrales. En otraspalabras, estimamos 2 por medio de

donde 2 (2, - 21)2 es la suma de las desviaciones elevadas al cuadrado referidas a la media de Ia primera muestra, y 2: (x2 - z2)2 es la suma de las desviaciones elevadasalcuadrado referidas a la media de la segunda muestra. Dividimos por n 1 + n2 - 2, puestoquehay n , - 1 desviaciones independientes referidas a la media en la primeramuestra, n2 - 1 enla segunda y, por lo tanto,obtenemos nl + n2 - 2 desviaciones independientes referidas a la media para estimar la vavarianza de la población. Substituyendo esta estimación de u2 en la expresión anterior de y después substituyendola raíz cuadrada del resultadoen el denominador de la fórmda para t de la pagina 156 encontramos finalmente.

157

HlPOTESls REFERENTES A ,DOS MEDIAS

para, el estadístico en que hemos ,basado la ,prueba. Las regiones críticas correspondientes para contrastar la hipótesis nula i r o : p1 p2 = 6 se muestran .en la tabla siguiente:

-

i



,

,

REGIONES CRITICAS PARA CONTRASTAR H ~ : - p2 = 6 (Poblaciones normales, u: = ut = u, u desconocida) ’.>Rechazar

para n1

alternativa Pl

H, si

+.ni - 2

grndoslibertad, de 1 < -t.

-m 2000,hemos situad&;el peso de la cogiendo la hipótesis alternativa ‘pA pruebas en la laminadora A.) En este último ejemplo, sin ‘detenernos en qomprobaciones y con cierta arbitrariedad establecimos un test t rie dos muestr&, suponiendo tácitamente que las varianzas de la población eran iguales. Afortunadamente, el test ‘ mes muy sensible a pequeñas diferencias en las varianzas de población por lo que el procedimiento usado es bastante justificable. Sin embargo, para %tenerseguridad en lo que estabamos haciendo, debieramos primero haber examinado en qué grado se puede atribuir a la casualidad la diferencia entre las varianzas de las muestras: un procedimiento para precisar esto se expondrá en el capítulo 9.

-

158

INFERENCIAS REFERENTES A LAS MEDIAS

Si la diferencia entre las varianzas de las muestras es grande, o si no es razonabie tratar las varianzas de población como si fuesen iguales, no podremos utilizar ei test t de dos muestras Sin embargo, hay varios mitodos alternativos que se pueden emplear en su lugar, los cuales no requieren la supbsición de que sean iguales ias varianzas de población. Uno de estos, el test t de muestras apareadas, se aplica a dos muestras aleatorias del mismo tamaño que no necesitan ser independientes. Brevemente, el procedimiento consiste en trabajar con las diferencias de observaciones apareadas en las que el primer miembro de cada par proviene de la primera muestray el segundode la segunda muestra,y en usar el test t deunamuestra descrita en la sección 8.4 para determinar si la media de las diferencias es significativamente diferente de 6. A veces, como en el caso en que se hacen dos exámenes a cada una de n personas, el apareamiento es “natural”; en todos los otros casos será zieatorio. Para ilustrar el test t de muestras apareadas, supongamos que tenemos que probar la resistencia al desteñido de un tinte exponiendo al sol 8 piezas teñidas de varias clases durante un periodo determinado de tiempo. La reflexión a la luz para el mismo color del tintesemide(enunidadesarbitrarias)antes de la exposición al sol y después, y se considerará que el tinte no es resistente si la diferencia en los indices de reflexibilidad es significativamente mayor que 1. Los resultados obtenidos .3n este experimento son los siguientes:

Pieza Pieza Pieza Pieza Pieza Pieza pieza Pieza

1 2 3 4 5 6 I 8

Antes de la exposición

Ilespués de la

*I

x2

19 5 24 8 IO 11 7 16

14 4

exposición

20 8 9 9 5 15

Las diferencias entre estas observaciones apareadas son 5, I , 4, O, 1 , 2, 2, 1, su media es 2.00 y su desviación típica 1.69. Suponiendo que las diferencias pueden ser tratadas como una muestra proviniente de una población normal con 6,) = 1, el estadístico del’test, para el test t de una muestra, tiene el valor: 2.00 - 1 t = 1.69/4/8 = Si el nivel de significación es 0.05, hallamos que t.oa para 7 grados de libertad es igual a 1.895 y, por lo tanto, que la hipótesis nula no puede rechazarsc. Podemos concluir que el tinte es resistente al desteiíido o podemos reservar nuestro juicio hasta obtener más datos. Aunque esta test t de muestras apareadas se puede emplear ‘para muestras de poblucicin normal independientemente de que las muestras sean independientes o las

HIPOTESIS REFERENTES A

159

GOS MEDIAS

vaviuntus de las poblaciones sean iguales, tiene dos ventajas. Primera, los tamaños de las muestras deben ser iguales y, segunda, hay una pérdida de información muy grande en el sentido de que la prueba se realiza como si sólo hubiera n observaciones enlugarde 212 observaciones. En el ejercicio 20 que sigue, se da un método alternativo que elimina estas desventajas cuando las muestras son independientes. EJERCICIOS 1. La direccih de una factoría de comercialización de alimentos está considerando la instalación de un equipo nuevo para clasificar huevos. Si pl es el número promedio de huevos clasificados por hora por la máquina antigua y p2el promedio correspondiente de la = O, nueva máquina, la hipótesis nula que se desea contrastar es pl- pU.. ( a ) ¿Qué hipótesis alternativa se deberá usar si el peso de la prueba se va a poner en el nuevo equipo yel equipo antiguo se conservaráa menos que la hipótesisnula sea rechazada? ( b ) ¿Qué hipótesisalternativa se deberá usar si el peso de la prueba se hace sobrela máquina antigua? (c) ¿Qué hipótesis alternativa se deber& usarparaqueel rechazo de la hipótesisnula pueda conducir a la compra de la nueva máquina o a mantener la antigua? 2. Un productor de artículos de plástico inyectadoencuentra que su inventario diario medio es de 1148 piezas. Se ha puesto en marcha una nueva política de mercados y se desea contrastar la hipótesis nula, de que elinventario diario mediopermanezcasincambios. Qué hipótesisalternativadebeusarse si: (a) ¿Se desea probar que la nueva política reduce el inventario? ( b ) ¿Si se desea conocer cuándo la nuevapolíticacambia el inventario diario medioy cuándo no? (c) ¿La nueva política debe permznecer en uso, a menos que se pueda probar Que causa un incremento en el inventario? 3. Una muestra aleatoria formada por las botas usadas por 50 soldados en una regijn desértica muestra una vida promedio de 1.24 años con una desviación típica de 0.55 años. En condicionesnormales se sabe que esas botas tieneuna vida promedio de 1.40 años. ¿Hay alguna razón para asegurar,con un nivel de significación de 0.05, que el USO de esas botas en el desierto causa la disminución en la vida promedio? 4. Una muestra de 9 medidas del porcentaje de manganeso en un ferromanganeso tiene una media de 84.0 y una desviacijn típica de 1.2. Suponiendo que la muestra se ha escogido al azar de una poblaciónnormal, contrastarla hipbtesis nuladeque elporcentaje verdadero sea 80.0 frente a la alternativa de que exceda a 80.0, con un nivel de significación de 0.05. 5. Un test de funcionamiento de 5 modelos de un motor experimental mostri, que funcionade comron, respectivamente, 20, 19, 22, 17 y I 8 minutoscon un galhn deciertaclase bustible. ¿Es esto evidencia suficiente con u11 nivel de significación de 0.01 deque los modelos no están funcionando con el promedionormaldeseado de 22 minutos por galón? ¿Qué suposiciones se debenhacerparaefectuar este test'? 6 . Un procedimiento analíticorápido ysingastos paradeterminarla cantidad de titanio acabade ser desarrolladopor Iln quimico. Parademostrar su exactitud, el descubridor presentó 50 determinaciones independientes, con una media de 0.0995ppm y una varianza de 81.0.10-*.El materialanalizado por el nuevoprocedimiénto se analizódespués por un método muy exacto, pero muytedioso, y se llegb al resultado de que eltitanio del material era efectivamente, 0.0093 ppm. Utilizando un nivel de significacih de 0.05, decidir si hay alguna razhn para dudar de la exactitud del nuevo procedimiento.

160

INFERENCIAS REFERENTES A LAS MEDIAS

7. Un laboratorio de pruebas desea contrastar siel promedio de vida de cierta herramienta cortante es de 2 O00 piezas, frente a la alternativa de que es de menos de 2000. ¿Qué conclusión se deberá sacar con un nivel de significación de 0.01, si 6 tests mcstraron como vidas de las heramientas 2010, 1980, 1920, 2005, 1975, y 1950 piezas? 8. Una muestra aleatoria de 100 llantas producidas por cierta fábrica duraron en promedio, vida 21 O00 millas con una desviación típica de 1 500 millas. ¿Se puede asegurar que la media verdaderadeestamarcadellantas excede de 20000 millas? Utilizar ~y = 0.05, 9. Calcular algunas delasprobabilldades necesarias y dibujarla Curva oc para el test usado como ejemplo en la página 164. 10. Dibujar la curva OC para el test descrito en el ejercicio 6. 11. Los diámetros de los ejes de rotor de un lote, tienen una media de 0.249 pulgadas y una desviación típicade 0.003 pulgadas. Losdiámetros interiores deunos cojinetes deotro lote tienen una media de 0.255 pulgadas y una desviación típica de 0.002 pulgadas. ( a ) ¿Cuáles son la media y la desviación típica de las tolerancias entre los qjes y los cojinetes seleccionados de esos lotes? eje y un cojinete,¿cuál es la probabilidad dequeel ( b ) Si seseleccionan alazarun eje noentreen elcojinete? (Supóngasequeambas dimensiones siguen una distribución normal). 12. Una investigación de los méritos de dos tipos de baterías para bombillas de destellos de cámaras fotográficas demostró que una muestra de 100 baterías hechas por la compañia A teníauna vida mediade 24 horas,conuna desviación típicade 4 horas. Si una muestras de 80 bateríasde la compañía B tuvouna vidamedia de 40 horas,conuna desviacióntípica de 6 horas, ¿se puedeconcluir, conun nivel de significación de 0.05, que las baterías de la compañía B tienen una vida medin de 10 horas más por menos, que las de la compañía A ? 13. Una compañía desea comparar las vidas de dos piedras utilizadas en un proceso de abrasión y encuentra que el promedio de vida de 10 piedras de la primera clase es de 58 piezas, con una desviación típica de 6 piezas, y que lavida promedio de 12 piedras de la segunda clase es de 66 piezas, con una desviación típica de 4 piezas. Contrastar la hipótesis nula de que no hay diferencia entre el promedio verdadero de tiempos de vida de las dos piedras frente a la alternativa de que la segunda es superior. Utilizar CY = 0.01. ¿Qué suposición se debe hacer para poder realizarestetest? 14. Los miembros de un equipo ¿e evaluación de armas quieren evaluar los méritos comparativosdedostiposde proyectiles antitanques.Sedisparan a su distanciamáxima 10 proyectiles del tipo A, con un error medio en el blanco de 24 pies y una varianza de 16 pies. Luego se disparan 8proyectiles del tipo B con un error medio de 30 pies y una varianza de 25. ¿Hayuna diferencia significativa entre, los errores mediosrespecto del blancodelosdostiposde proyectiles, conun nivel de 0.01? (Supóngase que el error respectodel blanco esta distribuido normalmente.) 15. Dos grupos de 50 estudiantes de cursos de postgraduados de ingeniería,seleccionadosal azar, recibenenseñanza sobre una operación de montaje por dos métodosdiferentesy despuésse les hace un test de aprovechamiento. El primergrupopromedia120puntos conuna desviacibn tipicade 12 puntos,mientras que el segundosaca unpromediode 112 puntos con una desviacibn típica de 9puntos. $i pI es el aprovechamiento medio verdaderode los estudiantes queaprendieron el primermttodo y p:, el de los del segundométodo,contrastarla hipótesisnula pl = p.., con un nivel de 0.05, frente a la alternativa bilateral p1 # pz. 16. Se afirma que la resistencia de un alambre eléctricosepuede reducir, como mínimo, en 0.050ohms aleando el material. Se hacen25 pruebas en alambrealeado y otrastantas en alambre sinaleación, dando los siguientesresultados:

161

HIPOTESIS REFERENTES A DOS MEDIAS

I

Alambre aleado Alambre sin aleación

Media 0.089 ohms 0.141 ohms

Desviación típica 0.003 ohms 0.002 ohms

Empleando un nivel de significación de 0.05, determinar si es cierta la afirmación. de muestras de 4 bolos de plásticoy 4 de madera, poniendo especial atención al número de tiradas que se pueden ha’cer antes de que aparezcan dentelladuras u otras imperfecciones. Los resultados ottenidos para los 4 bolos de plástico son 2650,2770,2480 y 2660 tiradas,mientras que los de los 4 bolos y 1395 tiradas.Si pLy p- son lasmediasverdaderas demadera son 1420,1600,1545 correspondientes a las dos clases de bolos, probar, con a = 0.01, si los bolos de plhstico duranenpromedio 1 O00 tiradas más. ¿QuS suposiciones son necesarias para hacer este tets? 18. Paradeterminarla efectividad deunprograma deseguridadindustrial, se recogieron los siguientes datos sobre el tiempo perdido por accidentes ( los números dados son las medias de horns-hombreperdidas por mes en un períodode un año). Factoría Núm. 1 2 3 4 5 6 7 8 38.5 69.2 15.3 52.1 78.8 47.6 120.9 9.7 Antes del programa 28.9 62.2 28.7 0.0 40.2 86.5 49.6 93.5 Después del programa Contrastar con un nivel de significación de 0.10, si el programa de seguridad fue efectivo en la reducción de pérdidas de tiempo por accidentes. 19. LOS datos siguientes se obtuvieron de un experimentoproyectado para verificar las diferencias sistemhticas en las lecturas de presión arterial hechas por dos instrumentos diferentes: Lectura con el Lectura con el Instrumento B instrumento A Paciente 1 Paciente 2 I17 115 Paciente 3 142 141 Paciente 4 145 140 Paciente 5 127 123 Paciente 6 147 146 Paciente 7 133 135 Paciente 8 150 1 52 Paciente 9 138 135 Paciente 10 147 152 Utilizar un nivel de significación de 0.05 para contrastar sí hay una diferencia en el promedio verdadero de lectura obtenido con los dos instrumentos. 20. AI tratarcondos muestras aleatorias independientesprovinientes de poblaciones nor. males cuyas varianzas no son necesariamente iguales, la prueba Smith-Sarterthwaite, que se indica a continuación,puedeusarse paracontrastar la hipótesis nula pl = 8. El estadístico del test esta dado por 3, 2,) - 6 17. Se están haciendo tests de lascaracterísticas

t’=i -

I___

y su distribución muestra1 se puede aproximar por la distribuci6n t con

(Ei + n1-1

’ 7tz-1

162

REFERENTES INFERENCIAS

A LAS MEDIAS

gradosdelibertad.Utilizarestetestpara los datosdelproblema 14 y compararla respuesta con la obtetlida anteriormente. 21. Emplear la f6rrnula para I de la página 156 para constuir un intervalo de confianza para 6 al nivel de 1 - LY diferencia entre las medias de las dos poblaciones. 22. Emplearlaf6rmulaobtenidaen el ejercicio 21 para construir un intervalo de confianza Ins vidas medias dc las dos piedras abrasivas del alnivcl de 0.95 para la diferencia entre problema 13.

9

INFERENCIASREFERENTES A LAS VARIANZAS

9.1

Estimación'devarianzas

En varias wasignes, en el capítulo anterior, estimamos la varianza de la población por medio de una varianza de la muestra definida por la fórmula n

I:

. "

S2

=

i-1

(Xi

- 2)2'

n-1

. .

'

Substituimos s2 por u2 en el intervalo de confianza de u , para muestras ,grandes en la página 148, en el test de muestras, grandes referentes a p en la página 153, y en test de muestras' grandes rkferentes a la diferencia entre dos pedias en la página 155. Para justificar este 'procedimiento, vamos, ahora, a compro6ar que S') es, de hecho, una estimación no sesgadu,de d . E n otras palabras; demostraremos que la media de la distribución muestra1 de s? es igual v2. 163

164

INFERENCIAS REFERENTES A LAS VARIANZAS

Si / ( x l , X?,. . . 2,) es la densidad conjunta de los valores de la muestra xl, xq,. . . según la discusión de la página 77, la media de la distribución muestral de s2 está dado por

y

X,

=

/-mm

2 u.f(xl, n-1

. . . /-mm

,-I

x2, . . . , x,) dxl dxz

. . . dx,

Si ahora escribimos n

2 i=l

(Xi

- z)2

n

=

z i-1

x; - n22

e intercambiamos las operaciones de suma e integración, la expresión de la media de la distribución de S' es

Suponiendo, sin perdida de generalidad, que la media de la población p t s igual a cero, vemos que estas dos integrales últimas ya han sido calculadas en la página 122, donde se demostró que sus valores respectivos eran u2 yu2/n. Entonces, la media de la distribución muestral de s? estará dado por 1 z" n - 1 i=l

ue

n .u2 nu2 - U2 -=n-1

n

n-1 n-1

u2

y esto completa la demostración de que sf es una estimación insesgada de u2. (Nótese que si hubiéramos dividido por n en lugar de hacerlo entre n - 1 al definir S', el resultado habría sido una estimación sesgada y la media de su distribución muesn-1

tralhabriasido 7u'.) Aunque la varianza muestral es una estimación insesgada de u2, esto no implica que la desviacicin típica de la muestra sea también una estimación insesgada de U ; de hecho, no lo es. Sin embargo, para muestras grandes, el sesgo es pequeño y es práctica común hacer una estimación de U con s. Junto con S, algunas veces se estiman, también, las desviaciones típicas de las poblaciones en función del recorrido R de la muestra, que qued6 definido anteriormente cam0 diferencia entre los valores mayor y menor de la muestra. Dada una muestra aleatoria de tamaño n provenienfe de'una pohlacitin normal, podemosdemostrar que la distribrciqn muestral de R tiene la media deu y la desviación típica d3u,donde de y da son constantes que dependen del tamaño de la muestra, como se ve en la tabfa siguiente:

165

ESTlMAClON DE VARIANZAS

I 4

3

dr

1.128 1.693 2.059 2.326 2.534 2.704 2.847

dr

0.853 0.888

5

4

7

6 9

8

.~

2.970

0.g80

0.848 0.833 0.820 0.808

0.864

I

3.078 0.797

Asi pues, el estadístico Kid, es una estimación insesgada de u, y la, desviación típica de su distribución muestral esta dada por dsu/dn . Paramuestrasmuypequéñas (n 15 5), R / d 2 nos da una estimación aproximadamente tan buena de u como S, pero cuando crece el tamaño de‘ la muestra, es mlis eficiente el uso de s. Se emplea el recorrido para estimar U en problemas de coritroi de calidad, donde los tamaños de las muestras son, en general, pequeños, y en los que la facilidad de cálculo es un requisito importante. Esta aplicaciijn se discutirá detalladamente en el capftulo 15. La estimación de intervalos para u ó uz se basa casi siempreen la varianza muestral. Al tratar con muestras.aleatorias tomadas de poblaciones ttormales, utilizazamos el teorema 7.4, de acuerdo con el cual (n - l)s2 a2

es un valor de. una variable aleatoria que tiene m a distribución X-cuadrado can - 1 grados de libertad. Entonces, si x? y xf cortan las Colas izquierda y derecha 1 grados de liberdel área a / 2 bajo la curva de distribución X-cuadrado con n tad, podemos asegurar, con un grado de confianza de 1 - a, que rz

-

(n - l)s2

+

x;

< u2 < ( n - I ) s 2

+

X::

Si, ahora, tomamos la raíz cuadrada de cada miembro de esta desigualdad, obtenemos el intervalo de confianza al nivel de 1 - a , correspondiente para u. Nótese que los intervalos de confianza anteriores, obtenidos tomando “colas iguales”, no dan los intervalos d e confianza m h cortos para u2 y u,puesto que 18 distribución X-cuadrado no es simétrica. De todas formas, se utilizan en,la mayoría de las aplicaciones para evitar cálculos complicados. Para ilustrar la construcción de un intervalo de confianza para u 6 us,volvamos al ejemplo de lapágina 130 y supongamos que los indices de refracción de una muestraaleatoriade 20 piezas de cristal tienen una varianza de 1.20. , Para construir un intervalo de confianza al nivel de 0.95 para u2, encontramos en la tabla V que, para 19 grados de libertad,

x; = x575

=

8.907

y

x; = xks’=

32.852

166

INFERENCIAS REFERENTES A LAS VARIANZAS

Substituyendo estos valores junto con los de I E = 20 y S? la del intervalo de confianza anterior ,obtenemos

=

1.20 .

en la fórmu-

19)(1.20. IO-')

(19)(1.20-10-4) 32.852 ci

0.69. < u' < 2.56. Tomando raíces cuadradas, encontramos que el intervalo de confianza al nivel de 0.95, correspondiente para u es 0.0083 < U < 0.0160. El método que hemos analizado se aplica solamente a muestras aleatorias provinientes de poblaciones normales (o al menos, muestras aleatorias provinientes de poblaciones que se aproximan suficientemente a las normales, por lo que el método nos dé una buena aproximación). Si el tamaño de la muestra es grande, se puede probar que, en condiciones muy generales, la distribución muestra1 de S se puede aproximar muy bien con una distribución normal que tiene u como media y ~/d/21( c.c)mn desbiaci6n típica. Entonces, z=-

S - u U / d %

es un valor de una variable aleatoria que tiene aproximadamente una distribucicin normal tipificada, y resolviendo la desigualdad

para u, obtenemos el siguiente intervalo de confianza de muestras grandes con una probabilidad I - a para u:

+ EJERCICIOS los 1. Utilizar los datos del ejercicio 7 de la página 160 para estimar la desviacidn típica de tiempos d e vida delasherramientascortantesdadas, en funcidn'de: a l muestra, (a) la desviación típica de ( b ) el recorrida de la muestra. Comparar las dos estimaciones, expresando su diferencia en porcentaje de la primera. 2. Laslongitudes(enpulgadas),de 10 clavosproducidosporciertamáquina, son las siguientes:

1.14, 1.12, 1.11, 1.10, 1.16, 1.13, 1.18, 1.12 1.11, , 1.15 (a) Hallar el recorridodeestamuestra y emplearloparaestimarladesviacióntípicade las longitudes de los clavos. ( b ) Comparar el recorrido estimado obtenido en la parte ( a ) conladesviacibntípicade la muestra. LCOmc podemos usar eficazmente una clave en este caso para calcular

S?

HIPOTESIS REFERENTES A UNA VARlANZA

167

3. Usando los datos del problema 5 de la página 160. construir un intervalo de confianza al .nivel dc 0.95 para la desviacibntipicade las longitudes del tiempo que el motor exper,¡ntentalfunciona con un gal6ndelcombustibledado. 4. Cltilizando la f0rmuIaparamuestrasgrandesdada en l a pigina 166 con el valorde S obtenido en el problema 3. suhstituycndo a r3hallar el tamaño de muestra mínimo neceraritl para estimal u cntre 0.005 con u n grado d e confiarza de (1.Y5. 5. Una muestra alentorta de 2.5 cjecutivos.gast6 en promedio 517.5.36 con u n a desviacicin tiplcade 316.94. en visltas a funcionarios.Hallar un intervalodeconfianza al nivel de 0.95 para la desviacion ttpica verdadera dc estos gastos. utiltzando 'a! la tCcnica denluectras pequcfias hasadaen l a distrihucibnX-cuadrado. ( b 1 la técnica demuestras grandes basada en ladistribucionnormal.('ompar;rr l o r dos intervalos de confianza. h. 0.50, y que lo debemos hacer con un nivel de significación de 0.05. Como esto es equivalente a contrastar la hipótesis nula u2 = = 0.25 frente a la alternativa u2 > 0.25, el valor del estadístico del test ser5

En esta tabla,

Como no excede a 23.685, valor de xbs con 14 grados de libei-tad, la hipótesis nula no se puede rechazar; aunque la desviacicin típica muestral excede a 0.50, la evidencia no es suficiente para llegar a la conclusión de que el proceso para obtener el grosor laminar deseado es insatisfactorio. Si la población de la que estamos tomando las muestras no es normal, pero el tamaño de la muestra es grande (la regla general será tomar n 2 30). la hipótesis nula H o : U = uu se puede contrastar ;,tilizando el estadístico z=-

S

- Un

Un/

4%

cuya distribución muestral es, aproximadamente. ladistribucicin normal tipificada. La linica diferencia en el test es que y zn reemplazan a x' y d.

169

HIPOTESIS REFERENTES A DOS VARIANZAS

9.3

Hipdtesisreferentes a dos varianzas

El test t de dos muestras para la diferencia entre dos medias, descrita en la sección 8.5, requiere la suposición de que las varianzas de población sean iguales. Antes de proceder con este test, será conveniente, por lo tanto, someter esta hipótesis a un test. En esta sección describiremos un test de la hipótesis nula N O : u? = U$ frente a una alternativa apropiada que se aplica a muestras aleatorias independientes tomadas de poblaciones normales. Como veremos en el capítulo 13, el test tiene muchas otras aplicaciones importantes. Si, de dos poblaciones normales que tlenen la misma varianza, tomamos dos muestras aleatorias independientes de tamaños nl y n:, se deduce, del teorema 7.5, que el estadístico

es un valor de una variable aleatoria que tiene una distribución F con nl - 1. y 1 grados de libertad. Entonces, si la hipótesis nula U? = U ; es cierta, la razón de las varianzas muestrales S; y S: nos da un estadístico con el que se pueden basar el test de la hipótesis nula. La región crítica para contrastar H,, frente a la hipótesis alternativa u? > (ri es F > F,, donde Fa como se definió en la página 130, es decir, corta la cola derecha 1y17~ 1 gwdos de libertad. de área CY bajo la curva de distribución F con n, Anhlogamente, la región crítica para contrastar H b frente a la hipótesis alternativa U: < U; es F < F1-, , y esto provoca ciertas dificultades, ya que la tabla VI s610 contiene valores correspondientes a las colas por la derecha de (Y = 0.05 y Q = 0.01. Un método es usar el recíproco del estadístico del test original y empleamos la relación n2

-

-

dada anteriormente en la página 131. Entonces basamos eltestenel estadístico F = sf/s? y la región crítica para probar H o :u: = u: frente aH,:a? F a , donde F, es el valor crítico apropiado de F con n 2 1 1 ~ 1 grados de libertad. .. Para la alternativa bilatera U? # U ; laregicin critica ~ S F < F ~ - ~ / (>. ÓFmIa, F donde F = S V S S y los grados de llbertadson 1 1 ~ 1 y t12 - 1. En lapráctica, modificaremos este test como en el párrafo anterior, de tal forma que podamos utilizar la tabla de valores de F correspondientes a las colas por la derecha de CY = 0.05 y CY = 0.01. Con este objeto, representemos por S$ la mayor de las dos varianzas muestrales, y por s: la menor, y los correspondientes tamaños de las muesy la tras por nM y nm.Así, el estadístico del test quedará en la forma F = S;/& región crítica será la mostrada en la tabla siguiente:

-

-

-

170

INFERENCIAS REFERENTES

A LAS VARIANZAS

REGIONES CRITICAS PARA CONTRASTAR Ho:ut = a:

(Poblaciones normales) Hipótesis alrerrtarivu

Esradistico deltest

Rechazar

2 a;

F

F

‘4 jt

F = S$/&

0;

= &S%

I

F

H, si

- 1) > Fa(% - 1, m - 1) > F , I ~ ( ~-M1, n, - 1) > Fa(% - 1, n1

El nivel de significación de estos tests es IY y los valores indicados entre parkntesis son los respectivos grados de libertad. Notemos que, como en el test X-cuadrado, se emplean “colas iguales” en test de dos colas por conveniencia matemática, aunque la distribución F no sea simétrica, Para ilustrar un test F de una cola para la igualdad de dos variancias, supondremos que se desea determinar si, para dar el acabado a la lámina de silicio, es mejor hacerlo manualmente o con una máquina automática. Supondremos que, esencialmente, no hay dificultad para controlar el espesor medio de la lámina, cualquiera que sea el método empleado, y basaremos el test enla variabilidad del espesor de los dados encontrada en los dados cortados por los dos métodos. Siel peso de la prueba se sitira en el método automático (posiblemente porque ésta requiere equipo nuevo y caro), la hipótesis nula Ho: U ; = U: deberá contrastarse frente a la alternativa H I : U: > u:, donde los subindices 1 y 2 se emplean, respectivamente,para el método manual y el método automático. Si 31 dados acabados a mano tienen una varianza s? = 0.58 , mientras que 35 dados acabados a máquina tienen una varianza de si = 0.26 encontramos que el estadístico del test adecuado tiene, por valor F = - oL58 ”

-

2.23

0.26

Comparando estevalorcon 1.79, el valor de F.,,,(30, 34) obtenido enla tabla VI por interpolación lineal,+concluimos que la hipótesis nula, deberá rechazarse, conun nivel de significación de 0.05, y la decisión será instalar el equipo automático. Para ilustrar un test F de dos colas para la igualdad de dos varianzas, volvamos al problema de la página 156, enel que contrastamos si las resistencias medias de tensión de vigas de acero estructural hechas por los fabricantes A y B diferían en más de 2000 libras por pulgada cuadrada. En este ejemplo, hicimos un test t de dos muestras, aunque había una diferencia entre las varianzas de las dos muestras. Para justificar este procedimiento. emplearemos un test para ver si ri = U:, y para ello, contrastaremos la hip6tesis frente a la alternativa$,, # &,puesto que sólo nos interesa saber si estas varianzas son iguales, o no. Como: 10s

* N6tese que realmenteera innecesario interpolar en este caso, puesto que 2.23 excede a dos F.a~(30,30) Y Fm(30, 40).

171

HIPOTESIS REFEfiENTES A 00s VARIANZAS

Utilizando a = 0.02, encontramos, en la tabla VI, que F.ol(9, 1 1 ) es igual a 4.63, de donde la hipótesis nula no puede ser rechazada. En otras palabras, era justificable emplear el test t de dos muestras en el ejemplo considerado. EJERCICIOS 1. Con los datos delproblema 4 de la página 159, contrastar la hipljtesis de que u = 1.5 1.5. Emplear 1y = 0.05. frentea la hiphtesis alternativa deque U 2. Se han disparado 500 cargas de municiones y la tabla de frecuencias nos indica las presiones en ei cañón resultantes en miles de libras por pulgada cuadrada:

<

presió11 e11 el cariúrz

48.0-49.9 50.0-51.9 52.0-53.9 54.0-55.9 56.0-57.9 58.0-59.9

Frecuerrcia

21 94 133 155 82 16

Con baseen esta informacihn. ;es razonlhle concluir que la desviaciím típicade estas presiones excede de 2.2 miles de libras por pulgada cuadrada'? Usar un nivel de significacidn de 0.05. 3. Contrastar la hipjtesis nula u = 0.01 pulgadds para los diimetros de ciertos pernos. si en una muestra aleatoria de tamaño 12, los diimetros de los pernos tuvieron una varianza de SI' = 0.000950. Utilice un nivel de significacion de 0.01. 4. Con los datos del ejercicio 2 de la página 166 contrastarla hi*Itesis nula de o2 = 0.0CKl3 frenteala alternativa deque u2 = O.OW3. utilizando un nivel de significaci6n de 0.01. 5. En el ejercicio 8 dela página 160. contrastar la hipdtesis nula de que u = 1750 para el númerode millas obtenidopara el tipode llantas. Usar (Y .- 0.05 y la hipBtcsis alternativa U < 1750. 6. Los datos de experiencias anteriores indican que la varianza de las mcdidas hechas en cstampados de láminas de metal por un grupo experimentado de inspcctorcs de control de calidad es 0.16 pulg". Tales medidas. hechas por un inspector sin experiencia. pucdcn tener una varianza demasiado grande (por eiemplo. por S U falta de habilidad para lccr adccuadamcnte los instrumentos) o demasiado pequeña (posihlemcnte porquclas medidas muy grandes o muy pequeñas se hayan dcscartado). Si un nuevo inspector mide I 0 0 estampados con una varianza de 0.11 pulgz, contrastarconun nivel de significacihn dc 0.05 si el inspector esti haciendo medidas satisfactorias. 7. En el problema I7 de la página 16 1. verificar si es razonahlc afirmar que hay una variabilitlad nlayor en lasvidas de los bolos de plástico que. en las de los de madera.Usar (y = 0.05.

>

172

INFERENCIASREFERENTES

A LAS VARIANZAS

8. Justificarel

uso de un test t dedosmuestrasen el problema 14 de la página 160, contrastando la hip6tesis de que las dos poblaciones tienen varianzas iguales. Usar un nivel de significacih de 0.02. 9. En el ejercicio 16 de la página 160, contrastar la hipStesis nula de que u1 = u2 frente a laalternativabilatera ul # u2 con (Y = 0.02. Aquí, u1 4 u2 son las desviaciones típicas de las dos poblaciones de las que se han obtenido las medidas de las resistencias de los cables eléctricos. 10. Se comparandos técnicas diferentesdeiluminacihnmidiendo l a intensidad lumínica en posiciones seleccionadas de áreas iluminadaspor los dosmétodos. Si 15 medidas en la primera área dieron una desviación típica de 2.5 pies-bujías, y 21 medidas en la segunda área dieronuna desviacijn típicade 4.1 pies-bujías, ¿,se puede concluir quela iluminación en la segunda área es menos uniforme'? Emplear un nivel de significacih de 0.01. ¿Qué suposiciones se deben hacer en la manera de obtener las dos muestras?

.

10.1

Estimacibndeproporciones

En muchos problemas de ingeniería se presentan proporciones, porcentajes, O probabilidades. AI tomar muestras para aceptar algo. nos hemos de ocupar con la proporcicin de los objetos defectuosos en un lote, y en los tests de vida probable tratamos con el porcentaje de ciertas componentes que deberin trabajar satisfactoriamente durante un periodo de tiempo establecido. o la prohahilid~dde que una componente determinada dure, al menos, un número dado de horas. Debe quedar claro. en estos ejemplos, que los problemas referentes a proporciones. porcentajes .o probabilidades, son, en realidad, equivalentes: un porcentaje es. simplemente. una proporción multiplicada por cien, y una probabilidad se puede considerar como una proporción cuando el número de casos observados se va extendiendo. La información disponible generalmente para determinar una proporcicin es 4 n6mero de veces, x. que un suceso determinado se presenta en 11 pruetias U observaciones. La estimacicin de puntos es, usualmente. la frecucncia relativa x/th es decir. la proporción de las veces que ha ocurrido el succ)so. Si los II ensayos satisfacen las suposiciones que hicimos al tratar de la distribucifin b i n h i c a (pigina 36). sabemos 173

174PROPORCIONES

A

REFERENTESINFERENCIAS

que la media y la varianza de ladixtribucicindel nilmero de casos favorables estin dados por t?p y n p ( 1 - p ) . En el ejercicio I de la página 378. e1 lector deberj verificar que la media y la varianza de la propolcicin de casos favorables (la írecuencia relativa X/II) están dados por

Esto muestra que la proporcicin muestral debe considerarse como un c d m r r d o r i j l .w.yur/o del parámetro p de una distribucicin bintimica. es decir. de la proporcicin "verdadera" que estamos tratando de estimar basados enla muestra. En la construccitin de intervalos de confianza para el parimetro p de la distribucicin bintimica. encontramos \!arios obsthculos. Estos se deben principalmente a clue ( 1 ) la distribucicin bincimica es discreta. por lo que es imposible encontrar un intervalo conun grado de confianzaque sea exactamente 1 - (Y.y (?) la wri:tnza dc la distribucitin mucstral de .Y ( o la de la proporcicin muestral s / n ) contiene implícito el parametro p que estamos tratando de calcular. Para construir un intervalo de confianza para p con u n grado de confianza aproximado de 1 - CY.seleccionamos, para un conjunto dado dc valores de p , las cantidades correspondientes xo y X I . donde xIIes el mayor entero, para el que

Para hacer resaltar el hechodeque x,, y x1 dependen del valor escogido para p . designaremos estas cantidades por x 0 ( p ) y x1( p ) . Entonces, podemos afirmar. con una probabilidad aproximada de 1 - CY (y por. l o I ~ J I M L Y 1 - a ) ,quc ZdP) < x < a ( p ) para cada valor dado de p . Para cambiar estas desigualdades en intervalos de confianza para p . usamos un nv2todo grifico muy simple que se ilustra en el siguiente ejemplo. Se trata de determinar intervalos con grado de confianza de 0.95 aproximadamente para p , en muestras de tamaño 20. Utilizando la tabla I, comenzaremos por encontrar x,, y x1 para valores determinados de p . de tal forma que x ( ,sea el ma;or entcro. para elc1uc

Z3(:fY,; 20, p)

y x1 el nzcmr

ctltero,

5 0.025

para el que 1 - R(x.1 - 1; 20, p ) 5 0.0'25

Haciendo p

a 0.1, 0.2.. . .. y 0.9, obtenemos la tabla siguiente:

:

175

ESTIMACION D E PROPORCIONES

."

"

zL

0

9

11

13

15

17

20

19

-

Marcando los puntos ( p , x = 0.0084

donde 16.8 es el valor de X?OI para 2 (2 + 1 ) =- 6 grados de libertad. Si hubikramos usado errtinearnente la distribucicin normal en lugar de la distribución de Poisson paraaproximar la distribucicin bincimica, habríamosobtenido el intervalo mucho más corto O < p < 0.00.3i.

EJERCICIOS 1. Verificarlas f k m u l a s d a d a s e n l a g g i n a 174 para la media Y lavarianzadeladistribución de la proporcidn de los casos favorables. 2. En una muestra alcatoria de 200 votantcs. X 0 estuvieron a favordecierta ley y 120en contra. Usar la tabla Vlll para construir un intervalo de confianza alnivel de 0.95 para laproporcibnverdaderadevotantes en favor de la ley. los que se leshizounaentrevista, 260 dijeronque 3. Entre 400 dueñosdeautomóvilesa el prbximocoche que pensabancomprarseriadelamlsmamarcaque el queusaban V l l l . construirunintervalodeconfianzaal nivel corrientemente.Empleandolatabla autornciviles que piensan cambiar SU de 0.99 para la proporción verdadera de ducños de auto por otro de la misma marca. 4. En una muestra alcatoria de I O 0 diodos, se cncontr0 que 2X fallaronenciertacategoria de voltaje. Construir intervalos de confianza al nivel d e 0.99, para la proporción de diodos quc fallaron er. la categoría dada, utilizando la tabla Vlll y fa fbrrnda para mues188. Comparar los rcsultados. tras grandes de la pagina 5. Una compañía de seguros de accidentes industrides encontri) que 138 d e 10s 250 dicntcs dieron parte de un accidcnte por lo menos, durante el período de 3 años, de 1960 a 1962. 10s archiDado que cstainformaciónestábasada cn unamuestraalcatoriatomadade vos de la compañia, construir un intervalodeconfianza al nivel de 0.95 d e l a ProPorcion verdadera corrcspondicntc, ( a ) utilizando la tabla VIII, y ( b ) utilizando la f M n u l a Para muestras grandes rle la phgina 176.

179

HIPOTESIS REFERENTES A UNA PROPORCION

6. ¿cuál es el tamaño de la muestra más pequeña necesaria para calcularuna proporcijn desconocida en la que se permite un error miximo de 0.01 con un grado de confianza de O%? Si se estima que la proporcih es 0.15 sobre la base deunapequeñamuestra piloto, ¿qué tamaño de muestra se podrh usar'? 7. ;,Cuál es el tamaño mínimo de muestra en unaencuesta de opiniún pública si se desea que esta encuesta sea capaz de asegurar, con unaprobabilidadde 0.95 por lo menos. que SU estimación delporcentaje de los votos que puedeobtenercierto candidato no esté "equivocado" en más de un 5 % ? ¿Cómo se vería afectado el tamaño mínimo de la muestra si se supiera que el porcentaje que se vaaestimar es próximo al 65%? x. Demostrar que ladoble desigualdad de la página 176 conduce a los limites de confianza conprobabilidad de I - cy, siguientes: 2

+ 2-1 & f

Q2

n

+

zL2

9. Emplear la fórmula del intervalo de confianza del ejercicio 8 para hacer

el ejercicio 4 y comparar los resultados. 1 o . En 5000 disparos de un proyectil "de airc a aire". hubo un casoenel quc aquel exploti, durante la ignición. Construir un limite superior de confianza al nivel de 0.99 para la probabilidad de que tal proyectil explote durante la ignicibn. 11. Entre 500 unidadesinstaladas por unacompañía telefjnica. 3 requirieron reparación durante el primer año. Utilizar el métododiscutido en la página 178 para determinar un límitesuperiordeconfianza al nivel de 0.95 paralaproporcibn verdaderade unidades nuevas que requieren reparación durante el primer año de operación. 12 En el ejercicio 10, encontrar el número de proyectiles encendidos sin fallo que se necesitan para poder afirmar, con ,un grado de confianza de 0.995 al menos? que la probabilidad de explosión durante la ignición es menor que 0.O001.

10.2

Hipótesisreferentes a una proporción

Muchos de los métodos empleados en inspección de muestras, control de calidad y verificación de fiabilidad, están basados en tests de la hipótesis nula de que una proporción (porcentaje o probabilidad) sea igual a una constante determinada. Los detalles de la aplicación de tales tests al control de calidad se discutirán en el capítulo 15, donde, además, mostraremos algunos problemas de inspección de muestras; las aplicaciones a fiabilidad y tests de duración de vida se darán en el capitulo 16. Aunque existen tests exactos basados en la distribucicin bincimica (que se pueden construir empleando la tabla I), consideraremos aquí solamente los tests aproximados con muestras grandes (n 2 100) basados en la aproximación normal a la distribución binómica. En otras palabras, contrastaremos la hipótesis nula 110: p = I'd frente a una de las alternativas f.-1: p < pn, 111: p > pa, II1. p Z po utiiizando el siguiente estadístico

180

INFERENCIAS REFERENTES A PROPORCIONES

Si la hipótesis nula es cierta, la distribución muestra1 de este estadístico es, aproximadamente, la distribución normaltipificada. y las regiones criticas del test se muestran en la tabla siguiente: KFGIONES CRITICAS PAR.A CONTRASTAR flu: p = (Muestras grandes)

Hipdresis alternativa

rechazar H, si ~~

z

P

> Po

P

f

Po 6 z

<

-2,

> z2;,

(Si el tamaño de la muestra no es suficientemente grande para usar la aproximación normal de la distribución binómica, tendremos que emplear el test exacto mencionado con anterioridad.Por ejemplo, paracontrastarla hipótesis nula p = p o frente a la alternativa p < po, utilizamos la región crítica x 5 k,, donde k , es el mayor mtero, tal que B(k,; n, p o ) I ,). Para ilustrar el test con muestras grandes, supondremos que queremos contrastar la afirmación de un ejecutivo de que menos del 60% de los empleados de una compañia muy grande están en favor de unirse a un sindicato. Si el peso de la prueba se hace recaer sobre el ejecutivo, la hipótesis nula adecuada y la alternativa son, respectivamente, p = 0.60 y p < 0.60. Si se toma una muestra aleatoria de tamaño 400 y en ella hay 208 votos en favor de la alianza y 192 en contra, obtenemos. z=

208 - 400(0.60) = -3.3 ~400(0.60)(0.40)

dedondela hipótesis nula se puederechazar 0.01. Esto apoya la afirmación del ejecutivo. 10.3

con unnivel

de significación del

Hipdtesisreferentes a varias proporciones

Cuando comparamos las respuestas de los consumidores (porcentaje favorable y porcentaje desfavorable) a dos productos diferentes, cuando decidimos si la proporción de defectos en un proceso dado permanece constante cada día, cuando juzgamos si hay una diferencia en la persuasión política entre varios grupos nacionales. etc., estamos interesados en contrastar si dos, o más, poblaciones binómicas tienen el mismo parámetro p. Llamando a estos parámetros p , , p2,. . . y p k , lo que hacemos es contrastar la hipótesis nula 11”:

= j>?

..,

-y

7);

HIPOTESIS REFERENTES A VARIAS PROPORCIONES

181

frente a la alternativa de que, al menos. dos de estas proporciones de poblacicin no sean iguales. Para Raceruntest adecuadode muestras grandes paraestas hipótesis, necesitamos muestras de azar independientes de tamaño nl, u ? , . . . tzk de las X poblaciones y se supondrá que los nilmeros correspondientes de "casos favorables" son x, x2,.. . xk. El test que emplearemos está basado en el hecho de que (1) para muestras grandes, la distribución muestral de 2;

=

- n,,p; Jn,.p,U - P i ) xi

es, aproximadamente, la distribución normal tipificada, (2) el cuadrado de una variable aleatoria con distribución normal tipificada es otra variable aleatoria que tiene distribucidn X-cuadrado con l grado de libertad, y (3) la suma de las k variables aleatorias independientes que tienen distribución X-cuadrado con 1 gradode libertad es una variable aleatoria con distribución X-cuadrado con k grados de libertad. (En el libro de J. E. Freund mencionado en la bibliografia, se dan las demostraciones de estos dos últimos resultados.) Entonces. la distribucirin muestral del estadístico =

2 i=l

(.Ci - n,p;)Z n , p , ( l - pi)

es, aproximadamente,la distribución X-cuadrado con k gradosde libertad. (Esta aproximación, generalmente. es bastante correcta cuando ni pi 2 S para todas las i). Ahora, si la hipótesis nula es cierta, y p I = p . = . . . = p k = p . el valor del estadístico anterior x2 es

Y en la práctica substituimos p (la cual, por supuesto. es desconocida) por el valor estimado conjunto

1;= x 1 + 2 2 + ...+.TI

nl+n2+ . . . + n k Como la hipótesis nula se debe rechazar si las diferencias entre las xi y las tli p son grandes, la región crítica es x' 2 donde x: se definió en la página 129 y el número de grados de libertad es k - 1. La pkrdids de un grado de libertad se debe a que p esta estimado por p . No ilustraremos este test de manera directa, porque, en la práctica, es conveniente realizar eltest o expresar el estadístico 'x 2n diferentes (aunque equivalentes) f 11.mas. En el caso especial en que k = 2. en el que estamos contrastando la hipi.tc:.,, nula de que dos proporciones de poblaci6n son iguales. basamos nuestra decisih en el estadistico

x:,

182

INFERENCIAS REFERENTES A PROPORCIONES

cuya distribucicin muestra1 es. aproximadamente. la distribucicin normal tipificada. El test basado en este estadístico es equivalente al lest x' mencionado anteriormente. en sentido de que el c.~rc/dr.ur/o de este estadístico :es igual al estadístico X 2 anterior con X = 2 (ver ejercicio 7 de la pagina 198). Es preferible utilizar el estadístico .:, ya que nos permite contrastar la hipótesis nula p , p 2 frente a alterrlativas unilateras o bilateras: esto no es cierto para el estadístico x2. con el que scilo podemos hacer un test frente a la alternativa bilatera p, -;i 1):. Las regiones críticas resultantes basadas en el estadístico :son -:

Pl f p?

2

6

2

< "Z,'? > 2,,*

Para ilustrar este test de muestras grandes para la diferencia entre dos proporciones muestrales. supongamos que una encuesta hecha por una organizacicin investigadora de mercados, mostrci que cierto producto era usado por 128 de 400 personas entrevistadas en una ciudad en que se había anunciado profusamente, pero sdo por I I5 de 500 personasentrevistadas en unaciudad en que el producto no se habia anunciado. Para determinar si realmente es eficaz el anuncio. se desea contrastar la hipótesis nula p I -. p 2 frente a la alternativa p , > p.. donde p1 y p - son las proporciones verdaderas de perwnas de las dos ciudades que usan el producto. ( E n esta forma, el rechazo de lahipcitesis nula implica que el anuncio es eficaz.) Substituyendo x1 = 128. I I ~= 400, X- = I 15. y 11: = 500 en las fcirmulas para $ y .:-obtenemos

Y

128 I15 "2 =

400

500

= 3.02

(A + 7 .)o0 '>

m.27)(0.7:i) -

Esto excede el valorcríticopara Q: . 0.05. es decir, 1.645, y concluimos que la diferencia en lasproporciones de las muestras es significativa. En otraspalabras. el anuncio es efectivo. Determinar si es "suficientemente efectivo" para justificar SU empleo, depende del costo del producto. el tamaño del mercado, el costo del anuncio y, posiblemente, o ! m consideraciones.

HIPOTESIS VARIAS REFERENTES A

183

PROPORCIONES

Cuando aplicamos el criterio x-cuadrado de la phgina 182 a la comparación de varias proporciones de muestras, es conveniente tomar los datos preparados de la manera siguiente:

7:I I _ j l / Muestra I

suceso

Muestra 2

...

Muestra k

Tot& 2

Fallo

n1

Total

- x1

n1

7%

n2-G

...

Izs

- zk

nk

n-x 12

donde la notaci6n es la misma que antes, excepto en la adición de x y n, que representan, respectivamente, el número total .de casos favorables y el número total de pruebas para todas las muestras combinadas. Con respecto a esta tabla, la entrada de la casilla correspondiente a la idsima fila y la j-ésima columna recibe el nombre de frecuencia de Ia casilla observbda jij phra i = 1, 2 y j = 1, 2,. . .k. Con la hipótesis' 'nula p 1 = p z = .'. = p k = p . estimamos p , como antes, como el número'total de casos favorables divididos por el número total de pruebas, lo que indicamos por j =' x/n.';Entonces, el número de casos favorables,,esperdo para la muestra j-bima se estima en I

,

I :

I

elj = n j . $

- nj.2 n

mientras que el número de casos desfavorables esperado para la muestra j-ésima, se estima en

Las cantidades elj y ezj se llaman frecuencias esperadasde casilla eij para i = 1, 2 y j = 1, 2,. . . k. Entone -;las frecuencias esperadas para una casilla dada se pueden obtener multiplicando los totales,.de la fila y la columna a las que pertenece.la casilla, y dividiendo después por,el gran total n. Utilizaqdo ,esta nueva notación, podemos. ver que (ejercicio 12 de la pdgina 185) el estadístico X2 de la página 182 se puede escribir en la forma

Esta fórmlrla tient la ventaja que se puede aplicar directamente 'a problemas más generales, en los que cada prueba admite más de dos casos,posibles, y donde hay, por lo tanto, mhs de dos filas en el esquema anáIogo al de la página 182. Esta clase de problemas se discutirin en la sección 10.4. Para ilustrar el empleo de este estadistico x2, supondremos que se desea contrastar a n un nivel de significación de 0.01 si la proporción de compras devueltas y cambiadas, en cierto departamentó de un almacén est6 sometida b variaciones estacionales. Los datos obtenidos para este test se muestran en la tabla siguiente:

184

INFERENCIAS REFERENTES A PROPORCIONES

Primcr frjmesrrc,

Seundo rrimcstrc

Terker

Cuurro rrirnesrrr

rrimesrre

""

~~

Ntimerc~dv piezus cambiadas

Told*

(1

~"

~

21

8

70

~

~

1 ~

M i m e r o de pic,.-us s i n camhiur

92

___

Told

i

139

p~L-.--p'p--J

I :io

110

100

X GO

430

500

La frecuencia de casilla esperada para las tres primeras casillas de laprimera fila son

como se puede demostrar que !as frecuencias esperadas para cada fila o columna, totalizan lo mismo que las frecu&ncias"observadas correspondientes ( ver ejercicio 16 de ,la página 186), ,encontramos, por substracción, que e, es igual a 70 (15.4 18.2 i- 14.0) = 22.4 y que las frecuencias esperadasparala segunda fila son I10 - 15.494.6, 130 - 18.2 = 111.8, 100 - 14.0 = 86.0 y 160 - 22.4 = 137.6. Como las frecuencias esperadas son todas de 5, mayores, pódemos substituir estos valores junto con los observados de las frecuencias de casilla en la fórmula adecuada del estadístico x', y obtendremos

y,

-

x2 =

(2!1 - l . i . - 1 ) 2 l,-j..l (81 -

+ ____" 91.ti

(12 +

+

IS.'))? 18.2

-

+

(8 - 14.0)Z (21 - 22.1)* 14.0 + 22.4

(118 - 111.8)2 (92 - 86.0)' (139 - 137.6)' 111.8 + 86.0 -k 137.6

~~

= 19.49

Como este vdor excede a 11.345, valor de x ? , ~con 3 grados de libertad, podemos rechazar la hipótesis nula de que la proporci6n de compras cambiadas permanece constante: en otras palabras, concluimos que hdy una definida variación kstacional. EJERCICIOS 1. Un investigador médico desea determinar si un nuevo producto para relajar

los músculos produce resultados benéjicos en una mayor proporción de pa,cieptes que sufren vn desorden neurológico, que el 0.70 que"son'los que obtienen resultados positivos con un trata" mientonormal. ¿Cd?no deberá interpretar u n experimento (con un nivel de significacibn de 0.05) .si :156 de '200 pacientes obtienen'resultados benefices con el nuevo producto? 3,. Una muestra aleatoria de tamaño 1.W.) 6e: obtiene de un gran lote de objetosfabricadas. Se desea contrastar, (con un nivel de significgción de 0.05) si la propqrci0n;de objetos 'aceptables en el lóte es 0.80 frente a la alternativa de que sea menor que esta cantidad. fa) ;,Cui1 es e l número máximo de objetos aceptables en la múestra que conducen al re~

1

,

.

.

HIPOTESIS REFERENTES A VARIAS PROPORCIONES

3.

185

(b) Hallar la probabilidad de aceptar la hipótesis si el lote contiene un 75% de objetos aceptables. (c) Dibujar la curva UC de este test. De un cierto tipo de municiones cuesta más hacer un test que fabricarlas y, Por consisonprobadas. Si se rechaza el lote, guiente, sólo tresunidades decadalotegrande a menos que las tres unidades trabajen de acuerdo con las especificaciones, (a) dibujar la curva OC de este test, Procedimiento del ( b ) hallarlaproporcibn real de unidadesdefectuosas para 10s que test hace que se rechace un lote, con una probabilidad de 0.10. Un oficialde carreteras asegura que 3 de cada 10 automóviles no cumplen con 10s requisitosconcernientes a luces, frenos, señales direccionales, etc. Contrastar esta afirmación conun nivel de significación de 0.01, si entre 400 automóvilesdetenidos enun punto de la carretera hubo 73 que no cumplían los requisitos. Se asegura que el 30% de todas lasmáquinas de escribiren USO en Cierta área fueron fabricadas por cierta compafiía. Una investigación, que muestra que 118 de las 500 m& quinas fueron hechas por esa compañía, ¿sostiene o contradice la afimación? Utilizar un nivel de significación de 0.01. La hipótesis nula p = 0.35 de una población binómica se va a contrastar frente a la al0.35 con un nivel de significación de 0.05. Si la decisión se basa en una ternativa p muestradetamaño n = 15, ¿cuál eselmenor número de “casos favorables” parael que se puede rechazar la hipótesis nula? ¿Cuál es la probabilidad de que se acepte la hipótesis nula con este criterio, aunque p sea realmente igual a 0.40? Demostrarqueelcuadradodel estadístico z dela página 162 es igual al estadístico x-cuadrado de la misma página cwndo k = 2. Las experiencias pasadas muestran que en 150 embarques del vendedor A había 34 que no eran satisfactorios por una razón u otra, mientras que en 120 embarques del vendedor B había 46 que no eran satisfactorios. Utilizar el estadístico X’con un nivel de significac i h de 0.05 para contrastar la hipótesis nula p 1 = pt siendo pI y pz las proporciones verdaderas de envíos no satisf@orios d e los dos wndedores. Repetir el test usando el estadístico z de la página 182, y verificar que el cuadrado de este estadístico es igual al valor obtenido previamente para el estadisticb.X* Repetir el problema 8, contrastando la hipjtesis nula p I . -- p z frente a la alternativa unilaterir pl < p g . Un fabricante de equipo electrónico desea sometera dos compañías de transistoresen competencia, a un test comparativorápido. De los 80 transistores’del primer fabricante 25 fallan en el teSf y de los 50 transistoresdelsegundo 21 fallan. Empleando un nivel de, significación de 0.05, aprobar si hay diferencia entre 10s dos productos

>

7. 8.

9. 1o.

( a ) basando el resultadoen el estadísticox-cuhdrado dado en la pagina 182. ( b ) basando el resultado en el estadistico z dadó en la página 182. Verificar tambih que el cuadrado del valor :obtenido con ei estadístico z es igual al obtenido con el estadístico x-cuadrado. 11. Dos grupos de 50 pacientes cada uno, tomaron parte en un experimento en el cual un grupo recibió píldoras que contenían una droga antialérgica, y el otro grupo recibió píldoras que no contienen tal droga.’En el grupo que recibió la droga, I 5 pacientes mostraron síntomas alkrgicos, mientras que, en el grupo que recibió la píldora sin droga, hubo 24 con estos síntomas. ¿Es esto evidente suficiente para concluir (con un nivel de significacih de 0.05) que la droga es eficaz parareducir los síntomas? . , 12. Verificar que las dos fórmulas dadas parael estadístico en las páginas 182 y 183, son equii valentes. 13. Las siguientes son las ventas en enero de 1964 de tres agentes vendcdores empleados por, cierta firma:

186

r,T] INFERENCIAS REFERENTES A PROPORCIONES

Agente B

Agente A

visitados Clientes Nlimerode

ventas realizadas,

I

Usando un nivel de significacijn de 0.05, probar si .lasdiferencias entre las proporciones de ventas son significativas. 14. Se hacen test sobrela proporci6n de funcionesdefectuosasproducidaspor. 5 moldes diferentes. Si hubo 12 unidades defectuosas entre 100 hechas en el molde T . 32 entre 200 del motde 11, 25 entre 180 del molde 111, 15 entre 120 del molde IV y 20 entre 150 del molde V, contrastar* (en un nivel de significación de 0.05) si la proporción verdadera de piezas defectuosas es l a misma para cada molde. 15. Empleando un nivel de significacijn de 0.05, ¿se puede concluir, de los datos.siguientes, que la proporci6n de estudiantes que manejan'autom6vil en cierta universidad depende de su clase?,

Novatos Cadetes pemíltimo de de Númerode Estudiantes

.

estudiantes COJI

auto

I

450 99

-

dtimo

360

340

300

90

102

96

16. Verificar que, si las frecuencias esperadas se determinan Como se indicaen .la página 183, lasfrecuencias e s p a d a s en cada fila o columnatotalizan Io mismo quelas fre-

cuencias observadaid correspondlentes.

10.4 Tabias decontingencia Como sugerimos en la pigina 183, el. método por el que anzlizamos el ultimo ejemplo de la sección precedente se presta también para el análisis de las llamadas tablu.7 r por k, esto es, tablas en las qLle se situan las frecuencias observadas en r filas y k columnas.'Tales tablas aparecen esencialmente en dos tipos de problemas. En primer lugar, podemos tener nuevamente, muestras de k poblaciones, con la distinci6n de que~ahora,cada prueba permita más de dos casos posibles. Esto puede ocurrir, por ejemplo, cuando a personas pertenecientes a diferentes grupos de nivel de ingresos, se pregunta si piensan favorecer a un candidato político, si están et? contra de &,o si están indecisas. La otra situación que nos da tablas de r por k (:S aquella en que tomamos muestras de una sola poblacicin, pero las clasificamos con respecto a dos categorías (usualmente cualitativas). Esto se presenta, por ejemplo. si un servicio para aconsejar a los consumidores, somete a un test a los automtiviles y los clasifica en excelentes, superiores, medios y pobres, atendiendo a SUS cualidades y, al mismo tiempo, atsndiendo a su apariencia: Cada automóvil podri. entonces, caer dentro de alguna de las 16 casillas de una tabla de 4 por 4. La diferencia esencial xntre las dos situaciones es que, en ei prirner caso los totales de las columnas (los tamaiios de las muestras) están fijados, mientras que, en el segundo, sólo el gran total es fijado. Aparte de esta diferencia, el método de

181

TABLAS DE CONTINGENCIA

analisis es el mismo y podremos tratar las dos situaciones como un solo problema. Para ilustrar el método general, consideramos el problema que se le presenta :a un fabricante de latas de conservas vegetales que quiere saber si la reacción del consumidor ante su producto es la misma independientemente de la calidad de colorante empleado en la preparación de la conserva en otras palabras, si, existe una relacicin entre el empleo de difer2ntes cantidades'kle colorante y la r&cci6n del cohsumidor. Los datos que tiene para el estudio se'muestran en la tabla siguiente: > .'

. I

Sin ' color

,,

. ..!

r

; I

Color tenue

Color iufeltSo

I

Total

.

90 '

Buen sabor

,

,

.

. .

Sabor mediano

I

Sabor malo 150 Total

100

50

GO

300

Si estos datos se han obtenido de ill0 latas sin colol'ante, 150 con una ligera coloración y 50 con una fuerte coloración, y viendo la reacci6n del consumidor, tenemoy la primera clase de 'Situaciones descritas anteriormente y ,deseanios contrastar la" hipótesis nula para i = 1, 2, 3 donde pijes la probabilidad de obtener una resp.uesta correspondiente a la i-ésima fila y la j-ésima columna. La hipótesis alternativa es aquella en la que las p no son todas iguales, por lo menos en una fila. Si los datos se hubieran obtenido entrevistando al azar a un grupo de consumidores y clasificando cada respuesta de acuerdo con la cantidad de coiorante usado en el producto y la reacci6n del consumidor. tendríamos la segunda clase de situaciones descritas anteriomente y tendriamos que contrastar la hipótesis nula pil = piz = pi,

donde pi es la probabilidad de obtener una respuesta correspondiente a la i-isima fila y />.j es la probabilidad de obtener una correspondiente a la j-Csima columna. La alternativa a esta hipótesis nula (que,.en realidad, eg pna hip6tesis nula de indcpcndencia) es que no haya igualdad, por lo menos, para un par de valores de i y j . Independientemente de cómo se hayan obtenido los datos (o cónio enfoquemos el,-problema),el lmétodo de dnálisis es elmismo: Calculamos la frecuentiafesperada de casilla eij rnultipfitando el'totalde la fila i .por el total .de h colamna j y dividiendo poc.el'gran total. (En la práctica, -haemos uso del hecho de que las frecuencias observadas, y las frecuencias eiperadas totalizan io mismo paial cada fila y columna,.de tal forma que sdlo (I. 1). ( k - 1) dit las.ei, se deb- calcular para una tabla dada. d e r por k, y los valores restantes se pueden calcular por substrac-

-

188

A

REFERENTESINFERENCIAS

PROPORClONES

ción 'de los totales de la fila o la columna apropiada.) .Entonces, substituyendo en la fdrmula

rechazaremos la 'hipótesis nula sielvalor de este estadísticoexcede a 2 con (r 1) ( k 1) grados de libertad. (Esta expresión del número de grados de libertad se justifica por la observación, hecha anteriormente, de que, después de es1) de las frecuencias de casillas esperadas, las otras quedan coger (r - 1) (k determinadas automtiticamente, es decir, se pueden obtener por substracción de la fila o la columna adecuada.) Volviendo a nuestro ejemplo numérico, encontramos que las frecuencias de casilla esperadas para las dos primeras casillas de las dos primeras columnas son

-

-

-

y, por substracción, las otras frecuencias de casillas esperadas son % = 25, e31 = 20, e23 = 30, y g 3 = 10. luego, x2

=

(18 - 30)2 (61 - 45)2 30 + 35

~

(11

eI3 = 15,

- 15)'

15 (48 - 50)' (79 - 75)' I (23 - 2513 50 75 25 @4 - 20)2 110 - 30)' I (16 + 20 i- 30 10 = 3a.74

"

-

Como excede a 9.488, valor de xib5 con (3 1) (3 - 1) = 4 grados de libertad, la hipótesis nula debe ser rechazada. Concluimos que hay cierta relación (alguna dependencia) entre la cantidad de colorante y la aceptacióndel producto por el consumidor. 10.5

Bondad de ajuste

Hablamos de "bondad de ajuste" cuando queremos comparar una distribución observada con los valorescorrespondiente de una distribuciónteórica. Para ilustrar esto, supongamos que, en la manufactura de una l¿imina de vidrio, un ingeniero de control de calidad inspecciona muestras a intervalos regulares de tiempo y que, en ,250 de tales muestras, observa O, 1, 2, . . . y 10 imperfecciones con las frecuencias respectivas de 8, 4 0 , 62, 54,43, 27, 10. 3, 2, O y 1. Con esta informacidn, desea determinar si los valores de los datos se pueden considerar como valores

BONDAD DE AJUSTE

,



b

%89”

,

de una variable aleatoria .que .sigue una distribución de Pqisson, es decir, si una distribución de, Poisson da, en este’caso, un buen ajuste. La rnEdia de la distribución dada es 740/250 = 2.96 y, por lo tanto, la intentamos ajustar a una distribución de Poisson con A = 3 (el :valor más pr&mo a 2.96 en ía .tabla 11). En la tabla que sigue, las frecuencias observadas se ‘&n en la segunda columna, las probabilidades de Poisson con A = 3 están dadas en la tercera columna;y las frecuencias esperadas de la, cuarta colutqna se. obtienen multiplicando cada una de las proba. por 250 y redondeándolas biljdades .de Poisson . .. a un decimal. ,. ~.. “

2

_

N I i m e r o de imperfecciones

Frecuetrciu

O

8 40 62 54

observuda

i

/

,

I

,Pl!>buhilidudes Poissott I

3 4

-7

.,

Frecuetlriu esperada

.lee D

27

8 9. 10 I

, .ii

.6

I

f

37.4 56.0

43

5 6 7

5 ’

..

I

56.0 42.0 25.2% 12.6, 5.4 I 2.0 0,7 18.3 0.21 /

Un test.adecuada de,la hipótesis nula, de que los da& provienen de una poblcthn con distribución ‘de Poisson (frentea la alternatiya deque f a poblacih ltiene . . cualquiera otra distribución), se puede basar en el estadístico ’ .

.

..

,

donde las fi y las et son; como antes. las frecwncias observadas y esperadas, correspondientes. La distribuci6n. muestra1 de este estadístico es. aproximadamente. l a distribución q-cuadrado con X2 grados de libertad.”siendo k el nimero‘ ‘de tCrminos en la fórrnuli de x?. En general, el nílmel-o degradosde libertad para el test x-cuadredo de bondad d e ajuste, es -el-nitmero de terminos ’& la bmmu€a de x 2 , menos el número de cantidades ohtcnidw (IClos &tos’ w.igi&lcs cpre sou necesarias para calcurar las frecllencias esperadas. Ncitese que. en nuestro ejemplo, debemos conocer la media de la distribucicin $ la fricuencia total para calcular las e , ; por lo tanto, tenemos k 2 grado$ de libertad. Para seguir la regla de la página 182. de acuerdo con la cual ninguna de las frecuencias esperadas en una comparaci6nx-cuadradodebe ser menor ‘de 5. seguiremos la práctica simple de combinar clases adyacentes copo se indica cn la tabla anterior. Combinando las illtimas 4 clases en una sola clase que represente 7, o mlis imperfccciones. obtenemas

-

-

190

56.0

REFERENTESINFERENCIAS

X2

=

(8

37.4

- 12.5)2 I

(40

- 37.4)'

A PROPORCIONES

I (62 - 56.0)'

12.5

"

- 25.2)2

(43 - 42.0)*(27 42.0 i-

-k

25.2

"

(54

- 56.0)% 56.0

110 - 12.6)' I (6 - 8.3)' 12.6 8.3

= 3.84

Como este valor es menor que 12.592, valor de x% para 8-2 = 6 grados de libertad, la hipótesis nula no puede ser rechazada y llegamos a la conclusión de que la distribuci6n de Poisson nos da un buen ajuste. EJERCICIOS 1. Las muestras de tres clases de materiales sujetos a cambios extremos de temperatura, pro-

dujeron los resultados mostrados en la tabla siguiente: Material A Mat& Factura completa Mostrando ligeros defectos Permaneció perfecto

I

1

9

18

I

Material C

I

I

62

B

8

31

1

27

48

I

51

I

Contrastar, con un nivel de significación de 0.05, si las proporciones verdaderas de casos mostrados en las tres categorías son las mismas para los tres materiales. 2. Un periódico comercialdesea determinar la actitud de los ejecutivos de varios campos, al valorar actividades "de prestigio", tales como apadrinamiento de investigaciones, becas, exposicionescientíficas,etc. Utilizando los resultados de la YabIa siguiente, contrastar con un nivel de 0.01, si hayaalguna relacibrí entre la actitud de los ejecutivos hacia tales actividades y la clase de sus empleos.

Publicidad

Personal

100

55

Producción

Administración general de ejecutivos

Poco valor Algún valor Gran valor

,

95

3. LOSsiguientes datos de muestras, pertenecen a envms recibidos por una empresa grande de cuatro vendedores diferentes: Número de Número de im, Número de rechazos perfect? aceptables perfectos Vendedor A

7

18

65

Vendedor B

6

32

83

Vendedor C

12

25'

103

Vendedor D

6

8

86

191

BONDAD DE AJUSTE

4.

5.

6. 7.

8.

Contrastar con un nivel de significacijn de' 0.05, si los cuatro'vendedoresenvían productos de igual calidad. En una muestra de azar de 600 familiasentrevistadas para conocer sus hibitos de ver televisibn, liubo 124 familias de ingresos económicos bajos entre las .que a 48 les gustaba ciertocomediante nuevo, mientras que a las 76, restantes no les ,gustaba O n o lo habían visto. Hubo famb%n 319 familias',con ingresos económicos medios deentrelas cuales a I15 les gust6 el nuevo comediante*,y a las restantes 204, o no les gustó O no 10 habían vist? Y, entre 157 familias con ingresos aItos, a 94 les gusta el nuevo comediante y a 63 no les gusta, o no Ió han visto. Cohfrastar, con un nivel de 0.05, si hay alguna relación entre el nivel de ingresos y los 'gustos con respecto 'al nuevo comediante Un ingeniero de control 'de calidad toma diariamente muestras de Id'componentes electrónicos y los revisa para ver sus imperfecciooes. Si en 200 días de trabajo sonsecutivos obtuvp 112 muestras con O defectos, 76 muestras con un defecto, y 12Lmuestrascon dos un nivel de 0.05, si dichasmuestras se puedenconsiderar defectos, contrastar,con como provinientes de una distribución binómica. Con respecto a los datos del ejercicio 5, contrastar,con un nivel de 0.05, si se pueden aonsiderar como muestras de una poblacibn binómica con p = 0.05. Tirar un dado 240 veces y usar los resultados para contrastar (con = 0.05) si el dado seencuentra realmente equilibrado. Se desea contrastar si el nhmerode rayos gamma emitidos por segundo por cierta = 3.4 Contrastar esta substancia radioactivatiene unadistribucijnde Poisson con hipótesis con el nivel de significación 0.01, si los resultados siguientes seobservaron en 250 intervalos de un segundo: Número de rayos gamma por segundo

O

3

1

21 51

2 3 4 5

6

70

Frecuencia

rnz

60 38

31 26 20

9. A continuación, repetimos los indices de solución de hierro dados en la pagina 98 Indices de solución de hierro 3

0.10-0.29 0.30-0.49 0.50-0.69 0.70-0.89 0.~1.09 1.10-1.29 1.30-1.49

Frecuencia 13 17 32

23 7 5

e

c o m o demostramos en el capítulo 6, la media de esta distribución es f = 0.795 y su des0.28. viaci6n típicaes S (a) Hallar l a s urobabilidades de que una variable aleatoria que tienedistribuciónnormal con p = 0.795 y Q = 0.28 tome un valor entre 0.095 y 0.295, entre 0.295 y 0.495,

-

192

INFERENCIAS REFERENTES A PROPORCIONES

entre 0.495 y 0.695, entre 0.695 y 0.895. entre 0.895 y 1.095, entre 1.095 y 1.295, Y entre 1.295 y 1.495. (b) Multiplicar las probabilidadesobtenidas en el inciso ( a ) por la frecuencia total (en este caso, n = loo), obteniendo así las frecuerlcias de la curva normal esperadas COrrespondientes a las siete clases de la distribución dada. (c)Probarla hipótesis nuladeque los datosdadossepuedan considerar comouna muestra aleatoria proviniente de una población normal, comparando las frecuencias observadas y esperadas con un estadístico x2 adecuado (usando (y = 0.05). Explicar por qu6 el número de grados de libertad de esta prueba está dado por k - 3, donde k es el ndmero de terminos del estadístico X” 10. De 1 0 tubos de vacío usados en un experimento, 35 tuvieron una vida de servicio de menos de 10 horas, 20 de más de 10, pero menos de 20 horas, 18 de más. de 20, pero menos de 30, 8 de mls de 30 pero menos -de 40, Y 19 tuvieron una vida de más de 40 horas. Siguiendopasossimilares a los marcados en el problema 9, contrastar si estas vidas de servicio se pueden considerar como una muestra de una población exponencial con = 25 horas. Utilizar un nivel de significación de 0.01.

e

11

METODOS ABREVIADOS EMPLEADOS EN INFERENCIA

11.1

Introduccidn

La mayoría de los métodos de estimación y de contraste de hipótesis que hemos estudiado, se basaban en la suposicidn de que las observaciones provienen de poblaciones normales. Estos métodos extraen. toda la informacih que es capaz de dar un muestra, y generalmente alcanzan la precisión máxima posible, esto es, los resultados m8s dignos de confianza. Como hemos indicado anteriormente,, la hi*tesis de que las muestras provienen de poblaciones normales no es tan restrictiva como parece. La mayor -parte de 'los mktodos estadísticos basados en la distribuci6n normal son suficientementerobustos, es decir, dan respuestas razonables acertadas, aun cuando la suposición de "normalidad'' se satisfaga sólo de uná manera aproximada. Esto no obstante, hay vanos motivos por los que pudieramos desear el empleo de otros mdtodos menos, precisos la hipótesis de normalidad puede ser bastante incorrecta, el trabajo para realizarun lnttodo preciso puede ser excesivo, y un método abreviado se puede desear para determinar por adelantado si es conveniente efectuar cálculos más detallados. 193

194

METODOS ABREVIADOS EMPLEADOS EN lNFERENClA

Ya hemos introducido algunos métodos abreviados, principalmente como artificios para ahorrar trabajo. Por ejemplo, en la página 104 introdujimos un método rápido para estimar la media y la desviación típica de un conjunto de datos normalmente distribuidos, utilizando los puntos de 50% y 84% de una gráfica de "probabilidad". En la página 111 discutimos un método de codificación que puede reducir materialmente el tiemporequeridopara calcular la media y la desviación típica 1 6, obserde un conjunto de datos sin ninguna pérdida de precisicjn. En " ~capítulo vamos que estos cálculos pueden simplificarse aun m$s coli solo una ptrdida de precisión mínima, agrupando las observaciones en una tabla de frecuencias. Otros métodos abreviados relacionados con la estimación puntual se introdujeron en los capítulos 8 y 9. Discutimos la mediana muestral, que 'se puede determinar siempre más fácil y rápidamente que la media y, como se indicó en la página 134, la mediana da un estimador insesgado de la media de una población simétrica. También la mediana es superior a la media como medida de la "localización" de una población muy asimétrica. Introdujimos el recorrido muestral en la página 1 6 4 , como un estimador de la desviación típica de una población normal; y que se obtiene mucho más rápidamente que la desviación típica de la muestra y su precisiim es, aproximadamente, la de s para muestras pequeñas. Si hay que escoger entre varios métodos estadísticos que se pueden emplear en una situación dada, el criteriomás utilizado comúnmentees el dela eficacia. Si pensamos que losmétodosbasados en la hipótesis denormalidad son completamente eficaces (cien por ciento), podemos utilizar esto como una medida de los méritos de cualquier otro método. La manera más frecuente de medir la eficacia, es por los tamañosde lasmuestras necesarios para dar resultados igualmente precisos por un método dado y por el método correspondiente que es completamente eficaz. Por ejemplo, al estimar la media de una población normal, el método más eficaz implica el uso de la media muestral 2. Si deseamos utilizar la medianaen lugar dc la media deberemos tener en cuenta que la varianza de la distribución muestral de la mediana es, aproximadamente, 1.57 2, por lo que la eficacia de la mediana n es 1/1.57 .o, aproxitpadamente, 64%. En. otras palabras, la mediana basada en una muestra de tamafio 100 nos da una,estimación de la media de una poblacibn normal tan digna de confianza.como la media basada en una muestra de tamaño 64. De una manera semejante, se puede demostrar. que la eficacia :del estimador lrecorrido para la desviacicin tipica de una población normal decrece a,medida que aumenta el tamaño de la muestra la eficacia es de 100.5ijpara muestras de tamaño 2, 96% para muestras de tamaño 5, y 81% para muestras de tamaño 15. En :la próxima sección introduciremos otros métodos abreviados para estimar p y 6, que son, generalmente, más eficaces que la mediana y. el recorrido. Ciertos métodosde inferencia 'tienen laimportante ventaja deno necesitar la hipótesis restrictivas de los rnktodos basados en la distribución normal. Estos rnétodos, que, generalmente, tienen la otra ventaja de necesitar menos cálculos. o menos complicados, se conocen como m6todos no paramPtricos (o de distribucicirt libre), puesto que generalmente no se encuentran ligados de una manera especifica a los pa-

195

ESTIMACION RAPlDA

r h e t r o s de las,distribuciones dadas. La principal ventaja de los métodos no paramétricos es que se pueden hacer tests exactos cuando las hipótesis que subyacen en los asi llamados los métodos -“normales” no se puexlen confirmai; esencialmente, estos métodos no dependen dela distribución de la población ( o poblaciones) dc las que se obtienen las muestras. ,La mayor desventaja de los métodos no paramCtricos es que se desperdicia mucha información y, usualmente, tienen una eficacia menor que los metodos paramétricos ‘correspondientes cuando se pueden conjbmar las hiptitesis de los mttodos normales (paramétricos). Así, si aseguramos queala eficacia de cierto‘método no paramétrico es SO%, debemos entender que este valor relativo esti referido a la eficiencia del método “normal” corírespondiente, pero la @ciencia de éste último será algo menor del 100% si no se verifican esactamente todas ?as hipótesis. En este capítulo indicaremos una gran variedad de métodos abreviados de inferencia muy útiles: la mayoría de los cuales son no param&icos. Estos métodos 51: pueder, emplear en lugar de los métodos “normales” corr&pbndi&tes (descntOs en los capítulos 8, 9 y IO), cuando no se cumplan todas las hip&esis 0 que haya una necesidad da gran simplificación en lbs cálculos. Otros métodos abreviados, que pueden ser usados en lugar de métodos “normales” no tratados todavía, se describirán junto con estos Últimos ‘en capítulos siguientes. 11.2 ‘Estimación rápida

Se recomienda generalmente e1 uso de Z para estimar la media de cualquier población porque es loo%, eficaz para poblaciones normales, porque tiene alta eficacia para otros tipos de poblaciones y porque es fácil de calcular. Para muestras grandes, donde el cálculo de E se vuelve lento, la mediana sirve para dar estimaciones rápidas de p para poblaciones más o menos simétricas.Lo mismo podemos decir delrecorrido medio, el cual se obtiene promediando los valores mayor y menor de una muestra; aunque este valor es ficil y rápido de calcular, su eficaciaes,generalmente, muy baja y resulta muy sensible a la omisión de valores de muestras (que pueden representar, o no, errores grandes). Una variedad de tknicas rápidas de estimación puntual para p y cr se basan en las’euantilas de una distribución observada. Dividiendo la distribuciijn en k partes iguales; definimos la jésima k-cuantila: Pj,k de tal’forma que j / k esla fracción de los datos que se excede en ,Fj,k. De especial importancia son las cuartifai, para los que k 4 y j = 1, 2, 3; las nueve decilas, para los que k = 10 y j = 1,2,.. . 9, y las 99 centiIus, para los que k = 100 y j = 1, 2,. . . ,99. Para el cálculo dE cuantilas debemos ordenar las observaciones, ya sea situando Jas observaciones individuales de acuerdo a su tamaño, o construyendo una tabla de frecuencia. El cálculo de cuantilas a partir de datos no agrupados se facilita por el uso de la regla siguiente: dadas n ohservaciqcs ordenadas, Fj,k es el ,valor de la &servaS n que ocupa el lugar j ( n -1 l ) /X: et1 tatnario, cometIZando por la mayor. Natese p e esta regla concuerda con la que dimos anteriormente para calcular la mediana ’

--7.

1

196

METODOS ABREVIADOS EMPLEADOS EN INFERENCIA

FIP, de acuerdo con la cual la mediana es el valor de laobservacibn numerada (n + 1)/2, Para ilustrar el cálculo de cuantilas a partir de datos no agrupados, hallaremos Fina, Pin, y para elsiguente conjunto ordenado de 30 observaciohes: 4 21 31

5 21 32

7 25 34

8 27~ 36

8 28 37

11 28

9 28 37

40

17 29 44

19 30 47

19 31 61

Para calcular F‘lI16, debemos encontrar el valor de la observación numerada 31/16 = 1.9, y esto significa que debemos ir nueve décimos del camino de la primera observaci6n hacia la segunda. Entonces:

F I / I= ~4

9 +(5 - 4) = 4.9 10

Para calcular la mediana Flw debemos encontrar el valor de la observación numerada 31/2 = 15.5, lo que significa que debemos recorrer la mitad del camino entre la observación 15 y la 16. De aquí se sigue que F l p = 28, ya que los dos valores (15 y 16) son 28. Para obtener llamado también tercera cuartila determinaremos el valor de Ia observación numerada (3.31)/4 = 23.25, y obtenemos 1 F3/4

= 34

+ -1(;% - 34) = 34.5

Para ilustrar el cálculo de cuantilas a partir de datos agrupados, determinaremos la tercera decila de los datos agrupados en la tabla siguiente:

f

X

14 15

6

0.5 3.5 6.5 9.5 12.5 15.5

8 5 2 50

Encontraremos, primero, la clase en que está localizada la tercera decila. Como hay 50 observaciones, Falloexcede a las 6 (50) = 15 observaciones más bajas y, por consiguiente, seencuentra localizado en la segunda clase. Como hay 6 observaciones en la primera clase, necesitamos 9 de las 14 observaciones de la segunda clase; esto es, la tercera decila está localizada a 9/14 del camino recorrido en la segunda clase. Como el límite inferior de la segunda clase es 2.0 y el intervalo de clase es 3.0, obtenemos: 9 FSllo = 2.0 (3.0)= 3.9 14

+

N6tese que, para datos agrupados, contamos j.n/k observaciones en lugar de j(n + l ) / k , como hicimos en el caso de datos no agrupados. Se hace esto porque hemos supuesto que las observaciones en cada clase están “uniformemente dispersas” a lo largo del intervalo de clase.

197

ESTIMACION RAPIDA

Las estimaciones rápidas más cómúnmente usadas para p basadas en las cuantilas, son la medida Fin. y la cuartila media, 1 (pill + F ~ , ~la) eficacia de la primera es de 64CJ0, la de la segunda 81c/o, y se deben utilizar como estimaciones de ,u solo para muestras de poblaciones simétricas. Para las 30,observacionesen la lista antes considerada, la mediana es 28 y la cuartila mediaes -21 (15.5 + 34.5) 25.0, mientras que Z es igual a 25.5. Las .siguientes son dos estimaciones bastante M e s de u basadas en las cuantilas de un conjunto de datos:

La primera tiene un 62% de eficacia y no se debe emplearpara poblaciones con mucha asimetría, mientras que la segunda tiene 7356 de eficacia y no es sensible a la asimetria. Para las 30 observaciones de la lista, que tienen la desviación tfpica de muestra1 S = 12.7, obtenemos

-31 (47.4 - 4.9) = 14.2 Y i(47.4 4

+ 43 (34.5) -

(15.5) - 4.0) = 14.2

Si un conjunto de datos sigue aproximadamente una distribución normal, un método muy riipido de estimar U (aún para muestras muy grandes) es calcular un 5% inferior. Este métodotiene una eficacia de 70% para muestras grandes provinientes de poblaciones con distribucibn normal. Aplicándofoa las 30 observaciones anteriores enla página 196, encontramos que las medias, de las 1% observaciones Euperiores.e inferiores, respectivamente, son 1 51 2 (47) 4 (5) = 49.7 Y = 4.3 L 1 11” 2 1+2 1 y, por lo tanto, podemos estimar U en - (40,7 - 4.3) = 11.4.

+

+,

;

J.

4



EJERCICIOS

F1/4, Fl/% F a147 Flilo, Y F m 1 , para las velocidades no agrupadas del ejercicio 10 de la página 107. 2. En la dktribuci6n de remaches que faltan dada en la página 101, hallar ( a ) la mediana, fh) la primera wartila, (c) l a novena decila. y (d) F s i s . 3. Usar 10s dos estimadores de cuantilas para estimar la media de la poblacicin en la que se hicieron las 15 medidas d e resistencia a la cornprcsicin en el ejercicio 9 de la página 107.

1. Hallar

198

METODOS ABREVIADOS EMPLEADOS EN INFEKENCIA

4. Utilizando las 20 lecturas de temperatura dadas en el problema 4 de la página 114, estimar la media de la población a partir de la cuartila media. 5. Empleando la distribución de pesos de recubrirnientos de estaño obtenidos en el ejercicio 3 de la pAgina 106, determinar la mediana y la cuartila media y comparar con la media obtenida en el problema 10 de ia página 114. 6. Usar la distribución de velocidades obtenidaenel problema 10 de la página 115 para calcular la cuartila media y estimar p . Comparar este resultado con Z y con una estimación de p obtenida dibujando la gráfica en papel de probabilidades. 7. Utilizarlosdosestimadores de cuantilas de la página 197 para dar unaestimacibn de U para los ingresos no agrupados del problema 6 de la página 105. Calcular 1a.desviación típica muestral y comprara: las estimaciones. Estimar, tambikn, cr tomando un cuarto de la diferencia entre la media. del 5% superior y el 5% inferior de los datos. 8. Con respectoa las lecturas de temperatura di1 ejercicio 4 de la phgina 114, estimar la desviación típica de la población utilizando (a) la desviación típica muestral, (b) las dos fórmulas dadas en la psgina 197,y (6) una gr&fica deprobabilidad. Comparar los resultados obtenidos. 9. Emplear ladistribucibn de pesos de recubrimiento de estañoobtenida en el problema 3 de la página 106 para calcular los dos estimadores de cuantilas de u dados en la p k i na 197. Tambih, comparar con el valor de la desviación típica de la muestra obtenida en el problema I1 de la página 114. 10. Comparar el valor estimado de u obtenido de la gráfica de probabilidad del ejercicio 6 con los valoresestimados basados en lasdosfórmulasdela página 197. Calcularlas cuantilasnecesariasa partir de los datos agrupados.

11.3

Tests de l o s signos

En estaseccióndescribiremostests no paramétricos basados en clasificar los datos de acuerdo con dos tributos, representados convenientemente por sfgnos más y signos menos. Por ejemplo, si queremos contrastar la hipótesis nula H O : p = M sobre la base de una muestra de azar de tamaño n, podemos cambiar cada observapor un ción que exceda de po por un signo más y, cada observación menor que pFco, signo menos. Si la población de la que obtenemos las muestras es continua y simétrica la probabilidad de que una observación sea cambiada por un signo mAs es igual a 1/2 cuando H , es cierta. En consecuencia, la prueba de la hipótesis nula p = PO es equivalente a una prueba de la hipótesis nula p = 1/2, donde p es el parámetro de una distribución binómica. La alternativa bilatera p # po es equivalente, ahora, a p # 1/2, y las alternativas unilaterales p < po y p > po sonequivalentes a P < 1/2 y p > 1/2, respectivamente, siendo I, la probabilidad de encontrar un signo más, es decir, una observación mayor que po. Para ilustrar el test de los signos de una sola muestra que acabamos de describir, vamos a contrastar la hipótesis de que ]a temperatura media a la que opera un termostato es 2 8 O C., utilizando los resultados siguientes obtenidos de 20 termostatos: 29.9 28.2 32.0 30.5 29.3 30.1 27.7 31.4 28.6 27.9

+ + + + + + - + + -

26.8 30.3 29.0 28.8 28.0 31.4 32.1 27.8 31.7 29.2

- + + +

+ + - + +

TEST DE LOS SIGNOS

199

Notemos que,hay 15 observaciones mayores que 28.0, 4 observaciones menores que 28.0 y una observación igual a 28.0. Aunque la probabilidad de que una observación, en una población continua, sea exactamente igual, a 28.0, es nula, los números anteriores están redondeados y, como no sabemos. si el número 28.0 representa un valor mayor o menor que 28, descartamos esta observación. Así pues, debemos determinar si los 15 signos más y los 4 signos menos, o sea. 15 “casos favorables” er, 19 pruebas, comprueban la hipótesis de que p = 1/2. Aplicando el criterio del test exacto dado en la página 180 con cy = 0.05, encontramos en la tabla de probabilidades bincimicas que k.oB = 4 y k,Lz5 = 15; como hubo 15 signos más y 4 signos menos, se deduce que la hipótesis nula debe ser rechaza. Nótese que, si el tamaiio de la muestra es suficientemente grande, podemos usar la curva normal como aproximación de la distribución binómica y los tests dados en la tabla de la piigina 1 6 4 . Utilizando muestras apareadas, podemos extender inmediatamente el test de los signos a test de diferencias entre dos medias de poblaciórl, En este caso, cl test de los signos se puede emplear como una’ alternativa ‘no paramétrica del test t para muestras apareadas introducida en la página 157. Dadas II observaciones apareacias. con la primera observación proviniente de la población uno y la segunda de la poblacibn dos, usamos un sigrlo 177ds para reemplazar cada par para el cual la observación de la primera población excede a la de la segunda, y un siglro m w o . s para substituir cada par en el que la observacicin de la segunda poblacicin excede al de 1 2 primera. En el caso en que dos observaciones, pareadas sean iguales. se omite esta pareja y la prueba se desarrolla comb en el caso de tina sola muestra antes, descrilu. Parailustrar el test de los signos (ILJmlmtrgs q m w h . ~ vamos , acomparas dos métodos para anodizar aluminio atendiendo a la apariencia de las piezas ano&zadas (brillo, color, etc.). Autque resulta difícil asignar valores numericos a esias cualidades, no es difícil comparar piezas apareadas y decidir cui1 tiene el aspc~io más agradable. Supongamos que 40 unidades apareadas se juzgan. dando un sigw más o un signo menos a cada par, de acuerdo con que el anodizado del prin2cL mgtodo o eldel’ segundo se considere superior. Dado cluc hubo 24 signos mris. 11 signos menos y 5 empates, queremos probar si el primer mCtodo es realil: otras palabras, concluimos que el primer mCtodo de ~nodizacicines mejor. La eficacia del test de los signos es bastalile alta para muestras peq~~eiias. 95‘, para 11 = 6, pero disminuyc a medida que el tamalio de la mucstra aumcnin 1 : a h t a llegar, a una eficacia límite de 6 3 ; . Las hipbtesis necesarias para aplicar cl !cst dc. los signos. l o mismo en el caso dc una soia murstra qtle en e1 de muestras aparc:~tl:r>. son C ~ lasC poblaciones consideradas sean continuas y sinl2tricas. Si ‘la pohlacicitl

200

METODOS ABREVIADOS EMPLEADOS EN INFERENCIA

fuese continua, podría haber una probabilidad positiva de que una observación fWra realmente igual a po en el caso de una’sola muestra, o que las observaciones apareadas fueran exactamente iguales en el caso de muestras apareadas. Entonces, dejará de ser válida la.hip6tesis de ser p = 1/2, a menos que impongamos mayores restricciones. Si la población (o poblaciones) no fueran simétricas, la Probabilidad de que una observación fuera mayor que la media, ó de que la diferencia entre dos observaciones apareadas fuera mayor que cero, no iguala necesariamente un medio, bajo la hipótesis nula p = poen el caso de una sola muestra, o pl = p2 en el caso de muestras apareadas. Sin embargo, es posible modificar el test de los signos para eliminar la hipótesis de simetría. Para concluir esto, sólo tenemos que considerar las hipótesis concernientes a las medianas de la población en lugar de las concernientes a las medias. 11.4

Tests por suma de números de orden

El test de los signos de muestras apareadas es ‘uno de los métodos no paramétricos para contrastar la hip6tesis nula de que dos muestras provienende poblaciones continuas idénticas, frente a la alternativa de que las poblaciones tienen medias diferentes. Una clase altamente eficaz de tests no paramétricos de esta hipótesis, y otras similares, se basa en la suha de los nzímeros de orden: esto es, se dan números de orden a las observaciones de acuerdo- con su magnitud y los tests se realizan sobre la base de ciertas sumas de estos n6mero. de orden. En esta sección, introduciremos tres tests basados en sumas de números de orden. El test U de Mann-Whifney se presenta como un substituto del test t de dos muestras, y tiene una eficacia límite de 95.5% cuando las hipótesis necesarias para el test t correspondiente quedan. satisfechas. Un test similar al test U , que se puede emplear cuando la hipótesis alternativa especifica que las dos poblaciones tienen dispersiones diferentes, se considerará a continuación. Finalmente, introduciremos el test H de Kruskal- W d i s H para contrastar si k muestras provienen de poblaciones idénticas, frente a ’la alternativa de que las poblaciones tengan mediasdiferentes. Como el test U , el test H tiene, también, una eficacia de 95.5% cuando se compara conelprocedimiento “normal” correspondiente, que se analizará en el capítulo 13. Vamos a describir, en primer lugar, el test U de Mann-Whitney por medio del ejemplo siguiente. Supongamosque queremos comparar dos instrumentos de control O “registradores” diferentes utilizados para la determinación del contenido de humedad dentro de un semiconductor, a partir de las siguientes corrientes medidas en microamperes: Registrador A : 1.3 Registrador B: 1.7

0.9 3.5

0.8 7.8

0.2 0.9

0.4 0.7

0.6 2.6

0.1 0.2

5.1 1.5

0.2 15.3

0.7

Primero, ordenamos conjuntamente las 19 observaciones de acuerdo con su tamaño, reteniendo la identidad de la muestra en cada observaci6n. Después, asignamos a estas observaciones los puestos 1, 2, 3, . . . y 19, como se indica en la tabla siguiente:

TESTS POR SUMA

DE NUMEROS DE

Registrador: A Observación: 0.1 1 Rango: Registrador: B Ohservación: 1.5 13 Rango:

3

3

B 0.2 3

B. 1.7 14

I3

B

2.6 15

3.5 16

A

A

0.2

,

0.2

'

201

ORDEN

A 0.4 A 5.1 17

5

A 0.6 6

B, 0.7 7.5

B

B ,. 15.3 19

7.8

18

B A A 0.8 0.9 0.9 9 10.5 10.5

B 0.7 7.5 .

A 1.3 12

.

Nótese Que, si dos t, más observaciones están empatadas 'en el mismo lugar, damos a cada uná'de ellas el medio de los lugares que ocupan en conjunto. ! .Si denotamos los tamaños respectivos de las muestras por n, y n z y la suma de los números de orden ocupados por la primera muestra .por R1,se puede demostrar que la medi8 y la varianza de la distribuci6n muestra1 de1:estadístico

+

+

están dadas por

+

+

(Si hay empates en la ordenación, estasfórmulas son correctas s610 aproximadamente). Si n, y n, son, arqbas, mayores que 8, la distribución del estadístico U se puede aproximar con bastante exactitud por una distribución normal y, por lo tanto. el test se puede basar en el estadístico L * ,

*

u - pu "

+

z=

nu

4

y ,en la tabla 111. Existen? también,,tablas en las que se pueden basar tests exactos cuando n, y nipson pequeños (ver la tabla de D. B. Owen mencionada en la bibliografía). Observemos que notieneconsecuencias sajer qui muestraseconsidera "primera", por lo que podemos trabajar co,n cualquier suma de números de orden. escogiendo la que sea más fácil de obtener. Volviendo ahora a nuestro ejemplo,tenemos 11, = 9, rz2 = 10. R , = 66.5, y. por consiguiente,

9.10 = 45.0 2 .

4sí, G8.5

. 2 e'

.

:

.

- 45.0 = 1.93

4 x 0

282

EN

EMPLEADOS ABREVIADOS METODOS

INFERENCIA

1; como este valor se encuentra entre -1.96 y 1.96, valores críticos de una alternativa :‘:!stera con a = 0.05, llegamos a la conclusión de que la hipótesis nula de pobla..imes idénticas no se puede rechazar. Si se asignan los números de orden de alguna otra forma diferente, se puede cmpicar el mismo estadístico U para contrastarla hipótesis nula de poblbciones idinticas frente a la alternativa de que las poblaciones tienen dispersiones distintas. Los números de orden se asignan “desde ambos extremos hacia el medio”, dando c.! nilmero 1 a la menor observación; los números 2 y 3, a la mayor y segunda mayor observaciones; los números 4 y 5, a la segunda y terceza menores; los 6 y 7, a la tercera y cuarta mayores, y así sucesivamente. Todos los demás aspectos de ,este ‘ e x con dispersiones diferentes son idénticos a los del test U de Mann-Wllitney. El test Kruskal-Wallis para decidir si k muestras independientes provienen de poblaciones idénticas, se desarrolla en una forma similar al test U. Como antes, las observaciones se tratan en conjunto para darles el lugar de orden, y si Ri es la suma de los números de orden ocupados por las ni observaciones de la i-ésima muestra, c l test se hasa en el estadístico 1

.

I€ =

+

k R: z - - 3(n + 1) n(n + 1) i = l ni + n k . Cuando ni > 5 paratodaslas

l2

donde n = n, + n2 ... i y la hipótesis nula es válida, la distribución del estadístico W se puede aproximar bastante por la distribución X-cuadrado,con k - 1 gradosdelibertad. En la tablade D. B. Owen. mencionada en la bibliografía, se encuentran tablas especiales para aplicar con valores pequeños seleccionados de las ni y k. Para ilustrar la prueba de Kruskal-Wallis 22, supondremos que el experimento descrito en la pagina 200, se amplía para incluir cuatro registradores diferentes, con los resultados mostradds en la tabla siguiente. (Nótese que a las observaciones empatadas se les asignan nuevamente, el medio de los puestos queocupan en conjonto.) Registrador Registrador Hegislrador Registrador

A:

0.2

0.3

0.4

0.5

B:

0.8 0.7 0.1

1.1 0.9

1.3

1.9

8.2 0.3

12.0

C:

D:

o. 1

.

0.5



I .7 2.5 12.1 2.9

1.9

2.0

7.8 15.3

13.8

Las observaciones son, otra vez, corrientes de retorno en microamperes. Como pusdc verificar ficilmente, las observaciones de ‘la primera muestra ocupan los ;Tuestos 3 , 4.5,6, 7.5, 14, 15.5 y 17, por lo que R , = 67.5. Similarmente, las obser\:aciones de la segunda muestra ocupan los puestos 10, 12, 13, 15.5, 18 y 20, por l o que K , == 88.5: las observaciones de la tercera muestra ocupan los puestos 9, 11, 21, *?2. 23 y 25. por lo que R , = 111.0; y las observaciones de la cuarta muestra ocupan los puestos 1.5, 1.5, 4.5, 7.5, 19 y 24, por lo que R , = 58.0. Substituyendo en ia 5rmula de H , encontramos be

203

TESTS FOR SUMA DE NUMEROS DE ORDEN

x%& con 3 grados de libertad, vemos que no se puede rechazar la hipótesis nula. En otras palabras, ho podernos rechazar la hipótesis nula de que las muestras provienen de~poblacionesidénticas frentc a 13 alternativa de que las medias de las poblaciones no son iguales; y si comparamos este valor con 7.815, valor de

EJERCICIOS 1. con respecto a las 100 medidas de los pesos de planchas de estaño de galvanizado elecLicllitico del problema 3 de la página 106, utilizar el test de los signos con a = 0.05 par:{, contrastar la hipbtesis nula fl = 0.33 frente a la alternativa, 1.1 < 0.33,donde p es l a mrdio de la pobiación de pesos de la que se obtuvo la muestra. 2. Empleando el test de los signos de una sola muestra, contrastar la hipótesis nula de qa:. el8octanage mqdio de la gasolina de la que se tomaron. las 16 muestras siguientes cs ! M I . frente a la hipótesis alternativa de que es mayor, de cien.

. ' 101.6 103.3

98.2 100.0

104.5

102.5

99.0 97.1

102.8

105.4

103.6

101.0

107.7 98.7

99.4

101.0

Emplear un nivel de significación de 0.05. 3. Utilizarel test de los signos y un nivel de significacibn de 0.10 para decidir si hay u l ~ diferencia sistemática entre las lecturas obtenidas de los dos instrumentos dci cjcrcicio j J de la página 161. 4. Se sierran vigas de acero pordosmétodos, consistente el primcro cn ascrrarix cunnci! abn están calientes, Y el segundo cuando se han enfriado. Las longitudes finalcs restlltanlc:, (en pies) una vez que todas las vigas se han enfriado hasta la temperatura ambicnte, soil las siguientes: 31.6 30.5 28.9 frio: 30.1

Vigas serradm en calienre:

Vigas serradas e n

30.6

31,3

31.1 30.5 31.8 29.9 31.0 30.2 30.5

29.7 32.6 28.8 31.6 30.3 30.7 29.9 29.8 31.1 29.729.8 30.1 30.0

27.9 29.0

30.2 28.5

3:.5

30.0

30.8

30.5 29.6 30.3

Apareandoalazarlas 18' observacibnes de las dos muestras. usar cl tcst dc l o \ ,,::::I. de dos muestras, con un nivel de significacidn de 0.05. para detcrrninar si hay algunl rencia significante en las longitudes finales medias. 5. En pruebas repetidas, un motor experimental opercj. respcctivamcntc, duranw 20. 19, 23. 17, 18, 20, 23, 19! 20, 15, 24,21, 18, 20. 24, 23, 20, 17, 25 y 28 minutos.con u n p ! b n de cierta clase de comhustiblc. Empleando el fest de los signos y un njvel dc significncich de 0.01 contrastar la hip6tesis nula p = 20 frente a la alternativa N # 20. 6. Para comparar una bebida con la de una marca'de la competencia: 50 pcrsnnas probarm una bebida y luew la otra y despues. se les pidih que indicaran .su preferida. (El ordcn * ,de lasmarcas se escogib al a@r paracada persona.) Si 27 prefirieron lamarca dada, 18 prefirieron la de la competencia, y 5 no encontraron difercncia cn el sabor. contrastar. con un nivel de significacidn de 0.01, si lamarca dada es superior cn sabor a la de la competencia. 7. Un experimento para comparar la rcsistcncia a la tcnsiirn dc dos clascs de hilos dio los resultados siguientes (en libras) : L , k . -

t

204

METODOS ABREVIADOS EMPLEADOS ENINFERENCIA

Hilo A:

143.6 143.0

144.8 147.4

145.2 144.0

144.8 145.6

145.6 145.5

146.0 144.8

Hilo B:

146.6 153.0

147.8 142.4

144.4 146.8

140.8 143.2

143.0 140.9

148.8 150.6

Usar el test U y un nivel de significación de 0.05 para contrastar la hipótesis nula de que las dos muestras provienen de poblaciones idénticas, frente a la alternativa de que las dos poblaciones tienen medias diferentes. 8. Repetir el ejercicio 4, usando el test U de Mann-Whitney. También contrastar si las dispersiones de las dos poblaciones son iguales, utilizando el test de suma de nfimeros de orden mencionada en la página 21l . 9. En el ejercicio 7 utilizar a = 0.05 para contrastar la hipótesis nula de que las muestras provienen de poblaciones idénticas,‘frente a la alternativh de que las dos poblaciones tienen dispersiones diferentes. 10. Los testsdenominadosde Franklinse establecierdn para determinar las propiedades de aislamiento de aceros al silicio de granos orientados que fueron recocidos en cinco atmbsferas diferentes,con los resultados siguientes :

Resultados del ensayo (amperios)

Atmosfera

0.37

0.26

0.58

1 2 3 4 5

0.29 0.81

0.61 0.37 0.19 0.69 0.34

0.69 0.58 0.34 0.75 0.29

0.79 0.40 0.17 0.72 0.47

0.61 0.59 0.28 O.’$ 0.29 0.16 0.68 0.77 0.57 0.85 0.42 0.30

0.35

Emplear el test H deKruskal-Wallis H y un nivel de significación de 0.05 para decidir si se puede aceptar que estas cinco muestras proceden de poblaciones idhticas. 11. Para investigar tres medidas preventivas contra lacorrosión, se probaron muestras al azar de 10 piezas de alambre para cadauna de lastresmedidaspreventivas, dando los siguientes resultados para las profundidades máximas de las partes erosionadas (en milésimas de pulgada) : A: 45

B : 62 C:

57

53 58 45

60 47 60

48 59 54

57 63 57

62 48 55

49 58 48

55 52 59

53 50 62

52 49 60

Contrastar, con un nivel de significacion de 0.05, si hay,alguna diferencia en la eficacia de las tres medidas preventivas contra la corrosión.

11.5

Tests de las series de términos iguales

Al discutir las muestras aleatorias en el capítulo 7, presentamos varios métodos que daban por anticipado cierta seguridad de que una muestra fuera de azar. Sin embargo, es útil tener una técnica para contrastar si una muestra se puede considerar como aleatoria despuh de haber sido obtenida. Una de estas técnicas está basada en el orden en queseobtuvieron los valores de las muestras; mis concisamente, se basa en el número de series de términos iguales mostradas en los resultados de las muestras.

TESTS D E

LAS SERIES

205

DE TERMINOS IGUALES

Dada una sucesión de dos simbolos, tales comoH y T (que pueden representar. por ejemplo, las caras y las cruces en $iradas sucesivas), una "serie de iguales" es una sucesión de símbolosidénticoscomprendidos entre dos símbolosdiferentes o sin estos Últimoq. Es decir, l a serie

T T H H T T H H H T H B H T ' T T T H f i H

" " " I

..

contiene 8 series de iguales, como indican los subrayados. El número total de series de iguales en una sucesión de n ensayos da una indicación de si la sucesión se puede qqiderar como de azar. Entonces, si sólo ha habido dos,series.de iguales, consistent& en diez caras, seguidas por diez cruces, se puede suponer que la probabilidad de un.caso favorable no ha pelmanecido constante de una prueba a la siguiente. Por otra parte, si la sucesiónconsta de veinte tiradas formadas alternativamente por caras y cruces, se puede suponer que los ensayos no han sido independientes. En cualquier caso, hay razones para suponer que no.se trata de un azar. Notemos que nuestra suposici6n.no procede del número de caras y cruces, si.no del orden en que aparecen. Si una sucesibn contiene n, símbolos de una clase y n, de otra (y ni n 1 ni 1 1 ~ son muy pequeiíos), lq distribución muestra1 delnúmero total de series de iguales se p u d e representar muy aproximadamentepor,una distribución normalde media

+

I/

pu

y desviación típica

=

2np2 fl n1 + ni

+

donde u denota el número total de series de iguales. Entonces, el test de la hip6tesis nula de que la ordenación de los símbolos (y, por consiguiente, de la muestra) sea aleatoria, se puede basar en el estadistico.

+

o

y en la tabla 111. Este test da una excelente aproximacibn cuando ni ! I , ni tr, son menores de 10. Se pueden encontrar tablas especiales para hacer tests. exactos cuando nl o n, son' pequeñas, en Iás tablas de D. B. Owen, citadas enla bibliografía. Para ilustrar este test, examinaremos la siguiente sucesiónde 32 vuelos de yrueba de un cohete, donde S y F marcan, sucesivamente, los éxitos y los fallos:

F F F S S F F S S_"""S F S P S S S S F S S S F ~ S -, S ~ ~ ~ F , S ~ S ~ ~ Como hay 22 éxitos, 10 fallos y 14 series de iguales, substituimos tr, = 22. I T , =- 10. u = 14, y obtenemos " "

.vu

=

G+

2,22.10(2-22.10- 22 - 10) = 10)2(22 -6 10 - 1)

206

METOOOS ABREVIADOS EN EMPLEADOS

INFERENCIA

?‘ Como este valor queda entre -1.96 y 1.96, no podemos rechazar (con un nivel dc significacicin de 0.05) la hipótesis nula de que la ordenación sea aleaioria. Evi-

dcntcmente, no hay razones suficientes para concluir que hay una fiabilidad real. Se puede emplear también el test de series de iguales para contrastar la casualidad que hay en las muestras formadas por datos numéricos, contando las series de iguales a partir de la mediana por encima y por debajo de ésta. Si denotamos ana a y una observación observación mayor que la mediana de la muestra por la letra menor que la mediana por la letra b, podemos utilizar la sucesión resultante de Q y h para constrastar la casualidad, siguiendo el mCtodo indicado antes. Una aplicaci6n frecuente de este método es en el control. de calidad, donde las medias de muestras pequeñas sucesivas se representan en una gráfica en orden cronológico. El test de serles de iguales se puede usar entonces para comprobar si hay alguna tendencia en los datos, que nos indique que es necesario ajustar una máquina o hacer algiln otro proceso antes de que ocurra algiln daño grave. Para ilustrar un test de series de iguales por encima y por debajo de la mediana. supongamos que un ingeniero se interesa en la posibilidad de que se hayan hecho demasiados cambios enel ajuste de un torno automático. Para contrastar esta hipiitesis. se obtuvieron los siguientes diámetros medios (en pulgadas) de 40 ejes torneados sucesivamente en el torno: n.XI 0.252 ‘).24S

0,237

0.258 0.250 0.252 0.250

0.249 0.253 0.254 0.253

0.251 0.247 0.250 0.247

0.247 0.251 0.247 0.249

0.256 0.243 0.253 0.253

0.250 0.258 0.251 0.216

0.247 0.251 0.246 0.251

0.255 0.245 0.249 0.249



0.243 0.250 0.252 0.253

L. T : ;;iana de estas medidas es 0.250 y. cambiando cada una de ellas por una letra si escede de 0.250. por una 1) sies menor que 0.250, y omitiendo las cinco que !3G~!’ I c ! ~ . i l : ~ ;! 0.250, obtenemos la sucesicin ri

a,abaha~~abaababaabbaabaabbahabbabababa q+.!

?

117 series de iguales. Entonces, n t

=

*~CI:C

= 2p 19-’ l6

U”

=

z=

=

27, tendremos:

+ 1 = 18.37

clu

30

19, n2 = 16, u

2*19*16(2*19.16 - 19 - 16) (19 16)’(19 16 - 1)

+

+

27 - 18.37 2.89

=

=

2.89

2.98

Como este valor excede a 1.96, podemos rechazar la hipótesis nula de que la sucesicin de medidas sea aleatoria. Como el número de series de iguales es mayor que el que se podría esperar, debido al azar, es razonable suponer que el torno se ha ajus-

207

TESTS DE KOLMOGOROV-SMIRNOV

tad0 demasiado; es probable que se haya hecho un ajuste después de tornear cada pieza, tratando, con ello, de compensar cualquier discrepancia que se haya observado con respecto a1 diámetro nominal de 0.250 pulgadas.

11.6

Tests de Kolmogorov-Smirnov

Los tests de Kolmogorov-Smirnov son test no paramétricos para diferencias entre dos distribuciones totalcs o acumulativas. El test uni-muestrul se refiere a la concordancia entre una distribución acumulativa observada de valores de una muestra y una función de distribución continua especificada; es decir, se trata de una prueba de bondad de ajuste. El test bi-muestrul se refiere a la concordancia entre dos distribuciones acumulativas observadas:se contrasta lahipótesis de si dos muestras independientes provienen de distribuciones continuas idénticas, y essensible a las jiferencias de población en lo que se refiere a la localización, dispersión,o disimetría. El test uni-muestra1 de Kolmogorov-Smirnov es, en general, más eficaz que el :est X-cuadrado para la bondad de ajuste de muestras pequeñas y puede usarse con nuestras muy pequeñas en las que el test X-cuadrado no es aplicable. Debemos re:ordar, sin embargo, que el test X-cuadrado de la sección 10.5 se puede usar con listribucionesdiscretas, mientras que eltest de Kolmogorov-Smirnov no puede Isarse. El test uni-muestra1 se basa en la diferencia absoluta máxima D entre los valoes de la distribución acumulativa de una muestra aleatoria de tamaño II y una disribucidn teórica especificada. Como ilustración de este test, se quiere comprobar si 3s agujeros para clavijas en una placa de hojalata electrolítica están distribuidos niformemente para lo cual se han tomado medidas de las siguientes distancias (en lulgadas) de 10 agujeros a partir de un extremo de una tira grande de placa de hojaita de 30 pulgadas de ancho: 14.8 28.2 23.1 4.4 28.7

19.5 2.4 25.0 6.2. ,ajo la hipbtesis nula de que los agujeros estan uniformemente repartidos, la distrilución acumulativa teórica con la que queremos comparar la distribuci6n acumulava observada esth dada por 4.8

i:

F ( x ) = x/30

para 2 ,< O para O < x < 30 para x 2 30

a gráfica de esta distribución acumulativa te6rica se muestra, junto con la de la istribución acumulativa observada, en la figura 11.1. Como se indica en esta figura, diferencia máxima entre las dos distribuciones acumulativas es 0.193. Para determinar si esta diferencia es mayorque lo que -se puede esperar razonaAemente, encontramos elvalorcrítico de D enla tabla IX. Para tz = 10 OL = 05, el valor crítico es D.o6= 0.410, y de aquí que la hipótesis nula (que los aguros estan uniformemente distribuidos) no se puede rechazar.

208

METODOS ABREVIADOS EMPLEADOS EN INFERENCIA

F

X)

1.c

O.€ 0.E

0.4 0.2

C Fig. 11.1 Prueba Kolmogorov-Smirnov

El testbimuestral de Kolmogorov-Smirnovse basa enladiferencia absoluta maxima entre los valores de las dos distribuciones acumulativas observadas. En' principio, es muy similar al test uni-muestra], y los valores cnticos necesarios se pueden obtener de tablas especiales (por ejemplo, las de D. B. Owen, citada en la bibliografía). EJERCICIOS 1. Para comprobar si cierta señal de radio contiene un mensaje, se puede subdividir un intervalo de tiempo en cierto número de intervalos muy cortos y determinar después si la fuerza de la señal excede cierto nivel (ruido de fondo) en cada corto intervalo. Supongamos q,ue la siguiente es parte de una observación de este tipo, donde H indica una señal-fuerte y L que la señal no excede cierto nive1,de ruido.

L L H L H L N L H H € i L H H H L H H H L H L ' H L L L ' L L H L H L I I L N H H L H H € I L H H € I L H L H L H L L ~ Verificar si esta sucesión se debeal azar(usando un nivel de significacibn de 0.05) y comprobar si es razonable suponer que la señal contiene un mensaje. 2. La siguiente es una lista que nos da, leyendo las filas sucesivas de izquierda a derecha, el orden en que una máquina produjo piezas defectuosas ( D ) y no defectuosas (N) durante cierto periodo:

N N N N N N N N N D D D N N N N N D N N N N N N N N D N N N N N N N N N N N N N ' D N N D N N N N N N N N D N N N N N N N N D D D N N

N D D D N

t N D N N

N N D N N

N D N N N

N D N D N

N N , N N D N N N N N

TESTS

209

DE KOLMOGOROV-SMIRNOV

Comprobar, con un nivel de significacibn de 0.05, si este arreglo es debido al azar.

En la página 92 se describió un método para generar digitos al seudoazar, en el cual

un mímero de 4 dígitos se elevaba al cuadrado, los 4 números de la parte media del número resultante se elevaban al cuadrado, y así sucesivamente. Comenzando con el número 3571: usar una tabla de cuadrados o una calculadora para continuar este proceso hasta obtener una sucesión de 48 dígitos. Contrastar si la sucesidn resultante, para ver si es de azar, utilizandoseries de términos iguales por encima y por debajo de lamediana y un nivel de significación de 0.05. 4. En una fábrica, el tiempo que no trabaja una máquina durante laS horasde trabajo, debido a dificultades tales como roturas o fallos, se llama “tiempo muerto”. La tabla que sigue corresponde a 50 tiempos muertos (en minutos) consecutivos observados por un ingeniero de control durante cierto periodo (léanse las filas sucesivas de izquierda a derecha): 3.

18 22 30 40 38

25 29 21 36 35

28 30 26 36 50

21 24 33 34 46

29 35 36 35 34

30 37 35 39 37

34 20 31 42 39

30 27 20 30 42

25 30 28 35 48

21 25 39

41 51

Usar el test de las series de iguales por encima y por debajo de la mediana, a un nivel de significación de 0.05, para contrastar la hipjtesis de que los datos marcan una tendencia. 5. Las temperaturas horarias de un horno (en grados centígrados) tomadas durante un periodo de 24 horas son las siguientes:

269, 265, 271, 268,270, 266, 273, 271, 275,269, 271, 273 275, 268, 276, 270, 273, 266, 270, 268, 272, 271, 278, 267 Contrastar si esta disposición es al aza.r, con un nivel de significacibn de 0.01, para investigar si el horno está trabajando ciclicamente en intervalos de dos horas. 6. El problema 13 de la página 107 contiene el número de imperfecciones en muestras tomadas de 50 piezas de tela. Suponiendo que el orden de las muestras es el mismo que el orden en que se han producido las piezas de tela, contrastar la hipótesis de que la presencia de muestras sin imperfecciones se ,debe al azar, frente a~la alternativa de que existe un agrupamiento. (Setoma a = 0.05). 7. Utilizar e1,test de Kolmogorov-Smirnov,. Con a = 0.01, para decidir si las resistencias a la compresión del ejercicio 9 de 13 página 107 se pueden syponer provinientes de una distribuciónnormal’con. media de 50,000 libras por pulgada cuadrada y desviación típicade 10.000 libras ‘por pulgada cuadrada. [Sugerencia: utilizar papel gráfico,de‘ probabilidades.] 8. En un esiudiv de vibraciones, se sometieron las componentes de un ,avión a fuertes vibraciones, hasta que se originaron fallos estructuraks.. Los siguientes s o n los tiempos obtenidos (en minutos) 4.1, 0.8;.5.3, 5 0 , 8.3, 1.7, 2.5, 6.2, 7.3, 9.0, 1.2, 3.7, 9.5, 10.5. Contrastar si se pueden considerar estos datos como una muestra proviniente de una población q p o nencial con una media de 5 minutos. (Se toma (Y = 0.05.)

12

AJUSTE DE CURVAS

12.1

Metodosde mínimos cuadrados

Uno de los objetivos más importantes de muchas investigaciones de ingeniería es hacer predicciones, de preferencia empleando ecuaciones matemáticas. Por' ejemplo, un ingeniero puede desear predecir la cantidad de óxido que se.formaria en la superficie de un metal calentqdo qn un horno durante un intervalo especificado de tiempo a 200° C., o la medida de deformaci6n de un anillo sometido a una fuerza de compresión de lo00 libras, o el tiempo de desgaste entre recublimientos de una cubierta de una rueda de auto que tiene una composicidn y un espesor de cuerda dados. Generalmente, tales predicciones requieren que se obtenga una fhrmula que relacione la variable dependiente(cuyo valor se desea predecir) conuna o m i s variables independientes. En esta sección consideraremos el caso especial en el que una variable dependiente se ha de predecir en funcicin de una sola variable independiente. En muchos problemas de esta clase, las observaciones de la variable independiente se hacen sin error, o con un error que es insignificante al compararlo con el error [variación aleatoria) de la variable dependiente. Por ejemplo, al medir la can21o

METODO

211

DE MlNlMOS CUADRADOS

tidad de 6xido en la superficie de un metal, la temperatura de calentamiento se puede controlar, en general, con buena precisión, pero la medida del espesor de óxido se encontrará sujeta a considerables variaciones aleatorias. Así, aunque la variable independiente se puede fijar en un valor x, las medidas repetidas de la variable dependiente nos darán valores y que difieren considerablemente. Las diferencias entre los valores de y se pueden atribuir a diversas causas, principalmentea errores de medida y a la existencia de otras variables, incontrolables, que pueden influir en el valor de y cuando x permanece fija. Luego, las medidas del espesor de óxido variaran para diferentes piezas calentadas durante el mismo tiempo a la misma temperatura, debido tanto a la dificultad en medir los espesores, como a las posibles diferencias en la composición de la atmósfera del horno, a las condiciones de la superficie de la pieza, etc. De esta discusión, debe quedar claro que y es el valor de una variable aleatoria cuya distribución depende de x. En la mayoría de las situaciones de este tipo, nos interesa principalmente la relación entre x y la media de la distribución correspondiente de y, y nos referimos a esta relación llamándola curva de regresiún de y respecto de x, o brevemente de y sobre x. (Por el momento, supondremos que x es fija, esto es, no depende del azar; en la sección 12.5 consideraremos el caso en que x e y son, ambas, variables aleatorias.) Trataremos primero el caso en que la curva de regresión de y sobre x es lined, esto es, cuando, para cualquier x dada, la media de la distribución de las y está dada por CY + fix. En general, una y observada diferirá de esta media y denotaremos esta diferencia por E, escribiendo y=a+pz+e

Nótese que E es un valor tomado por una variable aleatoria y que siempre podremos escoger CY de tal manera que la media de su distribución sea igual a O. El valor de E para cualquier observación dada dependerá de un posible error de medida y de los valores de otras variables diferentes de x que tengan influencia en y. Para dar un ejemplo en que la curva de regresión de y sobre x se puede suponer lineal de una forma razonable, consideremos que se va a calibrar un par termoeléctrico, midiendo la fuerza electromotriz en milivoltios a varias temperaturas conocidas. En la tabla siguiente (que da los resultados de 10 medidas) xi es la i-ésima temperatura en grados centígrados y yi esIa medida correspondiente del termopar en milivoltios: '

4

1

. 2

3

4

0

20

40

60

0.01

0.12

0.24

0.51 0.38

,

5

6

80

120 100 0.67

7

8 140

'

9

1o.

160

180

'

0.84 11 .1 . 3. 10 51

En la figura 12.1, en que se han marcado estos datos, es evidente ,que resulta razonable suponer que la relación (la curva de regresión) es lineal. (Si el recorrido de x se extendiera, se haría evidente que la curva de calibración del termopar no sería

212

AJUSTE DE CURVAS

lineal, pero una línea recta nos da una excelente aproximación en el recorrido limitado usado en nuestro ejemplo.) Nos encontramos ahora ante el problema de usar los datos marcados en la figura 12.1 para calcular los parámetros cy y /3 de la línea de regresión de y sobre x supuesta. Nótese que estos parámetros determinan completamente la línea de regresión, y que el cálculo de cy y p es equivalente a encontrar la ecuación de la recta que

X Temperatura

PC)

Fig. 12.1 Regresiónlineal

“ajusta mejor” los puntos de los datos. En este ejemplo, se puede hacer esto “a ojo” y, si experimentadores diferentes hicieran este tipo de líneas, probablemente predijeran que a l O o C. la fuerza electromotriz sería de alrededor de 0.75 milivoltios. Sin embargo, si tenemos que tratar con datos tales como los marcados en la figura 12.2, el problema de encontrar la Iínea de mejor ajuste no es tan sencillo. Para tratar problemas deesta clase, desarrollaremosunmétodo no subjetivo paraajustarlíneas rectas que tiene, además, algunas propiedades estadísticas deseables. Para establecer formalmente el problema, consideremos que se tienen IZ observaciones apareadas (xi,yi) para las que es razonable suponer que la regresión de Y sobre x es lineal, y queremos determinar la recta (esto es, la ecuación de la recta) que nos da en alguna forma el “mejor” ajuste. Hay diversas maneras de interpretar la palabra “mejor”, y el significado que le daremos aquí se puede explicar como sigue. Si se supone que y está dada por la ecuación y’ = a

+ DX

donde a y b son constantes, entonces ei, el error al suponer el valor de y correspondiente a la xi dada, es y ..

- y! (

= c%.

213

METdDO DE MlNlMOS CUADRADOS

Nótese que la ecuación y' = a + bx nos da una estimacicin de la ecuación de la línea de regresión cuya ecuación real, pero desconocida, es y = a + DX. El error yi' = ei. Tratarereal al predecir y; es E;, y este error se estima por la cantidad yi mos de determinar a y b de tal forma que los errores estimados sean tan pequefiios como sea posible, en algún sentido.

-

Y

35 -

-- 30 25-

m o U

.

a

20-

.-

.S

.,

Y)

$

15-

al

,

, '

n

>

5-

'0

20

40 80 60

100 120 140 '160 tiempo (minutos)

180

x

Fig. 12.2 Criterio de mínimos cuadrados

Corno no podemos hacer mínimo cada e; individualmente, se sugiere, de manen .a inmediata, que tratemos de hacer su suma I; eí tan cercana a cero como sea poi-l

;ibIe. Sin embargo, como esta suma se puede hacer igual a cero de muchas maneras y por lo tanto para muchas líneas rectas,pues basta que los errbres positivos y nega:ivos se compensen anulándose su suma, haremos mínima la suma de los cuadrados le los eá (véase también la aefinición de desviación típica). En otras palabras, escogeremos a y b de tal forma que

2

i-1

[y;

-

(a

+ bzi)12

ea mínima. Notemos, en la figura 12.2, que esto es equivalente a hacer minima la uma de 10s cuadrados de las distancias verticales de los puntos a la línea. El triteio, llamado criterio de mínimos cuadrados, nos da valores de a y b (estimaciones de I y p) que tienen muchas propiedades deseables, algunas de las cuales se mencionaán al final de esta sección. Una condici6n necesaria para un mínimo relativo es la anulación de Ias derivaas parciales con respecto a a y b. Entonces, tenemos

214

AJUSTE DE CURVAS

2

L: [y; - (a + bs,)l(-za)

= 0

i=l

y volviendo a escribir estas ecuaciones en una forma más conveniente. obtenemos las ecuaciones siguientes, llamadas ecuaciones normales:

Las ecuaciones normales son un conjunto de dos ecuaciones lineales en las incognitas a y b; su resolucirin simultánea nos da los valores de a y h de la recta que proporciona el mejor ajuste a los datos dados, de acuerdo con el criterio de mínimos cuadrados. Notemos que se pueden recordar fácilmente de la manera siguiente: primero escribimos la ecuación y L = a /)xi y luego la ecuación xiyi = axi bs;, obtenida multiplicando ambos miembros de la primera ecuación por xi. Si ahora sumamos los dos miembros correspondientes de cada una de estas ecuaciones, obtenemos las dos ecuaciones normales (después de algunas simplificaciones algebraicas sencillas). Para ilustrar el métodode mínimos cuadrados, tal como se usa paraajustar lo aplicaremos a los datos de la una recta a un conjunto dado de datos apareados, figura 12.2. pertenecientes a los tiempos de calentamiento y los espesores del rixido de cierta pieza:

+

+

x 1 y

1

20

30

40

60

70

90

100

120

150

180

~______

15.6 3.5 7.1 7.4

14.9

11.1

23.5 22.1 27.1

32.9

siendo las x los tiempos de calentamiento en minutos y las y los espesores de dxido en Angstrom. Como IZ == 10, n

I1

2 i=l

=

860,

=

lG.2,

2 x:

= ‘38,800

i=l n

n

2 y, i=l

Z; X ; Y ~= 18,460.0 2-1

las ecuaciones normales son

+

18,4i!).0 = 8 0 0 ~ !38,800b

Resolviendo estas dos ecuaciones, obtenemos (I 7: 1.90, h 0: 17, y la ecuacidn de la recta que proporciona el mejor ajuste en el sentido de mínimos cuadrados es ~

y’ = 1.90

+ 0.17.L

215

WFERENCIAS BASADAS EN LOS ESTIMADORES DE MlNlMOS CUADRADOS

Esta ecuación se puede usar, por ejemplo, para predecir que el espesor del óxido dehierro deuna pieza calentadadurante 80 minutos será y' = 1.90 + (0.17) (80) = 15.5 Angstrom. Es imposible hacer cualquier afirmación' exacta sobre la "bondad" de esta predicción, a menos que hagamos algunas suposiciones acerca de la distribución de las lecturas de espesor de 'óxido y acefca de la 'verdadera naturaleza de la regresibn, es decir, que para una x dada, la media verdadero de las y es de la forma a Pz. Considerando los valores de a y b obtenidos de las ecuaciones normales como estimaciones de los coeficientes de regresión a y p, el lector deberá demostrar, en los problemas 13 y 14 de la página 213, que estas estimaciones son lineales en las observaciones yi y que tienen estimaciones insessgadas de a y p. Con estas propiedades. nos podemos referir al notable teorema de Gauss-Markov que establece que, entre todos los estimadores insesgados de a y p que son lineales en las yi, los estimadores de mínimos cuadrados tiene la menor varianza. En otras palabras, los estimadores de mínimos cuadrados son los que nos dan mayor confianza en el sentido de que esttin encontraruna demostración sujetos a lasmenores variaciones aleato$as.p,uede del teorema de Gauss-Markov en el libra de.F, A. Graybill citado en la bibliografía.

+

12.2

lnferenciasbasadas en los estimadoresdemínimoscuadrados

El método de la sección precedente se emplea cuando la relación entre x y la media y es lineal, o suficientemente aproximada a una línea recta, de tal forma que la recta de mínimos cuadrados de predicciones razonablemente acertadas. En lo que sigue, supondrembs que la regresión es lineal y que las n variables aleatorias que son los valores yi ( i = I , . . .,n) están distribuidas independientemente con una distribución normal de media a + Pxi y varianza comrín d. Si escribimos ..

dependientes distribuidas normalmente, que tienen (medias igual a .cero y varianza común uz. Las hipótesis que hemos hecho están ilustradas en lit figura 12.3, en la que se ven las distribuciones, de valores de yi para varios valores de x;. Notemos que estas ,hipótesis adicionales se necesitan para analizar 'la bondad de las predicciones a n base' en las ecuaciones de mínimos cuadrados, las prop.iedades de a y b como estimaciones de a p, etc., y no fueron necesarias para obtener las estimaciones originales basadas en el método de mínimos cuadrados. Antes de establecer un teorema referente a la distribución de los estimadores de mínimos. cuadrados de a y p, es conveniente introducir una notación especial. Lis'expresiones siguientes, correspondientes a los valores de las muestras (XI, yi); se encbentran'tan frecuentemente que es conveniente éscribirlas en la forma "

216

AJUSTE DE CURVAS

+

+

Empleando esta notación, el lector deberá mostrar, en el ejercicio 15 de la pbgina 223, que a = - b.z Y b = SZ,/S,,

Fig. 12.3 Suposiciones del teorema 12.1

donde a y b son la solución de las dos ecuaciones normalesde la página 214, y z e ij son, respectivamente, las medias de las xi y las yG Nótese, también, la cercana relación entre S,, y S,,, respectivamente, y las varianzas de las muestras de las Xi y las yi; pues, S: = S, /n(n 1) y sf = S,, / n ( n I), y en algunis ocasiones usaremos esta otra notación. La varianza u2, definida en la pagina 215, seestima usualmente en función de las desviaciones verticales de los puntos de las muestras de la linea,de rninimos cuadrados. La i-ésimadesviación de este tipo es yt y'i = yi (a -f- hxi) y la estimación de u* es

-

-

-

-

donde se'es tradicionalmente designado como error típiccg de estimacicin. Una fórmula equivalente para esta estimación de 8 , que es más conveniente en las aplicqciones, es

+

+

218

AJUSTE DE C U R V A S

(248,400)(8,343.76) - (42,618.0)' = 12.90 (10)(8)(2&8,400) Como es igual a 2.306 para 10-2 = 8 grados de libertad, obtenemos los siguientes intervalos de confianza a un nivel de 0.95 para (Y y p :

2

=

-3.32

6

Y

< a < 7.12

0.17 f (2.306)(3.59)

dzi

0.12 < p < 0.22 Los resultados del teorema 12.1 se pueden utilizar también para establecer criterios de test de hipótesis referentes a a y p. En este sentido, el parámetro /3 es de especial importancia, ya que representa la pendiente de la línea de regresión, esto es, nos dael cambio en lamedia de y correspóndiente al incrementoen una unidadde x. Si p = O, la línea de regresión es horizontal y la media de y no depende linealmente de x. Para contrastar la hipótesis nula H,,: p = Po, podemos usar el segundo eStadístic0 t del teorema 12.1, o sea, 6

y las regiones críticas resultantes son las siguientes: REGIONES CRITICAS PARA PROBAR H,:

fl

=

Bo

donde t a se obtiene en la tabla IV, con n - 2 grados de libertad. Para ilustrar esta clase de tests, vamos a probar la-importancia de la regresión lineal (dependencia lineal) del espesor de óxido en el tiempo de calentamiento, basando nuestros cálculos en los datos dados en la página 204. La hipótesis nula a contrastares H,: /3 = O y la alternativaadecuadaes H,: /3 # O. Utilizando los cálculos de la página 234, obtenemos t =

3.59

INFERENCIAS. BASADAS EN

LOS ESTIMADORES DE MlNlMOS CUADRADOS

219

y, como esto excede a 2.306; valor de t.025 para 8 grados de libertad, podemos rechazar la hipótesis nula a un nivel de significación de 0.05. En otras palabras Ilegamos a la conclusión de que existe una relación entre el tiempo de calentamiento y el espesor promedio de óxido. Otro problema, estrechamente relacionado al de estimar los coeficientes de regresión a y p , es el de estimar CY + px, o sea, la media de la distribución de las y para un valor dado de x. Si x permanece fijo en xo, la cantidad que queremos estimar es a + J3 x. y es razonable utilizar a + bxo, donde a y b son, nuevamente, los valores obtenidos por el método de los minimos cuadrados. Efectivamente, podemos demostrar que este estimador es insesgado, tiene la varianza

+ donde se obtiene de la tabla IV, con n - 2 grados de libertad. De importancia, aún mayor que la estimación de LY + fix(,, es,engeneral, la prediccio'n de y', un valor futuro de y cuando x = xo. Por ejemplo, aunque en el experimento sobre los espesores de óxido no se consideraba un tiempo de calentamiento de 80 minutos, es importante predecir cuál será el espesor de óxido en este tiempo. En la página 215, obtuvimos una.estimación de 15.5 para este espesor, substituyendo x = 80 en la ecuación de la recta de mínimos cuadrados. Construiremos, ahora, un intervalo en el que se puede esperar que y se encuentre, con una probabilidad dada, cuando x = xu. Sise conocieran CY y p, podríamos emplear el hecho de que y es un valor de una variable aleatoria que tiene distribución normal, con (Y - pro es un valor de una variamedia CY + pxoy varianza u* (o que y ble aleatoria que tiene distribución normal con media igual a cero y varianza d ) . Sin embargo, si CY y /3 no se conocen debemos considerar la cantidad y -a - bxo, donde y, a y b son valores de variables aleatorias, la teorla nos da los siguientes limites de prediccio'n para y cuando x = xo:

-

+

+

donde, una vez más, el número de grados de libertad de tu,% es n - 2. Para ilustrar la construcción de límites de confianza para CY + px0 y límites le predicción para un valor futuro de y, nos referimos nuevamente a los espesores le óxfdo de nuestro ejemplonumérico. Cuando x = 80, podemosescribir los línites de confianza a un nivel de 0.95 para a + 80 p en la forma 15.5 -f (2.306)(3.59) 8

k donde

12.9 < a

248,400

+ 800 < 18.1

220

AJUSTE DE CURVAS

Igualmente, los limites de predicción a un nivel de 0.95 para un valor futuro de y cuando x = 80, están dados por 15.5 f (2.306)(3.59)dl . .

- 86)' + $ + (10)(80 248,400

6 15.5 rt 8.7. N6tese que, aunque la media de la distribución de las Y cuando x = 80. se puede estimar con bastante aproximación, el valor de una observación futura, no se puede predecir con buena precisión. Obsérvese de la frirnlula de los límites de predicción, que, cuando n co , la amplitud del intervalo no se aproxima a cero. La amplitud límite depender6 de se, que expresa la variabilidad inherente de los datos. Aún más, notemos que, si se quiere'exfrupular, esto es, predecir un valor futuro de y' correspondiente a un valor de x fuera del recorrido de las observaciones, los límites de predicción '(y también los límites de confianza de a Px) se vuelven progresivamente más anchos. Por ejemplo, los límites de predicción a un nivel de 0.95 para y' correspondientes a x = 240 minutos están dados por "+

+

42:7 f (2.306)(3.59)

1

- 86)2 + lo1 + (10)(240 248,400

6 42.7 t 11.8. En otras palabras, podemos afirmar, con una probabilidad de 0.95,

que el espesor de óxido en una pieza calentada durante 240 minutos, cae entre 30.9 y 54.5 Angstroms. Pobre comoes,estapredicciónse basa en I$ hipótesis de que la verdadera regresióneslinealaim si salimos fuera del recorrido de las observaciones.

€JERCICIOS 1. La tabla siguiente muestra los resultados de,las medidas de resistividades eléctricas en ohm-cm.10-6 del platino a diferentes temperaturas, en grados Kelvin.

Temperatura, x Hesistividad, y

I

300

100

200

4.1

8.0 19.4 16.3 12.6

400

500'

( a ) Suponiendo que la regresión de y sobre x es de la forma y = (Y px. hallar las ecuaciones normales para estimar los parámetros (y y p y resolverlas para u y b h ) Hacer la gráfica de los datos y dibujar la recta obtenida en (a) en el mismo sistema de coordenadas. ¿,Cuál es su estimación de la resistividad det platino cuando SU temperatura es 350"K? 2. Resolviendo las ecuaciones normales de la página 230 en su forma simbólica, depostrar que

+

(Los indices y límites de sumación se. han omitido por simplicidad.) Usar estas f6rmua s l para verificar los resultados obtenidos en la parte (a) del problema 1. 3. En la tabla siguiente, x es la fuerza de tensión aplicada a una probeta de acero en miles de libras, e y es la elongación resultante en milésimas de pulgada. Suponiendo que la regresión de y sobre x, es lineal, calcular los pathmetros de la línea de regresión y construir un intervalo de. confianza a un nivel de 0.95 para p, elongación de la probeta, por miles de libras del esfuerzo de tensión.

5

1

1

2

3

y 413515 4.

4

5

6

63

77

84

'Un estudiante obtuvo los siguientes datos sobre la cantidad de bromuro de potasio, y , que se puede disolver en 100 gramos de agua a distintas temperaturas, x. x ?PC)

1

O

10

20

30

40

50

1

52

60

64

73

76

81

y-(gramos)

(a), Calcular (y y p , coeficientes de las l i m a de regresión de y sobre x. (b) Probar la ,hipótesis.nula @, = 0.5, a un nivel de significación de 0.05. El costo de fabricación de un lote de cigrto producto depende del tamaño del lote, como se muestra en la tabla siguiente; Costo (dólares), 30

Tamafio del lote

1

1

80 270 130

520

5

50

10

6025

1050 ,

100

250

600

Ajustar a estos datos una recta por,el mktodo de mínimos cuadrados empleando los tamafios delotecomovariable independiente. Encontrar, tambidn, un intervalo de confianza a un nivel de 0.90 para a, que eneste caso se puede interpretar como elcosto general fijo de la fabricación. El material crudo usado en la producción de 'una fibra sintktica se almacena en un lugar que no tiene control de humedad. Las medidas de la humedad relativa en el almac8n y del contenido de humedad de. una muestra del material crudo (ambas en porcentajes) en 12 días, dio los siguientes resultados: Y

X

Humedad Contenido

43 35 51 47, 46 62 32 36 41

de humedad I.

12 8 14 9 11

16 7. 9

,39 53

12 10 13

48

11

222

AJUSTE

DE

CURVAS

( a ) Calculary p, coeficientes de:regresiÓn de la recta de y sobre x. ( b ) Hallar un intervalo de confianza a un nivel de 0.99 para el contenido medio de. humedad en elmaterial crudo cuando la humedad del almacén es 40% . (c) Hallar límites de predicción a un nivel de 0‘95 paraelcontenidode humedaddel material crudo cuando la humedad relativa del lugar de almacenamiento es 40%. ( d ) Con respecto al.inciso (c),indicaren que medida la amplituddelintervalo queda afectada por el tamaño de la muestra, en que medida queda afectado por ,¡a variabilidad inherente a los datos. 7. Con respecto a los datos del problema 3, (a) Hallar un intcrvalo de confianza a un nivel de 0.95 para la media de la distribución de las y cuando x = 3.5. (b) Expresar los límites deconfianza a un nivel de 0.95 parala media de la distribución de las y en función de x, dibujar la gráfica de la recta de regresión estimada y eligiendovaloresconvenientes de xu, trazar la poligonal que une 10s puntos fijados por los limites superiores de confianza, así como la que une 10s límites infer¡@ res, en elmismo sistema decoordenadasNbtese que, las“bandasdeconfianza” obtenidas, no dan intervalos de confianza para la recta misma, Y tales bandas S510 deben emplearse en relación con algún valor fijo xn.) 8. Con referenciaa los datos del ejercicio 4, expresarlímites de predicacijn a un nivel de 0.95, para la cantidad de bromuro de potasio que se disolverá en 100 gramos de agua en función de 2;, éscogiendo valores convenientes de xn dibujar las gráficas de las Polilímitesinferiores de predicción,’ así como gonales que unen los puntosfijadosporlos la que une aloslimitesinfériores,enel m h o sistema de coordenadas. (Nótese,que como en el ejercicio 7, tales bandas d l o deben emplearse en relación con a l g h Valor fijo de xo). 9. En el ejercicio 3, es completamente razonable imponer la condición de que no habra elongación cuando no haya ninguna fuerza de tensión aplicada. ( a ) Empleando el mCtodo de mínimos cuadrados, obtener una fbr&elanálisis estadístico del diseño hecho completaRente al azar, O de clasificacicin en una sola dirección. Supondremos que el experi-

246

ANALISIS DE LA VARIANZA

mentador cuenta con los resultados de k muestras de azar independientes, cada una de tamaño n, provinientes de k poblaciones diferentes (esto es, datos sobre k tratamientos, k grupos, k métodos de producción etc.) ; y debe contrastar la hipótesis de que las medias de esas k poblaciones son todas iguales. Un ejemplo de tal experimentos, con k = 4, es el expuesto en la página 245. Si denotamos la j-ésima observación en la i-ésima muestra por yij el esquema general de la clasificación en una sola dirección es el siguiente:

Muestra I:

yn,

Muestra 2:

y21, 1/22,

Muestra i: Muestra k:

Media

. , Ylj, .

Yln

81

’Lhn

Q2

yil, yi2,

. . . , yijl . . . , yin

5;

Ykl, Yk2,

.

8k

+

-,

. 1 Y2j1

, ykn

ykj,

Y. Con respecto al experimento de la página 263, yji (i = 1, 2, 3, 4; j = 1, 2, . . .12) es el j-ésimo peso de recubrimiento medido por el i-ésimo laboratorio, 8; es la media de las medias obtenidas por el i-ésimo laboratorio, e jj es la media general ( o media mayor) de las 48 observaciones. Para poder contrastar lahipótesis de que las muestrasobtuvieron de k poblaciones con medias iguales,haremos varias suposiciones. Concretamente, sesupondrá que tratamos con poblaciones normales que tienen varianzasiguales. Existen métodos para contrastar en qué grado es razonable es esta última suposicih (‘vei el libro de A. M. Mood y F. A Graybill, citado en la bibliografía), pero los “mktodos que desarrollaremos en este capítulo son bastante “robustos”; es decir, son relativamente insensibles a las violaciones de la .hipótesisde la normalidad y de la igualdad de las varianzas. Si pi denota la media de la i-ésima población y denota lavarianzacomún de las k poblaciones, podemos expresar cada observación yij por pi, más el valor de una componenté aleatoria, esto es, podemos escribir. yij = p i

+ eij

para i = 1,2,

. . . , k;j

= 1,2,

. . . ,n

De acuerdo con las suposiciones anteriores las rij son valores de ,variables aleatorias independientescondistribucionesnormales de mediascero y varianzacomún u2. (Nótese que esta ecuación, o modelo, se puede considerar como una ecuación de regresión múltiple; introduciendo las variables xil que sean igual a O ó 1, dependiendo de que los dos subindices sean desiguales o iguales, podemos escribir. yij

=

Plxil

P2xi2

+ + *

Pkxik $- eij

Los parámetros pi se pueden interpretar ahora como coeficientes de regresión, Y se pueden estimar por los métodos de mínimos cuadrados del capítulo l?.)

247

CLASIFICACIONES EN UNA SOLA DlRECClON

Para lograr uniformidad con las ecuaciones correspondientes para clases más complicadas de diseño, es costumbre reemplazar E . C ~por p a{,donde p es la media

+

k

de las ,ui y, por lo tanto, Z

ai

O (ver problema 11 de la página 254). Utilizan-

=

ill

do estos nuevos parámetros, podemos escribir la ecuación. modelopara la clasificación en una sola dirección, en a l forma

+

yij = p

+ ai+

tij

para i = 1,2,

. . . , k;j

= I, 2,

.,. . ,n

y la hipótesis nula de que las k medias de poblaciones sean todas iguales se puede cambiar por 4 hipótesis nula de que a1 = az = . . = cyg = O. La hipótesis alternativa de que, al menos, dos de las medias de población sean diferentes, es equivalente a la hipótesis altenativa de que ai # O para alguna i. Para contrastar la hipótesis nula de que las k medias de población sean todas iguales, compararemos dos estimaciones de $-uno basado en la varianza entre las medias muestrales, y otra basada en la variación dentro de la muestras. Como, por hipótesis, cada muestra proviene de una población de varianza d , estavarianza se puede estimar por cualquiera de las varianzas muestrales

.

y, por consiguiente, también por sus medias

-

Nótese que cada una de las varianzas muestrales S: está basada en n 1 grados de libertad (n "1desviaciones independientes de V i ) y, por lo tanto, 3k está basada en k(n - 1) grados de libertad. Ahora, la varianza de la media IC muestral está dada por E

S:

= z1 (Pi - g . I 2 / ( k - 1) ill

y, si la hipútesis nula es cierta,'nos da una estimación de $/n.Luego, ' 62, = n-sg =

k

n. Z (pi - p)*/(k (-1

- 1)

nos da una estimación de basada en lasdiferencias entre las mediasmhestrales, y está basada en k I grados de libertad. Si la hipótesis nula es cierta, podemos demostrar que & y gi son estimaciones independientes de c2, y de aquí que . ,

-

-

un valor de una variablealeatoria que tiene .distribución F, con k 1 y G(n- 1) grados de libertad. Coho la vuriurtzu ifttermuestru[ d,(puede esperarse que exceda a la varianza muestral interior, U$, cuando la hipótesis"nu1a es fulsh;

2s

248

ANALISIS DE LA VARIANZA

ésta deberá rechazarse si F excede de Fa,donde Fa se obtiene de la tabla VI, con k 1 y k(n 1) grados de libertad. El argumento precedente ha demostrado cómo se puede basar en la comparación de dos estimaciones de varianzas el test de la igualdad de k medios. Quizá más interesante resulta el hecho de que las dos estimaciones consideradas (excepto para los divisores k - I y k(n 1 ) ) se pueden obtener por “ruptura” o análisis de la varianza total de todas las nk observaciones en dos partes. La varianzamuestra1 de las nk observaciones está dada por

-

-

-

E

S’ =

n

Z: 2 (yij - g . ) ’ / ( d ~ - 1)

i=l

j-1

y con respecto a su numerador, llamado suma total de cuadrados, probaremos ahora el siguiente teorema

TEOREMA 13.1

La prueba de este teorema está basada en la identidad

+

y i j - 8. = (yij ( Z I~ 5.) Elevando ambos miembros al cuadrado y haciendo la suma respecto de i y de j, obtenemos

A continuación, observamos que

Es costumbre denotar la suma total de cuadrados, primer miembro de la identidad del teorema J 3.1 por S S T . El primer término del segundo miembro es 8% veces sus grados de libertad y nos referimos a esta suma como la sun~ade cuadrados de error, SSE. El término “suma de error de cuadrados” expresa la idea de que la cantidad estima el error aleatorio. (0 de azar). El segundo término del segundo miembro grados de libertad y lo llamamos de la identidad delteorema 13.1 esvecessus

249

CLASIFICACIONES EN UNA SOLA DIRECCION

suma intermuestral de cuadrado so suma de tratamiento, de cuadrados SS(TT). (La mayoría de las primeras aplicaciones de esta clase de análisis se hicieron en el campo de la agricultura, donde las k poblaciones representaban diferentes tratamientos,tales como fertilizantes, aplicados a campos agricolas.) Notemos que con esta notación la razón F de la phgina 248 se puede escribir. SS(Tr)/(k - 1) F= S S E / k ( n - 1) Las sumas de cuadrados necesarios para substituir en esta última fórmula, se obtienen generalmente por medio de las fórmulas abreviadas siguientes,, que el lector debera verificar en el problema 12 de la página 254. .Primero calculamosSST y SS(Tr) por medio de las f6rmulas

+

+

SST =

+ donde C, llamada término de correccicjn, estádada por

.

+ y donde Ti es el total de lasn observaciones de la i-Csima muestra, mientrasque T2

es el total mayor de las kn observaciones. La suma de error de cuadrados, SSE, se obtiene, entonces, por substracción; de acuerdo con el teorema 13.1 podemos escribir Los resultados obtenidos al analizar la suma total de cuadrados por sus componentes, se puede resumir en la siguiente ,tabla de análisis de la varianza: Origen de variación

Grado de libertad

Suma de cuadrodos

Cuadrado medii) I

Tratamiento Error

Total

SS(Tr)

k - 1 k(n

nk

- 1)

-1

SSE

ius(Tr) =ss(Fr)/@ - 1) MSE PSSE/k(n

F ,.

I-IS( Tr)

MSE

- 1)

SST

N6tese que cada cuadrado medio se obtiene dividiendo la suma de cuadrados correspondiente por sus grados de libertad . Para ilustrar el análisis de, la varianza (comose llama esta.técnica) para la clasificación en una sola dirección, supongamos que, de acuerdo con lo establecido en

250

ANALISIS

DE

LA VARIANZA

la .página 244, cada laboratorio mide los pesos de recubrimiento de 12 discos y que los resultados son los siguientes: Laboratorio Laboratorio Laboratorio Laboratorio

A : 0.25,0.27,0.22,0.30, 0.27, 0.28, B: 0.18,0.28, 0.21, 0.23, 0.25, 0.20, C: 0.19,0.25, 0.27, 0.24,0.18, 0.26, D: 0.23, 0.30, 0.28, 0.28, 0.24,0.34,

0.32, 0.27, 0.28, 0.20,

0.24,0.31,0.26,0.21, 0.19, 0.24, 0.22,0.29, 0.24, 0.25, 0.20,0.21, 0.18, 0.24, 0.28,0.22,

0.28 0.16 0.19 0.21

Los totalesparalascuatromuestras son, respectivamente, 3.21, 2.72, 2.76, y 3;00, el total mayor es 11.69, y los cálculos para obtener las sumas de cuadrados necesarias son 10s siguientes: C

=

(11.69)'/48

SST

=

(.25)2

SSE

=

0.0809 - 0.0130

=

2.8470

+ (.27)2 + . . . + (21)' - 2.8470 = 0.0809 =

0.0679

Así, obtenemos la siguiente tabla de andisis de la varianza:

Como el valor 'obtenido para F excede de 2.82, al valor de F.,,s con 3 y 44 grados de libertad, la hipótesis nula se puede rechazar al nivel de significado de 0.05; Ilegamos a la conclusión de que los laboratorios no esthn obteniendo resultados concordantes. Para estimar los parámetros M , a l , m , a3, y a4(6 PI, pz, p3, y p4 ), podemos emplear el mCtodo de mínimos cuadrados, haciendo minima l a expresicin

4

con respecto p y las ai,con la restriccicin de que

Z

i=l

a,

=

O. Esto se puede hace1

eliminando una de las a, o mejor aún, utilizando' el método de los multiplieadores de Lagr'ange que se puede encontrar e n la mayon'a'de los libros dc Cilcula superior. En cada,caso. obtenemos la!: estimaciones "intuitivamente "obvias'. '

251

CLASIFICACIONES EN, U N A SOLA DiRECClON

y las estimaciones correspondientes de las p i están dados por .pi = vi. El análisis de la varianza descrito en esta sección se aplica a clasificaciones en una sola direccih en las que cada muestra tiene el mismo número de observaciones. Si no es Cste el caso, y los tamaños de las muestras SQ~I nl, no,. . . m ; , sólo tenemos

que substituir N =

k r: ni en lugar de nk y escribir las expresiones de cSlculo de *=l

XSTyforma SS(Tr) en la

,

.

.

. 4

4

E n lo demás, el procedimiento es el mismo. (Ver problema 13 de la página 254.)

EJERCICIOS acción limpiadora de dos detergedtes, A y B . Se ensucian 20 piezas de tela con grasa y mugre, y cada una se lava con uno de los demidiéndose después la blancura de las piezas. tergentes en una máquina de tipo agitador, Criticar los. aspectos siguientes -del experimento: ( a ) E l experimento completo se hizo- con agua sum&. ( b ) Quince piezas se lavaron con el aetergente :A y &o con el B. (c) Para acelerar la pruebk, se empleó agua muy cahente y un tiempo de lavado de 30 segundos. .. ( d ) Las medidas de blancura de todas las piezas lavadas con el detergente A se hicieron primero. . , 2. Un bon vivant, deseaba saberla causade- sus frecuentes malestares, después debeber hizo el siguiente experimento. La primera noche sólo bebió whiskey c'on agua; la segunda, vodkayagua; 11 tercera,ginchra y agua, y en la cuarta, ron y agua. En cadade las siguientes mañanas tuvo malestares y llegó a la cbnclusi6n de que era el factor cuI mun, o sca el agua,, lo que le hacía daño. 1. Se hace un experimento para comparar la

'

(a) Estaconclusión, obviamente, es incorrecta, pero, ¿puede usted decir qut principios del proyecto experimental han sido violad os? ( b ) Dé un ejemplo menos obvio de un experimento que tenga lasmismas conclusiones. ( c ) Suponga quenuestro amigoha m.odificado su experimentodetal for,rllla.que cada una de las bcbidas alcohjlicas se ha.empleado CM, y sin, agua, de tal forma que el experimento duró 8 noches. ?,Pueden los resultadosde este otro experimentoservir Para confirmar o refutar la hipjtesis de que el agua.es.,la. causa de los. malestaFes? Explique por qué.

252

VARIANZA

ANALISIS DE LA

3. Muestras, tomadasalazar,de 4 marcas cubiertas,necesitaron de frenado a 30 millas por hora: Marca B

Marca A

32 k

(a)Sinemplearf6rmulas y

k

12. .Z (gi 1-1

- v.)*,

26 26 25 23

27 31 30

20 22 21

25 26

Marca D

Marca C

25

27 30

n

abreviadas,calcular

k

Z

las siguientes distancias

n

Z (yij

i - 1 j-1

- v.)*,

.z

i-lj-1

(vij

- %)*,

y verificar la identidad del teorema 13.1.

(b) Verificar los resultadosobtenidos para lastressumas decuadrados, utilizando las fórmulas abreviadas de la pfigina 249. 4. Para determinar elefectoen la salida de polvos de un precipitador, se hicieron las siguientes medidas: Con carga de polvo Corrientetotal gramos por yarda cúbica en el gasto de gas (pie"/hora) 1.6 1.0 m 2 1.8 2.5 2.0 300 3.0 400 23..45 3.8 4.4 500 3.1 (a) Comprobar si el gasto en lasalida a través del precipitadortienealgúnefectoen la carga de polvo de salida. (b) Estimar los efectos (yi correspondientes a las diferentes velocidades del gasto. 5. Utilizando las sumas de cuadrados obtenidas en el ejercicio 3, probar con un nivel de significacijn de 0.05, si las diferencias entre las distanciasmedias de frenado obtenidas para las 4 marcas de cubiertas tienen a l g h significado. 6. Tresprobetasdecadaunode loscincodiferentesmetales quese indican a continuacibn, fueron sumergidas en una, soluciónaltamentecorrosiva y se midieron sus velocidades de corrosión con los siguientes resultados: Metal

Aluminio Acero inoxidable Acero al carbono Acero esmaltado Aleación de niquel

VeIocidad de corrosión 0.5 0.6 0.6

7.0

0.4 0.7

0.6

0.6 3.5

7.3 0.8 3.0

6.5 0.8 4. L

(a)Contrastarla hipótesisnula deque los cincometalestienen la misma velocidad de corrosión. (b) .Estimar la diferencia de velocidad de corrosión entreelacero inoxidable y el acero al carborto y darun intervalo de confianza a un nivel de 0.95 para esta diferencia. 7. Paracompararla efectividad de tres tipos diferentes de pinturasfosforescentes para cuadrantes indicadores de instrumentos de aviones, se pintan 8 cuadrantescon cada

CLASIFICACIONES

EN UNA

259

SOLA DlRECCClON

unadelas pinturas. Luegose iluminan los cuadrantes con luzultravioleta, y , los siguientes son los ntmleros que indican los minutos que dieron luz, después' que la ultravioleta fue apagada: Tipo A 46.3 48.2 4298. ,'. 41.8 48.9 51.0 49.7 50.1

Tipo B

Tipo C

48.7 53.6 493 47.3 51.4 53.9 43.6 48.8

62.3 64.7 56.2 60.2 53.6 55.5 61.8 54.5

,

I

(a)Calcular F y (suponiendoquese ' obtienenlas condiciones necesarias) contrastar; conun nivel de 0.01, si lasdiferenciasobservadas entrelas medias de las' muehtras se pueden atribuir al azar. (b) Estimar los parfimetros delmodelousadoen elanálisis de este experimento. 8. Un fabricantede planchaseltctricas,deseando probar la exactitud de los termostatos de tresproveedoresdiferentes, comprdbó los hierrosa 500" F. Las' temperaturas se midieron con un gar termoel&trico, ydieron los resultadosdguientes: >

Proveedor A: Proveedor 'B: Proveedor C:

494, 516, 487,491 512, 528 480; 515, 510 . ,

¿Se puede llegar a la conclusibn de que hayuna diferencia en la exactituden los termostatos de los tres proveedores? 9. Teniendo 20 pruebas disponibles paracomparar. elcrecimiento de tresvariedades de maíz, un investigadoragrícolaplanta 7 con cadauna de las Variedades A y B, y 6 eon la variedad C . Los siguientes son los crecimientos obtenidosenbushels por acre: Variedad A 81.6 66.7 72.9 86.7 73.5 63.8 69.2

Variedad B

Variedad C

73.5 77.3

89.6 86.1 .'.72.4 78.4 85.2 70.5

77.7 71.5

.

'

. '

Esttmar elcrecimiento promedioverdaderodecada variedady probar si hay difcren= 0.05. cias significativas entrelas medias d b lasmuestrasaon 10. Con respecto a la discusión de la página 243, supongamos quelas desviacioncs tipias de los pesos de recubrimientodeterminado$ porcada Üno dc los trcs laboratorios tíenenel valor común SI = 0.012, y que se desea una confianza de 95% para determinar una diferencia entre las medias de dos laboratorios cualesguicra en mis de 0.01 .libras por envase. Demostrar que estas suposi.ciones'nos conducen a la dccjsión de enviar una muestra de 12 discos a cada laboratorio.

254

ANALISIS

1 1 . Demostrar que, si

p, = p

DE

LA VARIANZA

+ ai, y p es la media de las pClaentonces zk ai = 0. i-1

12. Verificar las frjrmulas abreviadas paraaalcular SST y SS(Tr) dadas en la página 249. 13. Establecer y probarun teorema andlogo al teorema 13-1, para el caso enque el tamaño de la i-ksimamuestra sea n i , esto es, cuando los tamaños de las muestras no son necesariamente iguales.

13.3

Clasificaciones en dos direcciones

Como hicimos notar en la sección 13.1, el valor estimado de la variacibn aleatoria (el error experimental) puede frecuentemente ser reducido, es decir, liberado de la variabilidad debida a causas extrañas, dividiendo las observaciones en cada clasificación en bloques. Esto selogra cuando fuentes de variabilidadconocidas (o sea,variables extrañas) semantienen fijas en cada bloque, pero varian de un bloque a otro. En estasecciónsupondremos que elexperimentadortiene a mano medidas pertenecientes a a tratamientos distribuidas en b bloques. Primero consideraremos el caso en que hay exactamente una observación procedente de cada tratamiento en cada’bloque; en la ilustración de la página 245, este caso se presentaría si cada laboratorio comprobara undisco de cada tira. Indicando con yii Ia observacidn pertenecienteali-ésimo tratamiento y alj-ésimobloque,con P ~la. media de las b observacionesdeli-ésimo tratamiento, conlamedia de las a observaciones del bloque j, y con P. la media mayor de todas las ab observaciones podemos utilizar el siguiente esquema para este tipo de clasificaciún en dos direcciones: Bloque

Media

Tratamiento I: Tratamiento 2:

. . . B j . . . Bb yll, YlZ, . ,,ylj, , Ylb yzl, yzz, . . . , yzj, . . . , YZb

Tratamiento i:

yilt ya,

. . . , . . . ,Y i b gal, y02, . . . , . . . , Yab P.1 . . . . . . g.b

vi.

B1 Bz

Tratamiento a: Media

yij,

yoj,

g.2

17.j

81. 82.

P.. P..

Nótese que, cuando empleamos un punto en lugar de un subíndice, esto significa que la media se obtiene sumando respecto a esesubíndice. El modelo subyacente que aceptaremos para el análisis de este tiPo de dasificación de dos direcciones con una observación por “casilla” está dada por

+ + +

para i = 1 , 2 , . . . , ~ ; = j1,2,.. , ,b 6 Donde es la media’mayor, cy1 el efecto deli-ésimo tratamiento, & el efecto dcl j-bimo bloque, y las Eij son valores de variables aleatorias con distribucidn normal, independientes y con medias cero y vavianza común 42: Igual que en el mo6

l/ij = I.(

LY~

eij

255

CLASIFICACIONES EN DOS DIRECCIONES

los parámetros impo-

delo para la clasificación en una sola dirección, restringimos a

niendo las condiciones ,X ai = O y $311

b

,X pj = O

J-1

(problema 10 de la página 263).

En elanálisis de una clasificación de dos direcciones en el que cada tratamienfo está representado una vez en cada bloque, el objetivo principal es probar si la diferencia entre las gi., essignificativa,estoes, contrastar la hipótesisnula a1=CQ=

. . . = a.=o

Además, siempre será conveniente comprobar si la agrupación de los bloquesha sido efectiva, es decir, si se puede rechazar la hipótesis nula f l l = & = . . . = f l b = o

En cada caso, lahipótesis alternativa es que, al menos, uno de losefectossea diferente de cero. Como en el análisis de la varianza de una soladirección, basaremos estos tests de significación en comparaciones de las estimaciones de U S ; una basada en la’variación entre tratamientos, otra basada en la variaci6n entre bloques, y otra que mida el error experimental. Notemos que solo la última es una estimaci6n de u* cuando alguna (o ambas) de las hipótesisnulas no esválida. Las sumas de cuadrados necesarias estin dadas por las tres componentes en que se “rompe” la suma total de cuadrados, por medio del siguiente teorema: TEOREMA 13.2

+

a

.21 ( P i . - P.J2

t-

+

b

a

Z j-1

@.j

- g..)2

El primer miembro de esta identidad representa la suma total de cuadrados, SST, y los términos delsegundomiembroson,respectivamente, la suma de cuadrados de error SSE, la suma de cuadrados de tratamientos, SS(Tr), y la suma de cuadrados de bloque SS(BI). Para probar este teorema, empleamos la identidad yij

- 5.. = ( Y i j - Y$. - B.j + v..) + ( ~ i-. 5.J +

- p..)

( ~ . j

y seguimos,esencialmente,lamismaargumentación que en la prueba del teorema 13.1. En la prhctiea,calculamos las sumas de cuadrados necesarias por medio de fórmulas abreviadas análogas a las de la página 248, mejor que las expresiones que definanestassumas de cuadrados, talescomo las definidas en elteorema 13.2. En lo que sigue, Ti. eslasuma de las b observacionesdeli-ésimo tratamiento, T.5 es la suma de las a observaciones del j-ésimo bloque, y T.. es el gran total de todas las observaciones. Usando el término de correccicin

+

c = T2 ab

+

256

ANALISIS DE LA VARIANZA

tenemos

+

SSE = SST - SS(Tr) - SS(BI) Nótese que los divisores de SS(Tr) y SS(BI) sonel número de observaciones de los totales respectivos, T?.y T.j. En el problema 11 de la pbgina 263, el lector deberá verificar que estas fórmulas son equivalentes a los términos correspondientes de la identidad del teorema 13.2. Empleando estas sumas de cuadrados, podemos rechazar la hipótesis nula de que las ai son todas igual a cero con un nivel de significación a si M S ( T r ) - S S ( T r ) / ( a- 1) Fr,. = ___ + MSE SSE/(a - l ) ( b - 1)

+

excede a F,, con a- 1 y ( a - 1) ( b - 1) grados de libertad. La hipótesis nula de que las pj son todas igual a cero se puede rechazar con un nivel de significación a, si MS(B1) - SS(Bl)/(b - 1) FBZ= MSE S S E / ( U - l ) ( b - 1)

-

excede a F , con b - 1 y (a- 1) ( b 1) grados de libertad. Notemos que las medias de cuadrados, MS(Tr), M S ( B l ) , y MSE, se definen nuevamente como las sumas de cuadrados correspondientes divididas por sus grados de libertad. Los resultados obtenidos en esteanálisis, se puedenresumiren la siguiente tubla de andisis de la varianza:

I F I

de variacidn

Origelt

Tratamiento

B1oc Error

b - 1 (a

- l)(b

SS(U1)

- 1) SSE ~

Ms(Ba = S S ( B l ) / ( b - 1) MSE =SSE/(a

FBI =

MS(B1)

- l ) ( b - 1)

Total I

1

257

CLASIFICACIONES EN DOS DIRECCIONES

Ilustraremos el anilisis de una clasificación en dos direcciones con una observaci6n de cada tratamiento encadabloque,considerandounexperimento para comparar vanos proyectos de cascos de lanchas de motor. Como las condiciotes del aire y del agua pueden afectar la velocidadmáxima de una lancha, posiblemeate en un grado mayor que las diferencias en los proyectos de los cascos, cada uno de los cuatro cascos se probó en tres días diferentes, correspondientes a condiciones de calma, moderado, y picado. En cada día las cuatro lanchas se 'corrieronen una ruta marcadaalavelocidadmáxima, habiendo sidosu orden de salida al azar, y los tiempos (en minutos) necesarios para cubrir la trayectoria se muestran en la tabla siguiente: Día I Proyecto A

45

Proyecto B

42

7,

Proyecto C

1

Proyecto D

4 8

36

Total 553

172 203

Dia 2

Día 3

Total 142 136 1%

150

47

178

Considerando los proyectoscomo tratamientos y los díascomobloques,obtenemos las sumas de cuadrados necesarias en la forma siguiente:

SST = (45)'

+ (46)' + . . . + (54)' - 25,484 = 265

-

#SE = 265 111 - 135 =: 19 Dividiendo las sumas de 'cuadrados por sus respectivosgradosde libertad para obtener las medias de cuadrados adecuadas,obtenemos los resultadosmostrados en la siguiente tabla de analisis de la varianza:

,

Origen de vwiacidn

Grado de libertad

Suma de cuadrados

Cuadrado medio

F

proyecto del

'3

111

37.0

11.6

2

135

67.6

casco . Dias

Ehror

6

3.2

,

21.1

19 "

Total

If

265 4

258

ANALISIS

DE

LA VARIANZA

Como Frr = I 1.6 excede de 9.78, valor de F.,,l con 3 y 6 grados de libertad, llegamos a la conclusión de que las diferencias en los proyectos de los cascos afecFBi 21.1 excede de tanla velocidad máximadelaslanchas.Además,como 10.9, valor de F.*,, condos y seis grados de libertad, concluimos quelas diferenciasen la velocidad máximase deben tambiénalas condiciones del, tiempo, es decir, quela distribución en bloques hasido efectiva. (Para hacer más evidente el efecto de estos bloques, el lectordeberá verificar, en el probleya 6 de la página 262, que el test de diferencias entre proyectos no daresultados significativos si consideramos los datos como una clasificación en'una sola dirección.) El efecto ai del i-bimo casco se puede estimar por medio dela fórmula d i = pi. - g,., que sepuedeobtenerpor el métodode mínimos cuadrados.Las estimaciones resultantes son = 6?3

47.3 - 46.1 =

= 41.7

- 46.1

1.2,

= "4.4,

- 46.1 = -0.8 50.0 - 46.1 = 3.9

Bs = 45.3 d24

Debemos observar que una clasificación en dos direcciones nos conduce automáticamente a repeticiones de las condiciones del experimento: por ejemplo, en el caso anterior, cada casco se prob6 tres veces. Las repeticiones se pueden tratar de diferentes maneras, y debemos tener cuidado de que el modelo empleado describa convenientemente l a situación.Unaformadeobtener repeticiones adicionales en una clasificación de dos direcciones es incluir bloques adicionales, por ejemplo, probar cada casco en mayor número de días, haciendo al azar el orden de prueba en cada día. Nótese que el modelo permanece, esencialmente, igual que antes, habiendo cambiado ímicamente por un incremento en b y un incremento correspondiente en los grados de libertad por bloques y por error. L.o idtimo es importante porque un aumento en los gradosde libertad porerror hace mús sensible el test de la hipótesis nula ai = O para todo i, parapequeñas diferencias entrelas mediasde los tratamientos. De hecho, el prop6sito real de esta clase de repeticiones es aumentar los grados de libertad por error. y por lo tanto incrementando la sensibilidad de los tests F (problema 9 de la página 263). Un segundo método es repetir el experimento completo, usando un nuevo método de selección al azar para obtener a b observacipnes adicionales. Esto sólo es posible si los bloques son idmtificahles, esto es, si las condiciones que definen cada bloque se pueden repetir. 'Por ejemplo, en el experimento de los pesos de recljbrimientodescrito en la sección 13.1, los bloques son tirastomadasaIo'largo de la direccicin de laminado de una hoja de acero galvanizado y, dando una nueva hoja, es posible identificar cuál es la'tira uno. cuál es lados, etc. En el ejemplo de esta sección, esta clase de repetición (llamada generalmente rc;p€icu) es difícil de conseguir porque sería necesario que las condiciones del tiempo se' repitieran exactamenteen los tres días. Esta clase de repetición se usaráen los diseños de cuadradolatinode la seccidn 13.5. Véanse también los problemas 7 y 8 de la página 262. Un tercer métodode repetición es incluir IZ observaciones paracadatratamiento en cada bloque. Cuando se desarrolla un experimento en esta forma, las

259

COMPARACIONES MULTIPLES

rl observaciones de cada “casilla”seconsiderancomo duplicados, y es de esperar que su variabilidad seaalgo menor que el error experimental. Para ilustrar este punto, supongamos que los pesos de los recubrimientos de tres discos de posiciones contiguas en una tira se midieron consecutivamente por uno de los laboratorios, utilizando las mismassoluciones químicas. La variabiIidad de estas medidas será probablemente mucho menor que la de tresdiscos de la mismatira medidos en tiempos diferentes en dicho laboratorio, utilizando soluciones químicas diferentes y, quizá, técnicos diferentes. El análisis de lavarianza apropiado para estaclase de repetici6n se reduceesencialmente a un análisis de lavarianza de dos direcciones aplicado a las medias de los n duplicados en las a . b casillas; luego, no 1zabr.ú aumento en los grados de libertad por error y, en consecuencia, no habrá aumento en la sensibilidad de los tests F.

13.4

Comparaciones múltiples

Los tests F usados eneste capítulo muestran si haydiferenciasentrevarias medias y siéstassonsignificativas, pero nonosdicen si unamedia dada (o un grupo de medias) difieresignificativamente de otra media dada (o grupo de medias). En la prácticaestaúltimaeslaclase de información que le interesa a un investigador; por ejemplo, habiendo determinado en laphgina 251 que las medias de los pesos de recubrirnientosobtenidos por los cuatro laboratorios difieren de una manera significativa, será importante encontrar qué laboratorio (o laboratorios) difiere de cuáles otros . Si un experimentador se encuentra ante k medias, es razonable, en primer lugar, hacer tests para contrastar las diferencias significativas entre todos los posibles pares, estoes, hacer

(i) ’ 9

test t de dos muestras,como los descritos

=

en la página 156. Adem& de1,hecho de que esto requiere un gran número de pruebas, aún siendo k relativamentepequefio,estas pruebas no serían independientes y seria virtualmente imposible asignar a todo este proceso un nivel de significado general. Se han propuesto varios tests de comparaciones múltiples para superar estas dificultades; entre ellas, el testdel recorrido múltiple de Duncan, que estudiaremos en estasección (en el libro de W. T. Federer, citado en la bibliografia, se hace referencia a otros tests de comparaciones m~ltiples).Las suposiciones en que se basa el test,del recorrido múltiple de Duncan, son, esencialmente, las del an&lisis de la varianza en unasoladirección, con tamaños de muestrasiguales. El test compara el recorrido de cualquier conjunto de p mediascon un adecuado mínimo recorrido de significacicin, Rprdado por

+

R,

=

SZ*T~

+

260

ANALISIS DE LA VARIANZA

donde MSE esel error cuadrado mediodelanálisis de la varianza. El valor de rp depende del nivel de significación deseado y del número de grados de libertad correspondiente a MSE, y sepuedeobtener de las tablas X ( a ) y ( b ) para (Y = 0.05 y 0.01, para p = 2, 3, . . . 10, y para varios grados de libertad entre 1 y 120. Para ilustrar esteproceso de comparacionesmúltiples,nosreferiremos a los datos de la página 250 y ordenaremos las cuatro medias de las muestras en un orden de magnitud creciente:

1

Laboratorio

Media

B

C

D

A

0.227 0.230 0.250 0.268

A continuacióncalcularemos sI, utilizandoel error cuadrado medio de 0.0015 en el análisis de la varianza de la página 250, y obtendremos SI

=

49

= 0.011

Luego, obtenemos (por interpolación lineal) de la tabla X ( a ) los valores siguientes de r, para (Y = 0.05 y 44 grados de libertad: P

I

51

2

2

3

3

4

4

0.031 0.033 0.034

El recorrido del conjunto de las cuatro medias es 0.268 - 0.227 = 0.041, que excede a R , = 0.034, mínimo recorrido de significación. Se podia esperar este resultado, puesto que el test F de la phgina 270 demostró que las diferencias entre las cuatro medias eran significativas, para un nivel (Y = 0.05. Para contrastar las obtenemos los recorridos diferenciassignificativas entre tresmediascontinuas. 0.038 y 0.023, para los conjuntos de tres medias 0.230, 0.250. 0.268 y 0.227, 0.230, 0.250respectivamente. Como el primero de estosvaloresexcede a R , = 0.033, las diferencias observadas enel primer conjunto sonsignificativas;como 'el segundo valor no excede a 0.033, las diferencias correspondientes no son significativas. Finalmente, paca pares contiguos de medias encontramos que no hay ningún par adyacente que tengg un recorrido menor que elminimo recorrido de significación R2=: 0.031. Todos estos resultados se pueden condensar escribiendo 0.227

0.230 0.250 -

0.268

donde se ha dibujado una línea debajo de cualquier conjunto de medias contiguas paralas que el recorrido esmenorque elvalor adecuado de Rp, esto es, debajo de cualquier conjunto de mediascontiguas para lascualeslas diferencias no son

261

COMPARACIONES MULTIPLES

significativas. Por lo tanto, llegamos a la conclusión de que, en nuestro experimento, el laboratorio A promdia pesos de recubrimiento mayores que los otros tres laboratorios. Si aplicamos este mismo método al ejemplo de lasección 13.3, enel que comparamos los cuatro cascos de lanchas, obtenemos (véase también el problema 12 de la phgina 262) Proyectode casco

C B A 41.745.347.3

D 50.0

En otras palabras, entre ternas de medias contiguas, ambos conjuntds de diferencias son significativos. En lo que respecta a pares de mediascontiguas, encontramos que solo la diferencia entre 41.7 y 45.3 essignificativa. Interpretando estos significados, concluimos que el casco C es significativamente mejor que cualquiera de los otros.

1. Parahallarlamejor disposici6n de instrumentosen untablerodecontrol,cuatro disposiciones diferentes se sometierona un testsimulando una emergencia y observando el tiempode reaccibnneczsario para corregirla. Los tiempos de reacción (en dkirnas de segundos) de tres personasdiferentes fueron los siguientes:

Sujeto I

Sujeto 2

Sujeto 3

8

14 15 11 18

10 11

Disposición A Disposición B Disposición C Disposición D

11 5

I?

6 15

Utilizar el analisis delavarianzadedos direccionesadecuado, paracontrastar si hay diferencias significativas entre las diversas disposiciones. 2. Suponganios que,en elexperimento delproblema 3 dela pAgina 252 la primeramedidaparacadamarcaseobtuvoconun Chevrolet, la segunda conunFord,la tercera con un Plymouth, y la cuarta con un Rambler. Analizar los datos como una clasificacibn de dos direcciones y contrastar si hay diferencias entrelas cubiertas, conun nivel de significación de 0.05. 3. La tabla siguiente da la productividad (medida por el ndmero de piezas aceptables por trabajador y porhora)detresturnosenunafabricaduranteunperiododeuna semana. Lun.Miér. ~

Turnoprimero Turno segundo Turno tercero

~~~

~

5.6 4.8 3.9

~

Mar.

Jue.

Vier.

6.5

5.8 5.0

~

6.1

6.5 5.8

5.9 6.0 5.1 4.2

5.8 5.9

¿Hay diferencias significativas de turno a turno o de día a día?

262

ANALISIS DE LA VARIANZA

4. Los siguientes son los números de piezas defectuosasproducidas res queoperan,porturno,entres máquinasdiferentes:

ti

Mdquina

Aa

por cuatro trabajado-

Trabajador

1

BS

Ba

Bd

22

23

15 18

30 22 27

21

14 20

22

considerandolas máquinascomo “tratamientos”y los trabajadores como“bloques”, analizar los datoscomouna clasificación dedos direcciones. Estimartambién cuántas A,. piezas defectuosas se puede esperarque haga un trabajadoroperandolamáquina 5. En el ejercicio 4 de la página 252, supongamos que los datosencada una de las tres columnas se obtuvierondeprecipitadoresdiferentes.Repetirel análisis dela varianza, tratando elexperimento comouna clasificación dedos direcciones, y observar qué cambios se presentanenel errorcuadrado medio. 6 . para hacerresaltarlaimportanciadeladistribucibn en bloques, volver aanalizar los datos de la pagina 257 pertenecientes a los proyectosde cascos delancha- * como una clasificación de una sola dirección. 7 . Si, en una clasificación de dos direcciones, se repite el experimentocompleto r veces, el modelo se transforma en Yijk

E

EL

+ + pj + + ai

Pk

eiik

para i = 1, 2, . . . a, j 1, 2, . . . b, y k = 1, 2, . . . r, siendo la suma de las a , la y !a sumade las p igualacero. Las eiik son de nuevovalores sumadelas de variables aleatarias indepcdicntescondistribucionesnormalesde medias cero y variancia común u2. ( a ) Escribir (peronoprobar)una identidadanálogaa la delteorema 13.2, que subdivida la sumatotal decuadrados en componentesatribuiblesatratamientos,btoques, réplicas y error. ( b ) Generalizarlas fórmulasde cálculo dela página 256, detal formaque se puedan aplicara un diseño de bloques alazar con réplicas. Nótese que el divisor en cadacaso es igual alnúmero de observaciones enlostotales respectivos. ( c ) Si el númerode gradosdelibertad paralasumadecuadradosde réplicas es r - 1, ¿cuántosgrados de libertad hay para la sumade cuadrados de error? 8. Supongamos, en el ejercicio 3, que lasmedidasdeproductividad se repitieron enuna segundasemana con los resultadosadicionales siguientes: y=

p

Segunda semana Lun.Miér.

6.5 Turna primero 6.7 Turno segundo Turno tercero

5.4 4.8 4.3

Mar.

6.4

5.9 5.8 4.6

Jue.

Vier.

7.1 6.2 5.9

6.2 5.9 5.3

utilizar lateoría desarrolladaen el ejercicio 7 para analizar los resultadoscombinados de ]as dos semanas como una clasificación de dos direcciones con réplica. dapágina 258, dos métodos paraaumentar el tamañodeuna 9 Como se indicóenla sificación de dos direcciones son ( a j doblar el númerode bloques, y ( b ) hacer una réplica del experimentocompleto.Discutir y compararla gananciaen gradosde m e r tad para la sumadecuadrados de error por los dos métodos.

263:

OTROS DISENOS DE EXPCRIMENTOS

$0. Demostrar que, si pii = p ( Y ~ Pi, la media de las pij (sumadas respecto de j) es igual a p ai, y la mediade las p i i sumadasrespectode i y j es iguala p , de esto

+ +

+

b

a

se deduce que

2 (Y¡= j-1 z. Pi = 0. i=l

11. Verificar que las fórmulas decálculo de S S T , SS ( T r ) , S S ( B l ) y SSE. dadas en la pigina 256, sonequivalentesa los terminoscorrespondientes dela identidaddel teorema 13.2. 12. Verificar los resultados del test deDuncanparala comparación de los cuatro cascos de lancha, dada en la página 261. 13. Utilizareltestde Duncancon un nivel de ct = 0.05 paraanalizarlas 'medias obtenidas para las cuatro.marcas de cubiertasdel ejercicio 3 de la página 252 14. Utilizar el test de Duncan, con un nivel de [Y = 0.05, para comparar los efectos de las pinturas fosforescentes del ejercicio 7 lade página 252. , , , 15. Utilizar el test de Duncan, con un nivel de (Y = 0.01, .para comparar las cuatro disposiciones de instrumentosdel ejercicio 1. ¿Qué disposícibn o disposiciones son mejores? 16. Utilizarel test del recorridomhltiple deDuncan, oon u n ' nivel de (Y e 0.01 para analizar: ( a ) Las mediasobtenidas paralas tresmáquinas. ( b ) Las mediasobtenidas para los cuatro trabajadoresdel ejercicio 4. I

13.5

Otros diseños deexperimentos

Los diseños de bloques alazar, o las clasificaciones en dos direcciones, son apropiados cuandouna fuente extraíia de variabilidad,.se debe eliminar al compararun conjunto de medias de muestras. Una característica importante'de esa cIase ,da diseños es su equilibrio, logrado dando. el mismo número de observaciones, para cadatratamientoencada bloque. (En este sentido, véase también el comentariode la página 246, en el que indicamos quelas diferencias debidasa bloques no afectaríanlas medias obtenida$para los diferentes tratamientos.)La misma clase de, equilibrio se puede obtener en tipos más comp!icados de diseños cuando se desea eliminar el efecto de varias' fuentes de variabilidad extrañas. En esta sección introduciremos dos diseños equilibrados más generales, e1 diseño de cuadro latifro y el diseño de cuadrado gredolatino, que se utilizan para eliminar 10s efectos de dos y tres fuentes extrañas de variabilidad, respectivamente. : . Para introducir el diseño de cuadrado latino, supongamos que se desean comparar tres tratamientos A, B y C, en la presencia deotrasdos fuentes de variabilidad. Por ejemplo. los tres tratamientos pueden ser tres métodos para soldar terminales eléctricas de cobre y las doh fuentes extrañas de variabilidad pueden ser (1) diferentes operadores haciendo la soldadura, y (2) el empleo de fundentes diferentes. Si tres operadores emplean tres fundentes, el experimento sepuede presentar en el siguiente esquema:

264

A N A L I S I S DE L AV A R I A N Z A

Fundenre 1

Fundente 2

Fundente 3

r

Operador I

C II A I I B I l

Operador 2 I-

Operador 3

B L

A

C

En estecaso, cada método de soldadura seaplica una vez por cada operador, junto con cada fundente y, si hay efectos sistemáticos debidos a diferencias entre operadores o entre fundentes, estos efectos se presentan igualmente en cada tratamiento, es decir, para cada método de soldadura. Una presentaciónexperimental, tal como la descritaanteriormente, se llama cuadrado latino. Un cuadrado latino de n X n es una disposición en forma de cuadrado de n letras distintas, enel que cada letra aparece una vez y sólo una en 5x5 4 x 4

Fig. 13.2 Cuadrados latinos

cad.afila y en cada columna. En la figura 13.2 se ven ejemplos de cuadrados latinos con n = 4 y n = 5, y se pueden obtener ejemplos mayores en el libro de W. C . Cochran y G. M. Cox, citado en la bibliografía.Nótese que un cuadrado latino incluye n tratamientos, y es necesarioincluir n 2 observaciones,correspondiendo n a cada tratamienio. Como veremos en la página 286, un experimento de cuadrado latino sin réplicas da solamente ( n - 1) ( n 2) grados de libertad para estimar el error experimental. Por lo tanto, talesexperimentossehacen raramente sin réplica si n es pequeña, estoes,sinrepetir el cuadrado latino completovariasveces.Sihay un total de r réplicas, el análisis de los datos presupone el siguiente modelo, en el que &j(k)l es la observación de la i-ésima fila y la j-ésima columna de la I-Csima réplica, y el subíndice k, entre paréntesis,indica que pertenece al k-bimo tratamiento:

-

+

Yij(k)l

para i, j, k = 1, 2, . . .

11,

i=l

ai

ai =

Pi

Xk

PI

+

'%(k)I

y 1 = 1, 2, . . . r, con las restricciones de que: n

n

L:

+ + + + +

=

o, L: pj j= 1

=

o,

n

2: Yk

k=l

=

o,

r

y

2:

z=1

pz =

o.

265‘

OTROS DISEAOS DE EXPERIMENTOS

E n este caso p es la medía mayor, ai es el efecto de la i-ctirp fila, pj es el efecto de la j-;sima columna, y k es el efécto del k-&imo tratamiento, pr es. el efecto de la I-ksima replica, y las € i j ( k ) l son vaiores de variables aleatorias independientes con distribución normal de medias cero y varianza común u2. Nótese que, por “efectos de fira” y “efectos de columna”, entendemos los efectos de IaS dos variables extrañas, y que incluimos los.efectos de las réplicas, puesto que, como veremos, las réplicas puedenintroducir una tercera variable extraña. Nótese, también, que el subindice k seencuentraentre .paréntesis en y i , ( k ) ~porque, , para un. diseñode k quedadeterminadoautomiticamentecuandose conocuadradolatinodado, cen i y j. ’

La hipótesis principal que queremos contrastar es la hipótesis nula y k .+:O para todas las k, es decir, la hipótesis nula de que 110 hay diferencia en la efectividad de los n tratamientos. Sin embargo, podemos contrastar también si la distribucibn de“bloqueadocruzado” del cuadradolatino es efectiva: es decir, podemoscontrastar la hipótesis nula ai = O para todas las i y pj = O para todas ‘las‘;’ (contra alternativas convenientes) para ver si las dos variables extrañas tienen .algiln efecto sobre los fenómenos considerados. Además, podemos contrastar la hipótesis nula p 1 = O para todas las 1 frente a laralternativa de que no todas las pt sean igual a cero, jr este test para los efectbs de la rc;plit*apuede ser importante si las partes del experimentoquerepresentan los cuadrados latinos individuales se realizara4 en diferentes días por técnico3 diferentes, a temperaturas . , diferentes, etc. Las sumas de cuadrados necesarias para desarrollar estos tests se obtienen generalmente por medio de las fórmulas abreviadas siguientes. en las que Ti.. es el totaldelas r.n observaciones en toda la fila i, T.;, es el total de- las r . n observaciones. en toda la coiumna j, T ..1 es el total de las 11’) obsrevaciones . en .la‘ rOplica I, T c k ) es el totaldetodas las r . n observaciones pertenecientes al k-Psimo tratamiento y T . .. e4 .el-.totalmayor de todas las ,r.n2 obgervaciones: _

I

c = -(T...P ran2

. : . .

i

..

b

I

,

(

,

.,

:I

I ” SS(Tr)=z Ten z T&) - .G‘ k-1

, .

1

I

1 ” SSR = Ten -i Z T:..- C -1

+

(efecto

d e fib)

+

266

ANALISIS

DE

LA VARIANZA

Nótese que,una vez más,cada divisor es igual al número de observaciones ea los totales cuadrados correspondientes. Finalmente, los resultados del analisis quedan como se muestra en la siguiente tabla de análisis de la varianza:

Suma de .uadrados

Grado de libertad

n-1

Cudrado medio

SS(TT) MS(TT)

--SS(T T ) n-1

SSR

n-1

n-1

Total

1

MSR -

SSR

MSE

=n"l

ssc

r-1

Réplicas

Error

1 MSR

(n

- l)(rn + r

In2

-1

- 3)

SSE

SST

Como en los casos anteriores, los gradosde libertad paralasuma total de cuadrados es igual a la suma de los gradosdelibertadde las componentes individuales; luego, los gradosde libertad paraerror se encuentran, generalmente, al final por substracción. Parailustrar el análisis deun experimento decuadrado latino con réplica, supongamosquese hacen dos réplicas del experimento desoldadura, empleando las disposiciones siguientes: Hépliccl I I Futldrllrc

1

2

S

I

n

A

C

I3

A

c

267

OTROS DISENOS DE EXPERIMENTOS

Los resultados, mostrando la fuerza de tensión en libras necesaria para separar las terminales soldadas, fueron los siguientes: Réplica I1

Réplicu I

11.0

12.0 13.5

13.5

18.0

11.5

El total para el primer tratamiento (método A) es 14.0

+ 17.0 + 13.5 + 13.0 + 12.0 + 18.0 = 87.5

mientras que los totales para los otros dos tratamientos (mttodos B y,C) son

+ 15.0 + 11.0 + 16.5 + 14.0 + 13.5 = 8 6 5 11.0 + 9.5 + 12.0 + 10.0 + 12.0 + 11.5 = GG.0

16.5

Y

respectivamente.Además, los totales para lastres filas son 81.0. 79.5 y 79.5: los delas tres columnas son 70.0, 92.0 y 78.0; los totales de las dos riplicas son 119.5 y '120.5, y el total'mayor es 240. Entonces. obtenemos C=

SS(TT)

SSR

=

o2 = 3200.0 18 1

[(87.5)2

1

T [(81.0)2 6

SSC = G1 [(70.0)'

+ (8G.5)2 + (CiG.O)'] + ($9.5)* + (79.5)': + ('32.0)' + (7S.O)'I

- 3200.0

=

49.1

- 3200.0 = 0.2 -

:K?OO.O

=

11.3

268

ANALISIS DE LA VARIANZA

Como las razones F para los métodos y los fundentes exceden ambas, a 7.56, vadiferencias, tanto las debidas a los lor de F.,),.para 2 y 10 grados de libertad, las métodos comolasdebidasa los fundentes, son significativas. Como se puede ver por inspección, las diferencias debidasalasotrasdosfuentes de variación (operadores y rtplicas) no son significativas. Para dar un paso más, la prueba de recorrido múltiple de Duncan de la sección 13.4, nos da el siguiente esquema cle clecis i t h con un nivel de significación de 0.01: Mcdiu

Método C

Método B

hfélodo A

11.0

14.4

14.6

Entqnces, llegamos a la conclusión de que el mttodo C nos da, definitivamente, soldaduras más débiles que los 'lnétodos A y B. La eliminación de "tres fuentesextrañas de variabilidadsepuedehacer por medio de un diseño denominado "cuadrado greco-latino". Este diseño es una disposición en cuadro de I? letras latinas y Ir letras griegas, en el que tanto las letras latinas como las griegas forman, cada una, un cuadrado latino; además, cada letra latinaapareceuna vez y sólo una junto con cada letra griega. El siguiente es un ejemplo de un cuadrado greco-latino de 4 X 4:

1

Aa

1

Ir0

1

_

~

_

_

Cr

La construcción d l cuadradosgreco-latinos,llamadostambiéncuadradoslatinos orfogonales, plantea varios problemas matemáticos interesantes, algunos de los cuales se mencionan en el libro de H. B. Mann, citado en la bibliografía.

269

OTROS DISEAOS DE EXPERIMENTOS

Paradarun ejemplo en el que.es conveniente utilizar uncuadrado grecolatino, supongamos que, en el ejemplo de lassoldaduras,seconsiderala temperatura de soldadura como una fuente adicional de variabilidad. Si se emplean tres métodos, los soldadurasatemperaturas diferentes a, /3 y y, juntoconlostres tresoperadores (filas) ylostresfundentes(cdlumnas),sepuedepresentaruna réplica de un experimento de cuadrado greco-latino, en la forma siguiente: Operador I

1I

Fundente 2

Fundente 1

A,

Operador 2

(‘lY

Operador 3

I: 6

Fundente 3

I

,CY

A@

cff

~~

””

ea lh

~

__

I

,

AY. -

.

~

_

_

_

_

1

Entonces,elmétodo A seemplearácon el operador 1, usando el fundente 1 y la temperatura a; con el operador 2; ,el fundente 2 y la temperatura /?; y con el operador 3, el fundente 3 y la temperatura y. Similarmente, el método B se usarh con el operador 1, el fundente 2 y la temperatura y, etc. En un cuadrado greco-latino, cada variable (representada por filas, columnas, letras latinas, o letras griegas) está “igualmente distribuida” sobre las otras variables. Luego, al comparar las medias obtenidas por una .variable, todos los efectos de las otras variables quedan promediados. El análisis de un cuadrado greco-latino es semejante al de un cuadrado latino, con la adición de una fuente extra de variabilidad correspondiente a las letras griegas. Existe una gran variedad de diseños experimentales además de los discutidos en estecapítulo que son útiles para diversos fines. Entre los más corrientemente utilizados están los diseiios de bloques incompletos, que se caracterizan porque cada tratamiento no estárepresentado en cada bloque. Si el nilmero detratamientos investigados en un experimento esgrande, sucede frecuentemente que es imposible encontrar bloques homogéneos, de tal forma que cadaunode los tratamientossepuedaacomodar en un bloque. Por ejemplo, si se van acomparar II pinturas,aplicandocadaunaaunahojadeacero y después calentindola en un horno, será imposible poner todas las hojas en el horno al mismo tiempo. En consecuencia, será necesario utilizar un proyecto experimental en el que k < n tratamientos (pinturas) se incluyan en cada bloque (calentamiento en el horno). Una forma de lograr esto, es asignar los tratamientos a cada hornada en tal modo que cada tratamiento se presente junto con cada otro tratamiento en el mismo nilmero de bloques. Esta clase de proyecto se llama provrcto de hloqrres incompletos equilibrados, Y podemos utilizar el siguiente esquema para J Z = 4 y k = 2: Hornnda

1 2 3 4 66 1

.Pill/llrm

l 3 l 2 l 2

Y Y Y Y y Y

2 4 3 4 4 3

270

ANALISIS

DE

LAVARIANZP

Los proyectos de bloques incompletos equilibrados tienen la ventaja deque se pueden hace; con igual precisi6n las comparaciones entre dos cualesquiera de los Iratamientos. Como los proyectos de bloques incompletos equilibrados requieren demasiados bloques, se han desarrollado muchos otros modelos. La mayoría de estos diseños experihentales surgieron para cubrir lis necesidades específicas de algún investigador, especialmente en el campo de la agricultura. Como hemos indicadoanteriormente, el lenguaje empleado en estos diseños, incluyendo términos como “tratamiento”, “bloques”, etc., provienen de la agricultura. Sólo en los años recientes se han aplicado estos métodos a la experimentación industrial y de ingeniería y, con una aplicación más amplia, es de esperarse que se desarrollen muchos nuevos diseños para cubrir las necesidades de estos campos. EJERCICIOS 1. Seempleó

un cuadrado latinocontresréplicas paracomparartres combustibles experimentales. Los númerosrepresentanlosminutos que los motores E,, E , y E , estuvieron trabajando, operados por los mecánicos M,,M , y M , , teniendo 1 galón de los combustibles A , B o C . Las replicas pertenecen aduplicadosdelexperimento completo hecho (con orden al azar), en tres dias consecutivos.

BZ6

‘19

1‘16

1

24

I

I 1 1 A24

B28

Analizar estos datos y, si la hipbtesis nulareferenteal efecto de los combustibles se puederechazar,aplicareltestdelrecorridomúltiple deDuncanpara analizar las medias correspondientes. 2. En elproblema en el que se distribuyenmuestras de recubrimiento de estaño entre cuatro laboratorios (Sección 1 3 . 1 ) , supongamos queseencuentran diferencias sistemáticas enelpeso del recubrimiento, tantoenla direccióndel laminado comoen !a transversal. para eliminaresas dos fuentesdevariabilidad,cadauna dc dos láminas de

271

OTROS DISENOS, DE EXPERIMENTOS

hojalatase divide en 16 partes, que representan cuatro posiciones a lo largo y cuatro a lo anchode ¡a dirección de laminado.Luego, semandancuatromuestrasdecada láminaa cada uno de los laboratorios A , B, C y D, como se muestra, y los pesos de recubrimientodeterminados son:

1 I .29

D .28

I

laminado

"

B

A .18

D

C

.28 .28

.24 .20 .27 -____

ID

A

.19

.28

.25

a

c

B

C .21

1 1 1

A

Diry:ón

A .25

" "

4

Réplica ¡I

Réplic,a l -

.22

.28

-___ B

B

D

A .20

.23

' .23

A

C

.21

.28

"

A .30

,

D

C .19

C

A .24

.25

.32

A partirde estos datos,determinar si los laboratoriosestánobteniendo resultadoscorrectos. Determinartambiénsihay diferencias en los pesos reales de recubrimiento a lo largo y a lo ancho de la dirección de laminado. !EmpIear.un nivel de significación de 0.0%) 3. Las siguientes sonlasmedidas dela resistencia a larotura(enonzas) de los hilos de lino A , B. C , D y E , obtenidos por S técnicos delaboratoriosen 5 díap diferentes: Técnicos TI Tz T3 7'4 T6

B

A

24.3

30.2

B

27.1

20.7

D

26.5

E

24.5

~-

B 32.3

B 35.8

1 1

A 25.2 29.1 ___-

24.7

A 20.6

E 23.4

A

E 20.7

21.5

B

D

C

D 19.6

D

C

21.4

1

17.3

A 31.0

B 20.6 C

25.2

22.2 " -

D

C 23.9

E

23.6

21.5

Analizar este experimento decuadradolatino yaplicar la pruebadelrecorrido múltiple de Duncan, con a! = 0.01, a las medias de las resistencias a l a rotura de los cinco hilos de lino. 4. U n fabricante de telas desea .determinar cuál, de cuatro agujas diferentes, es mejor para su máquina de coser. Las fuentes de variabilidad que deberán ser eliminadas para hacer esta comparación son: la máquinaempleadaactualmente,el operador y el tipo de hilo. Utilizando el diseño de cuadrado greco-latino mostrado acontinuación(las filas representan operadores;lascolumnasrepresentanmáquinas; lasletras latinas, agujas; y las letras griegas, tipos de hilo), el fabricante anotó los números de prendas rechazadasal cabo de dos días, con los siguientes resultados:

.

272

ANALISIS DE L A VARIANZA

Primer día Ca

42

"- -"I D6

28

13

I

'j

A y 15

!

Bg 8

1

~

C6

B6

DP 6

Aa 24

24

I"

34

Dy 30

21

~

I

I

I

1-

Usando un nivel de significadode 0.05, determinar si hay algunadiferencia entrelas agujss. Determinar también si hay diferencias significativas entre los operarios, las máquinas y los tipos de hilos. 5. Para estudiar la eficacia de diferentes clases de envases, un fabricante de desayunos hizo elsiguienteexperimento decuadrado greco-latino, donde A , B, C, D y E representan tipos diferentes de envases, cy, U, y, 6,y B representan (en orden creciente de magnitud) las cantidades dedinero gastadasenanuncios delproducto el día anterior al experimento, y las filasrepresentan localizaciones diferentes en supermercadosproyectados idhticamente, los cuales, a su vez, e s a n representados porlas cinco columnas.Los números representan las ventas de desayunos de 9 A.M. a 11 A.M.

Aa 50

By 51

1

43

~

47

1O 'r 1 41

42

I

" 42

1

Analizar este experimento. 6 . La siguiente es un modo sencillo de construir cuadrados greco-latinos cuyoladoes un ndmero primoimpar p . Comenzamosporconstruir dos cuadrados latinos. En elprimero, ponemosel número i 9 j- 2 en la casilla correspondientea la i-bsima fila y la jdsima columna, restando p si una entrada excede de p - 1. En elsegundo cuadrado ponemos el ntimero 2i + j- 3 en la casilla correspondiente a la i-&simafila y la /-bsima columna,restando p ó 2p, de tal forma que ninguna entrada exceda de p - 1. Si entonces substituimos por A , B. C. . . . los números o, 1, . , . p - 1 en el primer cuadrado, y por cy, @,y , . . . los números 0 , 1, . . . p - 1 en el segundo cuadlado los cuadrados superpuestos constituyen un cuadrado greco-latino. (a) Verificar que este mttodo se utilizó paraconstruir el cuadrado greco-latino del problema 5.

273

OTROS DISEMOS DE EXPERIMENTOS

( b ) Utilizar este m6todo para construir uncuadrado greco-latino de 7 x 7. (c) Comprobar que este m6todo da un cuadrado greco-latino para primo impar p . [Sugerencia: probarprimero que cada unode es un cuadradolatino y probar después que cada par de letras presenta una vez y.sblo una.] I

de 3 X 3 y otro cualquier ndmero los dos cuadrados latina y griega se

,

8

.,

14

1 I

EXPERINIENTACIBN FACTORIAL

114.1

Experimentación de dos factores

En el capítulo 13, nos interesamos principalmente en los efectos deuna variable CUYOS valores los considerábamos Como “tratamientos”. Las variables extrañas se acomodaron para evitar su influencia en bloques, réplicas, filas o columnas de cuadradoslatinos y enformas más complicadas de diseños. En este capítulo trataremosde los efectos individuales y enconjunto de varias variables, y de las combinaciones de los valores, o niveles, de esas variables que harán ahora el papel de diferentes tratamientos.Las variables extrañas, si lashay, se tratarán como antes. Para considerar un experimento simple de dos factores (dos variables), suponla caldera y el gamos que se desea determinar los efectosdelatemperaturade espesor del horno en el tiempo necesario para hacer coque. Las condiciones experimentales utilizadas son Ancho drl hogar

4 4 8 8 12 12

Temperatura de (grados

1600 1900 1600 1900 1600 1900

F)

puses

275

EXPERIMENTACION DE DOS FACTORES

y si se hacen varios bloques (o réplicas) consistente cada uno en estos seis “tratamientos”, será posible analizar los datos como una clasificación en dos direcciones y contrastarlasdiferencias significativas entrelas medias de los seis tratamientos. Sin embargo, en este caso el experimentador está interesado en conocer algo más que esto: .desea saber si las variaciones en el espesor del horno o en su temperatura afectan al tiempo para hacer el coque, y posiblemente también si cualquiercambioen este tiempo atribuiblea variaciones del espesor,.es el mismo a diferentes temperaturas. Contestar preguntas de este tipo será posible si las condiciones del experimento, los tratamientos, consisten en combinaciones adecuadasde los niveles (o valores) delos distintos factores. Los factores, en este caso, son el espesor y la temperatura; el espesor tiene los tres niveles 4, 8 u 12 pulgadas, mientras que la temperatura tiene los dos niveles 1600 y 1900 grados Fahrenheit. Nótese que los seis tratamientos se escogieron de tal forma que cada nivel del espesor del horno se asocia una vez a cada nivel de la temperatura. En general, si dos factores A y 11 se investigan en a niveles y b niveles, respectivamente, y si hay a.b condiciones experimentales (tratamientos) correspondientes atodaslas combinacions posibles de los niveles de los dosfactores, el experimento resultante se denomina a p e rimento factorial a X b completo. Nótese que, si una o másde las a.b condiciones experimentales se omite, aunasísepodráanalizar el experimento comouna clasificación endos direcciones, peronosepodráanalizarcomo un experimento factorial. Es costumbre omitir la palabra “completo‘“, ya que el experimeato factorial a X b’ debe contener condiciones experimentales correspondientes atodas las combinaciones posibles de los niveles de los dos factores. , Para obtener una estimación del error experimental en un experimento de dos factores, es necesario hacer réplicas, esto es, repetir el conjunto completo de las ;! .b condiciones experimentales, tat como un total de Y veceq, tomando al azar el orden de aplicación’delas condiciones en cada rkplica. Si Yijk es da observación de la k-ésima réplica, tomada con el i-ésimo nivel del factor ,A y el j-ésimo nivel del factor B, el modelo necesario para el análisis de esta clase de experimentos se escribe corrientemente de la siguiente forma ~

+

Yiik

=

f ai

+ + pj

(ab)ij

+ + pk

+

Eijk

para i = 1, 2, . . . a; j == 1, 2, , . b; y k = I , 2, . . Y. En este caso p es la meiia mayor, ai es el efecto del i-ésimo nivel del factor A , p,i es el efecto del j-6simo live1 del,factor B.: (@)ij es la interaccihn, o efecto conjunto, del i-ésimo nivel del :actor A y el j-ésimo nivel del factor B, y pr; es el efectodela k-ésima réplica. [gual que en los modelos empleados en el capítulo 13, supondremos que las e i i k ion vaIores de variables aleatoriasindependientesque tienen distribuciolies nornales con medias cero y varianza comb ~9.También,en forma análogaa las estricciones impuestas a los modelos de las phginas 266 y 275. supondremos que ,

a

2

i=l

b

ai =

,2 Pj

3=1

a

=

b

,X (ap)ii = 3,X (aB)iJ a=1 -1

7

,S, p

k = o

216

FACTORIAL

EXPERIMENTACION

Se puededemostrar que estas restricciones aseguran estimaciones únicas para los parámetros p , ai,Pj, (aP)ij,y m. Para ilustrar el modeloutilizado enun experimento de dos factores, consideremos un experimentocondos réplicas enlasque el factor A sepresenta en dos niveles y el factor B enotrosdos niveles y los efectos dela réplica son O, esto es, pt = p2 = O. En vista de las restricciones impuestasa los parámetros, tendremos

y lasmediasdelaspoblacionescorrespondientesalascuatro condiciones experimentales definidas por los dos niveles del factor A , y los dos niveles delfactor B se pueden escribir de la siguiente forma:

Sustituyendo ,Uijl = pij. por la media de todas las observaciones obtenidas para el i4simo nivel del factor A y el j-ésimo nivel del factor B encontramos cuatro ecuaciones lineales simultáneas que se pueden resolver para losparámetros p, cyl, p1 y (q3) (problema 7 dela página 290). Paracontinuarconnuestra ilustración, supondremos ahoraque p = 10. Si todos los demás efectos son nulos, cada una de las pijk será igual a 10, y la superficie de resputsta será un plano horizontal, como el mostrado en la figura 14.1 (a). Si afiadimos ahora un efecto del factor A, con al= -4, la superficiede respuesta seconvierte enel plano inclinado mostradoen'la figura 14.1 (b), y si añadimos a esto un efecto del factor B, con PI = 5, obtenemos el plano mostrado en la figura 14.1 (c). Nótese que los efectos de los factores A y B son aditivos, esto es, el cambio en la media decualquierfactor al ir del nivel 1 al nivel 2 no depende del nivel del otro factor, y la superficie de respuesta es un plano. Si ahora incluimos una interuccitin, con CY/^),^ = -2, el plano se curva como se muestra en lafigura 14.1 (d), los efectos ya n o son aditivos y la superficie de respuesta ya no esun plzno. Nótese, también,que, si los efectos de las réplicas no fueran igual a cero, habríamos obtenido una superficie diferente para cada réplica: la superficie dela figura 14.1 (d) paracada réplica se habría inclinado cierto nitmero de unidades hacia arriba o hacia abajo. El analisis de un rxperimetlto fuctorial u X h se basa en la siguiente descomposici6n dela suma total decuadrados. Primero, subdividimos SST en componentes atribuidasa los tratamientos, las riplicas (o bloques), y error, por medio de l a identidad

277

EXPERIMENTACION DE DOS FACTORES

Excepto en la notación, esta identidad esequivalente a la delteorema 13.2. La suma total de cuadrados enel primer miembro de la identidad tiene abr- 1 grasuma dos de libertad. Los términos del segundo miembro son, respectivamente, la de cuadrados de los tratamientos, con ab - 1 grados de libertad, la suma de cuadrados de las réplicas (o bloques), con ‘ I - l grados de libertad, y la suma de cuadrados de error, con (ab - 1) ( r - 1) grados de libertad. (Ndtese que los va-

‘r

Pijk

I

A’ (b) Efectos A solamente

(a) Efectos factoriales ausentes

(c) Efectos de 8 suplementario FIG.

(d) Efecto suplementarlo interaccion de

14.1 Efectosfactoriales

278

EXPERlMENTAClON FACTORIAL

riosgradosdelibertadson los mismos quelos del análisis de varianzas de la tabla de la página 256 si sustituimos ab por Q y r por b.) No haynada nuevo en este análisis delosdatos;setratade el análisis de una clasificación en dos direcciones, pero el hecho que distingue a un experimento factorial es que la suma de cuadrados de los tratamientos se puede continuar subdividiendo en componentes correspondientes a los distintos efectos factoriales. Así, para un experimento de dos factores, tenemos la siguiente subdivisih. o descomlos tratamientos: posición, de la suma de cuadrados de a

b

a

i-li-1

i-1

+ ra

r Z Z (pi,. - p...)2 = rb Z (pi.. -

+ r 2: a

b

@.i. 3=l

b

Z

i=lJ.=l

(pi.

-

- vi.. - p.j. + p...I2

El primertérmino del segundomiembromide la variabilidad de las medias correspondientea los diferentes niveles del factor A, y llamamosa esta sumade cuadrados del factor A, SSA. Similarmente, el segundo término es la suma de cuadrados del factor B, SSB, y el tercer témino es la suma de cuadrados de las interacciones, S S ( A B ) , que midela variabilidad de lasmedias gij. que no esatri1 buible a los efectos individuales (o separados) de los factores A y B. Los ab grados de libertad de los tratamientos se subdividen, análogamente, en a - 1 grados de libertad para el efecto del factor A, b - 1 para el efecto del factor B, y

-

ab - 1

- (a - 1) - (b - 1) = (a - l ) ( b

- 1)

grados de libertad para la interacaón. Para ilustrar el análisis deun experimento de dos factores, nos referiremos nuevamente al experimento del coque dekcrito en la página 274 y supondremos que tres réplicas dieron los siguientes tiempos (en horas): Factor B Factor A Temperatura dc Ancho del hogar los guses

1600

4 4 8 8 12 12

1600 1900 1600 1900 1900

108.6

37.7 Total 34.5

Rep. 1

Rep. 9

Rep. S

Total

3.5 2.2 7.1 5.2

3.0 2.3

2.7 2.4 7.5 6.8 11.o 7.3

9.2 6.9 21.5 16.6 32.4 22.0

1o.s 7.6

6.9

4.6 10.6 7.1

36.4

Siguiendo el procedimiento utilizado paraanalizaruna direcciones, calculamos primero el término de corrección

clasificación en dos

Luego, la suma total de cuadrados está dada por

SST = (R.5)2

+ (2.2)2 + . . . + (7.3)2 - 655.22 = 149.38

279

EXPERIMENTACION DE DOS FACTORES

y las sumas de cuadrados de los tratamientos y las réplicas (en lugar de bloques)

esthn dados por

+ (6.9)' + . . . + (22.0)2] - 655.22 = 146.05 1 SSR = g [(36.4j2 + (34.5)' + (37.7)'] - 655.22 = 0.86 1

SS(TT)= 3 [(9.2)'

Finalmente, por substracción, obtenemos

SSE = 149.38 - 146.05 - 0.86 = 2.47 Se puede facilitar la subdivisión de la suma de cuadrados de los tratamientos en componentes para los factores A y B y para lainteracción,construyendo la siguiente tabla en dos direcciones,en que las entradas son los totales de la COlumna derecha de la tabla que da los datos originales: Factor B Temperaruru de los gtrses

Factor A Atrcho del hogur

1600

1900

4

9.2

6.9

16.1

8

21.5

16.6

38.1

12

I

32.4 63.1

1

1

22.0

54.4

108.6

45.5

Empleando fórmulas semejantes a las que utilizamos para calcular las sumas de cuadrados de variosefectosen el capítulo 13, tenemos ahora los dos efectos principales

=

61 [(16.1)' + (38.1)' + (54.4)'] - 655.22

=

1 - [(ti3.1)' 9

+ (15.5)'] - 655.22 = 17.21

y para la interarcicin

SS(AB)

- SSB = 146.0.5 - 122.l.l - 1'7.21 =

SB(Tr) - SS.4

=

5.70

123.14

280

EXPERIMENTACION FACTORIAL

Finalmente, dividiendo las diferentes sumas de cuadrados por sus grados de libertad y dividiendo los medios cuadradospor el error medio cuadrado,obtenemos los resultados mostrados en la siguiente tabla de análisis de la varianza:

La prueba F para réplicas no es significativa ni en el nivel 0.05 ni en el 0.01, pero las otras 3 pruebas F son significativas en elnivel 0.01. En consecuencia, rechazamos la hipótesis nula de que las a ison todas igual a cero, la de que las p.; son todas igual a cero, y la de que las (a/3)ijEon todas igual a cero. Estos resultados se ilustran en la figura 14.2, en la que se ve la tendencia de los tiempos de coquización medios a variar el espesor dehornopara.cadauna delastemperaturas. En esta figura se ve claramenteque el aumento en el tiempo al cambiar el espesor es mayor a la temperatura mAs baja. En vista de esta interacción, sedebe tener mucho cuidado al establecer los resultados de este experimento. Por ejemplo, sería muy erróneo establecer que el efecto deaumentarlatemperaturade Temperatura de los gases

O

4

8

12

Ancho del hogar (pulgada)

Fig. 14.2 Resultados del experimento .de la coqulficaciCh

m3

EXPERIMENTOS DE VARIOS FACTORES

1 6 0 0 O a 1900° F serviría para disminuir e1 tiempo de coquización en (63.1/9) (45.519) = 1.96 horas. De hecho, este tiempo se disminuye en promedio sólo una cantidad tan pequeña como 0.77 horas cuando el espesor de 'las paredes del horno es de 4 pulgadas y en tanto como en 3.47 horas cuándo el espesor es de 12 pulgadas. 14.2 Experimentos de varios factores

Una gran parte de la investigación y experimentación industrial está dirigida a descubrir los efectos individuales y de conjunto de algunos factores en variables que son las mis importantes enlosfenómenos investigadd. El tipo de clasificación en dos direcciones o el de bloquessimples al azar son los tipos de diseños de experimentos más usados, pero la característica distintiva de la mayoría de ellos es la disposición factorial de los tratamientos, o de las condiciones experimentales. Como observamos en la secci6n precedente, se pueden analizar r conjuntos de dafactotos perteneciehtes a a.b condicionesexperimentales,comounexperimento rial con r réplicassi las condicionesexperimentalesrepresentan todas las combinaciones posibles de los niveles de dos factores A y B. En esta, sección, extenderemosel anilisis de los experimentosfactorialesalcaso de más de ,dos factores. esto es, a experimentos donde las condiciones representan toda las combinaciones posibles de los niveles de tres, o más, factores. Para ilustrar elanálisis de unexperimento de muchosfactoresconsideraremos la situación siguiente. Se emplea un baño de solución sulfúrica caliente para quitar los óxidos dela superficie de un metal antes de someterloa un recubrimientoelectrolítico, y sedesea determinar qué factores, además de la concentración de ácido sulfúrico, pueden afectar la conductividad eléctrica del baño. Como se sabe que la concentración de la sal y la temperatura del baño afectan también la conductividad, se planea unexperimento para determinar los efectosindividuales y en conjunto de estas tres variables sobre la conductividadeléctricadel baño. Para cubrir los recomdos de concentraciones y temperaturas que se encuentran normalmente, se decide emplear los niveles siguientes para los tres factores: '

FllCtOr

Nivel I

Nivel 2

Nivel 3

Nivel 4

A . concentración de Acid0 7%

O

G

12

18

B. Concentraci6n de sal I C C. Temperatura del baño

O

10

20

80

100

El experimento factorial resultante necesitará 4.3.2 = 24 condiciones experimentales en cada réplica, donde cada condición experimental es un baño. hecho de acuerdo con las especificaciones. El orden en que se deben tomar estos baños serrin al azar.Supongamos que efectivamentesehan completado dos réplicasdel

EXPERIMENTACION FACTORIAL

RESULTADOS DE LOS EXPERIMENTOS DE I1 \ N O - /lCI,D() I

,

N i d drl f w o r A /I C'

.

Cc,,lducrividl!j (dm!cItcB) /
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF