Probabilidad y Estadistica - Milton.pdf

May 18, 2018 | Author: carolina1217 | Category: Gases, Statistics, Regression Analysis, Linear Regression, Temperature
Share Embed Donate


Short Description

Download Probabilidad y Estadistica - Milton.pdf...

Description

PROBABILIDAD Y ESTADÍSTICA Con aplicaciones para ingeniería y ciencias computacionales Cuarta edición

PROBABILIDAD Y ESTADÍSTICA Con aplicaciones para ingeniería y ciencias computacionales Cuarta edición J. Susan Milton Radford University

Jesse C. Arnold Virginia Polytechnic Institute and State University Traducción:

Jorge Luis Blanco y Correa Magallanes Traductor profesional

Revisión técnica: María Gabriela Cano González Departamento de Matemáticas División de Ingeniería y Arquitectura Instituto Tecnológico y de Estudios Superiores de Monterrey Campus Ciudad de México

A. Leonardo Bañuelos Saucedo Coordinador de Probabilidad y Estadística División de Ciencias Básicas Facultad de Ingeniería Universidad Nacional Autónoma de Méxicco

Luis Eduardo Falcón Morales Departamento de Ciencias Básicas División de Ingeniería Instituto Tecnológico y de Estudios Superiores de Monterrey Campus Guadalajara

Adelita Posada Bolivar Departamento de Ingeniería Industrial y Textil Universidad de las Américas, Puebla

MÉXICO • BUENOS AIRES • CARACAS • GUATEMALA • LISBOA • MADRID NUEVA YORK • SAN JUAN • SANTAFÉ DE BOGOTÁ • SANTIAGO AUCKLAND • LONDRES • MILÁN • MONTREAL • NUEVA DELHI SAN FRANCISCO • SINGAPUR • ST. LOUIS • SIDNEY • TORONTO

Gerente de división: Leonardo Newball González Gerente de producto: Javier Reyes Martínez Editor de desarrollo: Sergio Campos Peláez Supervisor de producción: Timoteo Eliosa García

PROBABI LI DAD Y ESTADÍSTICA CON APLICACIONES PARA INGENI ERÍA Y CI ENCIAS COMPUTACIONALES Prohibida la reproducción total o parcial de esta obra, por cualquier medio, sin autorización escrita del editor.

DERECHOS R ESERVADOS © 2004, respecto a la primera edición en español por McGRAW-HILL/INTERAM ERICANA EDITORES, S.A. DE C.V. A Subsidiary of The McGraw-Hill Companies, Inc. Cedro Núm. 512, Col. Atlampa Delegación Cuauhtémoc 06450, México, D. F. Miembro de la Cámara Nacional de la Industria Editorial Mexicana, Reg. Núm. 736 ISBN 970-10-4308-1

Traducido de la cuarta edición en inglés de: INTRODUCTION TO PROBABILITY AND STATISTICS: PRINCIPLES AND APPLICATIONS FOR ENGINEERING AND THE COMPUTING SCIENCES, FOURTH EDITION. Copyright © 2003, 1995, 1990, 1986 by The McGraw-Hill Companies, Inc. All rights reserved ISBN: 0-07-246836-X

1234567890

09876532104

Impreso en México

Printed in Mexico

ACERCA DE LOS AUTORES

J. Susan Milton es profesora emérita de estadística en la Radford University. La doctora Milton estudió la licenciatura en ciencias en la Western Carolina University, la maestría en la University of North Carolina at Chapel Hill, y el doctorado en estadística en el Virginia Polytechnic Institute and State University. Es una Danforth Associate y recibió el Radford University Foundation Award for Excellence in Teaching. La doctora Milton es autora de Statistical Methods in the Biological and Health Sciences, de Introduction to Statistics, de Probability with the Essential Analysis y de A First Course in the Theory of Linear Statistical Models. Jesse C. Arnold es profesor de estadística en el Virginia Polytechnic Institute and State University. El doctor Arnold estudió la licenciatura en ciencias en la Southeastern State University y la maestría y doctorado en estadística en la Florida State University. Ha sido jefe del departamento de estadística durante 10 años y es miembro de la American Statistical Association, además de ser miembro electo del International Statistics Institute. Ha fungido como presidente de la International Biometric Society (Eastern North American Region) y director de la Statistical Educational Section de la American Statistical Association.

Dedicado a Peggy Arnold Y con un recuerdo amoroso a Enid K. y George A. Milton

CONTENIDO

Capítulo 1 1.1 1.2 1.3

Capítulo 2 2.1 2.2 2.3 2.4

Capítulo 3 3.1 3.2 3.3 3.4

Prefacio Introducción a la probabilidad y el conteo

xv

Interpretación de las probabilidades Espacios muestrales y eventos Eventos mutuamente excluyentes Permutaciones y combinaciones Conteo de permutaciones Conteo de combinaciones Permutaciones de objetos que no se diferencian Resumen del capítulo Ejercicios

3 5 9 9 10 14 15 17 17

Algunas leyes de probabilidad

25

Axiomas de probabilidad La regla general de la adición Probabilidad condicional Independencia y la regla de la multiplicación La regla de la multiplicación Teorema de Bayes Resumen del capítulo Ejercicios

25 26 29 30 34 35 38 38

1

Distribuciones discretas

45

Variables aleatorias Densidades de probabilidad discretas Distribución acumulativa Esperanza y parámetros de una distribución Varianza y desviación estándar Distribución geométrica y la función generadora de momentos Distribución geométrica Función generadora de momentos

45 46 49 51 54 58 59 61

vii

viii

PROBABILIDAD Y ESTADÍSTICA

3.5 3.6 3.7 3.8 3.9

Capítulo 4 4.1

4.2 4.3

4.4 4.5 4.6 4.7

4.8 4.9

Capítulo 5 5.1

5.2 5.3 5.4

Distribución binomial Distribución binomial negativa Distribución hipergeométrica Distribución de Poisson Simulación de una distribución discreta Resumen del capítulo Ejercicios

65 70 72 75 78 80 81

Distribuciones continuas

98

Densidades continuas Distribución acumulativa Distribución uniforme Esperanza y parámetros de una distribución Distribuciones gamma, exponencial y ji cuadrada Distribución gamma Distribución exponencial Distribución ji cuadrada Distribución normal Distribución normal estándar Regla de probabilidad normal y desigualdad de Chebyshev Desigualdad de Chebyshev Aproximación normal de la distribución binomial Distribución de Weibull y confiabilidad Confiabilidad Confiabilidad de los sistemas en serie y en paralelo Transformación de variables Simulación de una distribución continua Resumen del capítulo Ejercicios

98 101 104 105 107 109 110 112 113 115 118 118 121 123 125 129 131 134 134 138

Distribuciones conjuntas

156

Densidades conjuntas e independencia Distribuciones marginales: discretas Distribuciones conjuntas y marginales: continuas Independencia Esperanza y covarianza Covarianza Correlación Densidades condicionales y regresión Curvas de regresión

156 158 158 163 164 167 169 172 174

CONTENIDO

5.5

Capítulo 6 6.1 6.2

6.3

6.4

Capítulo 7 7.1 7.2 7.3 7.4

Capítulo 8 8.1 8.2

8.3 8.4 8.5 8.6 8.7

ix

Transformación de variables Resumen del capítulo Ejercicios

176 180 180

Estadística descriptiva

191

Muestreo aleatorio Representación gráfica de la distribución Diagrama de tallo y hoja Histogramas y ojivas Gráficas de distribución acumulada (ojivas) Estadísticas de muestras Estadísticas de localización Mediciones de variabilidad Gráficas de caja Resumen del capítulo Ejercicios

191 194 195 196 199 202 203 204 207 212 212

Estimación

225

Estimación puntual El método de momentos y el método de máxima verosimilitud Estimadores de máxima verosimilitud Funciones de variables aleatorias: distribución de X Distribución de X Estimación por intervalos y el teorema del límite central Intervalo de confianza para la media: varianza conocida Teorema del límite central Resumen del capítulo Ejercicios

225 229 230 233 235 237 237 242 243 244

Inferencias acerca de la media y varianza de una distribución

259

Estimación de intervalo de la variabilidad Estimación de la media y la distribución T de Student La distribución T Intervalo de confianza para la media: varianza estimada Pruebas de hipótesis Nivel de significancia Pruebas de hipótesis y nivel de significancia de la media Pruebas de hipótesis acerca de la varianza Métodos no paramétricos alternativos Prueba de signo de la mediana

260 262 263 266 268 273 275 280 282 282

x

PROBABILIDAD Y ESTADÍSTICA

Prueba de rango con signo de Wilcoxon Resumen del capítulo Ejercicios

Capítulo 9 9.1

9.2 9.3 9.4

Capítulo 10 10.1 10.2 10.3

10.4 10.5 10.6

10.7

Capítulo 11 11.1

11.2

Inferencias acerca de proporciones Estimación de proporciones Intervalos de confianza para p Tamaño de muestra para estimar p Prueba de hipótesis sobre una proporción Comparación de dos proporciones: estimación Intervalo de confianza de p1 – p2 Comparación de dos proporciones: prueba de hipótesis Proporciones agrupadas Resumen del capítulo Ejercicios

Comparación de dos medias y dos varianzas

285 287 288

312 312 313 315 317 319 320 322 323 325 326

336

Estimación puntual: muestras independientes Comparación de varianzas: la distribución F Comparación de medias: varianzas iguales (prueba agrupada) Intervalo de confianza de µ1 – µ2: agrupada Prueba T agrupada Comparación de medias: varianzas desiguales Comparación de medias: datos por pares Prueba T por pares Métodos no paramétricos alternos Prueba de suma de rangos de Wilcoxon Prueba de rango con signo de Wilcoxon para observaciones por pares Una nota sobre tecnología Resumen del capítulo Ejercicios

336 338 342 343 345 347 349 350 351 352 354 355 357 358

Regresión lineal simple y correlación

378

Modelos y estimación de parámetros Descripción del modelo Estimación de mínimos cuadrados Propiedades de los estimadores de mínimos cuadrados Distribución de B1 Distribución de B0

380 380 382 386 388 391

CONTENIDO

11.3

11.4 11.5

11.6

Capítulo 12 12.1

12.2

12.3

12.4

12.5

12.6 12.7

xi

Estimador de σ 2 Resumen de resultados teóricos Estimación de intervalos de confianza y prueba de hipótesis Inferencias sobre la pendiente Inferencias sobre la intersección Inferencias acerca de la media estimada Inferencias sobre un valor de predicción único Medidas repetidas y falta de ajuste Análisis residual Gráficas residuales Comprobación de la normalidad: gráficas de tallo y hoja y gráficas de caja Correlación Estimación de intervalos y pruebas de hipótesis sobre ρ Coeficiente de determinación Resumen del capítulo Ejercicios

392 393 394 394 397 399 401 405 408 409 412 419 422 425 426 427

Modelos de regresión lineal múltiple

443

Procedimientos de mínimos cuadrados para ajuste de modelos Modelo polinomial de grado p Modelo de regresión lineal múltiple Enfoque matricial de mínimos cuadrados Ecuaciones normales Solución de las ecuaciones normales Regresión lineal simple: formulación matricial Modelo polinomial: formulación matricial Propiedades de los estimadores de mínimos cuadrados Valor esperado de βˆ Estimación de σ 2 y varianza de βˆ

443 444 448 451 453 456 458 460 462 464 465 469 469 470 472 472 473 473 476 477 481 482 483

Estimación de intervalos Intervalo de confianza para los coeficientes Intervalo de confianza para la media estimada Intervalo de predicción sobre una sola respuesta pronosticada Pruebas de hipótesis acerca de los parámetros del modelo Pruebas de una sola variable de predicción Pruebas para una regresión significativa Pruebas acerca de un subconjunto de variables de predicción Uso de variables indicadoras Criterios de selección de variables Método de selección hacia adelante Procedimiento de eliminación hacia atrás

xii

PROBABILIDAD Y ESTADÍSTICA

12.8

Capítulo 13 13.1

13.2 13.3

13.4 13.5

13.6 13.7 13.8 13.9

Capítulo 14 14.1

14.2

Método escalonado Método de R2 máxima Estadística Ck de Mallows Estadística de la suma de los cuadrados de predicción Transformación de modelos y comentarios finales Resumen del capítulo Ejercicios

484 486 486 486 492 495 496

Análisis de varianza

511

Modelos de efectos fijos de clasificación unidireccional El modelo Prueba de H0 Comparación de varianzas Comparaciones por pares Pruebas T de Bonferroni Prueba de rangos múltiples de Duncan Prueba de Tukey Pruebas de contrastes Diseño de bloques completos aleatorizados: efectos fijos El modelo Prueba de H0 Efectividad del uso de bloques Comparaciones por pares Cuadrados latinos Modelos de efectos aleatorios Clasificación unidireccional Modelos de diseño en forma matricial Métodos no paramétricos alternos Prueba de Kruskal-Wallis Prueba de Friedman Resumen del capítulo Ejercicios

512 515 516 522 524 524 526 529 530 533 535 539 539 542 544 547 547 550 553 553 555 556 557

Experimentos factoriales

574

Análisis de varianza de dos factores Prueba H0 Comparaciones por pares Tamaño muestral Extensión a tres factores

575 578 581 587 587

CONTENIDO

14.3

14.4 14.5 14.6

Capítulo 15 15.1 15.2 15.3 15.4

Capítulo 16 16.1

16.2

16.3

16.2

16.5 16.6 16.7

xiii

Experimentos factoriales de modelos aleatorio y mixto Modelo de efectos aleatorios Modelo de efectos mixtos Experimentos factoriales 2k El método de Yates Experimentos factoriales 2k en un diseño de bloques incompleto Experimentos factoriales fraccionarios Resumen del capítulo Ejercicios

587 588 590 590 599 601 604 609 609

Datos categóricos

623

Distribución multinomial Pruebas de bondad de ajuste de ji cuadrada Pruebas de independencia Prueba de independencia r × c Comparación de proporciones Prueba de homogeneidad r × c Comparación de proporciones con datos por pares: prueba de McNemar Resumen del capítulo Ejercicios

623 625 627 631 633 636

Control estadístico de calidad

649

Propiedades de las gráficas de control Monitoreo de medias Distribución de la duración de lote Gráficas de control de mediciones de Shewhart Gráfica X (media) Gráfica R (rango) Gráficas de control de Shewhart para atributos Gráfica P (proporción defectuosa) Gráficas C (número promedio de defectos) Límites de tolerancia Supuesto de distribución normal Intervalo de tolerancia no paramétrico Muestreo de aceptación Muestreo de aceptación de dos etapas Ampliaciones en el control de calidad Modificación de las gráficas de control Procedimientos de diseño paramétricos

650 651 652 655 655 659 662 662 665 667 667 669 669 674 676 676 677

638 639 640

xiv

PROBABILIDAD Y ESTADÍSTICA

Resumen del capítulo Ejercicios

Apéndices A Tablas estadísticas B Respuestas a problemas seleccionados C Demostraciones seleccionadas Índice

678 678

686 725 778 785

CONTENIDO

xv

PREFACIO

La interpretación de gran parte de las investigaciones en ingeniería y ciencias de la computación depende cada vez más de métodos estadísticos. Por añadidura, se espera que el ingeniero en ejercicio comprenda y ayude a implantar las técnicas estadísticas de control de calidad en los centros de trabajo. Por esas razones, es indispensable que los estudiantes en esos campos estén expuestos al razonamiento estadístico en etapa temprana de sus estudios. Este libro de texto tiene como fin servir como primer curso de probabilidad y estadística aplicada para estudiantes de ingeniería y ciencias de la computación. Se espera que este primer curso lo tomen en el nivel de licenciatura. Sin embargo, pueden aprovecharlo estudiantes de posgrado con experiencia mínima, si acaso, en los métodos estadísticos. Este texto no es un recetario estadístico ni un manual para investigadores. Intentamos ubicarlo en un punto medio del camino, de modo que brinde al estudiante la comprensión de la lógica subyacente a las técnicas estadísticas y su aplicación práctica. Un curso de un año en cálculo debe servir de base adecuada para entender todos los conceptos de esta obra. Seleccionamos los ejemplos y ejercicios de manera específica para los estudiantes de ingeniería y ciencias de la computación. Muchos conjuntos de datos son simulados. Sin embargo, la simulación se realizó con cuidado, de modo que los resultados del análisis sean compatibles con los informes de investigaciones recientes. Se indica, siempre que es posible, la referencia a los informes en los que se basan los datos. De tal manera, el estudiante puede darse una idea de los tipos de problemas de ingeniería susceptibles de manejo estadístico. Muchos ejercicios son de respuesta abierta, con la esperanza de que estimulen la discusión en el aula. Se parte del supuesto de que el estudiante tiene acceso a algún tipo de calculadora electrónica. Son muchos los dispositivos de ese tipo existentes en el mercado y gran parte de ellos cuentan con funciones estadísticas. Se recomienda el uso de esas calculadoras, ya que permiten al estudiante concentrarse en la interpretación del análisis, no en los cálculos aritméticos. Debe resaltarse que muchos de los conjuntos de datos presentados son más bien pequeños, de modo que el estudiante no se vea abrumado por los aspectos de cálculo de la estadística. No se pretende implicar que se usen habitualmente conjuntos muy pequeños de datos en ingeniería. De hecho, gran parte de los proyectos de investigación grandes requieren una enorme inversión de tiempo y dinero, además de que producen datos muy abundantes. Por primera vez, en esta cuarta edición xv

xvi

PROBABILIDAD Y ESTADÍSTICA

se incluyeron algunos grandes conjuntos de datos, con el fin de reflejar en mejor forma la realidad que enfrentarán los estudiantes después de titularse. Tales datos se prestan al análisis computarizado. Por ello, también se incluyen ciertas instrucciones de interpretación de los paquetes estadísticos. De éstos, se seleccionaron SAS y MINITAB para fines ilustrativos, sobre la base de su amplia disponibilidad y facilidad de uso. De nuevo, no se pretende implicar que sean superiores a otros paquetes muy conocidos, como SPSS (Statistical Package for the Social Sciences) o BMD (Biomedical Computer Programs, de la University of California Press). Cada capítulo termina con un resumen, que tiene como fin recordar al estudiante los principales temas del capítulo. El resumen también incluye una lista de términos importantes. Asimismo, se proporciona un conjunto de ejercicios para cada sección de cada capítulo. Por añadidura, en todos los capítulos existe un conjunto de ejercicios de repaso, donde se presentan los problemas en orden aleatorio. Se espera que ello sirva para que el estudiante adquiera la capacidad de reconocer el análisis apropiado. Los apéndices incluyen tablas estadísticas, demostraciones seleccionadas y respuestas a todos los ejercicios de número impar y a los ejercicios de repaso. Son diversos los cursos que pueden enseñarse con base en este libro. Su duración puede ir de un trimestre a un año. Es difícil establecer con exactitud qué material puede cubrirse en un tiempo dado, ya que ello depende del tamaño del grupo, madurez académica de los estudiantes y preferencias del profesor. No obstante, sí brindamos algunos lineamientos para el uso de la obra. En particular, el tipo de curso puede ir desde uno cuyo objetivo principal sea familiarizar al estudiante con los aspectos de cálculo de la probabilidad y el manejo de conjunto de datos hasta otro de naturaleza más teórica. En muchos casos, se incluye la prueba o demostración de teoremas en el texto, indicada como tal. Si el profesor quiere hacer menos énfasis en la teoría, puede omitir esas pruebas sin pérdida de la continuidad temática. El complemento del libro es el sitio web, que contiene archivos de datos. La dirección del sitio es www.mhhe.com/miltonarnold.

CAMBIOS EN LA CUARTA EDICIÓN Por recomendación de los usuarios de las primeras tres ediciones del libro, se realizaron algunos cambios para mejorar esta cuarta edición. Se añadieron nuevos ejercicios en toda la obra. A sugerencia de los revisores, algunos conjuntos de datos son grandes, de modo que el estudiante aprenda a manipularlos en la computadora. Algunas de las demostraciones más difíciles se incluyen en un apéndice. Ello hace que el texto tenga una naturaleza más aplicada, al mismo tiempo que se conserva ese material para quienes estén interesados particularmente en los fundamentos matemáticos de los conceptos estadísticos presentados. El análisis de la distribución F y la comparación de dos medias se han simplificado con el uso de la prueba F para la comparación de varianzas. Otros materiales nuevos son el análisis del método de comparaciones por pares de Tukey y una sección sobre el uso de límites de tolerancia en el control de calidad. Capítulo 1 Contiene una introducción a la probabilidad y el conteo. Capítulo 2 Continúa el estudio de la probabilidad. Se presentan las leyes que la rigen, así como las nociones de probabilidad condicional e independencia. Capítulo 3 Se introduce el concepto de variables aleatorias. Se analizan las propiedades generales de las distribuciones discretas. Se presenta la noción de valor esperado y se desarrollan las ideas de la media y varianza de una distribución. La función generadora de momentos se incluye

PREFACIO

xvii

como un medio para identificar los primeros dos momentos de una distribución. Se estudian a fondo distribuciones discretas de importancia. El capítulo termina con una sección opcional sobre la simulación de distribuciones discretas. Capítulo 4 Guarda paralelismo con el capítulo 3, en este caso con énfasis en las distribuciones continuas. Capítulo 5 Se analizan las distribuciones conjuntas de tipos discreto y continuo. Se introducen en forma teórica las nociones de covarianza, correlación y regresión. Capítulo 6 Es el vínculo entre los conceptos más teóricos de la estadística y los métodos de análisis de datos. Aquí, se presenta una introducción a las técnicas clásicas de manejo de datos y a la estadística descriptiva. También se inicia el estudio de algunas técnicas novedosas de análisis de datos exploratorio. Capítulo 7 Se considera la noción de estimación puntual y de intervalo de los parámetros poblacionales. Se estudian los métodos de momentos, máxima verosimilitud y estimadores insesgados. Asimismo, se estudia en parte la teoría de la distribución, en particular la distribución de X. La función generadora de momentos se usa como huella digital para identificar la distribución de algunas variables aleatorias importantes, que subyacen a los métodos estadísticos analizados en capítulos ulteriores. Capítulo 8 Se inicia con el estudio de los métodos clásicos de análisis de datos. El tema de interés es el de inferencias sobre la localización y variabilidad de una distribución basada en una muestra. Se estudian la estimación y prueba de hipótesis, además de presentar la distribución T. Se incluye un análisis completo de la puesta a prueba de la significación. Los métodos estudiados suponen que el muestreo es parte de una distribución normal. El capítulo termina con una sección sobre las pruebas no paramétricas de localización. Éstas resultan especialmente útiles cuando parecen transgredirse los supuestos de normalidad. Capítulo 9 En este capítulo, se consideran las inferencias de una proporción. Se inicia el estudio de los problemas de dos muestras, al mostrar la forma de comparar dos proporciones basadas en muestras aleatorias independientes. Capítulo 10 Versa sobre los métodos usados para comparar dos varianzas y dos medias. Se presenta la distribución F como un medio para comparar varianzas. En primer término, se comparan medias cuando se supone que las varianzas son iguales. El procedimiento de Smith-Satterthwaite se usa para contrastar medias cuando las varianzas parecen ser desiguales. Todos esos procedimientos suponen el muestreo independiente. También se estudia un procedimiento de comparación de medias basadas en datos por pares. El capítulo termina con una sección sobre pruebas no paramétricas de dos muestras para localización. Capítulo 11 En él se estudian la regresión lineal simple y correlación. Se analiza el método de mínimos cuadrados para la estimación de parámetros en el modelo de regresión. Se presentan la estimación y prueba de hipótesis. El desarrollo del modelo de regresión lineal simple es más bien completo, como preparativo para los casos de regresión más generales que son tema del capítulo 12. La distribución normal de dos variables se estudia como material necesario para la estimación y prueba de la correlación producto-momento. Por último, se incluye una nueva sección sobre el análisis de residuos. Capítulo 12 El modelo de regresión lineal simple se amplía a los modelos múltiple y polinomial. Los métodos del capítulo 11 se expanden en forma matricial. Se comentan procedimientos de selección de variables junto con los ejemplos.

xviii

PROBABILIDAD Y ESTADÍSTICA

Capítulo 13 El procedimiento de análisis de varianza se estudia para varios diseños experimentales de un factor. Este capítulo contiene un análisis de bloques completamente aleatorizados, además de ciertos resultados sobre la efectividad del uso de bloques. Se incluye una sección sobre cuadrados latinos, además de material acerca de las comparaciones múltiples de Bonferroni y Tukey. Finalmente, se presenta la estimación de los componentes de la varianza en modelos de efectos aleatorios. Capítulo 14 Contiene el análisis de los experimentos factoriales y material sobre factoriales fraccionarios. Capítulo 15 Es una introducción al estudio de los datos categóricos. Se analizan las pruebas de bondad de ajuste ji cuadrada. Se comentan las pruebas de tablas de contingencia de la independencia y homogeneidad en los casos 2 × 2 y r × c. Capítulo 16 Se analizan los conceptos básicos de control estadístico de calidad. El control de procesos se estudia mediante los gráficos de control, además de presentar nociones básicas del muestreo de aceptación. También se incluye la relación de este último con la prueba de hipótesis. Se estudian brevemente los métodos Taguchi. Por último, se presenta una nueva sección sobre los límites de tolerancia. El lector debe estar consciente de que la estadística es por igual un arte y una ciencia. Por ello, siempre hay espacio para el debate acerca de cómo analizar correctamente un conjunto de datos dado. En esta obra, se presentan métodos que han soportado la prueba del tiempo y otros relativamente nuevos. En muchos casos, con toda intención se deja en manos del estudiante decidir si rechaza una hipótesis nula específica o no lo hace. La razón de ello es sencilla: nadie puede decir realmente cuán infinitesimal debe ser una probabilidad a modo de afirmar que es demasiado pequeña para ser aleatoria. En algunos casos, el lector podría estar en desacuerdo con nuestras conclusiones. ¡Siéntase en libertad de hacerlo!

AGRADECIMIENTOS Deseamos expresar nuestra gratitud a Chemical Rubber Company, Bell Laboratories y American Society for Testing and Materials por el uso de tablas estadísticas. Vaya un agradecimiento especial al SAS Institute por la autorización de uso de su paquete con fines ilustrativos. Una nota de agradecimiento particular para la doctora Jill Stewart por las muchas horas que dedicó a comprobar las respuestas y redactar los manuales de soluciones. También deseamos agradecer a David Dietz, Peter Galuardi, Joyce Watters y el resto del personal de McGraw-Hill por su apoyo y consejos. Un agradecimiento muy especial para los revisores siguientes, por sus numerosas sugerencias útiles durante la preparación de ésta y las tres ediciones previas: Lynne Billard, de la University of Georgia; Ahankar P. Bhattacharyya, de la Texas A & M University; Martha L. Bouknight, del Meredith College; David C. Brooks, de la Seattle Pacific University; Saibal Chattopadhyay, de la University of Nebraska-Lincoln; Daren B. H. Cline, de la Texas A & M University; Michael W. Ecker, de la Pennsylvania State University; Peter G. Furth, de la Northeastern University; David Groggel, de la Miami University of Ohio; Robert Lacher, de la South Dakota State University; Chand K. Midha, de la University of Akron; H. N. Nagaraja, de la Ohio State University; Roxanne Peck, del California Polytechnic and State University; Larry G. Richards,

PREFACIO

xix

de la University of Virginia; Don Ridgeway, de la North Carolina State University; Thomas N. Roe, de la South Dakota State University; Paul Speckman, de la University of Missouri–Columbia; Larry Stephens, de la University of Nebraska; Harrison M. Wadsworth, del Georgia Institute of Technology, y Vasar Waikar, de la Miami University of Ohio. De parte de J. C. Arnold, un agradecimiento especial por la inspiración y apoyo incesantes de mi esposa Peggy, así como el amor y aliento de nuestros hijos Christa y Chuck. También desearía expresar mi gratitud a los colegas del Virginia Polytechnic Institute and State University por sus útiles y enriquecedoras disquisiciones. J. Susan Milton Jesse C. Arnold

CAPÍTULO

1

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

¿Q

ué es la “estadística” y por qué su estudio reviste importancia para ingenieros y científicos? Con el fin de responder a esta pregunta, en seguida se describe un aspecto del trabajo de los científicos, llamado “construcción de modelos”. En lo fundamental, el trabajo de los científicos consiste en describir lo que ven, tratar de explicar lo observado y usar esos conocimientos para predecir eventos del mundo en que vivimos. La explicación con frecuencia asume la forma de un modelo físico. Un modelo es una explicación teórica del fenómeno de estudio y, desde luego, suele expresarse en forma verbal. A efecto de aplicar el modelo para objetivos de predicción, esa descripción verbal debe traducirse en una o más ecuaciones matemáticas. Éstas pueden usarse para determinar el valor de una variable específica del modelo, con base en el conocimiento de los valores de otras variables del propio modelo. Por ejemplo, la ley del gas perfecto afirma que la presión y volumen de un gas pueden variar simultáneamente si cambia la temperatura del gas. Este modelo verbal puede traducirse en una ecuación matemática, como sigue: Ley del gas perfecto: PV = RT donde P es la presión del gas, V es su volumen, T es su temperatura y R es una constante, denominada constante de los gases. El valor numérico de esa constante depende de las unidades físicas elegidas para otros términos del modelo. Una vez que se conocen los valores de dos de las tres variables (P, V o T ), se puede calcular el valor de la tercera con el modelo matemático. Por ejemplo, con presión de 760 mmHg y temperatura de 273 K, se supone que una mol de cualquier gas tiene volumen de 22.4 L. La constante de gases en este caso tiene un valor aproximado de 62.36. Según la ley del gas perfecto, un gas con volumen de 5 L a temperatura de 100 K tendría presión P, dada por: 1

2

o

PROBABILIDAD Y ESTADÍSTICA

PV = RT = 62.36T P(5) = 62.36(100) P = 1 247.2 mmHg

En otras palabras, el modelo lleva a esperar que la presión sea de 1 247.2 mmHg. Se dice que un modelo como la ley del gas perfecto es “determinista”. Lo es en el sentido de que permite determinar un valor preciso de la variable de interés bajo condiciones de experimentación específicas. Dicha ley sí describe algunos gases reales a temperaturas y presiones moderadas. Por desgracia, muchos otros gases reales no pueden describirse con éste o cualquier otro modelo determinista, ¡en especial a temperaturas y presiones extremas! Bajo tales circunstancias, debe encontrarse otra forma de predecir el comportamiento del gas con algún grado de certidumbre. Ello puede hacerse con la ayuda de métodos estadísticos. ¿Qué son los métodos estadísticos? Son métodos con los que se toman decisiones basadas en el análisis de datos recopilados en experimentos de diseño minucioso. Puesto que los experimentos no pueden diseñarse para tener en cuenta toda posible contingencia, siempre existe algo de incertidumbre en la ciencia experimental. Los métodos estadísticos están ideados para permitir la evaluación del grado de incertidumbre de los resultados. Es posible clasificarlos de manera general en tres categorías, a saber: estadística descriptiva, estadística inferencial y construcción de modelos. La estadística descriptiva abarca las técnicas analíticas y gráficas que posibilitan describir o representar visualmente un conjunto de datos. A la estadística inferencial le conciernen los métodos con los que es posible derivar conclusiones acerca de un gran grupo de objetos, al observar únicamente una porción de los objetos de dicho grupo. La idea precedente lleva a la definición siguiente: Definición: El grupo total de objetos acerca del cual se obtienen conclusiones se llama población. Un subconjunto o parte de la población que se obtiene y se usa para extraer las conclusiones sobre esa población se denomina muestra. La construcción de modelos entraña el desarrollo de ecuaciones predictivas a partir de datos experimentales. Estas ecuaciones se denominan modelos estadísticos y permiten la predicción del comportamiento de un sistema complejo, además de la evaluación de las probabilidades de error. No se trata de categorías mutuamente excluyentes. Dicho de otra manera, los métodos creados para solucionar problemas en un área suelen tener aplicación en otra. En esta obra, interesan las tres áreas. Un estadístico o un usuario de la estadística siempre trabajan en dos mundos. El mundo ideal corresponde al nivel de la población y es de naturaleza teórica. Se trata del mundo que nos gustaría ver. El mundo real es el de la muestra. Es el nivel en que se opera en verdad. Se espera que las características de la muestra reflejen satisfactoriamente las de la población. En otras palabras, se trata a la muestra como un microcosmos en el que se refleja la población. Este concepto se ilustra en la figura 1.1. La parte de las matemáticas en que se basan los métodos estadísticos es la teoría de la probabilidad. Por ello, se inicia el estudio de la estadística con una consideración de conceptos básicos de probabilidad.

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

3

Población (mundo ideal, teórico e inobservable, cuyas características se pretende describir)

Muestra (mundo real y tangible, cuyas características se pueden observar)

FIGURA 1.1 La muestra se considera como una población en miniatura. Se espera que el comportamiento de la variable de estudio en la muestra brinde una imagen precisa de su comportamiento en la población.

1.1 INTERPRETACIÓN DE LAS PROBABILIDADES Ante la pregunta “¿Sabe algo acerca de probabilidad?” muchas personas responden de inmediato “¡No!”. Es usual que no sea así. La capacidad de interpretar las probabilidades se da por sentada en nuestra cultura. Todo mundo ha oído oraciones como “Las probabilidades de lluvia hoy son de 95%” u “Hoy se tienen 0% de probabilidades de que llueva”. Se supone que el público en general o las personas pueden interpretar correctamente esos valores. La interpretación de las probabilidades se resume como sigue: Interpretación de las probabilidades 1. La probabilidad es un número entre 0 y 1, inclusive, que refleja cuán factible es que ocurra un evento físico. 2. Que la probabilidad sea cercana a 1 indica que es muy factible que ocurra el evento. Ello no significa que el evento ocurrirá, sino únicamente que se considera que es una ocurrencia común. 3. Que la probabilidad sea cercana a 0 refleja que es muy poco factible que tenga lugar el evento. Ello no significa que necesariamente no ocurrirá, sino tan sólo que es un evento raro. 4. Que la probabilidad sea cercana a 1/2 indica que es igualmente factible que el evento ocurra o no. 5. Puesto que los números entre 0 y 1 pueden expresarse como porcentajes que van de 0 a 100, es usual representar las probabilidades en forma porcentual. Ello es particularmente común en escritos de naturaleza no técnica. Las propiedades recién descritas son lineamientos para interpretar las probabilidades una vez que se conocen, sin que indiquen cómo asignar probabilidades a los eventos. Tres métodos son de uso

4

PROBABILIDAD Y ESTADÍSTICA

generalizado: el enfoque personal, el de frecuencia relativa y el clásico. Estos métodos se ilustran en los ejemplos siguientes: Ejemplo 1.1.1. Ocurrió un derrame de petróleo. Un científico ambientalista pregunta: “¿Cuál es la probabilidad de que este derrame pueda controlarse antes de que cause daño generalizado en las playas cercanas?” Son muchos los factores que participan, entre ellos el tipo de derrame, el volumen de petróleo derramado, las condiciones de viento y agua durante las operaciones de limpieza, y la cercanía de las playas. Estos factores hacen que este derrame sea único. Se pide al científico que elabore un juicio de valor, es decir, que asigne una probabilidad al evento con base en su opinión personal informada.

La ventaja principal del enfoque personal es que siempre resulta aplicable. Todo mundo puede tener una opinión personal acerca de cualquier cosa. Su principal desventaja, por supuesto, radica en que su precisión depende de la exactitud de la información disponible y la capacidad del científico para evaluar de manera correcta esa información. Ejemplo 1.1.2. Un ingeniero eléctrico estudia la demanda máxima en una planta generadora de electricidad. Se observa que en 80 de 100 días seleccionados aleatoriamente para estudio, de registros pasados, la demanda máxima ocurre entre las 18:00 y 19:00 horas. Es natural suponer que la probabilidad de que ello ocurra en cualquier otro día son por lo menos aproximadamente de:

80 = 0.80 100 Esta cifra no es simplemente una opinión personal. Se basa en la experimentación y observación repetidas. Es una frecuencia relativa.

El enfoque de frecuencia relativa puede usarse siempre que sea posible repetir muchas veces el experimento y observar sus resultados. En tales casos, la probabilidad de que ocurra el evento A, denotada como P[A], se calcula de manera aproximada como sigue: Aproximación de frecuencia relativa P[ A]

número de veces que ocurrió el evento f = n número de veces que se realizó el experimento

La desventaja de este enfoque consiste en que el experimento no puede ser una situación que ocurra una sola vez, sino que debe ser susceptible de repetirse. Recuérdese que toda probabilidad obtenida de esta manera es una aproximación. Se trata de un valor basado en n ensayos. Sin embargo, tienden a ser menores los cambios de los valores aproximados que se obtienen conforme aumenta el número de ensayos. Así pues, con un número de ensayos alto, suele ser muy precisa la probabilidad aproximada que se obtenga con el enfoque de la frecuencia relativa. Ejemplo 1.1.3. ¿Cuál es la probabilidad de que el hijo de una pareja heterocigota para el color de los ojos (es decir, que cada uno de sus miembros tiene genes para ojos cafés y azules) tenga ojos cafés? A fin de responder a esta pregunta, debe tomarse nota de que, puesto que el niño recibe un gen de cada proge-

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

5

nitor, las posibles combinaciones son (café, azul), (azul, café), (azul, azul) y (café, café), donde el primer miembro de cada par indica el gen que recibe del padre. Ya que cada progenitor tiene iguales probabilidades de contribuir con un gen para ojos cafés o para ojos azules, las cuatro posibilidades tienen la misma probabilidad. El gen de ojos cafés es dominante, de modo que tres de las cuatro posibilidades llevan a ojos cafés. Así pues, las probabilidades de que el hijo tenga ojos cafés son de 3/4 = 0.75.

En este ejemplo, la probabilidad no se basa en una opinión personal ni en la experimentación repetida. De hecho, se calcula con el método clásico. Éste puede usarse solamente cuando es razonable suponer que los posibles resultados del experimento son igualmente probables. En este caso, la probabilidad de que ocurra el evento A está dada por la fórmula clásica: Fórmula clásica P[ A] =

n( A) número de formas en que puede ocurrir = n( S ) número de formas que puede efectuarse el experimento

Una ventaja de este método es que no requiere experimentación. Por añadidura, si en verdad los resultados son igualmente posibles, la probabilidad asignada al evento A no es una aproximación. Es una descripción precisa de la frecuencia con la que ocurrirá el evento A.

1.2

ESPACIOS MUESTRALES Y EVENTOS

Para determinar qué es “probable” en un experimento se requiere indagar primero qué es “posible”. En otras palabras, el primer paso en el análisis de muchos experimentos es elaborar una lista de las posibilidades del experimento, llamada espacio muestral. Este término se define como sigue:

Definición 1.2.1 (espacio muestral y punto muestral). Un espacio muestral de un experimento es un conjunto S con la propiedad de que cada resultado físico del experimento corresponde solamente a un elemento de S. Cada uno de estos elementos se llama punto muestral.

Es habitual que pueda identificarse sin dificultades el espacio muestral cuando el número de posibilidades es pequeño. Por ejemplo, se vio ya que si una pareja heterocigota para el color de los ojos tiene un hijo, los genotipos posibles en el hijo están dados por: S = {(café, azul), (azul, café), (azul, azul), (café, café)} Es útil tener un sistema para desarrollar el espacio muestral a medida que aumenta el número de posibilidades. Uno de esos sistemas es el diagrama de árbol. El ejemplo siguiente ilustra el concepto respectivo.

6

PROBABILIDAD Y ESTADÍSTICA

Sistema primario

Primer sistema de respaldo

s

Segundo sistema de respaldo s

s Sistema primario

Sistema primario

s

n

Primer sistema de respaldo s

s

s

n n

s n n

a)

b)

n n

Número Punto de rama muestral o trayectoria 1 (sss)

n

2

(ssn)

s

3

(sns)

n

4

(snn )

s

5

(nss)

n

6

(nsn)

s

7

(nns)

n

8

(nnn)

c)

FIGURA 1.2 Elaboración de un diagrama de árbol

Ejemplo 1.2.1. Durante un viaje al espacio, el sistema de cómputo primario está respaldado por dos sistemas secundarios. Éstos funcionan independientemente uno de otro, de modo que las fallas en uno de los sistemas no tengan efecto en los demás. Interesa el estado funcional de los tres sistemas en el momento del lanzamiento. ¿Cuál es el espacio muestral apropiado de este experimento? Puesto que interesa principalmente que cada sistema esté en condiciones de funcionar cuando ocurra el lanzamiento, sólo se necesita encontrar un espacio muestral que aporte dicha información. Se usa un árbol para generar dicho espacio. El sistema primario está en condiciones funcionales (sí) o no funcionales (no) en el momento del lanzamiento. Esto se indica en el diagrama de árbol de la figura 1.2a, donde sí = s y no = n. De igual modo, el primer sistema de respaldo está en condiciones de funcionar o no lo está, como se ilustra en la figura 1.2b. Por último, el segundo sistema de respaldo está en condiciones funcionales o no lo está. El árbol se completa como se ilustra en la figura 1.2c. El espacio muestral S del experimento puede leerse en el árbol al considerar cada una de las ocho ramas por trayectorias distintas del árbol, a saber: S = {sss, ssn, sns, snn, nss, nsn, nns, nnn}

Una vez identificado un espacio muestral adecuado, se utilizan los fundamentos de la teoría de conjuntos para describir los casos físicos del experimento. Ello se logra al considerar lo que se llama evento en sentido matemático. Definición 1.2.2 (evento). Todo subconjunto A de un espacio muestral se llama evento. El conjunto vacío ∅ se denomina evento imposible, y el subconjunto S, evento cierto. Ejemplo 1.2.2. Considérese un lanzamiento espacial en el que el sistema de cómputo primario está respaldado por dos sistemas secundarios. El espacio muestral del experimento es: S = {sss, ssn, sns, snn, nss, nsn, nns, nnn} donde, por ejemplo, sns denota el hecho de que el sistema primario y el segundo sistema de respaldo están en condiciones de funcionar al momento del lanzamiento, no así el primer sistema de respaldo (véase ejemplo 1.2.1). Supóngase que:

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

7

A: el sistema primario es funcional B: el primer sistema de respaldo es funcional C: el segundo sistema de respaldo es funcional El evento matemático correspondiente a cada uno de estos eventos físicos se identifica al enumerar los puntos muestrales que correspondan al caso del evento. Así pues, se tiene: A = {sss, ssn, sns, snn} B = {sss, ssn, nss, nsn} C = {sss, sns, nss, nns} Otros eventos pueden describirse usando los precedentes como fundamento. Por ejemplo, el evento “el sistema primario o el primer sistema de respaldo son funcionales” está indicado por el conjunto A ∪ B, es decir, la unión de los conjuntos A y B. Recuérdese, de los fundamentos de matemáticas, que la unión de A con B consiste en todos los puntos muestrales que están en el conjunto A o en el conjunto B o ambos. Así pues: A∪B=

sistemas primario o primero = {sss, ssn, sns, snn, nss, nsn} de respaldo funcionales

Nótese que la conjunción “o” denota la unión de conjuntos. El evento “el sistema primario y el primer sistema de respaldo son funcionales” está dado por el conjunto A ∩ B, o sea, la intersección de los conjuntos A y B. La intersección de dos conjuntos consiste de todos los puntos muestrales que son parte de ambos conjuntos. En otras palabras, es el conjunto de puntos que tienen en común. Aquí: A ∩ B = sistema primario y primer sistema de respaldo funcionales = {sss, ssn} Adviértase que la conjunción “y” refleja la intersección de los conjuntos. El evento “el sistema primario o el primer sistema de respaldo son funcionales, mientras que el segundo sistema de respaldo no lo es” está dado por (A ∩ B) ∩ C', donde C' es el complemento del conjunto C. El complemento de un conjunto consiste en los puntos muestrales del espacio muestral que no están en el conjunto en cuestión. Así: (A ∪ B) ∩ C' =

sistema primario o primer sistema de respaldo funcionales; = {ssn, snn, nsn} pero con segundo sistema de respaldo no funcional

Nótese que “pero” también se traduce como una intersección de conjuntos, y “no”, como un complemento de un conjunto.

A continuación, una breve pausa para considerar una diferencia básica entre el espacio muestral: S1 = {(café, azul), (azul, café), (azul, azul), (café, café)} del ejemplo 1.1.3 y el espacio muestral: S2 = {sss, ssn, sns, snn, nss, nsn, nns, nnn} del ejemplo 1.2.1. Puesto que cada uno de los progenitores tiene iguales probabilidades de contribuir con un gen para ojos azules u ojos cafés, los puntos muestrales de S1 son la misma probabilidad. Ello permite usar el método clásico para calcular la probabilidad de que tenga ojos cafés un hijo de la pareja heterocigota para el color de los ojos. Si se denota ese evento con A, puede sacarse en conclusión que: P[A] = P[{(café, azul), (azul, café), (café, café)}] =

n( A) 3 = n( S ) 4

8

PROBABILIDAD Y ESTADÍSTICA

Primera parte muestreada

Segunda parte muestreada

Tercera parte muestreada

Cuarta parte muestreada

s

s c

s c

s c c

...

FIGURA 1.3 Muestreo de una línea de producción en busca de partes defectuosas.

Sin embargo, es incorrecto suponer que los puntos muestrales de S2 tienen iguales probabilidades. Ello sería verdadero si y sólo si cada uno de los tres sistemas tuviera iguales probabilidades de fallar o de ser funcional en el momento del lanzamiento. ¡La tecnología actual brinda mucho mejores probabilidades! La pregunta principal que debe responderse es: “¿Cuál es la probabilidad de que al menos un sistema esté funcionando en el momento del lanzamiento?” En otras palabras, cuál es la probabilidad: P[{sss, ssn, sns, snn, nss, nsn, nns}] Es posible responder a esta pregunta, como se demostrará más adelante. No obstante, los puntos muestrales no tienen iguales probabilidades, por lo que es imposible responderla con el método clásico. No todos los árboles son simétricos, como el ilustrado en la figura 1.2. En algunos casos, terminan en diferentes etapas. El ejemplo 1.2.3 ilustra un experimento de este tipo. Ejemplo 1.2.3. Considérese un proceso de producción, del cual se sabe que genera partes defectuosas con tasa de una por cada ciento. El proceso se vigila mediante la prueba de partes seleccionadas aleatoriamente durante el proceso de producción. Supóngase que tan pronto se identifica una parte defectuosa, se detiene la producción y se verifican todos los parámetros de las máquinas. Interesa estudiar el número de partes que se somete a prueba para identificar la primera parte defectuosa. En el árbol de la figura 1.3, c representa la vigilancia continua, y s, la interrupción del proceso de producción. Nótese que el proceso y la rama terminan en cuanto se identifica un producto defectuoso. Por tal razón, algunas ramas son mucho más cortas que otras. Adviértase también que, en teoría, el árbol continúa en forma indefinida. El espacio muestral que genera el árbol es: S = {s, cs, ccs, cccs, ccccs, . . .} Ya que las partes defectuosas ocurren con la probabilidad de 0.01, debe ser evidente que las ramas de este árbol no tienen probabilidades iguales.

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

9

Eventos mutuamente excluyentes En ocasiones, el interés se centra en dos o más eventos que no pueden ser simultáneos. En otras palabras, la presencia de uno impide la del otro. Se dice que esos eventos son mutuamente excluyentes. Ejemplo 1.2.4.

Considérese el espacio muestral: S = {sss, ssn, sns, snn, nss, nsn, nns, nnn}

del ejemplo 1.2.1. Los eventos: A1: sistema primario funcional = {sss, ssn, sns, snn} A2: sistema primario no funcional = {nss, nsn, nns, nnn} son mutuamente excluyentes. Es imposible que el sistema primario funcione y falle al mismo tiempo. Desde el punto de vista matemático, A1 y A2 no tienen puntos muestrales comunes. Dicho de otra manera, A1 ∩ A2 = ∅.

El ejemplo 1.2.4 indica la definición matemática del término eventos “mutuamente excluyentes”. Definición 1.2.3 (eventos mutuamente excluyentes). Dos eventos A1 y A2 son mutuamente excluyentes si y sólo si A1 ∩ A2 = ∅. Los eventos A1, A2, A3, . . . son mutuamente excluyentes si y sólo si Ai ∩ Aj = ∅, con i ≠ j.

1.3

PERMUTACIONES Y COMBINACIONES

Son varias las formas de determinar las probabilidades de un evento, como se indica en la sección 1.1. Es posible calcular la probabilidad de que ocurra un evento con el método clásico, si la descripción física del experimento lleva a creer que los posibles resultados son igualmente probables. En este caso, la probabilidad del evento A está dada por:

P [ A] =

n ( A) n( S )

Así pues, para calcular una probabilidad con el método clásico debe ser factible cuantificar dos conceptos: n(A), que es el número de veces que puede ocurrir el evento A, y n(S), el número de formas en que puede proceder el experimento. Las listas y árboles se vuelven inmanejables a medida que el experimento se torna más complejo. Se requieren métodos de conteo alternos. Son comunes dos tipos de problemas de conteo. El primero es el de permutaciones, y el segundo, el de combinaciones. Estos términos se definen como sigue:

10

PROBABILIDAD Y ESTADÍSTICA

Definición 1.3.1 (permutación). definido.

Una permutación es un arreglo de objetos en un orden

Definición 1.3.2 (combinación). cualquier orden.

Una combinación es una selección de objetos en

Nótese que la característica que distingue una permutación de una combinación es el orden. El problema es de permutación y puede solucionarse con la técnica llamada principio de multiplicación si reviste importancia el orden con el que se emprende una acción. En caso de que el orden sea irrelevante, se trata de un problema de combinación, que se resuelve con una fórmula desarrollada más adelante. Ejemplo 1.3.1 1.

Los péptidos y proteínas suelen contener varios de 20 aminoácidos distintos. Un pentapéptido consistente en los cinco aminoácidos: alanina-valina-glicina-cisteína-triptófano tiene propiedades distintas y, de hecho, es un compuesto diferente del pentapéptido: alanina-glicina-valina-cisteína-triptófano

2.

que contiene los mismos aminoácidos. Los péptidos son permutaciones de las unidades llamadas aminoácidos, puesto que en ellos reviste importancia la secuencia u orden de los aminoácidos en la cadena. Una fundidora embarca bloques de motor en lotes de 20 unidades. Antes de la aceptación de un lote, se seleccionan en forma aleatoria tres bloques y se prueba su dureza. Esta prueba se realiza sólo en tres bloques, ya que se requiere cortarlos a la mitad y, en consecuencia, se desechan dichos bloques. Los tres bloques seleccionados son una combinación de bloques de motor. Interesan sólo los tres seleccionados, no el orden en que se elijan.

Conteo de permutaciones Una vez que se identifica un problema en el que reviste importancia el orden, la pregunta siguiente que debe responderse es: “¿Cuántas permutaciones o arreglos de los objetos dados son posibles?” Es usual que sea posible responderla con el principio de multiplicación. Principio de multiplicación Considérese un experimento que ocurre en k etapas. Denótese con ni el número de formas en que puede ocurrir la etapa i, con i = 1, 2, 3, . . . , k. En total, el experimento puede ocurrir en Πik = 1 ni = n1 ⋅ n2 · n3 · · · nk formas. El ejemplo siguiente ilustra el uso de este principio.

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

11

Ejemplo 1.3.2. ¿En cuántas formas pueden arreglarse los cinco aminoácidos alanina, valina, glicina, cisteína y triptófano para formar un pentapéptido? Se trata de un experimento de cinco etapas, puesto que los cinco aminoácidos deben ocupar su lugar en la cadena. Ello se indica al trazar cinco posiciones y tomar nota mental de qué representan: Primer ácido Segundo ácido Tercer ácido de la cadena de la cadena de la cadena

Cuarto ácido de la cadena

Quinto ácido de la cadena

¿En cuántas formas puede ocurrir la primera etapa del experimento? Respuesta: cinco. Son cinco los ácidos disponibles y cualquiera de ellos podría ocupar la primera posición. Esto se indica al colocar el cinco en la primera posición: 5 Primer ácido Segundo ácido Tercer ácido de la cadena de la cadena de la cadena

Cuarto ácido de la cadena

Quinto ácido de la cadena

Una vez terminada la primera etapa, ¿de cuántas maneras puede ocurrir la segunda etapa? Respuesta: cuatro. Puesto que se afirmó que cada pentapéptido tiene cinco aminoácidos, no se permite repetir el primer aminoácido de la cadena. El segundo miembro de la cadena debe ser uno de los cuatro aminoácidos restantes. Ello se refleja con el cuatro en la segunda posición: 5

4

Primer ácido Segundo ácido Tercer ácido de la cadena de la cadena de la cadena

Cuarto ácido de la cadena

Quinto ácido de la cadena

Una línea de razonamiento similar lleva a la conclusión de que la tercera etapa puede ocurrir en tres formas, la cuarta en dos formas y la quinta en una forma. Con el principio de multiplicación, se tiene: 5

·

4

·

3

Primer ácido Segundo ácido Tercer ácido de la cadena de la cadena de la cadena

·

2 Cuarto ácido de la cadena

·

1

= 120

Quinto ácido de la cadena

pentapéptidos que pueden formarse a partir de estos cinco aminoácidos.

Son varios los lineamientos que deben tenerse en cuenta cuando se usa el principio de multiplicación: Lineamientos de uso del principio de multiplicación

1. Buscar la repetición o su ausencia. A veces, es posible que se repitan los objetos, no así en otras. Que se permita la repetición o no es algo que depende del contexto físico del problema. 2. Buscar la sustracción. Considérese el evento A. En ocasiones, resulta difícil, sino es que imposible, encontrar directamente n(A). Sin embargo, S = A ∪ A'. Puesto que A y A' no tienen puntos en común, n(S) = n(A) + n(A' ). Ello implica que n(A) = n(S) – n(A' ). 3. Si una etapa del experimento tiene una restricción especial, debe pensarse primero en esa restricción.

12

PROBABILIDAD Y ESTADÍSTICA

Los lineamientos precedentes se ilustran en el ejemplo siguiente. Ejemplo 1.3.3. El código del ADN-ARN es un código de tipo molecular en el que la secuencia de moléculas contiene información genética significativa. Cada segmento del ARN se compone de “palabras”. A su vez, cada palabra especifica un aminoácido dado y consiste en una cadena de tres ribonucleótidos. Cada uno de los ribonucleótidos de la cadena es la adenina (A), uracilo (U), guanina (G) o citosina (C). 1. 2. 3.

¿Cuántas palabras pueden formarse? En este ejemplo, se permite la repetición. Con el principio de multiplicación, se tienen 4 · 4 · 4 = 64 palabras de ARN posibles. ¿Cuántas de estas palabras incluyen alguna repetición? La sustracción se usa en la respuesta a esta pregunta. Son 64 las palabras posibles. Conforme al principio de multiplicación, 4 · 3 · 2 = 24 sin nucleótidos repetidos. Las 40 (64 – 24) restantes contienen alguna repetición. ¿Cuántas de las 64 palabras terminan con los nucleótidos uracilo o citosina y no contienen repeticiones? Puesto que existe una restricción en cuanto a la última posición de la cadena, se la considera primero al colocar el 2 en la tercera posición. 2 Primera

Segunda

Tercera

Una vez tomada en cuenta la restricción, se advierte que no está permitida la repetición. Ello significa que el nucleótido de la tercera posición no puede usarse de nuevo. La primera posición puede llenarse con cualquiera de los tres nucleótidos restantes, y la segunda, con cualquiera de los dos que no se hayan usado. Según el principio de multiplicación, el número de palabras que terminan con el uracilo o citosina y no contienen repeticiones es: 3 Primera

·

2 Segunda

·

2

= 12

Tercera

El uso del principio de multiplicación frecuentemente genera un producto de la forma n(n – 1)(n – 2) · · · 3 · 2 · 1, donde n es un entero positivo. Por ejemplo, · · se halló que el número de péptidos que pueden formarse con cinco aminoácidos distintos es 5 · 4 · 3 · 2 · 1. Este producto puede denotarse con la llamada notación factorial.

Definición 1.3.3 (notación factorial). Sea n un entero positivo. Se llama n factorial al producto n(n – 1)(n – 2) · · · 3 · 2 · 1 y se denota con n! Cero factorial, que se denota con 0!, es por definición 1. El número de pentapéptidos que pueden formarse con cinco aminoácidos distintos es 5! cuando se usa esta notación. Aunque todavía no es evidente la necesidad del cero factorial, su propósito será obvio un poco más adelante. Una fórmula de conteo de permutaciones puede obtenerse fácilmente del principio de multiplicación. Supóngase que se tienen n objetos distintos y sólo se usan r objetos del conjunto en cada ordenamiento. ¿Cuántas permutaciones son posibles en este caso? Denótese dicho número con nPr. Nótese que el subíndice de la izquierda indica el número de objetos distintos que se tiene; la P denota el hecho de

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

13

que se cuentan permutaciones, y el subíndice de la derecha, el número de objetos en cada ordenamiento. Puesto que cada permutación es un ordenamiento de r objetos distintos, se necesitan r posiciones: Primer objeto

Segundo objeto

Tercer · · · r-ésimo objeto objeto

Se tienen n opciones para la primera posición, ya que se cuenta con n objetos distintos. No se permite la repetición, de modo que el número de permutaciones está dado por: n

(n – 1)

·

Primer objeto

(n – 2) · · ·

·

Segundo objeto

Tercer objeto

(?) r-ésimo objeto

Para hallar el último número del producto se requiere tomar nota de que el número que se resta de n en cada factor es la unidad menos el número de posición. Así pues, el factor r será n – (r – 1) = n – r + 1. Ahora, se tiene que: n

Pr = n (n – 1) (n – 2) · · · (n – r + 1)

Nótese que:

n! n( n − 1)( n − 2) . . . ( n − r + 1)( n − r )( n − r − 1) . . . 3 ⋅ 2 ⋅ 1 = ( n − r )! ( n − r )( n − r − 1) . . . 3 ⋅ 2 ⋅ 1 Luego de sustituir, se ha demostrado que la fórmula para calcular el número de permutaciones de n objetos distintos, de los cuales se toman r objetos en un momento dado, está expresada en el teorema siguiente. Teorema 1.3.1. El número de permutaciones de n objetos distintos, de los cuales se toman r objetos a la vez, denotado con nPr, es: n

Pr =

n! (n − r )!

Ejemplo 1.3.4 1. 2.

P4 =

9! 9! 9 . 8 . 7 . 6 . 5! = = = 3 024 (9 − 4)! 5! 5!

P7 =

7! 7! 7! = = = 5 040 (7 − 7)! 0! 1

9

7

Nótese que la aplicación del teorema 1.3.1 requiere que deban ser distintos los objetos que se ordenan, no se permitan las repeticiones y no puedan imponerse restricciones en ninguna posición del

14

PROBABILIDAD Y ESTADÍSTICA

ordenamiento. ¡Esta fórmula no resuelve todos los problemas de permutaciones! El principio de multiplicación debe de ser lo primero que se venga a la mente cuando se advierte que el problema incluye un orden, natural o impuesto.

Conteo de combinaciones Hasta este punto, se han considerado problemas de conteo en que el orden reviste importancia. Ahora, la atención se centra en situaciones en las que el orden es irrelevante. En otras palabras, se centra la atención en problemas de combinaciones, no de permutaciones. Es posible deducir una fórmula muy útil para calcular el número de combinaciones de n objetos distintos, de los cuales se seleccionan r objetos a la vez. Nótese que ordenar r objetos tomados de n disponibles es un proceso de dos etapas. Primero deben seleccionarse los r objetos; el número de formas de seleccionarlos se denota con nCr. Los r objetos seleccionados luego deben disponerse en orden, lo que puede lograrse en r! formas. De conformidad con el principio de multiplicación, el número de ordenamientos de r objetos tomados de n objetos es: n

Pr = nCr · r!

Al despejar nCr en la ecuación y aplicar el teorema 1.3.1, se tiene que: Pr n! = r! r! (n − r )! Este resultado se resume en el teorema siguiente y se ilustra en el ejemplo 1.3.5. n

Cr =

n

Teorema 1.3.2. El número de combinaciones de n objetos distintos, de los cuales se seleccionan  n r a la vez, denotados con nCr o   , está dado por: r   n n!   = C = n r  r  r !( n − r )!

Ejemplo 1.3.5.

1. 2.

5

C3 =

5! 5! 5 ⋅ 4 ⋅ 3! = = = 10 3!(5 − 3)! 3!2! 3!2 ⋅ 1

5  5! 5!   = 5C0 = = =1 !( )! !5! − 0 5 0 0  0

Es usual que al principio resulte problemático distinguir entre las combinaciones y permutaciones. Deben buscarse las palabras clave “seleccionar” y “ordenar”. La primera indica que es un problema de combinaciones, y la segunda, que se busca una permutación.

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

15

Ejemplo 1.3.6. En una fundidora, se identifica un lote de 20 bloques de motor, de los cuales cinco contienen defectos internos. El comprador selecciona tres bloques al azar y prueba su dureza. Se aceptará el lote si no se identifican defectos. ¿Cuál es la probabilidad de que se acepte este lote? A fin de responder esta pregunta, hay que considerar dos aspectos: el número de formas de seleccionar tres bloques de los 20 disponibles y el número de formas de seleccionar tres bloques de los 20 sin que ninguno tenga defectos. La primera cantidad está dada por:

20

C3 =

20! 20 ⋅ 19 ⋅ 18 ⋅ 17! = = 1 140 3!17! 3 ⋅ 2 ⋅ 1⋅ 17!

Los tres motores de la muestra deben seleccionarse de los 15 motores sin defectos del lote para que no se obtengan motores defectuosos. Ello puede lograrse en:

15

C3 =

15! 15 ⋅ 14 ⋅ 13 ⋅ 12! = = 455 12!3! 3 ⋅ 2 ⋅ 1⋅ 12!

formas. Puesto que los motores de prueba se eligen al azar, tienen la misma probabilidad todas y cada una de las 1 140 muestras posibles. Al usar el método clásico de cálculo de probabilidades, se tiene:

P[se acepta el lote] =

455 1 140

Permutaciones de objetos que no se diferencian Hasta este punto, se han considerado sólo problemas de permutaciones que podrían incluir repeticiones o no incluirlas. A continuación, se analizan otras en las que es inevitable la repetición. La pregunta que debe responderse es: “¿Cuántos ordenamientos distintos de n objetos son posibles si algunos de los objetos son idénticos y, por ende, no se puede diferenciarlos?” Un ejemplo muestra que a estas alturas ya se tienen las herramientas para responderla. Ejemplo 1.3.7. Considérese una computadora con 16 puertos y supóngase que en un momento dado cada puerto está en uso (u), no se usa aunque su estado sea funcional (n) o no funciona (i). ¿Cuántas configuraciones son posibles, en las que 10 puertos estén en uso, cuatro no se usen pese a que funcionan y dos más no funcionen? Una secuencia típica de esta naturaleza sería: uuiuinnunuunuuuu La determinación del número de formas en que pueden permutarse tales puertos para formar otros ordenamientos requiere considerar los 16 puertos. Si fuera posible controlar su uso, se tendría frente a sí un proceso de tres pasos. Estos pasos son: Paso 1: Seleccionar 10 puertos para su uso. Ello puede hacerse en 16C10 = 8 008 formas. Paso 2: Seleccionar cuatro de los seis puertos restantes como no usados y funcionales. Ello puede hacerse en 6C4 = 15 formas. Paso 3: Seleccionar los dos puertos restantes como puertos que no funcionan. Ello puede hacerse en 2C2 = 1 forma.

16

PROBABILIDAD Y ESTADÍSTICA

El principio de multiplicación garantiza que el proceso de tres pasos en su totalidad pueda realizarse en: C10 · 6C4 · 2C2 = (8 008)(15)(1)

16

= 120 120 formas

Úsese la solución al problema anterior para plantear una fórmula general útil en la resolución de otros problemas que requieran permutaciones de objetos que no se diferencian. La expresión C · C · C puede escribirse como: 16 10 6 4 2 2

16

16! 6! 2! 10!6! 4!2! 2!0! 16! = 10!4!2!

C10 ⋅ 6C4 ⋅ 2C2 =

Nótese que los términos de este producto son predecibles a partir del problema original. El 16! aparece en el numerador porque se tienen 16 puertos. Los términos 10!, 4! y 2! resultan del hecho de que se permutan tres tipos de letras, a saber, 10 u, 4 n y 2 i. Ello hace pensar en que la solución de un problema de permutación de este tipo requiere determinar n, que es el número total de objetos permutado, y n1, n2, . . . nk, que es el número de cada uno de los k tipos de objetos en cuestión. Así pues, la fórmula general del número total de ordenamientos distintos de estos objetos está dada por: Permutaciones de objetos que no se diferencian

n! n1! n2! ⋅ ⋅ ⋅ nk !

n = n1 + n2 + ⋅ ⋅ ⋅ + nk

Un argumento general similar al precedente muestra que esta fórmula es válida para todos los valores de n, n1, n2, . . . , nk. Ejemplo 1.3.8. Un ingeniero de tránsito debe ajustar el tiempo de cambio de la luz en una serie de 10 semáforos de la calle principal de un pequeño poblado. En un momento dado, el semáforo puede estar con las luces roja, ámbar o verde encendidas. ¿Cuántas variantes de colores de la serie de semáforos son posibles al principio? Si las luces se encienden aleatoriamente al inicio, ¿cuál es la probabilidad de que inicialmente se tengan tres semáforos con luz roja, cinco con luz ámbar y dos con verde? Es un proceso de 10 pasos, con tres opciones en cada uno. Según el principio de multiplicación, el número de formas posibles de distribución de los colores es: 3 · 3 · 3 · 3 · 3 · 3 · 3 · 3 · 3 · 3 = 310 = 59 049 La fórmula de permutaciones de objetos que no se diferencian arroja: 10! = 2 520 3! 5! 2!

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

17

formas distintas en que se pueden tener tres semáforos en rojo, cinco en amarillo y dos en verde. Así pues, la probabilidad de obtener la distribución inicial está dada por: 2 520 = 0.0427 59 049

RESUMEN DEL CAPÍTULO En este capítulo, se analiza la interpretación de probabilidades. También se presentan tres métodos para asignarlas a los eventos. Se los llama enfoques personales, de frecuencia relativa y clásico. Asimismo, se presentan ideas y términos importantes, que se deben conocer. Se trata de: Espacio muestral Punto muestral Evento Evento imposible Evento cierto

Eventos mutuamente excluyentes Permutación Combinación n! 0!

El principio de multiplicación se usa en la resolución de problemas de permutación. Se aplica este principio para deducir la fórmula de nPr, que es el número de permutaciones de n objetos distintos, de los cuales se ordenan r objetos a la vez. Asimismo, se deduce la fórmula para calcular nCr, el número de combinaciones de n objetos distintos, de los cuales se seleccionan r en un momento dado.

EJERCICIOS Sección 1.1

1. Se ha identificado recientemente un riesgo ambiental en la sobreexposición a asbesto en el aire. De una muestra de 10 edificios públicos de más de 20 años de antigüedad, en tres se identificó aislamiento con materiales que producen un número excesivo de artículos de asbesto en el aire. ¿Cuál es la probabilidad aproximada de que otro edificio del mismo tipo tenga el problema? ¿Cuál método usará usted en la asignación de esta probabilidad? 2. Se selecciona una muestra de 75 puentes en una región y se inspecciona en búsqueda de debilidad estructural. Si 30 de los puentes de la muestra resultan tener problemas graves, ¿cuál es la probabilidad estimada de que el siguiente puente muestreado en la región tenga problemas estructurales graves? ¿Cuál método de asignación de probabilidades se utiliza para obtener este cálculo? 3. La hemofilia es un defecto hereditario de la sangre ligado al género que se caracteriza por la prolongación del tiempo de coagulación sanguínea, lo cual dificulta el control de hemorragias inclusive en lesiones leves. En el caso de una mujer portadora de la hemofilia clásica, existe 50% de probabilidad de que su hijo varón herede la enfermedad. Si la portadora da a luz dos hijos varones, ¿cuál es la probabilidad de que ambos padezcan el trastorno? ¿Qué enfoque probabilístico se utiliza para responder a esta pregunta?

18

PROBABILIDAD Y ESTADÍSTICA

4. Una fundidora produce balatas para automóviles. Un lote específico de 50 de estas balatas incluye dos con rebaba que se pasaron por alto en el proceso de fabricación. Si se selecciona al azar una parte del lote para instalarla en un automóvil, ¿cuál es la probabilidad de que tenga rebabas? ¿Es una aproximación de frecuencia relativa o una probabilidad clásica? Sección 1.2

5. La fisión ocurre cuando el núcleo de un átomo capta una partícula subatómica, llamada neutrón, y la divide en dos núcleos más ligeros. Ello hace que se libere energía. Al mismo tiempo, se emiten otros neutrones, dos o tres en promedio. Si al menos uno de ellos es captado por otro núcleo fisionable, es posible una reacción en cadena. a) Considere una reacción en que se emiten inicialmente tres neutrones. Denote con c que otro núcleo capta el neutrón, y con n, que no lo capta. Construya un árbol que denote el posible comportamiento de los tres neutrones. b) Liste los puntos muestrales generados con el árbol. c) Liste los puntos muestrales que conforman cada uno de los eventos siguientes: A1: es posible una reacción en cadena A2: son captados los tres neutrones A3: es imposible una reacción en cadena d ) ¿Son mutuamente excluyentes A1 y A2? ¿Son mutuamente excluyentes A1 y A3? ¿Son mutuamente excluyentes A1, A2 y A3? e) La probabilidad de que un neutrón sea captado depende de su energía, que es distinta en cada neutrón. Con tales circunstancias, ¿es correcto afirmar que la probabilidad de que sean captados los tres neutrones es de 1/8, ya que sólo puede ocurrir en una forma y existen ocho ramas en el árbol del inciso a? Explique su respuesta. 6. En estudios de balística realizados durante la Segunda Guerra Mundial, se descubrió que en el fuego tierra a tierra, los proyectiles de artillería tienden a caer en forma elíptica, como la que se muestra en la figura 1.4. La probabilidad de que caigan en la elipse interna es de 0.50, y la de que caigan en la elipse externa, de 0.95. (“Statistics and Probability Applied to Problems of Antiaircraft Fire in World War II”, E. S. Pearson, Statistics: A Guide to the Unknown, HoldenDay, San Francisco, 1972, pp. 407-415.) a) Se considera que el disparo tiene éxito (e) si el proyectil cae en la elipse interna, y en caso contrario, que es un fracaso ( f ). Elabore un árbol que represente el disparo de tres proyectiles sucesivos. b) Liste los puntos muestrales generados con el árbol. c) Denote con A1 el evento de que un disparo tiene éxito, con A2 el evento de que el segundo disparo lo tiene, y con A3 el evento de que el tercer disparo también es exitoso. Enumere los puntos muestrales que conforman cada uno de los tres eventos. ¿Se trata de eventos mutuamente excluyentes? Explique su respuesta desde los puntos de vista práctico y matemático. d ) Describa verbalmente el evento A1' y luego enumere los puntos muestrales que lo componen. e) Describa verbalmente el evento A1 ∩ A2' ∩ A3' y enumere los puntos muestrales que lo conforman.

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

rn Conto 95% Al arma

19

o s e lí p ti c o s 50%

Blanco

FIGURA 1.4 De los proyectiles, 50% cae en la elipse interna.

f ) Explique por qué puede usarse el método clásico de probabilidad para encontrar la probabilidad del evento descrito en el inciso e y calcule dicha probabilidad. 7. Una computadora en el hogar está conectada con un servidor a través de un módem telefónico. La primera marca repetidamente hasta establecer el contacto. Por supuesto, el proceso de marcado termina una vez logrado el contacto telefónico. Sea que c denota el hecho de que se establece contacto en un intento específico, y n, que no se establece. a) Elabore un diagrama de árbol para representar el proceso de marcado. b) ¿Son igualmente probables las trayectorias del árbol? c) Enumere los puntos muestrales que genera el árbol. ¿Acaso puede completarse esta lista? d ) Enumere los puntos muestrales que constituyen el evento A: se establece contacto a lo sumo en cuatro intentos. e) Señale un ejemplo de dos eventos que no son imposibles y sí mutuamente excluyentes. 8. Una batería de artillería puede disparar cinco proyectiles en sucesión rápida. Los disparos cesan tan pronto se da en el blanco. Sea que h denota que se dio en el blanco y m que el disparo falló. a) Trace un árbol para representar los posibles disparos de estos proyectiles a un blanco que se acerca. b) ¿Existen diferencias entre este árbol y el ilustrado en el ejemplo 1.2.3? Explique su respuesta. c) Enumere los puntos muestrales que genera el árbol. d ) Enumere los puntos muestrales que constituyen los eventos siguientes: A1: se disparan exactamente dos proyectiles A2: se disparan a lo más dos proyectiles ¿Son mutuamente excluyentes estos eventos? Explique su respuesta. Sección 1.3

9. Evalúe cada una de las expresiones siguientes: a) 9! b) 6! c) 7P3 d ) 6P2 e) 5P5 f ) 6P6 10. Al investigar la ley del gas ideal, se realizarán experimentos con cuatro presiones diferentes y tres temperaturas distintas. a) ¿Cuántas condiciones experimentales se estudiarán?

20

PROBABILIDAD Y ESTADÍSTICA

Motor principal

Sistema propulsor de servicio

Módulo de servicio de mando

Módulo de excursión lunar

Motor del módulo lunar

FIGURA 1.5 Diagrama simplificado del sistema del Apolo.

11.

12. 13.

14.

b) Si cada condición experimental se repite cinco veces, ¿cuántos experimentos se realizarán con un gas dado? c) ¿Cuántos experimentos deben efectuarse para obtener cinco repeticiones de cada condición experimental con cada uno de seis gases distintos? En la configuración de un sistema de cómputo, para que la empresa lo use en el control de calidad, un ingeniero tiene cuatro opciones de computadora: IBM, VAX, Honeywell o HP. Son seis las marcas de monitores que pueden adquirirse y tres los tipos de impresoras gráficas. a) Si todo el equipo es compatible, ¿en cuántas formas puede diseñarse el sistema? b) Si el ingeniero necesita usar un paquete de software estadístico que está disponible sólo para equipos IBM o VAX, ¿de cuántas maneras puede configurar el sistema? En el ejercicio 6, se consideró el experimento de disparar tres proyectiles de artillería en sucesión. Cada disparo se clasificó como éxito o fracaso. Use el principio de multiplicación para verificar que el número de trayectorias del árbol que representa este experimento es ocho. En la misión Apolo que llevó a hombres hasta la Luna, se recurrió a un sistema cuya estructura básica se muestra en la figura 1.5. Los cinco componentes tenían que funcionar adecuadamente para que el sistema lo hiciera con éxito. Sea que se identifica cada componente como funcional (F ) o no funcional (N ). De tal suerte, la secuencia FFFFN denota un estado en el que funcionan todos los componentes, excepto el motor del módulo lunar. (“Striving for Reliability”, Gerald Lieberman, Statistics: A Guide to the Unknown, Holden-Day, San Francisco, 1972, pp. 400-406.) a) ¿Cuántos estados son posibles? b) ¿Cuántos estados son posibles en los que no funcione el motor del módulo lunar? c) Se considera que la misión tiene éxito al menos parcialmente si funcionan los primeros tres componentes. ¿Cuántos estados representa una misión por lo menos parcialmente exitosa? d ) La misión es un éxito total si y sólo si funcionan los cinco componentes. ¿Cuántos estados representa una misión totalmente exitosa? La unidad básica de almacenamiento en las computadoras es el bit. Un bit es una posición de almacenamiento que puede estar encendida (1) o apagada (0) en un momento dado. En la conversión de imágenes en una forma que pueda transmitirse electrónicamente, se usa un elemento de imagen, llamado pixel. Cada pixel se cuantifica en tonos de gris y se codifica con el código binario. Por ejemplo, un pixel con cuatro tonos de gris puede codificarse con dos bits al designar dichos tonos como 00, 01, 10 y 11. a) ¿Cuántos tonos de gris pueden cuantificarse con un código de cuatro bits? b) ¿Cuántos bits son necesarios para codificar un pixel cuantificado en 32 tonos de gris?

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

21

15. Se realizarán pruebas con cinco recubrimientos usados en la protección de cables de fibra óptica contra el frío extremo. Las pruebas se efectuarán en orden aleatorio. a) ¿En cuántos órdenes pueden llevarse a cabo las pruebas? b) Si dos de los recubrimientos son de un fabricante, ¿cuál es la probabilidad de que las pruebas de esos recubrimientos se realicen una después de la otra? 16. Se está investigando la efectividad de los polímeros irradiados para separar el benceno del agua. Se estudiarán tres polímeros. Cada uno se pondrá a prueba con cuatro temperaturas distintas y tres niveles de radiación diferentes. a) ¿Cuántas condiciones experimentales distintas se estudiarán? b) Si cada condición experimental se repetirá cinco veces, ¿cuántos experimentos deben efectuarse? 17. Evalúe cada una de las expresiones siguientes: b) 8C3 a) 9C4 c)

 8    5

 8 d)    0

18. Un contratista tiene ocho proveedores, a los cuales puede comprar insumos eléctricos. Seleccionará aleatoriamente a tres de ellos y pedirá a cada uno que presente una cotización del proyecto. ¿De cuántas maneras puede seleccionarse a los proveedores? Si su compañía es uno de los ocho proveedores, ¿cuál es la probabilidad de que tenga oportunidad de cotizar el proyecto? 19. Un ingeniero químico tiene siete tratamientos distintos, cuya eficacia desea comparar en la producción de un molde de arena que pueda usarse en el moldeo de hierro fundido. Desea comparar cada tratamiento con todos los demás. ¿Cuántas comparaciones de tipo par tendrá que efectuar? En otras palabras, ¿en cuántas formas es posible seleccionar estos tratamientos, dos en cada ocasión? 20. Es necesario participar en una lotería para tener la oportunidad de entrar al McNeill River Brown Bear Sanctuary, en Alaska, un santuario de osos pardos. En un año dado, participan 2 000 personas en una lotería, de las cuales se elige aleatoriamente un conjunto de 120 nombres. Suponga que participa con un amigo en la lotería. a) ¿De cuántas maneras puede seleccionarse aleatoriamente un conjunto de 120 nombres, de los 2 000 que participan en la lotería? b) ¿En cuántas formas es posible la selección aleatoria de modo que usted y su amigo queden incluidos entre los seleccionados? c) ¿Cuál es la probabilidad de que los seleccionen a ambos? 21. Una compañía tiene 10 programadores, ocho analistas de sistemas, cuatro ingenieros en sistemas y tres estadísticos. Se elegirá un “equipo” para un nuevo proyecto de largo plazo. El equipo consistirá en tres programadores, dos analistas de sistemas, dos ingenieros en sistemas y un estadístico. a) ¿En cuántas formas puede seleccionarse el equipo? b) Si el cliente insiste en que se incluya en el proyecto a un ingeniero con el que ha trabajado anteriormente, ¿de cuántas maneras puede seleccionarse al equipo? 22. Una compañía recibe un embarque de 20 discos duros. Antes de aceptarlo, selecciona aleatoriamente cinco de ellos y los somete a prueba. El embarque se acepta si los cinco discos

22

23.

24.

25. 26.

27.

PROBABILIDAD Y ESTADÍSTICA

cumplen con las especificaciones, en caso contrario se regresan todos al fabricante. Si tres de los 20 discos son defectuosos, ¿cuál es la probabilidad de que no se acepte el embarque? Se usa una gráfica de control para vigilar el conteo promedio de hilos que produce una máquina de fabricación de tela Spandex. Se obtienen muestras periódicas y cada una se clasifica en una de cinco categorías: controlada superior al promedio, controlada promedio, controlada inferior al promedio, incontrolada alta, e incontrolada baja. Indique, en la obtención de una serie de 20 muestras, el número de formas en que puede tenerse una serie en la que haya exactamente: a) Cinco muestras controladas superior al promedio, igual número de controladas inferior al promedio, la misma cantidad de controladas en promedio, tres muestras incontroladas altas, y el resto de incontroladas bajas. b) Dieciocho muestras controladas y dos incontroladas. El embargo petrolero de 1973 originó el estudio de la posibilidad de instalar medidores automáticos para reducir los costos de las compañías eléctricas. Un procedimiento estudiado incluía el uso de mensajes de 128 bits. A veces, ocurrían errores de transmisión que daban por resultado una reversión de dígitos de uno o más bits. ¿Cuántos mensajes pueden enviarse, que contengan exactamente dos errores de transmisión? Sugerencia: Piense en un mensaje como una permutación de 128 objetos, cada uno de los cuales es correcto (c) o incorrecto (i). En el estudio de una reacción química, se realizarán 12 experimentos. Se usarán cuatro temperaturas distintas en tres ocasiones, en cada una con temperaturas seleccionadas en orden aleatorio. ¿Cuál es el número de órdenes en que puede realizarse la serie de experimentos? Un sistema de apertura de puertas de garaje tiene seis interruptores de conmutación, cada uno con tres posiciones: arriba, centro y abajo. a) ¿De cuántas maneras puede configurarse estos interruptores? b) Si un ladrón conoce el tipo de sistema de apertura y desconoce la configuración, ¿cuál es la probabilidad de que pueda adivinarla en el primer intento? c) ¿Cuál es el número de configuraciones posibles en el que dos de los interruptores estén en la posición arriba, otros dos en la posición abajo y los dos restantes en el centro? Considere el ejemplo 1.2.1. a) Sin ver el diagrama de árbol, ¿cuántas trayectorias de árbol representan el hecho de que exactamente dos de las tres computadoras sean funcionales en el momento del lanzamiento? Verifique su respuesta con la enumeración de las trayectorias. b) Si se usan 10 computadoras en lugar de tres, el árbol de la figura 1.1 podría expandirse para responder a preguntas sobre el número de computadoras funcionales en el momento del lanzamiento. ¿Cuántas trayectorias tendría el árbol? ¿Cuántas trayectorias representarían el hecho de que exactamente siete de las 10 computadoras sean funcionales en el momento del lanzamiento?

EJERCICIOS DE REPASO

 n  n 28. Calcule n si   = 21; si   = 105.  2  2

INTRODUCCIÓN A LA PROBABILIDAD Y EL CONTEO

23

29. La configuración de una terminal de cómputo incluye los parámetros de baudios, dúplex y paridad. Son posibles 11 valores de baudios, dos de paridad (par o impar) y dos de dúplex (a la mitad o lleno). a) ¿Cuántas son las configuraciones posibles de esta terminal? b) ¿En cuántas de esas configuraciones se tendría paridad par y dúplex lleno? c) Ocurre un pico de corriente y hace que esos parámetros cambien al azar. ¿Cuál es la probabilidad de que la configuración resultante tenga paridad par y dúplex lleno? 30. Una compañía ofrece 10 paquetes de software gratuitos a los compradores de su nueva computadora para el hogar. Existen 25 paquetes, de los cuales pueden elegir. ¿En cuántas formas podrían realizar la selección? Cinco de los paquetes son de juegos de computadora. ¿Cuántas son las formas posibles de selección si se eligen exactamente tres juegos de computadora? 31. Un gerente de proyecto tiene como empleados a 10 ingenieros químicos. De éstos, cuatro son mujeres y seis son hombres. Todos están capacitados por igual. En una selección aleatoria de esos empleados, ¿cuál es la probabilidad de que no sea seleccionada alguna mujer? ¿Consideraría inusual que ninguna mujer se elija bajo tales circunstancias? Explique su respuesta. 32. Un sistema de cómputo tiene contraseña que consiste en cinco letras seguidas de un dígito. a) ¿Cuántas contraseñas son posibles? b) ¿Cuántas contraseñas incluyen tres A y dos B, además de terminar en dígito par? c) Si olvida la contraseña y recuerda que tiene las características descritas en el párrafo b, ¿cuál es la probabilidad de que la adivine correctamente en el primer intento? 33. Un servidor tiene 16 puertos. En un momento dado, cada puerto está en uso o no lo está. ¿Cuántas posibilidades existen de uso de todos los puertos en este servidor? ¿Cuántas incluirían el uso de por lo menos un puerto? 34. Una linterna funciona con dos baterías. Aunque hay ocho baterías, tres no tienen carga. En una selección aleatoria de las baterías, ¿cuál es la probabilidad de que se seleccione precisamente una batería sin carga? 35. Un tablero de control eléctrico tiene tres interruptores de conmutación, llamados I, II y III, cada uno de los cuales puede estar en las posiciones de encendido (E ) o apagado (A). a) Construya un árbol que represente las configuraciones posibles de los tres interruptores. b) Enumere los elementos del espacio muestral generado con el árbol. c) Liste los puntos muestrales que constituyen los eventos siguientes: A: por lo menos un interruptor está encendido B: el interruptor I está encendido C: ningún interruptor está encendido D: están encendidos los cuatro interruptores d ) ¿Son mutuamente excluyentes los eventos A y B? ¿Lo son los eventos A y C? ¿Lo son los eventos A y D? e) ¿Cuál es el nombre que se da a un evento como D? f ) Si en un momento dado cada interruptor tiene igual probabilidad de estar encendido o apagado, ¿cuál es la probabilidad de que ningún interruptor esté encendido? 36. Dos artículos se seleccionan al azar y simultáneamente de una línea de montaje y se clasifican como de calidad superior (+), promedio (0) o inferior (–). a) Construya un árbol para este experimento de dos etapas. b) Enumere los elementos del espacio muestral generado con el árbol.

24

PROBABILIDAD Y ESTADÍSTICA

c) Liste los puntos muestrales que constituyen los eventos siguientes: A: el primer artículo seleccionado es de calidad inferior B: la calidad de ambos artículos es la misma C: la calidad del primer artículo es mayor que la del segundo d ) ¿Son mutuamente excluyentes los eventos A y B? ¿Lo son los eventos A y C? e) Dé una descripción verbal breve de los eventos siguientes: A' ∩ B A' ∩ B' A ∩ B' A ∩ C' ∩ B f ) Se sabe que 90% de los artículos producidos es de calidad promedio, 1% es de calidad superior y el resto es de calidad inferior. Se argumenta que, puesto que el experimento de clasificación puede proceder de nueve maneras y sólo en una de ellas se obtendrían dos artículos de calidad promedio, la probabilidad de obtenerlos es de 1/9. Critique tal argumentación. 37. Un experimento consiste en seleccionar un dígito de 0 a 9 de manera tal que cada dígito tenga la misma probabilidad que los demás de ser seleccionado. El dígito seleccionado se denota con A. se ejecutan las líneas de código siguientes: IF A < 2 THEN B = 12; ELSE B = 17; IF B = 12 THEN C = A – 1; ELSE C = 0; a) Elabore un árbol para ilustrar las formas en que pueden asignarse valores a las variables A, B y C. b) Encuentre el espacio muestral generado con el árbol. c) ¿Son igualmente probables los 10 posibles resultados de este experimento? d ) Calcule la probabilidad de que A sea un número par. e) Halle la probabilidad de que C sea negativo. f ) Calcule la probabilidad de que C = 0. g) Halle la probabilidad de que C ≤ 1. 38. Considere el ejercicio 16. Si los experimentos se realizan en forma aleatoria, ¿cuántas secuencias distintas son posibles? (¡Sólo tome en cuenta la configuración del experimento!) En experimentos de este tipo, es inusual que las pruebas se realicen aleatoriamente. En vez de ello, se diseñan con minuciosidad para que el investigador tenga control del orden de experimentación. ¿Puede pensar en razones prácticas que lo hagan necesario?

CAPÍTULO

2

ALGUNAS LEYES DE PROBABILIDAD

E

l capítulo 1 se dedica a la interpretación de probabilidades. En el presente capítulo, se consideran algunas leyes que rigen su comportamiento. Se estudian las que tienen aplicación directa en la solución de problemas. Son leyes que se pueden expresar e ilustrar en forma numérica. Sus deducciones son relativamente sencillas y muchas se dejan como ejercicios.

2.1 AXIOMAS DE PROBABILIDAD Usted probablemente estudió el desarrollo de un sistema matemático como parte de su curso de geometría en el bachillerato. En tal desarrollo, se parte de unos cuantos axiomas y definiciones básicos, subyacentes al sistema. Las definiciones son los términos técnicos del sistema, y los axiomas, afirmaciones que se suponen verdaderas y, por ende, no requieren comprobación. Es usual que se recurra al menor número posible de axiomas y luego se usen, junto con las definiciones técnicas, para desarrollar los teoremas que se derivan lógicamente de ellos. Se presentaron ya ciertos términos técnicos, como espacio muestral, punto muestral, evento y eventos mutuamente excluyentes. Es posible generar un sistema útil de teoremas de probabilidad con la ayuda de esas definiciones y tres axiomas, los llamados axiomas de probabilidad. Axiomas de probabilidad 1. Sea S el espacio muestral de un experimento: P[S] = 1 2. P[A] ≥ 0 con cualquier evento A. 3. Sean A1, A2, A3, . . . una colección finita o infinita de eventos mutuamente excluyentes. Entonces, P[A1 ∪ A2 ∪ A3 · · ·] = P[A1] + P[A2] + P[A3] + · · ·. 25

26

PROBABILIDAD Y ESTADÍSTICA

El axioma 1 expresa un hecho que muchas personas consideran evidente, a saber, que la probabilidad asignada a un evento cierto S es 1. El axioma 2 garantiza que las probabilidades no sean negativas. El axioma 3 afirma que cuando se tienen eventos mutuamente excluyentes, la probabilidad de que ocurra por lo menos uno de ellos puede calcularse al sumar las probabilidades de esos eventos. Una consecuencia importante de este último axioma es que permite calcular la probabilidad de un evento cuando no son igualmente probables los puntos muestrales en un mismo espacio del experimento. Ello se ilustra en el ejemplo 2.1.1. Ejemplo 2.1.1. La distribución de grupos sanguíneos en Estados Unidos es de casi 41% del grupo A, 9% del grupo B, 4% del grupo AB y 46% del tipo O. Una persona llega a una sala de urgencias y es necesario indagar su grupo sanguíneo. ¿Cuáles son las probabilidades de que sea A, B o AB? El espacio muestral del experimento es: S = {A, B, AB, O} Los puntos muestrales no son igualmente probables, de modo que es inaplicable el método clásico de la probabilidad. En otras palabras, no se puede afirmar que, puesto que existen cuatro grupos sanguíneos y tres de ellos son A, B o AB, la probabilidad de que la sangre sea de uno de estos grupos es de 3 4 . Sean A1, A2 y A3 eventos que denotan que el paciente tenga sangre de los grupos A, B y AB, respectivamente. Se trata de eventos mutuamente excluyentes, ya que una persona no puede tener sangre de dos grupos distintos. Se aplica P[A1 ∪ A2 ∪ A3]. Según el axioma 3: P[A1 ∪ A2 ∪ A3] = P[A1] + P[A2] + P[A3] = 0.41 + 0.09 + 0.04 = 0.54

Una consecuencia inmediata de estos axiomas es el hecho de que la probabilidad asignada al evento imposible es 0, como debe haber supuesto el lector. La deducción de este resultado se delinea en el ejercicio 12. Teorema 2.1.1. P[∅] = 0.

Otra consecuencia de los axiomas es que la probabilidad de que un evento no ocurra es igual a la unidad menos la probabilidad de que ocurra. Por ejemplo, si la probabilidad de un lanzamiento espacial exitoso es de 0.99, la probabilidad de que no tenga éxito es de 1 – 0.99 = 0.01. Esta idea se expresa en el teorema 2.1.2. Su derivación se delinea también en el ejercicio 12. Teorema 2.1.2. P[A' ] = 1 – P[A].

La regla general de la adición Se analizó cómo responder a preguntas concernientes a la probabilidad de que ocurra un evento u otro en el caso de que éstos sean mutuamente excluyentes. A continuación, se desarrolla una regla más general, que permite calcular la probabilidad de que al menos uno de los dos eventos tenga lugar

ALGUNAS LEYES DE PROBABILIDAD

A1

A2

27

S

FIGURA 2.1 A1 ∩ A2 ≠ ∅.

cuando no sean por necesidad mutuamente excluyentes. Dicha regla está indicada por el diagrama de Venn de la figura 2.1. Suponga que no está vacía la región sombreada del diagrama, A1 ∩ A2, de modo que A1 y A2 no son mutuamente excluyentes. Si se afirma que: P[A1 ∪ A2] = P[A1] + P[A2] se comete un error evidente. Puesto que A1 ∩ A2 está contenida en A1 y A1 ∩ A2, está contenido en A2, P[A1 ∩ A2] se incluye dos veces en el cálculo. La corrección del error consiste en restar P[A1 ∩ A2] en el miembro derecho de la ecuación, para obtener la regla de adición general: Regla general de la adición P[A1 ∪ A2] = P[A1] + P[A2] – P[A1 ∩ A2] Esta regla puede deducirse de los axiomas de probabilidad y los teoremas ya desarrollados. Su comprobación se delinea en el ejercicio 12. La palabra clave que indica su uso es “o”. Ejemplo 2.1.2. Los componentes de un sistema propulsor pueden estar dispuestos en serie. Sin embargo, ello se acompaña de una desventaja grave: si un componente falla, ocurre lo mismo con el sistema en su totalidad. ¡Evidentemente es una disposición riesgosa para viajes espaciales! Considérese un sistema en el que el motor principal tiene un respaldo. Los motores están diseñados para funcionar independientemente, de modo que el éxito o fracaso de uno no tenga efecto en el otro. El componente de motor funciona si uno u otro motores funcionan. Se afirma que dicho sistema tiene el componente de motores en paralelo. Suponga que cada motor es 90% confiable, es decir, que funciona correctamente con probabilidad de 0.9. Como se analizará más adelante, es razonable suponer que ambos motores funcionan correctamente con probabilidad de 0.81. A continuación, se calcula la probabilidad de que el componente de motores sea funcional. Sean A1: el motor principal es funcional, y A2: el motor de respaldo es funcional. Se sabe que P[A1] = P[A2] = 0.9 y que P[A1 ∩ A2] = 0.81. Se necesita calcular P[A1 ∪ A2]. Según la regla de adición general: P[A1 ∪ A2] = P[A1] + P[A2] – P[A1 ∩ A2] = 0.9 + 0.9 – 0.81 = 0.99

La regla de adición vincula a las operaciones de unión e intersección. Si se conoce P[A1 ∩ A2], es posible usar la regla de adición para calcular P[A1 ∪ A2]. De manera similar, cuando se

28

PROBABILIDAD Y ESTADÍSTICA

A2

A1

S 0.10

A2

A1

S 0.22

a)

0.10

b)

A2 A1

S 0.22

0.10

0.06

S(1) 0.10

0.22

0.06

0.62 c)

d)

FIGURA 2.2 a ) P[ A1 ∩ A2 ] = 0.10; b) P[ A1 ∩ A2' ] = 0.22; c) P[ A1' ∩ A2 ] = 0.06; d ) P[ A1' ∩ A2' ] = 0.62.

conoce P[A1 ∪ A2] la regla sirve para calcular P[A1 ∩ A2]. Los diagramas de Venn son útiles en la aplicación de esta regla. Ejemplo 2.1.3. Un químico analizará muestras de agua de mar en búsqueda de dos metales pesados: plomo y mercurio. La experiencia indica que existen valores tóxicos de plomo o mercurio en 38% de las muestras obtenidas cerca de la desembocadura de un río, sobre cuyo margen se localizan numerosas plantas industriales: 32% con concentraciones tóxicas de plomo y 16% con concentraciones tóxicas de mercurio. ¿Cuál es la probabilidad de que una muestra seleccionada aleatoriamente contenga sólo valores tóxicos de plomo? Sea A1 el evento de que la muestra tiene valores tóxicos de plomo, y A2, que contiene valores tóxicos de mercurio. Se sabe que P[A1] = 0.32, P[A2] = 0.16 y P[A1 ∪ A2] = 0.38. De conformidad con la regla de adición: P[A1 ∪ A2] = P[A1] + P[A2] – P[A1 ∩ A2] o

0.38 = 0.32 + 0.16 – P[A1 ∩ A2]

Al despejar la ecuación, se tiene que P[A1 ∩ A2] = 0.10, como se indica en la figura 2.2a. Puesto que P[A1] = 0.32 y A1 ∩ A2 está contenido en A1, la probabilidad relacionada con la región sombreada de la figura 2.2b es de 0.22. De manera similar, A1 ∩ A2 está contenida en A2, por lo que la probabilidad de 0.06 se relaciona con la región sombreada de la figura 2.2c. Por último, P[S] = 1, de modo que la probabilidad asignada al área sombreada de la figura 2.2d es de 0.62. Se pide calcular la probabilidad de que la muestra sólo contenga plomo. En otras palabras, se requiere calcular P[A1 ∩ A'2]. Esta probabilidad es de 0.22 y puede leerse en la figura 2.2b.

Nótese que las probabilidades calculadas con el uso de la regla general de la adición son exactas si los porcentajes presentados en problemas como éstos se basan en datos poblacionales. Sin embargo, las probabilidades calculadas son de frecuencia relativa cuando los porcentajes se basan en mues-

ALGUNAS LEYES DE PROBABILIDAD

29

A2

A1

S (todas las mujeres embarazadas)

0.26

0.17

0.34

0.23

FIGURA 2.3 División de S.

tras obtenidas de una población más grande. Se trata de aproximaciones a la probabilidad verdadera de que ocurra el evento en cuestión. Muchos porcentajes que se expresan en la literatura técnica se basan en muestras, de modo que sería más correcto interpretarlos como probabilidades de frecuencias relativas. Se usa la palabra “probabilidad” en el entendido de que las probabilidades dadas y calculadas con el uso de teoremas en este capítulo son, en muchos casos, sólo aproximaciones.

2.2 PROBABILIDAD CONDICIONAL En esta sección, se presenta el concepto de probabilidad condicional. Su nombre en sí indica para qué sirve. Se pretende determinar la probabilidad de que ocurra el evento A2, “condicionado” al supuesto de que ha tenido lugar otro evento, A1. Las palabras clave que deben buscarse en la identificación de una pregunta condicional son “si” y “dado que”. Se usa la notación P[A2|A1] para denotar la probabilidad condicional de que ocurra el evento A2, dado que ha ocurrido el evento A1. Un ejemplo sencillo indica la manera de definir esta probabilidad. Ejemplo 2.2.1. La prueba de “electroforesis de gel de almidón” se usa para determinar el género de los hijos durante el embarazo. Esa prueba puede revelar la presencia de una zona de proteínas, llamada zona de embarazo, presente en 43% de las mujeres embarazadas. Por añadidura, se sabe que en 51% de los partos nace un varón. El 17% de los niños nacidos son varones y la zona de embarazo está presente. El diagrama de Venn correspondiente a estos datos se muestra en la figura 2.3. Sea A1 el evento de la presencia de la zona de embarazo, y A2, que el hijo será varón. Se sabe que, en una mujer embarazada a la que se selecciona aleatoriamente, P[A1] = 0.43, P[A2] = 0.51 y P[A1 ∩ A2] = 0.17. Ante la pregunta: “¿Cuál es la probabilidad de que el hijo sea varón?”, la respuesta es 0.51. Suponga que se da la información de que está presente la zona de embarazo y la pregunta es: “¿Cuál es la probabilidad de que el hijo sea varón?” En este caso, se cuenta con información no disponible originalmente. ¿Cuál efecto, si acaso, ejerce esa nueva información en la creencia de que el hijo es varón? Dicho de otra manera, ¿cuál es el valor de P[A2|A1]? Una vez que se sabe que está presente la zona de embarazo, el espacio muestral ya no incluye a todas las mujeres embarazadas, sino que consiste apenas en el 43% que posee esa característica. De ellas, 0.17/0.43 0.395 tiene hijos varones. La lógica implica que: P[varón|presencia de la zona] = P[A2|A1] = 0.395 La información de la presencia de la zona de embarazo reduce de 0.51 a 0.395 la probabilidad de que el hijo sea varón.

30

PROBABILIDAD Y ESTADÍSTICA

A efecto de formalizar el razonamiento usado en el ejemplo previo, tome nota de que P[A2|A1] se calcula con una razón cuyo denominador es P[A1], la probabilidad de que ocurra el evento dado. El numerador es P[A1 ∩ A2], la probabilidad de que tengan lugar tanto el evento dado como el evento en cuestión. En otras palabras, se define la probabilidad condicional como sigue: Definición 2.2.1 (probabilidad condicional). Sean A1 y A2 eventos tales que P[A1] ≠ 0. La probabilidad condicional A2, dado A1, se denota con P[A2|A1] y se define con la fórmula siguiente: P[ A2 A1 ] =

P[ A1 ∩ A2 ] P[ A1 ]

En ocasiones, recibir la información de que ocurrió el evento A1 no tiene efecto alguno en la probabilidad asignada al evento A2. En otras palabras: P[A2 | A1] = P[A2] En caso de ser así, A1 y A2 guardan una relación especial, cuya naturaleza se explora en la sección siguiente. Entretanto, ¡no le sorprenda que una probabilidad condicional específica no difiera de la probabilidad original que se asignó al evento!

2.3 INDEPENDENCIA Y LA REGLA DE LA MULTIPLICACIÓN En varios ejemplos previos, se usa la palabra “independiente” de manera informal. El diccionario Webster define a los objetos independientes como los que actúan “uno sin tener en cuenta al otro”. Así pues, dos eventos son independientes si uno puede ocurrir sin importar qué pase con el otro. Dicho de otra manera, que uno de ellos ocurra o que no lo haga ejerce efecto nulo en la probabilidad de que el otro tenga lugar o no. En algunos casos, es razonable suponer que dos eventos son independientes a partir de sus descripciones físicas. Por ejemplo, suponga que una pareja heterocigota para el color de los ojos tiene dos hijos. Puesto que dicho color se ve afectado sólo por la composición genética de los padres, no por el color de ojos de los hermanos, es razonable suponer que son independientes los eventos A1: el primogénito tiene ojos cafés, y A2: el segundogénito también los tiene cafés. Sin embargo, en muchos casos el problema no está claro. De ser así, se necesita una definición matemática del término para determinar sin duda alguna que los dos eventos sean en verdad independientes. A fin de ver la manera de caracterizar a la independencia, considérese un experimento sencillo, que consiste en lanzar una sola vez un dado y hacer lo mismo con una moneda. Sea que el primer miembro de cada par ordenado denota el número del dado que queda hacia arriba, y el segundo, el lado de la moneda que queda hacia arriba (H = cara, T = cruz). El espacio muestral del experimento es:

ALGUNAS LEYES DE PROBABILIDAD

31

S = {(1, H ), (1, T ), (2, H ), (2, T ), (3, H ), (3, T ), (4, H ), (4, T ), (5, H ), (5, T ), (6, H ), (6, T )} Puesto que se parte de que el dado y la moneda no están cargados, los 12 resultados son igualmente probables. Considérense los eventos siguientes: A: quedan hacia arriba el uno o el dos en el dado B: queda hacia arriba la cara en la moneda A ∩ B: quedan hacia arriba el uno o el dos en el dado y la cara en la moneda Conocer el resultado del lanzamiento del dado no brinda información adicional acerca de cómo quedará la moneda, por lo que es razonable suponer que los eventos A y B son independientes. Con base en el método clásico de la probabilidad, se aprecia fácilmente que: P[A] = P[{(1, H ), (1, T ), (2, H ), (2, T )}] = 4/12 = 1/3 P[B] = P[{(1, H ), (2, H ), (3, H ), (4, H ), (5, H ), (6, H )}] = 6/12 = 1/2 P[A ∩ B] = P[{(1, H ), (2, H )}] = 2/12 = 1/6 Inclusive de mayor importancia, es fácil advertir que con estos eventos físicamente independientes se tiene que: P[A ∩ B] = P[A] · P[B] Considérese ahora un experimento que consiste en extraer sucesivamente dos monedas de una caja que contiene una moneda de 5 centavos (N ), otra de 10 centavos (D) y una más de 25 centavos (Q). La primera moneda no se reemplaza antes de extraer la segunda. El espacio muestral del experimento es: S = {(N, D), (N, Q), (D, N ), (D, Q), (Q, N ), (Q, D)} Los resultados son igualmente probables. Considérense los eventos siguientes: A: la primera moneda es de 10 centavos B: la segunda moneda es de 10 centavos Puesto que no se puede reemplazar la primera moneda antes de la segunda extracción, es evidente que si ocurre el evento A será imposible el evento B. Así pues, ¡el conocimiento de que ha tenido lugar el evento A brinda información acerca de si ocurrirá el evento B o no lo hará! Estos eventos no son independientes. De conformidad con el método clásico de probabilidad, se advierte fácilmente que: P[A] = P[{(D, N ), (D, Q)}] = 2/6 P[B] = P[{(N, D), (Q, D)}] = 2/6 P[A ∩ B] = P[∅] = 0 De mayor importancia es la facilidad con que se aprecia que estos eventos no son independientes: P[A ∩ B] ≠ P[A]P[B] Así pues, se advierte que cuando A y B son claramente independientes, P[A ∩ B] = P[A]P[B], y cuando es obvio que son dependientes, P[A ∩ B] ≠ P[A]P[B]. No se trata de una coincidencia. Es natural utilizar esta caracterización matemática como definición técnica del término “eventos independientes”.

32

PROBABILIDAD Y ESTADÍSTICA

Definición 2.3.1 (eventos independientes). Los eventos A1 y A2 son independientes si y sólo si P[A1 ∩ A2] = P[A1]P[A2] Esta definición reviste utilidad de dos maneras. Si se cuenta con probabilidades exactas, sirve como prueba de independencia. No obstante, muchas probabilidades calculadas en estudios científicos son aproximaciones, de modo que su máxima utilidad es para calcular la probabilidad de que ocurran dos eventos cuando son claramente independientes. El ejemplo 2.3.1 ilustra su utilización como prueba de independencia. Ejemplo 2.3.1. vueltas. Sean:

Considérese el experimento de extraer una baraja de un monte de 52 barajas bien reA1: se saca una carta de espadas A2: se saca una carta alta (10, J, Q, K, A)

Se usa el método clásico de probabilidad para ver que P[A1] = 13/52 y P[A2] = 20/52. La probabilidad de sacar una carta alta y otra de espadas, P[A1 ∩ A2], es de 5/52. Nótese que se trata de probabilidades exactas. No son aproximaciones basadas en la observación de cartas sacadas. ¿Son independientes los eventos A1 y A2? A fin de decidir, tome nota de que: P[A1]P[A2] = (13/52)(20/52) = 5/52 y

P[A1 ∩ A2] = 5/52

Puesto que P[A1 ∩ A2] = P[A1]P[A2], puede concluirse que se trata de eventos independientes.

En el capítulo 15, se presenta una prueba de independencia útil en el trabajo con datos reales, no con probabilidades clásicas. Su deducción se basa en la definición de eventos independientes recién analizada. El ejemplo 2.3.2 muestra el uso de la definición 2.3.1 para calcular la probabilidad de que dos eventos ocurran en forma simultánea cuando son claramente independientes. Ejemplo 2.3.2. En el ejemplo 1.1.3, se calculó que la probabilidad de que una pareja heterocigota para el color de los ojos tenga un hijo de ojos cafés es de 3/4 con cada hijo. Los estudios genéticos indican que el color de los ojos de un hijo es independiente del que tengan sus hermanos. Así pues, si la pareja tiene dos hijos, la probabilidad de que los ojos sean cafés en ambos es:

primogénito de segundogénito de primogénito de segundogénito de P y  = P  P   ojos cafés   ojos cafés    ojos cafés ojos cafés 3 3 = ⋅ 4 4 9 = 16

La definición 2.3.1 corresponde a la independencia de dos eventos A1 y A2 cualesquiera. Si al menos uno de ellos tiene probabilidad distinta de cero, es posible obtener una caracterización intere-

ALGUNAS LEYES DE PROBABILIDAD

33

sante de la independencia. A fin de ver cómo se logra esto, supóngase que P[A1] ≠ 0. Según la definición 2.3.1, A1 y A2 son independientes si y sólo si: P[A1 ∩ A2] = P[A1]P[A2] Al dividir entre P[A1], puede concluirse que A1 y A2 son independientes si y sólo si:

P[ A1 ∩ A2 ] = P[A2 | A1] = P[A2] P[ A1 ] Un argumento similar es válido cuando P[A2] ≠ 0. Así pues, se dedujo el resultado que se indica en el teorema 2.3.1. Teorema 2.3.1. Sean A1 y A2 eventos tales que por lo menos P[A1] o P[A2] difieren de cero. A1 y A2 son independientes si y sólo si: P[A2 | A1] = P[A2]

si P[A1] ≠ 0

P[A1 | A2] = P[A1]

si P[A2] ≠ 0

y

Muchos eventos de interés real ocurren con probabilidad distinta de cero, por lo que el teorema 2.3.1 se usa como prueba de independencia. A fin de entender la lógica subyacente a él, reconsidérense los datos del ejemplo 2.3.1. Ejemplo 2.3.3. Considérense los eventos A1, que se extraiga una carta de espadas, y A2, que se extraiga una carta alta. Se sabe que P[A1] = 13/52, P[A2] = 20/52 y P[A1 ∩ A2] = 5/52. Supóngase la pregunta siguiente: “¿Cuál es la probabilidad de que una carta seleccionada aleatoriamente sea carta alta?” La respuesta es 20/52. Ahora, supóngase que se recibe la información de que la carta es de espadas y la pregunta es: “¿Cuál es la probabilidad de que sea una carta alta?” En otras palabras: “¿Cuál es el valor de P[A2|A1]?” Si A1 y A2 son independientes, la nueva información es irrelevante y la respuesta no debe cambiar. Dicho de otra manera, P[A2 | A1] = P[A2]. De no ser así, la respuesta debe modificarse y P[A2|A1] ≠ P[A2]. En este contexto, ¿es P[A2 | A1] = P[A2]? A fin de responder a la pregunta, tómese nota de que: P[ A1 ∩ A2 ] 5/ 52 = = 5/13 P[ A1 ] 13/ 52 P[A2] = 20/52 = 5/13

P[A2 | A1] = y

Puesto que las probabilidades son las mismas, se llega a la conclusión, con base en el teorema 2.3.1, de que A1 y A2 son independientes.

En ocasiones, son más de dos los eventos. De nuevo, surge la pregunta: “¿Cuándo se les considera independientes?” La definición 2.3.2 responde a esta pregunta, al ampliar la definición previa para incluir tres o más eventos. Definición 2.3.2. Sea C = {Ai: i = 1, 2, . . . , n} un conjunto finito de eventos. Estos eventos son independientes si y sólo si dado cualquier subconjunto A(1), A(2), . . ., A(m) de elementos de C: P[A(1) ∩ A(2) ∩ · · · ∩ A(m)] = P[A(1)]P[A(2)] · · · P[A(m)]

34

PROBABILIDAD Y ESTADÍSTICA

Esta definición puede usarse como prueba de independencia de un conjunto de eventos; pero su propósito fundamental es servir como forma de cálculo de la probabilidad de que ocurra una serie de eventos supuestamente independientes. A manera de ejemplo, se reconsidera a continuación un problema del capítulo 1 (ejemplo 1.2.1). Ejemplo 2.3.4. Durante un lanzamiento espacial, el sistema de cómputo primario está respaldado por dos sistemas secundarios. Funcionan uno con independencia de los otros y cada uno es 90% confiable. ¿Cuál es la probabilidad de que los tres sistemas sean funcionales en el momento del lanzamiento? Sean: A1: el sistema principal funciona A2: el primer sistema de respaldo funciona A3: el segundo sistema de respaldo funciona Se tiene la información de que P[A1] = P[A2] = P[A3] = 0.9. Se necesita calcular P[A1 ∩ A2 ∩ A3]. Puesto que se supone que estos eventos son independientes, se tiene: P[A1 ∩ A2 ∩ A3] = P[A1]P[A2]P[A3] = (0.9)(0.9)(0.9) = 0.729

La definición 2.3.2 debe usarse con sumo cuidado. En particular, hay que tener la certeza de que es razonable suponer que los eventos son independientes antes de aplicarla al cálculo de la probabilidad de que ocurra una serie de eventos. El peligro de suponer erróneamente la independencia se ilustra en el ejemplo 2.3.5. Ejemplo 2.3.5. En un estudio de la Atomic Energy Commission estadounidense (WASH 1400), se informó que la probabilidad de un accidente nuclear como el ocurrido durante marzo de 1978 en Three Mile Island era de uno en 10 millones. No obstante, dicho accidente ocurrió. Según Mark Stephens: “En el método del estudio WASH 1400, se usaron los árboles de eventos, secuencias de acciones que serían necesarias para que ocurran los accidentes. Estos árboles de eventos no suponen la interrelación de eventos, que podría deberse a errores de juicio o ser parte de una acción errónea. Los estadísticos que asignaron probabilidades en la redacción del estudio WASH 1400 afirmaron, por ejemplo, que había un riesgo de uno en 1 000 de que se cerrara una de las válvulas auxiliares de control de alimentación de agua, las 12. Y si hay una posibilidad en mil de que una válvula sea cerrada, las posibilidades de que ambas válvulas sean cerradas es una milésima de eso, o de un millón a una. Sin embargo, el mismo trabajador cerró ambas válvulas el 26 de marzo, y una de ellas nunca había sido cerrada sin la otra.” No fueron independientes los eventos A1: la primera válvula está cerrada y A2: la segunda válvula está cerrada. Sin embargo, se las trató como independientes al calcular la probabilidad de que ocurriera un accidente. Entre otros factores, éste llevó a subestimar el potencial de un accidente. (Tomado de Three Mile Island, Mark Stephens, Random House, 1980.)

La regla de la multiplicación Existe un aspecto adicional que debe mencionarse antes de terminar esta sección. Es posible calcular P[A1 ∩ A2] si se parte del supuesto de que los eventos son independientes. Por añadidura, con la información apropiada, puede usarse la regla general de la adición para calcular esa probabilidad.

ALGUNAS LEYES DE PROBABILIDAD

35

¿Existe alguna otra forma de calcular la probabilidad de que ocurran simultáneamente dos eventos si no son independientes? La respuesta es sí y el método es de fácil deducción. Se sabe que:

P[ A1 ∩ A2 ] donde P[A1] ≠ 0 P[ A1 ] sin importar que los eventos sean independientes o no lo sean. Al multiplicar cada miembro de la ecuación por P[A1], se obtiene la fórmula siguiente, llamada regla de la multiplicación: P[A2 | A1] =

Regla de la multiplicación P[A1 ∩ A2] = P[A2 | A1]P[A1] El uso de esta regla se ilustra en el ejemplo 2.3.6. Ejemplo 2.3.6. Investigaciones recientes muestran que casi 49% de las infecciones se debe a bacterias anaerobias. Además, el 70% de todas las infecciones anaerobias son polimicrobianas, es decir, resultan de dos o más anaerobias. ¿Cuál es la probabilidad de que una infección dada se deba a bacterias anaerobias y también sea polimicrobiana? Sea A1 el evento de que la infección es anaerobia, y A2, que es polimicrobiana. Se sabe que P[A1] = 0.49 y P[A2|A1] = 0.70. Es necesario calcular P[A1 ∩ A2]. De conformidad con la regla de la multiplicación: P[A1 ∩ A2] = P[A2|A1]P[A1] = (0.70)(0.49) = 0.343

2.4 TEOREMA DE BAYES El tema de esta sección es el teorema que formuló en 1761 el reverendo Thomas Bayes sobre la probabilidad condicional. El teorema de Bayes se usa para calcular P[A|B] cuando la información disponible no tiene compatibilidad inmediata con lo necesario para aplicar directamente la definición de la probabilidad condicional. El ejemplo 2.4.1 es un problema típico que requiere usar el teorema de Bayes. El lector observará que la regla de Bayes es de aplicación más bien natural, ¡sin siquiera haber visto la definición formal del teorema! Ejemplo 2.4.1. Suponga que en 40% de los accidentes en autopistas interestatales participa la velocidad excesiva de por lo menos uno de los conductores (evento E ), y en 30%, el consumo de bebidas alcohólicas, también al menos de uno de los conductores (evento A). En el caso de dicho consumo, existe probabilidad de 60% de que también haya velocidad excesiva, mientras que en caso contrario esta probabilidad es de apenas 10%. Ocurre un accidente con participación de exceso de velocidad. ¿Cuál es la probabilidad de que participe el consumo de bebidas alcohólicas? Se dan las probabilidades siguientes: P[E ] = 0.40 P[E' ] = 0.60

P[A] = 0.30

P[E | A] = 0.60

P[A' ] = 0.70 P[E | A' ] = 0.10

Se pide calcular P[A|E]. Puesto que se trata de una pregunta condicional, es natural buscar la solución en la definición de la probabilidad condicional. En este caso:

36

PROBABILIDAD Y ESTADÍSTICA

P[A | E ] =

P[ E ∩ A] P[ E]

Por desgracia, no se cuenta de inmediato con una de las probabilidades necesarias para la solución. Sin embargo, es posible obtenerla con facilidad. Con la regla de la multiplicación: P[E ∩ A] = P[E | A]P[A] Nótese que si participa la velocidad excesiva, el consumo de bebidas alcohólicas puede hacerlo también o no hacerlo. Por lo tanto, el evento E puede subdividirse en dos eventos mutuamente excluyentes, como sigue: E = (E ∩ A) ∪ (E ∩ A' ) Así pues,

P[E ] = P[E ∩ A] + P[E ∩ A' ]

Se ha encontrado ya una expresión para la primera probabilidad, en el miembro derecho de la ecuación. La regla de multiplicación puede aplicarse a la segunda probabilidad para ver que: P[E ∩ A' ] = P[E | A' ]P[A' ] Con la sustitución, se tiene: P[A | E] =

P[ E ∩ A] P[ E ] P[ E | A] P[ A] P[ E | A] P[ A] + P[ E | A' ] P[ A' ]

=

Adviértase la estructura de esta solución. En el numerador, la expresión condicional es opuesta a la que había en la pregunta original, mientras que en el denominador las expresiones condicionales abarcan todas las alternativas del evento en cuestión, en este caso A y A'. La solución numérica puede calcularse mediante sustitución, como sigue: P[A | E ] = =

P[ E | A] P[ A] P[ E | A] P[ A] + P[ E| A' ] P[ A' ] (0.60) (0.30) (0.60) (0.30) + (0.10) (0.70)

= 0.72 Si hubo velocidad excesiva en un accidente, existe probabilidad de 72% de que se acompañe de consumo de bebidas alcohólicas.

En el ejemplo previo, existen dos eventos mutuamente excluyentes, A y A', cuya unión es S. El teorema de Bayes también es aplicable cuando S se subdivide en más de dos eventos mutuamente excluyentes. A continuación, se define el teorema en este contexto más general. Teorema 2.4.1 (teorema de Bayes). Sean A1, A2, A3, . . . , An un conjunto de eventos mutuamente excluyentes, cuya unión es S. Sea B tal que P[B] ≠ 0. Entonces, para cualquier evento Aj, con j = 1, 2, 3, . . . , n, se tiene que: P[Aj|B] =

P[ B | A j ]P[ A j ] n

∑ P[ B | Ai ]P[ Ai ]

i =1

ALGUNAS LEYES DE PROBABILIDAD

37

A fin de comprobar que podría haberse usado directamente el teorema de Bayes para responder a la pregunta planteada en el ejemplo 2.4.1, tómese nota de que A y A' son eventos mutuamente excluyentes, cuya unión es S, y el evento E ocurre con probabilidad distinta de cero. Así pues, son posibles las identificaciones siguientes: A1 = A

A2 = A'

B=E

La aplicación directa del teorema de Bayes permite obtener lo siguiente:

o

P[A1 | B] =

P[ B | A1 ]P[ A1 ] P[ B | A1 ]P[ A1 ] + P[ B | A2 ]P[ A2 ]

P[A | E ] =

P[ E | A] P[ A] P[E | A] P[ A] + P[ E | A' ]P[ A' ]

Una comparación rápida muestra que es la misma solución deducida en el ejemplo 2.4.1 con la regla de multiplicación. El ejemplo siguiente ilustra el uso del teorema de Bayes en un contexto donde el espacio muestral se subdivide en cuatro eventos mutuamente excluyentes, en lugar de dos. Ejemplo 2.4.2. La distribución de grupos sanguíneos en Estados Unidos es de 41% del grupo A, 9% del grupo B, 4% del grupo AB y 46% del grupo O. Se calcula que, de los conscriptos reclutados durante la Segunda Guerra Mundial, se clasificó incorrectamente como si tuvieran sangre del grupo A a 4% con sangre del grupo O, correctamente a 88% con sangre del grupo A, incorrectamente como personas con sangre del grupo A a 4% con sangre del grupo B y, una vez más con sangre del grupo A, a 10% que tenía sangre del grupo AB. Un soldado herido es llevado al quirófano. Se identifica su sangre como del grupo A. ¿Cuál es la probabilidad de que ése sea su grupo sanguíneo verdadero? Sean: A1: tiene sangre del grupo A A2: tiene sangre del grupo B A3: tiene sangre del grupo AB A4: tiene sangre del grupo O B: se clasifica su sangre como del grupo A Nótese que los eventos A1, A2, A3 y A4 son mutuamente excluyentes y su unión es S, ya que un individuo sólo puede tener sangre de un grupo y se enumeran todos los grupos sanguíneos posibles. Se pide calcular P[A1B]. Se tiene que: P[A1] = 0.41

P[BA1] = 0.88

P[A2] = 0.09

P[BA2] = 0.04

P[A3] = 0.04

P[BA3] = 0.10

P[A4] = 0.46

P[BA4] = 0.04

La sustitución en la expresión dada por el teorema de Bayes arroja lo siguiente: P[A1B] =

( 0.88) ( 0.41) ( 0.88) ( 0.41) + ( 0.04) ( 0.09) + ( 0.10) ( 0.04) + ( 0.04) ( 0.46)

0.93 Si se clasifica la sangre de una persona como del grupo A, es de casi 93% la probabilidad de que ése sea su grupo sanguíneo verdadero.

38

PROBABILIDAD Y ESTADÍSTICA

RESUMEN DEL CAPÍTULO En este capítulo, se presentan algunas de las leyes que rigen el comportamiento de las probabilidades. Se parte de los axiomas, de los cuales pueden derivarse las leyes restantes. En particular, se dedujo la regla de adición, que trata sobre la probabilidad de la unión de dos eventos; la de multiplicación, que versa acerca de la probabilidad de la intersección de dos eventos, y el teorema de Bayes, concerniente a la probabilidad condicional. Se presentaron y definieron términos importantes, que el lector debe conocer. Son los siguientes: Probabilidad condicional

Eventos independientes

Debe tenerse cuidado en el uso del concepto de independencia. En un problema aplicado, hay que tener la certeza de que es razonable suponer que los eventos A y B son independientes, antes de calcular la probabilidad de que ocurran conjuntamente con la definición P[A ∩ B] = P[A]P[B].

EJERCICIOS Sección 2.1

1. La probabilidad de que un pozo perforado al azar produzca petróleo es de 1/13. ¿Cuál es la probabilidad de que sea improductivo? 2. El robo de metales preciosos a compañías fue y sigue siendo un problema grave en Estados Unidos. La probabilidad calculada de tal robo correspondiente a metales específicos es como sigue (basado en datos que se presentan en “Materials Theft”, Materials Engineering, febrero de 1982, pp. 27-31): estaño: 1/35

acero: 11/35

cobre: 8/35

titanio: 1/35

platino: 1/35

oro: 5/35

aluminio: 2/35

níquel: 1/35

zinc: 1/35

plata: 4/35

(Nótese que se supone que estos eventos son mutuamente excluyentes.) a) ¿Cuál es la probabilidad de que el robo de un metal precioso sea de oro, plata o platino? b) ¿Cuál es la probabilidad de que el robo no sea de acero? 3. En el supuesto de que la distribución de grupos sanguíneos es de A = 41%, B = 9%, AB = 4% y O = 46%, ¿cuál es la probabilidad de que la sangre de una persona seleccionada aleatoriamente contenga el antígeno A? ¿Cuál es la probabilidad de que contenga el antígeno B? ¿Cuál es la probabilidad de que no contenga alguno de esos dos antígenos? 4. Suponga que el componente de motor de una nave espacial consiste en dos motores en paralelo. Si el motor principal es 95% confiable, y el de respaldo, 80%, además de que el componente de motores en su totalidad es 99% confiable, ¿cuál es la probabilidad de que funcionen ambos motores? Use el diagrama de Venn para calcular la probabilidad de que falle el motor principal y funcione el de respaldo. Calcule la probabilidad de que falle el motor de respaldo y funcione el principal. ¿Cuál es la probabilidad de que falle el componente de motor de su totalidad?

ALGUNAS LEYES DE PROBABILIDAD

39

5. La muerte puede sobrevenir cuando una persona se ve expuesta a la radiación. Entre los factores que afectan el pronóstico, están la magnitud de la dosis, duración e intensidad de la exposición, y composición biológica del individuo. La sigla LD50 se usa para denotar la dosis que suele ser letal en 50% de las personas expuestas a ella. Suponga que en un accidente nuclear 30% de los trabajadores tiene exposición a la LD50 y fallece; que 40% de los trabajadores muere, y que 68% tiene exposición a la LD50 o fallece. ¿Cuál es la probabilidad de que un trabajador seleccionado al azar se vea expuesto a la LD50? Use el diagrama de Venn para calcular la probabilidad de que un trabajador seleccionado aleatoriamente tenga exposición a la LD50 y no fallezca. Calcule también la probabilidad de que muera un trabajador sin exposición a la LD50. 6. Cuando una computadora se bloquea, existe una probabilidad de 75% de que se deba a una sobrecarga, y de 15% de que sea por un problema de software. La probabilidad de que se origine en una sobrecarga o un problema de software es de 85%. ¿Cuál es la probabilidad de que se deba a ambos problemas? ¿Cuál es la probabilidad de que haya un problema de software sin sobrecarga? 7. A causa de una reciente crisis de energía en California, fueron necesarios los apagones programados, que podrían seguir siéndolo en el futuro. Suponga que existe probabilidad de 60% de que la temperatura sea mayor de 85°F en un día dado de julio y un área específica. Suponga también que la probabilidad es de 30% de que se necesite un apagón programado en esa área. Se tiene probabilidad de 20% de que ocurran ambos eventos. Calcule la probabilidad de que la temperatura sea mayor de 85°F en un día cualesquiera de julio sin que se necesite un apagón programado en tal día. 8. La experiencia muestra que 25% de las quejas concernientes a las líneas telefónicas domésticas se origina por la presencia de estática en la línea. En 50% de los casos, hay deterioro de la línea. En 35%, sólo ocurre tal deterioro. ¿Cuál es la probabilidad de que una queja seleccionada aleatoriamente comprenda ambos problemas? ¿Cuál es la probabilidad de que no abarque alguno de los dos? 9. Considere que en un ejercicio militar de dos unidades, Roja y Azul, existe probabilidad de 60% de que la unidad Roja cumpla con sus objetivos y 70% de que lo haga la unidad Azul. La probabilidad es de 18% de que sólo tenga éxito la unidad Roja. ¿Cuál es la probabilidad de que ambas unidades logren sus objetivos? ¿Cuál es la probabilidad de que una u otra los alcancen, no así ambas? 10. Se ha observado que 80% de los accidentes en fundidoras se debe a errores humanos, y 40%, a falla de equipos. En 35%, participan ambos problemas. Se investiga un accidente en una fundidora. ¿Cuál es la probabilidad de que sólo haya resultado de errores humanos? 11. Suponga que 1% de los neumáticos de una marca específica está defectuoso como resultado de un problema con el proveedor de un componente químico importante de los neumáticos mismos. Suponga también que 0.5% de los neumáticos de esta marca fallará tarde o temprano por estallamiento de su flanco. Además, en 1.4% de esta marca ocurrirá por lo menos uno de los dos problemas. ¿Cuál es la probabilidad de que en un accidente futuro con estos neumáticos ocurra el estallamiento sin que se identifique problema alguno en la composición química del neumático? 12. a) Demuestre el teorema 2.1.1. Sugerencia: Note que S = S ∪ ∅, además de que S y ∅ son mutuamente excluyentes. Aplique los axiomas 3 y 1. b) Demuestre el teorema 2.1.2. Sugerencia: Note que S = A ∪ A', además de que A y A' son mutuamente excluyentes. Aplique los axiomas 3 y 1.

40

PROBABILIDAD Y ESTADÍSTICA

c) Sea A un subconjunto de B. Demuestre que P[A] ≤ P[B]. Sugerencia: B = A ∪ (A' ∩ B). Aplique los axiomas 3 y 2. d ) Demuestre que la probabilidad de cualquier evento A es a lo sumo de 1. Sugerencia: A ⊆ S. Aplique el ejercicio 12c y el axioma 1. e) Sean A1 y A2 eventos mutuamente excluyentes. Según el axioma 3, P[A1 ∪ A2] = P[A1] + P[A2]. Demuestre que se obtiene el mismo resultado con la regla de adición general. Sección 2.2

13. Use los datos del ejercicio 5 para responder a las preguntas siguientes. a) ¿Cuál es la probabilidad de que fallezca un trabajador seleccionado aleatoriamente que estuvo expuesto a la dosis letal de radiación? b) ¿Cuál es la probabilidad de que no fallezca un trabajador seleccionado al azar que estuvo expuesto a la dosis letal de radiación? c) ¿Cuál teorema permite determinar la respuesta a la pregunta b con el conocimiento de la respuesta a la pregunta a? d ) ¿Cuál es la probabilidad de que muera un trabajador seleccionado aleatoriamente que no estuvo expuesto a la dosis letal? e) ¿Es P[muere] = P[muereexposición a la dosis letal]? ¿Esperaba que fueran iguales? Explique su respuesta. 14. Use los datos del ejercicio 4 para responder a las preguntas que siguen. a) ¿Cuál es la probabilidad de que en un sistema de motores como el descrito antes funcione el motor de respaldo dado que falle el motor principal? b) ¿Es P[funciona motor de respaldo] = P[funciona motor de respaldofalla motor principal]? ¿Esperaba que fueran iguales? Explique su respuesta. 15. En un estudio del agua cerca de plantas de generación eléctrica y otras de tipo industrial que vierten aguas residuales en el sistema de agua, se observó que 5% tenía signos de contaminación química y térmica; 40%, de contaminación química, y 35%, de contaminación térmica. Suponga que los resultados del estudio reflejan con exactitud la situación general. ¿Cuál es la probabilidad de que una corriente de agua con contaminación térmica también la tenga química? ¿Cuál es la probabilidad de que un río con contaminación química no tenga contaminación térmica? 16. Un generador de dígitos aleatorios de una calculadora electrónica se activa dos veces para simular un número aleatorio de dos dígitos. En teoría, cada dígito del 0 al 9 tiene las mismas probabilidades que los demás de aparecer en un ensayo dado. a) ¿Cuántos números aleatorios de dos dígitos son posibles? b) ¿Cuántos de esos números comienzan con el dígito 2? c) ¿Cuántos de esos números terminan con el dígito 9? d ) ¿Cuántos de esos números comienzan con el dígito 2 y terminan con el 9? e) ¿Cuál es la probabilidad de que un número formado al azar termine con el 9, dado que empezó con 2? ¿Supuso este resultado? 17. En un estudio de las causas de interrupciones del abasto de energía eléctrica, se recopilaron los datos siguientes: • Se debe a falla de transformadores en 5% • Resulta de daño en las líneas de alimentación en 80% • Se involucra a ambos problemas en 1%

ALGUNAS LEYES DE PROBABILIDAD

41

A partir de esos porcentajes, calcule la probabilidad aproximada de que una interrupción del abasto de energía eléctrica comprenda: a) daño de las líneas, dado que el daño proviene de los transformadores b) daño de transformadores, dado que el daño está en las líneas c) daño de transformadores sin daño en las líneas d ) daño de transformadores, dada la ausencia de daño en las líneas e) daño en transformadores o en las líneas Sección 2.3

18. Sean A1 y A2 eventos tales que P[A1] = 0.5 y P[A2] = 0.7. ¿A qué debe ser igual P[A1 ∩ A2] para que A1 y A2 sean independientes? 19. Sean los eventos A1 y A2, tales que P[A1] = 0.6, P[A2] = 0.4 y P[A1 ∪ A2] = 0.8. ¿Son independientes A1 y A2? 20. Considere su respuesta al ejercicio 14b. ¿Son independientes los eventos A1: funciona el motor de respaldo, y A2: falla el motor principal? 21. Estudios de genética poblacional indican que es negativo 39% de los genes disponibles para determinar el factor sanguíneo Rh. La sangre Rh negativa está presente si y sólo si el individuo tiene dos genes negativos. Cada gen se hereda de manera independiente, de cada progenitor. ¿Cuál es la probabilidad de que un individuo seleccionado aleatoriamente tenga sangre Rh negativa? 22. El grupo sanguíneo de una persona (A, B, AB u O) es independiente de su factor Rh. Calcule la probabilidad de que una persona seleccionada al azar tenga sangre AB con factor Rh negativo. Sugerencia: Véase el ejemplo 2.1.1 y el ejercicio 21. 23. El uso del aspecto de las plantas en la prospección de depósitos minerales se denomina prospección geobotánica. Un indicador de cobre es una pequeña planta de menta con flores de color malva. Suponga que en una región dada se tiene probabilidad de 30% de alto contenido de cobre en el suelo y de 23% de presencia de esa planta. Si el contenido de cobre es alto, existe 70% de probabilidad de que esté presente la planta. a) Calcule la probabilidad de que el contenido de cobre sea alto y la planta esté presente. b) Calcule la probabilidad de que el contenido de cobre sea alto, dada la presencia de la planta. 24. Los contaminantes más frecuentes del agua son orgánicos. Muchos materiales orgánicos son desdoblados por bacterias que requieren oxígeno, de modo que el exceso de materia orgánica puede disminuir el oxígeno disponible. A su vez, ello resultaría dañino para otros organismos que viven en el agua. La demanda de oxígeno de las bacterias se llama demanda de oxígeno biológica (DOB). Un estudio de sistemas de agua localizados cerca de un complejo industrial reveló que 35% tiene DOB alta, en 10% existe acidez alta, y en un 40% de los ríos con acidez alta hay DOB alto. Calcule la probabilidad de que una corriente de agua seleccionada aleatoriamente tenga ambas características. 25. Un estudio de inundaciones repentinas graves ocurridas durante los últimos 15 años muestra que la probabilidad de que se emita una advertencia de tales inundaciones es de 0.5, y la de que se rompa la presa durante una inundación, de 0.33. La probabilidad de falla de la presa, dada la emisión de la advertencia, es de 0.17. Calcule la probabilidad de que se emita una advertencia de inundación y concurra la falla de la presa. (Basado en datos presentados en McGraw-Hill Yearbook of Science and Technology, 1980, pp. 185-186.)

42

PROBABILIDAD Y ESTADÍSTICA

26. La capacidad de observar y recordar detalles es importante en la ciencia. Por desgracia, el poder de la sugestión puede deformar la memoria. Un estudio de rememoración se lleva a cabo como sigue: se muestra a los sujetos una película, en que un automóvil se desplaza por un camino rural. No aparece ningún granero en la película. Luego, se hacen diversas preguntas sobre la película a los sujetos. A la mitad de ellos, se les pregunta: “¿A qué velocidad iba el automóvil cuando pasó por el granero?” Esta pregunta no se hace a la otra mitad. Luego, se pregunta a todos los sujetos: “¿Aparece un granero en la película?” De quienes respondieron a la primera pregunta sobre el granero, 17% contesta “sí”, mientras que apenas 3% de los demás sujetos responde de igual manera. ¿Cuál es la probabilidad de que un participante del estudio seleccionado aleatoriamente señale haber visto el granero inexistente? ¿Es la afirmación de haber visto el granero independiente de que se haga la primera pregunta acerca del granero mismo? Sugerencia: P[sí] = P[sí y pregunta acerca del granero] + P[sí y sin pregunta acerca del granero]

27.

28. 29.

30.

31.

32. 33.

(Basado en un estudio presentado en McGraw-Hill Yearbook of Science and Technology, 1981, pp. 249-251.) La probabilidad de que una unidad de sangre provenga de un donador pagado es de 0.67. Si se le pagó al donador, la probabilidad de contraer hepatitis con dicha unidad es de 0.0144. Si no se le pagó, la probabilidad se reduce a 0.0012. Un paciente recibe la transfusión de una unidad de sangre. ¿Cuál es la probabilidad de que el paciente contraiga hepatitis con dicha sangre? Demuestre que el evento imposible es independiente de cualquier otro evento. Considere los porcentajes que se indican en el ejercicio 7. Calcule la probabilidad de que ocurra un apagón programado en un día cuya temperatura es mayor de 85°F. Si se supone que las probabilidades son exactas, ¿es el evento de que ocurra un apagón programado independiente del evento de que la temperatura sea mayor de 85°F? Explique su respuesta, con base en la probabilidad que acaba de calcular. Suponga que existe 50% de probabilidad de daño al disco duro de una computadora si la línea de alimentación eléctrica a la que está conectada es alcanzada por una tormenta eléctrica. Existe una probabilidad de 5% de que ocurra una tormenta eléctrica en cualquier día veraniego en un área dada. Si la probabilidad de que la tormenta eléctrica afecte a la línea es de 0.1%, ¿cuál es la probabilidad de que la tormenta alcance la línea y ocurra daño del disco duro durante la siguiente tormenta eléctrica en el área? Una fundidora produce piezas de hierro fundido para uso en las transmisiones automáticas de camiones. Son dos las dimensiones cruciales de dicha pieza, A y B. Suponga que si la pieza cumple con la especificación de la dimensión A, existe probabilidad de 98% de que también cumpla la de la dimensión B. Además, existe 95% de probabilidad de que cumpla con la especificación de la dimensión A y de 97% de que lo haga con la dimensión B. Se selecciona aleatoriamente e inspecciona una unidad de dicha pieza. ¿Cuál es la probabilidad de que cumpla con las especificaciones de ambas dimensiones? Sean A1 y A2 eventos mutuamente excluyentes, tales que P[A1]P[A2] > 0. Demuestre que estos eventos no son independientes. Sean A1 y A2 eventos independientes, tales que P[A1]P[A2] > 0. Demuestre que estos eventos no son mutuamente excluyentes.

ALGUNAS LEYES DE PROBABILIDAD

43

Sección 2.4

34. Use los datos del ejemplo 2.4.2 para calcular la probabilidad de que un conscripto cuya sangre se identificó como del grupo A en verdad tenga sangre del grupo B. 35. Se desarrolló una prueba para diagnosticar un tipo específico de artritis en personas de más de 50 años. Con base en una encuesta nacional, se sabe que casi 10% de las personas de dicho grupo de edad sufre la forma de artritis en cuestión. El examen propuesto se administra a personas con artritis confirmada y sus resultados son correctos en 85% de los casos. Cuando se emprende el examen en personas del mismo grupo de edad, de las cuales se sabe que no sufren el padecimiento, se identificó el malestar en 4%. ¿Cuál es la probabilidad de que un individuo tenga la enfermedad, dado que la información de la prueba indica su presencia? 36. Se informa que 50% de los chips de computadora producidos es defectuoso. La inspección revela que apenas 5% de los chips comercializados legalmente en realidad tiene defectos. Por desgracia, algunos chips son robados antes de la inspección. Si 1% de los chips existentes en el mercado es robado, calcule la probabilidad de que un chip sea robado, dado que es defectuoso. 37. A medida que la sociedad se vuelve dependiente de las computadoras, los datos deben comunicarse por redes de comunicación pública, como satélites, sistemas de microondas y teléfonos. Al recibir un mensaje, es necesaria su autentificación. Ello se logra mediante el uso de una clave secreta cifrada. Aunque sea secreta, siempre existe la posibilidad de que caiga en las manos indebidas, lo cual posibilitaría que un mensaje no auténtico parezca ser auténtico. Suponga que 95% de los mensajes recibidos es auténtico. Además, considere que apenas 0.1% de los mensajes no auténticos se envía con la clave correcta y que el envío de todos los mensajes auténticos se realiza con la clave correcta. Calcule la probabilidad de que un mensaje sea auténtico, dado que se usa la clave correcta.

EJERCICIOS DE REPASO

38. Una encuesta en despachos de ingeniería revela que 80% tiene su propio servidor (M ), 10% planea comprar un equipo de esos en el futuro cercano (B) y 5% los tiene y planea añadir otro a corto plazo. Calcule la probabilidad de que un despacho seleccionado aleatoriamente: a) tenga un servidor o planee comprarlo en el futuro cercano b) no tenga un servidor ni planee comprarlo en el futuro cercano c) planea comprar un servidor, dado que actualmente no lo tiene d ) tenga un servidor, dado que planea comprar uno en el futuro cercano 39. En un programa de simulación, se generarán tres números aleatorios de dos dígitos, uno con independencia de los otros. Estos números tendrán los valores 00, 01, 02, . . . , 99 con igual probabilidad. a) ¿Cuál es la probabilidad de que un número dado sea menor de 50? b) ¿Cuál es la probabilidad de que cada uno de los tres números generados sea menor de 50? 40. Una red de energía eléctrica tiene tres subestaciones, A, B y C. La sobrecarga en cualquiera de ellas puede originar que se interrumpa el abasto de electricidad en toda la red. La historia muestra que la probabilidad de apagón es de 1% si ocurre la sobrecarga únicamente en la subestación A, y de 2 y 3% si sobreviene en las subestaciones B y C, respectivamente. La sobrecarga en dos

44

41.

42.

43.

44.

PROBABILIDAD Y ESTADÍSTICA

o más subestaciones de manera simultánea origina apagones en 5% de los casos. Durante una onda cálida hay 60% de posibilidad que sólo la subestación A experimente una sobrecarga. Para las estaciones B y C estos porcentajes son de 20 y 15%, en el mismo orden. En una onda cálida específica, tuvo lugar un apagón debido a sobrecarga. Calcule la probabilidad de que haya habido sobrecarga únicamente en la subestación A, la subestación B o la subestación C, o en dos o más subestaciones al mismo tiempo. Un centro de cómputo tiene tres impresoras, A, B y C, que imprimen a velocidad distinta. Los programas se envían a la primera impresora disponible. Las probabilidades de que un programa se envíe a las impresoras A, B y C son de 0.6, 0.3 y 0.1, respectivamente. En ocasiones, los impresos se atoran en la impresora y se destruyen. Las probabilidades de que se atore el papel en las impresoras A, B y C son de 0.01, 0.05 y 0.04, en el mismo orden. Un programa escrito por usted se destruye al atorarse el papel en la impresora. ¿Cuál es la probabilidad de que ello haya ocurrido en la impresora A? ¿De qué haya ocurrido en la B? ¿De qué haya ocurrido en la C? Un ingeniero químico está a cargo de un proceso específico en una refinería. La experiencia indica que 10% de los paros de la planta se deben únicamente a fallas de equipo, 5% a fallas de equipo y errores de los operadores, y 40% a errores de los operadores. Ocurre un paro de la refinería. Calcule la probabilidad de que: a) se deba a fallas del equipo o errores de los operadores b) se deba sólo a errores de los operadores c) no se deba a fallas de equipo ni errores de los operadores d ) se deba a errores de los operadores, dado que ocurrió una falla de equipo e) se deba a errores de los operadores, dado que no ocurrió una falla de equipo Suponga que la probabilidad de que los frenos de aire de los camiones fallen en un descenso particularmente largo es de 0.001. Suponga también que los frenos de emergencia de esos camiones pueden detenerlos en el tipo de descenso mencionado con probabilidad de 0.8. Estos sistemas de frenado funcionan independientemente uno respecto del otro. Calcule la probabilidad de que: a) los frenos de aire fallen y los de emergencia detengan al camión b) los frenos de aire fallen y los de emergencia no puedan detener al camión c) los frenos de emergencia no puedan detener al camión, dado que fallaron los frenos de aire Considere el problema del ejemplo 1.2.3. Suponga que el muestreo es independiente y que en cada etapa se tiene probabilidad de 0.01 de obtener una pieza defectuosa cuando el proceso funciona correctamente. En el supuesto de que el proceso funcione en forma correcta, ¿cuál es la probabilidad de que la primera pieza defectuosa se obtenga en la cuarta muestra? ¿Cuál es la probabilidad de que se obtenga antes de la cuarta muestra o en ella?

CAPÍTULO

3

DISTRIBUCIONES DISCRETAS

E

n las ciencias, es frecuente el uso de “variables”. El diccionario Webster define una variable como “una cantidad que puede asumir cualquiera de un conjunto de valores”. En estadística, se estudian las variables aleatorias, cuyo valor depende del azar. Muchos ejemplos de capítulos previos corresponden a variables aleatorias, aunque en ellos no se haya usado el término. Estas variables suelen corresponder a una de dos categorías, a saber, discretas o continuas. En este libro se inicia su estudio con el aprendizaje de las variables aleatorias discretas. El resto del capítulo se dedica a esta variable.

3.1

VARIABLES ALEATORIAS

Se parte de considerar tres ejemplos, cada uno de una variable aleatoria. Estas variables se denotan con mayúsculas, y sus valores numéricos observados, con minúsculas. Ejemplo 3.1.1. Considérese la variable aleatoria X, que es el número de hijos de ojos cafés de una pareja heterocigota para el color de los ojos. Si se supone que tiene dos hijos, a priori, la variable X puede asumir los valores 0, 1 o 2. La variable es aleatoria en el sentido de que los ojos cafés dependen de la herencia al azar, en el momento de la concepción, de un gen dominante. Si una pareja dada tiene dos hijos con ojos cafés, se escribe x = 2. Ejemplo 3.1.2. La premisa básica subyacente al campo de la inmunología es que se inmuniza a un animal mediante la inyección de un antígeno idóneo. En un estudio, se exponen células cancerosas de plasmacitoma a linfocitos que contienen un antígeno específico. Se espera que estas células se fusionen, ya que las células fusionadas mantienen su capacidad de reproducirse en forma continua y también las características de anticuerpos del antígeno fusionado. De esta manera, se inmuniza rápidamente al animal. Las células son expuestas a los linfocitos en presencia de polietilenglicol, agente que promueve la

45

46

PROBABILIDAD Y ESTADÍSTICA

fusión. Se sabe que la probabilidad de que se fusionen es de 1/2. Sea Y el número de células expuestas para obtener la primera fusión. La variable Y es aleatoria; a priori, puede asumir cualquier valor del conjunto {1, 2, 3, . . .}. Recuérdese, del estudio del cálculo, que un conjunto como ése, que se conforma de una colección infinita de puntos aislados, se denomina conjunto infinito contable. Ejemplo 3.1.3. En el ejemplo 1.1.2, se considera la variable T, que es la hora en que ocurre la demanda máxima de energía eléctrica en un día dado. Esta variable es aleatoria, ya que su valor lo afectan factores del azar, como fecha, humedad y temperatura. Se puede suponer que asuma cualquier valor en el espacio de 24 h que va de las 24:00 horas de un día a las 24:00 horas del día siguiente.

Es fácil distinguir a una variable aleatoria discreta de otra que no lo es. Basta hacerse la pregunta: “¿Cuáles son los valores posibles de la variable?” Si la respuesta es un conjunto finito o un conjunto infinito contable, la variable discreta es aleatoria, mientras que en caso contrario no lo es. Esta idea lleva a la definición siguiente:

Definición 3.1.1 (variable aleatoria discreta). Una variable aleatoria es discreta si puede asumir cuando mucho un número finito o uno infinito contable de valores posibles.

La variable aleatoria X, el número de hijos de ojos cafés en una familia de dos hijos, es discreta. Su conjunto de valores posibles es el conjunto finito {0, 1, 2}. El conjunto {1, 2, 3, . . .} de posibles valores de Y, el número de células expuestas para obtener la primera fusión en el ejemplo 3.1.2, es infinito contable. Así pues, Y también es una variable aleatoria discreta. La variable aleatoria T, la hora de demanda máxima de energía eléctrica en una planta generadora, difiere de las otras. El tiempo se mide de manera continua y es concebible que T asuma cualquier valor en el intervalo [0, 24), donde 0 denota las 24:00 horas de un día, y 24, las 24:00 horas del día siguiente. Este conjunto de números reales no es finito ni infinito contable. La variable aleatoria de estudio no es discreta siempre que se plantee la pregunta: “¿Cuáles son los valores posibles de la variable aleatoria?” y se esté forzado a aceptar que el conjunto de posibilidades abarca un intervalo o un conjunto continuo de números reales.

3.2

DENSIDADES DE PROBABILIDAD DISCRETAS

En el caso de variables aleatorias, no basta determinar simplemente sus valores posibles. También se requiere indagar qué es probable. Debe ser factible predecir en algún sentido los valores que probablemente asumirá la variable en un momento dado. Puesto que el comportamiento de las variables aleatorias depende del azar, son predicciones que se elaboran en medio de una gran incertidumbre. Dos funciones se usan para lograr esas predicciones. Se las denomina función de densidad y función de distribución acumulativa. La primera es conocida con diversos nombres en el caso de variables discretas, de los cuales algunos comunes son los de función de probabilidad, función masa de probabilidad y función de densidad de probabilidad. En el caso de variables discretas, la densidad se denota con p(x) o f (x), mientras que en el caso de variables continuas casi siempre se denota con f (x). En aras

DISTRIBUCIONES DISCRETAS

47

de la consistencia, en esta obra se usa f (x) para indicar la densidad en ambos casos. Se parte de definir la función de densidad de variables aleatorias discretas. Definición 3.2.1 (densidad discreta). Sea X una variable aleatoria discreta. La función f dada por: f (x) = P[X = x] para el número real x se llama función de densidad de X. Son varios los factores que deben resaltarse en cuanto a la densidad en el caso discreto. Primero, que f se define sobre el conjunto de números reales, además, para cualquier número real dado x, f (x) es la probabilidad de que la variable aleatoria X asuma el valor x. Por ejemplo, f (2) es la probabilidad de que la variable aleatoria X tenga el valor numérico 2. Segundo, que f (x) es una probabilidad, de modo que f (x) ≥ 0 sin importar el valor de x. Tercero, que la suma de todos los valores de X que ocurren con probabilidad distinta de cero debe ser 1. Las dos condiciones siguientes son necesarias y suficientes para que una función f sea de densidad discreta. En otras palabras, si la función satisface ambas condiciones, puede considerarse como representativa de la densidad de una variable aleatoria discreta, y si no las satisface simultáneamente, no puede ser la densidad de ninguna variable aleatoria discreta: Condiciones necesarias y suficientes para que una función sea una densidad discreta 1. f (x) ≥ 0 2.

∑ f (x) = 1 ∀x

El ejemplo siguiente ilustra estas ideas. Ejemplo 3.2.1. Considérese la variable aleatoria Y, el número de células expuestas a linfocitos que contienen antígeno en presencia de polietilenglicol para obtener la primera fusión (ejemplo 3.1.2). Se sabe que bajo estas condiciones la probabilidad de que se fusione una célula dada es de 1/2. Así pues, la probabilidad de que no se fusione también es de 1/2. Es razonable suponer que las células se comportan en forma independiente. Los valores posibles de Y son {1, 2, 3, . . .}. La probabilidad de que la primera célula se fusione es 1/2. En otras palabras: P[Y = 1] = f (1) = 1/2 La probabilidad de que la primera célula no se fusione proporciona un valor de 2 para Y, es P[Y = 2] = f (2) = P[la primera célula no se fusiona]P[la segunda célula sí se fusiona] = 1/2 · 1/2 = 1/4

48

PROBABILIDAD Y ESTADÍSTICA

En forma similar: P[Y = 3] = f (3) = 1/2 · 1/2 · 1/2 = 1/8 Puede resumirse la estructura de probabilidad de Y en una tabla de densidad (tabla 3.1). Ésta es una en la que se indican los valores posibles de la variable aleatoria en la primera fila y las probabilidades correspondientes en la segunda fila. Nótese que un comportamiento es evidente en los valores de la segunda fila. Cuando ello ocurre, es posible identificar una expresión de forma cerrada de la densidad. En este caso: (1/ 2) y y = 1, 2, 3, . . . f ( y) =  0 en cualquier otro caso ¿Es realmente ésta una densidad? Aunque resulta evidente que no es negativa, ¿es su suma igual a 1? A fin de comprobarlo, tome nota de que: ∞

∑ f ( y) = ∑ (1/ 2) y y =1

∀y

es una serie geométrica con primer término a = 1/2 y razón común r = 1/2. Las propiedades de las series geométricas son muy conocidas. En particular, recuérdese de los fundamentos de cálculo que una serie puede converger o divergir. El hecho siguiente es útil en el material que aparece a continuación:

Convergencia de series geométricas ∞

Sea ∑ ar k − 1 una serie geométrica. k =1

La serie converge a

a si |r| < 1. 1− r

Si se aplica aquí este resultado, se observa que: ∞

∑ (1/ 2) y =

y =1

a 1/ 2 = =1 1 − r 1 − 1/ 2

y la función f es una densidad.

La densidad discreta se define sobre todo el conjunto de números reales; pero sólo es necesario especificar la densidad para los valores de y con los que f ( y) ≠ 0. De tal suerte, en el ejemplo previo puede escribirse: y = 1, 2, 3, . . . f ( y) = (1/2) y Se entiende que f ( y) = 0 para todos los demás números reales. Una vez que se sabe que la funció¡ es una densidad, puede usarse para responder preguntas concernientes al comportamiento de Y. TABLA 3.1 y

1

2

3

4· · ·

P[Y = y] = f ( y)

1/2

1/2 · 1/2

1/2 · 1/2 · 1/2

1/2 · 1/2 · 1/2 · 1/2 · · ·

DISTRIBUCIONES DISCRETAS

49

Ejemplo 3.2.2. ¿Cuál es la probabilidad de que sea necesaria la exposición de cuatro o más células a linfocitos portadores de antígeno en presencia de polietilenglicol para obtener la primera fusión? En otras palabras, ¿cuál es el valor de P[Y ≥ 4]? La densidad de Y es: y = 1, 2, 3, . . .

f ( y) = (1/2) y

Aunque es posible calcular directamente la probabilidad buscada, resulta más sencillo usar la sustracción:

P[Y ≥ 4] = 1 − P[Y < 4] = 1 − P[Y ≤ 3] = 1 − ( P[Y = 1] + P[Y = 2] + P[Y = 3]) = 1 − ( f (1) + f ( 2) + f (3)) = 1 − ((1/ 2)1 + (1/ 2) 2 + (1/ 2) 3 ) = 1 − (1/ 2 + 1/ 4 + 1/ 8) = 1 − 7 / 8 = 1/ 8

Distribución acumulativa La segunda función usada para calcular probabilidades es la función de distribución acumulativa, F. Muchas de las tablas estadísticas usadas en el material siguiente son de dicha función respecto de alguna variable aleatoria pertinente. El adjetivo “acumulativo” indica el uso de esta función. Suma o acumula las probabilidades calculadas por medio de la densidad. Esta función se define como sigue: Definición 3.2.2 (distribución acumulativa: discreta). Sea X una variable aleatoria discreta con densidad f. La función de distribución acumulativa de X, denotada con F, se define con la fórmula siguiente: F(x) = P[X ≤ x]

para todo número real x

Considérese un número real específico, x0. A fin de calcular P[X ≤ x0] = F(x0), se suma la densidad f de todos los valores de X que ocurren con probabilidad distinta de cero y son menores o iguales que x0. El cálculo se hace con la fórmula siguiente: F ( x0 ) =

∑ f (x)

x ≤ x0

Esta idea se ilustra en el ejemplo 3.2.3. Ejemplo 3.2.3. Ciertos genes producen una desviación respecto de lo normal, de magnitud tal que el organismo no puede sobrevivir. A tales genes se les conoce como genes letales. Un ejemplo es el gen Y, que produce pelaje amarillo en ratones. Es un gen dominante respecto del correspondiente a pelaje gris, y. La teoría genética normal predice que cuando se aparean dos ratones heterocigotos para este rasgo (Yy), 1/4 de sus descendientes tiene pelaje gris, y 3/4, pelaje amarillo. Los biólogos han observado que estas proporciones predichas no ocurren en realidad, sino que los porcentajes verdaderos son de 1/3 de pelaje

50

PROBABILIDAD Y ESTADÍSTICA

TABLA 3.2 x P[X = x] = f (x)

0

1

2

3

1/27

6/27

12/27

8/27

0

1

2

3

1/27

7/27

19/27

27/27

1

2

3

4...

8/16

12/16

14/16

15/16 . . .

TABLA 3.3 x P[X ≤ x] = F(x) TABLA 3.4 y P[Y ≤ y] = F(y)

gris y 2/3 de pelaje amarillo. Ha quedado establecido que tal desviación resulta del hecho de que no se desarrolla 1/4 de los embriones homocigotos para pelaje amarillo (YY ). Ello hace que sólo queden dos genotipos, Yy e yy, que ocurren en proporción de 2 a 1, de los cuales el primero origina el pelaje amarillo. Por tal razón, se dice que el gen Y es letal. La densidad de X, el número de ratones de pelaje amarillo en una camada de tres ratones, se muestra en la tabla 3.2, y su distribución acumulativa, en la tabla 3.3. Nótese que: F(0) = P[X ≤ 0] = P[X = 0] = 1/27 F(1) = P[X ≤ 1] = P[X = 0] + P[X = 1] = 1/27 + 6/27 F(2) = P[X ≤ 2] = P[X = 0] + P[X = 1] + P[X = 2] = 1/27 + 6/27 + 12/27 F(3) = P[X ≤ 3] = 1 En el caso de variables aleatorias discretas que sólo puedan asumir un número finito de valores posibles, el último valor de la fila inferior de la tabla acumulativa siempre es 1.

Aunque las probabilidades acumulativas suelen presentarse en forma de tabla, como en el ejemplo precedente, en ocasiones es posible expresar F en forma de ecuación. El ejemplo 3.2.4 ilustra esta idea. Ejemplo 3.2.4. Considérese la variable aleatoria Y del ejemplo 3.2.1, con densidad: f ( y) = (1/2) y

y = 1, 2, 3, . . .

Una tabla acumulativa parcial de Y se muestra en la tabla 3.4. Se forma al sumar las probabilidades indicadas en la tabla de densidad (tabla 3.1). Es útil tener una expresión cerrada de F. En este caso, es fácil de obtener. Por definición: F ( y0 ) =

∑ f ( y)

y ≤ y0

Si [ y0] denota el entero más grande menor o igual que y0, entonces el caso F( y0) puede expresarse como sigue:

DISTRIBUCIONES DISCRETAS

51

[ y0 ]

F ( y0 ) =

∑ (1/ 2) y y =1

[ y0 ]

=

∑ (1/ 2) (1/ 2) y − 1 y =1

Recuérdese, de los fundamentos de cálculo, que la suma de los primeros n términos de una serie geométrica está dada por:

Suma de los primeros n términos: series geométricas n

∑ ar k − 1 =

k =1

a(1 − r n ) 1− r

r ≠1

donde a es el primer término de la serie y r es la razón común. Se aplica este resultado, con a = 1/2 y r = 1/2, para obtener: (1/ 2) [1 − (1/ 2)[ y0] ] 1 − 1/ 2 = 1 − (1/ 2)[ y0]

F ( y 0) =

La probabilidad de que cuando mucho siete células deban ser expuestas para obtener la primera fusión está dada por:

P[Y ≤ 7] = F ( y ) = 1 − (1/ 2) 7 =

127 128

3.3 ESPERANZA Y PARÁMETROS DE UNA DISTRIBUCIÓN La función de densidad de una variable aleatoria describe por completo su comportamiento. Sin embargo, toda variable aleatoria se relaciona con constantes o “parámetros”, que son descriptivos. El conocimiento de los valores numéricos de esos parámetros brinda al investigador datos inmediatos sobre la naturaleza de las variables. Se consideran a continuación tres parámetros, a saber, la media µ, la varianza σ 2 y la desviación estándar σ. Si se conoce la densidad exacta de la variable aleatoria, es posible calcular el valor numérico de cada parámetro a partir de consideraciones matemáticas. Éste es el tema de la presente sección. Cuando lo único que tiene el investigador es un conjunto de observaciones de la variable aleatoria (un conjunto de datos), resulta imposible calcular con precisión los valores de esos parámetros, en vez de lo cual deben aproximarse con técnicas estadísticas. Este último es el tema de gran parte del resto de la obra. Es necesario familiarizarse con un concepto general, a saber, la idea de la esperanza matemática o valor esperado, para comprender el razonamiento subyacente a numerosos métodos estadísticos. Este concepto se usa en la definición de gran cantidad de parámetros estadísticos y constituye el

52

PROBABILIDAD Y ESTADÍSTICA

fundamento lógico de la mayoría de los métodos de inferencia estadística que se analizan más adelante en la obra. Un ejemplo sencillo ilustra la idea básica de la esperanza matemática. Considérese el lanzamiento de un dado, y sea X el número que queda hacia arriba. Los valores posibles de X son 1, 2, 3, 4, 5 y 6; puesto que el dado no está cargado, la probabilidad relacionada con cada valor es de 1/6. La densidad de X está dada por: f (x) = 1/6

x = 1, 2, 3, 4, 5, 6

Cuando se quiere indagar el valor esperado de X, lo que se requiere es el valor promedio teórico a largo plazo de X. Si el lector imagina lanzar el dado una y otra vez, y registra el valor de X con cada lanzamiento, estaría registrando el valor promedio teórico de los lanzamientos, a medida que el número de éstos se acerca al infinito. Puesto que la densidad de X es simétrica y conocida, resulta posible calcular intuitivamente dicho promedio. Nótese que P[X = 1] = P[X = 6] = 1/6, de modo que en el largo plazo cabría esperar que se obtengan tantos unos como seises. Estos valores deben equilibrarse unos con otros y su valor promedio es (6 + 1)/2 = 3.5. También cabría esperar que salgan tantos doses como cuatros, y su número igualmente promedia 3.5. De manera similar, se esperaría que el tres y cuatro se equilibren mutuamente y promedien 3.5. La lógica indica que, en el largo plazo, el valor promedio o esperado de X es 3.5. Esto se denota con E[X ] = 3.5. Adviértase que este valor puede calcularse a partir de la densidad de X, como sigue: E[X ] = 1 . 1/6 + 2 . 1/6 + 3 . 1/6 + 4 . 1/6 + 5 . 1/6 + 6 . 1/6 = 3.5 o E[ X ] = ∑ (valor de x )( probabilidad ) ∀x

Por supuesto, la característica que facilita el cálculo de esta esperanza es la simetría de la densidad. ¿Es posible elaborar una definición de la esperanza que funcione con densidades asimétricas y se aplique no sólo a X, sino también a variables aleatorias que sean funciones de X ? La respuesta es afirmativa y la definición necesaria es la 3.3.1. Sin embargo, las esperanzas de funciones de X, como X 2, (X – c)2, donde c es una constante, y etX, son especialmente útiles en teoría estadística. Por ello, la definición de valor esperado se expresa en términos generales. A continuación, se define el significado del valor esperado de alguna función de X, que se denota con H(X ). Definición 3.3.1 (valor esperado). Sea X una variable aleatoria discreta con densidad f. Sea H(X ) una variable aleatoria. El valor esperado de H(X ), que se denota con E[H(X )], está dado por: E[ H ( X )] = ∑ H ( x ) f ( x ) ∀x

siempre y cuando Σ∀ x|H(x)| f (x) sea finita. La suma abarca todos los valores de X que ocurran con probabilidad distinta de cero.

DISTRIBUCIONES DISCRETAS

53

Nótese que el valor esperado de X en el caso especial de H(X ) = X se obtiene a partir de la definición precedente. Así pues, se tiene que: Valor esperado de X E[ X ] = ∑ xf ( x ) ∀x

Otro aspecto que debe resaltarse en esta definición es el hecho de la restricción de que exista Σ∀x|H(x)| f (x) no es particularmente limitante en la práctica. Si el conjunto de valores posibles de X es finito, se satisfará; si es infinito contable, usualmente se satisfará. No obstante, es posible generar una densidad f y una función H(X) respecto de las cuales no converja la serie Σ∀ x|H(x)| f (x) (véase ejercicio 22). En tal caso, se afirma que es inexistente el valor esperado de la variable aleatoria H(X ). Un ejemplo ilustra el uso de la definición 3.3.1. ¡Por favor tome en cuenta que se simplificó significativamente la densidad para fines de ilustración! Ejemplo 3.3.1. Un medicamento se usa para mantener estable la frecuencia de latidos en pacientes que han sufrido un ataque cardiaco leve. Sea X el número de latidos por minuto en cada paciente. Considérese la densidad hipotética que aparece en la tabla 3.5. ¿Cuál es la frecuencia cardiaca promedio obtenida en todos los pacientes que reciben el medicamento? En otras palabras, ¿cuál es el valor de E[X ]? Conforme a la definición 3.3.1: E[ X ] = ∑H ( x) f ( x) ∀x

= ∑ xf ( x ) ∀x

= 40( 0.01) + 60( 0.04) + 68( 0.05) + . . . + 100( 0.01) = 70 Puesto que el número de valores posibles de X es finito, existe Σ∀ x (x). Así pues, resulta posible afirmar que la frecuencia cardiaca promedio obtenida en los pacientes que usan el medicamento es de 70 latidos por minuto. En forma intuitiva, debería haberse esperado este resultado. Nótese la simetría de la densidad. En el largo plazo, se esperaría que haya tantos pacientes con frecuencia de 100 como de 40 latidos por minuto, y tantos con 60 como con 80 latidos por minuto. De igual manera, las frecuencias de 68 y 72 latidos ocurren con la misma frecuencia. Cada uno de estos pares promedia 70, que es el valor obtenido en el 80% restante de pacientes. El sentido común apunta a 70 como valor esperado de X.

En el contexto estadístico, el valor esperado de una variable aleatoria X se denomina su media y se denota con µ o µX. Dicho de otra manera, los términos valor esperado y media son intercambiaTABLA 3.5 x f (x)

40

60

68

70

72

80

100

0.01

0.04

0.05

0.80

0.05

0.04

0.01

54

PROBABILIDAD Y ESTADÍSTICA

bles, al igual que los símbolos E[X] y µ. La media puede conceptuarse como una medición del “centro de localización”, en el sentido de que indica dónde se localiza el “centro” de la densidad. Por ello, es frecuente llamarla parámetro de “localización”. Con el fin de poner de relieve estos aspectos, a continuación se resume el análisis precedente. Notas sobre el valor esperado de una variable aleatoria X 1. El valor esperado de una variable aleatoria es su valor promedio teórico. Se denota por E[X ] y puede calcularse a partir del conocimiento de la densidad de X. 2. En el contexto estadístico, el valor promedio de X se llama su valor medio o media. Así pues, son intercambiables los términos valor promedio, valor medio o media y valor esperado. 3. El valor medio de X se denota con la letra griega mu (µ). Así pues, los símbolos µ y E[X ] son intercambiables. 4. La media o valor esperado de X es una medición de la localización del centro de los valores de X. Por tal razón, se llama parámetro de “localización” a µ. Son tres las reglas para manejar los valores esperados útiles en la justificación de procedimientos estadísticos de capítulos ulteriores. Esas reglas, válidas por igual con variables aleatorias continuas y discretas, se definen e ilustran a continuación. La comprobación de las dos primeras se delinea en los ejercicios, mientras que la de la tercera regla debe postergarse hasta el capítulo 5. Teorema 3.3.1 (reglas de la esperanza). Sean X y Y variables aleatorias y sea c cualquier número real. 1. E[c] = c (El valor esperado de toda constante es esa constante.) 2. E[cX ] = cE[X ] (Las constantes se pueden factorizar a partir de las esperanzas.) 3. E[X + Y ] = E[X ] + E[Y ] (El valor esperado de una suma es igual a la suma de los valores esperados.) Ejemplo 3.3.2.

Sean X y Y variables aleatorias, con E[X ] = 7 y E[Y ] = –5. Entonces: E[4X – 2Y + 6] = = = = =

E[4X ] + E[–2Y ] + E[6] 4E[X ] + (–2)E[Y ] + E[6] 4E[X ] – 2E[Y ] + 6 4(7) – 2(–5) + 6 44

Regla 3 Regla 2 Regla 1

Varianza y desviación estándar El conocimiento de la media de una variable aleatoria es importante; pero por sí solo puede ser desorientador. El ejemplo siguiente debe mostrar el problema correspondiente. Ejemplo 3.3.3. Suponga que se pretende comparar un nuevo medicamento con el del ejemplo 3.3.1. Sea X el número de latidos por minuto obtenido con el antiguo medicamento y Y el que se logra con el nuevo fármaco. La densidad hipotética de cada una de estas variables se indica en la tabla 3.6. Puesto que cada densidad es simétrica, el análisis muestra que µX = µY = 70. Cada uno de los medicamentos produce en

DISTRIBUCIONES DISCRETAS

55

TABLA 3.6 x f (x) y f (y)

40

60

68

70

72

80

100

0.01

0.04

0.05

0.80

0.05

0.04

0.01

40

60

68

70

72

80

100

0.40

0.05

0.04

0.02

0.04

0.05

0.40

promedio el mismo número de latidos por minuto. Sin embargo, es evidente que existe una diferencia clara entre los dos fármacos, la cual no se identifica con la media. El medicamento antiguo genera reacciones más bien constantes en los pacientes, de modo que 90% difiere de la media cuando mucho en 2; muy pocos (2%) tienen reacción extrema al fármaco. En contraste, el nuevo medicamento causa respuestas muy diversas. Apenas 10% de los pacientes tiene frecuencia cardiaca que difiere de la media en no más de dos unidades, mientras que en 80% ocurre una reacción extrema. Si se examina sólo la media, se llegaría a la conclusión de que los dos fármacos producen efectos idénticos, ¡y nada está más lejano de la verdad!

Es evidente, con base en el ejemplo 3.3.3, la existencia de algo que no se mide con la media. Ese algo es la variabilidad. Es imperativo encontrar un parámetro que refleje la constancia o su ausencia. Se pretende que la medición tenga valor positivo alto si la variable aleatoria fluctúa en el sentido de que frecuentemente asume valores que distan mucho de la media; debe tener un valor positivo pequeño si los valores de X tienden a agruparse muy cerca de la media. Son varias las maneras de definir esa medición. La más usada es la varianza. Definición 3.3.2 (varianza). Sea X una variable aleatoria con media µ. La varianza de X, denotada como Var X o σ 2, está dada por: Var X = σ 2 = E[(X – µ)2] Nótese que la varianza mide la variabilidad al considerar X – µ, que es la diferencia entre la variable y su media. Esa diferencia se eleva a la segunda potencia, de modo que los valores negativos no cancelen a los positivos en el proceso de cálculo del valor esperado. Cuando se expresa en la forma E[(X – µ)2], es fácil apreciar que σ 2 tiene las propiedades que se buscan. Si la variable X asume frecuentemente valores que distan mucho de µ, entonces σ 2 es un número positivo grande, y si tienden a agruparse cerca de µ, entonces σ 2 es un valor positivo pequeño. El concepto se ilustra en la figura 3.1. Es habitual que la definición de σ 2 no se use para calcular la varianza. En su lugar, se aplica una forma alterna, dada en el teorema siguiente. Teorema 3.3.2 (fórmula de cálculo de σ 2 )

σ 2 = Var X = E[X 2] – (E[X ])2

56

PROBABILIDAD Y ESTADÍSTICA

a)

µ

b)

µ

FIGURA 3.1 a) Distribución con varianza pequeña. La mayor parte de los datos, denotados con puntos, se ubican muy cerca del valor promedio, µ. Por ende, gran parte de las diferencias, x – µ, son pequeñas. b) Distribución con varianza grande. Gran cantidad de los datos están distantes del valor promedio, µ.

Demostración.

Por definición: Var X = E[(X – µ)2] = E[X 2 – 2µX + µ2]

El uso de las reglas de la esperanza del teorema 3.3.1 permite obtener: Var X = E[X 2] – 2µE[X ] + µ2 Puesto que los símbolos µ y E[X ] son intercambiables, se tiene: Var X = E[X 2] – 2(E[X ]2 ) + (E[X ])2 = E[X 2] – (E[X ]2 )

A continuación, se ilustra el teorema mediante el cálculo de la varianza de cada una de las variables aleatorias del ejemplo 3.3.3. Ejemplo 3.3.4. A fin de calcular σ 2X y σ Y2 para las variables del ejemplo 3.3.3, primero debe usarse la tabla 3.6 para calcular E[X 2] y E[Y 2]. Se sabe que E[X ] = E[Y ] = 70. E [ X 2] = ∑ x 2 f ( x ) ∀x

= ( 402 )( 0.01) + ( 602 )( 0.04) + . . . + (1002 )( 0.01) = 4 926.4 E [Y 2] = ∑ y2 f ( y) ∀y

= ( 402 )( 0.40) + ( 602 )( 0.05) + . . . + (1002 )( 0.40) = 5 630.32

DISTRIBUCIONES DISCRETAS

57

Según el teorema 3.3.2: Var X = = Var Y = =

E[X 2] – (E[X ])2 4 926.4 – 702 = 26.4 E[Y 2] – (E[Y ])2 5 630.32 – 702 = 730.32

Como cabría esperar, Var Y > Var X. Pese a que los medicamentos producen la misma media de latidos por minuto, no se comportan de igual manera. El nuevo fármaco no tiene efectos tan constantes como el antiguo.

Note que la varianza de una variable aleatoria no es en sí muy informativa. ¿Es grande o pequeña una varianza de 26.4? Este valor asume significado sólo cuando se compara con la varianza de una variable similar. Así pues, las varianzas se usan frecuentemente para fines comparativos, con el fin de elegir entre dos variables que, por lo demás, parecen idénticas. Por añadidura, tome nota de que la varianza de una variable aleatoria es, en lo fundamental, un número puro cuyas unidades frecuentemente carecen de significado físico. Cuando sea así, es posible omitirlas. Por ejemplo, la unidad relacionada con la varianza del ejemplo 3.3.4 es un “latido cardiaco al cuadrado”. Ello reviste poco significado, de modo que en este caso se presenta la varianza sin indicar sus unidades. A fin de superar este problema, se aplica una segunda medición de variabilidad. Se trata de la raíz cuadrada no negativa de la varianza y se llama desviación estándar. Posee la ventaja de expresarse en las mismas unidades que los datos originales. Definición 3.3.3 (desviación estándar). Sea X una variable aleatoria con varianza σ 2. La desviación estándar de X, denotada con σ, está dada por:

σ = Var X = σ 2 Ejemplo 3.3.5.

Las desviaciones estándar de las variables X y Y del ejemplo 3.3.4 son, respectivamente:

σ X = Var X = 26.4 = 5.14 latidos por minuto σ Y = Var Y = 730.32 = 27.02 latidos por minuto

Estos puntos se ponen de relieve con un breve resumen de los aspectos importantes de la desviación estándar de una variable aleatoria X. Propiedades de la desviación estándar 1. La desviación estándar de X se define como la raíz cuadrada no negativa de su varianza. 2. La desviación estándar se denota con σ, y la varianza de X, con σ 2. 3. Que la desviación estándar sea grande implica que la variable aleatoria X es más bien inconstante y hasta cierto punto de difícil predicción, mientras que una desviación estándar pequeña indica constancia y estabilidad.

58

PROBABILIDAD Y ESTADÍSTICA

4. La desviación estándar siempre se expresa en unidades físicas de medición que corresponden a los datos originales. La varianza suele estar desprovista de unidades. De igual modo que existen tres reglas de la esperanza, útiles para simplificar expresiones complejas, las hay respecto de la varianza y guardan paralelismo con las de la esperanza. Las reglas 1 y 2 pueden comprobarse con las reglas de la esperanza (véase ejercicio 20). La comprobación de la regla 3 debe postergarse hasta que se haya formalizado el concepto de “variables aleatorias independientes”. Teorema 3.3.3 (reglas de la varianza). Sean X y Y variables aleatorias, y c, cualquier número real. Entonces: 1. Var c = 0 2. Var cX = c2 Var X 3. Si X y Y son independientes, entonces Var (X + Y ) = Var X + Var Y (Dos variables son independientes si el conocimiento del valor que asume una no aporta indicios del valor de la otra.)

Ejemplo 3.3.6.

Sean X y Y independientes, con σ 2X = 9 y σ Y2 = 3. Entonces: Var [4X – 2Y + 6] = = = =

Var [4X ] + Var [–2Y ] + Var 6 Regla 3 16 Var X + 4 Var Y + Var 6 Regla 2 16 Var X + 4 Var Y + 0 Regla 1 16(9) + 4(3) = 156

En esta sección, se analizaron tres parámetros teóricos relacionados con una variable aleatoria X. Se mostró no sólo la forma de determinar sus valores numéricos a partir del conocimiento de la densidad, sino también cómo interpretarlas físicamente. Debe tenerse eso en cuenta, ya que desempeñan una función importante en el estudio de métodos estadísticos para el análisis de datos experimentales.

3.4 DISTRIBUCIÓN GEOMÉTRICA Y LA FUNCIÓN GENERADORA DE MOMENTOS En esta sección, se consideran dos temas de importancia. Se presenta la primera familia de variables aleatorias discretas que se analiza en la obra. Las variables aleatorias son miembros de una familia en el sentido de que cada miembro de la familia se caracteriza por una función de densidad de la misma forma matemática, que difiere sólo en el valor numérico de uno o más parámetros pertinentes. Esta primera familia, llamada geométrica, es de uso muy amplio en las áreas de los juegos de azar y en el control estadístico de calidad. Se la califica de geométrica porque, como se verá, sus propiedades teóricas se derivan de la aplicación de las propiedades matemáticas de las series geométricas que se estudian en los fundamentos de cálculo. El segundo tema es el análisis de la función generadora de momentos. Esta función, deducida de la densidad, permite calcular fácilmente los momentos ordinarios de una distribución. A su vez, ello hace posible el cálculo de la media y la varianza de una variable

DISTRIBUCIONES DISCRETAS

59

aleatoria sin tener que recurrir a las definiciones de estos términos. En muchos casos, es un enfoque mucho más sencillo que el cálculo directo a partir de la definición. Además, la función constituye una huella digital o identificador único de cada distribución. Este concepto se analiza más adelante en esta sección.

Distribución geométrica Se empieza por considerar la familia de variables aleatorias geométricas. Como se verá, usted ya ha tenido contacto con algunas variables aleatorias de este tipo, pese a que no se mencionó en su momento el nombre “variable aleatoria geométrica”. Las variables aleatorias geométricas surgen en la práctica como parte de experimentos que se caracterizan por las propiedades siguientes: Propiedades geométricas 1. El experimento consiste en una serie de ensayos. El resultado de cada ensayo se puede clasificar como éxito (E ) o fracaso (F ). Un ensayo con esta propiedad se llama ensayo de Bernoulli. 2. Los ensayos son idénticos e independientes, en el sentido de que el resultado de uno no tiene efecto en el resultado de ninguno de los demás. La probabilidad de éxito, p, es la misma de un ensayo a otro. 3. La variable aleatoria X denota el número de ensayos necesarios para obtener el primer éxito. El espacio muestral de un experimento como el descrito con esas propiedades es: S = {E, FE, FFE, FFFE, …} Puesto que la variable aleatoria X denota el número de ensayos necesarios para obtener el primer éxito, X asume los valores 1, 2, 3, 4,… Se busca un patrón para calcular la densidad de X. Tome nota de que: P[X = 1] = P[éxito en el primer ensayo] = p P[X = 2] = P[fracaso en el primer ensayo y éxito en el segundo ensayo] Los ensayos son independientes, por lo que la segunda de esas probabilidades puede calcularse por multiplicación. En otras palabras: P[X = 2] = P[fracaso en el primer ensayo y éxito en el segundo] = P[fracaso en el primer ensayo]P[éxito en el segundo ensayo] = (1 – p)( p) De manera similar: P[X = 3] = P[fracaso en el primer y segundo ensayos, y éxito en el tercer ensayo] = (1 – p)(1 – p)( p) = (1 – p)2p

60

PROBABILIDAD Y ESTADÍSTICA

TABLA 3.7 x

1

2

3

4

f (x)

p

(1 – p)p

(1 – p) p 2

...

5

(1 – p) p 3

(1 – p) p 4

...

Debe ser posible al lector apreciar que la densidad de X está dada en la tabla 3.7, donde las probabilidades de la segunda fila tienen un patrón definido. Éste puede expresarse de manera cerrada como: f (x) = (1 – p) x – 1p

x = 1, 2, 3, . . .

Ahora, se define una variable aleatoria geométrica como toda variable aleatoria con densidad de este tipo. Definición 3.4.1 (distribución geométrica). Se afirma que una variable aleatoria X tiene distribución geométrica, con parámetro p, si su densidad f está dada por: f (x) = (1 – p) x – 1p

0 0.5, la integral tiene valor 1, puesto que con estos valores de x se integró la densidad en todo su conjunto de valores posibles. En resumen, F está dada por:

0 x < 0.1  2 F ( x) = 6.25x − 1.25x + 0.0625 0.1 ≤ x ≤ 0.5  x > 0.5 1 ¿Cuál es la probabilidad de que la concentración de plomo en un litro de gasolina seleccionado aleatoriamente sea de 0.2 a 0.3 g/L? En la respuesta a esta pregunta, se redacta de nuevo la fórmula con base en la distribución acumulativa:

P[0.2 ≤ X ≤ 0.3] = P[ X ≤ 0.3] − P[ X < 0.2] = P[ X ≤ 0.3] − P[ X ≤ 0.2] = F (0.3) − F (0.2)

(X es continua)

Por sustitución: F (0.3) = 6.25(0.3) 2 − 1.25(0.3) + 0.0625 = 0.2500 F (0.2) = 6.25(0.2) 2 − 1.25(0.2) + 0.0625 = 0.0625 Así pues: P[0.2 ≤ X ≤ 0.3] = F (0.3) − F (0.2) = 0.2500 − 0.0625 = 0.1875

Advierta que esto concuerda con el resultado obtenido en el ejemplo 4.1.1 mediante la integración directa. Aprecie también que F(0.3) lleva al área a la izquierda de 0.3 que se muestra en la figura 4.3a, y F(0.2), al área a la izquierda de 0.2 de la figura 4.3b. Cuando se forma la diferencia F(0.3) – F(0.2), se obtiene de manera natural el área entre 0.2 y 0.3, que aparece en la figura 4.3c.

Recuérdese que en el caso discreto la distribución acumulativa F de la densidad se obtuvo por adición; si se tiene F, podría haberse obtenido f por sustracción, la operación opuesta de la adición. Algo similar ocurre en el caso continuo. Se obtiene la distribución acumulativa a partir de la densidad por la integración de f ; si se cuenta con F, es posible determinar f al revertir la integración mediante la diferenciación. Dicho de otra manera, en el caso continuo:

PROBABILIDAD Y ESTADÍSTICA

5

5

4

4

3

3

f(x)

f(x)

104

2 1 0

0.2

F(0.2)

1

F(0.3) 0.1

2

0.3

0.4

x

0.5

0

0.1

0.2

0.3

a)

0.4

0.5

x

b) 5

f(x)

4 3 2 1 0

0.1

0.2

0.3

0.4

0.5

x

c)

FIGURA 4.3 a ) F ( 0.3) = P[ X ≤ 0.3]; b ) F ( 0.2 ) = P[ X ≤ 0.2 ]; c ) F ( 0.3) − F ( 0.2 ) = P[ 0.2 ≤ X ≤ 0.3].

Obtención de f a partir de F en el caso continuo f (x) = F'(x) Ejemplo 4.1.3.

En el ejemplo 4.1.2, se obtuvo la distribución acumulativa:

F ( x) = 6.25x 2 − 1.25x + 0.0625

0.1 ≤ x ≤ 0.5

Tome nota de que: F' ( x) = 12.5x − 1.25

0.1 ≤ x ≤ 0.5

Esta expresión es, como cabría esperar, la densidad de X señalada en el ejemplo 4.1.2.

Distribución uniforme Quizá la distribución continua más sencilla para trabajar es la distribución uniforme. Guarda paralelismo con la distribución uniforme discreta presentada en el ejercicio 34 del capítulo 3 en cuanto a que, en cierto sentido, los eventos ocurren con probabilidad igual o uniforme. Puesto que resulta fácil e instructivo desarrollar directamente las propiedades de esta familia de variables aleatorias a partir de la definición, se dejan las deducciones al lector. Sus propiedades de aplicaciones importantes son tema de los ejercicios 5, 6, 10, 11, 18 y 19.

DISTRIBUCIONES CONTINUAS

4.2

105

ESPERANZA Y PARÁMETROS DE UNA DISTRIBUCIÓN

En esta sección, se define el término valor esperado de variables aleatorias continuas. Asimismo, se estudia cómo usar la definición para calcular la función generadora de momentos, media y varianza de una variable de tipo continuo. Como verá el lector, la definición tiene paralelismo con la del caso discreto, salvo que la suma se sustituye con la integración. Definición 4.2.1 (valor esperado). Sea X una variable aleatoria continua con densidad f. Sea H(X ) una variable aleatoria. El valor esperado de H(X ), denotado con E[H(X )], está dado por: E[ H ( X )] =

a condición de que:





−∞

sea finita.





−∞

H ( x ) f ( x ) dx

H ( x ) f ( x ) dx

Al igual que en la distribución discreta, la media o valor esperado de X es un caso especial de la definición precedente. Valor esperado de X

E[ X ] =



∞ −∞

xf ( x ) dx

El uso de esta definición se ilustra mediante el cálculo de la media y varianza de la variable aleatoria X correspondiente al ejemplo 4.1.1. Recuérdese que, según el teorema 3.3.2, la varianza de X puede hallarse mediante el cálculo:

σ 2 = Var ( X ) = E[ X 2 ] − ( E[ X ])2 Ejemplo 4.2.1. dada por:

La densidad de X, la concentración de plomo en la gasolina, en gramos por litro, está f ( x) = 12.5x − 1.25

0.1 ≤ x ≤ 0.5

La media o valor esperado de X es:

µ = E[ X ] =

∫ =

∞ −∞



xf (x) dx 0.5

0.1

x (12.5x − 1.25) dx

 12.5x 3 1.25x 2 0.5 = −  2 0.1  3  (12.5)(0.5) 3 1.25(0.5) 2   12.5(0.1) 3 1.25(0.1) 2  = − − −  3 2 3 2     0.3667 g/L

106

PROBABILIDAD Y ESTADÍSTICA

Como la integración abarca un intervalo de longitud finita,





−∞

x f ( x) dx

existe. Es posible llegar a la conclusión de que, en promedio, un litro de gasolina contiene aproximadamente 0.3667 g de plomo. ¿Cuál es la variabilidad de un litro a otro? A fin de responder a esta pregunta, se calcula E[X 2] y se aplica el teorema 3.3.2 para determinar la varianza de X:

E[ X 2 ] =

∫ =∫



−∞ 0.5

0.1

x 2 f ( x) dx x 2 (12.5x − 1.25) dx 0.5

12.5x 4 1.25x 3  = −  3  0.1  4

0.1433

De conformidad con el teorema 3.3.2:

Var X = E[ X 2 ] − ( E[ X ]) 2

0.1433 − (0.3667) 2

0.00883

La desviación estándar de X es:

σ = Var X = 0.00883 = 0.09396 g/L

Al igual que el caso discreto, la función generadora de momentos de una variable aleatoria continua X está definida como E[etX ], a condición de que tal esperanza exista para t en un intervalo abierto en torno a 0. Su uso se ilustra en el ejemplo siguiente. Ejemplo 4.2.2. La alternación espontánea de un bit almacenado en la memoria de una computadora se denomina “falla suave”. Sea X el momento, en millones de horas, antes de que se observe la primera falla de este tipo. Suponga que la densidad de X está dada por: f ( x) = e − x

x>0

La media y varianza de X pueden calcularse directamente con el método del ejemplo 4.2.1. Sin embargo, se requiere la integración por partes para determinar E[X ] y E[X 2]. Aunque este método de integración es sencillo, también es tardado. Calcule la función generadora de momentos de X y úsela para determinar la media y varianza. Por definición: mX (t ) = E[etX ] =





etx f ( x) dx

−∞

En este caso: mX (t ) =

∫ =∫



0 ∞ 0

=

etx e− x dx e( t − 1) x dx

1 ( t − 1) x ∞ e 0 t −1

DISTRIBUCIONES CONTINUAS

107

Supóngase que |t| < 1. Ello garantiza que el exponente (t – 1) x < 0, lo que permite evaluar la integral señalada. En particular:

mX (t ) =

1 1− t

t 0, |etx| = etx. Así pues, con el argumento precedente se ha demostrado que:





−∞

etx f ( x) dx

existe, como lo requiere la definición 4.2.1. Se aplica el teorema 3.4.2 para usar mX (t) en el cálculo de E[X ] y E[X 2]. Advierta que: dmX (t ) d (1 − t ) −1 = = (1 − t ) −2 dt dt d 2 mX (t ) = 2(1 − t ) −3 dt 2 dmX (t ) E[ X ] = =1 dt t = 0 E[ X 2 ] =

d 2 mX (t ) =2 dt 2 t = 0

Var X = E[ X 2 ] − ( E[ X ]) 2 = 2 − 12 = 1 El promedio o tiempo medio que debe esperarse para observar la primera falla es de un millón de horas. La varianza en dicho tiempo es de 1, y la desviación estándar, de un millón de horas.

El cálculo de los parámetros µ, σ 2 y σ de la distribución puede hacerse con la definición 4.2.1 o la técnica de la función generadora de momentos. En la práctica, se usa el método que resulte más sencillo. Debe resaltarse que existe una agradable interpretación geométrica de la media en el caso de una variable aleatoria continua. Imagínese cortar una pieza de metal rígido y delgado en la región delimitada por la gráfica de f y el eje x, para luego tratar de equilibrar esta región sobre el filo de un cuchillo paralelo al eje vertical. El punto en que se equilibra la región, si acaso existe, es la media de X. De tal suerte, µX es un parámetro de “localización” en el sentido de que indica la posición del centro de la densidad en el eje x. La varianza también es susceptible de interpretación gráfica. En el caso continuo, es un parámetro de “forma”, en cuanto a que una variable aleatoria con varianza pequeña tiene densidad compacta, y otra con varianza grande, densidad dispersa o plana.

4.3 DISTRIBUCIONES GAMMA, EXPONENCIAL Y JI CUADRADA En esta sección, se considera en primer término la distribución gamma. Reviste importancia especial porque permite definir dos familias de variables aleatorias, exponenciales y ji cuadrada, de uso amplio en estadística aplicada. El fundamento teórico de la distribución gamma es la función gamma, una función matemática definida en términos de una integral.

108

PROBABILIDAD Y ESTADÍSTICA

Definición 4.3.1 (función gamma).

La función Γ, definida por:

Γ(α ) =



∞ 0

z α − 1e − z dz

α>0

se llama función gamma.

El teorema 4.3.1 incluye dos propiedades numéricas de la función gamma útiles para evaluar la función respecto de diversos valores de α. Su comprobación se delinea en el ejercicio 26.

Teorema 4.3.1 (propiedades de la función gamma). 1. 2.

Γ(1) = 1 Para α > 1, Γ(α) = (α – 1)Γ(α – 1).

El uso del teorema 4.3.1 se ilustra en el ejemplo siguiente. Ejemplo 4.3.1. a)



Evalúe ∫ 0 z 3e− z dz. Evaluar esta integral con los métodos de fundamentos de cálculo precisa de aplicaciones repetidas de integración por partes. A fin de evaluar rápidamente la integral, ésta se reescribe como sigue:





0

z 3e− z dz =





0

z 4 − 1e−z dz

La integral de la derecha es Γ(4). La aplicación repetida del teorema 4.3.1 permite apreciar que:





0

z 3e− z dz = Γ (4) = 3 ⋅ Γ (3) = 3 ⋅ 2 ⋅ Γ (2) = 3 ⋅ 2 ⋅ 1⋅ Γ (1) = 3⋅ 2 ⋅1 = 6

b)



Evalúe ∫ 0 (1/54) x 2e− x / 3dx. A efecto de evaluar esta integral, se realiza un cambio de variable, técnica de amplio uso en la obtención de propiedades de la distribución gamma. En particular, sea z = x/3 o 3z = x. Entonces, 3 dz = dx y el problema cambia a:





0

(1/ 54) x 2e− x / 3dx =



∫ 1/ 54(3z) e = 27 / 54∫ z e

2 −z

0



0

2 −z

3 dz

dz

DISTRIBUCIONES CONTINUAS

109

Sin embargo: ∞

∫0

z 2e− z dz =



∫0

z 3 − 1e− z dz = Γ(3) = 2 ⋅ Γ( 2) = 2 ⋅ 1⋅ Γ(1) = 2 ⋅1 = 2

Así pues:





0

(1/54) x 2e− x/ 3dx = 27 /54 ⋅ 2 = 1

Nótese que se ha demostrado que la integral de función no negativa: f ( x) = (1/54) x 2e − x/ 3

es 1, por lo que puede conceptuarse como la densidad de la variable aleatoria continua X.

Ahora, es posible definir la distribución gamma.

Distribución gamma Definición 4.3.2 (distribución gamma). f ( x) =

Se dice que una variable aleatoria X con densidad:

1 xα − 1e − x /β Γ (α )βα

x>0 α >0 β>0

tiene distribución gamma con parámetros α y β. La media y la varianza de una variable aleatoria gamma pueden calcularse fácilmente a partir de las definiciones de estos parámetros (ejercicio 31); pero se usará la técnica de la función generadora de momentos. Como se analiza más adelante, es muy útil conocer la forma de dicha función respecto de una variable aleatoria. Teorema 4.3.2. Sea X una variable aleatoria gamma con parámetros α y β. Entonces: 1. La función generadora de momentos de X está dada por:

mX (t ) = (1 − β t ) −α 2. E[X ] = αβ 3. Var X = αβ 2

t < 1/β

110

PROBABILIDAD Y ESTADÍSTICA

FIGURA 4.4

a ) α = 1, β = 1, µ X = 1, σ X2 = 1; b ) α = 2 , β = 1, µ X = 2 , σ X2 = 2; c ) α = 2 , β = 2 , µ X = 4 , σ X2 = 8.

La comprobación de este teorema se incluye en el apéndice C. La figura 4.4 muestra las gráficas de algunas densidades gamma concernientes a unos cuantos valores de α y β. Nótese que α y β participan en la determinación de la media y la varianza de la variable aleatoria. Asimismo, adviértase que las curvas son asimétricas y se localizan totalmente a la derecha del eje vertical. Puede demostrarse que con α > 1, el valor máximo de la densidad ocurre en el punto x = (α – 1)β. (Véase ejercicio 32.)

Distribución exponencial Como se mencionó, la distribución gamma es origen de una familia de variables aleatorias llamadas variables exponenciales. Esta familia se conforma de cada variable aleatoria gamma con α = 1. Así pues, la densidad de una variable aleatoria exponencial asume la forma: Densidad exponencial f (x) =

1 − x /β e β

x>0

β>0

DISTRIBUCIONES CONTINUAS

111

La gráfica de una densidad exponencial característica se muestra en la figura 4.4a. En la práctica, es frecuente que esta distribución surja en el estudio de los procesos de Poisson, que son tema de la sección 3.8. Recuérdese que en un proceso de Poisson se observan eventos discretos en un intervalo de tiempo continuo. Si W denota el tiempo en que ocurre el primer evento, entonces W es una variable aleatoria continua. El teorema 4.3.3 muestra que W tiene distribución exponencial. Teorema 4.3.3. Considere un proceso de Poisson con parámetro λ. Sea W el tiempo en el que ocurre el primer evento. W tiene distribución exponencial, con β = 1/λ.

Demostración. La función de distribución F de W está dada por: F (w) = P[W ≤ w] = 1 − P[W > w]

El primer evento ocurrirá después del tiempo w sólo si no se registra el evento en el intervalo de tiempo [0, w]. Sea X el número de eventos que ocurren en dicho intervalo. La variable X es una aleatoria de Poisson, con parámetro λw. Así pues:

P[W > w] = P[ X = 0] =

e−λw (λw) 0 = e−λw 0!

Por sustitución, se obtiene:

F (w) = 1 − P[W > w] = 1 − e−λw Puesto que en el caso continuo la derivada de la función de distribución acumulativa es la densidad: F ' (w) = f (w) = λe−λw ésta es la densidad de una variable aleatoria exponencial con β = 1/λ.

El ejemplo siguiente ilustra el uso de este teorema. Ejemplo 4.3.2. Algunas cepas de paramecios producen y secretan partículas “asesinas”, que causan al contacto la muerte de un individuo sensible. Todos los paramecios incapaces de producir dichas partículas son sensibles. El número medio de partículas asesinas emitido por un paramecio asesino es de una cada cinco horas. En la observación de estos paramecios, ¿cuál es la probabilidad de que deban esperarse cuando mucho cuatro horas antes de que se emita la primera partícula? Si se considera que la unidad de medición es una hora, se trata de un proceso de Poisson, con λ = 1/5. De conformidad con el teorema 4.3.3, W, que es el tiempo en que se emite la primera partícula asesina, tiene distribución exponencial, con β = 1/λ = 5. La densidad de W es:

f (w) = (1/5)e− w /5

w>0

La probabilidad que interesa está dada por:

P[W ≤ 4] =

4

∫0 (1/5)e− w/5 dw −w / 5 4

= −e 0 = 1 − e−4 / 5

0.5507

112

PROBABILIDAD Y ESTADÍSTICA

Una variable aleatoria exponencial también es una variable aleatoria gamma, de modo que el tiempo promedio que debe esperarse para que se emita la primera partícula asesina es: E[W ] = αβ = 1 · 5 = 5 h

Distribución ji cuadrada La distribución gamma también es origen de otra familia importante de variables aleatorias, a saber, la familia ji cuadrada. Esta distribución se usa ampliamente en estadística aplicada. Entre otros usos, sirve de base para elaborar inferencias sobre la varianza de una población basada en una muestra. En este punto, se consideran sólo las propiedades teóricas de la distribución ji cuadrada. Los capítulos ulteriores contienen numerosos ejemplos de su uso. Definición 4.3.3 (distribución ji cuadrada). Sea X una variable aleatoria gamma con β = 2 y α = γ / 2, donde γ es un entero positivo. Se afirma que X tiene distribución ji cuadrada con γ grados de libertad. Esta variable se denota con X γ2 . Advierta que una variable aleatoria ji cuadrada se especifica por completo al indicar sus grados de libertad. La aplicación del teorema 4.3.2 permite apreciar que la media de una variable aleatoria ji cuadrada es γ, sus grados de libertad, y su varianza, 2γ, el doble de sus grados de libertad. La figura 4.4c muestra la gráfica de la densidad de una variable aleatoria ji cuadrada con cuatro grados de libertad. La distribución ji cuadrada es frecuente en la práctica, de modo que se han hecho tablas extensas de su función de distribución acumulativa. Una de ellas es la tabla IV del apéndice A. En dicha tabla, los grados de libertad aparecen como encabezados de filas; las probabilidades, como encabezados de columna, y los puntos relacionados con esas probabilidades, en las celdas de la tabla. Se usa χ r2 para denotar el punto relacionado con una variable aleatoria ji cuadrada tal que: P[ X 2γ ≥ χ r2 ] = r

En otras palabras, χ r2 es un punto tal que el área a su derecha es r. Desde el punto de vista técnico, debe escribirse χ r2, γ ya que el valor del punto depende de la probabilidad buscada y del número de grados de libertad relacionado con una variable aleatoria. Sin embargo, en las aplicaciones el valor de γ es evidente. Así pues, se utiliza sólo un subíndice para simplificar la notación. El uso de esta última se ilustra en el ejemplo siguiente. Ejemplo 4.3.3. Considere una variable aleatoria ji cuadrada con 10 grados de libertad. Calcule el valor de χ 02.05. Este punto se muestra en la figura 4.5. Por definición, el área a la derecha de este punto es 0.05, y el área a su izquierda, 0.95. La columna de probabilidades de la tabla IV indica el área a la izquierda del punto mencionado. Así pues, para determinar χ 02.05, se busca en la fila 10 y la columna 0.95, donde se aprecia que χ 02.05 = 18.3.

DISTRIBUCIONES CONTINUAS

113

f(x2 )

0.10

0.05

0.05

0.00 0

5

10

15

20

25

x2

2

18.3 = !0.05

FIGURA 4.5 P[ X 102 ≥ χ 02.05 ] = 0.05 y P[ X 102 < χ 02.05 ] = 0.95.

4.4 DISTRIBUCIÓN NORMAL La distribución normal es una distribución subyacente a numerosos métodos estadísticos usados en el análisis de datos. En 1733, la describió por primera vez De Moivre como la forma limitante de la densidad binomial cuando el número de ensayos se vuelve infinito. Este descubrimiento no recibió mucha atención hasta que, medio siglo después, Laplace y Gauss la “redescubrieron”. Ambos estudiaban problemas de astronomía y cada uno de ellos dedujo la distribución normal como una que al parecer describía el comportamiento de errores en las mediciones astronómicas. Es frecuente que se denomine “gaussiana” a esta distribución. Definición 4.4.1 (distribución normal). Se dice que una variable aleatoria X con densidad: 1

f (x) =

2πσ

e − (1 / 2)[( x − µ ) / σ ]

2

−∞ < x < ∞ −∞< µ 0

tiene distribución normal con parámetros µ y σ. Una consecuencia de esta definición es que:

1 2 e −(1 / 2)[( x − µ ) /σ ] dx = 1 −∞ 2πσ Verificarlo requiere una transformación a coordenadas polares. Se trata de una técnica que está más allá del nivel de matemáticas supuesto en la obra. Su comprobación detallada aparece en [49]. Observe que la definición 4.4.1 afirma solamente que µ es un número real y que σ es positiva. Como podría suponer el lector a partir de la notación usada, los parámetros que aparecen en la ecuación de la





114

PROBABILIDAD Y ESTADÍSTICA

densidad de una variable aleatoria normal son, de hecho, su media y su desviación estándar. Ello puede verificarse una vez que se conoce la función generadora de momentos de X. El teorema siguiente aporta la forma de esta función importante. Teorema 4.4.1. Sea X una variable de distribución normal con parámetros µ y σ. La función generadora de momentos de X está dada por: mX (t ) = eµ t + σ

2 t 2/ 2

La comprobación de este teorema se incluye en el apéndice C. Ahora bien, es fácil demostrar que los parámetros incluidos en la definición de la densidad normal son en verdad la media y desviación estándar de la variable. Teorema 4.4.2. Sea X una variable aleatoria normal con parámetros µ y σ. Entonces, µ es la media de X y σ es su desviación estándar. Demostración.

La función generadora de momentos de X es: mX (t ) = eµ t + σ

2t 2/2

y dmX (t ) 2 2 = eµ t + σ t /2 (µ + σ 2t ) dt De conformidad con el teorema 3.4.2, la media de X está dada por:

E[ X ] =

2 2 dmX (t ) = eµ ⋅ 0 + σ 0 / 2 (µ + σ 2 ⋅ 0) = µ dt t = 0

como se señaló. La demostración del resto del teorema se deja como ejercicio.

La gráfica de la densidad de una variable aleatoria normal tiene forma de campana, es simétrica y está centrada en su media. Los puntos de inflexión ocurren en µ ± σ. Ejemplo 4.4.1. Los hidrocarburos que se emiten por el sistema de escape de los automóviles son uno de los contribuyentes principales de la contaminación atmosférica. Sea X el número de gramos de hidrocarburos que emite un automóvil por milla recorrida. Suponga que X tiene distribución normal, con media de 1 g y desviación estándar de 0.25 g. La densidad de X está dada por: f ( x) =

1 2 e− (1/ 2 )( x − 1) /0.25] 2π (0.25)

La gráfica de esta densidad es una curva simétrica en forma de campana, centrada en µ = 1, con puntos de inflexión en µ ± σ = 1 ± 0.25. Un boceto de la densidad se ilustra en la figura 4.6. En este punto, procede un señalamiento. En teoría, una variable aleatoria normal debe tener la posibilidad de asumir cualquier valor. Está claro que en este caso ello sería poco realista. Es imposible

DISTRIBUCIONES CONTINUAS

115

1.5

Punto de inflexión

Punto de inflexión

f(x)

1.0

0.5

0.0 0

0.75

1

1.25

2

x

FIGURA 4.6 Gráfica de la densidad de una variable aleatoria normal con media 1 y desviación estándar 0.25.

que un automóvil emita una cantidad negativa de hidrocarburos. Cuando se afirma que X tiene distribución normal, la afirmación se refiere a que la curva normal dada genera probabilidades aceptables en el intervalo de valores físicamente razonables de X. En ese entendido, al menos es posible aproximar, por ejemplo, la probabilidad de que un automóvil seleccionado aleatoriamente emita entre 0.9 y 1.54 g de hidrocarburos, mediante el cálculo del área bajo la gráfica de f entre esos dos puntos.

Distribución normal estándar Existe un número infinito de variables aleatorias normales, cada una caracterizada de manera singular por los dos parámetros µ y σ. El cálculo de las probabilidades relacionadas con una curva normal específica requiere integrar la densidad normal en un intervalo particular. Sin embargo, la densidad normal no es integrable en forma cerrada. La determinación de las áreas bajo la curva normal requiere el uso de técnicas de integración numéricas. Se usa una transformación algebraica sencilla para superar este problema. Gracias a la transformación, llamada procedimiento de estandarización, toda pregunta acerca de cualquier variable aleatoria normal puede transformarse en una pregunta equivalente, que concierne a una variable aleatoria normal con media 0 y desviación estándar 1. Esta variable aleatoria normal en particular se denota con Z y se llama variable normal estándar. Teorema 4.4.3 (teorema de estandarización). Sea X una variable normal con media µ y desviación estándar σ. La variable (X – µ)/σ es la variable normal estándar.

Usted verificó ya que la transformación genera una variable aleatoria con media 0 y desviación estándar 1 (ejercicio 21 del capítulo 3). Demostrar que la variable transformada es normal requiere el uso de técnicas de la función generadora de momentos que se analizan en el capítulo 7.

116

PROBABILIDAD Y ESTADÍSTICA

1.5

f(x)

1.0

0.5

0.0 0

0.9 1

1.54

2

x

FIGURA 4.7 Área sombreada = P[0.9 ≤ X ≤ 1.54].

La función de distribución acumulativa de la variable aleatoria normal estándar aparece en la tabla V del apéndice A. El uso del teorema de estandarización y de esa tabla se ilustra en el ejemplo siguiente. Ejemplo 4.4.2. Sea X el número de gramos de hidrocarburos que emite un automóvil por milla recorrida. En el supuesto de que X es normal, con µ = 1 g y σ = 0.25 g, calcule la probabilidad de que un automóvil seleccionado aleatoriamente emita entre 0.9 y 1.54 g de hidrocarburos por milla recorrida. La probabilidad buscada se muestra en la figura 4.7. A fin de calcular P[0.9 ≤ X ≤ 1.54], primero se estandariza, al sustraer la media de 1 y dividir entre la desviación estándar de 0.25 a través de la desigualdad. En otras palabras: P[0.9 ≤ X ≤ 1.54] = P[(0.9 − 1)/ 0.25 ≤ ( X − 1)/ 0.25 ≤ (1.54 − 1)/ 0.25]

La variable aleatoria (X – 1)/0.25 es ahora Z. De tal suerte, el problema es calcular P[–0.4 ≤ Z ≤ 2.16] a partir de la tabla V. En primer término, se expresa la probabilidad buscada conforme a la distribución acumulativa, de la manera siguiente: P[−0.4 ≤ Z ≤ 2.16] = P[Z ≤ 2.16] − P[Z < −0.4]

= P[Z ≤ 2.16] − P[Z ≤ −0.4] = F (2.16) − F (−0.4)

(Z es continua)

Se determina F(2.16) al localizar los primeros dos dígitos (2.1) en la columna z; el tercer dígito es 6, de modo que la probabilidad buscada de 0.9846 se localiza en la intersección de la fila 2.1 y la columna 0.06. De manera similar, F(–0.4) o 0.3446 se identifica en la fila –0.4 y la columna 0.00. Ahora, puede verse que la probabilidad de que un automóvil seleccionado aleatoriamente emita entre 0.9 y 1.54 g de hidrocarburos por milla recorrida es de:

P[0.9 ≤ X ≤ 1.54] = P[−0.4 ≤ Z ≤ 2.16] = F (2.16) − F (−0.4) = 0.9846 − 0.3446 = 0.64

Interpretar esta probabilidad como porcentaje permite afirmar que 64% de los automóviles en circulación emiten 0.9 a 1.54 g de hidrocarburos por milla recorrida.

DISTRIBUCIONES CONTINUAS

117

0.003

f(x)

0.002

0.001

0.05

0.000 0

x

100 200 300 400 500 600 700 800 900 1 000 x0 = ?

FIGURA 4.8

P[ X ≥ x0 ] = 0.05.

En ocasiones, es necesario leer en “sentido inverso” la tabla V. En otras palabras, dada una probabilidad r particular, se requiere localizar el punto con r del área a su derecha. Este punto se denota con zr. Así pues, la notación zr denota el punto relacionado con una variable aleatoria normal estándar tal que: P[ Z ≥ zr ] = r Considere el ejemplo 4.4.3 para ver cómo surge esta necesidad. Ejemplo 4.4.3. Sea X la cantidad de radiación que puede absorber un individuo antes de que sobrevenga su muerte. Suponga que X es normal, con media de 500 roentgens y desviación estándar de 150 roentgens. ¿Por arriba de cuál dosis apenas sobrevive 5% de los individuos expuestos? En este caso, se pide encontrar el punto x0, que se muestra en la figura 4.8. En cuanto a las probabilidades, interesa calcular el punto x0 tal que: P[ X ≥ x0 ] = 0.05

La estandarización arroja:  X − 500 x0 − 500  P[ X ≥ x0 ] = P  ≥  150   150  x − 500  = P Z ≥ 0  = 0.05 150   Así pues, (x0 – 500)/150 es el punto de la curva normal estándar con 5% del área bajo la curva a su derecha y 95% a la izquierda. En otras palabras, (x0 – 500)/150 es el punto z0.05. De conformidad con la tabla V, el valor numérico de este punto es aproximadamente 1.645 (se realizó la interpolación). Al expresarlos en una ecuación, se tiene: x0 − 500 = 1.645 150

118

PROBABILIDAD Y ESTADÍSTICA

Despejar x0 en la ecuación indica la dosis buscada: x0 = 150(1.645) + 500 = 746.75 roentgens

4.5 REGLA DE PROBABILIDAD NORMAL Y DESIGUALDAD DE CHEBYSHEV En ocasiones, reviste utilidad contar con un método rápido para determinar cuáles valores de una variable aleatoria son comunes y cuáles se consideran infrecuentes. En el caso de una variable aleatoria de distribución normal, es posible desarrollar fácilmente una regla general, llamada regla de probabilidad normal. Ésta se expresa en el teorema 4.5.1. Teorema 4.5.1 (regla de probabilidad normal). Sea X una variable de distribución normal con parámetros µ y σ. Entonces:

P[−σ < X − µ < σ ] P[−2σ < X − µ < 2σ ] P[−3σ < X − µ < 3σ ]

Demostración.

0.68 0.95 0.997

Nótese que la división entre σ arroja lo siguiente:

  X −µ P[−σ < X − µ < σ ] = P −1 < < 1 σ   Con base en el teorema 4.4.3, (X – µ)/σ tiene distribución normal estándar. De conformidad con la tabla V del apéndice A:

P[−1 < Z < 1] = 0.8413 − 0.1587 = 0.6826 Esta probabilidad puede redondearse a 0.68. Los demás resultados indicados en el teorema se comprueban de manera similar.

La regla de probabilidad normal puede expresarse en porcentajes. De manera particular, implica que casi 68% de los valores observados de X en el muestreo repetido de una distribución normal debe ubicarse a no más de una desviación estándar de su media; 95%, a no más de dos desviaciones estándar, y 99.7%, a no más de tres desviaciones estándar de la media. Así pues, un valor observado que esté a más de tres desviaciones estándar de la media de µ es infrecuente, ya que ocurre con probabilidad de 0.003. Esta regla se usa más adelante para obtener un cálculo rápido de la desviación estándar de una variable aleatoria de distribución normal. La figura 4.9 ilustra la regla de probabilidad normal en su aplicación a la distribución normal estándar. Recuérdese que σ = 1, 2σ = 2 y 3σ = 3 con esta distribución.

Desigualdad de Chebyshev Una segunda regla general útil para juzgar cuán infrecuentes son los valores observados de una variable aleatoria es la desigualdad de Chebyshev. La obtuvo el probabilista ruso P. L. Chebyshev (o

DISTRIBUCIONES CONTINUAS

119

0.4

f(z)

0.3

0.2

0.68

0.1

0.0

z –4

a)

–3

–2

–1

0

1

2

3

4

1

2

3

4

1

2

3

4

0.4

f(z)

0.3

0.2

0.95

0.1

0.0

z –4

b)

–3

–2

–1

0

0.4

f(z)

0.3

0.2

0.997

0.1

0.0

c)

z –4

–3

–2

–1

0

FIGURA 4.9 a) La probabilidad de que una variable aleatoria de distribución normal se ubique a no más de una desviación estándar de su media es de aproximadamente 0.68 o 68%. b) La probabilidad de que una variable aleatoria de distribución normal se ubique a no más de dos desviaciones estándar de su media es de aproximadamente 0.95 o 95%. c) La probabilidad de que una variable aleatoria de distribución normal se ubique a no más de tres desviaciones estándar de su media es de aproximadamente 0.997 o 99.7%.

120

PROBABILIDAD Y ESTADÍSTICA

Tchebysheff, 1821-1894). La desigualdad difiere de la regla de probabilidad normal en que no requiere que la variable aleatoria correspondiente tenga distribución normal. Aunque se comprobará el teorema en el contexto continuo, es innecesaria la continuidad. La desigualdad es válida con cualquier variable aleatoria. Teorema 4.5.2 (desigualdad de Chebyshev). Sea X una variable aleatoria con media µ y desviación estándar σ. Entonces, con cualquier número positivo k:

P[| X − µ | < kσ ] ≥ 1 −

1 k2

Vea la demostración de este teorema en el apéndice C. Algunos ejemplos aclararán la diferencia entre los teoremas 4.5.1 y 4.5.2. Ejemplo 4.5.1. La viscosidad de un fluido puede medirse de manera aproximada si se deja caer una pequeña pelota en un tubo calibrado que contiene el fluido y se observa X, el tiempo que se requiere para que la pelota recorra una distancia medida. Supóngase que esta variable aleatoria tiene distribución normal, con media de 20 s y desviación estándar de 0.5 s. Según la regla de probabilidad normal, casi 95% de los valores observados de X se situará a no más de 1 s (dos desviaciones estándar) de la media. En otras palabras, la probabilidad de que X se ubique entre 19 y 21 s es de 0.95. La desigualdad de Chebyshev se aplica a toda variable aleatoria, por lo que resulta apropiada en este caso. Esa desigualdad garantiza que X sea de 19 a 21 s (a no más de k = 2 desviaciones estándar de su media) con probabilidad de por lo menos 1 – 1/k2 = 0.75. Nótese que la regla de probabilidad normal permite obtener resultados más aproximados que la desigualdad de Chebyshev cuando la variable aleatoria en cuestión tiene distribución normal. Ejemplo 4.5.2. La seguridad de una planta industrial se mide con base en M, el número total de horashombre trabajadas sin un accidente grave. La experiencia indica que M tiene una media de dos millones, con desviación estándar de 0.1 millón. Ocurrió un accidente grave. ¿Sería inusual que el siguiente accidente grave tenga lugar en los 1.6 millones de horas-hombre siguientes? Responder a esta pregunta precisa evaluar P[M ≤ 1.6]. No se tiene razón alguna para suponer que la distribución de M sea normal, de modo que aquí resulta inapropiada la regla de probabilidad normal. Sin embargo, se sabe a partir de la desigualdad de Chebyshev, con k = 4, que: P[1.6 < M < 2.4] ≥ 1 − (1/16) = 0.9375

Lo cual implica que: P[ M ≤ 1.6] + P[ M ≥ 2.4] ≤ 0.0625

Es posible que M exceda de 2.4, por lo que puede afirmarse con certeza que: P[ M ≤ 1.6] < 0.0625

Es imposible hacer una afirmación más aproximada sin conocimiento de la forma de la densidad de M. No obstante, si se sabe que la densidad es simétrica, puede irse un paso más allá y afirmar que: P[ M ≤ 1.6] ≤ 0.0625/ 2 = 0.03125

DISTRIBUCIONES CONTINUAS

121

4.6 APROXIMACIÓN NORMAL DE LA DISTRIBUCIÓN BINOMIAL Las tablas binomiales incluidas en esta obra o en cualquier otra están limitadas necesariamente en su alcance porque n puede variar de 1 al infinito y porque p puede asumir cualquier valor entre 0 y 1. Es imposible poner en tablas toda combinación de n y p. Los avances de la tecnología de las computadoras y calculadoras ahora posibilitan encontrar las probabilidades binomiales exactas de cualquiera de esas combinaciones. En el pasado, la curva normal se usaba para obtener aproximaciones satisfactorias de las probabilidades binomiales. La técnica que se analiza en esta sección todavía reviste utilidad cuando no se cuenta fácilmente con la tecnología necesaria. A fin de ver cómo surgieron esas aproximaciones, se consideran cuatro variables aleatorias binomiales, cada una con probabilidad de éxito de 0.4, que difieren en sus valores de n. Las densidades de estas variables, obtenidas de la tabla I del apéndice A, se acompañan de un boceto de cada una en la figura 4.10a-d. El punto que debe notarse en estos diagramas corresponde a la figura 4.10d, a saber, es fácil imaginar una curva en forma de campana uniforme, que se ajuste estrechamente al diagrama de barras ilustrado. Ello hace pensar que las probabilidades binomiales que se representan con una o más barras en el diagrama se pueden aproximar de manera razonablemente satisfactoria mediante un área seleccionada con minuciosidad bajo una curva normal elegida en forma apropiada. ¿Cuál del número infinito de curvas normales es apropiado? El sentido común indica que la variable normal seleccionada debe tener la misma media y varianza que la variable binomial de la cual es aproximación. El teorema 4.6.1 resume esta idea.

Teorema 4.6.1 (aproximación normal de la distribución binomial). Sea X una variable binomial, con parámetros n y p. Si n tiene valor alto, X es aproximadamente normal, con media np y varianza np(1 – p).

La demostración de este teorema se basa en el teorema del límite central, que se estudia en el capítulo 7. Debe aceptarse que el teorema 4.6.1 es hasta cierto punto vago, en el sentido de que no se define adecuadamente “alto”. En el sentido matemático más estricto, “alto” significa “cuando n se acerca al infinito”. La aproximación es aceptable para muchos fines prácticos con valores de n y p tales que p ≤ 0.5 y np > 5 o p > 0.5 y n(1 – p) > 5. Ejemplo 4.6.1. Se emprende un estudio para investigar la relación del tabaquismo en mujeres embarazadas con los defectos de nacimiento en los hijos. De las madres estudiadas, 40% fuma y 60% no lo hace. Cuando nacen sus hijos, existe algún tipo de defecto congénito en 20. Sea X el número de hijos cuya madre fumó durante el embarazo. Si no existe relación del tabaquismo materno con los defectos de nacimiento, entonces X es binomial, con n = 20 y p = 0.4. ¿Cuál es la probabilidad de que 12 o más de los niños afectados sean hijos de madres fumadoras? La respuesta a esta pregunta hace necesario calcular P[X ≥ 12] bajo el supuesto de que X es binomial, con n = 20 y p = 0.4. Esta probabilidad, 0.0565, aparece en la tabla I del apéndice A. Nótese que p = 0.4 ≤ 0.5 y np = 20(0.4) = 8 > 5, por lo que la aproximación normal debe generar un resultado muy cercano a 0.0565. Se aproximarán las probabilidades relacionadas con X mediante una variable aleatoria normal Y, con np = 20(0.4) = 8 y desviación estándar np(1 − p) = 20(0.4)(0.6) = 4.8 .

122

PROBABILIDAD Y ESTADÍSTICA

a)

n=5 p = 0.4

f(x) 0.3 x

f(x)

0 1 2 3 4 5

0.0778 0.2592 0.3456 0.2304 0.0768 0.0102

0.2 0.1

0 1 2 3 4 5

n = 20 p = 0.4

n = 15 p = 0.4

n = 10 p = 0.4

x 0 1 2 3 4 5 6 7 8 9 10

x

f(x) 0.0060 0.0404 0.1209 0.2150 0.2508 0.2007 0.1114 0.0425 0.0106 0.0016 0.0001

f(x) 0.2

f(x) 0.2

x

f(x)

x

f(x)

0 1 2 3 4 5 6 7

0.0005 0.0047 0.0219 0.0634 0.1268 0.1859 0.2066 0.1771

8 9 10 11 12 13 14 15

0.1181 0.0612 0.0245 0.0074 0.0016 0.0003 ~0 ~0

x

f(x)

x

f(x)

0 1 2 3 4 5 6 7 8 9 10

~0 0.0005 0.0031 0.0124 0.0350 0.0746 0.1244 0.1659 0.1797 0.1597 0.1172

11 12 13 14 15 16 17 18 19 20

0.0710 0.0355 0.0145 0.0049 0.0013 0.0003 ~0 ~0 ~0 ~0

b)

0.1

0 1 2 3 4 5 6 7 8 9 10

x

c)

0.1

0 1 2 3 4 5 6 7 8 9 10 12 14 11 13 15

x

d)

f(x) 0.2

0.1

0 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 11 13 15 17 19

x

FIGURA 4.10 Densidad de la variable binomial X: a) n = 5, p = 0.4; b) n = 10, p = 0.4; c) n = 15, p = 0.4, y d ) n = 20, p = 0.4.

La probabilidad exacta de 0.0565 está dada por la suma de las áreas de las barras centradas en 12, 13, 14, 15, 16, 17, 18, 19 y 20, como se muestra en la figura 4.11. La probabilidad aproximada está dada por el área bajo la curva normal mostrada superior a 11.5. En otras palabras: P[ X ≥ 12]

P[Y ≥ 11.5]

DISTRIBUCIONES CONTINUAS

123

0.2

fY

0.1

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

y

11.5

FIGURA 4.11 P[ X ≥ 12] = área de los bloques sombreados

área bajo la curva después de 11.5.

El número 0.5 se llama corrección de media unidad de la continuidad. Se resta de 12 en la aproximación, ya que de otra manera la mitad del área de la barra centrada en 12 se pasaría por alto inadvertidamente, lo que llevaría a un error de cálculo innecesario. A partir de este punto, el cálculo es rutinario:

P[ X ≥ 12]

P[Y ≥ 11.5]  Y − 8 11.5 − 8  = P ≥  4.8   4.8 = P[Z ≥ 1.59] = 1 − 0.9441 = 0.0559

Advierta que inclusive cuando n vale apenas 20, el valor aproximado de 0.0559 es cercano al valor exacto, 0.0565. Por supuesto, en la práctica no se aproximaría una probabilidad que pueda obtenerse directamente de una tabla binomial. Se hizo en este caso sólo para fines comparativos.

4.7 DISTRIBUCIÓN DE WEIBULL Y CONFIABILIDAD En 1951, W. Weibull describió una distribución que ha resultado de utilidad en diversas aplicaciones físicas. Se obtiene en forma más bien natural del estudio de la confiabilidad, como se demuestra en párrafos ulteriores. La forma más general de la densidad de Weibull está dada por: f ( x ) = αβ ( x − γ )β − 1 e −α ( x − γ )

β

x >γ α>0

β>0 La consecuencia de esta definición de la densidad es que existe un valor mínimo o “umbral” γ , respecto del cual no puede ser inferior la variable aleatoria X. En muchas aplicaciones físicas, dicho valor es 0. Por tal razón, en la obra se define la densidad de Weibull teniendo en cuenta tal hecho. Se recomienda al lector que tenga cuidado, cuando lea literatura científica, de tomar nota de la forma en que se usa esta densidad.

124

PROBABILIDAD Y ESTADÍSTICA

Definición 4.7.1 (distribución de Weibull). Se afirma que una variable aleatoria X tiene distribución de Weibull, con parámetros α y β, si su densidad está dada por:

f ( x ) = αβx β − 1e −α x

β

x>0 α>0 β>0

Es fácil verificar que la función dada en la definición 4.7.1 es una densidad (ejercicio 61). La media de esta distribución se calcula directamente, no por medio de la función generadora de momentos.

Teorema 4.7.1. Sea X una variable aleatoria de Weibull con parámetros α y β. La media y varianza de X están dadas por:

µ = α −1/β Γ (1 + 1/β ) y

σ 2 = α −2 /β Γ (1 + 2 /β) − µ 2 Demostración. Según la definición 4.2.1:

E[ X ] = =



β

∫0 xαβx β − 1e−α x dx ∞ ∫0 αβx β e−α x dx β

Sea z = αxβ. Ello implica que:

x = ( z /α )1/β

y

dx = (1/αβ)( z /α )1/β − 1 dz

Por sustitución, se tiene que: ∞

∫0 αβ ( z /α)e− z (1/αβ )( z /α)1/ β − 1 dz ∞ = ∫0 ( z /α)1/ β e− z dz ∞ = α −1/β ∫0 z 1/ β e− z dz

E[ X ] =

La integral de la derecha es, por definición, Γ(1 + 1/β ) [véase definición 4.3.1]. Así pues, se ha demostrado que la media de la distribución de Weibull es:

µ = E[ X ] = α −1/β Γ (1 + 1/ β) como se había afirmado. El resto de la demostración se incluye como ejercicio (ejercicios 62 y 63).

DISTRIBUCIONES CONTINUAS

125

La gráfica de la densidad de Weibull varía según los valores de α y β. Su forma general se asemeja a la de la densidad gamma, con una curva que se vuelve más simétrica a medida que aumenta el valor de β. Ejemplo 4.7.1.

Sea X una variable aleatoria de Weibull, con β = 1. La densidad de X es: f ( x ) = α e −α x

x>0 α >0

Tome nota de que ésta es la densidad de una variable aleatoria exponencial. En otras palabras, la distribución exponencial es un caso especial de la distribución de Weibull con β = 1. Conforme al teorema 4.7.1:

µ = α −1/ β Γ(1 + 1/β ) = (1/α )Γ( 2) = 1/α ⋅ 1! = 1/α σ 2 = α −2 / β Γ(1 + 2 /β ) − µ 2 = 1/α 2Γ(3) − (1/ α) 2 = 2 /α 2 − 1/α 2 = 1/α 2 Advierta que estos resultados son compatibles con los obtenidos al considerar como exponencial a esta variable aleatoria (ejercicio 33).

Confiabilidad Como se señaló, la distribución de Weibull surge frecuentemente en el estudio de la confiabilidad. Este último se relaciona con la evaluación de si un sistema funciona adecuadamente bajo las condiciones para las cuales se diseñó o no lo hace. El interés se centra en describir el comportamiento de la variable aleatoria X, el tiempo necesario para la falla de un sistema que es irreparable una vez que deja de funcionar. Son tres las funciones que participan en la evaluación de la confiabilidad. Son la densidad de falla f, la función de confiabilidad R y la tasa de falla o riesgo de la distribución, ρ. A fin de comprender cómo se definen estas funciones, considere un sistema que empieza a funcionar en el momento t = 0. Se observa al sistema hasta que tarde o temprano falla. Sea X el tiempo de la falla. Se trata de una variable aleatoria continua y, a priori, puede suponerse cualquier valor del intervalo (0, ∞). La densidad f de X se llama densidad de falla del componente. La función de confiabilidad R se define como la probabilidad de que el componente no falle antes del tiempo t. Así pues: R(t) = 1 – P[falla del componente antes del tiempo t] =1−



t

0

f ( x ) dx

= 1 − F (t )

donde F es la función de distribución acumulativa de X. Considere, para definir ρ, que es la función de tasa de falla, el intervalo de tiempo [t, t + ∆t] de duración ∆t. Se define la fuerza de la función de tasa de mortalidad o riesgo en este intervalo mediante

126

PROBABILIDAD Y ESTADÍSTICA

t1

t2

FIGURA 4.12 En el tiempo t1, la gráfica de F es pronunciada. Las fallas tienden a ocurrir en el intervalo de tiempo cercano a t1. En el tiempo t2, la gráfica de F es más bien horizontal. Resulta muy improbable que ocurran fallas en el intervalo de tiempo cercano a t2.

1 ∆t probabilidad de falla en [t , t + ∆t ] 1 = lím ⋅ ∆t → 0 probabilidad de falla en [t , ∞] ∆t

ρ(t ) = lím P(t ≤ X ≤ t + ∆t | t ≤ X ) ∆t → 0

Advierta que:

lím

∆t → 0

F ( t + ∆t ) − F ( t ) probabilidad de falla en [t, t + ∆t ] = lím ∆ t → 0 ∆t ∆t

Por definición, ésta es la derivada de la función de distribución acumulativa de X. Puesto que la derivada de una función en general puede interpretarse como la “tasa de cambio instantáneo” de la función, esta parte de la definición de ρ(t) indica la tasa de cambio instantáneo de F en el tiempo t. Una función de distribución acumulativa no puede decrecer, de modo que la derivada de F siempre es no negativa. Su magnitud indica cuán rápidamente ocurren las fallas en un momento dado. El valor alto de F '(t) implica una curva pronunciada en t, lo que a su vez lleva consigo que las fallas se suceden rápidamente en un intervalo cercano a t; el valor bajo de F '(t) entraña que las fallas ocurren con ritmo más lento (figura 4.12). Así pues, puede afirmarse que ρ(t) brinda una idea de la tasa de falla instantánea en el tiempo t, dado que el sistema funcionaba antes de ese momento. El teorema 4.7.2 relaciona las tres funciones, f, R y ρ. Teorema 4.7.2. Sea X una variable aleatoria con densidad de fallas f, función de confiabilidad R y función de tasa de riesgo ρ. Entonces:

ρ( t ) =

f (t) R( t )

DISTRIBUCIONES CONTINUAS

127

Demostración. Por definición:

ρ (t ) = lím

∆t → 0

probabilidad de falla en [t , t + ∆t ] 1 probabilidad de falla en [t , ∞] ⋅ ∆t t + δt

∫ = lím ∫ t

∆t → 0

t



f ( x) dx

f ( x) dx



1 ∆t

F (t + ∆t ) − F (t ) 1 ⋅ 1 − F (t ) ∆t F (t + ∆t ) − F (t ) 1 = lím ⋅ ∆t → 0 ∆t R(t ) F' (t ) f (t ) = = R(t ) R(t ) = lím

∆t → 0

La tarea de los científicos es encontrar la forma de estas funciones que corresponda al problema en cuestión. En la práctica, es frecuente empezar con el supuesto de una forma particular de la función de tasa de riesgo, basado en datos empíricos. A tal efecto, debe contarse con alguna forma práctica de interpretar ρ. Una interpretación aproximada es la siguiente: Interpretación de la tasa de riesgo 1. Si ρ aumenta durante un intervalo, entonces la falla es más probable a medida que pasa el tiempo. Ello ocurre normalmente en sistemas que empiezan a fallar principalmente por desgaste. 2. Cuando ρ disminuye en un intervalo, a medida que pasa el tiempo es menos probable la falla que en momentos previos. Ello tiene lugar en circunstancias tales que los sistemas defectuosos tienden a fallar con mayor prontitud. Al paso del tiempo, disminuye la tasa de riesgo de sistemas bien fabricados. 3. Una tasa de riesgo estable se espera durante la vida útil de un componente. Las fallas que tienden a ocurrir en ese periodo se deben principalmente a factores aleatorios. Es frecuente que sólo se tenga una idea aproximada de la forma de ρ, de modo que surge naturalmente la pregunta: “¿Es posible obtener la densidad de fallas y la función de confiabilidad del conocimiento de ρ?” El teorema 4.7.3 muestra que ello es posible. Teorema 4.7.3. Sea X una variable aleatoria con densidad de fallas f, función de confiabilidad R y tasa de riesgos ρ. Entonces: t R(t ) = exp − ρ ( x) dx   0 



y f (t) = ρ (t)R(t).

128

PROBABILIDAD Y ESTADÍSTICA

Demostración.

Advierta que R(x) = 1 – F(x), por lo que R'(x) = –F'(x). Por lo tanto:

f ( x) F'(x) – R'(x) = = R( x ) R( x ) R( x ) Se integra cada miembro de la ecuación para obtener:

ρ ( x) =

R' ( x) dx = −[ln R(t ) − ln R(0)] R( x ) Observe que R(0) = 1, ya que el componente no falla antes del tiempo t = 0, que es el momento en que empieza a funcionar. Puesto que ln R(0) = ln 1 = 0, se aprecia que: t

t

0

0

∫ ρ( x) dx = −∫

t

− ρ ( x) dx = ln R(t )



0

o que t exp − ρ ( x) dx  = eln R( t ) = R(t )  0 



como se afirmó.

El ejemplo 4.7.2 ilustra el uso del teorema 4.7.3 y muestra la forma en la que surge la distribución de Weibull en los estudios de confiabilidad. Ejemplo 4.7.2.

Una función de tasa de riesgo de uso generalizado es la siguiente:

ρ (t ) = αβt β − 1

t >0

α >0 β>0 Esa función tiene la propiedad de que, si β = 1, la tasa de riesgo es constante, lo cual indica que la ocurrencia de una falla se debe principalmente a factores aleatorios; cuando β > 1, la tasa de riesgo aumenta, lo cual refleja que la falla resulta principalmente de desgaste del sistema con el paso del tiempo. Si β < 1, la tasa de riesgo es creciente y la falla a corto plazo probablemente se deba a mal funcionamiento del sistema (ejercicio 64). La función de confiabilidad está dada por: t R(t ) = exp − αβx β − 1 dx   0 



[

t

]

= exp −α x β 0 = e−α [ t

β − 0β ]

= e −α t

β

La densidad de fallas, a su vez, está dada por: f (t ) = ρ (t ) R(t ) = αβt β − 1e−α t

β

Ésta es la densidad de una variable aleatoria de Weibull con parámetros α y β.

Esta sección puede resumirse como sigue: Propiedades de los estudios de confiabilidad 1. La variable aleatoria de interés es X, el tiempo de falla de un sistema o de un componente de un sistema.

DISTRIBUCIONES CONTINUAS

129

2. La densidad de fallas f es la función de densidad de probabilidad de X. 3. La función de confiabilidad R indica la probabilidad de que el sistema o uno de sus componentes no fallen antes del tiempo t. 4. La función F es la función de distribución acumulativa de X. 5. La función de tasa de riesgo ρ da una idea de la tasa instantánea de fallas en el tiempo t, dado que el sistema o componente funcionaban antes de dicho momento. 6. Estas funciones están interrelacionadas como sigue:

ρ (t ) = f (t )/ R(t )  t  R(t ) = exp − ρ( x ) dx   0 



7. La distribución de Weibull suele ser apropiada como densidad de fallas en problemas aplicados de ingeniería.

Confiabilidad de los sistemas en serie y en paralelo En sistemas con componentes múltiples, éstos pueden instalarse en el sistema de maneras diversas. Muchos están dispuestos en una configuración en “serie”, otros en “paralelo”, y algunos más en una combinación de estos dos diseños. Los sistemas en serie y en paralelo se definen como sigue: Definición 4.7.2 (sistema en serie). Se llama sistema en serie a uno cuyos componentes están arreglados de tal manera que el sistema falla si cualquiera de sus componentes falla.

Definición 4.7.3 (sistema en paralelo). Se denomina sistema en paralelo a uno cuyos componentes están arreglados de tal manera que el sistema falla sólo si todos sus componentes fallan. Recuerde que la función de confiabilidad de un componente es la probabilidad de que no falle antes del tiempo t. Considere un sistema de k componentes conectados en serie. Sea Ri(t) la confiabilidad del componente i y supóngase que los componentes son independientes, en el sentido de que la confiabilidad de uno no afecta a la de los demás. La confiabilidad del sistema en su totalidad es la probabilidad de que no falle antes del tiempo t. El sistema no falla si y sólo si ninguno de sus componentes lo hace antes del tiempo t. Así pues, la confiabilidad del sistema, Rs(t), está dada por: k

Rs (t ) =

∏ R (t ) i

i =1

Los dos ejemplos siguientes ilustran el uso de esta ecuación.

130

PROBABILIDAD Y ESTADÍSTICA

Ejemplo 4.7.3. Considere un sistema con cinco componentes conectados en serie. Si cada componente tiene confiabilidad de 0.95 en el tiempo t, la confiabilidad del sistema en dicho tiempo es Rs(t) = (0.95)5 = 0.774. Ejemplo 4.7.4. Suponga que está en diseño un sistema de cinco componentes independientes y se pretende que la confiabilidad del sistema en el tiempo t sea de por lo menos 0.95. Si la confiabilidad de cada componente en dicho tiempo es la misma, ¿cuál es la confiabilidad mínima que se requiere por componente? En este caso, interesa que x5 ≥ 0.95, donde x es la confiabilidad de cada componente. La solución es x = (0.95)1/5 = 0.9898.

Un diseño más práctico en numerosos equipos es el de sistema en paralelo. Considere k componentes independientes arreglados en paralelo. Cuando falla el primero, se usa el segundo; si falla este último, se utiliza el tercero. El proceso continúa hasta que falla el último componente, momento en que falla el sistema en su totalidad. La confiabilidad del sistema en el tiempo t es en este caso la probabilidad de que al menos uno de los k componentes no falle antes del tiempo t. Dicha probabilidad está dada por: Rs(t) = 1 – P[falla en todos los componentes] k

= 1−

∏[1 − R (t )] i

i =1

Debe tomar nota de que la confiabilidad de cada componente puede ser distinta en los sistemas tanto en serie como en paralelo. El ejemplo 4.7.5 ilustra un sistema en que se usan ambas configuraciones. Ejemplo 4.7.5. Considere un sistema que comprende ocho componentes independientes, conectados como se muestra en la figura 4.13. Advierta que el sistema incluye cinco subsistemas en serie, donde el subsistema I consiste en el componente 1; el II, en los componentes 2 y 3 en paralelo; el III, en los componentes 4, 5 y 6 en paralelo, y el IV y V, en los componentes 7 y 8, respectivamente. El cálculo de la confiabilidad del sistema requiere primero determinar la confiabilidad de los dos subsistemas en paralelo. La del subsistema II es: [1 – (1 – 0.95)2] = 0.9975 4 2 1

0.95

0.99

0.96 5

7

8

0.92

0.95

0.82

IV

V

3 0.95

6 0.85

I

II

III

FIGURA 4.13 Sistema con cinco subsistemas, de ellos el II y III en paralelo.

DISTRIBUCIONES CONTINUAS

131

y la del subsistema III es: [1 – (1 – 0.96)(1 – 0.92)(1 – 0.85)] = 0.99952 La confiabilidad de un sistema es el producto de la confiabilidad de los cinco subsistemas y está dado por: Rs(t) = (0.99)(0.9975)(0.99952)(0.95)(0.82) = 0.7689

Es evidente que un sistema con numerosos componentes independientes dispuestos en serie tendría confiabilidad muy baja como sistema, incluso si cada componente es en sí muy confiable. Por ejemplo, un sistema de 20 componentes, cada uno conectado en serie y con confiabilidad de 0.95, tiene confiabilidad de sistema de (0.95)20 = 0.358. Una forma de incrementar la confiabilidad del sistema es sustituir varios de los componentes en serie con otros similares, dispuestos en paralelo. Por supuesto, el costo de incluir este tipo de redundancia suele ser alto.

4.8

TRANSFORMACIÓN DE VARIABLES

Considérese una variable aleatoria continua X con densidad fX . Suponga que el interés se centra en la variable aleatoria Y, que es una función de X. ¿Es posible determinar la densidad de Y con base en el conocimiento de la distribución de X ? El teorema siguiente permite responder a esta pregunta, a condición de que Y sea una función estrictamente monótona de X. Teorema 4.8.1. Sea X una variable aleatoria continua con densidad fX . Sea también Y = g(X ), donde g es estrictamente monótona y diferenciable. La densidad de Y se denota como fY y está dada por: fY ( y) = f X ( g −1 ( y))

d −1 g ( y) dy

Demostración. Suponga que Y = g(X ) es una función estrictamente decreciente de X. Por definición, la función de distribución acumulativa de Y es: FY ( y) = P[Y ≤ y ] = P[ g ( X ) ≤ y ]

Puesto que g es estrictamente decreciente, g–1 existe y también es decreciente. Así pues:

P[ g ( X ) ≤ y ] = P[ g −1 ( g ( X )) ≥ g −1 ( y)] = P[ X ≥ g −1 ( y)] = 1 − P[ X ≤ g −1 ( y)] Por definición, P[X ≤ g–1( y)] = FX ( g–1( y)) y, de tal suerte, con la sustitución se tiene: FY ( y) = 1 − FX ( g −1 ( y))

La derivada de la función de distribución acumulativa genera la densidad: fY ( y) = (−1) f X ( g −1 ( y))

d −1 g ( y) dy

132

PROBABILIDAD Y ESTADÍSTICA

Advierta que g–1 es decreciente, por lo que dg –1( y)/dy < 0 y −

d −1 d −1 g ( y) = g ( y) dy dy

Por sustitución, f Y ( y) puede escribirse como: d −1 g ( y) dy como se afirmó. La demostración del caso en el que g es creciente reviste similitud y se deja como ejercicio (ejercicio 69). fY ( y) = f X ( g −1 ( y))

Un ejemplo ilustra la idea precedente. Ejemplo 4.8.1.

Sea X una variable aleatoria con densidad: f X ( x) = 2 x

0< x 1.57]. e) P[–1.25 ≤ Z ≤ 1.75]. f ) z0.10. g) Z0.90. h) El punto z, tal que P[–z ≤ Z ≤ z] = 0.95. i) El punto z, tal que P[–z ≤ Z ≤ z] = 0.90. 40. La densidad de grosor del suelo se define como la masa de sólidos secos por unidad de volumen de grosor. Que sea alta implica que el suelo es compacto, con pocos poros. Esta densidad es un factor importante, que influye en el desarrollo de raíces y plántulas, así como en la aireación. Sea X la densidad del grosor de la arcilla para moldeo Pima. Los estudios muestran que X tiene distribución normal, con µ = 1.5 y σ = 0.2 g/cm3. a) ¿Cuál es la función de densidad de X? Elabore un boceto de la gráfica de la función de densidad. Indique, en esa gráfica, la probabilidad de que X se ubique entre 1.1 y 1.9. Calcule dicha probabilidad. b) Calcule la probabilidad de que una muestra seleccionada aleatoriamente del suelo mencionado tenga densidad de grosor menor de 0.9 g/cm3. c) ¿Le sorprendería que una muestra seleccionada aleatoriamente de este tipo de suelo tenga densidad mayor de 2 g/cm3? Explique su respuesta con base en las probabilidades correspondientes. d ) ¿Cuál punto posee la propiedad de que sólo el 10% de las muestras de suelo tengan las densidades de grosor más altas? e) ¿Cuál es la función generadora momentos de X ? 41. Muchas galaxias tienen forma de disco aplanado y la mayor parte de su luz proviene de ese plano fundamental muy delgado. El grado de aplanamiento difiere de una galaxia a otra. En la Vía Láctea, muchos gases se concentran cerca del centro del plano fundamental. Sea X la distancia perpendicular de ese centro a una masa gaseosa. Esa variable tiene distribución normal, con media 0 y desviación estándar de 100 parsecs. (Un parsec equivale aproximadamente a 19.2 trillones de millas.)

146

42.

43.

44.

45.

PROBABILIDAD Y ESTADÍSTICA

a) Elabore un boceto de la gráfica de la densidad de X. En él, indique la probabilidad de que una masa gaseosa se localice a más de 200 parsecs del centro del plano fundamental. Calcule dicha probabilidad. b) ¿Cuál porcentaje aproximado de las masas gaseosas se localiza a más de 250 parsecs del centro del plano? c) ¿Cuál distancia tiene la propiedad de que 20% de las masas gaseosas se ubica por lo menos a esa distancia del plano fundamental? d ) ¿Cuál es la función generadora de momento para X ? En diabéticos, podría suponerse que el valor de glucosa en la sangre durante el ayuno tiene distribución aproximadamente normal, con media de 106 mg/100 ml y desviación estándar de 8 mg/100 ml. a) Elabore un boceto de la gráfica de la densidad de X. En él, indique la probabilidad de que un diabético seleccionado aleatoriamente tenga valor en sangre de la glucosa de 90 a 122 mg/100 ml. Calcule esa probabilidad. b) Calcule P[X ≤ 120 mg/100 ml]. c) Calcule el punto que posee la propiedad de que 25% de los diabéticos tiene un nivel de glucosa en la sangre menor o igual a dicho valor. d ) Si en una muestra un diabético seleccionado aleatoriamente tiene valor de glucosa en sangre durante el ayuno mayor de 130, ¿pensaría que hay razones para preocuparse? Explique su respuesta con base en la probabilidad de que ello ocurra naturalmente. Sea X el tiempo en horas necesario para localizar y corregir un problema en el software que controla el cambio de las luces de semáforos en el área céntrica de una gran ciudad. Suponga que X tiene distribución normal, con media de 10 h y varianza de 9 h. a) Calcule la probabilidad de que la identificación y corrección del problema siguiente requieran cuando mucho 15 h. b) ¿Qué tiempo tarda en efectuarse el 5% más rápido de reparaciones? Suponga que el nivel de agua en pies de un lago específico tiene distribución normal durante la estación de lluvia, con media de 1 876 pies y desviación estándar de 6 pulg. a) ¿Sería inusual que el nivel de agua observado durante esa estación sea cuando mucho de 1 875 pies? Explique su respuesta con base en la probabilidad de que ello ocurra. b) Suponga que el lago se desborda si su nivel excede de 1 878 pies. ¿Cuál es la probabilidad de que así ocurra durante la estación de lluvias normal? (Distribución log-normal.) La distribución log-normal es la distribución de una variable aleatoria cuyo logaritmo natural posee distribución normal. Así pues, si X es una variable aleatoria normal, entonces Y = eX tiene distribución log-normal. Complete el argumento siguiente y, de tal suerte, deduzca la densidad de una variable aleatoria log-normal. Sea X una variable aleatoria normal con media µ y varianza σ 2. Sea también G la función de distribución acumulativa de Y = e X, y F, la función de distribución acumulativa de X. a) Demuestre que G( y) = F(ln y). b) Demuestre que G'( y) = F'(ln y)/y. c) Demuestre que la densidad de Y está dada por: g( y ) =

 1 (ln y − µ )2  1 exp −  σ2  2  2πσy

−∞ < µ < ∞ σ >0 y>0

DISTRIBUCIONES CONTINUAS

147

Nótese que µ y σ son la media y la desviación estándar de la distribución normal subyacente, no las de Y. 46. Sea Y el diámetro en milímetros de las esferas de Styrofoam usadas en empaques. Suponga que Y tiene distribución logarítmica normal, con parámetros µ = 0.8 y σ = 0.1. a) Calcule la probabilidad de que una esfera seleccionada aleatoriamente tenga diámetro mayor de 2.7 mm. b) ¿Entre cuales dos valores se ubica Y con probabilidad aproximada de 0.95? Sección 4.5

47. Verifique la regla de probabilidad normal 48. El número de unidades térmicas británicas (Btu) de petróleo y sus derivados consumido por persona en Estados Unidos durante 1975 tuvo distribución normal, con media de 153 millones de BTU y desviación estándar de 25 millones de Btu. ¿Qué porcentaje aproximado de la población consumió entre 128 y 178 millones de BTU en ese año? ¿Qué porcentaje aproximado de la población usó más de 228 millones de Btu? 49. Reconsidere los ejercicios 40a, 41a y 42a a la luz de la regla de probabilidad normal. 50. En el caso de una variable aleatoria normal, P[| x − µ | < 3σ ] 0.997. ¿Qué valor es asignado para esta probabilidad con la desigualdad de Chebyshev? ¿Los resultados son consistentes? ¿Cuál regla proporciona una evolución mejor en el caso de una variable normal? 51. Los animales tienen memoria espacial excelente. En un experimento para confirmar esa afirmación, se usó un laberinto de ocho brazos, como el que se muestra en la figura 4.21. Al comienzo de la prueba, se colocó una esfera de alimento en el extremo de cada brazo. También se puso a un animal hambriento en el centro del laberinto y se le permitió que eligiera libremente cual-

Alimento

Animal

FIGURA 4.21 Laberinto de ocho brazos.

148

PROBABILIDAD Y ESTADÍSTICA

quiera de los brazos. La estrategia óptima consiste en que corra una sola vez hasta el extremo de cada brazo. Ello requiere que el animal recuerde dónde ha estado. Sea X el número de brazos correctos (que todavía contienen alimento) seleccionados en los primeros ocho intentos. Los estudios indican que µ = 7.9. a) ¿Tiene X distribución normal? b) Indique e interprete de la desigualdad de Chebyshev en el contexto de este problema, con k = 0.5, 1, 2 y 3. ¿En cuál punto la desigualdad empieza a proporcionar información práctica? Sección 4.6

52. Sea X binomial, con n = 20 y p = 0.3. Use la aproximación normal para calcular las siguientes probabilidades. Compare sus resultados con los valores de la tabla I en el apéndice A. a) P[X ≤ 3]. b) P[3 ≤ X ≤ 6]. b) P[X ≥ 4]. d ) P[X = 4]. 53. Aunque los errores son probables cuando se toman mediciones a partir de imágenes fotográficas, es frecuente que sean muy pequeños. En el caso de imágenes claras con deformación insignificante, los errores de medición de distancias no suelen ser mayores de 0.0004 pulg. Suponga que la probabilidad de un error de medición grave es de 0.05. Se realiza una serie de 150 mediciones independientes. Sea X el número de errores graves cometidos. a) ¿Es adecuada la aproximación normal en el cálculo de la probabilidad de que se cometa por lo menos un error grave? En caso afirmativo, aproxime la probabilidad con dicho método. b) Aproxime la probabilidad de que se cometan cuando mucho tres errores graves. 54. Una reacción química tiene rendimiento usual de 70%. Se idea un nuevo proceso, que debe mejorarlo. Los defensores del nuevo proceso afirman que genera mejores rendimientos que el proceso antiguo en más de 90% de los casos. El nuevo proceso se someterá a prueba 60 veces. Sea X el número de intentos en que el rendimiento es mayor de 70%. a) ¿Es adecuada la aproximación normal si la probabilidad de mejor rendimiento es de 0.9? b) Si p = 0.9, ¿cuál es el valor de E[X ]? c) Si p > 0.9, como se afirma, entonces más de 54 de cada 60 intentos, en promedio, tendrán mejor rendimiento. Acéptese la afirmación si X es de por lo menos 59. ¿Cuál es la probabilidad de que se acepte esa afirmación si p es realmente de tan sólo 0.9? d ) ¿Cuál es la probabilidad de que no se acepte la afirmación (X ≤ 58) si es verdadera y p vale en realidad 0.95? 55. Los oponentes de un proyecto nucleoeléctrico afirman que está en contra del proyecto la mayoría de los habitantes del área cercana al sitio propuesto para el proyecto. A fin de justificar su afirmación, se selecciona una muestra aleatoria de 75 habitantes y se sondea su opinión. Sea X el número de personas opuestas al proyecto. a) Si la probabilidad de que un individuo se oponga al proyecto es 0.5, ¿resulta adecuada la aproximación normal? b) Cuando p = 0.5, ¿cuál es el valor de E[X ]? c) Si p > 0.5, como se afirma, entonces se tiene en promedio que más de 37.5 de cada 75 individuos se oponen al proyecto. Acéptese la afirmación si X vale por lo menos 46. ¿Cuál es la probabilidad de que se acepte la afirmación si p vale en realidad apenas 0.5?

DISTRIBUCIONES CONTINUAS

149

d ) ¿Cuál es la probabilidad de que no se acepte la afirmación (X ≤ 45), aunque es verdadera y p en realidad vale 0.7? 56. (Aproximación normal de la distribución de Poisson.) Sea X una variable de Poisson con parámetro λ s. Entonces, con valores altos de λ s, X es aproximadamente normal, con media λ s y varianza λ s. (La comprobación de este teorema también se basa en el teorema del límite central y se considera en el capítulo 7.) Sea X una variable aleatoria de Poisson con parámetro λ s = 15. Calcule P[X ≤12] a partir de la tabla II del apéndice A. Aproxime esa probabilidad con una curva normal. No olvide usar el factor de corrección de unidad media. 57. El número promedio de jets que llegan o salen del aeropuerto O’Hare es de uno cada 40 s. ¿Cuál es la probabilidad aproximada de que ocurran 75 de tales vuelos durante una hora seleccionada aleatoriamente? ¿Cuál es la probabilidad de que haya menos de 100 de esos vuelos en una hora dada? Sección 4.7

58. El tiempo en horas que mantiene su carga una batería recargable de calculadora es una variable aleatoria. Supóngase que tiene distribución de Weibull, con α = 0.01 y β = 2. a) ¿Cuál es la densidad de X ? b) ¿Cuáles son la media y varianza de X ? Sugerencia: puede demostrarse que Γ(α) = (α – 1)Γ(α – 1), con cualquier valor α > 1. Por añadidura, Γ(1/2) = π . c) ¿Cuál es la función de confiabilidad de esta variable aleatoria? d ) ¿Cuál es la confiabilidad de la pila con t = 3 h, t = 12 h y t = 20 h? e) ¿Cuál es la función de tasa de riesgo de la batería? f ) ¿Cuál es la tasa de falla con t = 3 h, t = 12 h y t = 20 h? g) ¿Es la función de tasa de riesgo una de naturaleza creciente o decreciente? ¿Parece ello razonable desde el punto de vista práctico? Explique su respuesta. 59. Los chips de computadora no se “desgastan” en el sentido usual. En el supuesto de que se retiran del mercado chips defectuosos para su inspección de fábrica, sería razonable suponer que esos chips tienen una tasa de riesgo constante. Sea la tasa de riesgo dada por ρ(t) = 0.02 (el tiempo se indica en años). a) ¿Cuáles son las causas principales de falla de estos chips desde el punto de vista práctico? b) ¿Cuál es la función de confiabilidad de chips de este tipo? c) ¿Cuál es la confiabilidad de un chip al cabo de 20 años de su puesta en uso? d ) ¿Cuál es la densidad de fallas de estos chips? e) ¿De cuál tipo es la variable aleatoria X, el tiempo para que falle un chip? f ) ¿Cuáles son la media y la varianza de X ? g) ¿Cuál es la probabilidad de que un chip funcione al menos durante 30 años? 60. La variable aleatoria X, el tiempo hasta la falla (en miles de millas conducidos) de las luces intermitentes de un automóvil tiene distribución de Weibull, con α = 0.04 y β = 2. a) Calcule la densidad, la media y la varianza de X. b) Calcule la función de confiabilidad de X. c) ¿Cuál es la confiabilidad de esas luces al cabo de 5 000 y 10 000 mi? d ) ¿Cuál es la función de tasa de riesgo? e) ¿Cuál es la tasa de riesgo luego de 5 000 y 10 000 mi? f ) ¿Cuál es la probabilidad de que esas luces fallen durante las primeras 3 000 mi conducidas?

150

PROBABILIDAD Y ESTADÍSTICA

61. Demuestre que con α > 0 y β > 0, se tiene: ∞

∫0 αβx β − 1e−α x dx = 1 β

y, con ello, que la función no negativa dada en la definición 4.7.1 es la densidad de una variable aleatoria continua. Sugerencia: Haga que z = α xβ. 62. Sea X una variable aleatoria de Weibull con parámetros α y β. Demuestre que E[X 2] = α –2/β Γ(1 + 2/β ). Sugerencia: En la evaluación de: ∞

∫0 x 2αβx β − 1e−α x dx β

sea que z = α xβ. Evalúe la integral de manera similar a la usada en la demostración del teorema 4.7.1. 63. Use el resultado del ejercicio 62 para encontrar Var X de una variable aleatoria de Weibull con parámetros α y β, con lo que se completa la demostración del teorema 4.7.1. 64. Considere la función de tasa de riesgo:

ρ(t ) = αβt β − 1

t>0 α>0 β>0

a) Demuestre que ρ(t) es constante si β = 1. b) Calcule ρ' (t). Argumente que ρ' (t) > 0 si β > 1, con lo que se produce una tasa de riesgo creciente. Argumente que ρ' (t) < 0 si β < 1, con lo que se produce una tasa de riesgo decreciente. 65. Un sistema tiene ocho componentes, que están conectados como se ilustra en la figura 4.22. a) Calcule la confiabilidad de cada uno de los subsistemas en paralelo. b) Calcule la confiabilidad del sistema. c) Suponga que el subsistema II se reemplaza con dos componentes idénticos en paralelo, cada uno con confiabilidad de 0.98. ¿Cuál es la confiabilidad del nuevo subsistema?

1 0.85

6

2

4

5

0.93

0.98

0.94

0.80 7 .95 7

8 0.999

0.80

3 0.75 I

FIGURA 4.22

II

III

IV

V

DISTRIBUCIONES CONTINUAS

151

d ) ¿Cuál es la confiabilidad del nuevo sistema después de los cambios indicados en el inciso c? e) Realice cambios análogos a los del inciso c en cada uno de los subsistemas de componentes restantes. Calcule la nueva confiabilidad del sistema. 66. Un sistema incluye dos componentes independientes conectados en serie. La vida útil del primer componente tiene distribución de Weibull, con α = 0.006 y β = 0.5, mientras que la del segundo componente es de distribución exponencial, con β = 0.00004. a) Calcule la confiabilidad del sistema luego de 2 500 h. b) Calcule la probabilidad de que el sistema falle antes de 2000 h. c) ¿Cuál es la confiabilidad del sistema después de 2500 h si están conectados en paralelo dos componentes? 67. Suponga que un proyectil puede tener varias computadoras idénticas e independientes, cada una con confiabilidad de 0.9, conectadas en paralelo de manera tal que el sistema continúe funcionando a condición de que esté en funcionamiento al menos una computadora. Si se pretende tener confiabilidad del sistema de por lo menos 0.999, ¿cuántas computadoras deben estar conectadas en paralelo? 68. Tres componentes idénticos e independientes, cada uno con confiabilidad de 0.9, se usarán en un sistema. a) El sistema funcionará si lo hace al menos uno de sus componentes. Calcule la confiabilidad del sistema. b) El sistema funcionará cuando lo hagan por lo menos dos de sus componentes. Calcule la confiabilidad del sistema. c) Sistema sólo funcionará si lo hacen sus tres componentes. Calcule la confiabilidad del sistema. Sección 4.8

69. Demuestre el teorema 4.8.1 cuando g es estrictamente creciente. 70. Sea X una variable aleatoria con densidad:

f X ( x ) = (1/ 4) x

0≤ x≤ 8

y sea Y = X + 3. a) Calcule E[X ] y luego use las reglas de la esperanza para calcular E[Y ]. b) Calcule la densidad de Y. c) Use la densidad de Y para calcular E[Y ] y compare su respuesta con la del inciso a. 71. Sea X una variable aleatoria con densidad: f X ( x ) = (1/ 4) xe − x/ 2

x≥0

y sea Y = (–1/2)X + 2. Calcule la densidad de Y. 72. Sea X una variable aleatoria con densidad:

f X ( x ) = e− x

x>0

y sea Y = e X. Calcule la densidad de Y. 73. Sea que C denota la temperatura en grados centígrados (Celsius) a la que está expuesta una computadora en el campo. Suponga que C tiene distribución uniforme en el intervalo (15, 21).

152

PROBABILIDAD Y ESTADÍSTICA

Sea F la temperatura de campo en grados Fahrenheit, de modo que F = (9/5)C + 32. Calcule la densidad de F. 74. Sea X la velocidad de una molécula de gas aleatoria. Según la ley de Maxwell-Boltzmann, la densidad de X está dada por:

f X ( x ) = cx 2 e −βx

2

x>0

donde c es una constante que depende del gas de que se trate, y β, una constante cuyo valor depende de la masa de la molécula y su temperatura absoluta. La energía cinética Y de la molécula está dada por Y = (1/2)mX 2, donde m > 0. Calcule la densidad de Y. 75. Sea X una variable aleatoria continua con densidad fX , y sea Y = X 2. a) Demuestre que con y ≥ 0:

[

FY ( y ) = P − y ≤ X ≤

y

]

b) Demuestre que con y ≥ 0: FY ( y ) = FX

( y ) − F (− y ) X

c) Use la técnica aplicada en la demostración del teorema 4.8.1 para demostrar que:

(

fY ( y ) = 1 / 2 y

)[ f ( y ) + f (− y ) ] X

X

d ) Use la técnica ilustrada en el ejemplo 4.8.2 para demostrar que:

(

f Y ( y ) = 1/ 2 y

)[ f ( y ) + f (− y ) ] X

X

76. Sea Z una variable aleatoria normal estándar, con Y = Z 2. ∞ a) Demuestre que Γ(1/ 2) = ∫ 0 x −1 / 2e − x dx. b) Demuestre que Γ(1/ 2) = π . Sugerencia: Use los resultados del inciso a, con x = t 2/2 y el hecho de que la integral de densidad normal estándar es 1 cuando la integración se hace sobre conjunto de números reales. c) Use los resultados del ejercicio 75 para calcular fY . d ) Argumente que Y tiene distribución ji cuadrada con un grado de libertad. 77. Sea X una variable de distribución normal con media µ y varianza σ 2 y sea Y = e X. Demuestre que Y tiene distribución log-normal (véase ejercicio 45). 78. Sea Z una variable aleatoria normal estándar y sea que Y = 2Z 2 – 1. Calcule la densidad de Y. Sección 4.9

79. Use la tabla III del apéndice A para generar nueve observaciones más de la variable aleatoria X, el tiempo para que falle un chip de computadora (véase ejemplo 4.9.1). A partir de esos datos, calcule el tiempo promedio aproximado para la falla mediante la determinación del promedio aritmético de los valores de X simulados en el experimento. ¿Este valor concuerda satisfactoriamente con la media teórica de 50 años?

DISTRIBUCIONES CONTINUAS

153

80. Simule 20 observaciones de la variable aleatoria X, el tiempo para la falla de las luces intermitentes de un automóvil (véase ejercicio 60). Calcule en forma aproximada el tiempo promedio para la falla de esas luces, con base en los datos simulados. ¿Concuerda ese valor con la media teórica de X ? 81. Un satélite funciona deficientemente y se espera que vuelva a entrar en la atmósfera terrestre en algún momento durante un periodo de cuatro horas. Sea X el tiempo en el cual vuelve a entrar. Suponga que X tiene distribución uniforme en el intervalo [0, 4]. Simule 20 observaciones de X (véase ejercicio 18).

EJERCICIOS DE REPASO

82. Sea X una variable aleatoria continua con densidad: f ( x ) = cx 2

83. 84.

85.

86.

−3≤ x ≤ 3

a) En el supuesto de que f (x) = 0 en cualquier otro caso, calcule el valor de c que hace de ésta una densidad. b) Calcule E[X ] y E[X 2] partir de la definición de estos términos. c) Calcule Var X y σ. d) Calcule P[X ≤ 2]; P[–1 ≤ X ≤ 2]; P[X > 1] por integración directa. e) Encuentre la expresión cerrada de la función de distribución acumulativa F. f ) Use F para calcular cada una de las probabilidades del párrafo d y compare sus respuestas con las obtenidas anteriormente. ∞ Calcule ∫ 0 z10e − z dz. Una fábrica de computadoras lanza una nueva computadora para el hogar. La experiencia muestra que la variable aleatoria X, el tiempo para llegar a la demanda máxima en meses después del lanzamiento, corresponde a una distribución gamma con varianza 36. a) Si el valor esperado de X es 18 meses, calcule α y β. b) Calcule P[X ≤ 7.01]; P[X ≥ 26]; P[13.7 ≤ X ≤ 31.5]. Sea que X denota el tiempo de espera en una cola de impresión de un centro de cómputo específico. En otras palabras, X indica la diferencia entre el momento cuando se coloca un programa en la lista de impresión y el momento en el que se inicia su impresión. Suponga que X tiene distribución normal, con media de 15 minutos y varianza de 25. a) Encuentre la expresión de la densidad de X. b) Calcule la probabilidad de que un programa empiece a imprimirse no más de 3 min después de que llega a la cola de impresión. c) ¿Sería inusual que un programa permaneciera en la cola de impresión de 10 a 20 min? Explique su respuesta con base en la probabilidad aproximada de que así ocurra. No tiene que utilizar la tabla Z para responder a esta pregunta. d ) ¿Le sorprendería que la impresión de un programa tardara más de 30 minutos en iniciarse? Explique su respuesta a partir de la probabilidad de que ello ocurra. Un centro de cómputo tiene un servicio de consulta por teléfono para la solución de los problemas de sus usuarios. El servicio está disponible de 9:00 a.m. a 5:00 p.m. en días laborales. La experiencia muestra que la variable aleatoria X, el número de llamadas recibidas por día, tiene

154

PROBABILIDAD Y ESTADÍSTICA

distribución de Poisson con λ = 50. En un día dado, calcule la probabilidad de que la primera llamada del día se reciba antes de las 9:15 a.m.; después de las 3 p.m.; entre las 9:30 y 10:00 a.m. 87. Sea H(X) = X 2 + 3X + 2. Calcule [H(X )] si X tiene: a) Distribución normal con media 3 y varianza 4. b) Distribución gamma con α = 2 y β = 4. c) Distribución ji cuadrada con 10 grados de libertad. d ) Distribución exponencial con β = 5. e) Distribución de Weibull con α = 2 y β = 1. 88. Sea X el tiempo necesario para actualizar un sistema de cómputo, en horas. Suponga que la densidad de X está dada por:

f ( x ) = k exp (−2 x ) 0< x 0, con todos los puntos en una recta de pendiente positiva; b) correlación negativa perfecta: ρ = –1, β1 < 0, con todos los puntos en una recta de pendiente negativa; c) ρ cercano a 1, con tendencia lineal de los puntos; d ) ausencia de correlación: ρ = 0, con puntos que indican una relación de X con Y, si bien esa relación no es lineal; e) ausencia de correlación: ρ = 0, con dispersión aleatoria de los puntos.

Ejemplo 5.3.1. A fin de calcular la correlación de X, el número de soldaduras defectuosas, con Y, el número de tornillos apretados incorrectamente, por automóvil, de los robots de la línea de montaje, se usa la tabla 5.3 para calcular E[X 2] y E[Y 2]. Para estas variables: E[X 2] = 02(0.90) + 12(0.08) + 22(0.02) = 0.16 E[Y 2] = 02(0.910) + 12(0.045) + 22(0.032) + 32(0.013) = 0.29 En el ejemplo 5.2.1, se calculó que E[X ] = 0.12 y E[Y ] = 0.148. Por consiguiente:

172

PROBABILIDAD Y ESTADÍSTICA

Var X = E[X 2] – (E[X ])2 = 0.16 – (0.12)2 Var Y = E[Y ] – (E[Y ]) = 0.29 – (0.148) 2

2

0.146 2

0.268

En el ejemplo 5.2.3, se calculó que Cov (X, Y ) = 0.046. Según la definición 5.3.1:

ρ XY =

Cov ( X ,Y ) = Var X Var Y

0.046 ( 0.146) ( 0.268)

0.23

Puesto que este valor no parece cercano a 1, tampoco se esperaría que los valores observados de X y Y presenten tendencia lineal de consideración.

La relación de la correlación con la independencia se resalta en el ejercicio 36.

5.4

DENSIDADES CONDICIONALES Y REGRESIÓN

En esta sección, se analizan dos temas relacionados estrechamente, las densidades condicionales y la regresión. A fin de apreciar qué se hará, reconsidere el ejemplo 5.1.5. Ejemplo 5.4.1. El ejemplo 5.1.5 versa sobre la variable aleatoria (X, Y ), donde X y Y son las presiones barométricas interna y externa, respectivamente, en un plafón de soporte de aire. Suponga que interesa el estudio de la presión interna cuando la externa está fija, con y = 30. Son tres los aspectos importantes que deben entenderse: 1. 2. 3.

La presión interna varía inclusive cuando la externa es constante. Así pues, tiene sentido hablar de “la variable aleatoria X, dada y = 30”. Esta nueva variable aleatoria se denota como X | y = 30. Puesto que X | y = 30 es una variable aleatoria en sí, tiene distribución de probabilidad. De tal suerte, tendría sentido preguntarse: “¿Cuál es la densidad de X | y = 30?” Esta densidad se llama “densidad condicional de X, dada y = 30” y se denota como fX | y = 30. La presión interna varía inclusive cuando la presión externa es constante, por lo que una vez más tiene sentido plantear: “¿Cuál es la presión media o promedio en el interior del techo cuando la presión externa es 30?” En otras palabras, es posible preguntarse: “¿Cuál es el valor medio de la variable aleatoria X | y = 30?” Este valor medio se denota como E[X | y = 30] o µX | y = 30.

En general, la densidad condicional de X, dada Y = y, denotada con fX | y, es una función que permite calcular la probabilidad de que X tenga valores específicos, ello con base en el conocimiento del valor de la variable aleatoria Y. A fin de ver cómo se define fX | y, suponga que (X, Y ) es discreta, con densidad conjunta fXY y densidades marginales fX y fY . Sea A1 el evento X = x, y A2 el evento Y = y. A partir de la definición 2.2.1, se tiene: P[ A1 A2 ] =

P[ A1 ∩ A2 ] P[ A2 ]

Al sustituir, se observa que: P[ X = x Y = y ] =

P[ X = x ∧ Y = y ] f XY ( x , y ) = P[Y = y ] fY ( y)

DISTRIBUCIONES CONJUNTAS

173

En el caso discreto, la densidad condicional de X, dada Y = y, es la proporción de la densidad conjunta de (X, Y ) sobre la densidad marginal de Y. Esta observación constituye el motivo para la definición del término “densidad condicional” en los casos discreto y continuo. En la definición formal, note que pueden invertirse los papeles que desempeñan X y Y. Definición 5.4.1 (densidad condicional). Sea (X, Y ) una variable aleatoria bidimensional con densidad conjunta fXY y densidades marginales fX y fY . Entonces: 1. La densidad condicional de X, dada Y = y, se denota con fX | y y está dada por: f XY ( x , y ) fY ( y) > 0 fY ( y) 2. La densidad condicional de Y, dada X = x, se denota con fY|x y está dada por: fX y =

fY x ( y ) =

f XY ( x, y ) f X( x)

f X ( x) > 0

El uso de esta definición se ilustra en el ejemplo 5.4.2. Ejemplo 5.4.2. La densidad de la variable aleatoria (X, Y ), donde X y Y son las presiones interna y externa, respectivamente, sobre un plafón de soporte de aire, está dada por: f XY ( x, y ) = c / x

27 ≤ y ≤ x ≤ 33 c = 1/(6 − 27 ln 33/ 27)

De conformidad con el ejemplo 5.1.5, las densidades marginales de X y Y son: f X ( y) = c(1 − 27/ x )

27 ≤ x ≤ 33

y fY ( y) = c(ln 33 − ln y) La densidad condicional de X, dada Y = y, es:

f X y ( x) = =

27 ≤ y ≤ 33

f XY ( x, y) fY ( y) c/ x 1 = c(ln 33 − ln y) x (ln 33 − ln y)

y ≤ x ≤ 33

A efecto de calcular la probabilidad de que la presión interna sea mayor que 32, dada la presión externa de 30, sea y = 30 en la expresión precedente. Luego, se integra la densidad condicional sobre los valores de X que exceden de 32. En otras palabras: P[ X > 32 | y = 30] =



33

32

1 dx x (ln 33 − ln 30) 33

=

ln x ln 33 − ln 30 32

=

ln 33 − ln 32 ln 33 − ln 30

0.32

174

PROBABILIDAD Y ESTADÍSTICA

En el cálculo del valor esperado o medio de X, dada y = 30, se aplica la definición 4.2.1 a la variable aleatoria X | y = 30. Dicho de otra manera: E[ X | y = 30] = µ X

y = 30

=





−∞



xf X

y = 30

dx

1 dx x (ln 33 − ln 30) 33 1 = dx 30 ln 33 − ln 30 =

33

30

x



=

3 ln 33 − ln 30

31.48

El valor promedio de la presión interna es de 31.48 pulg de mercurio cuando la presión externa sobre el plafón es 30.

Curvas de regresión En el ejemplo previo, tome nota de que no se calculó la media de X. Se determinó la media de X cuando y = 30. El valor medio obtenido dependió del valor elegido para Y. En general, la media de X, dada Y = y o µX | y, es una función de y. La representación gráfica de esta función hace que se obtenga la llamada curva de regresión de X sobre Y. Este término se define formalmente en la definición 5.4.2. Una vez más, advierta que pueden invertirse los papeles que desempeñan X y Y. Definición 5.4.2 (curva de regresión). Sea (X, Y ) una variable aleatoria bidimensional. 1. La gráfica del valor medio de X, dada Y = y, se denota con µX | y y se llama curva de regresión de X sobre Y. 2. La gráfica del valor medio de Y, dada X = x, se denota con µY | x y se llama curva de regresión de Y sobre X. La definición precedente se ilustra mediante el cálculo de la curva de regresión de X sobre Y y la de Y sobre X para la variable aleatoria (X, Y ) del ejemplo 5.4.2. Ejemplo 5.4.3. La densidad condicional de X, dada Y = y, donde X y Y son las presiones interna y externa sobre un plafón de soporte de aire, está dada por: 1 y ≤ x ≤ 33 x (ln 33 − ln y) La ecuación de la curva de regresión de X sobre Y está dada por: f X y ( x) =

1 dx x (ln 33 − ln y ) 33 1 = dx y ln 33 − ln y 33 − y = ln 33 − ln y

µX y =



33

y



x

DISTRIBUCIONES CONJUNTAS

µ X|y 33 32 31 30 29 28 27 0

y

µ X|y

27

29.90

28 29

30.43 30.95

30 31

31.48 31.98

32 32.5

32.50 32.74

175

y

27 28 29 30 31 32 33 a)

µ Y|x

31 30 29 28 27 0

27 28 29 30 31 32

x

b)

FIGURA 5.4 a) Curva de regresión no lineal: µX | y = (33 – y)/(ln 33 – ln y); b) curva de regresión lineal: µY | x = (1/2)(x + 27).

Note que se trata de una ecuación no lineal. Su gráfica no es una recta. Dicha gráfica se bosqueja al representar µX | y respecto de valores selectos de y. La gráfica se ilustra en la figura 5.4a. La densidad condicional de Y, dada X = x, es: fY | x ( y) =

f XY ( x, y) f X ( x)

c/ x c(1 − 27/ x) 1 = 27 ≤ y ≤ x x − 27 =

La ecuación de la curva de regresión de Y sobre X está dada por:

176

PROBABILIDAD Y ESTADÍSTICA

µY x = =



x 27

y

1 dy x − 27

y2 2( x − 27)

x

27

x 2 − 272 = 2( x − 27) = (1/ 2) ( x + 27)

Note que esta ecuación es lineal. Su gráfica es la recta que se muestra en la figura 5.4b. Ahora, puede usar estas curvas para calcular la media de X con cualquier valor especificado de Y, o viceversa. Por ejemplo, el valor promedio de la presión externa Y, dada la presión interna de 29, es:

µY | x = 29 = (1/2)(x + 27) = (1/2)(56) = 28 pulgadas de mercurio Se presentan únicamente las ideas básicas subyacentes al tema de la regresión. El cálculo de las curvas de regresión teóricas requiere conocer la densidad conjunta de (X, Y ). En la práctica, pocas veces se conoce con certidumbre tal densidad. Así pues, en tal contexto por fuerza es necesario aproximar estas curvas teóricas a partir de un conjunto de datos: un conjunto de observaciones de la variable aleatoria (X, Y ). Los métodos para hacerlo se describen en los capítulos 11 y 12.

5.5

TRANSFORMACIÓN DE VARIABLES

En la sección 4.8, se considera el problema de transformar variables continuas en el caso de una sola variable. En otras palabras, dada una variable aleatoria continua X, cuya densidad se conoce, se estudia la forma de calcular la densidad de la variable aleatoria Y, que es función de X. En este punto, se reconsidera el problema en el caso de dos variables. A tal efecto, primero debe presentarse la notación de jacobianos. Suponga que se trabaja en el plano xy y que u y v son variables, cada una a su vez una función de x y y. En otras palabras: u = g1(x, y)

y

v = g2(x, y)

Esas dos ecuaciones definen una transformación T de alguna región del plano xy al plano uv, como se ilustra en la figura 5.5a. Suponga que g1 y g2 tienen derivadas parciales continuas respecto de x y y. El jacobiano de T se denota como JT y está dado por el determinante siguiente:

∂u ∂x JT = ∂v ∂x El ejemplo 5.5.1 ilustra esta idea.

∂u ∂y ∂v ∂y

DISTRIBUCIONES CONJUNTAS

(x, y)

177

(x, y) T

T T –1

(u, v)

(u, v) u = g1(x, y) v = g2(x, y)

T:

T –1:

x = h1(u, v) y = h2(u, v)

a)

b)

FIGURA 5.5 a) T es la transformación del plano xy al plano uv; b) T –1 lo es del plano uv al plano xy.

Ejemplo 5.5.1.

Considere la transformación T del plano xy al plano uv, definida por: u = g1(x, y) = (3y – x)/6 v = g2(x, y) = x/3

El jacobiano de T es:

∂u ∂x JT = ∂v ∂x

∂u ∂y − 1/ 6 = ∂v 1/3 ∂y

1/ 2 = (−1/ 6) (0) − (1/ 2) (1/3) = −(1/ 6) 0

Si la transformación T es uno a uno, entonces es susceptible de inversión. Suponga que la transformación inversa T –1 está definida por las ecuaciones x = h1(u, v)

y

y = h2(u, v)

y que h1 y h2 tienen derivadas parciales continuas (figura 5.5b). El jacobiano de esta transformación inversa está dado por el determinante:

∂x ∂u ∂y ∂u

∂x ∂v ∂y ∂v

Éste es el tipo de jacobiano útil en el contexto estadístico. Suponga que se tienen dos variables aleatorias continuas X y Y, de las que se conoce su densidad conjunta fXY . Sean U y V variables aleatorias, ambas funciones de X y Y. Se pretende determinar la forma de fUV , la densidad conjunta de (U, V ), con base en el conocimiento de la forma de fXY . El método para hacerlo guarda paralelismo con el teorema 4.8.1 y se describe en el teorema 5.5.1.

178

PROBABILIDAD Y ESTADÍSTICA

Teorema 5.5.1. Sea (X, Y ) una variable aleatoria continua con densidad conjunta fXY . Sean: U = g1(X, Y )

y

V = g2(X, Y )

donde g1 y g2 definen una transformación uno a uno. Sea la transformación inversa definida por: X = h1(U, V )

y

Y = h2(U, V )

donde h1 y h2 tienen primeras derivadas parciales continuas. Entonces, la densidad conjunta de (U, V ) está dada por:

fUV (u, v) = f XY ( h1 (u, v), h2 (u, v)) J donde J ≠ 0 es el jacobiano de la transformación inversa. Dicho de otra manera:

∂x J = ∂u ∂y ∂u

∂x ∂v ∂y ∂v

Es fácil apreciar que el teorema 4.8.1 es un caso especial de este teorema, con correspondencia de fX con fXY , g –1( y) como función de transformación inversa y |dg–1( y)/dy| como el equivalente del valor absoluto del jacobiano de la transformación inversa. Ejemplo 5.5.2. Suponga que X y Y son variables aleatorias independientes de distribución uniforme en los intervalos (0, 2) y (0, 3), respectivamente. La densidad conjunta de (X, Y ) está dada por: f XY ( x, y) = 1/ 6

0< x< 2 0< y 0, advierta que 0 < x < 2 y 0 < y < 3, por lo que (X, Y ) se ubica en el rectángulo de la figura 5.6a. Es fácil apreciar que U = X – Y debe situarse entre –3 y 2, y V = X + Y, entre 0 y 5. Por añadidura, U y V deben satisfacer las desigualdades: 0 < ( v + u )/ 2 < 2 0 < ( v − u )/ 2 < 3

o 0< v+u< 4 0< v−u< 6

Resolver simultáneamente estas desigualdades permite obtener la región R que se muestra en la figura 5.6b. Así pues, la densidad de (U, V ) está dada por:

f UV ( u, v) = 1/12

( u, v) ∈ R

Se deja como tarea al lector verificar que fUV es, en realidad, una densidad válida.

180

PROBABILIDAD Y ESTADÍSTICA

Es posible obtener otros teoremas de transformación del teorema 5.5.1. Algunos se incluyen en los ejercicios 48, 50 y 51. Consulte un análisis más detallado del tema en [49].

RESUMEN DEL CAPÍTULO En este capítulo, se consideran variables aleatorias de más de una dimensión. Se hace énfasis en las variables aleatorias de dos dimensiones. La densidad conjunta se define al ampliar en forma lógica el concepto de densidad de una sola variable. Esta función se usa para calcular probabilidades relacionadas con variables aleatorias bidimensionales del tipo (X, Y ). Se estudia la forma de obtener las densidades marginales de X y Y a partir de su densidad conjunta. Esas densidades marginales son las usuales cuando estas dos variables se consideran por sí solas. El coeficiente de correlación ρ se presenta como una medición de linealidad de X con Y. El concepto de independencia entre X y Y se define formalmente, además de describir su relación con ρ. Se estudia cómo definir las densidades condicionales de X dada Y, y de Y dada X, a partir del conocimiento de la densidad conjunta de (X, Y ) y las densidades marginales de X y Y. Las densidades condicionales se usan para determinar las ecuaciones de las curvas de regresión de Y sobre X y de X sobre Y. Éstas son las gráficas del valor medio de Y como función de X, o a la inversa. Se analiza que dichas curvas pueden ser lineales o no serlo. En el capítulo, se mencionan y definen términos importantes, que el lector debe conocer. Son los siguientes: Variable aleatoria discreta bidimensional Variable aleatoria continua bidimensional Densidad discreta conjunta Densidad marginal discreta Variables aleatorias independientes Covarianza Correlación positiva perfecta Ausencia de correlación

Curva de regresión Variable aleatoria discreta de dimensión n Variable aleatoria continua de dimensión n Distribución normal bivariada Densidad continua conjunta Densidad marginal continua Valor esperado de H(X, Y ) Coeficiente de correlación Correlación negativa perfecta Densidad condicional

EJERCICIOS Sección 5.1

1. Use la tabla 5.2 para calcular cada una de las probabilidades siguientes: a) La probabilidad de que los robots produzcan exactamente dos soldaduras defectuosas y un tornillo apretado de manera incorrecta. b) La probabilidad de que produzcan al menos una soldadura defectuosa y un tornillo apretado incorrectamente.

DISTRIBUCIONES CONJUNTAS

181

TABLA 5.5 x/y

0

1

2

3

4

0 1 2 3

0 0 0 0

0 0 0 4/35

0 0 18/35 0

0 12/35 0 0

1/35 0 0 0

c) La probabilidad de que produzcan al menos una soldadura defectuosa. d ) La probabilidad de que atornillen incorrectamente por lo menos dos tornillos. 2. En la realización de un experimento de laboratorio, se usan termómetros en cuatro puntos de unión de la configuración del equipo. Estos cuatro termómetros se seleccionan aleatoriamente de un recipiente que contiene siete. Sin que lo sepa el científico, tres de los siete miden incorrectamente la temperatura. Sea X el número de termómetros defectuosos seleccionados, y Y, el de termómetros no defectuosos elegidos. La densidad conjunta de (X, Y ) se presenta en la tabla 5.5. a) Los valores de la tabla 5.5 pueden obtenerse al tomar en cuenta que la variable aleatoria X es hipergeométrica. Use los resultados de la sección 3.7 para verificar esos valores. b) Calcule las densidades marginales de X y Y. ¿Cuál tipo de variable aleatoria es Y ? c) En forma intuitiva, ¿son independientes X y Y ? Justifique matemáticamente su respuesta. 3. La densidad conjunta de (X, Y ) está dada por: fXY ( x, y) = 1/n2

x = 1, 2, 3, . . . , n y = 1, 2, 3, . . . , n

a) Verifique que fXY ( x, y) satisface las condiciones necesarias para ser una densidad. b) Calcule las densidades marginales de X y Y. c) ¿Son independientes X y Y ? 4. La densidad conjunta de (X, Y ) está dada por: fXY ( x, y) = 2/n(n + 1)

1≤y≤x≤n

donde n es un entero positivo

a) Verifique que fXY ( x, y) satisface las condiciones necesarias para ser una densidad. Sugerencia: La suma de los primeros n enteros está dada por n(n + 1)/2. b) Calcule las densidades marginales de X y Y. Sugerencia: Trace una imagen de la región sobre la cual se define (X, Y ). c) ¿Son independientes X y Y ? d ) Suponga que n = 5. Use la densidad conjunta para calcular P[X ≤ 3 ∧ Y ≤ 2]. También calcule P[X ≤ 3] y P[Y ≤ 2)]. Sugerencia: Esboce la región sobre la cual se define (X, Y ). 5. Los dos tipos más comunes de errores de los programadores son los de sintaxis y lógica. En el caso de un lenguaje sencillo, como BASIC, suele ser bajo el número de dichos errores. Sea X el número de errores sintácticos, y Y, el de errores lógicos, en la primera ejecución de un programa escrito en dicho lenguaje. Suponga que la densidad conjunta de (X, Y ) es la que se indica en la tabla 5.6.

182

PROBABILIDAD Y ESTADÍSTICA

TABLA 5.6 x/y

0

1

2

3

0 1 2 3 4 5

0.400 0.300 0.040 0.009 0.008 0.005

0.100 0.040 0.010 0.008 0.007 0.002

0.020 0.010 0.009 0.007 0.005 0.002

0.005 0.004 0.003 0.003 0.002 0.001

a) Calcule la probabilidad de que un programa seleccionado aleatoriamente no contenga alguno de estos dos tipos de errores. b) Calcule la probabilidad de que un programa seleccionado aleatoriamente contenga por lo menos un error sintáctico y a lo más un error lógico. c) Calcule las densidades marginales de X y Y. d ) Calcule la probabilidad de que un programa seleccionado aleatoriamente incluya por lo menos dos errores sintácticos. e) Calcule la probabilidad de que un programa seleccionado aleatoriamente contenga uno o dos errores lógicos. f ) ¿Son independientes X y Y ? 6. Considere el ejemplo 5.1.5. Verifique que P[X ≤ 30 ∧ Y ≤ 28] ! 0.15 mediante la integración de la densidad conjunta, primero respecto a y y luego respecto a x. 7. a) Use la densidad conjunta del ejemplo 5.1.5 para calcular la probabilidad de que la presión interna y externa sobre el techo sea mayor de 30 y menor de 32, respectivamente. b) Use la densidad marginal de X para calcular P[X ≤ 28]. c) Use la densidad marginal de Y para calcular P[Y > 30]. 8. Sea X la temperatura (en °C), y Y, el tiempo en minutos requeridos, para que el motor a diesel de un automóvil esté listo para ponerlo en movimiento. Suponga que la densidad conjunta de (X, Y ) está dada por: f XY ( x, y ) = c( 4 x + 2 y + 1)

0 ≤ x ≤ 40 0≤ y≤2

a) Calcule el valor de c que la convierte en densidad. b) Calcule la probabilidad de que en un día seleccionado aleatoriamente la temperatura atmosférica sea mayor de 20°C y se requiera por lo menos 1 min para poner en movimiento el automóvil. c) Calcule las densidades marginales de X y Y. d ) Calcule la probabilidad de que en un día seleccionado aleatoriamente se requiera al menos 1 min antes de que el automóvil esté listo para ponerlo en movimiento. e) Calcule la probabilidad de que en un día seleccionado aleatoriamente la temperatura atmosférica sea mayor de 20°C. f ) ¿Son independientes X y Y ? Explique su respuesta sobre bases matemáticas. 9. Un ingeniero estudia el tránsito vehicular a hora temprana de la mañana en una intersección dada. El periodo de observación se inicia a las 5:30 a.m. Sea X el momento de llegada del

DISTRIBUCIONES CONJUNTAS

183

primer vehículo en la dirección de norte a sur, y Y, la del primer automóvil en la dirección de este a oeste. El tiempo se mide en fracciones de hora después de las 5:30 a.m. Suponga que la densidad de (X, Y ) está dada por: fXY (x, y) = 1/x

0 2 se pueden definir y estudiar mediante la ampliación lógica de las definiciones presentadas en el caso bidimensional. Por ejemplo, la variable (X1, X2, X3, . . . , Xn), en la que cada una de las variables X1, X2, X3, . . . , Xn es una variable aleatoria discreta, se llama variable aleatoria discreta de n-dimensional. La densidad de esa variable está dada por: f (x1, x2, x3, . . . , xn) = P[X1 = x1, X2 = x2, X3 = x3, . . . , Xn = xn] Este problema implica el uso de una variable aleatoria tridimensional.

184

PROBABILIDAD Y ESTADÍSTICA

Los artículos producidos en una línea de montaje se clasifican como no defectuosos, defectuosos pero salvables, o defectuosos y no salvables. Las probabilidades de observar productos en cada una de estas categorías son 0.9, 0.08 y 0.02, respectivamente. Esas probabilidades no cambian de un intento a otro. Se seleccionan y clasifican aleatoriamente 20 artículos. Sean X1, X2 y X3 el número de productos obtenidos en cada una de las categorías, en el mismo orden. a) Calcule P[X1 = 15, X2 = 3, X3 = 2]. Sugerencia: Use la fórmula del número de permutaciones de objetos que se diferencian, de la página 16 del capítulo 1, para contar el número de formas de obtener este tipo de división en una secuencia de 20 intentos. b) Encuentre la fórmula general de la densidad de (X1, X2, X3). 13. (Variables aleatorias continuas de dimensión n.) La variable (X1, X2, X3, . . . , Xn), donde cada una de las variables aleatorias X1, X2, X3, . . . , Xn es continua, se llama variable aleatoria continua de n-dimensional. La densidad de este tipo de variable se define al ampliar de manera natural la definición 5.1.3. Señale las tres propiedades que identifican a una función como densidad de (X1, X2, X3, . . . , Xn). 14. Sea f (x1, x2, x3) = c(x1 · x2 · x3) para 0 ≤ x1 ≤ 1, 0 ≤ x2 ≤ 1, 0 ≤ x3 ≤ 1. Calcule el valor de c que hace de ésta en la densidad de la variable aleatoria tridimensional (X1, X2, X3). Sección 5.2

15. Se seleccionan aleatoriamente cuatro termómetros de un recipiente que contiene tres defectuosos y cuatro que funcionan correctamente. Sea X el número de medidores defectuosos seleccionado, y Y, el de medidores no defectuosos elegido (véase ejercicio 2). La densidad conjunta de (X, Y ) aparece en la tabla 5.5. a) Con base en la descripción del problema, ¿debe ser negativa o positiva Cov (X, Y )? b) Calcule E[X ], E[Y ], E[XY ] y Cov (X, Y ). 16. Sea X el número de errores sintácticos, y Y, el de errores lógicos, en la primera ejecución de un programa escrito en BASIC (véase el ejercicio 5). La densidad conjunta de (X, Y ) se presenta en la tabla 5.6. a) X y Y no son independientes. ¿Acaso ello brinda indicios sobre el valor de la covarianza? b) Calcule E[X ], E[Y ], E[XY ] y Cov (X, Y ). Brinde una interpretación física aproximada de la covarianza. c) Calcule E[X + Y ]. ¿Cuál es la interpretación práctica de esta esperanza? 17. Considere la variable aleatoria (X, Y ) del ejercicio 3. Sin realizar cálculos adicionales, determine Cov (X, Y ). 18. Use las densidades marginales que aparecen en la tabla 5.3 para calcular E[X ] y E[Y ]. Compare sus resultados con los obtenidos en el ejemplo 5.2.1. 19. La densidad conjunta de (X, Y ), donde X y Y son las presiones barométricas interna y externa, respectivamente, sobre un plafón de soporte de aire (véase ejemplo 5.1.5), están dadas por: fXY (x, y) = c/x

27 ≤ y ≤ x ≤ 33 c = 1/(6 – 27 ln 33/27)

1.72

a) Calcule E[X ], E[Y ], E[XY ] y Cov (X, Y ). b) Calcule E[X – Y ]. ¿Cuál es la interpretación física práctica de esta esperanza?

DISTRIBUCIONES CONJUNTAS

185

20. La densidad conjunta de (X, Y ), donde X es la temperatura y Y es el tiempo que requiere el motor a diesel de un automóvil antes de estar listo para ponerlo en movimiento (véase ejercicio 8), está dada por: fXY ( x, y) = (1/6 640)(4x + 2y + 1)

0 ≤ x ≤ 40 0≤y≤2

a) Desde el punto de vista físico, ¿piensa que Cov (X, Y ) debe ser positiva o negativa? b) Calcule E[X ], E[Y ], E[XY ] y Cov (X, Y ). 21. La densidad conjunta de (X, Y ), donde X y Y son los momentos de llegada del primer vehículo desde las direcciones norte a sur y este a oeste en una intersección (vea el ejercicio 9), respectivamente, está dada por: fXY(x, y) = 1/x

00

¿Cuál es la distribución de X ? ¿Cuál es el valor de E[X ]? Encuentre el estimador de θ mediante el método de momentos. Encuentre el estimador de máxima verosimilitud de θ, con base en una muestra aleatoria de tamaño n. ¿Difiere del que calculó en el inciso c?

ESTIMACIÓN

257

e) Estime θ con base en los datos siguientes: 3 1

5 4

2 3

3 3

4 3

f ) ¿Son los estimadores calculados en los incisos c y d estimadores insesgados de θ ? 60. Sea X una variable de distribución normal con media 2 y varianza 25. a) ¿Cuál es la distribución de la variable aleatoria (X − 2)/5? b) ¿Cuál es la distribución de la variable aleatoria [(X − 2)/5]2? c) Sea X1, X2, X3, . . . , X10 una muestra aleatoria de la distribución de X. ¿Cuál es la distribución de la variable aleatoria siguiente? 10

∑ i =1

 X i − 2  5 

2

61. (Teorema del límite central.) En este problema, use el teorema del límite central para justificar la aproximación normal de la distribución de Poisson, antes estudiada. En otras palabras, compruebe que una variable aleatoria X de Poisson, con parámetro λs, puede aproximarse con una variable aleatoria normal que tiene media y varianza λ s. A tal efecto, sea Y1, Y2, Y3, . . . , Yn una muestra aleatoria de tamaño n, de una distribución de Poisson con parámetro λs/n. a) Use técnicas de la función generadora de momentos para demostrar que: n

X = ∑ Yi i =1

tiene distribución de Poisson con parámetro λ s. b) Aplique el teorema del límite central para calcular la distribución aproximada de Y. c) Note que nY = X . Use esta observación para argumentar que X tiene distribución aproximadamente normal, con media y varianza λ s. 62. (Teorema del límite central.) Considere un experimento de un solo lanzamiento de un dado. Sea X el número que queda hacia arriba. En teoría, X tiene distribución uniforme discreta. a) Calcule la varianza, la media y la densidad teóricas de X. b) A continuación, considere un experimento en que lanza 20 veces el dado y promedia los resultados. Según el teorema del límite central, ¿cuál es la media y varianza teóricas de la variable aleatoria X ? c) Realice 25 veces el experimento del inciso b y registre el valor de X en cada una. (Lanzará el dado 500 veces y obtendrá un conjunto de datos consistente en 25 promedios.) ¿Cuál es la forma del diagrama de tallo y hoja de los datos? Explique su respuesta. Prepare tal diagrama respecto de los datos. ¿Tiene la forma que esperaba? d ) ¿Cuál valor aproximado esperaría obtener si promediara los datos del inciso c? Promedie las 25 observaciones de X . ¿Obtuvo los resultados que esperaba? e) ¿Qué valor aproximado esperaría obtener si calculara la varianza muestral de los datos del inciso c? Explique su respuesta. Calcule s2 en relación con las 25 observaciones de X . ¿Obtuvo el resultado que esperaba? f ) Si tuviera que calcular el intervalo de confianza de 95% para µ con base en cada uno de los valores de X determinados en el inciso c, ¿aproximadamente cuántos de ellos esperaría que contengan el valor verdadero de µ? A partir de sus datos, ¿puede encontrar ejemplos de un intervalo de confianza que sí contenga µ y otro que no los contenga?

258

PROBABILIDAD Y ESTADÍSTICA

63. Considere el ejemplo 6.2.1. Suponga que X tiene distribución exponencial, con parámetro β. a) Encuentre la estimación de β usando el método de momentos. b) Calcule la estimación de máxima verosimilitud de β. c) ¿Son iguales sus respuestas a los incisos a y b? d ) Use el valor estimado de β para aproximar la probabilidad de que una pila de este tipo dure por lo menos 1 000 h. 64. Suponga que un dado se lanza al aire 30 veces. Sea X el número que queda hacia arriba en cada lanzamiento. Suponga que x tiene el valor 2.83 en relación con los 30 lanzamientos. a) Encuentre un intervalo de confianza de 95% para valor medio de X. ¿Incluye la media verdadera 3.5? b) Si elabora un intervalo de confianza de 90% para µ, ¿tendrá oportunidad de incluir a µ? Explique su respuesta con base en los resultados del inciso a. c) Si construye un intervalo de confianza de 99% de µ, ¿tendrá oportunidad de incluir la media verdadera? Explique su respuesta. d ) Construya un intervalo de confianza de 99% para µ. ¿Quedó incluida la media en el intervalo?

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

259

CAPÍTULO

8

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

U

no de los “milagros” de los tiempos modernos es el ascenso industrial japonés después de la Segunda Guerra Mundial. Gran parte de ese éxito se atribuye al trabajo del estadístico estadounidense W. Edwards Deming. No sólo ayudó a que los japoneses pusieran en práctica los métodos del control estadístico de procesos, sino que también desarrolló y enseñó su propio sistema de administración de la calidad total (TQM). Se trata de un sistema administrativo basado en los 14 puntos de Deming. Uno de sus objetivos es reducir la variabilidad, es decir, en relación con un proceso, tener el objetivo de producir bienes que no sólo satisfagan un valor promedio establecido, sino que también lo hagan con constancia. A fin de lograrlo, debe disminuirse la variación aleatoria en cada etapa del proceso de producción, desde la adquisición de materias primas hasta el marketing y servicio del producto terminado. Por tal razón, interesan tanto la media (valor que se tiene como meta) como la varianza de la variable aleatoria que se corresponda. En este capítulo, se analizan ciertas técnicas estadísticas útiles para obtener conclusiones acerca de estos parámetros poblacionales con base en información obtenida de muestras. En capítulos previos de la obra, se estudia la forma de estimar la media y la varianza de una distribución a través de la estimación puntual. También se analiza la manera de generar un intervalo de confianza de la media de una distribución normal cuando se supone que es conocida su varianza. Desgraciadamente, en muchos estudios estadísticos es poco realista el supuesto de que se conoce σ 2. Cuando es necesario estimar la media de una distribución, es usual que también se desconozca la varianza. En este capítulo, la atención se centra en el problema de elaborar inferencias acerca de 259

260

PROBABILIDAD Y ESTADÍSTICA

la media y la varianza de una distribución cuando se suponen desconocidos ambos parámetros. Se parte de considerar la elaboración de un intervalo de confianza de σ 2.

8.1 ESTIMACIÓN DE INTERVALO DE LA VARIABILIDAD En el teorema 7.1.3, se demuestra que la estadística S 2 es un estimador insesgado de σ 2. A fin de calcular el intervalo de confianza de 100(1 – α )% de σ 2, se necesita una variable aleatoria cuya expresión incluya a σ 2 y de la cual se conozca su distribución de probabilidad. En el ejercicio 45 del capítulo 7, se n 2 2 comprueba que la variable aleatoria Σi = 1( X1 – µ ) /σ tiene distribución ji cuadrada con n grados de libertad. El teorema siguiente muestra que si se sustituye la media poblacional µ con la media muestral X , la variable aleatoria resultante Σin= 1( X1 – X )2/σ 2 tiene distribución ji cuadrada, con n – 1 grados de libertad. Este teorema permite contar con la variable aleatoria necesaria para preparar el intervalo de confianza de σ 2. Su demostración se presenta en el apéndice C. Teorema 8.1.1 [distribución de (n – 1)S 2/σ 2]. Sea X1, X2, X3, . . . , Xn una muestra aleatoria de una distribución normal con media µ y varianza σ 2. La variable aleatoria: n

(n – 1) S 2/σ 2 = ∑ ( X i – X ) 2/σ 2 i =1

tiene distribución ji cuadrada con n – 1 grados de libertad.

El uso de la variable aleatoria (n – 1)S 2/σ 2 para obtener un intervalo de confianza de 100 (1 – α )% para σ 2 requiere dividir primero la curva X 2n – 1 , como se muestra en la figura 8.1. Recuerde que en la convención de notación el subíndice relacionado con un punto denota el área a la derecha del punto mismo. En caso de dividir la curva ji cuadrada de manera que (1 – α)% del área esté en el centro de la curva, entonces el parámetro faltante α se divide por la mitad. Así pues, el punto ji cuadrada del lado derecho tiene α/2% del área a su derecha y se denota como χα2 /2. La distribución ji cuadrada no puede ser negativa, de modo que el punto ji cuadrada del lado izquierdo no es el negativo del punto del lado derecho, como ocurre en el intervalo de confianza tipo Z de la media, desarrollado en la sección 7.4. En lugar de ello, se trata simplemente de un punto con un área α/2 a su izquierda y área 1 – α/2 a su derecha, que se denota con χ12– α /2. A efecto de obtener el intervalo de confianza, se inicia con una afirmación de probabilidad basada en la figura 8.1 que puede ajustarse para que sea igual a 1 – α. Es evidente que: P[ χ12– α /2 ≤ ( n – 1)S 2/σ 2 ≤ χα2 / 2 ] = 1 – α La determinación de los límites inferior y superior del intervalo de confianza requiere despejar a σ 2 en el centro de la desigualdad, al invertir cada término y despejar σ 2:

[

]

P 1/χα2 /2 ≤ σ 2 / ( n – 1) S 2 ≤ 1/χ12– α / 2 = 1 – α o   ( n – 1) S 2 ( n – 1) S 2  2 P ≤ ≤ =1– α σ  χα2 /2 χ12– α /2 

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

X2n – 1

=

261

(n–1)S2 #2

1–! !/2 0

"

!/2 2

"2

"2

FIGURA 8.1 Partición de la curva X2n – 1 necesaria para obtener un intervalo de confianza 100(1 – α)% para σ 2.

Los límites de confianza buscados, que pueden leerse en la última desigualdad, están dados en el teorema 8.1.2. Teorema 8.1.2 [intervalo de confianza 100(1 – α)% para σ 2]. Sea X1, X2, X3, . . . , Xn una muestra aleatoria de tamaño n de una distribución normal con media µ y varianza σ 2. Los límites inferior y superior de un intervalo de confianza 100(1 – α)% de σ 2, L1 y L2, respectivamente, están dados por: L1 = ( n – 1) S 2/χ α2 /2

y

L2 = ( n – 1) S 2/χ 12– α /2

Como cabría esperar, para obtener los límites de un intervalo de confianza 100(1 – α)% de la desviación estándar de una variable aleatoria normal, se toma la raíz cuadrada no negativa de los límites dados en el teorema 8.1.2. Ejemplo 8.1.1. En computación, “carga de trabajo” se define como un conjunto de solicitudes de recursos de entrada-salida (E/S) durante un periodo dado. La carga de trabajo se compara con la medición llamada contenido relativo de E/S. La instalación MVS de lote comercial promedio es la base de esta medición y se le asigna un contenido relativo de E/S de 1. Otras instalaciones se califican en relación con dicha base. Se tienen las observaciones siguientes del contenido relativo de E/S en un despacho de consultoría grande, en periodos de una hora seleccionados aleatoriamente: 3.4 3.0 1.4 3.5 4.2

3.6 3.1 2.0 2.5 1.5

4.0 4.1 3.1 1.7 3.0

0.4 1.4 1.8 5.1 3.9

2.0 2.5 1.6 0.7 3.0

Interesa construir un intervalo de confianza de 95% de la desviación estándar del contenido relativo de E/S de esta instalación. El diagrama de tallo y hoja de los datos se muestra en la figura 8.2. Dicho diagrama no indica una desviación considerable respecto de la normalidad. La partición de la curva X224 necesaria para preparar el intervalo de confianza aparece en la figura 8.3. Los valores de s y s2 obtenidos mediante una calculadora estadística son s = 1.186381052 y s2 = 1.4075. Se informa sobre la varianza muestral con dos sitios decimales más que los datos, por lo que s2 = 1.408. La información sobre el estándar muestral se presenta con un sitio decimal más que los datos, de modo que s = 1.19.

262

PROBABILIDAD Y ESTADÍSTICA

0 1 2 3 4 5

47 457486 0505 405611090 201 1

FIGURA 8.2 Diagrama de tallo y hoja del contenido relativo de E/S del despacho de consultoría mencionado en el ejemplo 8.1.1. 0.10 0.09 0.08 0.07

f(" 2 )

0.06 0.05 $224

0.04 0.03 0.02 0.95

0.01 0.00

0.025

"2

0.975

0.025

= 12.4

"2

0.025

"2

= 39.4

FIGURA 8.3 Partición de la curva X224 necesaria para construir un intervalo de confianza de 95% de la varianza en el contenido relativo de E/S correspondiente al despacho de consultoría del ejemplo 8.1.1.

Los límites de un intervalo de confianza de 95% para σ 2 son: L1 = ( n – 1) s 2/ χ 02.025 = 24(1.408)/ 39.4 = 0.858 L2 = ( n – 1) s 2/ χ 02.975 = 24(1.408)/ 12.4 = 2.725

Los límites de un intervalo de confianza de 95% para σ son:

L1 = 0.858 =˙ 0.926 L2 = 2.725 =˙ 1.65 De tal suerte, puede afirmarse que se tiene confianza de 95% de que la varianza verdadera del contenido relativo de E/S en este despacho de consultoría se ubica entre 0.858 y 2.725, y la desviación estándar verdadera, entre 0.926 y 1.65.

8.2 ESTIMACIÓN DE LA MEDIA Y LA DISTRIBUCIÓN T DE STUDENT Note que la obtención de una estimación puntual de una media poblacional µ no requiere conocer la varianza poblacional; la media muestral X constituye un estimador insesgado de µ, sin importar el

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

263

valor de σ 2. Sin embargo, los límites de un intervalo de confianza de 100(1 – α)% de µ dados en la sección 7.4 son X ± zα /2 σ / n . Se supone que, si bien se desconoce la media poblacional, sí se sabe cuál es la varianza poblacional. En términos prácticos, tal supuesto es poco realista. En muchos casos, la realización de un estudio estadístico tiene lugar por primera vez, de modo que no existe forma de saber, antes del estudio, cuál es la media o la varianza de la población que interesa. En esta sección, se considera el problema más realista de preparar un intervalo de confianza de una media poblacional cuando se supone que es desconocida la varianza de la población. En la obtención de una fórmula general para un intervalo de confianza de 100(1 – α)% para µ bajo tales circunstancias, es natural partir de la consideración de la variable aleatoria usada con antelación, a saber:

X –µ

σ/ n Son dos los problemas que deben superarse: 1. Se desconoce y se debe estimar el valor de σ. 2. Tampoco se conoce la distribución de la variable aleatoria obtenida al sustituir σ con un estimador. El primer problema es de fácil solución. Se usa la desviación estándar muestral S como estimador de σ. La solución del segundo problema es un poco más difícil. El resultado de sustituir σ con su estimador S es la variable aleatoria ( X – µ )/( S / n ). Se puede demostrar que la distribución de esta variable no es normal estándar. En vez de ello, cuando el muestreo se realiza en una distribución normal, corresponde a la que se llama distribución t de Student o simplemente distribución T. La descripción original de esta distribución, de W. S. Gosset, se remonta a 1908. Utilizó el seudónimo “Student” porque la empresa donde trabajaba, una cervecería irlandesa, quería evitar que sus competidoras supieran que aplicaba métodos estadísticos en el trabajo. Se hará una pausa breve para considerar esta distribución.

La distribución T Definición 8.2.1 (distribución T ). Sean Z una variable aleatoria normal estándar y X 2γ una variable aleatoria ji cuadrada independiente con γ grados de libertad. Se dice que la variable aleatoria: T=

Z X 2γ /γ

tiene distribución T con γ grados de libertad. Esta definición implica que demostrar que una variable aleatoria tiene distribución T requiere comprobar que puede escribirse como una proporción de una variable aleatoria normal estándar sobre la raíz cuadrada de una variable aleatoria ji cuadrada independiente dividida entre sus grados de libertad.

264

PROBABILIDAD Y ESTADÍSTICA

A continuación, se señalan las características de la distribución T, útiles en el análisis subsiguiente: Propiedades de la distribución T 1. Existe un número infinito de distribuciones T, cada una identificada por su propio parámetro γ, al que se llama grados de libertad y que siempre es un entero positivo. La expresión Tγ denota una variable aleatoria T con γ grados de libertad. 2. Cada variable aleatoria T es continua. La densidad de una variable T con γ grados de libertad está dada por:

f (t ) =

Γ(γ + 1)/ 2 Γ(γ /2) πγ

 t 2  −(γ + 1)/ 2 1 +   γ

−∞< t < ∞

3. La gráfica de la densidad de una variable aleatoria Tγ es una curva simétrica en forma de campana, centrada en 0. 4. El parámetro γ es un parámetro de forma, en el sentido de que la varianza de la variable aleatoria Tγ disminuye conforme el valor de dicho parámetro aumenta. Así pues, la curva de forma de campana de Tγ se vuelve más compacta a medida que se incrementa el valor de γ. 5. La curva en forma de campana de la variable aleatoria Tγ se aproxima a la curva normal estándar conforme aumenta el número de sus grados de libertad. Las características precedentes se ilustran en la figura 8.4. La tabla VI del apéndice A resume parcialmente la distribución acumulativa para valores selectos de γ. Se lee de igual manera que la tabla de ji cuadrada. En otras palabras, los grados de libertad aparecen como rótulos de filas; las probabilidades pertinentes, como encabezados de columnas y los puntos relacionados con esas probabilidades, en las intersecciones de filas y columnas del cuerpo de la tabla. Se usa la convención previa de denotar con tr el punto relacionado con la curva Tγ tal que el área a la derecha del punto es r. Ejemplo 8.2.1.

Considere la variable aleatoria T10.

1.

De conformidad con la tabla VI del apéndice A, P[T10 ≤ 1.372] = F(1.372) = 0.90. Según nuestra convención de notación, t0.10 = 1.372 [véase figura 8.5a].

2.

En virtud de la asimetría de la curva T, t0.90 = − t0.10 = −1.372.

3.

El punto t tal que P[− t ≤ T10 ≤ t] = 0.95 es t0.025 = 2.228 [véase figura 8.5b].

La última fila de la tabla VI del apéndice A tiene el rótulo ∞. Los puntos enumerados en esa fila son en realidad puntos relacionados con la curva normal estándar. Note que los valores de cada columna de la tabla se acercan al enumerado en la última fila, conforme aumenta γ. Ello ocurre porque con valores altos de γ la gráfica de la densidad de la variable aleatoria Tγ coincide, para todos los fines prácticos, con la de la curva normal estándar o curva Z. Existen ciertas diferencias entre las dos curvas con valores bajos de γ.

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

265

T%2

T%1 t

0 a)

T%

Z t

0 b)

0.5

0.5

0.4

0.4

0.3

f(t)

f(t)

FIGURA 8.4 a) Relación característica entre dos curvas T con γ1 > γ2; b) relación típica entre una curva T y la curva normal estándar.

T10 0.2 0.1 0.0

0.90

0.3

0.1 0.10

t

0 t0.10 = 1.372

T10

0.2 0.95 0.025

0.025

0.0

t –2.228

0

t0.025 = 2.228

FIGURA 8.5

a ) P[T10 ≤ 1.372] = 0.90; b) P[–2.228 ≤ T10 ≤ 2.228] = 0.95.

A continuación, se demuestra que la variable aleatoria ( X – µ )/(S / n ) tiene distribución T, como se afirmó. La demostración de este teorema depende de un resultado cuyo análisis matemático está más allá del alcance de esta sección. En particular, puede demostrarse que cuando el muestreo se efectúa en una distribución normal, la media muestral X y la desviación estándar muestral S son independientes. Ese resultado no es sorprendente. Simplemente afirma que el conocimiento del cen-

266

PROBABILIDAD Y ESTADÍSTICA

tro de localización de una variable aleatoria normal no contribuye al de su variabilidad. El teorema siguiente constituye la base de la construcción de un intervalo de confianza de 100(1 – α)% de µ cuando se supone que σ 2 es desconocida. Teorema 8.2.1. Sea X1, X2, X3, . . . , Xn una muestra aleatoria de una distribución normal con media µ y varianza σ 2. La variable aleatoria:

X –µ S/ n tiene distribución T con n − 1 grados de libertad. Demostración. A continuación, se demuestra que la variable aleatoria ( X – µ) /( S / n ) puede escribirse como una proporción de la variable aleatoria normal estándar sobre la raíz cuadrada de una variable aleatoria ji cuadrada independiente dividida entre sus grados de libertad. De conformidad con el teorema 7.3.4, X es normal, con media µ y varianza σ 2/n. Luego de estandarizar, ( X – µ)/(σ / n ) es una variable normal estándar. Según el teorema 8.1.1, (n − 1)S 2/σ 2 es una variable aleatoria ji cuadrada con n − 1 grados de libertad. Considere la variable aleatoria: Z X2γ / γ

=

( X – µ)/(σ / n ) (n – 1) S 2/σ 2 (n – 1)

=

X –µ S/ n

Puesto que X y S son independientes, esa variable aleatoria tiene distribución T con n – 1 grados de libertad, como se afirmó.

Intervalo de confianza para la media: varianza estimada Ahora, es fácil determinar la forma general de un intervalo de confianza 100(1 – α)% para µ cuando se desconoce σ 2. Basta tomar nota de que las variables aleatorias:

Z=

X –µ

σ/ n

y Tγ =

X –µ S/ n

tienen la misma estructura algebraica. Así pues, el argumento algebraico dado en la sección 7.4 es válido cuando se sustituye σ con S y zα/2 con tα/2. Esas sustituciones llevan al teorema 8.2.2. Teorema 8.2.2 [intervalo de confianza de 100(1 – α)% para µ cuando se desconoce σ 2]. Sea X1, X2, X3, . . . , Xn una muestra aleatoria de una distribución normal con media µ y varianza σ 2. Un intervalo de confianza de 100(1 – α)% para µ está dado por: X ± tα / 2 S / n

El uso de este teorema se ilustra en el ejemplo 8.2.2.

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

267

0.5

0.4

f(t)

0.3 T23 0.2

0.1

0.95 0.025

0.0

0.025

–2.069

0

t

t 0.025 = 2.069

FIGURA 8.6 Partición de la curva T23 necesaria para construir un intervalo de confianza de 95% de la concentración media de dióxido de azufre en un bosque bávaro.

Ejemplo 8.2.2. El dióxido de azufre y el óxido de nitrógeno son productos secundarios del consumo de combustibles fósiles. Se trata de sustancias que pueden viajar largas distancias y convertirse en ácidos antes de depositarse en la forma de “lluvia ácida”. Los datos siguientes se obtuvieron respecto de la concentración de dióxido de azufre (en microgramos por metro cúbico) en un bosque bávaro supuestamente dañado por la lluvia ácida: 52.7 62.2 45.3 52.4

43.9 56.5 63.4 38.6

41.7 33.4 53.9 46.1

71.5 61.8 65.5 44.4

47.6 54.3 66.6 60.7

55.1 50.0 70.0 56.4

Una calculadora estadística proporciona los valores siguientes: x = 53.91666667

s = 10.07371382

s 2 = 101.4797102

Nuestros lineamientos de redondeo permiten obtener:

x

53.92 µg/m 3

s

10.07 µg/m 3

s2

101.480

La partición de la curva T23 necesaria para encontrar un intervalo de confianza de 95% de la media de concentración de dióxido de azufre en ese bosque se muestra en la figura 8.6. Los límites de confianza del intervalo son: x ± tα /2 s / n = 53.92 ± 2.069(10.07)/ 24 En otras palabras, se tiene confianza de 95% de que la concentración media de dióxido de azufre en el bosque referido se ubica en el intervalo [49.67, 58.17]. La concentración promedio de este compuesto en áreas no dañadas del mismo país es de 20 µg/m3. Puesto que se trata de un valor no incluido en el intervalo, existen valores altos de dióxido de azufre en el bosque dañado.

268

PROBABILIDAD Y ESTADÍSTICA

Son varios los aspectos que deben resaltarse. Primero, que el número de grados de libertad necesario para encontrar un intervalo de confianza de µ cuando se desconoce σ 2 es n − 1, es decir, el tamaño de la muestra menos uno. En el caso de muestras grandes, dicho valor no se incluye en la tabla VI del apéndice A. De ser así, la última fila de la tabla (∞) se usa para encontrar puntos de interés. De tal suerte, en relación con muestras grandes se estima un punto t, que interesa, mediante un punto z. Como se mencionó, ello resulta apropiado porque las curvas Z y T son virtualmente idénticas en el caso de muestras grandes. Segundo, que una vez más se usa el supuesto de normalidad. Es posible verificar gráficamente su validez con un diagrama de tallo y hoja o un histograma. También se cuenta con métodos más precisos para comprobar la normalidad. Si existen razones para suponer que la variable de estudio no tiene distribución normal y la muestra es pequeña, podrían ser inapropiados los métodos basados en la distribución T. En vez de ellos, debería usarse alguna técnica no paramétrica. Algunas técnicas de este tipo se analizan en la sección 8.7.

8.3 PRUEBAS DE HIPÓTESIS Se consideraron las ideas básicas de la estimación con ciertos detalles. Recuerde que un problema de estimación característico incluye un parámetro poblacional, θ, cuyo valor se aproxima con base en una muestra. Es usual que no se tenga una noción preconcebida del valor real de este parámetro. Se intenta simplemente indagar su valor hasta donde sea posible. En contraste, cuando se pone a prueba una hipótesis de θ sí se tiene una idea preconcebida de su valor. Ello implica que en realidad participan dos teorías o hipótesis en todo estudio estadístico de este tipo: la hipótesis que propone el experimentador y la negación de esa hipótesis. La primera, que se denota con H1, se llama hipótesis de investigación o hipótesis alternativa, y la segunda, denotada con H0, se denomina hipótesis nula. El propósito del experimento es decidir si se tienen datos que tiendan a refutar la hipótesis nula. Los tres lineamientos siguientes ayudan a decidir la forma de expresar H0 y H1: Lineamientos para realizar una prueba de hipótesis 1. Cuando se pone a prueba una hipótesis acerca del valor de un parámetro θ, la declaración de igualdad siempre se incluye en H0. De tal manera, H0 indica un valor numérico específico, que podría ser el valor real de θ. Ese valor específico se llama valor nulo y se denota con θ0. 2. Lo que se detecte o sustente es la hipótesis alternativa. 3. La hipótesis de investigación es H1, de modo que se espera que los datos lleven a rechazar H0 y, en consecuencia, aceptar H1. Un ejemplo ayuda a aclarar estas ideas. Ejemplo 8.3.1. Los ingenieros han observado que son muchos los factores con efecto en el funcionamiento de las señales reflejantes en autopistas. Uno de ellos es la alineación correcta de los faros de los automóviles. Se piensa que más de 50% de los automóviles en circulación tiene faros mal alineados. Si esta afirmación puede sustentarse estadísticamente, se pondrá en marcha un programa de inspección más estricto. Sea p la proporción de automóviles en circulación que tiene faros mal alineados. Puesto que se pretende sustentar la afirmación de que p > 0.5, ésta se considera como la hipótesis de investigación o

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

269

alternativa, H1. La hipótesis nula es automáticamente la negación de H1, a saber, que p ≤ 0.5. Así pues, las dos hipótesis son: H0: p ≤ 0.5 H1: p > 0.5 Note que la declaración de igualdad aparece en la hipótesis nula. Ello pone de relieve el valor 0.5 como posible valor de p; en otras palabras, el “valor nulo” de p es p0 = 0.5. Advierta también que el rechazo de H0 lleva a la aceptación de la hipótesis de investigación y la puesta en práctica de un nuevo programa de inspección.

Una vez que se selecciona una muestra y se recopilan los datos, debe tomarse una decisión. La decisión será rechazar H0 o no rechazarla. Una forma de hacerlo es tomar una muestra aleatoria de alguna estadística cuya distribución de probabilidad se conoce, bajo el supuesto de que el valor nulo es el valor verdadero de θ. Tal dato se llama estadística de prueba. Si ésta asume un valor que pocas veces ocurre cuando θ = θ0 y tiende a hacer creíble la hipótesis alternativa, entonces se rechaza H0, a favor de H1; la hipótesis nula no se rechaza cuando el valor observado es común bajo el supuesto de que θ = θ0. Ello significa que, a final de cuentas, cualquier estudio se ve forzado exactamente a una de las situaciones siguientes: Posibles resultados finales de cualquier prueba de hipótesis 1. Se rechaza H0 cuando es verdadera y se comete lo que se conoce como error tipo I. 2. Se toma la decisión correcta de rechazar H0 cuando es verdadera la hipótesis alternativa, H1. 3. No se rechaza H0 cuando es verdadera la hipótesis alternativa, H1. En este caso, se comete lo que se llama error tipo II. 4. Se toma la decisión correcta de no rechazar H0 cuando es verdadera. Ejemplo 8.3.2. En el ejemplo 8.3.1, se puso a prueba: H0: p ≤ 0.5 H1: p > 0.5

(la mayor parte de los automóviles de circulación tiene faros mal alineados)

Si se comete un error tipo I, se rechaza H0 cuando es verdadera. En términos prácticos, se llega a la conclusión de que la mayor parte de los automóviles en circulación tiene faros mal alineados, cuando en verdad no es así. Este error llevaría a la realización de un programa de inspección que es innecesario. Se comete un error tipo II si no se rechaza H0 y H1 es verdadera. De ser así, no se pondría en práctica el programa de inspección cuando en realidad es necesario.

Note que, sin importar qué se haga, es posible que se cometa un error. Siempre que se rechaza H0, podría ocurrir un error tipo I, y si no se rechaza tal hipótesis, sería posible un error tipo II. No hay forma de evitar esta disyuntiva. La tarea del estadístico es diseñar métodos para decidir si rechaza H0 o no, de manera que sean razonablemente bajas las probabilidades de cometer uno u otro tipo de errores.

270

PROBABILIDAD Y ESTADÍSTICA

Desde el punto de vista filosófico, son dos las maneras de determinar si se rechaza H0 o no. El primer método, que se analiza en esta sección, se llama prueba de hipótesis. Se utilizó ampliamente y todavía se aplica en la actualidad. El segundo, llamado prueba de significación, se aplica cada vez más y se analiza en la sección que sigue. La prueba de hipótesis es un procedimiento en el que los valores de la estadística de prueba que llevan al rechazo de la hipótesis nula se definen antes de realizar el experimento. Dichos valores constituyen lo que se llama la región crítica o de rechazo de la prueba. La probabilidad de que el valor observado de la estadística de prueba quede incluido en tal región por azar, pese a que θ = θ0, se llama alfa (α), tamaño de la prueba o nivel de significación de la prueba. Si esto ocurre, se comete un error tipo I, es decir, en un estudio de prueba de hipótesis α es la probabilidad de que se cometa un error tipo I. Estas ideas se resumen en la definición 8.3.1. Definición 8.3.1 (error tipo I y nivel de significación). Considere una prueba de una hipótesis. Se comete un error tipo I cuando la hipótesis nula se rechaza y, de hecho, es verdadera. La probabilidad de cometer este tipo de error se llama nivel de significación de la prueba y se denota con la letra griega alfa (α). Ejemplo 8.3.3.

Para probar la hipótesis del ejemplo 8.3.1:

H0: p ≤ 0.5 H1: p > 0.5

(la mayor parte de los automóviles de circulación tiene faros mal alineados)

Se selecciona una muestra aleatoria de 20 automóviles y se verifican sus faros. Se diseña una prueba tal que α, la probabilidad de rechazar H0 cuando p es igual al valor nulo 0.5, es de casi 0.05. La estadística de prueba es X, el número de vehículos de la muestra con faros mal alineados. Si p es en verdad igual al valor nulo, entonces X es binomial, con n = 20, p = 0.5 y E[X ] = np = 10. Así pues, cuando p = 0.5, en promedio 10 de cada 20 automóviles sometidos a la prueba tiene faros mal alineados, y si H1 es verdadera, el promedio es mayor de 10. Como es lógico suponer, debe rechazarse H0 si el valor observado de la estadística de prueba X es mayor de 10. Note, en la tabla I del apéndice A, que: P[ X ≥ 14| p = 0.5] = 1 − P[ X < 14| p = 0.5]

= 1 − P[ X ≤ 13| p = 0.5] = 1 − 0.9423 = 0.0577

Se acepta el rechazo de H0 a favor de H1 si el valor observado de la estadística de prueba X es 14 o mayor. De esta manera, se dividen los valores posibles de X en dos conjuntos: C = {14, 15, 16, 17, 18, 19, 20} y C' = {0, 1, 2, . . . , 13}. Si el valor observado de X se ubica en C, se rechaza H0 y se llega a la conclusión de que la mayor parte de los vehículos en circulación tiene faros mal alineados. El conjunto de valores de la estadística de prueba que lleva al rechazo de la hipótesis nula C es la región crítica o de rechazo de la prueba. Se selecciona C de modo que se tenga probabilidad de 0.0577 de que la estadística de prueba sea parte de C por azar, pese a que p = 0.5. En otras palabras, se diseña una prueba tal que la probabilidad de cometer un error tipo I (α) sea de aproximadamente 0.05, como se pretendía.

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

271

Existe un aspecto que debe resaltarse. En el ejemplo previo, se usa el valor nulo p0 = 0.5 para determinar la región crítica de la prueba, a pesar de que la hipótesis nula permite valores de p menores de 0.5. No existe problema en hacerlo así, ya que los valores de X excesivamente altos que ocurren por azar cuando p = 0.5 también son, sin duda, demasiado altos para sobrevenir de manera aleatoria si p < 0.5. Dicho de otra manera, todo valor de X que lleva al rechazo de 0.5 como valor razonable de p lleva de igual modo al rechazo de todo valor menor de 0.5 (vea el ejercicio 29). Es posible que el valor observado de la estadística de prueba no caiga en la región de rechazo, inclusive cuando H0 no es verdadera y debe rechazarse. En tal caso, se comete un error tipo II. La probabilidad de que así sea se llama beta (β ). Estos conceptos se resumen en la definición 8.3.2. Definición 8.3.2 (error tipo II y beta). Considere la prueba de una hipótesis. Un error tipo II es uno que se comete cuando la hipótesis nula no se rechaza y, de hecho, la hipótesis de investigación es verdadera. La probabilidad de cometer un error tipo II se denota con la letra griega beta (β ). La probabilidad beta es un poco más difícil de manejar que la probabilidad alfa, que puede especificar el experimentador. En una prueba dada, β depende de la hipótesis alternativa. En otras palabras, se puede calcular β sólo si se especifica un valor particular de la hipótesis alternativa. A manera de ilustración, en el siguiente ejemplo se calcula β en relación con la prueba del ejemplo 8.3.3. Ejemplo 8.3.4. La región crítica de la prueba del ejemplo 8.3.3 es C = {14, 15, 16, 17, 18, 19, 20}. Suponga que, sin que lo sepa el investigador, la proporción de vehículos con faros mal alineados es 0.7. ¿Cuál es la probabilidad de que la prueba, según se diseñó, no pueda detectar tal situación? En respuesta a la pregunta, se calcula β, la probabilidad de que H0 no se rechace cuando p = 0.7. Por definición:

β= = = =

P[error tipo II] P[no rechazar H0| p = 0.7] P[X no es parte de la región crítica| p = 0.7] P[X ≤ 13| p = 0.7] = 0.3920

(tabla I del apéndice A)

En otras palabras, la prueba tal y como está diseñada no tiene probabilidad muy alta de que pueda distinguirse entre p = 0.5 y p = 0.7. Beta está en función de la hipótesis alternativa, en el sentido de que si p cambia de 0.7 a 0.8, también se modifica β. En este caso:

β = P[X ≤ 13| p = 0.8] = 0.0867 Note que β disminuye a medida que aumenta la diferencia entre el valor nulo de 0.5 y el valor alterno de p.

Existe otra probabilidad importante que debe considerarse. Se pide al lector que se ponga en los zapatos de un investigador que dedica mucho tiempo, esfuerzo y dinero al diseño y ejecución de un experimento para recopilar datos que sustenten una teoría de investigación. Se pretende diseñar el estudio de manera tal que, si la teoría de investigación es verdadera, haya una probabilidad alta de que el

272

PROBABILIDAD Y ESTADÍSTICA

estudio demuestre que así es. Dicho de otra manera, se pretende que sea alta la probabilidad de rechazar la hipótesis nula cuando la teoría de investigación es verdadera. La probabilidad de llegar a esta decisión correcta importante se llama potencia de la prueba. Definición 8.3.3 (potencia). Considere una prueba de una hipótesis. La probabilidad de rechazar la hipótesis nula cuando en verdad la teoría de investigación es verdadera se llama potencia de la prueba. La potencia y beta están relacionadas. Advierta que ambas probabilidades se calculan bajo el supuesto de que la teoría de investigación es verdadera. En este caso, o no se rechaza la hipótesis nula con probabilidad β o se rechaza la hipótesis nula con la probabilidad de la potencia. De tal suerte:

β + potencia = 1 Ejemplo 8.3.5.

o

potencia = 1 – β

En el ejemplo 8.3.3, se diseña un experimento para comprobar que: H0: p ≤ 0.5 H1: p > 0.5

Se descubre que si la teoría de investigación es verdadera y p = 0.7, existe probabilidad de 39.2% de que no se pueda detectar tal hecho. En otras palabras, β = 0.392. La potencia de la prueba para detectar este valor alternativo de p es: Potencia = 1 – β = 1 – 0.392 = 0.608 Si es importante detectar la diferencia entre una proporción de 50% de vehículos con faros mal alineados y otra de 70%, la prueba no resulta muy satisfactoria tal y como está diseñada.

Existe un acto de equilibrio evidente que debe ejecutarse en el diseño de experimentos. Se pretende que α y β tengan valores bajos y que la potencia para detectar diferencias trascendentales sea alta. En la práctica, ello se logra al seleccionar una muestra de tamaño apropiado. Esta idea se ilustra en el ejercicio 46, en el contexto de la prueba de una hipótesis sobre el valor promedio de una distribución. Recuerde que el procedimiento de prueba de hipótesis entraña decidir el nivel de significación (α) antes de recopilar los datos y evaluar la estadística de prueba. En otras palabras, requiere preestablecer α. Son varias las razones de que así convenga. Brinda una forma clara de tomar una decisión. Una vez definida α, también se fija la región crítica de la prueba. Si el valor observado de la estadística de prueba se ubica en esa región, se rechaza H0, no así en cualquier otro caso. El debate es impensable después de recopilar los datos. Por lo tanto, no se puede acusar a los estadísticos de manipular los resultados para adaptarlos a sus necesidades. Por añadidura, si son muy graves las consecuencias de cometer un error tipo I, preestablecer α hace posible especificar a priori y con exactitud la magnitud del riesgo que se está dispuesto a tolerar. Las expresiones subyacentes a las pruebas de hipótesis se resumen en la figura 8.7.

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

273

Situación real Decisión

H0 es verdadera

H1 es verdadera

Rechazar H0

Error tipo I (probabilidad α)

Decisión correcta (potencia de la prueba)

No rechazar H0

Decisión correcta

Error tipo II (probabilidad β)

FIGURA 8.7

8.4

NIVEL DE SIGNIFICANCIA

En la sección precedente, se considera un método para decidir si se rechaza una hipótesis nula o no se la rechaza, llamado prueba de hipótesis. En esta sección, se estudia otro método para el mismo fin. Éste, llamado nivel de significancia, se ha vuelto de uso generalizado. Ello se debe a su atractivo lógico y al uso creciente de sofware en el análisis de datos estadísticos. A fin de entender la razón de que el nivel de significancia sea tan atrayente, resalta un aspecto molesto de la prueba de hipótesis que tal vez ya le haya ocurrido al lector. Es fácil identificar ese problema con un ejemplo sencillo. Suponga que se quiere poner a prueba que: H0: p ≤ 0.1 H1: p > 0.1 con base en una muestra de tamaño 20. La estadística de prueba es X, el número de “éxitos” observado en los 20 intentos. Puesto que el valor nulo es p0 = 0.1, cuando p = p0 la estadística de prueba tiene distribución binomial, con E[X ] = np0 = 20(0.1) = 2. Los valores de X mayores de 2 tienden a hacer creíble la hipótesis alternativa. Suponga que se pretende que α tenga valor “muy bajo”, de modo que se define la región crítica como C = {9, 10, 11, . . . , 20}. En relación con esta prueba:

α = P[error tipo I] = P[rechazar H0| p = p0] = P[X es parte de la región crítica | p = 0.1] = P[X ≥ 9| p = 0.1] = 1 – P[X < 9| p = 0.1] = 1 – P[X ≤ 8| p = 0.1] = 1 – 0.9999 = 0.0001 ¡En verdad se trata de un “valor muy bajo”! Ahora bien, suponga que se realiza la prueba y se obtienen ocho “éxitos”. De conformidad con las reglas más bien estrictas de la prueba de hipótesis, no se puede rechazar H0, puesto que ocho no se ubica en la región crítica. Sin embargo, ¡luego de pensar un poco

274

PROBABILIDAD Y ESTADÍSTICA

usted se sentiría a disgusto con tal decisión! Note que ocho está muy cerca de nueve, el valor más bien arbitrario seleccionado como límite inferior de la región crítica. Veamos las probabilidades de obtener un valor de ocho o más cuando p = 0.1: P[X ≥ 8| p = 0.1] = 1 – P[X < 8| p = 0.1] = 1 – P[X ≤ 7| p = 0.1] = 1 – 0.9996 = 0.0004 Sin duda, esta probabilidad también es “muy baja”. Resulta difícil imaginar una situación en la que se estaría dispuesto a tolerar una probabilidad de 1 en 10 000 de cometer un error tipo I, ¡al tiempo que se declara vehementemente que la probabilidad de 4 en 10 000 de cometer tal error es un riesgo excesivo! Existe tan poca diferencia entre estas probabilidades que sería un tanto absurdo insistir en apegarse estrictamente al límite original de nueve. El problema recién ilustrado puede evitarse con la ejecución de una prueba de significancia, en lugar de una prueba de hipótesis. Este método para decidir si se rechaza H0 o no se rechaza consiste en establecer H0 y H1 exactamente como antes. Sin embargo, no se preestablece α ni se especifica una región crítica estricta. En vez de ello, se evalúa la estadística de prueba y luego se determina la probabilidad de observar un valor de dicha estadística que sea por lo menos tan extremo como el valor observado bajo el supuesto de que θ = θ0. Esta probabilidad recibe nombres diversos, como los de nivel crítico, nivel descriptivo de significancia y la probabilidad o valor P de la prueba. En esta obra, se usa el último de esos términos. Note que el valor P es el más bajo que podría haberse asignado a α de modo que todavía se pueda rechazar H0. Se rechaza H0 si se considera que este valor de P es bajo. Ejemplo 8.4.1. Los ingenieros automotrices usan cada vez más el aluminio en la fabricación de automóviles, con el objeto de reducir los costos y mejorar el rendimiento del combustible. En un modelo dado, el número de millas por galón obtenido en autopistas tiene media de 26 millas por galón (mpg), con desviación estándar de 5 mpg. Se espera que un nuevo diseño, en el que se usa más aluminio, mejore el rendimiento de combustible. Suponga que este cambio no tiene efecto en σ. Puesto que la hipótesis de investigación se toma como hipótesis alterna, se pone a prueba: H0: µ ≤ 26 H1: µ > 26

(el nuevo diseño mejora el rendimiento de combustible en autopistas)

La media muestral es un estimador insesgado de la media poblacional, de modo que X es una estadística de prueba lógica. Acéptese rechazar H0 a favor de H1 si el valor observado de la media muestral es “un tanto mayor” que 26. Por “un tanto mayor”, entiéndase suficientemente grande para que haya ocurrido de manera razonable por azar si la media verdadera de rendimiento de combustible es todavía de 26 mpg. Se obtuvieron los datos siguientes en pruebas de manejo: 33.8 24.9 30.3 28.6 33.1 30.0

24.3 31.5 33.5 27.1 37.5 28.4

18.8 34.4 27.4 28.8 25.1 25.6

23.7 28.0 27.6 16.5 34.5 19.8

25.3 20.5 22.5 32.7 29.5 28.9

29.6 36.7 30.7 25.2 26.8 27.7

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

275

La media muestral de estos datos es x = 28.04 mpg. Es mayor que el valor nulo de µ, de 26 mpg. A efecto de ver si existe diferencia suficiente para rechazar H0, se calcula el valor de P de la prueba, es decir, la probabilidad de observar una media muestral de 28.04 o más si µ = 26 y σ = 5. Ello se logra al tomar nota de que si µ = 26 y σ = 5, entonces la estadística de prueba X tiene, conforme al teorema del límite central (teorema 7.4.2), distribución al menos aproximadamente normal, con media µ = 26 y desviación estándar σ / n = 5/ 6. Por lo tanto:

 X − 26 28.04 − 26  P[ X ≥ 28.04|µ = 26, σ = 5] = P  ≥  (5/ 6)   (5/ 6) P[ Z ≥ 2.45] = 1 − P[ Z ≤ 2.45] = 1 − 0.9929 (Tabla V del apéndice A) = 0.0071

Son dos las posibles explicaciones de esta probabilidad muy baja. La hipótesis nula es verdadera y se observó una muestra muy infrecuente, que por azar tiene media muestral grande, o la hipótesis nula no es verdadera y el nuevo proceso produjo, de hecho, una media más alta de rendimiento de combustible. ¡Se prefiere la segunda explicación! En otras palabras, se rechaza H0 y se informa que el valor P de la prueba es 0.0071.

Existe una forma muy sencilla de manejar la diferencia entre las pruebas de hipótesis y de significación. Basta calcular el valor P para cada prueba. Si se preestablece un nivel α para garantizar que satisfaga un nivel de riesgo aceptable máximo tradicional o del ramo, luego se compara el valor P contra dicho nivel. Cuando P ≤ α, puede rechazarse la hipótesis nula con el valor de significancia especificado. En caso de usar esta técnica, es innecesario encontrar puntos críticos y regiones críticas preestablecidas, como se hizo en el ejemplo 8.3.3. Este método resulta especialmente viable en la actualidad, cuando los valores P son parte habitual de los paquetes estadísticos y de las funciones de calculadoras estadísticas. Las pruebas de significación son un concepto muy usado. El método de cálculo del valor P es claro en el caso de pruebas con cola derecha o izquierda. Si la prueba tiene cola derecha (H1: θ > θ0), el valor P es el área a la derecha del valor observado de la estadística de prueba, y si tiene cola izquierda (H1: θ < θ0), es el área a la izquierda. Sin embargo, todavía queda por resolver una pregunta: “¿Cómo se calcula el valor P de una prueba con dos colas?” (H1: θ ≠ θ0). Si la estadística de prueba tiene distribución simétrica, como ocurre con las estadísticas Z o T, es lógico duplicar el valor P de una cola evidente. Cuando la distribución es asimétrica, como en la estadística ji cuadrada, supuestamente el valor P de dos colas es casi el doble que el valor de una cola. Aunque esta última es sólo una de las varias soluciones propuestas del problema, es la convención que se usa en esta obra.

8.5 PRUEBAS DE HIPÓTESIS Y NIVEL DE SIGNIFICANCIA DE LA MEDIA Uno de los problemas más frecuentes es la prueba de una hipótesis concerniente al valor de la media. Se ha visto la forma de hacerlo si se supone que σ 2 es conocida. Ya que este supuesto suele ser inválido, a continuación se centra la atención en un método que puede usarse para probar hipótesis

276

PROBABILIDAD Y ESTADÍSTICA

referentes a µ cuando se desconoce σ 2 y se la debe estimar a partir de los datos que se tienen. Considere los ejemplos siguientes. Ejemplo 8.5.1. El nivel máximo aceptable de exposición a la radiación por microondas en Estados Unidos es en promedio de 10 microwatts por centímetro cuadrado. Se piensa que un transmisor de televisión contamina la atmósfera al desplazar el nivel de radiación de microondas por encima del límite seguro. Se toma como hipótesis alternativa lo que se desea investigar, de modo que se pone a prueba: H0: µ ≤ 10 H1: µ > 10

(inseguro)

Ejemplo 8.5.2. Los ingenieros automotrices trabajan en un sistema de dirección de bajo esfuerzo que puede usarse en camionetas modificadas para adaptarlas a las necesidades de conductores discapacitados. El sistema de dirección antiguo requería una fuerza de 54 onzas para dar vuelta al volante de las camionetas, de 15 pulg de diámetro. Se espera que el nuevo diseño produzca la fuerza promedio necesaria para darle vuelta. En este caso, se pone a prueba: H0: µ ≥ 54 H1: µ < 54

(el nuevo sistema requiere menos fuerza que el sistema antiguo)

Ejemplo 8.5.3. Un sistema de cómputo tiene actualmente 10 terminales y una sola impresora. El tiempo promedio de proceso en el sistema es de 15 min. Se añaden 10 nuevas terminales y una segunda impresora al sistema. Se pretende determinar si resulta afectado el tiempo medio de proceso o no. A fin de decidirlo, se pretende probar: H0: µ = 15 H1: µ ≠ 15

(el nuevo equipo tiene efecto en el tiempo de proceso)

Como puede verse, una hipótesis referente a µ puede asumir una de tres formas generales. Éstas son, con µ0 para denotar el valor nulo de la media: Tres formas de pruebas de hipótesis sobre la media de una distribución I H0: µ ≤ µ0 H 1 : µ > µ0 Prueba de cola derecha

II H0: µ ≥ µ0 H 1 : µ < µ0 Prueba de cola izquierda

III H0: µ = µ0 H1: µ ≠ µ0 Prueba de dos colas

La forma I se llama prueba de cola derecha porque, cuando se prueba una hipótesis de esta forma, la región natural que lleva al rechazo de H0 es la región de cola superior (o derecha) de la distribución de la estadística de prueba. Este punto se explica en el ejemplo 8.5.4. De igual manera, la forma II es una prueba de cola izquierda porque la región natural de rechazo de H0 es la región de cola inferior (o izquierda) de la distribución apropiada. En una prueba de dos colas, la región crítica se conforma de las regiones de colas superior e inferior de la distribución de la estadística de prueba. Esto es fácil de recordar, ya que en una prueba de un lado, las formas I y II, la desigualdad en la hipótesis alternativa apunta hacia la región crítica.

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

277

Existe una afirmación general que debe tener en cuenta al probar una hipótesis de cualquier parámetro: A fin de probar una hipótesis del parámetro θ, debe encontrarse una estadística cuya distribución de probabilidad se conozca al menos en forma aproximada bajo el supuesto de que θ = θ0. Esa estadística sirve como estadística de prueba. En el ejemplo, es muy fácil encontrarla. A partir del análisis de la sección 8.2, se sabe que si X es normal, entonces la estadística ( X − µ0 )/( S / n ) tiene distribución Tn – 1. Las pruebas basadas en esta estadística suelen llamarse pruebas T. Las pruebas de hipótesis de µ en realidad se efectúan al probar H0: µ = µ0 contra una de las alternativas µ > µ0, µ < µ0 o µ ≠ µ0. Es seguro hacerlo, por razones análogas a las descritas en la sección 8.3. En particular, los valores de la estadística de prueba que llevan al rechazo de µ0 y a concluir que µ > µ0 también originan el rechazo de todo valor menor que µ0, y los valores de la estadística de prueba que generan el rechazo de µ0 y la conclusión de que µ < µ0, originan asimismo el rechazo de todo valor mayor que µ0. Por ello, muchos estadísticos prefieren expresar las tres formas como sigue: I H0: µ = µ0 H1: µ > µ0 Prueba de cola derecha

II H0: µ = µ0 H1: µ < µ0 Prueba de cola izquierda

III H0: µ = µ0 H1: µ ≠ µ0 Prueba de dos colas

Lo anterior enfatiza el hecho de que en una prueba de hipótesis de µ, se calcula α bajo el supuesto de que µ = µ0, mientras que en el caso de una prueba de significación de µ, el valor P se calcula bajo el mismo supuesto. Esta convención de notación se usa en el resto de la obra. Ejemplo 8.5.4. A fin de determinar si un transmisor de televisión contamina la atmósfera cercana (ejemplo 8.5.1), se pretende probar: H0: µ = 10 H1: µ > 10 Note que la desigualdad relacionada con la hipótesis alternativa apunta hacia la derecha, de modo que se trata de una prueba de cola derecha. Una muestra de 25 mediciones se obtiene en momentos seleccionados aleatoriamente de un periodo de una semana. La estadística de prueba, ( X − 10)/( S / 25 ), tiene distribución T24 si H0 es verdadera. X es un estimador insesgado de la media, por lo que se espera que su valor observado sea cercano a 10 si H0 es verdadera. Ello obliga a que el numerador de la estadística de prueba ( X − 10), sea pequeño, lo cual hace que el valor observado de la estadística de prueba también lo sea. No obstante, si H1 es verdadera, se espera que X sea mayor que 10, lo cual hace que X − 10 sea alto y positivo. A su vez, ello origina un valor positivo alto de la estadística de prueba. Así pues, lógicamente debe rechazarse H0 a favor de H1 siempre que el valor observado de la estadística de prueba sea positivo y suficientemente alto para que fuese razonable suponer que ocurrió al azar. Así pues, la región crítica natural de la prueba es la región de cola derecha o superior de la distribución T24. Se preestablece α para decidir cuán grande se necesita que sea el valor a fin de rechazar H0. Si se comete un error tipo I, se cerrará innecesariamente la estación transmisora, y si se comete un error tipo II, no se detecta un posible riesgo de

278

PROBABILIDAD Y ESTADÍSTICA

0.5

0.4

0.3 f(t)

T24

0.2

0.1 0.1

0.0

t 0

FIGURA 8.8 Región crítica de una prueba de cola derecha con nivel α = 0.1 (n = 25).

t 0.1 = 1.318

salud. Se pretende que α tenga valor bajo, si bien no tan bajo que fuerce a que β lo tenga muy alto. Se selecciona α = 0.1. El punto crítico de la prueba, obtenido de la tabla VI del apéndice A y que se muestra en la figura 8.8, es 1.318. Se rechaza H0 a favor de H1 si el valor observado de la estadística de prueba es 1.318 o mayor. Cuando se realiza el experimento, se determina que x = 10.3 y s = 2. El valor observado de la estadística de prueba es: ( x − 10)/( s / 25 ) = (10.3 − 10)/( 2/5) = 0.75

El valor es inferior al punto crítico, 1.318, por lo que resulta imposible rechazar H0. Los datos no sustentan la afirmación de que la transmisión haga que los valores promedio de radiación de microondas sean mayores que el límite de seguridad.

Debe resaltarse que en la práctica no es realmente necesario encontrar el punto crítico, incluso si se preestableció α. En su lugar, basta evaluar simplemente la estadística de prueba y calcular el valor P. Si este último es cuando mucho igual al valor α preestablecido, entonces puede rechazarse H0 con ese valor de α. De tal suerte, en el ejemplo previo se preestableció que α = 0.10. El valor observado de la estadística de prueba es 0.75. Éste y el valor P correspondiente se ilustran en la figura 8.9a. A partir de la tabla T con 24 grados de libertad, se tiene que este valor se ubica entre 0.685 y 1.318 [figura 8.9b]. El área a la derecha de 0.685 es 0.25, por lo que está claro que el valor P es menor que 0.25. El área a la derecha de 1.318 es 0.10, menor que el valor P. Mediante la combinación de estos resultados, se puede concluir que 0.10 < P < 0.25 El valor P excede el nivel preestablecido α de 0.05, por lo que no puede rechazarse H0 con dicho nivel. Se trata de una técnica de utilidad especial en la actualidad, ya que gran parte del análisis de datos se realiza con uno de los paquetes de computadora disponibles en el comercio. Es habitual que esos paquetes informen automáticamente sobre el valor P. A fin de realizar una prueba en la que se preestablece α, se compara el valor P de que informa el paquete contra α. Si P ≤ α, entonces puede rechazarse H0 con el nivel de significación α, mientras que no puede rechazarse en cualquier otro caso. Algunos paquetes de computadora permiten que el usuario indique si la prueba es de cola derecha, izquierda o doble, mientras que otros realizan automáticamente la prueba de dos colas. En el segundo de

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

279

0.5

0.4

0.3

f(t)

T24

0.2

0.1

P

0.0

t 0

0.75

0.5

0.4

0.3

f(t)

T24

0.2

0.1 P 0.0

t 0 0.685

1.318 0.75

Área = 0.10 Área = 0.25

FIGURA 8.9 a) Puesto que la prueba es de cola derecha, P = área sombreada = área a la derecha de 0.75; b) P es menor que el área a la derecha de 0.685 y mayor que el área a la derecha de 1.318, por lo que 0.10 < P < 0.25.

esos casos, el valor P verdadero es la mitad del que informa la computadora. Verifique la documentación del paquete para cerciorarse de que entiende con exactitud qué probabilidad se calcula. El ejemplo siguiente ilustra el uso de la prueba de significación de una hipótesis de dos colas. Ejemplo 8.5.5. En el estudio del efecto de añadir 10 nuevas terminales y una impresora a un sistema de cómputo existente (ejemplo 8.5.3), se pone a prueba: H0: µ = 15 H1: µ ≠ 15

(el nuevo equipo tiene efecto en el tiempo de procesamiento)

280

PROBABILIDAD Y ESTADÍSTICA

No se tiene una noción preconcebida de si el nuevo equipo aumenta o disminuye la media de tiempo de proceso, por lo que se trata de una prueba de dos colas. Se rechaza H0 y se acepta H1 si el valor observado de la estadística de prueba es suficientemente grande, ya sea positivo o negativo, para haber ocurrido por azar. Cuando se recopilan los datos, con una muestra de tamaño 30 se tiene x = 14 y s = 3. El valor observado de la estadística de prueba es:

( x − 15) /( s / 30 ) = (14 − 15)/(3/ 30 )

− 1.83

Con base en la tabla VI del apéndice A, se tiene que: P[T29 ≤ −1.699] = 0.05 y

P[T29 ≤ −2.045] = 0.025

Ya que –1.83 se ubica entre –1.699 y –2.045, la probabilidad de observar un valor negativo tan grande como el observado se ubica entre 0.025 y 0.05. Sin embargo, se trata de una prueba de dos colas. Ello significa que el valor P de la prueba es la probabilidad de observar un valor positivo o negativo tan extremo como el observado. En otras palabras, se supone que el valor P es el doble del calculado. Resulta posible informar en esta prueba que 0.05 < P < 0.1. Se trata de una probabilidad todavía baja, de modo que se rechaza H0 y se llega a la conclusión de que el nuevo equipo tiene efecto en la media de tiempo de proceso.

Debe resaltarse que la estadística ( X − µ 0 )/( S / n ) tiene distribución Tn – 1 si X es normal. Ha de tenerse cuidado cuando X no sea normal. Se ha observado que la transgresión de este supuesto con muestras moderadas o grandes (n ≥ 25) no tiene efecto considerable en la distribución de la estadística de prueba, en el sentido de que no cambia apreciablemente la probabilidad de cometer errores de tipos I o II [6]. Esta propiedad se llama robustez. Sin embargo, cuando el tamaño de la muestra es pequeño, entonces deben evitarse pruebas T con datos que no sean normales. Muchos paquetes de software estadístico incluyen algún tipo de prueba de normalidad. En este caso, se pone a prueba: H0: los datos se obtienen de una distribución normal H1: los datos se obtienen de una distribución no normal Los resultados de tales pruebas, con consideraciones del tamaño muestral, pueden usarse para decidir si se procede con la prueba T o se recurre a una de las pruebas no paramétricas descritas en la sección 8.7.

8.6 PRUEBAS DE HIPÓTESIS ACERCA DE LA VARIANZA En siguiente término, la atención se centra en prueba de hipótesis sobre el valor de σ 2 o σ. Se resumen a continuación, donde σ 02 denota el valor nulo de la varianza poblacional. Tres formas de pruebas de hipótesis de la varianza de una distribución I H0: σ 2 = σ 02 H1: σ 2 > σ 02 Prueba de cola derecha

II H0: σ 2 = σ 02 H1: σ 2 < σ 02 Prueba de cola izquierda

III H0: σ 2 = σ 02 H1: σ 2 ≠ σ 02 Prueba de dos colas

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

281

La estadística de prueba usada para comprobar cada una de ellas es ( n −1)/ S 2/σ 02. Cuando el muestreo se obtiene de una distribución normal, se sabe que la estadística tiene la distribución ji cuadrada con n – 1 grados de libertad, siempre y cuando σ 2 = σ 02 . Como cabría esperar, las regiones críticas de las pruebas de colas derecha e izquierda son las regiones de colas superior e inferior de la distribución X 2n − 1 , respectivamente; la región crítica de la prueba de dos colas consiste en esas dos regiones. Ejemplo 8.6.1. Una variable aleatoria estudiada durante el diseño de la media-flecha de tracción delantera de un nuevo modelo de automóvil es el desplazamiento en milímetros de las juntas de velocidad constante. Con el ángulo de las juntas fijo en 12°, se realizan 20 simulaciones y se obtienen los datos siguientes: 6.2 4.6 4.1 1.4

1.9 4.2 3.7 2.6

4.4 1.1 2.5 1.5

4.9 1.3 3.7 3.9

3.5 4.8 4.2 3.2

En relación con estos datos, x = 3.39 y s = 1.41. Los ingenieros de diseño de la media-flecha de tracción delantera afirman que la desviación estándar en el desplazamiento de la flecha de velocidad constante es menor de 1.5 mm. La desviación estándar estimada con base en las 20 observaciones es de 1.41 mm. ¿Acaso los datos sustentan la afirmación de los ingenieros? A fin de responder la pregunta, se pone a prueba: H0: σ = 1.5 H1: σ < 1.5 Lo anterior es equivalente a: H0: σ 2 = (1.5)2 H1: σ 2 < (1.5)2 El valor observado de la estadística de prueba es: ( n − 1) s 2 19(1.41) 2 = = 16.79 (1.5) 2 σ 02 Puesto que se trata de una prueba de cola izquierda, se rechaza H0 si el valor es demasiado bajo para haber ocurrido al azar cuando H0 es verdadera. Con base en la tabla de ji cuadrada, pueden verse que: 2 P[ X19 ≤ 14.6] = 0.25

y

2 P[ X19 ≤ 18.3] = 0.50

El valor observado de la estadística de prueba, 16.79, se ubica entre 14.6 y 18.3, por lo que el valor P de la prueba se sitúa entre 0.25 y 0.50. Este último es más bien alto, por lo que resulta imposible rechazar H0. Los datos son insuficientes para afirmar que σ < 1.5 mm.

Recuerde que la estadística T puede usarse para hacer inferencias sobre µ, inclusive con muestras de tamaño moderado o grandes (n ≥ 25), aunque se transgrediera el supuesto de normalidad. Ello se convierte en un problema grave cuando el tamaño de la muestra es pequeño. Desgraciadamente, no puede afirmarse lo mismo acerca del uso de la estadística X 2n − 1 para hacer inferencias respecto de σ 2 y σ. Por tal razón, debe incluirse una comprobación de la normalidad cuando se preparan intervalos de confianza de σ 2 o se prueban hipótesis del valor de este parámetro. Esos métodos deben evitarse si los datos no son normales.

282

PROBABILIDAD Y ESTADÍSTICA

8.7 MÉTODOS NO PARAMÉTRICOS ALTERNATIVOS Se analiza con antelación la forma de usar las estadísticas Z y T para poner a prueba hipótesis sobre la media de una distribución normal. Los procedimientos estudiados suponen que las muestras se obtienen de una distribución normal o que el tamaño de la muestra es suficientemente grande para que las desviaciones respecto del supuesto de normalidad no tengan efecto de consideración en los resultados. En la realidad, los experimentadores suelen obtener datos respecto de los cuales sería claramente irracional suponer una distribución normal subyacente y cuyo tamaño de muestra es pequeño. En tal caso, sería aconsejable que el experimentador aplique una prueba “no paramétrica” de localización, no las pruebas Z o T habituales. En esta sección, se analiza el significado del término prueba “no paramétrica”. También se estudian algunas opciones no paramétricas respecto de las pruebas Z y T de localización. Los términos “no paramétrica” y “sin distribución” suelen usarse indistintamente. En caso de aplicar el vocablo “prueba no paramétrica”, se hace referencia a una prueba con la propiedad de que no se elaboran supuestos acerca de la distribución específica de la cual se obtiene la muestra. Aunque es habitual suponer que la distribución es continua, resulta innecesario especificar la familia a la que pertenece la variable aleatoria de estudio. En particular, ya no se requiere suponer que la variable aleatoria de estudio tiene distribución normal. Así pues, los métodos no paramétricos son aplicables a una clase de distribuciones más amplia que sus análogos normales. Cuando se comparan los procedimientos estadísticos diseñados para poner a prueba una misma cosa, en lo esencial, se toman en cuenta dos características: la probabilidad de cometer un error tipo I y la potencia de la prueba. Se pretende que α sea pequeña y, al mismo tiempo, tener probabilidad alta de rechazo de la hipótesis nula falsa. Es habitual que con un nivel α fijo los procedimientos de la teoría normal sean más poderosos que sus equivalentes no paramétricos cuando se satisfacen los supuestos de las pruebas de la teoría normal. Sin embargo, los estudios han demostrado que, a falta de tal satisfacción de supuestos, el uso de los procedimientos de la teoría normal lleva a pruebas que son aproximadas, en el sentido de que se supone el nivel α que resulta aparente. Por ejemplo, si se aplica una prueba ji cuadrada de la varianza a datos que distan de la normal, con nivel α aparente de 0.05, la probabilidad real de rechazo de la hipótesis nula verdadera dista mucho de 0.05. En algunos casos, las aproximaciones son excelentes, mientras que en otros son tan deficientes que resultan del todo inaceptables. Sea cual fuere el caso, es riesgoso el uso de un procedimiento de la teoría normal bajo circunstancias en que son inválidos los supuestos de esa teoría. De ser así, se recurre a procedimientos no paramétricos. Estos métodos tienden a resultar superiores en el análisis de datos cuando quedan insatisfechos los supuestos de la teoría normal; en la comparación de sus resultados contra los de la teoría normal, son muy favorables, inclusive si se satisfacen los supuestos de esa teoría. La forma segura de proceder es aplicar un consejo: en caso de duda, ¡use una prueba no paramétrica! En esta sección, se analizan la prueba de signo y la prueba de rango con signo de Wilcoxon, ambas aplicables a pruebas de localización en la forma de medianas poblacionales.

Prueba de signo de la mediana Recuerde que la mediana de una variable aleatoria X de una distribución continua se define como el valor M tal que: P(X < M) = P(X > M) = 1/2

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

283

En otras palabras, la mediana es el 50 percentil de la distribución. En el caso de una distribución simétrica, como la normal, la media y mediana poblacionales son idénticas. Se verá que la prueba de signo es simplemente una forma de la prueba binomial, analizada en la sección 8.3. Sea X una variable aleatoria continua, con mediana M, y X1, X2, . . . , Xn, una muestra aleatoria de tamaño n de esta distribución no especificada. Si M0 denota el valor hipotético de la mediana poblacional, las formas usuales de las hipótesis que pueden someterse a prueba serían las siguientes: Tres formas de pruebas de hipótesis sobre la mediana de una distribución H0: M = M0 H1: M > M0

H0: M = M0 H1: M < M0

H0: M = M0 H1: M ≠ M0

Prueba de cola derecha

Prueba de cola izquierda

Prueba de dos colas

Bajo el supuesto de una distribución continua, cada una de las diferencias Xi – M0 tiene probabilidad 1/2 de ser positiva, la misma probabilidad de ser negativa y probabilidad 0 de ser igual a cero. Sea Q+ el número de diferencias positivas que se obtiene. Si H0 es verdadera, Q+ tiene distribución binomial, con parámetros n y 1/2, mientras que el valor esperado de Q+ es n/2. En otras palabras, cuando H0 es verdadera, la mitad de las diferencias debe ser positiva, y el resto, negativa. Note que en la ejecución de una prueba de cola izquierda se pretende identificar una situación en que la mediana M verdadera es menor que la mediana M0 hipotética. Si ello resulta válido, cabe esperar que sea negativa más de la mitad de las diferencias. Ello genera menos diferencias positivas que las esperadas. Así pues, un procedimiento lógico es rechazar H0: M = M0 a favor de H1: M < M0 si el valor observado de Q+ es demasiado pequeño para haber ocurrido al azar. La situación es opuesta en una prueba de cola derecha. En este caso, se rechaza H0: M = M0 a favor de H1: M > M0 si el valor observado de Q− es demasiado pequeño para haber ocurrido al azar. En una prueba de dos colas, se rechaza H0: M = M0 y se acepta H1: M ≠ M0 si Q+ o Q−, la que tenga valor más bajo, es demasiado pequeña para haber ocurrido al azar. El ejemplo siguiente ilustra la aplicación de la prueba de signo. Ejemplo 8.7.1. Un método estándar de realización de tareas en una línea de montaje genera una mediana de tiempo de terminación de 55 s. Se desarrolla un nuevo procedimiento, que debe reducir la mediana necesaria. Se pretende probar: H0: M = 55 H1: M < 55 A tal efecto, se pide a 15 sujetos que realicen la tarea y se obtienen las observaciones siguientes de la variable aleatoria X, el tiempo necesario para efectuarla: 35 47

65 41

48 49

40 39

70 34

50 33

58 31

36

El diagrama de tallo y hoja de estos datos se muestra en la figura 8.10. Note que el diagrama hace pensar en una distribución no normal para X. El tamaño muestral es más bien pequeño, de modo que se usa la prueba de signo no paramétrica para fines de localización. La prueba es de cola izquierda. Así pues, la estadística de prueba es Q+, el número de diferencias positivas obtenido cuando se resta 55 de

284

PROBABILIDAD Y ESTADÍSTICA

3 4 5 6 7

569431 80719 08 5 0

FIGURA 8.10 Diagrama de tronco y hoja del tiempo necesario para completar una tarea en una línea de montaje; el diagrama hace pensar en una población que no es normal.

cada observación. En el diagrama, es fácil observar que apenas tres observaciones tienen valor que excede 55. Así pues, el valor observado de la estadística de prueba Q+ es 3. El valor P de la prueba se encuentra al calcular la probabilidad de que ocurra un valor menor o igual que éste, bajo el supuesto de que Q+ tiene distribución binomial, con n = 15 y p = 1/2. De conformidad con la tabla I del apéndice A, P = P[Q+ ≤ 3|n = 15, p = 1/2] = 0.0176. Puesto que este valor P es bajo, se rechaza H0. Se carece de datos estadísticos convincentes de que el nuevo procedimiento reduzca la mediana del tiempo necesario para efectuar la tarea.

Se supone que la distribución subyacente es continua, por lo que en teoría no debe haber diferencias cero cuando se realiza una prueba de signo. Sin embargo, como podría suponer el lector, en la práctica sí ocurren algunas diferencias cero. Ello se debe a varias razones, si bien el problema fundamental es la carencia de instrumentos para la medición precisa de fenómenos continuos, como el tiempo, longitud, velocidad y volumen. El tratamiento de las diferencias cero se ha considerado ampliamente. De ello, han resultado diversas recomendaciones sobre su tratamiento. Las siguientes son las de los autores de esta obra: Tratamiento de los ceros en una prueba del signo 1. Asignar las diferencias cero al signo algebraico que favorezca menos el rechazo de la hipótesis nula. De tal suerte, en el caso de una prueba de cola izquierda se consideraría que las diferencias cero son positivas, y en el de una prueba de cola derecha, que son negativas. Si es una prueba de dos colas, las diferencias cero se asignan al signo algebraico de las diferencias menos frecuentes. Por ejemplo, si se observan tres de signo negativo, 15 positivas y seis ceros en una prueba de dos colas, los seis ceros recibirían el tratamiento de negativos. Este procedimiento tiene sentido, ya que las diferencias cero sustentan la hipótesis nula, de que M = M0. La técnica recomendada brinda el beneficio de la duda a la hipótesis nula, al hacer más difícil que se rechace H0. 2. Si el número de diferencias cero es pequeño en relación con el tamaño muestral n, se eliminan esas diferencias y se reduce en concordancia el tamaño muestral. En ocasiones, surge una situación en la que las diferencias Xi – M0 son tales que puede observarse el signo algebraico de cada diferencia, no así su magnitud. En tal caso, la prueba de signo es prácticamente la única opción disponible para fines de localización. El ejercicio 53 es un ejemplo de este tipo de problema. Lo usual es que pueda obtenerse el valor numérico real de las diferencias. Desgraciadamente, en la prueba de signo no se aprovecha esa información adicional. Dicha prueba da a una diferencia negativa – 0.1 exactamente el mismo tratamiento que a otra –1 000. En cuanto a datos

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

285

en los que pueden identificarse las diferencias reales, se cuenta con una segunda prueba no paramétrica de localización, a saber, la prueba de rango con signo de Wilcoxon, en la que se usan el signo y magnitud de las diferencias observadas Xi – M0.

Prueba de rango con signo de Wilcoxon En esta prueba, se supone que X1, X2, . . . , Xn es una muestra aleatoria de tamaño n de una distribución continua que es simétrica en torno a la mediana M desconocida. Considere el conjunto de diferencias Xi – M0, donde i = 1, 2, 3, . . . , n y M0 es la mediana hipotética de la distribución de la que se obtuvo la muestra. La hipótesis nula que se pone a prueba es H0: M = M0, contra las alternativas usuales, a saber, H1: M > M0, H1: M < M0 o H1: M ≠ M0. Si H0 es verdadera, las diferencias Xi – M0 provienen de una distribución simétrica en torno a cero. Se supone que las diferencias son tales que pueden obtenerse su magnitud y signo algebraico. En la realización de la prueba, se forma el conjunto de n diferencias absolutas |Xi – M0|. Éstas se clasifican de 1 a n en orden de magnitud absoluta, de modo que la diferencia absoluta de menor valor corresponde a la categoría (rango) 1. A estos rangos, que se denotan con R1, R2, . . . , Rn, se les asigna el signo algebraico de la calificación de diferencia que generó el rango. Si H0 es verdadera, cada rango tiene la misma probabilidad de asignación a un valor positivo o negativo. Considere la estadística: Estadística de prueba de Wilcoxon W+ =

∑ Ri

∀ Ri > 0

y

|W−| =

∑ |Ri|

∀ Ri < 0

Si H0 es verdadera, debe esperarse que W+ y |W– | sean aproximadamente iguales. En caso de que M > M0, entonces W+ tendería a ser muy grande y |W– | a ser muy pequeña. De manera similar, si M < M0, cabría esperar lo opuesto. Así pues, se define que la estadística de prueba es W = mín(W+, |W–|). Se cuenta con tablas de la distribución exacta de W para diversos valores del tamaño muestral n y el nivel de significación α. Una de ellas es la tabla VIII del apéndice A con uso de esa tabla, se rechaza H0 si el valor observado de W es menor o igual que el valor crítico especificado. En la práctica, pueden ocurrir empates en las calificaciones de diferencias Xi – M0. En tal caso, los valores de cada grupo deben recibir el rango medio del grupo. Por ejemplo, suponga que se observan las diferencias 3, –3 y 3, que deben ocupar los rangos 8, 9 y 10. Se asignaría el rango 9 a cada uno de los tres valores, y el rango 11 a la diferencia de magnitud inmediata superior. El ejemplo 8.7.2 ilustra esta idea. Ejemplo 8.7.2. Se investiga el punto de fusión de un nuevo material ligero, diseñado para usarse en el interior de automóviles. Se sabe que las impurezas del material hacen que el punto de fusión sea una variable aleatoria de distribución uniforme en un intervalo de temperatura angosto. Se piensa que la mediana es menor de 120°C. ¿Los datos siguientes brindan sustento a esa afirmación? 115.1 120.3

117.8 119.0

116.5 119.8

121.0 118.5

286

PROBABILIDAD Y ESTADÍSTICA

Se ponen a prueba: H0: M = 120 H1: M < 120 En primer término, se resta 120 de cada observación, y luego se calcula el valor absoluto de cada diferencia: 115.1

120.3

117.8

119.0

116.5

119.8

121.0

118.5

xi – 120

–4.9

0.3

–2.2

–1.0

–3.5

–0.2

1.0

–1.5

|xi – 120|

4.9

0.3

2.2

1.0

3.5

0.2

1.0

1.5

xi

Luego, se ordenan estas diferencias absolutas, de 1 a 8. Note que el valor 1.0 ocurre dos veces en las que normalmente serían las posiciones 3 y 4. Se asigna el rango 3.5 a cada uno de esos valores. El signo algebraico de cada rango es el mismo de la diferencia que genera el rango: |xi – 120|

4.9

0.3

2.2

1.0

3.5

0.2

1.0

1.5

Rango

8

2

6

3.5

7

1

3.5

5

–8

2

–6

–3.5

–7

–1

3.5

–5

Rango con signo

En relación con estos datos, se tiene:

W+ = |W−| =

∑ Ri = 2 + 3.5 = 5.5

∀ Ri > 0

∑ | Ri | = 8 + 6 + 3.5 + 7 + 1 + 5 = 30.5

∀ Ri < 0

La prueba es de cola izquierda, de modo que la estadística de prueba es W+. Se rechaza H0 si el valor observado de la estadística es demasiado pequeño para haber ocurrido al azar. A partir de la tabla VIII del apéndice A, si n = 8 puede verse que es posible rechazar H0 con el nivel α = 0.05 (punto crítico = 6), no así con el nivel α = 0.025 (punto crítico = 4). Así pues, el valor P de la prueba se ubica entre 0.025 y 0.05. Es un valor relativamente pequeño, de modo que se rechaza H0 y se llega a la conclusión de que la mediana del punto de fusión de este material es inferior a 120°C.

Es posible usar una aproximación normal de muestra grande cuando el tamaño muestral n excede los valores de la tabla VIII del apéndice A. En el teorema siguiente, se expresa la distribución aproximada de la estadística de rango con signo de Wilcoxon: Teorema 8.7.1 (distribución aproximada de W ). Sea W la estadística de rango con signo de Wilcoxon. En el caso de muestras de tamaño grande, W tiene distribución aproximadamente normal, con media: E[W ] =

n(n +1) 4

y varianza: Var W =

n(n + 1) (2n + 1) 24

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

287

En la aplicación de este teorema, basta estandarizar W al restar su media y dividir entre su desviación estándar. Luego, pueden encontrarse los valores P mediante la tabla Z o normal estándar. Esa técnica puede usarse con tamaños muestrales mayores que los enumerados en la tabla VIII del apéndice A. Es un procedimiento de aproximación que se ilustra en el ejercicio 57. La prueba de rango con signo de Wilcoxon es casi tan sensible a desviaciones respecto de la hipótesis nula como la prueba T de la teoría normal, inclusive si la distribución subyacente es normal. En el caso de otras distribuciones simétricas, la prueba de rango con signo suele ser incluso más potente que la prueba T. Así pues, se la debe considerar una competidora fuerte de la prueba T en problemas prácticos. Ello reviste validez especial en el caso de muestras pequeñas, donde preocupan más las transgresiones de los supuestos de las pruebas de la teoría normal. Note que, si bien la prueba de rango con signo de Wilcoxon no supone la normalidad, sí parte de la simetría. Se han desarrollado procedimientos para comprobar la validez de tal supuesto. Una de esas pruebas se detalla en [20].

RESUMEN DEL CAPÍTULO En este capítulo, se estudia la estimación de intervalos de confianza de la varianza y desviación estándar de una distribución normal. También se analiza la estimación por intervalos de la media cuando se desconoce la varianza poblacional. Este procedimiento entraña el uso de la distribución t de Student o distribución T. Se comenta con detalle esta distribución continua y se ve que sus propiedades son similares a las de la distribución Z o normal estándar. En particular, se menciona que los puntos t se aproximan satisfactoriamente con puntos z en el caso de muestras grandes. Después, la atención se centra en métodos usados para poner a prueba hipótesis estadísticas. Se menciona que siempre se tienen dos hipótesis, la hipótesis nula H0 y la hipótesis alternativa H1. El punto de vista del investigador se expresa como hipótesis alternativa. Así pues, se espera que los datos permitan rechazar H0, con lo que se acepta H1. Se diseña la prueba de manera que siempre se conozca la probabilidad de rechazar la hipótesis nula verdadera. Se señala que siempre se está sujeto a error en la comprobación de una hipótesis. Se comete un error tipo I cuando se rechaza una hipótesis nula verdadera, y de tipo II en caso de no rechazar una hipótesis nula falsa. Se describen dos métodos para decidir si se rechaza H0 o no. El primero se llama prueba de hipótesis. En su ejecución, se preestablece α. Ello consiste en establecer una región crítica o de rechazo antes de la recopilación de datos. El rechazo de H0 tiene lugar cuando el valor observado de la estadística de prueba es parte de esa región crítica. El segundo método para decidir el rechazo de H0 se llama nivel de significancia alcanzado. En ella, no se define una región crítica antes de recopilar los datos, sino que se evalúa la estadística de prueba y se calcula la probabilidad o valor P de la prueba. El valor P es la probabilidad de observar un valor de la estadística de prueba tanto o más inusual que el observable si es correcto el valor nulo del parámetro θ. Así pues, el valor P es el más bajo que podría haberse preestablecido para α de modo que todavía pueda rechazarse H0. Se rechaza esta última si se considera bajo el valor P. Cada método conlleva ventajas y desventajas. Usted debe familiarizarse con ambos, ya que los dos se utilizan ampliamente. Se consideran con ciertos detalles las comúnmente llamadas pruebas T. Se idearon específicamente para poner a prueba una hipótesis de la media de una distribución normal. Se menciona que estas pruebas requieren el muestreo de una distribución normal, restricción de importancia especial

288

PROBABILIDAD Y ESTADÍSTICA

en el caso de muestras pequeñas. En la sección 8.7, se estudian algunas alternativas no paramétricas de la prueba T cuando parece inválido el supuesto de normalidad. Son pruebas que no se basan en consideración alguna de la familia de la distribución que sirve como fuente del muestreo. Por último, se considera un método de prueba de hipótesis sobre la varianza o desviación estándar de una distribución normal. Se mencionan y analizan muchos nuevos términos y conceptos de importancia, que usted debe conocer. Algunos de ellos son: Distribución T de Student Hipótesis alternativa Valor nulo Error tipo I Alfa (α) Potencia Región crítica o de rechazo Prueba de significancia Probabilidad o valor P Nivel descriptivo de significancia Prueba de cola izquierda Prueba no paramétrica

Hipótesis nula Hipótesis de investigación Estadística de prueba Error tipo II Beta (β ) Tamaño de la prueba Nivel de significancia Prueba de hipótesis Nivel crítico Prueba de cola derecha Prueba de dos colas Mediana

EJERCICIOS Sección 8.1

1. Cuando se programa desde una terminal, una variable aleatoria que interesa es el tiempo de respuesta en segundos. Se tienen los datos siguientes de una instalación específica: 1.48 1.30 1.51 1.49 1.60

1.26 1.28 1.53 1.43 1.64

1.52 1.43 1.68 1.64 1.51

1.56 1.43 1.37 1.51 1.51

1.48 1.55 1.47 1.60 1.53

1.46 1.57 1.61 1.65 1.74

Construya un diagrama de tallo y hoja. ¿Parece razonable el supuesto de normalidad? Encuentre la estimación puntual insesgada para σ 2. Calcule un intervalo de confianza de 95% para σ 2. Calcule un intervalo de confianza de 95% para σ. ¿Le sorprendería escuchar que el director de esa instalación afirma que la desviación estándar del tiempo de respuesta es mayor de 0.2 s? Explique su respuesta. 2. Un grupo de ingenieros ha descubierto que la capacidad de ver y leer señales por la noche depende en parte de la “luminancia circundante”, es decir, de la intensidad de la luz cerca de la señal. Se obtienen los datos que aparecen a continuación respecto de tal luminancia (en candelas por metro cuadrado), de 30 señales de autopistas seleccionadas aleatoriamente en una gran área metropolitana. (Basado en “Use of Retroreflectors in the Improvement of Nighttime Highway Visibility”, H. Waltman, Color, 1990, pp. 247-251): a) b) c) d) e)

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

10.9 9.1 1.5 3.6 9.6

1.7 7.4 6.3 4.9 5.7

9.5 13.3 7.4 13.1 2.6

2.9 13.1 9.9 7.8 15.1

9.1 6.6 13.6 10.3 2.9

289

3.2 13.7 17.3 10.3 16.2

a) Encuentre la varianza muestral de los datos precedentes. b) Suponga que los datos se obtienen de una distribución normal. Encuentre un intervalo de confianza de 90% para la varianza en la luminancia circundante del área. c) Encuentre un intervalo de confianza de 90% para la desviación estándar en la luminancia circundante. d ) La regla de probabilidad normal (sección 4.5) implica que una variable aleatoria normal se ubica a no más de dos desviaciones estándar de su media con probabilidad 0.95. Use X y S para estimar la media y desviación estándar de la luminancia circundante en el área. ¿Sería inusual que exceda de 18 cd/m2 en relación con una señal seleccionada aleatoriamente? Explique su respuesta. 3. El microanálisis con rayos X se ha convertido en un método de estudio invaluable. La microsonda electrónica permite realizar mediciones cuantitativas y cualitativas, además de analizarlas estadísticamente. Un método de análisis de cristales se llama técnica de doble voltaje. Se obtienen las mediciones siguientes sobre el porcentaje de potasio en un producto comercial que, en teoría, contiene 26.6% de potasio por peso: 21.9 24.0 24.8 27.2 22.0

23.4 24.1 24.8 25.1 26.7

22.1 24.2 24.5 25.5 25.2

22.1 26.5 27.8 23.7 23.1

24.7 23.8 24.9 26.5 25.4

24.6 25.3

a) Verifique cuán razonable es el supuesto de normalidad mediante la construcción de un diagrama de tallo y hoja de los datos. b) Encuentre la varianza muestral de los datos. c) Encuentre un intervalo de confianza de 99% para σ 2. d ) Encuentre un intervalo de confianza de 99% para σ. Tome nota de que este intervalo es más bien amplio. Recomiende una forma de mejorar la estimación de intervalo de σ a partir de los datos. Ponga a prueba su recomendación para verificar si la nueva estimación es más informativa que la obtenida con el intervalo de confianza de 99%. 4. (Intervalo de confianza de un lado para σ 2.) La varianza es una medición de constancia, por lo que suele esperarse que σ 2 tenga valor bajo. Por ello, en ocasiones resulta útil preparar lo que se llama un intervalo de confianza de un lado para σ 2. En otras palabras, se pretende encontrar un intervalo de la forma [0, L], donde L es una estadística con la propiedad de que P[σ 2 ≤ L] 1 − α. La fórmula de tal intervalo es: L = ( n − 1)S 2/ χ12− α. 2 El punto χ1 − α es el punto ji cuadrada de cola inferior con áreas α a su izquierda y 1 – α a su derecha. Por ejemplo, para calcular un intervalo de confianza de 95% de un lado para σ 2, el punto ji cuadrada usado sería el que tenga n – 1 grados de libertad y área 0.05 a la izquierda. Aplique los datos que siguen a X, la longitud real de clavos de 63 mm, para calcular un intervalo de confianza de 95% de un lado respecto de la varianza en su longitud:

290

PROBABILIDAD Y ESTADÍSTICA

63.0 63.1

63.1 62.8

63.0 63.1

63.0 63.1

62.9 63.0

63.0 62.9

63.0 63.2

El fabricante desea que la varianza poblacional de los clavos producidos no sea mayor de 0.03. ¿La muestra indica que es tal el caso? Explique su respuesta. 5. La robótica es un área de rápido crecimiento. Según informes, en 1995 estaban en uso 315 000 robots industriales en fábricas estadounidenses. Una característica importante de los robots es su exactitud. En un estudio de un robot particular, usado para la aplicación de adhesivo en un sitio específico, se obtienen los datos siguientes sobre el error (en pulgadas) en la colocación del adhesivo: 0.001 0.007 0.006 0.001 0.001

0.002 0.003 0.003 0.008 0.003

0.003 0.004 0.005 0.001 0.003

0.002 0.003 0.004 0.004 0.005

0.002 0.006 0.004 0.003 0.006

a) Construya un diagrama de tallo y hoja. ¿Parece razonable el supuesto de que el error de colocación tiene distribución normal? b) Calcule la varianza muestral de los datos precedentes. c) Use el ejercicio 4 para calcular intervalos de confianza de 90% de un lado respecto de σ 2 y σ. d ) El robot es aceptable si su desviación estándar no excede de 0.005 pulg. ¿Parece satisfacerse este criterio? Explique su respuesta. 6. En el teorema 7.1.3, se demuestra que la varianza muestral es un estimador insesgado de σ 2, sin importar la distribución de la variable aleatoria X. Si ésta es normal, esa propiedad se determina más fácilmente con el teorema 8.1.1 y las propiedades de la distribución ji cuadrada que se explican en la sección 4.3. Use esos resultados para demostrar que E[S 2] = σ 2 y Var S 2 = 2σ 4/(n – 1) respecto de una variable aleatoria normal, X. 7. Investigaciones recientes muestran que son económicamente adecuadas la calefacción y acondicionamiento de aire en edificios comerciales con bombas térmicas que usan agua subterránea. Una muestra de 15 pozos en el estado de California indica desviación estándar de 7.5°F. Calcule un intervalo de confianza de 95% para la desviación estándar en la temperatura de pozos en California. 8. Al verter vidrio para uso en parabrisas automovilísticos, la uniformidad de grosor es recomendable para prevenir deformaciones. Encuentre un intervalo de confianza de 95% de un lado para la desviación estándar en el grosor si una muestra de 10 parabrisas revela una desviación estándar muestral de 0.01 pulg. Sección 8.2

9. Use la tabla T para calcular cada uno de los puntos siguientes: a) b) c) d) e) f)

t0.05 (γ = 8); t0.95 (γ = 8); t0.975 (γ = 12); t0.025 (γ = 12); t0.05 (γ = 121); t0.05 (γ = 150);

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

291

g) El punto t tal que P[–t ≤ T25 ≤ t] = 0.90; h) El punto t tal que P[–t ≤ T25 ≤ t] = 0.95; i) El punto t tal que P[T15 ≥ t] = 0.05; j ) El punto t tal que P[T20 ≥ t] = 0.10; k) El punto t tal que P[T16 ≤ –t] = 0.05; l ) El punto t tal que P[T30 ≤ –t] = 0.10. 10. El supergopher (“supercastor”) es un dispositivo creado para perforar la capa de hielo ártico. Se trata de un aparato cónico de 5 pies de altura y 4 pies de altura, con tubo de cobre enrollado a su alrededor. Se bombea agua calentada a 180ºF por el tubo de cobre. Ello permite que el aparato funda un cilindro vertical de hielo. Sea X la distancia o profundidad que el dispositivo puede taladrar por hora. Se obtuvieron los datos siguientes de 10 orificios de prueba (la profundidad se indica en pies): 2.0 2.1

1.7 3.0

2.6 2.5

1.5 1.8

1.4 1.4

a) Use esos datos para calcular x, s2 y s. b) Calcule un intervalo de confianza de 90% para la distancia promedio que puede perforar en una hora. (Basado en información de “The Lost Squadron”, Steven Petrow, LIFE, diciembre de 1992.) 11. Los conductores metálicos o tubos huecos se usan en el cableado eléctrico. En la prueba de tubos de 1 pulg, se obtienen los datos siguientes respecto del diámetro exterior (en pulgadas) del tubo: 1.281 1.288 1.292 1.289 1.291

1.293 1.293 1.291 1.289 1.288

1.287 1.291 1.290 1.286 1.289

1.286 1.295 1.296 1.291 1.286

a) Calcule x, s2 y s respecto de esta muestra. b) Suponga que el muestreo se realiza en una distribución normal. Calcule un intervalo de confianza de 95% para diámetro externo medio de tubos de este tipo. c) Los fabricantes de este tipo de tubo afirman que la media de diámetro exterior es de 1.29 pulg. ¿Acaso el intervalo de confianza lleva a poner en tela de juicio tal cifra? Explique su respuesta. 12. Los ingenieros civiles usan actualmente telémetros de láser manuales de bajo peso en investigaciones hidrográficas. En las pruebas de una marca de estos aparatos, se obtienen los datos siguientes sobre el error (en metros) en la localización de un objeto situado a 500 m: – 0.10 0.01 0.03

– 0.02 – 0.05 0.06

0.10 0.05 0.02

– 0.03 – 0.06 – 0.07

0.09 0.01 0.03

a) Calcule estimaciones puntuales para la media y desviación estándar del error del telémetro. b) Suponga que esos errores de medición tienen distribución normal. Encuentre un intervalo de confianza de 90% sobre la media de error de medición.

292

PROBABILIDAD Y ESTADÍSTICA

c) Un competidor afirma que con ese modelo de telémetro en particular se sobreestima la distancia, en promedio, al menos en 0.50 m. ¿Existen razones para dudar de esa afirmación, con base en los datos observados? Explique su respuesta. d ) De conformidad con la regla de probabilidad normal (sección 4.5), ¿consideraría inusual que un solo error de medición excediera de 0.15 m? Explique su respuesta. 13. Uno de los problemas clásicos de la investigación de operaciones es el problema de enrutamiento de vehículos. Éste consiste en estudiar un sistema compuesto por un número de clientes con ubicación conocida y demanda de un producto que se abastece desde un solo depósito mediante un número de vehículos de capacidad conocida. El objetivo del estudio es establecer la ruta de los vehículos de manera que se minimice la distancia recorrida total. Se investigan las características de un nuevo algoritmo. Se obtienen los datos siguientes sobre el tiempo de CPU necesario para resolver el problema: 2.0 0.1 2.2 3.1 2.5

1.4 3.5 2.3 1.5 3.9

3.5 2.2 2.7 1.5 0.8

2.3 2.1 1.9 2.6 1.8

3.2 2.4 1.7 2.8 3.3

3.6 1.5 1.8 2.5 3.7

a) Estime la media y desviación estándar del tiempo necesario para resolver un problema con ese algoritmo. b) Calcule un intervalo de confianza de 99% sobre la media de tiempo necesario para solucionar un problema. c) Otro algoritmo, escrito en otro lenguaje, requiere en promedio 6.6 s de tiempo de CPU. Las soluciones obtenidas son equivalentes. ¿Acaso el nuevo algoritmo parece más eficaz que el otro en cuanto al tiempo de cómputo? Explique su respuesta. 14. Se vigila una muestra de 150 t de mineral de cobre para estimar el número promedio de libras (lb) de cobre recuperados por tonelada de mineral beneficiado. Se obtiene una media muestral de 11 lb, con desviación estándar de 3 lb. Construya un intervalo de confianza de 95% sobre el número promedio de libras de cobre recuperados por tonelada de mineral beneficiado. 15. Se produce un cierto volumen de gas natural con cada barril de petróleo crudo. Ese gas escapa del petróleo cerca del extremo superior de la tubería de los pozos. En un intento por estimar el volumen de gas natural disponible de pozos kuwaitíes, se obtienen los datos siguientes respecto de X, el número de pies cúbicos de gas obtenido por barril de crudo (basado en información de “The Oil/Gas Separator: A New Cap for Quenching Oil Well Fires”, Energy and Technology, diciembre de 1991, p. 1): 290 420 410 610 470 680

610 600 810 510 380 530

790 350 620 390 550 650

670 800 560 480 570 1 000

770 920 550 630 730 720

a) Construya un diagrama de tallo y hoja de los datos. ¿Parece satisfacerse el supuesto de normalidad subyacente a los procedimientos T ? Explique su respuesta.

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

293

b) Prepare una gráfica de caja de los datos. ¿Identifica puntos de datos como valores atípicos? c) Estime un intervalo de confianza de 99% para el volumen promedio de gas natural producido por barril de crudo en los pozos kuwaitíes. d ) Si interesara un intervalo basado en los mismos datos que fuera más angosto que el calculado en el inciso c, ¿qué debería hacer para lograrlo? 16. El acabado superficial de protección anticorrosiva suele ser el último proceso de manufactura que tiene lugar antes de la venta o ensamblaje de partes metálicas usadas en productos como los automóviles o aparatos electrodomésticos. Es frecuente que el proceso se realice en talleres especializados. Una técnica para la aplicación de plateado de zinc brillante al acero es sometida a prueba. La variable de estudio es el grosor del recubrimiento obtenido, en micras. Se obtienen los datos siguientes en 25 franjas de prueba (basado en cifras de “The Cinderella of Manufacturing”, D. J. C. Hemsley, Professional Engineering, vol. 5, núm. 7, julio/agosto de 1992, pp. 18-20): 6.4 8.5 7.1 7.8 7.5

8.3 7.0 8.1 7.3 7.8

7.9 7.4 7.5 8.4 7.6

7.5 7.2 7.7 8.0 8.4

6.9 6.8 8.5 7.8 9.9

a) Construya un diagrama de doble tallo y hoja de los datos. Comente la posible distribución de esta variable aleatoria. b) Elabore una gráfica de caja de los datos e identifique los puntos de datos que resaltan como valores atípicos. c) Suponga que la investigación revela que el punto de datos inusual que se identifica con la gráfica de caja es una franja de prueba dejada inadvertidamente en la solución de recubrimiento más tiempo que el especificado en el procedimiento. ¿Qué debe hacerse con este punto de datos? d ) Prepare un intervalo de confianza de 95% sobre grosor promedio del recubrimiento obtenido con el nuevo proceso. e) ¿Le sorprendería la afirmación de que ese promedio es de 7.7 µm? Explique su respuesta con base en el intervalo de confianza calculado. 17. (Intervalo de confianza de un lado sobre µ.) Un intervalo de confianza de “un lado” puede usarse para estimar el valor máximo o mínimo de una media poblacional. Un intervalo de la forma (– ∞, L], tal que P[µ ≤ L] 1 − α permite asignar límites al valor máximo de la media poblacional. La fórmula de ese intervalo está dada por: L = X + tα S/ n

Un intervalo de la forma [L, ∞] posibilita aplicar límites al valor mínimo factible de la media poblacional. La fórmula de tal intervalo es: L = X − tα S / n Use los datos siguientes de X, el tiempo que un avión comercial permanece estacionado junto a la sala de abordaje durante un vuelo directo, para calcular un intervalo de confianza de 95% de un lado que asigne un límite al tiempo mínimo esperado, en minutos, para µ:

294

PROBABILIDAD Y ESTADÍSTICA

25

29 32 37

40 27 30

35 38 41

42 45 45

47 49 50

55 53 60

18. Se obtienen los datos siguientes sobre la concentración total de nitrógeno (en partes por millón, ppm) del agua obtenida de un lago considerado como posible fuente de agua potable de una localidad: 0.042 0.048 0.045 0.023

0.023 0.035 0.052 0.045

0.049 0.048 0.049 0.038

0.036 0.043 0.028 0.035

0.045 0.044 0.025 0.026

0.025 0.055 0.039 0.059

Calcule un intervalo de confianza de 95% unilateral del valor máximo factible para µ. La media de contenido de nitrógeno debe ser inferior a 0.07 ppm para que el lago sea aceptable como fuente de agua potable. ¿Parece satisfacer el lago dicho criterio? 19. (Tamaño de la muestra requerido para estimar µ.) Son tres los factores que determinan la amplitud de un intervalo de confianza de µ. Se trata de la confianza requerida, la variabilidad de los datos y el tamaño de la muestra. En un experimento no diseñado, el intervalo de confianza resultante puede ser tan grande que resulte casi inútil. Si se conoce σ o es posible su estimación a partir de un estudio “piloto” o preliminar pequeño, sería factible diseñar un experimento tal que el intervalo de confianza obtenido sea suficientemente angosto para resultar provechoso. Ello se logra con la selección cuidadosa del tamaño de la muestra. a) Sea d la distancia entre X el centro del intervalo de confianza, y X + zα / 2σ / n , el límite de confianza superior. Así pues, d = zα / 2σ / n . Note que el intervalo de confianza en sí tiene longitud 2d. Despeje n en la ecuación para demostrar que el tamaño de la muestra requerido en la estimación de µ a no más de d unidades, con confianza de 100(1 – α)%, es: ( zα /2 )2 σ 2 σ conocida d2 ( zα /2 )2 σˆ 2 n σ desconocida d2 b) La lectura de pantallas digitales bajo luz brillante es problemática. Un grupo de ingenieros pretende diseñar un filtro para optimizar la luminancia (brillantez) y el contraste de crominancia (color). A tal efecto, se planea estimar el número promedio de pies-candela en la cabina de mando de aviones comerciales, donde se usará el filtro. Se realiza un estudio piloto preliminar y se obtiene una desviación estándar estimada de 500 pies-candela. ¿Cuán grande debe ser la muestra para estimar µ a no más de 50 pies-candela con una confianza de 95%? c) Un grupo de ingenieros mineros debe estimar el grado promedio de un mineral de cobre con el fin de determinar si la pureza en un área particular es suficiente para que sea factible su beneficio a cielo abierto. La experiencia con este tipo de mineral indica que el grado varía entre 1 y 4% de cobre. La regla de probabilidad normal y el ejercicio 25 del capítulo 6 implican que una estimación aproximada de σ es 1/4 del rango, o sea, 0.75. ¿Cuántos orificios de prueba deben perforarse para estimar µ a no más de 0.1% con una confianza de 90%? 20. Se diseñó un estudio para la estimación del tiempo medio que requiere ensamblar un conjunto de microprocesadores para uso en televisores a color. Se necesita una estimación de esa media para n

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

295

asignar cuotas de producción razonables a los trabajadores de la línea de montaje. Se emprende un estudio piloto y se obtienen los datos siguientes sobre el tiempo de ensamble, en minutos: 1.0 2.0

1.5 2.4

2.2 2.6

3.0 2.3

2.7 1.7

a) Estime σ con base en los datos precedentes. b) ¿Cuán grande se requiere que sea la muestra para estimar µ a no más de 0.2 min, con una confianza de 99%? Sección 8.3

21. En 1969, en promedio 8% de la basura doméstica en Estados Unidos era metálica. En virtud del aumento en las actividades de reciclaje, se espera haber reducido dicha proporción. Se realiza un experimento para verificarlo. a) Especifique las hipótesis nula y alternativa correctas del experimento. b) Explique, de manera práctica, qué ocurre si se comete un error tipo I. c) Explique, de manera práctica, qué ocurre si se comete un error tipo II. d ) Explique, de manera práctica, qué significado tiene afirmar que se rechazó H0 con el nivel de significación α = 0.05. 22. El valor medio de radiación de fondo en Estados Unidos es de 0.3 rem por año. Se piensa que ha aumentado como consecuencia del uso creciente de materiales radiactivos. a) Especifique las hipótesis nula y alternativa apropiadas para documentar ese posible incremento. b) Explique, de manera práctica, qué ocurre si se cometen errores tipos I y II. 23. Como se menciona en el capítulo 1, un aspecto importante en la ingeniería es la creación de modelos. Una vez ideado un modelo teórico para explicar un fenómeno físico, debe ponerse a prueba para verificar si genera resultados de naturaleza realista. Es frecuente que esas pruebas se realicen mediante simulación en computadoras. En la prueba de modelos, se ponen a prueba: H0: el modelo es creíble H1: el modelo es increíble a) Explique en forma práctica qué ocurre si se comete un error tipo I. La probabilidad de cometerlo se ha llamado “riesgo del creador de modelos”. ¿Aprecia la razón de que sea apropiada esa expresión? b) Explique de modo práctico qué ocurre si se comete un error tipo II. La probabilidad de cometerlo se llama “riesgo del usuario de modelos”. ¿Le parece apropiado? 24. Se realiza una prueba de ADN para ver si las evidencias pueden exonerar a un sospechoso. Desde la perspectiva del sospechoso, se ponen a prueba: H0: el ADN es del sospechoso H1: el ADN no es del sospechoso Suponga que se comete un error tipo I. ¿Qué ocurrió en este contexto? Suponga también que la prueba de ADN tiene potencia alta. ¿Qué significa ello?

296

PROBABILIDAD Y ESTADÍSTICA

25. Suponga que se quiere probar: H0: p ≤ 0.4 H1: p > 0.4 con base en una muestra de tamaño 15. a) Calcule la región crítica para un nivel α 0.05. b) ¿Se rechazará H0 si x = 11 cuando se recopilen los datos? ¿Cuál tipo de error se cometería? 26. Suponga que se quiere probar: H0: p ≥ 0.7 H1: p < 0.7 con base en una muestra de tamaño 10. a) Calcule la región crítica para un nivel α 0.05. b) ¿Se rechazará H0 si x = 5 cuando se recopilen los datos? ¿Qué tipo de error se cometería? 27. Es práctica común someter bienes duraderos a esfuerzos mayores que los usuales para obtener datos de fallas en un breve tiempo de prueba. Se las denomina pruebas de vida acelerada. El equipo usado en cómputo utiliza semiconductores de óxidos metálicos. Se piensa que los “cortocircuitos de óxidos” causan la mayor parte de fallas prematuras en circuitos integrados de tales semiconductores. A fin de verificar esta afirmación, se aplica una prueba de pantalla de alto voltaje a un cierto número de circuitos y se observan 15 fallas prematuras. Sea X el número de fallas debidas a cortocircuitos de óxidos. a) Especifique las hipótesis alternativa y nula apropiadas. b) Si H0 es verdadera y p = 0.5, ¿cuál es el número esperado de fallas debidas a cortocircuitos en los 15 intentos? c) Se acuerda rechazar H0 y aceptar H1 si X vale 11 o más. ¿A qué nivel se preestablecería α ? d ) Calcule β si p vale 0.6, 0.7, 0.8 y 0.9. e) Calcule la potencia de la prueba si p tiene los valores del inciso d. f ) ¿Se rechazaría H0 si se observan 12 fallas prematuras debidas a cortocircuitos de óxidos cuando se recopilen los datos? ¿Cuál tipo de error se cometería? g) ¿Se rechazaría H0 si se observan 10 fallas prematuras debidas a cortocircuitos de óxidos cuando se recopilen los datos? ¿Cuál tipo de error se cometería? 28. La calidad y confiabilidad se están convirtiendo en aspectos importantes del hardware y software. La experiencia muestra que la probabilidad de fallas durante las primeras 1 000 h de operación de RAM dinámica de 16 KB producida en una compañía estadounidense es de 0.2. Se espera que la nueva tecnología y controles de calidad más estrictos la hayan reducido. A fin de verificarlo, se vigilarán 20 sistemas durante 1 000 h y se registrará el número de fallas. a) Especifique las hipótesis alternativa y nula apropiadas. b) Explique en términos prácticos las consecuencias de cometer errores de tipos I y II. c) ¿Cuál es el número esperado de fallas durante las primeras 1 000 h en los 20 intentos si H0 es verdadera y p = 0.2?

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

297

d ) Considere rechazar H0 a favor de H1 si el número observado de fallas X es cuando mucho de 1. ¿A qué nivel se preestablecería α de esta manera? e) Suponga que es esencial que la prueba permita distinguir entre tasas de fallas de 0.2 y 0.1. Calcule la probabilidad de que la prueba, tal como está diseñada, no permita lograrlo. En otras palabras, determine β si p = 0.1. Calcule también la potencia de la prueba con dicho valor de p. f ) Los resultados del inciso e indican que la prueba, como está diseñada, no permite distinguir entre p = 0.1 y p = 0.2. Sin modificar el tamaño de la muestra n = 20, ¿podría recomendar una forma de modificar la prueba con la que se disminuya β y se aumente la potencia para detectar una tasa de fallas de 0.1? ¿Será todavía α suficientemente baja para seguir siendo aceptable? De no ser así, ¿puede aconsejar una forma de rediseñar el experimento con la que tanto α como β sean suficientemente bajas para resultar aceptables? 29. En el ejemplo 8.3.3, se pone a prueba: H0: p ≤ 0.5 H1: p > 0.5

(la mayor parte de los automóviles en circulación tiene faros mal alineados)

con el nivel α = 0.0577 al aceptar que se rechace H0 si al menos 14 de los 20 automóviles de la muestra tienen los faros mal alineados. Se afirma que los valores de X que son demasiado altos para ocurrir al azar cuando p = 0.5 también lo son si p < 0.5. En otras palabras, si estos valores son infrecuentes con p = 0.5, lo son incluso en mayor grado con p < 0.5. Con el fin de verificar si ello es verdad, calcule P[X ≥ 14] cuando p = 0.4, 0.3, 0.2 y 0.1. ¿Es cada una de estas probabilidades menor que 0.0577, como se esperaba? 30. Una muestra de tamaño 9 de una distribución normal, con σ 2 = 25, se usa para probar que: H0: µ = 20 H1: µ = 28 La estadística de prueba usada es la media muestral X. Se acuerda rechazar H0 y aceptar H1 si el valor observado de X es mayor de 25. a) ¿Cuál es la distribución de X si H0 es verdadera? b) En el diagrama de la figura 8.11, sombree la región cuya área es α. c) Calcule α. Recuerde que dicho cálculo se efectúa bajo el supuesto de que H0 es verdadera. d ) ¿Cuál es la distribución de X si H1 es verdadera?

0

FIGURA 8.11

20

25

28

x

298

PROBABILIDAD Y ESTADÍSTICA

e) En el diagrama de la figura 8.11, sombree la región cuya área es β. Recuerde que se calcula bajo el supuesto de que H1 es verdadera. f ) Determine β. g) Calcule la potencia de la prueba. h) La desviación estándar de X disminuye si el tamaño muestral aumenta. ¿Cuál es el efecto geométrico de dicho cambio en las dos curvas de la figura 8.11? i) ¿Cuál es el efecto en α y β de aumentar el tamaño muestral sin modificar el punto crítico? Sección 8.4

31. Cuando un automovilista tiene problemas de frenos, especialmente la desviación impredecible hacia un lado, la causa es una de las balatas. Los elementos raros, en particular el titanio, pueden combinarse con otros para formar diminutas partículas de carbonitruro de titanio que modifican el grado de fricción entre la balatas y el disco o tambor, con lo que producen desgaste desigual. La proporción de titanio en las balatas no debe ser mayor de 5%. Se realiza un estudio para detectar una situación en la que la media porcentual de titanio en las balatas que produce un fabricante es mayor de 5%. a) Especifique las hipótesis alternativa y nula apropiadas. b) Analice las consecuencias prácticas de cometer errores tipo I y II. c) Una muestra de 100 balatas revela una media porcentual de x = 0.051. Suponga que σ = 0.008. Calcule el valor P de la prueba. ¿Cree que debe rechazarse H0? Explique su respuesta. ¿A qué tipo de error estaría expuesto ahora? 32. La norma de emisión de partículas para vehículos a diesel es de 0.6 g/mi. Se espera que un nuevo diseño de motor las haya reducido a valores que son inferiores a dicha norma. a) Especifique las hipótesis alternativa y nula apropiadas para confirmar que el nuevo motor tenga media de emisiones inferior a la norma vigente. b) Analice las consecuencias prácticas de cometer errores de tipos I y II. c) Una muestra de 64 motores probados revela una media de emisiones de x = 0.5 g/mi. Suponga que σ = 0.4. Calcule el valor P de la prueba. ¿Cree que debe rechazarse H0? Explique su respuesta. ¿A cuál tipo de error estaría expuesto ahora? 33. Se piensa que más de 15% de los altos hornos usados en la producción estadounidense es todavía de tipo abierto. Se selecciona y examina una muestra aleatoria de 40 hornos para comprobarlo. a) Especifique las hipótesis alternativa y nula apropiadas y necesarias para sustentar esa afirmación. b) Cuando se recopilan los datos, resulta que nueve de los 40 hornos inspeccionados son hornos abiertos. Use la aproximación normal de la distribución binomial (sección 4.6) para calcular el valor P de la prueba. ¿Piensa que debe rechazarse H0? Explique su respuesta. ¿A qué tipo de error estaría expuesto ahora? 34. Se sabe que se producen artículos defectuosos, inclusive en líneas de montaje automatizadas. En un proceso específico, suele producirse 5% de artículos defectuosos. Si la proporción es mayor que la indicada, la línea de montaje debe pararse para realizar ajustes. a) Especifique las hipótesis alternativa y nula apropiadas y necesarias para detectar una situación en la que la proporción de artículos defectuosos producidos excede de 0.05. b) Analice las consecuencias prácticas de cometer errores de tipos I y II.

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

299

c) Se selecciona y prueba una muestra aleatoria de 100 artículos. De ellos, siete resultan defectuosos. Use la aproximación normal de la distribución binomial para calcular el valor P de la prueba. ¿Cree que debe rechazarse H0? Sección 8.5

35. Calcule el o los puntos críticos para emprender una prueba de hipótesis sobre la media, con σ 2 desconocida, para una: a) prueba de cola izquierda con n = 25 y α = 0.05 b) prueba de cola izquierda con n = 150 y α = 0.10 c) prueba de cola derecha con n = 20 y α = 0.025 d ) prueba de cola derecha con n = 16 y α = 0.01 e) prueba de dos colas con n = 20 y α = 0.10 f ) prueba de dos colas con n = 30 y α = 0.05 36. Se desarrolla un nuevo chip de microcomputadora de 8 bits que se puede reprogramar sin extraerlo de la computadora. Se afirma que es factible programar un byte de memoria en menos de 14 s. a) Especifique las hipótesis alternativa y nula apropiadas y necesarias para verificar esa afirmación. b) ¿Cuál es el punto crítico con nivel α = 0.05 y tamaño muestral 15? c) Se obtienen los datos siguientes de X, el tiempo necesario para reprogramar un byte de memoria: 11.6 13.1 13.3

14.7 14.2 13.4

12.9 15.1 13.0

13.3 12.5 13.8

13.2 15.3 12.3

Construya un diagrama de tallo y hoja de los datos. ¿Parece razonable el supuesto de normalidad? d ) Ponga a prueba la hipótesis nula. ¿Puede rechazarse H0 con el nivel α = 0.05? Interprete el resultado en términos prácticos. ¿A qué tipo de error estaría expuesto ahora? 37. El ozono es un componente del smog que puede causar daños a plantas sensibles, incluso si sus concentraciones son bajas. En 1979, se estableció en EU una norma federal de ozono de 0.12 ppm. Se piensa que sus concentraciones actuales en las corrientes de aire sobre Nueva Inglaterra exceden dicho nivel. A fin de verificarlo, se obtienen muestras de aire en 30 estaciones de monitoreo de dicha región. a) Especifique las hipótesis alternativa y nula apropiadas para verificar esa afirmación. b) ¿Cuál es el punto crítico de una prueba con nivel α = 0.01 y tamaño muestral 30? c) El análisis de los datos revela media muestral 0.135 y desviación estándar muestral 0.03. Use esos datos para poner a prueba H0. ¿Puede rechazarse la hipótesis nula con el nivel α = 0.01? ¿Qué significa esto en términos prácticos? d ) ¿Cuál supuesto se hace respecto de la distribución de la variable aleatoria X, la concentración atmosférica de ozono? 38. Se diseñó un modelo de estrategia de exportación de petróleo de Arabia Saudita a partir de entrevistas con economistas informados. El modelo se usará para estimar la media de barriles de petróleo producidos diariamente en ese país. La utilidad del modelo se verificará parcial-

300

PROBABILIDAD Y ESTADÍSTICA

mente al comparar la media predicha para el año 1980 contra el valor conocido de ese año, a saber, 9.5 millones de barriles diarios. a) Encuentre los puntos críticos para probar: H0: µ = 9.5 H1: µ ≠ 9.5

39.

40.

41.

42.

con el nivel α = 0.05, basado en una muestra de 50 simulaciones. b) En relación con los datos recopilados, x = 9.8 y s = 1.2. Ponga a prueba H0. ¿Es posible rechazar H0 con el nivel α = 0.05? ¿Existen datos de que el modelo sea inadecuado, con base en la información proporcionada? ¿A qué tipo de error estaría expuesto ahora? Se desarrolla un transistor de bajo ruido para uso en productos de cómputo. Se afirma que su nivel medio de ruido será menor que los 2.5 dB de los productos que se utilizan actualmente. a) Especifique las hipótesis alternativa y nula apropiadas para verificar la afirmación. b) Se obtienen x = 1.8 y s = 0.8 con una muestra de 16 transistores. Calcule el valor P de la prueba. ¿Piensa que debe rechazarse H0? ¿Qué supuesto se hace acerca de la distribución de la variable aleatoria X, el nivel de ruido de los transistores? c) Explique, en el contexto de este problema, qué conclusión puede extraerse acerca del nivel de ruido de esos transistores. ¿Qué ocurrirá si se comete un error tipo I? ¿Cuál es la probabilidad de que se cometa ese tipo de error? El río Elba es importante en la ecología de Europa Central, ya que recibe gran parte del agua de la región. La industrialización creciente ha generado temores de disminución en el contenido mineral del suelo. Ello se reflejaría en aumento de los valores de ciertos minerales en el agua del Elba. Un estudio del río, efectuado en 1982, indicó que el valor medio de silicio era de 4.6 mg/L. a) Especifique las hipótesis alternativa y nula apropiadas y necesarias para obtener datos que sustenten la afirmación de que ha aumentado la concentración media de silicio en el río. b) Se obtienen x = 5.2 y s = 1.6 con tamaño muestral 28. Calcule el valor P de la prueba. ¿Piensa que debe rechazarse H0? c) ¿Qué conclusión práctica puede extraerse de esos datos? El mantenimiento mediante carbón es una tecnología muy reciente. La norma de emisión de las plantas que queman carbón es de 4.8 lb de SO2/millón de BTU/promedio por 24 h. En un intento de disminución de las emisiones a niveles inferiores al mencionado, los ingenieros experimentan con la quema de una mezcla de carbón de contenidos bajo y alto de azufre. a) Especifique las hipótesis alternativa y nula necesarias para sustentar la afirmación de que la nueva mezcla reduce las emisiones hasta quedar por debajo de la norma que establece el gobierno. b) Calcule el valor P de la prueba si una muestra de 200 mediciones genera una media muestral de 4.7, con desviación estándar muestral de 0.5. ¿Piensa que debe rechazarse H0? ¿Qué significado tiene esto en términos prácticos? La tecnología láser se usa para detectar movimientos estructurales en puentes y grandes edificios. Estos equipos deben ser muy precisos. En pruebas de laboratorio, se obtienen mediciones del error de dichos equipos. Los datos obtenidos se usan para probar: H0: µ = 0 H1: µ ≠ 0

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

301

Se obtiene x = 0.03 mm en 100 m y s = 0.1 con una muestra de 25 mediciones. Calcule el valor P de esta prueba de dos colas. ¿Piensa que debe rechazarse H0? Interprete el resultado en términos prácticos. 43. Las almejas, mejillones y otros seres vivos que se adhieren a los túneles de entrada de agua de plantas hidroeléctricas se llaman macrocontaminantes. A falta de control, estos organismos pueden inhibir el flujo de agua por los túneles. Se han probado diversas técnicas para controlar el problema, entre ellas el aumento del gasto y el recubrimiento de los túneles con Teflón, cera y grasa. En un año, en una planta dada un túnel acumula una capa de macrocontaminantes que promedia 5 pulg de espesor a lo largo del túnel. Se pone a prueba una nueva pintura de aceite de silicón. Se espera que la pintura reduzca la cantidad de macrocontaminantes adheridos a la pared del túnel. Se limpia el túnel, se aplica la nueva pintura y se pone de nuevo en funcionamiento bajo condiciones normales de trabajo. Al cabo de un año, se mide el grosor en pulgadas de la capa de macrocontaminantes en 16 puntos del túnel seleccionados aleatoriamente. Se obtienen los resultados siguientes (basado en información de “Consider Non-fouling Coatings for Relief from Macrofouling”, A. Christopher Gross, Power, octubre de 1992, pp. 29-34): 4.2 4.4 5.0 5.1

4.5 4.0 6.2 3.5

4.1 4.7 3.6 3.0

4.6 4.3 4.5 2.8

a) Indique la hipótesis de investigación. b) ¿Los datos sustentan la afirmación de que la nueva pintura reduce el espesor promedio de los macrocontaminantes en el túnel? Explique su respuesta con base en el valor P de la prueba. c) ¿Se habría rechazado H0 si se hubiera preestablecido un nivel α de 0.05? d ) Los datos del problema son ficticios. En realidad, la pintura analizada en el artículo de la revista fue mucho más efectiva que lo indicado por los datos. Si los datos presentados fueran reales, ¿habría considerado, desde el punto de vista práctico de la ingeniería, que la pintura era un adelanto importante en el control de la acumulación de macrocontaminantes? Explique su respuesta. 44. Las refinerías, acerías, plantas de procesamiento de alimentos y otras industrias separan el aceite y el agua con polielectrolitos. Éstos funcionan mejor si se controla estrechamente el pH. Por ejemplo, el agua usada en el cromado suele tener pH de 2.5, que debe neutralizarse antes de verterla en el entorno. Se obtienen los datos siguientes del pH en muestras de aguas residuales tratadas (basado en un análisis de “How to Choose a pH Measurement System”, David M. Gray y Jeff Marshall, Pollution Engineering, noviembre de 1992, pp. 45-47): 6.2 7.0 7.1

6.5 7.2 7.0

7.6 6.8 7.1

7.7 7.5 7.8

7.0 8.1 8.5

A partir de esos datos, ¿existen evidencias de que el proceso de tratamiento no genera pH de 7 en promedio, como se pretende? Explique su respuesta con base en el valor P de la prueba de dos colas. ¿Se habría rechazado H0 si se hubiera preestablecido un nivel α de 0.10?

302

PROBABILIDAD Y ESTADÍSTICA

45. En virtud del problema del terrorismo, en Estados Unidos ahora se observa la tendencia a usar la “correspondencia de equipaje” en vuelos nacionales. Ello significa que no se permite la salida de un vuelo cuando un pasajero registra su equipaje y no aborda el avión. Se piensa que la demora promedio que causa tal verificación es menor de 7 min. Se obtienen los datos siguientes con una muestra de 100 vuelos en los que se aplica dicha medida: 8.8 7.4 8.9 7.9 6.5 7.1 7.7 7.2 6.5 8.0

8.3 5.9 8.0 7.3 6.1 6.2 7.8 6.4 6.2 6.2

7.2 7.6 7.9 7.7 6.1 7.5 8.1 5.5 6.6 7.6

8.3 6.6 4.8 6.8 5.2 5.2 6.2 6.9 6.5 6.2

6.6 5.7 7.8 6.9 4.9 7.4 7.8 6.2 7.3 6.4

7.1 6.3 6.2 6.2 6.6 6.6 7.0 6.7 7.8 9.0

8.0 7.4 5.5 7.8 5.7 7.7 9.8 7.1 6.6 6.7

8.6 7.6 6.3 7.9 5.8 6.4 5.4 7.4 5.8 7.5

7.9 7.6 6.8 8.1 8.9 7.3 7.4 5.6 6.3 6.5

7.4 6.8 6.5 7.2 7.0 5.5 5.6 7.4 6.3 5.6

Especifique la hipótesis de investigación y calcule el valor P de la prueba. Si la demora menor de 7 min es aceptable para los pasajeros y no causa alteración excesiva de los horarios, ¿recomendaría su aplicación con base en los resultados del estudio? 46. (Aproximación del tamaño muestral.) En la prueba de la hipótesis H0: µ = µ0, el experimentador puede especificar α en el nivel que le convenga. Sin embargo, el valor de β depende no sólo de la selección de α, sino también de la diferencia entre µ0 y el valor alternativo µ1. Cuanto más separados estén esos valores, tanto más probable que sea factible distinguir uno de otro. En el diseño de un experimento, interesa seleccionar un tamaño muestral que brinde probabilidad alta de rechazar H0 cuando existe una diferencia práctica verdadera entre µ0 y µ1. En otras palabras, se pretende que β tenga valor bajo. Dista de ser sencilla la selección del tamaño apropiado para la prueba T. El problema se debe al hecho de que la estadística de prueba no tiene distribución T cuando H0 no es verdadera. En vez de ello, posee lo que se llama distribución T no central. Por fortuna, se cuenta con tablas de esa distribución que permiten determinar el tamaño muestral apropiado para probar H0: µ = µ0 con diversos valores de α, β y ∆, donde ∆ = |µ0 − µ1|/σ y σ de la desviación estándar de X. Un ejemplo de ello es la tabla VII del apéndice A. En seguida, se ilustra su uso. Ejemplo. Se pondrá a prueba H0: µ = 10 contra H1: µ > 10 con nivel α = 0.05. Suponga que se pretende tener certeza de 90% de detectar una situación en la que µ haya llegado hasta el valor 12. Suponga también que se efectúa un estudio piloto y σˆ = 4. En este caso:



| µ0 − µ1|/σˆ = |10 − 12|/4 = 0.5

α = 0.05

y

β = 0.1

En la tabla VII del apéndice A, puede verse que se necesita tamaño de muestra n = 36 para una prueba unilateral con estas características. a) Un estudio piloto indica que la desviación estándar de una variable aleatoria X es 1.25. Indique cuán grande debe ser la muestra para probar: H0: µ = 20 H1: µ > 20

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

303

con el nivel α = 0.05 y el nivel β = 0.05, ¿si es importante que sea posible distinguir entre µ = 20 y µ = 21? b) En el ejercicio 37, se puso a prueba: H0: µ = 0.12 H1: µ > 0.12 con el nivel α = 0.01, basado en un tamaño muestral 30. A partir de este estudio, se aprecia que σˆ = 0.03. Suponga que la concentración media de ozono 0.14 es tan grave que debe tenerse probabilidad de 0.95 de detectarla. Indique de manera aproximada cuán grande se requiere que sea la muestra. c) En el ejercicio 39, se puso a prueba: H0: µ = 2.5 H1: µ < 2.5 El tamaño muestral 16 generó s = 0.8. Suponga que no vale la pena la comercialización de los nuevos transistores, salvo que reduzcan el nivel medio de ruido hasta un valor máximo de 2 dB. Indique de manera aproximada ¿cuán grande tendría que ser la muestra para distinguir entre medias de 2.5 y 2 si α = 0.25 y β = 0.05. Sección 8.6

47. Un nuevo proceso para la producción de partes de precisión está en estudio. El proceso consiste en mezclar polvo metálico fino con una resina plástica, inyectar la mezcla en un molde y luego retirar la resina con un solvente. Se obtienen los datos siguientes sobre partes que deben tener diámetro de 1 pulg y cuya desviación estándar no debe exceder de 0.0025 pulg. 1.0030 1.0041 1.0021

0.9997 0.9988 1.0028

0.9990 1.0026 1.0002

1.0054 1.0032 0.9984

0.9991 0.9943 0.9999

En relación con estos datos, x = 1.00084 y s = 0.00282. a) Pruebe: H0: µ = 1 H 1: µ ≠ 1 con el nivel α = 0.05. b) Pruebe: H0: σ = 0.0025 H1: σ > 0.0025 con el nivel α = 0.05.

304

PROBABILIDAD Y ESTADÍSTICA

48. Las piscinas bajo techo se caracterizan por sus propiedades acústicas deficientes. El objetivo es diseñar una piscina de manera tal que el tiempo promedio para que desaparezca un sonido de baja frecuencia sea cuando mucho de 1.3 s, con desviación estándar a lo sumo de 0.6 s. Se realizan simulaciones en computadora con un diseño preliminar, para ver si se exceden esas normas. Se obtienen los datos siguientes sobre el tiempo necesario para que desaparezca un sonido de baja frecuencia: 1.8 2.8 4.6 5.3 6.6

3.7 5.6 0.3 4.3 7.9

5.0 5.9 2.5 3.9 3.6

5.3 2.7 1.3 2.1 2.7

6.1 3.8 4.4 2.3 3.3

0.5 5.9 4.6 7.1 3.3

En relación con esos datos, x = 3.97 y s = 1.89. a) Pruebe: H0: µ = 1.3 H1: µ > 1.3 con el nivel α = 0.01. b) Pruebe: H0: σ = 0.6 H1: σ > 0.6 con el nivel α = 0.01. ¿Parecen satisfacerse las especificaciones de diseño? 49. La incompatibilidad siempre ha sido problemática en el trabajo con computadoras. Se realizan pruebas de un nuevo convertidor digital de frecuencias de muestreo. El dispositivo toma las frecuencias de muestreo de 30 a 52 kHz de longitudes de palabra de 14 a 18 bits con formato arbitrario y las convierte en una frecuencia de muestreo de salida. Se piensa que el error de conversión tiene desviación estándar menor de 150 ps. Se obtienen los datos siguientes acerca del error de muestreo en 20 pruebas de dispositivo: 133.2 –81.7 56.9 –57.3

–11.5 314.8 44.4 –43.8

–126.1 147.1 1.9 –95.5

17.9 –70.4 –4.7 –1.2

139.4 104.3 96.1 9.9

En relación con estos datos, x = 28.69 y s = 104.93. a) Pruebe: H0: µ = 0 H1: µ ≠ 0 con el nivel α = 0.1.

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

305

b) Pruebe: H0: σ = 150 H1: σ < 150 con el nivel α = 0.1. ¿Parece ser el convertidor tan preciso como se afirma? 50. Use los datos del ejercicio 17 para poner a prueba la hipótesis nula de que la desviación estándar en el tiempo de compuerta es menor de 10 min. Sección 8.7

51. En cada uno de los casos siguientes, use la prueba de signo para decidir si se rechaza H0: M = M0 y se acepta la hipótesis alternativa que aparece a continuación, con nivel α = 0.05, basado en los datos que se indican. No elimine ceros. a) H1: M > M0; n = 15, Q+ = 13, sin ceros. b) H1: M > M0; n = 20, Q+ = 15, sin ceros. c) H1: M > M0; n = 20, Q+ = 15, con tres ceros. d ) H1: M < M0; n = 10, Q+ = 1, sin ceros. e) H1: M < M0; n = 10, Q+ = 1, con un cero. f ) H1: M ≠ M0; n = 15, Q+ = 2, sin ceros. g) H1: M ≠ M0; n = 15, Q+ = 2, con un cero. ¿Cuál es el valor de P de la prueba en cada uno de los ceros anteriores? 52. Un grupo de ingenieros diseña los dispositivos de seguridad para uso en la nueva atracción de un parque de diversiones. Se piensa que la estatura media de los clientes de esa atracción es mayor de 68 pulg. ¿Esa afirmación se sustenta en los datos, con base en la prueba de signo? Fundamente su respuesta con el cálculo del valor P de la prueba de signo conservadora. Estatura en pulg 65 74 70 69

73 74 66 70

72 66 72 73

71 68 67 70

68 69 73 74

53. Las básculas digitales suelen requerir ajustes antes de ponerse en uso, incluso con su fabricación minuciosa. Salvo que se cometan errores sistemáticos, el cero aparente de la báscula antes de los ajustes debe fluctuar en torno al cero verdadero. En otras palabras, algunas básculas dan un peso que es un poco mayor que el real, y otras, peso un poco menor que el verdadero. Se obtienen los datos siguientes sobre la exactitud del cero: mayor menor

menor menor

mayor menor

mayor mayor

mayor mayor

A partir de esos datos, ¿es posible rechazar H0: M = 0 y aceptar H1: M > 0 con el nivel α = 0.05? 54. En el ejemplo 8.7.2, fue posible rechazar: H0: M = 120 H1: M < 120

306

PROBABILIDAD Y ESTADÍSTICA

con el nivel α = 0.05. Si se tuviera que usar la prueba de signo, que hace caso omiso de las calificaciones de diferencias, ¿se podría haber rechazado H0 con dicho nivel? Explique su respuesta mediante el cálculo de P[Q+ ≤ 2|n = 8 y p = 1/2]. 55. Se realiza un experimento para el tratamiento de agua residual de arena de alquitrán para indagar si un nuevo proceso de tratamiento elimina más carbono orgánico total que el proceso de tratamiento estándar, del cual se sabe que elimina una mediana de 40 mg/L en un tiempo de detención fijo. El experimento se reproduce 10 veces bajo las mismas condiciones experimentales y las cantidades totales de carbono orgánico eliminadas son 38.8, 53.6, 39.0, 51.6, 40.1, 46.9, 40.9, 44.9, 41.0 y 43.2. a) ¿Cuál es el valor de E[W ]? b) ¿Se tienen datos de que el nuevo proceso elimina una cantidad de carbono orgánico total significativamente mayor que con el proceso estándar, en el nivel 0.05? 56. En un intento por determinar cuántos consultores se necesitan para responder las preguntas de los usuarios en un centro de cómputo, se recopilan los datos siguientes de X, el tiempo en minutos necesario para contestar a una indagación telefónica: 1.5 1.3 6.3

1.0 2.1 5.6

5.0 1.7 5.1

1.9 6.5 2.5

3.0 4.2 6.9

a) ¿Cuál es el valor de E[W ]? b) Con base en la prueba de rango con signo, ¿es posible llegar a la conclusión de que la mediana de tiempo necesario es menor de 5 min? Explique su respuesta a partir del valor P de la prueba. (Un resultado de cero se le debía dar al menor rango y asignarle el signo algebraico menos favorable para rechazar la hipótesis nula.) 57. Se realiza un estudio de juntas de expansión usadas en puentes. Se piensa que esas juntas se expanden más que lo especificado en su diseño, lo que genera grietas en el pavimento cerca de la junta. La mediana de expansión de diseño a 95ºF es de 2 pulg. Se llevan a cabo pruebas de laboratorio de 100 de esas juntas a la temperatura ambiental. a) ¿Cuál es el valor de E[W ]? b) ¿Cuál es el valor de Var [W ]? c) Especifique las hipótesis alternativa y nula apropiadas. d ) ¿Puede rechazarse H0 si |W_ | = 1 600? Explique su respuesta con base en el valor P de la prueba?

EJERCICIOS DE REPASO

58. Un grupo de consumidores pretende estimar el costo medio del sistema base de una computadora personal con ciertas especificaciones. Se piensa que esas computadoras tienen precio en el rango de $2 390 a $4 000. a) ¿Cuán grande debe ser la muestra para estimar µ a no más de $100 de lo real con confianza de 90%? b) Se obtienen los datos siguientes con una muestra aleatoria de tamaño 50 (datos en miles de dólares):

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

2.43 2.89 3.17 2.99 2.71 2.96 3.39 2.32

2.86 3.18 3.57 3.20 3.25 3.00 3.14

2.74 3.00 3.37 3.25 2.86 2.88 2.90

2.75 3.21 3.56 3.70 2.93 3.19 3.49

2.69 3.07 3.30 3.45 3.45 3.56 3.02

2.64 3.72 2.32 2.82 3.11 3.21 3.56

307

2.91 3.24 3.09 2.88 3.86 3.33 2.87

Prepare un diagrama de tallo y hoja de esos datos. Use los dígitos 2 y 3 como tallos, cinco veces cada uno. Coloque los números que empiezan con 2.0 y 2.1 en el primer tallo; los que inician con 2.2 y 2.3 en el segundo tallo, y así sucesivamente. ¿El diagrama de tallo y hoja le lleva a suponer que los datos no se extrajeron de una distribución que es cuando menos aproximadamente normal? c) Determine estimaciones insesgadas de µ y σ 2, basadas en los datos precedentes. Estime también σ. ¿Está desprovista de sesgo la estimación de σ ? d ) Calcule intervalos de confianza de 90% para σ 2 y σ. e) Calcule un intervalo de confianza de 90% sobre µ. 59. Un grupo de investigadores experimenta con un nuevo compuesto usado para unir el Teflón con el acero. Las sustancias utilizadas actualmente requieren tiempo de secado promedio de 3 min. Se piensa que el nuevo compuesto secará en un intervalo más breve. a) Especifique las hipótesis alternativa y nula necesarias para sustentar la afirmación de que el nuevo compuesto seca más rápidamente que los compuestos en uso. b) Analice las consecuencias prácticas de cometer errores de tipos I y II. c) Un estudio piloto muestra que σˆ = 0.5. Suponga que conviene la comercialización del nuevo producto si puede comprobarse que el tiempo de secado promedio es de 2.5 min o menos. ¿Cuán grande debe ser la muestra necesaria para detectar esta situación con probabilidad de 0.95 si α se fija en 0.05? d ) Se obtienen los datos siguientes al realizar el experimento: 1.4 2.4 2.6 2.2

2.1 1.7 1.9 2.2

2.8 3.7 2.8 3.4

0.9 2.7 2.8 1.9

Ponga a prueba la hipótesis nula del inciso a que antecede con nivel α = 0.05. ¿Recomendaría la comercialización del nuevo producto? 60. Se piensa que muchos de los procedimientos usados en un sofware estadístico se ejecutan en menos de 0.1 s. A fin de comprobar esta afirmación, se examina una muestra aleatoria de 20 programas, cada uno consistente exactamente en un procedimiento. a) Especifique las hipótesis alternativa y nula apropiadas y necesarias para verificar la afirmación. b) Sea X el número de programas en los que el procedimiento usado se ejecuta en menos de 0.1 s. Calcule la región crítica para una prueba con nivel α 0.025. c) Al efectuar la prueba, son 14 los programas en los que el procedimiento usado se ejecuta en menos de 0.1 s. ¿Se rechazará H0? ¿A qué tipo de error está expuesto ahora? d ) Calcule β si p = 0.6, 0.7, 0.8 y 0.9, respectivamente. e) Calcule la potencia de la prueba cuando p tiene los valores del inciso d.

308

PROBABILIDAD Y ESTADÍSTICA

61. Se usa polvo de níquel en recubrimientos para proteger equipo electrónico contra la interferencia electromagnética. Se piensa que la media del tamaño de las partículas de níquel en uno de esos recubrimientos es menor de 3 µm. ¿Los datos siguientes sustentan esa afirmación? Explique su respuesta con base en el valor P de la prueba apropiada. 3.26 1.89 2.42 2.03

3.07 2.95 1.39 3.06

2.46 3.35 1.56 1.79

1.76 3.82 2.42 2.96

62. Se quiere poner a prueba: H0: µ = 5 H1: µ > 5 con base en una muestra aleatoria de tamaño 25. La desviación estándar muestral es 2, y el valor observado de la media muestral, 5.5. ¿Cuál es el valor P de la prueba? 63. La exactitud de la artillería de un tanque se ve afectada evidentemente por el tamaño del blanco, la distancia del tanque al blanco y otros factores aleatorios, como el viento y las condiciones del terreno. Se realiza una sucesión de pruebas con un blanco estándar, de 2.30 por 3.40 m, que es el tamaño promedio de los blancos con los que probablemente se toparán los tanques de la OTAN. Cada blanco dista 3 000 m del tanque. La medición angular desde el centro del blanco hasta el punto del impacto en el blanco se indica en mil, que es un ángulo de 1/6 400 de un círculo de 360° (vea la figura 8.12). Se investiga el error de puntería del sistema que es tolerable de modo que todavía se dé en el blanco. Se obtienen los datos que aparecen al final del párrafo. Note que cero denota que se dio en el centro del blanco (sin error); los valores positivos, disparos altos, y los errores negativos, disparos bajos. (Basado en información de “Tank Gun Accuracy”, Mayor Bruce Held y Sargento Edward Sunoski, Armor, enero de 1993, p. 6):

Tanque

Centro del blanco a)

b)

Error de puntería c)

FIGURA 8.12 a) Tiro directo al centro del blanco; b) todo proyectil disparado en el ángulo que se indica debe dar en el blanco; c) medición angular desde el centro del blanco hasta el punto de impacto real = error de puntería que todavía permite dar en el blanco.

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

0.8 –0.1 0.1 –0.1 –0.2 –0.2 –0.3

– 0.3 0.3 0 –0.1 0.1 –0.2

0.2 0 0 –0.1 0.1 –0.1

0.2 0 0 0.1 –0.2 0

0 0.2 0.1 –0.1 –0.1 0

309

0 0.2 0.1 0 0 –0.1

a) Prepare un diagrama de tallo y hoja de los datos. ¿Se incluye algún valor inusual en el conjunto de datos? b) Prepare una gráfica de caja de los datos y vea si un punto de datos más bien alto puede considerarse valor atípico. c) Se piensa que el “blanco” en el que se dio cuando se obtuvo el valor atípico no fue tal, de hecho, sino más bien un error de codificación de los datos. Por ello, el valor atípico se elimina del conjunto de datos para análisis futuros. Use los datos que se tienen para calcular un intervalo de confianza de 95% del error de sistema promedio ocurrido en los disparos que dieron en el blanco. 64. Un dispositivo de reconocimiento incluye 3 000 bits. Cada bit puede estar “encendido” (su valor es 1) o “apagado” (con valor cero). Los bits pueden ser fijos o modificables. Si son fijos, el programador no puede cambiarlos. En el supuesto de que más de 95% de los bits sea fijo, el sistema se cae. Los bits son sometidos a pruebas secuenciales hasta que se identifica uno modificable. Se pretende detectar una situación en la que el sistema se caerá. La estadística de prueba es X, el número de bits muestreado para obtener el primer bit modificable. Note que, si el sistema se cae, la probabilidad de identificar un bit fijo es mayor de 0.95, y la de encontrar un bit modificable, menor de 0.05. La variable aleatoria X tiene distribución aproximadamente geométrica. Se ponen a prueba: H0: p ≥ 0.05 H1: p < 0.05

(el sistema no se cae) (el sistema se cae)

a) Explique por qué la distribución de X sólo es aproximadamente geométrica. Dicho de otra manera, ¿cuál propiedad geométrica no se satisface estrictamente? b) ¿Cuál es el valor de E[X ] si H0 es verdadera? c) ¿Esperaría que X sea mayor o menor que E[X ] si H1 es verdadera? d ) Calcule el punto crítico de la prueba si se pretende que α tenga valor entre 0.05 y 0.10. e) En un muestreo dado, se identifican 30 bits fijos consecutivos. ¿Es ello indicativo de que el sistema se caerá con el valor de α del inciso d ? En ese caso, ¿qué tipo de error es posible? En el contexto de este problema, ¿cuáles son las consecuencias de cometer ese error? f ) En un muestreo dado, se identifican 60 bits fijos consecutivos. ¿Qué conclusión puede obtenerse de ello? ¿Qué tipo de error es posible? En el contexto de este problema, ¿cuáles son las consecuencias de cometer ese error? (Basado en un estudio que realizó en 19931994 Eyal Schwartz, Department of Computer Science, Radford University.) 65. Se recopilan datos sobre el costo de programas de ahorro de energía para estudiar su rentabilidad. Se obtienen los datos siguientes del costo de diversos programas por kilowatt-hora de electricidad ahorrado:

310

PROBABILIDAD Y ESTADÍSTICA

Programas residenciales (costo en centavos) 3 6 6 10 7 10 8 181

8 4 9 8 9 12 10

7 8 9 3 6 7 11

4 8 11 8 11 12 10

7 5 8 9 13 8 14

7 8 8 9 5 8 6

Programas comerciales e industriales (costo en centavos) 1 3 4 3

3 2 3 4

3 4 3 5

2 5 6 3

3 3

a) Construya diagramas de tallo y hoja para cada conjunto de datos. Comente la probabilidad de que en cada caso se satisfaga el supuesto de normalidad que es subyacente a las estadísticas T. b) Elabore una gráfica de caja para cada conjunto de datos. Identifique el valor atípico extremo en los datos residenciales. Suponga que la investigación revela que ese punto de datos se obtuvo en un programa muy atípico de una región del país con altos ingresos. Dado el carácter inusual del programa, se decide no incluirla, para tratar de estimar el costo de programas que se pondrían en práctica en gran parte del país. Use los datos restantes para calcular un intervalo de confianza de 95% del costo promedio de programas de ahorro de electricidad residenciales actualmente en uso. Si se hubiera incluido el valor atípico, ¿cuál habría sido su efecto en el intervalo de confianza obtenido? c) Prepare un intervalo de confianza de 95% para la varianza en el costo de los programas de ahorro de electricidad residenciales. No use el valor atípico extremo en su cálculo. Si lo utilizara, ¿qué efecto tendría en la amplitud del intervalo de confianza obtenido? d ) Calcule el intervalo de confianza de 95% de la media, varianza y desviación estándar del costo de los programas de ahorro de electricidad en los sectores industrial y comercial. e) Si el costo promedio verdadero de la electricidad para clientes residenciales es de $0.08/ kWh, ¿existe razón alguna para cuestionar la rentabilidad de los programas de ahorro de electricidad residenciales? Explique su respuesta. f ) Si el costo promedio verdadero de la electricidad para clientes industriales y comerciales es de $0.05/kWh, ¿existen razones para cuestionar la rentabilidad de los programas de ahorro de electricidad en esos sectores? Explique su respuesta. (Basado en información de “The Real Cost of Saving Electricity”, Technology Review, febrero/marzo de 1993, p. 12.) 66. Considere la información dada en el ejercicio 6.35. Calcule un intervalo de confianza de 95% de la vida útil promedio de cada tipo de bombilla. Con base en esos intervalos, ¿existen datos claros de que difiere su media de vida útil? Explique su respuesta. 67. En Estados Unidos, la Nuclear Regulatory Commission tiene la responsabilidad de vigilar a las compañías que usan materiales radiactivos. Los datos obtenidos en un estudio de accidentes pasados aparecen en el sitio web de la comisión. Las variables del conjunto de datos son:

INFERENCIAS ACERCA DE LA MEDIA Y LA VARIANZA DE UNA DISTRIBUCIÓN

311

Número = número del accidente Tipo = tipo de la entidad, donde p = compañía privada; g = entidad gubernamental no militar, y m = entidad militar Accidente = tipo de accidente, donde wb = exposición corporal total, y e = exposición limitada a las extremidades Exposición = dosis de exposición en rem a) Ordene los datos por accidente y obtenga diagramas de tallo y hoja de la dosis de exposición para cada tipo de accidente. b) Calcule un intervalo de confianza de 90% para la media de dosis de exposición por cada tipo de accidente. ¿Existen datos claros de que las medias difieren en su valor? Explique su respuesta. c) Ordene los datos por accidente y tipo de accidente para obtener seis subgrupos. Prepare estadísticas descriptivas y gráficas de caja para cada subgrupo. Analice las similitudes o diferencias que observe con esas herramientas descriptivas.

312

PROBABILIDAD Y ESTADÍSTICA

CAPÍTULO

9

INFERENCIAS ACERCA DE PROPORCIONES

E

n este capítulo, se analizan las inferencias acerca de una proporción y la comparación de dos proporciones. Como se mencionó, la distribución binomial puede usarse para poner a prueba hipótesis sobre una proporción p con muestras pequeñas. Se estudiará la forma de usar la distribución normal estándar en el cálculo de intervalos de confianza de p y la prueba de hipótesis concernientes a su valor con muestras grandes. También se inicia el estudio de dos problemas de muestreo con el aprendizaje de la forma de comparar proporciones basadas en muestras extraídas de dos poblaciones distintas.

9.1 ESTIMACIÓN DE PROPORCIONES La situación habitual en que se requiere estimar una proporción es la siguiente: existe una población de interés, se estudia un rasgo específico y se clasifica a cada miembro de la población según posea el rasgo o carezca de él. Se pretende obtener inferencias acerca de p, la proporción poblacional que tiene el rasgo. Ejemplo 9.1.1. La calidad y confiabilidad son aspectos importantes del software. El más pequeño de los errores de programación en el software una vez trastornó el lanzamiento de un transbordador espacial, mientras que en Japón se interrumpió la comunicación telefónica durante horas por la disfunción en las señales de una central telefónica. A fin de estimar la confiabilidad dinámica de RAMs de 16 kilobits que se produce en una compañía específica, se extrae y somete a prueba una muestra de tamaño 100. Interesa la estimación de p, la proporción de circuitos que funciona correctamente durante las primeras 1 000 h de uso. En este caso, la población consiste en todos los circuitos de RAMs dinámica de 16 kilobits que produce la compañía y el rasgo de estudio es la capacidad de los circuitos para funcionar correctamente en las primeras 1 000 h de uso. Cada circuito tiene el rasgo en cuestión, es decir, funciona correctamente, o no lo hace.

312

INFERENCIAS ACERCA DE PROPORCIONES

313

A fin de desarrollar un estimador puntual lógico de p, note que la muestra aleatoria de tamaño n extraída de la población se relaciona con un conjunto de n variables aleatorias independientes X1, X2, X3, . . . , Xn, donde:

 Xi = 1 0

si el i -ésimo miembro de la muestra tiene el rasgo si el i -ésimo miembro de la muestra no posee el rasgo

Por ejemplo, si se tiene una muestra de 100 circuitos, se obtendría una muestra como la siguiente: x1 = 1 x4 = 1 x98 = 1 x2 = 0 x5 = 0 . . . x99 = 0 .. x3 = 0 x100 = 0 .

En este caso, el primer circuito de la muestra funciona correctamente durante las primeras 1 000 h de uso, de modo que x1 = 1; el segundo circuito no, por lo que x2 = 0, y así sucesivamente. Advierta que, en general, X = Σin= 1 X i indica el número de objetos de la muestra que poseen el rasgo, mientras que la estadística X/n representa la proporción de la muestra que tiene el rasgo. Esta estadística, llamada proporción muestral, es un estimador puntual lógico de p:

Estimador puntual de p pˆ =

X número en la muestra con el rasgo = n tamaño de la muestra

Ejemplo 9.1.2. Suponga que al realizar las 100 pruebas mencionadas en el ejemplo 9.1.1, se observa que 91 de los 100 circuitos probados funcionan correctamente durante las primeras 1 000 h de uso. Así pues, 91 de las variables aleatorias tienen valor 1, y las otras 9, valor 0. Con base en estos datos, Σ x i = x = 91 y: pˆ = x / n = 91/ 100 = 0.91

Intervalos de confianza para p La distribución de p debe determinarse para generar un intervalo de confianza de pˆ. Ello se logra al tomar nota de que pˆ = Σ Xi / n en realidad no es más que una media muestral muy especial. En otras palabras, pˆ = X es el promedio de variables aleatorias Xi cero-uno o binomiales puntuales. De conformidad con el teorema del límite central, pˆ tiene distribución aproximadamente normal, con la misma media que las variables Xi, además de varianza (Var Xi)/n. La media y varianza de Xi se determinan fácilmente. Xi = 1 sólo si un objeto con el rasgo es muestreado y la proporción verdadera de objetos de la muestra con el rasgo es p, con P[Xi = 1] = p. Por ende, P[Xi = 0] = 1 – p. La densidad de Xi es la siguiente:

314

PROBABILIDAD Y ESTADÍSTICA

xi

1

0

f (xi)

p

1–p

A partir de esta densidad, es fácil ver que: E[ Xi ] = 1( p) + 0(1 – p) = p E[ X i2] = 12 ( p) + 02 (1 – p) = p y

Var Xi = E[ X i2] – ( E[ Xi ])2 = p – p2 = p(1 – p) De conformidad con el teorema del límite central, puede sacarse en conclusión que pˆ tiene distribución aproximadamente normal, con media p y varianza p(1 – p)/n. Advierta que se acaba de demostrar que pˆ posee las propiedades aconsejables en un estimador puntual. Es insesgado respecto de p y tiene varianza pequeña para muestras grandes. Se estandariza pˆ para obtener una variable aleatoria que abarque a p, cuya distribución se conoce, de modo que sirva como punto de partida para la obtención del intervalo de confianza. La variable aleatoria resultante: ( pˆ – p) / p(1 – p ) /n

tiene aproximadamente una distribución Z para muestras grandes. La partición de la curva normal estándar que se muestra en la figura 9.1 es necesaria para obtener los límites de un intervalo de confianza de 100(1 – α)% de p. A partir de ese diagrama, puede verse que:

[

p – zα / 2 ≤ ( pˆ – p) / p (1 – p )/ n ≤ zα / 2

]

1–α

Aislar p en el centro de la desigualdad permite apreciar que:

[

P pˆ – zα/2 p (1 – p )/n ≤ p ≤ pˆ + zα / 2 p (1 – p )/n

]

1–α

Al parecer, los límites de confianza de p son: pˆ ± zα/2 p (1 – p) /n

No obstante lo anterior, existe un problema que no había aparecido hasta aquí. Los límites de un intervalo de confianza deben ser estadísticas. En otras palabras, se requiere que sean variables aleatorias cuya expresión no contenga parámetros desconocidos, de modo que su valor numérico pueda obtenerse de una muestra. Por desgracia, los límites precedentes no son estadísticas tal y como están escritos, ya Z = ( pˆ – p )"!p ( 1 – p )"n

1–! !/ 2

!/2

– z ! /2

z ! /2

0

z

FIGURA 9.1 Partición de la curva Z necesaria para obtener un intervalo de confianza de 100(1 – α)% para p.

INFERENCIAS ACERCA DE PROPORCIONES

315

que el parámetro p desconocido aparece en las expresiones dadas. ¡Ello significa que se intenta usar p para estimar p, algo que parecería imposible! El problema puede superarse con facilidad. El método evidente es sustituir p con su estimador insesgado pˆ , para obtener los límites siguientes: pˆ ± zα /2

pˆ (1 – pˆ)/ n

Una pregunta legítima es: “¿Debe cambiarse de Z a Tn – 1, como se hizo en la estimación de µ, ya que se sustituye la desviación estándar verdadera de pˆ con un estimador de esa desviación?” La respuesta a esta pregunta radica en considerar el tamaño muestral. La obtención de los límites de confianza se basa en el teorema del límite central, el cual supone que está disponible una muestra grande. Por añadidura, en los contextos experimentales donde se aplica esta fórmula se espera que el tamaño muestral sea suficientemente grande para que haya diferencia mínima entre dos puntos, z y t. Así pues, se describen los límites de confianza como sigue: Intervalo de confianza para p pˆ ± zα /2 pˆ (1 – pˆ )/ n

y se usan puntos z en la aplicación de la fórmula. Se han desarrollado límites de confianza para muestras de tamaño 1 hasta 30 basados en la distribución binomial y deben usarse con muestras de esos tamaños. Las tablas correspondientes aparecen en [10]. El uso de este método se ilustra con el ejemplo siguiente. Ejemplo 9.1.3. La estimación puntual de la proporción de RAM dinámica de 16 kilobits que funciona correctamente al menos durante 1 000 h, basada en una muestra de tamaño 100, es 0.91. A partir de la tabla normal estándar, el punto necesario para calcular un intervalo de confianza de 95% de p es z0.025 = 1.96. Los límites de este intervalo de confianza son: pˆ ± zα /2 pˆ (1 – pˆ )/ n o 0.91 ± 1.96 0.91(0.09) / 100 0.91 ± 0.056

Puede tenerse confianza aproximada de 95% de que la proporción verdadera de circuitos que funciona correctamente durante las primeras 1 000 h de uso se sitúa entre 0.854 y 0.966. En porcentajes, se tiene confianza aproximada de 95% de que el porcentaje verdadero de circuitos satisfactorios que produce la compañía va de 85.4% a 96.6%. Se usa el adverbio “aproximadamente” porque se aproxima o estima la distribución de pˆ a través del teorema del límite central, además de aproximar p mediante pˆ en el cálculo de los límites de confianza.

Tamaño de muestra para estimar p Al igual que en la estimación de la media, es posible que un experimento arroje un intervalo de confianza de p tan amplio que sea virtualmente inútil. Ello hace surgir otra pregunta importante:

316

PROBABILIDAD Y ESTADÍSTICA

FIGURA 9.2 Intervalo de confianza de 100(1 – α )% de p.

“¿Cuán grande debe seleccionarse la muestra, de modo que pˆ se sitúe dentro de una distancia d especificada de p con un grado de confianza establecido?” Son dos las formas de responder esta pregunta. La primera es aplicable cuando se cuenta con la estimación de p basada en experimentos previos. Considere el diagrama de la figura 9.2. Puesto que se tiene certeza de 100(1 – α)% de que p se ubica en el intervalo mostrado, también se la tiene de que la diferencia entre pˆ y p es cuando mucho d, donde d está dada por: d = zα /2

pˆ (1 – pˆ)/ n

Se despeja n en la ecuación precedente para obtener la fórmula que sigue, de cálculo del tamaño muestral necesario para estimar p con grado de exactitud y confianza especificadas, cuando se tiene una estimación previa de p: Tamaño de muestra para estimar p con su estimación previa n

zα2 /2 pˆ (1 – pˆ ) d2

Ejemplo 9.1.4. ¿Qué tan grande se requiere que sea una muestra para estimar la proporción de RAM dinámica de 16 kilobits que funciona correctamente durante las primeras 1 000 h de uso a no más de 0.01 (un punto porcentual) con confianza de 95%? Se tiene una estimación previa de p, a saber, pˆ = 0.91. De conformidad con la fórmula precedente: zα2 /2 pˆ (1 – pˆ ) d2 Interesa la confianza de 95%, por lo que el punto zα/2 = z0.025 = 1.96. La diferencia máxima aceptable entre pˆ y p es d = 0.01. Al sustituir, se obtiene: n

n

(1.96) 2 (0.91)(0.09) (0.01) 2

3 147

¡Se necesitan mucho más datos que los disponibles para lograr la exactitud deseada!

El segundo método de determinación del tamaño muestral para la estimación de proporciones se basa en un resultado de los fundamentos de cálculo. Puede demostrarse (ejercicio 9) que pˆ(1− pˆ) nunca es mayor que 1/4. Por lo tanto, este término puede sustituirse con 1/4 en la fórmula previa del tamaño muestral para obtener la fórmula siguiente, que se usa cuando se carece de una estimación previa de p:

INFERENCIAS ACERCA DE PROPORCIONES

317

Tamaño de muestra para estimar p sin su estimación previa n

zα2 /2 4d 2

Esta expresión será de mucha utilidad para el lector, ya que en muchas aplicaciones se carece de una estimación previa de p. Ejemplo 9.1.5. Se estudia un nuevo método de prerrecubrimiento de juntas para uso en los sistemas de aceite, frenos y otros de fluidos en camiones de uso pesado. ¿Cuán grande se necesita que sea la muestra para estimar la proporción de juntas que tendrá fuga a no más de 0.02 con confianza de 90%? Puesto que no se tiene una estimación previa de p: n

zα2/2 4d 2

Aquí, zα/2 = z0.05 = 1.645 y d = 0.02. Después de sustituir, se tiene: n

(1.645) 2 4(0.02) 2

1 692

Debe resaltarse que el muestreo en una población finita grande usualmente se efectúa sin reemplazo. En sentido estricto, la proporción de objetos de la población con el rasgo dado varía de un ensayo a otro. Sin embargo, el cambio es tan leve que su efecto en los cálculos resulta insignificante. Por tal razón, los métodos de esta sección pueden usarse en el estudio de poblaciones grandes, pese a que no se satisfagan por completo los supuestos matemáticos subyacentes a esos métodos.

9.2

PRUEBA DE HIPÓTESIS SOBRE UNA PROPORCIÓN

Se está ante una situación de prueba de hipótesis cuando se tiene una idea preconcebida del valor de una proporción o porcentaje e interesa obtener pruebas estadísticas que sustenten esa idea. Las hipótesis sometidas a prueba pueden asumir cualquiera de las tres formas usuales, de conformidad con el propósito del estudio. Sea p0 el valor nulo de p. Esas formas son las siguientes:

I H0: p = p0 H1: p > p0

Prueba de cola derecha

II H0: p = p0 H1: p < p0

Prueba de cola izquierda

III H0: p = p0 H1: p ≠ p0

Prueba de dos colas

En la sección 8.3, se analiza la forma de probar estas hipótesis con muestras pequeñas. La estadística usada es X, el número de objetos de la muestra con el rasgo de interés. Esa estadística tiene

318

PROBABILIDAD Y ESTADÍSTICA

distribución binomial con parámetros n y p0 cuando la hipótesis nula es verdadera. En el caso de muestras grandes, es habitual que se carezca de tablas binomiales apropiadas y debe buscarse otra estadística de prueba lógica. Considere la variable aleatoria usada para generar los límites de confianza de p. En otras palabras, considere: Estadística de prueba para verificar H0: p = p0 ( pˆ – p0 )/ p0 (1 – p0 )/n

Esta estadística es una opción lógica, ya que con ella se compara p, el estimador puntual insesgado de pˆ , con el valor nulo p0. Por añadidura, si H0 es verdadera, la estadística tiene distribución normal estándar, según el teorema del límite central. Las pruebas se realizan como cabría esperar. En otras palabras, en el caso de una prueba de cola derecha se rechaza H0 y se acepta H1 si el valor observado de la estadística de prueba es un número positivo grande, mientras que los números negativos grandes llevan al rechazo en una prueba de cola izquierda. H0 se rechaza en una prueba de dos colas con valores de la estadística de prueba excesivamente grandes, sean positivos o negativos. Estas ideas se ilustran en el ejemplo siguiente. Ejemplo 9.2.1. La mayor parte de las fallas en las líneas de transmisión resulta de factores externos y suele ser transitoria. Se piensa que más de 70% de esas fallas se debe a relámpagos. A fin de obtener datos que sustenten esa afirmación, se ponen a prueba: H0: p = 0.7 H1: p > 0.7 Los datos recopilados durante un año muestran que 151 de 200 fallas observadas se derivan de relámpagos. El valor observado de la estadística de prueba es:

( pˆ – p0 )/ p0 (1 – p0 )/ n = (151/ 200 – 0.7) / 0.7(0.3)/ 200 1.697 Se trata de una prueba de cola derecha, de modo que se rechaza H0 si ese valor es inusualmente grande. A fin de decidir si 1.697 es un valor positivo grande, se calcula el valor P. En la tabla normal estándar, se observa que P[Z ≥ 1.69] = 0.0455 y P[Z ≥ 1.70] = 0.0446. El valor observado 1.697 se ubica entre 1.69 y 1.70, de modo que el valor P está entre 0.0446 y 0.0455. Son dos las explicaciones de este valor P pequeño. La hipótesis nula es verdadera y se acaba de observar un evento infrecuente, que ocurre apenas unas cuatro veces por cada 100, o la hipótesis nula no es verdadera y el porcentaje verdadero de fallas que causan los relámpagos es mayor de 70%. La última explicación parece más factible, de modo que se rechaza H0 y se llega a la conclusión de que p > 0.7.

Este método de prueba de una hipótesis de p supone que el tamaño muestral es “grande”. De conformidad con los lineamientos de la sección 4.6, ello se interpreta como indicativo de que n y p0 son tales que p0 ≤ 0.5 y np0 > 5 o p0 > 0.5 y n(1 – p0) > 5. Estos criterios se satisfacen en el ejemplo 9.2.1, donde p0 = 0.7 > 0.5 y n(1 – p0) = 200(0.3) = 60 > 5.

INFERENCIAS ACERCA DE PROPORCIONES

9.3

319

COMPARACIÓN DE DOS PROPORCIONES: ESTIMACIÓN

El problema de comparar dos proporciones surge frecuentemente en ingeniería. La situación general puede describirse como sigue: existen dos poblaciones de interés, se estudia un mismo rasgo en cada población, es posible clasificar a cada miembro de cada población como poseedor del rasgo o carente de él, y en cada población se desconoce la proporción que tiene el rasgo. Se obtienen muestras aleatorias de ambas poblaciones. Esas muestras son independientes una de otra, en el sentido de que los objetos extraídos de una no determinan cuáles objetos se seleccionan en la otra. Se pretende obtener inferencias sobre p1, p2 y p1 – p2, donde p1 y p2 son las proporciones que poseen el rasgo en la primera y segunda poblaciones, respectivamente. Ejemplo 9.3.1. Se realiza un estudio para comparar el uso de computadoras en empresas canadienses y estadounidenses. El interés se centra en la proporción de compañías de cada país que cuenta con un servidor en sus instalaciones. En este caso, las poblaciones de estudio son las “empresas” de Canadá y Estados Unidos. Recuerde que antes de emprender el muestreo debe especificarse con claridad qué constituye una “empresa”, es decir, hay que definir nítidamente las poblaciones de estudio. El rasgo de que se estudia es tener una computadora en las instalaciones y cada empresa de la muestra cuenta con tal equipo o no lo posee. Se obtiene una muestra aleatoria de cada población. Se usan los datos muestrales para comparar la proporción de empresas canadienses y estadounidenses con un servidor en sus instalaciones (figura 9.3).

El problema de la estimación puntual de la diferencia entre dos proporciones se soluciona de manera evidente. Basta estimar por separado p1 y p2 y tomar como estimación de p1 – p2 la diferencia entre ellas. En otras palabras, el estimador puntual es:

Estimador puntual para p1 – p2 p1 – p2 = pˆ1 – pˆ 2 = X1 / n1 – X 2 / n2

Población I (empresas canadienses) Con servidor

1 – p1 Muestra de tamaño n1

Población II (compañías estadounidenses) Con servidor 1 – p2 Muestra de tamaño n2

p1 = ? Sin servidor

FIGURA 9.3 Muestras independientes que se obtienen para estimar p1 – p2.

p2 = ? Sin servidor

320

PROBABILIDAD Y ESTADÍSTICA

donde n1 y n2 son el tamaño de las muestras obtenidas de las poblaciones, mientras que X1 y X2 son el número de objetos de las muestras que poseen el rasgo, siempre en el mismo orden. Ejemplo 9.3.2. Se seleccionan muestras aleatorias independientes de tamaño 375 de las poblaciones de empresas canadienses y estadounidenses. Se determina que 221 y 232 empresas de Canadá y Estados Unidos, respectivamente, tienen servidor. En relación con estos datos:

pˆ 1 = x1 / n1 = 221/ 375 = 0.589 pˆ 2 = x2 / n2 = 232/ 375 = 0.619 p1 – p2 = pˆ 1 – pˆ 2 = 0.589 – 0.619 = –0.03

Intervalo de confianza de p1 – p2 Antes de ampliar el estimador puntual pˆ1 − pˆ 2 a un estimador de intervalo, hay que hacer una pausa para considerar la distribución de probabilidad de esta estadística. Su distribución aproximada se indica en el teorema 9.3.1. Teorema 9.3.1. En el caso de muestras grandes, el estimador pˆ 1 – pˆ 2 es aproximadamente normal, con media p1 – p2 y varianza p1(1 – p1)/n1 + p2(1 − p2)/n2.

Demostración. En la sección 9.1, se demostró que pˆ 1 y pˆ 2 son aproximadamente normales, con medias p1 y p2 y varianzas p1(1 – p1)/n1 y p2(1 – p2)/n2, respectivamente. La suma o diferencia de dos variables aleatorias normales es normal (ejercicio 41 del capítulo 7), por lo que puede sacarse en conclusión que la estadística pˆ 1 – pˆ 2 tiene distribución aproximadamente normal. Por añadidura, según las reglas de la esperanza y las de la varianza:

E [ pˆ1 – pˆ 2 ] = E [ pˆ1 ] – E [ pˆ 2 ] = p1 – p2 y Var [ pˆ 1 – pˆ 2 ] = Var pˆ 1 + Var pˆ 2 = p1 (1 – p1)/ n1 + p2 (1 – p2 )/ n2

Note que el teorema 9.3.1 muestra que la estadística pˆ1 – pˆ 2 es un estimador insesgado de p1 – p2. El cálculo de un intervalo de confianza de 100(1 − α)% para p1 – p2 requiere una variable aleatoria cuya expresión incluya este parámetro y que tenga distribución de probabilidad conocida al menos en forma aproximada. Ello es fácil con el teorema 9.3.1. Basta usar los resultados del teorema para estandarizar la estadística pˆ1 – pˆ 2 . En particular, se sabe que la variable aleatoria:

( pˆ1 – pˆ 2 ) – ( p1 – p2 ) p1(1 – p1 )/ n1 + p2 (1 – p2 )/ n2 es al menos aproximadamente normal estándar. En vez de repetir el argumento algebraico ya mencionado, se consideran tres intervalos también ya obtenidos y se notan sus similitudes.

INFERENCIAS ACERCA DE PROPORCIONES

Parámetro que se estima

µ(σ 2 conocida) µ(σ 2 desconocida) p

Empezar la obtención con

Distribución

X –µ

σ/ n X –µ S/ n pˆ – p p (1 – p) /n

321

Límites

Z

X ± zα / 2 σ / n

T

X ± tα /2 S/ n

~Z

pˆ ± zα / 2

pˆ (1 – pˆ )/n

La estructura algebraica de cada una de las variables iniciales es la misma, de la forma: Estimador − Parámetro D donde D es la desviación estándar del estimador o un estimador de esta desviación estándar. Ésta es también la forma algebraica que asume la variable: ( pˆ1 – pˆ 2 ) – ( p1 – p2 ) p1(1 – p1 ) / n1 + p2 (1 – p2 ) / n2

~Z

Los límites de confianza en los casos previos tenían la forma: Estimador ± punto de probabilidad · D La aplicación del concepto al caso en cuestión permite observar que los límites de confianza propuestos de un intervalo de confianza de p1 – p2 serían: ( pˆ1 – pˆ 2 ) ± zα /2

p1 (1 – p1 )/ n1 + p2 (1 – p2 )/ n2

Una vez más, existe un pequeño problema. Los límites propuestos no son estadísticas. Incluyen las proporciones poblacionales desconocidas p1 y p2. Al igual que en el caso de una muestra, el problema se resuelve al sustituir las proporciones poblacionales con sus estimadores pˆ1 y pˆ 2 . Ello conduce a la fórmula siguiente, de cálculo de los intervalos de confianza de la diferencia entre dos proporciones poblacionales: Intervalo de confianza sobre p1 – p2 ( pˆ1 – pˆ 2 ) ± zα /2

pˆ1 (1 – pˆ1 )/ n1 + pˆ 2 (1 – pˆ 2 )/ n2

Ejemplo 9.3.3. La estimación puntual de la diferencia en la proporción de empresas de Canadá y Estados Unidos con un servidor en sus instalaciones es pˆ 1 – pˆ 2 = 0.589 − 0.619 = −0.03. El intervalo de confianza de 95% de esta diferencia es:

322

PROBABILIDAD Y ESTADÍSTICA

( pˆ 1 – pˆ 2 ) ± zα /2

pˆ 1 (1 – pˆ 1) / n1 + pˆ 2 (1 – pˆ 2 )/ n2

o –0.03 ± 1.96 (0.589)(0.411) / 375 + (0.619)(0.381) / 375 –0.03 ± 0.07

En otras palabras, se tiene confianza de 95% de que la diferencia verdadera entre las dos proporciones se ubica en el intervalo [−0.10, 0.04]. Note que este intervalo contiene el número 0, por lo que es posible que en realidad no haya diferencia entre las proporciones poblacionales p1 y p2.

La cuestión de determinar el tamaño muestral necesario para estimar la diferencia entre dos proporciones con grados de exactitud y confianza especificados es más compleja que en el caso de una muestra. No obstante, si se seleccionan muestras de igual tamaño en cada población, el problema puede resolverse de igual manera que con una sola muestra. El procedimiento se delinea en el ejercicio 21.

9.4

COMPARACIÓN DE DOS PROPORCIONES: PRUEBA DE HIPÓTESIS

En ocasiones, surgen problemas en los que se plantea, antes del experimento, que una proporción o porcentaje difieren de otro en una cantidad específica. El propósito del experimento es obtener sustento estadístico de ese supuesto. Este tipo de hipótesis asume una de tres formas, donde (p1 – p2)0 representa el valor nulo de la diferencia entre las proporciones: I H0: p1 – p2 = (p1 – p2)0 H1: p1 – p2 > (p1 – p2)0 Prueba de cola derecha

III

II H0: p1 – p2 = (p1 – p2)0 H1: p1 – p2 < (p1 – p2)0

Prueba de cola izquierda

H0: p1 – p2 = (p1 – p2)0 H1: p1 – p2 ≠ (p1 – p2)0 Prueba de dos colas

Debe encontrarse una estadística de prueba para verificar tales hipótesis. En la derivación de esa estadística, considere la variable aleatoria normal aproximadamente estándar:

( pˆ1 – pˆ 2 ) – ( p1 – p2 )0 p1 (1 – p1 )/ n1 + p2 (1 – p2 )/ n2 usada en la obtención de intervalos de confianza para p1 – p2 en la sección precedente. Esa variable aleatoria no es una estadística, ya que contiene las proporciones poblacionales desconocidas p1 y p2. Una vez más, el problema se resuelve de manera lógica. En particular, se sustituyen pˆ1 y pˆ 2 con sus estimadores insesgados p1 y p2 para obtener la estadística de prueba aproximadamente normal estándar: ( pˆ1 – pˆ 2 ) – ( p1 – p2 )0 pˆ1(1 – pˆ1 )/ n1 + pˆ 2 (1 – pˆ 2 )/ n2

INFERENCIAS ACERCA DE PROPORCIONES

323

Ésa es una opción lógica de estadística de prueba, ya que en ella se compara la diferencia estimada de las proporciones pˆ1 – pˆ 2 contra su diferencia hipotética (p1 – p2)0. Si el valor hipotético es correcto, entonces las diferencias estimada e hipotética deben tener valores muy cercanos entre sí. Ello obliga a que el numerador en la fracción recién mencionada sea cercano a 0 y, de tal suerte, se tenga valor bajo de la estadística de prueba. Los valores negativos o positivos grandes de esa estadística indican que la hipótesis nula no es verdadera y que se debe rechazar a favor de la hipótesis alternativa apropiada. Ejemplo 9.4.1. Una compañía tiene dos fundidoras de tamaño similar y dedicadas a las mismas operaciones de producción. Se implanta un programa de seguridad experimental en una de ellas. Antes de ampliar el programa a la otra, los administradores desean comparar la proporción de trabajadores lesionados durante el periodo de prueba en el sitio experimental contra el de la otra planta. Se piensa que el programa es rentable si las proporciones difieren en más de 0.05. Lo que se pone a prueba es: H0 : p1 – p2 = 0.05 H1 : p1 – p2 > 0.05 donde p1 y p2 denotan las proporciones de trabajadores lesionados en las plantas de control y experimental, respectivamente. Cometer un error tipo I sería costoso, por lo que se preestablece α en 0.01. El punto crítico de esta prueba de cola derecha es z0.01 = 2.33. Al término del periodo de prueba, se han lesionado 24 de 263 trabajadores en la planta de control y apenas cinco de los 250 de la planta experimental. Con base en esos datos:

pˆ 1 = 24 / 263 = 0.091

pˆ 2 = 5/ 250 = 0.020

pˆ 1 – pˆ 2 = 0.071

¿Es esta diferencia suficientemente grande para llegar a la conclusión de que la diferencia verdadera entre las proporciones excede de 0.05? A efecto de decidir, se evalúa la estadística de prueba:

( pˆ 1 – pˆ 2 ) – ( p1 – p2 ) 0 = pˆ 1 (1 – pˆ 1)/n1 + pˆ 2 (1 – pˆ 2 )/n2

0.071 – 0.05 (0.091)(0.909)/ 263 + (0.02)(0.98)/ 250

= 1.059 Este valor no excede el punto crítico 2.33, por lo que es imposible rechazar la hipótesis nula con el valor α = 0.01. Se carece de la evidencia que se considera necesaria para justificar la ampliación del programa de seguridad.

Proporciones agrupadas Aunque la diferencia hipotética (p1 – p2)0 puede tener cualquier valor, el propuesto más comúnmente es cero. En este caso, en las hipótesis consideradas previamente se comparan p1 y p2, y asumen las formas siguientes: I H0: p1 = p2

II H0: p1 = p2

III H0: p1 = p2

H1: p1 > p2

H1: p1 < p2

H1: p1 ≠ p2

Prueba de cola derecha

Prueba de cola izquierda

Prueba de dos colas

324

PROBABILIDAD Y ESTADÍSTICA

Las hipótesis de este tipo se pueden probar mediante la estadística de prueba antes desarrollada, con (p1 – p2)0 = 0. Sin embargo, es factible un procedimiento alterno. Éste, que prefieren muchos estadísticos, aprovecha que pˆ1 y pˆ 2 son estimadores de una misma proporción, que se denota con p, si H0 es verdadera. A fin de ver cómo se usa esta información, note que la varianza de pˆ 1 – pˆ 2 está dada por: p1(1 – p1)/ n1 + p2(1 – p2)/ n2 Si H0 es verdadera, la varianza puede escribirse como sigue:

p (1 – p)/ n1 + p (1 – p)/ n2 = p (1 – p)(1/ n1 + 1/ n2 ) Se ve que la variable aleatoria:

pˆ1 – pˆ 2 p (1 – p)(1/n1 + 1/n2 ) tiene distribución que es aproximadamente normal estándar. Ahora, se enfrenta el problema de estimar la proporción poblacional común desconocida p. Puesto que pˆ1 y pˆ 2 son estimadores insesgados de p, tiene sentido combinarlos de alguna manera. Es factible promediar simplemente los estimadores; pero con ello se hace caso omiso de las diferencias que pudiera haber entre los dos tamaños muestrales participantes. Tomar en cuenta esas diferencias requiere el uso de un promedio ponderado. En otras palabras, se multiplica cada estimador por su tamaño muestral para obtener el estimador “agrupado” de p: Estimador agrupado de p cuando p1 = p2

pˆ =

n1 pˆ1 + n2 pˆ 2 n1 + n2

La estadística de prueba resultante cuando se sustituye p con pˆ es: Estadística de prueba para comparar dos proporciones

pˆ1 – pˆ 2 pˆ (1 – pˆ )(1/n1 + 1/n2 ) El uso de esta estadística se demuestra en el ejemplo siguiente. Ejemplo 9.4.2. Muchos consumidores piensan que los automóviles fabricados en lunes tienen mayores probabilidades de sufrir defectos graves que los producidos en cualquier otro día de la semana. A fin de sustentar esta teoría, se selecciona e inspecciona una muestra aleatoria de 100 vehículos fabricados en lunes. De ellos, en ocho existen defectos graves. Otra muestra aleatoria, de 200 automóviles producidos en los días restantes, revela que 12 tienen defectos graves. ¿Acaso los datos sustentan la afirmación inicial? A fin de decidir, se ponen a prueba: H0: p1 = p2 H1: p1 > p2

INFERENCIAS ACERCA DE PROPORCIONES

325

donde p1 denota la proporción de vehículos con defectos graves producida en lunes. Las estimaciones de p1 y p2 son pˆ1 = x1 / n1 = 8/100 = 0.08 y

pˆ 2 = x2 / n2 = 12 / 200 = 0.06

La estimación agrupada de la proporción poblacional común es: pˆ =

n1 pˆ 1 + n2 pˆ 2 100(0.08) + 200(0.06) = 100 + 200 n1 + n2 = 20/ 300 = 0.066

El valor observado de la estadística de prueba es: pˆ 1 – pˆ 2 = ˆp(1 – pˆ )(1/n1 + 1/n2 )

0.08 – 0.06 0.066 (0.934) (1/100 + 1/ 200)

= 0.658

En la tabla normal estándar (tabla V del apéndice B), se observa que la probabilidad de tener un valor tan alto o mayor es de casi 0.2546. En otras palabras, el valor P es de aproximadamente 0.2546. Es una probabilidad alta, por lo que no se rechaza H0. Se carece de evidencia estadística suficiente para sustentar la afirmación de que los vehículos fabricados en lunes tienen mayores probabilidades de defectos graves que los producidos en otros días.

Cualquiera de las estadísticas de prueba analizadas puede usarse para poner a prueba H0: p1 − p2 = 0 o H0: p1 = p2; pero se prefiere la estadística agrupada, ya que se la considera más potente. La combinación es inapropiada para probar H0: p1 − p2 = ( p1 − p2)0, donde ( p1 = p2)0 ≠ 0, en virtud de que con pˆ1 y pˆ 2 se estiman proporciones distintas. En este caso, la primera estadística presentada es la estadística de prueba adecuada. Note que se comparan proporciones basadas en muestras aleatorias independientes, extraídas de dos poblaciones. En el capítulo 14, se considera un método de comparación de dos proporciones cuando las muestras no son independientes.

RESUMEN DEL CAPÍTULO En este capítulo, se consideran métodos útiles para hacer inferencias acerca de una sola proporción con muestras grandes. También se estudia la forma de determinar el tamaño muestral requerido para la estimación de p con el grado de exactitud que interese cuando se tienen estimaciones previas de p y a falta de ellas. El análisis se inicia con dos problemas de muestras al considerar las estimaciones puntual y de intervalo de la diferencia entre dos proporciones poblacionales. Los métodos presentados suponen que las muestras son obtenidas en forma independiente. También se estudia que puede ponerse a prueba H0: p1 – p2 = ( p1 – p2)0 usando como estadística de prueba la misma variable aleatoria que sirve para generar el intervalo de confianza de p1 – p2, a saber: ( pˆ 1 – pˆ 2 ) – ( p1 – p2 ) 0 pˆ 1 (1 – pˆ 1) / n1 + pˆ 2 (1 – pˆ 2) / n2

326

PROBABILIDAD Y ESTADÍSTICA

No obstante lo anterior, cuando ( p1 – p2)0 = 0 es preferible un procedimiento agrupado. En éste, se aprovecha el dato de que si H0 es verdadera, entonces p1 = p2. Puesto que con pˆ1 y pˆ 2 se estima lo mismo, se los combina para formar el estimador siguiente de la proporción poblacional común p: pˆ =

n1 pˆ1 + n2 pˆ 2 X1 + X 2 = n1 + n2 n1 + n2

La estadística de prueba usada para poner a prueba H0: p1 − p2 = 0 con ese estimador es:

pˆ1 – pˆ 2 pˆ (1 – pˆ )(1/ n1 + 1/n2 ) En este capítulo, se introduce el término siguiente: estimador agrupado para p.

EJERCICIOS Sección 9.1

1. La efectividad de las señales reflejantes en autopistas requiere verlas con la luz de los faros. Hacerlo a grandes distancias precisa usar las luces “altas” de los faros. Un estudio de ingenieros de autopistas revela que en 45 de 50 automóviles seleccionados aleatoriamente en un área de tráfico intenso se usan las luces “bajas” de los faros. a) Calcule un estimador puntual de p, la proporción de automóviles en el área que usa las luces bajas. b) Determine un intervalo de confianza de 90% para p. c) ¿Cuán grande se requiere que sea la muestra para estimar p con exactitud de 0.02 y confianza de 90%? 2. Un estudio de dispositivos de protección electromecánicos usados en sistemas de alimentación eléctrica muestra que 193 fallan al someterlos a prueba, 75 de ellos a causa de falla de piezas mecánicas. a) Encuentre un estimador puntual de p, la proporción de fallas resultantes de fallas mecánicas. b) Determine un intervalo de confianza de 95% para p. c) ¿Cuán grande se requiere que sea la muestra para estimar p con exactitud de 0.03 y confianza de 95%? 3. En 1980, el Bureau of Labor Statistics estadounidense realizó un estudio de 1 000 lesiones oculares leves que sufrieron trabajadores en los centros de trabajo. El estudio reveló que en 600 de los casos el trabajador no usaba equipo de protección ocular en el momento de la lesión. También mostró que 900 de las lesiones habrían sido previsibles con el uso de tal equipo. Suponga que las condiciones actuales en los centros de trabajo no han cambiado sustantivamente de las que había en 1980, en lo relativo al uso de equipos de protección ocular. a) Determine un intervalo de confianza de 90% para la proporción de trabajadores que sufre lesiones oculares leves este año y no usa equipo de protección ocular en el momento de la lesión.

INFERENCIAS ACERCA DE PROPORCIONES

4.

5.

6.

7.

8. 9.

327

b) Calcule un intervalo de confianza de 95% para la proporción de lesiones oculares leves que ocurre este año y habrían sido previsibles con el uso apropiado de equipo de protección ocular. Una encuesta de compañías que usan robots muestra que, de 200 robots en uso, 48 están dedicados a operaciones de carga y descarga. a) Encuentre un intervalo de confianza de 95% para p, la proporción de robots que se usa actualmente en tareas de carga y descarga. b) ¿Le sorprendería la afirmación de que la mayor parte de los robots en uso se dedican a operaciones de carga y descarga? Explique su respuesta. Un problema relacionado con el uso de transporte supersónico (SST) es el boom supersónico. A fines de la década de 1960 y comienzos de la década siguiente, se efectuaron pruebas preliminares sobre Oklahoma City, St. Louis y otras áreas. Después de las pruebas, se emprendió una encuesta para estimar el porcentaje de personas cuya opinión era que no podrían vivir con el boom supersónico. ¿Cuán grande debe haberse seleccionado la muestra para estimar esa proporción a no más de tres puntos porcentuales con confianza de 95%? La Agencia de Protección Ambiental identificó recientemente 30 000 rellenos sanitarios en Estados Unidos considerados al menos como potencialmente riesgosos. ¿Cuán grande se necesita que sea la muestra para estimar el porcentaje de esos sitios que sí entraña una amenaza grave para la salud a no más de dos puntos porcentuales con confianza de 90%? Se dice que “los médicos entierran sus errores, los arquitectos los cubren con hiedra y los ingenieros escriben largos informes que nunca ven la luz del día”. Un área en la que los errores de ingeniería son críticos es la construcción de presas. ¿Cuán grande se necesita que sea una muestra para estimar el porcentaje de presas no federales que necesita reparación inmediata a no más de un punto porcentual con confianza de 90%? Una investigación de mercados se realizará entre los usuarios de un tipo específico de computadora. ¿Cuántos usuarios deben estar incluidos en la muestra para estimar el porcentaje de los que planean agregar terminales, a no más de cuatro puntos porcentuales con confianza de 90%? Considere la función g ( pˆ ) = pˆ (1 – pˆ ). a) Encuentre g'( pˆ ). b) Determine el punto crítico de g. c) Calcule g" ( pˆ ) y use esto para argumentar que g asume su valor máximo en el punto crítico. d ) ¿Cuál es el valor máximo que asume la función g?

Sección 9.2

10. Un sondeo de opinión de analistas de inversión obtenida con antelación indica que la mayoría piensa que el aspecto dominante con efecto en el futuro de la industria de la energía solar es la caída de los precios de fuentes de energía. Se emprende una nueva encuesta para indagar si todavía es ésa su opinión. Sea p la proporción de analistas de inversión que mantiene esa opinión. a) Especifique las hipótesis alternativa y nula apropiadas. b) Cuando se realiza la nueva encuesta, 59 de los 100 analistas de la muestra concuerda en que el aspecto principal es la caída de los precios de fuentes de energía. ¿Basta ello para rechazar H0? Explique su respuesta con base en el valor P de la prueba. c) Interprete los resultados en el contexto del problema.

328

PROBABILIDAD Y ESTADÍSTICA

11. Se diseña actualmente una nueva red de computadoras. El fabricante afirma que es compatible con más de 99% del equipo en uso. a) Especifique las hipótesis alternativa y nula necesarias para obtener datos que sustentan la afirmación. b) Se ejecuta una muestra de 300 programas, de los cuales 298 funcionan sin que se requieran cambios. En otras palabras, son compatibles con la nueva red. ¿Puede rechazarse H0? Explique su respuesta con base en el valor P de la prueba. c) ¿Qué conclusión práctica puede obtenerse de la prueba? 12. Se piensa que la tasa de ausencia total de defectos en dispositivos de RAM de 64 KB producidos en Japón es menor de 8%. a) Especifique las hipótesis alternativa y nula necesarias para sustentar la afirmación. b) Se pone a prueba una muestra de 64 de esos dispositivos, de los cuales cuatro no tienen defectos. ¿Es posible rechazar H0? Explique su respuesta con base en el valor P de la prueba. c) ¿Qué conclusión puede obtenerse de los datos en el contexto del problema? 13. Se piensa que más de 60% de las oficinas corporativas en Estados Unidos tiene un servidor como parte de su equipo. a) Especifique las hipótesis alternativa y nula apropiadas para sustentar la afirmación. b) Calcule el punto crítico de la prueba con nivel α = 0.05. c) Al recopilar los datos, se descubre que 233 de las 375 oficinas estudiadas tienen servidor. ¿Puede rechazarse H0 con el nivel α = 0.05? ¿A qué tipo de error estaría expuesto ahora? d ) Explique, en el contexto del problema, las consecuencias prácticas de cometer el tipo de error al que se estaría expuesto ahora. 14. Los oponentes de la construcción de una presa en un río afirman que menos de la mitad de los ribereños están a favor de la construcción. Se emprende una encuesta para sustentar ese punto de vista. a) Especifique las hipótesis alternativa y nula apropiadas. b) Encuentre el punto crítico de una prueba con nivel α = 0.1. c) De 500 personas interrogadas, 230 están a favor de la construcción. ¿Es esa evidencia suficiente para justificar la afirmación de los oponentes de la presa? d ) ¿A cuál tipo de error se está sujeto ahora? Analice las consecuencias prácticas de cometer tal error. 15. Se desarrolla un medidor digital de presión operado con baterías para su uso en la calibración de medidores de presión neumáticos en el campo. Se piensa que 95% de las mediciones obtenidas con el medidor digital está a no más de 0.01 lb/pulg2 del valor verdadero. En una serie de 100 pruebas, el medidor es sometido a una presión de 10 000 lb/pulg2. Se considera que la prueba tiene éxito si la medición se ubica a no más de 10 000 ± 0.01 lb/pulg2. Interesa probar: H0: p = 0.95 H1: p ≠ 0.95 con el nivel α = 0.05. a) ¿Cuáles son los puntos críticos de la prueba? b) La recopilación de los datos muestra que 98 de las 100 mediciones son exitosas. ¿Puede rechazarse H0 a un nivel α = 0.05? ¿A qué tipo de error se estaría expuesto?

INFERENCIAS ACERCA DE PROPORCIONES

329

16. El ruido en las líneas de transmisión eléctrica, variaciones de voltaje y cortes de energía (apagones) pueden afectar el funcionamiento de las computadoras. Cuando entra ruido en un televisor, el resultado consiste en estática y nieve; si entra en una computadora, son posibles los errores y daño de circuitos. Se piensa que más de 80% de las alteraciones de las líneas de transmisión eléctrica en un sitio de cómputo específico corresponde a ruido. a) Especifique las hipótesis alternativa y nula apropiadas y necesarias para verificar ese supuesto. b) Encuentre el punto crítico de la prueba con nivel α = 0.01. c) De 150 alteraciones en las líneas de transmisión ocurridas durante el tiempo de estudio, 133 se deben a ruido. ¿Puede rechazarse H0 con el nivel α = 0.01? Interprete los resultados en el contexto del problema. Sección 9.3

17. Se selecciona una muestra aleatoria de 500 trabajadores dedicados a tareas de investigación y desarrollo durante el año pasado. De ellos, 178 ganan más de $72 000 anuales. De 450 empleados del área estudiados en el año actual, 220 ganan más de $72 000 por año. a) Sea que p1 y p2 denotan la proporción de trabajadores del área de investigación y desarrollo que ganaron más de $72 000 anuales en los años previo y actual, respectivamente. Calcule estimaciones puntuales de p1, p2 y p1 – p2. b) Determine un intervalo de confianza de 95% para p1 – p2. c) ¿Le sorprendería la afirmación de que la proporción de trabajadores de investigación y desarrollo que ganan más de $72 000 es la misma en este año y el pasado? Explique su respuesta con base en el intervalo de confianza calculado en el inciso b. 18. El concreto superplastificado se produce mediante la adición de sustancias químicas al concreto normal para hacerlo más fluido, de modo que pueda colocarse con mayor facilidad. Suponga que una muestra de 50 nuevos proyectos de construcción en el área Dallas-Fort Worth indica que en 15 de ellos se usa ese tipo de concreto. Otra muestra de 60 nuevos proyectos en el área de Boston revela que en 15 se usa el concreto superplastificado. a) Sean p1 y p2 las proporciones de nuevos proyectos de construcción en Dallas-Fort Worth y Boston, respectivamente, en las que se usa el concreto superplastificado. Calcule estimaciones puntuales de p1, p2 y p1 – p2. b) Encuentre un intervalo de confianza de 95% para p1 – p2. c) ¿Le sorprendería la afirmación de que la proporción de proyectos de Dallas-Fort Worth en los que se usa ese tipo de concreto es claramente mayor que en el área de Boston? Explique su respuesta con base en el intervalo de confianza determinado en el inciso b. 19. Se realiza un estudio del mercado de computadoras. Se extraen muestras aleatorias de usuarios de las dos marcas líderes de servidores. El propósito del estudio es estimar la proporción de usuarios de cada población que usa o le gustaría usar el sistema de oficina pequeña que produce el fabricante del servidor. Se obtienen los datos siguientes: Tipo I

n1 = 200 x1 = 62

Tipo II

n2 = 190 x2 = 76

330

PROBABILIDAD Y ESTADÍSTICA

a) Encuentre estimaciones puntuales de p1, p2 y p1 – p2. b) Determine un intervalo de confianza de 90% para p1 – p2. c) ¿Le sorprendería la afirmación de que p1 = p2? Explique su respuesta con base en el intervalo de confianza del inciso b. 20. Se espera que las computadoras tengan una función cada vez más importante en el control de las actividades delictivas durante los años por venir. En 1983, el FBI tenía un sistema no computarizado, Ident, que contenía los expedientes de miles de personas en todo Estados Unidos. Una muestra aleatoria de 500 expedientes revela que apenas 70% de ellos tiene información sobre la resolución del caso. Ello resulta desafortunado, ya que cerca de un tercio de los casos es desestimado finalmente. Si la desestimación no fuera parte del expediente, personas inocentes podrían quedar señaladas. a) Suponga que se diseña y pone en uso un nuevo sistema computarizado de historiales delictivos. Se selecciona una muestra aleatoria de tamaño 500 de los casos registrados en el nuevo sistema. De ellos, se descubre que 410 abarcan la información sobre la resolución del caso. Estime la proporción de casos del nuevo sistema que contiene esa información. b) Estime la diferencia entre las proporciones del viejo sistema Ident y el nuevo sistema computarizado (reste el primero del segundo). c) Determine un intervalo de confianza de 95% para la diferencia entre las proporciones. d ) ¿Sería correcto afirmar que el nuevo sistema es superior a Ident, en el sentido de que contiene más información sobre “la resolución del caso”? Explique su respuesta con base en el intervalo de confianza del inciso c. 21. (Tamaño muestral para estimar p1 – p2.) La diferencia entre dos proporciones poblacionales, p1 – p2, se estima con base en muestras aleatorias independientes que se extraen de las poblaciones respectivas. Cada una de las muestras tiene tamaño n. Demuestre que en la estimación de p1 – p2 con exactitud d y confianza 100(1 – α)%, n está dada por: Tamaño muestral para estimar p1 – p2 Tamaño muestral para estimar p1 – p2, con estimaciones previas de p1 y p2: n

zα2 /2

[ pˆ1 (1 – pˆ1 ) + pˆ 2 (1 – pˆ 2 )] d2

Tamaño muestral para estimar p1 – p2, sin estimaciones previas de p1 y p2:

n

zα2 /2 2d 2

22. ¿Qué tamaño de muestra común debe tomarse de las poblaciones de trabajadores del área de investigación y desarrollo de los años actual y pasado para estimar p1 – p2 a no más de 0.02 con confianza de 90%? Use los datos del ejercicio 17 para obtener las estimaciones de p1 y p2. 23. ¿Qué tamaño muestral común debe seleccionarse de los archivos del sistema Ident y el nuevo sistema computarizado para estimar p1 – p2 a no más de 0.03 con confianza de 95%? Use los datos del ejercicio 20 para obtener las estimaciones de p1 y p2.

INFERENCIAS ACERCA DE PROPORCIONES

331

24. Se realizará un estudio para estimar la diferencia en las proporciones de productos defectuosos fabricados por los trabajadores de una línea en montaje en dos turnos distintos. ¿Qué tamaño de muestra común debe usarse para estimar tal diferencia a no más de 0.04 con confianza de 90%? 25. Un grupo de ingenieros automotrices desea comparar el funcionamiento de su nuevo automóvil de seis cilindros y tracción delantera con el viejo modelo de cuatro cilindros. Sean p1 y p2 las proporciones de automóviles con problemas de motor durante las primeras 5 000 mi de uso de los dos modelos, en el orden de su mención. ¿Qué tamaño muestral común debe usarse para estimar p1 – p2 a no más de 0.05 con confianza de 90%? Sección 9.4

26. El uso de fibra óptica se incrementa rápidamente en los sectores de telecomunicaciones, militar e industrial general. Esa fibra debe ser fuerte, duradera, funcional en una amplia gama de temperatura e insensible a la radiación. Muchas fallas de la fibra se deben a fracturas por fragilidad que se convierten en rupturas completas. Se estudian dos fuentes de calentamiento para obtención de fibras. Se trata de hornos de carbón y calentamiento con láser de dióxido de carbono. Una compañía usa actualmente los hornos de carbón; pero cambiará al calentamiento con láser si puede demostrarse que el segundo de esos métodos reduce la proporción de fallas en más de 0.02. a) Sean p1 y p2 las proporciones de fallas ocurridas con el uso de los hornos de carbón y el calentamiento con láser de dióxido de carbono, respectivamente. Especifique las hipótesis alternativa y nula apropiadas y necesarias para sustentar el cambio al método de láser. b) Encuentre el punto crítico de una prueba con nivel α = 0.05. c) De 100 fibras de prueba que se producen con el horno de carbón, fallan cinco, mientras que lo hace apenas una de las 100 producidas con el láser. Estime p1, p2 y p1 – p2. ¿Puede rechazarse H0 a un nivel α = 0.05? ¿Recomendaría que la empresa cambie de método de producción? d ) ¿A qué tipo de error estaría expuesto ahora? Analice las consecuencias prácticas de cometer ese tipo de error. 27. El costo de corrección de un defecto en un circuito integrado digital bipolar depende de cuándo se descubra el defecto. El costo es de centavos si se identifica antes de su integración en un sistema de cómputo. Sin embargo, en caso de detectarlo sólo después de que el dispositivo está instalado en una computadora, su reparación podría costar miles de dólares. Se estudia la tasa de defectos eléctricos de dos tipos de circuitos que produce una compañía dada. Se supone que la tasa de defectos de sus circuitos ALS (advanced lower-power Schottky) es menor que la de sus circuitos LPS (lower-power Schottky). a) Sean p1 y p2 las proporciones de circuitos ALS y LPC producidos, respectivamente, con defectos eléctricos. Especifique las hipótesis nula y alternativa necesarias para confirmar la suposición. b) ¿Cuál es el punto crítico de la prueba a un nivel α = 0.1? c) Se seleccionan aleatoriamente y prueban 2 000 circuitos de cada tipo. Se descubre que tres y cinco circuitos ALS y LPS, respectivamente, tienen defectos eléctricos. Estime p1, p2 y p1 – p2. ¿Puede rechazarse H0 a un nivel α = 0.1 a partir de esos datos?

332

PROBABILIDAD Y ESTADÍSTICA

28. Los motores a diesel actuales requieren acabados superficiales más finos y mayor consistencia que los del pasado. Se prueban dos tipos de abrasivos para su uso en microacabados usados en el pulido de cigüeñales. El primero usa un abrasivo de papel y tela, y el segundo, una película abrasiva recubierta. Ambos están disponibles en rollos que pueden romperse, lo cual es causa de paro de máquinas y demoras en el proceso de pulido. Se piensa que la proporción de rollos que se rompe es mayor con el abrasivo de papel y tela que con la película. Sin embargo, esta última es más costosa, de modo que la diferencia en las proporciones de ruptura debe exceder de 0.10 para que la película sea rentable. a) Especifique las hipótesis nula y alternativa necesarias para sustentar la afirmación de que la película abrasiva es rentable. Sea p1 la proporción de rollos del abrasivo de papel y tela que se rompe durante la prueba. b) ¿Cuál es el punto crítico de la prueba con nivel α = 0.025? c) De 50 rollos de abrasivo de papel y tela, se rompen 15 durante la prueba, mientras que sólo dos de los 40 de película abrasiva se rompen. Estime p1, p2 y p1 – p2. ¿Puede rechazarse H0 a un nivel α = 0.025? d ) ¿A qué tipo de error estaría expuesto ahora? Analice las consecuencias prácticas de cometer ese tipo de error. 29. Dos tipos de detectores de metal se usan en aeropuertos de todo el mundo. Uno se llama detector de ondas continuas, y el otro, detector de ondas pulsátiles. Ambos son igualmente eficaces en la detección de objetos metálicos grandes, como las pistolas y cuchillos. Sin embargo, se piensa que el detector de ondas continuas tiende a ser menos eficiente, en el sentido de que puede activarse fácilmente con objetos como monedas, lápiz labial y otros pequeños e inocuos objetos metálicos. a) Sean p1 y p2 las proporciones de pasajeros que pasan por los detectores de ondas continuas y ondas pulsátiles, respectivamente, con las que se activan los dispositivos. Especifique las hipótesis nula y alternativa necesarias para sustentar la afirmación de que el detector de ondas continuas se activa con una mayor proporción de pasajeros que el de ondas pulsátiles. b) Se observa muestras aleatorias de 175 pasajeros que pasan por uno y otro tipos de dispositivos. De los que cruzan el de ondas continuas, con 113 se activa la alarma. Sin embargo, la activación ocurre sólo con cuatro de los que pasan por el detector de ondas pulsátiles. ¿Piensa que se debe rechazar H0? ¿Cuál es el valor P de la prueba? ¿Cuál conclusión práctica puede obtenerse de los datos? 30. El bombardeo con partículas se usa para comprimir el área superficial de piezas metálicas y hacerlas más resistentes a las fracturas. Ello se logra al bombardear la superficie con pequeñas partículas que giran a alta velocidad. Cada vez que una partícula tiene contacto con el metal, produce una pequeña depresión en la superficie y comprime el área situada directamente bajo ella. El bombardeo continúa hasta que se comprime toda la superficie. Se realizan pruebas de una pieza específica para ver si este proceso reduce la proporción de piezas que se fracturan al ponerlas en uso. Se obtienen los datos siguientes: No bombardeadas

Bombardeadas

n1 = 35 Piezas con fractura = 7

n2 = 40 Piezas con fractura = 3

INFERENCIAS ACERCA DE PROPORCIONES

333

Especifique las hipótesis alternativa y nula apropiadas. A partir de los datos, ¿piensa que el bombardero reduce la probabilidad de que una parte se fracture al ponerla en uso? Explique su respuesta con base en el valor P de la prueba. 31. Demuestre que pˆ = (X1 – X2)/(n1 + n2), es decir, que puede encontrarse pˆ al combinar las dos muestras en una y calcular la proporción muestral usual de la nueva muestra. Verifíquelo numéricamente con los datos del ejercicio 30. 32. Sean X1 y X2 los números de objetos con el rasgo de interés en muestras aleatorias obtenidas independientemente de tamaños n1 y n2, en ese orden. Suponga que estas variables aleatorias tienen distribución binomial, con parámetros p1 y p2. a) Calcule el valor esperado del estimador combinado pˆ . b) Demuestre que si H0: p1 = p2 es verdadera, entonces pˆ es un estimador insesgado de la proporción poblacional común p. EJERCICIOS DE REPASO

33. Se realizará una encuesta de compañías mineras para estimar p, la proporción de empresas que piensa contratar pasantes de ingeniería o ingenieros experimentados durante el año próximo. a) ¿Cuán grande debe ser la muestra para estimar p a no más de 0.04 con confianza de 94%? b) Una muestra de 500 compañías revela que 105 planea efectuar tales contrataciones. Encuentre la estimación puntual de p. Calcule un intervalo de confianza de 94% para p. 34. Se piensa que la mayoría de los ingenieros mineros titulados durante 1970 en facultades estadounidenses trabaja actualmente en la empresas carboneras. a) Especifique las hipótesis nula y alternativa necesarias para obtener datos estadísticos que sustenten esa afirmación. b) Se selecciona una muestra aleatoria de 50 de esos individuos y se determina su situación laboral actual. De ellos, 26 trabaja en la entidades carboneras. ¿Piensa que debe rechazarse H0? Explique su respuesta con base en el valor P de la prueba. 35. Un procedimiento usado para obtener gemelos idénticos en ganado bovino consiste en la división microquirúrgica del embrión en dos grupos de células, ello seguido de la transferencia inmediata de los embriones. Se piensa que este procedimiento tiene efectividad mayor de 50%. a) Especifique las hipótesis nula y alternativa necesarias para sustentar esa afirmación. b) Encuentre el punto crítico de una prueba con nivel α = 0.05 con base en tamaño muestral 100. c) Cuando se realiza el experimento, 55% de los trasplantes culmina en el nacimiento de gemelos. ¿Puede rechazarse H0 con el nivel α = 0.05? Interprete los resultados en el contexto del problema. 36. Un sistema de control de iluminación programable está en fase de diseño. Su propósito es reducir los costos de consumo de electricidad en edificios. En última instancia, el sistema incluirá el uso de numerosos transmisores-receptores. Se consideran dos tipos. En las pruebas de vida útil, se obtienen los datos siguientes sobre el número de fallas en los transmisores-receptores de cada tipo: Tipo I

Tipo II

n1 = 100

n2 = 100

x1 = 2

x2 = 4

334

PROBABILIDAD Y ESTADÍSTICA

a) Encuentre estimaciones puntuales de p1 – p2, la diferencia entre las tasas de falla de los dos tipos de transmisores-receptores. b) Encuentre un intervalo de confianza de 95% para p1 – p2. c) ¿Puede afirmarse que p1 < p2 con base en el intervalo del inciso b? Explique su respuesta. d ) ¿Es el intervalo del inciso b suficientemente angosto para formarse una idea del valor real de p1 − p2? ¿Qué tamaño muestral común es necesario para estimar p1 − p2 a no más de 0.01 con confianza de 95%? 37. Una medida de la calidad y de la satisfacción de los clientes consiste en las compras repetidas. Un proveedor de papel usado para impresos de computadora realiza un muestreo de 75 cuentas de clientes durante el año pasado y descubre que 40 de ellos colocaron dos o más pedidos en ese año. Otra encuesta similar, efectuada a fines del año actual, revela que 35 de 50 clientes hicieron compras repetidas. ¿Los datos sustentan la afirmación de que se ha incrementado la proporción de compras repetidas durante el periodo de dos años? Explique su respuesta con base en el valor P de la prueba. 38. Una compañía experimenta con un nuevo método para grabar circuitos, que debe reducir la proporción de circuitos en los que es necesario grabar una segunda vez. A fin de que sea rentable, la diferencia de proporciones entre los métodos antiguo y nuevo debe exceder de 0.1. a) Sea p1 la proporción de circuitos que debe grabarse de nuevo con el método antiguo. Especifique las hipótesis alternativa y nula requeridas para demostrar que el nuevo método es rentable. b) Encuentre el punto crítico de la prueba con nivel α = 0.05 de la hipótesis del inciso a. c) Se obtienen los datos siguientes sobre el número de circuitos que deben procesarse de nuevo con cada método: Antiguo

Nuevo

n1 = 25

n2 = 50

x1 = 4

x2 = 2

¿Puede rechazarse H0 con el nivel α = 0.05? ¿A qué tipo de error estaría expuesto ahora? ¿Cuáles son las consecuencias prácticas de cometer ese tipo de error? 39. Una fuente de contaminación del agua es la gasolina que se fuga de los tanques de almacenamiento subterráneos. Se selecciona una muestra aleatoria de 100 estaciones de servicio y se inspeccionan los tanques. Se determina que hay fuga de por lo menos un tanque en 20 de ellas. a) Encuentre un intervalo de confianza de 95% para la proporción de estaciones de servicio en todo el país con problema de fugas. b) Suponga que existen unas 375 000 estaciones de servicio en Estados Unidos. Calcule un intervalo de confianza de 95% del número de estaciones de servicio con problemas de fugas. c) ¿Cuán grande se requiere que sea la muestra para estimar la proporción de estaciones de servicio con problema de fuga a no más de 0.02 con confianza de 95%? 40. “En la operación Tormenta del Desierto, la regla de combate dictaba que cuando la tripulación de un avión no podía localizar o identificar positivamente sus blancos primario o secundario, debía regresar a la base con su armamento”. Esa regla tenía como fin minimizar el daño a civiles. Durante las operaciones Tormenta del Desierto y Escudo del Desierto, las fuerzas alia-

INFERENCIAS ACERCA DE PROPORCIONES

335

das realizaron 72 000 vuelos de combate. En 18 000 casos, regresaron a la base con su armamento. (Basado en información de “Operations Law and the Rules of Engagement in Operations Desert Shield and Desert Storm”, Teniente Coronel John G. Humphries, Airpower Journal, otoño de 1992, pp. 25-41.) a) Calcule una estimación puntual de p, la proporción de vuelos de combate que regresan a la base con su armamento en futuros conflictos donde estén vigentes esas reglas, con base en los datos precedentes. b) Determine un intervalo de confianza de 95% para p. c) Suponga que en un conflicto futuro se vuelan 10 000 misiones de combate. Calcule un intervalo de confianza de 95% del número de misiones en las que los aviones regresan a la base con su armamento.

336

PROBABILIDAD Y ESTADÍSTICA

CAPÍTULO

10

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

E

n este capítulo, continúa el estudio de problemas de dos muestras con la consideración de métodos para comparar las medias de dos poblaciones. Este problema se considera mediante dos condiciones experimentales distintas, a saber, cuando las muestras son independientes y cuando los datos están por pares. Estos términos se explican con detalle en las secciones del capítulo.

10.1 ESTIMACIÓN PUNTUAL: MUESTRAS INDEPENDIENTES La situación general que se considera a continuación es la siguiente: Existen dos poblaciones de interés, cada una con media desconocida. Se obtiene una muestra aleatoria de la primera población y otra de la segunda, de manera tal que los objetos seleccionados de la primera no tienen efecto alguno en los que se eligen de la segunda. Se dice que las muestras obtenidas de esta manera son independientes una de la otra. Se pretende estimar µ1 – µ2, la diferencia entre las medias poblacionales, con un estimador puntual.

El ejemplo 10.1.1 ilustra esta idea en un contexto práctico. Ejemplo 10.1.1. Se realiza un estudio comparativo del tiempo necesario para inspeccionar las conexiones y aislamiento del cableado en dos tipos de cortacircuitos. La población I consiste en todos los cortacircuitos de interruptor de vacío, y la población II, en todos los cortacircuitos magnéticos de aire. Se selecciona una muestra aleatoria de cada población, se inspecciona cada cortacircuito seleccionado y se registra el tiempo en minutos necesario para la inspección. Las muestras son independientes, en el sentido de que la elección de un cortacircuito de la población I no afecta de manera alguna la de

336

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

Población I (todos los cortacircuitos de interruptor de vacío)

337

Población II (todos los cortacircuitos magnéticos de aire)

Muestra de n1 cortacircuitos

Muestra de n2 cortacircuitos

!1 = ?

!2 = ?

!1 – ! 2 = ?

FIGURA 10.1 Muestras independientes de cortacircuitos extraídas de dos poblaciones distintas.

cortacircuitos en la población II. Se pretende estimar µ1 – µ2, la diferencia entre las medias de tiempo requeridas para la inspección en las dos poblaciones. El estudio se representa gráficamente en la figura 10.1.

La forma lógica de estimar µ1 – µ2 es hacerlo por separado para cada media, a través de la media muestral correspondiente, y luego estimar µ1 – µ2, la diferencia entre las medias muestrales. En otras palabras, un estimador puntual lógico de la diferencia entre las medias poblacionales es la diferencia entre las medias muestrales. Estimador puntual de la diferencia entre dos medias

µ1 – µ2 = µˆ1 – µˆ 2 = X 1 – X 2 Ejemplo 10.1.2.

Al término del estudio del ejemplo 10.1.1, se tienen los datos siguientes:

Interruptor de vacío (I) 3.0 8.0 7.1 5.1

5.3 6.7 4.2 5.5

6.9 6.3 7.2 5.8

Interruptor magnético de aire (II)

4.1

7.1 10.4 12.1 10.5

9.3 9.1 10.7 11.3

8.2 8.7 10.6 11.5

A partir de esos datos, se tiene:

µˆ1 = x1 = 75.2 / 13 = 5.78 min µˆ 2 = x2 = 119.5 / 12 = 9.96 min La diferencia estimada en la media de tiempos de inspección es:

µ1 – µ2 = µˆ1 – µˆ 2 = x1 – x2 = 5.78 – 9.96 = – 4.18

338

PROBABILIDAD Y ESTADÍSTICA

Con base en los datos, parecería que en promedio un cortacircuito de interruptor de vacío se puede inspeccionar en casi 4.18 min menos que otro magnético de aire.

El conocimiento de la distribución de la variable aleatoria X 1 – X 2 es necesario para determinar los intervalos de confianza para µ1 – µ2 o poner a prueba una hipótesis concerniente al valor de esa diferencia. En el teorema siguiente, se pone de relieve su distribución bajo el supuesto de que ambas muestras se obtienen de distribuciones normales. El teorema también muestra que el estimador X 1 – X 2 es un estimador insesgado de µ1 – µ2. Este teorema se usa en muchos de los procedimientos estadísticos analizados más adelante. Teorema 10.1.1 (distribución de X1 – X 2 ). Sean X1 y X 2 las medias muestrales basadas en muestras aleatorias independientes de tamaños n1 y n2 obtenidas de distribuciones normales con medias µ1 y µ2, y varianzas σ 21 y σ 22 , respectivamente. Entonces, X1 – X 2 es normal, con media µ1 – µ2 y varianza σ 12 / n1 + σ 22 / n2 .

Demostración. En el teorema 7.3.4, se demostró que en el muestreo de una distribución normal, la media muestral es también normal, con media µ y varianza σ 2/n. Al aplicar el resultado, puede llegarse a la conclusión de que X1 y X 2 son normales, con medias µ1 y µ2, y varianzas σ 21 /n1 y σ 22 / n2 , respectivamente. El ejercicio 41 del capítulo 7 muestra que es normal toda combinación lineal de variables aleatorias normales e independientes. Puesto que X1 y X 2 se basan en muestras extraídas independientemente de dos poblaciones, X1 y X 2 son a su vez independientes. Con la aplicación del ejercicio 41, puede sacarse en conclusión que X1 − X 2 es normal, con media µ1 – µ2 y varianza σ 21 / n1 + σ 22 / n2 , como se afirmó.

Al igual que con una muestra, el teorema del límite central permite suponer que en el caso de muestras grandes es aproximadamente normal la diferencia X1 – X 2 , inclusive si las muestras se obtienen de poblaciones que no sean normales.

10.2 COMPARACIÓN DE VARIANZAS: LA DISTRIBUCIÓN F Existen dos opiniones en cuanto a la mejor forma de comparar las medias de dos poblaciones normales. Ello se debe a que existen dos posibilidades distintas, a saber: 1. σ 21 y σ 22 son desconocidas e iguales. 2. σ 21 y σ 22 son desconocidas y distintas. Un punto de vista es que los datos experimentales o la experiencia deben usarse como guía para determinar la situación prevaleciente. Luego, se selecciona una de las dos estadísticas de prueba posibles para la comparación de las medias, elección que depende de la relación percibida entre las varianzas poblacionales. Una segunda opinión hace caso omiso de la relación entre las varianzas y usa una misma estadística de prueba para comparar las medias en ambos casos. Puesto que el lector

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

339

se encontrará con ambas en la literatura de investigación, se analizan las dos, así podrá decidir cuál prefiere. La primera técnica mencionada requiere el desarrollo de una prueba para la comparación de las varianzas de dos poblaciones normales. En teoría, las pruebas de la relación entre dos varianzas pueden asumir cualquiera de las tres formas usuales. En la práctica, sólo se necesitan dos, que son: I H 0: σ 12 = σ 22

II H 0: σ 12 = σ 22

H1: σ 12 > σ 22

H1: σ 12 ≠ σ 22

Prueba de cola derecha

Prueba de dos colas

donde σ 21 denota, en el caso de la cola derecha, la varianza poblacional considerada como la mayor de las dos. Poner a prueba cualquiera de estas hipótesis requiere desarrollar una estadística de prueba. Ésta debe ser lógica; pero reviste mayor importancia que sea tal que su distribución de probabilidad se conozca bajo el supuesto de que la hipótesis nula es verdadera. En otras palabras, debe conocerse su distribución cuando se piensa que las varianzas poblacionales son iguales. Es fácil encontrar una estadística lógica para la comparación de varianzas. Recuerde que las varianzas muestrales S 21 y S 22 son estimadores insesgados de las varianzas poblacionales σ 21 y σ 22, respectivamente. Así pues, para comparar σ 21 contra σ 22 basta hacerlo con S 21 y S 22. Ello se logra no al considerar la diferencia entre ellas dos, sino más bien su proporción, S 21/ S 22. Si la hipótesis nula es verdadera y las varianzas poblacionales son realmente iguales, puede esperarse que S 21 y S 22 tengan valor muy cercano una de la otra, lo cual obliga a que S 21/ S 22 a su vez sea cercana a 1. Puede llegarse a la conclusión de que las varianzas poblacionales son diferentes si S 21/ S 22 es mucho mayor que la unidad. La frase “mucho mayor que la unidad” se usa en el sentido de las probabilidades, es decir, que un valor observado de la estadística es mucho mayor que 1 si resulta excesivamente alto para que haya ocurrido por azar cuando, de hecho, las varianzas poblacionales son iguales. Debe conocerse la distribución de probabilidad de la estadística S 21/ S 22 para determinar la probabilidad de que se observen diversos valores de ella. En este capítulo, se demuestra que esa estadística tiene una distribución antes no mencionada. En particular, si las varianzas poblacionales son iguales, entonces posee lo que se llama distribución F. Esta distribución se define con base en otra ya analizada, a saber, la distribución ji cuadrada. En particular, toda variable aleatoria F puede escribirse como una proporción o razón de dos variables aleatorias ji cuadrada independientes, cada una dividida entre sus grados de libertad respectivos. La definición formal de la distribución F es la siguiente. Definición 10.2.1 (distribución F ). Sean X γ21 y X γ22 variables aleatorias ji cuadrada independientes con γ1 y γ2 grados de libertad, respectivamente. La variable aleatoria: X γ2 /γ1 1

X γ2 /γ 2 2

tiene lo que se llama distribución F, con γ1 y γ2 grados de libertad.

340

PROBABILIDAD Y ESTADÍSTICA

F" ," 1

0

2

f

FIGURA 10.2 Una densidad F característica.

Las propiedades importantes de la familia de variables aleatorias F se resumen de la siguiente forma: Propiedades de las distribuciones F 1. Existe un número infinito de variables aleatorias F, cada una identificada por dos parámetros, γ1 y γ2, llamados grados de libertad. Estos parámetros siempre son enteros positivos: γ1 se relaciona con la variable aleatoria ji cuadrada del numerador de la variable aleatoria F, y γ2, con la variable aleatoria ji cuadrada de su denominador. La notación Fγ , γ denota una variable aleatoria F con γ1 y γ2 grados de libertad. 2. Cada variable aleatoria F es continua. 3. La gráfica de la densidad de cada variable aleatoria F es una curva asimétrica con la forma general que se muestra en la figura 10.2. 4. Las variables aleatorias F no pueden tener valor negativo. 1

2

Un resumen parcial de la distribución acumulativa de variables aleatorias F con grados de libertad selectos se muestra en la tabla IX del apéndice A. En ésta, los grados de libertad del numerador, γ1, aparecen como encabezados de columna, y los del denominador, γ2, como rótulos de filas. Los puntos F con grados de libertad mayores de 120 pueden aproximarse satisfactoriamente con la fila o columna 120. Una vez más, se usa la notación de indicar con fr el punto de la curva Fγ , γ con el área r a su derecha. El ejemplo 10.2.1 ilustra el uso de la tabla IX. 1

2

Ejemplo 10.2.1. Considere F10, 15, la variable aleatoria F con 10 y 15 grados de libertad. a) b) c)

Determine P[F10, 15 ≤ 2.544]. Esta probabilidad se lee directamente en la tabla IX. Basta observar los números de la columna 10 y la fila 15 hasta localizar 2.544. Puede verse que P[F10, 15 ≤ 2.544] = F(2.544) = 0.95. Encuentre P[F10, 15 > 2.059]. La distribución F es continua, de modo que esta probabilidad es igual a 1 – F(2.059). Según la tabla IX, F(2.059) = 0.90. Por ende, P[F10, 15 > 2.059] = 0.10. De conformidad con la convención de notación, puede afirmarse que f 0.05 = 2.544 y f0.10 = 2.059.

Ahora, es posible verificar que la estadística propuesta para probar que H 0: σ 12 = σ 22 en verdad tiene distribución F cuando H0 es verdadera.

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

341

Teorema 10.2.1 (distribución de S12 /S 22). Sean S12 y S 22 varianzas muestrales basadas en las muestras aleatorias independientes de tamaños n1 y n2 extraídas de poblaciones normales con medias µ1 y µ2, y varianzas σ 12 y σ 22 , respectivamente. Si σ 12 = σ 22 , entonces la estadística S12 / S22 tiene distribución F con n1 – 1 y n2 – 1 grados de libertad. Demostración. Se demostró que la variable aleatoria (n – 1)S 2/σ 2 tiene distribución ji cuadrada con n – 1 grados de libertad (teorema 8.1.1). La aplicación de ese resultado permite llegar a la conclusión de que las variables aleatorias ( n1 – 1) S12 /σ 12 y ( n2 – 1) S22 /σ 22 son variables aleatorias ji cuadrada con n1 – 1 y n2 – 1 grados de libertad, respectivamente. Por añadidura, el muestreo es independiente, de modo que esas variables ji cuadrada también lo son. Con base en la definición 10.2.1, la variable aleatoria:

( n1 – 1) S12 /σ 12 σ 2 S2 ( n1 – 1) = 22 12 2 2 ( n2 – 1) S2 /σ 2 σ 1 S2 ( n2 – 1) tiene distribución F con n1 – 1 y n2 – 1 grados de libertad. Si σ 12 = σ 22 , entonces la proporción recién mencionada se reduce a S12/ S22 , como se pretendía.

Note que los grados de libertad relacionados con la estadística S12/ S22 son n1 – 1 y n2 – 1. En otras palabras, el número de grados de libertad del numerador es una unidad menos que el tamaño de la muestra extraída de la población I, y lo mismo es válido para el denominador respecto de la población II. Son varios los aspectos que deben resaltarse en cuanto a esta prueba F. Supuestos de la prueba F con varianzas iguales 1. Se supone la normalidad y la prueba es sensible a las transgresiones de este supuesto. La prueba debe omitirse cuando parece, con base en el diagrama de tallo y hoja o el histograma, que cualquiera de las dos poblaciones no tiene forma al menos aproximada de campana. 2. La prueba de igualdad de las varianzas funciona óptimamente cuando los tamaños muestrales son iguales. La prueba tampoco debe usarse en caso de que difieran mucho y haya duda acerca de la normalidad de las dos poblaciones muestreadas. 3. La prueba no es muy potente. En otras palabras, la hipótesis nula de que σ 12 = σ 22 no se rechaza con la frecuencia necesaria cuando, de hecho, las varianzas son distintas. Se recomienda minimizar este problema ejecutando la prueba con nivel α relativamente alto (son satisfactorios los niveles α hasta de 0.2). Las restricciones precedentes al uso de la prueba F explican en parte la preferencia de algunos estadísticos por la segunda técnica antes mencionada de comparación de medias. Ejemplo 10.2.2. Se realiza un estudio de dos tipos de materiales utilizados en conductos, que son tuberías diseñadas para proteger cables eléctricos. El propósito del estudio es comparar la resistencia de los dos tipos. Ello se evalúa con la medición de la carga en libras necesaria para aplastar una pieza de 6 pulg

342

PROBABILIDAD Y ESTADÍSTICA

hasta 40% de su diámetro original. Se plantean dos preguntas. Cada una debe responderse estadísticamente con base en la información obtenida de muestras de los dos materiales extraídas en forma independiente. La pregunta principal es: “¿El material A soporta en promedio cargas más pesadas que el material B?” En otras palabras, “¿es µA > µB?” Sin embargo, antes de responder esa pregunta debe considerarse otra: “¿Es σ A2 = σ B2 ?” En primer término, se pretende poner a prueba:

H0: σ A2 = σ B2 H1: σ A2 ≠ σ B2 Se obtienen los datos siguientes: Material A

Material B

nA = 25

nB = 16

x A = 380 lb

x B = 370 lb

sA2 = 100

sB2 = 400

En la comparación de las varianzas, se forma la proporción S12/ S22, donde S12 es la mayor de las dos varianzas muestrales. En este caso, s12 es la varianza muestral del material B, 400, y s22 es la del material A, 100. El valor observado de la estadística de prueba es:

sB2 /sA2 = 4 Ese valor es hasta cierto punto mayor que 1, de modo que existen datos de que las varianzas de los dos materiales difieren. A fin de cerciorarse de ello, se requiere calcular un valor P. Los números de grados de libertad relacionados con la estadística de prueba son nB – 1 = 16 – 1 = 15 y nA – 1 = 25 – 1 = 24. Se entra a la tabla IX del apéndice A con 15 y 24 grados de libertad. Se observa que: P[F15, 24 > 2.108] = 0.05 La probabilidad de ver un valor mayor de 4 es incluso menor. Si se tratara de una prueba de una cola, se informaría que P < 0.05; pero es una prueba de dos colas. En este caso, se duplica el valor calculado. Puede rechazarse la hipótesis nula de varianzas iguales y llegar a la conclusión de que las dos varianzas son diferentes, con P < 0.10. En la comparación de promedios, debe usarse un procedimiento de prueba que no suponga la igualdad de las varianzas poblacionales.

10.3 COMPARACIÓN DE MEDIAS: VARIANZAS IGUALES (PRUEBA AGRUPADA) Suponga que el objetivo primario de un estudio es comparar medias y, después de considerar la información disponible, se carece de razones para creer que las varianzas poblacionales sean desiguales. En tal caso, es posible usar el procedimiento llamado prueba T agrupada, independiente o no correlacionada para comparar µ1 contra µ2. La comparación puede hacerse mediante la estimación del intervalo de confianza o con una prueba hipótesis o prueba de significación. Se parte de calcular los límites de un intervalo de confianza de 100(1 – α)% para las diferencias en las medias poblacionales.

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

343

Intervalo de confianza para µ1 – µ2: agrupada Se demostró que X 1 – X 2 es estimador insesgado de µ1 – µ2. A fin de ampliar ese estimador puntual a un intervalo de confianza, una vez más debe encontrarse una variable aleatoria cuya expresión abarque el parámetro de interés, en este caso µ1 – µ2, de distribución conocida. Esa variable aleatoria se obtiene con el teorema 10.1.1. En él, se afirma que cuando se muestrean poblaciones normales, la variable aleatoria X 1 – X 2 es normal, con media µ1 – µ2 y varianza σ 12 / n1 + σ 22 / n2. La estandarización de esa variable aleatoria permite llegar a la conclusión de que la variable aleatoria: ( X 1 – X 2 ) – (µ1 – µ2 )

σ 12/ n1 + σ 22 / n2 es normal estándar. Puede suponerse que las varianzas poblacionales son iguales cuando se las compara y no se detectan diferencias. Sea que σ 2 denota esa varianza poblacional común. En otras palabras, sea que σ 12 = σ 22 = σ 2 . La sustitución en la expresión anterior posibilita sacar en conclusión que: ( X 1 – X 2 ) – (µ1 – µ2 )

σ 2 (1/ n1 + 1/ n2 ) es normal estándar. Puesto que se desconoce σ 2, debe estimarse a partir de los datos. Ello se hace por medio de una varianza muestral agrupada. Note que ya se cuenta con dos estimadores insesgados para σ 2, a saber, S12 y S 22 . La idea es agruparlos para formar un solo estimador insesgado de σ 2, de manera tal que se tomen en cuenta los tamaños muestrales. Es natural que se tienda a conceder mayor importancia o “peso” a la varianza muestral relacionada con la muestra más grande. La varianza agrupada, como se define a continuación, logra precisamente eso. Definición 10.3.1 (varianza agrupada). Sean S12 y S22 las varianzas muestrales basadas en muestras independientes de tamaños n1 y n2, respectivamente. La varianza agrupada, que se denota con S 2p , está dada por: S 2p =

( n1 – 1) S12 + ( n2 – 1) S22 n1 + n2 – 2

Advierta que se ponderan S12 y S 22 al multiplicar por n1 – 1 y n2 – 1, respectivamente. La forma más natural de ponderación es la multiplicación por los tamaños muestrales correspondientes, n1 y 2 2 n2. Se opta por este tipo de ponderación para que la variable aleatoria ( n1 + n2 – 2) S p /σ tenga distribución ji cuadrada. Ello es necesario para que la estadística de prueba que se usa en la prueba de igualdad de las medias tenga, su vez, distribución T. Ejemplo 10.3.1. Considere la varianza muestral s12 = 24 de una muestra de tamaño 16 y una segunda varianza muestral s22 = 20 basada en una muestra de tamaño 121. El valor de la proporción s12/s22 es 24/20 = 1.20. A partir de esas varianzas muestrales, suele afirmarse que las varianzas poblacionales σ 12 y σ 22

344

PROBABILIDAD Y ESTADÍSTICA

son diferentes, inclusive con α = 0.2 ( f0.1 = 1.545). La estimación agrupada de la varianza poblacional común es: ( n1 – 1) s12 + ( n2 – 1) s22 n1 + n2 – 2 15 ( 24) + 120 ( 20) = 16 + 121 – 2 2 760 = = 20.44 135

σˆ 2 = s 2p =

Note que esta estimación difiere mucho de 22, el valor obtenido al hacer caso omiso de los tamaños muestrales y ponderar aritméticamente s12 y s22 .

La obtención de una variable aleatoria que pueda usarse para calcular un intervalo de confianza de 100(1 – α)% para µ1 – µ2 se logra al sustituir la varianza poblacional desconocida σ 2 en la variable aleatoria Z: ( X 1 – X 2 ) – (µ1 – µ2 )

σ 2 (1/ n1 + 1/ n2 ) 2 con el estimador agrupado S p , para tener la variable aleatoria:

( X 1 – X 2 ) – (µ1 – µ2 ) S p2 (1 / n1 + 1/ n2 )

Al igual que en el caso de una muestra, sustituir la varianza poblacional con su estimador sí tiene efecto en la distribución. La primera de esas variables aleatorias es una de tipo Z, mientras que la segunda tiene distribución T, con n1 + n2 – 2 grados de libertad. La estructura algebraica de esa variable aleatoria es la misma antes mencionada, a saber: Estimador − Parámetro D Por lo anterior, el intervalo de confianza para µ1 – µ2 asume la misma forma general de muchos otros ya estudiados en la obra. Sus límites están dados en el teorema 10.3.1.

Teorema 10.3.1 (intervalo de confianza para µ1 – µ2: varianza agrupada). Sean X1 y X 2 medias muestrales basadas en muestras aleatorias independientes, obtenidas de distribuciones normales con medias µ1 y µ2, respectivamente, y varianza común σ 2. Sea S 2p la varianza muestral agrupada. Los límites de un intervalo de confianza 100(1 – α)% para µ1 – µ2 son: ( X1 – X 2 ) ± tα /2

S 2p (1/ n1 + 1/ n2 )

donde se encuentra el punto tα/2 en relación con la distribución Tn1 + n2 – 2 .

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

345

Ejemplo 10.3.2. Se realiza un estudio para estimar la diferencia entre la media de exposición a la radiactividad en trabajadores de empresas de servicios públicos en los años 1973 y 1979. Se obtienen los datos siguientes, basados en muestras independientes de trabajadores en relación con los dos años señalados: 1973

1979

n1 = 16

n2 = 16

x1 = 0.94 rem

x2 = 0.62 rem

2 1

s22 = 0.028

s = 0.040

En primer término, se verifica la igualdad de las varianzas al poner a prueba:

H0: σ 12 = σ 22 H1: σ 12 ≠ σ 22 a un nivel α = 0.2. La varianza muestral más grande es el numerador de la estadística de prueba, por lo que se aprecia que el valor observado de esa estadística es s12/s22 = 0.040/ 0.028 1.43. Al buscar en la tabla F, la tabla IX, con n1 – 1 = 15 y n2 – 1 = 15 grados de libertad, puede observarse que: P[F15, 15 > 1.972] = 0.10 La probabilidad de observar el valor F de 1.43 es incluso mayor que ésa. Por consiguiente, el valor P de la prueba de dos colas excede de 2(0.10) = 0.20. Es imposible rechazar la hipótesis nula de varianzas iguales, incluso con el nivel α = 0.20. Se carece de evidencia suficiente de que las varianzas poblacionales difieran. Así pues, se agrupan s12 y s22, y se estima σ 2 con:

σˆ 2 = s 2p =

15 (0.040) + 15 (0.028) = 0.034 16 + 16 – 2

La comparación de las medias precisa un intervalo de confianza de 95% para µ1 – µ2. La partición de la curva T16 + 16 – 2 = T30 necesaria se muestra en la figura 10.3. Los límites del intervalo de confianza son: ( x1 – x2 ) ± tα /2 s 2p (1/ n1 + 1/ n2 ) = (0.94 – 0.62) ± 2.042 0.034 (1/16 + 1/16) = 0.32 ± 0.13

Puede tenerse confianza de 95% de que la diferencia en la media de exposición a la radiactividad en los dos años se ubica entre 0.19 y 0.45 rem. Ese intervalo no contiene el número 0 y todos sus valores son positivos, lo cual indica que la media de exposición en 1973 fue, de hecho, mayor que en 1979.

Prueba T agrupada A semejanza de casos previos, la variable aleatoria usada para obtener los límites de confianza de un parámetro también sirve como estadística de prueba de diversas hipótesis concernientes al parámetro mismo. En este caso, la variable aleatoria siguiente es útil como estadística de prueba de cualquiera de las hipótesis usuales, donde (µ1 – µ2)0 denota la diferencia hipotética entre las medias poblacionales:

346

PROBABILIDAD Y ESTADÍSTICA

T30 0.95 0.025

0.025 0

t0.025 = 2.042

t

FIGURA 10.3 Partición de la curva T30 necesaria para obtener un intervalo de confianza de 95% de µ1 – µ2.

Estadística de prueba T agrupada ( X 1 – X 2 ) – (µ1 – µ2 )0 = Tn + n S p2 (1/ n1 + 1/ n2 ) 1

2

–2

La diferencia hipotética puede ser cualquier valor. Sin embargo, lo más común es que sea igual a cero. En tal caso, el propósito es determinar si las medias poblacionales difieren y, de ser así, cuál es mayor. Las hipótesis pueden asumir las formas siguientes:

I H0: µ1 = µ2 H1: µ1 > µ2

II H0: µ1 = µ2 H1: µ1 < µ2

Prueba de cola derecha

Prueba de cola izquierda

III H0: µ1 = µ2 H1: µ1 ≠ µ2 Prueba de dos colas

Es posible distinguir entre H0 y H1 al preestablecer α y emprender una prueba de hipótesis o recurrir a una prueba de significación y luego informar de su valor P, dejando en manos del investigador la decisión final de rechazar H0 o no. Ejemplo 10.3.3. La resistencia a la tracción de un material es su propiedad de resistir la deformación cuando se le aplica una fuerza o carga. Se efectúa un estudio de la resistencia a la tracción de hierro dúctil templado o fortalecido a dos temperaturas distintas. Se piensa que la temperatura inferior genera mayor resistencia a la tracción. Resultan los datos siguientes: 1 450°F

1 650°F

n1 = 10

n2 = 16

x1 = 18 900 psi

x2 = 17 500 psi

2 1

s = 1 600

s22 = 2 500

Primero se pone a prueba H0: σ 12 = σ 22 para cerciorarse de que la agrupación es apropiada. El uso de la varianza muestral más grande como numerador de la estadística de prueba lleva a obtener 2 500/1 600 =

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

347

1.5625 como valor observado de la estadística de prueba F. Los números de grados de libertad relacionados con la estadística son 15 y 9. En la tabla IX del apéndice A, puede verse que: P[F15, 9 > 2.340] = 0.10 La probabilidad de observar un valor que exceda 1.5625 es mayor que ésa. Así pues, el valor P de la prueba de dos colas es mayor que 2(0.10) = 0.20. Este valor P es alto, de modo que no puede rechazarse la hipótesis nula y, por ende, se agrupan s12 y s22 para estimar la varianza poblacional común. En este caso: s 2p =

( n1 – 1) s12 + ( n2 – 1) s22 9 (1 600) + 15 ( 2 500) = = 2 162.5 10 + 16 – 2 n1 + n2 – 2

El objetivo principal del estudio es poner a prueba: H0: µ1 = µ2 H1: µ1 > µ2 El valor observado de la estadística de prueba es: ( x1 – x2 ) – (µ1 – µ2 ) 0 2 p

s (1/ n1 + 1/ n2 )

=

(18 900 – 17 500) – 0 2 162.5 (1/10 + 1/16)

= 74.68

Con base en la distribución T10 + 16 – 2 = T24 el valor P, la probabilidad de observar un valor de 74.68 o mayor si µ1 = µ2, es menor que 0.0005(t0.0005 = 3.745). Se tienen datos muy claros de que la media de resistencia a la tracción del hierro templado a 1 450o F es mayor que la obtenida a 1 650o F.

10.4 COMPARACIÓN DE MEDIAS: VARIANZAS DESIGUALES La agrupación es inapropiada cuando se detecta una diferencia con la comparación de las varianzas poblacionales. En tal caso, es posible comparar las medias con la estadística T aproximada. Una vez más, la estadística necesaria se identifica al modificar la variable aleatoria Z: ( X 1 – X 2 ) – (µ1 – µ2 )

σ 12 / n1 + σ 22 / n2 de manera lógica. Ahora existe evidencia de que σ 12 ≠ σ 22 , por lo que cada varianza poblacional se estima por separado y las estimaciones no se combinan. En vez de ello, en la variable aleatoria Z precedente se sustituyen las varianzas poblacionales con sus estimadores respectivos, S12 y S 22 , para obtener la estadística de prueba que sigue: Estadística de prueba con varianzas desiguales ( X 1 – X 2 ) – (µ1 – µ2 )0 S12/ n1 + S 22/ n2

Al igual que antes, este cambio produce uno de la distribución Z a la T aproximada. No obstante, en esta ocasión el número de grados de libertad debe estimarse a partir de los datos. Se han propuesto

348

PROBABILIDAD Y ESTADÍSTICA

varios métodos para hacerlo. Aquí se demuestra el procedimiento de Smith-Satterthwaite. Según dicha técnica, el número de grados de libertad γ está dado por: Grados de libertad de Smith-Satterthwaite [ S12/ n1 + S 22 / n2 ]2 [ S12/ n1 ]2 [ S 22/ n2 ]2 + n1 – 1 n2 – 1

γ

El valor de γ no es necesariamente un entero. Si no lo es, se redondea al entero inmediato inferior. El redondeo en sentido inferior, no superior, tiene como fin ser conservador. A medida que aumenta el número de grados de libertad relacionados con variables aleatorias T, las curvas en forma de campana correspondientes se vuelven más compactas. En términos prácticos, ello significa que, a manera de ejemplo, el punto t0.05 relacionado con la curva T10 (1.812) es un poco mayor que el punto t0.05 de la curva T11 (1.796). Si es posible rechazar una hipótesis nula basada en la distribución T10, también se la rechaza con la distribución T11. Lo opuesto no es necesariamente válido. El procedimiento de Smith-Satterthwaite se ilustra en el contexto de una prueba de significación en el ejemplo siguiente. Ejemplo 10.4.1. En el ejemplo 10.2.2, se inició el estudio de las propiedades de carga de dos materiales usados en conductos para cable. La pregunta fundamental que se planteó es: “¿Acaso el material A soporta en promedio una mayor carga que el material B?”, es decir, “¿es µA > µB?”. Se tienen los datos siguientes: Material A

Material B

nA = 25

nB = 16

x A = 380 lb

x B = 370 lb

sA2 = 100

sB2 = 400

Se realizan pruebas de la igualdad de las varianzas y se encuentran datos de que σ A2 ≠ σ B2 . Por lo tanto, para poner a prueba: H 0: µ A = µ B H 1: µ A > µ B no se agrupan sA2 y sB2 . En su lugar, se usa el procedimiento de Smith-Satterthwaite. Los grados de libertad necesarios son: [ sA2 / nA + sB2 /nB]2 [ s / nA ]2 [ sB2 / nB ]2 + n –1 nB – 1

γ

2 A . A

[100/ 25 + 400/16]2 [100/ 25]2 [ 400/16]2 + 25 – 1 16 – 1 = 19.86 =

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

349

Este valor se redondea en sentido inferior a 19. El valor observado de la estadística de prueba es: ( xA – x B ) – (µA – µ B ) 0 2 A

2 B

s / nA + s / nB

=

(380 – 370) – 0 100/ 25 + 400/16

= 1.857

Con base en la distribución T19, t0.05 = 1.729 y t0.025 = 2.093. El valor observado de la estadística de prueba se ubica entre esos dos valores, de modo que el valor P de la prueba está entre 0.025 y 0.05. Se trata de valores relativamente pequeños, por lo que es posible rechazar H0 y llegar a la conclusión de que el material de A soporta en promedio cargas más pesadas que el material B.

El procedimiento de Smith-Satterthwaite puede usarse para determinar límites de confianza para µ1 – µ2 cuando las varianzas poblacionales son desiguales. El uso de esos límites se delinea en el ejercicio 27. Se mencionó que existen dos opiniones concernientes a la manera óptima de actuar cuando se comparan dos medias. La primera, que incluye el uso de una prueba F preliminar con un nivel α alto, para decidir si se agrupan o no, se demuestra en las dos secciones precedentes. Comprende la que podría llamarse un punto de vista de “agrupar a veces”. La segunda aprovecha una propiedad muy conveniente del procedimiento de Smith-Satterthwaite, a saber, que en estudios de simulación recientes se ha demostrado que no sólo funciona de manera satisfactoria cuando las varianzas son desiguales, sino que también genera resultados virtualmente equivalentes a los obtenidos con la prueba T agrupada si las varianzas son iguales. Por ello, parecería que no existe la necesidad verdadera de agrupar; bastaría usar el procedimiento de Smith-Satterthwaite en todos los casos. Ninguna de las dos es claramente “la mejor”. Sin embargo, sería más seguro utilizar la segunda, ya que con ella se evitan los errores inherentes a la aplicación de la prueba F a varianzas. El lector debe sentirse en libertad de elegir el procedimiento que mejor le parezca.

10.5

COMPARACIÓN DE MEDIAS: DATOS POR PARES

En muchos casos, surgen problemas en los que se tienen dos muestras aleatorias que no son independientes, en vez de lo cual cada observación de una muestra tiene relación de manera natural o por diseño con una observación de la otra. Considere el ejemplo 10.5.1 para ver el significado de esto. Ejemplo 10.5.1. Un aspecto importante en computación es el tiempo de CPU necesario para que un algoritmo particular resuelva un problema. Se desarrolla un nuevo algoritmo para solucionar problemas objetivos múltiples de cero-uno en programación lineal. Se piensa que este nuevo algoritmo soluciona los problemas con mayor rapidez que el algoritmo en uso. Se seleccionan diversos problemas al azar para obtener datos estadísticos que sustenten la hipótesis de investigación. Cada problema se resuelve dos veces, uno con el algoritmo actual y otro con el algoritmo nuevo. Así pues, cada problema de prueba genera dos observaciones y se tienen dos conjuntos de datos. Uno de estos conjuntos es una muestra aleatoria de tiempos de CPU con uso del algoritmo vigente, y el otro representa una muestra aleatoria de tiempos de CPU con el nuevo algoritmo. Estos conjuntos de datos no son independientes, sino que se basan en los mismos problemas resueltos con métodos distintos y, de tal suerte, se consideran en pares por diseño. La idea se ilustra en la figura 10.4.

Los métodos de las secciones 10.3 y 10.4 dejan de ser aplicables cuando ocurre una relación por pares, como recién se ilustró. En su lugar, se necesita un procedimiento para responder a la pregunta: “¿Cuál es el valor de µX – µY?”, en el cual se considere el hecho de que las observaciones

350

PROBABILIDAD Y ESTADÍSTICA

Población I (el problema se soluciona con el método antiguo) Muestra de tamaño n1

Población II (el problema se soluciona con el nuevo algoritmo)

X1

Y1

X2 .. . Xn

Y2 .. . Yn

Pares naturales

!X = ?

Muestra por par de tamaño n

!Y = ? ! X – !Y = ?

FIGURA 10.4 Muestras por pares de tiempos de CPU obtenidos de dos poblaciones distintas.

se relacionan por pares. Ello se logra fácilmente. Note que con datos relacionados por pares es posible definir una nueva variable aleatoria D = X – Y. Las n diferencias Di = Xi – Yi , i, donde iˆ = 1, 2, 3, . . . , n, forman un conjunto de observaciones de D, es decir, una muestra aleatoria de tamaño n extraída de la población de diferencias. Puesto que, conforme a las reglas de la esperanza:

µ X – µY = E [ X ] – E [Y ] = E [ X – Y ] = E [ D] = µ D la pregunta original: “¿Cuál es el valor de µX – µY?”, es equivalente a: “¿Cuál es el valor de µD?” Se redujo el problema de dos muestras original a otro de una muestra, consistente en determinar una inferencia acerca de la media de la población de diferencias. Este problema no es nuevo y puede manejarse con los métodos del capítulo 8. En particular, la fórmula de los límites de confianza de 100(1 – α)% para µX – µY = µD es: Límites de confianza para µX– µY con datos relacionados por pares

D ± tα / 2 S d / n En esta fórmula, D y Sd son la media muestral y la desviación estándar muestral de la muestra de calificaciones de diferencias, respectivamente, mientras que tα/2 es el punto apropiado relativo a la distribución Tn – 1.

Prueba T por pares La hipótesis nula µX = µY es equivalente a la hipótesis µD = 0. La estadística de prueba para la prueba de hipótesis basada en la muestra de calificaciones de diferencias es: Estadística de prueba T por pares D –0 Sd / n

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

351

y tiene distribución T con n – 1 grados de libertad si H0 es verdadera. El uso de esta estadística se ilustra a continuación. Ejemplo 10.5.2. La realización del experimento descrito en el ejemplo 10.5.1 lleva a los datos siguientes: Tiempo de CPU (s) Programa

Antiguo (x)

Nuevo ( y)

Diferencia d=x–y

1 2 3 4 5 6 7 8 9 10

8.05 24.74 28.33 8.45 9.19 25.20 14.05 20.33 4.82 8.54

0.71 0.74 0.74 0.77 0.80 0.83 0.82 0.77 0.71 0.72

7.34 24.00 27.59 7.68 8.39 24.37 13.23 19.56 4.11 7.82

En relación con estos datos, d = 14.409 y sd = 8.653. Interesa poner a prueba:

H0: µ x = µY H1: µ x > µY Eso es equivalente a probar que:

H0 : µ D = 0 H1: µ D > 0 El valor observado de la estadística de prueba es:

d –0 14.409 – 0 = = 5.266 sd / n 8.653/ 10 El valor P de esta prueba es menor de 0.0005 (t0.0005 = 4.781), con base en la distribución Tn – 1 = T9. Esta probabilidad es muy baja, por lo que se rechaza H0 y se llega a la conclusión de que el nuevo algoritmo es, en promedio, más rápido que el antiguo.

En el uso de procedimientos de “T por pares”, se supone que la variable aleatoria D = X – Y tiene distribución por lo menos aproximadamente normal. Note que en el caso de una comparación por pares es innecesario verificar la igualdad de las varianzas. Ello se debe a que en realidad se estudia una sola población, la de diferencias. Lo único que interesa es la varianza de esa población.

10.6

MÉTODOS NO PARAMÉTRICOS ALTERNOS

En la sección 10.3, se analiza la prueba T para poner a prueba la igualdad de las medias poblacionales de dos muestras independientes. Bajo los supuestos de las variables aleatorias de distribución normal con varianzas poblacionales iguales y desconocidas, es la prueba más potente de medias. Sin embargo,

352

PROBABILIDAD Y ESTADÍSTICA

como cabría esperar, sus supuestos más bien restrictivos no siempre son razonables en aplicaciones. De ser así, se cuenta con una prueba no paramétrica alterna que es casi tan buena como la prueba T, inclusive cuando se satisfacen todos los supuestos necesarios, y sería considerablemente superior a ella si está claro que no se satisfacen esos supuestos. La prueba T es muy “robusta” con muestras de tamaños razonablemente grandes. En otras palabras, no es muy sensible a desviaciones de la normalidad. No obstante, con muestras pequeñas, en particular si las varianzas son desiguales, la prueba T puede llevar a conclusiones inválidas. Bajo tales circunstancias, debe considerarse ampliamente una prueba no paramétrica como técnica alternativa para probar la igualdad de la localización de dos poblaciones. La más usada de estas pruebas es la suma de rangos de Wilcoxon.

Prueba de suma de rangos de Wilcoxon Sean X y Y variables aleatorias continuas. Sean también X1, X2, . . . , Xm y Y1, Y2, . . . , Yn muestras aleatorias independientes de tamaños m y n de las distribuciones subyacentes de X y Y, respectivamente. En aras de la conveniencia, se supone que la muestra de X es tal que m ≤ n. La hipótesis nula que se pondrá a prueba es que las poblaciones X y Y son idénticas. Sin embargo, la prueba que se usa es particularmente sensible a las diferencias de localización. Por ello, la hipótesis nula suele expresarse con base en medianas poblacionales iguales. Así pues, las tres formas de las hipótesis serían: H 0 : M X = MY

H 0 : M X = MY

H 0: M X = M Y

H 1: M X > M Y

H1: M X < MY

H1: M X ≠ M Y

Prueba de cola derecha

Prueba de cola izquierda

Prueba de dos colas

En la realización de la prueba, las observaciones m + n se agrupan para formar una sola muestra, con retención de la identidad de grupo de cada observación. Luego, las observaciones se ordenan de menor a mayor y se clasifican de 1 a N = m + n. En caso de ocurrir empates, cada uno recibe el rango promedio del grupo, al igual que en procedimientos de Wilcoxon antes mencionados. La estadística de prueba, que se denota con Wm, es la suma de los rangos que guardan relación con las observaciones que inicialmente eran componentes de la muestra más pequeña (valores de X ). La lógica subyacente a esta selección de estadística de prueba es la siguiente. Si la población de X se localiza bajo la población de Y, los rangos más bajos tienden a relacionarse con los valores de X. Ello hace que el valor de Wm sea también bajo. En el caso opuesto, Wm tiende a ser grande. Así pues, lógicamente se debe rechazar H0: MX = MY y se debe aceptar H1: MX < MY con valores pequeños de Wm; se rechaza H0: MX = MY y se acepta H1: MX > MY en el caso de valores grandes de Wm. Los puntos críticos superior e inferior de valores selectos de m, n y α aparecen en la tabla X del apéndice A. El ejemplo 10.6.1 muestra el uso de esa tabla. Ejemplo 10.6.1. Se realiza un experimento de dos marcas de calefactores de queroseno. El fabricante de la marca A afirma que su modelo calienta una habitación de 8 pies de 60o F a 70o F en menos tiempo que la marca B de un competidor. Así pues, para verificar la afirmación del fabricante, se ponen a prueba las hipótesis siguientes: H 0: M B = M A H 1: M B > M A

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

353

Se selecciona una muestra aleatoria de 12 calefactores de la marca B y otra muestra independiente de 15 calefactores de la marca A. Las observaciones corresponden al tiempo en segundos para aumentar la temperatura de la habitación en los 10o especificados: Marca B 69.3 56.0 22.1 47.6 53.2 48.1 23.2 13.8

Marca A

52.6 34.4 60.2 43.8

28.6 25.1 26.4 34.9 29.8 28.4 38.5 30.2

30.6 31.8 41.6 21.1 36.0 37.9 13.9

Luego de ordenar las observaciones agrupadas de menor a mayor, manteniendo la identidad del grupo, se obtienen los rangos correspondientes, que siguen: Observación

13.8

13.9

21.1

22.1

23.2

25.1

26.4

28.4

28.6

Marca Rango

B 1

A 2

A 3

B 4

B 5

A 6

A 7

A 8

A 9

Observación

29.8

30.2

30.6

31.8

34.4

34.9

36.0

37.9

38.5

Marca Rango

A 10

A 11

A 12

A 13

B 14

A 15

A 16

A 17

A 18

Observación

41.6

43.8

47.6

48.1

52.6

53.2

56.0

60.2

69.3

Marca Rango

A 19

B 20

B 21

B 22

B 23

B 24

B 25

B 26

B 27

La marca B es la muestra más pequeña (m = 12), por lo que la estadística de prueba Wm es: Wm = 1 + 4 + 5 + 14 + 20 + 21 + 22 + 23 + 24 + 25 + 26 + 27 = 212 En la tabla X, el valor crítico de una prueba de cola derecha es 202 con m = 12, n = m + 3 = 15 y α = 0.05. Puesto que Wm = 212 > 202, se rechaza H0 y se llega a la conclusión de que los calefactores de la marca A sí aumentan la temperatura en menos tiempo que los de la marca B.

Cuando los tamaños muestrales m o n exceden los valores de la tabla X, puede usarse una aproximación normal de una muestra grande para poner a prueba H0. La estadística de prueba es:

Wm – E (Wm ) Var Wm Esa estadística tiene distribución aproximada a la de una variable aleatoria normal estándar, donde: E(Wm) = [m(m + n + 1)/2] y

Var Wm = mn(m + n + 1)/12

354

PROBABILIDAD Y ESTADÍSTICA

Son varios los aspectos que deben resaltarse acerca de la estadística de Wilcoxon. El primero, que si bien la hipótesis nula se expresa con base en medianas, también se prueba la igualdad de las medias si las distribuciones de X y Y son simétricas. Así pues, en el caso de población normal, la estadística de Wilcoxon es análoga a la prueba T de la teoría normal para muestras independientes. El segundo, que la estadística de Wilcoxon es útil con datos inconmensurables que, no obstante ello, pueden clasificarse en rangos. Los ejemplos de este tipo de datos se dan en los ejercicios 39 y 40.

Prueba de rango con signo de Wilcoxon para observaciones por pares En la sección 10.5, se analiza la prueba T de datos por pares. La prueba de rango con signo de observaciones por pares es su análogo no paramétrico cuando no se satisfacen los supuestos normales. Esta prueba es casi tan buena como la prueba T por pares, inclusive si la distribución subyacente es normal, y suele preferirse sobre esta última en el caso de otras distribuciones. La prueba de rango con signo de Wilcoxon se analiza en relación con una sola muestra en la sección 8.7. La prueba correspondiente de datos que se relacionan por pares es una modificación sencilla del método descrito en esa sección. Aquí, sean X y Y variables aleatorias continuas, de las que se supone que tienen distribuciones simétricas. Se pretende probar la hipótesis de que las medianas de estas dos distribuciones son iguales. Así pues, las hipótesis asumen las formas: H 0: M X = M Y

H 0 : M X = MY

H 0 : M X = MY

H1: M X > M Y

H1: M X < MY

H1: M X ≠ MY

Prueba de cola izquierda

Prueba de dos colas

Prueba de cola derecha

Considere una muestra aleatoria (X1, Y1), (X2, Y2), . . . , (Xn, Yn) de observaciones por pares de X y Y. En primer término, se forman las diferencias X1 – Y1, X2 – Y2, . . . , Xn – Yn. Si la hipótesis nula es verdadera, la población de calificaciones de diferencias es simétrica en torno a 0. Así pues, para probar H0: MX = MY , se somete a prueba H0: MX – Y = 0. La prueba se realiza exactamente como antes. En primer término, se ordenan los valores absolutos de las diferencias, de menor a mayor, y se les asignan rangos de 1 a n. Las calificaciones empatadas reciben el rango promedio del grupo. Cada rango se asigna al signo de la diferencia que genera el rango mismo. Una vez más, las estadísticas de prueba usadas son: W+ =



∀ Ri > 0

Ri

y

W− =



Ri

∀ Ri < 0

Las pruebas de cola derecha se realizan mediante |W–|, y las de cola izquierda, con W+ como estadística de prueba. En cada caso, se rechaza H0 con valores demasiado pequeños para haber ocurrido al azar, de conformidad con los puntos críticos de la tabla VIII del apéndice A. El ejemplo siguiente debe servir para que el lector recuerde el procedimiento de rango con signo de Wilcoxon. Ejemplo 10.6.2. Se emprende un experimento para comparar la cantidad de memoria requerida en el análisis de un conjunto de datos con dos de los principales softwares estadísticos. Se obtienen los datos siguientes:

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

Programa

Software X

Software Y

Diferencia X – Y

512K 650K 890K 410K 1 050K 1 500K 600K 750K

500K 600K 890K 400K 1 025K 1 400K 625K 710K

12 50 0 10 25 100 – 25 40

1 2 3 4 5 6 7 8

355

Se pondrán a prueba:

H0: MX = MY H1: MX ≠ MY a un nivel α = 0.1. A tal efecto, se ordenan los valores absolutos de las diferencias, del menor al mayor, y se les asignan los rangos 1 a 8. Luego, se asigna a cada rango el signo algebraico de la diferencia que generó el propio rango. La diferencia cero se aplica al signo algebraico con el que sea menos factible el rechazo de H0. En este caso, la diferencia cero se considera que es negativa. Así pues, se obtienen los rangos con signo siguientes: X –Y

0

10

12

Rango

1

2

3

–1

2

3

Rango con signo

25

25

40

50

100

4.5

4.5

6

7

8

– 4.5

4.5

6

7

8

En relación con estos datos:

W+ = 2 + 3 + 4.5 + 6 + 7 + 8 = 30.5 W– = –1 + –4.5 = 5.5 La estadística de prueba de una prueba de dos colas es W, el menor de W+ y |W–|. En la tabla VIII del apéndice A, puede verse que el punto crítico de una prueba de dos colas con el nivel α = 0.1 es 6. Puesto que 5.5 < 6, es posible rechazar H0 y afirmar que existen diferencias entre las medianas de estas dos poblaciones.

Debe hacerse un último comentario. Si las diferencias son tales que sólo se sabe que la diferencia es negativa o positiva, la hipótesis nula puede verificarse con la prueba de signo. Esta idea se analiza en el contexto de una muestra en la sección 8.7. Un ejemplo de datos de este tipo está dado en el ejercicio 44.

10.7

UNA NOTA SOBRE TECNOLOGÍA

Como probablemente ya supuso el lector, muchas de las técnicas demostradas en este capítulo pueden ponerse en práctica con la tecnología disponible. Sin embargo, el uso correcto de las herramientas tecnológicas requiere la comprensión plena del material del capítulo, ya que de lo contrario pueden ocurrir el abuso o uso incorrecto de esas herramientas. En esta sección, se analizan brevemente algunos de esos auxiliares de cómputo estadísticos. La calculadora TI83 se diseñó especialmente con los expertos y usuarios de la estadística en mente. Es un equipo con el que se realizan muchas de las funciones analizadas en el capítulo. En particular, permite efectuar la prueba F preliminar de comparación de varianzas con datos primarios o estadísticas de resumen. La prueba seleccionada debe ser de cola derecha, cola izquierda o dos

356

PROBABILIDAD Y ESTADÍSTICA

colas. Como se demuestra en el capítulo, la de cola izquierda es innecesaria si la prueba se realiza de manera tal que la mayor de las dos varianzas muestrales se selecciona como numerador de la estadística de prueba. El resultado generado abarca el valor P exacto de la prueba. Este último puede compararse con un nivel α preestablecido, si así se prefiere. A partir de los resultados de esa prueba, es posible determinar los intervalos de confianza tipo T agrupados o de Smith-Satterthwaite, o emprender la prueba T. Ello puede ponerse en práctica con datos primarios o estadísticas de resumen. En ambos casos, se pregunta al usuario si se agrupan las varianzas. Es muy amplia la variedad de software estadístico existente en el mercado. Algunos, como el SAS, incluyen una prueba F preliminar y muestran automáticamente los resultados de la prueba F de dos colas, de comparación de varianzas, como parte de los resultados del procedimiento de comparación de medias de dos muestras. Por omisión, el SAS ejecuta las pruebas agrupadas y de SmithSatterthwaite de comparación de medias. Es responsabilidad del usuario seleccionar la prueba apropiada con base en los resultados de la prueba F para comparar las varianzas. En el ejemplo 10.7.1, se muestran resultados del SAS y su interpretación, correspondientes a datos del ejercicio 26. Ejemplo 10.7.1. En este ejemplo, se investiga la capacidad de un recubrimiento de plasma para reducir el desgaste en válvulas giratorias usadas en la industria de pulpa y papel. Se seleccionan dos muestras de tamaños 8 (válvulas recubiertas) y 10 (válvulas no recubiertas). Se piensa que el recubrimiento aminora el desgaste y, por ello, la prueba primaria es una de cola izquierda, para comparar las medias. Está dada por: H0: µ c = µu H1: µ c < µu

donde C denota válvulas recubiertas, y U, válvulas no recubiertas. La prueba F preliminar es de dos colas, dada por: H0: σ c2 = σ u2 H1: σ c2 ≠ σ u2

Los resultados del procedimiento del SAS y su interpretación son los siguientes: TESTING FOR EQUALITY OF MEANS AND VARIANCES T TEST PROCEDURE VARIABLE: WEAR GROUP N C 8 U 10 VARIANCES UNEQUAL EQUAL

MEAN 0.08300000 0.10420000

STD DEV 0.00924276 0.03342587

MINIMUM 0.07200000 0.05200000

MAXIMUM 0.09900000 0.15600000

DF PROB> !T!

T –1.9162 –1.7320

STD ERROR 0.00326781 0.01057019

3

10.7 16.0

4

0.0825 0.1025

5

FOR HO: VARIANCES ARE EQUAL, F´ = 13.08 WITH 9 AND 7 DF 1 PROB > F´ = 0.0027 2 El valor de la estadística F usada para comparar las varianzas es 13.08. Este valor se muestra en 1 . El valor P de la prueba F de dos colas es 0.0027, y se enumera en 2 . Puesto que este valor es pequeño, se puede concluir que σ c2 ≠ σ u2 , y usar el procedimiento de Smith-Satterthwaite para comparar las medias. La estadística T y sus grados de libertad correspondientes se muestran en 3 y 4, respectivamente. El valor P de la prueba de dos colas es 0.0825 y corresponde a 5. El valor P de la prueba de una cola es 0.0825/2 = 0.04125.

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

357

Este valor P es pequeño, por lo que se rechaza la hipótesis nula y se llega a la conclusión de que el desgaste promedio de válvulas recubiertas es menor que el de las no cubiertas. Debe comparar estos resultados con los obtenidos anteriormente a mano.

En el ejemplo 10.7.2, se muestran resultados de MINITAB correspondientes a los mismos datos analizados en el ejemplo 10.7.1. Ejemplo 10.7.2. El paquete MINITAB no cuenta con la opción para ejecutar una prueba F preliminar de comparación de varianzas ni la ejecuta por omisión. Puede realizar la prueba a mano o con una técnica más informal. Puesto que es más seguro no agrupar cuando hacerlo es apropiado que agrupar cuando no debe hacerse, lo más sencillo es simplemente no agrupar nunca. Ésa es la opción por omisión de MINITAB. Si se piensa que la agrupación es apropiada, entonces MINITAB permite que el usuario seleccione una opción de combinación. Debe indicar si su prueba de medias es de cola derecha, cola izquierda o dos colas. Los resultados de MINITAB correspondientes a los datos del ejercicio 26 se muestran a continuación. Note que incluyen un intervalo de confianza de 95% sobre la diferencia entre las medias, que se muestra en 1 , así como los resultados de la prueba de cola izquierda de comparación de medias, indicados en 2 . Debe comparar los valores que aparecen aquí contra los que se muestran respecto del programa SAS. Two Sample T Test and Confidence Interval Two sample T for c vs u c u

N 8 10

Mean 0.08300 0.1042

StDev 0.00924 0.0334

SE Mean 0.0033 0.011

1 95% CI for mu c – mu u: (–0.0459, 0.003) 2 T-Test mu c = mu u (vs B y B > A denotan que el aspecto de A se prefiere sobre el de B, y a la inversa, respectivamente. Los resultados del experimento son los siguientes: Par 1 2 3 4 5

Par

A>B A>B B>A A>B A>B

6 7 8 9 10

Par

B>A B>A A>B B>A A>B

11 12 13 14 15

A>B A>B A>B B>A A>B

Par 16 17 18 19 20

A>B B>A A>B A>B A>B

Use una prueba apropiada para verificar la hipótesis de que las dos marcas de pintura tienen aspecto igualmente preferente al cabo de dos años. EJERCICIOS DE REPASO

45. Un grupo de investigadores experimenta con el uso de microprocesadores como auxiliares para reducir el consumo de combustible y energía eléctrica en hornos usados para procesar mineral de magnetita. Se diseña un sistema específico que mantiene el flujo de gas por la máquina de manera tal que garantiza calor suficiente para elevar la temperatura de las esferas de mineral a 1 300°C. Se emprende un estudio de comparación de los ajustes de temperatura necesarios para lograr eso último con un sistema computarizado y otro convencional. Se piensa que el primero genera un menor ajuste promedio necesario, con menor variabilidad en los ajustes, en contraste con el sistema convencional. a) Interesa poner a prueba dos hipótesis nulas. Especifíquelas, junto con sus hipótesis alternativas. b) Las operaciones de muestra generan los datos siguientes: Computarizado

Convencional

n1 = 25 x1 = 733°C s1 = 10°C

n2 = 25 x2 = 822°C s2 = 50°C

Suponga la normalidad y pruebe las hipótesis nulas del inciso a. Prepárese para argumentar su selección de las estadísticas de prueba. ¿Acaso los datos sustentan las dos afirmaciones concernientes al sistema computarizado? Explique su respuesta. 46. La escoria es una capa que se forma en la superficie del metal fundido durante su procesamiento. Se desarrolla una nueva técnica para reducir su formación. Su rentabilidad precisa que la reducción sea mayor que la del método actual en más de 15 kg/ton. a) Especifique las hipótesis nula y alternativa necesarias para sustentar la afirmación de que el nuevo proceso será rentable.

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

373

b) Las corridas de prueba generan los datos siguientes: Método antiguo

Nuevo método

n1 = 10 x1 = 20 kg/ton s1 = 2.5 kg/ton

n2 = 10 x2 = 1 kg/ton s2 = 0.5 kg/ton

Suponga la normalidad y pruebe la hipótesis nula del inciso a. Prepárese para argumentar su selección de estadísticas de prueba. ¿Acaso parece que el nuevo proceso será rentable? Explique su respuesta. 47. Se estudia una combinación de nylon 6/6 y acero para su posible uso en árboles de levas. Se producen 16 tipos distintos de árboles y el nivel de ruido obtenido con su uso se compara contra el de un árbol idéntico, fabricado con hierro fundido. Se obtienen los datos siguientes: Intensidad del ruido (dB) Árbol

Hierro fundido

Combinado

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

75 90 80 60 110 95 93 88 70 65 91 100 85 50 62 67

74 88 81 60 107 92 90 84 66 64 86 97 83 44 60 64

a) Prepare un diagrama de tallo y hoja de las diferencias en la intensidad de ruido de los dos tipos de árboles. Reste el de combinación de acero y nylon del árbol de hierro fundido. ¿Acaso parece que las diferencias se aproximan a la distribución normal? b) Calcule un intervalo de confianza de 95% para la diferencia media en la reducción de la intensidad del ruido. ¿Parece que con los árboles hechos de la combinación es menor el número promedio de decibeles que con los de hierro fundido? Explique su respuesta. 48. Desde tiempo atrás, se han usado cadenas en los hornos de las plantas de cemento para ayudar a disminuir el consumo de calor. Se emprende un estudio para determinar si las cadenas tienen el mismo efecto cuando se usan materias primas más baratas, con alto contenido de azufre y cloro. El propósito de la investigación es estimar la diferencia en el consumo de calor específico en los hornos con y sin el uso de cadenas. Se usan muestras independientes de tamaños 14 y 16, respectivamente. Los datos resultantes son los que siguen:

374

PROBABILIDAD Y ESTADÍSTICA

Sin cadenas

Con cadenas

n1 = 16 x1 = 6 150 kJ/kg s1 = 80 kJ/kg

n2 = 14 x2 = 5 250 s2 = 75

Determine un intervalo de confianza de 95% para µ1 – µ2. Prepárese para argumentar su selección de límites de confianza. ¿Acaso parece que las cadenas son efectivas? Explique su respuesta. 49. Se piensa que la pérdida de calor en tuberías de vidrio es menor que en las de acero del mismo diámetro. A fin de verificar esa afirmación, se obtienen nueve pares de tubos de varios diámetros. Se hacen correr diversos líquidos a la misma temperatura inicial por segmentos de 50 m de cada tipo de tubo y se mide la pérdida de calor en cada uno. Los datos resultantes son los siguientes: Pérdida de calor (°C) Par

Acero

Vidrio

1 2 3 4 5 6 7 8 9

4.6 3.7 4.2 1.9 4.8 6.1 4.7 5.5 5.4

2.5 1.3 2.0 1.8 2.7 3.2 3.0 3.5 3.4

Bajo el supuesto de normalidad, ¿puede concluirse que la media de pérdida de calor es mayor en las tuberías de acero que en las de vidrio? Explique su respuesta con base en el valor P de la prueba. 50. Se realiza un estudio de comparación del tiempo total de impresión de diversas tareas, en segundos, con dos marcas de impresora láser. Los datos siguientes corresponden a la impresión de gráficos. (Basado en información de MACWORLD, marzo de 1993, p. 1980.) Tarea

Tiempo de la marca 1

Tiempo de la marca 2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

21.8 22.6 21.0 19.7 21.9 21.6 22.5 23.1 22.2 20.1 21.4 20.5 22.7 20.5 21.3

36.5 35.2 36.2 34.0 36.4 36.1 37.5 38.0 36.3 35.9 35.7 34.9 37.1 34.2 35.4

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

375

a) Estime la diferencia promedio en el tiempo de impresión de las dos impresoras láser. b) Determine un intervalo de confianza de 95% para la diferencia promedio en los tiempos de impresión. c) Con base en el intervalo de confianza del inciso b, ¿le sorprendería la afirmación de que las dos impresoras son igualmente rápidas en la impresión de gráficos? Explique su respuesta. 51. Se estudian dos medicamentos, la amantadina (A) y la rimantidina (R), para su administración contra el virus de la influenza. Se administra una sola dosis de 100 mg por vía oral a adultos por demás saludables. La variable de estudio es Tmáx, el tiempo en minutos necesario para que se alcancen las concentraciones máximas en el plasma sanguíneo. Se obtienen los datos siguientes (basado en información de “Drug Therapy”, Gordon Douglas, Jr., New England Journal of Medicine, vol. 322 de febrero de 1990, pp. 443-449): Tmáx(A) 105 126 120 119 133 145 200

123 108 112 132 136 156

Tmáx(R) 12.4 134 130 130 142 170

221 261 250 230 253 256

227 264 236 246 273 271

280 238 240 283 516

a) Construya una gráfica de caja para cada conjunto de datos e identifique los valores atípicos. b) Suponga que el valor atípico 12.4 del conjunto A es el resultado de la colocación incorrecta del punto decimal. Sustitúyalo con el valor verdadero, 124. Ponga prueba la igualdad de las varianzas a un nivel α = 0.20. c) Determine un intervalo de confianza de 95% para la diferencia en el tiempo promedio necesario para llegar a las concentraciones máximas en el plasma sanguíneo de los dos medicamentos. d ) Con base en el intervalo de confianza del inciso c, ¿puede concluirse que existe una diferencia entre las medias? Explique su respuesta. 52. Se lleva a cabo un estudio para entender el efecto del tabaquismo en los hábitos de sueño. La variable que se considera es X, el tiempo que se requiere para que la persona se quede dormida. Se obtienen las observaciones siguientes de X con muestras de fumadores y no fumadores: No fumadores

Fumadores

17.2 16.2 19.8 21.2 21.1 21.8

19.7 19.9 22.6 18.9 16.9 22.1

18.1 19.8 20.0 22.1 23.0 21.1

15.1 23.6 24.1 20.6 20.1 20.5

18.3 24.9 25.0 23.3 17.5 20.4

17.6 20.1 21.4 20.2 21.3 20.7

15.1 16.8 22.8 25.8 24.3 23.2

20.5 21.2 22.4 24.1 25.7 25.1

17.7 18.1 19.4 15.0 15.2 16.1

21.3 22.1 25.2 24.1 18.0 17.2

16.0 15.9 18.3 21.6 23.8 24.9

24.8 25.2 25.0 16.3 17.9 19.9

19.5

18.8

19.2

22.4

19.3

17.4

15.7

15.3

19.9

23.1

23.0

25.1

a) Construya un diagrama de tallo y hoja de cada uno de los conjuntos de datos. Use los enteros 15 a 25, inclusive como tallos. b) ¿Le sorprendería la afirmación de que no existe diferencia en la distribución de X entre los dos grupos? Explique su respuesta.

376

PROBABILIDAD Y ESTADÍSTICA

c) Emprenda las pruebas estadísticas que considere apropiadas para detectar las diferencias que pudiera haber. Puede usar pruebas de la teoría normal o no paramétricas. 53. El reciclaje se ha vuelto importante, a medida que se vuelve cada vez más difícil tener rellenos sanitarios. Se realiza un estudio del destino final del papel blanco y se obtienen los datos siguientes sobre la cantidad (en cientos de libras) de papel blanco que tiran anualmente los empleados bancarios y de otras empresas: Empleados bancarios 3.1 2.9 3.8 3.3 2.7 3.0 2.8 2.5 2.0 2.9 2.1 2.7 2.2 1.8 1.9 1.7

2.6 2.0 3.2 2.4 2.3 3.1 2.1 3.4 1.9 2.5 2.5 2.3 2.3 1.5 1.2 1.7

Empleados de otras empresas 6.9 6.4 4.7 4.3 5.1 6.3 5.9 5.4 5.2 5.7 6.2 4.2 5.0 3.7 5.1

5.3 5.2 5.1 5.9 5.8 4.9 4.8 4.0 4.0 5.2 5.0 4.1 3.9 3.7 3.4

(Basado en información de “White Paper Recycling”, MIT Technology Review, agosto/septiembre de 1992, p. 20.)

¿Los datos sustentan la afirmación de que, en promedio, los empleados bancarios tiran más papel blanco por año que los de otras empresas? Explique su respuesta mediante la realización de las pruebas estadísticas apropiadas (de la teoría normal o no paramétrica). Prepárese para argumentar su selección de pruebas. 54. Un constructor tiene sitios de construcción razonablemente comparables. Se instalará un sistema séptico, por lo que es indispensable probar la capacidad de absorción de agua de cada sitio. Se perforan orificios de prueba en puntos seleccionados aleatoriamente y se llenan de agua. La variable de interés es el tiempo en segundos que se requiere para que el agua drene del orificio. Use los resultados de MINITAB que aparecen párrafos abajo para responder a cada una de las preguntas siguientes. a) ¿Cuántos orificios se perforan en cada sitio? b) ¿Cuántos grados de libertad se relacionarían con la prueba T agrupada? c) ¿Cuántos grados de libertad usa ese programa en la comparación de medias? d ) ¿Piensa que sería aceptable la agrupación en este caso? Explique su respuesta. e) ¿Es una prueba de cola derecha, cola izquierda o dos colas? f ) ¿Cuál es el valor P de la prueba? g) ¿Puede concluirse que el tiempo promedio de absorción difiere, a un nivel α = 0.05? ¿Se llegaría a esa conclusión a un nivel α = 0.10?

COMPARACIÓN DE DOS MEDIAS Y DOS VARIANZAS

377

Two-Sample T Test and Confidence Interval Two-sample T for site 1 vs. site 2 site 1 site 2

N 17 13

Mean 13.00 14.15

StDev 1.58 1.57

SE Mean 0.38 0.44

95% CI for mu site 1 – mu site 2: (–2.35, 0.04) T test mu site 1 = mu site 2 (vs. not =): T = –1.99 P = 0.058 DF = 26

55. En el ejemplo 10.5.2, se emprendió una prueba T por pares para comparar los tiempos medios de CPU de dos algoritmos de computadora. Se pensó que el algoritmo actual (X ) es más lento que el nuevo (Y ). Así pues, la hipótesis de investigación es: H1: µX > µY

o

H1: µD > 0

donde D = X – Y. Use los resultados del SAS que aparecen a continuación para responder a cada una de las preguntas subsiguientes. PAIRED T TEST VARIABLE DIFF

MEAN

STANDARD DEVIATION

STD ERROR OF MEAN

T

PR > !T!

14.40900000

8.65276635

2.73624497

5.27

0.0005

3

5

1

2

4

a) Identifique qué representan los valores 1 - 5 y compárelos con los calculados anteriormente a mano. b) Con base en los datos, ¿se sustenta H1 con los niveles α = 0.05 y 0.10?

378

PROBABILIDAD Y ESTADÍSTICA

CAPÍTULO

11

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

E

l concepto de regresión se analiza de manera teórica en el capítulo 5. Allí, se supone que X y Y son variables aleatorias. Se usan las densidades teóricas para encontrar la gráfica de µY | x, la media de Y dado el supuesto de que X tiene el valor x. En otras palabras, se grafica la media de Y como función de x. En este capítulo, se estudia un problema similar, con una diferencia importante. Aquí, se supone que la variable X no es aleatoria. En vez de ello, se trata de una variable matemática, una entidad que puede asumir valores distintos, si bien su valor en el momento de consideración no depende del azar. A manera de ilustración, suponga que se desarrolla un modelo para describir la temperatura del agua más allá de la plataforma continental. La temperatura depende en parte de la profundidad del océano, por lo que es un problema de dos variables. Éstas son X, la profundidad del mar, y Y, la temperatura del agua. No interesa obtener inferencias sobre la profundidad del mar. En su lugar, interesa describir el comportamiento de la temperatura del agua bajo el supuesto de que se conoce de manera precisa y anticipada la profundidad oceánica. Incluso si esta última está fija en un valor x, la temperatura del agua todavía varía, en virtud de otros factores aleatorios. Por ejemplo, si se realizan varias mediciones de la temperatura en diversos lugares, cada uno con profundidad x = 1 000 pies, las mediciones tendrán valores diversos. Por ello, debe aceptarse que una x dada en realidad es una variable aleatoria “condicional”, que se denota como Y | x (Y, dada X = x). Esta variable aleatoria condicional tiene media denotada por µY | x. Es evidente que la temperatura promedio del agua oceánica depende en parte 378

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

379

de la profundidad del mar; no se espera que a x = 1 000 pies sea igual que a x = 5 000 pies. En otras palabras, es razonable suponer que µYx es una función de x. La gráfica de esta función se llama curva de regresión de Y sobre X. Puesto que se supone que el valor de X se conoce anticipadamente y que el de Y depende en parte del valor particular de X que se considera, Y se llama variable dependiente o de respuesta. La variable X, cuyo valor ayuda a predecir el comportamiento de Y | x, se denomina variable independiente o de predicción, o de regresión. El problema inmediato es estimar la forma de µY | x a partir de los datos obtenidos con valores selectos x1, x2, x3, . . . , xn de la variable de predicción X. Los valores reales usados para desarrollar el modelo no tienen mucha importancia. Si existe una relación funcional, debe volverse evidente sin importar cuáles valores de X se usen para descubrirlos. Sin embargo, para que esos valores tengan uso práctico deben representar una gama razonablemente amplia de valores posibles de la variable independiente X. En ocasiones, es posible seleccionarlos anticipadamente. Por ejemplo, en el estudio de la relación de la temperatura del agua con la profundidad oceánica, podría saberse que el modelo se usará para predecir dicha temperatura a profundidades de 1 000 a 5 000 pies. Es posible elegir las mediciones de la temperatura del agua a cualquier profundidad que interese, dentro de ese intervalo. Por ejemplo, podría optarse por mediciones a incrementos de 1 000 pies. De tal manera, los valores de X preestablecidos serían x1 = 1 000, x2 = 2 000, x3 = 3 000, x4 = 4 000 y x5 = 5 000 pies. Se dice que el estudio está controlado cuando se seleccionan anticipadamente los valores de X usados para desarrollar la ecuación de regresión. En ocasiones, los valores de X utilizados en la ecuación se eligen con algún mecanismo aleatorio. Por ejemplo, en el estudio del efecto de la calidad del aire en el pH de la lluvia, se está forzado a seleccionar una muestra de días, registrar la calidad del aire en esos días y medir el pH de la lluvia. En este caso, el investigador no selecciona con antelación los valores de X usados en el desarrollo de la ecuación de regresión, sino que se trata de un conjunto de valores de X característicos. Las investigaciones de este tipo se llaman estudios de observación. Sin importar cómo se seleccionen los valores de X para el estudio, sería correcto suponer que la muestra aleatoria asume la forma siguiente: {( x1 , Y | x1 ),( x2 , Y | x2 ),( x3 , Y | x3 ), . . . , ( x n , Y | x n )} Note que el primer miembro de cada par ordenado denota un valor de la variable independiente X y es un número real. El segundo miembro de cada par es una variable aleatoria. Este capítulo se dedica al aprendizaje de la estimación de la curva de regresión de Y sobre X cuando se considera que la regresión es lineal. En tal caso, la ecuación µY | x está dada por:

Curva de regresión lineal de Y sobre X

µY | x = β0 + β1 x

donde β0 y β1 denotan números reales. Gran parte de la teoría subyacente a las técnicas analizadas depende del álgebra lineal. Por ello, resulta imposible demostrar algunos de los resultados con base en el material de esta obra. La verificación de resultados se incluye siempre que es posible.

380

11.1

PROBABILIDAD Y ESTADÍSTICA

MODELOS Y ESTIMACIÓN DE PARÁMETROS

Descripción del modelo Recuerde, de los fundamentos de álgebra, que la ecuación de una recta es y = b + mx, donde b denota la intersección con el eje y, y m, la pendiente de la recta. En el modelo de regresión lineal simple:

µY | x = β0 + β1x β0 denota la intersección y β1 la pendiente de la recta de regresión. A fin de estimar esta última, debe encontrarse una forma lógica de estimar los parámetros teóricos β0 y β1. Entender la forma de lograrlo requiere primero escribir de nuevo el modelo en una forma alternativa. En un estudio de regresión, se observa la variable X en n puntos x1, x2, x3, . . . , xn. Se supone que éstos se miden sin error. Si los selecciona anticipadamente el experimentador, se habla de un estudio controlado, y si se observan al azar, de un estudio de observación. Ambas situaciones se manejan en forma matemática. En ambos casos, interesan las n variables aleatorias Y | x1, Y | x2, Y | x3, . . . , Y | xn. Recuerde que una variable aleatoria Y varía en torno a su media. Sea Ei la diferencia aleatoria entre Y | xi y su media, µY | x . En otras palabras, sea: i

E i = Y | x i – µY | x

i

Al resolver esta ecuación para Y | xi, se llega a la conclusión de que:

Y | x i = µY | x + E i i

En esta expresión, se supone que la diferencia aleatoria Ei tiene media 0. Se supone también que la regresión es lineal, de modo que puede concluirse que µY | x = β0 + β1xi . Luego de hacer una sustitución, se tiene: i

Y | xi = β0 + β1 xi + E i Es costumbre omitir la notación condicional y denotar Y | xi por Yi. Una forma alterna de expresar el modelo de regresión lineal simple es: Modelo de regresión lineal simple Yi = β0 + β1 xi + E i

(11.1)

donde se supone que Ei es una variable aleatoria con media 0. Los datos consisten en un conjunto de n pares (xi, yi) donde xi y yi son valores observados de las variables aleatorias X y Y, respectivamente. El valor observado de una variable aleatoria suele diferir de su media en una cierta cantidad aleatoria. Esta idea se expresa matemáticamente como sigue: yi = β0 + β1xi + εi

(11.2)

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

x

0

Profundidad del mar a) y Temperatura del agua

0

Temperatura del agua

y

Temperatura del agua

y

381

0

" Y|x

=

!0

+

!1 x

x Profundidad del mar b)

(x i, y i ) εi

x Profundidad del mar c)

FIGURA 11.1 a) Diagrama de dispersión de datos hipotéticos de la profundidad del océano (x) contra la temperatura del agua ( y) los datos muestran tendencia lineal, indicativa de que es razonable la regresión lineal; b) la línea de regresión teórica desconocida pasa a través de los puntos de datos; c) εi es la distancia de yi a su media, µ Y |xi.

En esta ecuación, εi denota una realización de la variable aleatoria Ei cuando Yi asume el valor yi. En un estudio de regresión, es útil representar gráficamente los puntos de datos en el plano xy, lo que se llama diagrama de dispersión. No se espera que esos puntos se ubiquen exactamente en una recta. Sin embargo, cuando la regresión lineal es aplicable, entonces deben mostrar una tendencia lineal. Estas ideas teóricas se ilustran en la figura 11.1, en el contexto del estudio de la temperatura del agua. Note que se desconocen los valores verdaderos de β0 y β1, de modo que tampoco se conoce el valor real de εi, la distancia vertical del punto (xi, yi) a la línea de regresión verdadera. Una vez que se han aproximado β0 y β1 a partir de los datos que se tienen, es posible sustituir esos parámetros teóricos con sus valores estimados, en el modelo de regresión. Sean b0 y b1 las estimaciones de β0 y β1, respectivamente, en cuyo caso la línea de regresión estimada asume la forma:

µˆ Y | x = b0 + b1x De igual modo que no todos los puntos de datos se sitúan sobre la línea de regresión teórica, tampoco lo hacen respecto de la línea de regresión estimada. Si ei denota la distancia vertical del punto (xi, yi) a la línea de regresión estimada, entonces cada punto de datos satisface la ecuación: yi = b0 + b1xi + ei

El término ei se llama residuo. En la figura 11.2, se ilustra esta idea y se resalta gráficamente la diferencia entre εi y ei.

382

PROBABILIDAD Y ESTADÍSTICA

y

ei

εi

!ˆ Y|x ! Y|x

x

0

FIGURA 11.2 εi es la distancia vertical desde el punto (xi, yi) hasta la línea de regresión verdadera µY/x = β0 + β1x; ei es la distancia vertical desde el punto (xi, yi) a la línea de regresión estimada µˆ Y | x = b0 + b1 x. (x 5 , y 5 )

y

e5 (x 3 , y 3 ) e3

(x 1 , y 1 ) e1

!ˆ Y|x = b 0 + b 1 x

e4 (x 4 , y 4 )

e2 (x 2 , y 2 )

0

x

FIGURA 11.3 El procedimiento de mínimos cuadrados minimiza la suma de los residuos ei.

Estimación de mínimos cuadrados Los parámetros β0 y β1 se estiman mediante el método de mínimos cuadrados. El razonamiento subyacente a éste es muy sencillo. De las numerosas rectas que pueden trazarse en un diagrama de dispersión, se pretende elegir la que “mejor se adapte” a los datos. La adaptación es “óptima” en el sentido de que los valores de b0 y b1 sean los que minimicen la suma de los cuadrados de los residuos. En lo fundamental, se selecciona la recta que esté tan cercana como sea posible, simultáneamente, a todos los puntos. Por ejemplo, si se considera la muestra de cinco puntos de la figura 11.3, el procedimiento de mínimos cuadrados selecciona la línea con la que e12 + e22 + e32 + e42 + e52 sea tan pequeña como sea posible. Los residuos se elevan al cuadrado antes de sumarlos por una razón muy práctica. Note que el residuo de un punto situado arriba de la línea de regresión estimada es positivo, y el de otro punto situado debajo de ella, negativo. Si se suman directamente los residuos, los valores negativos y posi-

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

383

tivos se contrarrestan entre sí y la suma siempre es igual a cero. Se pide al lector, en el ejercicio 5, que verifique este hecho. La deducción general de las estimaciones de mínimos cuadrados de β0 y β1 depende de la técnica de minimización estudiada en los fundamentos de cálculo. En particular, interesa expresar la suma de cuadrados de los residuos como función de las dos variables b0 y b1, diferenciar esta función respecto de dichas variables, ajustar las derivadas de modo que sean iguales a cero y despejar b0 y b1 en las ecuaciones resultantes. Antes de presentar la deducción, advierta que el residuo ei a veces se denomina error residual. Es frecuente que la suma de los cuadrados de los residuos se llame suma de los cuadrados de los errores y se denota como SSE (suma de cuadrados del error). Puesto que el término “errores” tiende a indicar que se hizo algo incorrecto, su uso es desorientador. Sin embargo, se utiliza ampliamente y aquí se respeta tal uso. La suma de los cuadrados de los errores concerniente a la línea de regresión estimada está dada por: n

n

i =1

i =1

SSE = ∑ ei2 = ∑ ( yi – b0 – b1 xi )2 Al diferenciar el SSE respecto de b0 y b1, se obtiene: n ∂SSE = –2 ∑ ( yi – b0 – b1 xi ) ∂b0 i =1 n ∂SSE = –2 ∑ ( yi – b0 – b1 xi ) xi ∂b1 i =1

En siguiente término, se igualan esas derivadas parciales a cero y se usan las reglas de la sumatoria para obtener las ecuaciones: n

n

i =1

i =1

nb0 + b1 ∑ xi = ∑ yi n

n

n

i =1

i =1

i =1

b0 ∑ xi + b1 ∑ xi2 = ∑ xi yi

Estas ecuaciones se llaman normales. Se pueden resolver fácilmente al obtener las estimaciones de β0 y β1: Estimaciones de mínimos cuadrados para β0 y β1

b1 =

n  n  n  n ∑ xi yi –  ∑ xi   ∑ yi  i =1 i = 1  i = 1 

 n 2 n ∑ x –  ∑ xi  i=1 i = 1  b0 = y – b1 x n

2 i

Antes de ilustrar estas ideas, hay que resaltar un aspecto muy práctico de la regresión que todavía no se menciona. Se trata de que, si bien la ecuación de regresión en verdad es una estimación de la media de Y para un valor dado x, se usa ampliamente para estimar el valor de Y misma. El

384

PROBABILIDAD Y ESTADÍSTICA

sentido común indica que una selección lógica del valor pronosticado de Y para un valor x dado es su promedio estimado, µˆ Y | x . Por ejemplo, si es necesario predecir la temperatura del agua oceánica a 1 000 pies de profundidad, una opción lógica es la temperatura promedio a esa profundidad. Este uso de la línea de regresión estimada se subraya al reescribirla en la forma: yˆ = µˆ Y |x = b0 + b1x Ejemplo 11.1.1. La humedad influye en la evaporación, de modo que el equilibrio de solventes de las pinturas base agua durante su rocío se ve afectado por la humedad. Se emprende un estudio controlado para examinar la relación de la humedad (X ) con la magnitud de la evaporación del solvente (Y ). El conocimiento de esta relación es útil para que el pintor ajuste el aspersor de pintura a modo de considerar la humedad. Se obtienen los datos siguientes:

Observación

Humedad relativa, x (%)

Evaporación del solvente, y (% de peso)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

35.3 29.7 30.8 58.8 61.4 71.3 74.4 76.7 70.7 57.5 46.4 28.9 28.1 39.1 46.8 48.5 59.3 70.0 70.0 74.4 72.1 58.1 44.6 33.4 28.6

11.0 11.1 12.5 8.4 9.3 8.7 6.4 8.5 7.8 9.1 8.2 12.2 11.9 9.6 10.9 9.6 10.1 8.1 6.8 8.9 7.7 8.5 8.9 10.4 11.1

Las estadísticas de resumen para esos datos son: n = 25

∑x

2

= 76 308.53

∑ x = 1 314.90 ∑ y 2 = 2 286.07

∑ y = 235.70 ∑ xy = 11 824.44

La estimación de la línea de regresión lineal simple requiere la de la pendiente β1 y la intersección β0. Estas últimas dos estimaciones son:

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

385

FIGURA 11.4 Gráfica de la línea de regresión estimada de Y, la magnitud de la evaporación, sobre X, la humedad relativa.

βˆ1 = b1 =

n∑ xy –

[(∑ x)(∑ y)]

n∑ x 2 –

(∑ x)

2

25(11 824.44) – [(1 314.90)( 235.70)] 25(76 308.53) – (1 314.90) 2 = –0.08 =

βˆ0 = b0 = y – b1x = 9.43 – (–0.08)(52.60) = 13.64 Por consiguiente, la ecuación de regresión estimada es:

µˆY |x = yˆ = 13.64 – 0.08 x La gráfica de esta ecuación se muestra en la figura 11.4. La predicción de la magnitud de evaporación del solvente cuando la humedad relativa es 50% requiere sustituir x con el valor 50 en la ecuación: yˆ = 13.64 – 0.08 x para obtener yˆ = 13.64 – 0.08(50) = 9.64. En otras palabras, cuando la humedad relativa es de 50%, se predice que 9.64% del solvente, por peso, se pierde a causa de la evaporación.

386

PROBABILIDAD Y ESTADÍSTICA

En el análisis estadístico moderno, es habitual el uso de las computadoras. Existen ventajas pedagógicas en estudiar los métodos de cálculo como se hace en esta obra. Sin embargo, en la práctica se recomienda el uso de los modernos tipos de software estadístico. Algunos de los más importantes son SAS (Statistical Analysis System), MINITAB, BMDPC (Biomedical Computer Programs y SPSS (Statistical Package for the Social Sciences). Aquí se presentan algunos resultados característicos obtenidos con el SAS. Note que la pendiente e intersección de la línea de regresión estimada se indican en 1 y 2 , respectivamente. Se hace referencia a 3 y 4 en el ejemplo 11.3.1. ESTIMATED LINE OF REGRESSION GENERAL LINEAR MODELS PROCEDURE DEPENDENT VARIABLE: Y SOURCE MODEL ERROR CORRECTED TOTAL

DF 1 23 24

SUM OF SQUARES 45.82966081 18.06073919 63.89040000

C.V. 9.3991

ROOT MSE 0.88614306

SOURCE X

DF 1

TYPE I SS 45.82966081

F VALUE 58.36

PR > F 0.0001

SOURCE X

DF 1

TYPE III SS 45.82966081

F VALUE 58.36

PR > F 0.0001

T FOR HO: PARAMETER = 0 23.56 –7.64 3

PR > !T! 0.0001 0.0001 4

STD ERROR OF ESTIMATE 0.57898306 0.01047971

R-SQUARE 0.717317

PARAMETER INTERCEPT X

ESTIMATE 13.63886687 2 –0.08006059 1

MEAN SQUARE 45.82966081 0.78524953

F VALUE 58.36 PR > F 0.0001 Y MEAN 9.42800000

Recuerde, de los fundamentos de cálculo, que la pendiente de una recta indica el cambio de y por una unidad de cambio en x. Si la pendiente es positiva, entonces y aumenta conforme lo hace x, de igual forma y decrece si x lo hace. Cuando la pendiente es negativa, ocurre a la inversa. El aumento de x indica la disminución de y, mientras que la reducción de x genera el aumento de y. En el ejemplo previo, la pendiente es –0.08. Si la humedad relativa aumenta en un punto porcentual, entonces la media de evaporación del solvente decrece en 0.08. Dicha evaporación debe aumentar en 3(0.08) = 0.24 cuando la humedad relativa disminuye tres puntos porcentuales. Se termina esta sección con una advertencia. Un conjunto de datos específico contiene pruebas de linealidad sólo respecto de los valores de X que abarca dicho conjunto. No se tienen pruebas de linealidad en relación con valores de X que están más allá del conjunto. Así pues, es riesgoso usar una línea de regresión estimada para predecir valores de Y correspondientes a valores de X que se sitúan mucho más allá del intervalo de valores de X incluido en el conjunto de datos.

11.2 PROPIEDADES DE LOS ESTIMADORES DE MÍNIMOS CUADRADOS El método de mínimos cuadrados genera, en relación con un conjunto dado de observaciones de (X, Y ), estimaciones de b0 y b1 para β0 y β1, la intersección y la pendiente de la línea de regresión verdadera, respectivamente. Los valores de b0 y b1 obtenidos varían de uno a otro conjunto de datos, por lo que

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

387

es evidente que en realidad son valores observados de variables aleatorias, que se denotan con β1 y β2. Estas variables aleatorias, que son estimadores de β0 y β1, están dadas por: Estimadores de mínimos cuadrados de β0 y β1

B1 = βˆ1 =

n  n  n  n ∑ xiYi –  ∑ xi   ∑Yi  n=1 i = 1  i = 1 

 n 2 n ∑ x –  ∑ xi  i=1 i = 1  ˆ B0 = β0 = Y – B1 x n

2 i

En esta sección, se deducen las propiedades matemáticas de esos estimadores. Conocerlas permite calcular los intervalos de confianza de β0, β1, µY | x y Y | x, además de probar hipótesis sobre los valores de β0 y β1. Recuerde que una forma de expresar el modelo de regresión lineal simple es: Yi = β0 + β1 xi + E i donde se supone que Ei es una variable aleatoria con media 0. La determinación de las propiedades de B0 y B1 requiere otros supuestos concernientes a Ei. En particular, se supone que E1, E2, E3, . . . , En es una muestra aleatoria de una distribución normal con media 0 y varianza σ 2. Se expresa esto al escribir: E i ~ N (0, σ 2 ) Advierta que ello implica que las variables aleatorias de esa muestra son independientes. El modelo expresa Yi como función lineal de Ei, por lo que los supuestos concernientes a esas variables imponen ciertas restricciones a las variables aleatorias Y1, Y2, Y3, . . . , Yn. De manera específica, se supone lo siguiente: Supuestos del modelo de regresión lineal simple 1. Las variables aleatorias Yi están distribuidas normalmente y son independientes. 2. La media de Yi es β0 + β1xi. 3. La varianza de Yi es σ 2.

Esos supuestos se expresan al escribir:

Yi ~ N ( β0 + β1 xi , σ 2 ) Note que σ 2 es una medida de la variabilidad de las respuestas en torno a la línea de regresión verdadera. Esos supuestos se demuestran en la figura 11.5. Note que, si bien pueden diferir los valores medios de Y1, Y2, Y3, . . . , Yn, se supone que cada uno tiene la misma varianza. Así pues, las curvas normales respectivas podrían ser de localización distinta, pese a la cual todas tendrían la misma forma.

388

PROBABILIDAD Y ESTADÍSTICA

y Distribución de Y|x 1 x1

Distribución de Y|x 2 x2 ! Y|x = "

x

0

+ "1 x

FIGURA 11.5 Para cada i, Yi tiene distribución normal, con media µ Y |xi = β0 + β1 x i y varianza σ 2.

Antes de usar los supuestos recién mencionados para determinar la distribución de B0 y B1, se hace una pausa para expresar algunos resultados que facilitan el trabajo. Se pueden verificar fácilmente con la aplicación de las reglas que rigen el comportamiento del símbolo de suma. Algunas propiedades de la suma 1.

n

∑ ( xi – x ) = 0

i=1

2. 3.

4. 5.

n

n

i=1

i=1

∑ ( xi – x )(Yi – Y ) = ∑ ( xi – x )Yi n



n

n

n



i=1



i=1

i=1

i=1



∑ ( xi – x )(Yi – Y ) =  n ∑ xiYi – ∑ xi ∑Yi  n

n

i=1

i=1

n

∑ ( xi – x )2 = ∑ ( xi – x ) xi

 n n 2 ∑ ( xi – x ) = n ∑ xi2 i=1  i = 1

 n  2 –  ∑ xi    i = 1  

n

Distribución de B1 El desarrollo de intervalos de confianza o pruebas de hipótesis, o de la pendiente de una línea de regresión, precisa conocer la distribución de B1, el estimador de esa pendiente. A continuación, se

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

389

demuestra que los supuestos del modelo sobre Yi garantizan que B1 tiene distribución normal, con n 2 2 E[B1] = β1 y Var B1 = σ / Σi = 1 ( xi – x ) . Note que ello implica que el estimador de mínimos cuadrados para β1 es un estimador insesgado de dicho parámetro. La distribución de B1 se obtiene con las propiedades 2, 3 y 5 arriba mencionadas, para reescribir los estimadores como se muestra: n  n  n  n ∑ xiYi –  ∑ xi   ∑Yi  i=1 i = 1  i = 1  B1 = n  n 2 n ∑ xi2 –  ∑ xi  i=1 i = 1  n

∑ ( xi – x )(Yi – Y )

i=1

=

n

∑ ( xi – x )2

i=1 n

∑ ( xi – x )Yi

i=1

=

n

∑ ( xi – x )2

i=1

Si se tiene que:

(x j – x )

cj =

n

j = 1, 2, 3, . . . , n

∑ ( xi – x )2

i=1

se ha expresado B1 en la forma: B1 = c1Y1 + c2Y2 + . . . + cnYn Dicho de otra manera, se ha expresado B1 como una función lineal de las variables aleatorias independientes Y1, Y2, . . . , Yn. Puesto que toda función lineal de variables aleatorias normales e independientes tiene distribución normal (ejercicio 41 del capítulo 7), puede concluirse que B1 es normal. Con las reglas de la esperanza, se tiene que:

E[ B1 ] = E[ c1Y1 + c2Y2 + . . . + cnYn ] ( x1 – x )Y1 + ( x2 – x )Y2 + . . . + ( x n – x )Yn    n = E  ( xi – x )2 ∑   i=1 n

∑ ( xi – x ) E[Yi ]

=

i=1

n

∑ ( xi – x )2

i=1

390

PROBABILIDAD Y ESTADÍSTICA

Para cada i, E[Yi] = β0 + β1xi. Al sustituir, puede verse que: n

E[ B1 ] =

∑ ( xi – x )(β0 + β1 xi )

i=1

n

∑ ( xi – x )2

i=1 n

n

∑ ( xi – x )β0 + β1 ∑ ( xi – x ) xi

=

i=1

i=1

n

∑ ( xi – x )2

i=1

De conformidad con las propiedades 1 y 4 de la suma: E[ B1 ] = β1 Este resultado demuestra que B1 es un estimador insesgado para β1. Se aplican las reglas de la varianza para calcular Var B1, como sigue:  n   ∑ ( xi – x )Yi   Var B1 = Var i =n1   ∑ ( xi – x )2  i=1   2 n = n 1  Var ( xi – x )Yi ∑ 2  ∑ ( xi – x )  i=1 i = 1   2 n = n 1  Var ( xi – x )Yi  ∑ ( xi – x )2  i∑ i = 1  = 1  2 n = n 1  ( xi – x )2 Var Yi  ∑ ( xi – x )2  i∑ i = 1  = 1 Puesto que se supone que Var Yi es σ 2 para cada i, es posible la sustitución para obtener:

 2 n Var B1 =  n 1  ( xi – x )2 σ 2  ∑ ( xi – x )2  i∑ i = 1  = 1 =

σ2 n

∑ ( xi – x )2

i=1

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

391

Esos resultados se resumen al escribir: Distribución de B1  B1 ~ N  β1 , σ 2 

n



i=1



∑ ( xi – x )2 

Distribución de B0 Los intervalos de confianza de la intersección de la línea de regresión y las pruebas de hipótesis acerca de este parámetro se basan en el conocimiento de la distribución de B0, el estimador de esa intersección. A continuación, se prueba que dicho estimador tiene distribución normal, con E[B0] = β0 y Var B0 = σ 2 Σin= 1xi2 / nΣin= 1( xi – x )2 . Una vez más, el estimador de mínimos cuadrados de β0 es un estimador insesgado para este parámetro. A fin de obtener la distribución del estimador B0, primero tome nota de que puede demostrarse que Y y B1 son independientes (ejercicio 14). Puesto que: B0 = Y – B1 x B0 es una función lineal de variables aleatorias normales e independientes y, por ende, también su distribución es normal. De conformidad con las reglas de la esperanza, puede verse que: E[ B0 ] = E[Y – B1 x ] = E[Y1 + Y2 + . . . + Yn )/n – B1 x ] = ( E[Y1 ] + E[Y2 ] + . . . + E[Yn ])/n – xE[ B1 ] = [(β0 + β1 x1 ) + (β0 + β1 x2 ) + . . . + ( β0 + β1 x n )]/n – xE[ B1 ] n   =  nβ0 + β1 ∑ xi  n – xE[ B1 ] i=1   = β0 + x β1 – x β1 = β0

Este resultado muestra que B0 es un estimador insesgado de β0. La varianza de B0 está dada por:

Var B0 = Var (Y – B1 x ) = Var Y + x 2 Var B1 Advierta que: Var (Y ) = Var (Y1 + Y2 + . . . + Yn )/ n Var Y1 + Var Y2 + . . . + Var Yn = n2 2 2 nσ σ = 2 = n n

392

PROBABILIDAD Y ESTADÍSTICA

Luego de la sustitución, se aprecia que: Var B0 =

σ2 + n

x 2σ 2 n

∑ ( xi – x )2

i=1 n

σ 2 ∑ ( xi – x )2 + nx 2σ 2 =

i=1

n

n ∑ ( xi – x )2 i=1

=

 n n ∑ x 2 σ2 i=1 i  

 n  2  n  2 –  ∑ xi   ∑ xi   i = 1  i = 1    + n n  n

n ∑ ( xi – x )2 i=1

n

∑ xi2

=

i=1 n

σ2

n ∑ ( xi – x )2 i=1

En resumen, se demostró que: Distribución de B0 n     ∑ xi2 i= 1  2 B0 ~ N β 0 , n σ  2  n ∑ ( xi – x )    i= 1

Estimador de σ 2 Probar hipótesis y determinar intervalos de confianza de diversos parámetros requiere estimar la varianza desconocida σ 2. Recuerde que σ 2 denota la variabilidad de cada una de las variables aleatorias Yi en torno a la línea de regresión verdadera. En la estimación de esa variabilidad, se usa información concerniente a la variabilidad de los puntos de datos alrededor de la línea de regresión ajustada. Los residuos miden la desviación aleatoria o inexplicada de un punto de datos respecto de la línea de regresión estimada, por lo que se usan para estimar σ 2. En otras palabras, en la estimación se usa SSE, la suma de los cuadrados de los residuos. En particular, se estima σ 2 con: Estimador de σ 2 S 2 = σˆ 2 = SSE /( n – 2)

Se divide SSE entre n – 2, de modo que la estimación de σ 2 sea insesgada (véase ejercicio 13).

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

393

Resumen de resultados teóricos Antes de terminar esta sección, se presentan notaciones que facilita recordar los resultados aquí obten 2 n 2 nidos. A saber, se denota Σni = 1 ( xi – x )2 por Sxx . El símbolo Syy indica Σi = 1 ( yi – y ) o Σi = 1 (Yi – Y ) . Que se trate de las variables aleatorias Yi o sus valores observados yi es algo que debe estar claro con n el contexto en el cual se usa el símbolo. De manera similar, Sxy denota Σi = 1 ( xi – x )( yi – y ) o Σin= 1( xi – x )(Yi – Y ), y SSE, Σin= 1( yi – b0 – b1xi )2 o Σni = 1 (Yi – B0 – B1xi )2 . Esta notación puede usarse para reescribir la suma de los cuadrados del error como sigue:

SSE =

n

∑ (Yi – B0 – Bi xi )2

i=1 n

=

∑ (Yi – Y + B1 x – B1 xi )2

i=1 n

=

∑[(Yi – Y ) – B1 ( xi – x )]2

i=1

n

n

i=1

i=1

n

=

∑ (Yi – Y )2 – 2 B1 ∑ ( xi – x )(Yi – Y ) + B12 ∑ ( xi – x )2

i=1

2 1

= S yy – 2 B1S xy + B S xx Note que: n

B1 =

∑ ( xi – x )(Yi – Y )

i=1

n

∑ ( xi – x )2

=

S xy S xx

i=1

Al sustituir, puede verse que: SSE = S yy – 2 B1S xy + B1

S xy S xx

S xx

= S yy – B1S xy

A continuación, se resumen los resultados teóricos obtenidos en esta sección. Se demostró que: Σin= 1( xi – x )2 = S xx Σin= 1(Yi – Y )2 = S yy Σin= 1 ( xi – x )(Yi – Y ) = S xy B1 = Sxy/Sxx es un estimador insesgado para β1. Se trata de un estimador con distribución normal y varianza σ B2 = σ 2/S xx . 5. B0 = Y – B1x es un estimador insesgado para β0. Dicho estimador tiene distribución normal, con varianza σ B2 = ( Σin= 1xi2σ 2 )/nS xx . 6. S 2 = SSE/(n – 2) es un estimador insesgado para σ 2.

1. 2. 3. 4.

1

0

394

PROBABILIDAD Y ESTADÍSTICA

11.3 ESTIMACIÓN DE INTERVALOS DE CONFIANZA Y PRUEBA DE HIPÓTESIS En las secciones previas, se consideraron procedimientos de estimación puntual de parámetros relacionados con el modelo de regresión lineal simple. Se demostró que los estimadores dados están exentos de sesgo. A partir de esa información, es posible estimar una línea de regresión de una muestra de observaciones por pares (xi, yi) y predecir el valor de Y o estimar su media con un valor dado x. Al igual que en otros capítulos, el estudio no termina con la estimación puntual. Continúa con el desarrollo de los intervalos de confianza pertinentes y el aprendizaje de cómo probar hipótesis sobre los parámetros del modelo. En esta sección, se consideran los temas siguientes: 1. Prueba de hipótesis y estimación de intervalos de confianza sobre la pendiente de la línea de regresión. 2. Prueba de hipótesis y estimación de intervalos de confianza sobre la intersección de la línea de regresión. 3. Estimación de intervalos de confianza para la media de Y con un valor x dado. 4. Estimación de intervalos de predicción sobre el valor de Y misma, con un valor x dado. Esos conceptos se analizan en el orden de su enumeración.

Inferencias sobre la pendiente Una de las primeras preguntas que interesa responder a los científicos es: “¿Es ‘significativa’ la regresión?” Aquí, hablar de “regresión significativa” indica que existen datos estadísticos suficientes para sacar en conclusión que la pendiente de la línea de regresión verdadera difiere de 0. Note que si β0 = 0, entonces el modelo de regresión es: Yi = β0 + E i Lo anterior implica que la variación en Y se debe únicamente a fluctuaciones aleatorias en torno a la línea de Y = β0. Si β1 ≠ 0, entonces al menos una parte de la variación en Y se explica por el hecho de que se observa Y con diversos valores de x. En este último caso, el modelo de regresión es útil para estimar µY|x y predecir Y | x. A fin de desarrollar una estadística de prueba para comprobar que H0: β1 = 0, se reconsidera B1, el estimador puntual de β1. Recuerde que: B1 ~ N (β1, σ 2/S xx ) Luego de la estandarización, puede llegarse a la conclusión de que la variable aleatoria:

( B1 – β1 )/(σ / S xx ) es normal estándar. Resulta posible demostrar que la variable aleatoria (n – 2)S 2/σ 2 = SSE/σ 2 tiene distribución ji cuadrada con n – 2 grados de libertad y que B1 y S 2 son independientes [19]. Al aplicar la definición 8.2.1, la de una variable aleatoria T, es factible llegar a la conclusión de que la variable aleatoria: ( B1 – β1 )/(σ / S xx ) 2

2

( n – 2)S /σ ( n – 2)

=

B1 – β1 S / S xx

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

395

tiene distribución T con n – 2 grados de libertad. Si β1 = 0, entonces esa variable aleatoria puede usarse para poner a prueba la regresión significativa: Estadística de prueba de H0: β1 = 0 Tn – 2 =

B1 S / S xx

Esta fórmula sirve como estadística de prueba de cualquiera de las tres hipótesis usuales:

H 0: β1 = 0

H 0: β1 = 0

H 0: β1 = 0

H1: β1 > 0

H1: β1 < 0

H1: β1 ≠ 0

Prueba de cola derecha

Prueba de cola izquierda

Prueba de dos colas

La hipótesis nula se rechaza con valores positivos grandes de la estadística de prueba en el caso de una prueba de cola derecha, mientras que los valores negativos grandes llevan al rechazo de H0 con una prueba de cola izquierda. Si se trata de una prueba de dos colas, H0 se rechaza con valores grandes, sean positivos o negativos. Los tres casos de la pendiente de la línea de regresión, β1 > 0, β1 < 0 y β1 = 0, se ilustran en la figura 11.6. Aquí es necesaria una aclaración. Se considera que el valor nulo es 0 porque es el valor más frecuente en la práctica. Es factible poner a prueba H 0: β1 = β10 , donde β10 denota todo valor hipoté-

y

y

Y = "0 + " 1 x

Y = "0 + " 1 x

x Pendiente positiva ( " 1 > 0)

x Pendiente negativa ( " 1 < 0)

y

Y = "0 + " 1 x

x Pendiente cero ( " 1 = 0)

FIGURA 11.6 Pendientes relativas positiva, negativa y cero de una línea de regresión lineal.

396

PROBABILIDAD Y ESTADÍSTICA

tico de la pendiente de la línea de regresión. La estadística de prueba de esta hipótesis nula generalizada es: Estadística de prueba de inferencias acerca de la pendiente

Tn – 2 =

( B1 – β10 ) S / S xx

Ejemplo 11.3.1. En el ejemplo 11.1.1, se estima que la ecuación de regresión de Y, la magnitud de evaporación de solvente durante la pintura con pulverizador, sobre X, la humedad relativa, es la siguiente:

µˆY |x = 13.64 – 0.08 x Ahora, se determina si la regresión es significativa o no. En otras palabras, se ponen a prueba: H0: β1 = 0 H1: β1 ≠ 0

Las estadísticas de resumen de los datos antes mencionados son:

∑ x = 1 314.90 ∑ y 2 = 2 286.07

n = 25

∑x

2

= 76 308.53

∑ y = 235.70 ∑ xy = 11 824.44

En relación con esos datos:

 Sxx =  n∑ x 2 – 

(∑ x)  2

n

= [ 25(76 308.53) – (1 314.90) 2 ]/ 25 = 7 150.05 2  S yy =  n∑ y 2 – ∑ y  n  

( )

= [ 25( 2 286.07) – ( 235.70) 2 ]/ 25 = 63.89 Sxy = [ n∑ xy – ∑ x∑ y ] n = [ 25(11 824.44) – (1 314.90)( 235.70)]/ 25 = –572.44 Con uso de esos datos, se obtiene: SSE = S yy – b1Sxy = 63.89 – (–0.08)(–572.44) = 18.09 Por ende: s 2 = SSE /(n – 2) = 18.09/ 23 = 0.79

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

397

El valor observado de la estadística de prueba Tn – 2 = T23 es: t= =

b1 s / Sxx –0.08 0.79 / 7 150.05

= –7.62

En la tabla VI del apéndice A, puede verse que P[T23 ≤ –7.62] < 0.0005. Puesto que se trata de una prueba de dos colas, P < 2(0.0005) = 0.001. Es posible rechazar H0 y concluir que la pendiente de la línea de regresión verdadera difiere de 0. Dicho de otra manera, el conocimiento del valor x ayuda a la estimación de µY | x y la predicción de Y | x. Consulte también el impreso del SAS que sigue al ejemplo 11.1.1. La estadística T para poner a prueba β1 = 0 está dada en 3 , y el valor P correspondiente, en 4 . En la obtención de los límites de un intervalo de confianza de la pendiente, advierta que la variable aleatoria:

Tn – 2 =

B1 – β1 S/ Sxx

es de la forma:

Estimador − Parámetro D donde D es el estimador de la desviación estándar de B1. Es la misma estructura algebraica ya estudiada varias veces con antelación en la obra (véase secciones 9.3 y 10.3). El intervalo de confianza para β1 resultante asume la conocida forma: Estimador ± Punto de probabilidad · D En este caso, el intervalo de confianza es:

Intervalo de confianza para β1, la pendiente de la línea de regresión

B1 ± tα / 2 S / S xx donde tα/2 es el punto apropiado, que se basa en la distribución Tn – 2.

Inferencias sobre la intersección Las pruebas de hipótesis relativas a β0, la intersección de la línea de regresión verdadera, se emprenden al tomar nota de que, puesto que:

B0 ~ N ( β0 , σ 2 ∑ x 2/nS xx )

398

PROBABILIDAD Y ESTADÍSTICA

la variable aleatoria:

B0 – β0



∑ x2

)(

n ⋅ S xx

)

es normal estándar. Puede demostrarse que B0 y S 2 son independientes. Así pues, la variable aleatoria:

(

( B0 − β0 ) σ ∑ x 2 2

nS xx

2

( n − 2) S /σ ( n − 2)

)=

B0 − β0 S 2  ∑x  nS xx 

   

tiene distribución T con n – 2 grados de libertad. La estadística de prueba para demostrar que H0: β0 = 0 es: Estadística de prueba de H0: β0 = 0 Tn − 2 =

B0 S 2  ∑x  nS xx 

   

Los intervalos de confianza del valor para β0 se calculan como sigue: Intervalo de confianza para β0, la intersección de la línea de regresión

B0 ± tα /2

S ∑ x2 nS xx

donde tα/2 es el punto apropiado, basado en la distribución Tn – 2.

El ejemplo siguiente ilustra el uso de estos intervalos de confianza. Ejemplo 11.3.2. Aquí se continúa el análisis de los datos sobre la magnitud de la evaporación de solvente durante la pintura con pistola y la humedad relativa, mediante el cálculo de los intervalos de confianza de β0 y β1. Se necesitan las siguientes estadísticas de resumen, ya calculadas: s2 = 0.79 Sxx = 7 150.05

Σ x2 =

76 308.53

b1 = – 0.08

b0 = 13.64 n = 25

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

399

Un intervalo de confianza de 99% para la pendiente de la línea de regresión está dado por:

b1 ± t0.005s / Sxx

o

− 0.08 ± 2.807 0.79 / 7 150.05

El punto t0.005 se basa en la distribución Tn – 2 = T23. Al completar los cálculos, vemos que se puede confiar 99% que la pendiente de la línea de regresión verdadera se encuentra en el intervalo [–0.109, –0.051]. Nótese que este intervalo no contiene 0. Esto es lo que se espera ya que se rechazó H0: β1 = 0 en el último ejemplo. Un intervalo de confianza de 90% para la intersección de la línea de regresión está dada por

b0 ± t0.05s Σx 2

nSxx

o

13.64 ± 1.714 0.79 76 308.53

25(7 150.05)

Puede tenerse confianza de 90% de que la línea de regresión verdadera cruza el eje y entre los puntos y = 12.64 e y = 14.64.

Inferencias acerca de la media estimada Además de encontrar una estimación puntual de µY | x, la media de Y para un valor x dado, es útil en la obtención de un intervalo de confianza de este parámetro. A tal efecto, se considera la distribución del estimador puntual de µY | x, al reescribir dicho estimador en la forma:

µˆ Y x = B0 + B1 x = Y − B1 x + B1 x = Y + B1 ( x − x ) Puesto que Y y B1 tienen distribución normal y son independientes, µˆ Y |x , también es normal. En el ejercicio 12, se determinó que ese estimador es insesgado para µY | x. La única información adicional que se necesita es su varianza. Con las reglas de la varianza, puede verse que:

Var ( µˆ Y | x ) = Var[Y + B1 ( x − x )] = Var Y + ( x − x )2 Var B1 = σ 2/ n + ( x − x )2 σ 2/S xx  ( x − x )2  2 = 1/ n + σ S xx   En resumen, es posible sacar en conclusión que: Distribución de µY | x   ( x − x ) 2  2  µˆ Y |x ~ N µ Y |x , 1/ n + σ   S xx   

400

PROBABILIDAD Y ESTADÍSTICA

y

Límite de confianza superior de ! Y|x

Límite de confianza inferior de ! Y|x

0

Línea de regresión estimada x1

x2

x

x3

x4

x

FIGURA 11.7 Banda de confianza de 95% de µY | x.

El proceso de estandarización permite demostrar que:

µˆ Y | x − µ Y | x σ es normal estándar. La división entre ble aleatoria:

1 ( x − x )2 + n S xx

( n − 2) S 2/σ 2 ( n − 2) = S /σ , posibilita determinar que la varia-

µˆ Y | x − µY | x S

1 ( x − x )2 + n S xx

tiene distribución T con n – 2 grados de libertad. La variable aleatoria es de la misma forma algebraica ya estudiada, por lo que los intervalos de confianza para µY | x se determinan con la fórmula siguiente: Intervalo de confianza para µY | x, la media de Y cuando X = x

µˆ Y | x ± tα /2 S

1 ( x − x )2 + n S xx

donde tα/2 es el punto apropiado, basado en la distribución Tn – 2.

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

401

Esa fórmula puede usarse para elaborar lo que se llama banda de confianza en torno a la línea de regresión estimada. A tal efecto, basta determinar intervalos de confianza de 100(1 – α)% de varios puntos selectos y luego unir los puntos de estos intervalos con una curva continua. La línea de regresión verdadera debe estar al interior de esa banda. La idea se ilustra en la figura 11.7.

Inferencias sobre un valor de predicción único Uno de los usos principales de la línea de regresión estimada es predecir el valor de Y misma con un valor especificado de x. Se sabe que ese estimador puntual de Y | x es el mismo que de µY | x, a saber: Yˆ x = µˆ Y | x = B0 + B1 x

Note que Y | x es una variable aleatoria, no una constante desconocida. Cuando se pregunta acerca del “intervalo de predicción” para Y | x, la pregunta es acerca de dos estadísticas, L1 y L2, con la propiedad de que:

P[ L1 ≤ Y x ≤ L2 ]

1−α

En otras palabras, se piden dos estadísticas que incluyan entre ellas el valor observado de Y | x en (1 – α)100% del tiempo. A fin de determinarlas, se usa el lineamiento de determinación de intervalos de confianza dado en el capítulo 7. Ese lineamiento requiere encontrar una variable aleatoria cuya expresión abarque Y | x y que sea de distribución conocida. Recuerde que:   1 ( x − x )2   σ 2  µˆ Y | x ~ N µY | x ,  + S xx    n 

y que, con los supuestos del modelo:

Y x ~ N (µ Y | x , σ 2 ) Puede demostrarse que la variable aleatoria Yˆ | x − Y | x tiene distribución normal [19]. Las reglas de la esperanza permiten obtener: E[Yˆ x − Y x ] = E[Yˆ x ] − E[Y x ] = µY | x − µY | x = 0

De manera similar, se aplican las reglas de la varianza para demostrar que: Var[Yˆ x − Y x ] = Var Yˆ x + Var Y x  1 ( x − x )2  σ 2 + σ 2 = + n S   xx  1 ( x − x )2  σ 2 = 1 + + S xx   n

402

PROBABILIDAD Y ESTADÍSTICA

En conclusión, puede verse que:   1 ( x − x )2   σ 2 (Yˆ x − Y x ) ~ N 0, 1 + +   n S xx   En este caso, la estandarización y la división entre S/σ llevan a la variable aleatoria T: Yˆ x − Y x

Tn − 2 =

S 1+

1 ( x − x )2 + n S xx

La estructura algebraica de esta variable aleatoria guarda paralelismo con la antes estudiada. Por ello, puede llegarse a la conclusión de que un “intervalo de predicción” de 100(1 – α)% para Y | x está dado por:

Intervalo de predicción de Y | x, el valor de Y cuando X = x 1 (x − x ) Yˆ | x ± tα / 2 S 1 + + n S xx

2

donde tα/2 es el punto apropiado, basado en la distribución Tn – 2.

La evaluación de los límites de predicción con diversos valores de x posibilita determinar una banda de predicción de Yx. Note que los límites de confianza para µY | x e Y | x son similares. La diferencia es que la primera de ellas incluye el término: 1 ( x − x )2 + n S xx

mientras que el término correspondiente en el segundo es un poco más largo, a saber:

1+

1 ( x − x )2 + n S xx

Eso era algo que cabía esperar, ya que es posible la estimación de una respuesta promedio con mayor exactitud que la predicción de una observación específica. Desde el punto de vista gráfico, la banda de confianza de µY | x contiene a la banda de predicción correspondiente a Y | x. Esta idea se ilustra en la figura 11.8.

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

403

y 19.5 19.0 18.5

Línea de regresión estimada

18.0 17.5 17.0

Banda de predicción de 90% de Y | x

16.5 16.0

Banda de confianza de 90% de µY | x

15.5 15.0 14.5 14.0 13.5 13.0 1.0

1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9

x

2.0

FIGURA 11.8 Posiciones relativas de banda de confianza de 90% de µY | x y banda de predicción de 90% de Y | x.

El ejemplo siguiente debe mostrar claramente la diferencia entre esos dos tipos de intervalos. Ejemplo 11.3.3. Se inicia una investigación para estudiar el rendimiento de combustible en automóviles conducidos exclusivamente en el entorno urbano. Se usan en el estudio 10 vehículos con la afinación y servicios apropiados, fabricados durante el mismo año. Se conduce cada automóvil 1 000 mi, se obtienen el número promedio de millas por galón (mi/gal), Y, y se registra el peso del automóvil en toneladas, X. Se tienen los datos siguientes:

Número de vehículo Millas por galón (y) Peso en toneladas (x)

1

2

3

4

5

6

7

8

9

10

17.9

16.5

16.4

16.8

18.8

15.5

17.5

16.4

15.9

18.3

1.35

1.90

1.70

1.80

1.30

2.05

1.60

1.80

1.85

1.40

404

PROBABILIDAD Y ESTADÍSTICA

Las estadísticas de resumen de estos datos son: n = 10

Σ x = 16.75

Σ x 2 = 28.6375 Σy 2 = 2 900.46 Σy = 170.0 Σ xy = 282.405

Sxx = 0.581 Sxx = −2.345 S yy = 10.46

nΣ xy − Σ xΣy βˆ1 = b1 = 2 nΣ x 2 − Σ x

( )

10( 282.405) − (16.75)(170.0) 10( 28.6375) − (16.75) 2 = −4.03 =

βˆ0 = b0 = y − b1x = 17.0 − (−4.03)(1.675) = 23.75 La línea de regresión estimada es:

µˆY x = b0 + b1x = 23.75 − 4.03x El lector puede verificar que es posible rechazar H0: β1 = 0 con P < 0.0001. Así pues, la regresión es significativa y el modelo es útil en la predicción del rendimiento de combustible basado en el peso del automóvil. Suponga que interesan todos los vehículos con peso de 1.7 ton. El millaje promedio estimado de estos vehículos es:

µˆY

x = 1.7

= 23.75 − 4.03(1.7) = 16.899 mi/gal

Esa estimación no es de mucha utilidad a falta de una idea de su exactitud. Con el fin de evaluar esta última, se determina un intervalo de confianza de 90% de µˆY x = 1.7 . Ello requiere calcular la SSE y s2 en relación con estos datos: SSE = S yy − b1Sxy = 10.46 − (−4.03)(−2.345) = 1.01 s 2 = SSE /(n − 2) = 1.01/ 8 = 0.126 El intervalo de confianza de 90% de µY | x es:

µˆY x ± tα / 2 s

1 ( x − x )2 + n Sxx

o

16.899 ± 1.86 0.126

1 (1.7 − 1.675) 2 + 10 0.581

16.899 ± 0.21

Puede tenerse confianza de 90% de que el rendimiento de combustible promedio de vehículos con peso de 1.7 ton se ubica entre 16.689 y 17.109 mi/gal. La predicción del rendimiento de combustible de un solo vehículo de 1.7 ton se realiza con el intervalo:

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

yˆ x ± tα / 2 s 1 +

405

1 ( x − x )2 + n Sxx

En relación con estos datos, el intervalo es: 16.899 ± 1.86 0.126 1 +

1 (1.7 − 1.675) 2 + 10 0.581

16.899 ± 0.69 Es posible tener confianza de 90% de que el rendimiento de combustible de cualquier automóvil con peso de 1.7 ton se ubica entre 16.209 y 17.589 mi/gal. Como cabía esperar, el intervalo de predicción usado para el rendimiento de combustible de un solo automóvil es más amplio que el utilizado para predecir el rendimiento de combustible promedio de un grupo de automóviles.

Debe notarse que la amplitud de la banda de confianza o predicción es una función de x. A fin de ver la razón de que ello sea verdadero, considere la fórmula de elaboración de un intervalo de predicción para Y | x. La amplitud del intervalo está determinada en parte por el término: 1+

1 ( x − x )2 + n S xx

Es evidente que ese término tiene valor más bajo cuando x = x. De tal suerte, es factible predecir con mayor exactitud el valor de Y con valores de x que están cerca del valor promedio x. Tal hecho resulta evidente de manera gráfica en las bandas de confianza de la figura 11.8. En ella, las bandas tienen menor amplitud con x = 1.675.

11.4

MEDIDAS REPETIDAS Y FALTA DE AJUSTE

El ajuste de una recta a un conjunto de observaciones por pares con el procedimiento de mínimos cuadrados supone de entrada que la regresión lineal es apropiada. El grado en que tal supuesto es razonable puede verificarse de manera visual con un diagrama de dispersión. Desgraciadamente, cada persona podría ver de manera distinta ese tipo de diagrama; ¡podría parecer que muestra una tendencia lineal para un sujeto y no para otro! Se necesita un método analítico para probar la forma apropiada del modelo de regresión lineal. En esta sección, se analiza el método estadístico para detectar la “falta de ajuste” del modelo. Ese método se basa en un examen de los residuos, las diferencias entre los valores observados de la variable dependiente Y y los valores de predicción de esa misma variable con la línea de regresión estimada. La suma de los cuadrados de los errores o residuos, SSE, puede tener valor grande porque Y tenga variabilidad alta natural o porque el modelo supuesto sea inapropiado. El método que se usa para detectar la falta de ajuste del modelo incluye dividir la SSE en dos componentes atribuibles a estas fuentes de error. La porción atribuible a la variabilidad natural de Y se llama error experimental o puro, o puede asignarse a la falta de idoneidad del modelo, llamada error debido a la falta de ajuste. Si el modelo es apropiado, lógicamente se espera que gran parte de la SSE corresponda a un error puro, mientras que en caso de ser inapropiado una porción grande de la SSE debería ser atribuible a la falta de ajuste. La prueba intenta determinar la porción de la SSE debida a la falta de ajuste y rechazar el modelo si dicha porción parece demasiado grande para haber ocurrido al azar.

406

PROBABILIDAD Y ESTADÍSTICA

TABLA 11.1 Valor de x x1

x2

x3

Y11 Y12 Y13 .. . Yn1

Y21 Y22 Y23 .. . Y2n2

Y31 Y32 Y33 .. . Y3n3

...

xk Yk1 Yk2 Yk3 .. . Yknk

La medición del error puro precisa contar con las que se llaman mediciones repetidas o replicadas. En otras palabras, deben tenerse al menos dos observaciones de Y en uno o más puntos xi (i = 1, 2, . . . , k). Sea Yij la j observación de Y en un punto xi ( j = 1, 2, . . . , ni). Con esta notación, la distribución de datos del experimento es la que se muestra en la tabla 11.1. Note que el número de observaciones es: k

n = n1 + n2 + n3 + . . . + nk = ∑ ni i =1

Recuerde que se mide la variabilidad natural de una variable aleatoria al cuantificar su desviación en torno a la media. Para cada i = 1, 2, 3, . . . , k, puede verse a Yi1, Yi2, Yi3, . . . Yini como una muestra aleatoria de tamaño ni de la distribución de la variable aleatoria Y | xi. Un estimador insesgado para µY | x es la media muestral Yi , donde: i

ni

Yi =

∑Yij / ni j =1

La estadística: ni

∑ (Yij − Yi )2 j =1

mide la variabilidad natural de Y en el punto xi y se llama suma interna de cuadrados. A fin de obtener una medida de la variabilidad natural de Y en todos los valores de x, se combinan las k sumas internas de cuadrados para formar la estadística: k

ni

∑ ∑ (Yij − Yi )2

i =1 j =1

Esta estadística se llama suma de cuadrados debida a error puro y se denota con SSEpe. Se deja como tarea al lector la argumentación de que la variable aleatoria: SSEpe/σ 2 tiene distribución ji cuadrada con n – k grados de libertad (véase ejercicio 40).

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

407

La porción de la SSE debida a la falta de ajuste se denota con SSElf . Se determina por sustracción, a saber: SSElf = SSE – SSEpe Puesto que SSE/σ 2 tiene distribución ji cuadrada con n – 2 grados de libertad, es razonable concluir que SSElf/σ 2 tiene distribución ji cuadrada con (n – 2) – (n – k) = k – 2 grados de libertad. La falta de ajuste se detecta al poner a prueba: H0: el modelo de regresión lineal es apropiado H1: el modelo de regresión lineal es inapropiado La estadística de prueba usada es la razón: Prueba de la falta de ajuste SSE1f /( k − 2)σ 2 SSE1f /( k − 2) = SSE pe /( n − k )σ 2 SSE pe /( n − k )

Fk − 2, n − k =

Esta estadística tiene distribución F con k – 2 y n – k grados de libertad. Advierta que la falta de ajuste se refleja en los valores incrementados de SSElf y un valor alto de F. Se rechaza H0 con valores de la razón F demasiado altos para haber ocurrido al azar. La prueba de la falta de ajuste se ejemplifica a continuación. Ejemplo 11.4.1. Considere los datos siguientes de X, la temperatura en grados centígrados (oC) a la que tiene lugar una reacción química, e Y, el rendimiento porcentual obtenido: Valor de X 30

40

50

60

70

13.7 14.0 14.6

15.5 16.0 17.0

18.5 20.0 21.1

17.7 18.1 18.5

15.0 15.6 16.5

En relación con estos datos, k = 5, ni = 3 para i = 1, 2, 3, 4, 5, y: 5

n = ∑ ni = 15 i =1

La suma interna de cuadrados de errores con x = 30 es: 3

3

j =1

j =1

∑ ( y1 j − y1)2 = ∑ ( y1 j − 14.1)2 = 0.42

408

PROBABILIDAD Y ESTADÍSTICA

La suma de cuadrados de error puro se determina mediante el cálculo de la suma interna de cuadrados de error para cada valor x, luego de lo cual se suman los valores de x. En otras palabras: 5

SSE pe = ∑

3

∑ ( yij − yi )2 = 6.453

i =1 j =1

En relación con estos datos, Syy = 66.437, Sxy = 154 y b1 = 0.051. La suma de cuadrados de los errores, SSE, está dada por:

SSE = S yy − b1Sxy = 58.583 La suma de cuadrados para la falta de ajuste se determina por sustracción. Está dada por:

SSE1f = SSE − SSE pe = 58.583 − 6.453 = 52.13 El valor observado de la estadística Fk – 2, n – k = F3, 10 usada para poner a prueba: H0: el modelo de regresión lineal es apropiado H1: el modelo de regresión lineal es inapropiado es F=

SSE1f /(k − 2) SSE pe /(n − k )

52.13 / 3 6.453 /10 = 26.928 =

A partir de la distribución F3, 10, es posible rechazar H0 con P < 0.05 ( f0.05 = 3 708) [tabla IX del apéndice A]. Se tienen datos convincentes de que el modelo de regresión lineal es inapropiado.

En este punto, procede una advertencia. El procedimiento de mínimos cuadrados puede usarse para ajustar una recta a cualquier conjunto de observaciones por pares. Esa recta sirve para predecir el valor de Y, dado un valor x. Sin embargo, es probable que esas predicciones sean inútiles cuando el modelo de regresión lineal es inapropiado. Es responsabilidad del investigador encontrar un modelo satisfactorio. Algunas técnicas de selección de modelos alternos se consideran en el capítulo 12.

11.5

ANÁLISIS RESIDUAL

Recuerde que en la determinación de intervalos de confianza para β0, β1 y µY | x, así como la de intervalos de predicción para Y | x y en la prueba de hipótesis concernientes a β0 y β1, es necesario recurrir a algunos supuestos de modelo. Cuando el modelo de regresión lineal simple se escribe como: Modelo de regresión lineal simple

Yi = β0 + β1xi + E i

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

409

los supuestos del modelo se expresan como relativos al comportamiento de las variables aleatorias E1, E2, . . . , En. En particular, se supone que estas variables aleatorias son independientes y de distribución normal, con media 0 y varianza común σ 2. Antes de usar una línea de regresión ajustada para efectuar predicciones en la práctica, hay que intentar la verificación de la validez de esos supuestos. En esta sección, se muestran algunas técnicas gráficas que son útiles para ello. Se trata de procedimientos en que se utilizan los residuos, cuyo comportamiento en condiciones ideales debe ser una imagen especular del que tienen las variables aleatorias Ei.

Gráficas residuales Recuerde que ei, el i-ésimo residuo, es la distancia vertical desde el punto de datos i hasta la línea de regresión ajustada. Así pues: ei = yi − [ b0 + b1 xi ] La respuesta pronosticada para un valor dado xi se determina mediante sustitución de la ecuación de regresión. En otras palabras, yˆ i = b0 + b1xi . Puede verse que el i-ésimo residuo podría describirse como: ei = yi − yˆ i El i-ésimo residuo es la diferencia de la i-ésima respuesta observada menos su valor de predicción. Se elaboran gráficas de residuos para verificar los supuestos del modelo. Esas gráficas son diagramas de dispersión de los puntos (xi, ei). En ellas, se muestra al valor de regresión (eje horizontal) contra el valor residual (eje vertical). Las gráficas residuales ayudan a responder dos preguntas: 1. ¿Acaso parecen satisfacerse los supuestos del modelo subyacentes a la regresión lineal simple? 2. Si no parecen satisfacerse los supuestos del modelo, ¿cuáles no? Las gráficas residuales son útiles para identificar o diagnosticar posibles problemas, por lo que a veces se las llama “herramientas de diagnóstico”. En la figura 11.9a, se muestra una gráfica de un conjunto de datos con los que es apropiada la regresión lineal simple. Los puntos de datos muestran tendencia lineal ascendente y se agrupan estrechamente en torno a la línea de regresión estimada, además de que su dispersión es casi la misma con cada valor de regresión. La gráfica residual que guarda relación con un conjunto de datos ideal de este tipo se ilustra en la figura 11.9b. Note que dicha gráfica muestra un conjunto de puntos que se dispersan aleatoriamente alrededor de 0. Que esos puntos varíen en torno a 0 es algo que debe esperarse, ya que se ha demostrado que el valor promedio de los residuos siempre es 0. Sin embargo, advierta también que la dispersión de los residuos es casi la misma en toda la gráfica. Eso es algo que cabe esperar cuando es válido el supuesto de una varianza común σ 2. La figura 11.10a contiene un conjunto de datos indicativo de problemas. Aprecie que, si bien se aprecia una tendencia lineal ascendente, la dispersión de las respuestas parece incrementarse confor-

410

PROBABILIDAD Y ESTADÍSTICA

y (respuesta) yˆ i = b0 + b1xi

x (regresor) a)

e (residuo)

x (regresor)

0

b)

FIGURA 11.9 a) Diagrama de dispersión de un conjunto de datos con el que es apropiada la regresión lineal simple. Los puntos muestran tendencia lineal, con distribución uniforme alrededor de la línea de regresión estimada; b) gráfica residual del caso ideal. Los residuos se dispersan aleatoriamente en torno a 0, con distribución uniforme.

me lo hace x. Ello indica que podría no satisfacerse el supuesto de la varianza común. Dicho de otra manera, la varianza en la respuesta a valores pequeños de la regresión parece diferir de la que se tiene con valores grandes de x. ¿Cómo se muestra este problema en una gráfica residual? Quizá como supondría el lector, la gráfica contiene una dispersión aleatoria alrededor de 0, con dispersión de los puntos cada vez mayor conforme aumenta el valor de x [véase figura 11.10b]. Otros dos problemas pueden identificarse con ayuda de la gráfica de residuos. Son las especificaciones incorrectas y huecos en el modelo. Las especificaciones incorrectas de un modelo ocurren cuando trata de ajustarse una recta a datos no lineales, mientras que los huecos de datos se deben al diseño experimental deficiente o, tal vez, a la pérdida de datos durante el experimento. Ambos problemas hacen que, en el mejor de los casos, el uso de una predicción lineal sea riesgoso. La figura 11.11a muestra un conjunto de datos que es claramente no lineal, junto con una “línea de regresión” que, no obstante lo anterior, se aplicó de manera forzada a los datos. En la figura 11.11b, se ilustra el aspecto de este error en una gráfica residual. Note que los residuos varían en torno a 0; pero parece haber un patrón en ellos. La dispersión no es aleatoria. La falta de azar es lo que se busca, ya que es indicativa de la posibilidad de que la regresión lineal simple no describa adecuadamente la relación entre el regresor y la respuesta.

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

411

y (respuesta)

x (regresor)

e (residuo)

x (regresor)

FIGURA 11.10 a) Conjunto de datos indicativo de que probablemente sea inválido el supuesto de la varianza común; b) gráfica residual que arroja dudas sobre la validez del supuesto de la varianza común. Los residuos se dispersan aleatoriamente en torno a 0, si bien la dispersión de los puntos dista de ser uniforme.

En la figura 11.12a, se presenta un conjunto de datos que contiene huecos concernientes a los valores del regresor. Aunque es posible ajustar una línea a esos datos, hacerlo sería peligroso. Se supone que la tendencia lineal que sugieren las respuestas con valores altos y bajos del regresor continúa en el rango intermedio de x. En realidad, no se tienen datos de que así sea y sería inapropiado suponerlo. La gráfica de residuos de un conjunto de datos con un hueco definido en los datos se muestra en la figura 11.12b. Las gráficas de residuos son útiles para identificar posibles problemas. Sin embargo, su interpretación no siempre es tan sencilla como la de las figuras 11.9-11.12. Resulta difícil identificar patrones con conjuntos de datos pequeños, salvo en casos extremos, de modo que estas gráficas revisten utilidad máxima con conjuntos de datos más bien grandes. Por añadidura, para darse clara idea de la validez del supuesto de la varianza deben diseñarse los experimentos de manera tal que se tengan observaciones múltiples con cada valor distinto del regresor.

412

PROBABILIDAD Y ESTADÍSTICA

y (respuesta)

x (regresor) a)

e (residuo)

x (regresor)

b) FIGURA 11.11 a) Conjunto de datos con el que es inapropiado el modelo de regresión lineal simple; b) gráfica residual en el que se ajustó una ecuación de predicción lineal a un conjunto de puntos de datos desprovistos de tendencia lineal. Los residuos tienen un patrón que no corresponde a la dispersión aleatoria en torno a cero.

Comprobación de la normalidad: gráficas de tallo y hoja y gráficas de caja Un supuesto del modelo que todavía no se ha estudiado en el capítulo es la normalidad. Puede comprobarse visualmente, como se hizo en capítulos previos, o de manera analítica con un software estándar, como el SAS. Aquí, se consideran dos verificaciones visuales que no requieren pruebas formales. Ambos funcionan de manera óptima con muestras razonablemente grandes, ya que las dos requieren ciertos juicios de valor acerca de la forma. Estos juicios son difíciles de elaborar con muestras pequeñas, ya que en esos conjuntos de datos no se aprecian patrones, salvo que las transgresiones de los supuestos sean extremas. La primera técnica visual es una que debe venir a la mente de inmediato, a saber, la construcción de un diagrama de tallo y hoja de los residuos, como se explica en el capítulo 6. Si el supuesto de normalidad es válido, se espera que la gráfica muestre la forma de campana aproximada que es indicativa de la curva normal.

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

413

y (respuesta)

x (regresor) a)

e (residuo)

x (regresor)

0

b)

FIGURA 11.12 a) Conjunto de datos con un hueco en el rango intermedio. Sería riesgoso usar la regresión lineal simple. b) Gráfica residual que muestra huecos en los valores del regresor.

La gráfica de caja también puede usarse como herramienta de diagnóstico. Permite comprobar las posibles violaciones del supuesto de normalidad, además de detectar la presencia de valores atípicos. La elaborada con los residuos cuando es válido el supuesto de normalidad debe ser simétrica, con la línea mediana cercana a 0 o sobre dicho valor. No se espera que haya valores atípicos, ya que son muy infrecuentes siempre que la variable aleatoria correspondiente tiene distribución normal (véase ejercicio 26 del capítulo 6). Así pues, la asimetría o valores atípicos serían indicativos de que podría ser inválido el supuesto de normalidad. Los valores atípicos son muy problemáticos en los estudios de regresión. Pueden ejercer influencia significativa en la línea de regresión, en el sentido de que tiran de ella hacia el valor atípico. Ello puede ocasionar que la línea ajustada no cruce el centro de la mayor parte de los datos, como se pretende. Si se detectan valores atípicos con la gráfica de caja, hay que investigarlos. El punto de datos correspondiente no debe usarse en el análisis cuando contenga un error u origine sospechas por alguna otra razón. El ejemplo 11.5.1 ilustra el uso de los residuos y las gráficas de tallo y hoja en un estudio de regresión. En él, puede apreciarse que las gráficas relacionadas con datos reales no siempre son tan fáciles de interpretar como se preferiría.

414

PROBABILIDAD Y ESTADÍSTICA

Y 13 + A A A

12 +

AA

11 +

A

A

A A

10 + A

A

A

A

9+

A A A

A A

A

8+

A

7+

A A

A

A A

6+

+

+

+

+

+

+

+

20

30

40

50 a)

60

70

80

X

FIGURA 11.13 a) Diagrama de dispersión de los datos con la línea de regresión estimada.

Ejemplo 11.5.1. Considere el problema que se describe en el ejemplo 11.1.1, en el cual se determina una ecuación para predecir la magnitud de evaporación de solvente (Y ) a partir del conocimiento de la humedad (X ). El diagrama de dispersión de los datos en dicho ejemplo se muestra en la figura 11.13a. La línea ilustrada es la gráfica de la línea de regresión estimada. Su ecuación está dada por:

µˆY x = 13.64 − 0.08 x Se observa una tendencia lineal de los datos, además de que los puntos de datos parecen situarse razonablemente cerca de la línea de regresión estimada. La gráfica residual se ilustra en la figura 11.13b. Advierta que esta gráfica no revela un patrón posiblemente indicativo de que el modelo lineal sea inapropiado; los puntos de datos sí parecen dispersarse aleatoriamente en torno a 0, como se pretendía. Tampoco existen diferencias evidentes en su dispersión conforme aumenta x. Sin embargo, el experimento no se diseñó con observaciones múltiples de valores distintos del regresor, de modo que dista de ser fácil la verificación de ese supuesto. A fin de comprobar la normalidad, se prepara una gráfica de tallo y hoja de los residuos. Éstos aparecen en la tabla 11.2, y la gráfica mencionada, en la figura 11.14. En ella, se usa doble tallo, con la “hoja” correspondiente al primer sitio decimal del residuo. Por ejemplo, el valor 0.18727 se representa gráficamente como 0|1 en el tallo 0 “bajo”. ¿Acaso la gráfica muestra datos convincentes de normalidad? ¿Indica claramente la forma de campana característica de la curva normal? Es probable que la respuesta a esta pregunta sea “no”. La forma es muy poco descriptiva. Determinar si existen datos suficientes e indicativos de que el supuesto de normalidad probablemente es inválido requiere una prueba

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

415

Y 1.5 + A

A

A

A

A

1.0 + A

A

A

0.5 +

R E S I D U O

A A

A A

A

0.0 + A –0.5 +

AA

A

A

AA

A A

–1.5 +

A

A

A

–1.0 + A –2.0 +

+

+

+

+

+

+

+

20

30

40

50 b)

60

70

80

X

FIGURA 11.13 (CONTINUACIÓN) b) Gráfica residual de los datos de los ejemplos 11.1.1 y 11.5.1. Los residuos no muestran una distribución evidente de errores en la especificación del modelo.

formal. La figura 11.15 contiene el impreso del SAS para PROC UNIVARIATE. Dicho impreso contiene el valor observado de la estadística W usada para poner a prueba: H0: los datos son de una distribución normal H1: los datos son de una distribución no normal El valor de la estadística, 0.958717, se muestra en (1), y su valor P, 0.4028, en (2). Este valor P es grande, por lo que no se debe rechazar H0. Con base en esos residuos, se carece de razones para suponer que no correspondan a una distribución normal. Note que el SAS proporciona un diagrama de tallo y hoja que difiere del que muestra la figura 11.14. Recuerde que no existen reglas establecidas en la definición de las hojas. En la gráfica de SAS, se define una hoja al redondear primero el residuo a un sitio decimal y luego representarlo gráficamente. ¿Ello clarifica la cuestión de la normalidad? Es probable que no. Todavía se carece de una campana claramente definida.

En el ejemplo precedente, el interés se centra en verificar la normalidad. En el ejemplo que sigue, se usa la gráfica de caja para verificar la asimetría y la presencia de valores atípicos. La carencia definitiva de asimetría o la existencia de valores atípicos son signos de posible transgresión del supuesto de normalidad.

416

PROBABILIDAD Y ESTADÍSTICA

TABLA 11.2

Respuesta observada (Y ), respuesta pronosticada y residuos de los 25 puntos de datos de los ejemplos 11.1.1 y 11.5.1 Número de observación 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Y

Respuesta pronosticada

Residuo

11.0 11.1 12.5 8.4 9.3 8.7 6.4 8.5 7.8 9.1 8.2 12.2 11.9 9.6 10.9 9.6 10.1 8.1 6.8 8.9 7.7 8.5 8.9 10.4 11.1

10.8127 11.2611 11.1730 8.9313 8.7231 7.9305 7.6824 7.4982 7.9786 9.0354 9.9241 11.3251 11.3892 10.5085 9.8920 9.7559 8.8913 8.0346 8.0346 7.6824 7.8665 8.9873 10.0682 10.9648 11.3491

0.18727 –0.16107 1.32700 –0.53130 0.57685 0.76945 –1.28236 1.00178 –0.17858 0.06462 –1.72406 0.87488 0.51084 –0.90850 1.00797 –0.15593 1.20873 0.06537 –1.23463 1.21764 –0.16650 –0.48735 –1.16816 –0.56484 –0.24913

1 0 0 –0 –0 –1 –1

3 5 1 1 5 2 7

0 7 0 1 9 2

0 2 2 8 5 0 1 1 4 5 1

2

FIGURA 11.14 Diagrama de tallo y hoja de los residuos de la tabla 11.2. En el diagrama, se usa doble tallo, con la “hoja” definida como el primer sitio decimal del residuo.

Ejemplo 11.5.2. A fin de construir rápidamente una gráfica de caja de los residuos que aparecen en la tabla 11.2, una vez más se retiene sólo el primer sitio decimal del número, como se hizo en la construcción del diagrama de tallo y hoja en la figura 11.14. En relación con estos datos, n = 25, la localización mediana es (n + 1)/2 = 13, y el valor de la mediana, –0.1. Las localizaciones de los cuartiles son (13 + 1)/2 = 7. Los valores de los cuartiles son q1 = –0.5 y q3 = 0.7. El rango intercuartiles es q3 – q1 = 1.2. Los límites internos se localizan en:

SASREGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

417

UNIVARIATE PROCEDURE Variable = RESID Residual Moments

1

N Mean Std Dev Skewness USS CV T:Mean = 0 Sgn Rank Num ˆ = 0 W:Normal

25 0 0.867485 –0.17648 18.06074 . 0 –0.5 25 0.958717

Sum Wgts Sum Variance Kurtosis CSS Std Mean Prob > |T| Prob > |S|

25 0 0.752531 –0.84038 18.06074 0.173497 1.0000 0.9896

Prob < W

0.4028

2

Quantiles (Def = 5) 5 3 4

100% Max 75% Q3 50% Med 25% Q1 0% Min

1.326999 0.769453 –0.15593 –0.5313 –1.72406

Range Q3 – Q1 Mode

3.051055 1.300757 –1.72406

99% 95% 90% 10% 5% 1%

1.326999 1.217641 1.208726 –1.23463 –1.28236 –1.72406

Extremes Lowest –1.72406( –1.28236( –1.23463( –1.16816( –0.9085 (

Obs 11) 7) 19) 23) 14)

Highest 1.00178( 1.007969( 1.208726( 1.217641( 1.326999(

Stem Leaf 1 00223 0 5689 0 112 –0 22222 –0 9655 –1 322 –1 7

# 5 4 3 5 4 3 1

Obs 8) 15) 17) 20) 3) Boxplot $#####$ $

6

* ##### * $#####$

####$####$####$####$

FIGURA 11.15 Prueba analítica de normalidad.

417

418

PROBABILIDAD Y ESTADÍSTICA

2

x

1

0

1

2

x

FIGURA 11.16 Gráfica de caja de los residuos de la tabla 11.2, basados en la gráfica de tallo y hoja de la figura 11.14. No se detectan valores atípicos. Aunque la gráfica carece de simetría perfecta, su desviación es insuficiente para rechazar el supuesto de normalidad.

f1 = q1 − 1.5iqr = −0.5 − 1.5(1.2) = −2.3

y f 3 = q3 + 1.5iqr = 0.7 + 1.5(1.2) = 2.5 Puesto que ningún valor de residuo se sitúa por fuera de los límites internos, el conjunto de residuos carece de valores atípicos. Se trata de buenas nuevas, ya que los valores atípicos son muy infrecuentes (tienen probabilidad de 0.007) cuando el muestreo es de una distribución normal. La gráfica de caja de los residuos se ilustra en la figura 11.16. Note que no muestra la simetría perfecta que se espera de una distribución normal; pero no se desvía en grado suficiente para indicar una transgresión clara del supuesto de normalidad. Los valores de la mediana, q1 y q3 basados en los valores verdaderos de los residuos están dados por SAS en los puntos (3), (4) y (5), respectivamente, de la figura 11.15. La gráfica de caja de SAS corresponde al punto (6) de la figura. El + en la caja está en 0, el valor promedio de los residuos. En una gráfica con simetría perfecta, que es la gráfica ideal, dicho signo coincidiría con la mediana. Puesto que el conjunto de datos es imperfecto, como es usual con los datos reales, existe diferencia leve entre los dos valores.

La regresión es por igual un arte y una ciencia. Los datos reales pocas veces son perfectos. El investigador tiene que elaborar algunos juicios de valor en cuanto a la idoneidad de la regresión lineal. Las herramientas estudiadas en esta sección le ayudan en esos juicios. En la sección 12.8, se presentan algunas sugerencias sobre el manejo de datos que transgreden varios supuestos descritos en esta sección.

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

11.6

419

CORRELACIÓN

Hasta este punto del capítulo, se han estudiado problemas concernientes a la regresión lineal simple. El problema fundamental ha sido expresar el valor medio de una variable aleatoria Y como función lineal de una variable no aleatoria X. En esta sección, se continúa el estudio de la correlación iniciado en el contexto teórico como parte de la sección 5.3. Existen dos diferencias importantes entre los estudios de regresión analizados hasta este punto y los de correlación que se estudian en siguiente término. La primera, que en un estudio de correlación tanto X como Y deben ser variables aleatorias. La segunda, que no se busca una relación lineal de X con la media de Y, sino que más bien se intenta medir la intensidad de la relación lineal que existe entre X y Y. El parámetro teórico usado para medir la relación lineal de X con Y es el coeficiente de correlación de Pearson, ρ. Dicho parámetro está definido por: Coeficiente de correlación de Pearson

ρ=

Cov ( X , Y ) (Var X )(Var Y )

y

y

x y

ρ =1 a)

x y

ρ = −1 b)

x

x

ρ =0 c)

ρ =0 d)

FIGURA 11.17 a) ρ = 1, relación positiva perfecta; b) ρ = –1, relación negativa perfecta; c) ρ = 0, no existe relación; d ) ρ = 0, existe una relación, si bien no es lineal.

420

PROBABILIDAD Y ESTADÍSTICA

El parámetro ρ asume valores entre –1 y 1, inclusive. Esos dos valores indican relaciones negativa o positiva perfectas, en ese orden. El valor 0 refleja la ausencia de relación lineal. Cuando ocurre esto, se dice que X y Y no están correlacionadas. La interpretación gráfica de ρ se ilustra en la figura 11.17. En capítulos previos, se determinó el valor teórico de ρ con base en el conocimiento de la función de densidad conjunta de X y Y. Desgraciadamente, en la práctica pocas veces se conoce dicha función. Por ello, la tarea del investigador es estimar ρ a partir de un conjunto {(xi, yi): i = 1, 2, 3, . . . , n} de observaciones de la variable aleatoria (X, Y ). Es fácil ver cómo puede lograrse. Se requiere estimar Var X, Var Y y Cov (X, Y ). Se usan los estimadores de máxima similitud de la varianza, es decir: n

Var X = ∑ ( X i − X )2 / n = S xx / n i =1 n

Var Y = ∑ (Yi − Y )2 / n = S yy / n i =1

En la estimación de Cov (X, Y ), advierta que: Cov ( X , Y ) = E[( X − µ X )(Y − µY )] Se estima Cov (X, Y ) al promediar productos análogos a los del miembro derecho de la ecuación precedente. Por lo tanto: n

Cov ( X , Y ) = ∑ ( X i − X )(Yi − Y )/ n = S xy / n i =1

Cuando se combinan esos estimadores, el estimador de ρ está dado por: Estimador para ρ, el coeficiente de correlación de Pearson

ρˆ = R =

S xy S xx S yy

Muchas calculadoras determinan automáticamente ρˆ . Si se cuenta con una de ellas, debe usarse en su cálculo. De no ser así, resulta útil la fórmula de cálculo siguiente: Fórmula de cálculo para r, el coeficiente de correlación de Pearson estimado

ρˆ = r =

nΣ x y − Σ x Σy 2

[ nΣ x − ( Σ x )2 ][ nΣy 2 − ( Σy )2 ]

Ejemplo 11.6.1. En un estudio del efecto del efluente de aguas negras en un lago, los investigadores miden la concentración de nitrato en el agua. Un antiguo método manual se ha utilizado para cuantificar

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

421

y 600 550 500 450

Automatizada

400 350 300 250 200 150 100 50 0

50

100 150 200 250 300 350 400 450 500 550 600 Manual

x

FIGURA 11.18 Diagrama de dispersión de mediciones manuales y automatizadas.

esa variable. Sin embargo, se diseñó un nuevo método automatizado. Si existe correlación positiva alta entre las mediciones tomadas con los dos métodos, se pondrá en uso habitual el automatizado. Se obtienen los datos siguientes sobre la concentración de nitrato, en microgramos de nitrato por litro de agua: x (manual)

25 40 120 75 150 300 270 400 450 575

y (automatizadas)

30 80 150 80 200 350 240 320 470 583

El diagrama de dispersión de los datos se muestra en la figura 11.18. Puesto que los puntos muestran una tendencia creciente razonablemente bien definida, se espera que r sea positiva, y su valor, cercano a 1. El resumen de las estadísticas para estos datos es:

422

PROBABILIDAD Y ESTADÍSTICA

Σ x 2 = 900 775 Σy = 2 503

n = 10 Σ x = 2 405 Sxx = 322 372.5

Σy 2 = 919 489 Σ xy = 902 475

Sxy = 300 503.5

S yy = 292 988.1 La correlación estimada de X con Y es:

ρˆ = r = =

Sxy Sxx S yy 300 503.5 (322 372.5)( 292 988.1)

0.978 Como se esperaba, parece haber una relación lineal positiva fuerte de X con Y.

Estimación de intervalos y pruebas de hipótesis sobre ρ Casi siempre es posible obtener un estimador puntual lógico de un parámetro θ únicamente sobre la base de su definición. Sin embargo, determinar intervalos de confianza o efectuar pruebas de hipótesis suele requerir algunos supuestos de la distribución de la variable aleatoria de estudio. Ello es válido en este caso. Se cuenta con un estimador puntual lógico de ρ. Obtener inferencias estadísticas acerca de su valor precisa suponer una distribución de probabilidad de la variable aleatoria bidimensional (X, Y ). La distribución supuesta es la distribución normal bidimensional. La densidad conjunta de esa variable aleatoria está dada por: Densidad normal bidimensional   2   1  x − µ X  − 2ρ x − µ X f ( x , y ) = k exp −   σ 2   2(1 − ρ )  σ X   X  1 donde k = −∞< x < ∞ 2πσX σ Y 1 − ρ 2

 y −µ Y   σ  Y

  y −µ Y  +  σ   Y

  2       

−∞< y < ∞ −∞ < µX < ∞ − ∞ < µY < ∞

σX >0 σY > 0 −1 < ρ < 1 Esta distribución tiene muchas propiedades teóricas interesantes. Entre ellas, se cuentan las siguientes: 1. Las distribuciones marginales de X y Y son normales. Los parámetros µX , µY , σX y σY que aparecen en la expresión de f (x, y) son las medias y desviaciones estándar de X y Y, respectivamente.

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

423

2. El parámetro ρ de la expresión de f (x, y) es el coeficiente de correlación de X con Y. 3. Si ρ = 0, entonces X y Y son independientes. 4. Las curvas de regresión de X sobre Y y de Y sobre X son lineales. La segunda de ellas está dada por:

σY ( x − µX ) σX Aunque no deben preocupar excesivamente esas propiedades teóricas, facilitan comprender la relación entre la correlación y la regresión. Al suponer que (X, Y ) tiene distribución normal bidimensional, se supone un modelo de regresión lineal. En otras palabras, se parte de que: µ Y x = β 0 + β1x µY | x = µY + ρ

donde β1 = (σY /σX)ρ. Puesto que σY y σX son positivas, puede verse fácilmente que la pendiente de la línea de regresión y el coeficiente de correlación tienen el mismo signo algebraico. También es fácil apreciar que ρ = 0 si y sólo si β1 = 0. Así pues, para poner a prueba H0: ρ = 0 contra una de las alternativas usuales, se usa la misma estadística de prueba aplicada anteriormente para probar que H0: β1 = 0, a saber, B1/( S / S xx ). Se tiene una estimación puntual de ρ al probar que H0: ρ = 0, por lo que es conveniente expresar la estadística de prueba en la forma alternativa: Estadística de prueba para H0: ρ = 0

Tn − 2 =

R n−2 1 − R2

(véase ejercicio 52). El uso de esta estadística se ilustra en el ejemplo siguiente. Ejemplo 11.6.2. En el ejemplo previo, se estima la correlación entre X, la medición manual de nitrato, e Y, su medición automatizada, con r = 0.978. Aunque la intuición sin duda lleva a suponer que se tienen datos claros de que ρ ≠ 0, debe recordarse que el tamaño muestral es pequeño con n = 10. Por ello, debe ponerse a prueba: H0 : ρ = 0 H1: ρ ≠ 0 El valor observado de la estadística de prueba:

Tn − 2 =

R n−2 1 − R2

es:

t=

0.978 10 − 2 1 − (0.978) 2

= 13.26

Con base en la distribución T8, es posible rechazar la hipótesis nula con P < 0.001 (t0.0005 = 5.041 y la prueba es de dos colas). Se tienen datos convincentes de que ρ ≠ 0.

424

PROBABILIDAD Y ESTADÍSTICA

La distribución exacta de R depende del valor real de ρ. Por añadidura, para valores grandes de ρ, esa distribución es definitivamente no normal. Por fortuna, existe un cambio sencillo de variable que lleva a una variable aleatoria cuya distribución es aproximadamente normal. En particular, puede demostrarse que cuando (X, Y ) tiene distribución normal bidimensional, entonces la variable aleatoria:

1 1 + R   ln  2  1 − R  tiene distribución aproximadamente normal, con:

1 1 + ρ  1  y σ2 = µ = ln  n−3 2  1 − ρ  Este resultado, publicado originalmente en 1921, se debe a R. A. Fisher. Al estandarizar, puede sacarse en conclusión que la variable aleatoria:

Z=

1 1 + R  1 1 + ρ    − ln  ln  2  1 − R  2  1 − ρ  1 n−3

es aproximadamente normal estándar. En el desarrollo de los límites de confianza de ρ, tome nota de que:   1 1 + R  1 1 + ρ    − ln  ln    2 1 − R  2 1 − ρ    P  − zα /2 ≤ ≤ zα /2  1     n−3

1−α

Aunque el argumento algebraico es un tanto confuso, puede despejarse ρ en esa desigualdad para obtener un intervalo de confianza de 100(1 – α)% para ρ: Intervalo de confianza para ρ, el coeficiente de correlación de Pearson Límite inferior =

(1 + R) − (1 − R)exp ( 2 zα /2 / n − 3 ) (1 + R) + (1 − R)exp ( 2 zα /2 / n − 3 )

Límite superior =

(1 + R) − (1 − R)exp (−2 zα /2 / n − 3 ) (1 + R) + (1 − R)exp (−2 zα /2 / n − 3 )

Considere la forma de evaluar esos límites en el ejemplo siguiente. Ejemplo 11.6.3. Se sabe que el valor de una estimación puntual para ρ, la correlación entre las mediciones manuales y automatizadas de nitrato, es 0.978. A fin de encontrar un intervalo de confianza de 95% para ρ, primero se toma nota de que z0.025 = 1.96 y n = 10. El límite inferior del intervalo de confianza es:

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

425

(1 + r ) − (1 − r ) exp ( 2 zα / 2 / n − 3 ) (1 + r ) + (1 − r ) exp ( 2 zα / 2 / n − 3 ) =

(1 + 0.978) − (1 − 0.978) exp ( 2(1.96) / 7 ) (1 + 0.978) + (1 − 0.978) exp ( 2(1.96) / 7 )

=

(1 + 0.978) − 0.022( 4.4) (1 + 0.978) + 0.022( 4.4)

=

1.881 2.075

0.907

Al sustituir, se encuentra que el límite superior es 0.995. Se tiene confianza de 95% de que el valor verdadero del coeficiente de correlación se ubica en el intervalo [0.907, 0.995]. Puesto que se rechaza H0: ρ = 0, no debe sorprender que 0 esté fuera del intervalo.

Aunque la hipótesis nula usual concerniente a ρ es H0: ρ = 0, pueden ponerse a prueba otros valores nulos con la transformación de Fisher. Si ρ0 denota cualquier valor nulo de ρ, puede verse que la estadística Z: Estadística de prueba para H0: ρ = ρ0

Z=

1  1 + R  1  1 + ρ0    − ln  ln  2  1 − R  2  1 − ρ0  1 n−3

sirve como estadística de prueba para H0: ρ = ρ0.

Coeficiente de determinación En sentido estricto, las técnicas de regresión lineal simple y de correlación no deben aplicarse al mismo conjunto de datos. La primera de ellas supone que X no es una variable aleatoria, mientras que la segunda requiere que lo sea. Pese a ello, R puede ser útil en un estudio de regresión. Como se demuestra en párrafos siguientes, es un indicador de la idoneidad del modelo de regresión lineal simple. A fin de apreciar la veracidad de esta afirmación, note que: SSE = Syy − B1Sxy

Dividir cada miembro de esta ecuación entre Syy y sustituir B1 con Sxy/Sxx permite ver que:

S xy2 SSE =1− Syy Sxx Syy Puesto que R = Sxy / S xx S yy , es factible llegar a la conclusión de que:

SSE = 1 − R2 Syy

426

PROBABILIDAD Y ESTADÍSTICA

Correlación Correlación Correlación Correlación Correlación Correlación negativa negativa negativa positiva positiva positiva fuerte moderada débil débil moderada fuerte a)

–0.9

–0.5

0

0.5

0.9

No relacionado Tendencia lineal débil b)

0

Tendencia lineal moderada

0.25

Tendencia lineal fuerte

0.81

FIGURA 11.19 a) Una interpretación sugerida de R; b) una interpretación sugerida de R2.

o que R2 = 1 – SSE/Sy y. La ecuación puede reescribirse como: R2 =

Syy − SSE Syy

Syy mide la variabilidad total en Y, y SSE, la variabilidad aleatoria en Y en torno a la línea de regresión estimada, de modo que con Syy – SSE mide la variabilidad en Y explicada con el modelo de regresión lineal. La variable aleatoria R2 es la proporción de la variabilidad en Y explicada por el modelo. Si se multiplica esa proporción por 100%, se obtiene la estadística llamada coeficiente de determinación. Cuando es cercana a 1 o −1, entonces R2 debe ser igualmente cercana a 1, con lo que se tiene un coeficiente de determinación cercano a 100%. Cuando R es cercana a cero, el coeficiente de determinación también lo es. Así pues, el tamaño relativo de R2 × 100% es una buena medida descriptiva de la idoneidad del modelo. Si bien no se cuenta con reglas absolutas para la interpretación de R y R2, son útiles las gráficas de la figura 11.19. Tenga en cuenta que la interpretación de esas estadísticas es algo que depende hasta cierto punto de la disciplina de que se trate. Un valor R2 de 50% podría considerarse muy alto en un entorno de ciencias sociales, donde los sujetos son seres humanos, y muy bajo en un experimento de ingeniería. La interpretación de R y R2 debe quedar a discreción del experto en el tema.

RESUMEN DEL CAPÍTULO En este capítulo, se consideran muchos de los aspectos importantes de la regresión lineal simple y la correlación. Se incluye una descripción verbal y matemática del modelo de regresión, junto con el método de mínimos cuadrados para estimar los parámetros de la pendiente e intersección de ese modelo. Se analiza que esos estimadores son insesgados bajo los supuestos mínimos. Al suponer que el error aleatorio Ei tiene distribución normal, se tiene la distribución de Y | xi, βˆ0 y βˆ1. Con esas propiedades de la distribución, se consideran métodos para probar hipótesis y estimar intervalos de confianza acerca de la pendiente β1 y la intersección β0. Se distingue minuciosamente entre la predicción de la respuesta media de la variable dependiente Y con un valor fijo de la variable independiente

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

427

x y la predicción de un valor único de la variable dependiente Y con el valor dado de x. Se consideran métodos para preparar estimaciones de intervalos en ambos casos y se observa que la predicción de la media lleva a un intervalo más angosto (más preciso) que con un valor único. Por último, en cuanto a la regresión, a partir de la observación de mediciones múltiples de la variable dependiente Y con valores dados de la variable independiente x, se considera un procedimiento que permite poner a prueba el modelo en cuanto a su carencia de ajuste lineal. Además de la regresión lineal simple, en el capítulo se estudia el coeficiente de correlación de Pearson. Se analizan métodos para estimar la correlación verdadera, poner a prueba hipótesis acerca de la correlación y estimar intervalos de confianza para el coeficiente de correlación ρ. Por último, se presentan y definen términos que el lector debe conocer, a saber: Regresión lineal Propiedades de mínimos cuadrados Variable dependiente Intersección de la regresión Error puro Error residual Correlación significativa Estudio de observación Estudio diseñado Diagrama de dispersión Residuo

Estimación de mínimos cuadrados Variable independiente Pendiente de la regresión Falta de ajuste Error experimental Correlación de Pearson Distribución normal bidimensional SSE Coeficiente de determinación Variable de respuesta Regresor Variable de predicción

EJERCICIOS Sección 11.1

1. Considere las observaciones siguientes de la variable independiente X y la variable dependiente Y: x 80 75 75 70 65 100 95 90 85

a) b) c) 2. En

y 5.0 4.7 4.5 3.2 2.0 6.5 6.0 5.5 5.2

x

y

100 115 110 105 105 100 130 125 120

6.7 4.2 5.5 6.4 6.8 7.2 2.0 2.9 3.8

Prepare el diagrama de dispersión de esos datos. ¿Parece razonable usar una regresión lineal para esos datos? Trace, a ojo, una línea de regresión lineal en el diagrama de dispersión del inciso a. relación con cada uno de los tres conjuntos de datos siguientes, elabore un diagrama de

428

PROBABILIDAD Y ESTADÍSTICA

dispersión y afirme subjetivamente si parece que una regresión lineal: i) coincide en forma satisfactoria con los datos; ii) coincide en forma moderada con ellos, o iii) coincide deficientemente con los datos. a) x

5

15

25

35

45

50

y

10

18

20

25

32

45

b) x

5

10

20

30

40

50

y

15

22

32

35

30

15

c) x

10

15

20

30

40

50

y

40

35

30

22

14

7

3. En esta sección, se presentan ecuaciones normales. Resuelva las ecuaciones normales para b0 y b1 y demuestre que su solución puede reescribirse en la forma dada como estimaciones de mínimos cuadrados de β0 y β1. 4. Considere un conjunto de datos arbitrario (x1, y1), (x2, y2), . . . , (xn, yn). Sean x y y las medias muestrales respectivas de la variable independiente X y la variable dependiente Y. En relación con la ecuación de regresión lineal estimada µˆ Y x = b0 + b1 x , demuestre que el punto ( x, y) siempre se sitúa en la línea de regresión estimada. 5. Verifique que Σei = 0. Sugerencia: Escriba ei como yi – (b0 + b1xi) y recuerde que b0 = y − b1x. 6. Estime β0 y β1 para cada conjunto de datos del ejercicio 2. Encuentre los residuos en cada caso y verifique que, más allá del error de redondeo, los residuos suman 0. 7. Se estudia la relación del consumo de energía eléctrica con el ingreso familiar y se obtienen los datos siguientes sobre el ingreso familiar X (en unidades de $1 000/año) y el consumo de energía Y (en 108 Btu/año):

Consumo de energía ( y)

Ingreso familiar (x)

1.8 3.0 4.8 5.0 6.5 7.0 9.0 9.1

20.0 30.5 40.0 55.1 60.3 74.9 88.4 95.2

a) Realice un diagrama de dispersión de los datos. b) Estime la ecuación de regresión lineal µY | x = β0 + β1x. c) Si x = 50 (ingreso familiar de $50 000), estime el consumo promedio de energía de las familias con ese ingreso. ¿Cuál sería su estimación para una sola familia? d ) ¿Cuánto esperaría que cambie el consumo si el ingreso familiar aumenta en $2 000/año

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

429

(dos unidades de $1 000)? e) ¿Cuánto esperaría que cambie el consumo si el ingreso familiar disminuye en $2 000/año? 8. Considere los datos del ejercicio 7. a) Escriba las ecuaciones normales para esos datos. b) Despeje b0 y b1 en las ecuaciones normales, además de verificar que esos resultados sean los mismos obtenidos en el inciso b del ejercicio 7. 9. Los conectores usados en computadoras se ven sometidos a esfuerzos multidimensionales simultáneos, como las temperaturas altas y esfuerzos mecánicos. Se realiza un estudio para identificar y cuantificar los esfuerzos de interfaz. Se emprenden experimentos para investigar la relación entre el paso y la longitud del conector, obteniendo los datos siguientes:

Longitud del conector, x (pulg)

Paso (mm)

0.150 0.100 0.098 0.079 0.050 0.040 0.039 0.032 0.020 0.016 0.010 0.005

3.81 2.54 2.50 2.00 1.27 1.02 1.00 0.80 0.50 0.40 0.25 0.13

Prepare un diagrama de dispersión de los datos. Estime la línea de regresión. Calcule los residuos y demuestre que, aparte del error de redondeo, su suma es 0. Estime el paso promedio de todos los conectores de 0.03 pulg de longitud. Estime el paso de un solo conector de 0.03 pulg de longitud. ¿En cuánto esperaría que cambie el paso si la longitud del conector aumenta en 0.1 y 0.05 pulg? g) ¿Sería razonable esperar que puede usarse la línea de regresión estimada para predecir satisfactoriamente el paso en relación con conectores de 0.175 pulg, 0.39 pulg y 1 pulg de longitud? Explique su respuesta. 10. Un tipo especial de cepillo eléctrico es una rueda de alambre en torno a un centro. Se usa para muchos fines, como el acabado de los cuadros de bicicletas de aluminio, el acabado mate en plástico y la eliminación de rebabas en engranes. Cuanto menor sea la longitud de los alambres y más gruesos éstos, tanto más intensa la acción de pulido. Se realiza un estudio para elaborar una gráfica que indique los usos recomendables de la rueda. Se emprenden dos pruebas con una rueda de 2 pulg de diámetro, y se obtienen los datos siguientes: a) b) c) d) e) f)

y (pies de superficie/minuto

430

PROBABILIDAD Y ESTADÍSTICA

x (rpm × 1 000)

cubiertas de la eliminación de rebabas)

1.0 1.5 1.75 2.5 3.0 4.0 6.0 10.0

525, 520, 527 785, 780, 790 915, 900, 922 1 300, 1 295, 1 310 1 575, 1 565, 1 582 2 100, 2 110, 2 090 3 125, 3 120, 3 133 5 250, 5 256, 5 245

a) Prepare un diagrama de dispersión de los datos. b) Estime la línea de regresión. c) Estime los pies de superficie por minuto que pueden cubrirse con una rueda de este tipo usada a 3 450 revoluciones por minuto (rpm). Sección 11.2

11. Verifique las propiedades de las sumas siguientes: n

a)

∑ ( xi − x ) = 0

i =1 n

n

b)

i =1

i =1

c)

 n  n n ∑ ( xi − x )(Yi − Y ) =  n∑ xiYi − ∑ xi ∑Yi  n . i =1 i =1 i =1   i =1

∑ ( xi − x )(Yi − Y ) = ∑ ( xi − x )Yi . n

d)

n

n

i =1

i =1

∑ ( xi − x )2 = ∑ ( xi − x )xi .

 n  n  2 n  2 2 ∑ ( xi − x ) = n∑ xi −  ∑ xi   n . e) i = 1  i = 1    i = 1 12. El estimador de la media verdadera de la variable dependiente Y está dado por µˆ Y x = B0 + B1 x. Demuestre que E (µˆ Y x ) = µY x y, por ende, que µˆ Y x es un estimador insesgado para µY x . 13. Es más bien difícil la demostración de que S 2 = SSE/(n − 2) es un estimador insesgado para σ 2. Los pasos de esa demostración son los siguientes: a) Demuestre que SSE = Syy − Sxx B12 . n

b) Demuestre que SSE = ∑Yi 2 − nY 2 − Sxx B12 . i =1 n

c) Demuestre que E[SSE] = ∑ E[Yi 2 ] − nE[Y 2 ] − Sxx E[ B12 ]. i =1

2

d ) Demuestre que E[Yi ] = Var Yi + ( E[Yi ])2

= σ 2 + ( β0 + β1 xi )2 E[Y 2 ] = Var Y + ( E[Y ])2 = σ 2/n + ( β0 + β1 x )2

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

431

E[ B12 ] = Var B1 + ( E[ B1 ])2 = σ 2/Sxx + β12 . e) Sustituya y simplifique para demostrar que E[SSE] = (n – 2)σ 2. f ) Demuestre que E[S 2] = σ 2. 14. Recuerde que los estimadores para los parámetros µY y β1 se denotan con Y y B1, respectivamente. Demuestre que Cov ( Y , B 1) = 0. Sugerencia: Se supone que Y i y Yj no están correlacionadas. Escriba Y y B 1 como combinaciones lineales de Yi (Y = Σin= 1aiYi y B1 = Σin= 1ciYi ).Tome nota de que ai = 1/n y ci = ( xi − x ) / Σin= 1 ( xi − x )2. 15. Suponga que se sabe que la ecuación de regresión verdadera es µY | x = 10 + 2.5x. Se ha visto que, bajo el supuesto de normalidad, el estimador de β1, que es B1, también tiene distribución n 2 2 normal, con media β1 y varianza σ / Σi = 1 ( xi − x ) . Asimismo, suponga que se sabe que Var B1 = 1.2. Calcule, en relación con una muestra de 25 observaciones, (xi, yi), la probabilidad de que la estimación de β1 tenga valor mayor de 3.5. Sección 11.3

En los problemas de flujo de producción en las fábricas, el rendimiento suele evaluarse con base en el tiempo de producción mínimo, que es el total transcurrido desde el inicio de la primera tarea en la primera máquina hasta que se completa la última tarea en la última máquina. En un flujo de trabajo específico, este parámetro se evalúa en relación con el número de tareas realizadas. Sea X una variable independiente que denota el número de tareas, y Y, la variable dependiente que denota el tiempo de producción (en unidades estandarizadas): Número de tareas (x)

4

5

6

7

8

9

Tiempo de producción ( y)

3.75

4.90

4.88

7.2

7.3

9.1

10

11

12

13

14

15

9.0

11.9

11.5

14.1

13.9

17.5

Aplique estos datos en los ejercicios 16-18. 16. a) Estime la ecuación de regresión lineal µY | x = β0 + β1x. b) Represente gráficamente la ecuación de regresión estimada. 17. Ponga a prueba una regresión lineal significativa al nivel de significación α = 0.05. 18. a) Calcule un intervalo de confianza de 95% para µY | x con x = x, y exprese verbalmente su respuesta. b) Calcule un intervalo de confianza de 95% para µY | x con x = 12 y exprese verbalmente su respuesta. c) ¿Cómo explicaría los diferentes anchos de los intervalos de los incisos a y b? Use los datos del ejercicio 7 en los ejercicios 19 a 22. 19. 20. 21. 22.

Pruebe H0: β0 = 2 al nivel de significación 0.01. Determine un intervalo de confianza de 95% para la intersección verdadera β0. Ponga a prueba la regresión lineal significativa, es decir, que H0: β1 = 0 con el nivel 0.05. a) Si x = 50, entonces estime Y, un solo valor de predicción de Y cuando x = 50. b) Calcule un intervalo de predicción de 95% de Y | x = 50 e interprete su respuesta.

432

PROBABILIDAD Y ESTADÍSTICA

Sea x el número de líneas de código ejecutable de SAS, y sea Y el tiempo de ejecución en segundos. Use la información de resumen siguiente para los ejercicios 23-28: 10

n = 10

10

10

∑ xi = 16.75

∑ xi2 = 28.64

∑ yi = 170

i =1

i =1

i =1

10

10

∑ yi2 = 2 898

∑ xi yi = 285.625

i =1

i =1

23. Estime y represente gráficamente la línea de regresión. 24. a) Estime Var Yi = σ 2. b) Estime la desviación estándar de B1. c) Estime la desviación estándar de B0. 25. Pruebe la hipótesis β1 = 0 al nivel 0.01 y exprese verbalmente su conclusión. 26. Pruebe la hipótesis β0 = 25 al nivel 0.05 y analice la conclusión en el contexto del problema. 27. Si se detecta regresión significativa, estime el tiempo promedio necesario para ejecutar un programa de SAS con 15 líneas de código ejecutable. 28. ¿Cuál es el significado matemático de que la regresión no sea significativa? ¿Puede pensar en alguna razón práctica, desde el punto de vista de cálculo, de que la regresión podría no ser significativa en este caso? 29. Los datos siguientes corresponden a la emisión de dióxido de carbono (CO2) de calderas alimentadas con carbón (en unidades de 1 000 ton) durante los años 1965-1977. La variable independiente (el año) se estandarizó para obtener la tabla siguiente: Año (x)

0

5

8

9

10

11

12

Emisión de CO2 ( y)

910

680

520

450

370

380

340

a) Estime la ecuación de regresión lineal µY|x = β0 + β1x. b) ¿Existe una tendencia lineal significativa en las emisiones de CO2 durante ese intervalo? En otras palabras, pruebe H0: β1 = 0 a un nivel de significación 0.01. c) ¿Sería aconsejable usar la línea de regresión estimada para calcular la emisión promedio de CO2 de las calderas alimentadas con carbón en el año 2000? Explique su respuesta. Los datos siguientes corresponden al peso conocido del óxido de calcio (CaO) en nueve muestras distintas y el peso correspondiente, determinados con un procedimiento químico estandarizado. El peso conocido recibe el tratamiento de variable independiente X. CaO presente (x)

3.0

7.0

11.5

15.0

19.0

CaO identificado ( y)

2.7

6.8

11.1

14.6

18.8

24.0

30.0

35.0

39.0

39.0

23.5

29.7

34.5

38.4

38.5

Use los datos para los ejercicios 30-32. 30. Determine la línea de regresión lineal usada para estimar µY | x, el peso promedio de CaO medido en un peso conocido x.

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

433

31. Calcule una estimación insesgada de la varianza de Y en torno a la línea de regresión lineal verdadera. 32. a) Si x = 15, estime µY | x. b) Calcule e interprete un intervalo de confianza de 90% para µY | x, con x = 15. 33. Se lleva a cabo un experimento para estudiar la relación de las concentraciones de estrona en la saliva y libres en el plasma. Se obtienen los datos siguientes: Sujeto

Estrona en saliva (x)

Estrona libre en el plasma ( y)

1 2 3 4 5 6 7 8 9 10

7.4 7.5 8.5 9.0 9.0 11.0 13.0 14.0 14.5 16.0

30.0 25.0 31.5 27.5 39.5 38.0 43.2 49.0 55.0 48.5

a) b) c) d)

Prepare un diagrama de dispersión de los datos. Estime la línea de regresión de Y sobre X. Si el valor de estrona es 12.1, prediga su concentración libre en plasma. Ponga a prueba una regresión lineal significativa al nivel 0.10.

Sección 11.4

En un estudio que aparece en Journal of Coatings Technology, vol. 55, 1983, se considera la capacidad para predecir el agrietamiento de la pintura de látex en superficies de madera expuestas, ello con base en pruebas de agrietamiento acelerado. Los datos siguientes son representativos de tasas de agrietamiento acelerado (x) y por exposición ( y): Tasa de agrietamiento acelerado (x)

Tasa de agrietamiento por exposición ( y)

2.0 2.0 3.0 3.0 4.0 4.0 5.0 5.0 6.0 6.0 7.0 7.0

1.9 2.3 2.7 3.9 3.0 4.2 3.1 4.8 4.8 6.7 5.1 6.4

Aplique estos datos en los ejercicios 34 y 35.

434

PROBABILIDAD Y ESTADÍSTICA

34. a) Prepare un diagrama de dispersión de los datos. b) Estime la línea de regresión de la tasa de agrietamiento por exposición pronosticada a partir de su similar de agrietamiento acelerado. c) Estime la tasa de agrietamiento por exposición promedio si la de agrietamiento acelerado es 4.5. 35. a) Ponga a prueba la falta de ajuste lineal a un nivel de significación 0.05. b) ¿Puede concluirse que una ecuación de regresión lineal coinciden adecuadamente con los datos? Muchas sustancias químicas se disuelven en agua con tasas distintas, que varían según la temperatura del agua misma. Este fenómeno se estudia en relación con un cierto compuesto, con los datos experimentales que aparecen a continuación. La variable dependiente y denota la cantidad (en g/L) de sustancias disueltas, y x, la temperatura del agua (en oC). x ( ºC) 0 10 20 30 40 50

y (g/L) 2.1, 2.8, 3.1 4.5, 4.8, 5.4 6.1, 8.2, 9.0 11.2, 12.0, 12.5 13.8, 15.2, 15.9 17.0, 18.1, 18.8

Use esos datos en los ejercicios 36-38. 36. Elabore un diagrama de dispersión. 37. a) Estime la regresión lineal verdadera µY | x = β0 + β1x. b) Estime µY | x si la temperatura del agua (x) es 35oC. 38. Pruebe la idoneidad de ajuste de la regresión lineal con el nivel de significancia 0.05. 39. Si la variable aleatoria Yi tiene distribución normal, con media µY y varianza σ 2, indique la distribución de la variable aleatoria: n

∑ (Yij − Yi )2/σ 2

i =1

Sugerencia: Consulte el teorema 8.1.1. 40. Demuestre que la variable aleatoria SSEpe/σ 2 tiene distribución ji cuadrada con n − k grados de libertad cuando la distribución de Yi es normal, con media µY y varianza σ 2. Sugerencia: Consulte el ejercicio 44 del capítulo 7. 41. Considere los datos del ejercicio 10. Pruebe la idoneidad de ajuste. Sección 11.5

42. Reconsidere el ejercicio 1. Aunque el diagrama de dispersión de los datos hace pensar que sería inapropiada la regresión lineal simple, es posible forzar una recta a través de los datos, con el método de mínimos cuadrados. a) Estime b0 y b1 para forzar una recta a través de los datos del ejercicio 1. b) Use la línea de regresión estimada para determinar yˆ i , con i = 1 a 18. c) Encuentre los 18 residuos de los datos y verifique que, aparte del error de redondeo, los residuos suman 0.

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

435

d ) Prepare una gráfica residual y advierta que no muestra el trazo ideal esperado cuando es apropiada la regresión lineal simple. e) ¿Puede proponer una ecuación que probablemente describiría la distribución de los datos primarios mucho mejor que la recta? f ) Bosqueje e interprete la gráfica de caja de los residuos. 43. Prepare gráficas residuales de cada uno de los conjuntos de datos del ejercicio 2 (los residuos se determinaron en el ejercicio 6). ¿Cuál de las gráficas, si acaso, hace pensar que no se satisfacen los supuestos de la regresión lineal simple? 44. Considere los residuos calculados en el ejercicio 9. a) Bosqueje e interprete la gráfica residual. b) Trace e interprete la gráfica de caja de los residuos. 45. En las primeras etapas del desarrollo de la tecnología electrónica, se usaban soldadores para ensamblar los componentes. En virtud de que se aplican en caliente, pueden originarse esfuerzos como el colgado, deformación y fatiga del metal. Se realiza un estudio del uso de amalgamas como alternativas de la soldadura. Una amalgama es una aleación de un metal líquido con un polvo, formada a temperatura ambiente. Se obtienen los datos siguientes sobre el tiempo de curación en minutos (x) y la dureza ( y) de una amalgama de galio, níquel y cobre:

x (tiempo de curación)

y (dureza en unidades de durómetro, D)

5 1 500 1 800 2 000 3 500 4 200 5 800

9, 9, 10 68, 70, 72 82, 80, 83 87, 86, 86 91, 90, 90 91, 91, 92 95, 96, 93

(Basado en información de “Amalgams for Improved Electronics Interconnection”, Colin A. MacKay, IEEE MICRO, abril de 1993, pp. 46-58.)

a) Prepare un diagrama de dispersión de los datos. b) Aunque la regresión lineal simple es inapropiada, fuerce una línea de regresión a través de los datos. Trace esa línea en el diagrama de dispersión. c) Estime visualmente cada residuo y prepare una gráfica residual aproximada. Analícela. d ) Si cuenta con SAS u otro software encuentre los valores exactos de los residuos y prepare una gráfica residual con la computadora. 46. En la figura 11.20, se muestran las gráficas residuales de diversos conjuntos de datos. En cada caso, identifique los supuestos del modelo que podrían haberse transgredido. Sección 11.6

Los plaguicidas que se usan en la producción de alimentos están presentes en productos para consumo humano. Se realiza un estudio sobre los pollos expuestos al malaoxón. Los pollos también son expuestos a un inductor de enzimas hepáticas, para determinar si tiene efecto en la destoxificación

436

PROBABILIDAD Y ESTADÍSTICA

0

0

a)

0

b)

0

c)

d)

FIGURA 11.20 Gráficas de residuos.

hepática del plaguicida. Se informa de los datos siguientes como porcentaje de destoxificación normal del plaguicida ( y) y porcentaje de valores normales de enzimas hepáticas (x): Nivel de enzima (x)

Nivel de destoxificación ( y)

95 110 118 124 145 140 185 190 205 222

108 126 102 121 118 155 158 178 159 184

Use esos datos en los ejercicios 47-50. 47. a) Trace un diagrama de dispersión de los datos. b) Estime ρ, el coeficiente de correlación entre X y Y. 48. Pruebe la hipótesis nula de que X no guarda correlación con Y al nivel 0.10. En otras palabras, pruebe que H0: ρ = 0. Analice su conclusión.

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

437

49. Calcule un intervalo de confianza de 90% para ρ. 50. Pruebe H0: ρ = 0.8 a un nivel de significación α = 0.05. 51. Se obtienen los datos siguientes de las variables aleatorias x, el porcentaje de cobre de una muestra, e y, su calificación de dureza de Rockwell: x

y

0.01 0.03 0.01 0.02 0.10 0.08 0.12 0.15 0.10 0.11

58.0 66.0 55.0 63.2 58.3 57.9 69.3 70.1 65.2 62.3

a) Prepare un diagrama de dispersión de los datos. b) Calcule una estimación puntual para ρ. c) Determine un intervalo de confianza de 95% de ρ y discuta su conclusión. 52. Demuestre que B1 /( S / S xx ) = R n − 2 / 1 − R2 . Sugerencia: Use el hecho de que B = S xy / S xx y

53. 54. 55. 56. 57. 58. 59.

R = S xy / S xx S yy para comprobar que B1 /( S / S xx ) = S yy R / S . Luego, aproveche que SSE = Syy – B1Sxy y S 2 = SSE/(n – 2). Demuestre que si la variable aleatoria (X, Y ) tiene distribución normal bidimensional, con ρ = 0, entonces X y Y son independientes. ¿Que el coeficiente de correlación sea 0 implica siempre que X y Y son independientes? Demuestre que si la variable aleatoria (X, Y ) tiene distribución normal bidimensional, entonces el punto (µX , µY) se sitúa sobre la línea de regresión verdadera de Y sobre X. Calcule e interprete el coeficiente de determinación de los conjuntos de datos del ejercicio 2. Encuentre e interprete el coeficiente de determinación de los datos del ejercicio 7. Calcule e interprete el coeficiente de determinación de los datos del ejercicio 10. Descubra e interprete el coeficiente de determinación de los datos del ejercicio 1.

EJERCICIOS DE REPASO

Investigadores de un centro de gráficas interactivas diseñan un experimento para estudiar el rendimiento de los operadores en función de la jornada laboral. La variable independiente (que fijan los experimentadores) es la duración de la jornada laboral (en horas, h), y la variable dependiente, el número de comandos o instrucciones por hora. Se emplea a 15 operadores con capacitación comparable y se selecciona aleatoriamente a tres para que trabajen con cada una de las cinco duraciones de la jornada laboral que se utilizan en el experimento. El estudio arroja los datos siguientes:

438

PROBABILIDAD Y ESTADÍSTICA

Duración de la jornada, x (h)

Número de comandos, y

1 2 3 4 5

136, 143, 139 165, 169, 173 168, 173, 176 170, 169, 176 165, 170, 172

Use estos datos en los ejercicios 60 y 61. 60. a) Prepare una gráfica de los datos. b) Estime y represente gráficamente la curva de regresión µY | x = β0 + β1x. 61. a) Pruebe la falta de ajuste lineal de los datos a un nivel de significación 5%. ¿Coincide adecuadamente la curva de regresión lineal con los datos? b) ¿Parecen concordar la gráfica del ejercicio 60 y la prueba de falta de ajuste lineal de este ejercicio? Los datos siguientes corresponden a la temperatura de gas combustible (en oF) y la tasa de calor unitario (en Btu/kWh) de una turbina de combustión usada para la gasificación del carbón: Temperatura del gas, ο F (x)

Calor, y (en 100 unidades Btu/kWh)

100 150 200 250 300 350 400 450 500

99.1 98.5 98.2 98.0 97.8 97.6 97.5 97.0 96.8

( y)

Use estos datos para los ejercicios 62-66. 62. Estime la curva de regresión µY | x = β0 + β1x. 63. Ponga a prueba H0: β1 = 0 contra H1: β1 < 0. Use α = 0.05. 64. Estime el coeficiente de determinación como medida de la bondad de ajuste de la curva de regresión lineal. 65. Calcule un intervalo de confianza de 90% para β0 y analice los resultados en el contexto de los datos. 66. Determine un intervalo de confianza de 95% para β1 y analice los resultados en el contexto de los datos. Una ingeniero tiene interés en estudiar la recuperación de calor que normalmente se pierde en el entorno como gases de la emisión de hornos. Diseña su experimento a modo de fijar la velocidad de flujo por los tubos térmicos (en m/s) y luego medir la tasa de recuperación. El estudio arroja los datos siguientes:

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Velocidad de flujo, m/s (x) 1 1.5 2 2.5 3 3.5 4 4.5 5

439

Tasa de recuperación ( y) 0.740 0.745 0.718 0.678 0.652 0.627 0.607 0.507 0.545

Aplique estos datos en los ejercicios 67-69. 67. Estime la curva de regresión µY | x = β0 + β1x. 68. Ponga a prueba la regresión significativa al nivel 0.05. 69. a) Si la velocidad de flujo se fija en 3.25 m/s, prediga µY | x = 3.25 y Y | x = 3.25. b) Calcule e interprete el intervalo de confianza de 95% para µY | x = 3.25. c) Calcule e interprete el intervalo de confianza de 95% para Y | x = 3.25. d ) ¿Cómo explica las diferentes amplitudes de los intervalos calculados en los dos incisos precedentes? En el estudio del efecto de la calidad del aire en un lago, el experimentador toma observaciones del pH del agua y la calidad del aire, medida esta última con un índice de calidad del aire. Dicho índice va de 0 a 100, donde los números crecientes indican contaminación cada vez mayor. Se obtienen los datos siguientes: pH (x)

4.5

4.1

4.8

4.0

5.0

6.0

3.5

4.9

3.2

6.1

Calidad del aire ( y)

40

50

30

60

20

10

70

30

85

15

Aplique estos datos en los ejercicios 70-72. 70. a) Represente gráficamente los datos en el plano xy. b) Estime el coeficiente de correlación ρ. 71. Ponga a prueba la correlación negativa significativa al nivel de significación 0.05. 72. Calcule e interprete el intervalo de confianza de 90% para ρ. 73. Suponga que un conjunto de 10 pares de datos (x, y) genera una correlación estimada r = 0.3. a) Indique el valor P mínimo aproximado para probar H0: ρ = 0 contra H1: ρ ≠ 0. b) Suponga de nuevo que r = 0.3, en este caso con n = 50 observaciones. ¿Cuál es el valor P mínimo aproximado para probar las mismas hipótesis del inciso anterior? ¿Cómo explica la diferencia de los valores de P en los incisos a y b? 74. a) ¿Qué relación guarda el tamaño (valor absoluto) del coeficiente de correlación con la pendiente de la línea de regresión lineal de Y sobre X ? b) ¿Qué relación guarda el tamaño (valor absoluto) del coeficiente de correlación con la cercanía de los puntos a la línea de regresión lineal de Y sobre x? 75. Los tiempos de procesamiento en fábricas que incluyen operadores semiautomáticos o manuales pueden considerarse como variables aleatorias. Un investigador decide estudiar la correlación del tiempo de producción (el que transcurre hasta que se completa la última tarea en la

440

PROBABILIDAD Y ESTADÍSTICA

última máquina) de dos sistemas distintos. El estudio arroja las observaciones bidimensionales siguientes de una selección aleatoria de 10 conjuntos de tareas: Tarea

Sistema 1 (x)

Sistema 2 ( y)

1 2 3 4 5 6 7 8 9 10

4.1 5.0 4.9 5.3 13.5 12.0 19.2 10.0 24.1 6.9

3.9 5.1 5.0 4.9 13.3 13.2 21.3 9.1 23.0 8.1

a) Estime el coeficiente de correlación de Pearson. b) Calcule un intervalo de confianza de 95% para la correlación verdadera ρ. c) Pruebe una correlación significativa al nivel 0.05. ¿Tienden a coincidir los resultados de los dos incisos precedentes? d ) Calcule el coeficiente de determinación. Explique su significado. 76. Se sabe que el dióxido de carbono tiene efecto crítico en la proliferación de los microorganismos. Pequeñas cantidades de dicha sustancia estimulan la proliferación en numerosas especies, mientras que las concentraciones altas la inhiben en muchas otras. Este último efecto se usa comercialmente en el almacenamiento de productos perecederos. Se realiza un estudio para investigar el efecto del CO2 en la tasa de proliferación de Pseudomonas fragi, una bacteria que degrada alimentos. El dióxido se administra a cinco presiones atmosféricas distintas. Se toma nota de la respuesta en el cambio porcentual de la masa celular después de una hora de proliferación. Se usan 10 cultivos con cada nivel. Los datos resultantes son los siguientes: Nivel del factor (presión de CO2 en atmósferas) 0.0

0.083

0.29

0.50

62.6 59.6 64.5 59.3 58.6 64.6 50.9 56.2 52.3 62.8

50.9 44.3 47.5 49.5 48.5 50.4 35.2 49.9 42.6 41.6

45.5 41.1 29.8 38.3 40.2 38.5 30.2 27.0 40.0 33.9

29.5 22.8 19.2 20.6 29.2 24.1 22.6 32.7 24.4 29.6

0.86 24.9 17.2 7.8 10.5 17.8 22.1 22.6 16.8 15.9 8.8

Prepare un estudio de regresión y elabore un informe en el que resuma los resultados de todas las pruebas y las herramientas gráficas que usó en el análisis. 77. A continuación, se muestran los valores de predicción y los residuos correspondientes al ejemplo 11.4.1. Prepare una gráfica residual y analice sus consecuencias. ¿La gráfica lleva a la misma conclusión que la prueba formal aplicada en el ejemplo?

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

X

Y

Predicción

Residuo

30 30 30 40 40 40 50 50 50 60 60 60 70 70 70

13.7 14.0 14.6 15.5 16.0 17.0 18.5 20.0 21.1 17.7 18.1 18.5 15.0 15.6 16.5

15.7600 15.7600 15.7600 16.2733 16.2733 16.2733 16.7867 16.7867 16.7867 17.3000 17.3000 17.3000 17.8133 17.8133 17.8133

–2.06000 –1.76000 –1.16000 –0.77333 –0.27333 0.72667 1.71333 3.21333 4.31333 0.40000 0.80000 1.20000 –2.81333 –2.21333 –1.31333

441

78. Se estudia el efecto del tipo de ácido y el pH en la pérdida de peso en árboles de cedro rojo. Se usa ácido sulfúrico con valores de pH 2.0, 2.5, 3.0, 3.5 y 4.0, con agua destilada (pH 5.6) como control. Se recurre a una cámara de intemperización acelerada durante 200 h en total. Se obtienen y pesan cortes de cedro rojo de tamaño idéntico. Luego, cada uno se sumerge durante una hora en la solución de ácido y después se coloca en la cámara por espacio de 25 h. Este proceso se repite hasta que el tiempo de uso de la cámara totalice 200 h, momento en el que se determina el peso final. Se tienen los datos siguientes: Observación

pH

Peso inicial

Peso final

Reducción de peso

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

2.0 2.0 2.0 2.5 2.5 2.5 3.0 3.0 3.0 3.5 3.5 3.5 4.0 4.0 4.0 5.6 5.6 5.6

696 696 694 699 696 692 697 698 698 699 698 699 698 698 698 698 698 696

661 664 664 668 668 666 673 675 674 677 678 674 677 678 673 677 678 672

35 32 30 31 28 26 24 23 24 22 20 25 21 20 25 21 20 24

a) Prepare una gráfica del pH contra la reducción de peso. ¿Qué indica en cuanto a las concentraciones de ácido sulfúrico y su efecto en la disminución de peso del cedro rojo?

442

PROBABILIDAD Y ESTADÍSTICA

b) Calcule el coeficiente de correlación de Pearson del pH contra la reducción de peso. c) Ponga a prueba una correlación significativa a un nivel de significación α = 0.05. d ) Calcule un intervalo de confianza de 95% del valor verdadero de la correlación ρ. Un ingeniero eléctrico tiene interés en predecir la demanda de electricidad en relación con la temperatura del día. Ello permitiría que la compañía adquiera y transfiera electricidad con base en las predicciones climatológicas de corto plazo y, de tal suerte, se reduzcan o eviten los cortes de energía (apagones). Se prepara una escala de demanda de 0 a 10, donde 0 indica demanda muy baja, y 10, demanda máxima. Se obtiene una muestra aleatoria de 40 días de los 365 del año, la cual arroja los datos siguientes: Observación 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Temperatura 30 11 97 41 53 105 68 1 48 106 98 33 10 63 50 2 45 59 7 96

Demanda

Observación

2.9 5.1 4.0 2.0 1.6 4.5 0.3 8.0 0.6 5.6 3.3 2.6 5.2 0.9 1.3 7.1 1.4 0.6 6.3 3.5

21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

Temperatura 67 33 81 101 84 36 98 79 98 3 86 34 108 14 89 53 55 15 87 87

Demanda 1.4 3.1 1.9 3.5 1.5 1.2 3.1 1.0 3.6 7.8 2.7 2.2 4.5 4.9 2.9 1.3 0.7 4.7 2.2 1.9

Aplique esos datos en los ejercicios 79-81. 79. a) Prepare una gráfica de los datos de la variable independiente (temperatura) contra la variable de respuesta (demanda). ¿Piensa que una línea de regresión lineal simple predice satisfactoriamente la demanda en este caso? ¿Por qué sí o no? b) Elabore dos gráficas por separado, en las que use sólo valores de temperatura de 60o o menos en una gráfica y de más de 60º en la otra. ¿Piensa que funcionaría satisfactoriamente usar líneas de regresión separadas para predecir la demanda? c) ¿Se le ocurre algún otro modelo de estos datos para predecir la demanda? Analice posibles opciones. 80. a) Estime la línea de regresión lineal de temperaturas menores o iguales que 60o. b) Ponga a prueba una regresión lineal significativa a un nivel de significación α = 0.05. c) Use la ecuación de regresión del párrafo a para predecir la “demanda” con temperatura de 15º. d ) Calcule un intervalo de confianza de 95% de la “demanda” promedio cuando la temperatura es de 15o. 81. Repita los cálculos de los incisos a-d del ejercicio 80 con temperaturas mayores de 60o. También prediga la demanda y calcule el intervalo de confianza con temperatura de 90o.

486

PROBABILIDAD Y ESTADÍSTICA

regresor y la respuesta. A continuación, se describen las tres estadísticas de uso actual para elaborar tales juicios. Advierta que pueden intentarse los otros modelos si no se identifica una combinación lineal satisfactoria de regresores.

Método de R2 máxima En el procedimiento de R2 máxima, se selecciona en cada paso j, j = 1, 2, 3, . . . , k, el conjunto de j variables con el que se tiene el valor más alto de R2. Aunque R2 siempre aumenta conforme se añaden más variables, el error cuadrático medio suele disminuir inicialmente y luego incrementarse a medida que se seleccionen variables adicionales. Es habitual que el experimentador elija el modelo correspondiente al valor más bajo del error cuadrático medio.

Estadística Ck de Mallow La estadística Ck de Mallow se basa en el error total de la estimación esperado y normalizado, que está dado por:

Γk =

n  E  ∑[Yi − E (Yi )]2  i =1 

σ

2

=

SSE + 2( k − 1) − n σ2

donde k + 1 es el número total de parámetros del modelo, incluyendo la intersección β0. Después de sustituir σ 2 con el estimador S 2, se observa que la estadística Ck es:

Ck =

SSE + 2( k − 1) − n S2

Que el valor de Ck sea cercano a k + 1 hace pensar que el sesgo del modelo es pequeño. En otras palabras, no existe ajuste excesivo o insuficiente del modelo con magnitud significativa. En general, son recomendables los valores de Ck cercanos a k + 1 o inferiores a dicha suma.

Estadística de la suma de los cuadrados de predicción Un procedimiento hasta cierto punto distinto para la selección del modelo se basa en la estadística de la suma de los cuadrados de predicción o estadística PRESS (por su nombre en inglés, prediction sum of squares), que propuso D. M. Allen. Se usa principalmente para seleccionar un modelo con fines de predicción. Es hasta cierto punto desconcertante darse cuenta que en el contexto de regresión usual se usa cada observación para desarrollar una ecuación con la que pueda predecirse el valor de la observación. Por ejemplo, ¡se utiliza la información sobre el rendimiento de combustible de un automóvil con peso de 1.6 ton que se conduce en un día con temperatura ambiental de 50°F para generar una ecuación que prediga el rendimiento de combustible (millaje) de un automóvil con peso de 1.6 ton que se conduce en un día con temperatura de 50°F! Esa situación se evita con la estadística en cuestión. En el caso de un modelo especificado, la estadística PRESS se forma al predecir cada observación con base en un modelo desarrollado mediante el uso de las demás observaciones. En pocas palabras, la estadística se forma como sigue:

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

487

1. Se usan todos los puntos de datos, excepto el primero, para el modelo. El valor de la primera observación, y1, se predice a partir del modelo creado. Se determina el residuo PRESS y1 − yˆ1 . 2. Se usan todos los puntos de datos, salvo el segundo, para ajustar el modelo. El valor de la segunda observación, y2, se predice con base en el nuevo modelo ajustado. Se forma el residuo y2 − yˆ 2 . 3. El proceso continúa hasta que se haya pronosticado cada observación a partir de las demás y se haya calculado el residuo PRESS. 4. La estadística PRESS se define como la suma de los cuadrados de los residuos PRESS, es decir, Σin= 1 ( yi − yˆ i )2 .Se elige el modelo con valor bajo de la estadística. Es evidente que evaluar la estadística de la suma de los cuadrados de predicción de tal manera entraña cálculos abundantes. Por fortuna, se cuenta con un método breve y la estadística puede determinarse con el software SAS. El modelo ideal de predicción tiene valor bajo de la estadística PRESS, de la estadística Ck y del error cuadrático medio, así como valor grande de R2. Es mucho pedir que un modelo posea todas esas propiedades, de modo que el experimentador debe usar su juicio para seleccionar el modelo óptimo. Aunque todos esos criterios son útiles, en caso de verse forzados a jerarquizarlos en orden de importancia habría que basarse en la estadística PRESS, la Ck y el error cuadrático medio, en ese orden. En los dos ejemplos siguientes, se ilustran esos criterios respecto de dos conjuntos de datos. El primero de esos conjuntos es inusual, en el sentido de que cada uno de los criterios mencionados apunta al mismo modelo. El segundo conjunto obliga a ciertos juicios de valor en la selección del modelo. Ejemplo 12.7.4. Se sabe que es posible modificar la toxicidad de diversos tipos de medicamentos, plaguicidas y carcinógenos químicos en mamíferos con la inducción de la actividad de enzimas hepáticas. Un estudio en el que se investiga este tipo de fenómenos en pollos es el de M. Ehrich, C. Larson y J. Arnold, “Organophosphate Detoxification Related by Induced Hepatic Microsomal Enzymes in Chicken”, American Journal of Veterinary Research, vol. 45, 1983. En él, se usa el análisis de regresión para estudiar la relación entre la actividad enzimática inducida y la destoxificación del insecticida malatión. El inductor de enzimas usado es el hidroxitolueno butilado (BHT). Cada número representa el porcentaje de actividad relativo a un control, que es un pollo no tratado. Se miden cinco actividades enzimáticas, que sirven como variables de predicción. Los datos recopilados se muestran en la tabla 12.1; el valor de las estadísticas R2 y Ck de todos los modelos posibles, en la tabla 12.2, y los coeficientes de regresión estimados, el error cuadrático medio (ECM) y la estadística PRESS de cada modelo, en la tabla 12.3. A partir de esta última, puede verse que el modelo estimado con inclusión de todas las variables independientes:

µˆY | x1 , x2 , x3 , x4 , x5 = 54.079 + 0.097 x1 + 0.034 x2 + 0.522 x3 − 2.655x 4 + 2.559 x5 tiene los valores más bajos del error cuadrático medio (54.00) y de la estadística PRESS (1 995.1). En la tabla 12.2, se observa que el mismo modelo lleva a los valores máximo de R2 (0.976) y mínimo de Ck (6.00). Así pues, todos los criterios apuntan al mismo modelo, a saber, el que contiene las cinco variables de predicción.

La situación recién analizada hace que el experimentador tenga mucha confianza en el modelo seleccionado. Desgraciadamente, es inusual una situación tan clara. Otra más característica se describe en el ejemplo siguiente.

TABLA 12.1 488 PROBABILIDAD Y ESTADÍSTICA

Datos en bruto de BHT Destoxificación, y (%) 146.104 152.597 168.831 178.571 191.558 113.636 188.312 94.156 159.091 142.857

Enzima 1, x1

Enzima 2, x2

Enzima 3, x3

Enzima 4, x4

Enzima 5, x5

348.475 233.220 287.458 152.542 276.271 78.644 196.949 101.695 194.576 325.424

337.500 260.417 273.958 310.417 818.750 156.250 260.417 112.500 280.208 326.042

108.122 82.234 74.619 86.802 122.843 112.690 79.188 127.919 239.594 173.096

106.667 80.000 66.667 73.333 86.667 93.333 80.000 93.333 106.667 113.333

107.692 88.889 87.179 96.581 97.436 94.872 106.838 80.342 91.453 100.000

TABLA 12.2

Valores de R2 y Ck Número de variables en el modelo

R2

Ck

1 1 1 1 1

0.037 0.180 0.186 0.222 0.408

151.5 128.2 127.2 121.3 90.9

x3 x4 x1 x5 x2

2 2 2 2 2 2 2 2 2 2

0.219 0.227 0.244 0.283 0.425 0.455 0.467 0.488 0.543 0.574

123.7 122.5 119.6 113.3 90.0 85.1 83.1 79.8 70.8 65.8

x3, x4 x1, x3 x3, x5 x1, x5 x1, x2 x2, x3 x1, x4 x2, x5 x4, x5 x2, x4

3 3 3 3 3 3 3 3 3 3

0.311 0.473 0.489 0.523 0.575 0.594 0.636 0.642 0.746 0.833

110.7 84.2 81.6 76.0 67.5 64.5 57.5 56.6 39.5 25.3

x1, x3, x5 x1, x2, x3 x1, x2, x5 x2, x3, x5 x1, x3, x4 x2, x3, x4 x1, x2, x4 x1, x4, x5 x2, x4, x5 x3, x4, x5

4 4 4 4 4

0.525 0.691 0.764 0.927 0.948

77.7 50.6 38.7 12.0 8.5

5

0.976*

488

6.0*

Variables en el modelo

x1, x2, x3, x5 x1, x2, x3, x4 x1, x2, x4, x5 x2, x3, x4, x5 x1, x3, x4, x5 x1, x2, x3, x4, x5

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

489

TABLA 12.3

Modelos estimados, en orden creciente de valor de la estadística PRESS βˆ 0

βˆ1

βˆ 2

54.079 49.802 16.103 37.316 43.403 75.416 230.841 211.303 242.091 153.571 250.583 121.140 10.343 167.842 11.771 66.588 5.672 135.775 120.779 21.783 30.820 195.577 136.482 210.467 78.197 42.773 193.349 218.604 113.148 24.291 128.842 46.104

0.097 0.131 0.000 0.000 0.000 0.122 0.000 0.188 0.215 0.000 0.000 0.148 0.000 0.000 0.094 0.000 0.000 0.149 0.000 0.000 0.099 0.000 0.000 0.000 0.057 0.000 0.102 0.135 0.052 0.015 0.053 0.019

0.034 0.000 0.000 0.056 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.078 0.000 0.000 0.105 0.089 0.000 0.103 0.106 0.101 0.067 0.091 0.078 0.067 0.092 0.086 0.094 0.088

βˆ 3 0.522 0.588 0.578 0.472 0.000 0.000 0.000 0.000 0.317 0.000 0.187 0.000 0.000 −0.118 0.000 0.000 −0.092 −0.124 0.000 0.000 −0.103 0.000 −0.134 0.134 0.000 −0.116 0.000 0.233 0.000 0.000 −0.134 −0.117

βˆ 4

βˆ 5

ECM

PRESS

−2.655 −2.910 −2.782 −2.422 −1.187 −1.265 −0.859 −1.100 −1.934 0.000 −1.328 0.000 0.000 0.000 0.000 −1.074 0.000 0.000 0.000 0.000 0.000 −0.825 0.000 −1.163 −1.126 0.000 −0.965 −1.597 0.000 0.000 0.000 0.000

2.559 2.795 3.351 2.731 2.281 1.738 0.000 0.000 0.000 0.000 0.000 0.000 1.723 0.000 1.273 1.671 1.672 0.000 0.000 1.092 1.193 0.000 0.000 0.000 1.505 1.010 0.000 0.000 0.000 1.040 0.000 0.945

54.00* 91.70 245.39 129.78 577.35 527.31 905.74 672.15 625.16 981.64 985.45 899.15 859.23 1 063.05 905.29 373.64 953.55 975.73 654.19 646.50 1 014.61 538.23 687.35 598.37 417.61 702.12 535.74 546.09 725.29 752.37 775.61 839.08

1 995.1* 2 003.6 3 053.4 6 343.8 7 602.9 8 306.2 9 509.2 9 576.4 10 003.4 10 907.1 11 001.3 12 000.0 12 051.7 14 569.6 15 311.3 16 149.6 17 375.7 18 271.4 20 911.9 21 241.3 21 852.7 23 842.5 28 098.8 30 378.6 30 380.0 30 904.6 41 406.9 41 871.2 49 496.5 53 154.6 60 113.7 68 821.9

Ejemplo 12.7.5. Se emprende un análisis similar al descrito en el ejemplo previo, respecto del inductor enzimático 3-metilcolantreno (3-MC). El conjunto de datos completo aparece en la tabla 12.4, mientras que los valores de R2, Ck, los parámetros del modelo estimado, el error cuadrático medio y la estadística PRESS se muestran en las tablas 12.5 y 12.6. En siguiente término, procede ver cuáles modelos sugieren los diversos criterios. En la tabla 12.5, se observa que, como se esperaba, el modelo de cinco variables tiene el valor máximo de R2. El valor mínimo de Ck es 1.4 y corresponde al modelo que incluye sólo las variables x1 y x2. En la tabla 12.6, se aprecia que el error cuadrático medio más bajo guarda relación con el modelo que contiene las variables de predicción x1, x2 y x3. La estadística PRESS más pequeña corresponde al modelo con las variables x1, x4 y x5. En resumen, los criterios apuntan hacia los modelos siguientes:

TABLA 12.4 490 PROBABILIDAD Y ESTADÍSTICA

Datos en bruto de 3-MC Destoxificación, y (%) 56.250 75.000 115.625 68.750 96.875 168.750 84.375 171.875 109.375 103.125

Enzima 1, x1

Enzima 2, x2

Enzima 3, x3

Enzima 4, x4

Enzima 5, x5

106.329 144.726 136.287 154.430 385.232 583.544 489.451 445.992 270.886 163.291

90.756 203.361 672.269 183.193 140.336 146.218 184.874 537.815 309.244 190.756

94.650 131.687 123.457 113.169 117.284 152.263 121.399 150.206 185.185 139.918

162.791 255.814 191.860 133.721 174.419 273.256 255.814 552.326 534.884 360.465

114.737 112.632 153.684 116.842 87.368 94.737 95.789 113.684 108.421 106.316

TABLA 12.5

Valores de R2 y Ck Número de variables en el modelo

R2

Ck

1 1 1 1 1

0.003 0.219 0.347 0.379 0.448

13.2 9.0 6.6 6.0 4.6

2 2 2 2 2 2 2 2 2 2

0.347 0.380 0.396 0.421 0.478 0.593 0.612 0.616 0.647 0.719

8.6 8.0 7.6 7.2 6.1 3.8 3.5 3.4 2.8 1.4*

x4, x5 x3, x5 x3, x4 x2, x4 x2, x3 x2, x5 x1, x3 x1, x4 x1, x5 x1, x2

3 3 3 3 3 3 3 3 3 3

0.397 0.481 0.603 0.630 0.642 0.720 0.765 0.776 0.779 0.783

9.6 8.0 5.7 5.1 4.9 3.4 2.5 2.3 2.3 2.2

x3, x4, x5 x2, x3, x4 x2, x4, x5 x1, x3, x4 x2, x3, x5 x1, x2, x5 x1, x2, x4 x1, x3, x5 x1, x4, x5 x1, x2, x3

4 4 4 4 4

0.652 0.780 0.784 0.788 0.790

6.7 4.2 4.2 4.1 4.1

x2, x3, x4, x5 x1, x2, x4, x5 x1, x2, x3, x4 x1, x2, x3, x5 x1, x3, x4, x5

5

0.793*

6.0

x1, x2, x3, x4, x5

490

Variables en el modelo x5 x2 x4 x3 x1

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

491

TABLA 12.6

Modelos estimados, en orden creciente del error cuadrático medio PRESS βˆ 0 −16.46 −101.92 −150.64 22.34 30.64 −127.82 −71.20 −12.76 −79.07 54.13 −94.18 −89.57 37.34 −17.19 261.15 169.28 6.73 230.98 61.67 167.11 −21.21 −21.27 60.25 52.40 2.34 −12.36 −29.07 59.36 79.36 −4.57 105.00 117.81

βˆ1

βˆ 2

βˆ 3

βˆ 4

0.135 0.195 0.190 0.141 0.159 0.189 0.158 0.135 0.185 0.147 0.227 0.171 0.122 0.116 0.000 0.000 0.116 0.000 0.150 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.090 0.000 0.000 0.087 0.107 0.000 0.057 0.089 0.018 0.122 0.000 0.033 0.000 0.000 0.239 0.192 0.000 0.211 0.000 0.211 0.067 0.000 0.000 0.060 0.000 0.064 0.000 0.000 0.096 0.000 0.000 0.000

0.441 0.000 0.595 0.000 0.000 0.307 0.493 0.395 0.000 0.000 0.000 0.338 0.000 0.668 0.000 0.416 0.346 0.000 0.000 0.639 0.815 0.950 0.000 0.000 0.633 0.702 0.956 0.000 0.000 0.640 0.000 0.000

0.000 0.100 0.000 0.065 0.000 0.058 0.000 0.010 0.093 0.000 0.000 0.040 0.112 0.000 0.000 0.000 0.065 0.035 0.000 −0.055 0.000 0.000 0.155 0.127 0.064 0.024 0.000 0.155 0.000 0.064 0.000 0.000

Criterio Valor máximo de R2 Ck ECM PRESS

βˆ 5 0.000 1.103 1.104 0.000 0.000 1.093 0.451 0.000 0.897 −0.215 1.211 0.724 0.000 0.000 −1.989 −1.545 0.000 −1.742 0.000 −1.694 0.000 0.000 0.000 0.000 0.000 0.000 0.063 0.008 0.000 0.055 0.000 −0.116

ECM 497.09* 507.00 514.42 537.89 552.80 578.10 583.15 595.42 606.00 641.93 693.16 713.42 754.37 761.60 799.87 821.08 847.91 910.08 948.16 956.45 1 024.92 1 067.65 1 122.04 1 137.67 1 186.27 1 190.57 1 218.50 1 282.30 1 341.90 1 382.52 1 528.21 1 714.26

PRESS 11 015.6 7 758.1* 10 557.8 9 097.3 8 855.7 17 167.8 20 719.5 19 444.9 16 131.7 16 905.5 10 013.5 30 456.1 12 085.2 15 478.5 8 877.2 15 271.4 27 762.1 11 644.5 12 618.8 29 312.3 20 604.9 20 324.6 14 651.1 13 480.9 37 564.8 41 585.2 24 933.1 25 800.4 20 320.4 48 787.1 16 980.1 21 392.9

Variables independientes usadas x1, x2, x3, x4, x5 x1, x2 x1, x2, x3 x1, x4, x5

¡Es evidente que hay un problema! ¿Cuál modelo se selecciona? Suponga que interesa tener capacidad de predicción y ajuste adecuado de los datos hasta donde sea posible. Observando la tabla 12.6 más de cerca revela que los cinco primeros modelos enumerados difieren apenas levemente en cuanto al error cuadrático medio. El segundo, cuarto y quinto modelos tienen valores razonablemente cercanos de la estadística PRESS. Así pues, conviene analizarlos. Sus características se enumeran a continuación:

492

PROBABILIDAD Y ESTADÍSTICA

Modelo 2 4 5

Variables

ECM

PRESS

R2

Ck

x1, x4, x5 x1, x2, x4 x1, x2

507.00 537.89 552.80

7 758.1 9 097.3 8 855.7

0.779 0.765 0.719

2.3 2.5 1.4

Se observa que cada uno de los modelos tiene valor de R2 razonablemente grande, en comparación con su valor máximo de 0.793. El modelo 5 tiene valor mínimo de Ck, mientras que con el modelo 2 son mínimos los valores de PRESS y EMC, y bajo el de Ck. En términos prácticos, es probable que cada uno de los modelos funcione razonablemente bien. El modelo 2 es preferible para fines de predicción. Este modelo ajustado está dado por:

µˆY

x1 , x2

= −101.92 + 0.195x1 + 0.100 x 4 + 1.103x5

12.8 TRANSFORMACIÓN DE MODELOS Y COMENTARIOS FINALES Se ha visto la forma de estimar una curva de regresión cuando es apropiado suponer que existe relación lineal entre x y la media de Y. También se ha estudiado la manera de usar diagramas de dispersión de los datos y gráficas residuales para darse una idea visual de la validez de ese supuesto. Se estudia la forma de probar la falta de ajuste cuando se cuenta con observaciones repetidas de algunos valores de regresores. ¿Qué puede hacerse si existe una fuerte evidencia de que resulta inapropiada la regresión lineal? Es una pregunta difícil de responder, ya que la estrategia usada depende de la manera en que los datos se desvíen de la linealidad o transgredan los supuestos del modelo de regresión lineal simple. En esta sección, se resumen algunos “trucos del negocio” útiles. Por principio de cuentas, considere los diagramas de dispersión de la figura 12.3. En cada caso, se trazó una curva de regresión “de manera burda” a través de los datos. ¿Qué tipo de ecuación describiría óptimamente esas curvas? Es una pregunta difícil de responder. De hecho, habría varias ecuaciones distintas que funcionen satisfactoriamente. Advierta que existe una diferencia fundamental en los diagramas de dispersión mostrados. En cada caso, parece encajar en los datos una curva, no una recta. En la figura 12.3a, no se aprecia un cambio evidente de la dispersión o variabilidad a medida que se modifica el valor de x. Así pues, se carece de datos indicativos de que se transgreda el supuesto de igualdad de la varianza. No ocurre tal en la figura 12.3b. Además de que los datos indican una curva, no una recta, la varianza parece diferir con valores distintos de x. En virtud de esa diferencia en los datos, los dos casos reciben un manejo distinto. En el primero, es probable que sea apropiado un modelo polinomial, es decir, se usan las técnicas analizadas en el capítulo para ajustar un modelo de la forma:

µY x = β0 + β1 x + β2 x 2 + . . . + β p x p donde p es un entero positivo mayor que 1. En el segundo caso, podrían intentarse los modelos exponencial o de potencias. Se trata de modelos no lineales, ya que no expresan la respuesta promedio como función lineal de los parámetros. Se explican en los ejemplos siguientes.

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

a)

493

b)

FIGURA 12.3 a) Diagrama de dispersión con el que es apropiado un modelo polinomial; b) diagrama de dispersión con el que deben intentarse los modelos polinomial o de potencias.

Ejemplo 12.8.1 (modelo exponencial). El modelo exponencial asume las formas:

µY x = β0eβ1x

x>0

o y i = β0eβ1xi ei Advierta que este modelo difiere de los antes estudiados en dos aspectos. Primero, que no es lineal. Segundo, que el error aleatorio ei no se añade al término β0eβ1xi ; sino que es un multiplicador. Ello explica la diferencia en la varianza con los diversos valores de x. Aunque el modelo no sea lineal, es intrínsecamente lineal. Afirmar que un modelo es intrínsecamente lineal significa que se puede transformar o rescribir en una forma lineal equivalente. Este proceso, llamado linealización, se logra en este caso al tomar los logaritmos naturales para obtener: ln y i = ln β0eβ1xi ei De conformidad con las leyes de los logaritmos, el miembro derecho de la ecuación puede escribirse como ln β0 + β1xi + ln ei. Si ln y i = y*i ,ln β0 = β0*, β1 = β1*, y ln ei = e*i , el modelo transformado se convierte en: y*i = β0* + β1*x i + e*i que es un modelo de regresión lineal simple. Se usa el método de mínimos cuadrados para estimar β0* y β1*.Se ajusta el modelo mediante regresión, del logaritmo natural de la respuesta original contra el regresor. Note que β1* = β1 , el parámetro del exponente del modelo original. Por lo tanto, βˆ1 = βˆ1*; pero β*0 ≠ β0 .A fin de estimar β0, el coeficiente del modelo original, se usan las relaciones β0* = ln β0 o β0 = eβ0* . ˆ* Así pues, βˆ0 = e β0 . Tenga en cuenta que el diagrama de dispersión de la figura 12.3b no es el único dato que apunta a un modelo exponencial. De hecho, es uno con el que β0 y β1 son positivas. En los ejercicios 59 y 60, se pide al lector que elabore diagramas de dispersión de otros posibles modelos exponenciales. Ejemplo 12.8.2 (modelo de potencias).

El modelo de potencias es uno de la forma:

µY x = β0 x β1

x>0

o y i = β0 x iβ1 ei

494

PROBABILIDAD Y ESTADÍSTICA

FIGURA 12.4 Diagrama de dispersión con el que es apropiado un modelo recíproco, con β1 > 0.

Este modelo, al igual que el exponencial, es intrínsecamente lineal. La transformación logarítmica también lo linealiza, como sigue: ln y i = ln β0 x iβ1 ei o ln y i = ln β0 + β1 ln x i + ln ei

Aquí, y*i = ln y i , β0* = ln β0 , β1* = β1 , x*i = ln x i , y e*i = ln ei .El nuevo modelo se convierte en: y*i = β0* + β1*x*i + e*i Los parámetros se estiman mediante el uso de mínimos cuadrados. Advierta que se trata de una regresión del logaritmo natural de la respuesta original contra el logaritmo natural del regresor original. Las estimaˆ* ciones de parámetros son βˆ1 = βˆ1* y = βˆ0 = eβ0 . La figura 12.3b muestra un diagrama de dispersión con el que sería apropiado un modelo de potencias con β0 > 0 y β1 > 1. En los ejercicios 61-63, se le pide que explore otras posibles formas de diagramas de dispersión que apuntarían al modelo de potencias. El modelo analizado a continuación es un modelo lineal en el que la regresión es una función de x, en lugar de ser x misma. Un diagrama de dispersión para un conjunto de datos con el cual sería adecuado este modelo se muestra en la figura 12.4. Ejemplo 12.8.3 (modelo recíproco).

Este modelo asume las formas:

µY x = β0 + β1 (1/ x) x > 0 o

y i = β0 + β1 (1/ x) + ei Se trata de un modelo que ya es lineal, puesto que expresa la respuesta promedio como función lineal de los parámetros β0 y β1. En el ajuste del modelo con el método de mínimos cuadrados, se procede a la regresión de la respuesta contra la recíproca del regresor, no contra el regresor mismo.

Antes de terminar la sección, procede un comentario adicional. Uno de los supuestos básicos de la regresión lineal simple es la igualdad de la varianza. Si un diagrama de dispersión indica que ese supuesto es inválido, el uso de una transformación logarítmica suele ayudar en la estabilización de la varianza. En otras palabras, se hace que y* = ln y y luego se procede a la regresión de y* contra x. De esa manera, se estima el modelo:

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

495

µY*|x = β0 + β1x

donde µY*|x es el valor promedio del logaritmo natural de la respuesta con un valor dado de x. Una vez que se tienen las estimaciones de β0 y β1, puede usarse la línea de regresión ajustada para estimar y*, el logaritmo natural de la respuesta original con un valor dado de x. Es posible recuperar la respuesta estimada con la relación: yˆ = e yˆ *

Recuerde que la regresión es un arte. Puede haber varios modelos que parezcan embonar en un conjunto de datos dado. La tarea del investigador es estudiar esos modelos para encontrar el que tenga mejor ajuste y brinde la explicación más razonable de la relación entre el regresor y la respuesta promedio. En este capítulo, se toca apenas la superficie de la poderosa herramienta estadística llamada análisis de regresión. Son muchos los aspectos de este tema que se omiten. Por ejemplo, si las variables de predicción están correlacionadas (son linealmente dependientes), se dice que tienen multicolinealidad. De ser así, los estimadores de mínimos cuadrados son insesgados, si bien sus varianzas pueden ser muy grandes. Un procedimiento llamado regresión de borde suele usarse en tal situación. Aunque genera estimadores con sesgo, la varianza suele producirse de modo que el error cuadrático medio es relativamente pequeño. Es un procedimiento que se analiza con detalle en los textos de análisis de regresión [39]. Otro enfoque más bien reciente del análisis de regresión es la llamada regresión robusta. Este procedimiento es útil cuando el supuesto de normalidad parece poco realista o los datos incluyen valores atípicos con influencia considerable en los estimadores de mínimos cuadrados usuales. Se trata de un procedimiento hasta cierto punto polémico [12]. Nuestra mejor sugerencia es la siguiente. Si usted emprende un estudio de investigación serio que podría incluir la regresión, busque la ayuda de un estadístico experto en el área durante la etapa de diseño del estudio. En esta obra, se aprende sobre la regresión lo suficiente para conversar con tal experto; pero no para aprovecharla al máximo. Son varias las obras excelentes en el mercado que se dedican únicamente a estudiar el análisis de regresión, entre ellas [12] y [39].

RESUMEN DEL CAPÍTULO El modelo de regresión lineal simple estudiado en el capítulo 11 se amplía en el presente capítulo. Esa ampliación incluye un modelo para diversas variables independientes lineales, el modelo polinomial para una sola variable independiente y combinaciones de esos dos modelos. Luego, ambos se desarrollan en forma matricial y se estudian el procedimiento de estimación de mínimos cuadrados y las propiedades de ese procedimiento. A continuación, se analizan métodos de estimación de los intervalos de confianza de esos modelos con una sola pendiente, la media pronosticada y el valor pronosticado único. También se detallan los métodos de prueba de hipótesis de la significación de una variable de predicción única, de la regresión significativa y de un subconjunto de variables de predicción. Se resalta que esos modelos son de mucha utilidad en aplicaciones, si bien se requiere de una computadora para la estimación de sus parámetros. Otros temas que se definen y analizan son los coeficientes de correlación múltiple y de determinación múltiple.

496

PROBABILIDAD Y ESTADÍSTICA

En estadística aplicada, dista de ser una tarea trivial la decisión de cuáles variables de predicción deben incluirse en el modelo seleccionado. Se estudian en el capítulo varios de los métodos más usados de selección de variables. Ello abarca la selección hacia adelante, eliminación hacia atrás, método escalonado, R2 máxima, Ck de Mallow y la estadística PRESS. Por último, se mencionan y definen términos importantes, que debe conocer el lector, a saber: Regresión polinomial Estimadores de mínimos cuadrados Regresión significativa Correlación múltiple Variable indicadora Ck Estadística PRESS

Regresión lineal múltiple Modelo en forma matricial Variable de predicción Selección de variables Coeficientes de determinación Modelo de potencias Modelo exponencial Modelo recíproco

EJERCICIOS Sección 12.1

1. ¿De qué grado es el modelo de regresión lineal simple, como modelo polinominal? Verifique que en este caso las ecuaciones 12.3 se reducen a las que aparecen en el capítulo 11 respecto del modelo de regresión lineal simple. 2. El modelo de regresión lineal simple es también un modelo de regresión lineal múltiple con k = 1. Verifique que en este caso las ecuaciones normales 12.5 se reducen a las del capítulo 11 correspondientes al modelo de regresión lineal simple. 3. Considere el modelo µY | x , x = β0 + β1 x1 + β2 x2 . Se tienen los datos siguientes: 1

x1

x2

y

0 2 4

8 9 8

9 8 7

2

a) Encuentre: 3

3

3

3

i =1

i =1

i =1

i =1

3

3

3

i =1

i =1

i =1

∑ x1i ∑ x2i ∑ x1i x2i ∑ x1i yi ∑ x12i ∑ x22i ∑ yi

3

∑ x2i yi

i =1

b) Determine las ecuaciones normales. c) Demuestre que b0 = 9, b1 = −0.5 y b2 = 0 son soluciones de las ecuaciones normales. 4. Considere el modelo:

µY | x1 , x2 = β0 + β1 x1 + β11 x12 + β2 x2 Expréselo en la forma lineal general del sistema 12.1.

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

497

5. Considere el modelo:

µY | x , x = β0 + β1 x1 + β2 x2 + β12 x1 x2 1

2

Exprese el modelo en la forma lineal general del sistema de ecuaciones 12.1. Sección 12.2

6. Considere el modelo de regresión lineal simple:

µY |x = β0 + β1 x Demuestre que:  n  ∑ xi2 1  i =1 ( X' X )−1 = nS xx  n −∑ x  i = 1 i

n  −∑ xi  i =1   n  

7. Considere los datos del ejercicio 7 del capítulo 11. a) Use el enfoque matricial para encontrar ecuaciones normales y compare su respuesta con la del ejercicio 8 del capítulo 11. b) Resuelva las ecuaciones normales con el álgebra matricial y compare sus respuestas con las determinadas anteriormente. 8. Considere los datos del ejercicio 9 del capítulo 11. Estime la línea de regresión con la técnica matricial. 9. Considere los datos del ejercicio 10 del capítulo 11. Use la técnica matricial para estimar la línea de regresión. 10. En la regresión lineal simple, la respuesta estimada yˆ con un valor dado de x puede escribirse en notación matricial como sigue: yˆ = [ b0

1  b1 ]   x

a) Verifique que sea válida esa técnica. b) Use ese método y los resultados del ejercicio 7 para estimar la energía promedio consumida en un hogar con ingreso de $50 000. c) Utilice ese método y los resultados del ejercicio 8 para estimar el paso de un conector específico con longitud de 0.03 pulg. d ) Recurra a ese método y los resultados del ejercicio 9 para estimar los pies de superficie por minuto que pueden cubrirse con una rueda que gira a 3 450 revoluciones por minuto. 11. En el desarrollo de un modelo de regresión lineal simple para predecir el consumo de combustible con base en peso del automóvil, se tienen los datos siguientes: x

1.35

1.90

1.70

1.80

1.30

2.05

1.60

1.80

1.85

1.40

y

17.9

16.5

16.4

16.8

18.8

15.5

17.5

16.4

15.9

18.3

498

PROBABILIDAD Y ESTADÍSTICA

Determine la matriz de especificación del modelo. Calcule X'X. Calcule X'y. Encuentre las ecuaciones normales mediante álgebra de matrices. Encuentre (X'X)−1. Encuentre las estimaciones de mínimos cuadrados de β0 y β1 usando álgebra de matrices. Compare sus valores con los calculados en el ejemplo 11.3.3. 12. Considere los datos siguientes en los ejercicios 12 y 13: a) b) c) d) e) f)

x

1.6

1.8

1.4

2.0

1.2

2.2

1.0

2.4

0.8

2.6

y

12

6

13

5

10

1

20

1

24

0

a) Encuentre la matriz de especificación del modelo para el modelo cuadrático:

µY | x = β0 + β1 x + β2 x 2 b) Encuentre X'X. c) Encuentre X' y. d ) Demuestre, aparte del error del redondeo, que:  8.733 −10.8182 3.0303 ( X'X ) = −10.8182 13.9867 −4.0246  3.0303 −4.0246 1.1837 −1

Sugerencia: Basta que demuestre que (X'X )(X'X )−1 = I. e) Encuentre b. 13. a) Escriba la expresión del modelo estimado. b) Argumente que en un modelo de este tipo, con un valor específico de x, se tienen:

µˆ Y | x

1 = yˆ = [b0 b1 b2 ]  x   x 2 

c) Use el modelo estimado para predecir el valor medio de y cuando x = 2.5. 14. En el ejercicio 3, se considera el modelo µY | x , x = β0 + β1 x1 + β2 x2 con base en los datos siguientes: 1

x1

x2

y

0 2 4

8 9 8

9 8 7

a) b) c) d)

2

Encuentre la matriz de especificación del modelo. Calcule X'X. Calcule X' y. Encuentre las ecuaciones normales y compárelas con las determinadas en el ejercicio 3.

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

499

e) Demuestre que: 1 680   16  −4 ( X' X )−1 =   16  −200  16

−4 16 2 16 0

−200   16   0   24  16 

 9  f ) Verifique que b = −0.5    0  15. Escriba la matriz de especificación del modelo:

µY | x , x = β0 + β1 x1 + β11 x12 + β2 x2 1

2

con base en una muestra aleatoria de tamaño 8. 16. Escriba la matriz de especificación del modelo:

µY | x , x = β0 + β1 x1 + β2 x2 + β12 x1 x2 1

2

a partir de una muestra aleatoria de tamaño 10. 17. Reconsidere los datos del ejercicio 1 del capítulo 11. ¿Puede proponer un modelo que sea apropiado con esos datos? Sección 12.3

2 8 18. Sea C = 3 6. Sean Y1 y Y2 variables independientes con E[Y1] = 3, E[Y2] = 9 y Var Y1 = Var Y2 = 16. 1 0 a) Encuentre E[C ].

Y  b) Determine E[C Y], donde Y =  1  Y2  c) Calcule Var Y. d ) Encuentre Var C Y.   19. Sea C = 3 2. Sean Y1 y Y2 variables independientes con E[Y1] = 5, E[Y2] = 10 y Var Y1 = 1 7

Var Y2 = 6.

  a) Encuentre E[CY ] donde Y = Y1  . Y2  b) Determine Var Y. c) Calcule Var C Y.

500

PROBABILIDAD Y ESTADÍSTICA

Considere el modelo de regresión lineal simple en los ejercicios 20-22. 20. Calcule Var βˆ , es decir, la matriz de varianza-covarianza del modelo. Sugerencia: Véase ejercicio 6. 21. Determine Var βˆ0 y Var βˆ1 a partir de la matriz de varianza-covarianza. Compare sus resultados con los de la sección 2 del capítulo 11. 22. ¿No están correlacionadas B0 y B1? Explique su respuesta con base en la matriz de varianzacovarianza. 23. Considere el modelo:

µY | x , x = β0 + β1 x1 + β2 x2 1

2

Por definición, se tiene: n

SSE = ∑ [Yi − ( B0 + B1 x1i + B2 x2i )]2 i =1

a) Eleve al cuadrado el término de la derecha y sume sobre i para obtener: n

SSE = ∑[Yi 2 − Yi ( B0 + B1x1i + B2 x2i ) i =1

+ ( B0 + B1x1i + B2 x2i )2 − Yi ( B0 + B1x1i + B2 x2i )] b) Demuestre que: n

∑ [( B0 + B1 x1i + B2 x2i )2 − Yi ( B0 + B1 x1i + B2 x2i )]

i =1

n

= B0 ∑ ( B0 + B1 x1i + B2 x2 i − Yi ) i =1

n

+ B1 ∑ ( B0 x1i + B1 x12i + B2 x1i x2i − x1iYi ) i =1 n

+ B2 ∑ ( B0 x2i + B1 x1i x2i + B2 x22i − x2iYi ) i =1

c) Use las ecuaciones normales del modelo de regresión lineal múltiple, dadas en la sección 12.1, para argumentar que cada uno de los componentes del miembro derecho en la ecuación del inciso b es igual a 0. d ) Demuestre que: n

n

n

n

i =1

i =1

i =1

i =1

SSE = ∑Yi 2 − B0 ∑Yi − B1 ∑ x1iYi − B2 ∑ x2iYi y, de tal suerte, verifique parcialmente los cálculos usados para determinar SSE. 24. A partir del modelo de regresión lineal simple, se tiene que:

SSE = S yy − B1S xy (Véase sección 11.2.) En esta sección, se define SSR para este modelo con: n n  n 2 SSR = B0 ∑Yi + B1 ∑ x1iYi −  ∑ Yi  n i =1 i =1 i =1 

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

501

Demuestre que B1Sxy = SSR, con lo que verifica que los resultados obtenidos aquí coinciden con los encontrados anteriormente. 25. En el ejemplo 12.2.5, se desarrolló una ecuación de regresión cuadrática para predecir el costo unitario de producción de un medicamento con base en el número de unidades fabricadas. Use la información dada en dicho ejemplo para estimar Var B0, Var B1 y Var B2. 26. En relación con el modelo cuadrático desarrollado en el ejercicio 12, estime Var B0, Var B1 y Var B2. Sección 12.4

27. Use los datos del ejemplo 12.4.1 para encontrar intervalos de confianza de 95% para β1 y β2. ¿Se tiene evidencia de que β1 ≠ 0 o de que β2 ≠ 0? Explique su respuesta. 28. Use los datos del ejemplo 12.2.5 para encontrar intervalos de confianza de 95% para β1 y β2. ¿Se tiene evidencia de que β1 ≠ 0 o de que β2 ≠ 0? Explique su respuesta. 29. Use la información del ejemplo 12.3.3 para calcular un intervalo de confianza de 90% para la media de rendimiento de combustible (millaje) con vehículos que pesan 1.5 ton conducidos a una temperatura ambiente de 40°F. Encuentre un intervalo de predicción de 90% de tal rendimiento con un automóvil de 1.5 ton de peso conducido a dicha temperatura. ¿Cuál intervalo tiene mayor amplitud? 30. Utilice la información del ejemplo 12.2.5 para determinar un intervalo de confianza de 95% para la media de costo unitario de producción de 12 unidades del medicamento señalado. Determine un intervalo de predicción de 95% del costo unitario de producción de un lote específico de 12 unidades del medicamento. 31. Use la información del ejemplo 12.2.4 para encontrar un intervalo de confianza de 95% para la media en la magnitud de evaporación del solvente cuando la humedad en el momento de pintar con compresor es de 50%. Encuentre un intervalo de predicción de 95% de esa magnitud de evaporación en un día específico con el grado de humedad indicado. Los tres elementos estructurales básicos de un sistema de procesamiento de datos son los archivos, flujos y procesos. Los archivos son conjuntos de registros permanentes en el sistema; los flujos, interfaces de datos entre el sistema y su entorno, y los procesos, manipulaciones lógicas de los datos, definidas funcionalmente. Se emprende una investigación del costo de desarrollo de software en lo relativo a archivos, flujos y procesos. El estudio revela los datos siguientes: Costo unitario, y (en unidades de 1 000)

Archivos, x1

Flujos, x2

22.6 15.0 78.1 28.0 80.5 24.5 20.5 147.6 4.2 48.2 20.5

4 2 20 6 6 3 4 16 4 6 5

44 33 80 24 227 20 41 187 19 50 48

Los ejercicios 32-36 se refieren a estos datos.

Procesos, x3 18 15 80 21 50 18 13 137 15 21 17

502

PROBABILIDAD Y ESTADÍSTICA

32. Considere el modelo:

µY | x , x , x = β0 + β1 x1 + β2 x2 + β3 x3 1

2

3

a) Encuentre la matriz de especificación del modelo. b) En relación con esos datos:

 0.3197263 0.005305965  −0.0408268 −0.00202208   0.0140738 0.0003717104 −0.00224159  −0.0408268 ( X' X )−1 =  0.0003717104 0.00005188447 −0.000113861  −0.00202208  0.005305965 −0.00224159 0.0004938527 −0.000113861  489.7  5 259   X' y =  59 088.4  33 845.2 s 2 = 98.37516961

Use esa información para estimar el modelo. 33. Encuentre un intervalo de confianza de 95% para µY | x , x , x con x1 = 12, x2 = 40 y x3 = 20. 34. Encuentre un intervalo de confianza de 95% para el costo de un solo sistema, con x1 = 12, x2 = 40 y x3 = 20. 35. Determine un intervalo de confianza de 90% para β0. 36. Encuentre un intervalo de confianza de 90% para β1. 1

2

3

Sección 12.5

Considere los datos siguientes: x

1

2

3

4

5

6

7

y

8

17

29

34

46

42

52

Use esos datos en los ejercicios 37-42. 37. Ajuste una curva de regresión de la forma µY | x = β0 + β1x. 38. Encuentre la matriz de especificación de un modelo con la forma:

µY | x = β0 + β1 x + β2 x 2 39. En relación con el modelo del ejercicio 38, se tienen:  2.428571 −1.28571 0.1428571   −1 0.797619 −0.0952381  ( X'X ) = −1.28571  0.1428571 −0.0952381 0.01190476  228 X' y =  1111 6 091

s 2 = 12.27380952 Use esa información para estimar el modelo.

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

503

40. Haga una prueba de hipótesis apropiada para decidir si la curva de regresión cuadrática encaja significativamente mejor en los datos que la de regresión lineal. 41. Use la curva de regresión seleccionada en el ejercicio 40 y calcule un intervalo de confianza de 95% para µY | x, donde x = 4.8. 42. Use la curva de regresión seleccionada en el ejercicio 40 para calcular un intervalo de confianza de 95% para la respuesta individual, con x = 4.8. Se estudia el agrietamiento de la pintura de látex en estructuras de madera. La preocupación principal del estudio es investigar el efecto de la permeabilidad al agua y la energía de fractura (la energía necesaria para que se propague una grieta en la película de pintura) en la tasa de agrietamiento de la pintura. La investigación arroja los datos siguientes: Número de muestra 1 2 3 4 5 6 7 8 9 10

Tasa de agrietamiento, y

Permeabilidad, x1

Energía de fractura, x2

2 9 5 10 3 3 8 7 8 5

2.1 8.4 5.1 14.5 4.4 6.2 12.5 7.0 17.2 7.1

4.31 22.11 11.40 24.15 6.21 5.65 9.71 12.00 14.25 8.63

Consulte estos datos en los ejercicios 43-49. 43. Elabore gráficas de y contra x1 y de y contra x2. 44. Encuentre la matriz de especificación del modelo siguiente:

µY | x , x = β0 + β1 x1 + β2 x2 1

2

45. En relación con el modelo del ejercicio 44, se tiene:  0.529839 −0.02535552 −0.0182053  ( X' X ) = −0.0253552 0.00772376 −0.00337026  −0.0182053 −0.00337026 0.003942239  60  X' y = 604.2  860.52 −1

s 2 = 0.94334776 Use esta información para estimar el modelo. 46. Determine R2 respecto del modelo estimado en el ejercicio 45. 47. Estime ρ, el coeficiente de correlación entre las respuestas observadas y pronosticadas del modelo del ejercicio 45. 48. Ponga a prueba la regresión significativa de la curva estimada en el ejercicio 45. 49. Ponga a prueba H0: β2 = 0. ¿Piensa que es necesaria x2 en el modelo, que ya contiene la variable x1? Explique su respuesta.

504

PROBABILIDAD Y ESTADÍSTICA

50. Ponga a prueba el efecto de regresión significativa en el ejercicio 32. 51. Use los datos del ejercicio 32 para probar H0: β2 = β3 = 0. Sección 12.6

52. Se emprende un estudio del consumo de energía contra el ingreso familiar y la situación de propiedad de la vivienda. Sea Y (en unidades de 108 Btu) el consumo de energía; x1 (en unidades de $1 000/año), el ingreso, y x2 (x2 = 1, 0), el estado de propietario o arrendatario, respectivamente. Se obtienen los datos siguientes: Consumo, y

Ingreso, x1

Situación de propiedad, x2

1.8 4.7 3.0 5.8 4.8 7.1 5.0 8.0 7.0 9.9 9.0 11.3 9.2

20.0 25.0 30.5 35.1 40.0 48.2 55.1 60.5 74.9 80.3 88.4 90.1 95.2

0 1 0 1 0 1 0 1 0 1 0 1 0

a) Suponga que un modelo apropiado es:

µY | x , x = β0 + β1 x1 + β2 x2 Encuentre la matriz de especificación del modelo. b) En relación con esos datos, se tiene: 1

2

  0.5416711 −0.00690843 −0.151114 ( X' X )−1 = −0.00690843 0.0001196709 0.0001430353 0.0001430353 0.3096948  −0.151114 y

 86.6  X' y = 5 751.14  46.8 

Use esta información para estimar el modelo. c) En relación con esos datos:

σˆ 2 = 0.13417107 Use esa información para poner a prueba H0: β2 = 0. d ) Señale los modelos estimados que describen la relación del consumo de energía con el ingreso en propietarios de la vivienda y arrendatarios. e) Calcule una estimación puntual de la diferencia en las intersecciones de los dos modelos del inciso d.

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

505

53. Un ingeniero estudia la recuperación de calor que pasa al entorno en la forma de gases de emisión de dos tipos de hornos. El experimento está diseñado para fijar la velocidad de flujos por las tuberías térmicas (en m/s) y luego medir la tasa de recuperación. Recuperación, y 0.740 0.745 0.718 0.678 0.652 0.627 0.607 0.507 0.545 0.402 0.321 0.255 0.175 0.115 0.085

Velocidad de flujo, x1

Tipo de horno, x2

1 1.5 2 2.5 3 3.5 4 4.5 5 1 2 2.5 3 4 5

A A A A A A A A A B B B B B B

a) Suponga que se desconoce si la velocidad de flujo afecta en la misma forma a ambos tipos de hornos o no lo hace. El modelo apropiado es:

µY | x , x = β0 + β1 x1 + β2 x2 + β3 x1 x2 1

2

donde x2 = 1 si se usa el horno A y x2 = 0 si se utiliza el horno B. Encuentre la matriz de especificación del modelo. b) En relación con esos datos, se tienen:  1 −0.285714 −1 0.2857143   0.09795918 0.2857143 −0.0979592 −0.285714 −1 ( X'X ) =  0.2857143 1.711111 −0.485714  −1 0.1646259  0.2857143 −0.0979592 −0.485714 y

 7.172    19.665  X' y =   5.819  16.5735 Use esa información para estimar el modelo. c) Estime la diferencia entre las pendientes de las líneas de regresión de los dos hornos. d ) En relación con los datos:

σˆ 2 = 0.0007562574

506

PROBABILIDAD Y ESTADÍSTICA

Use esta información para poner a prueba H0: β3 = 0. ¿Qué conclusión práctica puede obtenerse? 54. Considere el problema del ejercicio 52. Suponga que en un estudio futuro se pretende diferenciar entre los tipos de inmuebles en renta y viviendas propias, de modo que x2 aumenta a cuatro niveles. Éstos son: de i) propietario de vivienda unifamiliar de diseño personal; ii) propietario de vivienda unifamiliar de diseño en serie o condominio; iii) arrendatario de vivienda unifamiliar, y iv) arrendatario de condominio o departamento. a) ¿Cuántas variables indicadoras se necesitan para codificar la situación de propiedad de vivienda? b) Suponga que las pendientes de las cuatro líneas de regresión son idénticas. Desarrolle un modelo apropiado. c) Sean: x2 = x3 = x4 = 0 en el caso de propietarios de vivienda unifamiliar de diseño personal x2 = x3 = 0 y x4 = 1 en el caso de propietarios de vivienda unifamiliar de diseño en serie o condominio x2 = x4 = 0 y x3 = 1 en el caso de arrendatarios de vivienda unifamiliar x3 = x4 = 0 y x2 = 1 en el caso de arrendatarios de departamentos Desarrolle el modelo de cada uno de esos grupos. d ) ¿Qué hipótesis nula debe ponerse a prueba para verificar la igualdad de las cuatro intersecciones? 55. Suponga que se tiene un modelo con una variable cuantitativa, x1, y otra cualitativa de tres niveles A, B y C. Considere el modelo:

µY | x , x , x = β0 + β1 x1 + β2 x2 + β3 x3 + β4 x1 x2 + β5 x1 x3 1

donde

2

3

x2 = x3 = 0 para el nivel A x2 = 1 y x3 = 0 para el nivel B x2 = 0 y x3 = 1 para el nivel C

a) Desarrolle los modelos de cada uno de los tres niveles. b) ¿Qué hipótesis nula debe ponerse a prueba para verificar la igualdad de las pendientes de las tres líneas de regresión? c) ¿Qué hipótesis nula debe probarse para verificar simultáneamente la igualdad de las pendientes e intersecciones? ¿Cuántos grados de libertad se relacionan con la proporción F usada en esa prueba? Sección 12.7

56. Suponga que se tienen cuatro posibles variables de predicción, x1, x2, x3 y x4. Parta también de que el modelo final con la selección hacia adelante incluye sólo las variables x4 y x2, que se integran al modelo en ese orden. Delinee los pasos de desarrollo del modelo. Apéguese al formato del ejemplo 12.7.1.

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

507

57. Suponga que se tienen cuatro variables posibles de predicción y que, con la eliminación hacia atrás, se llega a un modelo reducido que sólo contiene las variables x1 y x2. Suponga también que las variables x3 y x4 se eliminan en dicho orden. Delinee los pasos de desarrollo del modelo con base en el formato del ejemplo 12.7.2. 58. En un modelo de regresión lineal múltiple, las variables x2 y x4 guardan relación estrecha, con la segunda de ellas como la mejor variable de predicción. Suponga que el modelo final contiene las variables x2 y x1, que se añaden en las etapas tercera y segunda, respectivamente. Defina los pasos de desarrollo del modelo con la regresión escalonada. Sección 12.8

59. Considere el modelo:

µY | x = β0 e β x 1

x>0

Calcule la primera derivada de la función β0eβ x . Si β0 > 0 y β1 < 0, ¿es creciente o decreciente la curva de regresión? Encuentre la segunda derivada de la función β0eβ x . Si β0 > 0 y β1 < 0, ¿la curva de regresión es cóncava hacia arriba o cóncava hacia abajo? Bosqueje un diagrama de dispersión con el cual sea razonable suponer que es apropiado un modelo exponencial con β0 > 0 y β1 < 0. 60. Considere el modelo: a) b) c) d) e)

1

1

µY | x = β0 e β x 1

x>0

Bosqueje un diagrama de dispersión con el cual sea razonable suponer que es apropiado el modelo, con β0 < 0 y β1 > 0, y con β0 < 0 y β1 < 0. 61. Considere el modelo:

µY | x = β0 x β

1

x>0

a) Calcule la primera derivada de la función β0 x β . b) Verifique que si β0 > 0 y β1 > 1, la función es creciente, como se muestra en la figura 12.3b. c) Encuentre la segunda derivada de la función β0 x β . Verifique que si β0 > 0 y β1 > 1, la función tiene concavidad hacia arriba, como se muestra en la figura 12.3b. 62. Considere el modelo de potencias, con β0 > 0 y 0 < β1 < 1. Bosqueje un diagrama de dispersión con el que sería apropiado este modelo. 63. Considere el modelo de potencias con β0 > 0 y β1 < 0. Bosqueje un diagrama de dispersión con el que sería apropiado este modelo. 64. Considere el modelo: 1

1

µY | x = β0 + β1 (1 / x )

x>0

a) Encuentre la primera derivada de la función β0 + β1(1/x). b) Verifique que si β1 > 0, la función es decreciente, como se muestra en la figura 12.4. c) Encuentre la segunda derivada de la función β0 + β1(1/x). Verifique que si β1 > 0, la función tiene concavidad hacia arriba, como se ilustra en la figura 12.4. 65. Considere el modelo recíproco, con β1 < 0. Bosqueje un diagrama de dispersión con el que sería apropiado el modelo.

508

PROBABILIDAD Y ESTADÍSTICA

EJERCICIOS DE REPASO

Se realiza un estudio del efecto de la temperatura del agua y el tiempo en solución sobre la cantidad de colorante que absorbe un cierto tipo de tela. Se agrega una cantidad estándar de colorante (200 mg/min) a un volumen fijo de agua. Los tres niveles de temperatura usados en el experimento son 105, 120 y 135°C. La tela se deja en el agua 15, 30 o 60 min. En relación con cada una de las combinaciones temperatura-tiempo, se mide la cantidad de colorante que queda en la tela. El experimento revela los datos siguientes: Colorante en la tela (mg), y

Tiempo en solución (min), x1

Temperatura del agua (°°C), x2

136 153 186 182 175 187 170 179 183

15 30 60 15 30 60 15 30 60

105 105 105 120 120 120 135 135 135

Se hace referencia a estos datos en los problemas 66-76. 66. Elabore gráficas de y contra x1 y de y contra x2. ¿Parece haber relación del tiempo, temperatura o ambos con el colorante que queda en la tela? 67. Estime la curva de regresión de Y sobre x1. 68. Encuentre e interprete los límites de confianza de 95% para µY | x = 45 . 69. Estime la curva de regresión de Y sobre x2. 70. Bosqueje una banda de predicción de 90% en torno a un solo valor pronosticado de Y mediante el uso de unos cuantos valores del regresor correspondiente al modelo del ejercicio 69. 71. Encuentre la matriz de especificación del modelo: 1

µY | x , x = β0 + β1 x1 + β2 x2 1

2

72. En relación con el modelo del ejercicio 71, se tiene: 11.16667 −0.0111111 −0.0888889    ( X'X ) = −0.0111111 0.0003174603 0  0.0007407407 −0.0888889 0 −1

 1 551   X' y =  55 890 186 975 s 2 = 166.78571429

Use esa información para estimar el modelo.

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

509

73. Considere como modelo reducido el que contiene únicamente x1. Ponga a prueba: H0: el modelo reducido es apropiado H1: el modelo completo es necesario al nivel α = 0.05. ¿Cuál modelo prefiere? 74. Determine R2 en relación con el modelo seleccionado en el ejercicio 73. Encuentre ρˆ, la correlación estimada entre las respuestas pronosticadas y observadas. 75. Si se prepara una solución de colorante a 125°C de temperatura del agua y se deja la tela en la solución durante 20 min, ¿cuánto colorante predeciría, en promedio, que quede en la tela? 76. Calcule los límites de confianza de 95% de su predicción correspondiente al ejercicio 75. 77. Se realiza un estudio de tiempo en que se consumen ciertos fuegos pirotécnicos. Las variables consideradas son la longitud del recubrimiento químico en la punta del fuego pirotécnico (en pulgadas) y el tiempo en el que se quema (en segundos). Se queman 17 fuegos pirotécnicos y se obtienen los valores de recubrimiento químico (x) y tiempo de consumo ( y) siguientes:

Número de observación

Longitud del recubrimiento químico (pulg)

Tiempo de consumo (s)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

4.5 3.6 4.0 3.7 4.0 3.7 4.0 4.0 3.8 4.0 3.8 4.1 3.9 4.1 3.9 4.2 3.8

29 26 25 25 27 27 28 25 25 28 24 15 22 25 24 26 24

a) Estime el modelo de regresión lineal simple con el tiempo de quema como variable de respuesta ( y) y la longitud del recubrimiento como variable de predicción (x). b) Ponga a prueba la regresión significativa con α = 0.05. ¿Es bueno el modelo para predecir el tiempo de quema? c) ¿Piensa que deberían incluirse otras variables en un estudio futuro para mejorar la capacidad de predicción? Se realiza un estudio del efecto de diluciones del ácido nítrico en la intemperización acelerada de la madera. Se prueban los niveles de pH 2.0, 2.5, 3.0, 3.5 y 4.0, con el agua destilada (pH 5.6) como control. Se usa una cámara de intemperización acelerada con tiempos de 200, 400, 600, 800 y 1 000 h.

510

PROBABILIDAD Y ESTADÍSTICA

Se obtienen cortes de cedro rojo de unos 700 mg y se pesan con exactitud para tener su peso inicial al comienzo del experimento. Luego de la intemperización acelerada, se pesan de nuevo para registrar su peso final. Los datos resultantes, que incluyen la diferencia entre esas dos mediciones, aparecen en la tabla adjunta. Número de observación 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

pH

Tiempo

2.0 2.0 2.0 2.0 2.0 2.5 2.5 2.5 2.5 2.5 3.0 3.0 3.0 3.0 3.0 3.5 3.5 3.5 3.5 3.5 4.0 4.0 4.0 4.0 4.0 5.6 5.6 5.6 5.6 5.6

200 400 600 800 1 000 200 400 600 800 1 000 200 400 600 800 1 000 200 400 600 800 1 000 200 400 600 800 1 000 200 400 600 800 1 000

Peso inicial 693 696 700 692 693 697 698 698 698 697 698 699 699 695 698 698 696 698 699 698 695 698 694 698 700 695 695 698 698 698

Peso final 669 647 621 601 575 677 656 632 612 585 677 656 636 617 597 679 662 641 622 598 677 661 643 622 602 677 662 642 625 606

Diferencia 24 49 79 91 18 20 42 66 86 12 21 43 63 78 101 19 34 57 77 100 18 37 51 76 98 18 33 56 73 92

Los problemas 78-81 hacen referencia a estos datos. 78. Prepare un modelo de regresión lineal simple con la diferencia de peso (peso inicial – peso final) como variable de respuesta y el tiempo como regresor. 79. Prepare un modelo de regresión lineal múltiple con la diferencia de peso como variable de respuesta, y el tiempo y el pH como variables regresoras. 80. Ponga a prueba si se necesita el modelo completo (con el tiempo y pH como regresores) o basta el modelo reducido (sólo el tiempo como regresor). ¿Cuál modelo usaría para predecir la disminución de peso? 81. En relación con el modelo seleccionado en el ejercicio 79, calcule R2 y ponga a prueba la significación a un nivel α = 0.05.

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

467

Var βˆ = Var [( X'X )−1 X' Y ]

[

]

= ( X'X )−1X' Var Y ( X' X )−1 X' ' Las reglas del álgebra matricial afirman que (AB)' = B'A' y que (A−1)' = (A' )−1. La aplicación de estas reglas permite ver que: [( X'X )−1X' ]1 = X [( X'X )−1 ]' = X [( X'X )' ]−1 = X ( X'X )−1 La sustitución lleva a:

ˆ X ( X'X )−1 Var βˆ = ( X'X )−1X' Var Y = ( X'X )−1 X' σ 2 IX ( X'X )−1 = σ 2 ( X'X )−1 ( X'X )( X'X )−1 = σ 2 ( X'X )−1 Se desconoce σ 2, por lo que se sustituye con un estimador apropiado. Al igual que en el caso de la regresión lineal simple, en la estimación de σ 2 se usa la información concerniente a la variabilidad de los puntos de datos en torno a la ecuación de regresión ajustada. En otras palabras, en el estimador se usa SSE, la suma de cuadrados de los residuos. Obtener un estimador insesgado para σ 2 requiere dividir SSE entre n – k – 1. Así pues, el estimador es: Estimador para σ 2

σˆ 2 = S 2 = SSE /( n − k − 1) Advierta que en el caso de la regresión lineal simple, k = 1 y σˆ 2 = SSE/(n – 2). Esto coincide con los resultados obtenidos en el capítulo 11. El cálculo de la SSE de nuevo guarda paralelismo con la técnica usada en el contexto de la regresión lineal simple. En particular, se escribe SSE como la diferencia entre dos componentes cuyas fuentes son reconocibles. Aunque las fórmulas algebraicas son un tanto complejas, puede demostrarse que:

SSE =

n

∑[Yi − ( B0 + B1 x1i + B2 x2i + . . . + Bk x ki )]2

n =1 n

n

n

n

n

i =1

i =1

i =1

i =1

i =1

= ∑Yi 2 − B0 ∑Yi − B1 ∑ x1iYi − B2 ∑ x2iYi − . . . − Bk ∑ x kiYi La adición y sustracción del término ( Σni = 1Yi ) 2/ n, frecuentemente llamado factor de corrección, lleva a obtener la expresión: n  n 2  SSE = ∑Yi 2 −  ∑Yi  n i = 1  i =1     n n n n  n 2   B ∑Y + B ∑ x Y + B ∑ x Y + . . . + B ∑ x Y −  ∑Y  n 1 1i i 2 2i i k ki i i =1 i   0 i =1 i  i =1 i =1 i =1    

468

PROBABILIDAD Y ESTADÍSTICA

El lector debe reconocer el primer componente de la derecha como Syy. En lo sucesivo, se hace referencia a él como la suma total de cuadrados “corregida”. Es una medida de la variabilidad total de los datos. El segundo componente de la derecha se denomina suma de cuadrados de la regresión. Se denota como SSR y cuantifica la variabilidad en Y atribuida a la relación lineal de la media de Y con las variables de predicción. Puesto que: SSE = S yy − SSR

es fácil ver que la SSE es una medida de la variabilidad aleatoria o inexplicada de la variable de respuesta. En otras palabras, ayuda a estimar σ 2. En el ejercicio 23, se delinea un pequeño ejemplo de utilidad para entender el argumento algebraico subyacente a esta deducción. A manera de ilustración, en siguiente término se continúa el estudio del rendimiento de combustible antes iniciado. Ejemplo 12.3.3. En el ejemplo 12.2.3, se determinó que la ecuación de regresión estimada para predecir el rendimiento de combustible de un vehículo con base en su peso y la temperatura ambiente en el momento de conducirlo es:

µˆY |x1 , x2 = 24.75 − 4.16 x1 − 0.014897 x2 Puesto que:  170     n  yi     i∑ =1  282.405  n     X' y = = ∑ x1i y i    i =1    n  x2 i y i   8 887   i∑ =1     

se cuenta ya con gran parte de la información necesaria para calcular la SSE. El único término adicional necesario es Σni = 1 y i2 .Un rápido cálculo lleva a un valor de 2 900.46 para dicho término. Luego de sustituir, se tiene:

 10  10  2 S yy = 10 ∑ y i2 −  ∑ y i   10 = [ 2 900.46 − (170) 2 ]/ 10 = 10.46  i = 1    i = 1 10 10 10  10  2 SSR = b0 ∑ y i + b1 ∑ x1i y i + b2 ∑ x2 i y i −  ∑ y i  10 i=1 i=1 i=1 i =1 

= 24.75(170) − 4.16( 282.405) − 0.014897(8 887) − (170) 2 /10 = 10.31 Por sustracción: SSE = S yy − SSR = 10.46 − 10.31 = 0.15 Así pues:

σˆ 2 = s 2 = SSE /(n − k − 1) = 0.15 /(10 − 2 − 1) = 0.0214

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

469

En el ejemplo 12.2.3, se determinó que la matriz (X'X )−1 de estos datos es:  6.070769 −3.02588 −0.0171888    1.738599 0.002166306  ( X' X ) −1 = −3.02588 −0.0171888 0.002166306 0.0002582903

Puesto que Var βˆ = σ 2(X'X )−1, encontrar las estimaciones de las varianzas de B0, B1 y B2 requiere multiplicar cada número de la diagonal principal de (X'X )−1 por σˆ 2 . De tal suerte:

Var B0 = 6.070769(0.0214)

0.1299

Var B1 = 1.738599(0.0214)

0.0372

Var B2 = 0.0002582903(0.0214)

0.000005

En la práctica, gran parte de esos cálculos se dejan en manos de la computadora. Sin embargo, en la interpretación correcta de los impresos de computadora reviste importancia entender qué se hace.

12.4

ESTIMACIÓN DE INTERVALOS

Al igual que en capítulos previos, es útil ampliar una estimación puntual de un parámetro a otra de intervalos, de modo que pueda evaluarse su exactitud. Aquí, se consideran tres tipos de intervalos, a saber: 1. Intervalos de confianza para los parámetros β0, β1, β2, . . . , βk del modelo lineal general. 2. Intervalo de confianza para µY | x , x , . . . , x , la respuesta media para un conjunto dado de valores de las variables de predicción. 3. Intervalo de predicción para Y |x1, x2, . . . , xk, una respuesta individual para un conjunto dado de valores de las variables de predicción. 1

2

k

Intervalo de confianza para los coeficientes Recuerde que una forma de expresar el modelo lineal general es: Yi = β0 + β1 x1i + β2 x2i + . . . + β k x ki + E i donde se supone que E1, E2, . . . , En son variables aleatorias independientes, cada una con media 0 y varianza σ 2. Ahora, se incluye el supuesto adicional de que esas variables aleatorias tienen distribución normal. A su vez, ello implica que se parte de la idea de que las variables aleatorias Y1, Y2, . . . , Yn son independientes y de distribución normal. En forma matricial, se sabe que los estimadores B0, B1, B2, . . . , Bk están dados por: βˆ = ( X' X )−1 X' Y Puesto que (X'X )−1X' es una matriz de constantes, cada componente del vector(X'X )−1X' Y es una combinación lineal de las variables aleatorias Y1, Y2, . . . , Yn. Toda combinación lineal de variables aleatorias normales e independientes también es normal, de modo que es fácil ver que cada uno de los estimadores B0, B1, B2, . . . , Bk es asimismo una variable aleatoria normal. Se sabe que esos estimadores son insesgados para sus parámetros respectivos. La matriz de varianza-covarianza de βˆ es ( X'X )−1σ 2 . Las varianzas de B0, B1, B2, . . . , Bk están dadas por c00σ 2, c11σ 2, . . . , ckkσ 2, respectivamente, donde cii denota el elemento de la diagonal principal en la fila i + 1 de la matriz(X'X )−1. La variable aleatoria:

470

PROBABILIDAD Y ESTADÍSTICA

Z=

βˆi − βi σ cii

es normal estándar. Puesto que se desconoce σ, se le sustituye con su estimador S = SSE /( n − k −1) para formar la variable aleatoria Tn – k – 1: Tn − k − 1 =

βˆi − βi S cii

Esta variable aleatoria tiene la misma estructura algebraica que muchas otras ya analizadas. Así pues, se sabe que los límites de confianza de βi están dados por: Límites de confianza para βi , el i-ésimo parámetro del modelo lineal general

βˆi ± tα / 2 S cii , donde el punto tα / 2 es el punto apropiado con base en la distribución Tn – k – 1. Un ejemplo muestra el uso de estos límites. Ejemplo 12.4.1. A fin de predecir el rendimiento de combustible (millaje) de un automóvil con base en su peso y la temperatura en el momento de conducirlo, se desarrolló la adecuación de regresión (véase el ejemplo 12.2.3):

µY | x1 , x2 = 24.75 − 4.16 x1 − 0.014897 x2 En el ejemplo 12.3.3, se determinó que s2 = 0.0214 y, por ende, s = s 2 = 0.1463. La matriz de varianzacovarianza es:  6.070769 −3.02588 −0.0171888    −1 2 1.738599 0.002166306  σ 2 ( X' X ) σ = −3.02588 −0.0171888 0.002166306 0.0002582903 Un intervalo de confianza de 95% para β0, la intersección de este modelo, es: βˆ ± t s c 0

α /2

00

Puesto que n = 10 y k = 2, el número de grados de libertad relacionado con el punto t0.025 es 10 − 2 − 1 = 7. El intervalo de confianza está dado por:

24.75 ± 2.365(0.1463) 6.070769 o 24.75 ± 0.853. Puesto que 0 no se incluye en el intervalo, se tiene evidencia suficiente de que β0 ≠ 0.

Intervalo de confianza para la media estimada Es posible formar intervalos de confianza del tipo recién descrito; pero otro tipo más útil es el intervalo para el valor de la media de la variable de respuesta con un conjunto específico de valores de las variables de predicción. Se denotan los valores que interesan con x10, x20, . . . , xk0, y se advierte que esos valores no se usan necesariamente para desarrollar la ecuación de regresión. Se sabe que un estimador insesgado para esta media es:

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

µˆ Y | x

10

471

= βˆ0 + βˆ1 x10 + βˆ2 x20 + . . . + βˆ k x k 0

, x20 , ... , x k 0

A fin de encontrar la varianza de ese estimador, se escribe en forma matricial como:

µˆ Y |x

10

, x20 , ... , x k 0

= x'0βˆ

donde x'0 = [1 x10 x20 . . . x k 0 ]. Con el uso de la regla matricial de la varianza, se tiene: Var µˆ Y | x

10

, x20 , ... , x k 0

= Var x'0βˆ = x' Var βˆ x 0

0

= x'0σ 2 ( X'X )−1 x 0 = σ 2 x'0 ( X'X )−1 x 0

La estandarización y sustitución de σ 2 con su estimador insesgado S 2 lleva a obtener la variable aleatoria Tn – k – 1:

µˆ Y | x

10

, x20 , ... , x k 0

− µY | x

10

, x20 , ... , x k 0

−1

S x 0' ( X'X ) x 0 Es fácil ver que los límites de un intervalo de confianza de 100(1 − α)% para µY | x

10

, x20 , ... , x k 0

son:

Límites de confianza para µY | x , x , . . . , x , la respuesta media para un conjunto dado de valores de las variables de predicción 10

µˆ Y |x

10

, x20 , ... , x k 0

20

k0

± tα /2 S x ′0 ( X'X )−1 x 0

donde el punto tα/2 es el punto apropiado con base en la distribución Tn – k – 1. El ejemplo siguiente ilustra esta idea. Ejemplo 12.4.2. En el ejemplo 12.2.3, se estima el consumo de combustible promedio de un vehículo con peso de 1.5 ton que se conduce en un día con temperatura ambiente de 70°F mediante la ecuación:

µˆY | x10 , x20 = 24.75 − 4.16(1.5) − 0.014897(70) = 17.47 A continuación, se calcula un intervalo de confianza de 95% para este valor medio. El vector x′0 necesario está dado por: x'0 = [1 1.5 70] Con base en trabajos previos, se sabe que:

 6.070769 −3.02588 −0.0171888    1.738599 0.002166306  ( X'X ) −1 = −3.02588 −0.0171888 0.002166306 0.0002582903 y que s = 0.1463. Un sencillo cálculo matricial permite obtener: x'0 ( X'X ) −1 x0

0.22

472

PROBABILIDAD Y ESTADÍSTICA

Con base en la distribución Tn – k – 1 = T10 – 2 – 1 = T7, un intervalo de confianza de 95% del rendimiento de combustible (millaje) promedio cuando x1 = 1.5 y x2 = 70 es:

µˆY | x10 , x20 ± tα / 2 S

x'0 ( X'X ) −1 x0

o 17.47 ± 2.365(0.1463) 0.22 17.47 ± 0.16 Puede tenerse confianza de 95% de que el rendimiento de combustible promedio de vehículos con peso de 1.5 ton en un día con temperatura ambiente de 70°F se ubica entre 17.31 y 17.63 millas por galón (mi/gal).

Intervalo de predicción sobre una sola respuesta pronosticada Los límites de confianza de una respuesta específica con un conjunto de valores dados de las variables de predicción son similares a los del valor medio. Al igual que en el caso de la regresión lineal simple, la única diferencia radica en que la varianza del estimador tiene valor poco más alto. Los límites asumen la forma: Límites de predicción de Y |x10, x20, . . . , xk0, una respuesta específica para un conjunto dado de valores de las variables de predicción Yˆ | x10 , x20 ,..., x k 0 ± tα / 2 S 1 + x 0' ( X' X )−1x donde el punto tα/2 es el punto apropiado con base en la distribución Tn – k – 1. Con fines de ilustración, se calcula en siguiente término un intervalo de predicción de 95% del rendimiento de combustible (millaje) obtenido con un automóvil específico de 1.5 ton de peso conducido a 70°F. Ejemplo 12.4.3. Del trabajo del ejemplo previo, se sabe que µˆY |x10 , x20 = Yˆ | x10 , x20 = 17.47, s = 0.1463, x'0 ( X' X ) −1 x0 = 0.22. El intervalo de predicción de 95% que interesa está dado por: Yˆ | x , x ± t s 1 + x' ( X'X ) −1 x 10

20

α /2

0

0

o 17.47 ± 2.365(0.1463) 1 + 0.22 17.47 ± 0.38 Puede tenerse confianza de 95% de que un automóvil dado, con peso de 1.5 ton, tendrá rendimiento de combustible de 17.09 a 17.85 mi/gal cuando se conduce con temperatura ambiente de 70°F.

12.5 PRUEBAS DE HIPÓTESIS ACERCA DE LOS PARÁMETROS DEL MODELO En esta sección, se consideran tres tipos de hipótesis concernientes a los parámetros del modelo lineal general, a saber: 1. Hipótesis sobre el valor de un parámetro del modelo específico βi. 2. Hipótesis acerca de la significación del modelo de regresión en su totalidad. 3. Hipótesis acerca de la efectividad de un subconjunto del conjunto original de variables de predicción.

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

473

Pruebas de una sola variable de predicción En ocasiones, el experimentador supone que una variable de predicción específica dista en realidad de ser muy útil. A fin de decidir si es así o no, se prueba la hipótesis nula de que el coeficiente de esa variable es 0. En otras palabras, se intenta probar:

H 0 : βi = 0 H1 : β i ≠ 0 Es fácil obtener la estadística de prueba usada. Se sabe que la variable aleatoria:

βˆi − βi S cii tiene distribución T con n − k − 1 grados de libertad. Si H0 es verdadera, entonces la estadística: Estadística de prueba de H0: βi = 0

βˆi − 0 S cii tiene distribución Tn – k – 1. Se rechaza H0 con los valores de esa estadística demasiado pequeños o grandes para haber ocurrido al azar. En caso de rechazarla, se tiene evidencia de que βi ≠ 0. De ser así, la variable de predicción Xi es útil en la predicción del valor de la respuesta. Si no se rechaza H0, entonces la variable de predicción Xi es innecesaria en el modelo que contiene las otras variables de predicción. Por supuesto, es factible poner a prueba valores nulos diferentes de 0. Sin embargo, este último es el valor más común en la práctica. También pueden efectuarse pruebas de una cola, si así se prefiere.

Pruebas para una regresión significativa Una hipótesis más interesante es la hipótesis nula de que la regresión es “no significativa”. En otras palabras, se pretende probar la hipótesis nula de que la ecuación de regresión no explica una proporción considerable de la variabilidad en la variable de respuesta, contra la hipótesis alterna de que sí la explica. En lo matemático, se pone a prueba: H0: β1 = β2 = . . . = βk = 0 H1: βi ≠ 0 para al menos una i, con i = 1, 2, . . . , k Se tienen ya los cimientos para desarrollar una estadística de prueba lógica. Se demostró que SSE, la suma de cuadrados de los residuos, puede expresarse como: SSE = Syy − SSR Al rescribir esta expresión, puede verse que: Syy = SSE + SSR En otras palabras, la variabilidad total de la respuesta, Syy, puede dividirse en dos componentes. Se trata de SSE, la variabilidad inexplicada o residual en torno a la línea de regresión, y SSR, la variabi-

474

PROBABILIDAD Y ESTADÍSTICA

lidad de Y atribuida a la relación lineal de las variables de predicción con la media de Y. Si la regresión es significativa, entonces SSR debe ser grande en comparación con SSE. En la estadística de prueba, se aprovecha esa idea. En particular, se usa la estadística: Prueba para una regresión significativa SSR / k SSR / k = SSE /( n − k − 1) S2

para probar H0. Puede demostrarse que, si H0 es verdadera, entonces esa estadística tiene distribución F, con k y n – k – 1 grados de libertad. La prueba se rechaza para valores altos de la estadística de prueba. A fin de ilustrar la idea, se regresa de nuevo a la ecuación de regresión lineal múltiple desarrollada para predecir el rendimiento de combustible con base en el peso del vehículo y la temperatura en el momento de su conducción. Se analiza si ese modelo explica una proporción significativa de la variabilidad observada en la variable de respuesta o no. Ejemplo 12.5.1.

Con base en trabajos previos, se tiene la información siguiente (véase ejemplo 12.3.3): n = 10

S yy = 10.46

k=2

SSE = 0.15

SSR = 10.31

A fin de probar: H0: β1 = β2 = 0 H1: βi ≠ 0 para alguna i se evalúa la estadística Fk, n − k − 1 = F2,10 − 2 − 1: SSR / k SSE /( n − k − 1) En relación con esos datos, la estadística tiene el valor:

10.31/ 2 = 240.56 0.15 / 7 Es posible, con base en la distribución F2, 7, rechazar H0 con P < 0.05. Se tiene buena evidencia estadística de que β1 y β2 difieren de 0.

Una vez que se sabe que la regresión es significativa, es natural preguntarse: “¿Cuál proporción de la variabilidad total de Y se explica con el modelo de regresión ajustado?” A fin de responderla, hay que trazar paralelismo con lo que se hace en el caso de la regresión lineal simple. Se define lo que se llama coeficiente de determinación múltiple. Esta estadística, que se denota con R2, está definida por: Coeficiente de determinación múltiple R2 =

SSR S yy

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

475

Cuando se multiplica R2 por 100%, se obtiene un porcentaje de la variación de Y que explica la ecuación de regresión ajustada. Los valores de R2 cercanos a 1 se consideran indicativos de que el modelo explica satisfactoriamente los datos. La raíz cuadrada de R2 se llama coeficiente de correlación múltiple entre Y y las variables de predicción. En el ejemplo precedente:

R2 =

SSR 10.31 = = 0.9857 S yy 10.46

El modelo ajustado explica 98.57% de la variación observada en Y. Es posible otra interpretación de R2. Advierta que, si un modelo explica satisfactoriamente la variación de Y, entonces las respuestas pronosticadas por el modelo, Yˆ , deben concordar de modo igualmente satisfactorio con las observadas en realidad, ya que de lo contrario existen diferencias sustanciales entre las respuestas observadas y pronosticadas. Ello lleva a suponer que existe relación de R2 con pˆ, el estimador del coeficiente de correlación de Pearson entre Y y Yˆ. De hecho, es factible demostrar que R2 = pˆ 2 . Así pues, la relación lineal estrecha entre Y y Yˆ genera valores altos de R2, y viceversa. Las respuestas observadas y pronosticadas con el modelo, en relación con los datos del ejemplo 12.2.3, se enumeran a continuación: y real 17.9 16.5 16.4 16.8 18.8 15.5 17.5 16.4 15.9 18.3

yˆ predicha

17.793 16.399 16.486 16.666 18.820 15.552 17.349 16.368 16.086 18.479

Como puede verse, las respuestas pronosticadas concuerdan estrechamente con las observadas. Así 2 pues, pˆ debe estar cerca de 1 y R2 = pˆ ha de tener valor grande. Un cálculo rápido permite obtener 2 2 pˆ = 0.9932 y R = pˆ = 0.9864. Ello concuerda con el valor antes determinado, aparte del error de redondeo. A fin de comprender mejor la lógica subyacente a la prueba F de una regresión significativa, a continuación se rescribe la estadística de prueba con base en R2: Fk , n − k − 1 =

=

=

SSR / k SSE /( n − k − 1) SSR / k S yy SSE /( n − k − 1) S yy R2 /k (1 − R ) /( n − k − 1) 2

476

PROBABILIDAD Y ESTADÍSTICA

En esa expresión, puede verse claramente que la estadística F es, aparte de la múltiple constante (n − k − 1)/k, la proporción de la variación explicada sobre la variación inexplicada de Y. Es natural que pueda afirmarse que la regresión es significativa sólo cuando la proporción de variación explicada es grande. Ello ocurre únicamente si la razón F tiene valor alto. Por ello, la prueba F siempre se usa para rechazar los valores de F demasiado grandes para haber ocurrido al azar.

Pruebas acerca de un subconjunto de variables de predicción Suele ser aconsejable encontrar el modelo más sencillo que encaje satisfactoriamente en los datos, inclusive cuando se determina que la regresión es significativa con un modelo específico. ¿Por qué usar 10 variables de predicción si bastan 3? Puede efectuarse una prueba formal que posibilite al experimentador determinar si un subconjunto de las variables de predicción originales es suficiente para fines de predicción. A fin de ver cómo se logra ello, sean X1, X2, X3, . . . , Xk las variables de predicción originales. El modelo que se considera está dado por:

µY |x , x , ... , x = β0 + β1 x1 + β2 x2 + . . . + β k x k 1

2

k

A éste se lo denomina modelo completo. Suponga que se propone reducir el número de variables de predicción mediante la eliminación de todas ellas, salvo m variables. Sin pérdida de la generalidad, suponga que se conservan las primeras m variables. El nuevo modelo, llamado modelo reducido, está dado por: µY |x , x , ... , x = β0 + β1 x1 + β2 x2 + . . . + βm xm 1

2

m

Interesa elegir entre los modelos reducido y completo. Ello se logra al poner a prueba: H0: el modelo reducido es apropiado H1: el modelo completo es necesario El método usado para probar H0 es de naturaleza más bien intuitiva. En primer término, se calcula el residuo o suma de los cuadrados de los errores del modelo completo, en la forma usual. Se denota esta suma de los cuadrados con SSEf , que representa la estadística basada en el modelo completo, el cual contiene todas las k variables de predicción originales. Luego, se encuentra la suma de cuadrados de los residuos del modelo reducido. Esta suma se denota con SSEr, que indica el uso de un subconjunto de las variables de predicción en el cálculo. Se sabe que la suma de cuadrados de los residuos de un modelo dado refleja la variación de la variable de respuesta inexplicada con el modelo. Si las variables de predicción Xm + 1, Xm + 2, . . . , Xk son importantes, eliminarlas del modelo debe originar el aumento significativo de la variación inexplicada de Y. En otras palabras, SSEr debe volverse mucho mayor que SSEf . En la estadística de prueba, se aprovecha esa idea. Está dada por:

Estadística de prueba de H0: el modelo reducido es apropiado Fk − m , n − k − 1 =

(SSE r − SSE f )/( k − m) SSE f /( n − k − 1)

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

477

Note que el modelo reducido es tan satisfactorio como el completo en la explicación de la variabilidad observada en la variable de respuesta, si H0 es verdadera. En este caso, no difiere mucho el valor de SSEf y SSEr, es pequeña la diferencia SSEr – SSEf y la razón F también tiene valor bajo. Por otra parte, el modelo reducido es inapropiado cuando H0 no es verdadera. En este caso, SSEr es mucho mayor que SSEf , SSEr – SSEf es grande y la razón F tiene valor alto. La lógica indica que se rechace H0 y se acepte H1 con valores de la estadística de prueba demasiado grandes para haber ocurrido al azar, con base en la distribución Fk – m, n – k – 1. Aunque ello parezca complejo, un ejemplo sencillo debe aclararlo. Ejemplo 12.5.2. Se tienen dos modelos propuestos para la predicción del rendimiento de combustible de un automóvil. Uno se basa en la predicción del peso del vehículo y la temperatura ambiental en el momento de su conducción, mientras que en el otro sólo usa el peso del automóvil en la predicción. El primero es el modelo completo, y el segundo, el reducido. Se ponen a prueba: H0: el modelo reducido es apropiado H1: el modelo completo es necesario Con base en trabajos previos (véase ejemplos 11.3.3 y 12.3.3), se sabe que: SSEr = 1.01

SSEf = 0.15

n = 10

El modelo completo incluye dos variables de predicción, y el modelo reducido, sólo una, de modo que k = 2 y m = 1. El valor observado de la estadística de prueba es: Fk − m, n − k − 1 =

(SSE r − SSE f ) /( k − m) SSE f /( n − k − 1)

(1.01 − 0.15) /( 2 − 1) 0.15 /(10 − 2 − 1) = 40.13

=

Puede rechazarse H0, con P < 0.05, a partir de la distribución F1, 7. Se llega a la conclusión de que agregar la variable X2, la temperatura ambiental con la cual se conduce el automóvil, mejora el modelo original.

12.6

USO DE VARIABLES INDICADORAS

En la sección previa, se analiza la regresión lineal múltiple cuando todas las variables independientes (de predicción) son cuantitativas, como la altura o estatura, temperatura, tiempo o presión. En ocasiones, es necesario usar variables cualitativas o categóricas. Variables como el género, grupo racial, turno laboral y marca o tipo de producto son cualitativas, sin que se cuente con una escala natural para su medición. En tales casos, se usan variables indicadoras en el modelo para considerar el efecto que la variable tiene en la respuesta. La idea se ilustra en el ejemplo 12.6.1. Ejemplo 12.6.1. Considere el ejemplo 11.1.1, en el cual se usa la regresión lineal simple para estudiar la relación entre la humedad X y la magnitud de evaporación del solvente Y de una pintura basada en agua. Suponga que se repite el estudio con dos marcas de pintura, A y B. Se piensa que la humedad generalmente afecta de la misma manera a ambas pinturas, si bien la respuesta de las dos marcas sería

478

PROBABILIDAD Y ESTADÍSTICA

sistemáticamente distinta. Así pues, el modelo de regresión planteado debe contener dos variables de predicción, x1, la humedad, y x2, una variable que permite codificar el tipo de pintura usado. El modelo se convierte en:

µY |x1 , x2 = β0 + β1x1 + β2 x2 donde sea que: 1 si se usa la pintura A x2 =  0 si se usa la pintura B

La variable x2 se llama variable indicadora, ya que sirve para indicar la presencia o ausencia de la pintura A. A fin de determinar si es útil la variable cualitativa, además de la humedad, en la predicción del valor de Y, se ponen a prueba: H0 : β2 = 0 H1 : β2 ≠ 0

Ello puede hacerse con la prueba T o la prueba F equivalente, descrita en la sección 12.5.

Considere un experimento de una variable indicadora. Si se rechaza H0: β2 = 0, se tiene evidencia de que la variable cualitativa es importante en el modelo. En este caso, se trata en realidad de dos modelos separados. Por ejemplo, en el experimento de pintura con β2 ≠ 0 y uso de la pintura A, el modelo se transforma en:

µY | x , x = β0 + β1 x1 + β2 (1) 1

2

o

µY | x , x = (β0 + β2 ) + β1 x1 1

2

En otras palabras, la relación entre la media de evaporación del solvente y humedad es una recta con pendiente β1 e intersección β0 + β2. Sin embargo, cuando se usa la pintura B, el modelo es:

µY | x , x = β0 + β1 x1 + β2 (0) 1

2

o

µY | x , x = β0 + β1 x1 1

2

Esas ecuaciones representan una recta con pendiente β1 e intersección β0. Advierta que estos modelos son lineales, con la misma pendiente e intersecciones distintas. Así pues, siempre que se rechace H0: β2 = 0, en realidad se llega la conclusión de que se trata de dos líneas de regresión paralelas con intersecciones diferentes. La distancia vertical estimada entre estas dos rectas es la diferencia estimada entre las intersecciones, a saber, βˆ2 .

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

479

Ejemplo 12.6.2. Se obtienen los datos siguientes respecto del estudio descrito en el ejemplo 12.6.1: Humedad relativa, x1 (%)

Presencia de la pintura A, x2

Evaporación del solvente, y (% de peso)

35.3 29.6 31.0 58.0 62.0 72.1 74.0 77.0 71.1 57.0 46.4 29.6 28.0 39.1 46.8 48.5 59.3 70.0 70.0 74.4 72.1 58.1 44.6 33.4 28.6

1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0

11.2 11.0 12.6 8.3 10.1 9.6 6.1 8.7 8.1 9.0 8.2 13.0 11.7 6.7 7.7 6.8 7.0 5.2 4.0 5.7 4.9 5.5 6.1 7.5 8.0

La matriz de especificación del modelo está dada por: 1 1  .. . 1 X= 1 1.  .. 1

35.3 1 29..6 1.  .. ..  28.0 1 39.1 0 46..8 .0 .. ..  28.6 0

Con ayuda de la computadora, puede demostrarse que:

 0.488429 −0.00753783 −0.0993029   ( X' X ) = −0.00753783 0.0001402605 0.0002971544 0.0002971544 0.160886  −0.0993029 −1

y que:

βˆ0 = 10.3979 βˆ2 = 3.3938 s = σˆ = 1.0185 βˆ1 = −0.0770 σˆ 2 = 1.0374

480

PROBABILIDAD Y ESTADÍSTICA

La estadística T usada para probar H0: β2 = 0 es:

Tn − k − 1 = T25 − 2 − 1 =

βˆ2 − 0 s c22

3.3938 1.0185 0.160886 = 8.3074 =

Es posible rechazar H0 con P < 0.0005 a partir de esa estadística. Puede llegarse a la conclusión de que el tipo de pintura usado es un factor importante en la predicción de la magnitud de evaporación del solvente. El modelo estimado es:

µˆY | x1 , x2 = 10.3979 − 0.0770 x1 + 3.3938 x2 El modelo cuando se usa la pintura A es:

µˆY | x1 , x2 = 10.3979 − 0.0770 x1 + 3.3938(1) o

µˆY | x1 , x2 = 13.7917 − 0.0770 x1 El modelo para la pintura B es:

µˆY | x1 , x2 = 10.3979 − 0.0770 x1 + 3.3938(0) o

µˆY |x1 , x2 = 10.3979 − 0.0770 x1 Note que, como se afirmó, estas líneas de regresión estimadas tienen la misma pendiente, a saber, –0.0770, e intersecciones distintas. Éstas difieren en βˆ2 = 3.3938.

Puesto que al rechazar H0: β2 = 0 se tienen dos líneas de regresión, es natural preguntarse: “¿Por qué modelarlas de esta manera, en vez de usar simplemente dos líneas de regresión separadas?” La razón es que al combinar los datos de los dos grupos se obtienen mejores estimaciones de la pendiente común β1 y de la varianza común σ 2. Es factible usar una estrategia similar con factores cualitativos que tienen más de dos niveles. Por ejemplo, si se cuenta con tres tipos de pintura, A, B y C, se requieren dos variables indicadoras para codificar el tipo de pintura usado. A manera de ilustración, con los tres tipos de pintura el modelo se convierte en:

µY | x , x , x = β0 + β1 x1 + β2 x2 + β3 x3 1

2

3

donde x1 denota la humedad, mientras que x2 y x3 están dadas por: x2 = 0 y x3 = 0 x2 = 1 y x3 = 0 x2 = 0 y x3 = 1

si se usa el tipo A si se usa el tipo B si se usa el tipo C

En general, cuando una variable cualitativa tiene l niveles, entonces se necesitan l − 1 variables indicadoras para codificar los niveles de la variable.

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

481

En el modelo recién analizado, se supone que la variable cuantitativa x1 afecta de la misma manera a todos los niveles de la variable cualitativa. Dicho de otra forma, se piensa que se tienen buenas razones para creer que las líneas de regresión de cada nivel de la variable cualitativa tienen la misma pendiente, posiblemente con intersecciones distintas. Si se sabe que no es así, entonces se necesita un modelo distinto para probar la igualdad de las pendientes. En el caso de una variable indicadora x2, con dos niveles, un modelo apropiado es:

µY | x , x = β0 + β1 x1 + β2 x2 + β3 x1 x2 1

2

Advierta que en el caso x2 = 1 el modelo se convierte en:

µY | x , x = β0 + β1 x1 + β2 + β3 x1 1

2

o

µY | x , x = (β0 + β2 ) + (β1 + β3 ) x1 1

2

Cuando x2 = 0, el modelo se reduce a:

µY | x , x = β0 + β1 x1 1

2

Debe quedar claro que para verificar la igualdad de las pendientes se ponen a prueba:

H 0: β3 = 0 H1: β3 ≠ 0 mediante las pruebas T o F descritas en la sección 12.5. Como puede ver el lector, aunque el uso de las variables indicadoras es un tanto complejo, en el análisis se usan sólo técnicas ya estudiadas. Puede encontrar lecturas adicionales sobre el uso de las variables indicadoras en [12] y [39].

12.7

CRITERIOS DE SELECCIÓN DE VARIABLES

Puede verse que la selección del modelo idóneo dista de ser un problema insignificante. En el caso de la regresión polinomial, el experimentador debe decidir el grado de polinomio que usará. En la regresión lineal múltiple, tiene que determinar cuál de las variables de predicción disponibles permite obtener el modelo adecuado más sencillo. La selección de un modelo definitivo es, en muchos aspectos, un arte más que una ciencia. Está claro que la experiencia resulta valiosa. Sin embargo, se cuenta con varios procedimientos más bien estandarizados que ayudan en el proceso de selección del modelo. Muchos de esos procedimientos forman parte de los paquetes de software estadístico estándar. El uso de estos paquetes es directo y, de tal suerte, libera al experimentador de los trabajos de cálculo del análisis de regresión. Sin embargo, es importante entender para qué sirven esos procedimientos. A continuación, se resumen algunos de ellos. El problema básico es encontrar un modelo tan sencillo como sea posible que tenga “buen ajuste”. Puesto que R2 es la proporción de la variabilidad de la respuesta explicada con la ecuación de regresión ajustada, es evidente que se pretende que R2 tenga valor alto. Sin embargo, muchos modelos ajustados se usan en última instancia para fines de predicción. Note que la amplitud de los intervalos de confianza para βi , µY | x , x , . . . , x y Y |x1, x2, . . . , xk depende en parte de la estadística S 2 = SSE/(n − k − 1). Interesa que S 2 i

2

k

482

PROBABILIDAD Y ESTADÍSTICA

tenga valor pequeño, para obtener intervalos de confianza angostos y estimaciones precisas de esas entidades. Esa estadística se denomina error cuadrático medio. En cualquier momento, es posible aumentar el valor de R2 con la adición de más términos al modelo. Sin embargo, agregar variables innecesarias haría que se incremente el error cuadrático medio. Así pues, la tarea verdadera es equilibrar estas dos mediciones de la bondad de ajuste del modelo. Por principio de cuentas, se consideran algunos métodos muy usados para elegir un modelo apropiado. Cada uno de esos métodos se basa en la estadística R2.

Modelo de selección hacia adelante En el proceso de selección hacia adelante, se añaden variables al modelo, una por una, hasta que agregar una variable más no lo mejore significativamente. En otras palabras, la adición de variables continúa hasta que sea imposible rechazar el modelo reducido. Ejemplo 12.7.1. Suponga que se tienen tres posibles variables de predicción X1, X2 y X3. Suponga también que el modelo final con la selección hacia adelante sólo contiene las variables X3 y X1, que se añaden al modelo en ese orden. Los pasos en la computadora son los siguientes: 1.

Ajustar los tres modelos de variable única:

µY | x1 = β0 + β1x1 µY | x2 = β0 + β2 x2 µY | x3 = β0 + β3 x3 Se calcula el valor de R para cada uno. Se elige el que tenga el valor más alto de R2 y se compara contra el modelo reducido µY = β0. En este caso, se prueban: 2

H0: µY = β0

(el modelo reducido es apropiado)

H1: µY | x3 = β0 + β3 x3

(el modelo completo es necesario)

y se rechaza H0. Ahora, se incluye la variable X3 en el modelo. 2.

Ajustar los dos modelos de dos variables:

µY | x3 , x1 = β0 + β1x1 + β3 x3 µY | x3 , x2 = β0 + β2 x2 + β3 x3 Se calcula el valor de R2 de cada uno. Se selecciona el modelo con el valor más alto de este parámetro y se compara contra el modelo reducido µY | x3 = β0 + β3 x3. En esta ocasión, se intenta probar: H0 : µY | x3 = β0 + β3 x3

(el modelo reducido es apropiado)

H1: µY | x3 , x1 = β0 + β1x1 + β3 x3

(el modelo completo es necesario)

y se rechaza H0. A continuación, se incluye la variable X1 en el modelo. 3.

Ajustar el modelo de tres variables:

µY | x1 , x2 , x3 = β0 + β1x1 + β2 x2 + β3 x3 y se ponen a prueba:

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

H0 : µY | x1 , x3 = β0 + β1x1 + β3 x3

483

(el modelo reducido es apropiado)

H1: µY | x1 , x2 , x3 = β0 + β1x1 + β2 x2 + β3 x3

(el modelo completo es necesario)

En este caso, no se rechaza H0. La variable X2 parece ser innecesaria en el modelo. El modelo final que se obtiene es el de dos variables:

µY | x1 , x3 = β0 + β1x1 + β3 x3

Como puede ver, resulta impráctico efectuar a mano este tipo de análisis. El problema se simplifica con el uso de una computadora.

Procedimiento de eliminación hacia atrás Otro método de selección de modelo es la llamada eliminación hacia atrás. En ésta, se parte del modelo que incluye todas las posibles variables de predicción. Éstas se eliminan una por una del modelo hasta que la eliminación de una variable haga que se rechace el modelo reducido. Ejemplo 12.7.2. Suponga que se tienen tres posibles variables de predicción y que con la eliminación hacia atrás se obtiene un modelo reducido que sólo incluye la variable X2. Suponga también que se eliminan las variables X1 y X3 en el orden mencionado. Los pasos son los siguientes: 1.

Ajustar el modelo completo:

µY | x1 , x2 , x3 = β0 + β1x1 + β2 x2 + β3 x3 2.

se calcula el valor de R2. Ajustar los tres modelos de dos variables:

µY |x1 , x2 = β0 + β1x1 + β2 x2 µY |x1 , x3 = β0 + β1x1 + β3 x3 µY |x2 , x3 = β0 + β2 x2 + β3 x3 Se determina el valor de R2 de cada una. Se elige el modelo con el valor más alto de R2 y se compara contra el modelo completo. En este caso, se ponen a prueba: H0: µY | x2 , x3 = β0 + β2 x2 + β3 x3

(el modelo reducido es apropiado)

H1: µY | x1 , x2 , x3 = β0 + β1x1 + β2 x2 + β3 x3

3.

(el modelo completo es necesario)

y es imposible rechazar H0. Se elimina la variable X1 del modelo, puesto que al parecer resulta adecuado el modelo reducido. Ajustar los modelos de variable única:

µY |x2 = β0 + β2 x2 µY |x3 = β0 + β3 x3 En este caso, se ponen a prueba: H0 : µY |x2 = β0 + β2 x2

(el modelo reducido es apropiado)

H1 : µY | x2 , x3 = β0 + β2 x2 + β3 x3

(el modelo completo es necesario)

y no puede rechazarse H0. Se elimina la variable X3 del modelo, puesto que parece ser innecesaria.

484

PROBABILIDAD Y ESTADÍSTICA

4.

Ajustar el modelo µY = β0 y probar: H0: µY = β0 H1: µY | x2 = β0 + β2 x2

En esta ocasión, se rechaza H0 y queda el modelo que contiene una variable de predicción, X2.

El tercer método de selección de variables de uso generalizado es la llamada regresión escalonada.

Método escalonado La regresión escalonada es una versión modificada del proceso de selección hacia adelante. En la selección hacia adelante, las variables que entran al modelo permanecen en él. Desgraciadamente, es posible que una variable que se integra al modelo en etapa avanzada haga que otra variable previamente seleccionada se vuelva poco importante, en virtud de las interrelaciones de las variables. Ello usualmente ocurre cuando las variables mismas guardan relación estrecha entre sí. La selección hacia adelante no considera esta posibilidad. En la regresión escalonada, cada vez que se añade una nueva variable al modelo, se verifica que persista la importancia de todas las variables preexistentes. Resulta difícil la descripción, en términos generales, de qué se hace en la regresión escalonada. Sin embargo, un ejemplo debe servir para aclararlo. Ejemplo 12.7.3. En un modelo de regresión lineal múltiple, las variables X1 y X3 están interrelacionadas estrechamente y la variable X1 es, por sí sola, la mejor variable de predicción. Suponga que el modelo final incluye las variables X2 y X3, con adición de la variable X2 en el segundo paso. Los pasos de la regresión escalonada son: 1.

Ajustar los tres modelos de variable única:

µY | x1 = β0 + β1x1 µY | x2 = β0 + β2 x2 µY | x3 = β3 + β3 x3 Se calcula el valor de R2 para cada uno y se compara el modelo en el que ese valor sea más alto contra el modelo:

µY = β0 En este caso, se prueban: H0 : µY = β0

(el modelo reducido es apropiado)

H1 : µY | x1 = β0 + β1x1

(el modelo completo es necesario)

y se rechaza H0. Se añade la variable X1 al modelo.

MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

2.

485

Ajustar los modelos de dos variables:

µY | x1 , x2 = β0 + β1x1 + β2 x2 µY | x1 , x3 = β0 + β1x1 + β3 x3 Se compara el que tenga valor más alto de R2 contra el modelo precedente. Aquí, se ponen a prueba: H0: µY | x1 = β0 + β1x1

(el modelo reducido es apropiado)

H1: µY | x1 , x2 = β0 + β1x1 + β2 x2

(el modelo completo es necesario)

y se rechaza H0. También se verifica si ahora es necesaria la variable X1. A tal efecto, se prueban: H0: µY | x2 = β0 + β2 x2

(el modelo reducido es apropiado)

H1: µY | x1 , x2 = β0 + β1x1 + β2 x2 3.

(el modelo completo es necesario)

y se rechaza H0. La variable X2 no basta por sí sola. Todavía se necesita X1 en el modelo. Ajustar el modelo:

µY | x1 , x2 , x3 = β0 + β1x1 + β2 x2 + β3 x3 Se ponen a prueba: H0 : µY | x1 , x2 = β0 + β1 x1 + β2 x2

(el modelo reducido es apropiado)

H1: µY |x1 , x2 , x3 = β0 + β1x1 + β2 x2 + β3 x3

(el modelo completo es necesario)

y se rechaza H0. Se agrega la variable X3 al modelo. A fin de ver si aún se necesita la variable X2, se ponen a prueba: H0 : µY | x1 , x3 = β0 + β1x1 + β3 x3

(el modelo reducido es apropiado)

H1 : µY | x1 , x2 , x3 = β0 + β1x1 + β2 x2 + β3 x3

(el modelo completo es necesario)

y se rechaza H0. Ello deja a X2 en el modelo. Para verificar que sea necesaria la variable X1, se prueban las hipótesis siguientes: H0 : µY | x2 , x3 = β0 + β2 x2 + β3 x3

(el modelo reducido es apropiado)

H1: µY | x1 , x2 , x3 = β0 + β1x1 + β2 x2 + β3 x3

(el modelo completo es necesario)

y resulta imposible rechazar H0. En este punto, se elimina X1 del modelo, con lo que queda una ecuación de predicción basada en las variables X2 y X3.

Las tres técnicas recién descritas se han usado durante muchos años y el lector verá referencias a ellas en la literatura. Esas técnicas no siempre llevan al mismo modelo; pero permiten que el investigador encuentre una combinación lineal razonable de regresores sin tener que examinar todas las posibles combinaciones. Ello constituía una ventaja importante en los primeros tiempos de la computación, cuando el ajuste del modelo era un proceso que requería tiempo. El advenimiento de la computación eficaz, de alta velocidad, ha hecho que ahora sea posible examinar todas las combinaciones lineales de regresores. En el caso de un modelo con k regresores, la computadora puede ajustar rápidamente 2k modelos. Algunos resultarían muy adecuados, y otros, inútiles. Las investigaciones recientes se han centrado en técnicas que permitan comparar modelos entre sí. De esa manera, se puede seleccionar el o los modelos que parezcan más adecuados para describir la relación entre el

ANÁLISIS DE VARIANZA

511

CAPÍTULO

13

ANÁLISIS DE VARIANZA

E

n el capítulo 8, se analiza el problema de la prueba de hipótesis sobre la media de una sola población. El problema se amplía a probar la igualdad de dos medias poblacionales en el capítulo 10. En este último caso, interesa principalmente la comparación de medias basadas en muestras independientes de poblaciones normales. Se usan la prueba T agrupada o el procedimiento de Satterthwaite. También se considera la prueba T por pares, método de comparación de medias basado en datos por pares. En el presente capítulo, estos problemas se amplían a la comparación de varias medias poblacionales con un método estadístico llamado análisis de la varianza (ANOVA). Éste es un procedimiento en el que la variación total de una respuesta medida se divide en componentes que pueden atribuirse a fuentes de variación reconocibles. Esos componentes son útiles en la prueba de hipótesis pertinentes. En este capítulo y el 14, se toca un área de la estadística llamada diseño experimental. Es un área importante y amplia de la estadística aplicada que se relaciona con los aspectos prácticos y teóricos del diseño de estudios experimentales. Son tres las fases principales de esos estudios, a saber, formulación del problema, diseño del experimento y análisis de los datos obtenidos. En la fase 1, el investigador define minuciosamente el problema que pretende resolver. Este proceso debe incluir la recopilación de toda la información actualmente conocida acerca del problema, la consideración de otros puntos de vista, la determinación del alcance del estudio y una expresión clara del propósito del estudio mismo. La fase 2 de diseño del estudio, comprende seleccionar la o las variables de respuesta y tratar de prever cuáles otras variables podrían influir en esa respuesta. Se determinan técnicas de control o, por lo menos, de medición de la influencia de esas variables. También se toman en cuenta los costos, tiempo y otras restricciones físicas. En última instancia, son necesarias las decisiones concernientes al número de observaciones que se tomarán, el orden de experimentación y el método de distribución aleatoria que se usará. Luego, se formula un modelo estadístico. En teoría, éste es el que describe el 511

512

PROBABILIDAD Y ESTADÍSTICA

diseño experimental, tiene sencillez suficiente para que se entienda y estudie con las técnicas disponibles de análisis de varianza y permite obtener respuestas estadísticas a las preguntas que se plantean en la fase de formulación. La fase 3 de análisis de los datos recopilados no es difícil cuando el experimento está bien diseñado, ya que se ha previsto el análisis apropiado. En este capítulo, se estudian las técnicas del ANOVA en el caso de diseños experimentales de “factor único”, frecuentes en la práctica. En este contexto, “factor único” significa que el diseño se centra en un solo factor primario que puede influir en la respuesta. Por ejemplo, en un estudio sobre la viscosidad de un aceite para motor específico, podría pensarse en la temperatura del aceite como factor, mientras que en otro sobre la rapidez con la que un algoritmo ordena un arreglo aleatorio, el científico consideraría como factor el grado de desorden inicial del arreglo. Los experimentos multifactoriales son tema del capítulo 14.

13.1 MODELO DE EFECTOS FIJOS DE CLASIFICACIÓN UNIDIRECCIONAL Suponga que interesa comparar las medias de k poblaciones. La situación experimental podría ser cualquiera de las siguientes: 1. Se tienen k poblaciones, cada una identificada por alguna característica común que se estudiará en el experimento. Se seleccionan muestras aleatorias independientes de tamaños n1, n2, . . . , nk, respectivamente, de cada una de las k poblaciones. Las diferencias observadas en las respuestas medidas se atribuyen a diferencias básicas entre las k poblaciones. 2. Se tiene un conjunto de N unidades experimentales homogéneas y se pretende estudiar los efectos de k tratamientos distintos. Esas unidades se dividen aleatoriamente en k subgrupos de tamaños n1, n2, . . . , nk y cada subgrupo recibe un tratamiento experimental diferente. Los k subgrupos son conceptuados como muestras aleatorias independientes de tamaños n1, n2, . . . , nk extraídas de las k poblaciones. Aunque las situaciones experimentales descritas son distintas, tienen en común que cada una lleva a muestras aleatorias independientes extraídas de poblaciones con medias µ1, µ2, . . . , µk. Interesa probar la hipótesis nula de que las medias poblacionales son iguales, es decir: H0: µ1 = µ2 = . . . = µk H1: µi ≠ µj para algunas i y j (al menos dos de las medias no son iguales) Como puede ver el lector, se trata de una ampliación de los problemas de dos muestras basados en muestras independientes que se estudiaron en el capítulo 10. El modelo aquí desarrollado se llama modelo de clasificación unidireccional de efectos fijos. La expresión “clasificación unidireccional” se refiere a que sólo un factor o atributo se estudia en el experimento. El factor estudiado tiene k niveles distintos. En la segunda situación experimental descrita, suele usarse el vocablo “tratamientos”, en lugar de niveles del factor. La frase “efectos fijos” hace referencia al hecho de que el experimentador selecciona específicamente los tratamientos o

ANÁLISIS DE VARIANZA

Población I (veta I)

Muestra de tamaño n1

Población II (veta II)

Población III (veta III)

Muestra de tamaño n2

Muestra de tamaño n3

Población IV (veta IV)

Muestra de tamaño n4

513

Población V (veta V)

Muestra de tamaño n5

H0: µ1 = µ2 = µ3 = µ4 = µ5 FIGURA 13.1 Muestras aleatorias de tamaños n1, n2, n3, n4 y n5, seleccionadas independientemente de las cinco vetas de carbón principales de una región geográfica.

niveles del factor porque revisten interés particular. No se eligen aleatoriamente de un grupo más amplio de posibles tratamientos o niveles. La selección aleatoria de tratamientos o niveles lleva al modelo de efectos aleatorios, que es tema de la sección 13.5. Como puede apreciar el lector, los tipos de inferencias dependen de que los efectos sean fijos o aleatorios. El ejemplo 13.1.1 debe poner en claro el significado de estos términos. Ejemplo 13.1.1. Se diseña un estudio para investigar el contenido de azufre de las cinco vetas de carbón principales de cierta región geográfica. Se obtienen muestras en puntos seleccionados aleatoriamente de cada veta y la respuesta medida es el porcentaje de azufre de cada muestra. Se pretende detectar las diferencias que pudiera haber en el contenido promedio de azufre de las cinco vetas. Cada una constituye una población. Se pretende comparar las medias poblacionales al poner a prueba: H0: µ1 = µ2 = µ3 = µ4 = µ5 H1: µi ≠ µj

para algunas i y j

con base en muestras independientes extraídas de esas poblaciones. El factor de estudio es la veta de carbón y se investiga en cinco niveles. Éstos no se seleccionan al azar. En su lugar, se eligen intencionadamente para estudiar las cinco vetas principales de la región. Se trata de un diseño de efectos fijos. El estudio es un ejemplo de la primera situación experimental antes descrita. La idea se ilustra en la figura 13.1.

En cuanto a la notación, sea Yij la j-ésima respuesta para el i-ésimo tratamiento o nivel del factor, con i = 1, 2, . . . , k y j = 1, 2, . . . , ni . En este contexto, ni es el tamaño de la muestra extraída de la iésima población. El número total de observaciones de las k muestras combinadas es N = n1 + n2 + . . . + nk. Los datos recopilados en un experimento de un solo factor y algunas estadísticas muestrales importantes se expresan de manera conveniente como se muestra en la tabla 13.1. El punto que está junto al subíndice en la notación siguiente indica que la suma se realiza con dicho subíndice. Note que:

514

PROBABILIDAD Y ESTADÍSTICA

TABLA 13.1 Distribución de los datos de la clasificación unidireccional Tratamiento o nivel del factor 1 Y11 Y12 Y13 .. . Y1n Total Media muestral

2 Y21 Y22 Y .. 23 . 1

Y2n

...

3 Y31 Y32 Y .. 33 . 2

Y3n

k Yk1 Yk2 Y .. k3 . Ykn

3

k

T1.

T2.

T3.

...

Tk.

T..

Y1.

Y2 .

Y3.

...

Yk .

Y ..

Ti . = total de las i-ésimas respuestas al tratamiento ni

= ∑ Yij j =1

Yi . = media muestral del i-ésimo tratamiento = Ti./ni T.. = total de todas las respuestas k

k

ni

= ∑ Ti . = ∑ ∑ Yij i =1

i =1 j =1

Y .. = media muestral de todas las respuestas = T../N El uso de esta notación se ilustra en el ejemplo 13.1.2. Ejemplo 13.1.2. Se obtienen los datos y estadísticas de resumen siguientes acerca del contenido de azufre de las cinco vetas de carbón principales de una región geográfica: Factor (veta de carbón) 1 1.51 1.92 1.08 2.04 2.14 1.76 1.17

T1. = 11.62 Y1. = 1.66

2

3

4

5

1.69 0.64 0.90 1.41 1.01 0.84 1.28 1.59

1.56 1.22 1.32 1.39 1.33 1.54 1.04 2.25 1.49

1.30 0.75 1.26 0.69 0.62 0.90 1.20 0.32

0.73 0.80 0.90 1.24 0.82 0.72 0.57 1.18 0.54 1.30

T2. = 9.36 Y2 . = 1.17

T3. = 13.14 Y3. = 1.46

T4. = 7.04 Y4 . = 0.88

T5. = 8.8 Y5. = 0.88

T.. = 49.96 Y .. = 1.189

ANÁLISIS DE VARIANZA

515

Se sabe que las cinco medias muestrales Y1., Y2 ., Y3., Y4 . y Y5., son estimadores insesgados de las medias poblacionales µ1, µ2, µ3, µ4 y µ5. Por inspección, se observa que existen diferencias entre las medias muestrales. La pregunta que debe responderse es: “¿Son estas diferencias suficientemente extremas para que exista una distinción real de contenido promedio de azufre entre las cinco vetas de carbón?” A fin de responderla, es necesario desarrollar un método analítico para poner a prueba H0: µ1 = µ2 = µ3 = µ4 = µ5 con base en los datos.

El modelo Se requiere crear un modelo estadístico para ver la forma de cómo probar la hipótesis nula de medias de tratamiento iguales. Por principio de cuentas, advierta que cada respuesta puede expresarse como: Yij = µi + Eij donde µi denota la media teórica de la i-ésima población, y Eij, la diferencia aleatoria entre la j-ésima observación tomada de la i-ésima población y la media de esa población. En otras palabras, Eij = Yij – µi . Una forma alterna de escribir este modelo es hacer que αi = µi – µ, donde: k

µ = ∑ ni µi /N i =1

En sentido práctico, µ representa un efecto medio global, calculado al combinar las k medias poblacionales. Note que si los tamaños muestrales son iguales, entonces µ es simplemente el promedio de las k medias poblacionales. Puesto que αi es la diferencia entre la media global µ y la media de la i-ésima población, αi mide el efecto del i-ésimo tratamiento. Advierta que: k

k

k

i =1

i =1

i =1

∑ niαi = ∑ ni (µi − µ ) = ∑ ni µi − Nµ = 0

Por sustitución, el modelo de clasificación unidireccional con efectos fijos puede expresarse en cualquiera de las tres formas siguientes: Modelo de efectos fijos de clasificación unidireccional Yij = µ i + E ij Yij = µ + (µ i − µ ) + (Yij − µ i ) Yij = µ + α i + E ij Esos modelos se ilustran en la figura 13.2. Esos modelos expresan matemáticamente la idea de que cada respuesta puede dividirse en tres componentes reconocibles, como sigue: desviación respecto desviación aleatoria respuesta de la media global, Respuesta de la j-ésima respecto de la i-ésima + debido a que la unidad experimental al = media + media poblacional, global unidad recibió el i-ésimo tratamiento debido a influencias i-ésimo tratamiento aleatorias En otras palabras: Yij

= µ

+ (µi − µ o αi)

+ (Yij − µi o Eij)

516

PROBABILIDAD Y ESTADÍSTICA

Yij

Yij

Eij = Yij – µ i

Eij

µi

µi µ i – µ = αi µi

µ µ

0 a)

b)

FIGURA 13.2 a) Yij = µi + Eij, es decir, la j-ésima observación de la i-ésima muestra se conceptúa como dividida en dos componentes reconocibles, µi, el promedio del i-ésimo tratamiento, y Eij, una desviación respecto de ese promedio causada por influencias aleatorias que actúan en la j-ésima unidad experimental. b) Yij = µ + (µi – µ) + (Yij – µi) o Yij = µ + αi + Eij, o sea, la j-ésima observación de la i-ésima muestra se divide en tres componentes reconocibles, que son el promedio global, µ; el efecto µi – µ, debido al hecho de que participa el i-ésimo tratamiento, el cual podría hacer que µi difiera del tratamiento global, y Eij, la desviación resultante de influencias aleatorias.

La hipótesis nula de medias de tratamiento iguales puede expresarse de manera alternativa al tomar nota de que si µ1 = µ2 = . . . = µk, entonces: k

µ = ∑ ni µi /N = Nµi /N = µi

para cada 1, 2, . . . , k

i =1

y α1 = µ1 – µ = 0 para cada i. Ello implica que verificar: H:µ =µ =...=µ 0

1

2

k

es equivalente a probar: H0: α1 = α2 = . . . = αk = 0 Como se analiza más adelante, es posible expresar el modelo de clasificación unidireccional con la forma lineal general que se estudia en el capítulo 12. Al rescribir la hipótesis de medias iguales en esta forma alternativa, se puede probar H0 con las técnicas de regresión.

Prueba de H0 La obtención de una estadística de prueba requiere ciertos supuestos acerca de las diferencias aleatorias Eij. Esas premisas son similares a las usadas en modelos de regresión estudiados en capítulos previos.

ANÁLISIS DE VARIANZA

517

En particular, se supone que esas diferencias son variables aleatorias independientes de distribución normal, cada una con media 0 y varianza σ 2. En términos más comprensibles, se supone que: 1. Las k muestras son independientes y extraídas de k poblaciones específicas, con medias desconocidas µ1, µ2, . . . , µk. 2. Cada una de las k poblaciones tiene distribución normal. 3. Cada una de las k poblaciones tiene la misma varianza, σ 2. Cuando se expresan de esta forma, es fácil apreciar que esos supuestos guardan paralelismo con los del capítulo 10 relativos a la prueba T agrupada de comparación de dos medias poblacionales. Se definió ya el análisis de la varianza, procedimiento en el que la variación total de una respuesta media se subdivide en componentes atribuibles a fuentes reconocibles. Puesto que µ, µ1, µ2, . . . , µk son medias poblacionales teóricas, el modelo logra dicho objetivo sólo en sentido teórico. Dividir de manera práctica una observación requiere sustituir las medias teóricas con sus estimadores insesgados Y .., Y1., Y2 ., . . . , Yk ., respectivamente. Efectuar tal reemplazo en el modelo lleva a la identidad siguiente: Yij = Y .. + (Yi . − Y ..) + (Yij − Yi .)

Note que Y .. es un estimador de µ, el efecto medio agrupado global; Yi . – Yi . es un estimador de αi = µi − µ, el efecto del i-ésimo tratamiento, y Yij – Yi . es un estimador de Eij = Yij − µi, el error aleatorio. El término Yij – Yi . suele denominarse residuo. Esta identidad es equivalente a: Yij − Y .. = (Yi . − Y ..) + (Yij − Yi .)

Si se eleva al cuadrado y se suma cada miembro de la identidad respecto de todos los valores posibles de i y j, se tiene: k

ni

ni

k

∑ ∑ (Yij − Y ..) 2 = ∑ ∑ [(Yi . − Y ..) i=1j=1

i=1j=1 ni

k

+ ( Yij − Yi .)]2 k

ni

= ∑ ∑ ( Yi . − Y ..) 2 + 2 ∑ ∑ ( Yi . − Y ..)( Yij − Yi .) i=1j=1 k

i=1j=1

ni

+ ∑ ∑ ( Yij − Yi .) 2 i=1j=1

El término medio es 0, puesto que: ni

ni

∑ (Yij − Yi .) = ∑Yij − niYi . = 0 j =1

j =1

Al tomar nota de que: k

ni

k

∑ ∑ (Yi . − Y ..)2 = ∑ ni (Yi . − Y ..)2

i =1 j =1

i =1

se tiene la llamada identidad de la suma de cuadrados del análisis de varianza de clasificación unidireccional.

518

PROBABILIDAD Y ESTADÍSTICA

Identidad de la suma de cuadrados k

ni

k

k

ni

∑ ∑ (Yij − Y ..)2 =∑ ni (Yi . − Y ..)2 +∑ ∑ (Yij − Yi .)2 i =1 j =1

i =1

i =1 j =1

Cada uno de los componentes de esta identidad puede interpretarse de manera que tenga sentido. En particular: k

ni

∑ ∑ (Yij − Y ..)2

i =1 j =1 k

∑ ni (Yi . − Y ..)2

i =1 k

ni

∑ ∑(Yij − Yi .)2

i =1 j =1

= medida de la variabilidad total de los datos = suma de cuadrados total (SSTot) = medida de la variabilidad de los datos atribuida al hecho de que se usan diferentes niveles de factores o tratamientos = suma de cuadrados de los tratamientos (SSTr) = medida de la variabilidad de los datos atribuida a la fluctuación aleatoria entre los sujetos de un mismo nivel de factor = residuo o suma de cuadrados de error (SSE)

De manera simbólica, la identidad de la suma de cuadrados puede escribirse como: Identidad de la suma de cuadrados conceptual de clasificación unidireccional SSTot = SSTr + SSE En caso de existir diferencias entre las medias poblacionales, se espera que gran parte de la variación en las respuestas se deba al hecho de que se usan tratamientos distintos. En otras palabras, se espera que SSTr sea grande en comparación con SSE. En los procedimientos del análisis de varianza, se usa esta idea para probar la hipótesis nula de medias de tratamiento iguales mediante la comparación de la variación de los tratamientos (SSTr) contra la variación del tratamiento (SSE) con una razón F apropiada. A fin de contar con una razón F apropiada, deben considerarse los valores esperados de las estadísticas SSTr y SSE. Ello requiere suponer en el modelo que los errores aleatorios Eij son variables aleatorias normalmente distribuidas e independientes, cada una con media 0 y varianza σ 2. Por principio de cuentas, tome nota de que para cada i: ni

Yi . = ∑ (µ + αi + E ij ) /ni j =1

ni

ni µ + niαi + ∑ E ij =

j =1

ni

= µ + αi + E i . k

Además, puesto que ∑i = 1 niαi = 0, se tiene:

ANÁLISIS DE VARIANZA

k

519

ni

Y .. = ∑ ∑Yij / N i =1 j =1 k ni

= ∑ ∑ (µ + αi + E ij )/ N i =1 j =1

k

k

ni

Nµ + ∑ niαi + ∑ ∑ E ij i =1

=

i =1 j =1

N = µ + E.. Luego de sustituir, es posible rescribir SSTr como se muestra: k

SS Tr = ∑ ni (Yi − Y ..) 2 i=1 k

= ∑ ni [(µ + α i + E i .) − ( µ + E ..)]2 i=1 k

= ∑ ni (α i + E i . − E ..) 2 i=1 k

k

k

i=1

i=1

i=1

= ∑ niα i2 + 2 ∑ niα i E i . + ∑ ni E i .2 − NE ..2 Al tomar el valor esperado de cada término, se tiene: k

k

k

i =1

i =1

i =1

E[ SS Tr ] = ∑ niαi2 + 2∑ niαi E[ E i .] + ∑ ni E[ E i .2 ] − NE[ E..2 ] En el ejercicio 1, se delinea la demostración de que E[ E i .2 ] = σ 2/ni para cada i. Un argumento similar muestra que E[ E..2 ] = σ 2/N . Es fácil ver que E[ Ei .] = 0. La sustitución lleva a: k

k

i =1

i =1

E[ SS Tr ] = ∑ niαi2 + ∑ niσ 2/ni − Nσ 2/N k

= ( k − 1)σ 2 + ∑ niαi2 i =1

Luego de dividir SSTr entre k − 1, se obtiene la estadística llamada cuadrado medio del tratamiento, que se denota con MSTr. Dicho de otra manera: Cuadrado medio del tratamiento MSTr = SSTr/(k – 1) k

Es fácil apreciar que E[ MSTr ] = σ 2 + ∑i = 1 niα 2i /( k − 1). Recuerde que la suma de los cuadrados de los residuos ayuda a estimar σ 2 en el contexto de regresión. Lo mismo es válido aquí. A fin de obtener un estimador insesgado de σ 2, se divide la suma de cuadrados de los residuos SSE entre N − k. Es un estimador denominado cuadrado medio del error y se denota con MSE. En otras palabras: Cuadrado medio del error MSE = SSE /(N – k)

520

PROBABILIDAD Y ESTADÍSTICA

¿Cómo usar MSTr y MSE para probar H0? A fin de responder a esta pregunta, basta tomar en cuenta que k si H0 es verdadera, entonces α1 = α2 = . . . = αk = 0 y, por ende, ∑i = 1 niαi2 /( k − 1) = 0. En caso de que H0 no sea verdadera, entonces este término es positivo. Así pues, en el primero de estos dos casos, se esperaría que MSTr y MSE tengan valores cercanos, ya que con ambas se estima σ 2, mientras que en el segundo cabría esperar que la primera sea un tanto mayor que la segunda. Ello hace pensar en la razón: Estadística de prueba de H0: µ1 = µ2 = . . . = µk Fk – 1, N – k = MSTr/MSE como estadística de prueba lógica. Si H0 es verdadera, se espera que su valor sea cercano a 1, y en cualquier otro caso, que sea mayor que 1. Esta razón puede usarse como estadística de prueba, puesto que si la hipótesis nula es verdadera, se sabe que tiene distribución F, con k − 1 y N − k grados de libertad. La prueba siempre es de cola derecha, con rechazo de H0 en el caso de valores de la variable aleatoria Fk – 1, N – k que parecen demasiado grandes para haber ocurrido al azar. Es posible que los valores de F = MSTr/MSE sean menores que la unidad, ya que F es una variable aleatoria. Dicho resultado puede ocurrir únicamente por azar o a causa de que el modelo lineal supuesto sea incorrecto. Aunque en la práctica es usual que el análisis de varianza se efectúe mediante computadora, se cuenta con algunos atajos de cálculo. Se deja como ejercicio de final de capítulo demostrar que: Atajos de cálculo ni

T ..2 i =1 j =1 N 2 2 k T . T .. SS Tr = ∑ i − i = 1 ni N SS E = SS Tot − SS Tr k

SS Tot = ∑ ∑ Yij2 −

Las ideas teóricas subyacentes al procedimiento de análisis de la varianza en el caso del modelo de efectos fijos de clasificación unidireccional se resumen en la tabla 13.2. Este tipo de tabla se llama tabla de análisis de varianza (ANOVA). TABLA 13.2 Tabla de ANOVA del diseño de clasificación unidireccional con efectos fijos Fuente de variación

Grados de libertad (DF)

Tratamiento o nivel

k–1

Error o residuo

N–k

Suma de cuadrados (SS) 2

2

Ti . T .. − ni N (SSTr)



SSTr k −1

Sustracción

SS E N −k

k

i=1

(SSE) Total

N–1

Cuadrado medio (MS)

k

ni

∑ ∑ Yij2 −

i=1 j =1

T ..2 N

Cuadrado medio esperado k

σ2 + ∑

i=1

2 i

niα k −1

σ2

F MSTr MS E

ANÁLISIS DE VARIANZA

521

El uso de la razón F se ilustra con la continuación del análisis de los datos de carbón iniciado en el ejemplo 13.1.2. Ejemplo 13.1.3. Se ponen a prueba:

H0: µ1 = µ2 = µ3 = µ 4 = µ5 o

H0: α1 = α2 = α3 = α 4 = α5 = 0 con base en los datos previos. Recuerde que µi, i = 1, 2, 3, 4, 5, denota el contenido medio de azufre de las cinco vetas de carbón principales de una región geográfica. Se tienen las estadísticas de resumen siguientes: T1. = 11.62 T2 . = 9.36 T3. = 13.14

T4 . = 7.04 T5. = 8.8 T .. = 49.96

n1 = 7 n2 = 8 n3 = 9

n4 = 8 n5 = 10 N = 42

La única estadística adicional necesaria es Σ5i = 1Σnji= 1Yij2 . En relación con los datos del ejemplo 13.1.2, esta estadística asume el valor 67.861. Luego de sustituir en las fórmulas de cálculo, se obtiene: 5

ni

SSTot = ∑ ∑ Yij2 − T ..2 /N = 67.861 − i =1 j =1

( 49.96) 2 = 8.432 42

5

Ti .2 T ..2 − i = 1 ni N (11.62) 2 (9.36) 2 (13.14) 2 (7.04) 2 (8.8) 2 ( 49.96) 2 = + + + + − 7 8 9 8 10 42 = 3.935 SSE = SSTot − SSTr = 8.432 − 3.935 = 4.497 SS 3.935 MSTr = Tr = = 0.984 k −1 4 SSE 4.497 MSE = = = 0.122 N−k 37 SSTr = ∑

El valor observado de la estadística de prueba Fk – 1, N – k = F4, 37 es: MSTr 0.984 = = 8.066 MSE 0.122 Puesto que f0.05(4, 37) 2.626, es posible rechazar H0 con P < 0.05. Se tienen evidencias estadísticas de que al menos dos vetas de carbón difieren en la media de contenido de azufre. La tabla ANOVA de estos datos es la 13.3. F4, 37 =

TABLA 13.3 Tabla ANOVA de los datos de vetas de carbón Fuente de variación

Suma de cuadrados (SS)

Cuadrado medio (MS)

F

4

3.935

0.984

8.066

Error

37

4.497

0.122

Total

41

8.432

Tratamientos

Grados de libertad (DF)

522

PROBABILIDAD Y ESTADÍSTICA

El impreso correspondiente de SAS es el siguiente: ONE WAY ANOVA GENERAL LINEAR MODELS PROCEDURE DEPENDENT VARIABLE: SULFUR SOURCE

DF

SUM OF SQUARES

MEAN SQUARE

F VALUE

MODEL ERROR CORRECTED TOTAL

4 37 41

3.93539048 4.49700000 8.43239048

0.98384762 0.12154054

8.09 PR > F 0.0001

Antes de concluir esta sección, recuerde que se parte del supuesto de que cada una de las k muestras independientes se extrae de poblaciones de distribución normal, con varianzas iguales σ 2. Si los tamaños muestrales son razonablemente grandes, la prueba es muy robusta en cuanto a suponer la normalidad, en el sentido de que son razonablemente precisos los valores de P reportados, sin que dejen de ser aproximados. Sin embargo, la prueba puede ser muy sensible al supuesto de varianzas iguales. Ello reviste validez especial si los tamaños muestrales respectivos difieren mucho. Siempre que sea posible, es ventajoso diseñar los experimentos con tamaños muestrales iguales. Un método para probar la igualdad de las varianzas se detalla en la sección que sigue. Si la normalidad parece poco razonable o es evidente que las varianzas difieren, resulta apropiado un método de análisis no paramétrico, como el que se estudia en la sección 13.7.

13.2

COMPARACIÓN DE VARIANZAS

Como se mencionó, la prueba F de verificación de la igualdad de medias es sensible a la transgresión del supuesto de varianzas iguales. Ello reviste validez particular cuando los tamaños muestrales difieren mucho. Antes de emprender el análisis de varianza, es necesario probar las hipótesis:

H 0: σ 12 = σ 22 = . . . = σ k2 H1: σ i2 ≠ σ 2j para algunas i y j (al menos dos de las varianzas no son iguales) Si se rechaza H0, se debe usar un análisis no paramétrico o emprender una transformación de los datos con la esperanza de estabilizar las varianzas. Un ejemplo del primero se estudia en la sección 13.7, mientras que las transformaciones de estabilización de varianzas son tema de obras de análisis de varianza [14]. La prueba más usada para poner a prueba la hipótesis nula de varianzas iguales es la prueba de Bartlett. Puede demostrarse que la estadística usada en ella sigue aproximadamente una distribución ji cuadrada con k − 1 grados de libertad cuando el muestreo se efectúa a partir de poblaciones normales. La prueba de Bartlett se inicia con el cálculo de las varianzas muestrales S12 , S22 , . . . , Sk2 de cada una de las k muestras. También se determina el de cuadrado medio del error, la estimación combinada de σ 2 bajo el supuesto de que la hipótesis nula es verdadera. En este contexto, resulta conveniente el cálculo directo de MSE a partir de las varianzas muestrales individuales, mediante la fórmula: ( ni − 1) S i2 i =1 N − k k

MS E = S p2 = ∑

ANÁLISIS DE VARIANZA

523

La verificación de la validez de esta ecuación se deja como ejercicio (véase ejercicio 8). Luego, se forma la estadística Q, definida por: k

Q = ( N − k )log10 S p2 − ∑ ( ni − 1)log S i2 i =1

El valor observado de esa estadística es grande cuando las varianzas muestrales S i2 , i = 1, 2, . . . , k son muy distintas, y es cercano a 0 si dichas varianzas también guardan cercanía en sus valores. La estadística de Bartlett se define por: Estadística de prueba H 0: σ 12 = σ 22 = . . . = σ k2 B = 2.3026Q/h

donde h =1+

1 k 1 1  ∑  − 3( k − 1)  i = 1 ni − 1 N − k 

Un ejemplo debe mostrar el uso de esta prueba. Ejemplo 13.2.1. Permítase regresar de nuevo a los datos de las vetas de carbón del ejemplo 13.1.2. Deben calcularse las varianzas muestrales y sus logaritmos para cada uno de los cinco niveles del factor. Los resultados de esos cálculos se resumen a continuación: Veta de carbón 1 2 3 4 5

Varianza muestral ( si2 ) 0.175 0.144 0.115 0.123 0.074

log10 si2

Tamaño muestral (ni)

–0.757 –0.842 –0.939 –0.910 –1.131

7 8 9 8 10

La estimación agrupada de σ 2 es: ( ni − 1) si2 i =1 N − k (7 − 1)(0.175) + (8 − 1)(0.144) + (9 − 1)(0.115) + (8 − 1)(0.123) + (10 − 1)(0.074) = 42 − 5 = 0.122 k

MSE = s 2p = ∑

Note que este valor concuerda con el obtenido para MSE en el ejemplo 13.1.3. Por sustitución, se tiene: k

q = ( N − k ) log10 s 2p − ∑ ( ni − 1) log10 si2 i =1

= 37 log10 .122 − [6(−0.757) + 7(−0.842) + 8(−0.939) + 7(−0.910) + 9(−1.131)] = 0.692

524

PROBABILIDAD Y ESTADÍSTICA

y

1 k 1 1  ∑  − 3( k − 1)  i = 1 ni − 1 N − k  1 1 1 1 1 1 1  = 1+  + + + + −  3( 4)  6 7 8 7 9 37  = 1.055

h = 1+

El valor observado de la estadística de Bartlett es: b = 2.3026q/h = 2.3026(0.692) /1.055 = 1.510 Basado en la distribución X2k − 1 = X24 , el valor P se ubica entre 0.75 y 0.9. Puesto que es un valor grande, resulta imposible rechazar: H0: σ 12 = σ 22 = σ 32 = σ 42 = σ 52

Se carece de razones para dudar del supuesto de que las varianzas poblacionales son iguales.

13.3

COMPARACIONES POR PARES

En la prueba de la igualdad de las medias en el modelo de clasificación unidireccional, se rechaza H0 o no se le rechaza. En el primero de esos casos, se llega a la conclusión de que al menos dos de las medias poblacionales tienen valor distinto. Desgraciadamente, el procedimiento del análisis de varianza no permite saber a cuáles de las k medias poblacionales se las considera distintas de las demás. Son muchas las técnicas que se han propuesto para la comparación de pares de medias. Varios de ellos no requieren emprender la prueba F en la tabla de análisis de varianza global antes de las comparaciones por pares. Sin embargo, es usual que dicha prueba se realice en la práctica. Como se menciona al final de la sección, el requisito de un resultado significativo de la prueba F en el análisis de varianza antes de las comparaciones por pares brinda protección adicional contra declarar falsamente que las medias de pares difieren en forma significativa. Lentner y Bishop [31] describen una panorámica adecuada de muchos de los procedimientos de comparación por pares. Aquí, se estudian tres posibilidades. Se trata de las pruebas T de Bonferroni, de rango múltiple de Duncan, y de Tukey.

Pruebas T de Bonferroni k Considere un conjunto de k medias poblacionales. Existen   = k ( k − 1)/ 2 posibles pares de me2 dias. Así pues, también se tienen k(k − 1)/2 posibles pruebas, de la forma: H 0: µi = µ j H1: µi ≠ µ j que pueden emprenderse. Puesto que uno de los supuestos del modelo es el de varianzas poblacionales iguales, cada una de las hipótesis se verifica con una prueba T agrupada, como se describe en el capítulo 10. En ella, la estadística de prueba es:

ANÁLISIS DE VARIANZA

Tn + n i

j

−2

=

525

Yi . − Y j . 1 1  S p2  +   ni n j 

donde S 2p es el estimador agrupado de la varianza poblacional común basada en muestras extraídas de las poblaciones i y j. En este caso, está disponible otro estimador de σ 2, a saber, σ 2 = MSE. Puesto que dicho estimador se basa en todos los datos disponibles, la prueba T puede mejorarse con el uso de: Estadística de prueba de Bonferroni de H0: µi = µj TN − k =

Yi . − Y j . 1 1  MS E  +   ni n j 

como estadística de prueba. El punto crítico de la prueba de dos colas con el nivel de significación α es: Punto crítico de Bonferroni   cp = t N − k ,1 − α/ 2 MS  1 + 1  E   ni n j  Se rechaza H0 siempre que Yi . − Yj . exceda el punto crítico determinado. Note que podría ser necesario, en el caso de tamaños muestrales desiguales, calcular un punto crítico diferente para cada prueba, mientras que si son iguales basta un solo punto crítico. Aunque laboriosas, es posible efectuar k(k − 1)/2 pruebas T individuales. Sin embargo, este procedimiento tiene una desventaja más grave, que debe manejarse con cuidado. A fin de entender ese problema, suponga que se plantea la pregunta: “¿Cuál es la probabilidad de que ocurra al menos un rechazo incorrecto y, con ello, se extraiga por lo menos una conclusión errónea?” Si las k(k − 1)/2 pruebas son independientes, entonces esa probabilidad, llamada tasa de error de tipo experimento y denotada con α', puede calcularse como sigue: P[al menos un rechazo incorrecto] = 1 − P[ningún rechazo incorrecto] En el supuesto de que cada prueba se realiza con el nivel de significación α, entonces la probabilidad de un rechazo incorrecto en cada caso es α, y la de que el rechazo que sea correcto, 1 − α. Cuando se emprenden pruebas independientes, la definición de independencia garantiza que si se llevan a cabo c pruebas, entonces: P[ningún rechazo incorrecto] = (1 − α)c Así pues, en el caso de pruebas independientes, α' está dada por 1 − (1 − α)c. El problema en el caso de comparaciones múltiples es que se efectúan muchas pruebas de un mismo conjunto de datos. Por

526

PROBABILIDAD Y ESTADÍSTICA

ello, las pruebas distan de ser independientes. Sin embargo, puede demostrarse que la expresión recién mencionada proporciona un límite superior de α' en ese contexto. Es posible afirmar, en cualquier contexto de prueba de hipótesis con realización de dos o más pruebas, que: Tasa de error de tipo experimento = α' ≤ 1 – (1 − α)c Aquí, α es el nivel de significación común por prueba, llamado tasa de error en forma de comparación, y c es el número de pruebas realizado. 5 A manera de ejemplo, con k = 5, se tienen   = 10 posibles comparaciones por pares. Si cada 2 prueba se realiza con nivel α = 0.05, entonces un límite superior de la probabilidad de que al menos un rechazo sea incorrecto es 1 – (1 − 0.05)10 = 0.40. Resulta fácil apreciar que conforme aumente k, se vuelve inaceptablemente alta la probabilidad global de error. A fin de compensar este problema, se recomienda emprender sólo las pruebas que interesen en realidad al investigador y que se seleccione un límite superior blanco, b, razonablemente pequeño. Luego, se realiza cada prueba T con el nivel b/c de significación, donde c denota el número real de pruebas efectuadas. Puede demostrarse que si α = b/c, entonces α' ≤ b (véase ejercicio 14). A manera de ejemplo, si se pretende que α' sea menor o igual que 0.10 y llevar a cabo todas las pruebas posibles de k = 5 grupos, se realizarían cada una de las comparaciones por pares con el nivel de significación α = 0.10/10 = 0.01. La selección del valor numérico del límite b queda a discreción del investigador. Ese valor depende hasta cierto punto del número de pruebas que se emprenda. Note que si b es pequeño, entonces α = b/c es todavía más pequeña. Cuando se intenta forzar que la tasa de error de experimento sea demasiado pequeña, α se vuelve tan pequeña que es sumamente difícil rechazar H0: µi = µj, inclusive si se le debe rechazar. En otras palabras, el precio que se paga por hacer que el límite de α' sea excesivamente bajo es esta pérdida de potencia. En virtud de ello, son hasta cierto punto razonables los valores de α' hasta de 0.15 o 0.20. La técnica presentada aquí es equivalente al denominado procedimiento de diferencia significante mínima de Fisher, que se emprende con α = b/c. Véase un análisis excelente de este procedimiento en [31]. Puesto que es un procedimiento basado en la llamada desigualdad de Bonferroni, tiene el mismo nombre. SAS incluye las pruebas T de Bonferroni.

Prueba de rangos múltiples de Duncan A comienzos del decenio de 1950, D. B. Duncan desarrolló esta prueba. Es uno de los primeros métodos que se recomiendan en el caso de comparaciones por pares de medias y en la literatura se hace referencia a ella. A fin de entender la idea de Duncan, se la compara con la técnica de Bonferroni recién estudiada. En primer término, el procedimiento de Duncan supone de partida tamaños muestrales iguales. En otras palabras, parte de la premisa de un conjunto de k medias muestrales Y1 , Y2 , Y3 , . . . , Yk , cada uno basado en un tamaño muestral n. Advierta que en este contexto existe un punto crítico común, cp, que se aplica a todas las pruebas T de Bonferroni efectuadas. Se rechaza H0: µi = µj siempre Yi . − Y j . > cp. No se intenta explicar las posiciones relativas de Yi . − Y j . en la lista ordenada de medias muestrales. Se usa el mismo punto crítico, sin importar que las medias estén una junto a otra o separadas por otras medias, o que se encuentren en los extremos de la lista ordenada. En el procedimiento de Duncan, se intenta ajustar el punto crítico para explicar las posiciones. Así pues, en él se utilizan puntos críticos

ANÁLISIS DE VARIANZA

527

múltiples, que llevan el nombre de prueba de “rangos múltiples”. Si dos medias son adyacentes en la lista ordenada de medias muestrales, el punto crítico utilizado es el mismo que en una prueba T ordinaria con nivel α especificado; pero cuando no son adyacentes las medias muestrales comparadas, ese valor crítico aumenta en concordancia a la distancia entre las medias en el conjunto ordenado de ellas. Dicho de otra manera, se seleccionan puntos críticos de modo que no se requiera que las medias muestrales cercanas entre sí tengan tanta diferencia como las más separadas para afirmar que existe, entre las medias poblacionales correspondientes, una “diferencia significativa”. La contribución de Duncan consistió en desarrollar tablas que sirven para calcular esos puntos críticos ajustados. La prueba se desarrolló inicialmente bajo el supuesto de tamaños muestrales iguales. Sin embargo, C. Y. Kramer la adaptó al caso de muestras de tamaños desiguales. La prueba de Duncan se realiza como sigue: 1. Ordenar linealmente las k medias muestrales. 2. Calcular el valor del “rango studentizado” menos significativo, rp, para cada p = 2, 3, . . . , k. Este valor aparece en la tabla XI del apéndice A respecto de valores α de 0.1, 0.01 o 0.05. En esa tabla, γ denota el número de grados de libertad relacionado con MSE, el cuadrado medio del error en el original análisis de varianza. 3. Calcular, para cada p = 2, 3, . . . , k, el rango menos significativo o más corto, SSRp. Este valor está dado por: SSR p = rp

MS E n

SSR p = rp MS E

si todos los tamaños muestrales son iguales, con valor n si todos los tamaños muestrales son desiguales

4. Considerar cualquier subconjunto de p medias muestrales adyacentes. Sea Yi . − Y j . el rango de medias de este subgrupo. Las medias poblacionales µi y µj de separación p se consideran diferentes si: Yi . − Y j . > SSR p con tamaños muestrales iguales

o

Yi . − Y j .

2ni n j ni + n j

> SSR p con tamaños muestrales desiguales

5. Elaborar el resumen de los resultados, en el que se pone de relieve cualquier subconjunto de medias muestrales adyacentes no consideradas significativamente diferentes con el nivel α seleccionado. Aunque eso parezca complejo, ¡no lo es! Un ejemplo debe aclarar la idea. Ejemplo 13.3.1. En el ejemplo 13.1.3, se rechaza: H0: µ1 = µ2 = µ3 = µ 4 = µ5 y se llega a la conclusión de que al menos dos de las vetas de carbón muestreadas difieren en su contenido medio de azufre. Se emprende la prueba de rangos múltiples de Duncan para identificar las diferencias. Las medias muestrales en orden lineal son:

528

PROBABILIDAD Y ESTADÍSTICA

Y4 . Y5. Y2 . Y3. Y1. 0.88 0.88 1.17 1.46 1.66

Los valores de rp con separación p = 2, 3, 4, 5 para un nivel α = 0.01 basado en 37 grados de libertad se muestran en la tabla XI del apéndice A. Estos valores son: p

2

3

4

5

rp

3.825

3.988

4.098

4.180

El cuadrado medio de error calculado con anterioridad es MSE = 0.122. Los tamaños muestrales n1 = 7, n2 = 8, n3 = 9, n4 = 8 y n5 = 10 son desiguales, de modo que el rango significativo más corto para cada p está dado por: SSR p = rp MSE

Esos valores son: p rp SSRp

2

3

4

5

3.825 1.336

3.988 1.393

4.098 1.431

4.180 1.460

Se considera que difiere un par de medias µi y µj de separación p si: Yi . − Yj .

2ni n j ni + n j

> SSR p

5  En el caso de cinco poblaciones, existen   = 10 posibles comparaciones. En primer término, se compa2 ran las medias muestrales mínima y máxima, en este caso, Y1. y Y4 .. Puesto que estas medias abarcan todo el conjunto de medias muestrales, p = 5 y SSRp = 1.460. El valor observado de la estadística de prueba es:

2n1n4 2(7)(8) = (1.66 − 0.88) 7+8 n1 + n4 = 2.131 Ese valor es mayor que SSRp, por lo que se llega a la conclusión de que dos medias µ1 y µ4 difieren significativamente. Los resultados de las demás comparaciones son los siguientes: Y1. − Y4 .

Par de tratamiento

p

4-1 4-3 4-2

5 4 3

4-5 5-1 5-3 5-2 2-1

2 4 3 2 3

Valor de la estadística de prueba 2.131 1.688 0.820

SSRp

¿Rechazar µi = µj?

1.460 1.431 1.393

Sí Sí No

1.336 1.431 1.393 1.336 1.393

No Sí Sí No No

1.336 1.336

No No

Y4 . Y5. Y2 . Y3. Y1.

0 2.238 1.785 0.8646 1.339 Y4 . Y5. Y2 . Y3. Y1.

2-3 3-1

2 2

0.8440 0.5612

ANÁLISIS DE VARIANZA

529

En resumen, puede concluirse que:

µ1 ≠ µ 4 µ1 ≠ µ5 µ3 ≠ µ 4 µ3 ≠ µ5 La probabilidad de error de cada una de esas afirmaciones es de 0.01.

En el caso de que todas las muestras fueran del mismo tamaño, no tendrían que efectuarse las k   comparaciones. Ello se debe a que cuando los tamaños muestrales son los mismos, siempre que 2 resulte no haber diferencia significativa entre el par de medias más extremas se supone que todas las medias del subgrupo son iguales y no se requieren pruebas adicionales. La prueba de Duncan es muy usada y está disponible en SAS y otros paquetes de computadora. Sin embargo, debe resaltarse que el nivel de significación dado no se refiere a α', la probabilidad global de que haya por lo menos un rechazo incorrecto. Por lo tanto, una prueba de Bonferroni con nivel α' = 0.01 o 0.05 puede originar resultados diferentes de los de una prueba de Duncan con el mismo nivel. En el uso de SAS, debe tenerse en cuenta este hecho. Ha de emprenderse sólo un procedimiento en estudios reales. Su elección queda en manos del investigador. La técnica de Bonferroni es atractiva desde el punto de vista analítico, ya que es fácil calcular un límite superior de la tasa de error del tipo experimento. Sin embargo, tiende a ser muy conservadora, por lo que podría no detectar las diferencias de las medias cuando en realidad existen. En el procedimiento de Duncan, se intenta controlar la tasa de error de tipo experimento sin que la prueba sea excesivamente conservadora. El trueque es que este segundo procedimiento puede generar tasas de error de tipo experimento grandes cuando el número de comparaciones es también relativamente grande. Una estrategia que se recomienda en ocasiones es usar lo que se podría llamar procedimiento de Duncan protegido. En otras palabras, no se usa la técnica de Duncan, salvo que la prueba F preliminar del ANOVA resulte significativa con el nivel α. Ello garantiza al experimentador que la tasa de error de tipo experimento α' ≤ α si la técnica de Duncan también se utiliza con el nivel α. El uso habitual de la técnica de Duncan no requiere la prueba F significativa previa del ANOVA.

Prueba de Tukey La prueba de Tukey se basa en la distribución de rango “studentizado” y tiene la ventaja de permitir intervalos de confianza simultáneos de la diferencia de medias por pares. Sea q(α, k, v) el valor crítico de cola superior de nivel α del rango “studentizado”, donde α denota el nivel de significación; k, el número de grupos de tratamiento, y v, el número de grados de libertad del error cuadrático medio (MSE) en la tabla ANOVA usada para la prueba F global. Los valores de q(α, k, v) aparecen en la tabla XIII con nivel α = 0.05.

530

PROBABILIDAD Y ESTADÍSTICA

Los intervalos de confianza simultáneos se muestran en las ecuaciones 13.1 y 13.2 subsiguientes, con tamaños muestrales iguales y desiguales, respectivamente. En el caso de muestras de igual tamaño, n, en cada grupo de tratamiento, se tiene: (Yi . − Y j .) ± q(α, k , v ) MS E /n

(13.1)

para todos los pares de medias Yi . e Y j . con i ≠ j. En el caso de que los tamaños muestrales sean desiguales, el procedimiento de Tukey de intervalos de confianza simultáneos puede estimarse como sigue:   Sea qij = q(α, k , v ) MS E  1 + 1  , donde ni y nj denotan los tamaños muestrales de Yi . e Y j . , n n  j   i

respectivamente. Entonces, los intervalos de confianza están dados por:

(Yi . − Y j .) ± qij

(13.2)

para todos los pares de medias Yi . y Y j . , con i ≠ j. La interpretación de las ecuaciones 13.1 y 13.2 lleva a la conclusión de que las medias verdaderas µi y µj difieren significativamente en el nivel α si el intervalo de confianza no incluye a 0.

13.4

PRUEBAS DE CONTRASTES

En la sección precedente, se analizan métodos de comparación de pares de medias. Existen otras situaciones en las que se requieren otros tipos de comparaciones. A manera de ilustración, reconsidere el ejemplo 13.1.2. Podría ser que el experimentador piense que, en virtud de características geológicas, las vetas de carbón 1 y 3 sean similares entre sí, y las vetas 4 y 5 también lo sean entre ellas, mientras que los pares (1, 3) y (4, 5) difieren entre sí. Por lo tanto, interesa probar: H 0: µ1 + µ3 = µ4 + µ5 H1: µ1 + µ3 ≠ µ4 + µ5 Note que H0 también puede rescribirse en la forma H0: µ1 + µ3 − µ4 − µ5 = 0. En otras palabras, es posible expresarla como una combinación lineal de medias poblacionales. De hecho, se trata de una función lineal especial, llamada contraste. Este término se define a continuación. Definición 13.4.1 (contraste). Sean µ1, µ2, . . . , µk las medias de k poblaciones. Toda función lineal de la forma: k

L = ∑ ci µi i =1

tal que Σ

k i =1 i

c = 0se llama contraste en medias de tratamiento.

La función µ1 + µ3 − µ4 − µ5 es un constraste con coeficiente c1 = c3 = 1, c2 = 0 y c4 = c5 = −1. Para probar una hipótesis de la forma: k

H 0:

∑ ci µi = 0

i =1

ANÁLISIS DE VARIANZA

531

donde ∑ik= 1ci µi es un contraste, requiere desarrollar una estadística de prueba. Para empezar, se sustituyen las medias poblacionales con sus estimadores insesgados Y1., Y2 ., . . . , Yk . para obtener la estadística: k

Lˆ = ∑ ciYi . i =1

Se supone que se extraen muestras independientes de k distribuciones normales con medias µ1, µ2, . . . , µk y varianza común σ 2, de modo que las medias muestrales Y1., Y2 ., . . . , Yk . tienen distribución normal con media µi y varianza σ 2/ni, respectivamente. La estadística Lˆ también posee distribución normal, con media ∑ik= 1ci µi y varianza σ 2 ∑ik= 1 (ci2/ni ). (Véase ejercicio 41 del capítulo 7.) Si H0 es verdadera, entonces ∑ik= 1ci µi = 0 y: Lˆ k

ci2 i = 1 ni

σ2∑

tiene distribución normal estándar. El ejercicio 76 del capítulo 4 garantiza que:

Q1 =

Lˆ2 k

ci2 i = 1 ni

σ2∑

tiene distribución ji cuadrada con 1 grado de libertad. Puede demostrarse que Q2 = SSE/σ 2 posee distribución ji cuadrada con N − k grados de libertad y que Q1 y Q2 son independientes. Según la definición 10.2.1, la variable aleatoria:

Q1/ 1 Q2 /( N − k ) es de distribución F con 1 y N − k grados de libertad. Es fácil verificar que se trata de una estadística dada por: k

Estadística de prueba H 0: ∑ c i µ i = 0 i=1

F1, N − k

 k  2   ∑ ciYi .      i = 1    = 2 k  ci   ∑   i = 1 ni 

MS E

El numerador de la estadística se llama suma de cuadrados de contraste y se denota con SSL. A manera de ilustración, la hipótesis nula antes planteada se verifica en el ejemplo siguiente. Ejemplo 13.4.1. Interesa probar:

H0: µ1 + µ3 − µ 4 − µ5 = 0 H1: µ1 + µ3 − µ 4 − µ5 ≠ 0

532

PROBABILIDAD Y ESTADÍSTICA

con base en los datos del ejemplo 13.1.2. Gracias a análisis precedentes, se sabe que: y1. = 1.66 y3. = 1.46 MSE = 0.122 n3 = 9

y2 . = 1.17 y 4 . = 0.88 n1 = 7 n4 = 8

y5. = 0.88 n2 = 8 n5 = 10

La suma de cuadrados de contraste deseado es: 5 2 ∑ ci y i . i =1  5

2 i

i =1

i

∑ cn

[1(1.66) + 1(1.46) + (−1)(0.88) + (−1)(0.88)]2 12 12 (−1) 2 (−1) 2 + + + 7 9 8 10 = 3.81 =

El valor observado de la razón F usada para probar H0 es: F1, 37 =

3.81 SSL = = 31.23 MSE 0.122

En la tabla IX del apéndice A, se aprecia que P < 0.05. Así pues, puede sacarse en conclusión que la media agregada de las vetas de carbón 1 y 3 difiere significativamente de su similar de las vetas 4 y 5.

Es posible formar un conjunto muy especial de k − 1 contrastes independientes L1, L2, . . . , Lk – 1 con la propiedad de que su suma de cuadrados de contraste se suma a la suma de cuadrados del tratamiento de todo el ANOVA. En otras palabras: SS L + SS L + . . . + SS L 1

2

k −1

= SS Tr

De esta manera, el investigador puede determinar cuáles contrastes tienen mayor contribución al rechazo de la hipótesis nula de medias de tratamiento iguales. Los contrastes seleccionados deben ser ortogonales para que ello ocurra. Este término se define a continuación. Definición 13.4.2 (contrastes ortogonales). Dos contrastes: k

L1 = ∑ ai µi i =1

k

y L2 = ∑ bi µi i =1

son ortogonales si: k

ai bi =0 i = 1 ni



Advierta que L1 y L2 son ortogonales, con tamaños muestrales iguales, siempre que ∑ik= 1ai bi = 0.Es relativamente fácil diseñar contrastes ortogonales en este caso. Si los tamaños muestrales son desiguales, la tarea se vuelve más difícil. Un ejemplo aclara este punto.

ANÁLISIS DE VARIANZA

533

Ejemplo 13.4.2. Considere el modelo de clasificación unidireccional con k = 5 y muestras del mismo tamaño. Los contrastes:

L1 = µ1 + µ2 − µ3 − µ5

y L2 = µ1 + µ2 + µ3 − 4µ 4 + µ5

son ortogonales, puesto que: 5

∑ a b = 1(1) + 1(1) + (−1)(1) + 0(−4) + (−1)(1) = 0 i i

i =1

Ninguno de ellos es ortogonal a L3 = µ1 – µ4. Sin embargo, cuando n1 = 20, n2 = 22, n3 = 24, n4 = 21 y n5 = 25, entonces ni L1 ni L2 son ortogonales. En tal caso: 5

∑ anb

i i

i =1

i

=

1(1) 1(1) (−1)(1) 0(−4) (−1)(1) + + + + ≠0 20 22 24 21 25

Los contrastes ortogonales se usan cuando el experimentador necesita dividir la variación de la respuesta debida a los tratamientos, SSTr, en componentes independientes. Los k – 1 contrastes seleccionados para ello pueden elegirse en forma más bien arbitraria. Sin embargo, es usual que el investigador tenga ciertos contrastes que revisten interés particular desde el punto de vista físico. Estos contrastes se incluyen en los sometidos a prueba, mientras que otros seleccionados simplemente deben ser ortogonales a los que interesan para que tenga lugar la división de SSTr en la suma de cuadrados contraste con k – 1 grados de libertad.

13.5 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS: EFECTOS FIJOS El procedimiento analizado en esta sección es una ampliación del procedimiento de T por pares que se estudia en el capítulo 10 para la comparación de medias de dos poblaciones normales. El propósito del emparejamiento es controlar el efecto de una variable extraña, que no se estudia en el experimento, al emparejar unidades experimentales que son similares en lo referente a esa variable. Cada miembro del par recibe tratamiento distinto y las diferencias en la respuesta se atribuyen a los efectos del tratamiento, ya que el efecto de la variable extraña se controla mediante el trabajo por pares. Se recurre al procedimiento llamado uso de bloques cuando se pretende comparar las medias de k poblaciones en presencia de una variable extraña. Un bloque es un conjunto de k unidades experimentales tan parecidas como sea posible en lo relativo a la variable extraña. Cada tratamiento se asigna aleatoriamente a una unidad de cada bloque. Puesto que el efecto de la variable extraña se controla con el emparejamiento de unidades experimentales similares, toda diferencia en la respuesta se atribuye a los efectos del tratamiento. El diseño experimental analizado en esta sección se llama diseño de bloques completos aleatorizados con efectos fijos. En dicha expresión, bloques se refiere a que las unidades experimentales se emparejan en lo concerniente a una variable extraña; aleatorizados, a que los tratamientos se asignan de manera aleatoria al interior de los bloques, y completo, a que cada tratamiento se usa exactamente una vez en cada bloque. La expresión “efectos fijos” es aplicable

534

PROBABILIDAD Y ESTADÍSTICA

TABLA 13.4 Disposición de datos de bloques completos aleatorizados Tratamiento Bloque

k

Bloque total

Media del bloque

Y31 Y32 Y. 33 .. Y3b

Yk1 Yk2 Y. k3 .. Ykb

T.1 T.2 T. .. 3 . T.b

Y .1 Y .2 Y. .3 .. Y .b

T2 .

T3.

Tk .

T..

Y 2.

Y 3.

Y k.

Y ..

1

2

3

1 2 3. .. b

Y11 Y12 Y. 13 .. Y1b

Y21 Y22 Y. 23 .. Y2b

Total del tratamiento Media del tratamiento

T1. Y 1.

...

a los bloques y tratamientos, es decir, se supone que ni los bloques ni los tratamientos se seleccionan al azar. Todas las inferencias elaboradas se aplican únicamente a los k tratamientos y b bloques usados realmente. El uso apropiado de los bloques, en el sentido de que las unidades experimentales al interior de los bloques son relativamente homogéneas, y las de bloques distintos, relativamente heterogéneas, hace que el diseño de bloques completos aleatorizados sea más sensible que el de clasificación unidireccional a las diferencias de las medias de tratamiento. Lo opuesto sería válido si el uso de los bloques no se realiza de manera correcta. La hipótesis que interesa es la de medias de tratamiento iguales, dada por: H0: µ1. = µ2. = . . . = µk. donde µi. denota la media del i-ésimo tratamiento. En cuanto a la notación, Yij denota la respuesta del i-ésimo tratamiento en el j-ésimo bloque, con i = 1, 2, . . . , k y j = 1, 2, . . . , b. Advierta que b indica el número de bloques usado en el experimento y el número de observaciones por tratamiento; k denota el número de tratamientos que se estudia y el de observaciones por bloque, y N = kb, el número total de respuestas. Los datos recopilados en un experimento de bloques completos aleatorizados y algunas estadísticas muestrales importantes se presentan de manera conveniente como se ilustra en la tabla 13.4. Note que: Ti. = total de todas las respuestas al i-ésimo tratamiento b

= ∑Yij j =1

Yi . = media muestral del i-ésimo tratamiento = Ti./b T.j = total de respuestas del j-ésimo bloque k

= ∑Yij i =1

ANÁLISIS DE VARIANZA

535

Y . j = media muestral del j-ésimo bloque = T.j /k T.. = total de todas las respuestas k

b

k

= ∑ ∑Yij =∑Ti . = i =1 j =1

i =1

b

∑T . j j =1

Y .. = media de todas las respuestas = T../N El ejemplo siguiente ilustra estas ideas. Ejemplo 13.5.1. Los funcionarios de un sistema de transporte pequeño, con apenas cinco autobuses, necesitan evaluar el desgaste de cuatro tipos de neumáticos. Cada uno de los autobuses tiene ruta distinta, de modo que las condiciones de terreno y de conducción difieren de un vehículo a otro. Es apropiado un diseño de bloques completos aleatorizados para controlar el efecto de esta variable extraña. Cada autobús constituye un bloque, y cada tipo de neumático, un tratamiento. Se coloca un neumático de cada tipo en cada autobús, con asignación al azar de las posiciones de los neumáticos. Luego, se los conduce por 15 000 mi, tras la cual se mide el desgaste de la superficie de rodamiento (en mm). Los datos obtenidos y las estadísticas de resumen pertinentes son los que siguen: Tratamiento (tipo de neumático) Bloques (autobuses) 1 2 3 4 5

2

3

4

Total del bloque

Media del bloque

17.1 20.3 24.6 18.2 19.8

20.8 28.3 23.7 21.4 25.1

11.8 16.0 16.2 14.1 15.8

T.1 = 58.8 T.2 = 78.0 T.3 = 80.1 T.4 = 64.7 T.5 = 73.4

Y.1 = 14.7 Y.2 = 19.5 Y.3 = 20.025 Y.4 = 16.175 Y.5 = 18.35

1 9.1 13.4 15.6 11.0 12.7

Total del tratamiento

T1. = 61.8

T2. = 100

T3. = 119.3

T4. = 73.9

T.. = 355.0

Media del tratamiento

Y1. = 12.36

Y2. = 20.0

Y3. = 23.86

Y4. = 14.78

Y.. = 17.75

Advierta que, como cabría esperar, parece haber diferencias sustanciales entre las medias de bloques. Además, se observan ciertas diferencias entre las medias de tratamientos. ¿Son esas diferencias de naturaleza extrema suficientes para permitir la conclusión de que existen diferencias en el desgaste promedio de la superficie de rodamiento de esos cuatro tipos de neumáticos? A fin de responder la pregunta, se requiere desarrollar una prueba para verificar estadísticamente:

H0: µ1. = µ2 . = µ3. = µ 4 . con base en los datos precedentes.

El modelo En la redacción del modelo del diseño de bloques completos aleatorizados con efectos fijos, se requiere la notación siguiente:

536

PROBABILIDAD Y ESTADÍSTICA

µij = media del i-ésimo tratamiento y el j-ésimo bloque b

µi . = media del i-ésimo tratamiento = ∑ µij /b j =1

k

µ .j = media del j-ésimo bloque = ∑ µij /k i =1

k

b

µ = media global = ∑ ∑ µij /kb i =1 j =1

τi = µi . − µ = efecto debido al hecho de que la unidad experimental recibió el i-ésimo tratamiento βj = µ.j − µ = efecto debido al hecho de que la unidad experimental está en el j-ésimo bloque Eij = Yij − µij = error residual o aleatorio Ahora, es posible expresar el modelo como sigue: Modelo para el diseño de bloques completos aleatorizados Yij = µ + τ i + β j + E ij

Este modelo expresa simbólicamente el concepto de que cada observación se puede dividir en cuatro componentes reconocibles: la media de efecto global µ, el efecto de tratamiento τi, el efecto de bloque βj y una desviación aleatoria Eij que se atribuye a fuentes inexplicadas. Se tienen los supuestos del modelo siguientes: 1. Las k . b observaciones constituyen muestras aleatorias independientes, cada uno de tamaño 1, de k . b poblaciones con medias desconocidas µij. 2. Cada una de las k . b poblaciones tiene distribución normal. 3. Cada una de las k . b poblaciones tiene la misma varianza, σ 2. 4. Los efectos de bloque y tratamiento son aditivos, es decir, no existe interacción de los bloques con los tratamientos. Los supuestos 1-3 son idénticos a los del modelo de clasificación unidireccional, salvo que se consideran k . b, no k, poblaciones. El cuarto supuesto es nuevo y se requiere examinarlo de cerca. En pocas palabras, afirmar que los efectos de bloque y tratamiento son aditivos significa que los tratamientos tienen comportamiento constante de un bloque a otro, y los bloques lo tienen de un tratamiento a otro. En lo matemático, ello implica que la diferencia entre los valores medios de cualquier par de tratamientos es la misma en cada bloque, y la diferencia entre las medias de dos bloques es la misma para cada tratamiento. Si así no fuera, entonces puede afirmarse que existe interacción de los bloques con los tratamientos. El concepto de supuestos aditivos contra su interacción se ilustra en la figura 13.3. En cada caso, se representa gráficamente la media teórica de los tres tratamientos A, B y C en cada par de bloques. Cuando no existe interacción, los segmentos de la línea que unen a cualquier par de medias

ANÁLISIS DE VARIANZA

Bloque 1

537

Bloque 1

Bloque 2

Bloque 2

A

B

C

A

Tratamiento a)

B

C

Tratamiento b)

FIGURA 13.3 a) Efecto aditivo, sin interacción (los segmentos de línea son paralelos); b) existe interacción (los segmentos de línea no son paralelos).

son paralelos de un bloque a otro, como en la figura 13.3a. En términos prácticos, ello significa que es factible hacer afirmaciones generales acerca de los tratamientos sin tener que especificar el bloque correspondiente. Por ejemplo, es correcto afirmar que la media del tratamiento A es menor que la de los tratamientos B y C. Esta afirmación es válida en ambos bloques. Los segmentos de recta no son paralelos en la figura 13.3b. Ello significa que existe interacción de los bloques y tratamientos. En otras palabras, debe tenerse mucho cuidado al hacer afirmaciones respecto de los tratamientos, ya que también reviste importancia el bloque correspondiente. Por ejemplo, ya no sería correcto afirmar que el tratamiento A tiene media menor que B y C. Tal afirmación sería válida con el bloque 1, no así con el bloque 2. En lo matemático, esa naturaleza aditiva significa que:

µij = µ + τ i + βj = µ + (µi . − µ ) + (µ.j − µ ) Al sustituir, puede rescribirse el modelo teórico como sigue:

µij − µ = τ i + βj = (µi . − µ ) + (µ. j − µ ) + { µij − [µ + (µi . − µ ) + (µ.j − µ )]} El reemplazo de los parámetros con sus estimadores insesgados respectivos lleva a:

Yij − Y .. = (Yi . − Y ..) + (Y .j − Y ..) + {Yij − [Y .. + (Yi . − Y ..) + (Y .j − Y ..)]} Si cada miembro de esta identidad se eleva al cuadrado, se suma respecto de todos los valores posibles de i y j, y se simplifica, resulta la identidad siguiente de suma de cuadrados del diseño de bloques completamente aleatorizados:

538

PROBABILIDAD Y ESTADÍSTICA

Identidad de suma de cuadrados k

b

k

b

∑ ∑ (Yij − Y ..)2 =∑ b(Yi . − Y ..)2 + ∑ k (Y .j − Y ..)2

i =1 j =1

i =1

j =1

k

b

+ ∑ ∑ (Yij − Yi . − Y .j + Y ..)2 i =1 j =1

La interpretación práctica de cada componente es similar a la del modelo de clasificación unidireccional. En particular: k

b

∑ ∑ (Yij − Y ..)2

i =1 j =1

= medida de la variabilidad total de los datos = suma de cuadrados total (SSTot)

k

∑ b(Yi . − Y ..)2

= medida de la variabilidad de los datos atribuibles al uso de tratamientos distintos = suma de cuadrados de los tratamientos (SSTr) b 2 ∑ k (Y .j − Y ..) = medida de la variabilidad de los datos atribuibles al uso de j =1 bloques distintos = suma de cuadrados de los bloques (SSBlks) k b 2 ∑ ∑ (Yij − Yi . − Y .j + Y ..) = medida de la variabilidad de los datos debida a factores i =1 j =1 aleatorios = residuo o suma de cuadrados del error (SSE) i =1

En forma simbólica, la identidad de la suma de cuadrados es: Identidad conceptual de suma de cuadrados de bloques aleatorizados SS Tot = SS Tr + SS Blks + SS E La hipótesis de medias de tratamientos iguales puede expresarse con base en los efectos de tratamientos τi. A fin de ver cómo se logra, note que si µ1. = µ2 . = . . . = µ k ., entonces: k

b

µ = ∑ ∑ µij /kb i =1 j =1 k

= ∑ µi ./k i =1

= µi . para cada i = 1, 2, . . . , k

Por definición, τi = µi . − µ. Por ende, si las medias de tratamiento son iguales, su valor común es µ y cada efecto de tratamiento tiene valor 0. La hipótesis nula del experimento: H 0: µ1. = µ2 . = . . . = µ k . es equivalente a: H 0: τ 1 = τ 2 = . . . = τ k = 0

ANÁLISIS DE VARIANZA

539

Al igual que el caso del modelo de clasificación unidireccional, esta forma de H0 es útil si se pretende considerar el diseño de bloques completos aleatorizados como un modelo lineal general y analizar los datos mediante técnicas de regresión.

Prueba de H0 La prueba de esta hipótesis se obtiene de manera similar a la utilizada en el diseño de clasificación unidireccional. El uso de los supuestos del modelo y las reglas de la esperanza permite demostrar que el cuadrado de medias esperadas de los tratamientos está dado por:

E[ MS Tr ] = E[ SS Tr /( k − 1)] k

b∑ τ i2 =σ2 +

i =1

( k − 1)

Definir el cuadrado medio del error requiere notar en primer término que los grados de libertad relacionados con esta estadística corresponden a lo usual, a saber: Tamaño – 1 – grados de libertad relacionados muestral global con otros componentes del modelo o kb − 1 − [( k − 1) + (b − 1)] = ( k − 1)(b − 1) Al igual que antes, el cuadrado medio del error es un estimador insesgado de σ 2. En otras palabras:

E[ MS E ] = E[ SS E /( k − 1)(b − 1)] = σ 2 A fin de probar la hipótesis nula siguiente: H 0: τ 1 = τ 2 = . . . = τ k = 0 se usa la razón F: Estadística de prueba de H 0: µ 1 . = µ 2 . = . . . = µ k .

Fk − 1, ( k − 1)( b − 1) =

MSTr MS E

Si la hipótesis nula es verdadera, tanto el numerador como el denominador de la estadística F son estimadores de σ 2 y el valor observado de esa estadística debe ser cercano a 1; en caso contrario, el numerador debe ser mayor que el denominador, con lo que se tiene una razón F mayor que la unidad. La prueba sirve para rechazar H0 si el valor observado de la estadística de prueba es excesivamente grande para haber ocurrido al azar. En la tabla 13.5, se resumen las ideas desarrolladas en esta sección y se incluyen algunas fórmulas de cálculo de SSTr y SSBlks.

Efectividad del uso de bloques El uso de bloques está diseñado para controlar el efecto de una variable extraña, por lo que es natural preguntarse: “¿Tuvo éxito el uso de bloques?” En caso afirmativo, SSBlks debe explicar una porción

540

PROBABILIDAD Y ESTADÍSTICA

TABLA 13.5 Tabla ANOVA para el diseño de bloques completos aleatorizados de efectos fijos Fuente de variación

Grados de libertad (DF)

Suma de cuadrados (SS)

Cuadrados medios (MS)

Tratamiento

k −1

Ti .2 T ..2 − kb i=1 b

SSTr /( k − 1)

Bloque

b −1



Error Total

k

∑ b

T .2j k

j =1

( k − 1)(b − 1)

kb − 1



T ..2 kb

Sustracción k

b

∑ ∑ Yij2 −

i=1 j =1

Cuadrado medio esperado

τ i2 i = 1 ( k − 1) k

σ2 +b∑

F MSTr MSE

SSBlks /(b − 1) SSE /( k − 1)(b − 1)

σ2

T ..2 N

considerable de la suma de cuadrados total. A su vez, ello reduce el valor de SSE, con lo que se incrementa el de la razón F utilizada para probar la igualdad de las medias de tratamiento y es más probable que se rechace la hipótesis nula. En breve, se incrementa la potencia de la prueba. Advierta que el número de grados de libertad del error en el diseño de clasificación unidireccional es N − k; su valor es menor en el diseño de bloques completos aleatorizados, a saber, (k − 1)(b − 1) = (N − k) − (b − 1). En la tabla IX del apéndice A, observe que aumenta el valor de F conforme disminuye el número de grados de libertad relacionados con el denominador de la razón F. La consecuencia de eso es que el uso innecesario de bloques entraña pagar el precio de ese error. En particular, al disminuir el número de grados de libertad de error, aumenta el valor del punto crítico para probar H0 y es más difícil rechazar esta hipótesis. La potencia de la prueba se reduce. Está claro que el uso de bloques es útil cuando resulta apropiado, si bien debe evitarse su aplicación indiscriminada. La única guía para decidir si se usan los bloques o no cuando se realiza un experimento por primera vez, es la intuición, basada en los conocimientos del tema. Una vez efectuado dicho experimento, se evalúa la efectividad de los bloques, de modo que se diseñen con eficacia estudios futuros. Parece razonable aconsejar que el uso de bloques es innecesario cuando las medias de los bloques son iguales, mientras que resulta útil en cualquier otro caso. Sin embargo, se carece de una forma válida de poner a prueba la hipótesis nula de medias de bloques iguales. Una estrategia usada para investigar la efectividad del uso de bloques es estimar la eficacia relativa (RE ) del diseño de bloques completos aleatorizados en comparación con el diseño completamente aleatorizado que se describe en la sección 13.1. El desarrollo teórico del concepto de eficacia relativa rebasa el alcance de la obra, si bien aparece en [27] y [31]. La eficacia relativa es un número positivo que puede interpretarse como la razón del número de observaciones por tratamiento necesaria para que dos diseños sean equivalentes. Por ejemplo, si RE = 3, entonces el diseño completamente aleatorizado requiere el triple de observaciones que el diseño de bloques completos aleatorizados para que se tenga una prueba de las mismas características, en cuyo caso es aconsejable recurrir a los bloques. El uso de bloques no es aconsejable cuando RE = 0.5, ya que con el diseño completamente aleatorizado puede lograrse lo mismo que con el diseño de bloques aleatorizados, con la mitad de observaciones. Si RE = 1, entonces los diseños son equivalentes con tamaños muestrales idénticos.

ANÁLISIS DE VARIANZA

541

¿Es posible estimar rápidamente la eficacia relativa a partir del análisis de varianza original? Por fortuna, se cuenta con una forma fácil de lograrlo. Se ha observado (véase [32]) que existe relación lineal de RE con la razón: MS Blks /MS E donde: MSBlks = cuadrado medio del bloque = SSBlks/(b − 1) Esa relación está dada por: RE = c + (1 − c )( MSBlks / MSE ) donde c = b(k – 1)/(bk – 1). Es fácil demostrar que: RE = 1

si y sólo si MSBlks/MSE = 1

RE < 1

si y sólo si MSBlks/MSE < 1

RE > 1

si y sólo si MSBlks/MSE > 1

Así pues, para elaborar un juicio acerca de si es útil o dañino el uso de bloques en un experimento dado, es posible usar la información disponible del ANOVA para encontrar el valor de MSBlks/MSE. Luego, se estima la eficacia relativa y se decide a partir de consideraciones prácticas, como el tiempo, costo y esfuerzos necesarios para usar los bloques, si su uso vale la pena. A medida que se acumula experiencia, se vuelve innecesario el cálculo real de RE. Basta considerar el valor observado de MSBlks/MSE. Si es considerablemente mayor que la unidad, indica que el uso de bloques es benéfico; si es cercano a ella, que no ayuda ni causa daño, y si es un tanto menor que 1, que no resulta útil. En este último caso, se considera preferible en estudios futuros la utilización de un diseño totalmente aleatorizado. Debe mencionarse que algunas obras incluyen una “prueba” de bloques basada en la estadística MSBlks/MSE. Sin embargo, esa prueba es inapropiada debido a la manera en que se logra la aleatorización en el diseño de bloques completos aleatorizados. A manera de ilustración, se continúa el análisis de los datos del ejemplo 13.5.1. Ejemplo 13.5.2. En la comparación de los cuatro tipos de neumáticos para uso de autobuses, se prueba la hipótesis nula de que no existen diferencias respecto del desgaste promedio de la superficie de rodamiento entre las marcas. En otras palabras, se intenta probar: H0: µ1. = µ2 . = µ3. = µ 4 .

Se tienen calculadas las estadísticas de resumen siguientes: T1. = 61.8 T2 . = 100 T3. = 119.3 T4 . = 73.9

T .1 = 58.8 T .. = 355 T .2 = 78.0 T .3 = 80.1 T .4 = 64.7 T .5 = 73.4

542

PROBABILIDAD Y ESTADÍSTICA

TABLA 13.6 Tabla ANOVA de datos de desgaste de neumáticos Fuente de variación

Grados de libertad (DF)

Suma de cuadrados (SS)

Tratamientos Bloque Error

3 4 12

401.338 81.525 26.167

Total

19

509.030

Cuadrado medio (MS) 133.779 20.381 2.181

F 61.340 9.345*

En relación con los datos que se tienen, ∑4i = 1 ∑5j 1 Yij2 = 6 810.28. El uso de las fórmulas de cálculo de la tabla 13.5 debe permitir que el lector verifique muchas de las cifras de la tabla ANOVA mostradas en la tabla 13.6. Puesto que f0.05(3, 12) = 3.49 y 61.34 > 3.49, es posible rechazar:

H0: µ1. = µ2 . = µ3. = µ 4 . con P < 0.05. Se tiene evidencia estadística concluyente de las diferencias en la media de desgaste de la superficie de rodamiento de los cuatro tipos de neumáticos. El valor con asterisco en la tabla es el observado de la razón MSBlks/MSE, usada para evaluar la efectividad de la utilización de bloques. Puesto que este valor es mayor que la unidad, es posible llegar a la conclusión de que los bloques resultan apropiados en este experimento. La eficacia relativa estimada es: RE = c + (1 − c)( MS Blks/MS E ) donde c = b( k − 1)/( bk − 1) = 5( 3)/(19) = 0.789. En este caso RE = 0.789 + 0.211( 9.345) = 2.76

Comparaciones por pares Al igual que en el diseño totalmente aleatorio de clasificación unidireccional, es posible emprender k comparaciones por pares mediante   pruebas tipo T de Bonferroni, con selección minuciosa de α 2 para mantener bajo control α'. En este caso, se trata de pruebas T por pares. Tenga en cuenta que este método es factible sólo cuando k es más bien pequeña. Ello se debe a que los valores altos de k obligan a que α sea extremadamente pequeña, lo que lleva a una prueba con muy poca potencia. También se cuenta con una prueba de rangos múltiples de Duncan. Se efectúa de la manera antes descrita, con: MS E b Note que los tamaños muestrales son iguales en este diseño. A fin de utilizar el procedimiento de Tukey, se recurre a la ecuación 13.1, puesto que el número de observaciones de cada tratamiento es igual. Así pues, se afirma que µi . es significativamente diferente de µj . si Yi . − Y j . es mayor que: SSR p = rp

q(α, k , v ) MS E /b , donde b es el número de bloques.

ANÁLISIS DE VARIANZA

543

0.4

f(t)

0.3

T12

0.2

0.98

0.1 0.01

0.01

0.0

–3

–2

–1

0

1

2

3

t

2.681 FIGURA 13.4 Valor T usado para calcular el punto crítico a fin de probar H0: µi = µj . a un nivel α = 0.2. El número de grados de libertad es (k – 1)(b – 1) = 12.

Esta sección concluye con el uso de las pruebas T de Bonferroni para completar el análisis de los datos del ejemplo 13.5.1. Ejemplo 13.5.3. En los dos ejemplos previos, se calculan diferencias significativas en el desgaste de la superficie de rodamiento entre los cuatro tipos de neumáticos estudiados y es apropiado el uso de bloques.  4 El número de comparaciones por pares que se efectúa es   = 6. Pueden usarse el procedimiento 2 de Duncan o las pruebas T de Bonferroni. Si se utiliza el primero, debe ajustarse α a 0.01, para mantener razonablemente baja la tasa de error del experimento. En tal caso, se emprenden las pruebas T de Bonferroni con α' controlada en 0.12. Para ello, se calcula que la tasa de error de comparación es α = 0.12/6 = 0.02. Puesto que los tamaños muestrales son iguales, el punto crítico común de las pruebas T de Bonferroni es:

cp = t( k − 1)( b − 1), 1 − α /2 MSE [(1/ n) + (1/ n)] El punto t(k – 1)(b – 1),1 − α/2 se muestra en la figura 13.4 y su valor es 2.681. El cuadrado medio del error, 2.181, se determina en la tabla 13.6. Cada media de tratamiento se basa en muestra de tamaño 4, de modo que n = 4 y el punto crítico es: cp = 2.681 2.181[(1/ 4) + (1/ 4)]

2.80

Afirmar que son diferentes dos medias poblacionales requiere que sus medias muestrales correspondientes difieran al menos en 2.80. Las medias muestrales ordenadas, con las diferencias no significativas subrayadas, son: Y1. 12.36

Y4 . 14.78

Y2 . 20.0

Y3. 23.86

Todos los pares de medias son significativamente diferentes, excepto 1 y 4. Es conveniente el menor desgaste de la superficie de rodamiento, por lo que el experimentador puede sacar en conclusión que los neumáticos de tipos 1 y 4 son superiores a los tipos 2 y 3. Aunque no podría afirmar que un tipo sea claramente superior a otros, sí puede decir que el tipo 3 es claramente inferior a los demás, con base en los datos.

544

13.6

PROBABILIDAD Y ESTADÍSTICA

CUADRADOS LATINOS

Se analizó ya la forma de usar el diseño de bloques completos aleatorizados para controlar el efecto de una fuente de variación extraña. En el ejemplo 13.5.1, se comparan cuatro tipos de neumáticos. Los autobuses los utilizan bajo situaciones de conducción distintas, por lo que se consideran como bloques para explicar esa variable extraña. En este ejemplo, existe otra fuente de variación reconocible, que debe controlarse, a saber, se supone que el desgaste de los neumáticos recibe efecto de la posición del neumático en el autobús. Los neumáticos delanteros se desgastarían más rápidamente que los traseros. Sería útil diseñar un experimento que tome en cuenta esa observación. Ello puede hacerse con el llamado diseño de cuadrados latinos. En general, un cuadrado latino es provechoso cuando el experimentador necesita controlar dos fuentes de variación extrañas. Cada una de esas variables es una variable de bloque. Las pruebas de hipótesis respecto de las diferencias entre los niveles de esas variables son inapropiadas. Así pues, el diseño de cuadrados latinos es uno con el que se controla, en el diseño mismo del experimento, el efecto de la presencia de dos variables extrañas. A fin de que un cuadrado latino sea apropiado, el número de niveles con el que se estudia el factor extraño debe ser el mismo que el de las medias poblacionales comparadas. En el ejemplo, se estudian cuatro tipos de neumáticos. Así pues, se necesitan cuatro autobuses, en cada uno de los cuales se utilizan cuatro posiciones naturales de los neumáticos. Los tipos de estos últimos deben asignarse aleatoriamente a los autobuses y posiciones, de manera tal que cada tipo de neumático se use exactamente una vez en cada autobús y en cada posición. La distribución aleatoria se logra mediante la selección al azar de un diseño, de entre las tablas existentes de diseños de cuadrados latinos. Éstas aparecen en [15]. En el estudio de neumáticos, se necesita un diseño 4 × 4. Un diseño prototípico se muestra en la tabla 13.7, donde las letras A, B, C y D se refieren al tipo de neumático empleado. A manera de ejemplo, ese diseño indica que el neumático tipo B se utiliza en la posición I del autobús I; el neumático tipo C, en la posición II del autobús I, y así sucesivamente. Advierta que cada tipo de neumático se incluye una sola vez en cada autobús y en cada posición, como se pretendía. En general, se requiere un diseño r × r cuando se comparan r medias poblacionales en presencia de dos variables extrañas. Cada tratamiento ocurre exactamente una vez en cada fila y en cada columna del diseño. La teoría subyacente al análisis del diseño de cuadrados latinos es una ampliación de la correspondiente al de bloques completos aleatorizados. Sin embargo, la notación se vuelve un tanto más compleja. En este caso, Yijk denota la respuesta al tratamiento aplicado en la fila j y la columna k. Por ejemplo, en el experimento de neumáticos el tratamiento aplicado en la fila y columna 1 es B, el segundo tratamiento. Ello se indica al escribir la respuesta como Y211. La disposición completa de datos del diseño de la tabla 13.7 se muestra en la tabla 13.8. El modelo del diseño de cuadrados latinos está dado por: Modelo del diseño de cuadrados latinos

Yijk = µ + τ i + β j + γ k + E ijk

donde τi es un efecto de tratamiento, βj es un efecto de fila, y γk es un efecto de columna. En el ejemplo, τi se debe al tipo de neumático usado, βj es el efecto relacionado con la posición del neumá-

ANÁLISIS DE VARIANZA

TABLA 13.7 Diseño de cuadrados latinos 4 × 4 prototípico

545

TABLA 13.8 Distribución de datos para el diseño de la tabla 13.7

Factor (autobús)

Factor (autobús)

Factor (posición del neumático)

I

II

III

IV

Factor (posición del neumático)

I II III IV

B C D A

C D A B

D A B C

A B C D

I II III IV

I

II

III

IV

Y211 Y321 Y431 Y141

Y312 Y422 Y132 Y242

Y413 Y123 Y233 Y343

Y114 Y224 Y334 Y444

tico en el autobús y γk es el efecto atribuido al autobús mismo. Se tienen los supuestos del modelo siguientes: 1. Las r 2 observaciones constituyen muestras aleatorias independientes, cada una de tamaño 1, de r 2 poblaciones, cada una de media desconocida. 2. Cada una de las r 2 poblaciones tiene distribución normal. 3. Cada una de las r 2 poblaciones posee la misma varianza, σ 2. 4. No existe interacción, es decir, los únicos efectos presentes se deben a que las variables de fila, tratamiento y columna actúan de manera separada, como se indica en el modelo. La hipótesis nula que se intenta probar es: H 0: µ1.. = µ2 .. = . . . = µ r .. las medias de tratamiento son idénticas Los totales necesarios y medias muestrales son: Ti .. = total de todas las respuestas al tratamiento i Yi .. =

Ti .. = media de todas las respuestas al tratamiento i r

T .j. = total de todas las respuestas en la fila j T . j.

Y . j. =

r

= media de todas las respuestas en la fila j

T ..k = total de todas las respuestas en la columna k T ..k = media de todas las respuestas en la columna k r T... = total de todas las respuestas Y ..k =

Y ... =

T ... = media de todas las respuestas r2

En forma simbólica, la identidad de la suma de cuadrados es: Identidad de suma de cuadrados conceptual de cuadrados latinos SS Tot = SS Tr + SS Filas + SS Col + SS E

546

PROBABILIDAD Y ESTADÍSTICA

TABLA 13.9 Tabla ANOVA para el diseño de cuadrados latinos de efecto fijo Fuente de variación

Grados de libertad (DF)

Suma de cuadrados (SS) r

Tratamiento

r −1

Fila

r −1

Columna

r −1

Error

(r − 1)(r − 2)

Total

r2 − 1



i=1

2

Ti .. T ... − 2 r r

r



2

j =1

T . j.2 r



T ...2 r2

T ..2k T ...2 − 2 k =1 r r r

SSTr /(r − 1)

MSTr / MSE

SSCol /(r − 1)

Sustracción

∑ ∑ ∑Y −

F

SSFilas /(r − 1)



2 ijk todas las i, j , k posibles

Cuadrado medio (MS)

SSE /(r − 1)(r − 2) 2

T ... r2

Esas sumas de cuadrados se definen y calculan de manera análoga a las del diseño de bloques completos aleatorizados. Por ejemplo:

Ti ..2 T ...2 − 2 r i =1 i =1 r Se pide al lector que determine la forma de las demás como ejercicio. El número total de grados de libertad está dado por el tamaño muestral total menos la unidad, o sea, r2 − 1. Los grados de libertad se dividen como sigue: r

r

Suma de cuadrados del tratamiento = SS Tr = r ∑ (Yi .. − Y ...)2 = ∑

DF (total) = DF (tratamientos) + DF (filas) + DF (columnas) + DF (error) o r 2 − 1 = ( r − 1) + ( r − 1) + ( r − 1) + ( r − 1)( r − 2) Dividir la suma de los cuadrados entre sus grados de libertad respectivos permite obtener los cuadrados de medias necesarios para probar H0. La estadística de prueba es: Estadística de prueba H 0: µ 1.. = µ 2.. = . . . = µ r ..

Fr − 1, ( r − 1)( r − 2) =

MSTr MS E

El ANOVA completo se muestra en la tabla 13.9. Note que se enumera únicamente la razón F usada para probar la igualdad entre las medias de tratamiento. Al igual que en el diseño de bloques completos aleatorizados, se carece de una prueba válida para determinar la efectividad de controlar las dos fuentes extrañas de variación. Sin embargo, es posible evaluar los beneficios del control en cada caso al hacerlo con las razones MSFilas/MSE y MSCol/MSE. Siempre que el valor de ésta exceda de la unidad, el diseño es útil para explicar las fuentes de variación extrañas.

ANÁLISIS DE VARIANZA

13.7

547

MODELOS DE EFECTOS ALEATORIOS

Clasificación unidireccional Se denomina modelo de efectos fijos al estudiado en la sección 13.1. El término implica que el experimentador selecciona específicamente los niveles del factor o “tratamiento” porque revisten interés particular. El propósito del experimento es obtener inferencias acerca de las medias de las poblaciones dadas, de las cuales se extraen las muestras. Sin embargo, cuando se pretende elaborar una generalización amplia acerca de un conjunto mayor de poblaciones, no sólo las k poblaciones de las que se obtienen las muestras, es apropiado el llamado modelo de efectos aleatorios. En este caso, se considera que las k poblaciones muestreadas conforman una muestra aleatoria de poblaciones, extraída del conjunto más grande. La hipótesis de interés no es µ1 = µ2 = . . . = µk. En su lugar, se pretende determinar si existe variabilidad entre las medias poblacionales del conjunto al cual pertenecen esas poblaciones. El modelo de efectos aleatorios se escribe como sigue. Modelo de efectos aleatorios de clasificación unidireccional Yij = µ + Ti + Eij donde:

µ = efecto medio global µi = media de la i-ésima población seleccionada para el estudio Ti = µi − µ = efecto del i-ésimo tratamiento Eij = Yij − µi = error aleatorio o residual Se parte de los supuestos del modelo siguientes: 1. Las k muestras son muestras aleatorias independientes de k poblaciones seleccionadas al azar de un conjunto de poblaciones más amplio. 2. Cada una de las poblaciones de ese conjunto tiene distribución normal y, por ende, cada población muestreada también es normal. 3. Cada una de las poblaciones de ese conjunto tiene la misma varianza σ 2, de modo que ésta también es la varianza de cada una de las k poblaciones muestreadas. 4. T1, T2, . . . , Tk son variables aleatorias independientes de distribución normal, cada una con 2 media 0 y varianza común σ Tr . El modelo mismo y sus tres primeros supuestos son similares al modelo de efectos fijos. Sin embargo, una diferencia importante entre ellos se expresa en el supuesto 4. En el modelo de efectos fijos, el experimentador selecciona intencionalmente los niveles o tratamientos usados en el experimento porque interesan en particular. Si se repite el experimento, se usarían los mismos tratamientos. En otras palabras, se muestrearían cada vez las mínimas poblaciones y no variarían los k efectos de los tratamientos αi = µi − µ. Ello implica que los k efectos del tratamiento son constantes desconocidas en el modelo de efectos fijos. El primer paso de un experimento de efectos aleatorios es seleccionar aleatoriamente k poblaciones para su estudio, de modo que las seleccionadas varían de una repetición a otra. Así pues, los k términos Ti = µi − µ no son constantes, sino más bien variables aleatorias, cuyos valores en una repetición dada dependen de la selección de las k poblaciones de estudio. Se supone

548

PROBABILIDAD Y ESTADÍSTICA

TABLA 13.10 Tabla ANOVA para el diseño de clasificación unidireccional con efectos aleatorios Fuente de variación

Grados de libertad (DF )

Suma de los cuadrados (SS )

Cuadrado medio (MS )

Cuadrado medio esperado

Tratamiento o nivel

k −1



Ti .2 T ..2 − N i = 1 ni

SSTr k −1

σ 2 + n 0σ Tr2

Residuo o error

N −k

Sustracción

SSE N −k

σ2

Total

N −1

∑ ∑ Yij2 −

k

k

ni

i=1 j =1

F

MSTr MS E

T ..2 N

que esas variables son independientes y de distribución normal, cada una con media 0 y varianza 2 común σ Tr . Si las medias poblacionales del conjunto más amplio son iguales, entonces los efectos de los 2 tratamientos Ti = µi − µ no varían, es decir, σ Tr es igual a 0. Así pues, en el modelo de efectos aleatorios la hipótesis de medias iguales se expresa como: 2 H 0: σ Tr = 0 (sin variabilidad de los efectos de tratamientos) 2 H1: σ Tr ≠ 0 Aunque el modelo de efectos aleatorios de clasificación unidireccional difiere del modelo de efectos fijos, en ambos se verifica H0 exactamente de la misma manera. La diferencia entre los supuestos de los modelos concerniente a la naturaleza de los efectos de los tratamientos no se refleja en el manejo de los datos, sino más bien en los cuadrados de la media esperada. Estas esperanzas se muestran en la tabla 13.10. El término n0, que aparece en el cuadrado medio esperado de los tratamientos, está dado por:

k

N 2 − ∑ ni2 n0 =

i =1

N ( k − 1)

Si los tamaños muestrales son iguales, esa expresión se reduce a n. El lector puede apreciar que cuando H0 es verdadera, se estima σ 2 tanto con MSTr como con MSE. En este caso, la razón MSTr/MSE de tipo F debe tener valor cercano a la unidad. De lo contrario, se espera que MSTr sea mayor que σ 2, con lo que se tiene razón F que excede de 1. A semejanza del modelo de efectos fijos, se rechaza H0 con valores de la estadística de prueba demasiado grandes para haber ocurrido al azar, con base en la distribución Fk – 1, N – k. En caso de rechazar H0, no se emprenden pruebas de comparación múltiples, a diferencia del 2 , la variabilidad de los efectos de tratamiento. Con modelo de efectos fijos. En su lugar, se estima σ Tr base en la tabla de cuadrados de la media esperada, es fácil apreciar que un estimador insesgado de ese parámetro está dado por: MS Tr − MS E n0 Esas ideas se ilustran con el ejemplo siguiente. 2 σˆ Tr =

ANÁLISIS DE VARIANZA

549

TABLA 13.11 Tabla ANOVA de los datos de voltímetros Fuente de variación

Grados de libertad (DF)

Suma de cuadrados (SS)

Cuadrado medio (MS)

Tratamiento Error

5 18

11.257 7.669

2.251 0.426

Total

23

18.926

F 5.284

Ejemplo 13.7.1. Una compañía de servicios públicos tiene en existencia numerosos voltímetros, que usan indistintamente muchos empleados. Se realiza un estudio para identificar las diferencias entre los valores promedio que se obtienen con esos voltímetros. En el caso de que parezca haber tales diferencias, se calibrarán todos los voltímetros en existencia. Se selecciona una muestra aleatoria de seis medidores y se realizan cuatro mediciones con cada uno. La variable de respuesta es la diferencia entre los valores de los voltímetros y el voltaje conocido, que se aplica en el momento de la medición. Se obtienen los resultados siguientes: Voltímetro 1 0.18 –1.31 0.15 –0.81

2

3

–0.15 1.85 0.63 0.45

–0.25 0.77 1.65 1.24

4 1.95 1.03 0.65 1.25

5 –0.90 –0.50 0.25 –0.88

6 1.10 1.21 0.68 0.92

Los seis voltímetros usados en el experimento son una muestra aleatoria extraída de una población más amplia de voltímetros, por lo que es apropiado un modelo de efectos aleatorios de clasificación unidireccional. Las hipótesis nula y alternativa son: 2 H0: σ Tr =0

y

(no existen diferencias entre los efectos de tratamiento: se obtienen los mismos valores promedio con todos los voltímetros en existencia)

2 H1: σ Tr ≠0

Al tratar los datos exactamente como en el modelo de efectos fijos, se obtiene el ANOVA que se muestra en la tabla 13.11. Si H0 es verdadera, se espera que la razón F observada sea cercana a 1, y en caso contrario que sea mucho mayor que la unidad. A partir de la distribución F5, 18, es posible rechazar la hipótesis nula con P < 0.05 ( f0.05 = 2.773, de la tabla IX del apéndice A). Se tienen pruebas estadísticas de diferencias entre las mediciones promedio de los voltímetros en existencia.

Es factible estimar el grado de variabilidad en los valores de los voltímetros que se debe a diferencias en los equipos mismos y a error aleatorio. A tal efecto, se estiman los componentes de varianzas 2 σ 2 y σ Tr . Con base en la tabla ANOVA, las estimaciones insesgadas de esos parámetros son:

σˆ 2 = MS E = 0.426 MS Tr − MS E 2 = σˆ Tr n0 2.251 − 0.426 = = 0.456 4

550

PROBABILIDAD Y ESTADÍSTICA

La variabilidad total estimada de las mediciones con los voltímetros es: 2 2 σˆ Tot = σˆ 2 + σˆ Tr = 0.426 + 0.456 = 0.882

La proporción de esa variabilidad total atribuida a las diferencias entre voltímetros es: 2 σˆ Tr 0.456 = = 0.517 2 ˆ σ Tot 0.882

(51.7% de la variabilidad total)

Así pues, parece necesaria la calibración de los voltímetros, ya que casi 52% de la variabilidad total es atribuible a diferencias entre los voltímetros.

13.8

MODELOS DE DISEÑO EN FORMA MATRICIAL

Como puede verse, los cálculos necesarios para analizar los datos se vuelven abrumadores a medida que el diseño del experimento se torna más complejo. Lo mismo ocurre en el contexto de la regresión: conforme se añaden más variables a la ecuación de regresión, los cálculos resultan tan engorrosos que obligan a emplear el álgebra matricial para el análisis eficaz de los datos. Es razonable suponer que podría hacerse lo mismo aquí. A fin de ver cómo se enfoca el problema, se reconsidera el modelo de clasificación unidireccional con efectos fijos. Se sabe que este modelo puede expresarse como:

Yij = µ + αi + E ij

i = 1, 2, . . . , k ;

j = 1, 2, . . . , ni

En forma expandida, se tiene:

Y11 = µ + αi + E11 Y12 = µ + αi + E12 .. . Y1n = µ + αi + E1n 1

1

Y21 = µ + α2 + E 21 Y22 = µ + α2 + E 22 .. . Y2 n = µ + α2 + E 2 n 2

2

.. .

Yk 1 = µ + α k + E k 1 Yk 2 = µ + α k + E k 2 .. . Ykn = µ + α k + E kn k

k

Los vectores de respuestas, parámetros y errores aleatorios están dados, respectivamente, por:

ANÁLISIS DE VARIANZA

Y   11   Y12   ...    Y1n   Y21     Y22  Y =  ...  α =   Y2 n   ...     Yk 1   Yk 2   ..   .  Ykn  1

2

551

E   11   E12   ...     E1n   E 21     E 22  E =  ...    E 2 n   ...     E k1   Ek2   ..   .   E kn  1

µ   α1  α2   ..  .  α k 

k

2

k

La matriz de especificación del modelo o de diseño es: 1  1.  ..  1 1 1 . X =  .. 1  .. . 1  1.  .. 1 

0  0 .. .  0 0 0 .. . 0   0 0 1  0 0 . . . 1 .. .. .. . . . 0 0 1

1 1 .. . 1 0 0 .. . 0

0 0 ... .. . 0 1 ... 1 .. . 1

Los cálculos rápidos permiten demostrar que el sistema de ecuaciones que define al modelo puede expresarse en forma matricial como sigue: Forma matricial del modelo de clasificación unidireccional Y = Xα + E Se trata precisamente de la forma matricial del modelo lineal general, obtenida con anterioridad. En otras palabras, el modelo de clasificación unidireccional con efectos fijos es tan sólo un caso especial del modelo lineal general. Difiere de los modelos de regresión estudiados en capítulos previos sólo en el formato de la matriz de especificación del modelo. En un modelo de regresión, la primera columna es de unos; las otras k columnas consisten en los valores observados de las variables independientes

552

PROBABILIDAD Y ESTADÍSTICA

X1, X2, . . . , Xk. En un modelo de diseño, la primera columna también es de unos, mientras que las otras k columnas consisten en bloques de unos y ceros. La hipótesis nula principal en el modelo de regresión es: H0: β1 = β2 = . . . = βk = 0

(la regresión no es significativa)

En la forma lineal general se escribe la hipótesis nula principal, referente a la no existencia de diferencias entre las medias de tratamiento: H0: α1 = α2 = . . . = αk = 0

(la regresión no es significativa, es decir, no existen diferencias entre los efectos de los tratamientos)

Como debe suponer el lector, el análisis matricial de un modelo de diseño es casi idéntico al de un modelo de regresión. La diferencia de enfoque se requiere por el hecho de que en el primero la matriz X'X no tiene inversa, es decir, ya no se puede afirmar que los parámetros µ, α1, α2, . . . , αk se estiman con:

αˆ = ( X'X )−1 X' Y Son varias las formas de remediar la situación. Sin embargo, su análisis completo rebasa el alcance de la obra. Se cuenta con obras excelentes si el lector desea profundizar en la materia ([27] y [35]). Ejemplo 13.8.1.

Considere, a manera de ilustración en un contexto sencillo, los datos siguientes:

Tratamiento 1

2

3

1.3 1.5 2.1

2.7 1.1 1.6 2.0

1.6 3.2

En relación con esos datos:

1.3   1.5  2.1  2.7 Y =  1.1   1.6  2.0 1.6   3.2

µ   α α =  1 α2  α   3

E   11   E12   E13  E   21 E =  E22  E   23   E24   E31    E32 

ANÁLISIS DE VARIANZA

553

La matriz de especificación del modelo es: 1  1 1 1 X = 1 1 1  1 1 9  3 X'X =  4 2

1 1 1 0 0 0 0 0 0

0 0 0 1 1 1 1 0 0

3 3 0 0

4 0 4 0

0  0 0 0  0 0 0  1 1 2  0 0 2

Note que X'X no tiene inversa, puesto que la primera columna de la matriz es la suma de las últimas tres columnas.

El diseño de bloques completos aleatorizados también puede expresarse en forma matricial. Se deja como tarea al lector la investigación de este modelo.

13.9 MÉTODOS NO PARAMÉTRICOS ALTERNOS Como se menciona en las secciones 8.7 y 10.6, existen análogos no paramétricos a la teoría normal de las pruebas T para dos muestras independientes y para muestras por pares cuando se prueban las diferencias de localización. Las ampliaciones de los problemas de dos muestras independientes y de muestras por pares a muestras múltiples se estudian en el presente capítulo con el análisis de varianza unidireccional y el diseño de bloques completos aleatorizados. Ambos procedimientos suponen poblaciones de distribución normal, con premisas más bien restrictivas acerca de las varianzas poblacionales. Por fortuna, se cuenta con análogos no paramétricos de los dos procedimientos para el caso de que no se satisfagan los supuestos de las pruebas de la teoría normal. La prueba no paramétrica concerniente al análisis de varianza de clasificación unidireccional es la prueba de Kruskal-Wallis. La prueba de Friedman es la opción no paramétrica respecto del diseño de bloques completos aleatorizados. Esos dos métodos de prueba se estudian en la presente sección.

Prueba de Kruskal-Wallis Suponga que se extraen k muestras aleatorias independientes de tamaños n1, n2, . . . , nk de poblaciones distribuidas en forma continua. El procedimiento de Kruskal-Wallis pone a prueba la hipótesis de que cada una de las k muestras se extrajo de poblaciones idénticas. Sin embargo, es una prueba especialmente sensible a las diferencias de localización, por lo que la hipótesis nula usualmente se expresa con base en la igualdad de las medianas poblacionales. Así pues, las hipótesis nula y alternativa se expresan como:

554

PROBABILIDAD Y ESTADÍSTICA

H0: M1 = M2 = . . . = Mk H1: al menos dos medianas poblacionales son desiguales En la ejecución de la prueba, las N = n1 + n2 + . . . + nk observaciones muestrales se combinan y ordenan de menor a mayor, con retención de la identidad de grupo. A semejanza de las pruebas de Wilcoxon, se asigna el rango promedio del grupo a los empates. Sea Ti, con i = 1, 2, . . . , k, la suma de los rangos que se relacionan con las observaciones de la i-ésima población. La estadística de la prueba de Kruskal-Wallis está dada por: 2 k  12 N + 1  H= ∑ ni Ti − 2  N ( N + 1) i = 1 

donde Ti = Ti /ni denota el promedio de los rangos asignados al i-ésimo grupo. Si la hipótesis nula es verdadera, puede demostrarse que E (Ti ) = ( N +1) / 2. Así pues, la estadística de la prueba de KruskalWallis es una medición de las desviaciones de los rangos promedio observados de los k grupos respecto del valor esperado cuando H0 es verdadera. Las desviaciones de gran magnitud llevan a valores relativamente altos de H y, por ende, al rechazo de la hipótesis nula. Aunque se cuenta con tablas exactas para valores pequeños de k y ni, se ha demostrado que H tiene distribución ji cuadrada aproximada, con k − 1 grados de libertad si todas las ni ≥ 5. Así pues, es posible obtener valores críticos aproximados de H de la distribución ji cuadrada que aparece en la tabla IV del apéndice A. El lector puede verificar fácilmente que una forma equivalente de cálculos de la estadística de prueba H, si bien más sencilla, es la siguiente: Estadística de prueba de H0: M1 = M2 = . . . = Mk

 12 k T2  H = ∑ i  − 3( N + 1)  N ( N + 1) i = 1 ni 

Ejemplo 13.9.1. Se realizan experimentos de comparación de la cantidad de presión necesaria para comprimir tres tipos de materiales. Se obtienen muestras aleatorias de tamaños 7, 7 y 10 de los materiales A, B y C, respectivamente. Las mediciones de presión y los rangos correspondientes (entre paréntesis) de la muestra combinada de 7 + 7 + 10 = 24 observaciones son los siguientes: Material A

Material B

Material C

207 (14) 150 (5) 197 (12) 173 (7) 147 (4) 144 (2) 192 (10)

194 (11) 146 (3) 175 (8) 186 (9) 223 (17) 143 (1) 170 (6)

288 (12.5) 269 (20) 288 (21.5) 358 (24) 229 (18) 249 (19) 346 (23) 217 (16) 203 (13) 214 (15)

ANÁLISIS DE VARIANZA

555

Las sumas de rangos son:

T1 = 14 + 5 + 12 + . . . + 2 + 10 = 54 T2 = 11 + 3 + 8 + . . . + 1 + 6 = 55 T3 = 21.5 + 20 + 21.5 + . . . + 13 + 15 = 191 El cálculo de la estadística de la prueba de Kruskal-Wallis lleva a obtener: 3  12 Ti2   − 3( N + 1) H = ∑  N ( N + 1) i = 1 ni  12  542 552 1912    − 3( 25) = + + 24( 25)  7 7 10  = 14.94 Con base en la tabla IV para k − 1 = 3 − 1 = 2 grados de libertad se observa que el valor crítico en el caso es 10.6 para un nivel de significación de 0.005. Se llega a la conclusión de que la cantidad de presión necesaria para comprimir los materiales difiere significativamente al menos en relación con dos de los materiales de prueba.

A semejanza de la prueba de suma de rangos de Wilcoxon, la de Kruskal-Wallis es muy robusta en comparación con la usual prueba F de la teoría normal. Además, se cuenta con diversos procedimientos de comparación múltiple en obras de referencia de estadística no paramétrica. Se pide al lector que consulte [23], [6] y [30].

Prueba de Friedman La prueba de Friedman es el análogo no paramétrico del diseño de bloques completos aleatorizados que se estudia en la sección 13.5. Como se analiza en dicha sección, el interés radica en comparar los efectos de k tratamientos (grupos) cuando es posible controlar la variación extraña mediante el uso de bloques. Se divide a las comunidades experimentales en b bloques, cada uno de tamaño k, de modo que los elementos de un bloque dado sean tan similares como resulte posible en lo concerniente a la variable extraña. Luego, los k tratamientos se asignan aleatoriamente a los elementos de cada bloque. En la verificación de la hipótesis de efectos de tratamiento iguales (diferencias de localización), se usa el procedimiento de asignación de rangos siguiente: las observaciones en cada bloque reciben la asignación de los rangos 1 a k (de la menor a la mayor), asignando calificaciones empatadas al rango promedio del grupo. Luego, se calcula el total del rango, Ti, de cada uno de los k tratamientos. La estadística de prueba de Friedman está dada por: Estadística de prueba H0: M1 . = M2 . = . . . = Mk . 2 k  12 b( k + 1)  S=  ∑ Ti − 2  bk ( k + 1) i = 1   12  k = ∑Ti2  − 3b( k + 1)  bk ( k + 1) i = 1 

Cuando la hipótesis nula es verdadera, resulta posible demostrar que E(Ti) = b(k + 1)/2. Así pues, la estadística de Friedman es una medida de las desviaciones de los totales de los rangos de tratamiento

556

PROBABILIDAD Y ESTADÍSTICA

observados respecto de su valor esperado con H0. Se cuenta con tablas de la distribución exacta de S con valores pequeños de b y k, si bien S tiene distribución ji cuadrada aproximada, con k − 1 grados de libertad. A partir de esa aproximación, se rechaza la hipótesis nula con valores de S que exceden los valores críticos indicados en la tabla IV, con niveles de significación específicos. Ejemplo 13.9.2. Los datos de algunos tipos de problemas se presentan originalmente en la forma de rangos, como está implícito en las secciones sobre procedimientos no paramétricos alternos. En el caso de tales datos, debe estar claro que no se satisfacen los supuestos de normalidad y, por consiguiente, lo más probable es que sean inválidas las pruebas de la teoría normal. En el presente ejemplo, se intenta determinar si existen diferencias significativas en la preferencia por ocho marcas de terminales de cómputo. Se pide a cuatro jueces que califiquen las ocho marcas, con asignación del rango 1 a su primera elección, el 2 a la segunda, y así sucesivamente. El experimento se realiza con un diseño de bloques completos aleatorizados, con las ocho marcas de terminales como tratamientos y los cuatro jueces como bloques. Los datos resultantes son los que siguen: Terminal

Juez I Juez II Juez III Juez IV Totales de rangos

1

2

3

4

5

6

7

8

1 4 3 3

2 1 4 1

3 3 2 6

4 2 1 2

5 5 7 5

6 6 5 4

7 8 6 7

8 7 8 8

11

8

14

9

22

21

28

31

Las hipótesis que se pretenden verificar son: H0: igual preferencia por todas las terminales H1: diferencia significativa en las preferencias por lo menos hacia dos terminales El cálculo de la estadística de prueba de Friedman lleva a obtener:  12  S=  (112 + 82 + 142 + . . . + 312 ) − 3( 4)(9)  ( 4)(8)(9)  = 22.5 En la tabla IV, puede verse que el valor crítico para k − 1 = 7 grados de libertad es de 18.50 con un nivel α = 0.01. Por lo tanto, puede concluirse que existe diferencia significativa en la preferencia para al menos dos terminales. De nueva cuenta, se menciona que los procedimientos de comparación múltiple están disponibles en diversas obras sobre técnicas no paramétricas y permiten determinar cuáles tratamientos difieren significativamente entre sí.

RESUMEN DEL CAPÍTULO Se presentan los fundamentos del análisis de varianza respecto de algunos modelos de diseño experimental básicos. Se consideran la clasificación unidireccional, bloques completos aleatorizados y experimentos de cuadrados latinos. Se analizan métodos de comparación múltiple de efectos fijos, además de estudiar la estimación de los componentes de la varianza en el caso de efectos aleatorios. El capítulo incluye las tablas del análisis de varianza general (ANOVA), usadas para fines de cálculos y de

ANÁLISIS DE VARIANZA

557

selección de las razones de error cuadrático medio apropiadas para la prueba de hipótesis. Se intenta tener cuidado en los supuestos necesarios para los diversos modelos. Se estudia una prueba de la igualdad de varianzas y métodos no paramétricos alternativos para su posible uso cuando están en tela de juicio los supuestos de la teoría normal. Por último, se estudian los modelos de diseño en forma matricial para que el lector aprecie su relación con el modelo lineal general. Además de lo anterior, se mencionan y definen términos importantes, que debe conocer el lector, a saber: Clasificación unidireccional Homogeneidad de varianzas Diseño de bloques completos aleatorizados Efectos aleatorios Componentes de varianzas Contraste Tasa de error en forma de comparación Tasa de error de tipo experimento Desigualdad de Bonferroni

Diseño completamente aleatorizado Comparaciones múltiples Efectos fijos Análisis de varianza no paramétrico Cuadrados latinos Pruebas T de Bonferroni Prueba de rangos múltiples de Duncan Prueba de Tukey

EJERCICIOS Sección 13.1

1. Demuestre que E[ E i .2 ] = σ 2/ni para cada i = 1, 2, . . . , k. Sugerencia:

 n  2   E[ E i . ] = E  ∑ E ij ni   j =1     n  2 = E  ∑ E ij   ni2 j =1    i

2

i

Argumente que, en virtud de la independencia de los términos Eij, todos los términos de productos cruzados Eij, con j ≠ f, tienen esperanza 0. Argumente también que E[ E 2ij ] = σ 2 . 2. Demuestre que: k

ni

SS Tot = ∑ ∑Yij2 − T ..2/N i =1 j =1

3. Demuestre que: k

SS Tr = ∑Ti .2/ni − T ..2/N i =1

4. Se realizan experimentos para estudiar si el procesamiento comercial de diversos alimentos modifica la concentración de elementos esenciales para consumo humano. Uno de esos experimentos estudia los valores de zinc en ejotes. Se divide un lote de ejotes en cuatro grupos. Éstos

558

PROBABILIDAD Y ESTADÍSTICA

se asignan aleatoriamente para la medición del zinc como sigue: grupo 1, crudos; grupo 2, antes de su blanqueado; grupo 3, después de su blanqueado, y grupo 4, luego del paso final de su procesamiento. Se obtienen mediciones independientes de los cuatro grupos (tratamientos), de modo que se cuenta con las observaciones siguientes: Concentración de zinc Grupo 1

Grupo 2

Grupo 3

Grupo 4

3.71 4.67 3.45 2.73 2.58 1.85 1.81 2.32 2.50

2.53 2.87 2.83 2.33 2.19 1.80 1.75 1.83 1.97

5.46 5.19 5.51 4.82 6.63 2.39 2.09 2.27 2.39

2.23 2.20 2.44 2.11 2.30 1.72 1.78 2.36 2.91

a) Exprese las hipótesis alternativa y nula apropiadas. b) Verifique las hipótesis para el nivel de significación de 5%. c) Describa sus conclusiones. 5. Se sabe que un material tóxico vertido en un río llega a una gran área marina de pesca comercial. Un grupo de ingenieros civiles estudia la forma en que el agua transporta dicho material al medir la cantidad de éste (en partes por millón) encontrado en ostras extraídas en tres sitios distintos, que van desde el estuario hasta la bahía, en la que tiene lugar gran parte de la pesca comercial. Los datos resultantes son los siguientes: Sitio 1 15 26 20 20 29 28 21 26

Sitio 2

Sitio 3

19 15 10 26 11 20 13 15 18

22 26 24 26 15 17 24

a) Verifique si existe una diferencia significativa en el promedio de partes por millón del material tóxico encontrado en las ostras extraídas en los tres sitios. Use α = 0.05. b) ¿Diferirían significativamente las medias con el nivel de significación 0.01? (Use un paquete de computadora para calcular el valor P.) c) ¿Sus respuestas a los incisos a y b se contradicen una a otra? Justifique su respuesta. 6. El reciclaje se volverá cada vez más necesario, a medida que se saturen los rellenos sanitarios y se vuelvan cada vez más escasos los terrenos disponibles para tal uso. Algunas cadenas de

ANÁLISIS DE VARIANZA

559

restaurantes de comida rápida han tomado conciencia del problema y empiezan a usar empaques biodegradables o a reciclar su material de empaque. Se realizó un estudio para investigar los importes monetarios recibidos anualmente por productos reciclados en empresas de diversos tamaños. Esos datos, expresados en miles de dólares, son los siguientes (basado en cifras de Tom Andel, “New Ways to Take Out the Trash”, Transportation and Distribution, mayo de 1993): Empleados de la compañía 101-250 empleados 3.5 3.4 3.7 3.3 2.9 2.6 3.5 4.2

3.8 3.0 2.8 3.2 3.9 4.1 4.0 4.9

251-500 empleados

Más de 500 empleados

13.4 14.0 14.5 14.7 15.2 15.5 14.2 15.3

9.0 10.3 10.1 10.6 10.4 10.5 10.3 10.7

14.1 14.7 15.0 13.6 14.3 14.6 14.8 15.6

10.8 10.7 9.5 11.2 9.7 10.0 11.3 11.8

a) Construya diagramas de tallo y hoja de cada una de las muestras y comente el grado en que es razonable el supuesto de normalidad. b) Estime la varianza de cada una de las poblaciones usadas para extraer los datos y comente cuán razonable es el supuesto de varianzas iguales. (No emprenda prueba alguna.) ¿Qué se hizo en el estudio como protección contra la posible transgresión del supuesto de varianzas iguales? c) Verifique H0: µ1 = µ2 = µ3 e informe sobre el valor P de la prueba. ¿Qué conclusión práctica puede obtener? 7. La rapidez de desplazamiento en la pantalla es una consideración importante en el desarrollo de tarjetas gráficas a color. Se emprende un estudio para comparar el tiempo, en segundos, necesario para desplazarse una pantalla en documentos de Microsoft Word con cinco tarjetas gráficas a color distintas en monitores de 24 pulg. La prueba emprendida es la de rendimiento Hydra Quick Draw. Se obtienen los datos siguientes (basado en información de “Gauging Video Speed”, MAC WORLD, junio de 1993, p. 28): Tarjetas gráficas A

B

C

D

E

30.5 32.4 27.2 26.3 25.1 38.2 30.6 33.7

48.3 42.1 43.5 40.6 38.6 32.1 41.6 38.8

79.2 84.7 85.0 88.2 76.3 83.1 92.6 88.5

51.6 59.4 57.3 59.0 58.7 68.1 64.8 55.5

79.0 85.3 86.2 82.0 87.2 81.7 93.5 89.1

560

PROBABILIDAD Y ESTADÍSTICA

Use esos datos para verificar la igualdad de las medias. Exprese sus conclusiones e informe sobre el valor P de la prueba. Sección 13.2

8. Recuerde que MSE se define como la proporción SSE /(N − k). Demuestre que: k

∑ ( n1 − 1)Si2

MS E = S p2 =

i =1

N −k

para el modelo de clasificación unidireccional de efectos fijos. 9. En relación con el ejercicio 4, use la prueba de Bartlett para determinar si es razonable suponer la homogeneidad de varianzas de los cuatro grupos de tratamiento o no lo es. En caso negativo, ¿cuál tipo de procedimiento alternativo se tiene para analizar esos datos? 10. Verifique la igualdad de varianzas mediante uso de los datos del ejercicio 6. No olvide expresar sus conclusiones e informar sobre el valor P de la prueba. 11. Verifique la igualdad de varianzas con los datos del ejercicio 7. Sección 13.3

12. En cada uno de los casos siguientes, determine el número de comparaciones por pares posible: a) k = 3 b) k = 6 c) k = 10 13. Sea α = 0.05 y suponga que se realizan todas las comparaciones por pares factibles. En relación con cada valor de k del ejercicio 12, use el procedimiento de Bonferroni para calcular el límite superior de α', la probabilidad global de que por lo menos un rechazo sea incorrecto. En cada caso, ¿qué nivel debe usarse para garantizar que α' ≤ 0.10? 14. Considere una situación en la que se realizarán c pruebas. Sea b el límite superior previsto de α'. En cada caso, demuestre que 1 − [1 − (b/c)]c ≤ b, lo que garantiza que la elección de α = b/c implica que α' ≤ b. a) c = 2 b) c = 3 En cada caso, halle el valor de 1 − [1 − (b/c)]c para b = 0.10. 15. (Desigualdad de Bonferroni.) La desigualdad siguiente constituye la base para determinar la tasa de error en forma de comparación necesaria a fin de controlar la tasa de error de tipo experimento en algún nivel especificado. Sean A1, A2, . . . , Ac eventos. Entonces: P[ A1 ∩ A2 ∩ . . . ∩ Ac ] ≥ 1 − [ P[ A1' ] + P[ A'2 ] + . . . + P[ A'c ]]

a) Demuestre este resultado para c = 2. Sugerencia: Advierta que, según la regla de adición general, P[ A1' ∪ A'2 ] ≤ P[ A1' ] + P[ A'2 ]. Use el hecho de que A1 ∩ A2 = ( A1' ∪ A'2 )' para completar la demostración. b) Sea Ai el evento de que ningún rechazo incorrecto en la i-ésima comparación ocurre con i = 1, 2, . . . , c. Exprese, con la notación de conjuntos, la probabilidad de que ningún rechazo

ANÁLISIS DE VARIANZA

16. 17.

18. 19. 20.

561

incorrecto sea hecho. Con base en dicha probabilidad, ¿cuál es la probabilidad de que tenga lugar al menos un rechazo incorrecto? Si α = P[ A'i ] , con i = 1, 2, . . . , c, entonces use la desigualdad de Bonferroni para demostrar que α' ≤ αc. Argumente que la elección de un límite superior establecido b y la realización de c pruebas, con α = b/c, hace que α' ≤ b. Considere el estudio descrito en el ejercicio 6. Si se efectúan comparaciones múltiples de Duncan con α = 0.05, ¿cuál es un límite superior de la tasa de error de tipo experimento? Emprenda dichas comparaciones y luego analice sus conclusiones. Reconsidere los datos del ejercicio 5. a) ¿Cuántas comparaciones por pares son posibles? b) Suponga que se emprenden esas comparaciones con las pruebas T de Bonferroni. Si se pretende que α ≤ 0.15, ¿con cuál nivel de α debe efectuarse cada prueba? c) Realice cada una de las pruebas indicadas en el párrafo b y analice sus resultados. Use pruebas T de Bonferroni con α' ≤ 0.10 para identificar diferencias entre los grupos del ejercicio 4. Use pruebas T de Bonferroni con α' ≤ 0.20 para detectar las diferencias entre las tarjetas gráficas del ejercicio 7. Un grupo de científicos interesado en el tratamiento de las aguas de desecho estudia tres métodos de tratamiento para la extracción de carbono orgánico. (Basado en W. R. Pirie, “Statistical Planning and Analysis for Treatments of Tar Sand Wastewater”, informe técnico, Virginia Tech University.) Los tres métodos de tratamiento usados fueron la flotación de aire, separación con espuma y coagulación con cloruro férrico. Las mediciones de carbono orgánico de los tres tratamientos llevan a los datos siguientes: Flotación 34.6 35.1 35.3 35.8 36.1 36.5 36.8 37.2 37.4 37.7

Separación 38.8 39.0 40.1 40.9 41.0 43.2 44.9 46.9 51.6 53.6

Coagulación 26.7 26.7 27.0 27.1 27.5 28.1 28.1 28.7 30.7 31.2

Realice una prueba para las diferencias entre las medias. No olvide informar sobre el valor P de la prueba ni expresar sus conclusiones. 21. Si encontró diferencias significativas en el ejercicio 20, determine cuáles métodos de tratamiento difieren entre sí. 22. Se emprende un estudio de la resistencia a la tracción de barras de aluminio. Se divide aleatoriamente en cuatro grupos, cada uno de tamaño 10, a 40 barras de aluminio. Cada grupo es sometido a un tratamiento térmico distinto y se determina la resistencia a la tracción, en miles de libras por pulgada cuadrada, de cada barra. Resultan los datos siguientes:

562

PROBABILIDAD Y ESTADÍSTICA

Tratamiento 1

2

3

4

18.9 20.0 20.5 20.6 19.3 19.5 21.0 22.1 20.8 20.7

18.3 19.2 17.8 18.4 18.8 18.6 19.9 17.5 16.9 18.0

21.3 21.5 19.9 20.2 21.9 21.8 23.0 22.5 21.7 21.9

15.9 16.0 17.2 17.5 17.9 16.8 17.7 18.1 17.4 19.0

a) Prepare un diagrama de tallo y hoja de cada conjunto de datos. ¿Parece razonable el supuesto de que cada muestra se extrajo de una distribución normal? b) Pruebe la hipótesis nula de medias de tratamiento iguales con el ANOVA unidireccional. c) Compare todos los pares posibles de medias con pruebas T de Bonferroni en las que use un nivel de significación global cuando mucho de 0.05. d ) Emprenda una prueba múltiple de Duncan con nivel de significación 0.05. e) Realice una prueba de Tukey con el nivel de significación 0.05. f ) ¿Acaso las pruebas de los tres incisos precedentes llevan a la misma conclusión? g) Explique las diferencias, si acaso existen. Sección 13.4

23. Verifique que (Q1/1)(Q2/(N – k)), como se define en la sección 13.4, puede expresarse como SSL/MSE, donde: k 2  ∑ ciYi . i =1    SS L = k 2 c ∑ i i = 1 ni como se afirmó. 24. En cada uno de los casos siguientes, decida si las funciones lineales dadas contrastan. Si es así, determine si son ortogonales o no lo son. a) L1 = µ1 − (1 / 3)(µ2 + µ3 + µ4 ) n1 = n2 = n3 = n4 = n L2 = µ1 − µ2 b) L1 = µ1 − µ2 n1 = n2 = n3 = n4 = n L2 = µ3 − µ4 c ) L1 = µ1 − µ2 n1 = n2 = 6 L2 = µ3 − µ4 n3 = n4 = 10 n1 = n2 = n3 = n4 = n d ) L1 = µ1 + 2µ2 L2 = µ1 − 2µ2 + µ3

ANÁLISIS DE VARIANZA

e)

L1 = µ1 − µ2 + µ3 − µ4 L2 = µ1 − µ3 f ) L1 = µ1 − µ2 + µ3 − µ4 L2 = µ1 − µ3

563

n1 = n2 = n3 = n4 = n n1 = n2 = 5 n3 = n4 = 10

25. Sean Y1., Y2 ., Y3 . y Y4 . las medias muestrales basadas en muestras independientes, extraídas de distribuciones normales con medias µ1, µ2, µ3 y µ4, respectivamente. Encuentre la suma de cuadrados de cada uno de los contrastes de los incisos a, e y f del ejercicio 24. 26. Considere los contrastes ortogonales del ejercicio 24e. Use los datos del ejercicio 22 para calcular los valores numéricos de SS L y SS L .Puesto que k = 4, existe un tercer contraste que es ortogonal a L1 y L2. ¿Cuál es el valor numérico de SS L ? 27. Use los datos del ejercicio 22 para probar: 1

2

3

H0: µ1 − µ2 + µ3 − µ4 = 0

y

H0: µ1 − µ3 = 0 Un ingeniero químico estudia un polímero recién desarrollado para su uso en la extracción de desechos tóxicos del agua. Se realizan experimentos con cinco temperaturas distintas. La respuesta estudiada es el porcentaje de impurezas extraído con el tratamiento. Use los datos siguientes para responder a los ejercicios 28-30: Temperatura I

II

III

IV

V

40 35 42 48 50 51

36 42 38 39 37 40

49 51 53 53 52 50

47 49 51 52 50 51

55 60 62 63 59 61

28. Pruebe la hipótesis nula de medias de tratamiento iguales al nivel α = 0.05. 29. Use pruebas T de Bonferroni con α' ≤ 0.25 para comparar todos los pares de medias posibles. Informe de sus resultados a manera de esquema, mediante el ordenamiento de las medias muestrales de menor a mayor y subrayado de los pares que no difieran significativamente. 30. Escriba un contraste que pueda usarse en la comparación de la media poblacional 5 con el agregado de las otras cuatro medias. Pruebe la hipótesis nula de que este contraste tiene valor 0. Interprete sus resultados en el contexto de este ejercicio. Sección 13.5

31. Cada una de las tablas siguientes muestra las medias de tratamiento teóricas de cada uno de cuatro tratamientos en relación con cada uno de tres bloques. Represente gráficamente estas medias de manera similar a lo ilustrado en la figura 13.3. En cada caso, decida si existe interacción de los bloques y tratamientos o no la hay.

564

PROBABILIDAD Y ESTADÍSTICA

Tratamiento

a) Bloque

A

B

C

D

1 2 3

1 4 2

3 6 4

4 7 5

0 3 1

Tratamiento

b) Bloque

A

B

C

D

1 2 3

1 4 2

3 6 4

0 5 5

0 3 1

Tratamiento

c) Bloque

A

B

C

D

1 2 3

1 4 2

3 5 4

4 7 5

0 3 1

32. Demuestre que ∑ik= 1 τ i = 0. 33. Explique el significado de cada una de las eficacias relativas siguientes en la evaluación de la efectividad del uso de bloques. a) RE = 2 b) RE = 10 c) RE = 0.25 d ) RE = 0.10 e) RE = 1 Un ingeniero de control de calidad realiza un experimento para investigar el efecto de la experiencia en una línea de montaje, en lo concerniente al tiempo promedio necesario para realizar una tarea de montaje. Si la experiencia resulta ser un factor, se planea emprender un programa de capacitación con los empleados de ingreso más reciente. El ingeniero selecciona aleatoriamente ocho empleados de grupos que tienen 1, 2, 3 y 4 años de experiencia laboral, respectivamente. Luego, configura el experimento como un diseño de bloques aleatorios, con las tareas como bloques y los años de experiencia como tratamientos. Los datos resultantes son los que siguen: Tiempo para completar las tareas de montaje Experiencia Tarea

1 año

2 años

3 años

4 años

1 2 3 4 5 6 7 8

40.3 25.4 28.2 41.6 28.8 38.7 29.4 37.7

34.2 25.4 28.0 24.9 39.2 29.5 29.0 25.6

28.8 29.2 24.6 29.1 34.8 26.6 36.0 25.6

26.6 21.2 23.2 27.0 27.1 27.3 34.2 25.2

ANÁLISIS DE VARIANZA

565

Use la información precedente para responder a los ejercicios 34-39. 34. Escriba el modelo estadístico apropiado para este experimento. 35. Realice pruebas en busca de diferencias significativas entre los años de experiencia respecto del tiempo de montaje promedio. Use α = 0.05. 36. ¿Fue apropiado el uso de bloques? Explique su respuesta. 37. ¿Cuántas comparaciones por pares son posibles? Si se emprenden con las pruebas T de Bonferroni, ¿qué nivel de α debe usarse para lograr un nivel de significación global cuando mucho de 0.10? 38. Use pruebas T de Bonferroni para determinar cuáles tratamientos (número de años de experiencia) difieren significativamente, si acaso, con α' ≤ 0.10. 39. ¿Indican los datos que un programa de capacitación sería productivo? Un científico de cómputo estudia cuatro algoritmos distintos, usados para la integración numérica. Se mide la rapidez (en segundos) con la que se resuelve un problema. Cada algoritmo se usará en la solución de 10 problemas distintos y, por ende, un problema sirve como bloque. Use los datos siguientes para responder a los ejercicios 40-43: Algoritmo Problema 1 2 3 4 5 6 7 8 9 10

I

II

III

IV

0.10 0.11 0.13 0.08 0.15 0.17 0.05 0.13 0.12 0.16

0.11 0.13 0.14 0.11 0.16 0.18 0.07 0.15 0.14 0.15

0.16 0.17 0.17 0.13 0.19 0.23 0.11 0.18 0.15 0.20

0.10 0.09 0.12 0.09 0.16 0.16 0.07 0.14 0.12 0.15

40. Realice pruebas en busca de diferencias entre la media de tiempo necesario para resolver problemas de integración con estos algoritmos. 41. Estime la eficacia relativa y úsela para analizar cuán aconsejable es el uso de bloques en un estudio futuro de este tipo. 42. ¿Cuántas comparaciones son posibles si se usa la técnica de Bonferroni para comparar todos los pares de medias? ¿Cuál es el límite superior de α', la probabilidad global de cometer por lo menos un error tipo I, si cada comparación se realiza con el nivel α = 0.01? 43. Use pruebas T de Bonferroni con α = 0.01 para determinar si parece haber un algoritmo “más rápido” o no. Sección 13.6

44. Dé un ejemplo de un diseño de cuadrados latinos con r = 3. 45. Ejemplifique un diseño de cuadrados latinos 4 × 4 diferente del que aparece en la tabla 13.7. Especifique la distribución de datos del diseño. 46. El diseño de la tabla 13.12 se llama cuadrado latino de movimiento de caballo porque es posible ir de cada tipo de tratamiento a otro del mismo tipo con un movimiento como el del caballo

566

PROBABILIDAD Y ESTADÍSTICA

ajedrecístico. Las respuestas observadas se indican entre paréntesis en la tabla. Use estos datos para verificar H0: µ1.. = µ2.. = µ3.. = µ4.. con el nivel α = 0.05. r 47. Considere que SS Tr = r∑i = 1 (Yi .. − Y ...)2 . Exprese SSTot, SSFilas y SSCol en forma similar. 48. En un estudio para comparar el millaje de gasolina promedio de tres tipos distintos de una marca de gasolina, se reconocen dos fuentes de variación extrañas. Se trata del conductor y el tipo de vehículo usado en las pruebas de conducción. Hay tres conductores y tres nuevos automóviles. En la tabla 13.13 se muestra el millaje de combustible obtenido en cada prueba de conducción. Verifique la hipótesis nula de medias iguales entre los tipos de gasolina con el nivel 0.05. 49. Una compañía analiza tres procesadores de texto para su uso por el personal secretarial. Todos ellos son aceptables, de modo que la decisión depende de cuál sea de más fácil aprendizaje. La rapidez se ve afectada por el tipo de texto que se produce y el aprendiz, de modo que se usa un diseño de cuadrados latinos. Se obtienen los datos que aparecen en la tabla 13.14. Verifique que: H0: µ1.. = µ2.. = µ3.. TABLA 13.12 Diseño de cuadrados latinos de movimiento de caballo

I II III IV

I

II

III

IV

A (3) C (1.0) B (4.5) D (5.5)

B (4.2) D (5.6) A (3.5) C (0.8)

C (0.9) A (3.8) D (5.7) B (3.9)

D (5.3) B (4.3) C (1.2) A (3.7)

TABLA 13.13 Millaje de combustible obtenido al controlar el conductor y el tipo de automóvil (A = gasolina normal, B = extra, C = súper) Factor (tipo de automóvil)

1 2 3

4 cilindros

6 cilindros

8 cilindros

A (36.0) B (36.5) C (38.0)

B (33.0) C (33.5) A (32.5)

C (26.5) A (25.0) B (26.0)

TABLA 13.14 Tiempo necesario para aprender varias subrutinas en un procesador de texto (en horas) Factor (tipo de artículo)

I II III

I, prosa

II, técnico

III, informe

B (0.5) C (1.2) A (0.8)

A (1.2) B (1.0) C (1.7)

C (1.0) A (0.95) B (0.9)

ANÁLISIS DE VARIANZA

567

Sección 13.7

50. Se usa con regularidad numerosos laboratorios para medir la cantidad de sustancias tóxicas en diversos materiales. Existe la preocupación de que los resultados no sólo varíen a causa de la variabilidad de medición normal, sino que también haya variabilidad sustantiva que resulte de las diferentes técnicas entre los laboratorios. Si así fuera, ello llevaría a la necesidad de implantar un procedimiento “estándar” en todos los laboratorios. A fin de verificarlo, se selecciona aleatoriamente cuatro laboratorios y se les pide que midan la cantidad de un cierto compuesto químico en partes por millón. Cada laboratorio recibe seis muestras idénticas para las pruebas. Resultan los datos siguientes: Laboratorio 1

2

3

4

(partes por millón) 53.2 54.5 52.8 49.3 50.4 53.8

51.0 40.5 50.8 51.5 52.4 49.9

47.4 46.2 46.0 45.3 48.2 47.1

51.0 51.5 48.8 49.2 48.3 49.8

a) Exprese las hipótesis alternativa y nula apropiadas. b) Verifique la hipótesis nula con el nivel de significación 0.05. c) Estime la proporción de la varianza total que resulta de la variación interna del laboratorio (cuadrado medio del error). d ) Estime la proporción de la varianza total que se deriva de la variación entre laboratorios (varianza debida a tratamientos). e) ¿Acaso parece justificarse la estandarización de las técnicas de los laboratorios? Sección 13.8

51. Considere el modelo de clasificación unidireccional siguiente: Yij = µ + αi + E ij

i = 1, 2, 3;

j = 1, 2

En relación con ese modelo, calcule Y, α, X y E. Determine también X'X y demuestre que esta matriz no tiene inversa. 52. Considere el modelo de bloques completos aleatorizados

Yij = µ + α i + β j + E ij

i = 1, 2, 3;

j = 1, 2, 3, 4

Para este modelo, hallar Y, α, X y E. Determine también X 'X y demuestre que esta matriz no tiene inversa. Sección 13.9

53. En cierta planta manufacturera, los filtros usados para extraer contaminantes sólidos deben sustituirse tan pronto fallen a causa de grietas u orificios en el propio filtro. Se realiza un expe-

568

PROBABILIDAD Y ESTADÍSTICA

rimento para poner a prueba cinco tipos de filtros hechos de materiales distintos. Se usan seis filtros de cada tipo bajo las mismas condiciones y se registra el número de horas hasta que falla cada uno. El experimento arroja la información siguiente: Tipo de filtro (horas hasta su falla) 1

2

3

4

5

261.1 186.2 239.1 243.3 296.8 270.5

221.9 188.7 167.6 224.9 178.8 147.9

201.4 146.1 96.8 173.9 280.8 100.3

600.9 301.2 608.9 283.3 193.3 159.4

160.6 135.0 455.1 402.3 457.9 559.6

a) Use la prueba de Kruskal-Wallis para determinar si existen datos significativos de que la mediana de tiempo hasta la falla difiere entre los tipos de filtro, con el nivel de significación 0.05. b) Repita esta prueba con el uso del procedimiento de prueba apropiado de la teoría normal. 54. Después de un derrame accidental de una planta de manufactura química cercana a un río, se emprende un estudio para determinar si ciertas especies de peces que se pescan en ese río difieren en la cantidad del compuesto absorbida. Si se identifican diferencias, se recomendarán medidas para regular su consumo humano. Se obtienen muestras de pescados de tres especies importantes y se miden las partes por millón del compuesto. Los datos resultantes son los que siguen: Especie A

B

C

18.1 16.5 21.0 18.7 7.4 12.4 16.1 17.9

29.1 15.8 20.4 23.5 18.5 21.3 23.1 23.8 20.1 11.9

26.6 16.1 18.8 25.0 21.8 15.4 19.9 15.5 21.1 25.5

Verifique si difiere la mediana de cantidades absorbidas del compuesto químico en las tres especies de peces con el nivel de significación 0.05. 55. Un gerente de laboratorio planea adquirir máquinas para su uso en el análisis de muestras sanguíneas. Se consideran para adquisición cinco tipos de máquinas. Después de las pruebas de uso, se pide a cada uno de ocho técnicos que jerarquicen las máquinas en orden de preferencia, de modo que asignen el rango 1 a la máquina por la que tengan mayor preferencia. Los rangos correspondientes son los que siguen:

ANÁLISIS DE VARIANZA

569

Máquina Técnico

I

II

III

IV

V

A B C D E F G H

1 4 4 4 1 1 5 5

3 5 1 1 3 2 1 1

4 1 3 5 2 3 3 4

2 2 5 2 5 4 2 3

5 3 2 3 4 5 4 2

Use la prueba de Friedman para determinar si el grupo de técnicos calificó las máquinas de manera diferente, con el nivel de significación 0.10. 56. Se realizan pruebas del desgaste de la superficie de rodamiento de cuatro marcas de neumáticos. Puesto que el desgaste es distinto en los diferentes automóviles, se considera a éstos como bloques para reducir el efecto de la diferencia entre ellos. Se realiza un experimento con los vehículos como bloques y las marcas de neumáticos asignadas aleatoriamente a sus cuatro posiciones en los automóviles. Después de recorrer un número predeterminado de millas, se mide el desgaste de la superficie de rodamiento (en mm) de cada neumático. Los datos resultantes son los que siguen: Marca de neumático Automóvil 1 2 3 4 5 6 7 8

A

B

C

D

8.9 7.2 3.1 7.1 6.7 5.3 2.4 5.7

6.6 6.9 6.2 8.3 6.4 6.7 5.5 9.2

5.6 7.3 7.2 6.3 5.9 8.0 6.1 9.6

4.2 6.9 4.1 5.8 9.4 7.9 3.1 4.2

a) Asigne rangos apropiados a los datos de este experimento. b) Si se parte del supuesto de que la hipótesis nula es verdadera, ¿cuál es el rango promedio esperado total de las marcas de neumáticos? c) Verifique la hipótesis de que la mediana de desgaste de la superficie de rodamiento es desigual en cada marca de neumático. Use α = 0.05. EJERCICIOS DE REPASO

Se sabe que el dióxido de carbono tiene efecto crítico en la proliferación de microorganismos. En pequeñas cantidades, estimula la proliferación de algunos microbios, mientras que sus concentraciones altas inhiben la de muchos otros. Este segundo efecto se usa comercialmente en el almacenamiento de productos perecederos. Se inicia un estudio para investigar el efecto del CO2 en el ritmo de

570

PROBABILIDAD Y ESTADÍSTICA

proliferación de Pseudomonas fragi, una bacteria descomponedora de alimentos. Se administra el dióxido de carbono a cinco presiones atmosféricas distintas y predeterminadas. Se mide la respuesta como el cambio porcentual de la masa celular después de 1 h de proliferación. Se usan 10 cultivos con cada nivel de presión atmosférica y se obtienen los datos siguientes: Nivel del factor (presión de CO2) 0.0

0.083

0.29

0.50

0.86

62.6 59.6 64.5 59.3 58.6 64.6 50.9 56.2 52.3 62.8

50.9 44.3 47.5 49.5 48.5 50.4 35.2 49.9 42.6 41.6

45.5 41.1 29.8 38.3 40.2 38.5 30.2 27.0 40.0 33.9

29.5 22.8 19.2 20.6 29.2 24.1 22.6 32.7 24.4 29.6

24.9 17.2 7.8 10.5 17.8 22.1 22.6 16.8 15.9 8.8

Los ejercicios 57-59 se refieren a estos datos. 57. Exprese los supuestos necesarios para verificar la hipótesis nula: H0: µ1 = µ2 = . . . = µ5 58. a) Complete numéricamente la tabla apropiada de análisis de varianza (ANOVA). b) ¿Existen datos suficientes para rechazar H0 con el nivel de significación α = 0.05? 59. Use la prueba de Bartlett para verificar la homogeneidad de las varianzas. ¿Acaso dicha prueba sustenta los supuestos del ejercicio 57? 60. Se seleccionan aleatoriamente tres tratamientos de una población numerosa de posibles tratamientos. Luego, se obtienen 10 observaciones, también seleccionadas al azar, de cada uno de los tratamientos elegidos. a) Exprese una hipótesis nula apropiada para verificarla y enumere todos los supuestos necesarios para realizar esa prueba en el experimento descrito. b) Se obtiene la tabla de análisis de varianza parcialmente terminada que sigue, a partir de los datos: ANOVA Fuente

DF

SS

Tratamiento Error

2 27

110.6

Total

29

608.3

MS

F

EMS

Complete la tabla ANOVA y verifique la hipótesis nula del inciso a con el nivel de significación 0.05. c) Estime las proporciones de la variabilidad total debidas a errores y tratamientos, respectivamente.

ANÁLISIS DE VARIANZA

571

61. Se realiza un experimento para comparar el consumo de energía de tres actividades físicas, a saber, carrera, caminata y ciclismo. La variable que interesa es el número de kilocalorías consumido por kilómetro recorrido. El control de posibles diferencias metabólicas se logra mediante la selección de ocho sujetos y su asignación aleatoria (en cuanto al orden) a cada una de las tres tareas, con reposo amplio entre ellas para eliminar la fatiga. Cada actividad se vigila exactamente una vez en cada individuo. Los datos resultantes son los que siguen: Tarea Individuo

Carrera

Caminata

Ciclismo

1 2 3 4 5 6 7 8

1.4 1.5 1.8 1.7 1.6 1.5 1.7 2.0

1.1 1.2 1.3 1.3 0.7 1.2 1.1 1.3

0.7 0.8 0.7 0.8 0.1 0.7 0.4 0.6

a) Verifique las posibles diferencias entre las tres tareas en cuanto a las kilocalorías promedio que se consumen. Calcule un valor P aproximado. b) ¿Se tienen datos de que el uso de bloques (individuos) fue efectivo para eliminar la variabilidad extraña? c) Use la prueba de rangos múltiples de Duncan para determinar cuál tarea, si acaso, difiere de las otras en cuanto a la energía consumida, con el nivel de significación 0.05. d ) Repita el inciso c con la prueba de Tukey y compare las diferencias de resultados encontrados, si las hay. 62. El embargo petrolero de la OPEP hizo evidente que era necesario mejorar el rendimiento de combustible de los automóviles. Se buscaron nuevos materiales, más ligeros, para uso en los motores. Se emprendieron comparaciones de muestras de prueba de compuestos de acero, aluminio y compuestos termofijos fenólicos que contenían fibra de vidrio. Se consideraron dos variables, la densidad (g/cm3) y la resistencia a la tracción (ksi). Los resultados obtenidos son los siguientes (basado en información de John Arimind y William Ayles, “Phenolics Creep Up on Engine Applications”, Advanced Materials and Processes, vol. 143, núm. 6, junio de 1993, pp. 34-36): Material (densidad) Acero 7.60 7.80 7.81 7.65 7.72 7.71 7.68 7.79 7.76

Aluminio 7.82 7.90 7.75 7.73 7.75 7.80 7.87 7.89 7.78

2.90 2.65 2.67 2.75 2.80 2.81 2.85 2.72 2.60

2.71 2.77 2.78 2.72 2.86 2.73 2.75 2.79 2.81

Fenólicos 1.79 1.74 1.69 1.68 1.50 1.67 1.80 1.78 1.62

1.73 1.72 1.66 1.67 1.70 1.72 1.71 1.63 1.62

572

PROBABILIDAD Y ESTADÍSTICA

Material (densidad) Acero 60 73 87 98 175

Aluminio 100 122 86 112 77

17 25 35 38 27

Fenólicos

40 19 29 22 26

8 17 15 9 10

13 12 10 11 16

Analice cada uno de estos conjuntos de datos con las pruebas que considere apropiadas. Escriba un informe de resumen de los resultados. Explique su selección de la estadística de prueba. 63. Se realizan estudios del uso de escoria en la base, subbase y afirmado del pavimento de carreteras. Interesa la composición de la escoria obtenida de diversas fuentes. Se obtienen los datos siguientes sobre el porcentaje de S1O2 en muestras de cinco fuentes distintas (basado en información de B. S. Heaton, “Steel Plant Slag in Road Pavements”, Australian Civil Engineering Transactions, marzo de 1993, pp. 49-53): Fuente Escoria de hornos de viento inyectado

Escoria de acero

Cemento Portland

Ceniza muy fina

Basalto natural

35.1 34.7 34.8 33.2 33.6 36.8

16.0 15.6 17.2 16.2 16.3 14.7

20.1 22.0 23.1 19.7 19.5 16.2

58.3 57.6 55.0 60.1 61.2 58.2

45.9 46.3 44.5 45.2 44.5 49.6

Analice los datos precedentes y prepare un informe de resumen de los resultados. Esté preparado para defender su selección de las estadísticas de prueba. Es ampliamente sabido que los excesos o “picos” de voltaje pueden causar daños en equipo electrónico sensible. Se realiza un estudio de los picos de voltaje para indagar si existen diferencias en su frecuencia promedio entre los siete días de la semana o no. En un periodo de 10 semanas seleccionado aleatoriamente, se observa el número de picos de voltaje durante 10 periodos de 24 h para cada uno de los siete días de la semana. Resultan los datos siguientes: Lunes

Martes

Miércoles

Jueves

Viernes

Sábado

Domingo

25 21 20 20 21 20 25 21 18 22

24 20 19 16 21 19 24 15 20 14

16 20 19 21 17 13 23 23 23 23

22 17 19 21 19 13 27 15 20 20

33 28 44 33 22 36 28 27 22 16

28 28 31 21 33 22 22 20 22 26

35 20 29 19 26 23 26 30 29 29

ANÁLISIS DE VARIANZA

573

Los ejercicios 64-67 hacen referencia a estos datos. 64. Use el análisis de varianza y exprese la hipótesis correcta para verificar la igualdad de las medias, además de emprender la prueba de ANOVA que resulte apropiada. Exprese sus conclusiones. 65. Si resulta diferente alguna de las medias del ejercicio 64, use el procedimiento de Duncan para verificar cualesquiera diferencias significativas en pares de medias. Realice la prueba con α = 0.05. 66. Repita el ejercicio 65, en este caso con la prueba de Tukey. ¿Son diferentes los resultados obtenidos en estos dos ejercicios? En caso afirmativo, explique las razones de esas diferencias. 67. Repita el ejercicio 64, en esta ocasión con una prueba no paramétrica apropiada.

EXPERIMENTOS FACTORIALES

587

Tamaño muestral Proceden algunos comentarios acerca de los tamaños muestrales. Note que en todos los modelos considerados en el diseño de dos factores, los grados de libertad de error están dados por ab(n − 1). Así pues, si sólo se tiene una observación por celda, el término adquiere el valor 0. En este caso, MSE es indefinido y resulta imposible verificar la interacción. Aunque los efectos de esta última podrían ser muy importantes, debe suponerse que no la hay. En este caso, SSE y SSAB se combinan en una suma de cuadrados con grados de libertad (a − 1)(b − 1) y se usa como cuadrado medio del error (SSE + SSAB)/(a − 1)(b − 1). Debe estar claro que, siempre que sea posible, el investigador debe tener al menos dos observaciones por combinación de tratamiento. Además, el análisis no es sencillo si difiere el número de observaciones por combinación. Simplemente no guarda paralelismo con las ideas aquí presentadas, con la sustitución de n mediante ni. ¡Tenga cuidado! Si trabaja en un diseño de ese tipo, debe consultar a un profesional para el análisis de los datos y la interpretación de los resultados.

14.2

EXTENSIÓN A TRES FACTORES

A estas alturas, probablemente usted tiene claro que el análisis de un experimento de dos factores se amplía fácilmente al caso de tres o más factores. Sin embargo, también debe estar claro que los cálculos respectivos se vuelven muy tediosos. Así pues, tales experimentos usualmente se analizan en la práctica con una computadora. En los ejercicios 16-23, se lleva al lector a un desarrollo del análisis de un experimento de efectos fijos con los factores A, B y C. El diseño supone la posible existencia de interacciones bidimensionales y tridimensionales. En el ejercicio 24, se ilustra un modelo en el que se supone a priori que algunas interacciones son insignificantes.

14.3 EXPERIMENTOS FACTORIALES DE MODELOS ALEATORIO Y MIXTO El diseño de dos factores analizado en la sección 14.1 supone que los factores A y B están fijos. Al igual que en los diseños de clasificación unidireccional y de bloques completos aleatorizados, los factores pueden ser aleatorios. En el caso de un diseño de dos factores, son posibles las situaciones experimentales siguientes: 1. Los factores A y B están fijos. Este tipo de diseño se llama modelo de efectos fijos. 2. Los factores A y B son aleatorios. Se denomina modelo de efectos aleatorios a este tipo de diseño. 3. Un factor está fijo y el otro es aleatorio. Este diseño corresponde al llamado modelo de efectos mixtos. Los cálculos de los grados de libertad, sumas de cuadrados y los cuadrados medios son los mismos en todos los casos. Sin embargo, los procedimientos de prueba varían de un modelo a otro y dependen de los cuadrados medios esperados. En la realización de cada prueba, se inspeccionan los cuadrados medios esperados y se forma una razón F, con la propiedad de que si H0 es verdadero se estima el

588

PROBABILIDAD Y ESTADÍSTICA

mismo parámetro con el numerador y el denominador, mientras que en caso contrario el numerador debe ser mayor que el denominador, lo que resulta en valores altos de la estadística F.

Modelo de efectos aleatorios Las ideas precedentes se ilustran con la consideración de la tabla de análisis de varianza del modelo de efectos aleatorios que aparece en la tabla 14.5. Se usa el mismo orden de prueba que en el modelo de efectos fijos. Primero se verifica la interacción, es decir, se pone a prueba:

H 0: σ 2AB = 0 El examen de los cuadrados de medios esperados de la tabla 14.5 permite apreciar que la estadística de prueba apropiada es: Estadística de prueba H0: ausencia de interacción

F( a − 1)( b − 1), ab( n − 1) = MSAB / MSE Si H0 es verdadera, se estima σ 2 tanto con el numerador como con el denominador de esa estadística, mientras que en caso contrario el numerador debe ser mayor que el denominador, con lo que se tiene valor alto de la estadística F. En caso de no rechazar la hipótesis nula, se prueba en busca de diferencias entre los niveles de los factores A y B mediante la prueba de: H 0I : σ 2A = 0

y

H 0II: σ B2 = 0

La estadística de prueba apropiada para probar H 0I es:

Fa − 1, ab( n − 1) = MSA /MSAB A partir de los cuadrados medios esperados, puede verse que si H 0I es verdadera, con el numerador y el denominador se estima σ 2 + nσ 2AB ; si H 0I no es verdadera, el numerador debe exceder al denominador y ha de tenerse un valor alto de la estadística F. Un razonamiento similar muestra que en la prueba de H 0II se usa la estadística de prueba: Fb − 1, ab( n − 1) = MSB / MSAB

Note que por primera vez se verifica una hipótesis mediante el uso de una razón F que no incluye a MSE como denominador. Si se rechaza la hipótesis nula de ausencia de interacción, entonces se trata al experimento como un diseño de clasificación unidireccional de efectos aleatorios, con a . b tratamientos. La hipótesis nula: 2 H 0III: σ Tr =0

se prueba con la razón F: Fab − 1, ab( n − 1) = MSTr /MSE

ab − 1 a −1 b −1 (a − 1)(b − 1) ab(n − 1) abn − 1

A B AB Error Total

Grados de libertad (DF)

Tratamiento

Fuente de variación b



b

n

i=1 j =1 k =1

∑ ∑ ∑ Yijk2 −

a

∑∑

a

2 T ... abn

2 T ... i=1 j =1 n abn 2 a Ti2.. T ... − ∑ i = 1 bn abn 2 b T .2j. T ... − ∑ abn j = 1 an SSTr − SS A − SSB SSTot − SSTr

Tij2 .

Suma de cuadrados (SS)

SS AB / (a − 1)(b − 1) SSE /ab(n − 1)

SSB / (b − 1)

SS A / (a − 1)

SSTr / (ab − 1)

Cuadrados medios (MS)

TABLA 14.5 Tabla ANOVA del diseño de clasificación bidireccional con efectos aleatorios

σ + nσ σ2

MS AB/MSE

MSB /MS AB

σ 2 + nσ 2AB + anσ B2 2 AB

MS A /MS AB

σ 2 + nσ 2AB + bnσ 2A

2

MSTr /MSE

F

2 σ 2 + nσ Tr

Cuadrados medios esperados

EXPERIMENTOS FACTORIALES

589

589

590

PROBABILIDAD Y ESTADÍSTICA

Modelo de efectos mixtos El análisis de un modelo de efectos mixtos es similar. La mayor diferencia corresponde a la expresión de las hipótesis que se probará. Por ejemplo, en un modelo de efectos mixtos con niveles fijos del factor A y aleatorios del factor B, se ponen a prueba: H0 : σ 2AB = 0 H0I : µ 1.. = µ 2 .. = . . . = µ a .. H0II: σ 2B = 0 2 H0III: σ Tr =0

La tabla de análisis de varianza completa de este modelo aparece en la tabla 14.6. Se deja el análisis del modelo mixto con niveles aleatorios del factor A y fijos del factor B como ejercicio (véase ejercicio 25).

14.4

EXPERIMENTOS FACTORIALES 2k

Un experimento de seis factores (26) incluye 64 conjuntos de condiciones experimentales distintos. Los experimentos de las formas 2k o 3k (k factores en cada uno de los niveles) se llaman factoriales simétricas. También es factible tener factoriales asimétricas. Por ejemplo, 23 × 32 es un factorial asimétrico con tres factores en dos niveles y dos factores en tres niveles, respectivamente. El análisis siguiente corresponde a experimentos 2k simétricos. Es posible analizarlos con el uso de las técnicas estudiadas en la sección 14.1. Sin embargo, en este caso un segundo método de análisis factible consiste en usar las técnicas de regresión del capítulo 12. Este enfoque resulta especialmente útil en el diseño de experimentos. Por principio de cuentas, considere un experimento de dos factores. Puesto que cada uno tiene sólo dos niveles, es posible denotar estos niveles como “alto” o “bajo”. Pueden tenerse cuatro combinaciones de tratamientos: Factor A

B

bajo bajo alto alto

bajo alto bajo alto

En cuanto a la notación, es conveniente denotar el nivel alto del factor A con a, y el del factor B, con b. El nivel bajo de cada uno se representa con 1. Ello permite codificar cada combinación de tratamiento. Por ejemplo, el tratamiento bajo-bajo se denota con 1 . 1 = (1); el bajo-alto, con 1 . b = b. Así pues, las cuatro combinaciones de tratamientos en un experimento de dos factores son (1), b, a y ab. Esta notación puede ampliarse a un diseño de k factores. En general, la presencia de una letra denota el uso del nivel alto del factor correspondiente, y su ausencia, la utilización del nivel bajo. Por ejemplo, en un experimento de tres factores, la combinación de tratamiento (1) entraña el

Grados de libertad (DF)

ab − 1

a −1 b −1 (a − 1)(b − 1) ab(n − 1) abn − 1

Fuente de variación

Tratamiento

A B AB Error Total

b

n

Tij2 . −

2 T ... abn

b

n

i=1 j =1 k =1

∑ ∑ ∑ Yijk2 −

a

a

2 T ... abn

2 T 2.. T ... ∑ i − i = 1 bn abn 2 b T .2. T ... ∑ j − abn j = 1 an SSTr − SS A − SSB SSTot − SSTr

i=1 j =1

∑∑

a

Suma de cuadrados (SS)

SS AB / (a − 1)(b − 1) SSE /ab(n − 1)

SSB / (b − 1)

SS A / (a − 1)

SSTr / (ab − 1)

Cuadrados medios (MS)

MS AB /MSE

σ 2 + nσ 2AB σ2

MS A /MS AB MSB /MSE

a −1

i=1

a

nb ∑ α i2

MSTr /MSE

F

σ 2 + naσ B2

σ 2 + nσ 2AB +

2 σ 2 + nσ Tr

Cuadrados medios esperados

TABLA 14.6 Tabla ANOVA del diseño de clasificación bidireccional, con efectos mixtos y A fijo y B aleatorio

EXPERIMENTOS FACTORIALES

591

591

592

PROBABILIDAD Y ESTADÍSTICA

uso del nivel bajo de los tres factores, y la combinación ab, el de los niveles altos de los factores A y B, con el nivel bajo de C. Suponga, para facilitar la interpretación del significado de los efectos de los factores de interacciones de este tipo de experimento, que se tienen n repeticiones de cada combinación de tratamiento (1), a, b y ab. Estos símbolos se interpretan como representativos de los totales de las n observaciones muestrales de cada combinación de tratamiento. Se representan en la gráfica siguiente:

Nivel alto

b

ab

(1)

a

Factor B Nivel bajo Factor A Nivel bajo

Nivel alto

Se define el efecto de un factor como el cambio de una respuesta cuando se modifica el nivel del factor. Si el factor B tiene el nivel bajo, el efecto del factor A es a − (1). De igual modo, con el factor B en nivel alto, el efecto de A es ab − b. Así pues, el efecto promedio de A es: A = 1/ 2{[a − (1)] + [ab − b]} = 1/ 2[−(1) + a − b + ab] De manera similar, el efecto promedio de B es: B = 1/ 2[−(1) − a + b + ab] Ahora bien, considere el efecto de la interacción AB. El efecto de A con el nivel bajo de B es a − (1), mientras que con el nivel alto de B es ab − b. En caso de que difieran estos dos efectos, ello implica la existencia de una interacción de los factores A y B. De tal suerte, el efecto de la interacción AB se define como la diferencia promedio entre esos dos efectos, a saber: AB = 1/ 2{[ab − b] − [ a − (1)]} = 1/ 2[(1) − a − b + ab] El modelo de regresión del diseño de dos factores general es:

µ Y |x , x = β 0 + β1x1 + β 2 x2 + β12 x1x2 1

2

En este caso, x1 denota el factor A, donde sea que x1 = −1 si se usa el nivel bajo del factor A y x1 = 1 en cualquier otro caso. El regresor x2 corresponde al factor B y se define de manera similar. El término de producto cruzado x1x2 representa la posible interacción de los factores A y B. Con esta codificación, puede verse que los elementos de la matriz de especificación del modelo son 1 o −1:

EXPERIMENTOS FACTORIALES

Intersección  1   1  .  . .  1   1   1  . .  .  X = 1  1  1  .  .  .  1  1   1  . .  .  1 

593

x1 x2 x1 x2   −1 −1 1  −1 −1 1 . . .  . . . . . .  −1 −1 1  1 −1 −1  1 −1 −1  . . .  . . .  . . .  1 −1 −1  −1 1 −1   −1 1 −1  . . .  . . . . . .  −1 1 −1   1 1 1 1 1 1  . . . . . .  . . .  1 1 1

En esta matriz, cada submatriz tiene dimensión n × 4. Advierta que la primera submatriz es la combinación de tratamiento (1), mientras que las otras representan a, b y ab, respectivamente. La matriz X'X siempre es una matriz diagonal, de la forma: 2 2 n 0 0 0    2 0   0 2 n 0 X'X =   0 22 n 0   0 0 0 22 n  0

donde n es el número de observaciones por combinación de tratamiento. Su inversa es:

 1  2 2 n   0 ( X'X )−1 =   0    0 

0

0

1 22 n

0

0

1 22 n

0

0

 0    0   0   1  22 n 

594

PROBABILIDAD Y ESTADÍSTICA

El vector de respuesta es:

 y111     y.112   .   y.   11n   y211  y   .212   ..  y  y =  21n   y121   y122   .   ..   y12 n  y   221   y222   ..   .   y22 n 

Note que el primer subvector de este vector contiene las respuestas de la combinación de tratamiento (1), y los otros, las de las combinaciones a, b y ab, respectivamente. Un cálculo rápido muestra que el vector X' y está dado por: (1) + a + b + ab   a + ab − (1) − b X' y =  b + ab − (1) − a (1) + ab − a − b donde (1), a, b y ab denotan la suma de las respuestas de la combinación de tratamiento indicada. La idea se ilustra con un ejemplo. Ejemplo 14.4.1. Mirogrex terrae-sanctae es un pez comercial parecido a la sardina que se pesca en el Mar de Galilea. Se realiza un estudio para determinar el efecto de la luz y temperatura en el crecimiento de los ovarios de sus hembras. Se usan dos fotoperiodos (de 14 h de luz con 10 de oscuridad y de 9 h de luz con 15 de oscuridad) y dos temperaturas (16 y 27°C). De tal manera, el experimentador puede simular las condiciones veraniegas e invernales en la región. Se obtienen los datos siguientes: Factor A (fotoperiodo)

Factor B

9 h de luz (bajo) 1.30 2.88 16° (bajo)

27° (alto)

invierno simulado

14 h de luz (alto) 1.01 1.52

no natural

(1) = 1.30 + 2.88 = 4.18

a = 1.01 + 1.52 = 2.53

0.90 1.06

0.83 0.67

no natural

b = 0.90 + 1.06 = 1.96

verano simulado

ab = 0.83 + 0.67 = 1.50 T ... = (1) + a + b + ab = 10.17

EXPERIMENTOS FACTORIALES

En notación matricial: 1.30    2.88 1.01 1.52 y=  0.90 1.06  0.83 0.67

1  1 1 1 X= 1 1 1 1

−1 −1 1 1 −1 −1 1 1

−1 −1 −1 −1 1 1 1 1

1  1 −1 −1 −1 −1 1 1

Advierta que los elementos de X son 1 o −1, como se afirmó. Adicionalmente, note que: 8  0 X'X =  0 0

0 8 0 0

0 0 8 0

0  0 0 8

y 1/ 8 0 0 0   0 1 8 0 0 /  ( X'X ) −1 =  0 1/ 8 0   0  0 0 0 1/ 8 El vector X'y está dado por:

como se afirmó.

1.30    2.88  1 1 1 1 1 1 1 1 1.01   −1 −1 1 1 −1 −1 1 1 1.52 X'y =    −1 −1 −1 −1 1 1 1 1 0.90  1 1 −1 −1 −1 −1 1 1 1.06  0.83 0.67  10.17   (−4.18) + ( 2.53) − (1.96) + (1.50) = (−4.18) − ( 2.53) + (1.96) + (1.50) ( 4.18) − ( 2.53) − (1.96) + (1.50)  (1) + a + b + ab    − (1) + a − b + ab = − (1) − a + b + ab (1) − a − b + ab  (1) + a + b + ab   a + ab − (1) − b = b + ab − (1) − a (1) + ab − a − b

595

596

PROBABILIDAD Y ESTADÍSTICA

La prueba en busca de interacción requiere probar: H 0: β12 = 0 Los efectos principales se estudian al probar:

H 0I : β1 = 0

y

H 0II: β2 = 0

Se sabe cómo efectuar estas pruebas con los métodos de la sección 12.5. Recuerde que se demostró con anterioridad, respecto de cualquier análisis de regresión, que: S yy = SSR + SSE

donde Syy denota la suma de cuadrados total corregida, SSR es la suma de cuadrados debida a la regresión, y SSE es la suma de cuadrados del error o residuos. En notación matricial, es fácil apreciar que: SSR = βˆ'X' y − C donde C denota el factor de corrección usual. En este caso (véase ejercicio 31):

C=

T 2... (1) + a + b + ab = N 22 n

Se sabe que:

βˆ = ( X'X )−1 X' y Dada la naturaleza especial de (X'X)−1 y X'y en esta aplicación, βˆ y SSR asumen formas relativamente sencillas. En particular:  (1) + a + b + ab    22 n    a + ab − (1) − b    22 n  βˆ =   b + ab − (1) − a    22 n    (1) + ab − a − b    22 n 2 [(1) + a + b + ab] [ a + ab − (1) − b]2 SSR = + 2 2n 2 2n

y

+

[ b + ab − (1) − a ]2 [(1) + ab − a − b]2 + −C 2 2n 2 2n

Sin embargo, el término (1) + a + b + ab = T..., de modo que el primer término de la expresión precedente es el factor de corrección. Por lo tanto, SSR puede describirse como sigue:

SSR =

[a + ab − (1) − b]2 [b + ab − (1) − a ]2 [(1) + ab − a − b]2 + + 22n 22n 22n

EXPERIMENTOS FACTORIALES

597

El uso de las técnicas para verificar un subconjunto de variables predictivas, dadas en la sección 12.5, permite demostrar que el numerador de la razón F usada para probar H0: β12 = 0 es:

[(1) + ab − a − b]2 22n Eso se denota con SSAB y la estadística de prueba se escribe como sigue: Estadística de prueba H0: no existe interacción F1, 2 n − 3 − 1 = 2

SSAB SSE /(22n − 3 − 1)

(véase ejercicio 47). También es posible comprobar que las estadísticas de prueba para verificar H 0I : β1 = 0 y II H 0 : β2 = 0 son: Pruebas de efectos principales

F1, 2 n − 3 − 1 2

F1, 2 n − 3 − 1 2

[ a + ab − (1) − b]2 SSA 2 2n = = 2 SSE /(2 n − 3 − 1) SSE /( 22n − 3 − 1) [ b + ab − (1) − a]2 SSB 2 2n = = 2 SSE /( 2 n − 3 − 1) SSE /( 22 n − 3 − 1)

Note que en este caso especial se tiene: SSR = SSA + SSB + SSAB Las ideas precedentes se ilustran con la continuación del análisis de datos del ejemplo 14.4.1. Ejemplo 14.4.2. En relación con los datos del ejemplo 14.4.1: S yy = (1.32 + 2.882 + 1.012 + . . . + 0.672 ) −

(10.17) 2 8

= 16.3863 − 12.9286 = 3.4577 SS AB =

SS A =

[(1) + ab − a − b]2 [ 4.18 + 1.50 − 2.53 − 1.96]2 = 8 8 = 0.1770 [ a + ab − (1) − b]2 = [ 2.53 + 1.50 − 4.18 − 1.96]2 8 = 0.5565

598

PROBABILIDAD Y ESTADÍSTICA

[b + ab − (1) − a]2 [1.96 + 1.50 − 4.18 − 2.53]2 = 8 8 = 1.3203

SSB =

SSR = SS A + SSB + SS AB = 0.5565 + 1.3203 + 0.1770 = 2.0538 SSE = S yy − SSR = 3.4577 − 2.0538 = 1.4039 El valor observado de la razón F usada para verificar la interacción es:

F1, 4 =

SS AB 0.1770 = = 0.5043 SSE/4 1.4039/4

El valor P es mayor que 0.1 y, por ende, es imposible rechazar H0: β12 = 0. No se detectó interacción alguna.

Se usa el diseño de dos factores como ejemplo de la aplicación de las técnicas de regresión en un experimento factorial. La idea puede ampliarse a cualquier diseño 2k. Por fortuna, es fácil prever la forma del numerador de toda prueba F de 1 grado de libertad que sea necesaria sin necesidad de trabajar directamente con los modelos reducidos apropiados. Por ejemplo, en el caso de dos factores se prepara una tabla que incluya los signos algebraicos de x1, x2 y x1x2 para cada combinación de tratamiento, como se muestra en la tabla 14.7. El término que se eleva a la segunda potencia en el numerador de la razón F se encuentra al sumar los totales de tratamientos con el coeficiente indicado de la columna correspondiente al efecto que se verifica. Por ejemplo, para poner a prueba la interacción, se encuentra el numerador apropiado al relacionar los coeficientes de la columna AB con los totales de tratamientos (1), a, b y ab; sumar esos términos, elevar la suma al cuadrado y dividir entre 2kn. Este caso, puede verse que:

TABLA 14.7 Coeficientes de los efectos del factorial 22 Efecto Combinación de tratamiento (1) a b ab

A(x1)

B(x2)

AB(x1x2)

– + – +

– – + +

+ – – +

EXPERIMENTOS FACTORIALES

599

[+ (1) − a − b + ab]2 22n [− (1) + a − b + ab]2 SSA = 22n [− (1) − a + b + ab]2 SSB = 22n SSAB =

Como puede apreciar el lector, esos valores concuerdan con los calculados anteriormente. En los ejercicios 32 y 33, se le pide que amplíe la idea al modelo de tres factores y a un modelo restringido de cuatro factores, respectivamente.

Técnicas de cálculo del método de Yates El SAS u otro software estadístico pueden usarse, si están disponibles, para analizar fácilmente un experimento factorial 2k. En caso de que se requiera analizar los datos a mano, la tarea se simplifica con una técnica que desarrolló Yates. A fin de usarla, debe enumerar las combinaciones de tratamiento en una columna con el orden estándar. Éste es, en el caso de un experimento de un factor, (1), a. Si se agrega un segundo factor, b, se multiplica b para obtener los cuatro tratamientos (1), a, b y ab. De manera similar, cuando se añade un tercer factor c, los términos precedentes se multiplican por ese factor para obtener el orden estándar (1), a, b, ab, c, ac, bc y abc. Se continúa la aplicación de este esquema con los factores adicionales que correspondan. El método de Yates se delinea a continuación y se ilustra en el ejemplo 14.4.3. El método de Yates 1. Enumerar las combinaciones de tratamiento en una columna con el orden estándar. 2. Formar una segunda columna con una lista de los totales de tratamiento en orden estándar. Emparejar los totales de arriba abajo. 3. Rotular la columna siguiente como 1 y formar la primera mitad de sus elementos al encontrar los totales de los pares de la segunda columna. Formar la segunda mitad de sus elementos al sustraer el primer miembro del segundo en cada par. Emparejar los elementos de esta columna. 4. Rotular la columna siguiente como 2. Formar esta columna a partir de la 1 con el procedimiento descrito en el párrafo precedente. 5. Continuar hasta que se formen k columnas. 6. El primer valor de la k-ésima columna es el gran total de todas las respuestas. Los valores restantes, elevados a la segunda potencia y divididos entre 2kn, conforman el numerador de la razón F necesaria para verificar el efecto en cuestión. Ejemplo 14.4.3. Se emprende un estudio sobre el efecto de la temperatura, el tiempo de proceso y la tasa de aumento de la temperatura sobre la cantidad de colorante (en mg) que queda en el baño residual de un proceso de coloración. El experimento se realiza con dos niveles de temperatura (120 y 135°C), dos de tiempo de proceso (30 y 60 min) y dos de tasa de aumento de la temperatura (R1, R2). Se lleva a cabo como un factorial 23 con dos repeticiones, lo cual origina los datos siguientes:

600

PROBABILIDAD Y ESTADÍSTICA

Temperatura 120°C

Tasa

R1 R2

135°C

30 min

60 min

30 min

60 min

19.9 18.6 14.5 16.1

17.4 16.8 16.3 14.6

25.0 22.8 27.7 18.0

19.5 18.3 28.3 26.2

Si se denotan los efectos de la temperatura, tiempo y tasa con A, B y C, respectivamente, la suma de cuadrados se calcula con el procedimiento de Yates como sigue:

Combinación de tratamiento (1) a b ab c ac bc abc

Total (n = 2)

(1)

(2)

(3)

38.5 47.8 34.2 37.8 30.6 45.7 30.9 54.5

86.3 72.0 76.3 85.4 9.3 3.6 15.1 23.6

158.3 161.7 12.9 38.7 –14.3 9.1 –5.7 8.5

320 51.6 –5.2 2.8 3.4 25.8 23.4 14.2

Efecto

Suma de cuadrados (SS)

Gran total A B AB C AC BC ABC

— 166.41 1.69 0.49 0.7225 41.6025 34.2225 12.6025

Total = SSR = 257.74

En relación con estos datos, la suma de cuadrados total corregida es: 2 − T.... = 6 713.88 − ∑ ∑ ∑ ∑ yijkl 2

16

3202 16

= 313.88 Puesto que SSE = Syy – SSR, se tiene: SSE = 313.88 – 257.74 = 56.14 El análisis completo aparece en la tabla 14.8. Puede verse, en la tabla IX del apéndice A, que el efecto A (temperatura) y la interacción AC (temperatura-tasa de aumento) son significativas con el nivel 0.05.

El impreso del SAS correspondiente al ejemplo 14.4.3 aparece a continuación:

EXPERIMENTOS FACTORIALES

601

TABLA 14.8 Fuente

Grados de libertad (DF )

Efectos principales A B C Interacciones AB AC BC ABC Error Total

Suma de cuadrados (SS )

Cuadrados medios (MS )

F

1 1 1

166.41 1.69 0.7225

166.41 1.69 0.7225

23.71 0.24 0.10

1 1 1 1 8

0.49 41.6025 34.2225 12.6025 56.14

0.49 41.6025 34.2225 12.6025 7.0175

0.07 5.93 4.88 1.80

15

313.88

GENERAL LINEAR MODELS PROCEDURE DEPENDENT VARIABLE: Y SOURCE MODEL ERROR CORRECTED TOTAL

DF 7 8 15

R-SQUARE 0.821142 SOURCE

DF

SUM OF SQUARES 257.74000 56.14000 313.88000

MEAN SQUARE 36.82000 7.01750 2

C.V. 13.24528 TYPE I SS

ROOT MSE 2.6491

1 1 1 1 1 1 1

20.000 F VALUE

166.41000 1.69000 0.72250 0.49000 41.60250 34.22250 12.60250

23.71 0.24 0.10 0.07 5.93 4.88 1.80

166.41000 1.69000 0.72250 0.49000 41.60250 34.22250 12.60250

Pr > F 0.0164

Y MEAN

MEAN SQUARE

1

X1 X2 X3 X4 X5 X6 X7

F VALUE 5.25

3

Pr > F 4

0.0012 0.6368 0.7565 0.7983 0.0409 0.0582 0.2170

La suma de cuadrados de cada efecto se muestra en la columna 1 , y el cuadrado medio del error, en 2 . Los valores observados de las razones F con un grado de libertad corresponden a 3 , y sus valores P, a la columna 4 .

14.5 EXPERIMENTOS FACTORIALES 2k EN UN DISEÑO DE BLOQUES INCOMPLETO En algunas situaciones experimentales, es imposible llevar a cabo cada combinación de tratamiento exactamente con las mismas condiciones de experimentación. Por ejemplo, podría ser que el laboratorio no esté equipado para el manejo de todas las combinaciones de tratamiento en el mismo día, de modo que algunos tratamientos deban efectuarse en un día, y otros, más adelante. Ello introduce el

602

PROBABILIDAD Y ESTADÍSTICA

factor de “día de ejecución” como una posible fuente de variación extraña que debe tomarse en cuenta. Un ingeniero químico podría no contar con materia prima suficiente de un solo proveedor para efectuar los experimentos de todas las combinaciones de tratamientos, de modo que se requieran tres proveedores. En este caso, el factor “proveedor” es una variable extraña que debe controlarse. Una solución del problema es ejecutar las combinaciones de tratamiento en subconjuntos. Cada uno de estos últimos se denomina bloque incompleto. Como podría suponer el lector, debe pagarse un precio por no efectuar todo el experimento en condiciones idénticas. Ese precio es que algunos de los efectos se “confundan” con los de bloque o sean inseparables de estos últimos. Existen ciertas restricciones sobre el número de bloques incompletos que puede usarse en un experimento factorial 2k. En particular, se limita a los valores de 2p, donde p < k. Por ejemplo, si k = 2, entonces p debe ser 1 y 2p = 2; las cuatro combinaciones de tratamiento pueden dividirse en dos conjuntos de dos tratamientos cada uno. En el supuesto de que k = 3, entonces p = 1 o p = 2, de modo que pueden usarse dos o cuatro bloques. Decidir cuáles combinaciones de tratamiento se usan en cada uno de los 2p bloques incompletos y cuáles efectos se confunden con la utilización de bloques requiere elegir p “contrastes definitorios”. Estos últimos son efectos que no interesan al investigador o de los cuales espera que sean insignificantes. Se confunden con el efecto de bloque y, por ende, no se puede verificar más adelante su significación. Es usual que las interacciones de orden alto se elijan como contrastes definitorios. Ejemplo 14.5.1. Suponga que se tiene un experimento factorial 24 que se efectuará en cuatro bloques, de modo que p = 2. Se necesitan dos contrastes definitorios. Suponga también que el investigador no tiene interés en las interacciones ABC y CD, que se seleccionan como contrastes definitorios. No se harán más adelante inferencias acerca de estos efectos, ya que se trata de interacciones que se confundieron con los efectos de bloques. Una vez seleccionados los contrastes definitorios, es posible determinar las combinaciones de tratamientos asignadas a cada bloque. Un esquema para hacerlo se delinea a continuación. Se ilustra paso a paso, de manera que se complete el problema recién planteado. Formación de 2p bloques incompletos: 1.

Seleccionar un valor de p, donde p < k. (En el ejemplo, p = 2.)

2.

Seleccionar p contrastes definitorios. (Se seleccionaron ABC y CD.)

3.

Escribir cada contraste en la forma Aγ1 j β γ2 j Cγ3 j . . . , donde γij = 1 es el i-ésimo factor que aparece en el j-ésimo contraste definitorio, y γij = 0 en cualquier otro caso. (Aquí, ABC = A1B1C1D0 y CD = A0B0C1D1. En otras palabras, γ11 = γ21 = γ31 = 1 y γ41 = 0, mientras que γ12 = γ22 = 0 y γ32 = γ42 = 1.)

4.

Los p contrastes definitorios se relacionan con p funciones L1, L2, . . . , Lp, definidas por: L j = z1γ1 j + z2γ 2 j + . . . + z k γ kj

j = 1, 2, . . . , p

(En el ejemplo, existen dos funciones de este tipo, a saber: L1 = z1 + z2 + z3 L2 = z3 + z 4 )

EXPERIMENTOS FACTORIALES

5.

603

Evaluar cada una de esas funciones respecto de cada combinación de tratamiento, al hacer que zi = 1 si se usa el nivel alto del i-ésimo factor y zi = 0 en cualquier otro caso. (Por ejemplo, en el caso de la combinación de tratamiento (1), con uso del nivel bajo de cada factor, se tiene:

L1 = 0 + 0 + 0 = 0 L2 = 0 + 0 = 0 En el caso de la combinación de tratamiento ab, con uso de los niveles altos de los factores A y B, y de los niveles bajos de C y D, se tiene:

L1 = 1 + 1 + 0 = 2 L2 = 0 + 0 = 0) 6. 7.

Reducir cada uno de los valores de Lj a 0 o 1 módulo 2. (A tal efecto, se divide entre dos y se toma el residuo. En este caso, tanto L1 como L2 se reducen a 0 módulo 2.) Agrupar todas las combinaciones de tratamiento con valores idénticos de L1, L2, . . . , Lp en un solo bloque. El bloque que contiene la combinación de tratamiento (1) se llama bloque principal. (Los cuatro bloques del ejemplo tienen valores L1 y L2 módulo 2 de 0-0, 1-0, 0-1 y 1-1. Se muestran en la tabla 14.9.)

El análisis de un experimento factorial 2k con uso de bloques es similar al del experimento factorial sin bloques. La suma de cuadrados de los efectos que no se confunden con los bloques se TABLA 14.9 Combinación de tratamiento

L1

L1 (módulo 2)

L2

L2 (módulo 2)

Bloque

(1) a b c d ab ac ad bc bd cd abc abd acd bcd abcd

0 1 1 1 0 2 2 1 2 1 1 3 2 2 2 3

0 1 1 1 0 0 0 1 0 1 1 1 0 0 0 1

0 0 0 1 1 0 1 1 1 1 2 1 1 2 2 2

0 0 0 1 1 0 1 1 1 1 0 1 1 0 0 0

1 2 2 4 3 1 3 4 3 4 2 4 3 1 1 2

Bloque 1

Bloque 2

Bloque 3

(1)

a

ac

Bloque 4 c

ab

b

bc

ad

acd

cd

d

bd

bcd

abcd

abd

abc

604

PROBABILIDAD Y ESTADÍSTICA

calcula de la misma forma que en el caso sin confusión. Luego, se calcula una suma de cuadrados de bloques en la forma usual: SS Blks =

(total del bloque)2 − factor de corrección todos los bloques tamaño del bloque



o con el método de Yates. Si se usa este último, entonces la suma de cuadrados de los bloques es el total de los efectos que se confunden con los bloques. ¿Cuáles son esos efectos? En general, se trata de los p contrastes definitorios y sus interacciones generalizadas. Se define a la interacción generalizada de dos contrastes como el producto de los contrastes tal que los exponentes del producto se han reducido al módulo 2. A manera de ilustración, en el ejemplo 14.5.1 los efectos ABC y CD se confunden con los bloques. Además, ocurre lo mismo con la interacción (ABC )(CD) = ABC 2D = ABD. La suma de cuadrados de los bloques está dada por SSBlks = SSABC + SSCD + SSABD. Los cálculos respectivos se ilustran en el ejemplo 14.5.2. Ejemplo 14.5.2. Se planea un estudio del efecto de cuatro factores en el rendimiento de cierto compuesto químico. Se realizará un experimento factorial 24 con uso de dos bloques. En este caso, p = 1 y el contraste definitorio seleccionado es la interacción de cuatro factores ABCD. Se supone que todas las interacciones de tres factores son insignificantes y se las excluye del modelo. Los bloques resultantes y la respuesta única por combinación de tratamiento se muestran en la tabla 14.10. La tabla de análisis de varianza obtenida con SAS aparece en la tabla 14.11. En ella, SSBlks = 11.90 es una combinación del efecto de bloque y SSABCD, y la suma de cuadrados de errores es una combinación de interacciones de tres factores, SSABC, SSABD, SSACD y SSBCD.

14.6 EXPERIMENTOS FACTORIALES FRACCIONARIOS En múltiples experimentos industriales, existen numerosas variables que podrían influir en la respuesta. Se mencionó que el número de combinaciones de tratamiento se vuelve muy alto conforme aumenta k en un experimento factorial completo. Por razones de tiempo o economía, sería imposible recopilar datos bajo todas las condiciones de experimentación. En esta sección, se considera un método para contrarrestar dicho problema. Por principio de cuentas, advierta que al incrementarse el número de factores que se estudia en un experimento ocurre lo mismo con el número de interacciones de orden alto (tridireccional o mayor). Es frecuente que sea razonable suponer que son insignificantes. Ello reduce el número de parámetros del modelo o efectos de interés real para el investigador y posibilita emprender el estudio con menos combinaciones de tratamiento que las necesarias en un modelo 2k completo. Puesto que en tal caso se estudia sólo una fracción de las 2k combinaciones de tratamientos posibles, se denomina experimento factorial fraccionario. Las fracciones usadas son 1/2, 1/4, 1/8, y así sucesivamente. En lo fundamental, un experimento factorial fraccionario es uno de bloques aleatorios incompleto en el que se utiliza sólo uno de los 2p bloques posibles. Por ello, muchos de los conceptos necesarios en el diseño de estos experimentos forman parte de la sección precedente.

EXPERIMENTOS FACTORIALES

605

TABLA 14.10 Bloque 1

Bloque 2

(1) = 29.5 ab = 38.2 ac = 33.8 bc = 25.3 ad = 37.6 bd = 31.0 cd = 24.9 abcd = 34.1

a = 39.8 b = 32.1 c = 27.3 d = 31.4 abc = 35.7 abd = 38.9 acd = 35.9 bcd = 27.1

TABLA 14.11 Suma de cuadrados (SS)

Cuadrados medios (MS)

Fuente

DF

Bloques Efectos principales A B C D Interacciones de dos factores AB AC AD BC BD CD Error

1

11.90

1 1 1 1

267.32 0.30 73.96 0.04

267.32 0.30 73.96 0.04

1 1 1 1 1 1 4

0.42 1.21 0.09 0.16 0.01 0.02 1.355

0.42 1.21 0.09 0.16 0.01 0.02 0.75

F

789.14 218.33

Se empieza por seleccionar una o más de las interacciones de orden alto para su uso como contrastes definitorios. Sus efectos y los de sus interacciones generalizadas se confunden con los bloques, por lo que deben ser efectos que no interesan al investigador. Otra consecuencia importante de emprender sólo una fracción de las 2k combinaciones de tratamientos posibles es que también podrían confundirse otros efectos. A falta de cuidado, efectos de sumo interés para el investigador podrían ser indiferenciables entre sí. Un ejemplo ha de aclarar esta idea. Ejemplo 14.6.1. Suponga que se pretende diseñar un experimento factorial fraccionario 1/2 para estudiar tres factores. El contraste definitorio usado para crear dos bloques es la interacción de tres factores ABC. Los bloques resultantes son: Bloque 1

Bloque 2

(1) ab bc ac

a b c abc

606

PROBABILIDAD Y ESTADÍSTICA

Suponga que las combinaciones de tratamientos enumeradas en el bloque 2 se usan en el experimento. La tabla 14.12 es la de coeficientes de un diseño 23. La estimación de cada uno de los efectos del modelo puede leerse en las columnas de esa tabla. La confusión antes mencionada también es apreciable en la tabla. Advierta que si se emprenden las ocho combinaciones de tratamientos, entonces el efecto A se estima con:

− (1) + a − b − c + ab + ac − bc + abc = [ a − b − c + abc ] + [− (1) + ab + ac − bc ] = R+ S y el efecto BC, con:

(1) + a − b − c − ab − ac + bc + abc = [ a − b − c + abc ] − [− (1) + ab + ac − bc ] = R− S Cuando se emprenden las ocho combinaciones de tratamientos, esas dos estimaciones son distintas y la diferencia entre ellas depende de la magnitud del término [−(1) + ab + ac – bc]. En el supuesto de que se lleven a cabo sólo las combinaciones de tratamiento del bloque 2, puede apreciarse que los efectos A y BC son estimados por R = a − b − c + abc. Los efectos de A y BC se vuelven indistinguibles, es decir, se confunden entre sí.

En el caso de confusión de dos efectos, puede afirmarse que uno es el alias del otro o viceversa. En el ejemplo 14.6.1, el efecto A es el alias del efecto BC, lo cual se denota con A ≡ BC. Una manera fácil de determinar los alias es encontrar las interacciones generalizadas de cada efecto con los contrastes definitorios. Por ejemplo, los alias de los efectos B y C en el ejemplo mencionado son: B( ABC ) = AB 2C = AC y C ( ABC ) = ABC 2 = AB Debe resaltarse que el diseño factorial 23 se usa fundamentalmente con fines de ilustración. Los experimentos factoriales fraccionarios son de máxima utilidad cuando k es más bien grande y TABLA 14.12 Coeficientes de un experimento factorial 23 Combinación de tratamiento

Número de bloque

(x1 ) A

(x2 ) B

(x3 ) C

(x1x2 ) AB

(x1x3 ) AC

(x2x3 ) BC

(1) a b c ab ac bc abc

1 2 2 2 1 1 1 2

– + – – + + – +

– – + – + – + +

– – – + – + + +

+ – – + + – – +

+ – + – – + – +

+ + – – – – + +

EXPERIMENTOS FACTORIALES

607

se desea trabajar con uno de varios bloques posibles. En otras palabras, podría optarse por una fracción 1/2, 1/4, 1/8 o incluso otra menor en un experimento factorial muy grande. En general, con una fracción 2p de un experimento factorial 2k se construyen p bloques después de elegir p – 1 contrastes definitorios y luego se selecciona exactamente uno de esos p bloques en el experimento real. Cuando se hace esto, debe tenerse en cuenta la estructura de alias resultante. Ésta es crucial, ya que determina cuáles efectos pueden verificarse a partir de los datos experimentales. Es frecuente que sea necesario consultar a un profesional en búsqueda de ayuda para seleccionar un diseño experimental apropiado. El problema de los alias en un experimento factorial 24 se ilustra en el ejemplo 14.6.2. Ejemplo 14.6.2. Considere el ejemplo 14.5.1, en el cual p = 2 y k = 4. Los dos contrastes definitorios usados para determinar los cuatro bloques dados en la tabla 14.9 son ABC y CD. Suponga que el efecto principal A es el de interés primario. A fin de determinar los alias de este efecto, se multiplica A por cada uno de los contrastes definitorios y se reducen los exponentes al módulo 2. Esos alias son: A( ABC) = A2 BC = BC

y

A(CD) = ACD El efecto principal es alias de otros dos efectos, una interacción de dos factores y otra de tres factores. Ello no genera problemas cuando existen razones, dependientes de la disciplina correspondiente, para creer que las interacciones sean insignificantes; en caso contrario, deben encontrarse nuevos contrastes definitorios que no confundan el efecto A con otros efectos significativos.

El ejemplo 14.6.3 ilustra el análisis completo de un experimento factorial fraccionario. Ejemplo 14.6.3. Se lleva a cabo un experimento para estudiar la viscosidad de copolímeros de bloque estrella. Se seleccionan cinco variables dependientes a fin de determinar su efecto en la variable de respuesta, la viscosidad. Las variables dependientes son la temperatura, concentración diblock, frecuencia, fundido de solventes y tiempo de recocido. El experimento es costoso, por lo que se decide usar la fracción 1/2 de una factorial 25, con la interacción de cinco factores confundida con los bloques. Los niveles de los factores respectivos que se usan en el experimento son los siguientes: Factor A (temperatura) B (concentración diblock) C (frecuencia) D (fundido de solvente) E (tiempo de recocido)

Nivel 130°C, 230°C 10%, 100% 0.10, 100.0 8.2, 9.3 0 h, 2 h

Uno de los dos bloques obtenidos al confundir la interacción ABCDE con los bloques lleva a las respuestas siguientes de viscosidad con las combinaciones de tratamiento respectivas:

608

PROBABILIDAD Y ESTADÍSTICA

Nivel del factor A

B

C

D

E

Combinación de tratamiento

0 1 1 1 1 0 0 0 0 0 0 1 1 1 1 0

0 1 0 0 0 1 1 1 0 0 0 1 1 1 0 1

0 0 1 0 0 1 0 0 1 1 0 1 1 0 1 1

0 0 0 1 0 0 1 0 1 0 1 1 0 1 1 1

0 0 0 0 1 0 0 1 0 1 1 0 1 1 1 1

(1) ab ac ad ae bc bd be cd ce de abcd abce abde acde bcde

Respuesta 62.7 11.8 1.8 108.8 26.4 2.0 36.4 21.7 4.2 2.3 117.9 1.2 0.6 1.1 3.5 2.5

El lector puede verificar que la estructura de alias y las sumas de cuadrados respectivas (con uso del procedimiento de Yates) son las siguientes: Fuente A ≡ BCDE B ≡ ACDE C ≡ ABDE D ≡ ABCE E ≡ ABCD AB ≡ CDE AC ≡ BDE AD ≡ BCE AE ≡ BCD BC ≡ ADE BD ≡ ACE BE ≡ ACD CD ≡ ABE CE ≡ ABD DE ≡ ABC

Suma de cuadrados (SS) 558.14 3 915.63 8 496.23 1 337.73 174.90 0.11 469.81 0.18 1 074.20 3 579.03 1 157.70 0.23 1 17l.35 170.96 0.18

La combinación de las interacciones de dos factores con error permite obtener la tabla 14.13, del ANOVA de verificación de efectos principales. De conformidad con la tabla IX del apéndice A, puede concluirse que los factores B y C son significativos con el nivel 0.05.

Debe agregarse una advertencia a la interpretación de este ejemplo. A partir de la estructura de alias, puede verse que los efectos principales son alias de interacciones de cuatro factores, y las interacciones de dos factores lo son de interacciones de tres factores. Por añadidura, verificar efectos principales requiere combinar las interacciones de dos factores en error. De lo contrario, se tendrían cero grados de libertad en cuanto a errores y habría que partir de supuestos más bien concluyentes.

EXPERIMENTOS FACTORIALES

609

TABLA 14.13 Tabla ANOVA para fracción 1/2 de factorial 25 Fuente

Grados de libertad (DF)

Suma de cuadrados (SS)

Cuadrados medios (MS)

1 1 1 1 1 10

558.14 3 915.63 8 496.23 1 337.73 174.90 7 623.74

558.14 3 915.63 8 496.23 1 337.73 174.90 762.37

A B C D E Error

F 0.73 5.14 11.14 1.75 0.23

Determinar si los supuestos son válidos o no requiere juicio adecuado del científico y el estadístico. En el supuesto de que se determine su validez, este tipo de experimento proporciona información muy útil con costo significativamente reducido.

RESUMEN DEL CAPÍTULO En este capítulo, se amplía el estudio de los procedimientos del análisis de varianza a los llamados experimentos factoriales. Éstos se usan para investigar el efecto de dos o más factores en una respuesta medida. Se estudian los diseños mixto, fijo y aleatorio en el contexto de dos factores. Se denomina diseños factoriales 2k a los que utilizan k factores, cada uno en dos niveles, que se conceptúan como “alto” y “bajo”. Los aspectos de cálculo de esos diseños se manejan con el método de Yates o el programa SAS. Otro diseño analizado es el diseño factorial 2k en un bloque incompleto. Este diseño resulta útil cuando es imposible emprender cada combinación de tratamiento exactamente bajo las mismas condiciones experimentales. El capítulo termina con un análisis de los experimentos factoriales fraccionarios. En éstos, es imposible o, quizá, económicamente no factible recopilar datos de todas las posibles combinaciones de tratamiento, de modo que se estudian únicamente algunas de ellas. Los términos de importancia mencionados en el capítulo son: Factor Experimento factorial Efectos fijos Efectos mixtos Niveles

Interacción Diseños factoriales 2 Método de Yates Bloque incompleto Experimento factorial fraccionario

EJERCICIOS Sección 14.1

1. Demuestre, en el modelo bidireccional de efectos fijos, lo siguiente: a

b

i =1

j =1

a

b

∑ αi = ∑ β j = ∑ ∑ (αβ )ij = 0 i =1 j =1

610

PROBABILIDAD Y ESTADÍSTICA

2. Demuestre que en el modelo de clasificación bidireccional de efectos fijos la hipótesis nula: H 0I : µ1 .. = µ2 .. = . . . = µa ..

es equivalente a H 0I : αi = 0, i = 1, 2, . . . , a, y la hipótesis nula: H 0II : µ.1. = µ.2. = . . . = µ.b.

es equivalente a H 0II : β j = 0, j = 1, 2, . . . , b. Se estudia la ozonificación como tratamiento secundario de efluentes, después de la absorción con cloruro ferroso, con tres tiempos de reacción y tres niveles de pH. El estudio arroja los resultados siguientes de disminución del efluente: Tiempo de reacción (min)

Nivel de pH

Disminución del efluente

20

7.0 9.0 10.5

23, 21, 22 16, 18, 15 14, 13, 16

40

7.0 9.0 10.5

20, 22, 19 14, 13, 12 12, 11, 10

60

7.0 9.0 10.5

21, 20, 19 13, 12, 12 11, 13, 12

Los ejercicios 3-10 hacen referencia a este experimento. 3. Suponga el modelo de clasificación bidireccional de efectos fijos y escriba el modelo de este experimento, además de explicar qué representa cada parámetro en el contexto del experimento mismo. 4. Exprese la hipótesis nula que se probará primero. 5. a) Represente gráficamente los promedios de tiempo de reacción contra niveles de pH. b) Represente gráficamente los promedios de nivel del pH contra el tiempo de reacción. c) ¿Acaso las gráficas de los dos párrafos precedentes apuntan a una interacción? 6. Verifique en busca de interacción significativa. Indique su valor P aproximado. 7. Pruebe en busca de diferencias significativas de los tiempos de reacción. Exprese el valor P aproximado. 8. Realice pruebas en busca de diferencias significativas entre los niveles de pH con el nivel de significación 5%. 9. ¿Es necesario emprender análisis unidireccionales nivel por nivel para describir la naturaleza de las diferencias entre los efectos principales? Explique su respuesta. 10. Realice comparaciones por pares para resaltar las diferencias entre las medias de los efectos principales que resulten significativamente diferentes. La descomposición de empaques de hoja se estudia en cuatro ambientes con tres periodos de exposición. Las mediciones son en gramos de pérdida de peso de los empaques. El estudio genera los resultados siguientes:

EXPERIMENTOS FACTORIALES

611

Tiempo Ambiente

1 mes

2 meses

3 meses

E1

1.09 1.06 1.16 1.03 1.01 1.04 0.90 1.03

1.35 1.53 1.38 1.35 1.63 1.51 1.60 1.72

1.60 1.40 2.18 1.77 1.66 1.98 1.73 1.76

E2 E3 E4

Los ejercicios 11-15 se refieren al experimento recién descrito. 11. Suponga el uso del modelo de clasificación bidireccional con efectos fijos y escriba el modelo del experimento, además de explicar qué representa cada parámetro en el contexto del experimento mismo. 12. a) Prepare una gráfica de los promedios de tiempo contra condiciones ambientales. b) Prepare una gráfica de los promedios de las condiciones ambientales contra el tiempo. c) ¿Acaso las gráficas de los párrafos a y b hacen pensar en la existencia de interacción? 13. Realice pruebas en busca de interacción significativa con el nivel α = 0.10. 14. Lleve a cabo los análisis unidireccionales que considere apropiados, nivel por nivel, con base en los resultados del ejercicio 13. 15. ¿Cuál combinación de condiciones ambientales y tiempo parece llevar a la descomposición máxima de los paquetes? Sección 14.2

16. (ANOVA de tres factores.) En el diseño de tres factores, se supone que las a . b . c combinaciones de tratamiento corresponden a muestras aleatorias de tamaños n extraídas de a . b . c poblaciones, donde cada población tiene distribución normal, con media µijk y varianza σ 2. El modelo del diseño de tres factores es: Yijkl = µ + α i + β j + γ k + (αβ ) ij + (αγ ) ik + ( βγ )jk + (αβγ ) ijk + E ijkl i = 1, 2, . . . , a k = 1, 2, . . . , c j = 1, 2, . . . , b l = 1, 2, . . . , n Aquí, αi, βj y γk son los efectos principales. Los términos (αβ )ij, (aγ )ik y (βγ )jk representan las interacciones de los factores A y B, A y C, y B y C, respectivamente. La interacción entre los factores A, B y C se denota con (αβγ )ijk. Sea que:

µijk . = media de la (ijk)-ésima combinación de tratamiento µij .. = promedio de las medias de las poblaciones que reciben el i-ésimo nivel de A y el j-ésimo nivel de B c µ = ∑ ijk k =1 c

612

PROBABILIDAD Y ESTADÍSTICA

µi ... = promedio de las medias de las poblaciones que reciben el i-ésimo nivel de A

µijk . j = 1 k = 1 bc µ = promedio de las medias de todas las poblaciones que se consideran b

c

= ∑ ∑

µijk . i = 1 j = 1 k = 1 abc a

b

c

= ∑∑ ∑

Se necesitan otras medias de naturaleza similar para definir los términos del modelo. Se muestran a continuación. Exprese cada una en forma verbal y en notación de sumatoria como un promedio de medias poblacionales. a ) µ i .k . b) µ.jk . c ) µ.j.. d ) µ..k . 17. Los efectos principales y de interacción pueden definirse de una manera que guarda paralelismo con las definiciones del modelo bidireccional. Por ejemplo, se definen:

αi = µi ... − µ (αβ )ij = µij .. − µi ... − µ. j.. + µ Defina cada uno de los parámetros de modelos siguientes en forma similar: a ) βj b) γ k c ) (αγ )ik d ) ( βγ )jk e) (αβγ )ijk 18. Las definiciones del ejercicio 17 permiten demostrar que los efectos principales, así como los a términos de interacciones de dos y tres factores, suman 0. Verifique que ∑i = 1αi = 0. 19. Los totales necesarios en el ANOVA tridireccional también guardan paralelismo con los del diseño bidireccional. Por ejemplo: Ti ... = suma de todas las respuestas de las unidades experimentales que reciben el nivel i de A b

c

n

= ∑ ∑ ∑ yijkl j =1 k =1l =1

Tij .. = suma de todas las respuestas de las unidades experimentales que reciben el nivel i de A y el nivel j de B c

n

= ∑ ∑ yijkl k =1l =1

EXPERIMENTOS FACTORIALES

613

Defina cada uno de los totales siguientes: a ) T .j .. b ) T ..k . c) Ti .k . d ) T .jk . e) Tijk . f ) T .... 20. Las sumas de cuadrados características que se necesitan en el ANOVA tridireccional son: 2 Ti 2... T .... − i = 1 bcn abcn a

SSA = ∑

a

b

SSAB = ∑ ∑

Tij2..

i =1 j =1

cn

b T 2 . .. Ti 2... T 2.... j −∑ + abcn i = 1 bcn j = 1 acn a

−∑

Defina cada una de las sumas de cuadrados siguientes: a) SSB b) SSC c) SSAC d ) SSBC e) SSABC [Sugerencia: Véase la definición de (αβγ )ijk dada en el ejercicio 17.] f ) SSTot 21. Escriba la identidad de suma de cuadrados del diseño de tres factores. 22. La tabla 14.14 contiene el ANOVA del diseño de tres factores. Exprese la hipótesis nula que se intenta verificar con cada una de las razones F dadas en ella.

TABLA 14.14 Tabla ANOVA del factorial de tres factores fijos Fuente de variación

Grados de libertad (DF)

Suma de cuadrados (SS)

Cuadrados medios (MS)

F

Efecto principal A B C

a–1 b–1 c–1

SSA SSB SSC

SSA /a – 1 SSB /b – 1 SSC /c – 1

MSA /MSE MSB /MSE MSC /MSE

Interacción de dos factores AB AC BC

(a – 1)(b – 1) (a – 1)(c – 1) (b – 1)(c – 1)

SSAB SSAC SSBC

SSAB /(a – 1)(b – 1) SSAC /(a – 1)(c – 1) SSBC /(b – 1)(c – 1)

MSAB /MSE MSAC /MSE MSBC /MSE

Interacción de tres factores ABC Error

(a – 1)(b – 1)(c – 1) abc(n – 1)

SSABC SSE

SSABC /(a – 1)(b – 1)(c – 1) SSE /abc(n – 1)

MSABC /MSE

Total

abcn – 1

SSTot

614

PROBABILIDAD Y ESTADÍSTICA

23. Encuentre la tabla ANOVA de los datos siguientes:

Factor A 1

2

3

1

2

1

2

1

2

1

42 34 33

38 34 41

28 28 11

22 8 3

34 19 17

10 8 0

2

47 59 43

38 41 32

52 33 29

33 15 24

22 3 17

16 10 1

3

55 66 69

48 26 63

54 36 53

27 41 38

17 40 40

22 6 38

4

64 60 94

58 51 67

63 55 40

41 40 64

33 34 40

29 24 20

Factor B

Factor C

24. (Modelo tridireccional restringido.) Es frecuente que se tengan a priori razones para suponer que el modelo tridireccional completo dado en el ejercicio 16 es innecesario. Por ejemplo, suponga que se piensa que no existen la interacción tridireccional ni la bidireccional AC. En este caso, el modelo que interesa es: Yijkl = µ + αi + βj + γ k + (αβ )ij + ( βγ )jk + E ijkl

El ANOVA de tal modelo es idéntico al del análisis tridireccional, excepto por el término de error. En este caso, la suma de cuadrados de errores está dada por: SS E = SS Tot − SS A − SS B − SS C − SS AB − SS BC Esa suma recibe la denominación de término de error “agrupado”, ya que se encuentra al combinar o agrupar la variación usualmente atribuida a las interacciones de dos factores AC y de tres factores ABC con error puro. Los grados de libertad de error también se combinan de esas tres fuentes. En la tabla 14.15, se muestra el ANOVA de este modelo. a) Suponga que a = 4, b = 3, c = 3 y n = 2. ¿Cuántos grados de libertad se relacionan con SSA, SSB, SSC, SSAB, SSBC, SSTot y SSE, respectivamente? b) Demuestre que los grados de libertad de error en general pueden expresarse como: (a − 1)(c − 1) + ( a − 1)(b − 1)(c − 1) + abc( n − 1) Sección 14.3

25. ¿Cuáles son las hipótesis nulas de interés en un modelo de efectos mixtos con niveles aleatorios del factor A y fijos del factor B? La tabla de análisis de varianza de tal modelo es la 14.16.

615

EXPERIMENTOS FACTORIALES

TABLA 14.15 Tabla ANOVA reducida de tres efectos Fuente de variación

Grados de libertad (DF)

Suma de cuadrados (SS)

Cuadrados medios (MS)

F

Efecto principal A B C Interacción AB BC Error

a–1 b–1 c–1

SSA SSB SSC

SSA /(a – 1) SSB /(b – 1) SSC /(c – 1)

MSA /MSE MSB /MSE MSC /MSE

(a – 1)(b – 1) (b – 1)(c – 1) DFE = sustracción

SSAB SSBC SSE = sustracción

SSAB /(a – 1)(b – 1) SSBC /(b – 1)(c – 1) SSE /DFE

MSAB /MSE MSBC /MSE

Total

abcn – 1

SSTot

Determine las razones F apropiadas para probar cada hipótesis nula a partir de los cuadrados medios esperados. Sección 14.4

26. ¿Cuántas combinaciones de tratamiento son posibles en un experimento con k factores, cada uno en dos niveles, donde k = 4, 5 y 7, respectivamente? 27. Suponga, en un modelo bidireccional particular, que β0 = 12, β1 = 3 y β2 = 2. Suponga también que β12 = 0, de la cual se ha afirmado que puede interpretarse como la ausencia de interacciones. Advierta que la media teórica de la combinación de tratamiento (1) es:

µY | x , x = β0 + β1 (−1) + β2 (−1) = 12 − 3 − 2 = 7 1

2

a) Encuentre las medias teóricas de las combinaciones a, b y ab, respectivamente. b) Rotule las medias restantes de la gráfica de la figura 14.3. c) Encuentre las pendientes de los segmentos de recta que se muestran en la figura 14.3. Argumente que esos segmentos son paralelos, como se espera cuando no existe interacción. 28. Suponga, en un modelo bidireccional particular, que β0 = 12, β1 = 3 y β2 = 2. Suponga también que β12 = 1, de la cual se ha afirmado que puede interpretarse como la ausencia de interacciones entre factores A y B. a) Encuentre las medias teóricas de las combinaciones de tratamiento (1), a, b y ab, respectivamente. b) Elabore una gráfica cuyas medias sean similares a la de la figura 14.3. c) Encuentre las pendientes de los segmentos de recta que se muestran en la figura 14.3. Argumente que se trata de segmentos paralelos, como se espera cuando no existe interacción. 29. Suponga, en un modelo bidireccional particular, que β0 = 12, β1 = 3 y β2 = 2. Señale un valor numérico de β12 que origine cruzamiento de las gráficas de las medias en relación con los niveles del factor B.

616 ab − 1 a −1

b −1 (a − 1)(b − 1) ab(n − 1) abn − 1

Tratamiento A

B Error Total

AB

Grados de libertad (DF)

Fuente de variación b



2

b

n

i=1 j =1 k =1

∑ ∑ ∑ Yijk2 −

a

j =1



b

T ...2 abn

T ... − an abn SSTr − SS A − SSB SSTot − SSTr

T . j.2

∑∑

a

T ...2 i=1 j =1 n abn a Ti ..2 T ...2 − ∑ i = 1 bn abn

Tij 2.

Suma de cuadrados (SS)

SS AB / (a − 1)(b − 1) SSE /ab(n − 1)

SSB / (b − 1)

SS A / (a − 1)

SSTr / (ab − 1)

Cuadrados medios (MS)

σ +σ σ2

2

2 AB

σ 2 + nσ 2AB +

b −1

j =1

?

?

?

σ 2 + nbσ 2A b

?

F

2 σ 2 + nσ Tr

na ∑ β 2j

Cuadrados medios esperados

TABLA 14.16 Tabla ANOVA del diseño de clasificación bidireccional con efectos mixtos: A aleatoria y B fija

616 PROBABILIDAD Y ESTADÍSTICA

EXPERIMENTOS FACTORIALES

617

(Factor B alto)

(Factor B bajo)

Bajo

Alto Factor A

FIGURA 14.3 Una gráfica de niveles de factor B a través de niveles de factor A cuando se supone que β12 = 0.

30. En la sección 12.3, se demuestra que: n

n

i =1

i =1

SSR = β0 ∑ Yi + β1 ∑ X 2iYi n

n

i =1

i =1

+ β2 ∑ X 2iYi + . . . + β k ∑ X kiYi − C

donde C es el factor de corrección usual. Verifique que SSR puede expresarse en notación matricial como: SSR = βˆ' X' Y − C

31. Complete el análisis de los datos del ejemplo 14.4.1 con la prueba de efectos principales. 32. El modelo 23 completo está dado por:

µY | x , x , x = β0 + β1 x1 + β2 x2 + β3 x3 + β4 x1 x2 + β5 x1 x3 + β6 x2 x3 + β7 x1 x2 x3 1

2

3

a) Complete la tabla de coeficientes parcial que se muestra en la tabla 14.17. b) Con base en la tabla 14.17, puede verse que:

[(−1) + a − b − c + ab + ac − bc + abc ]2 23n Encuentre SSB, SSC, SSAB, SSAC, SSBC y SSABC. 33. Considere el modelo de cuatro factores: SSA =

µY | x , x , x , x = β0 + β1 x1 + β2 x2 + β3 x3 + β4 x4 1

2

3

4

en el cual se supone a priori que no existe en términos de interacción. a) ¿Cuántas combinaciones de tratamiento son posibles? b) Prepare una tabla de coeficientes de efectos similar a la tabla 14.17 para este modelo. c) Encuentre SSA, SSB, SSC y SSD.

618

PROBABILIDAD Y ESTADÍSTICA

TABLA 14.17 Coeficientes de efectos del factorial 23 Efectos Combinación de tratamiento

x1 A

x2 B

x3 C

x1x2 AB

x1x3 AC

x2x3 BC

x1x2x3 ABC

(1) a b c ab ac bc abc

– + – – + + – +

– – + – + – + +

– – – + – + + +

+ –

+ –

+ +

– +

34. Se emprende un experimento factorial de cuatro factores. El experimento se repite (Rep.) dos veces, con las respuestas siguientes: Combinación de tratamiento

Rep. 1

Rep. 2

(1) a b ab c ac bc abc d ad bd abd cd acd bcd abcd

29.8 34.6 30.7 35.2 28.7 31.5 26.7 32.0 30.2 35.1 31.1 36.0 27.0 32.2 26.5 27.1

30.3 35.2 29.5 34.3 27.7 32.0 27.1 31.5 29.6 34.7 30.8 34.9 27.8 33.0 27.3 26.9

a) Use el procedimiento de Yates para obtener la tabla ANOVA completa de verificación de todos los efectos principales e interacciones. b) Forme la tabla ANOVA completa si los tres factores y las interacciones de orden alto se combinan en error. c) Forme la tabla ANOVA completa si se sabe a priori que las interacciones ABCD, ADB, BCD y CD son insignificantes. 35. Demuestre que en un diseño factorial 2k, con n = 1, el número máximo de interacciones que puede ponerse a prueba es 2k − k − 2. Sugerencia: Advierta que un modelo sin términos de interacción tiene 2k − k − 1 grados de libertad de error. Los grados de libertad de interacción se restan de los de error y se debe garantizar que el término resultante valga por lo menos 1.

EXPERIMENTOS FACTORIALES

619

36. ¿Cuántos términos de interacción se pueden probar a lo sumo en un experimento factorial 24, con n = 1? Sección 14.5

37. En cada una de las situaciones siguientes, enumere los efectos que se confunden con los bloques: a) Un experimento 23 con contraste definitorio AB b) Un experimento 23 con contrastes definitorios AB y ABC c) Un experimento 24 con contrastes definitorios ABCD, ABC y BCD 38. En cada caso del ejercicio 37, enumere los efectos principales que no puedan verificarse debido a la selección de los contrastes definitorios. 39. Considere un experimento factorial 24 con factores A, B, C y D. a) Use los contrastes definitorios AB y CD para demostrar que si el experimento se efectúa en cuatro bloques, las combinaciones de tratamiento siguientes se asignan a cada bloque: Bloque 1

(1) ab cd abcd

Bloque 2

Bloque 3

Bloque 4

a b acd bcd

c abc d abd

ac bc ad bd

b) ¿Qué es la interacción generalizada de este experimento? ¿Cuál bloque se llama bloque principal? c) En el supuesto de que todas las interacciones no confundidas son insignificantes, prepare la tabla ANOVA reducida (con fuente de variación y grados de libertad) para verificar los efectos principales. 40. Se pretende realizar un experimento factorial 24. Las instalaciones de laboratorio son tales que sólo pueden efectuarse ocho combinaciones de tratamiento en un solo laboratorio, por lo que el científico decide recurrir a dos laboratorios, con tratamiento de cada uno como bloque. Se usa la interacción ABCD como contraste definitorio y se obtienen los bloques y respuestas a combinación de tratamiento siguientes: Bloque 1

Bloque 2

(1) = 229.5 ab = 38.2 ac = 33.8 bc = 25.3 ad = 37.6 bd = 31.0 cd = 24.9 abcd = 34.1

a = 39.2 b = 32.1 c = 27.3 d = 31.4 abc = 35.7 abd = 38.9 acd = 35.9 bcd = 27.1

a) Prepare la tabla ANOVA mediante el cálculo directo de las sumas de los cuadrados y la combinación de las interacciones de tres factores en error.

620

PROBABILIDAD Y ESTADÍSTICA

b) Repita la tabla del inciso a, excepto que en este caso debe usar el procedimiento de Yates. c) Estime los efectos principales A, B, C y D. ¿Cuáles efectos son significativos, si acaso, con el nivel de significación de 5%? Sección 14.6

41. Considere el ejemplo 14.6.1. Indique el estimador del efecto B si se ejecutan las ocho combinaciones de tratamiento. Señale el estimador de dicho efecto en el supuesto de que sólo se emprendan las combinaciones de tratamiento del bloque 2. ¿Respecto de cuál efecto es alias el efecto B? 42. Se realiza una fracción 1/2 de un experimento factorial 25 y se obtienen las respuestas siguientes de las combinaciones de tratamiento respectivas del bloque principal: (1) = 31.3 ab = 10.8 ac = 5.4 ad = 59.4 ae = 18.2 bc = 6.0 bd = 23.2 be = 15.7

cd = 7.1 ce = 6.3 de = 5.6 abcd = 5.6 abce = 5.3 abde = 4.2 acde = 7.8 bcde = 7.2

a) Escriba la estructura de alias completa de los efectos principales e interacciones de dos factores. b) En el supuesto de que las interacciones sin confusión son insignificantes, verifique todos los efectos principales con nivel de significación de 5%. c) ¿Sería posible probar interacciones de dos factores en este ejemplo? ¿Por que sí o no? 43. Se emprende un experimento con seis factores A, B, C, D, E y F respecto de una cierta variable de respuesta. Dado el costo y magnitud del experimento, se decide usar sólo dos niveles de cada factor y llevarlo a cabo como un experimento factorial fraccionario 1/4. a) Construya los cuatro bloques con el uso de los contrastes definitorios ABDE y ABCF. b) Prepare una tabla ANOVA abreviada para probar todos los efectos principales e interacciones de dos factores. c) Indique la estructura de alias de todos los efectos principales. 44. Considere un experimento factorial 24 con factores A, B, C y D. a) ¿Cuántas combinaciones de tratamiento son necesarias en este experimento si se realiza como uno factorial completo con una sola repetición? b) Escriba una tabla ANOVA abreviada (sólo la fuente de variación y grados de libertad) relativa al inciso a. ¿Cuáles deben ser los supuestos de una prueba relativa al experimento de dicho inciso? c) Use como contrastes definitorios ABD y ABC para construir cuatro bloques incompletos de combinaciones de tratamiento de este experimento factorial 24. d ) Indique la estructura de alias completa del inciso c. e) Escriba una tabla ANOVA abreviada para probar los efectos principales en el inciso d, bajo el supuesto de que todas las interacciones sin confusión son insignificantes.

EXPERIMENTOS FACTORIALES

621

EJERCICIOS DE REPASO

45. Considere un experimento factorial 25. Use los contrastes definitorios ABCD y BCDE en la construcción de los cuatro bloques con la demostración de las combinaciones de tratamiento apropiadas en cada bloque. a) ¿Cuáles sumas de cuadrados de interacción se confunden con los bloques? b) En el supuesto de que todas las interacciones de tres, cuatro y cinco factores se combinan en error, prepare la tabla ANOVA para probar los efectos principales y los efectos de interacción de dos factores apropiados. c) ¿Puede efectuarse alguna comprobación de hipótesis sin agrupar las interacciones no confundidas en error? ¿Por que sí o no? 46. En un modelo de regresión, el número de grados de libertad de error es n − k − 1, donde k es el número de regresores del modelo y n es el de respuestas. a) Demuestre que el número de respuestas debe ser mayor que el de parámetros del modelo para realizar pruebas F de esos parámetros. b) ¿Es posible probar la interacción en un experimento factorial 22 con n = 1? Explique su respuesta. c) ¿Es posible probar todas las interacciones en un experimento factorial 23 con n = 1? Explique su respuesta. d ) ¿Es posible probar alguna interacción en un experimento factorial 23 con n = 1? e) ¿Cuántas interacciones es posible probar en un experimento factorial 23 con n = 1? 47. El modelo factorial 22 completo está dado por:

µY | x , x = β0 + β1 x1 + β2 x2 + β12 x1 x2 1

2

En la prueba de H0: β12 = 0, se usan los métodos de la sección 12.5. En particular, se intenta probar: H0: el modelo reducido es apropiado H1: el modelo completo es necesario a) b) c) d) e) f) g) h) i)

Escriba el modelo reducido cuando se intenta probar la interacción. Escriba la matriz de especificación del modelo reducido. Encuentre X'X en relación con el modelo reducido. Sea Y dividido de modo que las primeras n observaciones son respuestas a la combinación de tratamiento (1), seguidas de las respuestas a los tratamientos a, b y ab. Encuentre la expresión general de X'Y respecto del modelo reducido. Determine βˆ en relación con el modelo reducido. Encuentre SSR para el modelo reducido. Calcule SSEr y SSEf . Encuentre SSEr − SSEf . ¿Cuántos grados de libertad se relacionan con dicha estadística? (Véase sección 12.5.) Verifique que SSEr y SSEf = SSAB, con lo que justifica la prueba F descrita en esta sección.

622

PROBABILIDAD Y ESTADÍSTICA

48. Considere un experimento con tres factores, en el cual se supone que no existen interacciones tridireccionales. Sean a = 5, b = 4 y c = 3. a) Escriba el modelo de tal experimento. b) Encuentre la tabla ANOVA abreviada de este diseño. 49. Considere un experimento factorial 25 con factores A, B, C, D y E. a) En el supuesto de que se usa ABCDE como contraste definitorio, construya el bloque principal de una repetición 1/2. b) Prepare la tabla ANOVA abreviada (fuente de variación y grados de libertad) para verificar efectos principales después de agrupar todas las interacciones no confundidas en error. 50. Considere el ejemplo 14.6.2. Encuentre los alias de cada uno de los efectos siguientes: a) B; C; D. b) ¿Es posible verificar todos los efectos principales en este experimento? Explique su respuesta. c) Señale un ejemplo de dos contrastes definitorios que garantizarían la ausencia de alias de los efectos principales. 51. Se seleccionan aleatoriamente tres tratamientos de una población numerosa de posibles tratamientos. Luego, se obtienen 10 observaciones seleccionadas al azar de cada uno de esos tratamientos elegidos. a) Exprese una hipótesis nula apropiada para su verificación y enumere todos los supuestos necesarios para realizar dicha prueba del experimento descrito. b) Los datos llevan a la tabla del análisis de varianza parcial que sigue: ANOVA Fuente

DF

SS

Tratamiento Error

2 27

110.6

Total

29

608.3

MS

F

EMS

Complete la tabla ANOVA y pruebe la hipótesis nula mencionada en el inciso a con el nivel de significación 0.05. c) Estime las proporciones de la variabilidad total debidas a errores y tratamientos, respectivamente.

623

DATOS CATEGÓRICOS

CAPÍTULO

15

DATOS CATEGÓRICOS

E

ste capítulo se dedica al análisis de datos caracterizados por el hecho de que cada observación del conjunto de datos puede clasificarse de modo que corresponda con exactitud a una de varias “celdas” o categorías mutuamente excluyentes. El interés se centra en el número de observaciones de cada clase. El problema estadístico consiste en determinar si las frecuencias de clase observadas tienden a refutar una hipótesis dada. Interesan en particular tres problemas, a saber: 1. Verificar si un conjunto de observaciones se extrajo de una distribución de probabilidades especificada. 2. Realizar pruebas de independencia entre dos variables usadas para fines de clasificación. 3. Comparar proporciones. Los procedimientos estadísticos usados en gran parte del capítulo se basan en la distribución multinomial. El análisis parte de describir esa distribución.

15.1

DISTRIBUCIÓN MULTINOMIAL

En el desarrollo de la definición de una variable aleatoria multinomial, es necesario considerar primero la idea de un ensayo multinomial. Definición 15.1.1 (ensayo multinomial). Un ensayo multinomial con parámetros p1, p2, . . . , pk es un ensayo que puede llevar exactamente a uno de k resultados posibles. La probabilidad de que ocurra el resultado i en un ensayo dado es pi, con i = 1, 2, 3, . . . , k. 623

624

PROBABILIDAD Y ESTADÍSTICA

Advierta que, puesto que p1, p2, . . . , pk son probabilidades, cada una de ellas se sitúa entre 0 y 1, inclusive. Por añadidura, cada ensayo lleva a exactamente uno de k resultados posibles, de modo que la suma de esas probabilidades es 1. Ejemplo 15.1.1. Se observa que 1% de los artículos que salen de una línea de producción es defectuoso y no recuperable, 5% es defectuoso y recuperable, y el resto no tiene defectos. Se selecciona al azar y clasifica un artículo. Puesto que puede haber exactamente uno de tres resultados posibles, es posible visualizar este experimento como un ensayo multinomial único con parámetros p1 = 0.01, p2 = 0.05 y p3 = 0.94.

La variable aleatoria multinomial surge en forma más bien natural cuando se observa una serie de ensayos multinomiales independientes e idénticos. Esa variable se define como sigue.

Definición 15.1.2 (variable aleatoria multinomial). Se tiene un experimento que consiste en n ensayos multinomiales independientes e idénticos con parámetros p1, p2, . . . , pk. Sea que Xi denota el número de ensayos que llevan al resultado i, con i = 1, 2, . . . , k. El k-tuplo (X1, X2, . . . , Xk) se llama variable aleatoria multinomial y tiene parámetros n, p1, p2, . . . , pk.

Ejemplo 15.1.2. Se supone que se selecciona una muestra aleatoria de 100 unidades de la línea de montaje descrita en el ejemplo 15.1.1. Es posible visualizar este experimento como uno de n = 100 ensayos multinomiales independientes, cada uno con parámetros p1 = 0.01, p2 = 0.05 y p3 = 0.94. Sea que X1 denota el número de unidades defectuosas y no recuperables; X2, el de unidades defectuosas y recuperables, y X3, el de unidades no defectuosas. El triplete (X1, X2, X3) es una variable aleatoria multinomial con parámetros 100, 0.01, 0.05 y 0.94. Por ejemplo, si se observan dos unidades defectuosas que no se pueden recuperar, seis defectuosas y recuperables, y 92 no defectuosas, entonces la variable aleatoria multinomial (X1, X2, X3) asume el valor observado (2, 6, 92).

Aunque es relativamente fácil derivar la densidad de una variable aleatoria multinomial, resulta innecesario hacerlo aquí. No obstante, sí se requiere determinar el valor esperado de cada una de las variables aleatorias X1, X2, . . . , Xk, lo cual resulta sencillo. Considere un solo ensayo multinomial y cualquier resultado fijo i. Dicho ensayo lleva al resultado i o no. Si lo hace, se considera que el ensayo tiene éxito, y cualquier otro caso, que es un fracaso. La probabilidad de éxito es pi, la de que el resultado i se derive de un ensayo dado, mientras que la probabilidad de fracaso es 1 – pi. Ahora, considere una serie de n ensayos multinomiales independientes e idénticos. Sea que Xi denota el número de ensayos que producen el resultado i. Advierta que Xi también denota el número de éxitos en n ensayos independientes, cada uno con probabilidad de éxito pi. Por lo tanto, Xi es una variable aleatoria binomial con parámetros n y pi. Con base en el análisis del capítulo 3, se sabe que E[Xi] = npi para cada i. Este resultado tiene una función importante en el análisis de datos categóricos. Ejemplo 15.1.3. En una muestra aleatoria de 100 unidades seleccionadas de la línea de montaje descrita en el ejemplo 15.1.1, el número esperado de unidades que caen en cada categoría es:

DATOS CATEGÓRICOS

Número esperado de unidades defectuosas y no recuperables

= E[X1] = np1 = 100(0.01) = 1

Número esperado de unidades defectuosas y recuperables

= E[X2] = np2 = 100(0.05) = 5

625

Número esperado de unidades no defectuosas = E[X3] = np3 = 100(0.94) = 94 Cuando se completa el muestreo, se observa que x1 = 2, x2 = 6 y x3 = 92. Estos valores no coinciden exactamente con los valores esperados, pero no aparentan diferir drásticamente de ellos. Por esta razón, los valores no nos permiten sospechar la exactitud de las probabilidades de la categoría especificada de 0.01, 0.05 y 0.94, respectivamente.

El ejemplo anterior ilustra la idea básica del análisis de datos categóricos. En el análisis de los datos de conteo, se comparan las frecuencias de categoría observadas contra las esperadas bajo una hipótesis nula especificada. Si concuerdan satisfactoriamente, no se rechaza H0, y cuando existe discordancia sustantiva, sí se le rechaza. En las secciones siguientes, se efectúan las estadísticas necesarias para determinar cuándo las diferencias son extremas en grado suficiente para justificar el rechazo de la hipótesis expresada.

15.2 PRUEBAS DE BONDAD DE AJUSTE JI CUADRADA El propósito de las pruebas de bondad de ajuste ji cuadrada es verificar la hipótesis nula de que un conjunto dado de observaciones se extrae o se ajusta a una distribución de probabilidades especificada. Se considera una situación en la que la distribución hipotética se especifica por completo antes de emprender el muestreo. El procedimiento para el manejo de este caso se basa en el teorema siguiente, que se presenta sin comprobación. Teorema 15.2.1. Sea que (X1, X2, . . . , Xk) es una variable aleatoria multinomial con parámetros n, p1, p2, . . . , pk. Con valores altos de n, la variable aleatoria: ( X i − npi ) 2 npi i =1 tiene distribución ji cuadrada aproximada, con k − 1 grados de libertad. k



Dos cambios de notación facilitan recordar esta variable aleatoria. En el contexto multinomial, Xi es el número real u “observado” de ensayos que llevan al resultado i o caen en la categoría i, de modo que se denota Xi con Oi. Recuerde que npi es el número teórico esperado de ensayos que producen el resultado i y, de tal suerte, sea que npi = E[Xi] = Ei. Así pues, el teorema 15.2.1 expresa que la estadística: k (Oi − Ei )2 [( frecuencia observada ) − ( frecuencia esperada )]2 =∑ Ei frecuencia esperada i =1 i =1 k



tiene, con valores altos de n, distribución ji cuadrada aproximada con k − 1 grados de libertad, donde k es el número de categorías mutuamente excluyentes que participan. Ello hace surgir en forma natu-

626

PROBABILIDAD Y ESTADÍSTICA

ral la pregunta: “¿Qué significa ‘grandes’?” Son diversas las opiniones sobre la respuesta a esa pregunta. Sin embargo, de manera usual se considera que n debe ser suficientemente grande para que ninguna frecuencia esperada sea menor que 1 y no más de 20% de las frecuencias esperadas sea menor que 5. Si no se satisface esta condición, se deben combinar o redefinir las categorías, o ha de aumentarse el tamaño de la muestra, de modo que las frecuencias esperadas tengan el tamaño adecuado. Esta variable aleatoria sirve en forma más bien lógica como estadística de prueba para verificar una hipótesis nula de que un conjunto dado de observaciones se extrae de una distribución de probabilidades especificada. Si H0 es verdadera, el valor de pi se conoce para cada i y, por ende, es fácil calcular Ei. De hecho, con esa estadística se compara el número real de observaciones por categoría contra el número esperado bajo la hipótesis nula. Si esas cifras concuerdan en forma razonablemente satisfactoria (existe buen ajuste), entonces el término (Oi − Ei)2 tiene valor bajo para cada i, Σik= 1[(Oi − Ei )2 ]/Ei también presenta valor bajo y no debe rechazarse tal hipótesis. En el caso de que las frecuencias observada y esperada difieran considerablemente, (Oi − Ei)2 tiene valor alto en relación con alguna i, es alto el valor de Σik= 1[(Oi − Ei )2 ]/Ei y ha de rechazarse H0. El uso de esta estadística de prueba se ilustra en el ejemplo siguiente. Ejemplo 15.2.1. Los sistemas de cómputo se colapsan por muchas razones, entre ellas las fallas de hardware o software, errores del operador y sobrecargas del sistema mismo. Se piensa que 10% de los colapsos se debe a fallas de software; 5%, a fallas de hardware; 25%, a errores del operador; 40%, a sobrecargas del sistema, y el resto, a otras causas. Se observan 150 colapsos de computadora durante un periodo de estudio prolongado y cada una se clasifica según su causa probable. Se determina que 13 resultan de fallas de software; 10, de fallas de hardware; 42, de errores del operador; 65, de sobrecargas del sistema, y el resto, de otras causas. ¿Estos datos llevan a poner en tela de juicio la exactitud de los porcentajes antes mencionados? A fin de responder la pregunta, se intenta verificar:

H0 : p1 = 0.10, p2 = 0.05, p3 = 0.25, p4 = 0.40, p5 = 0.20 H1 : pi no es como se expresó, para alguna i = 1, 2, 3, 4, 5 Si H0 es verdadera, entonces: E[ X1 ] = E1 = np1 = 150(0.10) = 15 E[ X 2 ] = E2 = np2 = 150(0.05) = 7.5 E[ X 3 ] = E3 = np3 = 150(0.25) = 37.5 E[ X 4 ] = E4 = np4 = 150(0.40) = 60 E[ X 5 ] = E5 = np5 = 150(0.20) = 30 La situación se resume en la tabla 15.1. Advierta que las frecuencias esperada y observada no concuerdan con exactitud. La pregunta que debe responderse es: “¿Difieren en grado suficiente para llevar al rechazo de H0?” Puesto que Ei > 5 en cada caso, la estadística de prueba: (Oi − Ei ) 2 Ei i =1 5



Tiene distribución X2k − 1 = X24 aproximada. El valor observado de dicha estadística es: (13 − 15) 2 (10 − 7.5) 2 ( 42 − 37.5) 2 (65 − 60) 2 ( 20 − 30) 2 + + + + = 5.39 15 7.5 37.5 60 30

DATOS CATEGÓRICOS

627

TABLA 15.1

Categoría Frecuencia observada, Oi Frecuencia esperada, Ei

Falla de software 1

Falla de hardware 2

Error del operador 3

Sobrecargas del sistema 4

Otras causas 5

13 15

10 7.5

42 37.5

65 60

20 30

¿Es ese valor suficientemente alto para causar el rechazo de la hipótesis nula? Con base en la tabla IV del apéndice A, puede verse que la probabilidad de observar un valor de 5.39 o mayor es 0.25. En otras palabras, si se rechaza H0, es el valor P de la prueba de 0.25. Ya que se trata de una probabilidad alta, no se rechaza la hipótesis nula. Los datos recopilados son insuficientes para llegar a la conclusión de que los porcentajes expresados son incorrectos.

15.3 PRUEBAS DE INDEPENDENCIA En esta sección, se analiza un problema relacionado con datos categóricos hasta cierto punto distinto del estudiado en la sección precedente. Sin embargo, la idea subyacente al procedimiento de prueba usado es idéntica a la del estudiado con antelación. Se trata de una estadística de prueba con la que se comparan las frecuencias de categorías observadas contra las esperadas, en el supuesto de que la hipótesis nula especificada es verdadera; se rechaza en caso de que esas frecuencias difieran excesivamente para haber ocurrido al azar. Aquí, se consideran experimentos de dos variables aleatorias. El propósito del estudio es verificar la independencia de esas variables. Por ejemplo, un ingeniero de caminos podría estar interesado en indagar si la magnitud de las lesiones es independiente del tipo de dispositivo de seguridad que usan las víctimas de accidentes; un fabricante podría estarlo en si la calidad de un artículo producido es independiente del día de la semana en que se produce, y un investigador de cáncer podría estarlo en averiguar si la aparición de cáncer pulmonar es independiente de la exposición a asbesto en la atmósfera. La prueba de independencia se ilustra en el contexto de las llamadas tablas de contingencia 2 × 2. Son tablas que surgen en experimentos donde las dos variables aleatorias consideradas se estudian en dos niveles. Ello define de manera natural cuatro (2 × 2) categorías o “celdas” mutuamente excluyentes. El análisis de datos se basa en el examen del número de observaciones que cae en cada celda. Ejemplo 15.3.1. Un investigador de cáncer emprende lo que se llama un estudio prospectivo al seleccionar aleatoriamente a un grupo numeroso de individuos y luego vigilar su evolución durante un largo periodo. Al final de este último, se clasifica a cada persona según tenga cáncer pulmonar o no y si estuvo expuesto a una fuente de asbesto identificable o no. Sea que C denota la presencia de cáncer pulmonar, y A, el hecho de que el individuo tuvo exposición a asbesto. Resultan las cuatro categorías mutuamente excluyentes que siguen: C ∩ A: presencia de cáncer y exposición a asbesto C ∩ A': presencia de cáncer sin exposición a asbesto C' ∩ A: ausencia de cáncer con exposición a asbesto C' ∩ A': ausencia de cáncer sin exposición a asbesto Cada individuo del estudio cae exactamente en una de esas celdas.

628

PROBABILIDAD Y ESTADÍSTICA

Interesa el número de observaciones correspondiente a cada celda, por lo que se necesita una convención de notación para las frecuencias de celdas. También se requiere dicha convención para indicar el número de observaciones que caen en cada nivel de cada una de las dos variables de clasificación. Se usa la convención siguiente: n11 = número de observaciones que cae en la celda que forman la fila 1 y columna 1 n12 = número de observaciones que cae en la celda que forman la fila 1 y columna 2 n21 = número de observaciones que cae en la celda que forman la fila 2 y columna 1 n22 = número de observaciones que cae en la celda que forman la fila 2 y columna 2 n1. = n11 + n12 = número de observaciones de la fila 1 n2. = n21 + n22 = número de observaciones de la fila 2 n.1 = n11 + n21 = número de observaciones de la columna 1 n.2 = n12 + n22 = número de observaciones de la columna 2 n = número total de observaciones Esta convención de notación se ilustra en el ejemplo 15.3.2. Ejemplo 15.3.2. La realización del estudio del ejemplo 15.3.1 revela que 50 de 5 000 participantes sufre cáncer pulmonar. De ellos, 10 tuvieron exposición a una fuente identificable de asbesto. En total, 500 personas del estudio estuvieron expuestas a una fuente de ese tipo. Estos datos se resumen en la tabla 15.2. Advierta que n.1 y n.2 son los totales de columnas que aparecen en los márgenes de la tabla 2 × 2. Se los llama totales de columna marginales. De igual forma, n1. y n2. son totales de fila marginales.

La hipótesis nula general que se verifica mediante una tabla de contingencia es la de “ausencia de relación” entre las dos variables de clasificación, y la hipótesis alterna, la existencia de tal relación. Las tablas estudiadas en esta sección se caracterizan por el hecho de que el investigador sólo fija el tamaño muestral global n. Hasta antes de la recopilación de datos, todos los demás componentes, incluidos los totales marginales de fila y columna, son libres de variar. En este tipo de estudio, la hipótesis nula de “ausencia de relación” equivale a la hipótesis nula de independencia. A fin de desarrollar la prueba general, sea que A y B denotan las variables de clasificación. Se pretende verificar: TABLA 15.2 A C C'

A'

10 = n11 490 = n21

40 = n12 4 460 = n22

50 = n1. 4 950 = n2.

500 = n.1

4 500 = n.2

5 000 = n

DATOS CATEGÓRICOS

629

H0: A y B son independientes H1: A y B no son independientes Si la hipótesis nula es verdadera, el conocimiento del nivel de clasificación de un objeto en relación con su característica A no afecta su nivel relativo a la característica B. En la expresión matemática de esta idea, se usa la tabla de probabilidades 15.3. Advierta que p11 denota la probabilidad de que el objeto seleccionado aleatoriamente tenga las características A y B, p1. denotan la probabilidad que tiene la característica A y p.1 la de que posea la característica B. Recuerde que A y B son independientes si y sólo si:

P[ A ∩ B ] = P[ A] ⋅ P[ B ] Así pues, la hipótesis nula de que A y B son independientes puede expresarse como: H 0 : p11 = p1 . p. 1 Ello implica que pij = pi.p.j , con i = 1, 2 y j = 1, 2. En otras palabras, A y B son independientes si y sólo si la probabilidad de cualquier celda puede calcularse al multiplicar las probabilidades de fila y columna respectivas. Puesto que en una tabla 2 × 2 cada observación corresponde exactamente a una de cuatro categorías mutuamente excluyentes, una muestra aleatoria de tamaño n puede considerarse como formada por una serie de n ensayos multinomiales independientes, cada uno con parámetros p11, p12, p21 y p22. Así pues, el conjunto (n11, n12, n21 y n22) de frecuencias de celdas observadas es una variable aleatoria multinomial con parámetros n, p11, p12, p21 y p22. De tal suerte, las frecuencias de celdas esperadas están dadas por: Eij = npij

donde pij es la probabilidad de que una observación corresponda a la (ij) celda y n es el tamaño muestral. Se desconocen esas probabilidades y hay que estimarlas a partir de los datos, bajo el supuesto de que la hipótesis nula es verdadera. ¿Cómo lograrlo? ¡De manera muy sencilla! Por ejemplo, note que si H0 es verdadera y las características A y B son independientes, entonces: p11 = p1. p.1 Puesto que p1. es la probabilidad de que una observación corresponda a la fila 1, es lógico estimarla mediante: pˆ1. = TABLA 15.3

A A'

B

B'

p11 p21

p12 p22

p1 . p2 .

p.1

p.2

1

número de elementos en la fila 1 n1. = n tamaño muestral

630

PROBABILIDAD Y ESTADÍSTICA

De manera similar, p.1 es la probabilidad de que una observación corresponda a la columna 1, por lo que se estima mediante: pˆ.1 =

número de elementos de la columna 1 n.1 = n n

De tal suerte: pˆ11 = pˆ1 . pˆ .1 =

n1 . n.1 n n

Ello implica a su vez que:

n . n. Eˆ11 = pˆ11n = 1 1 n n n n1.n.1 (total de fila marginal)(total de columna marginal) = = n tamaño muestral Un argumento similar es válido para las expectaciones de las otras celdas. Así pues, se llega a la conclusión de que para cada i y j se tiene:

n .n. (total de fila marginal)(total de columna marginal) Eˆ ij = i j = tamaño muestral n Recuerde que en el caso de muestras grandes: 2 2 (n − E ˆ ij )2 (Oij − Eˆ ij )2 ij =∑∑ Eˆ ij Eˆ ij i =1 j =1 i =1 j =1 2

2

∑∑

tiene distribución ji cuadrada aproximada. El número de grados de libertad es k − 1 − m, donde m es el número de parámetros estimados a partir de los datos usados en el cálculo de las frecuencias de celdas esperadas. Advierta que en realidad se estiman sólo p1. y p.1 a partir de los datos, ya que p.2 = 1 – p.1 y p2. = 1 – p1. Así pues, el número de grados de libertad relacionado con la estadística de prueba es:

k −1 − m = 4 −1 − 2 = 1 En este caso, satisfacer la regla de que ninguna frecuencia esperada debe ser menor que la unidad y que no más de 20% debe ser menor que 5 requiere, de hecho, que no haya frecuencias esperadas menores que 5. Si no se satisface esta regla, los datos deben analizarse con el procedimiento llamado prueba exacta de Fisher [6]. En término siguiente, se completa el análisis de los datos del ejemplo 15.3.2. Ejemplo 15.3.3. Se pretende investigar si existe evidencia de que el surgimiento de cáncer pulmonar (C) no es independiente de la exposición de la persona al asbesto (A). Se ponen a prueba: H0: C y A son independientes H1: C y A no son independientes El uso de los datos de la tabla 15.2 permite ver que las frecuencias de celdas esperadas con H0 están dadas por:

DATOS CATEGÓRICOS

631

n .n. 50(500) =5 Eˆ11 = 1 1 = 5 000 n 50(4 500) n .n. = 45 Eˆ12 = 1 2 = 5 000 n 4 950(500) n .n. = 495 Eˆ 21 = 2 1 = 5 000 n 4 950(4 500) n .n. = 4 455 Eˆ 22 = 2 2 = 5 000 n La situación se resume en la tabla 15.4. Observe que existen ciertas diferencias entre lo esperado si la hipótesis nula es verdadera, que se indica entre paréntesis, y las observaciones reales. ¿Son esas diferencias muy grandes para haber ocurrido estrictamente al azar? Advierta que ninguna frecuencia de celda esperada es menor que 5, como se requiere. El valor observado de la estadística de prueba está dado por: 2

2

∑∑ i=1 j =1

(nij − Eˆ ij ) 2 (10 − 5) 2 (40 − 45) 2 (490 − 495) 2 = + + 5 45 495 Eˆ ij +

(4 460 − 4 455) 2 4 455

= 5.61

El número de grados de libertad relacionado con esta estadística ji cuadrada es 1. Puesto que χ 02.01 = 6.63 y χ 02.025 = 5.02, el valor P de la prueba se sitúa entre 0.01 y 0.025. Se trata de probabilidades bajas, por lo que se rechaza la hipótesis nula y se llega a la conclusión de que el surgimiento de cáncer pulmonar se relaciona con la exposición a asbesto atmosférico. El estudio de la tabla 15.4 revela que el número de tumores observados en las personas expuestas a asbesto es mayor que el esperado a falta de tal exposición.

Prueba de independencia r × c En párrafos anteriores, se ilustra la prueba de independencia cuando cada variable se estudia en dos niveles, lo que lleva a una tabla de contingencia 2 × 2. En general, puede estudiarse una variable en r niveles, y la otra, en c niveles, con lo que se obtiene la llamada tabla de contingencia r × c. La distribución de los datos y las probabilidades relacionadas se muestran en las partes a y b de la tabla 15.5, respectivamente. La hipótesis nula de independencia se expresa matemáticamente como: H0: pij = pi . p. j

i = 1, 2, 3, . . . , r j = 1, 2, 3, . . . , c

TABLA 15.4 A C

A'

10

40 (5)

C'

490

50 (45)

4 460 (495) 500

4 950 (4 455) 4 500

5 000

632

PROBABILIDAD Y ESTADÍSTICA

TABLA 15.5a

Variable B Variable A

1

2

3

···

c

1 2 3

n11 n21 n31

n12 n22 n32

n13 n23 n33

··· ··· ···

n1c n2c n3c

n1. n2. n3.

r

nr1

nr2

nr3

···

nrc

nr.

n.1

n.2

n.3

···

n.c

n

TABLA 15.5b

Variable B Variable A

1

2

3

···

c

1 2 3

p11 p21 p31

p12 p22 p32

p13 p23 p33

··· ··· ···

p1c p2c p3c

p1. p2. p3.

r

pr1

pr2

pr3

···

prc

pr.

p.1

p.2

p.3

p.c

1

La hipótesis alterna es que pij ≠ pi.p.j al menos para una i y una j. La estadística de prueba es: Estadística de prueba de H0: no existe relación entre las variables A y B ( nij − Eˆ ij )2 ∑∑ ˆ E i =1 j =1 r

c

ij

(total de fila marginal)(total de columna marginal) donde Eˆ ij = tamaño muestral

La única pregunta que queda por responder es: “¿Cuántos grados de libertad se relacionan con esta estadística de prueba?” Deben estimarse las r − 1 probabilidades p1., p2., . . . , p(r – 1). y las c − 1 probabilidades p.1, p.2, . . . , p.(c – 1) a partir de los datos para calcular las frecuencias de celda esperadas. Recuerde que el número de grados de libertad está dado por k − 1 − m, donde k es el número de celdas de la tabla y m es el número de parámetros estimados a partir de los datos que se usan para calcular las frecuencias esperadas. En este caso, el número de grados de libertad es:

k − 1 − m = rc − 1 − ( r − 1 + c − 1) = rc − r − c + 1 = ( r − 1)(c − 1) Esas ideas se ilustran en el ejemplo siguiente.

DATOS CATEGÓRICOS

633

TABLA 15.6 Tipo de dispositivo Gravedad de la lesión

Solo cinturón de seguridad

Cinturón de seguridad con arnés

Ninguno

Ninguna Leve Grave Muerte

75 160 100 15

60 115 65 10

65 175 135 25

350

(70.0) (157.5) (105.0) (17.5)

250

(50.0) (112.5) (75.0) (12.5)

400

(80.0) (180.0) (120.0) (20.0)

200 450 300 50 1 000

Ejemplo 15.3.4. Se selecciona una muestra aleatoria de 1 000 accidentes de los registros para tratar de convencer al público de que use el equipo de seguridad en los automóviles. Cada accidente se clasifica según el tipo de dispositivo de seguridad que usaban los ocupantes del vehículo y la gravedad de las lesiones sufridas. Resultan los datos que aparecen en la tabla 15.6. Las frecuencias de celda esperadas aparecen entre paréntesis. ¿Indican una relación entre el tipo de dispositivo utilizado y la magnitud de la lesión? El valor observado de la estadística X2( r − 1)( c − 1) = X3.22 = X26 es:

(75 − 70) 2 (60 − 50) 2 (65 − 80) 2 . . . (25 − 20) 2 + + + + = 10.96 70 50 80 20 La probabilidad de observar un valor de 10.96 o mayor se encuentra entre 0.05 ( χ 02.95 = 12.6) y 0.1( χ 02.90 = 10.6). En otras palabras, el valor P de la prueba está entre 0.05 y 0.1. Puesto que esa probabilidad es relativamente baja, se rechaza la hipótesis nula y se llega a la conclusión de que la magnitud de las lesiones en los ocupantes de los vehículos no es independiente del tipo de equipo de seguridad usado en el momento del accidente.

Tenga en cuenta el hecho de que se realiza una prueba de independencia sólo cuando el experimentador fija el tamaño muestral y el resto de los elementos de la tabla de contingencia pueden variar libremente. Otros tipos de pruebas se consideran en la sección que sigue.

15.4

COMPARACIÓN DE PROPORCIONES

En esta sección, se considera el uso de la estadística ji cuadrada en la comparación de proporciones. Una vez más, se parte de describir un experimento que lleva a una tabla 2 × 2. El ejemplo siguiente muestra una diferencia importante entre los problemas estudiados en esta sección y los considerados con anterioridad. Ejemplo 15.4.1. Un gran número de personas que viven en una comunidad específica han estado expuestas por más de 10 años a la radiactividad de un depósito de desechos atómicos. Se emprende un estudio para investigar si dicha exposición se relaciona con el surgimiento de una enfermedad sanguínea específica. En la realización del experimento, se seleccionan muestras aleatorias de 300 personas de la comunidad que han estado expuestas a ese riesgo y 320 individuos sin dicha exposición. Cada sujeto es evaluado en cuanto a si padece la enfermedad sanguínea o no. El experimento genera una tabla de la forma que se ilustra en la tabla 15.7. Note que, si bien esta tabla 2 × 2 tiene exactamente el mismo aspecto que las ya estudiadas, existe una diferencia. En particular, los totales de fila marginales están fijos en 300 y 320 antes de realizar el estudio de

634

PROBABILIDAD Y ESTADÍSTICA

TABLA 15.7

E (expuestos) E' (no expuestos)

D (sufren la enfermedad)

D' (no sufren la enfermedad)

n11 n21

n12 n22

n1. = 300 (fijo) n2. = 320 (fijo)

n.1

n.2

n = 620 (fijo)

TABLA 15.8

A A'

B

B'

p11 p21

p12 = 1 – p11 p22 = 1 – p21

1 (fijo) 1 (fijo)

campo. En otras palabras, el experimentador predetermina esos totales marginales y el tamaño muestral global. Todos los demás elementos de la tabla pueden variar libremente.

En experimentos como éste, donde el investigador fija los totales de fila o columna, mas no ambos, la hipótesis nula de “ausencia de relación” se expresa como proporción. Con el fin de explicar la forma de hacerlo, sea que A y B denotan las variables de clasificación y suponga que los totales marginales de los niveles de A están fijos. Así pues, en lo fundamental se tienen dos muestras aleatorias independientes, una de la población de objetos con el rasgo A y la otra de la población de objetos sin dicho rasgo. Interesa probar: H0: proporción de objetos con el rasgo B entre los que tienen el rasgo A = proporción de objetos con el rasgo B entre los que carecen del rasgo A Ello implica que la característica B no es más prevaleciente entre los objetos con la característica A que entre los objetos que carecen de ella. Así pues, no existe una relación evidente entre A y B. En lo relativo al ejemplo, se pretende verificar: H0: proporción de personas con la enfermedad sanguínea entre las expuestas al factor de riesgo = proporción de individuos con el padecimiento sanguíneo entre los no expuestos al factor de riesgo En otras palabras, no existe relación evidente de la enfermedad sanguínea con la exposición al material de desecho riesgoso. La hipótesis nula puede expresarse matemáticamente con ayuda de la tabla 15.8. Puesto que p11 denota la proporción de objetos con el rasgo B entre los que poseen el rasgo A, y p21, la de objetos con el rasgo B entre los que carecen del rasgo A, se intenta verificar: H0: p11 = p21

DATOS CATEGÓRICOS

635

Advierta que p12 = 1 – p11 y p22 = 1 – p21, por lo que también se pone a prueba p12 = p22. Es conveniente expresar la hipótesis nula como: H0: p1j = p2j

con j = 1, 2

Se habla de una prueba de homogeneidad cuando la hipótesis nula se expresa de esa manera. A fin de entender la lógica subyacente a esa prueba, es necesario ver más de cerca la estructura de una tabla 2 × 2 con totales de fila marginales fijos. En especial, tome nota de que es posible considerar los datos de la fila 1 como una muestra aleatoria de tamaño n1. extraída de una distribución binomial con probabilidad de éxito p11. En este caso, el éxito consiste en identificar un objeto con el rasgo B. De manera similar, los datos de la fila 2 constituyen una muestra aleatoria de tamaño n2. derivada de una distribución binomial con parámetro p21. Así pues, cuando se pone a prueba: H0: p11 = p21 en realidad se comparan dos proporciones poblacionales, como en el capítulo 9. De hecho, ¡la estadística de prueba desarrollada aquí es simplemente la estadística Z antes usada, elevada al cuadrado! Importa destacar aquí que el número de objetos de cada grupo con el rasgo B es de distribución binomial, por lo que se tiene: E11 = n1.p11 E21 = n2.p21

y

Así pues, la estimación de E11 y E21 a partir de la tabla de contingencia sólo requiere encontrar una forma lógica de calcular p11 y p21, lo cual es fácil de lograr. Advierta que cuando H0 es verdadera, p11 = p21. Esta proporción poblacional común se denota con p. Por añadidura, si la proporción de objetos con el rasgo B es la misma en ambas poblaciones, entonces la proporción de objetos global en las dos poblaciones combinadas también es p. Un estimador lógico de la proporción global de objetos con el rasgo B es: pˆ =

número de objetos de la columna 1 n.1 = tamaño de la muestra global n

Se supone que p11 = p21 = p, por lo que también es posible usar pˆ como estimador de p11 y p21. Luego de sustituir, puede verse que las estimaciones de las frecuencias de celda con la hipótesis nula son:

n. Eˆ11 = n1 . pˆ11 = n1 . 1 n (total de fila marginal)(total de columna marginal) = tamaño muestral n. Eˆ 21 = n2 . pˆ 21 = n2 . 1 n (total de fila marginal)(total de columna marginal) = tamaño muestral

636

PROBABILIDAD Y ESTADÍSTICA

TABLA 15.9

E (expuestos)

D (tienen el trastorno)

D' (no tienen el trastorno)

52

248

300

(48.39) E' (no expuestos)

48

(251.61) 272

320

(51.61) 100

(268.39) 520

620

Se deja de tarea al lector verificar que: n .n. Eˆ12 = 1 2 n

y

n .n. Eˆ 22 = 2 2 n

Esas expectativas son precisamente las que se usan en las pruebas de independencia. A partir de este punto, las pruebas de homogeneidad e independencia son idénticas. La idea se ilustra con la reconsideración del experimento descrito en el ejemplo 15.4.1. Ejemplo 15.4.2. Los datos de la tabla 15.9 resultan de la ejecución del experimento del ejemplo 15.4.1. Las frecuencias de celda esperadas se muestran entre paréntesis. El valor observado de la estadística X12 es:

(52 − 48.39) 2 (248 − 251.61) 2 (48 − 51.61) 2 (272 − 268.39) 2 + + + = 0.62 48.39 251.61 51.61 268.39 2 = 1.32). Así pues, los datos no Este valor no es significativo, ni siquiera con el nivel α = 0.25 ( χ 0.25 permiten llegar a la conclusión de que existe relación entre la enfermedad sanguínea y la exposición a la fuente de radiactividad.

Prueba de homogeneidad r × c Al igual que en la prueba de independencia, es posible verificar la homogeneidad mediante una tabla r × c. En este caso, se trata de dos variables, una de las cuales se estudia en r niveles, y la otra, en c niveles. El investigador fija los totales marginales exactamente de una de esas variables antes de la recopilación de datos. A manera de ilustración de la idea, considere el ejemplo 15.4.3. Ejemplo 15.4.3. Se pretende realizar un estudio para considerar la relación entre los valores atmosféricos de dióxido de azufre (SO2 ) y la media del número de cloroplastos por célula en las hojas de árboles del área. Se seleccionan para estudio tres regiones. Se sabe que una de ellas tiene concentración alta de SO2; otra, valores normales de la sustancia, y la tercera, niveles bajos de SO2. Se seleccionan aleatoriamente 23 árboles de cada área y se determina la media del número de cloroplastos por célula en las hojas de cada árbol. Sobre dicha base, se clasifica cada árbol como de cuentas baja, normal o alta

DATOS CATEGÓRICOS

637

TABLA 15.10 Número de cloroplastos Nivel de SO2

Alto

Normal

Bajo

Alto Normal Bajo

n11 n21 n31

n12 n22 n32

n13 n23 n33

n.1

n.2

n.3

n1. = 20 (fijo) n2. = 20 (fijo) n3. = 20 (fijo) n

TABLA 15.11 Variable B Variable A

1

2

3

···

c

1 2 3 ... r

p11 p21 p31 ... pr1

p12 p22 p32 ... pr2

p13 p23 p33 ... pr3

··· ··· ···

p1c p2c p3c ... prc

···

1 1 1 ... 1

de cloroplastos. El experimento genera una tabla con la forma de la tabla 15.10. Note que la fijación de los totales de fila antes del experimento entraña, en lo fundamental, que se seleccionan tres muestras aleatorias independientes. Se obtienen de las poblaciones de árboles expuestos a concentraciones altas, normales y bajas de SO2.

Permítase suponer que los totales de fila están fijos para expresar la hipótesis nula de “ausencia de relación” cuando un conjunto de totales marginales está fijo en una tabla r × c. Considere las probabilidades que se muestran en la tabla 15.11. Note que pij denota la proporción de objetos del i-ésimo nivel relativa a la variable A que están en el j-ésimo nivel de la variable B. La hipótesis nula de ausencia de relación expresa, en lo esencial, que ninguna categoría de fila es más prevaleciente que cualquier otra en cada columna. La hipótesis alterna es que no ocurre tal en algunas columnas. En lo estadístico, esa hipótesis nula asume la forma: H0 : p1 j = p2 j = p3 j = . . . = prj

j = 1, 2, 3, . . . , c

Puede conceptuarse esa hipótesis nula como una prueba para verificar si r poblaciones multinomiales son idénticas o no. A manera de ilustración, en el último ejemplo se pone a prueba la hipótesis nula de ausencia de relación entre el número de cloroplastos y el nivel de exposición al SO2. Interesa averiguar si la proporción de árboles con cada nivel de cloroplastos es idéntica sin importar los valores de SO2 a los cuales están expuestos los árboles. La hipótesis nula de homogeneidad se verifica exactamente de la misma manera que la hipótesis nula de independencia.

638

PROBABILIDAD Y ESTADÍSTICA

TABLA 15.12 Número de cloroplastos Nivel de SO2

Alto

Alto

3

Normal 4

(5) Normal

5

13 (8.33)

10 (5)

Bajo

7 15

20 (6.67)

5 (8.33)

11 (5)

Bajo

20 (6.67)

2 (8.33)

25

20 (6.67)

20

60

Ejemplo 15.4.4. Se obtienen los datos de la tabla 15.12 cuando se realiza el estudio descrito en el ejemplo 15.4.3. Una vez más, las frecuencias de celda esperadas aparecen entre paréntesis. El valor observado de la estadística X2( r − 1)( c − 1) = X24 es:

(3 − 5) 2 (4 − 8.33) 2 . . . (2 − 6.67) 2 + + + = 14.74 5 8.33 6.67 2 2 = 13.3 y χ 0.005 = 14.9, es posible rechazar H0 con 0.005 < P < 0.01. Se tienen datos conPuesto que χ 0.01 cluyentes de la relación de los valores de SO2 en el área con la media de cloroplastos en las células de las hojas de los árboles. A fin de apreciar más claramente esa relación, tome nota de que la proporción de árboles con cuentas bajas de cloroplastos debe ser la misma en cada una de las tres regiones, a falta de la relación mencionada. Sin embargo, es fácil advertir que no ocurre así. Con base en los datos de la tabla 15.12, las proporciones estimadas de árboles con cuenta baja de cloroplastos son 13/20 = 0.65, 5/20 = 0.25 y 2/20 = 0.10, respectivamente. Esas proporciones hacen suponer que los valores altos de SO2 tienden a suprimir la formación de cloroplastos.

Comparación de proporciones con datos por pares: prueba de McNemar Antes de terminar el análisis de los datos categóricos, se estudia un tipo adicional de problema. Advierta que hasta este punto ha interesado la comparación de proporciones basadas en muestras independientes, extraídas de dos o más poblaciones. En ocasiones, es necesario contrastar dos proporciones si las muestras extraídas no son independientes. De ser así, resultan inaplicables los métodos estudiados hasta este punto de la sección o en el capítulo 9. Sin embargo, es posible usar un método de comparación basado en una estadística ji cuadrada, llamado prueba de McNemar, que se ilustra a continuación. Ejemplo 15.4.5. Un problema que interesa a los ingenieros industriales es el almacenamiento rentable de pequeños artículos que se distribuyen en cantidades menores que un lote de caja. Se estudian dos formas de almacenamiento. La primera, llamada ubicación alfanumérica, consiste en almacenarlos en orden alfanumérico estricto. La segunda, denominada del factor de densidad de selección (SDF, selection density factor), usa un factor numérico calculado para cada artículo en existencia, a fin de determinar su posición relativa a la estación de trabajo del distribuidor. Se pretende investigar cuál de los dos sistemas

DATOS CATEGÓRICOS

639

TABLA 15.13 Alfanumérica SDF

Menos de 10 pies

10 pies o más

Menos de 10 pies 10 pies o más

4 2*

33* 61

37 63

6

94

100

origina que la misma proporción de artículos esté a no más de 10 pies de la estación de trabajo. A fin de decidir, se clasifican primeramente 100 artículos por ubicación alfanumérica y luego con el factor de densidad de selección. Aunque se tienen muestras de 100 observaciones de cada población, las muestras no son independientes, sino que están por pares. Se registran los datos obtenidos con el formato que se ilustra en la tabla 15.13. Advierta que si acaso existe una diferencia entre las proporciones de objetos colocados cuando mucho a 10 pies de la estación de trabajo con los dos sistemas, esa diferencia se refleja en las celdas en las que los métodos no concuerdan sobre la ubicación de un artículo. Así pues, sólo interesan las celdas de la tabla 15.13 marcadas con el asterisco. En total, se tienen 35 observaciones en esas dos celdas. Si con ambos sistemas se coloca la misma proporción de objetos a no más de 10 pies de la estación de trabajo, se espera que la mitad (17.5) de esas observaciones caiga en cada una de las dos celdas. Al igual que antes, en este punto se comparan las frecuencias de celdas observadas contra las esperadas, bajo el supuesto de que las proporciones son las mismas con una estadística ji cuadrada que tiene 1 grado de libertad. En relación con los datos, se obtiene:

( 2 − 17.5) 2 (33 − 17.5) 2 + = 27.46 17.5 17.5 Puede rechazarse la hipótesis nula, ya que este valor es significativo inclusive con el nivel α = 0.005 2 ( χ 0.005 = 7.88). Se tienen datos de que las dos proporciones son diferentes. El análisis de la tabla 15.13 muestra que el método del factor de densidad de selección tiende a colocar una proporción más alta de objetos que el procedimiento alfanumérico.

En este capítulo, se estudian algunas de las pruebas de uso más frecuente con datos de naturaleza categórica. Debe mencionarse que es abundante la literatura sobre el análisis de datos categóricos. Se pide al lector interesado en ahondar en el tema que consulte [6] y [15].

RESUMEN DEL CAPÍTULO En este capítulo se estudian problemas de datos categóricos. Estos datos se caracterizan por el hecho de que cada observación puede clasificarse como correspondiente exactamente a una de varias categorías o celdas, que se excluyen mutuamente. Todos los procedimientos estudiados incluyen la comparación del número real de observaciones de una celda contra el esperado si fuera verdadera una hipótesis nula especificada. Se rechaza H0 si las diferencias observadas son demasiado grandes para haber ocurrido al azar. La teoría subyacente a la estadística de prueba usada se basa en la distribución multinomial. Por ello, se inicia el estudio de los datos categóricos con la consideración de esta importante distribución de variables múltiples.

640

PROBABILIDAD Y ESTADÍSTICA

En primer término, se estudia la forma de verificar si el conjunto de datos se extrajo de una distribución específica. Luego, se consideran experimentos de dos variables aleatorias. El propósito del estudio es comprobar si esas variables aleatorias son independientes. Se examinan tablas 2 × 2, en las cuales cada variable se estudia en dos niveles de clasificación con ciertos detalles. Más adelante, se amplían las ideas presentadas a modo de incluir las tablas r × c. En las pruebas de independencia, se observa que el único elemento fijo en la tabla de contingencia es n, el tamaño muestral global. Todos los demás elementos son variables aleatorias. Las hipótesis alterna y nula asumen las formas siguientes: H0: pij = pi.p.j

para todas las i y j

H1: pij ≠ pi.p.j

para algunas i y j

El procedimiento de prueba usado precisa una muestra razonablemente grande. Nuestro lineamiento para su utilización es que ninguna frecuencia de celda esperada sea menor que la unidad y que no más de 20% sea menor que 5. A continuación, se estudian las pruebas de homogeneidad. En ellas, se comparan dos poblaciones binomiales mediante una tabla de contingencia 2 × 2 o r poblaciones multinomiales a través de una tabla de contingencia r × c. La hipótesis nula tiene la forma siguiente: H0: p1j = p2j = . . . = prj

j = 1, 2, 3, . . . , c

Se menciona que el experimentador fija los totales de fila marginales y el tamaño muestral global. Sin embargo, el análisis matemático es el mismo que en las pruebas de independencia, pese a esas diferencias. La última prueba considerada, la de McNemar, se usa para verificar la igualdad de dos proporciones poblacionales con base en datos por pares. También se mencionan y definen términos importantes, que debe conocer el lector, a saber: Datos categóricos Celda Ensayo multinomial Variable aleatoria multinomial

Prueba de bondad de ajuste Total de fila marginal Total de columna marginal Prueba de McNemar

EJERCICIOS Sección 15.1

1. Se realiza un estudio para determinar si el público general favorece la construcción de una presa para la generación de electricidad y el control de inundaciones. Se piensa que 40% está a favor de la construcción, 30% tiene posición neutral, 20% se opone a la presa y el resto no tiene una opinión al respecto. Se selecciona y entrevista una muestra aleatoria de 150 individuos en el área afectada. Si las cifras precedentes reflejan con exactitud la opinión pública, ¿cuántos individuos se espera que haya en cada categoría? En el supuesto de que 42 participantes de la muestra se pronuncien a favor, 61 tengan posición neutral, 33 se opongan y el resto no tenga opinión, ¿piensa en forma intuitiva que los porcentajes propuestos son correctos o incorrectos? Explique su respuesta.

DATOS CATEGÓRICOS

641

2. Se supone que la fuerza laboral de un ramo industrial específico se compone en 40% de varones caucásicos, 30% de mujeres caucásicas, 5% de mujeres negras, 15% de hombres negros y 10% de otros grupos. En teoría, la fuerza laboral real debe reflejar esos porcentajes. A fin de verificar si es tal el caso, se selecciona una muestra aleatoria de 200 trabajadores y se ubica a cada uno exactamente en una de las categorías precedentes. Si la fuerza laboral verdadera refleja las proporciones mencionadas en primer término, ¿cuántos trabajadores se espera que haya en cada categoría? Al terminar el muestreo, se tienen 95 varones caucásicos, 50 mujeres caucásicas, 2 mujeres negras, 20 hombres negros y 33 de otros grupos. ¿Estos datos llevan a suponer que la fuerza laboral verdadera no refleja satisfactoriamente los porcentajes citados al inicio de este párrafo? Explique su respuesta. 3. Un generador de dígitos aleatorios debe producir los dígitos 0 a 9, inclusive, con iguales probabilidades. Si se activa 100 veces, ¿cuántos de cada dígito se espera obtener? En el supuesto de que se observan 10 ceros, 8 unos, 9 doses, 11 treses, 12 cuatros, 7 cincos, 10 seises, 13 sietes, 9 ochos y el resto de nueves, ¿existen razones para suponer que el generador no produce los dígitos con la misma frecuencia, en el largo plazo? Sección 15.2

4. Use los datos del ejercicio 1 para verificar: H 0 : p1 = 0.4,

p2 = 0.3,

p3 = 0.2,

p4 = 0.1

¿Existen datos para suponer la afirmación de que las probabilidades mencionadas son incorrectas? Explique su respuesta con base en el valor P de la prueba. 5. Use los datos del ejercicio 2 para verificar la hipótesis nula de que la fuerza laboral verdadera refleja los porcentajes de la fuerza laboral ideal. 6. Use los datos del ejercicio 3 para comprobar la hipótesis nula de que el generador de dígitos aleatorios produce los dígitos 0 a 9, inclusive, con la misma frecuencia. 7. Seleccione una muestra aleatoria de 50 números aleatorios de un solo dígito, de la tabla III del apéndice A. Verifique la hipótesis nula de que los dígitos 0 a 9, inclusive, ocurren con la misma frecuencia en dicha tabla. Sección 15.3

8. Se emprende un estudio para verificar si existe relación entre la edad y la disposición favorable al uso de sistemas bancarios computarizados. Los datos que se muestran en la tabla 15.14 se obtienen en una encuesta de 500 clientes, seleccionados aleatoriamente, de un banco que ha ofrecido la TABLA 15.14 Usa la banca computarizada Edad



No

Menos de 40 años 40 años o más

150 150

75 125 500

642

PROBABILIDAD Y ESTADÍSTICA

TABLA 15.15 Marca bajo sospecha Incendio



No

Sí No

9 16

31 144 200

TABLA 15.16 Calidad del aire Temperatura Menor que el promedio Promedio Mayor que el promedio

Deficiente

Normal

Buena

1 12 12

3 28 14

24 76 30 200

9.

10.

11.

12.

banca computarizada durante más de un año. ¿Se tienen datos de una relación entre esas dos variables? Explique su respuesta, con base en el valor P de la prueba y el análisis de la tabla. Se supone que la tendencia de un automóvil a incendiarse en una colisión de alcance no es independiente de la marca del vehículo. A fin de sustentar esta afirmación, se selecciona una muestra aleatoria de 200 vehículos involucrados en ese tipo de accidente, de los registros existentes. Se clasifica cada automóvil en cuanto a su marca y si es uno de los vehículos que se considera especialmente susceptible a incendiarse bajo tales circunstancias o no lo es. Los datos recopilados se muestran en la tabla 15.15. ¿Existen datos de una relación entre la marca del vehículo y que se incendie cuando se ve involucrado en una colisión de alcance? Explique su respuesta. Se realiza un estudio para probar la independencia entre la calidad y la temperatura del aire. Se obtienen los datos de los registros de 200 días seleccionados aleatoriamente de los últimos años mostrados en la tabla 15.16. ¿Los datos indican la relación entre las variables? Explique su respuesta con base en el valor P de la prueba. En un estudio de la relación entre el uso de colores y la efectividad de material gráfico, se seleccionan aleatoriamente 100 gráficas de revistas científicas actuales. Cada una se clasifica en cuanto al uso o ausencia de colores y respecto de su efectividad. Los datos resultantes aparecen en la tabla 15.17. ¿Se tiene evidencia de que la efectividad del despliegue gráfico no es independiente del uso de colores? Explique su respuesta con base en el valor P de la prueba. Se supone que existe relación entre el día de la semana de producción de un artículo y la calidad de este último. A fin de sustentar la afirmación, se selecciona una muestra aleatoria de 500 unidades en existencia y se clasifica cada una en cuanto al día de su producción, mediante el número de lote. También se la califica respecto de la calidad. Los datos recopilados se muestran en la tabla 15.18.

DATOS CATEGÓRICOS

643

TABLA 15.17 Uso de colores Efectividad



No

Excelente Buena Normal Deficiente

7 10 9 4

4 19 26 21 100

TABLA 15.18 Día de producción Calidad Excelente Buena Normal Deficiente

L

M

M

J

V

44 14 15 3

74 25 20 5

79 27 20 5

72 24 23 0

31 10 9 0 500

TABLA 15.19 Satisfecho

Nuevo Antiguo



No

82 70

18 30

100 100 200

a) El lineamiento antes mencionado de frecuencias de celdas esperadas afirma que no más de 20% puede ser menor que 5 y ninguna debe ser menor que la unidad. ¿Se satisface el criterio en este caso? b) Combine las categorías de calidad “Normal” y “Deficiente” para satisfacer el criterio con la formación de una nueva tabla que tenga tres filas y cinco columnas. Úsela para verificar la independencia. c) ¿Se estableció la relación de la calidad con el día de producción? Explique su respuesta. Sección 15.4

13. Se realiza un estudio para verificar la efectividad de un nuevo sistema computarizado de surtido de pedidos en un ramo industrial. Se seleccionan muestras aleatorias de 100 clientes atendidos con el sistema antiguo e igual número que se atiende con el nuevo sistema. Se establece contacto con cada cliente para determinar si su pedido se surtió satisfactoriamente en no más de dos

644

PROBABILIDAD Y ESTADÍSTICA

semanas. Los resultados del estudio aparecen en la tabla 15.9. Verifique la hipótesis nula de que la proporción de clientes atendidos con el nuevo sistema que están satisfechos es la misma del grupo que recibe atención con el antiguo sistema, con el nivel α = 0.05. 14. Aunque muchos puestos en las aerolíneas comerciales se acompañan de estrés, se piensa que los controladores del tráfico aéreo son especialmente susceptibles a enfermedades relacionadas con el estrés, como los trastornos cardiacos, presión sanguínea alta y úlceras. A fin de sustentar esta afirmación, se selecciona e interroga una muestra aleatoria de 500 controladores de tráfico aéreo. Con fines de comparación, también se selecciona e interroga una muestra de 700 trabajadores de otras áreas en el ramo de aerolíneas comerciales. Los datos obtenidos aparecen en la tabla 15.20. Ponga a prueba la hipótesis nula de que la proporción de controladores de tráfico aéreo que padece enfermedades relacionadas con el estrés es la misma que la de otros trabajadores de aerolíneas comerciales. Explique sus resultados en sentido práctico, con base en el valor P de la prueba y el análisis de la tabla 15.20. 15. Se estudia un nuevo método de grabación de semiconductores. La calidad de la grabación se compara contra la obtenida con dos técnicas antiguas. Los resultados del estudio aparecen en la tabla 15.21. Exprese matemáticamente la hipótesis nula de homogeneidad. Verifíquela con el nivel α = 0.05. Interprete su resultado en sentido práctico. 16. Se lleva a cabo un estudio de los aumentos de sueldo en trabajadores de las áreas de investigación y desarrollo y de control de calidad. Los datos de la tabla 15.22 muestran el desglose de aumentos porcentuales de sueldo durante el último año para hombres y mujeres que trabajan en esas áreas. El estudio se basa en una muestra de 300 hombres y 150 mujeres seleccionadas aleatoriamente entre trabajadores de las áreas mencionadas. Los aumentos se clasifican según su valor en enteros. Por ejemplo, un aumento de 5.75% se incluye en la categoría “2-5%”. ¿Los datos tienden a sustentar la afirmación de que el aumento porcentual de sueldo del trabajador se TABLA 15.20 Enfermedades relacionadas con el estrés

Controladores Otros empleados



No

115 125

385 575

500 700 1 200

TABLA 15.21 Calidad Método

Excelente

Buena

Normal

Deficiente

Presión alta (antiguo) Iones reactivos (antiguo) Magnetrón (nuevo)

113 117 130

34 31 40

21 25 20

32 27 10

200 200 200 600

DATOS CATEGÓRICOS

645

relaciona con su género? Explique su respuesta con base en el valor P de la prueba. Interprete los resultados en sentido práctico mediante la inspección de los datos de la tabla 15.22. 17. En un estudio reciente, se afirma que una proporción creciente de despachos de ingeniería contrata pólizas de seguros de responsabilidad civil. La afirmación se basa en una encuesta de 753 de esos despachos. Se registra el estatus de cada uno en relación con el año previo y el actual. Los datos que sirven de base a la afirmación se muestran en la tabla 15.23. ¿Sustentan dichos datos? Explique su respuesta, con base en el valor P de la prueba de McNemar. 18. Se emprende una investigación de la relación entre la rapidez con que se emiten las palabras y la capacidad de una “computadora parlante” en el reconocimiento de instrucciones para cuya aceptación está programada. Se emite una muestra aleatoria de 50 instrucciones con ritmo menor de 60 palabras por minuto y se toma nota de la respuesta de la computadora. Se repiten las mismas instrucciones con ritmo de 60 palabras por minuto o mayor y se registra una vez más la respuesta. Los datos recopilados aparecen en la tabla 15.24. ¿Existe diferencia en la proporción de instrucciones aceptadas con los dos ritmos de su emisión? Explique su respuesta con base en el valor P de la prueba de McNemar.

TABLA 15.22 Porcentaje de aumento

Hombres Mujeres

14%

50 21

47 27

103 50

76 35

24 17

300 150 450

TABLA 15.23 Año actual Año previo

Asegurados

No asegurados

650 28

5 70

655 98

678

75

753

Asegurados No asegurados

TABLA 15.24 Ritmo de 60 o más Ritmo menor de 60

Instrucción aceptada

Instrucción rechazada

Instrucción aceptada Instrucción rechazada

14 28

1 7 50

646

PROBABILIDAD Y ESTADÍSTICA

19. Se emprende un estudio del empaque de medicamentos que se venden sin receta médica. El propósito es determinar si la proporción de fármacos con empaque resistente a la violación es la misma que en el año pasado o no. Se selecciona una muestra de 100 productos y se determina el tipo de empaque en cada año. Los resultados del estudio se muestran en la tabla 15.25. ¿Se tienen datos de que las proporciones difieran? Explique su respuesta. 20. Demuestre, en relación con la prueba de homogeneidad de una tabla 2 × 2, que Eˆ12 = ( n1.n.2 )/n y Eˆ 22 = ( n2. n.2 )/n. Sugerencia: Eˆ12 = n1. − Eˆ11. 21. Repita el ejercicio 13, en este caso con la estadística de prueba Z agrupada que se estudia en el capítulo 9. Demuestre que la segunda potencia de esa estadística es idéntica al valor ji cuadrada observado que derivó en el ejercicio mencionado. 22. Repita el ejercicio 14 con la estadística de prueba Z agrupada del capítulo 9. Demuestre que la segunda potencia de dicha estadística es idéntica al valor ji cuadrada observado que calculó en el ejercicio 14. EJERCICIOS DE REPASO

23. Un robot industrial es un mecanismo programable, diseñado para realizar tareas en un espacio limitado. Los robots de pintura con pistola de aspersión se utilizan en la industria automotriz. Su ventaja principal es que pueden trabajar en áreas con niveles de ventilación que serían insalubres para seres humanos. Los robots son muy eficaces, sin ser infalibles, y se asemejan a los seres humanos en que a veces producen trabajos de pintura con bordes gruesos o puntos delgados. En un estudio de robots, se selecciona aleatoriamente 50 cofres de automóvil pintados por un robot y se les clasifica en cuanto a si la tarea de pintura fue deficiente o no. También se estudia una segunda muestra de 50 cofres pintados por un pintor experimentado. Los datos TABLA 15.25 Resistentes a la violación, año actual Resistentes a la violación, año previo



No

Sí No

30 52

3 15 100

TABLA 15.26 Deficiente

Robot Pintor



No

2 4

48 46

50 50

6

94

100

DATOS CATEGÓRICOS

647

resultantes aparecen en la tabla 15.26. ¿Sustentan la afirmación de que los robots producen una menor proporción de cofres con pintura deficiente, en comparación con los seres humanos? Explique su respuesta con base en el valor P de la prueba apropiada. 24. Las bacterias anaerobias son microbios que no proliferan en presencia de oxígeno. Hoy, se las reconoce como causa importante de enfermedades infecciosas. En el pasado, era frecuente que los laboratorios clínicos pasaran por alto su presencia. En años recientes, se han creado nuevos métodos para su detección. Un estudio de 826 especímenes revela los datos que aparecen en la tabla 15.27. ¿Indican que la presencia de bacterias anaerobias no es independiente de la presencia de bacterias aerobias? Explique su respuesta con base en el valor P de la prueba apropiada. 25. Diversos científicos han propuesto que los animales usan el campo magnético terrestre como base para su orientación. Se emprende un experimento para investigar esta teoría en palomas que regresan a casa. Se coloca un par de resortes alrededor de cada paloma y se aplica un campo magnético que invierte el campo terrestre. Ello podría desorientar al ave. Cada día, durante 18 días consecutivos, se libera un ave. Se toma nota de su orientación y el tipo de día. ¿Indican los datos de la tabla 15.28 que la orientación del ave no es independiente de la nubosidad? Explique su respuesta con base en el valor P de la prueba apropiada. 26. Se comparan dos tipos de recubrimientos para uso anticorrosivo. En el equipo, se usan 50 tramos de tubería, cada uno del mismo tipo y tamaño. La mitad de cada tramo se cubre con una capa de 0.5 mil del compuesto A, y la otra mitad, con una capa de igual grosor del compuesto B; luego, se los somete a 1 000 h de niebla salina. Al final del experimento, un juez imparcial contrasta las dos sustancias en cuanto a su efectividad anticorrosiva. Los datos recopilados aparecen en la tabla 15.29. ¿Existe una diferencia en la proporción de tramos con la que se consideran efectivos los dos compuestos? Explique su respuesta con base en el valor P de la prueba de McNemar. TABLA 15.27 Presencia de bacterias anaerobias

Presencia de bacterias aerobias

Sí No



No

322 81

286 137

(Aleatoria) (Aleatoria)

(Aleatoria)

(Aleatoria)

826

TABLA 15.28 Soleado Orientación a casa



No

Sí No

79 16

5 18 118

648

PROBABILIDAD Y ESTADÍSTICA

TABLA 15.29 A efectivo B efectivo



No

Sí No

35 8

5 2 50

TABLA 15.30 Profundidad del agua, d (m) Muy poca (d < 0.5) Dentro del pólder Fuera del pólder

Poca (0.5 ≤ d < 1)

Moderada (1 ≤ d < 1.5)

Profunda (d ≥ 1.5)

25

145

81

8

0

13

43

65

27. Se emprende un estudio de un sistema computarizado de despacho de camiones en minas a cielo abierto. El estudio incluye una simulación de la disponibilidad de los vehículos. Esa simulación se realiza de manera que cada camión debe considerarse por completo funcional en 50% del tiempo, parcialmente funcional en 25% del tiempo y no funcional en el resto del tiempo. a) El estado de un camión dado se simula 350 veces. ¿Cuántas de esas simulaciones se espera que den por resultado que el camión se clasifique como funcional, parcialmente funcional o no funcional? b) Cuando se termina la simulación, se clasifican como funcionales 168 camiones, parcialmente funcionales 94 y no funcionales el resto. ¿Estos datos llevan a suponer que la simulación no funciona apropiadamente? Explique su respuesta. 28. En Bangladesh, cada año ocurren inundaciones, y cada dos o tres años, inundaciones anormalmente graves. El pólder es una técnica de control de inundaciones en la que el nivel de la inundación se regula en un área delimitada, mediante reguladores de drenaje como las compuertas y las estaciones de bombeo. Se realiza un estudio de la efectividad percibida de esa técnica. Se obtienen muestras de 259 residentes que viven desde tiempo atrás en el área de aplicación de la técnica y 121 residentes que habitan fuera de dicha área, después de una reciente inundación anormalmente grave. Se pide a cada persona que estime la profundidad del agua en su hogar y los alrededores. Los datos obtenidos aparecen en la tabla 15.30. (Basado en “Poldering vs. Compartmentalization: The Choice of Flood Control in Bangladesh”, de Harun Rasid y Azim Mallik, Environmental Management, vol. 17, núm. 1, enero de 1993, pp. 59-71.) a) ¿Es la prueba de relación una prueba de independencia o de homogeneidad, con base en la descripción del método de muestreo? b) ¿Se detectó una relación entre la ubicación del residente y la gravedad percibida de la inundación? Explique su respuesta con base en la prueba estadística.

CONTROL ESTADÍSTICO DE CALIDAD

649

CAPÍTULO

16

CONTROL ESTADÍSTICO DE CALIDAD

L

os métodos estadísticos de control de calidad se usan en la industria por lo menos desde comienzos del decenio de 1940. El interés en ellos y en la investigación para desarrollar métodos más refinados aumentó considerablemente en los últimos años. Los fabricantes de países industrializados se han dado cuenta de que la calidad y confiabilidad de los productos deben ser competitivas para tener ventajas en los mercados internacionales. Después de la Segunda Guerra Mundial, en Japón se empezó a hacer énfasis considerable en el control de calidad industrial. El estadístico estadounidense Edward S. Deming obtuvo reconocimiento internacional por su ayuda inicial a los industriales japoneses en la implantación de métodos de control de calidad industrial. Gran número de consumidores de todo el mundo reconocen hoy la alta calidad de los productos, como los electrónicos y automóviles, que se producen en Japón. El considerable éxito japonés estimuló en parte un mayor interés en las áreas de control de calidad en Estados Unidos y otros países industrializados. De hecho, los procedimientos estadísticos de control de calidad se han vuelto parte vital del proceso de manufactura. Son métodos que revisten importancia especial para los ingenieros, dada su función clave en la creación de nuevos productos, la operación de los procesos de producción y el diseño de instalaciones de tipo industrial y obras públicas. Hasta el momento de su muerte prematura en 1993, Deming fue sin duda alguna la persona que más estimuló el interés en el control de calidad, ante todo en Estados Unidos y Japón. Hizo énfasis, con gran éxito, en su filosofía de administración industrial. En años recientes, muchos otros científicos han contribuido de manera importante a las áreas del control de calidad, en rápida expansión. El científico japonés G. Taguchi tuvo efecto considerable en el área. Una parte de su trabajo guarda relación estrecha con el diseño experimental estadístico. Las gráficas de control se utilizan ampliamente en la vigilancia o monitoreo de procesos (control de procesos). Su propósito es detectar una situación en la que un proceso está “fuera de control”, en el sentido de que presenta signos de haber sufrido un cambio debido a causas identificables. Algu649

650

PROBABILIDAD Y ESTADÍSTICA

nas de las primeras gráficas de control son las que desarrolló Walter A. Shewhart (1918-1967), físico que laboró gran parte de su vida en Bell Laboratories. Se le conoce principalmente por su trabajo en el área de control de calidad con el uso de métodos estadísticos. Su tarea fue decisiva en el desarrollo de las gráficas de control que llevan su nombre y se estudian en este capítulo. En los procedimientos modernos de control de calidad, se hace énfasis en el diseño y vigilancia de los procesos de producción para satisfacer especificaciones o excederlas. Sin embargo, cuando interesa determinar si un lote de productos recibidos de un proveedor cumple en realidad con las especificaciones (control de productos), resulta útil un procedimiento llamado muestreo de aceptación. Estas ideas se analizan en la sección 16.4. Ciertas ampliaciones y modificaciones de las gráficas de control básicas y algunas ideas relacionadas con el enfoque de diseño (diseño de procesos) de Taguchi para el control de la variabilidad de productos se estudian en la sección 16.6. Aunque los métodos analizados en el capítulo son en su mayor parte fundamentales, se usan ampliamente en la industria y otras áreas de aplicación, como el monitoreo ambiental.

16.1

PROPIEDADES DE LAS GRÁFICAS DE CONTROL

Una de las herramientas principales del control de procesos es la sencilla a la vez que efectiva gráfica de control de Shewhart. Permite la detección oportuna de la inestabilidad o falta de control en un proceso. Se vuelve inestable un proceso cuando la distribución de éste cambia en lo referente a la localización (como la media), variabilidad (como la desviación estándar del proceso) o alguna otra característica del proceso. Muchos factores pueden hacer que un proceso se vuelva inestable. Entre ellos, se incluyen fallas de la maquinaria, uso de materiales de calidad inferior, negligencia o errores de los operadores, o alteraciones del entorno. Una vez considerado inestable o fuera de control un proceso sobre bases estadísticas, la tarea del ingeniero de control de calidad es determinar las causas y corregir el problema. Las gráficas de control de Shewhart pueden usarse con datos de medición, de conteo o de atributos. En esta sección, se consideran las características generales que debe poseer toda gráfica de control. Luego, se ilustran las ideas con la gráfica de control X de Shewhart, que se aplica a la vigilancia de la media de los productos que se fabrican. Antes de elaborar una gráfica de control, hay que preguntarse: “¿Cuáles propiedades debe tener?” Son varias, cada una basada en consideraciones prácticas: 1. El desarrollo de numerosas gráficas de control corresponde a estadísticos e ingenieros, que trabajan juntos; pero se usan en los centros de trabajo, por lo que deben ser sencillas. Aunque un gran número de trabajadores de producción son inteligentes no son ingenieros y se les debe dar una herramienta que entiendan y puedan usar con exactitud. 2. Las gráficas de control deben diseñarse de manera que permitan detectar rápidamente la situación incontrolada. Por ejemplo, no convendría que se produzca un gran número de unidades de un producto inaceptable antes de darse cuenta de que existe un problema. 3. La gráfica de control debe tener lo que se llama baja tasa de falsas alarmas. En otras palabras, es usual que no se quiera calificar como incontrolado a un proceso cuando, de hecho, nada funciona mal. Las falsas alarmas llevan a interrupciones costosas e innecesarias de los procesos de producción.

CONTROL ESTADÍSTICO DE CALIDAD

651

4. El muestreo lleva tiempo y puede ser costoso. Ello reviste validez especial si las pruebas de productos son destructivas, es decir, que el producto se destruye en el proceso de prueba. Así pues, las gráficas de control deben funcionar satisfactoriamente con muestras pequeñas. La gráfica de control de medias de Shewhart satisface los criterios precedentes y se usan ampliamente en la industria. Por lo tanto, con ella se ilustra la aplicación de las gráficas de control y se presenta una parte de la terminología relacionada con tales gráficas.

Monitoreo de medias Las gráficas de control usadas para vigilar la media se centran en un valor blanco µ0. El límite de control inferior (LCI) y el límite de control superior (LCS) son los valores mínimo y máximo que puede asumir la media muestral X sin generar una alarma. En otras palabras, si LCI ≤ X ≤ LCS, se supone que el proceso está bajo control o funciona correctamente, en el sentido de que su valor medio parece cercano al preestablecido. Los valores de X inferiores al LCI o mayores que el LCS indican que la media del proceso se desvió del valor establecido. En teoría, los límites de control superior e inferior asumen las formas: LCI = µ0 − kσ X

LCS = µ0 − kσ X

donde µ0 es el valor medio establecido o buscado, σ X es la desviación estándar de la media muestral y k es un número real positivo. En la práctica, es usual que este último parámetro tenga valores 2 o 3 y que se trate de una gráfica de control 2-sigma o 3-sigma. La gráfica de control de medias de Shewhart se usa de la manera siguiente. Se obtienen muestras, usualmente de tamaños 4 o 5, a intervalos de tiempo fijos. Los intervalos seleccionados quedan a discreción del ingeniero de control de calidad y pueden ser de una hora, media hora o el intervalo que interese. La media muestral se calcula y traza en la gráfica de control. El proceso continúa, siempre y cuando el valor x obtenido esté dentro de los límites de control. Se obtienen muestras sucesivas hasta que x se sitúe fuera de los límites centrales. Cuando ello ocurra, se dice que se ha observado una “señal” y se detiene el proceso para buscar la causa de esa señal. En la figura 16.1, las primeras seis muestras obtenidas hacen creer que el proceso está bajo control, ya que todos los valores x se sitúan entre los límites de control. La séptima muestra envía una señal de que el proceso no lleva a la fabricación de productos con el valor medio preestablecido, se considera incontrolado el proceso y se busca la razón de la desviación aparente respecto del valor medio. Suponga, a fin de elaborar una gráfica de control 3-sigma de la media, que X tiene distribución normal, con media µ0 y varianza σ 2 cuando el proceso está bajo control. Sea que X denota la media de una muestra con tamaño de n unidades, extraída en un momento dado. Si el proceso está bajo control, entonces X tiene distribución normal, con media µ0 y varianza σ 2/n. La ley de probabilidad normal estudiada en el capítulo 3 indica que una variable aleatoria normal se ubica a no más de 3 desviaciones estándar de su media en 99% de los casos. En otras palabras:  −3σ 3σ  P ≤ X − µ0 ≤   n n

0.99

652

PROBABILIDAD Y ESTADÍSTICA

(Señal)

LCS

µ0

LCI

1

2

3

4

5

6

7

Número de (Señal) muestra

FIGURA 16.1 Ejemplo prototípico de una gráfica de control de la media de Shewhart. La media especificada blanco del proceso es µ0. Las primeras seis muestras obtenidas reflejan un proceso que parece estar “bajo control” en lo referente a la media. En la séptima muestra, se produce una “señal” y se califica como “fuera de control” al proceso.

En la tabla normal estándar, parece que la probabilidad exacta de que así ocurra es 0.9974. Aislar X en el centro de la desigualdad permite apreciar que X se ubica en el intervalo µ0 ± 3σ / n con probabilidad 0.9974 cuando el proceso está bajo control. Son muy inusuales los valores observados de X mayores que µ0 + 3σ / n o menores que µ0 − 3σ / n en el caso de un proceso que está bajo control. Son dos las explicaciones de que se observe tal valor: 1) el proceso está bajo control y simplemente se obtiene una muestra muy inusual, o 2) el proceso está fuera de control. La probabilidad de que sea correcta la primera explicación es muy baja (0.0026), ¡de modo que se opta por creer en la segunda! En otras palabras, una media muestral observada fuera del intervalo µ0 ± 3σ / n hace que se declare como fuera de control un proceso. Ello usualmente origina su detención para identificar el problema. Advierta que declarar incontrolado el proceso cuando en realidad está bajo control equivale a cometer un error tipo I en la verificación de hipótesis. Detener los procesos es costoso, por lo que se pretende cometer ese tipo de error sólo de manera muy infrecuente.

Distribución de la duración de lote Surgen dos preguntas importantes cuando se usan las gráficas de control para vigilar o monitorear un proceso. Una de ellas es: “¿Cuál es la frecuencia con la que se toma la decisión incorrecta de declarar como fuera de control el proceso (observación de un valor de la media fuera de los límites de control) cuando, en realidad, el proceso está bajo control y simplemente se observó un evento aleatorio inusual?” La otra pregunta es: “¿Cuán rápidamente puede detectarse que el proceso está fuera de control (una señal verdadera)?” En el caso sencillo, donde se supone que las medias muestrales corresponden a una distribución normal con media y varianza conocidas, es posible responder a esas preguntas con la distribución geométrica estudiada en el capítulo 3. Recuerde que la distribución geométrica ocurre cuando se realiza una serie de ensayos independientes e idénticos. Se supone que cada uno lleva a uno de dos posibles resultados, llamados éxito o fracaso. La probabilidad de éxito se denota con p, y la de fracaso, 1 − p, con q. La variable aleatoria Y es el número de ensayos necesarios para obtener el primer éxito. Se sabe que la densidad de probabilidades de Y está dada por:

CONTROL ESTADÍSTICO DE CALIDAD

0.0013

653

Señal (se supone que el proceso está fuera de control)

LCS = µ 0 + 3σ !!n

µ0 = media preestablecida cuando el proceso está bajo control

(Se supone que el proceso está bajo control)

Señal (se supone que el proceso está fuera de control)

LCI = µ 0 – 3σ !!n 0.0013

FIGURA 16.2 Si el proceso está bajo control, entonces X tiene distribución normal, con media µ0 y desviación estándar σ / n. La probabilidad de que X se sitúe por arriba del LCS o abajo del LCI es 0.0013 + 0.0013 = 0.0026.

P[Y = y ] = f ( y ) = pq y − 1

y = 1, 2, 3, . . .

y que el valor promedio de Y es 1/p. Para usar la distribución geométrica en el contexto de una gráfica de control de la media, sea Y que denota el número de muestras necesarias para obtener la primera señal, entonces la variable aleatoria es denominada duración de lote. Note que definir Y de esta manera equivale a definir el “éxito” como la obtención de una señal o la observación de un valor de X que está fuera de los límites de control. Puesto que X es una variable aleatoria, su valor varía de una muestra a otra, inclusive si el proceso está bajo control. Así pues, existe una probabilidad baja, p, de observar una media muestral inusual que genere una señal al azar, pese a que µ = µ0. Se supone que las muestras son independientes, por lo que p se mantiene sin cambio de una muestra a otra si el proceso está bajo control. De tal suerte, la variable aleatoria Y tiene distribución geométrica, con probabilidad de éxito p. El valor de p es inherente a la construcción de la gráfica de control. En el caso de una gráfica de control 2-sigma, la probabilidad aproximada de que X esté entre los límites de control cuando el proceso está bajo control es 0.95 o, dicho de manera más exacta, 0.9544. Así, la probabilidad exacta de recibir una falsa alarma es 0.0456. En este caso, p = 0.0456. En relación con una gráfica de control 3-sigma:

y

P[ X < LCS

P[ LCS ≤ X ≤ LCI] = 0.9974 o X > LCI] = 0.0026

En este caso, p = 0.0026. La idea se ilustra en la figura 16.2.

654

PROBABILIDAD Y ESTADÍSTICA

Ahora, la pregunta es: “¿Cuántas muestras se extraen para obtener la primera falsa alarma cuando un proceso está bajo control?”. Es decir, “¿cuál es el valor E[Y ] o duración de lote promedio si el proceso está bajo control?” Puesto que Y es geométrica, la pregunta tiene fácil respuesta. En el caso de una gráfica de control 2-sigma, E[Y ] = 1/p = 1/0.0456 = 21.929. En promedio, la falsa alarma ocurre en la 22ª muestra. Las falsas alarmas de gráficas de control 3-sigma son menos frecuentes. En este caso, E[Y ] = 1/p = 1/0.0026 = 384.6. En otras palabras, con una gráfica de control 3-sigma se esperaría una señal falsa aproximadamente en una de cada 385 muestras. Otra pregunta interesante es: “¿Cuántas muestras son necesarias antes de recibir una señal si el proceso está fuera de control, en el sentido de que la media verdadera se ha desviado de lo establecido?” Es más difícil responder a esta pregunta que a la concerniente a la duración de lote promedio, ya que la probabilidad de obtener la señal depende del grado de desviación del proceso. Una desviación leve es difícil de detectar, mientras que otra de carácter grave debe identificarse más bien con prontitud. La idea se ilustra en el ejemplo 16.1.1. Ejemplo 16.1.1. Suponga que un fabricante produce tornillos y se sabe que la longitud de los tornillos en este proceso tiene distribución normal, con media de longitud µ0 = 0.5 pulg y error estándar de la media σ / n = 0.01 pulg. Así pues, una gráfica de control 3-sigma tendría línea central en µ0 = 0.5 pulg, límite de control superior LCS = 0.5 pulg + 3(0.01) pulg = 0.53 pulg y límite de control inferior LCI = 0.5 pulg − 3(0.01) pulg = 0.47 pulg. En el supuesto de que el proceso se desvió de manera tal que, de hecho, la longitud promedio de los tornillos producidos es 0.51 pulg, ¿cuál es la probabilidad de que una muestra dada indique una señal de esta desviación? ¿Cuál es el número promedio de muestras requerido para detectar esa desviación de la media? La probabilidad de recibir la señal es:

p = P[ X > 0.53 o

X < 0.47]

La estandarización de la media arroja:

y

 X − 0.51 0.53 − 0.51 P >  = P[ Z > 2.0] = 0.0228 0.01   0.01  X − 0.51 0.47 − 0.51 < P  = P[ Z < −4.0] 0 0.01   0.01

La probabilidad de detectar esta desviación más bien pequeña de la media con una muestra dada es p = 0.0228 + 0 = 0.0228. El número promedio de muestras necesario para detectar la desviación es 1/p = 43.86. Así pues, se requiere mucho tiempo para detectar esta desviación pequeña en la longitud promedio de los tornillos producidos. Suponga que el proceso se altera de modo que el promedio cambia a 0.56 pulg. ¿Con cuál prontitud se detecta este cambio significativo? Cálculos análogos a los recién mostrados indican que es:

y

 0.53 − 0.56  P Z >  = P[ Z > −3] = 0.9987 0.01    0.47 − 0.56  P Z <  = P[ Z < −9.0] 0 0.01  

CONTROL ESTADÍSTICO DE CALIDAD

655

En este caso, p = 0.9987. Se tiene probabilidad muy alta de que un cambio en la media de esta magnitud se detecte con una sola muestra. La duración de lote esperada es 1/0.9987 1.00.

También pueden plantearse preguntas concernientes al tiempo. Si las muestras se obtienen a intervalos de duración d, entonces el tiempo promedio requerido para obtener una señal está dado por: Tiempo promedio = E[Y ] . d A manera de ilustración, en el ejemplo precedente la obtención de las muestras cada hora llevaría a que, en promedio, detectar una desviación del valor preestablecido de 0.5 a 0.51 pulg requiera 43.86 h. Si las muestras se toman cada 30 min, la desviación se detecta, en promedio, al cabo de 43.86(0.5) = 21.93 h. Debe resaltarse que el uso de una gráfica de control 2-sigma o 3-sigma de Shewhart requiere emprender pruebas de hipótesis de dos colas. En cada punto de muestreo, se intenta verificar: H 0: µ = µ0 H 1: µ ≠ µ0

(la media del proceso está bajo control) (la media del proceso está fuera de control)

El valor P de cada prueba es p, la probabilidad de que la estadística de prueba X se ubique fuera de los límites de control. Si se recibe una señal que es una falsa alarma, entonces se cometió un error tipo I. En caso de no recibirla cuando, en realidad, la media del proceso se desvió del blanco, el resultado es un error tipo II. Las pruebas efectuadas tienen potencia alta en relación con este cambio cuando la gráfica de control se diseña de manera que la duración de lote promedio es pequeña para la detección de algunas desviaciones prácticas decisivas en la media del proceso.

16.2 GRÁFICAS DE CONTROL DE MEDICIONES DE SHEWHART El monitoreo de un proceso en el que se obtienen mediciones como las de longitud, diámetro, y así sucesivamente, casi siempre requiere vigilar la estabilidad del proceso en cuanto a la localización y variabilidad. En esta sección, se consideran dos gráficas de control importantes, las gráficas X y R. La primera vigila la localización (referente a la media), y la segunda, la variabilidad (en cuanto al rango o intervalo). En general, la gráfica de rango debe indicar el control antes de elaborar la gráfica de la media, ya que en esta última se usan estimaciones de los parámetros de la gráfica de rango para determinar los límites de control.

Gráfica X (media) Se mencionó que los límites teóricos de la llamada gráfica X 3-sigma son:

µ0 ±

3σ n

Si se conocen los valores de µ0 y σ, es posible determinar inmediatamente dichos límites. Por desgracia, como ocurre con muchos parámetros teóricos, pocas veces se conocen en la práctica sus valores exactos y resulta necesario estimarlos de manera experimental. A tal efecto, se inicia el proceso y se

656

PROBABILIDAD Y ESTADÍSTICA

extraen m muestras de tamaño n durante el periodo en el que se supone que está bajo control el proceso. Los lineamientos recomendados son que m = 20 o más y n = 4 o 5. Se calcula X j , la media muestral, para cada muestra. La estimación de µ0 consiste en combinar las m medias muestrales para obtener el estimador siguiente: m

∑X µˆ 0 =

j

j =1

m Podría estimarse σ mediante el cálculo de la desviación muestral de cada muestra y la combinación de las estimaciones resultantes. En la práctica, el proceso sería un tanto engorroso. Por ello, se usan los rangos muestrales para estimar σ. En el caso de variables aleatorias normales, puede demostrarse que la razón del valor esperado del rango muestral R sobre la desviación estándar σ es una constante que depende sólo del tamaño muestral. Esa constante, que se denota con d2, está dada por: d2 =

E [ R] σ

y, por lo tanto:

E[ R] d2 El valor apropiado de d2 se obtiene en la tabla XII del apéndice A. El valor esperado de R se estima a partir de los m rangos muestrales R1, R2, . . . , Rm, al promediarlos. En otras palabras:

σ=

m

∑ Rj E [ R] = R =

j =1

m

La sustitución lleva al estimador de σ que sigue:

σˆ =

E[ R] R = d2 d2

Los límites estimados de una gráfica X 3-sigma son: Límites de una gráfica X 3-sigma

µˆ 0 ±

3σˆ n

o

µˆ 0 ±

3R d2 n

La creación de una gráfica X se ilustra en el ejemplo siguiente. Ejemplo 16.2.1. Se diseña una nueva línea de producción de manera que llene cada lata que pasa por ella con 12 onzas de un líquido. Sin importar el cuidado que se tenga, ocurre cierta variabilidad de la

CONTROL ESTADÍSTICO DE CALIDAD

657

variable aleatoria X, el volumen de bebida en cada lata. El proceso se considera fuera de control si la media de llenado parece diferir considerablemente del llenado promedio obtenido cuando el proceso funciona en forma correcta o si la variabilidad del llenado aparentemente difiere mucho de la obtenida en un sistema con funcionamiento correcto. Se usa una gráfica X para vigilar la media de X. Después de la calibración de la maquinaria y la capacitación del personal de la línea de producción, se obtienen cinco observaciones por hora de X, el volumen de bebida con que se llena cada lata, durante 24 horas. Se calculan la media y rango muestrales de cada muestra de tamaño 5. Los datos obtenidos aparecen en la tabla 16.1. A partir de ellos, se estima µ0, la línea central de la gráfica X, con: 24

∑xj µˆ 0 =

j =1

24 (12.088 + 11.971 + . . . + 12.007) = 24 = 11.987

TABLA 16.1 Volumen de líquido llenado Número de muestra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

12.046 12.091 11.952 11.821 11.674 12.020 12.077 11.867 12.063 12.042 12.014 11.949 12.168 11.974 11.799 12.021 12.008 12.128 11.946 11.956 12.246 11.947 11.994 12.124

Media Xj

Peso (onzas) por lata 12.006 12.118 11.862 11.989 11.881 12.016 12.038 11.971 12.038 12.059 11.747 11.894 11.985 11.964 12.118 11.993 11.834 11.986 11.806 12.066 11.947 12.000 12.136 11.862

12.139 11.850 11.899 11.866 11.886 12.227 11.949 12.016 11.858 12.086 11.965 11.951 12.060 12.183 11.886 12.061 11.966 11.911 12.049 11.911 11.937 11.984 11.908 11.904

12.112 11.931 11.999 12.104 11.921 12.004 12.029 11.866 11.985 12.024 11.953 12.076 11.910 12.054 12.036 11.969 11.948 12.019 11.976 11.937 12.128 11.838 12.001 12.073

Rango rj

12.139 11.863 12.139 12.028 11.886 11.887 12.103 11.124 11.969 11.915 11.944 12.023 11.884 11.794 11.977 11.814 12.299 11.980 12.053 12.040 12.005 12.038 11.909 12.072

12.088 11.971 11.970 11.962 11.850 12.031 12.039 11.969 11.983 12.025 11.925 11.979 12.001 11.994 11.963 11.972 12.011 12.005 11.966 11.982 12.053 11.961 11.990 12.007

0.133 0.268 0.277 0.283 0.247 0.340 0.154 0.258 0.205 0.171 0.267 0.182 0.284 0.389 0.319 0.247 0.465 0.217 0.247 0.155 0.309 0.200 0.228 0.262

Total Promedio

287.687 11.987

6.107 0.254

658

PROBABILIDAD Y ESTADÍSTICA

El rango muestral promedio está dado por: 24

∑ rj r=

j =1

24 0.133 + 0.268 + . . . + 0.262 = 24 = 0.254

Por ende, la desviación estándar σ se estima con:

σˆ =

r d2

El valor d2 = 2.326 se obtiene de la tabla XII para n = 5 y, de tal suerte:

σˆ =

0.254 = 0.1092 2.326

Los límites 3-sigma de la gráfica X son:

µˆ 0 ± o

11.987 ±

3σˆ n 3(0.1092) 5

Así pues, los límites de control inferior (LCI) y superior (LCS) son: LCI = 11.841 LCS = 12.134 La gráfica X resultante se muestra en la figura 16.3. Se usará en la vigilancia futura. Cuando se seleccione una muestra futura de tamaño 5, su media muestral se traza sobre la gráfica X. Si se sitúa fuera de los límites de control, se califica de incontrolado al proceso. Luego, es responsabilidad del ingeniero de control de calidad la localización y corrección del problema. Advierta que, en ocasiones, ¡no existe problema alguno que corregir! En unos cuantos casos, el valor de X está fuera de los límites de control por azar, pese a que el proceso funcione correctamente.

Debe hacerse un último comentario acerca de la elaboración de una gráfica X. Una vez determinados los límites en la forma recién estudiada, los valores X 1 , X 2 , X 3 , . . . , X m usados en la preparación de la gráfica deben trazarse en ella. Si se sitúan dentro de los límites de control, la gráfica está completa y puede ponerse en uso. Cuando uno o más de esos valores está fuera de los límites de control, deben eliminarse esos valores del conjunto de datos y se deben estimar una vez más µ0 y σ a partir del conjunto de datos reducido, además de calcular nuevos límites de control. Note que en el último ejemplo esos límites son 11.841 y 12.134. Puesto que cada uno de los valores de X j de la tabla 16.1 se sitúa entre esos límites, la gráfica X preparada está lista para usarse.

CONTROL ESTADÍSTICO DE CALIDAD

659

LCS = 12.134

µˆ 0 = 11.987

LCI = 11.841

FIGURA 16.3 Una gráfica X 3-sigma de control del número de onzas de bebida contenidas en una lata puede basarse en una muestra de tamaño 5.

Gráfica R (rango) Es usual que la variabilidad de un proceso sea tan importante como su media. Por ejemplo, suponga que se producen bolas de boliche cuyo diámetro promedio presuntamente es 8.6 pulg. ¿Basta saber que el proceso de producción está bajo control en lo referente a este valor medio? Considere que se observa una muestra de cinco bolas que salen de la línea de producción, con los diámetros siguientes: 4.0 (aproximadamente del tamaño de una pelota de softbol) 8.6 8.7 9.7 12.0 (casi del tamaño de una pelota de baloncesto) La media muestral de esos datos es x = 8.6, ¡justo en el blanco! El proceso parece estar claramente bajo control en lo concerniente a la media; pero, ¿es un proceso estable? Resulta evidente que no lo es. Una bola de boliche del tamaño de una pelota de softbol o de baloncesto resulta inaceptable. Controlar la variabilidad es tan importante como hacerlo con la media. De hecho, uno de los puntos principales del método de Deming es que se debe reducir y controlar la variabilidad. A continuación, se estudia una gráfica de control de Shewhart usada para vigilar la variabilidad de productos. Es posible elaborar una gráfica de la desviación estándar que sea análoga de la gráfica X. Sin embargo, en virtud de su sencillez se usa más la gráfica de control del rango, llamada gráfica de control R de Shewhart. Sus límites teóricos son:

µ R ± 3σ R donde µR denota el valor medio del rango muestral R, y σR, su desviación estándar. Se estima µR con: m

∑ Rj µˆ R = R =

j =1

m

660

PROBABILIDAD Y ESTADÍSTICA

Aunque no se presenta aquí la derivación, puede demostrarse que un buen estimador de σR, en el caso de muestreo de una distribución normal, es:

σˆ R =

d3 R d2

donde d3 también es una constante cuyo valor depende del tamaño muestral. Los valores de esa constante aparecen en la tabla XII del apéndice A. La sustitución de µR y σR con sus estimadores permite ver que los límites de control inferior y superior del rango muestral son: Límites de control del rango

µˆ R ± 3σˆ R d R ±3 3 R d2 Antes de ilustrar la idea, debe resaltarse un problema práctico. El rango de una distribución no puede ser negativo. Sin embargo, en ocasiones el límite inferior estimado de una gráfica R es un número negativo. En tal caso, dicho límite se ajusta a cero. Ejemplo 16.2.2. Aquí se construirá una gráfica R basada en los datos de la tabla 16.1. Se sabe ya que:

µˆ R = r = 0.254 La media estimada del rango muestral cuando el proceso está bajo control es 0.254 onzas, que constituye la línea central de la gráfica R. Los valores de d2 y d3 cuando n = 5 aparecen en la tabla XII y son 2.326 y 0.864, respectivamente. Los límites de control estimados son: r ±3

d3 r d2

(0.864)(0.254) 2.326 0.254 ± 0.283 0.254 ± 3

El límite de control inferior estimado es –0.029, de modo que se ajusta a 0, mientras que el superior es 0.537. Advierta que ninguno de los rangos muestrales de la tabla 16.1 es mayor que el segundo de esos límites, de modo que la gráfica de control está lista para usarse. Esta gráfica se muestra en la figura 16.4.

En la práctica, las gráficas X y R casi siempre se usan simultáneamente. De esa manera, se intenta controlar la media y variabilidad del producto que se fabrica. El ejemplo siguiente ilustra esa idea. Ejemplo 16.2.3. El proceso que se describe en el ejemplo 16.2.1 se vigila cinco veces en el curso de un día. Los datos resultantes aparecen en la tabla 16.2 y se ilustran en la figura 16.5. Note que el proceso se sale de control en cuanto a la localización (media) en el cuarto periodo de muestreo. En dicho momento,

CONTROL ESTADÍSTICO DE CALIDAD

661

LCS = 0.537

µˆ R = 0.254

LCI = 0

FIGURA 16.4 Gráfica R 3-sigma para controlar la variabilidad del número de onzas de bebida que contiene una lata, con base en tamaño muestral 5. TABLA 16.2 Número de muestra 1 2 3 4 5

Peso (onzas) por lata 12.016 12.039 11.998 12.167 12.048

12.088 12.047 12.053 12.127 12.048

11.792 12.014 12.058 12.053 11.931

11.971 12.113 12.077 12.137 12.083

12.118 12.156 12.049 12.212 12.045

Media Xj

Rango rj

11.997 12.074 12.047 12.139 12.031

0.326 0.142 0.079 0.159 0.152

LCS = 12.134

µˆ 0 = 11.987 LCI = 11.841 1

2

3

4

5

6

Número de muestra a) LCS = 0.537

µˆ R = 0.254 LCI = 0 1

2

3

4

5

6

Número de muestra b)

FIGURA 16.5 a) Gráfica X de una muestra de 5 días, con el proceso fuera de control en cuanto a la localización en el día 4; b) gráfica R de una muestra de 5 días, con proceso bajo control respecto de la variabilidad en cada día.

662

PROBABILIDAD Y ESTADÍSTICA

el ingeniero usualmente estudiaría el proceso para tratar de identificar y corregir el problema. Los datos hacen pensar que el proceso está controlado en lo relativo a la variabilidad.

16.3 GRÁFICAS DE CONTROL DE SHEWHART PARA ATRIBUTOS En secciones previas, se estudian las gráficas de control de Shewhart usadas para observar la localización (media) y variabilidad (rango) de una variable aleatoria continua. Se obtienen datos en la forma de mediciones. En la presente sección, se consideran gráficas de control de Shewhart que entrañan el uso de datos de conteo. En particular, se usan gráficas P para vigilar la proporción de productos defectuosos que se fabrica y gráficas C para el monitoreo del número promedio de defectos por unidad producida. Se analizan los límites de control 3-sigma estándar y se hace referencia al número de defectos de un producto o el de productos defectuosos como “controlado” o “fuera de control”, con base en esos límites.

Gráfica P (proporción defectuosa) La gráfica P se prepara de manera similar a la usada en la elaboración de la gráfica X . Considere una muestra de n elementos extraída de un proceso supuestamente controlado. Puesto que incluso en las mejores circunstancias se produce en ocasiones un artículo defectuoso, una cierta proporción de los productos fabricados cae en la categoría de defectuosos. Sea que Π denota esa proporción, y X, el número de productos defectuosos en la muestra. Se supone que la calidad de un producto no se ve afectada por la de otros, de modo que la variable aleatoria X tiene distribución binomial, con parámetros n y Π. Advierta que en este contexto el “éxito” consiste en observar un producto defectuoso y que la probabilidad de éxito en el caso de un proceso controlado es Π. Esta notación difiere de la usada en capítulos previos, donde la probabilidad de éxito se denotaba con p. Tal cambio es necesario por dos razones. Primera, esta notación se usa habitualmente en la literatura de gráficas de control de proporciones. Segunda, se genera a continuación una serie de estimaciones de Π y se promedian esas estimaciones. Es conveniente denotar el estimador de Π con P; las estimaciones sucesivas de Π, con p1, p2, p3, . . . , pm, y el promedio de esas estimaciones, con p . Se sabe, con base en el estudio previo de las proporciones muestrales, que la proporción muestral P es un estimador sin sesgo de Π, con varianza Π(1 − Π)/n. En otras palabras, cuando el proceso está bajo control, se tiene:

µP = ∏

σ 2P =

∏(1 − ∏ ) n

σP =

∏(1 − ∏ ) n

En el capítulo 4, se estudia la aproximación normal de la distribución binomial con tamaños muestrales grandes. Aquí, se utilizan esos resultados en la determinación de límites de control de gráficas P. En el supuesto de tamaño muestral grande, los límites de control 3-sigma teóricos de la gráfica P son:

µ P ± 3σ P

CONTROL ESTADÍSTICO DE CALIDAD

663

Como es usual, deben estimarse µP y σP a partir de datos obtenidos cuando se supone que el proceso funciona correctamente. En la estimación de µP y σP, se obtienen m muestras aleatorias, cada una de tamaño n. Sea que Xj representa el número de productos defectuosos en la muestra j. Entonces, Pj = Xj /n denota la proporción de unidades defectuosas en la muestra j. Se estima µP con el valor promedio de estas m proporciones muestrales. En otras palabras: m

m

∑ Pj µˆ P = P =

j =1

m

∑ Xj =

j =1

mn

Advierta que µˆ P es simplemente el número total de unidades defectuosas en las m muestras dividido entre el número total de unidades examinado. Puesto que µP = Π, µˆ P = P es un estimador combinado de Π. Permite combinar los m estimadores P1, P2, . . . , Pm en un solo estimador sin sesgo de Π. Puesto que σP es una función de Π, este parámetro puede estimarse con:

σˆ P =

P (1 − P ) n

Los límites estimados de una gráfica de control 3-sigma son: Gráfica de control 3-sigma de Π

o

µˆ P ± 3σ P P (1 − P ) P ±3 n

La proporción de productos defectuosos en una muestra no puede ser negativa, por lo que el límite de control inferior (LCI) se ajusta a 0 siempre que P − 3 P (1 − P ) / n sea negativa. En este punto, procede un comentario adicional. Parecería un tanto extraño que se quiera declarar como fuera de control un proceso cuando la proporción de productos defectuosos parece ser muy pequeña. Sin embargo, en tales situaciones a veces resulta necesario efectuar una verificación. Quizás ha ocurrido algún cambio que lleve a un proceso de producción mejor que el vigente; sin duda alguna, interesaría descubrir la razón de esa mejora inesperada. También es factible que se obtengan muy pocos productos defectuosos en virtud de las técnicas de inspección deficientes de los operadores, ¡en cuyo caso importa detectar la situación! Que se detenga el proceso o no cuando la proporción observada cae por debajo del LCI es un juicio que debe tomar el ingeniero de control de calidad. El ejemplo 16.3.1 muestra la preparación y uso de una gráfica P. Ejemplo 16.3.1. Una compañía fabrica chips para computadoras. Usa métodos de control estadísticos para vigilar la calidad de los chips fabricados. Se les clasifica como defectuosos cuando se identifica cualquier falla que haga inaceptable el chip para el comprador. A efecto de preparar una gráfica P para vigilar el proceso, se obtienen muestras de 300 chips en cada uno de 20 días laborales consecutivos. El

664

PROBABILIDAD Y ESTADÍSTICA

TABLA 16.3 Muestras de chips de computadora Día laboral 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Número de chips defectuosos 16 8 1 16 9 13 10 14 11 8 6 14 13 14 4 11 4 13 9 12

Proporción defectuosa ( p) 0.053 0.027 0.003 0.053 0.030 0.043 0.033 0.047 0.037 0.027 0.020 0.047 0.043 0.047 0.013 0.037 0.013 0.043 0.030 0.040

Total 206

número y proporción de chips defectuosos identificados cada día aparecen en la tabla 16.3. A partir de esos datos:

µˆ P = p =

20



j =1

xj mn

206 = 20(300) = 0.0343 La proporción estimada de chips defectuosos que se produce es 0.0343, que también es la línea central de la gráfica P. La desviación estándar estimada de P es: p (1 − p) = n = 0.0105

σˆ P =

(0.0343)(0.9657) 300

La sustitución permite obtener el LCS y LCI siguientes: 0.0343 ± 3(0.0105) 0.0343 ± 0.0315 El LCI es 0.0028, y el LCS, 0.0658. La gráfica P con las 20 observaciones usadas en su elaboración aparece en la figura 16.6. Ninguna de las proporciones usadas en la preparación de la gráfica se sitúa fuera

CONTROL ESTADÍSTICO DE CALIDAD

665

LCS = 0 .0658

µˆP = 0 .0343 LCI = 0 .0028 0

5

10

15

20

Número de muestra

FIGURA 16.6 Gráfica P 3-sigma para controlar la proporción de chips de computadora defectuosos que produce una compañía electrónica, con base en un tamaño muestral de 300; el proceso está bajo control en los 20 días usados para preparar la gráfica.

de los límites de control, de modo que la gráfica está lista para usarse. Si en una muestra futura de 300 chips se obtiene proporción muestral superior a 0.0658, se consideraría que el proceso es inestable o está fuera de control y se investigaría la causa del problema. Cuando la proporción muestral es inferior a 0.0028, queda en manos del ingeniero de control de calidad decidir si piensa que la situación justifica una investigación o no.

Gráficas C (número promedio de defectos) En la preparación de una gráfica C, sea que esta variable denota el número de defectos por unidad. Si se piensa que una unidad o elemento representa un “intervalo” continuo de tamaño s = 1, mientras que un defecto de la unidad es un “evento discreto”, entonces C satisface la descripción del capítulo 3 correspondiente a una variable aleatoria de Poisson. El parámetro k relacionado con C es k = λ s = λ . 1 = λ, donde λ denota el número promedio de defectos por artículo. Con base en las propiedades de Poisson antes derivadas, puede verse que:

µC = λ

σ C2 = λ

σC = λ

Así pues, los límites de control teóricos de una gráfica de control 3-sigma son:

µC ± 3σ C o

λ ±3 λ

A fin de estimar λ, se obtiene una muestra de m unidades, seleccionada durante un periodo dado, en el que se supone que el proceso está bajo control. Sea que Cj denota el número de defectos identificado en la j-ésima unidad. Un estimador insesgado de λ es: m

λˆ = C =

∑C j j =1

m ˆ Advierta que λ es el número total de defectos identificados en las m unidades dividido entre el número de unidades muestreadas. Los límites estimados de una gráfica de control 3-sigma son:

666

PROBABILIDAD Y ESTADÍSTICA

Límites de control 3-sigma del número promedio de defectos por unidad

λˆ ± 3 λˆ C ±3 C

Una vez más, si el LCI es negativo se ajusta a 0. A fin de usar una gráfica C de este tipo en el futuro, se obtiene una muestra consistente en una sola unidad y se determina el número de defectos. Si queda fuera de los límites de control, se supone que el proceso se salió de control y se busca la fuente del problema. Ejemplo 16.3.2. En la fabricación de telas sintéticas, se producen grandes rollos de éstas. Luego, se inspeccionan en busca de defectos y se califican como de primera calidad, segunda calidad o inaceptables. En algunas fábricas, se recurre a un sistema de inspección de 100%. Cada metro lineal de tela se examina visualmente en búsqueda de defectos durante el proceso de inspección. El ingeniero de control de calidad tiene interés en desarrollar una forma de controlar los defectos en el proceso de producción, antes de que el material está en rollos para su embarque a los clientes. A fin de preparar una gráfica de control de un telar específico, se obtienen rollos de 500 yardas de material de primera calidad producido en el telar. Se seleccionan 25 muestras de esos rollos, cada una de 1 yarda lineal, y se registra el número de defectos por muestra. En este caso, se considera que cada yarda lineal de la tela es una unidad o elemento. Los datos recopilados se muestran en la tabla 16.4. Sea que C denota el número de defectos por yarda lineal en la tela considerada de primera calidad, y λ, el número promedio de defectos por yarda en telas de esa calidad. En relación con los datos de la tabla, se tiene:

10 λˆ = C = = 0.4 25

TABLA 16.4 Muestras de tela Número de muestra

Número de defectos

1 2 3 4 5 6 7 8 9 10 11 12 13

0 0 0 1 0 0 2 0 0 0 1 0 3

Número de muestra 14 15 16 17 18 19 20 21 22 23 24 25

Número de defectos 0 0 1 0 0 1 0 0 0 1 0 0

CONTROL ESTADÍSTICO DE CALIDAD

667

Los límites de control estimados son: C ±3 C 0.4 ± 3 0.4

o

En este caso, el LCI es negativo. Puesto que resulta imposible observar un número negativo de defectos, se ajusta a 0. Los límites de control de trabajo son 0 a 2.3. En el futuro, se seleccionará, a intervalos elegidos aleatoriamente, una yarda de material conforme salga del telar. En caso de observar más de dos defectos, se detiene la máquina y se verifican sus parámetros.

Las gráficas de control del número promedio de defectos por unidad pueden prepararse con el uso de muestras consistentes en dos o más unidades. Resultan útiles cuando las unidades producidas son pequeñas, de modo que es posible examinar muchas de ellas con cierta rapidez. El ejercicio 15 lleva al lector a la obtención de los límites de control de una gráfica de ese tipo.

16.4

LÍMITES DE TOLERANCIA

En el capítulo 8, se analizan los intervalos de confianza de la media poblacional cuando se supone que las observaciones de muestrales provienen de una población con distribución normal. En el teorema 8.2.2, se define el intervalo de confianza de la media si debe estimarse la varianza poblacional. Aquí, debe mencionarse que ese intervalo es en el que se tiene gran confianza que se ubique la media verdadera µ. Es frecuente, ante todo en las aplicaciones de ingeniería, que interesen las afirmaciones acerca de observaciones específicas. Por ejemplo, podría ser necesario conocer la proporción de valores específicos de la población que se ubican en un intervalo especificado. También podría haber límites de especificaciones tales que interese estimar la proporción de unidades que quedan dentro de esos límites. A continuación, se estudian dos métodos de cálculo de los intervalos de tolerancia. El primero de ellos supone una distribución poblacional normal, mientras que el segundo no considera ninguna distribución en particular (es no paramétrico). Límites de tolerancia de dos lados Los límites de tolerancia de dos lados son valores determinados a partir de un tamaño muestral n, de modo que puede afirmarse con (1 − α)% de confianza que al menos una proporción δ de la población se incluye entre esos valores.

Supuesto de distribución normal Cuando se supone la normalidad, puede verse que el intervalo: (µ − 1.96σ , µ + 1.96σ ) contiene 95% de la población. En la práctica, es usual que se desconozcan µ y σ, de modo que deben estimarse a través de X y S, la media y desviación estándar muestrales. Así pues, el intervalo:

( X − 1.96S , X + 1.96S )

668

PROBABILIDAD Y ESTADÍSTICA

es aleatorio y, de tal suerte, ya no abarca con exactitud a 95% de la población. Sin embargo, puede demostrarse que el intervalo: ( X − KS , X + KS ) abarca δ de la población con confianza 1 − α. Los valores de la constante K se muestran en la tabla XIV respecto de diversos valores de δ y 1 − α. Ejemplo 16.4.1. Se fabrica una cierta máquina de modo que llene cada caja de cereal con 12 onzas. A fin de verificar la precisión de la máquina, un equipo obtiene una muestra de 25 cajas y pesa su contenido. El peso promedio de la muestra es 11.959 onzas, con desviación estándar 0.228. En el supuesto de la distribución normal, calcule un intervalo tal que puede afirmarse, con confianza de 95%, que 99% de la población se ubica entre las observaciones muestrales mínima y máxima. A partir de la tabla XIV, se calcula K = 3.457 con 1 − α = 0.95 y δ = 0.99. Así pues, el intervalo de tolerancia está dado por:

( X − KS, X + KS) que se convierte en:

[11.959 − (3.457)(0.228),11.959 + (3.457)(0.228)] (11.171, 12.747)

En algunos problemas, se necesitan límites de tolerancia de un lado. Dicho de otra manera, hay que determinar el tamaño muestral necesario para que una proporción especificada δ de la población esté entre los valores mínimo y máximo de la muestra.

Límites de tolerancia de un lado Un límite de tolerancia de un lado es un valor mínimo o máximo determinado a partir de una muestra de tamaño n, seleccionado de manera que pueda afirmarse con (1 − α)% de confianza que al menos una proporción poblacional δ excede ese valor mínimo (o es menor que ese valor máximo).

La tabla XV puede usarse para dicho propósito, como se muestra en el ejemplo 16.4.2. Ejemplo 16.4.2. Un fabricante de acumuladores para automóvil desea otorgar una garantía tal que pueda tener confianza de 95% de que 99% de los acumuladores funcione cuando menos durante el periodo de garantía. Suponga que la vida útil de los acumuladores tiene distribución normal. El equipo de investigación selecciona aleatoriamente n = 50 acumuladores y efectúa una prueba de la vida útil de cada uno. Resulta que la vida promedio de la muestra es de 39 meses, con desviación estándar muestral de 3 meses. El límite de tolerancia inferior (de un lado) está dado por: X − KS

En la tabla XV, puede verse que K = 2.863, lo cual lleva a un límite de tolerancia inferior de 30.411. Así pues, parece razonable un periodo de garantía de 30 meses.

CONTROL ESTADÍSTICO DE CALIDAD

669

Intervalo de tolerancia no paramétrico La presentación de intervalos de tolerancia requiere el supuesto de normalidad de la población que sirve para obtener la muestra. Es frecuente que tal supuesto no sea razonable. Por ejemplo, la distribución podría estar desviada a la derecha o izquierda. Sí existe un método no paramétrico, o sea, independiente de la distribución. Estos intervalos suelen ser más amplios, requerir tamaños muestrales más grandes o tener ambas características, con proporción δ y 1 − α especificadas. Puede demostrarse que: P[(Y(1) , Y( n) ) cubre por lo menos δ de la población = 1 − nδ

n −1

+ ( n − 1)δ

(16.1)

n

donde Y(1) y Y(n) denotan los valores mínimo y máximo de la muestra de tamaño n, respectivamente. La tabla XVI contiene los valores para el tamaño muestral necesario, de modo que la proporción poblacional δ se sitúe entre Y(1) y Y(n) con confianza de 1 − α. Ejemplo 16.4.3. En ausencia del supuesto de distribución normal, ¿cuál es el tamaño muestral necesario para que sea posible afirmar, con confianza de 90%, que al menos 95% de la población queda incluido entre las observaciones mínima y máxima (es decir, α = 0.10 y δ = 0.95)? En la tabla XVI, puede verse que se requieren n = 77 observaciones.

Los intervalos no paramétricos se usan de diversas maneras. Una estrategia evidente es encontrar el tamaño muestral necesario para que el intervalo de tolerancia cubra el δ porcentaje de la población con confianza de 1 − α. Otra sería, con un tamaño muestral dado, calcular el nivel de confianza de una proporción poblacional δ especificada para su inclusión dentro del intervalo de tolerancia. Ello puede lograrse al despejar la ecuación 16.1 en relación con diversos valores de n, con δ fija hasta que se obtenga una confianza aceptable.

16.5

MUESTREO DE ACEPTACIÓN

Las técnicas de control de calidad modernas tienden a hacer énfasis en el control de procesos, de modo que no se fabriquen artículos defectuosos; pero otra área importante del control estadístico de calidad es el muestreo de aceptación. Cuando el comprador recibe un lote de productos, debe decidir si lo acepta o no. Es usual que resulte impráctica la inspección de cada unidad del lote. Ello puede deberse al tiempo o costo necesarios para emprenderla; también podría resultar del hecho de que la inspección sea destructiva, en el sentido de que inspeccionar completamente una unidad sea posible únicamente al abrirla o probarla de alguna otra manera que la vuelva inútil. Así pues, la decisión de rechazar un lote debe basarse en pruebas restringidas a una muestra de unidades extraída del lote. Los planes de muestreo considerados a continuación se llaman planes de atributos. En ellos, cada artículo o unidad se clasifica como defectuoso o aceptable. La decisión de rechazar el lote o no hacerlo se basa en el número de productos defectuosos de la muestra. Como puede verse, el muestreo de aceptación es simplemente una adaptación de las pruebas de hipótesis clásicas.

670

PROBABILIDAD Y ESTADÍSTICA

Por principio de cuentas, sea que se denota el número de unidades del lote con N. La proporción verdadera y desconocida de artículos defectuosos del lote se indica con Π. Se acuerda que el lote en su totalidad es aceptable si la proporción de artículos defectuosos Π es menor o igual que un cierto valor especificado Π0. Puesto que la tarea es detectar los lotes inaceptables, se pretende verificar las hipótesis: H0: Π ≤ Π0 H1: Π > Π0

(el lote es aceptable) (el lote es inaceptable)

Es usual que se tome la decisión de rechazar H0 o no al determinar el llamado número de aceptación, que se denota con c. Si el número de artículos defectuosos de la muestra excede c, se rechaza el lote, y en cualquier otro caso se acepta. Como usted sabe, dos tipos de errores pueden cometerse en las pruebas de hipótesis. Podría rechazarse un lote que, de hecho, sea aceptable, con lo que se comete un error tipo I; también podría no rechazarse un lote inaceptable, en cuyo caso el error es tipo II. Alfa, la probabilidad de cometer el error tipo I en este contexto, se llama riesgo del productor, y beta, la de un error tipo II, riesgo del consumidor. Al igual que antes, es posible calcular el valor de α. En este caso, depende del valor específico de Π0, el tamaño muestral n y el tamaño del lote N. Así pues, en el caso particular siempre se conoce el riesgo del productor. A fin de ver cómo se calcula α, considere un lote de tamaño N con proporción defectuosa Π0. Sea que r = N Π0 denota el número de unidades defectuosas. Se selecciona una muestra aleatoria de tamaño n del lote y se considera la variable aleatoria D, el número de artículos defectuosos de la muestra. Esta variable tiene distribución hipergeométrica. Con base en la sección 3.6, se sabe que la función de densidad de probabilidad está dada por:  r   N − r     d n−d  f (d ) =  N   n

donde d es un entero entre máx [0, n − (N − r)] y mín [n, r]. En relación con un número de aceptación c preestablecido, el riesgo del productor está dado por:

α = P[rechazar H 0 | ∏ = ∏ 0 ] = P[ D > c | ∏ = ∏ 0 ]  r   N − r     d n−d  = ∑  N d>c   n Esta probabilidad puede calcularse de manera directa en el caso de muestras relativamente pequeñas. Sin embargo, en la práctica es usual aproximarla con las distribuciones binomial o de Poisson. En la primera, se supone que la probabilidad de “éxito” u obtención de una parte defectuosa es r/N, mientras que en la segunda el parámetro k está dado por k = nr/N. Estas ideas se ilustran en el ejemplo

CONTROL ESTADÍSTICO DE CALIDAD

671

siguiente. Se muestran los tres cálculos. En la práctica, se usaría la probabilidad hipergeométrica y se recurriría a las aproximaciones sólo cuando los cálculos hipergeométricos se vuelvan demasiado engorrosos para ser prácticos. Ejemplo 16.5.1. Una empresa constructora recibe un embarque de N = 20 vigas de acero para su uso en la construcción de un puente. Es imperativo verificar el lote para cerciorarse de que la resistencia a la rotura de las vigas cumple con las especificaciones. El lote se rechaza si parece que más de 10% de las vigas no satisface las especificaciones. Se ponen a prueba: H0: Π ≤ 0.1 H1: Π > 0.1

(el lote es aceptable) (el lote es inaceptable)

Se calcula α bajo el supuesto de que el valor nulo es correcto. En otras palabras, se determina α en la consideración de que el lote contiene en realidad r = N Π0 = 20(0.1) = 2 vigas defectuosas. Puesto que realizar la prueba en una viga precisa romperla, sería impráctico probar cada una del lote. Considérese un tamaño de muestra de n = 5 vigas para prueba. Se rechaza el lote si más de una viga resulta defectuosa. De esta manera, se establece el número de aceptación en c = 1. Note que D sólo puede asumir los valores 0, 1 o 2. El riesgo del productor está dado por:

α = P[ rechazar H0 | ∏ = 0.10] = P[ D > 1 | ∏ = 0.10] = P[ D = 2 | ∏ = 0.10]  2   18      2 5 − 2 =  20    5 Se usa la fórmula de combinación del capítulo 1 para evaluar los términos precedentes y se observa que:

α = 816 / 15 504 = 0.0526 En otras palabras, existe probabilidad cercana a 5% de que la técnica de muestreo lleve al rechazo de un lote aceptable que contenga sólo dos unidades defectuosas, y de 95% de que no se rechace ese lote. Los números usados en el ejemplo son pequeños, de modo que el cálculo basado en la distribución hipergeométrica es sencillo. Con fines comparativos, se aproxima el valor de α mediante el uso de la variable aleatoria binomial X, con n = 5 y p = 0.1. Interesa calcular la probabilidad relacionada con la región de cola derecha de la distribución hipergeométrica, por lo que se aproxima α con la determinación de la probabilidad relacionada con dicha región, de la distribución binomial apropiada. En este caso:

α = P[ D = 2] P[ X ≥ 2] = 1 − P[ X < 2] = 1 − P[ X ≤ 1]

672

PROBABILIDAD Y ESTADÍSTICA

Con base en la tabla I del apéndice A, α 1 − 0.9185 = 0.0815. También es posible aproximar α mediante una variable aleatoria Y de Poisson, con parámetro k = nr/N = 5(2)/20 = 0.5. De conformidad con la tabla II del apéndice A:

α = P[ D = 2] P[Y ≥ 2] = 1 − P[Y < 2] = 1 − P[Y ≤ 1] = 1 − 0.910 = 0.09 Aunque con estas aproximaciones se sobreestima α, ¡no están mal si se consideran los números utilizados!

En relación con un tamaño muestral, tamaño de lote y número de aceptación establecidos, la probabilidad de aceptar un lote depende sólo de Π = r/N, la proporción de unidades defectuosas real del lote. La distribución hipergeométrica puede usarse para calcular esta probabilidad respecto de r = 0, 1, 2, 3, . . . , N. La gráfica de esta probabilidad de aceptación como función de Π se llama curva característica de operación (CO). En el ejemplo siguiente, se demuestra cómo desarrollar e interpretar la curva CO. Ejemplo 16.5.2. Considere el problema descrito en el ejemplo 16.5.1, con N = 20, n = 5 y c = 1. La probabilidad de aceptación del lote depende sólo de su proporción de artículos defectuosos. Se calcula la probabilidad para diversos valores de r y Π con la ecuación:

r  N − r       dn− d  r P aceptar el lote | ∏ =  = ∑ N  d ≤1  N     n  A manera de ejemplo, la probabilidad de aceptar un lote que no incluya artículos defectuosos está dada por:  0   20      0  5  =1  20    5

La probabilidad de aceptar un lote que contenga exactamente una unidad defectuosa es:

 1   19   1  19         0   5   1  4  11 628 + 3 876 + = =1 15 504  20   20      5 5 Se vio ya que la probabilidad de aceptación de un lote que contenga exactamente dos unidades defectuosas es 1 − 0.0526 = 0.9474. Pueden efectuarse cálculos similares para r = 3, 4, 5, . . . , 20. Los resultados de estos cálculos con valores selectos de r se muestran en la tabla 16.5. Con ella, es posible elaborar un boceto rápido que la curva característica de operación de este plan de muestreo, al trazar la proporción

CONTROL ESTADÍSTICO DE CALIDAD

673

TABLA 16.5 r 0 1 2 5 10 15 20

Π

Probabilidad de aceptación

0 0.05 0.10 0.25 0.50 0.75 1.00

1 1 0.9474 0.6339 0.1517 0.0049 0

1.0 1 – α = 0.9474

Probabilidad de aceptación

Riesgo del productor

0.5

β = 0.3 0.1

Riesgo del consumidor

0 Π0 = 0.10

0.2

0.3 Π1 = 0.4 0.5

0.6

0.7

0.8

0.9

0.10

Proporción defectuosa del lote

FIGURA 16.7 Curva característica de operación con N = 20, Π0 = 0.10, c = 1 y n = 5; el riesgo del productor es α = 0.0526, y el del consumidor, β = 0.3, cuando Π = A.

defectuosa del lote contra la probabilidad de aceptación de estos valores selectos y luego unir los puntos con una curva continua. El boceto resultante se muestra en la figura 16.7. El riesgo del productor se calcula al proyectar una línea vertical hacia arriba desde el punto Π = Π0 hasta la intersección con la curva característica de operación. Luego, se proyecta una recta horizontal hasta el eje vertical. Interseca este último en el punto 1 − α. El riesgo del productor (α) es la longitud del segmento de recta desde ese punto de intersección hasta 1, como se observa en la figura 16.7. El riesgo del consumidor (β ) con una alternativa especificada Π1 > Π0 también puede leerse en la curva. Por ejemplo, suponga que interesa determinar la probabilidad de aceptación de un lote cuya proporción verdadera de unidades defectuosas es Π1 = 0.4. Se usa el método de proyección para ver que esa probabilidad es aproximadamente 0.3, como se aprecia en la figura 16.7. Note que β disminuye a medida que aumenta la diferencia entre Π0 y Π1. En otras palabras, es menos probable que se acepte un lote inaceptable conforme se incrementa la proporción de unidades defectuosas.

Como se menciona en análisis previos de las pruebas de hipótesis, la estrategia usual es especificar un valor de α y luego determinar la región de rechazo apropiada. Aquí, se especificaría α y luego se determinaría el número de aceptación que lleva a ese valor α aproximado. De esta manera, se controla el riesgo del productor. Sin embargo, ello podría originar que el riesgo del consumidor sea inaceptablemente alto con tamaños muestrales pequeños. En la práctica, se intenta lograr el equilibrio

674

PROBABILIDAD Y ESTADÍSTICA

entre el riesgo del productor (α) y el del consumidor (β). A tal efecto, se especifica un valor Π1 > Π0 que represente un lote “apenas aceptable”. Por ejemplo, si en realidad se pretende que Π ≤ 0.10, podría considerarse que una tasa de artículos defectuosos de 0.12, sin ser idónea, es por lo menos apenas aceptable. Cuando se especifica N, Π0, Π1, α y β, es posible encontrar una combinación de n y C que satisfaga los valores preestablecidos de α y β. En otras palabras, es factible encontrar una curva característica de operación tal que con Π0 la probabilidad de aceptar el lote sea 1 − α, y con Π1, sea β. Son muchas las fuentes disponibles de curvas características de operación con valores especificados de N, n, α y β. Una de las más usadas es el Military Standard 105D [33].

16.6

MUESTREO DE ACEPTACIÓN DE DOS ETAPAS

En ocasiones, se usan planes de muestreo de aceptación de etapas múltiples. Dichos planes pueden hacer que se requieran tamaños muestrales promedio menores para producir curvas características de operación iguales o similares a las del muestreo de una etapa. Ello reviste importancia si el muestreo es costoso, por ejemplo, cuando es destructivo. En esta sección, se considera el muestreo de dos etapas con tamaño de lote suficientemente grande para que las distribuciones binomial o normal permitan obtener una buena aproximación de la hipergeométrica. En el muestreo de dos etapas, se obtiene una sola muestra. Si el número de unidades defectuosas de la muestra es grande, se rechaza de inmediato el lote y se interrumpe el muestreo. Cuando dicho número es muy pequeño, se acepta sin demora el lote y, una vez más, cesa el muestreo. Sin embargo, en el supuesto de que se considere moderado el número de artículos defectuosos, de modo que no sea evidente una decisión clara, se extrae una segunda muestra. La decisión de aceptar o rechazar el lote se basa en el número total de unidades defectuosas de las dos muestras combinadas. Los términos “muy pequeño”, “grande” y “moderado” se definen en relación con la probabilidad de obtener diversos números de elementos defectuosos. El ejemplo siguiente ilustra el cálculo de una gráfica característica de operación en un diseño de muestreo de dos etapas. Recuerde que dicho cálculo requiere determinar: P[aceptar el lote|Π] = P[aceptar el lote en la primera o segunda muestras|Π] En otras palabras, la gráfica característica de operación es la probabilidad de aceptar un lote en función de la proporción verdadera de unidades defectuosas del lote. Ejemplo 16.6.1. Considere el muestreo de dos etapas siguiente. Se obtiene una muestra de tamaño n1 = 50 y se decide rechazar el lote si el número de unidades defectuosas es de cuatro o más, aceptarlo en caso de que sea 0 o 1, y obtener una segunda muestra en cualquier otro caso. La figura 16.8a muestra la primera etapa del muestreo. En caso de ser necesaria una segunda muestra, de tamaño n2 = 50, se rechaza el lote si el número total de elementos defectuosos de las dos muestras combinadas es de cinco o más y se lo acepta en caso contrario. La regla de aceptación de segunda etapa se ilustra en la figura 16.8b. Advierta que dicha regla puede cambiar de cuatro a cinco, ya que el tamaño muestral aumenta de 50 a 100. En la figura 16.9, se resume el procedimiento de muestreo en su totalidad. Sea que D denota el número de unidades defectuosas obtenidas durante el muestreo. La probabilidad de aceptación si la proporción verdadera de unidades defectuosas es Π está dada por: P[aceptar] = P[aceptar con la primera muestra] + P[tomar una segunda muestra y aceptar]

CONTROL ESTADÍSTICO DE CALIDAD

0

1

2

Aceptar

0

3

4

Repetir muestreo

1

2

675

50

5

Rechazar a)

3

4

Aceptar

5

6

7

100

Rechazar b)

FIGURA 16.8 a) Se usa una regla de decisión tridireccional en la primera etapa de un muestreo de dos etapas; b) se cambia a una regla de decisión bidireccional con la muestra combinada de tamaño 100 en la segunda etapa de muestreo.

Aceptar el lote 0, 1, 2

1 0,

3+

2 3

4

Aceptar el lote

0, 1

Rechazar el lote Aceptar el lote

2+

+

Rechazar el lote Rechazar el lote

n 1 = 50

n 2 = 50

FIGURA 16.9 Plan de aceptación de lote de dos etapas.

El uso de la regla de multiplicación analizada en la sección 2.3 permite expresar esta última probabilidad como: P[tomar una segunda muestra y aceptar] = P[aceptar|tomar una segunda muestra] × P[tomar una segunda muestra] En este ejemplo: P[aceptar ] = P[ D ≤ 1 | n1 = 50, Π] + P[ D = 2 | n1 = 50, Π] P[ D ≤ 2 | n2 = 50, Π] + P[ D = 3 | n1 = 50, Π] P[ D ≤ 1 | n2 = 50, Π]

A manera de ilustración, se calcula en término siguiente la probabilidad de aceptación cuando Π = 0.10. Las probabilidades pueden calcularse mediante la distribución binomial, con n = 5. Las de la tabla 16.6 se determinan con el uso de una tabla binomial ampliada, en la que se enumeran las probabilidades para n = 50 y p = 0.01 a p = 0.10. La tabla binomial no incluye esos valores, por lo que se calculan las probabilida-

676

PROBABILIDAD Y ESTADÍSTICA

TABLA 16.6

Π 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10

Probabilidad de aceptación 1 0.996 0.952 0.833 0.661 0.482 0.328 0.212 0.132 0.080 0.047

des que interesan a partir de la distribución binomial o se las aproxima con la curva normal. La segunda de esas técnicas se muestra a continuación. En esta aproximación, se supone que D tiene distribución aproximadamente normal, con µ = 50(0.1) = 5, σ 2 = 50(0.1)(0.9) = 4.5 y σ = 2.12: P[ D ≤ 1 | n1 = 50, Π = 0.1]

 1.5 − 5 P Z ≤  2.12  

= P[ Z ≤ −1.65] = 0.0495 P[ D = 2 | n1 = 50, Π = 0.1] P[−1.65 ≤ Z ≤ −1.18] = 0.0695 P[ D ≤ 2 | n2 = 50, Π = 0.1] = 0.1190 P[ D = 3 | n1 = 50, Π = 0.1] = 0.1199 La sustitución lleva a:

P[aceptar ]

0.0495 + 0.0695(0.1190) + 0.1199(0.0495)

= 0.0637 Note que esta aproximación es bastante cercana al valor binomial que se muestra en la tabla 16.6. Las ideas descritas para el muestreo de aceptación de dos etapas pueden ampliarse al muestreo de etapas múltiples.

16.7

AMPLIACIONES EN EL CONTROL DE CALIDAD

Modificación de las gráficas de control Los conceptos básicos del control de calidad se analizan en secciones previas. Se cuenta con métodos más refinados que, si bien más complejos, son más sensibles para la detección de cambios en un proceso. Las gráficas de control de Shewhart son sencillas, prácticas y de uso amplio. Sin embargo, lo más probable es que el lector se haya dado cuenta de que esas gráficas llevan a decisiones que se

CONTROL ESTADÍSTICO DE CALIDAD

677

basan únicamente en la muestra más reciente. Una gráfica de control un tanto más compleja, a la vez que más eficiente, utiliza información de muestreos del pasado y la muestra actual. Se llama gráfica de control de suma acumulativa (CUSUM), ya que usa funciones de las sumas acumuladas de las muestras previas y actual. Como podrá suponer el lector, estas gráficas son más sensibles que las de Shewhart a desviaciones pequeñas del proceso. Por añadidura, en muchos procesos se vigilan simultáneamente dos o más variables. También se cuenta con planes de muestreo de variables. Puede encontrarse información adicional acerca de estos procedimientos en [13], [18] y [38]. El aumento reciente en la conciencia de la importancia del control de calidad ha llevado a un renovado interés en la investigación de procedimientos de control de calidad. Algunos de los procedimientos clásicos se han mejorado para obtener diseños de muestreo mucho más sensibles. Por ejemplo, las gráficas de control estudiadas en este capítulo suponen que son constantes el tiempo entre las muestras y el tamaño de las muestras mínimas. La intuición lleva a pensar que sería aconsejable variar el intervalo entre las muestras o incluso el tamaño muestral mismo, de conformidad con el valor de la observación muestral más reciente. Por ejemplo, un valor muestral cercano al preestablecido hace suponer que el proceso está bajo control y, por ende, se estaría dispuesto a esperar más tiempo antes de obtener la muestra siguiente, con el fin de ahorrar costos de muestreo. Por otra parte, un valor muestral actual hasta cierto punto distante del previsto, sin que esté fuera de los límites de control, apuntaría en el sentido de que el proceso se vuelve inestable y, por ende, convendría obtener otra muestra (estudiar de nuevo el proceso) tan pronto como sea posible. Estos procedimientos, que se han investigado formalmente en relación con las gráficas de control de Shewhart y de suma acumulativa, han resultado mucho más sensibles que los de intervalos fijos. Se pide al lector que consulte [1], [8], [42] y [43].

Procedimientos de diseño paramétricos Las gráficas de control son de suma utilidad para detectar cuando un proceso se sale de control. Sin embargo, el objetivo de la producción es reducir la variación de la calidad y todavía mantenerse cerca de los valores ideales (preestablecidos) de las características del producto. En casi todos los procesos de producción, existen dos tipos de variables que causan variación en la calidad de los productos, a saber, factores de control y factores de ruido. Los primeros son variables que pueden controlar los operadores del proceso. Los segundos también son variables, como los factores ambientales y la imperfección en la manufactura, de control difícil o muy costoso. Por ejemplo, suponga que se producen radios de transistores. Se usarían en la playa, bajo la luz ardiente del sol, o en lugares de clima muy frío. En este caso, el productor no tiene control verdadero de la variable, que es la temperatura. Así pues, sería aconsejable que el proceso de producción se diseñe para controlar la variabilidad del producto concerniente al uso que se pretende darle. Taguchi planteó la idea fundamental de que los valores de las variables controlables deben buscarse de modo que se minimice la variación causada por las variables de ruido (incontrolables). Desarrolló un procedimiento de diseño experimental, llamado diseño paramétrico, para reducir la variabilidad de los productos de manera rentable. Es un método que se relaciona con el control de calidad y diseño experimental. Su objetivo es identificar las combinaciones óptimas de parámetros de las variables de control con los cuales las características de calidad tienen sensibilidad mínima a las variables de ruido incontrolables (o al menos de control muy costoso). En pocas palabras, el procedimiento de diseño paramétrico tienen como fin la minimización de la sensibilidad de los productos a

678

PROBABILIDAD Y ESTADÍSTICA

las condiciones externas (como las ambientales), de la variabilidad de los productos resultantes de su uso o deterioro, y de la variación de los productos mismos, de una unidad a otra, con el valor promedio de la característica de calidad cercano al valor previsto (ideal). Vea información adicional sobre esta estrategia de control de calidad en [5], [24], [26], [29], [47] y [48].

RESUMEN DEL CAPÍTULO En este capítulo, se presenta una breve introducción al uso de la estadística en el control de calidad. Los métodos analizados, de uso amplio en empresas, fábricas, gobierno e instituciones educativas, tienen como propósito mejorar la calidad de los bienes y servicios que reciben los consumidores. El capítulo se inicia con un análisis de la idea subyacente a las gráficas de control en general. Luego, se enfoca en cuatro tipos de gráficas de uso actual. Se trata de la gráfica X para el control de la media de una medición y la gráfica R para el de su rango, la gráfica P para el control de proporciones y la gráfica C para el número de defectos por unidad producida. Se definen los límites de tolerancia en productos y se desarrolla un método para identificarlos. El capítulo concluye con un análisis de las técnicas de muestreo de aceptación. Se trata de métodos con los que puede determinarse si un lote de productos que recibe el cliente satisface sus expectativas o no lo hace. Como ingeniero o científico de la computación, encontrará numerosas referencias a los procedimientos de control de calidad en la literatura de su disciplina. También observará que son procedimientos de uso generalizado. El capítulo tiene como objetivo presentar los fundamentos de esos métodos y favorecer una mayor comprensión de por qué revisten importancia en los procesos industriales modernos. Por último, en el capítulo se mencionan y definen términos importantes, que el lector debe conocer, a saber: Control estadístico de calidad Gráfica R Gráfica C Riesgo del consumidor Gráficas de suma acumulativa (CUSUM) Diseño paramétrico Gráficas de intervalo de variables Proceso inestable Gráfica X

Límites de tolerancia Gráfica P Muestreo de aceptación Riesgo del productor Factores de control Factores de ruido Duración de lote Muestreo de aceptación de dos etapas Curva característica de operación

EJERCICIOS Sección 16.1

1. Considere la gráfica de control del ejercicio 7. Calcule la probabilidad de una falsa alarma y la duración de lote promedio si la media verdadera se desvía como se describe a continuación (en cada caso, suponga que no se afecta la variabilidad):

CONTROL ESTADÍSTICO DE CALIDAD

2.

3.

4.

5.

679

a) Se desvía hacia arriba µ en 0.002. b) Se desvía hacia abajo µ en 0.01. c) En promedio, ¿cuánto tiempo se tardaría la detección de las desviaciones descritas en los párrafos a-b si las muestras se tomaran cada 30 min? Considere una gráfica de control 3-sigma de los datos de circuitos de 30 amperes que se mencionan en el ejercicio 3. Calcule la probabilidad de una señal y la duración de lote promedio si la media verdadera se desvía de lo previsto, 30.095, a 30.2. En el supuesto de que sea totalmente indispensable detectar con prontitud una desviación de esa magnitud, ¿piensa que la gráfica en cuestión lo haría posible si el muestreo se efectuara cada hora? Explique su respuesta. ¿Cuál sería la frecuencia de muestreo necesaria para detectar la desviación en no más de media hora, en promedio? Encuentre, para una gráfica de control 3-sigma, la probabilidad de detectar una desviación hacia abajo de magnitud 2σ X . En otras palabras, determine la probabilidad de obtener una señal si la media verdadera se desvía de µ0 µ0 + 2σ X .Determine la duración de lote promedio en este contexto. Un cierto tipo de resistor se fabrica de manera que el valor de la media µ0 sea 5.0, con varianza 22X = 0.0001 , cuando funciona correctamente. Se obtiene cada hora una muestra de cuatro resistores y se verifica para detectar el cambio de µ. Si la media muestral X de cualquier muestra difiere de la media en más de tres errores estándar, se detiene el proceso para corregir el problema. a) Bosqueje la gráfica de control 3-sigma de este proceso a manera de mostrar el valor de la línea central (previsto), además del LCS y LCI. b) Si µ = 5.0, ¿cuál es la probabilidad de que la media muestral X sea mayor que 5.015 o menor que 4.985? c) ¿Cuál es el número esperado de muestras para que la gráfica genere una señal si µ = 5.0? d ) Encuentre la desviación estándar del número de muestras hasta que la gráfica produzca una señal, en el supuesto de que µ = 5.0. e) Si µ = 5.01, ¿cuál es el número esperado de muestras para que la gráfica genere una señal? f ) En el supuesto de que se obtienen muestras cada hora, ¿cuánto tiempo se requiere en promedio para detectar la desviación de µ = 5.0 a µ = 5.01? ¿Cuál sería el tiempo necesario si se obtienen muestras cada 30 y 15 min, respectivamente? Considere una gráfica de control de medias de Shewhart con LCI = µ0 – 2σ X y LCS = µ0 + 2σ X . Suponga que la variable aleatoria medida tiene distribución normal, con media µ0 = 50 y varianza σ 2 = 25 X cuando el proceso está bajo control. Suponga también que se obtienen muestras de tamaño n = 4 y que las medias muestrales X se trazan en la gráfica de control. a) Bosqueje la gráfica de control con inclusión del valor previsto y ambos límites de control. b) Encuentre la tasa de falsa alarma. c) Si la media del proceso se desvía del valor previsto µ0 = 50 a µ = 45, determine el número promedio de muestras necesario para detectar la desviación. d ) Repita la tarea del párrafo c con una desviación a µ = 40.

Sección 16.2

6. En relación con cada uno de los conjuntos de datos de resumen siguientes, calcule los límites de control inferior y superior de una gráfica X 3-sigma ( x y r, cada una de las cuales se

680

PROBABILIDAD Y ESTADÍSTICA

basa en m muestras de tamaño n durante el intervalo en el que se supone bajo control el proceso): a) x = 24.5, r = 2.4, n = 5 b) x = 0.045, r = 0.005, n = 10 c ) x = 8.65, r = 2.15, n = 4 7. Se diseña un cierto proceso de producción en serie de cojinetes de 1/2 pulg de diámetro. Las especificaciones de ingeniería requieren una desviación estándar de 0.02 pulg. Un ingeniero de control de calidad muestrea aleatoriamente cuatro cojinetes por hora durante 20 h. Resultan los datos siguientes:

Hora 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Diámetro de los cojinetes (pulg) 0.481, 0.511, 0.463, 0.495 0.507, 0.486, 0.491, 0.491 0.495, 0.483, 0.480, 0.508 0.511, 0.453, 0.539, 0.494 0.479, 0.510, 0.554, 0.499 0.488, 0.479, 0.497, 0.520 0.511, 0.508, 0.501, 0.510 0.507, 0.522, 0.521, 0.515 0.494, 0.521, 0.503, 0.497 0.522, 0.482, 0.524, 0.477 0.509, 0.501, 0.530, 0.520 0.518, 0.523, 0.470, 0.486 0.490, 0.473, 0.480, 0.500 0.464, 0.498, 0.473, 0.521 0.464, 0.476, 0.513, 0.491 0.504, 0.503, 0.545, 0.501 0.515, 0.508, 0.490, 0.506 0.473, 0.494, 0.503, 0.473 0.513, 0.508, 0.472, 0.497 0.508, 0.512, 0.517, 0.505

a) Calcule el promedio y rango muestrales de cada uno de los 20 periodos y el promedio de rango globales de la muestra combinada. Estime la desviación estándar con base en los rangos muestrales. b) Calcule el LCI y LCS de una gráfica X 3-sigma y trace las 20 medias muestrales. ¿Parece estar bajo control el proceso de producción en cuanto a la media? c) Calcule el LCI y LCS de una gráfica R 3-sigma y trace los 20 rangos muestrales. ¿Parece estar bajo control el proceso de producción en lo referente a la variabilidad? 8. Una compañía electrónica fabrica circuitos para producir 30 amperes. El LCI y LCS de la media de los circuitos con muestras de tamaño 4 resultan ser 33.04 y 27.15, respectivamente. Se estiman dichos parámetros para el rango muestral con los valores 0 y 5.75. Esos límites de control se usan para vigilar los circuitos producidos durante 13 periodos y se obtienen los datos siguientes:

681

CONTROL ESTADÍSTICO DE CALIDAD

Periodo

Mediciones muestrales de amperes

1 2 3 4 5 6 7 8 9 10 11 12 13

30.9, 30.1, 32.9, 32.1 31.8, 32.4, 27.0, 28.6 29.0, 27.2, 28.0, 30.0 26.8, 29.8, 27.4, 32.1 26.8, 27.6, 31.4, 29.2 30.4, 30.4, 34.5, 30.1 31.6, 30.8, 29.0, 30.6 28.4, 29.4, 30.3, 28.5 31.5, 23.5, 37.0, 21.0 25.5, 33.4, 31.0, 20.1 34.5, 29.0, 32.1, 28.3 22.0, 29.5, 24.5, 23.5 29.5, 28.5, 32.5, 33.0

a) Trace las medias muestrales en la gráfica X de los 13 periodos. Analice la calidad del proceso concerniente a la media. b) Trace los rangos muestrales en la gráfica R de los 13 periodos. Analice la calidad del proceso referente a la variabilidad. 9. ¿Por qué reviste siempre importancia usar las gráficas X y R, no sólo la primera de ellas, cuando se usan datos de mediciones en problemas de control de calidad? 10. Prepare una gráfica R 3-sigma de cada uno de los conjuntos de datos de resumen que aparecen en el ejercicio 6. Sección 16.3

11. Una compañía fabricante de tornillos planea implantar un programa de control de calidad para vigilar la resistencia de sus productos a la fractura. Se prueban muestras aleatorias de 200 tornillos en cuanto a las especificaciones de resistencia a la rotura en 20 días laborales consecutivos. Se clasifica como defectuoso todo tornillo que no satisfaga las especificaciones. Las 20 muestras de tamaño n = 200 llevan a la información siguiente: Núm. de muestra

1

2

3

4

5

6

7

8

9

Defectos

6

3

3

1

6

1

3

2

3

10 11 12 13 8

5

3

2

14 15 4

6

16 17 18 19 20 4

6

2

3

7

a) Estime la proporción global de productos defectuosos y la desviación estándar de su estimación. b) Calcule los límites de control 3-sigma superior e inferior de Π y trace las 20 proporciones muestrales usadas en la preparación de la gráfica de control. c) ¿Cuáles cambios haría a la gráfica de control para la vigilancia futura del control de calidad si cualquiera de los valores muestrales trazados estuviera fuera de los límites de control? 12. Una compañía textil desea implantar un programa de control de calidad de una cierta prenda en cuanto al número de defectos en el producto acabado. Se muestrea una unidad de la prenda en cada una de 33 h consecutivas de producción. Los números de defectos por unidad encontrados son los siguientes: Defectos: 5, 1, 7, 1, 0, 2, 3, 4, 0, 3, 2, 4, 3, 4, 4, 1, 4, 2, 1, 3, 4, 3, 11, 3, 7, 8, 5, 6, 1, 2, 4, 7, 3

Calcule los límites de control 3-sigma superior e inferior para la vigilancia del número de defectos.

682

PROBABILIDAD Y ESTADÍSTICA

13. Considere un contexto en el que se seleccionan m muestras de tamaño n. En este caso, m puede ser pequeño, mientras que n debe ser 20 o más. Sea que C denota el número de defectos en la j-ésima unidad de la i-ésima muestra. Se supone que Cij tiene distribución de Poisson con parámetro λ, donde λ representa el número promedio de defectos por unidad cuando el proceso está bajo control. a) Sea que C = Σnj = 1Cij /n, i = 1, 2, . . . , m. ¿Cuál es la distribución aproximada de Ci con base en el teorema del límite central? m

b) Sea que C = ∑ Ci . ¿Cuál es el valor promedio o esperado de C ? i =1

c) Se extraerá una sola muestra de tamaño n en el futuro para vigilar el número promedio de defectos por unidad. El proceso se declarará fuera de control si el número muestral promedio de defectos de la muestra queda fuera de los límites de control. Argumente que los límites de control 3-sigma están dados por:



C n

d ) Explique por qué una gráfica de este tipo podría ser impráctica en el contexto que se describe en el ejemplo 16.4.2. e) Señale un ejemplo de contexto en el que sería práctica una gráfica de ese tipo. Sección 16.4

14. Considere el ejemplo 16.4.1, donde se mide el peso del contenido de 25 cajas de cereal. Encuentre el valor del límite de tolerancia de un lado tal que pueda afirmarse, con confianza de 95%, que 99% de los pesos poblacionales excede el límite de tolerancia. 15. Se diseña una máquina embotelladora para que llene una lata de aluminio con 12 onzas de un cierto refresco. Se selecciona una muestra aleatoria de tamaño n = 75 y se mide con exactitud el contenido de cada lata. La muestra arroja un promedio de 11.9 onzas, con desviación estándar de 0.2 onzas. Suponga la distribución normal y luego: a) Encuentre un intervalo de tolerancia de 95% para 90% de la población. b) Determine un intervalo de tolerancia de 99% para 90% de la población. c) Encuentre un intervalo de tolerancia de 95% para 99% de la población. d ) Calcule un intervalo de confianza de 95% de la media poblacional µ. e) Analice las diferencias en sus respuestas a los párrafos a-d. 16. Sin suponer la distribución normal, encuentre el tamaño muestral necesario para un límite de tolerancia de dos lados con las propiedades indicadas en los párrafos a-d. a) Confianza de 95% para 90% de la población. b) Confianza de 95% para 95% de la población. c) Confianza de 95% para 99% de la población. d ) Confianza de 90% para 95% de la población. 17. Suponga que se toma una muestra aleatoria de n = 40 mediciones de la resistencia a la rotura de un cierto material. La muestra genera una resistencia a la rotura promedio de 1 275 psi, con valor mínimo de 1 210 psi y máximo de 1 450 psi. Sin suponer la normalidad, encuentre el nivel de confianza de 90% de la población que se sitúe dentro de los límites de tolerancia de Y(1) y Y(40).

CONTROL ESTADÍSTICO DE CALIDAD

683

Sección 16.5

18. Suponga que se inspecciona un lote de productos de tamaño N = 100. Considere un plan de inspección de muestreos de n = 20 unidades por lote y el rechazo del lote si se encuentra más de una unidad defectuosa (número de aceptación c = 1). a) Bosqueje la curva característica de operación mediante el cálculo de la probabilidad exacta de aceptar el lote cuando se supone que la proporción verdadera de unidades defectuosas es Π = 0, 0.05, 0.10 y 0.15. b) Si el nivel de calidad aceptable (Π0) de 0.05 y el de calidad apenas aceptable (Π1) es 0.15, calcule el riesgo del productor α y el riesgo del consumidor β. 19. Repita el ejercicio 18, en este caso con la aproximación binomial de la distribución hipergeométrica. Comente la validez de esa aproximación. 20. Repita una vez más el ejercicio 18, en esta ocasión con la aproximación de Poisson de la distribución hipergeométrica. Comente la validez de esta aproximación. Sección 16.6

21. Considere un plan de muestreo de aceptación de dos etapas. En la primera etapa, se obtiene una muestra de tamaño n1 = 10 del lote. Si se observan 0 o 1 defectos, se acepta el lote, y en caso de detectar tres o más defectos, se rechaza. Se obtiene una segunda muestra de tamaño n2 = 10 en caso de observar dos defectos. Si el número acumulativo de defectos (de ambas muestras) es tres o menos, se acepta el lote. Su rechazo ocurre cuando haya cuatro o más defectos acumulativos. a) Bosqueje un diagrama de árbol de este plan de muestreo de aceptación similar al que se muestra en la figura 16.9. b) Use la distribución binomial para calcular la probabilidad de aceptación del lote si la proporción verdadera de defectos es Π = 0.2. c) Calcule la probabilidad de aceptación de Π = 0.1, 0.4 y 0.6, y luego bosqueje la curva característica de operación. d ) ¿Cuál es la probabilidad de que se rechace un lote si la proporción verdadera de defectos es Π = 0.2? 22. Considere el plan de muestreo de aceptación de dos etapas que se define en el ejercicio 21, con n1 = 10 y n2 = 10. Con fines de comparación, considere un plan de muestreo de una etapa con tamaño muestral n = 20, con el que se acepta el lote si tiene tres o menos defectos y se rechaza en caso de haber cuatro o más defectos. a) ¿Cuál plan de muestreo tiene mayor probabilidad de aceptación si Π = 0.2? b) Si Π = 0.4, ¿con cuál plan de muestreo es más probable que se rechace el lote? c) Compare los planes de dos y una etapas en cuanto a las probabilidades de aceptación. 23. Use el procedimiento de aproximación normal para estimar las probabilidades indicadas en la tabla 16.6. Si cuenta con una calculadora o software que le permita efectuar cálculos de probabilidades binomiales para n1 = n2 = 50, verifique las probabilidades de aceptación binomiales dadas en la tabla mencionada.

ÍNDICE

785

ÍNDICE Accidente nuclear, probabilidad, ejemplo, 34 Accidentes en carreteras, ejemplo, 35-37 Adición general, regla, 26-29 Adición, regla. Véase Regla general de la adición Administración total de la calidad, 259 Agrupar en ocasiones, punto de vista, 349 Agua de mar, análisis, ejemplo, 28 Agua, muestras, ejemplo, 231-232 Aguas negras, efluente (efecto), ejemplo, 419-421 Ajuste. Véase Desajuste Alfa (α), 270, 271 valor, 272 Álgebra lineal, 379 Algodón, ejemplo de uso, 71-72 Alias, estructura, 607, 608 Allen, D. M., 486 Almacenamiento económico, ejemplo, 638-639 Aluminio, ejemplo de uso, 274, 175 Aminoácidos, ejemplo, 10, 11 Amnesia postraumática, estudio, ejemplo, 210-211 Análisis de la varianza bidireccional, 585 Análisis de la varianza tridireccional, 612 Análisis de varianza (ANOVA), 511, 541, 557, 614. Véanse también ANOVA unidireccional; ANOVA de tres factores; ANOVA tridireccional; ANOVA bidireccional análisis, 511 determinación. Véase Diseño de tres factores ejercicios de repaso, 569-573 procedimiento, 524 prueba, 573 prueba F, 529 prueba no paramétrica. Véase Clasificación unidireccional respuestas, 768 significación, 586 tabla, 520, 529, 549, 570, 588-590 construcción, 621 demostración, 618 redacción. Véase ANOVA, tabla abreviada terminación, 619 técnicas, 512 Análisis no paramétrico, método, 522 Andel, Tom, 559 ANOVA. Véase Análisis de varianza ANOVA, tabla abreviada, redacción, 620 ANOVA unidireccional, 586 Aproximación, procedimiento, 277 Árbol, diagrama, 5-6 Argumento algebraico repetido, 320 Arimind, John, 571 Arnold, J., 487 Asimetría, 414 ATC. Véase Administración total de la calidad

Atributos, gráfica de control de Shewhart, 662-667 ejercicios, 681-682 respuestas, 776 Atributos, planes, 669 Autobuses de pasajeros (evaluación de neumáticos), ejemplo, 535, 541-542 desgaste de piso, ejemplo, 543-544 Autobuses, ejemplo. Véase Autobuses de pasajeros Automóviles, producción/calidad de acumuladores, 668 defectos, ejemplo, 324-325 tareas de planta, ejemplo, 157-158 uso de equipo de seguridad, ejemplo, 633 Axiomas. Véase Probabilidad Ayles, William, 571 Azufre, contenido, ejemplo. Véase Carbón, vetas Azufre, dióxido cloroplastos (asociación), ejemplo, 636-638 ejemplo, 267 Banda de confianza, 401 Barras de acero (verificación), ejemplo, 671-673 Bartlett, prueba, 522, 560 BASIC, programa, 181 Batería de litio, vida, ejemplo, 195-196 Bayes, reverendo Thomas, 75 Bayes, teorema, 35-37 aplicación directa, 37 ejercicios, 43 respuestas, 730 Bernoulli, ensayos, 59, 70 β. Véanse también Beta; Varianza límites de confianza, 470 valor esperado, 464-465 β0, intervalo de confianza, 399, 469 estimaciones de mínimos cuadrados, 383 estimadores de mínimos cuadrados, 387 distribución, 391-392 β1, intervalo de confianza, 397, 469 distribución, 388-391 distribución (demostración), 389 estimaciones de mínimos cuadrados, 383 estimadores de mínimos cuadrados, 387 β1, límites de confianza, 470 Beta (β), definición, 271 relación. Véase Potencia valor, 272 Binomial puntual, 313 Biomedical Computer Programs (BMDPC), 336 Bit (alternación espontánea), ejemplo, 106-107 Bloqueo, 533 efectividad, 539-542 variable, 544

785

786

PROBABILIDAD Y ESTADÍSTICA

Bloques de motores, ejemplo, 10, 15, 74 Bloques iguales, media, hipótesis nula (prueba), 540 Bloques incompletos, 602 formación. Véase 2p, bloques incompletos Bloques, experimento factorial 24, ejemplo, 602-604 diseño. Véase Diseño de bloques completo aleatorizado efectos, 602 experimentos factoriales 2k. Véase Diseño incompleto de bloques tratamientos, interacción, 536-537 BMDPC. Véase Biomedical Computer Programs Bondad de ajuste, mediciones, 482 pruebas. Véase Ji cuadrada, pruebas de bondad de ajuste Bonferroni, desigualdad, 560 pruebas T, 524-526, 543, 565 pruebas tipo T, 542 Botellas de cerveza, ejemplo de llenado de, 75 C, gráficas (defectos, número promedio), 665-667 Caballero, movimiento, 565 Cables, conexiones/aislamiento (tiempo de inspección), ejemplo, 336-338 Calcio, niveles, ejemplo. Véase Valores de calcio en sangre Cálculos hipergeométricos, 671 Cáncer pulmonar, surgimiento, ejemplo, 630-631 Característica operante, curva, 672, 674 Carbón (contenido de azufre), ejemplo de vetas, 513-515, 521-524, 527-529 Carbón, ejemplo de consumo, 203, 206 Carga de plomo, propiedades, ejemplo, 348-349, 351 Cartas (extracción), ejemplo, 623 ejercicios de repaso, 646-648 respuestas, 776 Caso continuo, cálculo. Véase F, caso continuo Caso de una muestra, 344 Casos unidimensionales, 157 Celdas, ejemplo de exposición, 47-49 Cereal, ejemplo de dispensadores, 668 Cero diferencias, ocurrencia, 284 Cero, covarianza, 169, 466 Cero, vector, 464 Ceros, manejo. Véase Signo, prueba Cero-uno, variables aleatorias, 313 Chebyshev, desigualdad, 118-120, 778, 780-781 ejercicios, 147 respuestas, 737 Chebyshev, P. L., 120 Ck, estadística. Véase Mallow, estadística Ck Clases, separación de datos (reglas), 197 Clasificación unidireccional, 547-550 ANOVA, prueba no paramétrica, 553 diseño, 534, 581 efectos fijos, 550-551 modelo, 538-539 de medias, igualdad, 524 ejemplo, 533

expresión, 516 sustitución, 515 modelos de efectos fijos, 512-522 ejercicios, 557-560 modelo estadístico, 515-516 respuestas, 766 Clasificación, diseño, inclusión de efectos fijos (modelo). Véase Diseño de clasificación bidireccional modelo de efectos fijos. Véase Clasificación unidireccional variables, relación, 628 CO. Véase Característica operativa Coeficiente. Véase Correlación intervalo de confianza, 469-470 Coeficiente de determinación, 425-426. Véase también Determinación múltiple Coeficiente de determinación. Véase Determinación Cola derecha, prueba, 276-277, 281. Véanse también H0; p; p1-p2 Cola izquierda, prueba, 276-277, 281. Véanse también H0; p; p1-p2 rechazo, 318 uso, 283 Combinación lineal, 456 Combinaciones, 9-17 conteo, 14-15 definición, 10 ejercicios, 19-22 número, 14 respuestas, 726-727 técnicas combinatorias, 72 Combustibles fósiles, ejemplo de consumo, 267 Comparaciones. Véanse Comparaciones por pares; Comparaciones en forma de pares Comparaciones por pares, 542-544, 581-586 Computadoras, ejemplo de caída, 626-627 tiempo de impresión del sistema, ejemplo, 276 uso, ejemplo, 15-16, 34, 319-322 Confiabilidad, 125-127. Véanse también Sistemas en paralelo; Sistemas en serie función R, 129. Véase también Variable aleatoria interacción. Véase Distribución Weibull estudios, propiedades, 128-129 Conjuntos, intersección, 7 Constantes desconocidas, 547 Constantes, valor esperado, 54 factorización, 54 Consumidores, riesgo, 670, 674 Contaminación atmosférica, ejemplo de contribución a, 114-117 Conteo. Véanse Combinaciones; Permutaciones introducción, 1 ejercicios de repaso, 23-24 respuestas, 727-729 Contexto binomial, 70 Contingencia, tablas. Véase también 2 × 2, tablas de contingencia uso, 635

ÍNDICE

Contraste definición, 530. Véase también Contraste ortogonal en medias de tratamiento, 530 proceso de definición, 604, 606 ejemplo, 607 pruebas, 530-533 ejercicios, 562-563 respuestas, 766 suma de cuadrados, 531 Contraste ortogonal, definición, 532 Contraste sin repetición. Véase Repetición Control de calidad. Véase Control de calidad estadístico conceptos, 676 extensiones, 676-678 interés, 649 Control de calidad estadístico, 649 método, ejemplo, 663-665 Controladores de tráfico aéreo, ejemplo, 67-68 Convergencia. Véase Series geométricas Copolímeros de bloque (viscosidad), ejemplo, 607-609 Correlación, 169-172, 419-426. Véanse también Correlación positiva perfecta; Correlación lineal simple coeficiente, 423. Véanse también Coeficiente de correlación múltiple; Coeficiente de correlación de Pearson coeficiente de Pearson, 170, 475 ejemplo, 171-172 ejercicios, 186, 434-436 interpretación, teorema. Véase Correlación perfecta límites, teorema, 170, 778, 781-782 respuestas, 740, 762 ρ , 170, 781, 782. Véase también Variable aleatoria Correlación lineal simple, 378 ejercicios de repaso, 436-442 respuestas, 762-763 Correlación múltiple, coeficiente, 475 Correlación perfecta, interpretación (teorema), 170, 778, 782 Correlación positiva perfecta, 170 Covarianza, 167-169. Véanse también Pares de variables; Covarianza cero fórmula de cálculo, 168 interacción. Véase Esperanza CPU, ejemplo de tiempo, 349 Cuadrado de la media esperada, 587. Véase también Tratamiento tabla, 548 Cuadrado medio del error, 519 Cuadrados. Véase Cuadrados latinos identidad, suma, 518, 578 Cuadrados latinos, 544-546 ejercicios, 565-566 respuestas, 767 Curva de campana (curva en forma de campana), 121, 264, 348 Curvas de regresión. Véase Regresión xy

787

Dado, echar, ejemplo, 227, 239-241 Datos. Véase también Datos categóricos análisis, 234, 511. Véase también Datos estadísticos conjunto, 206, 211. Véase también Conjunto de datos reales diseño, 631 ejemplo, 198-199 obtención, 662, 663 por pares, 350 puntos, 200, 211, 227, 381, 486 recopilación, 511 reglas de separación. Véase Categorías variabilidad, medición, 578 Datos estadísticos, análisis, 273 Datos no normales, uso de la prueba T, 280 Datos por pares, 349-351 ejercicios, 367-369 respuestas, 759 uso. Véase Proporción Datos reales, conjuntos, 418 Davies, A., 639 De Moivre, Abraham, 113 Defectos, número promedio. Véase C, gráficas número total, 665 Deming, W. Edwards, 259, 649 Densidad. Véanse también Densidad normal de dos variables; Densidad condicional; Densidad continua; Densidad marginal continua; Densidad marginal discreta; Densidad exponencial; Variable aleatoria geométrica definición. Véase Densidad discreta f. Véanse Variable aleatoria discreta; función de una variable aleatoria. función, 46-47, 68, 156, Véase también Probabilidad condiciones. Véase Densidad discreta deducción, 70 fx. Véanse Variable aleatoria continua; Variable aleatoria independiente; Variable aleatoria bidimensional fxy. Véanse Variable aleatoria continua bidimensional; Variable aleatoria discreta bidimensional, Variable aleatoria bidimensional fy. Véanse Variable aleatoria independiente; Variable aleatoria bidimensional de términos, 100 Densidad binomial, 66, 670 Densidad condicional, 172, 176 caso discreto, 173 definición, 173 ejemplo, 174-176 ejercicios, 136-537 interacción, regresión, 172-176 respuestas, 740 Densidad conjunta. Véase también Densidad continua conjunta definición. Véase Densidad discreta conjunta fxy, 172. Véanse también Variable aleatoria continua bidimensional; Variable aleatoria discreta bidimensional; Variable aleatoria bidimensional independencia, interacción, 156-164 ejercicios, 180-184

788

PROBABILIDAD Y ESTADÍSTICA

respuestas, 739 uso. Véase Promedios de variable única Densidad continua, 98-104 condiciones, 99 definición, 99 ejercicios, 138-141 respuestas, 735 Densidad continua conjunta, 158-159 Densidad discreta conjunta, condiciones, 157 definición, 156 Densidad discreta, definición, 47 función, condiciones, 47 Densidad exponencial, 110 Densidad marginal, 158 definición, 161. Véase también Densidad marginal continua fx, 172. Véase también Variable aleatoria independiente; Variable aleatoria bidimensional fxy, 172. Véase también Variable aleatoria bidimensional fy de densidad marginal. Véase Variable aleatoria independiente producto, 163 Densidad marginal continua, 161 Densidad marginal discreta, 158 Densidad normal. Véase Densidad normal de dos variables Densidad normal de dos variables, 421 Densidades de probabilidad discretas, 46-51 ejercicios, 81-83 respuestas, 730-731 Desajuste, 405-408. Véase también Error debido a desajuste ejercicios, 432-433 respuestas, 762 Desviación. Véanse Desviación aleatoria; Desviación estándar Desviación aleatoria, 578 Desviación de genes, ejemplo, 49-50 Desviación estándar con reemplazo, 315 definición, 57. Véase también Desviación estándar de la muestra estimación, 667 interacción. Véase Varianza propiedades, 57-58 σ, 51, 780 unidades de medición física, 58 Determinación múltiple, coeficiente, 474 Diagrama de tallo y hoja doble, 196 Diferencia significativa mínima. Véase Fisher, diferencia significativa mínima Diferencias aleatorias, 516 Diseño aleatorio. Véase Diseño completamente aleatorizado de clasificación bidireccional Diseño aleatorizado. Véase Diseño completamente aleatorizado Diseño completamente aleatorio de clasificación bidireccional, efectos fijos (inclusión), 574 Diseño completamente aleatorizado, 574 Diseño completo de bloques. Véase Diseño de bloques completos aleatorizados

Diseño de bloques completos aleatorizados, 533-544, 546, 555 ejercicios, 563-565 respuestas, 767 modelo, 535-539 Diseño de bloques incompletos, experimentos factoriales 2k, 601-604 ejercicios, 610-620 respuestas, 770-771 Diseño de clasificación bidireccional recopilación de datos, 575 modelo de efectos fijos (inclusión), 578 Diseño experimental, 511. Véase también Diseño experimental de un solo factor Dispersión, diagrama, 371, 420 Distribución. Véanse también Distribución binomial; Distribución ji cuadrada; Distribución acumulativa; Distribución exponencial; Distribución gamma; Distribución hipergeométrica, Distribución conjunta; Distribución multinomial, Distribución normal; Distribución uniforme; Varianza cálculo. Véanse Media; Distribución t de Student ejercicios de repaso, 306-311 inferencias de medias, 259 introducción, 236 media, pruebas de hipótesis (formas), 276 µ, 226, 242 mediana, pruebas de hipótesis (formas), 283 parámetros, 191 identificación, 107 interacción. Véase Esperanza representación gráfica, 194-202 ejercicios, 213-216 respuestas, 741-742 respuestas, 753-756 simulación. Véanse Distribución continua; Distribución discreta teorema, 260, 778, 783-784. Véase también X valor (promedio), 272 varianza, inferencias, 56-57, 259 ejercicios de repaso, 306-311 pruebas de hipótesis, formas, 280 respuestas, 753-756 σ 2, 242 Distribución acumulativa, 49-51, 101-104 continua, definición, 102 función, 46, 49, 68, 101, 112, 125-126, 201 gráficas, 199-202 tabla, 686, 697-698 Distribución aproximada. Véase Wilcoxon, estadística de rango con signo Distribución asimétrica, 194 Distribución binomial acumulativa, tabla, 686-691 Distribución binomial, 65-70, 273, 674. Véase también Distribución binomial negativa aproximación normal, 621-123 ejemplo, 243 ejercicios, 147-149

ÍNDICE

respuestas, 737 definición, 67 ejercicios, 88-90 propiedades binomiales, 66-70 respuestas, 732-733 uso, 74 Distribución binomial negativa, 70-72 definición, 71 ejercicios, 90-91 función generadora de momentos, 71 propiedades binomiales negativas, 70-72 Distribución conjunta, 156. Véase también Distribución continua conjunta respuestas, 740-741 ejercicios de repaso, 188-190 k, poblaciones, 517, 533 medias, 512, 524 k, poblaciones específicas, 517 k-1 grados de libertad, 522, 625. Véase también Distribución ji cuadrada k-1 grados de libertad sencillos, 533 Distribución continua, 98, 282 ejercicios de repaso, 153-155 respuestas, 737-738 simulación, 134 supuesto, 283 Distribución continua conjunta, 158-163 Distribución de frecuencias acumulativa, 199 Distribución de grupos sanguíneos, ejemplo, 37 Distribución discreta, respuestas, 734-735 simulación, 78-80 ejercicios, 94-95 Distribución exponencial, 107, 110-112, 194, 211 ejercicios, 143-145 respuestas, 736 Distribución gaussiana, 113 Distribución geométrica, 59-61, 653 definición, 60 ejercicios, 86-88 función generadora de momento, interacción, 58-65 respuestas, 731-732 usos, 652 Distribución hipergeométrica, 72-75. Véase también Variable aleatoria aproximación de Poisson, 683 definición, 73 ejercicios, 91-92 parámetro N, 73 parámetro n, 73 parámetro r, 73 propiedades hipergeométricas, 72-75 respuestas, 733 Distribución ji cuadrada acumulativa, tabla, 686, 695-696 Distribución marginal, 158-163, 422. Véanse también Distribución marginal continua; Distribución marginal discreta Distribución marginal continua, 158-163

789

Distribución marginal discreta, 158 Distribución multinomial, 623-625 ejercicios, 640-641 respuestas, 775 Distribución normal, 113-118, 235, 667. Véanse también Distribución normal supuesta; Distribución normal estándar definición, 113 ejercicios, 145-147 respuestas, 736-737 media µ, 236, 241, 260-261, 266 muestreo, 265 varianza σ 2, 236, 241, 260-261, 266 Distribución normal de dos variables, 190, 422 Distribución normal estándar, 115-118 Distribución normal supuesta, 667-668 Distribución uniforme, 104, 141-142, 235. Véase también Distribución uniforme discreta Distribución uniforme discreta, 87 Distribuciones discretas, 45 ejercicios de repaso, 95-97 DNA-RNA, ejemplo del código, 12 Dos colas, prueba, 275-277, 281, 525. Véanse también H0; p; p1-p2 uso, 283 Dos colas, valor de P, 275 Dos etapas, esquema de muestreo, 674 ejemplo, 674-676 Dos etapas, muestreo de aceptación, 674-676 ejercicios, 683 respuestas, 777 Dos factores, análisis. Véase Varianza diseño, 587, 598 interacciones, agrupaciones, 708 2k, diseño, 598 combinaciones de tratamiento, 604 ejercicios, 615-619 experimentos. Véase Experimentos simétricos 2k experimentos factoriales, 590-601, 603. Véase también Diseño de bloques incompletos respuestas, 769-770 técnicas computacionales, 599-601 Dos medias comparación, 336 ejercicios de repaso, 372-377 respuestas, 759-761 diferencia, estimador puntual, 337 tecnología, 355-357 Dos muestras, problema, 350 2p, formación de bloques incompletos, 602-604 2 × 2, tablas de contingencia, 627, 631 Dos proporciones, comparación prueba de hipótesis, 322-325 ejercicios, 331-333 respuestas, 757 estadística de prueba, 324

790

PROBABILIDAD Y ESTADÍSTICA

2-sigma, gráfica de control, 635, 654 gráfica de control de Shewhart, 655 Dos variables, modelos, 432, 483, 485 Dos varianzas comparación, 336 ejercicios de repaso, 372-377 respuestas, 759-761 tecnología, 355-357 Douglas Jr., Gordon, 375 DSM. Véase Fisher, diferencia significante mínima Duncan, D. B., 526 Duncan, procedimiento, 586 prueba de rango múltiple, 526-529, 542 Ecuación de regresión ajustada, 481 Ecuaciones normales, 383, 453-456. Véase también Regresión lineal múltiple, modelos solución, 456-457 Efecto promedio, 592 Efectos aleatorios, modelos, 513, 547-550, 587-589 Efectos de medias agrupadas, 517 Efectos fijos, 533 inclusión. Véase Diseño completamente aleatorio de clasificación bidireccional; Diseño de clasificación bidireccional experimento, análisis, 587 modelo, 547, 587. Véase también Clasificación unidireccional Eficacia relativa, 540-541 Electricidad (demanda máxima), ejemplo, 46 Eliminación hacia atrás, procedimiento, 483-484 Emerson, W. H., 361 Enfoque clásico. Véase Probabilidad Enfoque personal. Véase Probabilidad Ensayo multinomial, 629 definición, 623 Equipos de seguridad, uso, ejemplo. Véase Automóviles ER. Véase Eficacia relativa Eric, M., 487 Error aleatorio, 547 Error cuadrático medio, 482, 529 Error debido a falta de ajuste, 406 Error estándar, definición. Véase Media Error experimental, 406 Error puro, 406 Error tipo I, 269, 652 cometer un, 655 definición, 270 Error tipo II definición, 269, 271 resultado, 655 ESC. Véase Suma de los cuadrados del error Escalonamiento, método, 484-486 Espacios. Véase Espacios muestrales Espacios muestrales, 5-9 espacios, 5-9 ejercicios, 18-19 respuestas, 725-726

definiciones, 5 Desviación estándar de la muestra, 202, 350 definición, 205 Esperanza. Véase también Esperanza matemática covarianza, interacción, 164-169 ejercicios, 184-185 respuestas, 739-740 distribución de parámetros, interacción, 51-58, 105-107 ejercicios, 83-86, 141-143 respuestas, 731, 736 reglas, 54, 226, 464 uso, 465 reglas de matrices, 464 Esperanza matemática, 51-52 Estadística, 238, 314. Véanse también Estadística descriptiva; Localización; Estadística de muestras desarrollo, 625 evaluación, 194 comportamiento, 205 consideración, 285 requisitos, 576 valor observado, 339 Estadística aplicada, 67 Estadística descriptiva, 191 ejercicios de repaso, 220-224 respuestas, 744-747 Estadísticas muestrales, 202-207 ejercicios, 216-219 respuestas, 742-743 valores, 204 Estandarización procedimiento, 115 teorema, 115 prueba, 234 Estimación. Véanse Estimación puntual; Regresión, línea de Estimación, 225. Véanse también Intervalo; Estimación de mínimos cuadrados; Modelo; Parámetro; Estimación puntual; σ 2 ejercicios de repaso, 254-258 respuestas, 749-750 Estimación puntual, 225-228 desventaja, 233-234 ejercicios, 225, 244-248 muestras independientes, 336-338 ejercicios, 358-359 respuestas, 758 respuestas, 747-748 Estimador, 387, 519, 660. Véanse también Intervalo; Verosimilitud; Máxima verosimilitud; p; ρ; σ 2 combinación, 663 deducción, 229 definición. Véase Estimador insesgado propiedades. Véase Estimadores de mínimos cuadrados uso, 227 varianza, determinación, 471 Estimador agrupado. Véase p Estimador puntual, 233, 313, 337, 422. Véanse también p; p1-p2; Dos medias

ÍNDICE

Estimador sin sesgo, 260, 324, 338, 389-390. Véanse también Media; µ1-µ2 aporte, 262 definición, 226 obtención, 519 uso, 531. Véase también σ2 Estudio controlado, 380 Estudios de observación, 379, 380 Estudios estadísticos, 68, 259 Evaluación integral, ejemplo, 108-109 Evento discreto, 665 Evento matemático, 7 Eventos. Véanse Evento matemático; Eventos de muestras colección finita, 33 definición, 6. Véanse también Eventos independientes; Eventos mutuamente excluyentes independencia, definición. Véase Eventos múltiples número de ocurrencias, 77 probabilidades, asignación, 3-4 probabilidad de ocurrencia, 5, 29 recopilación, prueba, 74 Eventos físicamente independientes, 31 Eventos independientes, 31. Véase también Eventos físicamente independientes definición, 32 Eventos múltiples, independencia (definición), 33 Eventos mutuamente excluyentes conjuntos, 25-26, 36 efinición, 9 Éxito, 652 probabilidad, 71, 624, 662 Experimentación, orden, 511 Experimento. Véanse también 2k, experimentos factoriales; Experimentos factoriales; Experimentos factoriales fraccionarios; Experimentos factoriales de modelo mixto; Experimentos factoriales de modelo aleatorio descripción física, 9 restricción, 12 Experimento bidireccional, 590 Experimento, tasa de error de tipo, 525-526, 529 Experimentos 2k simétricos, 590 Experimentos factoriales, 574. Véanse también 2k, experimentos factoriales; Experimentos factoriales fraccionarios; Experimentos factoriales de modelo mixto; Experimentos factoriales de modelo aleatorio respuestas, 773-775 ejercicios de repaso, 621-622 Experimentos factoriales fraccionarios, 604-609 análisis, ejemplo, 607-609 ejemplo, 605-607 respuestas, 771-772 ejercicios, 620 Experimentos multifactoriales, 512 ez, expansión de la serie de Maclaurin, 63, 75 F, caso continuo, cálculo, 102 f, obtención, 104 F, distribución, 338-342

791

definición, 339 ejercicios, 359-361 propiedades, 340-341 tabla, 686, 704-714 respuestas, 758 F, prueba, 356, 524, 598. Véase también Análisis de varianza lógica, 475-476 supuestos. Véase Varianzas iguales F, razón, 477, 539, 581 examen, 586 formación, 587 numerador, uso, 598 rendimiento, 548 uso, 585, 588 Factor de corrección, 596 Factor k, diseño, 590 Factor único, diseño experimental, 512 Factores (efecto), ejemplo, 604 Factores de control, 677 Factoriales. Véase Factoriales asimétricos Factoriales asimétricos, 590 Falsa alarma, 654 tasa, 651 Falla ligera, 106-107 Fármacos, comparación, ejemplo, 54-55 acción (costo unitario), ejemplo, 447-448, 461-462 uso, ejemplo, 53-54 Fisher, R. A., 229 Fisher, transformación, 424 diferencia significante mínima (DSM), 526 prueba exacta, 630 Fórmula de cálculo. Véase σ 2 Fracaso, 652 densidad, 125 f, 129. Véase también Probabilidad de una variable aleatoria tasa, 653 Frecuencia. Véase también Frecuencias esperadas aproximación. Véase Histograma de frecuencia relativa 199. Véase también Frecuencia relativa ojiva. Véase Ojiva de frecuencia acumulativa relativa Frecuencia acumulativa relativa, ojiva, 201 Frecuencia cardiaca, ejemplo, 53-54 Frecuencia relativa enfoque. Véase Probabilidad aproximación, 4 histograma, 199 Frecuencias de clases, comparación, 625 Frecuencias esperadas, 626, 630 cálculo, 632 Frecuencias esperadas de celdas, estimación, 635 Friedman, estadística, 555 prueba, 553, 555-556 Función exponencial, 63 Función generadora de momento normal, teorema, 114, 778-780 Función generadora de momentos geométricos, definición, 62

792

PROBABILIDAD Y ESTADÍSTICA

Función lineal, 530 distribución, 251 Función masa. Véase Probabilidad Función monótona, 131 Fundidoras (seguridad), ejemplo, 323 Gamma, densidades, gráfica, 110 Gamma, distribución, 107-113, 194, 235 definición, 109 ejercicios, 143-145 muestra aleatoria, ejemplo, 230 respuestas, 736 teorema, 109, 778, 779 Gamma, función, 107 definición, 108 propiedades, 108 teorema, 109, 778, 779 Gamma, variable aleatoria, 110-112, 779 media, 109 parámetro α, 109 parámetro β, 109 varianza, 109 Gas perfecto, ley, 1-2 Gases, constante, 1 ley. Véase Gas perfecto, ley Gasolina (concentración de plomo), ejemplo, 100-101, 103 Gasolina, rendimiento, peso del automóvil, ejemplo, 477 peso del automóvil/temperatura, ejemplo, 444, 449-450, 452-453, 468-469, 477 peso del automóvil específico/temperatura, ejemplo, 471472, 474 conducción urbana, ejemplo, 403-405 Gauss, Carl Frederich, 113, 229, 242 Glóbulos blancos, cuenta, ejemplo, 77-78 Gowd, T., 93 Grado p, modelo polinomial, 444-448 Grados de libertad. Véase Libertad Gráficas media. Véase X propiedades. Véase Gráficas de control Gráficas. Véanse Gráficas de caja; Gráficas residuales; Gráficas de tallo y hoja Gráficas de caja, 207-212, 411-417 respuestas, 743-744 construcción, 209-212 ejemplo. Véase Residuo ejercicios, 219-220 Gráficas de control, 649. Véanse también 2-sigma, gráfica de control; 2-sigma, gráfica de control de Shewhart; 3sigma, gráfica de control; 3-sigma, gráfica de control de Shewhart; Suma acumulativa; Shewhart, gráfica de control R tabla de constantes, 686, 720 desarrollo, 650 modificaciones, 676-677 propiedades, 650-655 respuestas, 776 ejercicios, 678-679

Gray, David M., 301 Gross, A. Christopher, 301 Grupo, estudio (selección aleatoria), ejemplo, 627-628 H0, prueba de cola izquierda, 280, 283, 323, 346, 352 prueba de cola derecha, 280, 233, 318, 323, 339, 346, 352 pruebas, 516-522, 539, 578-581 ejemplo, 531-532 estadística de prueba, 318 prueba de dos colas, 280, 283, 323, 339, 346, 352 Heaton, B. S., 572 Hegland, D., 290 Hemsley, D. J. C., 293 Herramientas diagnósticas, 409 Hidrocarburos, ejemplo, 114-117 Hignett, B., 93 Hijos, ejemplo de determinación del género, 29-30 Hipótesis. Véanse también Hipótesis alternativa; Hipótesis nula; Hipótesis de investigación ejercicios, 295-298 formas. Véase Distribución interacción. Véase Intervalo de confianza lineamientos, 268-269, 673 procedimiento, 272 pruebas. Véanse Media; ρ; Varianza pruebas de hipótesis, 268-273, 394, 451, 652. Véanse también Modelo; Dos proporciones respuestas, 751-752 resultados finales, posibilidades, 269-273 Hipótesis alternativa, 268, 276 Hipótesis nula, 268, 284, 350, 473. Véase también Independencia declaración, 635 expresión matemática, 634 formación, 637 independencia, 629 interacción, 579 nivel de asociación, 634, 637 pruebas, 531, 579-581. Véase también Tratamiento igual rechazo, 269-272, 275, 343, 395, 585-586 uso, 318, 323 Histogramas, 196-197. Véanse también Frecuencia; Frecuencia relativa Homogeneidad, prueba r × c, 636-638 prueba, 635, 636 Humedad, efecto, ejemplo. Véanse Mirogrex; Temperatura/ humedad interacción de evaporación de solventes, ejemplo, 384-386 regresor/solvente, interacción de evaporación, ejemplo, 458-460, 477-481 Humphries, Coronel John G., 335 Iacopi, Robert, 93 Identidad, suma. Véase Cuadrados Incertidumbre, grado, 2 Independencia, 163-164 caracterización, 30

ÍNDICE

definición. Véase Eventos múltiples hipótesis nula, 331 interacción. Véase Densidad conjunta pruebas, 32, 627-633 ejercicios, 641-643 respuestas, 775 prueba r × c, 631-633 regla de multiplicación, interacción, 30-35 ejercicios, 41-43 respuestas, 729 Indicadores, uso, 477-481 ejercicios, 503-506 respuestas, 765 Inductor enzimático (3-metilcolantreno), ejemplo, 489-492 Infecciones, ejemplo, 35 Inferencias. Véanse Distribución, Media estimada; Intercepción; Proporción; Valor pronosticado único; Pendiente Inmunología, ejemplo, 45-46 Integración, regiones, 781 Interacción. Véanse también Interacciones de cuatro factores; Interacciones de orden superior; Interacciones de tres factores; Interacciones tridireccionales conjunta. Véase Interacciones de dos factores efecto, 592 Interacciones de cuatro factores, 608 Interacciones de orden superior, 604-605 Interacciones generalizadas, 604, 606 Interacciones tridireccionales, 604 Intercepción. Véase también inferencias en la región lineal Intercuartiles, rango, identificación. Véase Muestra Intervalo, 76, 98 definición. Véase Intervalo de confianza estimación, 237-243, 469-472. Véase también ρ ejercicios, 253-254, 500-502 respuestas, 764 estimador, 234 Intervalo de confianza. Véanse también β0; β1; Coeficientes; Media estimada; Media; µ; µ1-µ2; µY | x; p; p1-p2; ρ; σ 2; Intervalos de confianza simultáneos; Intervalos de confianza tipo Z construcción, 263 deducción, 314 definición, 237 desarrollo, 338 estimación, prueba de hipótesis (interacción), 394-405 ejercicios, 430-432 respuestas, 761-762 identificación, 338 límites superiores, 260 longitud, 241 obtención, 399 rendimiento, 315 Intervalo de confianza unilateral, 289, 293 Intervalo de tolerancia no paramétrico, 669 Intervalos de confianza simultáneos, 529-530 Intervalos no paramétricos, 669 Investigación, hipótesis, 268

793

Jacobianos identificación, 137 notación, 176 valor absoluto, 178 Ji cuadrada, distribución, 107, 112-113, 194, 343 aproximación, 522 definición, 112 ejemplo, 113 ejercicios, 143-145, 641 estadística, 625, 638 k – 1 grados de libertad, 554, 625 n grados de libertad, 784 n – 1 grados de libertad, 260, 341, 783 n – 2 grados de libertad, 394 tabla. Véase Ji cuadrada, tabla de distribución acumulativa familia, 112 pruebas de bondad de ajuste, 625-627 respuestas, 775 respuestas, 736 valor negativo, ocurrencia, 260 variable aleatoria, 340, 783. Véase también Ji cuadrada, variable aleatoria independiente uso, 633 Juntas (pre-recubrimiento), ejemplo, 317 Kramer, C. Y., 527 Kruskal-Wallis, prueba, 553-555 uso, 568 Lalich, J., 93 Laplace, Pierre Simon, 113, 242 Larson, C., 487 Lawton, E. A., 89 LCI. Véase Límite de control inferior LCS. Véase Límite de control superior Leemis, Lawrence, 135 Leucemia mieloblástica aguda, ejemplo, 237238 Libertad, grados, 263, 264, 278, 340, 587. Véanse también Distribución ji cuadrada; k-1 grados de libertad; N-k grados de libertad; Distribución T asociación, 630. Véase también Estadística de prueba número, 347, 540, 630 grados de Smith-Satterthwaite, 348 Límite de control, 665. Véanse también Límite de control inferior; Límite de control superior cálculo, 658 determinación, 655 valores, 653 Límite de control inferior, 651-653, 658-659, 663-667, 679680 Límites. Véase Límites internos; Límites externos noción, 210 Límites de confianza, 350. Véanse también β; βI; µ1–µ2; µY | x construcción, 349 deducción, 345 Límites de control superior (LCS), 651-653, 658-660, 679680

794

PROBABILIDAD Y ESTADÍSTICA

Límites de tolerancia, 667-669. Véanse también Límites de tolerancia unilaterales; Límites de tolerancia bilaterales ejercicios, 682 respuestas, 777 tamaño de muestra, tabla. Véase Límites de tolerancia bilaterales Límites de tolerancia bilaterales, 667 factores, tabla, 686, 722 Límites de tolerancia no paramétricos (tamaño de muestra), tabla. Véase Límites de tolerancia no paramétricos bilaterales Límites de tolerancia no paramétricos bilaterales (tamaño de la muestra), tabla, 686, 724 Límites de tolerancia unilaterales, 668 factores, tabla, 686, 723 Límites externos, 209 Límites internos, 209 Línea de regresión ajustada, 392, 408 Linealidad, datos, 386 Linealización, 493 Líneas de montaje, ejemplo de rendimiento en, 283-284 Liss, I., 85 Localización. Véase Mediana; Localización mediana truncada estadísticas, 203-204 parámetro, 54, 107 prueba no paramétrica, 282, 284 Longitud de corrida (Run length), distribución, 652-655 Llegada de vuelos a aeropuertos, ejemplo, 79-80 MacKay, Colin A., 434 Maclaurin, serie, 75 expansión. Véase ez Macrocontaminantes, 301 Major, J. B., 161 Mallik, Azim, 648 Mallow, estadística Ck, 486, 496 Mamíferos (toxicidad en), ejemplo, 487 Máquinas expendedoras de bebidas, ejemplo, 656-658, 660662 Marshall, Jeff, 301 Materiales de conductores eléctricos, ejemplo, 341342 Matriz. Véanse también Modelo; Submatriz; Matriz de varianza-covarianza álgebra, reglas, 467 cálculo, 454 ejemplo, 456-457 enfoque. Véase Mínimos cuadrados forma, 447, 451, 551. Véase también Modelos de diseño formulación, 453. Véanse también Modelo polinomial; Regresión lineal simple notación, 454 operaciones, 456 reglas. Véanse Esperanza; Varianza Máxima verosimilitud estimadores, 230-232

método, 229-233 ejercicios, 248-251 respuestas, 748 R2 máxima, método, 486 McMillan, T., 85 McNemar, prueba, 638-639, 647 Media estimada inferencias, 399-401 intervalo de confianza, 470-472 respuesta, 446 Media(s). Véanse también Variable aleatoria gamma; poblaciones k; Población; media de la muestra; Tratamiento comparación, 342-351. Véase también Dos medias ejercicios, 361-369 respuestas, 758-759 definición. Véase Muestra distribución, estimación, 262-268 ejercicios, 290-295 efecto. Véase Media agrupada, efecto estimación, 262-268 ejercicios, 290-295 respuestas, 750-751 formas. Véase Distribución identificación. Véase Variable aleatoria geométrica intercambiables. Véase Valor esperado intervalo de confianza, 237-242, 266-268 pruebas de hipótesis, 275-280 ejercicios, 299-303 respuestas, 752-753 tamaño de la muestra, tabla, 686, 701-702 vigilancia, 651-652 Mediana. Véanse Variable aleatoria; Muestra pruebas de hipótesis, formas. Véase Distribución localización, 204, 208. Véase también Localización mediana truncada prueba con signo, 282-285 Mediana truncada, localización, 208 Mediciones repetidas, 405-408 ejercicios, 432-433 respuestas, 762 Mediciones, gráficas de control de Shewhart (uso), 655-662 ejercicios, 679-681 respuestas, 776 Medidas poblacionales teóricas, 517 Memoria cantidad (comparación), ejemplo, 354-355 producción/calidad de chips, ejemplo, 663-665 Método de máxima similitud. Véase máxima similitud Método de momentos. Véase Momentos Métodos no paramétricos, 669. Véase también Alternativas de análisis alternativos, 282-287, 351-355, 553-556 ejercicios, 305-306, 369-372, 567-571 respuestas, 753, 759, 767 Microondas, exposición a radiaciones con hornos de, ejemplo, 276 Milton, J., 85

ÍNDICE

Mínimos cuadrados enfoque matricial, 451-462 ejercicios, 497-499 respuestas, 763-764 estimación, 382-386 estimaciones, 446, 456. Véanse también β0; β1 estimadores. Véanse también β0; β1 ejercicios, 429-430 impacto, 495 propiedades, 386-394, 462-469 ejercicios, 499-500 respuestas, 761, 764 método, 382 procedimientos. Véase Modelo resultados teóricos, resumen, 393 vector, 465 MINITAB, 386 paquete, ejemplo, 357 salida, 357, 376 uso, 196, 199, 208 Mirogrex (efecto de temperatura/humedad), ejemplo, 594-597 MODEL 1 (SAS), 585 Modelo. Véanse también Modelo lineal general; Regresión lineal múltiple, modelos descripción, 380-382 ejercicios, 427-429 estimación, 380-386 matriz forma. Véase Modelos de diseño formulación. Véase Modelo polinomial parámetros. Véase Modelo lineal general procedimientos de ajuste de mínimos cuadrados, 443-451 ejercicios, 496-497 supuestos, 547, 578. Véase también Regresión lineal simple Modelo aleatorio de experimentos factoriales, 537-590 ejercicios, 614-615 respuestas, 769 Modelo cúbico, 445 Modelo de efectos mixtos, 587, 590 Modelo estadístico, 2, 512. Véase también Clasificación unidireccional Modelo exponencial, ejemplo, 32-33, 45 Modelo lineal. Véase Modelo lineal general Modelo lineal general, 443, 444, 454 caso especial, 460 parámetros del modelo, 460 Modelo mixto, experimentos factoriales, 587-590 ejercicios, 614-615 respuestas, 769 Modelo polinomial, 443. Véase también Grado p formulación de matriz, 460-462 Modelo recíproco, ejemplo, 494-495 Modelo tridireccional. Véase Modelo tridireccional restringido Modelo tridireccional restringido, 614 Modelos de diseño, forma matricial, 550-553 ejercicios de repaso, 567 respuestas, 767

795

Modelos no lineales, 492 Momentos definición. Véase Momentos ordinarios método, 229-233 ejercicios, 248-251 respuestas, 748 método. Véase θ, estimación Momentos, función generadora de, 61-65, 68, 234. Véanse también Distribución binomial negativa; definición de variable aleatoria 62. Véase también Función generadora de momentos geométrica interacción. Véase Distribución geométrica media, 124 mx (t), 234-236 my (t), 234, 235 técnicas, uso, 115 teorema. Véase Función generadora de momentos normal uso, 114 Momentos ordinarios, definición, 62 µ, intervalo de confianza, 241, 266, 469 µ1 – µ2 estimador sin sesgo, 338 intervalo de confianza, 342-345 límites de confianza, 350 µY | x límites de confianza, 471 intervalo de confianza, 399 Muestra. Véanse también Muestras independientes; Observaciones definición, 2. Véase también Rango intercuartil de una muestra aleatoria espacio, 7, 9, 67 eventos, 5-9 definición, 5 ejercicios, 18-19 respuestas, 725-726 identificación, 207-209 media, 202, 228, 350, 576 definición, 203 estimación, 667 mediana, 202, 204, 207 necesaria, 669 proporción, 313 puntos, 26 expresión, 67 probabilidades, 66 rango, 202 definición, 206 uso, 656 tamaño, 522, 587. Véase también p consideraciones, 280 n, 285-286. Véase también Muestra aleatoria requisitos, 294 Muestra aleatoria, 235. Véase también Muestras aleatorias independientes definición, 192 ejemplo. Véase Distribución gamma

796

PROBABILIDAD Y ESTADÍSTICA

media µ, 260 tamaño n, 270, 226, 228, 242, 261, 283 término, 193 varianza σ 2, 260 Muestras aleatorias independientes, 325, 512, 334 Muestras independientes, 638. Véase también Estimación puntual Muestreo, 625, 651. Véanse también Muestreo de aceptación; Muestreo destructivo; Distribución normal; Muestreo aleatorio; Muestreo de una sola etapa, muestreo de dos etapas con reemplazo, 72 Muestreo aleatorio, 191, 194 ejercicios, 212-213 respuestas, 741 Muestreo de aceptación, 650, 669-674. Véase también Muestreo de aceptación de dos etapas ejercicios, 683 respuestas, 777 Muestreo de una etapa, 674 Muestreo destructivo, 674 Multicolinealidad, 495 Multiplicación interacción. Véase Independencia principio, 10 garantía, 16 uso, lineamientos, 11-14 regla, 34-35, 72 n términos, suma, 51 Neumáticos, evaluación, ejemplo, 535 Nitrato, ejemplo de valores, 423-424 Nivel crítico, 274 Nivel de significancia definición, 270 expresado, 275 nivel, 526 α, 285 nivel α, 278 nivel b/c, 526 nivel descriptivo, 274 pruebas, 270, 273-275 ejercicios, 298-299 respuestas, 752 uso, ejemplo, 279-280 pruebas, 274. Véase también Media realización, 346 resultados, 277 probabilidad, 274 Nivel descriptivo. Véase Significación N-k grados de libertad, 531 Normalidad comprobación, 412-418 supuesto, 268, 413 Notación, 544. Véanse también Notación condicional; Matriz definición. Véase Notación factorial cambios, 625 convenciones, 340

Notación condicional, 448 Notación factorial, definición, 12 Número de aceptación, determinación, 673 Número real, 379, 782 Números aleatorios ejemplo, 60-61 tabla, 676, 693-694 ejemplo, 78-79 uso, 79 Objetos definición. Véase Número de objetos independientes disposición, 10, 14, 15 nivel de clasificación, conocimiento, 629 número, 16 reselección. Véase Población selección, 10 uso, 13 Objetos independientes, definición, 30 Objetos que no se diferencian, permutaciones, 15-17 ejemplo, 16-17 número, 67 Observación (caída), probabilidad, 629-630 Observaciones conjunto, 203 muestra, 204 periodo, 77 Observaciones empatadas, 354 Observaciones por pares prueba de rango con signo, 354 prueba de rango con signo de Wilcoxon, 354-355 Ojivas, 196-197. Véase también Ojiva de frecuencia acumulativa relativa uso, 199-202 Opinión personal, 4 Orden, 70 característica, 10 Óxido de nitrógeno, ejemplo, 267 p estimación del tamaño de la muestra, 315-317 estimador agrupado, 324 estimador puntual, 313 intervalo de confianza, 313-315 modelo polinomial. Véase Grado p prueba de cola derecha, 317 prueba de cola izquierda, 317 prueba de dos colas, 317 P, gráfica (proporción defectuosa), 662-665 P, valor, 274. Véase también Valor P de dos colas cálculo, 343 descubrimiento, 278 notificación, 346 p1-p2, 320 estimación, tamaño de la muestra, 330 estimador puntual, 319 intervalo de confianza, 321

ÍNDICE

prueba de cola derecha, 322 prueba de cola izquierda, 322 prueba de dos colas, 322 Par ordenado, 159. Véase también Variable aleatoria discreta bidimensional Par, comparaciones de tipo, 524-530 ejercicios, 560-562 respuestas, 766 Paramecium, cepas, ejemplo, 111-112 Parámetro α. Véanse Variable aleatoria gamma; Variable aleatoria de Weibull β. Véase Variable aleatoria gamma; Variable aleatoria de Weibull estimación, 380-386, 451 ejercicios, 427-429 estimaciones, 494 interacción. Véase Esperanza k. Véase Poisson, distribución λ. Véase Poisson, proceso µ. Véase Variable aleatoria normal N. Véase Distribución hipergeométrica n. Véanse Variable aleatoria binomial; Distribución hipergeométrica; Variable aleatoria multinomial; Variable aleatoria p. Véanse Variable aleatoria binomial; Variable aleatoria geométrica; Variable aleatoria binomial negativa; Variable aleatoria procedimientos de diseño, 677-678 θ. Véase Población r. Véanse Distribución hipergeométrica; Variable aleatoria binomial negativa; Variable aleatoria σ. Véase Variable aleatoria normal Parámetros del modelo, 462 caso especial, 460 Pearson, coeficiente, 170 de correlación, 419-420, 424 Pearson, E. S., 18 Pearson, Karl, 229 Pendiente. Véase Regresión, línea inferencias, 394-397 Permutaciones, 9-17. Véase también Objetos que no se diferencian conteo, 10-11, 13 ejercicios, 19-22 respuestas, 726-727 formación, número, 70 número, uso, 13 Petrow, Steven, 291 Pino, sembrado de plántulas, ejemplo, 229-230 Pirie, W. R., 561 Planta industrial (registro de seguridad), ejemplo, 120 Plasma, recubrimiento, ejemplo, 356-357 Población, 191-192, 784. Véanse también Población normal; Población r2 definición, 2 ejemplo, 336 estudio, 351

797

igualdad de medianas, 554 media, 263. Véanse también Poblaciones k; Medias poblacionales teóricas media teórica. Véase Población i-ésima nivel de confianza, 668 parámetro θ, 268 proporciones, 321, 322, 635 diferencia, 325 reselección de objetos, 193 selección de muestras, 322 varianza, 207, 338 comparación, 347 reemplazo, 344 Población i-ésima, media teórica, 515 Población normal, 236, 339 muestreo, 342 Poisson, aproximación. Véase Distribución hipergeométrica Poisson, densidad, 670 Poisson, distribución, 75-78 definición, 76 ejercicios, 92-94 parámetro k, 76 respuestas, 734 tabla de funciones, 686, 691 Poisson, problema, solución (pasos), 77-78 Poisson, proceso, 76-77, 250 parámetro λ, 77, 111 Poisson, Simeon Denis, 75 Potencia beta, relación, 272 de la pruebas. Véase Prueba definición, 272 modelo, ejemplo, 493-494 Predicción banda, 403 construcción, 402 intervalo, 401-402. Véase también Y|x límites. Véase Y|x prueba, 451 valor. Véase Respuesta pronosticada única Presión (magnitud), ejemplo, 554-555 Presión barométrica, ejemplo, 172 PRESS. Véase Suma de los cuadrados de predicción Primer evento, tiempo en que ocurre, 111 Probabilidad. Véanse también Probabilidad condicional; Fracaso; Probabilidad diferente de cero; Significación, pruebas; Éxito asignación. Véase Eventos asociaciones, 631 axiomas, 25-29 ejercicios, 38-40 respuestas, 729 cálculo, 99 ejercicios de repaso, 23-24 respuestas, 727-729 enfoque clásico, 4-5, 15, 26 enfoque de frecuencia relativa, 4 enfoque personal, 4

798

PROBABILIDAD Y ESTADÍSTICA

fórmula clásica. Véase Eventos función, 46-47 función de densidad, 47, 670 función masa, 47 interpretación, 3-5 ejercicios, 17-18 respuestas, 725 introducción, 1 leyes, 25 ejercicios de repaso, 43-44 respuestas, 730 numeración, 3 regla. Véase Probabilidad normal, regla uso. Véase Probabilidad clásica Probabilidad clásica, uso, 31 Probabilidad condicional, 29-30 definición, 30, 65 ejercicios, 40-41 respuestas, 729 Probabilidad del color de los ojos, ejemplo, 32-33, 45 Probabilidad diferente de cero, 33, 52 Probabilidad normal, regla, 118 ejercicios, 147 respuestas, 747 Probabilidades binomiales, 121 Problema estadístico, características, 191, 194 Problemas, formulación, 511 Procedimiento agrupado, preferencia y, 326 Procedimiento no paramétrico, ejemplo, 556 Procedimientos de T por pares, 354-355 Proceso control, 649 diseño, 650 Producción de pernos, ejemplo, 654-655 Producción, elementos de la línea de (defectos), ejemplo, 624625 Producción, proceso, 259 ejemplo, 8 Producto calidad, 677 control, 650 variabilidad, vigilancia, 659 Productores, riesgo, 670, 673 Productos cruzados, términos, 450 Productos terminados, marketing/servicio, 259 Promedio aritmético, 229 Promedios de variable única, densidad conjunta (uso), 165 Propiedad sin sesgo, teorema. Véase Muestra, varianza Propiedades binomiales. Véase Distribución binomial Propiedades binomiales negativas. Véase Distribución binomial negativa Propiedades geométricas. Véase Distribución geométrica Propiedades hipergeométricas, 671. Véase también Distribución hipergeométrica Proporción. Véase también Proporciones agrupadas; Proporción de muestras comparación, 633-639 datos por pares, uso, 638-639

ejercicios, 643-646 pruebas de hipótesis. Véase Dos proporciones respuestas, 776 comparación, estimación, 319-322 ejercicios, 329-331 respuestas, 757 defectuosa. Véase P, gráfica estimación, 312-317 ejercicios, 326-327 respuestas, 757-758 inferencias, 312 ejercicios de repaso, 333-335 pruebas de hipótesis, 37-318 ejercicios, 327-329 respuestas, 756 Proporciones agrupadas, 323-325 Prueba agrupada, 342-347 ejercicios, 361-363 respuestas, 758 Prueba de T por pares, 511 Prueba de una cola, 343 Prueba no paramétrica, 352. Véanse también Localización; Clasificación unidireccional uso, 282 Prueba T agrupada, 342, 345-347, 525 Prueba T independiente, 342 Prueba T no correlacionada, 342 Prueba, estadística de, 269-270, 277, 322, 345. Véanse también H0; Proporciones agrupadas desarrollo, 324, 394, 473, 531 ecuación, 353 grados de libertad, asociación, 632 obtención, 347 redacción repetida, 475-476 selección, 323, 352 uso, 325, 520, 588, 630 valor observado, 271, 278 Pruebas, potencia, 272 Punto de fusión, ejemplo, 285-286 Q (estadística), 523 Queroseno, calefactores, ejemplo, 352-353 R, 659 r, fórmula de cálculo, 420 R, gráfica. Véase Shewhart, gráfica de control R construcción, ejemplo, 660 rango, 659-662 R2 máxima, método, 486 R2, método. Véase R2 máxima, método r2, población, 545 Radar, identificación de señales, ejemplo, 6870 Radiación, absorción, ejemplo, 117-118 Radiactividad exposición, ejemplo, 633-634, 636 exposición laboral media, ejemplo, 345 RAM (estimación puntual), ejemplo, 315-317

ÍNDICE

Rango definición. Véase Muestra prueba. Véase Duncan, prueba de rango múltiple Rango con signo, prueba. Véanse Observaciones en pares; Wilcoxon, prueba de rango con signo Rango múltiple, prueba. Véase Duncan, prueba de rango múltiple Rangos significativos mínimos de Student (rp), tabla, 686, 719 Rao, M. S., 93 Rasid, Harun, 648 Rechazo, región, 271 Redundancia, 131 Reemplazo. Véase Muestreo con reemplazo Reglas de esperanza. Véase Esperanza Reglas de varianza. Véase Varianza Regresión. Véanse Regresión de borde; Regresión robusta; Regresión/correlación lineal sencilla; Regresión escalonada análisis, 481, 596 curvas, 174-176, 379, 422 definición, 174 estimación, 379 ecuación, 333, 550. Véase también Regresión ajustada, ecuación desarrollo, 379 interacción. Véase Densidad condicional modelo, 551-552. Véase también Regresión lineal múltiple, modelos pruebas. Véase Regresión significativa Regresión de borde, 495 Regresión de la suma de los cuadrados (RSS), 467-468, 527 ecuaciones, 583-584, 596-598 expresión, 473-477 uso, 600 Regresión escalonada, 484 Regresión lineal, 381 idoneidad, 405 modelos, 380. Véase también Regresión lineal múltiple, modelos Regresión lineal múltiple, modelos, 443, 448-451 conclusión, 492-495 ecuaciones normales, 449 ejercicios de repaso, 507-511 respuestas, 765 Regresión lineal simple, 378 ejercicios de repaso, 436-442 formulación de matriz, 458-460 modelo, 394 respuestas, 762-763 supuestos, 387, 402 ecuación, 408-409 Regresión significativa, 394 pruebas, 473-476 Regresión, línea, 379-383. Véase también Regresión ajustada, línea estimación, 401 intercepción, 399

799

resultado, 480 pendiente, 380, 386-388, 397 Regresor, 379, 485 combinación lineal, 486 valores, 410 x2, representación, 593 Repetición y sin repetición, contraste, 11 Residual, 371, 517, 536, 547 análisis, 408-418 ejercicios, 433-434 baño (efecto de la temperatura), ejemplo, 599-601 construcción de gráfica de caja, ejemplo, 416-418 gráficas, 409-412 suma de cuadrados, 196 suma de los cuadrados, 392, 446 Respuesta ejemplo, 454-456 variable, 379, 446 vector, 451, 594 Respuesta pronosticada única, intervalo de predicción, 472 ρ estimación de intervalos, 422-425 estimador, 420 interpretación gráfica, 420 intervalo de confianza, 424 pruebas de hipótesis, 422-425 Riemman, sumas, secuencia, 99 Robusta, regresión, 495 Robustez, 280 RSS. Véase Suma de los cuadrados de regresión Ruido, factores, 677 S2 fórmula de cálculo, 204 uso, 228 SAS. Véase Statistical Análisis System Satterthwaite, procedimiento, 511. Véase también SmithSatterthwaite SC. Véase Suma de cuadrados SCep. Véase Suma de cuadrados debida a error puro. Sedimentos, estudio, ejemplo, 200 Selección aleatoria. Véase Tratamiento Selección hacia adelante, método, 482-483 Semáforos, uso (ejemplo), 16-17 Señal televisiva, interrupción, ejemplo, 694 Serie geométrica, convergencia, 48 Serie, sistemas definición, 129 confiabilidad, 129-131 Shewhart, gráfica de control, 650, 676, 677. Véanse también 2-sigma, gráfica de control de Shewhart; 3-sigma, gráfica de control de Shewhart introducción, 659 uso. Véanse Atributos; Mediciones R, 659 Shewhart, Walter A., 650 σ. Véase Desviación estándar σ 2. Véase también Varianza

800

PROBABILIDAD Y ESTADÍSTICA

estimación, 465-469 estimador, 392 estimador sin sesgo (uso), 228 fórmula de cálculo, 55 intervalos de confianza, 261 Signo, prueba. Véase Mediana ceros, manejo, 284-285 Signos reflejantes de carreteras, ejemplo, 268-271 Simulación, 78. Véase también Distribución discreta Sistema de propulsión (disposición de componentes), ejemplo, 27 Sistema de volante de dirección de bajo esfuerzo, ejemplo, 276 Sistemas ejemplos, 130-131 fracaso, 130 Sistemas en paralelo confiabilidad, 129-131 definición, 129 Smith-Satterthwaite, grados de libertad. Véase Libertad procedimiento, 348-349 intervalos de confianza tipo T, 356 Software, calidad/confiabilidad, ejemplo, 312-303 Soldadura defectuosa, ejemplo, 164, 168, 171-172 Solventes, evaporación ejemplo. Véase Humedad magnitud, ejemplo, 396-397, 412-415 SPSS. Véase Statistical Package for the Social Sciences Statistical Analysis System (SAS), 356, 386, 412, 599. Véase también MODEL 1 salida, 457 uso, 487, 529 Statistical Package for the Social Sciences (SPSS), 386 Stephens, Mark, 34 Stirling, fórmula, 74-75 Student, distribución t, estimación, 262-268 ejercicios, 290-295 respuestas, 750-751 Student, rangos, 527 distribución, puntos porcentuales superiores (tabla), 686, 721 tabla. Véase Rangos de Student menos significativos, tabla valor crítico de nivel α de cola superior, 529 Sturges, H. A., 197-198 Subconjunto, pruebas. Véase Variables predictoras Submatriz, 593 Suma acumulativa (CUSUM), 677 gráficas de control, 677 Suma de cuadrados (SC), 519, 578-583. Véanse también Contraste de la suma de cuadrados; Tratamiento identidad, 517-518, 537 uso, 596-598 Suma de cuadrados debida a error puro (SCep), 407-408 Suma de cuadrados del error (ESC), 383, 600 división, 392 ecuaciones, 446, 596-598 expresión, 473-477 uso, 393, 406-408, 425-426 uso de estimador, 467-468

Suma de cuadrados del error, 383, 538, 596. Véase también Suma de los cuadrados, error Suma de los cuadrados. Véanse Suma de cuadrados de regresión; Residuo Suma de los cuadrados de predicción (PRESS) residuo, 487 estadística, 486-492, 496 Sumatoria, 52 extensión, 99 propiedades, 388 reposición, 781 reglas, 383 símbolo, 388 Sustitución, 36, 37, 779. Véase también Clasificación unidireccional rendimiento, 781 uso, 733 Sustracción, uso, 11 T, distribución, 351, 399 definición, 263 estimación. Véase Student, distribución t n-2 grados de libertad, 395, 400 propiedades, 264-266 tabla, 686, 699-700 T, intervalos de confianza tipo. Véase Smith-Satterthwaite T, procedimientos. Véase T, procedimientos por pares T, prueba, 277, 351, 581. Véanse también Bonferroni, pruebas T; T, prueba independiente; T, prueba por pares; T, prueba agrupada; T, prueba no correlacionada uso. Véase Datos no normales T, variables aleatorias, 348 T183, calculadora, 355-356 Tabaquismo/embarazo/defectos congénitos (estudio), ejemplo, 131-123 Tablas estadísticas, 386 Taguchi, G., 649, 650 Tallo y hoja, diagrama, 195, 341. Véase también Doble tallo y hoja, diagrama construcción, 195-196 Tallo y hoja, gráfica, 211, 412-418 Tasa de error. Véanse Tasa de error de tipo de comparación; Tasa de error de tipo de experimento Tasa de riesgo, función, 129 ρ. Véase Variable aleatoria interpretación, 128 Tasas de errores en forma de comparación, 526 Taylor, serie, expansión, 71 Técnicas estadísticas, uso, 51, 211 Telas sintéticas, producción, ejemplo, 666-667 Temperatura (efecto), ejemplo. Véase Residuos, baño Temperatura/humedad (efecto), ejemplo, 577-580, 583-586 Temperatura/luz (efecto), ejemplo. Véase Mirogrex Tendencia lineal, 170 Teorema binomial, 66 Teorema del límite central, 121, 237, 242-243, 254-257 ejercicios, 253-254 uso, 313-315

ÍNDICE

Teoría estadística, 52 Teoría normal, comprobación, supuestos, 282 Terminales (adición), ejemplo, los 79-280 Términos no lineales, 450 θ, estimación, método de la técnica de momeos, 232-233 Tiempo, intervalos, 651, 655 Tn – 2, distribución, 399 Tolerancia, intervalo. Véase Intervalo de tolerancia no paramétrico Totales de columna/fila marginales, 628, 630 Trabajo del día, 602 Trabajo, carga, ejemplo, 261-262 Tracción, resistencia a, ejemplo, 346-347 Transformación. Véanse también Transformación inversa; Transformación uno a uno ejemplo, 176-178 Transformación inversa, 177 Transformación logarítmica, uso, 494 Transformación uno a uno, 178 Transmisión, fallas de líneas, ejemplo, 318 Transmisores televisivos, contaminación, ejemplo, 277278 Tratamiento, 512 combinaciones, 576, 598. Véase también 2k, combinaciones de tratamiento manejo, 601 media, 577 n observaciones de muestra, 592 observaciones, 578, 587, 593 cuadrado de la media esperada, 539 efectos, 548 interacciones. Véase Bloques/tratamientos media de cuadrados, 519 medias. Véase Contraste en medias de tratamiento selección aleatoria, 513 suma de cuadrados, 546 variación, 518 Tratamiento i-ésimo, efecto, 547 Tratamiento igual combinación de medias. Véase Hipótesis nula de medias hipótesis nula (prueba), 515-516, 518 Tres factores, extensión, 587 ANOVA, 611-612 diseño, ANOVA (determinación), 613 ejercicios, 611-614 respuestas, 769 experimento, 592 interaccionnes, 608 3-sigma, gráfica de control, 653, 654, 665 gráfica de control de Shewhart, 655 – gráfica X , 655-656 Tres variables, modelos, 432-483 Tukey, John, 195 Tukey, procedimiento, 542 Tukey, prueba, 529-530, 563, 581 Umbral, valor, 123 Unidades de medición física. Véase Desviación estándar

801

Valor atípico, 207, 211 Valor de predicción único, pruebas, 473 Valor de una cola, 275 Valor esperado, 51-52. Véanse también β; Constantes; Variable aleatoria continua definición, 52, 105, 165 ejemplo, 53, 105 media, intercambio, 53-54 notas. Véase Variable aleatoria Valor límite, 197, 199 Valor nulo, 268, 271, 273 supuesto, 269 Valor promedio, 54 Valor promedio teórico de largo plazo. Véase X Valor pronosticado, inferencias. Véase Valor pronosticado único Valor pronosticado único, inferencias, 400-404 Valor(es). Véanse también Valor promedio; Media; Muestra, valores definición. Véase Valor esperado inferencias. Véase Valor pronosticado único conjunto, 45 pruebas. Véase Valor de predicción único Valores adyacentes, 209 Valores de calcio en sangre, ejemplo, 159-163, 168 Valores numéricos, 192, 238 Valores observados, vector, 463 Válvula rotatoria, desgaste, ejemplo, 356-357 Variabilidad, 468. Véase también Variabilidad total estimada conocimiento, 266 estimación de intervalo, 260-262 ejercicios, 288-290 respuestas, 750 grado, 241 mediciones, 204-207. Véase también Datos vigilancia. Véase Producto Variabilidad total estimada, 550 Variable aleatoria, 45-46, 192, 397, 419. Véanse también Variable aleatoria de dos varianbles; Variable aleatoria independiente; Variable aleatoria no negativa; Variable aleatoria Z coeficiente de correlación ρxy, 170 combinación lineal, 469 distribución. Véase Variables aleatorias independientes distribuidas normalmente definición. Véanse Variable aleatoria continua; Variable aleatoria discreta; Variable aleatoria multinomial densidad ejemplo, 50-51, 102-103 f, 62. Véase también Variable aleatoria discreta fxy. Véanse Variable aleatoria continua bidimensional; Variable aleatoria bidimensional densidad conjunta ejemplo, 158, 165-167, 173-174 fxy, 164. Véanse también Variable aleatoria continua bidimensional; Variable aleatoria discreta bidimensional densidad de fracaso f, 126, 127

802

PROBABILIDAD Y ESTADÍSTICA

distribución, 423 distribución hipergeométrica, 73 ejercicios, 81 respuestas, 730 ejemplos, 45-46, 54, 65, 132-134, 340-341. Véase también Ejercicios de variables aleatorias independientes distribuidas uniformemente estudio, 201 fluctuación, 55 función de confiabilidad R, 126, 127 función de tasa de riesgo ρ, 126, 127 función generadora de momentos, 63-64 función lineal. Véase Variable no aleatoria funciones, 233-236 ejercicios, 251-253 respuestas, 748 huella digital, 234 media, 54 identificación, 61-62 µ, 55 µx, 167, 170 µy, 167, 170 mediana, 282 números reales, interacción, 58 parámetro α. Véase Variable aleatoria gamma; Variable aleatoria de Weibull β. Véase Variable aleatoria gamma; Variable aleatoria de Weibull k. Véase Poisson, variable aleatoria µ. Véase Variable aleatoria normal n, 67. Véanse también Variable aleatoria binomial; Variable aleatoria multinomial p, 67, 71. Véanse también Variable aleatoria binomial; Variable aleatoria geométrica; Variable aleatoria binomial negativa r, 71. Véase también Variable aleatoria binomial negativa σ. Véase Variable aleatoria normal parámetros teóricos, 58 uso, 170, 234, 236, 548 valor esperado, notas, 54 variabilidad natural, 406 varianza, 57, 259 identificación, 61-62 σ 2, 57 vector, 463, 465 Variable aleatoria bidimensional, 156, 422 densidad conjunta fxy, 165, 168, 173 densidad marginal fx, 173 densidad marginal fy, 173 Variable aleatoria binomial, 65-66, 68, 121 parámetro n, 68 parámetro p, 68 Variable aleatoria binomial negativa, 71 parámetro p, 71 parámetro r, 71 Variable aleatoria condicional, 378

Variable aleatoria continua, 159, 176, 184 definición, 98 densidad conjunta fxy. Véase Variable aleatoria continua bidimensional densidad fx, 131 valor esperado, 105 Variable aleatoria continua bidimensional, 159 densidad conjunta fxy, 161, 173 Variable aleatoria de dos variables, 156 Variable aleatoria de Poisson, 111, 665, parámetro k, 76 Variable aleatoria discreta bidimensional densidad conjunta fxy, 157-158 par ordenado, 156 Variable aleatoria discreta, 47, 183 definición, 46 densidad f, 49, 52 densidad conjunta de fxy. Véase Variable aleatoria discreta bidimensional familias, 58 Variable aleatoria geométrica, 59, 64 definición, 60 densidad, 62 media, identificación, 61 parámetro p, 62, 64 propiedades geométricas, 59-61 Variable aleatoria independiente ji cuadrada, 263, 339 suma, distribución, 252 Variable aleatoria independiente, 164, 192, 235 densidad marginal fx, 164 densidad marginal fy, 164 número finito, 235 suma, distribución, 251-252 Variable aleatoria multinomial, 629 definición, 624 parámetro n, 625 Variable aleatoria no negativa, 782 Variable aleatoria normal, 263, 651, 656, 780 función lineal. Véase Variable aleatoria independiente normal media µ, ejemplo, 234 parámetro µ, 114 parámetro σ, 114 varianza σ 2, ejemplo, 234 Variable aleatoria normal independiente, función lineal, 389-392 Variable dependiente, 379 Variable independiente, introducción, 457 Variable indicadora, 478, 481 Variable no aleatoria, función lineal, 419 Variable normal. Véase Variable normal estándar Variable normal estándar, 115 Variable única, modelos, 483-484 Variables. Véanse también Variables categóricas; Variables cualitativas; Variables cuantitativas; Variables aleatorias; Respuesta; Variable normal estándar conjunto de valores. Véase Variables de predicción

ÍNDICE

definición, 45. Véase también Variable aleatoria discreta subconjunto, prueba. Véase Variables de predicción transformación, 131-133, 176-180 ejercicios, 151-153, 187-138 uso. Véase Variables indicadoras Variables aleatorias distribuidas, 518, 547 ejemplo. Véase Variables aleatorias independientes distribuidas uniformemente combinación lineal, distribución. Véase Variables aleatorias independientes distribuidas normalmente Variables aleatorias independientes distribuidas normalmente, combinación lineal (distribución), 252 Variables aleatorias independientes distribuidas uniformemente, ejemplo, 178 Variables categóricas, 477 Variables cualitativas, 477-481 Variables cuantitativas, 477-481 Variables de predicción, 443, 448, 450 conjunto de valores, 471 ejemplo, 482-484 subconjunto, prueba, 476-477, 597 uso, 473 Variables indicadoras, uso, 477-481 ejercicios, 503-506 respuestas, 765 Variables, covarianzas de pares, 465 Variables, criterios de selección, 481-492 ejercicios, 506-507 Varianza. Véanse también Análisis de la varianza; Variable aleatoria gamma; Población análisis de dos factores, 575-587 ejercicios, 609-611 respuestas, 768 β, 465-469 comparación, 338-342, 522-524. Véase también Dos varianzas ejercicios, 359-361, 560 respuestas, 758, 766 conocida, 237-242 definición, 55. Véanse también Varianza agrupada; Muestra, varianza desviación estándar, interacción, 54-57 determinación. Véase Estimador distribución, 341 ejemplo. Véase Variables aleatoria normal estimación, 266-268 igualdad, supuesto, 492 propiedad sin sesgo, teorema. Véase Varianza de la muestra, prueba F, supuestos. Véase Varianzas iguales pruebas de hipótesis, 280-281 ejercicios, 303-304 respuestas, 753 formas. Véase Distribución reglas de matriz, 466 reglas, 58, 349, 465 σ 2, 51, 536. Véanse también Distribución normal; Muestra aleatoria; Variable aleatoria

σ 2/n, 237 supuesto, 411 Varianza agrupada, 342-345 definición, 343 Varianza de la muestra, 202, 228, 339. Véase también Varianza de muestras agrupadas definición, 205 ejemplo, 343-344 propiedad sin sesgo, teorema, 228, 778, 782-783 Varianza de muestras agrupadas, 343-344 Varianza-covarianza, matriz, 465-466 Varianzas desiguales, 347-349 ejercicios, 363-367 respuestas, 758-759 Varianzas iguales, 342-347 ejercicios, 361-363 respuestas, 758 supuestos de la prueba F, 341-342 Vector aleatorio ejemplo, 463-464, 466 varianza, 465 Vector, 594. Véase también Respuesta Venn, diagrama, 27, 28 Verosimilitud. Véase también Estimadores de máxima verosimilitud estimadores, 232 función, 231-232 Viento, velocidad, ejemplo, 236 Viscosidad de fluidos, ejemplo, 120 Voltímetros, ejemplo, 549-550 Volúmenes, probabilidades, 159 W. Véase Wilcoxon, estadística de rango con signo Waltman, H., 288 Weibull, densidad, 123 Weibull, distribución definición, 724 confiabilidad, interacción, 123-131 ejercicios, 149-151 respuestas, 737 Weibull, variable aleatoria ejemplo, 124-125 parámetro α, 124 parámetro β, 124 Wilcoxon, procedimientos, 352 prueba de suma de rangos, 352-354, 555 estadística de rango con signo (W ), distribución aproximada, 286 prueba de rango con signo, 285-287. Véase también Observaciones por pares tabla, 686, 703 estadística, 354 estadística de prueba, 285 X, 262 gráfica. Véase 3-sigma, gráfica X cálculo, 656 distribución, 233-236

803

804

PROBABILIDAD Y ESTADÍSTICA

ejercicios, 251-253 respuestas, 748-749 media, 655-659 teorema, 236 X, ejemplo hipergeométrico, 73-74 valor promedio teórico en el largo plazo, 52 X1-X2, distribución (teorema), 338, 778, 784 Y, valor medio, 400 valor, 402

Y|x, intervalo de confianza, 469 intervalo de predicción, 402 límites de predicción, 472 Yates, método, 599-601, 604 Z, curva, 264 Z, estadística, 425, 635 Z, intervalo de confianza tipo, 260 Z, variable aleatoria, 347 Z 2, distribución, 252-253

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF