Estadistica Aplicada a La Ingenieria Ambiental
April 3, 2017 | Author: Franco Follano p. | Category: N/A
Short Description
Download Estadistica Aplicada a La Ingenieria Ambiental...
Description
UNIVERSIDAD AUTÓNOMA DE CD. JUÁREZ INSTITUTO DE INGENIERÍA Y TECNOLOGÍA DEPARTAMENTO DE INGENIERÍA CIVIL Y AMBIENTAL
MÉTODOS ESTADÍSTICOS PARA LA INGENIERÍA AMBIENTAL Y LA CIENCIA
DR. HÉCTOR ADOLFO QUEVEDO URIAS
AGOSTO DE 2006
Copyright © 2006. Métodos Estadísticos para la Ingeniería Ambiental y la Ciencia. Héctor Adolfo Quevedo Urías Es propiedad del autor. Queda hecho el depósito que marca la ley.
Advertencia Prohibida la reproducción de este libro, además de los esquemas e ideas originales del autor que se hallan en este texto, ya sea por medios electrónicos, mecánicos, fotocopiado o de cualquier otra forma, puesto que todo esto pertenece al dominio de la propiedad intelectual y está protegido por la ley. Para revisores, críticos o reseñadores literarios, a quienes se les asigne la tarea de hacer revisiones literarias de esta obra, lo pueden hacer, previo acuerdo con el autor. Impreso en Cd. Juárez, Chihuahua, México Library of Congress Cataloging in Publication Data Héctor Adolfo Quevedo Urías Este libro fue publicado en el Internet en Enero de 2006 por la Biblioteca Virtual de la Universidad Autónoma de Cd. Juárez. La dirección electrónica del libro es: http://bivir.uacj.mx/LibrosElectronicosLibres/UACJ/ua00001.pdf
CONTENIDO Página i
Introducción Capítulo 1
Estadística Descriptiva
1-1
Definición de estadística.- Población y muestra.- Estadística inductiva y de inferencia.Estadística descriptiva.- Variables continuas y discretas.- Medidas de tendencia central.Medidas de dispersión.- La variable aleatoria estandarizada z.- Las desviaciones del promedio.- El rango.- Sesgo y kurtosis.- Distribuciones de frecuencia.- Diagramas de tallo y hoja.
Capítulo 2
Probabilidad
2-1
Probabilidad de frecuencia relativa.- Probabilidad subjetiva.- Axiomas y propiedades básicas de la probabilidad.- Diagramas de Venn y álgebra de conjuntos.- Técnicas de conteo: Regla de producto para pares ordenados, la regla de multiplicación más general, regla factorial, diagramas de árbol, permutaciones y combinaciones.- Regla multiplicativa para eventos dependientes e independientes.- Regla aditiva para eventos mutuos excluyentes y eventos no mutuos excluyentes.-
Capítulo 3
Distribución Binomial e Hipergeométrica
3-1
Aplicaciones generales de la distribución binomial.- Relación entre la distribución normal y la distribución binomial.- Relación entre la distribución binomial y la distribución de Poisson.- La distribución hipergeométrica.- Suposiciones y propiedades de la distribución hipergeométrica.-
Capítulo 4
Distribución de Poisson
4-1
Aplicaciones de la distribución de Poisson.- Condiciones que se requieren para aplicar la distribución de Poisson.- Funciones probabilísticas de la función de Poisson.- Aplicación de la distribución de Poisson dentro de sus propios términos y como una aproximación a la distribución binomial.- Propiedades de la distribución de Poisson.- Problemas de la distribución de Poisson usando el programa Minitab.
Capítulo 5
Distribuciones de Probabilidad Continua
5-1
Función de densidad de probabilidad de la variable aleatoria continua X.- Fórmula fundamental del cálculo.- Distribución normal y sus características.- Relación entre la curva normal y la binomial.- Áreas bajo la curva normal.- Distribución exponencial.- Distribución Gamma.- Distribución Weibull.- Intervalos de confianza para µ.- Estadística de inferencia:
teoría de decisión estadística y pruebas de hipótesis.- Pruebas de hipótesis estadísticas. Hipótesis nula (Ho:) e hipótesis alternativas (H1:, H2:, H3:).- Tipos de errores I (alfa) y II (beta).- Pruebas de hipótesis no tradicionales usando el valor de la probabilidad p.- Pruebas de hipótesis para uno y dos promedios poblacionales (µ1, y µ2).- Pruebas de hipótesis para las diferencias de dos promedios poblacionales (µ1 – µ2), para muestras grandes (n ≥ 30) usando la distribución normal, con varianzas conocidas e iguales (σ21 = σ22).- Intervalos de confianza para dos promedios poblacionales.- Pruebas de hipótesis e intervalos de confianza para proporciones.-
Capítulo 6
Distribuciones de t de Estudiante, JI Cuadrada y F
6-1
Propiedades de la distribución de t de Estudiante.- Intervalos de confianza para el promedio poblacional µ.- Prueba de hipótesis para µ.- Prueba de t pareada para detectar diferencias entre dos tratamientos.- Prueba de t para probar la hipótesis de dos promedios, cuando las varianzas son iguales.- Prueba de t para probar la hipótesis de dos promedios cuando las varianzas son desiguales.- Mecanismos para calcular el valor de p cuando se hacen pruebas de hipótesis no tradicionales.- Intervalos de confianza y pruebas de hipótesis con la JI cuadrada, (χ2).- Aplicación de la JI cuadrada en cuanto a la prueba de bondad de ajuste comparando las frecuencias observadas y las frecuencias teóricas.- Distribución F y su aplicación en la comparación de varianzas muestrales.-
Capítulo 7
Análisis de Varianza
7-1
Diseños de análisis de varianza completamente aleatorizados y diseño de bloques aleatorizados.- Método de comparaciones múltiples para saber cuales poblaciones son iguales y cuales son desiguales.- Análisis de varianza de diseño de bloques aleatorizados.- Suposiciones del modelo de bloques aleatorios completos.- Análisis de varianza en dos sentidos.- Interacción con ANOVA de dos factores.- Análisis de varianza en tres sentidos: diseño completamente aleatorio.- Interacción con ANOVA de diseños factoriales de tres clasificaciones.- Ejemplos de ANOVA usando el programa Minitab.-
Capítulo 8
Regresión Lineal Simple y Múltiple
8-1
Suposiciones del modelo de regresión lineal.- Ecuaciones normales para calcular el intercepto en la ordenada a y la pendiente b de la curva o línea de regresión.- Coeficiente de determinación R2 de la muestra que estima a ρ2 el coeficiente de determinación poblacional.- Coeficiente de correlación R de la muestra que estima a ρ, el coeficiente de correlación poblacional.- Intervalo de confianza para el coeficiente poblacional β componente de la línea de regresión µY|X = α + βX, estimado por b, la pendiente de la línea.- Intervalo de confianza para el parámetro poblacional α, el intercepto de la ordenada de la línea de regresión µY|X = α + βX, cuyo estimador es a.- Hipótesis nula de Ho:β = βo contra las hipótesis alternativas de H1:β < 1 y H2:β > 1.- Hipótesis nula de Ho:α = αo contra las hipótesis alternativas de H1:α ≠ αo, H2:α > αo, y de H3: α < αo.- Intervalo de confianza para µY|X de la línea poblacional estimada por Y.- Regresión y correlación
múltiple.- Métodos para validar el modelo de regresión lineal simple y múltiple: a través de estadística de inferencias y a través del análisis gráfico de los residuales estandarizados. Procedimiento de regresión múltiple usando el programa Minitab.-
Capítulo 9
Regresión Polinomial
9-1
Modelos polinomiales de segundo orden (k = 2) con una variable independiente.- Modelo de polinomios de tercer orden (k = 3), con una variable independiente.- Modelo de segundo orden (cuadrático) con interacción.- Modelo polinomial (de segundo orden o cuadrático), con tres variables independientes con interacción.- Evaluación de los modelos de regresión.- Prueba estadística para comparar la suma de los cuadrados del error (SSe) de cada modelo probado, para saber cual modelo es superior.- Modelos de regresión no lineales y de regresión logística.- Modelos de regresión exponenciales paramétricos, con una sola variable independiente.- Procedimientos para la Identificación de valores atípicos extremos. Diagnóstico y mitigación de multicolinealidad.- Medidas para corregir multicolinealidad severa.- Ejemplos de problemas de regresión polinomial usando el programa de computadora Minitab.- Autocorrelación en datos de series de tiempo.- Heteroscedasticidad y homoscedasticidad.- Prueba de White para el problema de heteroscedasticidad.-
Capítulo 10
Estadística no Paramétrica. El modelo de Distribución de ANOVA Libre 10-1
Ventajas de los métodos no paramétricos.- Desventajas de los métodos no paramétricos.Prueba de H de Kruskal-Wallis para análisis de varianza por rangos.- Pruebas de hipótesis con las funciones no paramétricas.- Procedimientos de pruebas de Kruskal-Wallis para ANOVA simple.- Pruebas de hipótesis no tradicionales, para la prueba de Kruskal-Wallis, es decir, usando el valor de la probabilidad p.-
Capítulo 11
Series de Tiempo
11-1
Clasificación de los movimientos de las series de tiempo.- Tendencias a largo plazo.Componentes cíclicos de series de tiempo.- Variaciones estacionales.- Variación irregular.Métodos para encontrar líneas de tendencia.- Línea de los cuadrados mínimos y parábolas de los cuadrados mínimos.-
Capítulo 12
Selección del Tamaño de la Muestra
12-1
Derivación de la fórmula para estimar el tamaño más apropiado de la muestra para el promedio.- Selección del tamaño de la muestra para dos poblaciones.-
Apéndices Apéndice A
Lista de Tablas Estadísticas
Apéndice-A
Apéndice B
Bibliografía
Apéndice-B
Apéndice C
Papel de gráfica
Apéndice-C
Apéndice D
Índice
Apéndice-D
Introducción La estadística y los métodos probabilísticos o estocásticos juegan un papel muy importante en todas las fases del comportamiento humano. El uso de la probabilidad y de la estadística se ha extendido, no tan solo a las áreas tradicionales universitarias o escolásticas, sino también a todos los campos de la ingeniería, la agricultura, la biología, la química, las comunicaciones, la economía, la electrónica, la medicina, la física, las ciencias políticas, la psicología, la sociología, las encuestas políticas, la mercadotecnia, la ecología, la meteorología, y así sucesivamente. Este texto de probabilidad y de estadística, está diseñado para cursos de postgrado de la Ingeniería Ambiental y la Ciencia. Este libro es una compilación de más de 25 libros de referencias bibliográficas de probabilidad y de estadística orientados, no tan solo a la ingeniería ambiental, sino también a la ingeniería en general, la economía, la química, la física, la agricultura, la medicina, etc. Este texto consta de más de 700 páginas que incluyen conceptos teóricos, muchos ejemplos prácticos y muchos ejercicios. El autor de este texto, sin intenciones de ufanarse, incluye un diseño de una fórmula (que no aparece en los libros de estadística) para interpolar, manualmente, valores y estimar la probabilidad p. En verdad, el propósito de este texto es el de ayudar al lector a entender los conceptos, ideas y funciones de la probabilidad y de la estadística aplicados a problemas de la ingeniería ambiental y a la ciencia. Este texto deberá ser también útil para aquellos estudiosos quienes deseen hacer aplicaciones de la probabilidad y de la estadística a problemas de la ingeniería en términos generales, así como también a la investigación. Cada capítulo se inicia con definiciones pertinentes y claras, teoremas y i
principios, con material abundante de gráficas, de materiales descriptivos y de muchos ejemplos y ejercicios. Por ejemplo, el Capítulo 1 da la introducción a la estadística clásica. Este capítulo da una clara distinción entre lo que es una población y una muestra. Este capítulo habla, además, de estadística descriptiva y de distribuciones de frecuencia. Más adelante, el Capítulo 2 habla de la teoría de probabilidad y todo lo relacionado con la probabilidad clásica. Después, los Capítulos 3 y 4 hablan de las distribuciones discretas, como la binomial, la hipergeométrica y la Poisson. Aquí se incluye el concepto de la lógica deductiva, la cual es un concepto de difícil entendimiento. El Capítulo 5 describe las funciones continuas de probabilidad, especialmente la distribución normal, además, de las distribuciones Weibul, exponencial, Gamma, etc. El Capítulo 6 habla de la teoría de muestreo pequeño como la t de Estudiante, JI cuadrada y la distribución F. En este renglón, en las pruebas de hipótesis, para el control de calidad, se habla de la lógica inductiva, que es un concepto de difícil entendimiento y discutido en poquísimos libros de estadística. Además, el Capítulo 7 está relacionado con diseños de análisis de varianza completamente aleatorizados y diseños de bloques aleatorizados. Este capítulo también discute modelos factoriales de dos y tres clasificaciones. El Capítulo 8 está relacionado con regresión lineal simple y múltiple. El Capítulo 9 está relacionado con regresión polinomial, el cual incluye modelos polinomiales de segundo y tercer orden, con una variable independiente y con más de dos variables regresivas. Este capítulo habla también de modelos de regresión no lineales de regresión logística y de modelos exponenciales paramétricos, con una sola variable independiente. Más adelante, el Capítulo 10 habla de pruebas no paramétricas. Otrosí, el Capítulo 11 habla de las series de tiempo. Finalmente, el Capítulo 12 habla de métodos para seleccionar el tamaño de muestra ii
más apropiado. Este texto, además, incluye varios apéndices con tablas de las distribuciones binomiales, de Poisson, normal, de t de Estudiante, de F, de JI cuadrada, etc. Igualmente, este texto incluye una serie de referencias bibliográficas. Finalmente, este libro de estadística incluye una sección que contiene más de 340 ejercicios relacionados con cada capítulo y ejemplos usando el programa de computadora Minitab y Excel. En este contexto, este texto de estadística da muchos ejemplos de problemas usando el paquete de computadora Minitab, es decir, describiendo el uso del Minitab con minuciosidad de detalles; situaciones presentadas por muy pocos libros de estadística. Para concluir, debo decir que este es un texto de estadística diseñado para los estudiantes de ingeniería ambiental de posgrado y de la ciencia en general. Es decir, para aquellos investigadores quienes deseen encontrar, prácticamente, todos los conceptos de la probabilidad y de la estadística, que les pueda ayudar en el desarrollo de su profesión de ingeniería, en la investigación o en cualquier otra área de la ciencia en general.
iii
Dr. Héctor Quevedo Urías
CAPITULO 1 Estadística Descriptiva Definición de estadística.- Población y muestra.- Estadística inductiva y de inferencia.- Estadística descriptiva.- Variables continuas y discretas.- Medidas de tendencia central.- Medidas de dispersión.- La variable aleatoria estandarizada z.- Las desviaciones del promedio.- El rango.- Sesgo y kurtosis.Distribuciones de frecuencia.- Diagramas de tallo y hoja. Estadística es el estudio de los métodos para coleccionar, resumir, organizar, presentar y analizar información de datos. El término estadística también se refiere a la derivación de conclusiones válidas y a la formación de decisiones razonables, en base a semejantes análisis. En la colección de datos de un grupo de observaciones, a menudo es imposible o impráctico observar toda la población. De manera qué, en lugar de examinar el grupo en su totalidad, llamado la población o universo, es conveniente examinar solamente una parte de la población llamada muestra. Población se refiere a un grupo de ítems que tienen una característica en común. Una población puede ser definida como un grupo de individuos, como por ejemplo, una persona, un animal, un objeto o una medición. Además, una población puede ser finita o infinita. Por ejemplo, la población consistente de todos los tornillos producidos en una fábrica, en un día, es finita. En contraste, la población consistente de todos los posibles resultados (caras o águilas) de los lanzamientos sucesivos de una moneda es infinita. A menudo la población no existe pero, sin embargo, es de importancia. Por ejemplo, al estudiar un nuevo colorante para telas de algodón podemos probar el nuevo colorante, con solamente 10 piezas de un metro del material
1-1
Dr. Héctor Quevedo Urías
y hacer mediciones de la resistencia del colorante. La muestra consiste de 10 piezas de algodón tratadas con el colorante. La población consiste de todas las piezas de algodón posibles de un cierto tipo que pudieran ser tratadas con el nuevo colorante. Esta población no existe. Sin embargo, la población total nos la podemos imaginar al estudiar las 10 piezas de algodón con el objeto de hacer inferencias. En el caso de una muestra, esto se refiere a una estadística y es un estimador de un parámetro de población. Por ejemplo, si X denota el promedio aritmético estadístico de una muestra, entonces, X es el estimador del parámetro µ de todo el conjunto o población. Sin embargo, en contraste como se dijo antes, es impráctico o imposible observar toda la población, por esta razón se examina una pequeña parte del grupo o población llamada muestra estadística. Aquí, es conveniente introducir términos tales como muestra aleatoria o al azar, muestreo, estadística inductiva o de inferencia y estadística descriptiva. También es muy crítico distinguir entre los términos parámetros (donde se usan símbolos griegos) versus estadísticas. Los parámetros se refieren a poblaciones infinitas o finitas. Sin embargo, las estadísticas ser refieren a una muestra. Por ejemplo, si una muestra es representativa de una población se pueden sacar conclusiones importantes acerca de esta población. Sin embargo, es importante notar que la muestra debe ser aleatoria, porque de otra manera, la inferencia acerca de la población será inválida. Con respecto a la estadística inductiva y a la estadística de inferencia, éstas se refieren al proceso de inferir conclusiones acerca de una población basándose en un muestreo aleatorio (al azar), de tal manera que la probabilidad de tener una inferencia correcta puede ser determinada de acuerdo con varias hipótesis concerniendo la población bajo estudio. Dicho en otras palabras, debido a que semejante inferencia no puede ser absolutamente cierta, el lenguaje de probabilidad es, a menudo usado en la
1-2
Dr. Héctor Quevedo Urías
presentación de los resultados o conclusiones. En contraste, la fase de estadística que busca únicamente describir y analizar datos de una distribución continua (como la normal), sin sacar ninguna conclusión o inferencia acerca de la población o universo, se denomina estadística descriptiva. Aquí se incluyen términos como colección de datos sin procesar, formación de datos en orden descendiente o ascendente (cuya diferencia entre el mayor y menos se denomina rango), distribuciones de frecuencia, que es un término para describir el arreglo relativo de un conjunto de elementos de los valores de una variable y de las frecuencia de ocurrencia de cada valor (la más importante llamada curva normal y t de estudiante). Otros términos usados en estadística descriptiva son promedios aritméticos, promedios geométricos, promedios armónicos, medianas, modas, percentiles, desviaciones estándar, varianzas, etc., pero, sin sacar inferencias del grupo que provienen. Sin embargo, con relación a la estadística descriptiva y la estadística de inferencia, en el caso de la estadística descriptiva, este tipo de estadística incluye la presentación de conjuntos de observaciones, de tal manera que puedan ser comprendidas e interpretadas y sirven para resumir o describir datos. En cambio, la estadística de inferencia se relaciona con estimaciones de magnitudes de poblaciones y pruebas de acerca de las características de la población. Ambas son útiles para determinar cual entre dos a más cursos de acción se siguen cuando el curso correcto es determinado por una característica particular o desconocida de la población. En el campo de la ingeniería (como en la ingeniería ambiental) y ciencias experimentales el uso de la estadística es requerido en el diseño de plantas de aguas residuales e industriales, en el diseño de chimeneas industriales, en el diseño del equipo de control de la contaminación, en pruebas de rutina de laboratorio, en
1-3
Dr. Héctor Quevedo Urías
trabajos de investigación y en la producción de calidad y construcción. Por ejemplo, en el laboratorio si el muestreo es preciso o si la variabilidad de nuestros resultados es mayor de lo esperado, entonces hay que corregir la variación refinando las técnicas de laboratorio o incrementando el tamaño de la muestra. En el campo de la investigación tal vez estemos interesados en saber si un cambio es un ingrediente que afecta las propiedades del material resultante, para comparar la eficiencia de procesos o de máquinas probadoras; para determinar si los resultados obtenidos encajan en una forma postulada o sospechada. Otra aplicación muy importante es el control de la calidad en la ingeniería industrial. Con relación a las variables continuas y discretas, en este caso se dice que una variable aleatoria es una función que asigna un valor numérico a cada evento simple en un espacio de la muestra. Así, una variable aleatoria continua puede asumir una figura innumerable y, teóricamente, puede asumir cualquier valor entre dos valores dados. Por ejemplo las alturas de una persona pueden ser 62.0 pulgadas, 63.8 Pulgadas, 65.8456 Pulgadas, etc. En contraste, una variable es discreta si puede asumir, solamente, un número contable de posibles valores. Medidas de tendencia central o de localización: el promedio, la mediana y la moda. Símbolos usados en las sumatorias de estadística: n
El símbolo Σ Xj se usa para denotar la suma de todas las j=1
Xjs, desde j = 1 hasta j = N.
n
Ejemplo #1. Σ Xj = X1 + X2 + X3 + ... + Xn j=1
1-4
Dr. Héctor Quevedo Urías
n
Ejemplo #2. Σ XjYj = X1Y1 + X2Y2 + X3Y3 + ...+ XNYn j=1
n
Ejemplo #3. Σ aXj = aX1 + aX2 +...+ aXn j=1
n
= a(X1 + X2 +,..,+ Xn) = a Σ Xj j=1
Nótese la diferencia entre ΣX 2 y (ΣX)2 La suma de los cuadrados (SS), es decir, la suma de las desviaciones al cuadrado de X de su promedio X se denota como: kn
La suma total de los cuadrados = Σ (Xi - X )2 = SS i=1
(1-1)
= ΣX 2 - (ΣX)2/n El promedio aritmético El promedio aritmético es un valor el cual es típico o representativo de un conjunto de datos de distribuciones continuas. Existen diferentes tipos de promedios. Los más comunes son el promedio aritmético, la mediana, la moda, el promedio geométrico, el promedio harmónico, etc. Cada uno tiene sus ventajas y desventajas dependiendo de los datos y el propósito a seguir. El promedio aritmético no se debe usar como sinónimo de promedio o media, porque hay otros tipos de promedios. El promedio aritmético es un valor que representa un conjunto de datos; es una medición de tendencia central. El promedio aritmético es el estimador del parámetro
1-5
Dr. Héctor Quevedo Urías
de población, µ y se define como: X = (X1 + X2 + X3 +...+ Xn) / n = ΣXj / n = ΣX/n
(1-2)
Si los números X1, X2, X3,…,Xk ocurren f1, f2,…,fk veces, es decir, con datos agrupados, entonces: X = fXi / n
(1-3)
Con las distribuciones continuas, es de notarse qué, el promedio aritmético, X es un estimador de µ, es decir, del parámetro de población. En muy raras ocasiones se conoce µ (toda la población), siendo así, entonces, se calcula directamente. Ejemplo #4. El promedio de una muestra de observaciones de ciertos análisis de aguas, cuyos valores son 8, 3, 5, 12, 10, es: X = (8 + 3 + 5 + 12 + 10)/5 = 38/5 = 7.6
Ejemplo #5. Calcular X , de una muestra de 5, 8, 6, y 2 casos que ocurren con una frecuencia de de 3, 2, 4, y 1. X = [(3)(5) + (2)(8) + (4)(6) + (1)(2)]/(3+2+4+1) = 5.7
La mediana ~
La mediana, X es el valor de en medio de un grupo de números u observaciones (puestas en forma ascendente) o el promedio aritmético de los dos valores de en medio. Geométricamente hablando, la mediana es el valor de X (abscisa) correspondiente a esa línea vertical que divide a un histograma en dos partes teniendo áreas iguales. La mediana es una posición de promedio, mientras que el promedio aritmético es un promedio calculado.
1-6
Dr. Héctor Quevedo Urías
Ejemplo # 6. La muestra de observaciones 3, 4, 4, 5, 6, 8, 8, 10 tiene una mediana de ~ X = (5+6)/2 = 5.5.
Ejemplo #7. La muestra de observaciones 5, 5, 7, 9, 11, 12, 13, 15, 18 tiene una ~
mediana de X = 11. La moda La moda es una estadística que demuestra el valor que ocurre con más frecuencia en una muestra (poniendo los datos en forma ascendente). Una distribución puede tener una moda, puede ser bimodal, etc. Este valor se denota por Xˆ . Sin embargo, algunas ocasiones la moda no existe. Ejemplo #8. La muestra de observaciones 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 tiene una moda de Xˆ = 9, es decir, el valor que ocurre con más frecuencia. Ejemplo #9. Los valores 3, 5, 8, 10, 12, 15, 16 no tienen moda. Ejemplo #10. La muestra de observaciones 2 ,3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tiene dos modas, 4 y 7 y es bimodal, es decir, Xˆ = 2.
1-7
Dr. Héctor Quevedo Urías
Relación entre el promedio aritmético, la mediana y la moda Si el promedio, la mediana y la moda coinciden, entonces la distribución es simétrica; de otra manera, la distribución es asimétrica con sesgo a la derecha o la izquierda. Ver figuras de abajo.
Figura 1.0. Distribución oblicua
Figura 1.1. Distribución oblicua
a la derecha (sesgo positivo).
a la izquierda (sesgo negativo)
(Elaboración propia)
(Elaboración propia)
Ejemplo #11. Encontrar el promedio aritmético, la mediana y la moda para una muestra de análisis de aire de Pb cuyos valores son: 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 partes por millón (ppm). Solución: X = 5.1 ppm ~ X = (5+5)/2 = 5 Xˆ = número que ocurre con más frecuencia = 5
Ejemplo #12. Encontrar el promedio, la mediana y la moda de los casos 48.7, 48.8,
1-8
Dr. Héctor Quevedo Urías
49.5, 50.3, 51.6. Solución: ~ X = 49.8, X = 49.5, Xˆ = no existe
El promedio geométrico El promedio geométrico se usa como un disfraz de transformación logarítmica. Es útil para promediar tasas de crecimiento (aumento o decremento) de una muestra estadística. La fórmula es: G=
n
x x x ... x 1
2
3
n
(1-4)
Ejemplo #13. Encontrar el promedio geométrico de los valores 3, 5, 6, 6, 7, 10, 12 Solución: G = 7 (3)(5)(6)(6)(7)(10)(12) = 7 453,600 log G = 1/7 log(453,000) = 0.8081 y antilog 0.8031 = 6.43 Existen otros promedios como el promedio harmónico, el promedio cuadrático, etc. También hay otras medidas de localización más finas que dividen los datos en más de dos partes. Por ejemplo, los cuartiles dividen el conjunto de datos en cuatro partes iguales. Por ejemplo, el tercer cuartil (Q3) describe la cuarta parte superior del conjunto de datos. El segundo cuartil (Q2) es idéntico a la mediana. El primer cuartil (Q1) separa la cuarta parte inferior de las tres cuartas partes superiores. Además, los percentiles pueden dividir los datos en 100 partes iguales. Por ejemplo, el 99avo percentil separa el 1% más alto del 99% restante, etc. Otra forma de ver la simetría de los datos es usando diagramas de caja. También hay lo que se llama diagramas de punto, que ayudan, visualmente, a revisar la simetría de los datos.
1-9
Dr. Héctor Quevedo Urías
La varianza La varianza, s2 es una medida de dispersión y nos dice, qué tanta variación existe de una observación a otra (o del promedio) o de una muestra a otra. Una s2 grande tiene más casos diversificados, que una con una varianza pequeña. La varianza s2 de una muestra estadística (o de varias muestras) es el estimador del parámetro de la varianza, σ2 de una población o poblaciones. La fórmula de la varianza es: n
s2 = Σ (X - X )2/(n-1) = [ΣX 2 – (ΣX)2/n]/(n - 1) i=1
(1-5)
= SS/(n – 1) Ejemplo #14. Calcular la varianza y la desviación estándar de la muestra 2, 4, 6. Solución: Calculando X = 4 y usando el método largo nos da: s2 = [(2 - 4)2 + (4 - 4)2 + (6 - 4)2]/(3 - 1) = 8/2 = 4 Usando el método corto: Varianza = s2 = [ΣX2 – (ΣX)2/n]/(n – 1) nos daría: s2 = [ΣX2 –(ΣX)2/n]/(n – 1) = (56 – 48)/2 =4 La desviación estándar La desviación estándar, s es una forma especial de la desviación promedio de la media. Es una medida de dispersión. A medida que aumenta la desviación estándar o la varianza, mayor diversidad habrá entre las observaciones de una muestra. Esta
1-10
Dr. Héctor Quevedo Urías
estadística se da como: s = √ [ΣX 2 – (ΣX)2/n] / (n – 1)
(1-5a)
Para datos agrupados, la desviación estándar es: s = √ [fj ΣX 2 – (ΣX)2/n] / (n – 1)
(1-5b)
Ejemplo #15. Para el ejemplo de arriba, calcular la desviación estándar. Solución: Si la varianza, s2 = 4, por lo tanto, la desviación estándar, s es: s = s2 = 4 = 2 Ejemplo #16. Encontrar X , s, s2, la mediana, el error estándar del promedio, el sesgo y la kurtosis de una muestra al azar de 36 análisis de fosfatos (PO4-3), en mg/L. ¿Qué tanta fidelidad hay en los datos? La tabla de abajo da la información. __________________________________________________________________ Valores de X | 61 64 67 70 73 69 68 70 Frecuencia | 5 8 4 5 5 4 3 2 Solución: Usando un paquete de computadora da: X = 67.27, s = 3.78, s2 = 14.31, mediana = 68, sesgo = -0.22 y kurtosis = -0.95. Al juzgar por los resultados, hay una buena aproximación a la distribución normal, puesto que X y la mediana son parecidos. Además el valor del sesgo no difiere mucho de 0. Se le pide al lector usar la fórmula (15-b) para corroborar los resultados computarizados obtenidos. Propiedades de la desviación estándar Para una distribución normal el 68.27% de todas las observaciones están incluidas entre ( X - s) y ( X + s), esto es, una desviación estándar a cualquier lado del promedio. Similarmente, el 95.45% de todos los casos se incluyen entre ( X - 2s) y
1-11
Dr. Héctor Quevedo Urías
( X + 2s), esto es entre z = ±2. Además, en el 99.73% de todos los casos se incluyen entre ( X - 3s) y ( X + 3s), esto es, entre z = ±3.
Figura 1.2. Distribución normal mostrando las áreas para diferentes percentiles de la variable estandarizada z (Spiegel, 1961). Variable aleatoria estandarizada z Esta variable aleatoria estandarizada z mide las desviaciones del promedio en unidades de desviación estándar y se da como: z = (X - X ) / s.
(1-6)
Z = (X - µ)/σ
(1-7)
Su parámetro respectivo es: Ejemplo #16. Calcular las siguientes probabilidades: (a) P(z ≤ 1.25) (b) P(z > 1.25) (c) P(z ≤ -1.25) (d) P(-.38 ≤ z ≤ 1.25) Solución: (a) Para esto, buscamos en la tabla de la distribución normal del renglón marcado con
1-12
Dr. Héctor Quevedo Urías
1.2 y la columna .05 y da .8944; por lo cual, P(X ≤ 1.25) = .8944. (b) P(z > 1.25) = 1 – P(z ≤ 1.25) = 1 - .8944 = .1056 c) P(z ≤ -1.25) = .1056. Por simetría de la curva normal, es la misma respuesta que en el inciso (b) (d) P(-.38 ≤ z ≤ 1.25) = (área de -∞ a z = 1.25) – (área de -∞ a z = -.38) = .8944 .3520 = .5424 (de la tabla de z) Otra manera de ver lo mismo es usando anotación de probabilidades: P(-.38 ≤ z ≤ 1.25) = P(z ≤ 1.25) – P(z ≤ -.38) = .8944 - .3520 = .5424 Las desviaciones del promedio Las desviaciones del promedio son otras medidas de dispersión. Matemáticamente.... n
Desviación del promedio = Σ |Xj - X |/N j=1
(1-8)
Ejemplo #17. Encontrar la desviación promedio de los valores 2, 3, 6, 8, 11. Solución: El promedio aritmético es X = 6 La desviación promedio = (|2-6|+|3-6|+|6-6|+|8-6|+|11-6|)/5 = 2.8 El rango El rango de las observaciones de una muestra es la diferencia entre el número más grande y el más pequeño. Aquí, es de notarse qué, entre más grande sea la diferencia, más dispersión habrá, es decir, la varianza y la desviación estándar serán más grandes. Ejemplo #18. Encontrar el rango de 2, 3, 3, 5, 5, 5, 8, 10, 12. Solución:
1-13
Dr. Héctor Quevedo Urías
El número más pequeño es el 2 y el más grande es el 12, esto es, 12 - 2 = 10 Nota: Existen otras funciones de dispersión como la dispersión relativa y absoluta o el coeficiente de variación, etc. Sesgo y kurtosis El sesgo de una distribución mide el grado de la simetría. Si la curva de frecuencia de una distribución tiene un extremo más largo a la derecha del máximo central que el de la izquierda, la distribución es oblicua hacia la derecha o con sesgo positivo. Lo contrario es correcto y se dice que es oblicua hacia la izquierda o de sesgo negativo. Esta condición se denomina el primer coeficiente de sesgo de Pearson. El sesgo de la distribución normal es igual a 0. Ya se explicó que, la relación entre el promedio, la mediana y la moda pueden dar una indicación del grado de simetría de los datos de una distribución. Por ejemplo, si el promedio es mayor que la mediana, mayor que la moda, entonces, la distribución es asimétrica con sesgo positivo hacia la derecha. De otra manera, la distribución tiene sesgo negativo hacia la izquierda. La kurtosis de una distribución mide lo puntiagudo de una distribución normal. Una distribución que tiene una cima o pico relativamente alta se llama leptokúrtica, mientras que aquélla que está achatada se llama platykúrtica. La curva normal que no está picuda ni achatada se llama mesokúrtica. La kurtosis de la curva normal es igual a 3. Error estándar Además de reportar el valor de una estimación puntual, también debe indicarse su precisión. La medida de precisión usual es el error estándar del estimador usado. Por ejemplo, los errores estándares de algunas distribuciones de la muestra son los del promedio, de proporciones, de desviaciones estándar y de medianas.
1-14
Dr. Héctor Quevedo Urías
Así, de esta manera, los errores estándares del promedio, de las proporciones o la mediana es, respectivamente: σX = σ √ N
(1-9)
σp = pq/N
(1-9a)
σs = σ 2N (para poblaciones normales) σmed.= σ
Π 2N
(para n ≥ 30)
(1-9b) (1-9c)
Términos importantes Parámetros. Se refieren a valores poblacionales. Se usan los símbolos griegos para denotarlos. Estadística. Se refiere a una muestra tomada de una población. Es un estimador de los parámetros de población. Promedio aritmético. Si se conoce toda la población se usa la variable µ. Si se refiere a una muestra estadística, se usa la variable X . De cualquier manera el promedio aritmético es la sumatoria de un grupo de observaciones dividido entre el total de los casos. Promedio. En general un promedio se refiere a una medida de tendencia central. Ejemplos son el promedio aritmético, la mediana y la moda. Hay también promedios geométricos, armónicos, etc. Mediana. Es el valor del ítem central cuando los datos son agrupados por tamaño ~
( X ). Moda. Es el valor que ocurre con más frecuencia ( Xˆ ). Distribución bimodal. Se refiere a una distribución con dos modas.
1-15
Dr. Héctor Quevedo Urías
Medidas de dispersión. Se refiere al grado de dispersión de los datos numéricos del promedio. Los más comunes son: el rango, la desviación estándar, la variancia, la desviación promedio, desviación de cuartiles, etc. Varianza. Es una medida de dispersión. Se denota como σ2 para describir toda la población. Sin embargo, si se refiere a la varianza de la muestra, se usa el símbolo s2 y se describe como la suma de los cuadrados dividida entre el número de valores de la muestra menos uno. Se usa el símbolo s2 que es el estimador del parámetro poblacional σ2. Desviación estándar. Se obtiene sacando la raíz cuadrada de la varianza poblacional o de la varianza de la muestra. Coeficiente de variación. Es la relación matemática de la desviación estándar divida entre el promedio aritmético. Generalmente se expresa como porcentaje. Es útil para comparar distribuciones donde las unidades puedan ser diferentes. Variables discretas. Variables discretas se refieren a características tales como color, sexo, religión, etc., que se pueden expresar en clasificaciones o categorías cualitativas. Por ejemplo, el número n de una familia de niños asume valores de 0, 1, 2, 3,..., pero que no puede asumir valores de 2.5 o de 3.856. Variables continuas.- Se refiere a variables que, teóricamente, pueden asumir cualquier valor entre dos valores dados. Se pueden expresar en clasificaciones o categorías cuantitativas. Por ejemplo, la altura h de un individuo, la cual puede ser 63.9 pulgadas, 65.9945 pulgadas, es una variable continua. Sesgo. Mide la simetría de una distribución. El sesgo puede ser positivo (oblicuo hacia la derecha) o negativo (oblicuo hacia la izquierda). Si es sesgo es positivo, ~ entonces X > X > Xˆ . Sin embargo, si el sesgo es negativo, entonces, es el reverso.
La kurtosis mide lo achatado o puntiagudo de la distribución.
1-16
Dr. Héctor Quevedo Urías
Variable estandarizada. Mide la desviación del promedio en unidades de desviación estándar, simplemente, se refiere al número de desviaciones estándar de una observación que está abajo o arriba del promedio de la distribución. Métodos gráficos y tabulares usados en estadística descriptiva Otras técnicas visuales, que son muy útiles en la probabilidad y la estadística de inferencia, son el uso de desplegados de tallo y hojas. Otros más son los diagramas de punto (explicados posteriormente) y los histogramas. Por ejemplo, para construir un diagrama de tallo y hoja, esta situación se explica en el tópico de diagramas de tallo y hoja. Los diagramas de tallo y hoja son parecidos a los histogramas y sirven el mismo propósito. Esto es, porque los diagramas de tallo y hoja revelan el rango de los datos, muestran donde ocurre la concentración más alta de valores, proveen información acerca de la presencia o ausencia de simetría y, pueden indicar el grado de simetría en la cual los datos son homogéneos. Distribuciones de frecuencia Cuando se están procesando grandes cantidades de datos es conveniente distribuirlos dentro de clases o categorías, para determinar el número de observaciones que pertenecen a cada clase llamada frecuencia de clase. Así, un arreglo tabular de datos por clases junto con las frecuencias de clases correspondientes se llama distribuciones de frecuencia o tablas de frecuencias. Definición de términos Órdenes.- Un orden es un arreglo de datos numéricos sin procesar en orden de magnitud ascendente o descendente. Intervalo de clase.- Es un arreglo que define una clase digamos de 60-62 la cual se llama intervalo de clase. Los números terminales 60 y 62 se llaman límites de clases o límites de clase inferior y superior. El intervalo 60-62 incluye, teóricamente, las
1-17
Dr. Héctor Quevedo Urías
mediciones 59.5-62.5 y se llaman límites de clases. Estos se obtienen sumando el límite superior de un intervalo con el límite inferior del siguiente intervalo de clase y dividiendo entre 2. Clases de punto intermedio o marcas de clases.- Las clases de punto intermedio o marcas de clases son el punto medio de un intervalo de clase que se obtiene sumando los límites superiores e inferiores y dividiendo entre dos. Por ejemplo, el punto medio del intervalo 60-62 es (60 + 62)/2 = 61 y, así sucesivamente. Tamaños de intervalos de clase. El tamaño de un intervalo de clase es la diferencia entre los límites o linderos superiores e inferiores. Reglas para hacer distribuciones de frecuencia 1. Determinar los números más pequeños y más grandes de los datos sin procesar. 2. Dividir el rango en un número conveniente de intervalos de clases que tengan el mismo tamaño. Si esto no es posible, usar intervalos de clase de diferentes tamaños. 3. Determinar el número de observaciones que caen dentro de cada uno de estos intervalos de clases. 4. Los límites de clases no deben de coincidir con los datos reales. La fórmula para calcular el tamaño de clase de una distribución de frecuencia es: i = (h - l) / k
(1-10)
Donde: i = el tamaño del intervalo de clase h = el valor del ítem más alto l = el valor del ítem más bajo k = número de clases Tipos de curvas de frecuencia 1. Curva de frecuencia simétrica o en forma de campana. Un ejemplo
1-18
importante es
Dr. Héctor Quevedo Urías
la curva normal. 2. Curva asimétrica u oblicua cuyos extremos de la curva están al
lado derecho o al
izquierdo del máximo central. 3. Curva de frecuencia en forma de J. 4. Curva de frecuencia en forma de U. 5. Curva de frecuencia bimodal que tiene dos máximos. 6. La curva de frecuencia multimodal que tiene más de dos máximos.
Figura 1.3 Gráficas mostrando los tipos de curvas de frecuencia (Spiegel, 1961). Histogramas y polígonos de frecuencia
1-19
Dr. Héctor Quevedo Urías
La forma más común de representación gráfica de una distribución de frecuencia es el histograma. Estos histogramas consisten en rectángulos adyacentes, las alturas de los cuales representan las frecuencias de clases, mientras que sus bases se extienden entre sucesivas fronteras de clases. Esto quiere decir que tienen bases sobre la abscisa con centros en las marcas de clases y con las longitudes igual a los intervalos de clases. Por otro lado, los polígonos de frecuencia son gráficas de líneas de frecuencias de clases que se grafican contra las clases de marcas. Se obtienen conectando los puntos medios de arriba de los rectángulos en los histogramas.
Figura 1.4. En los histogramas y polígonos de frecuencia se acostumbra a sumar las extensiones pq y rs para la siguiente marca de clase más baja y más alta que tienen la correspondiente clase de frecuencia de cero. En tales casos, la suma de las áreas de los rectángulos es igual al área total circundada por el polígono de frecuencia y el eje de las equis. (Elaboración propia) Distribuciones de frecuencia relativa La frecuencia relativa de un intervalo de clase es la frecuencia de la clase dividida entre la frecuencia total de todas las clases y se expresa como porcentaje.
1-20
Dr. Héctor Quevedo Urías
Ejemplo #20. Hacer una tabla de distribución con intervalos de clase y la frecuencia relativa para las alturas de 100 estudiantes de una universidad. TABLA 1.0. Alturas de los estudiantes. (Spiegel, 1961). ___________________________________________________________________ Distribución de las alturas Frecuencia relativa por intervalos de clase
de estudiantes (%)
___________________________________________________________________ 60 - 62 pulgadas
5%
63 - 65
18 %
66 - 68
42 %
69 - 71
27 %
72 - 74
8%
_________________________________________________________ Total 100 % Distribuciones de frecuencias acumuladas y distribuciones de frecuencias relativas acumuladas Aquí se discutirán las distribuciones de frecuencias acumuladas y la frecuencia relativa acumulada que se obtiene dividiendo la frecuencia acumulada por la frecuencia total. Ejemplo #21. Tabular los valores de la tabla de frecuencia de 500 observaciones formando una tabla con los intervalos de clase más apropiados, con la frecuencia, la frecuencia relativa (%), la frecuencia acumulada y la frecuencia relativa acumulada. Usar papel de probabilidad y encontrar el promedio aritmético y la desviación estándar. Confirmarlos gráficamente y calcularlos.
1-21
Dr. Héctor Quevedo Urías
TABLA 1.1. Frecuencias de 500 observaciones de fosfatos (mg/L). (Elaboración propia). _____________________________________________________________ X f X f X f X f _____________________________________________________________ 20 1 21 0 36 7 51 20 66 6 22 0 37 9 52 19 67 5 23 1 38 10 53 19 68 4 24 1 39 11 54 18 70 3 25 1 40 12 55 18 70 3 26 1 41 13 56 17 71 2 27 1 42 14 57 16 72 2 28 2 43 16 58 14 73 1 29 2 44 17 59 13 74 1 30 3 45 18 60 12 75 1 31 3 46 18 61 11 76 1 32 4 47 19 62 10 77 1 33 5 48 19 63 9 78 0 34 6 49 20 64 7 79 0 35 6 50 20 65 6 80 1 __________________________________________________________________
1-22
Dr. Héctor Quevedo Urías
TABLA 1.2. Tabla de frecuencias de 500 casos de fosfatos. (Elaboración propia) _________________________________________________________________ Intervalo de clase f f. r.(%) f. a. f. r. a. (%) ________________________________________________________________ < 30.5 13 2.6 13 2.6 30.5-35.5 24 4.8 37 7.4 35.5-40.5 49 9.8 86 17.2 40.5-45.5 78 15.6 164 32.8 45.5-50.5 96 19.2 260 52.0 50.5-55.5 94 18.8 354 70.8 55.5-60.5 72 14.4 426 85.2 60.5-65.5 43 8.6 469 93.8 65.5-70.5 21 4.2 490 98.0 > 70.5 10 2.0 500 100.0 _______________________________________________________________ Total 500
1-23
Dr. Héctor Quevedo Urías
Figura 1.5. Papel de probabilidad mostrando las 500 observaciones de fosfatos relacionadas con la TABLA 1.2. (Elaboración propia) Analizando la Figura 1.5, se puede ver qué, para calcular el promedio µ localizamos .50 en la ordenada y por interpolación calculamos el valor de 50. Igualmente, para calcular la desviación estándar σ, nos movemos a .84 y por interpolación calculamos el valor de 10, que está entre 50 y 60. Ejemplo #22. Para los siguientes 40 datos de análisis de agua de concentraciones de calcio, en mg/L, contestar las siguientes preguntas: (a) Construir una tabla de frecuencias con intervalos de 5 y estimar el punto intermedio o marca de clase. (b) Construir otra tabla más con intervalos de tamaño 9 y estimar el punto intermedio
1-24
Dr. Héctor Quevedo Urías
o marca de clase. (c) Para ambos casos construir un histograma y un polígono de frecuencia y también, en función de frecuencia relativa. (d) Para ambos casos, construir una gráfica de frecuencia acumulada y frecuencia relativa acumulada. (e) Usar papel de probabilidad para estimar el promedio aritmético y la desviación estándar. Comparar estos resultados con el cálculo del promedio y la desviación estándar usando las fórmulas estadísticas. TABLA 1.3. Tabla mostrando las concentraciones de calcio de 40 análisis de agua. (Elaboración propia) 138 146 168 146 161
164 158 126 173 145
150 140 138 142 135
132 147 176 147 142
133 136 163 135 150
125 148 119 153 156
149 152 154 140 145
157 144 165 135 128
Solución: El rango es de 176 - 119 = 57 mg/L Si se usan intervalos de clase de tamaño 5, los intervalos de clase son 57/5 = 12, aproximadamente. Sin embargo, si se usan intervalos de clase de tamaño 9, los intervalos de clase son 57/9 = 6, aproximadamente. Las tablas de abajo muestran estas estimaciones.
1-25
Dr. Héctor Quevedo Urías
TABLA 1.4. Tabla de frecuencias de las concentraciones de Calcio (Ca) usando un intervalo de tamaño 5. (Elaboración propia) _________________________________________________________________ Intervalo de clase Marca de clase f f.a. f.r. f.r.a. _________________________________________________________________ 118 - 122 120 1 1 2.5% 2.5% 123 - 127 125 2 3 5.0% 7.5% 128 - 132 130 2 5 5.0% 12.5% 133 - 137 135 4 9 10.0% 22.5% 138 - 142 140 6 15 15.0% 37.5% 143 - 147 145 8 23 20.0% 57.5% 148 - 152 150 5 28 12.5% 70.0% 153 - 157 155 4 32 10.0% 80.0% 158 - 162 160 2 34 5.0% 85.0% 163 - 167 165 3 37 7.5% 92.5% 168 - 172 170 1 38 2.5% 95.0% 173 - 177 175 2 40 5.0% 100.0% __________________________________________________________________ Total 40 TABLA 1.5. Tabla de frecuencias de las concentraciones de Ca usando un intervalo de tamaño 9. (Elaboración propia) _________________________________________________________________ Intervalo de clase Punto intermedio f f.a. f.r. f.r.a. _________________________________________________________________ 118 - 126 122 3 3 7.5% 7.5% 127 - 135 131 5 8 12.5% 20.0% 136 - 144 140 9 17 22.5% 42.5% 145 - 153 149 12 29 30.0% 72.5% 154 - 162 158 5 34 12.5% 85.0% 163 - 171 167 4 38 10.0% 95.0% 172 - 180 176 2 40 5.0% 100.0% __________________________________________________________________ Total 40 Los incisos (c), (d) y (e) se reservan para que el estudiante los haga.
1-26
Dr. Héctor Quevedo Urías
También se puede calcular el promedio aritmético de una distribución de frecuencia, cuando se dan los intervalos de clase y las frecuencias. La fórmula para tales casos es: X = ΣfX / Σf = ΣfX / nΣ
(1-11)
Ejemplo #22. Se dan los siguientes datos de temperaturas ambientales en grados Fahrenheit (oF) en la tabla de abajo. TABLA 1.6. Tabla mostrando los datos. (Elaboración propia) Marca de clase (X) f Temperaturas (oF) 60 – 62 61 5 63 – 65 64 18 66 – 68 67 42 69 – 71 70 27 72 – 74 73 8 N = Σf = 100
fX 5 x 61 = 305 64 x 18 = 1152 67 x 42 = 2814 70 x 27 = 1890 73 x 8 = 584 ΣfX = 6745
Por lo tanto, X = ΣfX / Σf = ΣfX / N = 6745 / 100 = 67.45 oF Diagramas de tallo y hoja usando el programa Minitab Ejemplo # 23. Para ilustrar la construcción de una gráfica de tallo y hoja, considérese la tabla de abajo, la cual muestra las mediciones de 40 observaciones. TABLA 1.7. Tabla mostrando las mediciones de 40 objetos. (Elaboración propia). 2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6 3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7 2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1 3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4 4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5 _____________________________________________________________ Procedimiento: Para formar el diagrama de tallo y hoja, se separa cada observación en dos partes
1-27
Dr. Héctor Quevedo Urías
consistentes de un tallo y una hoja. Siendo así, el tallo representa el dígito que precede al punto decimal y, la hoja, corresponde al dígito a la derecha del punto decimal. Por ejemplo, con el número 3.7, el dígito 3 representa el tallo y el dígito 7 representa la hoja. De acuerdo a los datos de la TABLA 1.8 hay cuatro tallos, es decir, 1, 2, 3, 4. Una vez hecho esto, se identifican los números a la derecha del punto decimal correspondientes a cada tallo. Por ejemplo, para el tallo 1 hay dos hojas, 6 y 9; para el tallo 2 hay 5 hojas, es decir, 2, 5, 6, 9 y 5, etc. La TABLA 1.8 de abajo representa la gráfica de tallo y hojas para este problema. No obstante, para poder construir la TABLA 1.8 se puede usar el Minitab de acuerdo a las siguientes indicaciones: Graph → Stem-and-leaf En el recuadro que aparece poner las variables de la columna C1 en la ventanilla de “Stem-and-leaf” y en la ventanilla de “Increments” poner 1. Esto produce los datos de la TABLA 1.8 mostrada abajo. TABLA 1.8. Tabla mostrando los resultados de tallo y hoja correspondientes a las observaciones de la TABLA 1.7. __________________________________________________________________ Stem-and-Leaf Display: Mediciones de 40 objetos Stem-and-leaf of Mediciones de 40 objetos N = 40 Leaf Unit = 0.10 Frecuencia
Tallos
Hojas
2 1 69 7 2 25669 (25) 3 0011112223334445567778899 8 4 11234577 __________________________________________________________________
1-28
Dr. Héctor Quevedo Urías
Sin embargo, los resultados de la TABLA 1.8 no dan un panorama adecuado de la distribución de los datos. Para remediar esta situación se necesita aumentar el número de tallos en la gráfica. Una manera simple de hacerlo es doblando cada tallo. Para esto, nuevamente introducir los datos como se hizo anteriormente y en la ventanilla de “Increments” poner .5. Esto produce la tabla de abajo. TABLA 1.9. Tabla mostrando los tallos dobles y de hojas. Stem-and-Leaf Display: Mediciones de 40 objetos Stem-and-leaf of Mediciones de 40 objetos N = 40 Leaf Unit = 0.10 Frecuencia Tallos Hojas 2 1 69 3 2* 2 7 2 5669 (15) 3* 001111222333444 18 3 5567778899 8 4* 11234 3 4 577 __________________________________________________________________ Las tablas de las distribuciones de tallo y hoja se pueden usar para estimar los intervalos de clase cuando se hacen distribuciones de frecuencia. El procedimiento es como sigue: 1. Primero se saca el rango de los datos. Por ejemplo, de la TABLA 1.7 el valor máximo es 4.7 y el valor mínimo es 1.6, o sea: rango = 4.7 – 1.6 = 3.1. 2. Enseguida se estima el ancho del intervalo dividiendo el rango entre el número de tallos (7 en este caso), es decir, 3.1 / 7 = .4. 3. Ahora, para estimar el primer intervalo de clase empezamos con 1.5 y le
1-29
Dr. Héctor Quevedo Urías
sumamos .4 para dar 1.9. El siguiente intervalo de clase es 2.0 más .4 para dar 2.4. El siguiente intervalo de clase es 2.5 más .4 para dar 2.9 y así sucesivamente, como se muestra en la TABLA 1.10 de abajo. TABLA 1.10. Tabla mostrando los intervalos de clase, el punto medio, la frecuencia, la frecuencia relativa y la frecuencia relativa acumulada. Intervalo de
Punto
Frecuencia
Frecuencia
Frecuencia relativa
clase
medio
(f)
relativa (f.r.)
acumulada (f.r.a.)
1.5 – 1.9
1.7
2
0.050
0.050
2.0 – 2.4
2.2
1
0.025
0.075
2.5 – 2.9
2.7
4
0.100
0.175
3.0 – 3.4
3.2
15
0.375
0.550
3.5 – 3.9
3.7
10
0.250
0.800
4.0 – 4.4
4.2
5
0.125
0.925
4.5 – 4.9
4.7
3
0.075
1.000
Por otro lado, con los datos de la TABLA 1.10 se pueden hacer histogramas de frecuencia relativa, con curvas normales sobrepuestas y curvas de frecuencia relativa acumulada para calcular medidas de localización como cuartiles o percentiles. Por ejemplo, los cuartiles dividen el conjunto de datos en cuatro partes iguales. Siendo así, el primer cuartil o .25 fractil (Q1) separa la cuarta parte inferior de las tres cuartas partes superiores, esto es, el 25% de las mediciones de abajo. El segundo cuartil o .50 fractil (Q2) es idéntico a la mediana o sea que la mitad de las observaciones están debajo de este valor. Las observaciones arriba del tercer cuartil o .75 fractil (Q3) son la cuarta parte superior del conjunto de datos. Finalmente, los
1-30
Dr. Héctor Quevedo Urías
intercuartiles miden la diferencia entre los cuartiles Q1 y Q2. De la misma manera, el conjunto de datos de la muestra se puede dividir en 100 partes iguales por medio de percentiles. Por ejemplo, el 99avo percentil separa el 1% más alto del 99% restante; el 84avo percentil separa el 16% más alto del 84% restante. Bajo estas condiciones, el 84avo percentil correspondiente al valor de la variable aleatoria z de la distribución normal es, aproximadamente, z = +1 y por simetría es z = -1. Los cuartiles y percentiles junto con la estadística descriptiva se pueden calcular con el programa Minitab usando el mandato: Stat → Basic statistics → Display Descriptive Statistics Igualmente, los cuartiles y percentiles también se pueden calcular de una gráfica de frecuencia relativa acumulada vs. valores de X. Usando los datos de la TABLA 1.7 vamos a proceder a hacer los cálculos de la estadística descriptiva, los cuales se dan en la tabla de abajo. TABLA 1.11. Tabla mostrando la estadística descriptiva del ejemplo #23. Descriptive Statistics: Mediciones de 40 objetos Variable
N N* CumPct Mean
Mediciones
40 0
Variable Mediciones
Minimum
100
3.413
Q1 Median
1.600 3.100
3.400
SE Mean StDev Variance 0.111 Q3 3.875
0.703
0.494
CoefVar 20.60
Maximum Range 4.700
3.100
__________________________________________________________________
1-31
Dr. Héctor Quevedo Urías
Histogram (with Normal Curve) of Mediciones de 40 objetos Mean StDev N
12
3.413 0.7028 40
Frequency
10 8 6 4 2 0
1.6
2.4 3.2 4.0 Mediciones de 40 objetos
4.8
Figura 1.6. Figura mostrando el histograma de frecuencia con curva normal sobrepuesta. Ahora, el procedimiento para hacer una gráfica de frecuencia relativa acumulada en función de los valores de X se procede de la siguiente manera: 1. Irse a: Calc → Probability Distribution → Normal 2. En el recuadro que aparece puntear “Cummulative distribution” y almacenar los datos de la distribución de frecuencia acumulada en C2. 3. Para hacer la gráfica de frecuencia relativa acumulada vs. valores de X, irse a: Graph → Scatterplot → With connect line 4. En la ventana de “Scatterplot with connect line” introducir los datos de la distribución de frecuencia acumulada (de la columna C2) vs. los valores de X. 5. En la ventanilla de “Scatterplot-Scale”, llenar todos los recuadros. De esta manera, para calcular la distribución de frecuencia acumulada proceder como en el paso 1 de arriba. Todas estas órdenes producen la tabla conteniendo los valores de X (no se muestra aquí). La gráfica de las frecuencias relativas
1-32
Dr. Héctor Quevedo Urías
acumuladas y valores de las observaciones se hace como en el paso 3 de arriba. De la gráfica de abajo se pueden leer todos los cuartiles y percentiles deseados.
Figura mostrando la grafica de f.r.a. y valores de X
Distribucion de f.r.a.
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0 1.5
2.0
2.5
3.0 3.5 4.0 Mediciones de 40 objetos
4.5
5.0
Figura 1.7. Figura mostrando la gráfica de la frecuencia relativa acumulada versus valores de X. Ejemplo #24. Encontrar los cuartiles (Q1, Q2 y Q3) de una muestra de 15 mediciones de sólidos suspendidos, en unidades de mg/L, de una muestra de agua residual. 7 19 12 5 17 29 8 19 4 27 30 1 4 10 21 __________________________________________________________________ Solución:
1-33
Dr. Héctor Quevedo Urías
Primero se arreglan los datos en forma ascendente, esto es: 1, 4, 4, 5, 7, 8, 10, 12, 17, 19, 19, 21, 27, 29, 30 ↑ ↑ ↑ Q1 Q2 Q3 El primer cuartil (Q1) es 5. El segundo cuartil (Q2) o la mediana es 12 y el tercer cuartil (Q3) es 21.
1-34
Dr. Héctor Quevedo Urías
Ejercicios Capítulo 1 1.1. Calcular el promedio, la varianza y la desviación estándar de las observaciones de la muestra: 12, 6, 7, 3, 15, 10, 18, 5.
(9.5, 27.1, 5.2)
1.2. Encontrar la desviación estándar y el promedio de los valores: 3, 6, 2, 1, 7, 5. De acuerdo a la relación de los valores obtenidos del promedio y la desviación estándar o varianza. ¿Qué conclusiones se pueden sacar? 1.3. Escribir los siguientes términos usando anotación de sumatoria. (a) X
2 1
+X
2 2
+X
2 3
+ ...+ X
10
2 10
(Σ Xi) x=0 5
(b) (X1 + Y1) + (X2 + Y2) + .... + (X5 + Y5)
(Σ Xi+Yi) x=0
(c) f1 X1Y1 + f2 X2Y2 + f3 X3Y3 + f4 X4Y4 1.4. Encontrar la desviación promedio de: (a) -3, 7,-9,5 (b) 2.4, 1.6, 3.8, 4.1, 3.4 1.5. El rango de los números 5, 3, 8, 4, 7, 6, 12, 4, 3 es:
(9)
1.6. De 50 mediciones la más grande es 8.34 Kg. Si el rango es .46, encontrar la medición más pequeña. 1.7. Convertir las siguientes observaciones a unidades de desviación estándar: 6, 2, 7, 5.
(z6=0.46, z2=-1.39, z7=0.93, z5=0)
1.8. Escribir los siguientes términos en forma de sumatoria. 6
(a) Σ Xj j=1
1-35
Dr. Héctor Quevedo Urías
4
(b) Σ (y1 - 3) 2 j=1
5
(c) Σ fkxk k=1
1.9. Usando el programa de computadora Minitab, EXCEL o una calculadora de bolsillo, encontrar: (a) El promedio aritmético
(95.84)
(b) La desviación estándar (c) El error estándar del promedio (f) La varianza
(106.49)
Tabla mostrando los datos del problema. (Elaboración propia) Observación x | 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126 _______________________________________________________________________________ Frecuencia f| 4 9 16 28 45 66 85 72 54 38 27 18 115 _______________________________________________________________________________
1.10. En una distribución, si el promedio es 5.0, la mediana es 7.0 y la moda es 9.0, contestar a los siguientes enunciados: (a) ¿Qué tipo de sesgo tiene esta distribución? (b) ¿Dónde se encuentra la mayor concentración de valores? 1.11. En una distribución, si el promedio es de 10.0, la mediana es de 8.0 y la moda es de 5.0, contestar las siguientes preguntas: (a) ¿Qué tipo de sesgo tiene esta distribución?
(Sesgo positivo)
(b) ¿Dónde se encuentran la mayor concentración de valores? 1.12. En un examen final de estadística, los grados fueron: 100, 100, 66, 65, 64, 60, 59, 57, 58, 50.
1-36
Dr. Héctor Quevedo Urías
¿Es esta distribución oblicua hacia la derecha o hacia la izquierda? Justificar el argumento usando la relación del promedio, la mediana y la moda. 1.13. Encontrar el promedio geométrico de una muestra aleatoria de de observaciones 10, 12, 16.
(12.43)
1.14. Si el promedio aritmético de una muestra de 30 casos es igual a 10 y la desviación estándar es igual a 2, calcular la variable estandarizada correspondiente al valor de X = 15. 1.15. La tabla de abajo muestra los coeficientes de inteligencia de 550 niños de una escuela elemental. Encontrar: (a) El promedio aritmético.
(97.03)
(b) La desviación estándar.
(13.22)
(c) El error estándar del promedio
(0.56)
Tabla mostrando los datos del problema. (Elaboración propia) ___________________________________________________________________ Marca de | 75 78 78 82 86 91 94 98 102 106 110 114 118 122 126 clase (X) Frecuencia (Y) | 53 5 10 20 45 60 85 72 54 38 27 18 11 50 2 1.16. Los siguientes datos están relacionados con las temperaturas, en oC, de 10 regiones de México. La tabla de abajo muestra esta situación: Tabla mostrando los datos del problema. (Elaboración propia) __________________________________________________________________ Temp. Frecuencia Frecuencia Frecuencia Frecuencia relativa o ( C) acumulada relativa (%) acumulada __________________________________________________________________ 20 21 22 23
3
3
30%
30%
2 1 Total 10
9
20%
90%
1-37
Dr. Héctor Quevedo Urías
(a) Completar la tabla de arriba. (b) Hacer gráficas de frecuencia versus frecuencia relativa. (c) Hacer gráficas de frecuencia acumulada (f.a.) vs. frecuencia relativa acumulada (f.r.a.). 1.17. Se saca una muestra aleatoria de análisis químicos de compuestos de cloruros (Cl-) expresados en unidades de mg/L procedentes de una muestra de aguas residuales. Estos análisis se hicieron usando el método de nitrato de mercurio descrito en el texto Métodos Estándares. La tabla con los valores de los cloruros se da abajo: Tabla mostrando los datos del problema. (Elaboración propia) ___________________________________________________________________ 17.2, 17.1, 17.0, 17.1, 16.9, 17.0, 17.1, 17.0, 17.3, 17.2, 16.9, 17.0, 17.1, 17.3, 17.2, 17.4, 17.1, 17.1, 17.0, 17.1 (a) Encontrar el promedio.
(17.11)
(b) Encontrar la varianza.
(0.017)
(c) Encontrar la desviación estándar.
(0.132)
(d) Hacer una tabla de frecuencia mostrando la frecuencia, la frecuencia relativa y la frecuencia relativa acumulada.
(el lector lo deberá hacer)
(e) Hacer un histograma.
(el lector lo deberá hacer)
(f) Hacer un polígono de frecuencia.
(el lector lo hará)
(g) ¿Qué tanta simetría hay en esta distribución?
(el lector responderá a esto)
1.18. Completar la tabla de abajo y hacer una gráfica en función de los intervalos de las concentraciones de DBO, de la frecuencia (f) y de la frecuencia relativa acumulada (f.r.a.).
1-38
Dr. Héctor Quevedo Urías
Tabla mostrando los datos. (Elaboración propia) __________________________________________________________________ Intervalos Número de Puntos Frecuencia (Conc. DBO) análisis intermedios relativa (%) __________________________________________________________________ 50.00 - 59.99 60.00 - 69.99 70.00 - 79.99 80.00 - 89.99 90.00 - 99.99 100.00 - 109.99 10.00 - 119.99
8 10 16 14 10 5 2
1.19. Una organización caritativa que ayuda a damnificados por huracanes ha hecho una lista de donaciones recibidas durante el presente año, en miles de pesos. El propósito de este ejemplo es el de hacer una tabla de distribución de frecuencia encontrando los intervalos de clase más apropiados usando la técnica de diagramas de tallo y hoja. La tabla de abajo muestra los datos. Para esto hacer lo siguiente: (a) Calcular el promedio y la mediana.
(139, 135)
(b) Hacer una tabla de distribución de frecuencia usando un diagrama de tallo y hoja. Encontrar los puntos intermedios, la frecuencia, la f. r. y la frecuencia relativa acumulada y construir un histograma y una gráfica de f. r. a. contra valores de X. Tabla mostrando los datos del problema (Elaboración propia). ___________________________________________________________________ 253.0 173.4 117.0 191.2 151.4 182.0 132.0 162.0 212.9 155.9 221.0 158.0 135.0 124.4 68.9 89.7 95.6 84.1 135.1 123.2 101.0 126.5 142.8 20.2 119.0 ___________________________________________________________________
1-39
Dr. Héctor Quevedo Urías
1.20. La siguiente tabla da las emisiones de óxidos de azufre (SO2 en toneladas métricas) provenientes de 200 plantas siderúrgicas localizadas en cierta región industrial. Tabla mostrando los datos. (Elaboración propia) ___________________________________________________________________ Emisión de SO2 (ton) Número de plantas ___________________________________________________________________ 1.00 - 1.02 6 1.02 - 1.04 26 1.04 - 1.06 52 1.06 - 1.08 58 1.08 - 1.10 39 1.10 - 1.12 15 1.12 - 1.14 5 1.14 - 1.16 1 (a) Calcular el promedio aritmético de la distribución. (b) Calcular la desviación estándar. (c) Calcular la mediana y la moda de la distribución. 1.21. Se dan los siguientes datos en la tabla de abajo. Tabla mostrando los datos de este problema. (Elaboración propia) __________________________________________________________________ Altura (pulgadas) Marca de clase (x) Frecuencia fx 60 - 62 61 5 5 x 61 = 305 63 - 65 64 18 64 x 18 = 1152 66 - 68 67 42 67 x 42 = 2814 69 - 71 70 27 70 x 27 = 1890 72 - 74 73 8 73 x 8 = 584 __________________________________________________________________ (a) Calcular el promedio aritmético. Sugerencia: usar la función del promedio igual a Σf X/Σf
1-40
Dr. Héctor Quevedo Urías
1.22. Se da la siguiente tabla de distribución de datos (intervalos de clase) de emisiones de partículas atmosféricas menores de 10 micras provenientes de varias industrias. (Elaboración propia) ___________________________________________________________________ Mediciones de partículas Número de industrias ___________________________________________________________________ 50.00 - 59.99 8 60.00 - 69.99 10 70.00 - 79.99 16 80.00 - 89.99 14 90.00 - 99.99 10 100.00 - 109.99 5 110.00 - 119.99 2 __________________________________________________________________ (a) Calcular la marca de clase X. (b) Calcular el promedio aritmético. (c) Calcular la frecuencia relativa (f.r.) y la frecuencia relativa acumulada (f.r.a.). (d) Hacer un histograma. (e) Usar papel de probabilidad para ver que tanta uniformidad hay en los datos. 1.23. Completar los faltantes de la tabla de abajo, de una distribución de frecuencia de las vidas de 400 tubos de radios. Además, hacer los cálculos pedidos abajo. (a) Encontrar el límite superior de la quinta clase.
(799)
(b) Encontrar el límite inferior de la octava clase.
(1000)
(c) Encontrar la marca de clase de la séptima clase.
(949.5)
(d) Encontrar los límites de la última clase.
(1099.5-1199.5)
(e) Encontrar el tamaño del intervalo de clase.
(100)
(f) Encontrar la frecuencia de la cuarta clase.
(76)
(g) Encontrar la f.r. de la sexta clase.
(15.5%)
1-41
Dr. Héctor Quevedo Urías
(h) Encontrar el % de los tubos cuyas vidas sean < 600 horas.
(29.5%)
(i) Graficar los datos en papel de probabilidad y leer el promedio aritmético y la desviación estándar de la gráfica. (j) Hacer una grafica de frecuencia relativa acumulada versus puntos medios y calcular los percentiles Q1, Q2 y Q3. Tabla mostrando los datos del problema. (Elaboración propia) ___________________________________________________________________ Vida de los No. de (f) f.r. f.a. f.r.a. Punto tubos tubos medio ___________________________________________________________________ 300 - 399 14 400 - 499 46 500 - 599 58 600 - 699 76 700 - 799 68 800 - 899 62 900 - 999 48 1000 - 1099 22 1100 - 1199 6 __________________________________________________________________ 1.24. Se da la tabla de debajo consistente en una muestra aleatoria de mediciones de óxidos de nitrógeno (NO2), procedentes de una planta de tratamiento de aguas residuales. La tabla con los datos se da abajo.
1-42
Dr. Héctor Quevedo Urías
Tabla con los datos. (Elaboración propia) Mediciones de NO2 Frecuencia (Intervalos) 3.0 – 5.0 14 6.0 – 8.0 46 9.0 – 11.0 58 12.0 – 14.0 76 15.0 – 17.0 68 18.0 – 20.0 21.0 – 23.0 48 24.0 – 26.0 22 27.0 – 29.0 6 Total 400
Marca de clase (X)
f.r
f.r.a.
(a) Llenar los faltantes de la tabla. (b) Calcular el promedio aritmético. (c) Usando papel de grafica de probabilidad, graficar los datos. (d) De la grafica de probabilidad obtenida en el inciso (c) calcular el promedio aritmético y compararlo con el promedio obtenido en (b). (e) De la misma grafica de probabilidad estimar la desviación estándar. 1.25. Se da la tabla de abajo. __________________ X P(X) __________________ 0 0.8574 1 0.1354 2 0.0071 3 0.0001 _________________ Para los problemas de abajo encontrar las siguientes sumatorias usando la tabla de arriba.
1-43
Dr. Héctor Quevedo Urías
1
(a) Σ p(x)
(0.9928)
x=0 2
1
x=0
x=0
(b) Σ p(x) – Σ p(x) 1
(c) Σ p(x)
(0.9928)
x=0 3
(c) Σ p(x)
(1.000)
x=0
1-44
Dr. Héctor Quevedo Urías
1-45
Dr. Héctor Quevedo Urías
CAPITULO 2 Probabilidad Probabilidad clásica.- Probabilidad de frecuencia relativa.- Probabilidad subjetiva.- Axiomas y propiedades básicas de la probabilidad.- Diagramas de Venn y algebra de conjuntos.- Técnicas de conteo: Regla de producto para pares ordenados, la regla de multiplicación más general, regla factorial, diagramas de árbol, permutaciones y combinaciones.- Regla multiplicativa para eventos dependientes e independientes.- Regla aditiva para eventos mutuos excluyentes y eventos no mutuos excluyentes.El desarrollo de la teoría de la probabilidad matemática ocurrió en el siglo 17, y está relacionada con el noble francés Antoine Gombauld y con el matemático Francés Blaise Pascal. El estudio de la probabilidad es una rama de las matemáticas que se inició hace 300 años. Maneras de medir las probabilidades: (1) La probabilidad clásica (2) La probabilidad de frecuencia relativa (3) La probabilidad subjetiva Probabilidad clásica El término probabilidad se refiere al estudio de lo aleatorio y de la incertidumbre. El concepto clásico de la probabilidad de un evento A se define como sigue: si hay a posibles resultados favorables la ocurrencia del evento A y, b resultados desfavorables a la ocurrencia de A, y si todos los resultados son igualmente mutuos excluyentes (que no pueden ocurrir a la vez), entonces la probabilidad de que A ocurra se denota como P(A), es decir: 2-1
Dr. Héctor Quevedo Urías
a Número de resultados favorables al evento A P(A) = ———— = ———————————————————— (a + b) Número total de resultados posibles
(2.0)
Otra manera de definir la probabilidad es: p = Pr{E} = h / n
(2-0a.)
Donde: E = el tipo de evento que estamos haciendo h = número de maneras favorables de que pueda ocurrir el evento o número de puntos en el evento del espacio A n = número total de posibles resultados o de número de puntos en el espacio de la muestra (S) La probabilidad de que no ocurra el evento es q, es decir: q = Pr{que no ocurra E} = 1 - h / n = 1 - Pr{E}
(2-1)
Por lo tanto, p + q = 1 Ejemplo #1. Si una moneda tiene dos caras denotadas por águilas o sellos, calcular la probabilidad de que salga un sello. Solución: Usando la función (2-0) y dejando que A sea el evento sello y B el evento águila, entonces, la probabilidad de sellos es: P(A) = 1 / (1 + 1) = 0.5. Ejemplo #2. En el caso de un dado que tiene 6 números: 1, 2, 3, 4, 5, 6, si el dado es honesto, todos los números tienen la misma probabilidad de salir. Siendo así, calcular 2-2
Dr. Héctor Quevedo Urías
las siguientes probabilidades: (a) La probabilidad de sacar el número 1 (b) La probabilidad de sacar los números pares (c) La probabilidad de sacar los números 3 o 4 (d) La probabilidad de no sacar los números 3 o 4 Solución: (a) P(sacar el número 1) = 1 / (1 + 5) = 1/6. (b) En este caso hay 3 números pares en las seis caras del dado, por lo tanto, la probabilidad de sacar los pares es: P(pares) = 3/(3 + 3) = 1/2 (c) Aquí, el evento puede ocurrir de dos maneras, es decir, como (3 o 4). Por lo tanto, P(3 o 4) = 2/(2 + 4) = 1/3. (d) La probabilidad de no sacar el 3 o 4 es: q = 1 - 1/3 = 2/3 Ejemplo #3. Encontrar la probabilidad de que una pareja con 3 hijos tendrán: (a) Exactamente 2 varones (X = 2) (b) 3 varones y 3 hembras (c) A lo más dos varones (X ≤ 2) (d) Cuando menos 2 varones (X ≥ 2) (e) Más de 2 hembras (X > 2) (f) Menos de 2 varones (X < 2) Solución: Dejemos que el evento varón sea v y, el evento hembra, sea h. Aquí el espacio muestral S se puede hacer de un árbol de probabilidad y da 8 resultados: S = {vvv, vvh, vhv, vhh, hvv, hvh, hhv, hhh} (a) P(2 varones en 3 nacimientos) = P(X = 2) = 3/8 = 0.375 2-3
Dr. Héctor Quevedo Urías
(b) P(X = 3 varones) • P(X = 3 hembras) = (1/8)(1/8) = 1/64 (c) P(X ≤ 2) = 6/8 = 3/4 (d) P(X ≥ 2) = 4/8 = 1/2 (e) P(X > 2) = 1/8 (f) P(X < 2) = 3/8 Probabilidad de frecuencia relativa La probabilidad de frecuencia relativa puede interpretarse como la proporción de veces un evento ocurre a largo plazo, bajo condiciones estables o uniformes. Este tipo de probabilidad se define como: P(E) = n / N
(2-2)
Donde: n/N es la proporción del tiempo que el evento E ocurre en experimentos repetidos. Ejemplo #4. Si 8,000 de 1,000,000 hombres anglos de 35 años murieron durante el año, la frecuencia relativa de muertes o la probabilidad de muerte para individuos de este grupo es: P(de muerte) = 8,000 / 1,000,000 = 0.00080 Ejemplo #5. Supóngase que se estudian 10,000 personas de 20 años y se encuentra que 9961 vivieron 21 años. Encontrar la probabilidad de que una persona de 20 años vaya a vivir 21 años. Solución: Aquí, los dos resultados de vivir y morir no son igualmente probables, de manera que la aproximación de frecuencia relativa debe usarse. Entonces la aproximación empírica de frecuencia relativa es: P(de la persona de 20 años que viva 21 años) = 9,961/10,000 = .996 Probabilidad subjetiva 2-4
Dr. Héctor Quevedo Urías
La probabilidad subjetiva es un desarrollo relativamente reciente. Esta probabilidad se define como el grado de credibilidad o confianza de un evento que varía con el juicio o estado de ánimo de la persona. Esta probabilidad es útil en decisiones financieras y otros tipos de trabajos. Relación entre la probabilidad (usando distribuciones discretas) y la estadística de inferencia (usando distribuciones continuas) usando lógica deductiva e inductiva La relación entre la probabilidad usando distribuciones discretas como la binomial, hipergeométrica o la Poisson y la estadística de inferencia (usando distribuciones continuas como la normal, la t de Estudiante, la distribución F, gamma, exponencial, etc.) radica en el hecho de qué, en el primer caso, el razonamiento va del conjunto o de la población hacia la parte (razonamiento deductivo o lógica deductiva). En contraste, con la estadística de inferencia, el razonamiento va desde la muestra o la parte hacia la población o total (razonamiento inductivo o lógica inductiva). Anotación para encontrar probabilidades Las anotaciones usadas en encontrar probabilidades se definen como: P denota una probabilidad; A, B, C denotan eventos específicos y, P(A), denota la probabilidad de que ocurra el evento A. 1. P denota una probabilidad 2. A, B, C denotan eventos específicos 3. P(A) denota la probabilidad de que ocurra el evento A 4. P (B) denota la probabilidad de que ocurra el evento B, etc.
Axiomas y propiedades básicas de la probabilidad 2-5
Dr. Héctor Quevedo Urías
1. Para cualquier evento A, P(A) ≥ 0. Además, la probabilidad no puede ser mayor que 1, ni tampoco negativa. 2. La probabilidad de un espacio muestral es: P(S) = 1 3. Si A1, A2,...., Ak es una colección finita de eventos mutuos excluyentes (que no puede ocurrir a la misma vez), entonces: k
P(A1 ∪ A2 ∪....∪ Ak) = Σ P(Ai) i=1
(2-3)
Si A1, A2, A3,... es una colección infinita de eventos mutuos excluyentes, entonces: k
P(A1 ∪ A2 ∪ A3 ∪...) = Σ P(Ai) i=1
(2-4)
Ejemplo #6. Este es un ejemplo adaptado del libro de Richard A. Jonson, intitulado Probabilidad y Estadística para Ingenieros de Miller y Freund (1994). Las probabilidades de que un consumidor que prueba el servicio de un nuevo dispositivo anticontaminante para autos, lo clasifique como muy deficiente, deficiente, suficiente, bueno, muy bueno o excelente son: 0.07, 0.12, 0.17, 0.21, y 0.011. ¿Cuáles son las probabilidades de que las clasificaciones del dispositivo sean?: (a) ¿Muy deficientes? (b) ¿Deficientes? (c) Suficientes o buenas? (d) ¿Buenos, muy buenos o excelentes? Solución: Puesto que las posibilidades son mutuamente excluyentes (que no pueden ocurrir a la vez), la sustitución directa de cada una de las cinco clasificaciones, en la función (2-3) da como resultado: (a)-(c) es: 0.07 + 0.12 + 0.17 + 0.32 = 0.68 2-6
Dr. Héctor Quevedo Urías
(d) 0.32 + 0.21 + 0.11 = 0.64 Terminología usada en probabilidad Cuando se habla de probabilidad se incluyen términos como: experimento, resultados, eventos, espacio muestral, teoría de conjuntos (uniones, intersecciones, complemento como A'), eventos mutuos excluyentes, variables aleatorias discretas (estocásticas de conjetura o probabilidad), probabilidad de frecuencia relativa, probabilidad subjetiva, técnicas de conteo (combinaciones y permutaciones, regla de multiplicación y adición, etc.), teorema de Bayes, independencia, eventos mutuos excluyentes, diagramas de Venn, árboles de probabilidad, etc. Algunas definiciones de estos términos se dan abajo. Experimento.- Un experimento es un proceso que nos ayuda a obtener observaciones de dos o más resultados distintos, donde el resultado que ocurre no puede ser predecible con certeza, sino en términos de probabilidad. Evento.- Es una colección de uno o más resultados elementales de un experimento. Un evento es un subconjunto de un espacio muestral. Por subconjunto se entiende cualquier parte de un conjunto, incluyendo el conjunto en su totalidad. Aquí, también puede haber conjuntos vacíos denotados por ф, los cuales no poseen ningún elemento. Eventos mutuos excluyentes. Dos eventos A y B son mutuos excluyentes o desunidos, si su intersección A ∩ B = ф, esto es, si A y B no tienen elementos en común. Por ejemplo, los eventos A y B se dice que son mutuos excluyentes o desunidos, si A y B no pueden ocurrir simultáneamente o en un solo ensayo de un experimento. Por ende, si A y B son eventos mutuos excluyentes, por lo tanto, P(A ∩ B) = 0. En este renglón se puede usar la regla aditiva, el teorema de Bayes o eventos independientes. Ejemplo #7. Dos eventos A y B son mutuos excluyentes o desunidos, si A ∩ B = ф, esto es, si A y B no tienen elementos en común. Siendo así, decir si en un solo 2-7
Dr. Héctor Quevedo Urías
lanzamiento de una moneda los dos eventos A y B son mutuos excluyentes. Solución: Debido a que si cae la cara, el águila no puede caer a la misma vez y viceversa, por lo tanto, los eventos A y B son mutuos excluyentes. Ejemplo #8. Si E1 es el evento de sacar un as de un mazo de 52 naipes y E2 es el evento de sacar un rey, ¿son estos eventos mutuos excluyentes? Solución: Aquí, en este caso, si son eventos mutuos excluyentes porque no se puede sacar el as o el rey a la misma vez. Espacio muestral.- El espacio muestral (S) es el conjunto de todos los resultados posibles de un experimento estadístico. Los espacios muestrales se clasifican de acuerdo al número de elementos (puntos) que contienen. En este respecto, se pueden enlistar los elementos separados por comas y enclaustrados en corchetes ({}). Los espacios muestrales pueden ser finitos, no finitos, discretos y continuos. Sin embargo, los dos tipos básicos de espacios muestrales son los discretos y continuos. Por ejemplo, un espacio muestral discreto tiene un número finito de eventos simples o un número infinito contable de eventos simples. En el caso de espacios muestrales continuos, esto se refiere cuando los elementos (puntos) de un espacio muestral constituyen un continuo, como por ejemplo, todos los puntos de una línea; todos los puntos de un segmento de línea o todos los puntos de un plano. En algunos experimentos puede ser útil enlistar los elementos del espacio muestral, sistemáticamente, por medio de diagramas de árbol. Ejemplo #9. Un ejemplo de un espacio muestral discreto finito es el lanzamiento de una moneda dos veces, el cual tiene un espacio muestral de 4 eventos simples, donde H denotan caras y T denotan águilas. Esto es: 2-8
Dr. Héctor Quevedo Urías
S = {HH, HT, TH, TT} Ejemplo #10. Un ejemplo de un espacio no finito está relacionado con el siguiente experimento. Si unos mecánicos encargados de verificar la emisión de óxidos de nitrógeno de los autos, les interesa saber el número de autos que deben inspeccionar antes de ver, cuál es el número de ellos que no satisfacen los reglamentos gubernamentales. Aquí, bien podría ocurrir que fuese el primer auto, el segundo, el tercero, etc., y que tuvieran que verificar miles de autos antes de encontrar uno que no cumpla con los reglamentos. Dado a que no se sabe que tan lejos tendrían que llegar, por lo tanto, se considera una cantidad de autos contable infinita. Ejemplo #11. En el caso de espacios muestrales con un número infinito de puntos muestrales, estos se describen mejor usando métodos de regla. Por ejemplo, si todos los resultados posibles de un experimento, es el grupo de ciudades en el mundo, con una población de más de un millón, entonces, el espacio muestral S es: S = {x|x es una ciudad con una población de más de un millón} Ejemplo #12. Para explicar un espacio muestral continuo, considérese el experimento de observar el tiempo para completar una tarea en particular, digamos, en un intervalo de 0 a 40 segundos. En este caso, el espacio muestral es continuo debido a que hay un número de valores infinitamente contable, en el intervalo de 0 a 40 segundos. S = {todas las veces posibles entre 0 y 40 segundos} Unión.- La unión de dos eventos, digamos A y B, se denotan por el símbolo A ∪ B y se lee A o B, y es el evento que contiene todos los elementos que pertenecen a A o B o ambos. Por lo tanto, el evento A ∪ B ocurre, si A ocurre, si B ocurre o si ambos A y B ocurren. Ejemplo #13. Si dejamos que el evento A = {a, b, c} y B = {b, c, d, e}, siendo así, por lo tanto, A ∪ B = {a, b, c, d, e} 2-9
Dr. Héctor Quevedo Urías
Ejemplo #14. Si M = {x|3 < x < 9} y N = {y|5 < y < 12}, entonces, encontrar la unión de M ∪ N. (Walpole 1993, p. 14) Solución: M ∪ N = {z}3 < z < 12} Intersección de los eventos. La intersección de dos eventos A y B, se denota por el símbolo A ∩ B, que se lee "A y B". La intersección A ∩ B es el grupo de puntos en el evento del espacio A y en el evento del espacio B. Por lo tanto, el evento A ∩ B ocurre, solamente, si ambos eventos A y B ocurren. Aquí, la palabra clave “y” se refiere al evento conteniendo todos los elementos que son comunes o que están en ambos, A y B. Ejemplo #15. Si S = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, A = {0, 2, 4, 6, 8}, B = {1, 3, 5, 7, 9}, C = {2, 3, 4, 5} y D = {1, 6, 7}, encontrar: (a) A ∩ B. (b) A ∩ C Solución: (a) Debido a que en A ∩ B no hay ningún elemento en común, por lo tanto, A ∩ B = ф y no pueden ocurrir a la misma vez. (b) Debido a que, solamente el 2 y el 4 son comunes en ambos eventos A y C, por lo tanto, A ∩ C = {2, 4} Ejemplo #16. Si dejamos que M = {a, e, i, o, u} y N = {r, s, t}, por lo tanto, M ∩ N = Φ, lo cual dice que M y N no tienen elementos en común y que no pueden ocurrir a la misma vez. Complemento.- El complemento de un evento A, denotado por A', es el conjunto de todos los resultados en el espacio muestral S, que no están contenidos en A. Ejemplo #17. Si A = {0, 1, 2, 3, 4}, B = {3, 4, 5, 6} y C = {1, 3, 5}, entonces, 2-10
Dr. Héctor Quevedo Urías
encontrar: (a) A ∪ B (b) A ∪ C (c) A ∩ B (d) A ∩ C (e) A' (f) {A ∪ C}' Solución: (a) A ∪ B = {0, 1, 2, 3, 4, 5, 6} = S (b) A ∪ C = {0, 1, 2, 3, 4, 5} (c) A ∩ B = {3,4} (d) A ∩ C = {1,3} (e) A' = {5,6} (f) (A ∪ C)' = {6}
2-11
Dr. Héctor Quevedo Urías
Figura 2.0. Diagrama mostrando los espacios muestrales y los eventos. (Johnson, 1997). Ejemplo #18. Refiriéndose al problema anterior representar con símbolos de Venn las siguientes regiones: (a) 4, 6, 7 (b) 1,4 (c) 1, 2, 5, 7 (d) 1, 2 (e) 1, 3, 4 Solución: (a) (A U C) (b) (A ∩ C) (c) (A U B) (d) (A ∩ B) (e) (A U B) ∩ C) Ejemplo #19. Si S = {libro, catalizador, cigarrillo, químico, ingeniero, remache} y, si dejamos que A = {catalizador, remache, libro, cigarrillo}, entonces A' = {químico, 2-12
Dr. Héctor Quevedo Urías
ingeniero} Ejemplo #20. El espacio muestral de un experimento aleatorio se da como S = {AA, AN, NA, NN}. Si E1 = {AA, AN, NA} y E2 = {AN, NA, NN}, entonces, encontrar: (a) E1 ∪ E2 (b) E1 ∩ E2 (c) E1' (d) E2' Solución: (a) E1 ∪ E2 = {AA, AN, NA, NN} (b) E1 ∩ E2 = {AN, NA} (c) E1' = {NN} (d) E2' = {AA} Eventos mutuos excluyentes.- Dos o más eventos se dice que son mutuos excluyentes o desunidos, cuando no hay elementos comunes entre si. Para esto se usa la simbología de intersecciones, es decir, A ∩ B = Φ, esto dice que A y B no tienen elementos en común. Esto nos dice qué, cuando uno de los resultados ocurre, los otros no pueden ocurrir al mismo tiempo. Por ejemplo, cuando se lanza un dado, la sacada de un 1 y un 2 son eventos mutuos excluyentes, debido a que, si el sale el 1, no puede salir el 2, a la misma vez. Igualmente, con los naipes si sale un rey no puede salir un as o cualquier otra carta del mazo de cartas. Si E1 y E2 son eventos mutuos excluyentes, entonces: Pr{E1E2} = 0. Si E1 + E2 denotan los eventos de que, ya sea que E1 o E2 o ambos ocurran, entonces: Pr{E1 + E2} = Pr{E1} + Pr{E2} - Pr{E1E2} En general para eventos mutuos excluyentes: 2-13
Dr. Héctor Quevedo Urías
Pr{E1 + E2} = Pr{E1} + Pr{E2}
(2-5)
Ejemplo #21. De los siguientes eventos, determinar, cuáles eventos son mutuos excluyentes y cuáles no lo son. (a) Manufacturando un componente electrónico defectuoso. Manufacturando un componente electrónico bueno. (b) Probando un sujeto con un coeficiente de intelecto > 100. Probando un sujeto con un coeficiente de intelecto < 95 (c) Seleccionando un médico, quien es cirujano Seleccionando un médico quien es mujer (d) Seleccionando un tipo con personalidad dominante Seleccionando un tipo de personalidad sumisa. Solución: En este caso, los incisos (a), (b), (d) son eventos mutuos excluyentes. Sin embargo, el inciso (c) es evento no mutuo excluyente. Ejemplo #22. Supóngase que hay 3 distribuidores de autos: el distribuidor de GM vende Chevrolet, Pontiac y Buick; el distribuidor de la Ford vende Mercury y Ford y, el distribuidor de la Chrysler vende Plymouth y Chrysler. Si un experimento consiste en observar la marca del siguiente auto vendido, entonces, los eventos A = {Chevrolet, Pontiac, Buick} y B = {Ford, Mercuy} son mutuos excluyentes porque el siguiente auto vendido no puede ser producto de GM o de Ford. Ejemplo #23. Dos eventos A y B son mutuos excluyentes o desunidos, si A ∩ B = Φ, esto es, si A y B no tienen elementos en común. Siendo así, decir si en un solo lanzamiento de una moneda los eventos A y B son mutuos excluyentes. Solución: Debido a que, si cae la cara de la moneda, la cara opuesta no puede caer a la misma 2-14
Dr. Héctor Quevedo Urías
vez y viceversa. Por lo tanto, los dos eventos A y B son mutuos excluyentes. Probabilidad condicional.- Se define como la probabilidad de que un evento A ocurra, cuando se sabe que el evento B ha ocurrido y se denota como P (A|B). También la probabilidad de que un evento B ocurra, cuando se sabe que el evento A ha ocurrido, se denota por P (B|A). Las funciones usadas para tales fines son: P (A ∩ B) P (B|A) = ——————; P(A)
P(A ∩ B) P (A|B) = ————— P(B)
(2-6)
Ejemplo #24. Si P(D) = 0.83, P(A) = 0.82 y P(D ∩ A) = 0.78, encontrar los siguientes enunciados: (a) P(A|D) (b) P(D|A) Solución: (a) P(A|D) = P(D ∩ A)/P(D) = 0.78/0.83 = 0.94 (b) P(D|A) = P(D ∩ A)/P(A) = 0.78/0.82 = 0.95 Ejemplo #25. Los resultados obtenidos de 266 muestras de aire se clasifican de acuerdo a la presencia de dos moléculas raras. Sean A: el evento formado por todas las muestras de aire en la que se encuentra la molécula rara 1, y B: el evento formado por todas las muestras de aire donde está presente la molécula rara 2. Si se calculó que la probabilidad P(A ∩ B) = 12/66 y P(A) = 36/266, entonces, calcular la probabilidad del evento formado por todas las muestras de aire con la molécula 2, dado el evento 2-15
Dr. Héctor Quevedo Urías
formado por todas las muestras de aire con la molécula 1. (Montgomery et al. 1996) Solución: P(B|A) = P(A ∩ B) / P(A) = (12/266) / (36/266) = 12/36 Ejemplo #26. Refiriéndose al problema anterior, encontrar P(A|B), si P(B) es igual a 30/266. Solución: P(A|B) = P(A ∩ B) / P(B) = 12/266/(30/266) = 12/30 Eventos independientes y dependientes.- En este caso, sin embargo, cuando hablamos de probabilidad condicional se incluyen lo que se llaman eventos independientes y eventos dependientes. Por ejemplo, si la ocurrencia de un evento, no cambia la probabilidad de la ocurrencia del otro evento, entonces, se dice que los dos eventos son independientes. Sin embargo, si cualquiera de estas condiciones no se satisfacen, los dos eventos se dicen que son dependientes, es decir, P(A|B) ≠ P(A). En el caso especial de que A y B sean independientes, es decir, de manera que, P(A|B) = P(A), esto conduce a la regla especial de multiplicación: P(A ∩ B) = P(A) · P(B)
(2-7)
Ejemplo #27. Encontrar la probabilidad de sacar dos caras en dos lanzamientos de una moneda honesta. Solución: Puesto que la probabilidad de las caras es de 0.5 por cada lanzamiento y los dos lanzamientos son independientes, la probabilidad es (1/2)(1/2) = ¼ Ejemplo #28. Se sacan dos cartas, aleatoriamente, de un mazo de 52 naipes. ¿Qué probabilidad hay de obtener dos ases si? 2-16
Dr. Héctor Quevedo Urías
(a) La primera carta se reemplaza antes de que se saque la segunda. (b) La primera carta no se reemplaza antes de que se saque la segunda carta. Solución: (a) Dado que entre los 52 naipes hay cuatro ases, la probabilidad de sacar dos ases es de: (1/13)(1/13) = 1/169. (b) Dado que entre los 51 naipes restantes, al sacar un as del fajo de cartas, quedan solo 3 ases, entonces, la probabilidad es: (4/52)(3/51) = 1/221. Aquí se ve que este es un evento dependiente, porque 1/221 ≠ 1/169, ya que los eventos son dependientes, cuando hay muestreo sin reemplazo. Ejemplo #29. Para dos eventos J y K se sabe que P(J) = 0.60, P(K) = 0.4 y P(J ∩ K) = 0.10. Decir si estos dos eventos son independientes. Solución: Debido a que P(J ∩ K) = 0.10, P(J/K) = P(J ∩ K)/P(K) = 0.10/0.40 = 0.25, entonces, siendo que P(J/K) = 0.25 ≠ P(J) = 0.6 y los dos eventos son dependientes. Ejemplo #30. Encontrar P(A|B), si P(B) = 20/26 y P(A ∩ B) = 30/26 Solución: Usando la función P(A|B) = P(A ∩ B)/P(B) y sustituyendo da: P(A|B) = (30/26)/(20/26) = 600/676 = 0.888 Variable aleatoria (va).- Fundamentalmente, hay dos tipos de variables aleatorias: variables aleatorias discretas y variables aleatorias continuas. La variable aleatoria es una función que asigna un número real a cada resultado en un espacio muestral S. Es un valor de una función numéricamente definido sobre S, es decir, una regla que asocia un número a cada resultado en el espacio muestral S. Algunos estadísticos 2-17
Dr. Héctor Quevedo Urías
relacionan el término "variable aleatoria" con el término "estocástico", que se relaciona con conjetura o probabilidad. Hay variables aleatorias binomiales, de Poisson, hipergeométricas, variables de la distribución normal, de la distribución de t de estudiante, de JI cuadrada, de Fisher, etc. Estocástico.- Es un término que involucra una variable aleatoria o que relaciona casualidad o probabilidad. Variable aleatoria discreta (vad).- La vad es un conjunto o rango de valores finitos o infinitamente contables en números. La vad se asocia con distribuciones de Bernoulli, de Poisson, geométrica, hipergeométrica, negativa binomial, etc. Un ejemplo de vad finita es el número de autos manejados con una flota de 6 vehículos, es decir, donde x = 0, 1, 2, 3, 4, 5. Sin embargo, un ejemplo de vad infinitamente contable es el número de personas que entran a una tienda de compras cada mes. Variable aleatoria continua (vac).- La vac se define como el rango de una variable aleatoria X que contiene un intervalo infinito o finito de números reales. Por ejemplo, si X es el valor del peso de una persona, el rango de X es X ≥ 0. Las distribuciones continuas asociadas con vac son la distribución normal, la familia de las distribuciones gamma, beta, la distribución exponencial, la JI cuadrada, la t de estudiante, etc. Diagramas de Venn y álgebra de conjuntos Diagrama de Venn.- Es un dispositivo gráfico para representar el espacio muestral y las operaciones que implican eventos. El inglés J. Venn desarrolló este tipo de diagrama para representar, gráficamente, los resultados de un experimento. El concepto de las reglas de eventos mutuos excluyentes y varias otras reglas de probabilidad se pueden representar con diagramas de Venn. Para construir un diagrama de Venn un espacio se enclaustra representando el total de todos los resultados posibles. 2-18
Dr. Héctor Quevedo Urías
Las reglas de las tres operaciones básicas del álgebra de conjuntos para formar uniones, intersecciones y complementos de eventos se describen en la TABLA 2.1. TABLA 2.1. Tabla mostrando las leyes del álgebra de conjuntos. (Elaboración propia) ___________________________________________________________________ Ley asociativa: (A ∪ B) ∪ C = A ∪ (B ∪ C) (A ∩ B) ∩ C = A ∩ (B ∩ (B ∩ C) Ley conmutativa: A∪B=B∪A A∩B=B∩A Ley distributiva: A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) Leyes de Morgan: (A ∪ B)' = A' ∩ B' (A ∩ B)' = A' ∪ B' Leyes complementarias: A ∪ A' = S A ∩ A' = Φ (A')' = A S' = Φ, Φ' = S Leyes idénticas: A∪Φ=A A∩S=A A∪S=S A∩Φ=Φ Leyes con la misma potencia: A∪A=A A∩A=A __________________________________________________________________
2-19
Dr. Héctor Quevedo Urías
Figura 2.2. Los esquemas de abajo muestran algunos diagramas de Venn. (Elaboración propia)
Técnicas de conteo Numerosas reglas de conteo han sido usadas para contar el número de puntos en muestreos. Cuando los diversos resultados de un experimento son igualmente probables, la tarea de calcular probabilidades se reduce a contar. Estas técnicas de conteo son útiles para contar el número de eventos que componen el numerador y/o el denominador de una probabilidad. Ejemplos de técnicas de conteo son: 1. La regla del producto para pares ordenados 2. La regla del producto más general 2-20
Dr. Héctor Quevedo Urías
3. Factoriales 4. Uso de diagramas de árbol 5. Permutaciones 6. Combinaciones La regla del producto para pares ordenados La forma más básica de conteo es la regla del producto mn. Por ejemplo, si el primer elemento u objeto de un par ordenado se puede seleccionar en n1 formas, y por cada una de estas n1 formas se puede seleccionar un segundo elemento del par en n2 formas, entonces, siendo así, esto es una regla del producto. Ejemplo #31. ¿Cuántos puntos muestrales hay en un espacio muestral S, cuando un par de dados se lanzan una vez? Solución: El primer dado puede caer en n1 = 6 maneras. Para cada una de estas 6 maneras, el segundo dado puede también caer en n2 maneras. Por lo tanto, el par de dados pueden caer en n1n2 = (6) (6) = 36. El espacio muestral es: S = {1-1, 1-2, 1-3, 1-4, 1-5, 1-6, 2-1, 2-2, 2-3, 2-4, 2-5, 2-6, 3-1, 3-2, 3-3, 3-4, 3-5, 36, 4-1, 4-2, 4-3, 4-4, 4-5, 4-6, 5-1, 5-2, 5-3, 5-4, 5-5, 5-6, 6-1, 6-2, 6-3, 6-4, 6-5, 6-6} Ejemplo #32. En un estudio médico los pacientes se clasifican en ocho maneras de acuerdo a que tengan tipo de sangre, es decir, AB+, AB-, A+, A-, B+. B- o O+, O- y también de acuerdo a, aquéllos que tengan presión alta, baja o normal. Encontrar el número de maneras en las cuales un paciente se pueda clasificar. Solución: n1 = 8 tipos de sangre y n2 = 3 presiones arteriales. Por lo tanto, n1 n2 = (8) (3) = 24 maneras. 2-21
Dr. Héctor Quevedo Urías
Regla de multiplicación más general La regla del producto para k-arreglos se define como sigue: Si una operación puede ser hecha en n1 maneras y, si para cada una de estas maneras, una segunda operación puede ser hecha en n2 maneras, y, si por cada una de estas dos primeras operaciones, una tercera operación puede ser hecha en n3 maneras y, así sucesivamente, entonces, la secuencia de k operaciones o arreglos puede ser hecha en n1, n2, n3,..., nk arreglos, es decir: n1n2n3,…,nk
(2-8)
Ejemplo #33. Supóngase que un cliente desea instalar un teléfono Trimline y se puede seleccionar de n1 = 10 colores decorativos que se supone están disponibles en n2 = 3 longitudes de cables con n3 = 2 tipos de tonos rotativos. Entonces, ¿cuántos arreglos se pueden hacer? Solución: n1n2n3 = (10)(3)(2) = 60 arreglos Ejemplo #34. Si cada clínica en un centro médico, tiene 4 especialistas del corazón, 3 especialistas en medicina interna y dos cirujanos generales, ¿cuántas maneras existen de seleccionar un médico de cada tipo? (Nota: en este renglón, del punto de vista del autor de este libro, no puede haber especialistas médicas de cada una de las partes, órganos o sistemas del cuerpo, como comúnmente se cree. Si así fuera, esto equivaldría a decir que cada órgano o sistema del cuerpo funciona independientemente del resto del organismo; lo cuál no es correcto. Esto se debe a qué, el cuerpo está compuesto por órganos o sistemas contingentes o dependientes, cuyo funcionamiento depende, en turno, de la dirección que se le dé a todo el organismo como unidad independiente. El hecho de que un órgano o sistema del cuerpo esté aparentemente 2-22
Dr. Héctor Quevedo Urías
enfermo, esto no quiere decir qué, solamente, ese órgano en particular está enfermo, sino que toda la química del cuerpo está alterada, como resultado de vida antinatural. Este razonamiento está relacionado con la tesis de Hipócrates conspiratio una). Solución: n1n2n3 = (4)(3)(2) = 24 Regla factorial Dado un íntegro positivo n, el producto de todos los números enteros desde n hasta 1 se llama factorial n y se escribe n!. En general, n! = n(n – 1)(n – 2)(n – 3)….1. Por definición 0! = 1. Aquí nótese que 10! = 10·9!; 5! = 4·4!, y n! = n(n – 1)! Más adelante, cuando se discuta el tema de permutaciones se verá que, la diferencia entre la regla factorial y la regla de permutaciones, es la siguiente: la regla factorial dice cuántos arreglos son posibles, cuando se usan todos los diferentes objetos de n. Sin embargo, cuando se habla de permutaciones, se seleccionan solamente algunos de los objetos n, no todos, como en el caso de la regla factorial. Ejemplo #35. Calcular los siguientes factoriales: (a) 10! (b) 5! (c) 9!/0! Solución: (a) 10! = 3,628,800 (b) 5! = 120 (c) 9!/0! = 362,880/1 = 362,880 Ejemplo #36. Un candidato presidencial planea visitar cada uno de 28 estados de un país. ¿Cuántas rutas diferentes son posibles? Solución: 2-23
Dr. Héctor Quevedo Urías
Las capitales de los diferentes 28 estados se pueden arreglar en 28! maneras, de tal forma el número de diferentes rutas es 28! = 3.049x1029. Ejemplo #37. En la facultad de ingeniería, en cierta oficina, los escritorios de 4 becarias se ponen en línea contra una pared. Cada becaria se puede sentar en cualquier escritorio. ¿Cuántos arreglos para sentar a las becarias son posibles? Solución: Usando n! = 4! = (4)(3)(2)(1) = 24 Diagramas de árbol En las reglas de producto o regla de multiplicación se puede usar una configuración llamada diagrama de árbol, para representar esquemáticamente, todas las posibilidades y calcular cualquier probabilidad en los resultados obtenidos del diagrama de árbol. De esta manera, los espacios muestrales pueden describirse gráficamente en términos de un diagrama de árbol. Ejemplo #38. Supóngase que una computadora pueda seleccionar, aleatoriamente, uno de dos factores, Rh (positivo y negativo) y uno de tres tipos de sangre. Calcular la probabilidad de sacar un factor Rh positivo con tipo de sangre A. Solución: Usando la regla de multiplicación n1 n2 = (2) (3) = 6 se hace este cálculo. Sin embargo, aquí es difícil visualizar las combinaciones calculadas en la probabilidad. No obstante, el uso de un diagrama de árbol simplifica esta tarea. Ejemplo #39. Con relación al problema anterior hacer un diagrama de árbol para relacionar el factor Rh y el tipo de sangre. Solución:
2-24
Dr. Héctor Quevedo Urías
Factor Rh
Tipo de sangre
Resultado
+
A O B
+A +O +B
-
A O B
-A -O -B
Figura 2.3. Diagrama mostrando el factor Rh, el tipo de sangre y el resultado. (Elaboración propia) Del diagrama de árbol de arriba podemos ver que el espacio muestral es: S = {+A, +O, +B, -A, -O, -B) Examinando esta situación vemos qué, una sola rama corresponde a: +A. Por lo tanto, la probabilidad de sacar este arreglo es de 1/6. Ejemplo #40. Supóngase que se quiera encontrar la probabilidad de un infante, que sea una hembra con ojos azules. Asumir que la probabilidad de varones y hembras es igual y que puedan salir con colores de ojos cafés, verdes, azules o castaños. Solución: Usando la regla de productos da: n1 n2 = (2) (4) = 8. La probabilidad de una hembra con ojos azules es 1/8. Pero, haciendo un diagrama de árbol simplificamos el cálculo de la probabilidad de sacar una hembra con ojos azules.
2-25
Dr. Héctor Quevedo Urías
ojos cafés
ojos cafés
ojos azules
ojos azules
varón
hembra ojos verdes
ojos verdes
ojos castaños
ojos castaños
Figura 2.4. Diagramas de árbol para varones y hembras. El espacio muestral S da 8 posibilidades. De manera que, la probabilidad de una hembra de ojos azules es de 1/8. (Elaboración propia) Ejemplo #41. Considérese el lanzamiento de una moneda tres veces (o el lanzamiento de tres monedas a la vez). Hacer los siguientes enunciados: (a) Usar un diagrama de árbol para representar el número de resultados experimentales y el espacio muestral. (b) Calcular la probabilidad de que caigan exactamente 3 soles (caras) (c) Calcular la probabilidad de que caigan cuando menos 2 soles. (d) Calcular la probabilidad de que caigan a lo más 2 águilas. (e) Calcular la probabilidad de cada uno de los resultados del espacio muestral. Solución: (a) La figura de abajo muestra el diagrama de árbol del experimento de lanzar las tres monedas simultáneamente.
2-26
Dr. Héctor Quevedo Urías
Etapa 1 Etapa 2 Etapa 3 Primera moneda Segunda moneda Tercera moneda
Figura 2.5. Diagrama de árbol del experimento de lanzar las tres monedas simultáneamente, donde S = soles y A = águilas. (Elaboración propia) Con este diagrama de árbol vemos que hay 8 resultados al lanzar una moneda tres veces consecutivas o tres monedas simultáneamente. El espacio muestral es: S = {(SSS), (SSA), (SAS), (SAA), (ASS), (ASA), (AAS), (AAA)} (b) La probabilidad de caigan exactamente 3 soles es: P(soles = 3) = 1/8 (c) La probabilidad de que caigan cuando menos 2 soles es: P(soles ≥ 2) = 4/8 = 1/2 (d) La probabilidad de caigan a lo más dos águilas es: P(águilas ≤ 2) = resolverse por el lector (e) La probabilidad de todo el conjunto muestral es: P(S) = 1 o sea: = P(SSS)+P(SSA)+P(SAS)+P(SAA)+P(ASS)+P(ASA)+P(ASS)+P(AAA) = 1/8 + 1/8 + 1/8 + 1/8 + 1/8 + 1/8 + 1/8 + 1/8 = 1 2-27
Dr. Héctor Quevedo Urías
Ejemplo #42. Una pareja de recién casados desea tener 4 hijos. (a) Enlistar el espacio muestral. (b) ¿Cual es la probabilidad de tener 3 varones? ¿4 varones? (c) ¿Cuál es la probabilidad de tener puras hembras? ¿Más de 2 hembras? Solución: (a) S = {vvvv, vvvh, vvhv, vvhh, vhvv, vhvh, vhhv, vhhh, hvvv, hvvh, hvhv, hvhh, hhvv, hhvh, hhhv, hhhh} (b) P(3 varones) = 2/8 = ¼; P(4 varones) = 1/16 (c) P(puras hembras) = 1/16; P(más de 2 hembras) = 5/16 Permutaciones Una permutación es un arreglo ordenado de objetos o casos. De esta manera, hasta ahora se ha discutido, únicamente, las reglas del producto para pares ordenados y la regla de multiplicación más generalizada. Como se dijo, estas reglas dicen que, los elementos sucesivos de un k-arreglo se seleccionaron de conjuntos diferentes y con opciones con reemplazo para el mismo elemento que pueda aparecer más de una vez. Sin embargo, en el caso de las permutaciones, vamos a considerar un fondo fijo formado por n distintos elementos y suponiendo que se forma un k-arreglo, al seleccionar sucesivamente de este conjunto, sin reemplazo, para que un elemento pueda aparecer a los sumo en una de las k posiciones. Definición: Una permutación es un arreglo de todos o parte de un conjunto de objetos, donde el orden es de importancia (en contraste con la combinación en la cual veremos que el orden no es de importancia). Teorema 1: El número de permutaciones de objetos tomados todos a un tiempo es n! Este teorema nos da el número total de todos los objetos tomados todos a un tiempo (el cual es el espacio muestral). 2-28
Dr. Héctor Quevedo Urías
Ejemplo #43. Usando una calculadora de bolsillo, evaluar las siguientes permutaciones: (a) 8P3, (b) 6P4, (c) 15P1, (d) 3P3 Solución: (a) 8P3 = n! / (n - r)! = 8!/(8 – 3)! = 336 (b) 6P4 = (6)(5)(4)(3) = 360 (c) 15P1 = 15 (d) 3P3 = (3)(2)(1) = 6 Ejemplo #44. El número de permutaciones de las cuatro letras, a, b, c, d (tomadas todas a un tiempo) es: n! = 4! = 24 Esta permutación es, realmente, una regla factorial, porque se tomaron todas las letras a un tiempo. Teorema 2: El número de permutaciones de n objetos distintos tomados a un tiempo r (una parte nomás) se da como: nPr
= n! / (n - r)!
(2-9)
Ejemplo #45. Dos boletos de la lotería se sacan de 20 para el primero y segundo lugar. Encontrar el número de puntos muestrales en el espacio. Encontrar también todo el espacio muestral S. Solución: Aquí los objetos son tomados de 2 en 2 es decir, n = 20 y r = 2 y usamos la fórmula: nPr
= n! / (n - r)! = 20P2 = 20!/(20 - 2)! = 380
Ahora, si queremos todo el espacio muestral quiere decir que los vamos a tomar todos a un tiempo r. Esto dice que la fórmula: nP r
= n! / (n - r)! se reduce a n! o sea 20! = 2.43x1018. 2-29
Dr. Héctor Quevedo Urías
Ejemplo #46. ¿De cuántas maneras puede la Sociedad Química Mexicana seleccionar a 3 conferencistas para 3 conferencias diferentes, si hay únicamente 5 fechas disponibles? Solución: Aquí n = 5 y r = 3 usando nPr = n! / (n - r)! y sustituyendo los valores da: nPr
= n! / (n - r)! = 5P3 = 5! / 2! = 60. En resumen, aquí vemos qué, si queremos todas
las permutaciones posibles o todo el espacio muestral, entonces, usamos n! Pero, si queremos, únicamente, una parte, usamos nPr = n!/(n - r)! Ejemplo #47. ¿Cuál es el número de permutaciones de las letras a, b, c tomadas todas a un tiempo? Solución: Seis, v.g., ab, ba, ac, ca, bc, cb Ejemplo #48. Considérese una carrera de 10 caballos y un premio de exacta para cualquiera que pueda escoger el orden exacto del primero hasta el décimo lugar. Asumiendo que todos los caballos tienen la misma oportunidad de ganar, ¿Cuántos arreglos hay? Solución: 10P10
= 3,628,800 permutaciones
Ejemplo #49. Bajo las condiciones del problema #7, ¿Cuál es la probabilidad de ganar si se compra un solo boleto? Solución: P(Con un solo boleto) = 1 / 10P10 = 1/3,628,800 = 2.76x10-7 Ejemplo #50. Supóngase que hay 6 partes diferentes para ser almacenadas, pero solamente, hay 4 cajas disponibles. ¿Cuántas permutaciones son posibles? 2-30
Dr. Héctor Quevedo Urías
Solución: Aquí, n = 6 y r = 4, es decir:
6P4
= 360
Teorema 3. El número de diferentes permutaciones de n objetos, de los cuales n1 son de una clase, n2 son de una segunda clase,...nk son de una k-ésima clase se da como: n! / (n1! n2!..nk!)
(2-10)
Donde: n! es el total de los objetos Ejemplo #51. ¿De cuántas maneras pueden arreglarse en un cordón eléctrico 3 focos rojos, 4 amarillos y 2 azules en 9 portalámparas? Solución: Usando la regla de partición n!/(n1!n2!..nk!) Donde, n! = 9, n1 = 3, n2 = 4 y n3 = 2, da: 9! / (3! 4! 2!) = 1260 Ejemplo #52. Un colegio juega 12 juegos durante la temporada. De cuantas maneras puede el equipo terminar la temporada con 7 juegos ganados, 3 perdidos y 2 empates? Solución: Usando la función (2-9) con n! = 12, n1 = 7, n2 = 3 y n3 = 2 y sustituyendo da: 12!/[(7!)(3!)(2!) = 7920 Otra forma de ver las permutaciones es cuando estamos interesados en el número de maneras de partir un conjunto de n objetos en r subconjuntos llamadas celdas. Teorema 4. El número de maneras de partir un conjunto de n objetos en r celdas con n1 elementos en la primera celda, n2 elementos en la segunda y, así sucesivamente, es:
2-31
Dr. Héctor Quevedo Urías
n = C = n! / n1! n2!...nr! n n1,n2..nr n1,n2..nr
(2-11)
Donde: n1 + n2 + nr = n Ejemplo #53. En cuántas maneras pueden 7 científicos ser asignados a un cuarto triple y a 2 cuartos dobles en un hotel. Solución: 7 = 7! / (3!2!2!) = 210 3, 2 , 2
Ejemplo #54. De cuántas maneras se pueden acomodar a 10 viajeros en un hotel asignándolos en 2 cuartos triples y 3 cuartos dobles? Solución: Usando la función (2-11) y sustituyendo da: 10! / (3! 3! 2! 2! 2!) = 12,600 Combinaciones Una combinación es un arreglo de objetos, sin importar el orden. El número de combinaciones de n objetos tomados a un tiempo r puede escribirse como nCr. Teorema: El número de combinaciones de n objetos distintos tomados a un tiempo r es una combinación; esto es, el número de subconjuntos de tamaño r que pueden seleccionarse de un conjunto de n objetos distintos donde el orden no es importante (como en el caso de la permutación, en la cual el orden si es importante). La combinación se denota por la función: nCr
= n! / r! (n - r)!
Donde: nCr
es la combinación, que también se puede denotar como Cnr 2-32
(2-12)
Dr. Héctor Quevedo Urías
Ejemplo #55. Evaluar 7C4. Solución: Usando la fórmula (2-12) nCr = n! / r!(n - r)! y sustituyendo los valores da: = 7C3 = 7! / 4! 3! = 35 Ejemplo #56. Un fabricante de llantas hace 10 tipos de neumáticos para diferentes tamaños y quiere preparar una partida que contenga 6 tipos de llantas. ¿Cuántas combinaciones de llantas están disponibles? Solución: Usamos la función de combinación, la cual es un arreglo de objetos, sin importar el orden. Aquí se usa nuevamente, la función (2-12) definida como: nCr
= n!/ r!(n - r)! = nPr / r!
Aquí, n = 10, r = 6. Substituyendo estos valores en la función de arriba da: 10C6
= 10! / 6! 4! = 210
Ejemplo #57. Un grupo de tres inspectores va a inspeccionar las actividades de una industria contaminante. El grupo se va a formar seleccionando los tres agentes de un grupo de 5. ¿Cuántos grupos diferentes se pueden formar siguiendo un orden definido? ¿Siguiendo un orden indefinido? Solución: Para el primer caso, sería una permutación, porque se quiere un orden definido. Usando la fórmula nPr = n!/(n - r)! con n = 5 y r = 3 y sustituyendo los valores da: 5P 3
= 5! / (5 - 3)! = 5!/3! = 20
Para el segundo caso, o sea un orden indefinido, sería una combinación, porque el orden no es de importancia, es decir, usando la fórmula (2-12): 5C3
= 10 2-33
Dr. Héctor Quevedo Urías
Otra variación de combinación se define como el número de combinaciones de n objetos tomados 1, 2, 3,... n a un tiempo. De esta manera, en general, para cualquier íntegro positivo n se da por la función de abajo: nC1
+ nC2 + nC3 + ... + nCn = 2n – 1
(2-13)
Ejemplo #58. Una persona tiene cinco monedas de diferentes denominaciones. ¿Cuántas sumas diferentes de dinero se pueden formar? Solución: La moneda se puede seleccionar ya sea una de 5 monedas, dos de 5 monedas,…., cinco de 5 monedas. Usando la función de arriba (2-13) y sustituyendo los valores apropiados da: 5C1
+ 5C2 + 5C3 + 5C4 + 5C5 = 5 + 10 + 10 + 5 + 1 = 31
Otra forma de hacer este problema sería razonando de la siguiente manera. Cada moneda se puede manejar de dos maneras, a medida que se selecciona o no se selecciona. Debido a que cada una de las dos maneras de tratar con una de las monedas es asociada con dos maneras de usar, con cada una de las otras monedas, el número de maneras de tratar con las cinco monedas es usando la relación 25 maneras. Pero la cantidad 25 maneras incluye el caso en el cual ninguna moneda se selecciona. Por lo tanto, el número requerido de sumas de dinero es de 25 – 1 = 31. Dentro del tópico de combinaciones, también se puede incluir el uso de la regla hipergeométrica (Pfaffenberger et al. 1987). Siendo así, supóngase que hay n objetos en un grupo y, que n1 son de un tipo y n2 son de otro tipo. El número de grupos de r objetos, donde r1 son del primer tipo y r2 son del segundo tipo, que pueden ser formados por medio de sacar r objetos de n, se da por: n1 n1Cr1
· n2Cr2 donde n1 + n2 = n; r1 + r2 = r 2-34
(2-14)
Dr. Héctor Quevedo Urías
Ejemplo #59.Un reclutador de una firma de empleos ha hecho entrevistas con 10 ingenieros, de los cuales 6 son ingenieros civiles y 4 no. El reclutador quiere emplear 5 de los 10 ingenieros entrevistados. ¿Cuántos grupos posibles de los cinco ingenieros empleados contendrán exactamente tres ingenieros civiles? Solución: Dejar que n1 = 6 y n2 = 4 u usar la regla hipergeométrica (2-14). En el subgrupo de tamaño r = 5, queremos r1 = 3 ingenieros civiles y r2 igual a los que no son ingenieros civiles. Entonces, el número de grupos de tamaño 5 de esta categoría es: 6! 4! 6C3·4C2 = ————— · ————— = (20)(6) = 120 3!(6 – 3)! 2!(4 – 2)! Aquí nótese que la regla hipergeométrica es “poniendo juntos” el producto y la regla de combinaciones para obtener el resultado. Eventos independientes y dependientes.- Dos eventos A y B se dice que son independientes si la ocurrencia de A no afecta la probabilidad de la ocurrencia de B, es decir: o bien
P(A|B) = P(A)
(2-15)
P(B|A) = P(B)
(2-16)
Eventos dependientes.- Si la ocurrencia o no ocurrencia de A, afecta la probabilidad de ocurrencia de B, entonces, los eventos son dependientes. Además, para tres eventos independientes, digamos, E1, E2, E3 la probabilidad es: Pr{E1E2E3} = Pr{E1}Pr{E2|E1}Pr{E3|E1E2}. Ejemplo #60. Se selecciona aleatoriamente una carta de una baraja común de 52 cartas. Si A es el evento de que la carta elegida sea un as y B sea el evento de que sea un corazón, entonces, A y B son eventos independientes, ya que P(AB) = 1/52, P(A) = 2-35
Dr. Héctor Quevedo Urías
4/52 y P(B) = 13/52. Esto se debe a que hay 4 ases y 13 cartas de corazones. Ejemplo #2. Considerar el espacio muestral S = {A, B, C, D), donde P(A) = P(D) = .3 y P(B) = P(C) = .2. (Keller et al. 1990) (a) Siendo así, definir los eventos: 1 = {A, B} 2 = {B, C} 3 = {C, D} (b) ¿Cuál de los siguientes pares de eventos son independientes o dependientes? (b) 1 y 2 (c) 2 y 3 (d) 1 y 3 Solución: (a) 1 = {A, B} = .3, .2 2 = {B, C} = .2, .2 3 = {C, D} = .2, .3 (b) Los eventos 1 y 2 son independientes (c) Los eventos 2 y 3 son independientes (d) Los eventos 1 y 3 son dependientes
2-36
Dr. Héctor Quevedo Urías
Regla multiplicativa para eventos dependientes e independientes En algunas ocasiones se pueden resolver problemas de probabilidad, por medio de contar el número de puntos en un espacio muestral, el cual se refiere como la regla multiplicativa. La regla multiplicativa o de conteo de número de puntos en un espacio muestral se usa en este caso. Sin embargo, podemos ver que esta regla aplica para dos eventos dependientes y para dos eventos independientes. Esta regla de multiplicación es sugerida por la definición de probabilidad condicional arriba descrita. Esta regla de probabilidad condicional se da como: P(A|B) = P(A|B)/P(B), P(B) ≠ 0
(2-17)
Podemos reescribir esta ecuación para obtener: P(A|B) = P(B) P(A|B)
(2-18)
La regla multiplicativa para dos eventos dependientes es: P(A y B) = P(A) P(B|A) y
P(A y B) = P(B) P(A|B)
(2-19)
Que finalmente, también se escribe como: P(A ∩ B) = P(B) P(A|B)
(2-19a)
= P(A) P(B|A)
(2-20b)
Donde: P(A|B) se refiere a la probabilidad condicional de que el evento A ocurra dado que B ya ocurrió y P(B|A) se refiere a la probabilidad condicional de que el evento B ocurra dado que A ya ocurrió. En verdad, la regla multiplicativa para eventos dependientes es la probabilidad de la intersección (A|B) de dos eventos A y B. Esto dice que, la probabilidad de ocurrencia conjunta de evento A y evento B es igual a la probabilidad condicional de A dado B por la probabilidad marginal de B. La regla multiplicativa para dos eventos independientes es: 2-37
Dr. Héctor Quevedo Urías
O bien
P(A y B) = P(A) P(B)
(2-21)
P(A ∩ B) = P(A) P(B)
(2-21a)
Ejemplo #61. Entre 3 discos de computadora uno está defectuoso. Dos de ellos se seleccionan aleatoriamente, pero el primero es reemplazado, antes de sacar el segundo disco. ¿Cuál es la probabilidad de que ambos discos estén buenos? Solución: Dejemos que A sea el evento de sacar un disco bueno y, B, el evento de sacar un segundo disco bueno. Entonces, la probabilidad de A es P(A) = 2/3 y la probabilidad de B es P(B) = 2/3. Debido a que hay reemplazo, esto nos lleva a la regla multiplicativa de eventos independientes. Por lo tanto: P(A y B) = P(A ∩ B) = P(A) P(B) = (2/3)(2/3) = 4/9 Ejemplo #62. Veinte unidades de un producto manufacturado se sitúan en un depósito. Dos de estas unidades están defectuosas. Si se inspeccionan todas las 20 unidades, ¿cuál es la probabilidad de seleccionar (aleatoriamente), las 2 unidades defectuosas? Solución: Dejar que A sea la primera unidad defectuosa y B la segunda unidad defectuosa. Entonces, queremos encontrar la probabilidad de intersección de los dos eventos, es decir, (A ∩ B). Los eventos son claramente dependientes, porque la probabilidad de que la segunda unidad sea defectuosa depende de que si la primera unidad sea o no defectuosa. Aquí: P(A) = 2/20 y P(B/A) = 1/19 Sustituyendo estos valores en la función de la regla de multiplicación para eventos dependientes da: P(A ∪ B) = P(A) P(B/A) = (2/10)(1/19) = 0.00526 2-38
Dr. Héctor Quevedo Urías
Nota: La probabilidad condicional P(B/A) es igual a 19, porque si A ocurre (una unidad defectuosa seleccionada en la primera sacada), entonces, quedarán solamente 19 unidades para ser seleccionadas en la segunda sacada. Por lo tanto, la probabilidad de seleccionar las 2 unidades defectuosas es de 0.00526, la cual es muy improbable, es decir, ¡5 oportunidades en 1,000! Por otra parte, la regla multiplicativa para eventos independientes se define como: P(A ∩ B) = P(A) P(B)
(2-22)
Ejemplo #63. Supóngase que en una caja hay 20 fusibles, de los cuáles 5 están defectuosos. Si se seleccionan 2 fusibles aleatoriamente, en sucesión, ¿cuál es la probabilidad de que los 2 fusibles seleccionados estén defectuosos? Solución: Dejemos que A sea el evento de sacar el primer fusible defectuoso y, B, sea el evento de sacar el segundo fusible defectuoso. Si interpretamos A ∩ B como el evento de que A ocurre y B el evento después de que A ocurrió, entonces, la probabilidad de A es P(A) = 5/20 y, la probabilidad de B es P(B) = 4/19. Por lo tanto, P(A ∩ B) = P(A) P(B|A) = (5/20)(4/19) = 1/19 Ejemplo #64. En los juegos de los dados (honestos) la suma de un total de 7 puntos de los dos dados gana. ¿Cuál es la probabilidad de que un jugador lance dos 7 consecutivos? Solución: Los dos eventos son independientes, porque el resultado del segundo lanzamiento no afecta al resultado del primero. Aquí el espacio muestral es de (36)(36) = 1,296 y la 2-39
Dr. Héctor Quevedo Urías
probabilidad de sacar la suma de 7 es de 6, es decir, (2+5, 5+2, 3+4, 4+3, 1+6, 6+1). Usando la regla multiplicativa para eventos independientes da: P(A ∩ B) = P(A) · P(B) = (6/36)(6/36) = 1/36 Ejemplo #65. ¿Cuántos puntos muestrales hay en un espacio muestral, cuando un par de dados se lanzan una vez? Solución: El primer dado puede caer en n1 = 6 maneras. Para cada una de estas 6 maneras, el segundo dado puede caer en n2 maneras. Por lo tanto: n1 n2 = (6)(6) = 36 maneras posibles El espacio muestral es: S = {1-1, 1-2, 1-3, 1-4, 1-5, 1-6, 2-1, 2-2, 2-3, 2-4, 2-5, 2-6, 3-1, 3-2, 3-3, 3-4, 3-5, 3-6, 4-1, 4-2, 4-3, 4-4, 4-5, 4-6, 5-1, 5-2, 5-3, 5-4, 5-5, 5-6, 6-1, 6-2, 6-3, 6-4, 6-5, 6-6} Regla aditiva para eventos mutuos excluyentes y eventos no mutuos excluyentes En muchas aplicaciones de la teoría de probabilidad, estamos interesados en combinar probabilidades de eventos que están relacionados de alguna manera. En este caso se usa la regla aditiva. Así, la regla aditiva se usa para computar la probabilidad de la unión de dos eventos. Esta regla aplica para eventos no mutuos excluyentes y, también, para eventos mutuos excluyentes. Por ejemplo si A y B son eventos mutuos excluyentes el modelo aditivo es: P(A ∩ B) = P(A) + P(B)
(2-23)
Que también se puede escribir como: P(A o B) = P(A) + P(B)
(2-23a)
Nota. El símbolo P(A o B) se refiere a la probabilidad de cualquiera de los eventos A o B ocurran o, bien, que ambos ocurran. 2-40
Dr. Héctor Quevedo Urías
Sin embargo, si los casos A y B no son eventos mutuos excluyentes, el modelo aditivo es: P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
(2-24)
Esta función también se puede expresar como: P(A o B) = P(A) + P(B) - P(A y B)
(2-25)
Nota: El símbolo P(A y B) se usa para denotar la probabilidad de que ambos eventos A y B ocurrirán. Ejemplo #66. ¿Cuál es la probabilidad de obtener un 6 en el primer o segundo lanzamiento de un dado o, en ambos lanzamientos? Solución: Aquí, usamos la regla aditiva para eventos no mutuos excluyentes: P(A1 o A2) = P(A1) + P(A2) - P(A1 y A2) O bien
P(A o B) = P(A) + P(B) - P(A y B)
Para esto, dejemos que A1 denote el evento de un 6 en el primer lanzamiento y A2 el evento de un 6 en el segundo lanzamiento. Queremos encontrar la probabilidad de P(A1 o A2), lo cual quiere decir que estamos buscando que el 6 aparezca, ya sea en el primer lanzamiento o en el segundo lanzamiento o en ambos lanzamientos. De manera que: P(A1) = 1/6, P(A2) = 1/6 y P(A1 y A2) = 1/36 Substituyendo todos estos valores en la fórmula da: P(A1 o A2) = 1/6 + 1/6 - 1/36 = 11/36 Ejemplo #67. La probabilidad de que Marina pase matemáticas es de 2/3, y la probabilidad de que pase el curso de inglés es 4/9. Si la probabilidad de pasar ambos cursos es de 1/4, ¿cuál es la probabilidad de que Marina pase, cuando menos uno de estos cursos? Solución: 2-41
Dr. Héctor Quevedo Urías
Dejar que A = 2/3 sea el evento de pasar matemáticas y B = 4/9 el evento de pasar inglés y P(A y B) = 1/4 el evento de pasar matemáticas e inglés, entonces por la regla aditiva: P(A o B) = P(A) + P(B) - P(A y B) P(A ∪ B) = P(A) + P(B) - P(A ∩ B) P(2/3 o 1/4) = P(2/3) + P(1/4) - P(2/3 y 1/4) = 2/3 + 4/9 - 1/4 = 31/36 Ejemplo #68. ¿Cuál es la probabilidad de que una carta seleccionada, aleatoriamente, de un mazo de 52 cartas sea un rey o un corazón? Solución: Debido a que hay un traslapado, se usa la regla aditiva para eventos no mutuos excluyentes P(A o B) = P(A) + P(B) - P(A y B). Siendo así, dejemos que A = un rey cualquiera y B = precisamente un corazón cualquiera. Por lo tanto, P(A) = 4/52, P(B) = 13/52, P(A y B) rey o corazones = 1/52. Aquí, es lógico que la probabilidad conjunta (Una probabilidad que mide la verisimilitud de que puedan ocurrir dos a más eventos a la misma vez), de un rey y un corazón deba de restarse una vez. De no ser así se incluiría dos veces en encontrar la probabilidad de que una carta seleccionada aleatoriamente fuera, ya sea un rey o un corazón. Existe un traslapado de resultados, lo cual quiere decir que existe la probabilidad de que el rey (A) y un corazón (B) ocurran al mismo tiempo. Por lo tanto: P(A o B) = P(A) + P(B) - P(A y B) = 4/52 + 13/52 – 1/52 = 16/52 Ejemplo #69. Este es un problema sacado del libro Statistical Analysis for Decisión Making de Morris Hamburg (1989), el cual está relacionado con la probabilidad de obtener un 6 en el primero o segundo lanzamiento de un dado o en ambos lanzamientos. 2-42
Dr. Héctor Quevedo Urías
Esto es lo mismo que calcular la probabilidad de obtener un 6, cuando menos una vez en dos lanzamientos de un dado. Solución: Dejar que A1 denote la salida de un 6 en el primer lanzamiento del dado y A2 represente la salida de un 6 en el segundo lanzamiento. Queremos encontrar el valor de P(A1 o A2). Para esto analicemos los resultados posibles del primero y segundo lanzamiento. 1,1
2,1
3,1
4,1
5,1
6,1
1,2
2,2
3,2
4,2
5,2
6,2
1,3
2,3
3,3
4,3
5,3
6,3
1,4
2,4
3,4
4,4
5,4
6,4
1,5
2,5
3,5
4,5
5,5
6,5
1,6
2,6
3,6
4,6
5,6
6,6
La probabilidad de que un 6 salga en ambos lanzamientos es P(A1 y A2) = 1/36. La probabilidad de que un 6 salga en el primer lanzamiento es P(A1) = 1/6 y en el segundo lanzamiento es P(A2) = 1/6. Entonces, aplicando la regla aditiva da: P(A1 o A2) = P(A1) + P(A2) – P(A1 y A2) = 1/6 + 1/6 – 1/36 = 11/36 Aquí nótese que es necesario restarle 1/36 para evitar un traslapado.
2-43
Dr. Héctor Quevedo Urías
Figura 2.6. Las Figuras (a), (b) y (c) muestran el uso de diagramas de Venn para la regla aditiva, para eventos mutuos excluyentes y no mutuos excluyentes. (Elaboración propia) Ejemplo #70. Una computadora genera aleatoriamente el último dígito de un número telefónico. Encontrar la probabilidad de que el resultado sea un 8 o 9 (Triola, 1986). Solución: Los resultados de los números 8 y 9 son eventos mutuos excluyentes, por lo tanto, se usa la función (2-23). Entonces, dejemos que P(A) = 8 y P(B) = 9, y aplicando la regla aditiva P(A ∩ B) = P(A) + P(B) y sustituyendo da: P(8 o 9) = P(8) + P(9) – P(8 y 9) = 1/10 + 1/10 - 0 = 1/5 Ejemplo #71. Si E1 es el evento de sacar un as de un mazo de cartas y E2 es el evento de sacar un rey, entonces, Pr{E1} = 4/52 y Pr{E2} = 4/52 = 1/13 y la probabilidad de sacar, ya sea un as o un rey es de: Pr{E1 + E2} = Pr{E1} + Pr{E2} = 1/13 + 1/13 = 2/13. 2-44
Dr. Héctor Quevedo Urías
Entonces, por lo tanto, debido a que ambos el as y el rey no pueden ser sacados de un solo tiro, por lo tanto, son eventos mutuos excluyentes y se usa la función (2-23). Ejemplo #72. Si E1 es el evento de sacar un as y E2 es el evento de sacar una espada, entonces, E1 y E2 no son eventos mutuos excluyentes debido a que el as de espadas puede ser sacado. Siendo así, se usa la función (2-25) para eventos no mutuos excluyentes. Por lo tanto, la probabilidad de sacar ya sea un as o una espada o ambos es: Pr{E1 + E2} = Pr{E1} + Pr{E2} - Pr{E1E2} = 4/52 + 13/52 - 1/52 = 4/13 Ejemplo #73. ¿Cual es la probabilidad de obtener un seis en el primero o segundo lanzamiento de un dado o, en ambos lanzamientos de un dado honesto? Solución: Aquí, usamos la regla aditiva para eventos no mutuos excluyentes, es decir, la función (2-25). Para esto dejemos que A1 denote el evento de un seis en el primer lanzamiento y A2 denote el evento de un seis en el segundo lanzamiento. Queremos encontrar la probabilidad de P(A1 o A2), lo cual dice que estamos buscando que el número seis aparezca, ya sea en el primer lanzamiento o en el segundo lanzamiento o en ambos lanzamientos. Entonces: P(A1) = 1/6, P(A2) = 1/6 y P(A1 y PA2) = 1/36 Sustituyendo todos estos valores en la función (2-27) da: P(A ∪ B) = P(A) + P(B) – P(A ∩ B) P(A1 ∪ A2) = 1/6 + 1/6 – 1/36 = 11/36 Ejemplo #74. ¿Cuál es la probabilidad de que una carta seleccionada, aleatoriamente, de un mazo de 52 cartas sea un as o un corazón? Solución: Aquí, nuevamente, se usa la regla aditiva para eventos no mutuos excluyentes. Para esto dejemos que A = un as cualquiera y B = precisamente un corazón cualquiera. Usando el 2-45
Dr. Héctor Quevedo Urías
mazo de 52 cartas (que contiene cuatro 2´s, cuatro 3´s, cuatro 4´s, ………, cuatro 10´s, cuatro sotas, cuatro reinas, cuatro reyes y cuatro ases, con sus correspondientes figuras de tréboles, corazones, espadas y diamantes), por lo tanto, para un as cualquiera, P(A) = 4/52 , para un corazón cualquiera, P(B) = 13/52 y, para ases o corazones, P(A y B) igual a 1/52. Aquí, nuevamente, como en el caso del ejemplo #68 es lógico asumir qué, la probabilidad conjunta (una probabilidad que mide la probabilidad de que puedan ocurrir dos o más eventos a la misma vez), de un as y un corazón deba restarse una vez. De no ser así, se incluiría dos veces en encontrar la probabilidad de que una carta seleccionada al azar fuera, ya sea un as o un corazón. Existe un sobrepuesto de resultados, lo cual dice que existe la probabilidad de que el as (A) y un corazón (B) salgan a la misma vez. Por lo tanto: P(as o corazón) = P(as) + P(corazón) – P(as y corazón) = 4/52 + 13/52 – 1/52 = 16/52 Ejemplo #75. En este ejemplo, para ilustrar la ley aditiva de probabilidad, en la cual existen traslapados, se puede hacer usando diagramas de Venn. Para esto, se hace el siguiente experimento de lanzar dos monedas. Siendo así, estimar la probabilidad de sacar, cuando menos una cara, ya sea en el primer lanzamiento o en el segundo lanzamiento (Smith, 1985). Solución: Primeramente, enlistar los cuatro posibles resultados poniendo H = caras y T = a soles, es decir, HT, HH, TH y TT. Aquí, para evitar un traslapado, se usa la regla aditiva para eventos no mutuos excluyentes. El diagrama de Venn de abajo ilustra claramente, el traslapado que pudiera ocurrir, si se sumara la probabilidad de una cara en el primer lanzamiento, más la probabilidad de una cara en el segundo lanzamiento que daría ½ + 2-46
Dr. Héctor Quevedo Urías
½ = 1, lo cual sería incorrecto. En este caso, la probabilidad de una cara en el primer lanzamiento es de 0.5; la probabilidad de una cara en el segundo lanzamiento es 0.5 y, la probabilidad de caras en ambos lanzamientos es de 0.25. Por lo tanto, la probabilidad de una cara, ya sea en el primero o segundo lanzamiento es: P(H o T) = P(H) + P(T) - P(H y T) =½+½-¼=¾ El traslapado o la representación del potencial de un doble conteo (HH) se da abajo.
Figura 2.7. Figura esquemática mostrando un diagrama de Venn indicando el traslapado de caras (HH), que ocurre en la intersección de A y B (Smith, 1985).
2-47
Dr. Héctor Quevedo Urías
Regla multiplicativa para más de dos eventos Otra regla útil para calcular la probabilidad de un evento es el modelo de la regla multiplicativa. Esta regla se define como la probabilidad de la ocurrencia conjunta que el evento A y el evento B sea igual a la probabilidad condicional del evento A dado el evento B multiplicado por la probabilidad marginal de B. Teorema 1: Si en un experimento, los eventos dependientes A1, A2, A3,...Ak pueden ocurrir, entonces: P(A1 ∩ A2 ∩ A3 ∩ ... Ak) = P(A1)P(A2|A1)P(A3|A1 ∩ A2) ... ...P(Ak|A1 ∩ A2 ∩ ... ∩ Ak-1)
(2-26)
Teorema 2: Si los eventos A1, A2, A3,... Ak son independientes, entonces: P(A1 ∩ A2 ∩ A3... ∩ Ak) = P(A1)P(A2)P(A3)….P(Ak)
(2-27)
Ejemplo #76. Tres naipes se sacan en sucesión, sin reemplazo. Encontrar la probabilidad de que ocurra el evento A1 ∩ A2 ∩ A3, cuando A1 es el evento de que la primera carta sea un as rojo, A2 sea que la segunda carta sea un 10 o una sota y, A3 sea el evento de que la tercera carta sea mayor que un 3, pero menor que un 7. Solución: Primero vamos a definir los eventos: A1: la primera carta es un as rojo (aquí, nótese que hay nomás 2 ases rojos) A2: la segunda carta sea un 10 o una sota (hay cuatro 10´s y cuatro sotas) A3: la tercera carta sea mayor que 3 pero menor que 7 (hay doce cartas entre el 3 y el 7). Los valores son: P(A1) = 2/52; P(A2|A1) = 8/51; P(A3|A1 ∩ A2) = 12/50. (Aquí nótese que, en la primera sacada son 52 cartas, pero en la segunda sacada el número de cartas baja a 51 y en la tercera sacada baja a 50 cartas). Por lo tanto: P(A1 ∩ A2 ∩ A3) = P(A1)P(A2|A1)P(A3|A1 ∩ A2) 2-48
Dr. Héctor Quevedo Urías
= (2/52)(8/51)(12/50) = 8/5,525 Ejemplo #77. Hacer el mismo ejemplo #1 de arriba pero, en esta ocasión, con reemplazo de cartas. Solución: Al haber reemplazo de cartas, el problema se reduce a la regla multiplicativa para eventos independientes. Los valores de las variables son: P(A1) = 2/52; P(A2) = 8/52; y P(A3) = 12/52 Enseguida, substituyendo los valores en la expresión de abajo da: P(A1 ∩ A2 ∩ A3) = P(A1)P(A2)P(A3) = (2/52)(12/52)(12/52) = 0.002 Ejemplo #78. Cuatro cartas se sacan en sucesión. Encontrar la probabilidad de que la primera carta sea un rey; la segunda sea un 9 de diamantes; la tercera sea, cuando menos, una sota (asumiendo que el as sea la última carta) y, la cuarta carta sea un 7 negro. Solución: Dejemos que A sea cualquiera de los 4 reyes; B sea precisamente un 9 de diamantes; C sea igual a doce cartas, es decir, desde la sota hasta el as; y D sea cualquiera de los dos sietes negros. Siendo así, P(A) = 4/52, P(B) = 1/51, P(C) = 16/50, P(D) = 2/49 Por lo tanto: P(A ∩ B ∩ C ∩ D) = (4/52)(1/51)(16/50)(2/49) = 128/6,497,400 = .00002 Ejemplo #79. Dejemos que un par de dados sean lanzados una sola vez. Las tablas de 2-49
Dr. Héctor Quevedo Urías
abajo muestran los resultados posibles, las probabilidades y su representación. Hacer una gráfica que vaya en función de P(X), es decir, 1/36, 2/36, etc. (El estudiante lo hará). Solución: TABLA 2.1. Diagrama mostrando la distribución de probabilidades cuando se lanzan dos dados una sola vez. (Elaboración propia) No. éxitos | 1 2 3 4 5 6 5 4 3 2 1 Suma (X) |2 3 4 5 6 7 8 9 10 11 12 Probabilidad |1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 TABLA 2.2. Probabilidades cuando se lanzan dos dados. (Elaboración propia) Suma de los dados
Número de éxitos
Probabilidad
2
1
1/36
3
2
2/36
4
3
3/36
5
4
4/36
6
5
5/36
7
6
6/36
8
5
5/36
9
4
4/36
10
3
3/36
11
2
2/36
12
1
1/36
2-50
Dr. Héctor Quevedo Urías
TABLA 2.3. Resultados cuando se lanzan dos dados una sola vez. (Elaboración propia) Primer dado
1
2
3
4
5
6
Segundo dado
Resultado
Suma de los números
1 2 3 4 5 6
1-1 1-2 1-3 1-4 1-5 1-6
2 3 4 5 6 7
1 2 3 4 5 6
2-1 2-2 2-3 2-4 2-5 2-6
3 4 5 6 7 8
1 2 3 4 5 6
3-1 3-2 3-3 3-4 3-5 3-6
4 5 6 7 8 9
1 2 3 4 5 6
4-1 4-2 4-3 4-4 4-5 4-6
5 6 7 8 9 10
1 2 3 4 5 6
5-1 5-2 5-3 5-4 5-5 5-6
6 7 8 9 10 11
1 2 3 4 5 6
6-1 6-2 6-3 6-4 6-5 6-6
7 8 9 10 11 12
2-51
Dr. Héctor Quevedo Urías
Ejercicios Capítulo 2 2.1. Si una moneda tiene dos caras denotadas por águilas o soles, ¿cuál es la probabilidad de que salga un sol?
(0.5)
2.2. En el caso de un dado que tiene 6 números o caras, entonces, si el dado es honesto, todas los números del 1 al 6 tienen la misma probabilidad de caer. Entonces, ¿cuál es la probabilidad de sacar un 1? 2.3. En el lanzamiento de un dado, ¿cuál es la probabilidad de que se muestren los números 3 o 4? ¿Cuál es la probabilidad de no sacar un 3 o un 4?
(2/3)
2.4. Si una persona es seleccionada al azar de un grupo de 20 psicólogos y 30 sociólogos, ¿cuál es la probabilidad de seleccionar un sociólogo? 2.5. ¿Cuál de los siguientes no es una probabilidad? 3/7, 2, -1/2, 3/4, 99/101, 0, 1, 5, 1.11, 1.0001, 0.0001, 0.001, 0.9999.
(2, 5, 1.11, 1.0001
2.6. La probabilidad de que Juan esté vivo en 20 años es de 0.7 y la probabilidad de que Pedro esté vivo en 20 años es 0.5. ¿Cuál es la probabilidad de que ambos estén vivos en 20 años? 2.7. Si E1 y E2 sean los eventos de "caras del quinto lanzamiento" y "caras en el sexto lanzamiento" de una moneda, entonces, los eventos E1 y E2 son eventos independientes. ¿Cuál es la probabilidad de que salgan caras en ambos lanzamientos?
(1/4)
2.8. ¿Cuál es la probabilidad de sacar cuando menos un 6 en dos lanzamientos de un dado honesto? Sugerencia: Usar la regla de adición. 2.9. Asumiendo que los varones y las hembras ocurran igualmente y que el sexo de cualquier hijo sea independiente de cualquiera de los hermanos o hermanas, encontrar el espacio muestral y encontrar la probabilidad de que una pareja con 3 hijos tendrán: (a) exactamente 2 varones.
(3/8)
(b) Exactamente 2 hembras.
(3/8) 2-52
Dr. Héctor Quevedo Urías
(P(X ≥ 2))
(c) Cuando menos 2 varones 2.10. Lanzar una moneda 2 veces. Encontrar los siguientes eventos: (a) Encontrar el espacio muestral.
(b) Encontrar la probabilidad de que salgan exactamente una cara y un águila. 2.11. Encontrar el número de permutaciones de las letras a, b, c tomadas dos a un tiempo.
(6)
2.12. Encontrar el número de combinaciones de las letras a, b, c tomadas dos a un tiempo. 2.13. Para dos eventos A y B, P(A) = 0.10, P(B) = 0.40 y P(A ∩ B) = 0.05. Determinar: (a) P(A|B)
(0.125)
(b) P(B|A).
(0.50)
2.14. Si P(B) = 2750/10,000 y P(A ∩ B) = 0.14, encontrar P(A|B). 2.15. Dejemos que E sea el evento de que, los números pares de un dado, sean 2, 4, 6. Encontrar la probabilidad de que salgan estos eventos.
(1/2)
2.16. Un grupo de consumidores consiste de 80 estudiantes, 30 de los cuales son mujeres. Si un estudiante es seleccionado aleatoriamente de este grupo, encontrar la probabilidad de no escoger a una mujer. 2.17. De los siguientes eventos decir cuales eventos son mutuos excluyentes: (a) Seleccionando un estudiante quien atiende las clases de estadística regularmente. Seleccionando un estudiante quien posee una computadora. (b) Seleccionando a una persona con pelo rubio. Seleccionando a una persona con ojos cafés. (c) Seleccionando un curso académico requerido.
(evento mutuo excluyente)
Seleccionando un curso electivo 2.18. La probabilidad de que un vuelo de avión salga a tiempo es de P(D) = 0.83; la 2-53
Dr. Héctor Quevedo Urías
probabilidad de que el vuelo llegue a tiempo es de P(A) = 0.82; y, la probabilidad de que salga a tiempo y llegue a tiempo es de P(D ∩ A) = 0.78. Asúmase una probabilidad condicional. Encontrar la probabilidad de que el avión: (a) Llegue a tiempo dado que partió a tiempo. (b) Salga a tiempo dado que arribó a tiempo. 2.19. Supóngase que una caja contiene 3 bolas blancas y 2 bolas negras. Asúmase que no hay reemplazo y, por lo tanto, son eventos dependientes. Siendo así, calcular los siguientes enunciados: (a) ¿Cuál es la probabilidad de que la primera bola sacada sea negra?
(2/5)
(b) ¿Cuál es la probabilidad de la segunda bola sacada sea negra dado que la primera bola sacada fue negra?
(1/4)
(c) ¿Cuál es la probabilidad de que ambas bolas sacadas sean negras?
(1/10)
2.20. Usando la figura de abajo y la simbología de diagramas de Venn definir las siguientes regiones: (a) Regiones 1 y 2 (b) Regiones 1 y 3 (c) Regiones 1, 2, 3, 4, 5, y 7 (d) Regiones 4 y 7 (e) Región 1 (f) Regiones 2, 6, 7
2-54
Dr. Héctor Quevedo Urías
Figura mostrando los diagramas de Venn. (Fuente: Montgomery et al.1996) 2.21. Supóngase que se estudian 10,000 personas de 20 años y se encuentra que 9961 vivieron 21 años. Encontrar la probabilidad de que una persona de 20 años vaya a vivir 21 años.
(.9961)
2.22. Un estudio encuestó a un grupo de 100 profesionistas que consistía de 40 ingenieros (de los cuales la mitad eran mujeres) y a 60 arquitectos (de los cuales la mitad eran mujeres). Encontrar la probabilidad de que un profesionista seleccionado aleatoriamente sea ingeniero o mujer. Asumir una regla aditiva. 2.23. ¿Cuál es la probabilidad de que una carta seleccionada al azar de un mazo de 52 naipes sea una reina o un corazón? Asumir una regla aditiva para eventos no mutuos excluyentes
(4/13)
2.24. ¿Cuál es la probabilidad de sacar un 6 en el primero o segundo lanzamiento de un dado honesto o, en ambos lanzamientos? 2.25. Un ingeniero fabricante de motores le preocupan tres tipos de principales defectos. Por ejemplo, A es el evento en el que el eje del motor es demasiado grande, B el evento en el que las bobinas son inadecuadas y C el evento en el que las conexiones eléctricas son insatisfactorias. De ser así, expresar verbalmente qué eventos están representados por las siguientes regiones del diagrama de Venn. (Johnson, 1997) 2-55
Dr. Héctor Quevedo Urías
(a) Región 2. (Dado que la región 2 está en A y B, pero no en C, esto dice que, el eje es demasiado grande y las bobinas son inadecuadas) (b) Región 1 y 3 juntas (c) Regiones 3, 5, 6 y 8 juntas (Debido a que todas estas regiones están fuera de la región A, esto representa el evento en que el eje es demasiado largo o defectuoso)
Figura mostrando los espacios muestrales y eventos. (Fuente: Johnson 1997) 2.26. Refiriéndose al problema anterior representar con símbolos de Venn las siguientes regiones: (a) 4, 6, 7 (b) 1,4 (c) 1, 2, 5, 7 (d) 1, 2 (e) 1, 3, 4. 2.27. En estudios de higiene industrial y seguridad de obreros de una industria se descubrió que el 8% necesitaron botas de hule para protección contra descargas eléctricas, 15% necesitaron cascos protectores para la cabeza y, 3% necesitaron, ambos, botas de hule protectoras y cascos protectores para la cabeza. ¿Cuál es la probabilidad 2-56
Dr. Héctor Quevedo Urías
de que un trabajador seleccionado, al azar, necesitará, ya sea, botas protectoras de hule o cascos protectores para la cabeza? Sugerencia: usar el modelo aditivo. (0.20) 2.28. Se lanza una moneda dos veces. Encontrar la probabilidad de sacar una cara, ya sea en el primer lanzamiento o segundo lanzamiento o en ambos lanzamientos. Asumir que H = caras, T = águilas. 2.29. Una computadora genera, aleatoriamente, el último dígito de un número telefónico. Calcular: (a) La probabilidad de que el resultado sea un 8 o 9.
(1/5)
(b) La probabilidad de que el resultado sea un número non o menor que 4. (0.7) 2.30. Encontrar la probabilidad de sacar un total de 7 o 11 cuando un par de dados se lanzan. 2.31. ¿La probabilidad de sacar un as o un rey de un mazo de 52 cartas?
(2/13)
2.32. Cuál es la probabilidad de sacar, ya sea un as o una espada o ambos en una sacada de cartas de un mazo de 52 naipes. 2.33 ¿Cuántas comidas consistentes de una sopa, un emparedado, un postre y un refresco son posibles, si podemos seleccionar 4 sopas, 3 tipos de emparedados, 5 postres y 4 refrescos?
(240)
2.34. Dos monedas se lanzan. ¿Cuál es la probabilidad de que ambas monedas caigan en águilas? Usar regla multiplicativa. 2.35. Una pareja de recién casados planea tener 3 hijos. Encontrar los siguientes enunciados: (a) La probabilidad que todos los hijos sean hombres.
(1/8)
(b) La probabilidad de 3 hembras.
(1/16)
(c) La probabilidad de exactamente 2 varones.
(3/8)
(d) La probabilidad de 3 varones y 3 hembras.
(1/64)
2-57
Dr. Héctor Quevedo Urías
(e) La probabilidad de tener a lo más 2 varones.
(3/8)
(f) La probabilidad de tener cuando menos 2 varones.
(4/8)
Asumir que los varones y las hembras tienen la misma oportunidad y que el sexo de cada hijo sea independiente del sexo del otro. Hacer un diagrama de árbol para facilitar el cómputo. 2.36. Con referencia al problema anterior, si la familia fuera de 4 hijos, ¿cuál sería la probabilidad de fueran 4 varones y/o 4 hembras? 2.37. Se sacan dos cartas al azar de un mazo de 52 naipes. ¿Qué probabilidad hay de obtener dos ases si? (a) La primera carta es repuesta antes de sacar la segunda carta.
(1/69)
(b) La primera carta no es repuesta antes de sacar la segunda carta. Asumir una regla multiplicativa.
(12/2652)
2.38. Hay 10 rollos de película en una caja y 3 están defectuosos. Se sacan 2 rollos uno detrás del otro. ¿Cuál es la probabilidad de seleccionar un rollo defectuoso seguido por otro rollo defectuoso, sin no hay reemplazo? Usar regla multiplicativa. 2.39. Responder a las siguientes preguntas; (a) ¿Cuántos resultados hay en un espacio muestral, cuando se lanzan un par de dados una sola vez?
(36)
¿Cuál es éste? (b) ¿Cuántos puntos muestrales hay en un espacio muestral cuando se lanzan 3 dados simultáneamente? 2.40. Un diseñador de una nueva subdivisión ofrece a los compradores de casas, una selección de estilos exteriores de inglés, rústico, colonial, y exterior tradicional combinados con tipos de rancho, de dos pisos y un desnivel. ¿De cuántas maneras se puede ordenar una de estas casas con esos estilos de construcción? Hacer un diagrama 2-58
Dr. Héctor Quevedo Urías
de árbol. Sugerencia: usar la regla del producto n1n2.
(12)
2.41. Un estudio de tráfico vehicular indica que de 3,756 autos que se acercan a la plaza, 857 entran en el aparcamiento. ¿Cuál es la probabilidad de que un auto no entre en el aparcamiento?
(P(857) = 0.23, q = ?)
2.42. En una prueba la primera pregunta es de falso y verdadero y, la segunda pregunta es de selección múltiple con posibles respuestas de a, b, c, d, e. (a) ¿Cuántas secuencias de posibles respuestas hay en estas dos preguntas? (b) Usar un diagrama de árbol y enlistar el espacio muestral.
(10)
2.43. En el diseño de un sistema de computadora, si un byte se define como una secuencia de 8 bits y, cada bit debe ser 0 o 1, ¿cuántos bytes diferentes son posibles? 2.44. Explique en sus propias palabras lo que significan los siguientes términos: (a) Experimento aleatorio (b) Espacio muestral (c) Evento 2.45. Hablando de factoriales, evaluar 50! Sugerencia: usar la aproximación de Sterling: n! ~ √2πn nn e-n
(3.04x1064)
2.46. Se lanza una moneda 3 veces consecutivas. Hacer un diagrama de árbol con los resultados de soles y águilas y el espacio muestral. Calcular lo siguiente: (a) Número de soles es cuando menos 2. (b) Segundo lanzamiento son soles. (c) El número de soles es exactamente 2. (d) Segundo lanzamiento son águilas. (e) Todos los lanzamientos muestran la misma imagen. (f) El número de soles es menor que 2. 2-59
Dr. Héctor Quevedo Urías
(g) El segundo lanzamiento no son soles. (h) El número de soles es de cuando menos 2. (i) El número de soles es no más de 3. (j) El número de águilas es a lo más 3. (k) El número de soles que excedan el número de águilas. 2.47. ¿De cuántas maneras diferentes una sección sindical con 25 miembros puede elegir un presidente y un vicepresidente?
(600)
2.48. Si un dado se lanza 3 veces consecutivas, ¿Cuál es la probabilidad de que salga un 3? 2.49. Se seleccionan 3 cartas, sucesivamente, de un mazo de 52, entonces, encontrar el número de resultados si: (a) Hay reemplazo
(140,608)
(b) Si no hay reemplazo
(132,600)
2.50. ¿De cuántas maneras pueden acomodarse 5 canicas de diferentes colores en una fila? 2.51. ¿Calcular de cuántas maneras pueden formarse seis personas para subir a un autobús?
(720)
2.52. Un candidato presidencial planea hacer campaña política. Encontrar el número de permutaciones si: (a) Planea visitar todos los estados de la República Mexicana. (b) Planea visitar únicamente los estados que colindan con los Estados Unidos. 2.53. Evaluar los siguientes factoriales: (a) 7!
(5040)
(b) 70!/68!
(100) 2-60
Dr. Héctor Quevedo Urías
(c) 10!/0!
(3,628,800)
2.54. Supóngase que hay 50 personas compitiendo por 3 rangos diferentes, primero, segundo y tercero. ¿Cuál es el número de resultados de las 50 personas, si las tomamos 3 a un tiempo (es decir, de 3 en 3)? 2.55. En cierta compañía, 4 escritorios de secretarias se sitúan en línea contra la pared. Cada secretaria puede sentarse en cualquier banco de los escritorios. ¿Cuántos arreglos se pueden hacer para sentar a las secretarias?
(24)
2.56. En un almacén hay 5 cajas adyacentes para almacenar 5 objetos diferentes. El depósito de cada objeto puede almacenarse satisfactoriamente en una caja. ¿De cuántas maneras pueden asignarse 5 objetos a 5 cajas? 2.57. Supóngase que hay 6 partes diferentes para ser almacenadas, pero solamente, hay 4 cajas disponibles. ¿Cuántas permutaciones son posibles?
(360)
2.58. ¿De cuántas maneras diferentes se puede realizar una primera, segunda, tercera o cuarta selección entre 12 empresas arrendadoras de equipo de control de contaminación ambiental? 2.59. Contestar lo siguiente. (a) ¿Cuál es el número de permutaciones de las letras a, b, c, es decir, tomadas dos a un tiempo?
(6)
(b)¿Cuáles son estas letras?
(ab, ba, ac, ca, bc, cb)
2.60. Un mecanismo electrónico de control requiere de 5 chips de memoria idénticos. ¿De cuántas maneras puede inhabilitarse este mecanismo colocando los 5 chips en las 5 posibles posiciones dentro del controlador? 2.61. Se requiere sentar a 5 hombres y 4 mujeres en una fila de tal manera que las mujeres ocupen lugares pares. ¿Cuántos arreglos hay?
(2880)
2.62. Un aparato de seguridad de un negocio con 10 botones se inhabilita cuando 3 2-61
Dr. Héctor Quevedo Urías
botones diferentes se oprimen en la secuencia apropiada (los botones no pueden oprimirse dos veces). Si el código correcto se olvida, ¿Cuál es la probabilidad de desarmar el aparato a través de oprimir, aleatoriamente, 3 botones? 2.63. Se sacan 2 boletos de la lotería entre 20 posibles para el primero y segundo premios. ¿Cuál es la probabilidad de ganar comprando un boleto?
(1/380)
2.64. En una carrera de 8 perros se juega un premio de exacta. Si seleccionamos 3 números de perros, ¿cuál es la probabilidad de acertar comprando un solo boleto? 2.65. Considérese una carrera de 10 caballos con un premio de exacta para cualquiera que pueda seleccionar el orden exacto y de ganar desde el primero hasta el décimo lugar. (a) ¿Cuántas permutaciones posibles hay? (b) ¿Cuál es la probabilidad de ganar si se compra un solo boleto?
(3,628,800) (2.7x10-7)
(c) ¿Cuál es la probabilidad de seleccionar los tres primeros lugares?
(1/10P3)
2.66. Una prueba se compone de 12 preguntas de falso y verdadero. ¿De cuántas maneras diferentes un estudiante puede marcar el papel con una respuesta para cada pregunta? 2.67. ¿De cuántas maneras pueden 3 focos rojos, 4 focos amarillos y 2 focos azules ser arreglados en un cordón eléctrico con 9 portalámparas?
(1260)
2.68. ¿Cuál es el número de permutaciones de la palabra "estadística"? 2.69. Cinco canicas rojas, 2 canicas blancas y 3 azules se arreglan en una fila. Si todas las canicas son del mismo color, y no se puede distinguir una de la otra, ¿cuántos arreglos pueden hacerse?
(2420)
2.70. ¿De cuantas maneras pueden 7 científicos ser asignados a un cuarto triple y a dos cuartos dobles? Asumir regla de partición. 2-62
Dr. Héctor Quevedo Urías
2.71. De un grupo de 4 químicos y 3 físicos, encontrar el número de comités que se pueden formar consistentes de 2 químicos y 1 físico. Sugerencia: usar un producto de combinaciones.
(18)
2.72. Un equipo de colegio juega 12 juegos durante la temporada. ¿De cuántas maneras puede el equipo terminar la temporada con 7 juegos ganados y 3 perdidos? Sugerencia usar la regla de partición de permutaciones. 2.73. Considerar un grupo de 5 personas consistentes de 3 hombres y 2 mujeres, todos pertenecientes a una organización. Siendo así, contestar lo siguiente: (a) ¿Cuántos comités de 3 personas pueden formarse de todo el grupo?
(10)
(b) ¿De cuántas maneras pueden las 2 posiciones, presidente y vicepresidente ser formados?
(20)
(c) ¿Cuál es la probabilidad de que un comité de 2 personas seleccionadas, aleatoriamente, consistieran de 1 hombre y 1 mujer?
(6/10)
2.74. ¿Cuántas manos de 5 cartas de flor imperial (la flor imperial consiste de sacar 10, sota, reina, rey, as de un solo palo, es decir, de tréboles, corazones, diamantes y espadas) son posibles de una mazo de 52 cartas, en las cuales el orden no es de importancia? 2.75. Si queremos saber la probabilidad de sacar una flor imperial de un mazo de 52 cartas, a sabiendas de que se pueden formar 4 flores imperiales (10, sota, reina, rey, as de cada una de las cuatro formas, es decir, tréboles, espadas, diamantes, corazones) (1.54x10-6)
entonces, calcular esta probabilidad.
2.76. En la lotería de Texas se juegan 54 números y se seleccionan solamente 6 de ellos. (a) ¿Cuántas combinaciones se pueden hacer? (b) ¿Cuál es la probabilidad de acertar comprando un solo boleto? (c) ¿Cuál es la probabilidad de acertar comprando un millón de boletos? 2-63
Dr. Héctor Quevedo Urías
2.77. Supongamos que de todos los individuos que compran una computadora personal, 60% incluyen un programa de procesador de palabras en su compra, 40% incluye un programa de esparcimiento de hojas (LOTUS) y 30% incluye ambos programas. (a) ¿Cuál es la probabilidad de seleccionar un comprador que incluya un programa de procesador de palabras, dado que incluya un programa de LOTUS? Usar un diagrama de Venn.
(0.75)
(b) ¿Cuál es la probabilidad de que un comprador incluya un programa de LOTUS, dado
que
incluya
un
programa
de
procesador
de
palabras?
(0.5) 2.78. Una revista de publicaciones publica tres columnas intituladas Arte (A), Libros (B), Cinema (C). La selección aleatoria de un comprador de revistas, con respecto a estas tres columnas se da abajo (elaboración propia):
Leídas regularmente | Probabilidad
A
B
C
| .15 .24 .47
A∩B
A∩C
B∩C
A∩B∩C
.09
.08
.15
.07
Calcular y hacer un diagrama de Venn para: (a) La probabilidad de que lea la revista Arte (A), dado que leyó la revista Libros (B). (b) La probabilidad de leer la revista Arte (A), dado que leyó las revistas Libros (B) y Cinema (C). (c) La probabilidad de leer la revista Arte (A), dado que haya leído cuando menos una. 2.79. Supongamos que P(A) = .5, P(B) = .4, P(A ∩ B) = .25. Hacer los siguientes cómputos y usar un diagrama de Venn. (a) P(B|A)
(.5)
(b) P(B’|A)
(.5) 2-64
Dr. Héctor Quevedo Urías
(c) P(A|B)
(.625)
(d) P(A’|B)
(.375)
(e) P(A ∪ B)
(.9)
2.80. Una firma de consultoría ambiental presenta licitaciones para la construcción de tres proyectos de plantas de tratamiento de aguas residuales. Dejemos A = proyecto i conferido para i = 1, 2, 3. Supóngase que: P(A1) = .22 P(A2) = .25 P(A3) = .28 P(A1 ∩ A2) = .11 P(A1 ∩ A3) = .05 P(A2 ∩ A3) = .07 P(A1 ∩ A2 ∩ A3) = .01 Encontrar: (a) A1 ∪ A2 (b) A’ ∩ A2 Sugerencia: usar A’ ∩ A2 = (A1 ∪ A2)’ = 1 - P(A1 ∪ A2) (c) A1 ∪ A2 ∪ A3 (d) A1' ∩ A2 ∩ A3 Sugerencia: usar 1 - P(A1 ∩ A2 ∩ A3) 2.81. Considérese un grupo de 5 personas consistentes en 3 hombres y 2 mujeres, todos los cuales pertenecientes a una organización. Siendo así, encontrar los siguientes enunciados. (a) ¿Cuántos comités de 3 personas pueden formarse?
(5C3)
(b) Decir de cuantas maneras pueden formarse las posiciones de presidente y 2-65
Dr. Héctor Quevedo Urías
vicepresidente.
(5P2)
(c) Decir la probabilidad de que un comité de 2 personas consistirán de 1 hombre y 1 ([3C1·2C1]/5C2)
mujer.
2.82. ¿Cuál es la probabilidad de sacar una flor corrida, es decir, 5 cartas de una sola denominación, que no incluyan del 10 al as? Ver Figura 2.6. 2.83. En el juego de póquer de 5 cartas, existen un total de 52 cartas que van desde el 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K, As y cada una de estas cartas, tienen 4 figuras, es decir, tréboles, diamantes, espadas y corazones. Tomando en consideración esto, ¿Cuál es la probabilidad de sacar una flor imperial, es decir, las cartas 10, J, Q, K, As, de una de las cuatro figuras, es decir, corazones, diamantes, tréboles o espadas? Para esto, ver Figura 2.6.
(624/2,598,960)
2.84. ¿Cuál es la probabilidad de sacar 4 cartas de la misma clase, es decir, un poker? Esto es, cuatro 2, cuatro 3, cuatro 4,……cuatro J, cuatro K, cuatro As. Para esto ver Figura 2.6. 2.85. ¿Cuál es la probabilidad de sacar una casa llena (full house), es decir, una tercia y un par?
(.00144)
2.86. En el juego de barajas, ¿Cuál es la probabilidad de sacar una tercia? 2.87. En el juego de naipes, ¿Cuál es la probabilidad de sacar un par de un mazo ordinario de 52 cartas? Ver Figura 2.6.
(0.42)
2.88. En un estudio de higiene industrial y seguridad, un supervisor de un grupo de 20 trabajadores de la industria desea saber la opinión de ellos, (a los que seleccionará aleatoriamente), sobre cierto reglamento de seguridad relacionado con emisiones de gases dentro de la fábrica. Si 12 de ellos están a favor del nuevo reglamento y los otros 8 están en contra, ¿Qué probabilidad hay de que dos trabajadores seleccionados, por el supervisor, se manifiesten en contra del nuevo reglamento de seguridad? Sugerencia: 2-66
Dr. Héctor Quevedo Urías
usar la regla multiplicativa para eventos independientes, es decir: P(A ∩ B) = P(A) P(B). 2.89. Cuatro naipes de un monte de 52 cartas (mazo de cartas americano) se sacan en sucesión (sin reemplazo). Encontrar la probabilidad de que la primera carta sacada sea un as; la segunda carta sacada sea un 8 de diamantes; la tercera carta sacada sea cuando menos una reina y la cuarta carta sacada sea un 6 rojo. Sugerencia: Dejar que P(A) sea la probabilidad de sacar el as, P(B) sea la probabilidad de sacar el 8 de diamantes, P(C) sea la probabilidad de sacar menos una reina y P(D) sea la probabilidad de sacar el 6 rojo. Usar diagramas de Venn para denotar las probabilidades y las intersecciones de las cuatro cartas sacadas. Referirse a la Figura 2.6 de abajo.
Figura 2.6. Diagrama esquemático mostrando las 52 cartas de juego de barajas. El monte de cartas empieza con el 2 hasta el 10, en cada una de sus denominaciones y termina con cuatro cartas adicionales, que son las sotas, las reinas, los reyes y los ases. Aquí, nótese que, las figuras de diamantes y de corazones son siempre del color rojo y las figuras de tréboles y de espadas son siempre de color negro. 2-67
Dr. Héctor Quevedo Urías
Fuente: http://en.wikipedia.org/wiki/Image:Set_of_playing_cards_52.JPG
Figura 2.7. Diagrama esquemático de las 52 cartas ilustrando la probabilidad de sacar un As o un Rey. Fuente: Lawrence L. Lapin. Statistics for Modern Business Decision. (1982).
2-68
Dr. Héctor Quevedo Urías
CAPITULO 3 Distribuciones Binomial e hipergeométrica Aplicaciones generales de la distribución binomial.- Relación entre la distribución normal y la distribución binomial.- Relación entre la distribución binomial y la distribución de Poisson.- La distribución hipergeométrica.Suposiciones y propiedades de la distribución hipergeométrica.La distribución binomial es una de las distribuciones de probabilidad discretas más usadas en estadística. Se puede considerar como un tipo de análisis de lógica deductiva, porque va del conjunto o total a la parte. Se deriva de un proceso conocido como ensayos de Bernoulli. Un proceso Bernoulli es un ensayo de algún proceso o experimento que puede resultar en, solamente, uno de dos resultados mutuos excluyentes, es decir, binarios, como por ejemplo, “éxito” y “fracaso”, donde la probabilidad de éxito se denota como p. También el experimento binomial se puede interpretar como una situación defectuosa o no defectuosa, correcta o incorrecta, presente o ausente, nacimientos de niños o niñas, caras o águilas de una moneda, etc. De esta manera, los datos de un proceso binomial (binario) consiste, únicamente, de dos situaciones o resultados. Aplicaciones generales de la distribución binomial Una de las áreas principales de aplicación de la distribución binomial es en los campos de la ingeniería industrial, es decir, en procesos industriales, donde el resultado de un proceso es dicótomo (proporciones de un objeto defectuoso o no defectuoso, de éxito o fracaso, etc.) También se usa en aplicaciones médicas (curar o no curar) y en aplicaciones militares (pegar o no pegar de un mísil). Igualmente,
3-1
Dr. Héctor Quevedo Urías
se usa para denotar el número de herramientas defectuosas producidas por una máquina, etc. La distribución binomial también se puede aplicar a la ingeniería ambiental. Como se dijo antes, los datos del proceso binomial consisten de dos resultados discretos (binarios). Por ejemplo, en un bioensayo, un organismo de prueba está, ya sea vivo o muerto, es decir, después de ser expuesto a la concentración de algún desinfectante, en función de la concentración y del tiempo de exposición. Igualmente, en el caso de una descarga de aguas residuales domésticas o industriales, ésta puede o no pueda estar dentro de los límites estipulados por las leyes ambientales. Análogmente, se puede aplicar a la ingeniería ambiental en la que una industria cumple o no cumple con las regulaciones ambientales del aire, del agua, de ruido, de contaminación de tierra, etc. También se puede aplicar a la ingeniería civil en el área de construcción, etc. Definición: Un ensayo Bernoulli es un experimento aleatorio que tiene solo dos resultados posibles, es decir, éxito o fracaso, donde la probabilidad de éxito se denota por p y el fracaso se denota por q = 1 - p. El experimento consiste de n ensayos repetidos donde los ensayos son independientes. De esta manera, si p es la probabilidad de que un evento ocurrirá, en un solo ensayo (llamado arbitrariamente éxito) y, la relación q es la probabilidad de que el evento fallará en cualquier ensayo, entonces, la distribución de probabilidad de la variable aleatoria binomial X, es igual al número de ensayos. Es decir, donde el resultado es un éxito con parámetros p y n = 1, 2, 3, …, n, esto es: P(X) = b(x;n,p) = nCx px qn-x = n!/x!(n – x)! px (1 – p)n-x
(3-1)
Donde: n = selección del tamaño de la muestra considerada como ensayos independientes
3-2
Dr. Héctor Quevedo Urías
repetidos de Bernoulli (independientes porque no importa cuantas veces se repita el experimento las probabilidades de éxito o fracaso permanecen constantes). x = 0, 1, 2, 3,…., n o sea el número exacto de éxitos posibles en n ensayos p = probabilidad de éxito nCx
= n!/x!(n – x)! = coeficiente binomial a sea el número de combinaciones de n
objetos tomados a un tiempo r q = 1 – p = probabilidad de fracaso Es de verse qué, la probabilidad de no éxito (o fracaso) es qn, por lo tanto, la probabilidad de cuando menos un éxito es 1 - qn. La distribución de probabilidad discreta Bernoulli a veces se le llama distribución binomial porque los valores de la variable aleatoria X pueden ser x = 0, 1, 2, 3,…., n que corresponden a términos sucesivos de la fórmula binomial o expansión binomial. Esto quiere decir que, la distribución binomial deriva su nombre del hecho de que los términos n + 1 en la expansión binomial de la función (q + p)n corresponde a varios valores de b(x;n,p), para x = 0, 1, 2, 3,…., n. Así, la expansión binomial es: (q + p)n = qn + nC1 qn-1 p + nC2 qn-2 p2 + .. + pn
(3-2)
Donde: nC1, nC2,…
se llaman los coeficientes binomiales
Los coeficientes binomiales se pueden estimar usando el triángulo de Pascal que se da abajo.
3-3
Dr. Héctor Quevedo Urías
Figura 3.0. Triángulo de Pascal que se usa para estimar los coeficientes binomiales. En este triángulo se nota que, el primero y el último número de cada renglón es 1. Además, cada otro número en cada ordenación puede obtenerse por medio de sumar los dos números que aparecen directamente arriba. (Elaboración propia)
3-4
Dr. Héctor Quevedo Urías
Figura 3.1. Gráficas mostrando varias distribuciones binomiales en función de p y de n. La distribución binomial es realmente una familia de distribuciones. Cada valor diferente de n o de p especifica una distribución diferente. Las figuras de arriba muestran, como la distribución binomial varía para diferentes valores de p y de n (donde p es la probabilidad de éxito y q es la probabilidad de fracaso y, donde en n repeticiones de un ensayo de Bernoulli, el número de éxitos posibles es 0, 1, 2,…, n). Sin embargo, sin importar el valor de n, la distribución binomial es simétrica cuando p = 0.5. Pero, cuando p > 0.5, la distribución es asimétrica y el pico ocurre a la derecha del centro. También, cuando p < 0.5 la distribución es asimétrica y el pico ocurre a la izquierda del centro. (Elaboración propia)
3-5
Dr. Héctor Quevedo Urías
TABLA 3.0. Tabla mostrando algunas propiedades de la distribución Binomial. (Elaboración propia) Promedio
µ = np λ = np
Varianza
σ2 = npq
Desviación estándar
npq = σ
Relación entre la distribución binomial y la distribución normal La distribución binomial se puede aproximar por la distribución normal cuando n es grande y, cuando ni p ni tampoco q están muy cercanas a cero. Esto se debe a que, el modelo binomial es inapropiado cuando n es extremadamente grande. Afortunadamente, la aproximación normal es más eficaz a medida que n aumenta. En la práctica, la aproximación de la distribución binomial usando la distribución normal es adecuada siempre y cuando np ≥ 10 y nq ≥ 10. Entonces, si np < 10 o nq < 10, la distribución binomial está demasiado sesgada, para dar aproximaciones satisfactorias, como con la curva normal que es simétrica. Para hacer las aproximaciones de la binomial usando la distribución normal es con la variable aleatoria estandarizada dada abajo. Z = (X –np) / npq
Donde: np = µ y npq = σ2
es decir o sea
Z = (X – µ) / σ σ=
(3-3)
npq
Relación entre la distribución binomial y la distribución de Poisson Con la distribución binomial, si n es grande (n ≥ 50 ensayos de Bernoulli) y si el promedio µ = np < 5 (p cercana a cero y q cercana a 1) en semejantes casos, la 3-6
Dr. Héctor Quevedo Urías
distribución binomial está muy cercana a la distribución de Poisson. Ejemplos de problemas relacionados con la distribución binomial o distribución Bernoulli Ejemplo #1. Calcular las siguientes probabilidades binomiales directamente de la fórmula, para b(x;n,p) (a) B(3;8,.6)* (b) B(5;8,.6) (c) P(3 ≤ X ≤ 5) cuando n = 8 y p = .6 (d) P(1 ≤ X) cuando n = 12 y p = .1 (e) b(x;8,0.6)* donde x = 0 *Nótese la diferencia entre el uso de la letra mayúscula B y la minúscula b Solución: (a) B(3;8,0.6) dice que queremos X = 3, n = 8, p = .6 P(X = 3) = 8!/3!(8 – 3)! (0.6)3 (1 – 0.6)8-3 = 0.124 Análogamente, usando la tabla binomial de probabilidades individuales: B(3;8,0.6) = 0.124 Igualmente, usando la fórmula da: nCx
px qn-x = 8C3 (0.6)3 (0.4)8-3 = (56)(0.216)(0.01) = 0.124
(c) P(3 ≤ X ≤ 5) = B(5;8,0.6) – B(3;8,0.6) = 0.279 – 0.124 = 0.155 Donde:
3-7
Dr. Héctor Quevedo Urías
B(5;8,0.6) = 0.279 (usando la tabla binomial de probabilidades individuales) = nCx px qn-x = 8C5 (0.6)5 (0.4)8-5 = (56)(0.078)(0.064) = 0.279 (usando la fórmula) (d) P(X ≥ 1) con n = 12 y p = 0.1. Esto dice que queremos: P(X ≥ 1) = 1 – P(X < 1) = 1 – P(X = 0) = 1 – 0.001 = 0.999 (usando la tabla de probabilidades individuales) P(X ≥ 1) = 1 – P(X = 0) = 1 - nCx px qn-x = 1 - 8C0 (0.6)0 (0.4)8-0 = 1 - (1)(1)(0.0007) = 0.9993 (usando la fórmula) Ejemplo #2. Hacer los mismos problemas del inciso #1 pero ahora usando la tabla de la distribución binomial. Comparar los resultados. El lector lo deberá hacer. Ejemplo #3. Usando la tabla de la distribución binomial estimar: (a) B(4;10,0.3) (b) B(6;10,0.7) Solución: (a) B(4;10,0.3) dice que usamos b(x;n,p), donde x = 4, n = 10 y p = 0.3. Entonces, P(X = 4) = B(4;10,0.3). Para esto, buscamos en la tabla de la distribución binomial de probabilidades individuales el valor de n = 10, π = p = .300 y x = a = 4 y nos da 0.200. Por lo tanto, P(X = 4) = B(4;10,0.3) = 0.200 Nótese que aquí también se puede usar la fórmula binomial (3-1), es decir, P(X) = b(x;n,p) = nCx px qn-x = n!/x!(n – x)! px (1 – p)n-x y da el mismo resultado.
3-8
Dr. Héctor Quevedo Urías
(b) Para este inciso se procede en forma similar. Ejemplo #4. Una moneda honesta se lanza 6 veces (que es lo mismo que lanzar seis monedas a la vez). Llamemos las caras un éxito. Calcular las siguientes probabilidades: (a) La probabilidad de que salgan exactamente 2 caras (b) La probabilidad de que salgan cuando menos 4 caras (c) La probabilidad de no caras, es decir, todos fracasos Solución: (a) Aquí usamos la fórmula de la distribución binomial: P(X) = b(x;n,p) = nCx px qn-x Donde: nCx
= coeficiente binomial = n! / x!(n - x)!
n = número de ensayos p = probabilidad de que el evento ocurra en un solo ensayo q = 1 – p = probabilidad de que el evento falle (fracaso) x = la probabilidad de que el evento ocurra en 0, 1, 2, …, n número de éxitos posibles Nótese que la probabilidad de no éxitos es qn, por lo tanto, la probabilidad de cuando menos un éxito es 1 - qn Aquí n = 6, p = 0.5, q = 1 - 0.5 = 0.5. Entonces, la probabilidad de que salgan exactamente 2 caras es: P(X = 2) = B(2;6,0.5) = 6C2 (0.5)2 (0.5)6-2 = 15/64 (b) La probabilidad de que salgan cuando menos 4 caras (X ≥ 4) es: P(X = 4 o 5 o 6) = B(4;6,0.5) + B(5;6,0.5) + B(6;6,0.5) = 6C4(0.5)4 (0.5)6-4 + 6C5 (0.5)5 (0.5)6-5 + 6C6 (0.5)6 (0.5)6-6
3-9
Dr. Héctor Quevedo Urías
= 11/32 Ejemplo #5. En un estudio de toxicología, la probabilidad de que un enfermo se recupere de una intoxicación es de 0.4. Si se sabe que una muestra de 15 personas se ha intoxicado, calcular las siguientes probabilidades: (a) La probabilidad de cuando menos 10 personas sobrevivan. (b) La probabilidad de que de 3 a 8 personas (inclusivamente) intoxicadas sobrevivan. (c) La probabilidad de que exactamente 5 personas intoxicadas sobrevivan. Solución: (a) Dejemos que X sea el número de intoxicados que sobrevivan. Aquí, el término “cuando menos 10” significa que el valor de la variable aleatoria es X ≥ 10. También sabemos que la muestra es n = 15. Aquí, pudiéramos usar la expresión binomial b(x;n,p) = nCx px qn-x y sustituir los valores de x = 10, 11, 12, 13, 14, 15 en la fórmula de abajo, y luego sumar todos los resultados usando la expresión de abajo. b(x;15,0.4) = 15Cx (0.4)x (0.6)15-x Sin embargo, este procedimiento sería muy largo y tedioso. Siendo así, esto se simplifica mucho si tomamos el complemento de la probabilidad de 1 (acordándose de que la probabilidad no puede ser mayor que 1 o negativa) y usando la tabla de la distribución binomial. P(X ≥ 10) = 1 – P(X < 10). Esto dice que x = 0, 1, 2, 3,….., 9 9
= 1 - ∑ b(x;15,0.4) = 1 – 0.9662 x=0
= 0.0338 (usando la tabla de la distribución binomial) El valor de 0.9662 se saca de la tabla binomial, buscando el valor de n = 15, x = 9
3-10
Dr. Héctor Quevedo Urías
y p = 0.4. Esto se lee como 0.9662. (b) Este problema dice que, la probabilidad de que se recuperen entre 3 y 8 intoxicados, inclusivamente, es lo mismo que decir, P(3 ≤ X ≤ 8). Esto quiere decir que los valores de la variable aleatoria son x = 3, 4, 5, 6, 7, 8. Nuevamente, si no usamos la tabla binomial, el procedimiento es muy largo. Por esto vamos a razonar como sigue: 8
2
x=0
x=0
P(3 ≤ X ≤ 8) = ∑ b(x;15,0.4) - ∑ b(x;15,0.4) = P(X ≤ 8) – P(X ≤ 2) = 0.9050 – 0.0271 = 0.8779 (usando la tabla de la distribución binomial) (c) La probabilidad de que exactamente 5 intoxicados sobrevivan es de x = 5, n = 15, p = 0.4. Esto se puede hacer de tres maneras: usando la tabla de las probabilidades individuales (la forma más sencilla) o la tabla acumulada o, bien, la fórmula. Usando la tabla binomial individual, buscamos el valor de n = 15 con p = 0.4 y con x = 5 y da 0.186. 5
4
x=0
x=0
P(X = 5) = B(5;15,0.4) = ∑ b(x;15,0.4) - ∑ b(x;15,0.4) = 0.4032 – 0.2173 = 0.1859 Si usamos la fórmula sería largo y tedioso, como se ve abajo. P(X = 5) = B(5;15,0.4) = 15C5 (0.4)5 (0.6)15-5 = 15!/5!(15-5)! (0.0041)(0.6)10 = 0.1859 Ejemplo #6. Si el 20% de los tornillos producidos por una máquina son
3-11
Dr. Héctor Quevedo Urías
defectuosos, determinar la probabilidad que de 4 tornillos seleccionados aleatoriamente: (a) Uno estará defectuoso (b) Ninguno estará defectuoso (c) A lo más 2 estarán defectuosos (d) Cuando menos uno estará defectuoso Solución: (a) Aquí, x = 1, n = 4, p = 0.20, q = 0.80 P(X = 1) = 4C1 (0.2)1 (0.8)4-1 = 0.4096 (b) P(X = 0) = 4C0 (0.2)0 (0.8)4-0 = 0.4096 (c) Aquí, el término “a lo más 2” significa X ≤ 2, lo cual quiere decir que queremos encontrar P(X = 0 o 1 o 2). Entonces: P(X ≤ 2) = P(0) + P(1) + P(2) = 0.4096 + 0.4096 + 0.1536 (de la tabla de probabilidades binomiales individuales) = 0.9728 Aquí, también se puede usar P(X ≤ 2) = .974 (de la tabla acumulada) (d) El término “cuando menos 1” significa X ≥ 1, lo cual quiere decir que x = 1, 2, 3, 4. Entonces queremos calcular P(3) y P(4) porque ya calculamos P(1) y P(2). Otro razonamiento sería el de calcular la probabilidad de que X = 4, menos la probabilidad de X = 0. Para esto, usamos la tabla binomial acumulada buscando n = 4, p = 0.2 y X = 4 y le restamos n = 4, p = 0.2 y X = 0. Es decir: P(X = 4) – P(X = 0) = P(X ≤ 4) – P(X ≤ 0) = 1 – 0.41
3-12
Dr. Héctor Quevedo Urías
= 0.59 Ejemplos aplicados a la ingeniería ambiental Ejemplo #7. Supóngase que el 40% de los ríos de cierta región industrial de México están contaminados con benceno. Si tomamos una muestra aleatoria de tamaño n = 30, calcular lo siguiente: (a) Exactamente 15 ríos estarán contaminados con benceno (b) Cuando menos 15 ríos estarán contaminados con este compuesto orgánico cancerígeno, de una muestra de n = 25. (c) No más de 10 ríos, pero cuando menos de 5 ríos estarán contaminados de una muestra aleatoria de n = 25. Solución: Usamos la distribución binomial, porque son dos eventos mutuos excluyentes o binarios, es decir, están o no están contaminados los ríos. Entonces, llamemos arbitrariamente, un éxito encontrar un río contaminado y, un fracaso, no encontrar un río contaminado. Se usa la fórmula binomial expresada como: b(x;n,p) = nCx px (1 – p)n-x = n! / (n – x)! px qn-x (a) Aquí, n = 30, x = 15, p = 0.40, q = 0.60. La muestra de 30 se puede interpretar como 30 ensayos repetidos de Bernoulli. Ahora, sustituyendo los valores en la fórmula de arriba da: B(15;30,0.40) = P(X = 15) = 30! / (30 – 15)! (0.4)15(0.6)30-15 = 0.073 También se pudiera usar la tabla de la distribución binomial de densidad de probabilidad o de probabilidades individuales, que son más precisas y más fáciles de usar que la fórmula. Siendo así, con n = 30 y p = 0.4:
3-13
Dr. Héctor Quevedo Urías
P(X = 15)= 0.0783 ≈ 0.08 El valor de 0.078 ≈ 0.08 dice que hay cerca de 8 posibilidades entre 100 de seleccionar una muestra de 30 ríos que estén contaminados con benceno. Aquí se ve que, a medida que aumenta n, la probabilidad de éxito también aumenta. (b) Cuando menos 15 indica X ≥ 15 y n = 25, p = 0.4 y q = 0.60 Aquí el espacio muestral es de: x = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, ……, 24, es decir, de 25 ensayos de Bernoulli. B(15;25,0.4) = P(X ≥ 15) = 1 – P(X < 15) = 1 – P(X ≤ 14) 14
= 1 - ∑ B(14;25,0.4) = 1 - .966 = 0.034 x=0
(c) Aquí, P(5 ≤ X ≤ 10) = P(X ≤ 10) – P(X ≤ 4) Ejemplo #8. En un estudio de laboratorio bacteriológico de aguas se afirma que, el 3.0% de las tomas domiciliarias contienen la bacteria E. Coli, en concentraciones arriba del límite estipulado por las leyes ambientales. Si esta afirmación es correcta, encontrar la probabilidad de que, el número de bacterias E. coli, en una muestra aleatoria de 25 tomas domiciliarias, se encontrará: (a) Ninguna bacteria (b) Cuando menos 1 bacteria (c) Entre 1 y 5 incluso (d) Más de 5 bacterias (e) Más de 5, pero menos de 10 bacterias Solución: Usamos la distribución binomial, porque son dos eventos mutuos excluyentes o binarios; se contiene la bacteria (llamándola éxito arbitrariamente) o no se contiene
3-14
Dr. Héctor Quevedo Urías
la bacteria (fracaso). (a) Aquí, n = 25, p = .03, q = .97, X = 0 El tamaño de muestra n = 25 indica que son 25 ensayos repetidos de Bernoulli, es decir, que los posibles valores de la variable aleatoria X son de x = 0, 1, 2, 3, 4,……., 24. Entonces, (b) Cuando menos 1 bacteria indica X ≥ 1 y se expresa como: P(X ≥ 1) = 1 – P(X = 0) = 1 – P(X < 1) = 1 – 0.4670 = 0.533 (c) Entre 1 y 5 incluso se expresa como: 5
P(1 ≤ X ≤ 5) = ∑ B(5;25,0.03) – P(X < 1) = 0.9999 – 0.467 = .533 x=0
Ejemplo #9. En un río adyacente a una zona industrial, la probabilidad de cada muestra de agua sacada del río exceda el límite de cromo de 10 mg/L, es de 0.10. Si se supone qué, las muestras de agua son independientes con respecto a la presencia de cromo, entonces: (a) Encontrar la probabilidad de que en una muestra de tamaño n = 18, exactamente, 2 excedan el límite de 10 mg/L de cromo. (b) Encontrar la probabilidad de que al menos 4 muestras excedan el límite. (c) Encontrar la probabilidad de que cuando menos 3 muestras, pero menos de 7 excedan el límite estipulado. (d) Encontrar la probabilidad de que más de 3 muestras, pero menos de 7 excedan el límite estipulado de cromo. Solución: (a) Dejemos que X = número de muestras de agua que excedan el límite estipulado
3-15
Dr. Héctor Quevedo Urías
de 10 mg/L del total de las 18 observaciones. Entonces, X es una variable aleatoria binomial con p = 0.1 y n = 18. Por consiguiente, usando la fórmula binomial b(x;n,p) = nCx px qn-x y sustituyendo los valores correspondientes da: B(2;18,0.1) = P(X = 2) = 18! / 2!(18 – 2)! (0.1)2 (0.9)18-2 = (153)(0.01)(0.1853) = 0.284 (b) P(X ≥ 4) = 18Cx (0.1) x (0.9)18-x Usando este enfoque, tendríamos que sustituir los valores de x = 4, 5, 6, 7,……, 18 en la fórmula de arriba y luego sumarlos. También pudiéramos usar la tabla binomial de probabilidades individuales o de probabilidad de función de masa o función acumulada y, luego, sumar los resultados. (¿Cuál es la diferencia en usar la tabla acumulada y la individual?). De cualquier manera, es mucho más fácil usar el evento complementario, ya sea usando la expresión de abajo o bien, la tabla binomial. P(X ≥ 4) = 1 – P(X < 4) = 1 – P(X ≤ 3) 3
= 1 - ∑ 18Cx (0.1)x (0.9)18-x x=0
= 1 – (0.15 + 0.30 + 0.284 + 0.168) = 1 – 0.902 = 0.098 Ahora, si usamos la tabla binomial acumulada, buscamos el valor de n = 18, con X = 3 y p = 0.1, para sacar el factor P(X < 4) y da .902. Por lo tanto, P(X ≥ 4) = 1 - .902 = 0.098 (c) Aquí estamos buscando P(3 ≤ X < 7). Esto nos lleva a: 6
P(3 ≤ X < 7) = ∑ 18Cx (0.1)x (0.9)18-x x=3
3-16
Dr. Héctor Quevedo Urías
= 0.168 + 0.07 + 0.022 + 0.005 = 0.265 Otro razonamiento sería como sigue: x = 0, 1, 2, 3, 4, 5, 6…,18 P(X ≤ 6) – P(X ≤ 3), es decir, para los valores de X = 3, 4, 5, 6 Aquí, nuevamente, podemos usar la tabla binomial de probabilidades individuales y sumar las cuatro probabilidades de x = 3, 4, 5, 6. También se puede usar la tabla binomial acumulada, es decir, buscando n = 18, p = 0.1, y X = 6 y, luego, restándole el valor de X = 3. 6
(d) P(3 < X < 7) = ∑ 18Cx (0.1)x (0.9)18-x x=4
Ejemplo #10. En una investigación de contaminación ambiental se estudiaron cientos de industrias. Sea X el número de industrias que no cumplen con las regulaciones ambientales del aire y del agua de una muestra al azar de 10 industrias. Si se sabe que el valor de la probabilidad es de p = 0.5, calcular las siguientes probabilidades. (a) La probabilidad de que, exactamente, 5 industrias cumplan con los límites ambientales. (b) La probabilidad de que no más de 2, cumplan con el reglamento. (c) La probabilidad de que cuando menos 9, lo cumplan. (d) La probabilidad de que menos de 5 industrias cumplan, pero cuando menos 3 si lo cumplan. Solución: (a) P(X = 5) = B(5;10,0.5) = 0.246 (usando la tabla binomial) (b) P(X ≤ 2) = 0.055 (usando la tabla binomial)
3-17
Dr. Héctor Quevedo Urías
(c) P(X ≥ 9) = 1 - .989 = 0.011 (d) P(3 ≤ X < 5) = P(4) + P(3) = .205 + 0.117 = .322 (de la tabla binomial individual) Ejemplo #11. Este problema ilustra el uso de la distribución binomial y su aproximación con la distribución normal. Resulta qué, la distribución normal, con µ = np y σ2 = npq proporciona una buena aproximación a la binomial cuando n → ∞ y, cuando p se aproxima a 0 o a 1. Así, supóngase que n = 15, p = 0.4 y queremos encontrar P(X = 4). Para esto usar la distribución binomial y la distribución normal como una aproximación a esta última. Comparar los resultados. Solución: Usando la distribución binomial estimamos el promedio, es decir, µ = np = (15)(0.4) = 6 y la varianza, σ2 = npq = (15)(0.4)(0.6) = 3.6, la cual da una desviación estándar de σ = 1.897. Enseguida, usando la distribución binomial acumulada da: b(x;n,p) = P(X = 4) = B(4;15,0.4) - B(3;15,0.4) = P(X ≤ 4) – P(X ≤ 3) = .217 - .091 = .126 Que es lo mismo que usar la fórmula o la distribución de probabilidades individuales, es decir: P(X = 4) = 15C4 (0.4)4 (0.6)15-4 = 0.1258 Aquí, se ve qué, usando la tabla binomial de probabilidades individuales se lee directamente con n = 15 y p = 0.4 y da 0.126 Ahora bien, usando la distribución normal, como una aproximación, usamos la
3-18
Dr. Héctor Quevedo Urías
variable aleatoria normal estándar poblacional Z, es decir: Z = (X – µ) / σ y su estimador muestral z = (X – X ) / s Sin embargo, la variable aleatoria discreta de X = 4, en forma de variable aleatoria continua, está entre 3.5 y 4.5. Además, con µ = 6 y σ = 1.897 hacemos la transformación usando la variable aleatoria normal estándar Z. Z3.5 = (3.5 – 6) / 1.897 = - 1.32 Z4.5 = (4.5 – 6) / 1.897 = - 0.79 De manera que, P(X = 4) = P(-1.32 < Z < -0.79) = 0.2148 – 0.0934 (de la tabla de z) = 0.1214 Finalmente, el valor de 0.1214 está bastante de acuerdo con el valor de 0.1258 obtenido con la distribución binomial. Ejemplo #12. Supóngase que se tiene una muestra de 20 casos de mediciones de análisis de demanda bioquímica de oxígeno (DBO5) provenientes de un muestreo de un río, procedentes de 20 lugares diferentes a lo largo de su trayectoria. Si se sabe que, la probabilidad de que la concentración de la demanda bioquímica de oxígeno de 5 (DBO5) días está dentro de los límites estipulados por las leyes ambientales es de p = 0.6 (éxito), hacer los siguientes cálculos: (a)
Calcular
el
promedio
y
la
desviación
estándar
de
la
variable
aleatoria X binomial. (b) Usando la distribución binomial calcular la probabilidad de que exactamente 10 casos de DBO estén dentro del límite estipulado. (c) Hacer los mismo que en el inciso (b) pero usando la distribución normal. (d) Hacer una tabla de los valores de la variable aleatoria X correspondientes a x = 0, 1, 2, 3, 4,…,19 en función de n = 20 y p = 0.6 usando la fórmula y la tabla
3-19
Dr. Héctor Quevedo Urías
binomial. Calcular también la probabilidad acumulada. (e) Hacer un histograma de probabilidades binomiales para el tamaño de la muestra n = 20 y p = 0.6 con una curva normal sobrepuesta. (f) Calcular P(X ≤ 5), P(X ≥ 12) y P(X ≤ 12) usando, ambas la distribución binomial y la distribución normal como aproximación a esta última. Solución: (a) El promedio, la varianza y la desviación estándar binomiales son: Promedio = µ = np = (20)(0.6) = 12 Varianza = σ2 = npq = µ(0.4) = 4.8 Desviación estándar = σ = √σ2 = 2.19 (b) Aquí, la aproximación de la distribución binomial a la distribución normal es buena, porque np = (20)(0.6) ≥ 10 y nq = (20)(0.4) ≥ 10. Para calcular la probabilidad de qué, exactamente, 10 casos estén dentro de las normas estipuladas se hace usando la distribución binomial con los valores n = 20, p = 0.6 y q = 1 – p = 1 – 0.6 = 0.4. Ahora, sustituyendo los valores en la fórmula binomial nos da: b(x;n,p) = nCx px qn-x para x = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10……, 19 B(10;20,0.6) = 20C10 (0.60)10 (0.4)20-10 = 0.1162 Sin embargo, usando la tabla binomial de probabilidades acumuladas nos da la probabilidad individual: P(X = 10) = .2447 - .1275 = .1172 También, usando la tabla binomial de probabilidades de función de masa con n = 20, π = .600 y a = 10 da un valor de 0.117. Como se ve arriba, el uso de la fórmula binomial es largo y tedioso. Sin embargo, si usamos la tabla de las probabilidades binomiales individuales o de
3-20
Dr. Héctor Quevedo Urías
función de masa o, bien, la tabla de probabilidades acumuladas, los cálculos se simplifican de sobremanera. (c) Ahora, usando la distribución normal con variables aleatorias continuas, nos da: (9.5 ≤ X ≤ 10.5) o sea P(-1.14 ≤ Z ≤ -.68). Esto se calcula usando la variable aleatoria estandarizada Z, es decir, Z = (X – µ) / σ donde X = 9.5 y 10.5, µ = 12, s = σ = 2.19 Z9.5 = (9.5 – 12) / 2.19 = - 1.14 Z10.5 = (10.5 – 12) / 2.19 = - 0.68 Enseguida, usando la tabla de la distribución normal razonamos como: P(-1.14 ≤ Z ≤ -.68) = P(Z = -.68) – P(Z = -1.14) = (0.2483 – 0.1271) = .1212 Al comparar los dos resultados vemos que la distribución binomial da 0.1172 y la distribución normal da 0.1212. Esta aproximación sería mejor a medida que n fuera más grande. (d) Para hacer una tabla con todas las probabilidades correspondientes a x = 0, 1, 2, 3, 4,…, 19. (Ver TABLA 3.1 de abajo).
3-21
Dr. Héctor Quevedo Urías
TABLA 3.1. Tabla mostrando las probabilidades individuales y acumuladas con n igual a 20 y p igual a 0.6. (Elaboración propia) Valor de la variable
P(X) individual
P(X) acumulada
aleatoria X 0
0.000
0.000
1
0.000
0.000
2
0.000
0.000
3
0.000
0.000
4
0.000
0.000
5
0.002
0.002
6
0.004
0.006
7
0.015
0.021
8
0.036
0.057
9
0.071
0.128
10
0.117
0.245
11
0.159
0.404
0.180
0.584*
14
0.124
0.974
15
0.075
0.949
16
0.035
0.984
18
0.003
0.999
20
0.000
1.000
X = µ = 12 (promedio)
El asterisco (*) señala la localización del promedio. (e) Para este inciso la Figura 3.2 e abajo muestra un histograma de probabilidad
3-22
Dr. Héctor Quevedo Urías
binomial para n = 20, p = 0.6, µ = 12 y σ = 2.19, con curva normal de aproximación sobrepuesta. Aquí, se ve que, aun cuando el histograma de probabilidad está un poco sesgado hacia la izquierda, porque p > .6. La curva normal da muy buena aproximación a la binomial.
Figura 3.2. Gráfica mostrando un histograma de probabilidad binomial para n = 20, p = 0.6, µ = 12 y σ = 2.19, con curva normal de aproximación sobrepuesta. Aquí, se ve claramente, qué, aun cuando el histograma de probabilidad está un poco sesgado hacia la izquierda, (porque p > .6), la curva normal da muy buena aproximación a la binomial. (Elaboración propia) (f) Para calcular los valores de abajo usando la distribución binomial y la normal, se procede como: 1. P(X ≤ 5) 2. P(X ≥ 12) 3. P(X ≤ 12) Usando la tabla de la distribución binomial con n = 20, p = 0.6 y q = 0.4 da los siguientes resultados.
3-23
Dr. Héctor Quevedo Urías
Para: P(X ≤ 5) = .002 Para: P(X ≥ 12) = 1 – P(X < 12) = 1 - .404 = .596 Nota: Para P(X ≥ 12) ¿porqué el valor obtenido no se aproximó a .5? Para contestar esta pregunta refiérase a la Figura 3.2 de arriba. Para: P(X ≤ 12) = 1 – P(X > 12) = .596 Ahora, para calcular los valores de arriba usando la distribución normal, como una aproximación a la binomial, para cada uno de las preguntas P(X ≤ 5), P(X ≥ 12) y P(X ≤ 12) necesitamos convertir las variable aleatorias discretas a las variables aleatorias normales Z usando la variable aleatoria estandarizada Z con µ = 12 y σ = 2.19 y luego buscar el valor de Z en la tabla de la distribución normal y calcular la probabilidad correspondiente. Usando la función Z = (X – µ)/σ y estandarizando nos da: Z5 = (5 – 12)/2.19 = - 3.197 Ahora usando la tabla de la distribución normal buscamos z = -3.197 y da .0007, o sea ≈ .001. Similarmente, con P(X ≥ 12) convertimos X = 12 a valores de Z con µ = 12 y σ = 2.19 y da: Z = (12 – 12)/2.19 = 0 Que corresponde a una probabilidad de .5000. La misma situación ocurriría con P(X ≤ 12)…… (Que también se puede leer de la gráfica). Ejemplo #13. Si en la fabricación de accesorios para un sistema de control de partículas (ciclón) se asocia con un proceso Bernoulli, con un promedio de partes defectuosas de 0.20, estimar la probabilidad: (a) De no encontrar partes defectuosas del sistema de control de una muestra
3-24
Dr. Héctor Quevedo Urías
aleatoria de 10 partes. (b) De no encontrar partes defectuosas de los ciclones fabricados de una muestra de 20 partes. Solución: (a) Usando la fórmula binomial: b(x;n,p) = nCx px qn-x y sustituyendo X = 0, p = 0.2 y q = 0.8 nos da: P(X = 0) = B(0;10,0.2) = 10C0 (0.2)0 (0.8)10-0 = 0.107 Este resultado también se puede obtener usando la tabla binomial de probabilidades individuales o de función de masa, es decir, buscando n = 10, p = 0.2 y X = 0. (b) Nuevamente usando la fórmula binomial y sustituyendo da: P(X = 0) = B(0;20,0.2)= 20C0 (0.2)0 (0.8)20-0 = (1)(1)(0.012) = 0.012 Análogamente, este mismo resultado se puede obtener usando la tabla binomial acumulada buscando n = 20, p = 0.2 y X = 0 y da 0.012. Aquí, nótese que también se obtiene el mismo resultado usando la tabla binomial de probabilidades individuales. Ejemplo #14. Si tenemos una muestra aleatoria de n = 20 (peces) para varios valores de p, podemos estimar la probabilidad de X muertes de los organismos sometiéndolos a ciertas concentraciones tóxicas provenientes de una descarga industrial de un río. Para esto hacer los siguientes cálculos: (a) Calcular el promedio µ y la desviación estándar σ, de la muerte de los peces, si el valor de p = 0.05 (b) La probabilidad de que muera a lo más 1 organismo
3-25
Dr. Héctor Quevedo Urías
(c) La probabilidad de que no muera ningún organismo (d) La probabilidad de que mueran cuando menos 3 organismos (e) La probabilidad de P(X = 10) Solución: (a) Promedio = X = µ = np = (20)(.05) = 1.0. Desviación estándar = σ = npq = (1.0)(.95) = .95 (b) P(X ≤ 1) = .736 (c) P(X = 0) = .358 (d) P(X ≥ 3) = 1 - P(X < 3) = 1 - .9245 = .0755 (e) P(X = 10) = 1.0 Ejemplo #15. La posibilidad de que una muestra de aire contenga un microorganismo letal es de 10%. Suponiendo que las muestras son independientes, con respecto a la presencia del microorganismo, encontrar la probabilidad de que: (a) En las 18 siguientes, exactamente 2 contengan el germen. (b) Al menos 4 muestras contengan el germen. (c) La probabilidad de que menos de 7 muestras de aire contengan el germen, pero cuando menos 3 muestras también lo tengan, e.g., P(3 ≤ X < 7). Solución: (a) Sea X el número de muestras de aire que contengan el germen patógeno en las 18 muestras siguientes analizadas. Entonces, X es una variable aleatoria binomial, con p = 0.1 y n = 18. Por consiguiente: P(X = 2) = B(2;18,0.1) = 18C2 (0.1)2 (0.9)16 = 0.284 18
(b) P(X ≥ 4) = Σ 18Cx (0.1)x (0.9)18-x, donde 18Cx = 18!/x!(18 – x)! x=0
Aquí, sin embargo, es más fácil usar el evento complementario.
3-26
Dr. Héctor Quevedo Urías
P(X ≥ 4) = 1 – P(X < 4) 3
= 1 – Σ 18CX (0.1)x (0.9)18-x x=0
= 1 – (0.15 + 0.300 + 0.284 + 0.168) = 0.098 6
(c) P(3 ≤ X < 7) = Σ 18Cx (0.1)x (0.9)18-x x=3
= 0.168 + 0.07 + 0.022 + 0.005 = 0.265 También, P(X ≤ 6) – P(X ≤ 2) = .9983 - .7338 = .2645 Ejemplo #16. En un estudio de higiene industrial y seguridad llevado a cabo en muchas maquiladoras industriales, supóngase que hay una población grande de tomadores de licor y otra población de abstemios. En este caso, la probabilidad de éxito o de tomadores se asume que es p igual a 0.4 y, la probabilidad de abstemios (probabilidad de fracaso) es de q igual a 0.6. Si sacamos una muestra al azar de n = 10 operadores de la maquiladora, entonces, el número de la variable aleatoria de X tomadores de licor es de x = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, siendo así: (a) Preparar una tabla mostrando las probabilidades individuales y valores de X. (b) Preparar una gráfica en función de probabilidades binomiales individuales en la ordenada y de x en la abscisa, donde las barras indiquen la probabilidad de función de masa P(X = x). (c) Calcular el promedio y la varianza de esta distribución. (d) De la gráfica leer todas las probabilidades P(X = x). (e) Estimar P(X = 4) e interpretar el resultado
3-27
Dr. Héctor Quevedo Urías
Solución: (a) La tabla de probabilidades individuales, con n = 10 y p = 0.4 se da en la TABLA 3.2 de abajo. Esto se hace con el programa Minitab. El procedimiento para generar las probabilidades de función de masa P(X=x) es: Calc → Probability distributions → Binomial En la ventana de “Binomial Distribution” puntear “Probability” e introducir el número de ensayos (10) y la probabilidad de éxito (0.4). Además, puntear “Input column”, introducir los valores de X, y en la ventanilla de “Optional storage” poner P(X=x) y luego OK. Todas estas ordenes generan la los valores de la TABLA 3.2. TABLA 3.2. Tabla mostrando las probabilidades binomiales individuales vs. valores de X. __________________________________ P(X=x) Variable aleatoria X __________________________________ 0.006047 0 0.040311 1 0.120932 2 0.214991 3 0.250823 4 0.200658 5 0.111477 6 0.042467 7 0.010617 8 0.001573 9 0.000105 10 _________________________________ (b) Para hacer la gráfica de P(X=x) vs. valores de X usar el programa Minitab y proceder de la siguiente manera: Irse a: Graph → Scatterplot. En la ventana de “Scatterplot” que aparece, irse a “With Connect Line” e introducir los valores de P(X=x) y valores de la variable aleatoria X. En la ventana de “Scatterplot Data
3-28
Dr. Héctor Quevedo Urías
View” puntear “Symbols” y “Project Lines” y OK. Esto genera la gráfica de las probabilidades binomiales de función de masa P(X=x), en función de los valores de la variable X mostrada abajo. Siendo así, analizar la configuración de los resultados de la grafica y decir si es oblicua a la derecha o a la izquierda y explicar porque ocurre de esa manera. La gráfica se muestra abajo.
Grafica de P(X=x) vs. variable aleatoria X
P(X=x)
0
2
4
6
8
10
0.25
0.25
0.20
0.20
0.15
0.15
0.10
0.10
0.05
0.05
0.00
0.00 0
2
4 6 Variable aleatoria X
8
10
Figura 3.3. Gráfica mostrando P(X = x) en función de X. Aquí, debido a que p = 0.4 < 0.5, la distribución es oblicua hacia la derecha. (Elaboración propia) (c) El promedio µ, la varianza σ2 y la desviación estándar σ de esta distribución son: µ = np = (10)(0.4) = 4.0, σ2 = npq = (10)(0.4)(0.6) = 2.4, σ = √2.4 = 1.555 (d) De la Figura 3.3 se pueden leer todas las probabilidades P(X = x) mostradas en la TABLA 3.3 y también usando la TABLA 3.2.
3-29
Dr. Héctor Quevedo Urías
TABLA 3.3. Tabla mostrando los valores de la variable aleatoria X para este problema. (Elaboración propia) P(X = 0) = 0.0060 P(X = 1) = 0.0403 P(X = 2) = 0.1209 P(X = 3) = 0.2150 P(X = 4) = 0.2508 P(X = 5) = 0.2006
P(X = 6) = 0.1115 P(X = 7) = 0.0425 P(X = 8) = 0.0106 P(X = 9) = 0.9916 P(X = 10) = 0.0001
(e) P(X = 4) = 0.2508 dice qué, si seleccionáramos 100 muestras de tamaño n = 10, de una población de operadores de la industria maquiladora esperaríamos que 25 de estas muestras tendrían un valor de X = 4 tomadores de licor. Ejemplo #17. La paraestatal PEMEX de México se avocó a hacer perforaciones en el sureste de Tabasco. Para ver la factibilidad financiera de que fuera conveniente hacer las perforaciones, PEMEX contrató los servicios de una firma de estudios estadísticos. Se sabe que, cada pozo perforado se clasifica como productivo o no productivo. La experiencia de PEMEX es que, en este tipo de exploraciones, se sabe por experiencia que, el 15% de los pozos perforados son productivos. Para las exploraciones petroleras se seleccionaron aleatoriamente 12 sitios. Con esta información en mente, hacer los siguientes cálculos. (a) ¿Cuál es la probabilidad de que los 12 pozos que se perforen en cada uno de los 12 sitios, sean productivos? (b) ¿Cuál es la probabilidad de que ningún pozo perforado sea productivo? (c) ¿Cuál es la probabilidad de que exactamente un pozo sea productivo? (d) Para hacer rentable al país, cuando menos tres de los pozos de exploración deben ser productivos. Siendo así, ¿Cuál es la probabilidad de que el negocio sea rentable?
3-30
Dr. Héctor Quevedo Urías
Sugerencia: Usar P(X = 12), P(X = 0), P(X = 1), P(X ≥ 3), etc. Distribución Hipergeométrica La función hipergeométrica es una distribución discreta de probabilidad, la cual está estrechamente ligada a la distribución binomial. La manera más simple de ver la diferencia entre las dos distribuciones radica en la forma que se hace el muestreo. La diferencia entre estas dos distribuciones es que, en la distribución binomial, los intentos son independientes, porque hay reemplazo en la selección de la muestra. Sin embargo, en el caso de la distribución hipergeométrica, hay dependencia, porque la selección de la muestra se hace sin reemplazo y la probabilidad de éxito cambia de un intento a otro. El modelo hipergeométrico es apropiado, cuando el muestreo es sin reemplazo de una población finita y, cuando se requiere la probabilidad de un número específico de éxitos y/o fracasos. Suposiciones y propiedades de la distribución hipergeométrica 1. Una muestra aleatoria de tamaño n se selecciona sin reemplazo de N ítems. 2. k de los N ítems pueden ser clasificados como éxitos y, N – k es clasificado como fracasos. 3. La población o conjunto de la muestra consiste de N individuos, objetos o elementos (una población finita). 4. Cada individuo puede ser caracterizado como un éxito o un fracaso y hay k éxitos en la población. 5. Una muestra de n individuos se selecciona sin reemplazo (hay dependencia, en contraste con la binomial en la que hay independencia) en forma aleatoria. Definición de la distribución hipergeométrica En la distribución de probabilidad de una variable aleatoria hipergeométrica X, el
3-31
Dr. Héctor Quevedo Urías
número de éxitos en una muestra aleatoria de tamaño n, seleccionada de N ítems, de los cuales k se llaman éxitos y N – k se llaman fracasos es: kCx N-kCn-x
h(X;N,n,k) = ───────── NCn
x = 0, 1, 2, 3,..., n
(3-4)
Donde: k
=
éxitos
en
n
intentos,
es
decir,
la
cantidad
de
elementos
identificados como éxito en la población N – k = fracasos n = tamaño de la muestra aleatoria o cantidad de elementos en la población N = número de ítems (tamaño de la población) Donde x no puede exceder de k y (n – x) no puede exceder de (N – k) Observaciones: NCn
Representa la cantidad de formas en las que se puede seleccionar una muestra de tamaño n de una población de de tamaño N
kCx
Representa la cantidad de maneras en las que se puede seleccionar x éxitos de un total de k éxitos de la población
N-kCn-x
Representa la cantidad de maneras en las que se puede
seleccionar n – x fracasos de un total de N – k fracasos en la población Aplicaciones de la distribución hipergeométrica Las aplicaciones de esta distribución se encuentran en las pruebas electrónicas; aseguranza de calidad; selección de diamantes industriales, algunos de los cuales
3-32
Dr. Héctor Quevedo Urías
son de calidad superior a los otros; en problemas de muestreos de declaraciones de impuestos sobre ingresos, donde k entre N declaraciones archivadas contienen deducciones cuestionables. Igualmene, la distribución hipergeometrica tiene las mismas aplicaciones a la ingeniería ambiental, que con la binomial, con la diferencia que con la hipergeométrica el muestreo es sin reemplazo. Características de la distribución hipergeométrica Si n es relativamente pequeño con respecto a N, la probabilidad para cada intento cambia ligeramente, lo que indica que se tiene un experimento binomial. Esta situación puede aproximarse a la distribución hipergeométrica usando la distribución binomial con p = k/N. Además, el promedio y la varianza de la distribución hipergeométrica se pueden aproximar mediante las fórmulas: µ = np = nk/N σ2 = npq = n(k/N)(1 – k/N)
(3-5) (3.6)
Relación entre la distribución hipergeométrica y la distribución binomial Hay una relación interesante entre la distribución binomial y la distribución hipergeométrica. Como se dijo antes, si n es pequeña comparada con N, la naturaleza de N ítems cambia muy poquito en cada muestreo. Por lo tanto, la cantidad k/N juega el papel del parámetro p de la distribución binomial. Como resultado, la distribución binomial puede ser vista como una edición poblacional grande de la distribución hipergeométrica. Así, cuando hay un experimento hipergeométrico, en el cual no se da el valor de k directamente, pero si con valores dados de N y de la probabilidad p (o en términos de porcentaje), el valor de k se puede calcular usando la relacion p = k/N.
3-33
Dr. Héctor Quevedo Urías
Ejemplos usando la distribución hipergeométrica Ejemplo #18. Un comité de tamaño 5 es seleccionado aleatoriamente, de 3 Químicos y 5 Físicos. Encontrar la distribución de probabilidad para el número de Químicos en el comité. Hacer una gráfica o histograma que vaya en función de la variable aleatoria X y de P(X). Solución: Aquí, N = 8, n = 5, k = 3. Se usa la fórmula (3-4) de la distribución hipergeométrica: kCx N-kCn-x
h(x;N,n,k) = ───────── NCn
x = 0,1,2,3….,n
Sustituyendo los valores en la fórmula de arriba nos da la forma bsica lista para sustituir los valores de la variable aleatoria X. 3Cx
8-3C5-x
h(x;8,5,3)= ───────── 8C3 Por lo tanto, del espacio muestral x = 0, 1, 2, 3, 4 y sustituyendo estos valores en la expresión de arriba da los siguientes enunciados: P(X = 0) = h(0;8,5,3) = 3C0 • 5C5 / 8C5 = (1)(1)/56 = 1/56 = 0.018 P(X = 1) = h(1;8,5,3) = 3C1 • 5C4 / 8C5 = (3)(5)/56 = 15/56 = 0.268 P(X = 2) = h(2;8,5,3) = 3C2 • 5C3 / 8C5 = (3)(10)/56 = 30/56 = 0.536 P(X = 3) = h(3;8,5,3) = 3C3 • 5C2 / 8C5 = (1)(10)/56 = 10/56 = 0.179 P(X = 4) = h(4;8,5,3) = 3C4 • 5C1 / 8C5 = (0)(5)/56 = 0
3-34
Dr. Héctor Quevedo Urías
TABLA 3.4. Tabla mostrando la tabulación de la distribución hipergeométrica. Variable aleatoria X
|
0
h(x;8,5,3)
|
1/56
1 15/56
2
3
4
30/56
10/56
0
Para hacer el histograma, únicamente se grafican los valores de la variable aleatoria x = 0, 1, 2, 3, 4 en la abscisa y los valores de h(x;8,5,3) en la ordenada. Ejemplo #19. Refiriéndose al problema anterior, calcular las siguientes probabilidades: (a) La probabilidad de qué, exactamente, 1 Químico sea seleccionado. (b) La probabilidad de qué, cuando menos 1 Químico sea seleccionado (c) La probabilidad de qué, entre 1 y 3 (incluso) Químicos sean seleccionados. Solución: (a) Sustituyendo los valores de N = 8, n = 5, k = 3 en la fórmula hipergeométrica: P(X = x) = h(x;N,n,k) = kCx • N-kCn-x / NCn P(X = 1) = h(1;8,5,3) = 3C1 • 5C4 / 8C5 = (3)(5) / 56 = 0.268 (b) P(X ≥ 1) = 1 – P(X = 0) = 1 – [(3C0 • 5C5)/8C5] = 1 – (1)(1) / 56 = 1 – 0.018 = 0.982 (c) P(1 ≤ X ≤ 3) = P(X ≤ 3) – P(X = 0) = P(X = 1) + P(X = 2) + P(X = 3) = H(1;8,5,3) + H(2;8,5,3) + H(3,8,5,3) = (3C1•5C4)/56) + (3C2•5C3)/56) + (3C3•5C2)/56) = ((3)(5)/56) + ((3)(10)/56) + ((1)(10)/56) = (0.268) + (0.536) + (0.179) = 0.983
3-35
Dr. Héctor Quevedo Urías
Ejemplo #20. Un embarque de 20 computadoras contiene 5 que están defectuosas. Si 10 de estas computadoras se seleccionan aleatoriamente, para su inspección, ¿Cuál es la probabilidad de que 2 de las 10 estén defectuosas? Solución: Aquí, X = 2, n = 10, k = 5 y N = 20. Ahora sustituyendo estos valores en la fórmula hipergeométrica da: P(X = 2) = H(2;20,10,5) = 5C2 • 15C8 / 20C10 = (10)(6435)/184756 = 0.348 Nótese la diferencia entre el uso de la letra mayúscula H y la letra minúscula h. Ejemplo #21. Repitamos el ejemplo anterior, pero ahora con un lotes de 100 computadoras, 25 de las cuales están defectuosas, de la siguiente manera. (a) Usando la fórmula hipergeométrica (b) Usando la fórmula binomial como una aproximación a la distribución hipergeométrica. Solución: (a) Sustituyendo x = 2, n = 10, k = 25, N = 100 en la fórmula da: P(X = 2) = H(2;100,10,25) = 25C2 • 75C8 / 100C10 = (300)(1.687x1010) / 1.731x1013 = 0.292 Aquí vemos que los datos son muy largos y tediosos. Sin embargo, usando la distribución binomial, como una aproximación, basándonos en el hecho de que el valor de N = 100 es grande con relación a n = 10, entonces, podemos usar la binomial como una aproximación a la hipergeométrica y da: Usando x = 2, n = 10, p = k/N = 25/100 = .25. Por lo tanto, Usando la formula binomial, b(x,n,p) = nCx px qn-x /x!
3-36
Dr. Héctor Quevedo Urías
P(X = 2) = B(2,10,0.25) = 10C2 (0.25)2 (0.75)8 = (45)(0.0625)(0.100) = 0.2813 Nota. Obsérvese que la diferencia entre los dos valores es de solo .01. En general, es posible demostrar que la distribución hipergeométrica, h(x;N,n,k) se aproxima a la distribución binomial, b(x;n,p), con p = k/N. Por regla general, puede usarse la distribución binomial como una aproximación a la distribución hipergeométrica, si n < N/10. Más ejemplos de problemas de la distribución binomial usando el programa de computadora Minitab Abrir el programa Minitab e irse a: Calc → Probability Distributions → Binomial… Esto hace que aparezca la ventana de “Binomial Distributions”. En esta ventana puntear “Probability”. En la ventanilla de “Number of Trials” poner el valor de n seleccionado (tamaño de la muestra). Asimismo, en la ventanilla de “Probability of Success” poner la probabilidad o el porcentaje (en forma decimal) deseado. En la ventanilla de “Input Columns” poner la columna C1 o sea la columna con los datos que se quieran evaluar. En la ventanilla de “Optional Storage” se pondrán los datos generales que se almacenaran. Luego poner “OK”. Enseguida, para generar las probabilidades acumuladas dentro de la misma ventana de “Binomial Distributions” puntear la “Cummulative Probability” y proceder análogamente, como arriba. Análogamente, para hacer gráficas irse a: Graph → Scatterplot → With Connect line, etc. En la ventana de “Scatterplots With Connect Line”, poner C2 o C3 en Y y, C1 en X. (Siempre que se tenga alguna duda, consultar la ventanilla de “Help”.)
3-37
Dr. Héctor Quevedo Urías
Ejemplo #22. Un fabricante de precipitadores electrostáticos afirma qué, el 6% de este equipo para controlar las partículas contaminantes del aire, está defectuoso. Si esta afirmación es correcta, encontrar las probabilidades de que el número de aparatos defectuosos sacados de una muestra de 10 estén en mal estado. (a) Exactamente dos aparatos estarán defectuosos (b) Cuando menos dos aparatos estarán defectuosos (c) Menos que un aparato estará defectuoso (d) Entre 2 y 5 incluso y excluso (e) P(S) (f) Hacer gráficas de probabilidad de función de masa P(X=x) y de probabilidad acumulada, P(X ≤ x) Solución: Para obtener los resultados apetecidos usar la tabla generada, que incluye la variable aleatoria X (en la columna C1) y las probabilidades binomiales individuales y las probabilidades binomiales acumuladas (en las columnas C2 y C3). (a) P(X = 2) = 0.0988 (de la columna C2) (b) P(X ≥ 2) = 1 – P(X < 2) (c) P(X < 1) = P(X = 0) = 0.5386 (d) P(2 ≤ X ≤ 5) = P(X ≤ 5) – P(X ≤ 1) = P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = 0.1176 P(2 < X < 5) = P(X = 4) + P(X = 3) (de la columna C2) = 0.0168 + 0.0019 = 0.0187
3-38
Dr. Héctor Quevedo Urías
(e) P(S) = 1 (Este valor se obtiene de la sumatoria de todas las probabilidades de función de masa o probabilidades binomiales individuales), esto es: P(S) = (0.538615 + 0.343797 + 0.098750 + 0.0116809 + 0.001878 + 0.000144 + 0.000008) ≈ 1 (f) Las Figuras 3.4 (a) y (b) muestran los gráficos de las probabilidades binomiales individuales, en función de la variable aleatoria X y, las probabilidades binomiales acumuladas, en función de la variable aleatoria X, respectivamente.
TABLA 3.5. Tabla mostrando los valores de la variable aleatoria x (columna C1), la probabilidades binomiales individuales P(X=x) y la probabilidades binomiales acumuladas P(X ≤ x) (columna C3). (a)
(b) Grafica mostrando la probabilidad P(X 2) = 1 – P(X ≤ 2) = 1 – P(x = 0, 1, 2) = 1 – 0.423 = 0.5770 (b) Cuando menos 4 trabajadores P(X ≥ 4) = 1 – P(X ≤ 3) = 1 – 0.6472 = 0.3528 (c) 5 o más trabajadores P(X ≥ 5) = 1 – P(X ≤ 4) = 1 – 0.8152 = 0.1848 Ejemplo #5. De los ítems producidos por una factoría, el 3% están defectuosos. Una muestra de 25 ítems se selecciona para una inspección. Usar la distribución binomial y la Poisson y comparar los resultados de los siguientes: (a) Exactamente 4 ítems estarán defectuosos (b) 3 o más objetos estarán defectuosos Solución: Usando la distribución binomial: (a) 0.0054 (b) 0.038 Usando la distribución de Poisson: (a) 0.006 (b) 0.041
4-14
Dr. Héctor Quevedo Urías
Ejemplo #6. Un promedio de 3 autos arriban a la caseta de cobro de una carretera cada minuto. Si esta tasa es aproximada por un proceso Poisson, ¿cuál es la probabilidad de qué, exactamente, 5 autos arribarán en un periodo de un minuto? Solución: Aquí, λ = µ = 3, x = 5 Usando la ecuación f(x) = µx e-µ / x! y sustituyendo los valores obtenemos: P(X = 5) = (3)5 (e)-3 / 5! = [(243)(.0498)] / 120 = .1008 El valor de .1008 es la probabilidad de que 5 autos arriben en un minuto Nótese que este problema también se puede resolver usando la tabla de probabilidades de Poisson, es decir, para valores específicos de µ y de x que dan una solución más fácil y precisa. Para esto, buscamos el valor de µ = 3 con x = 5 y da 0.9161, pero como la tabla da las sumatorias acumuladas, le restamos 1. Por lo tanto, P(X = 5) = 1 - 0.9161 = .08 ~ .1 (Ver tabla de valores selectos de la distribución acumulada de Poisson) Ejemplo #7. El 10% de las herramientas producidas en cierto proceso de manufactura son defectuosas. Encontrar la probabilidad de qué, en una muestra de 10 herramientas seleccionadas, aleatoriamente, exactamente, 2 herramientas sean defectuosas. Hacer esto usando: (a) La distribución de Poisson (b) La distribución binomial. Solución: Aquí ponemos n = 10 herramientas. Entonces, probabilidad de una herramienta defectuosa es, p = 10% = 0.10 y np = (10)(0.10) = 1.0, x = 2 (a) Usando la ecuación de Poisson: p(x) = (µx e-µ) / x! o bien P(x) = µx e-µ / x!
4-15
Dr. Héctor Quevedo Urías
Donde: p = 0.1, µ = np = (10)(0.1) = 1.0 Pr{de 2 herramientas defectuosas en 10} = (1.0)2 (e-1) / 2! = 1/2e = 0.1839 (b) Usando la ecuación de Bernoulli P(X = 2) = nCx px qn-x Donde: n = 10 X=2 p = 0.1 q = 1 - p = 1 - 0.1 = 0.9 P(X = 2) = 10C2 (0.1)2 (0.9)10-2 = 10! / [2!(10-2)!] = 0.19 Ejemplo #8. En este problema aplicar la función estadística más apropiada. Siendo así, si el 3.0% de los focos eléctricos manufacturados por una compañía están defectuosos, entonces, encontrar la probabilidad de qué, en una muestra de 100 focos: (a) Ningún foco esté defectuoso (b) 1 foco esté defectuoso (c) 2 focos estén defectuosos (d) 3 focos estén defectuosos (e) 4 focos estén defectuosos (f) 5 focos estén defectuosos Solución: Aquí es más apropiado usar la distribución de Poisson, porque n es grande. Siendo así, p = 0.03, n = 100, µ = np = (100)(0.03) = 3.0, x = 0, 1, 2, 3, 4, 5 (a) Usando la fórmula Poisson p(x,µ) = µx e-µ / x!, con e-3 = 0.04979 p(x,µ) = µx e-µ / x!
4-16
Dr. Héctor Quevedo Urías
p(0,3) = (3.0)0 (e)-3.0 / 0! = (1)( 0.04979) = 0.04979 (b) P(1,3) = (3)1 (e)-3.0 / 1! = (3)(0.04979)/1 = 0.1494 (c) P(2,3) = (3)2 (e)-3.0 / 2! = (9)(0.04979) / 2 = 0.44811 (d) P(3,3) = (3)3 (e)-3.0 / 3! = (27)(0.04979) / 6 = 0.2241 (e) P(4,3) = (3)4 (e)-3.0 / 4! = (81)(0.04979) / 24 = 0.1680 (f) P(5,3) = (3)5 (e)-3.0 / 5! = (243)(0.04979) / 120 = 0.1008 Propiedades de la distribución de Poisson TABLA 4.1. Tabla mostrando algunas propiedades de la distribución de Poisson. ________________________________________________________________ Promedio
µ=λ
Varianza
σ2 = λ
Desviación estándar
σ=√λ
Momento del coeficiente del sesgo
α3 = 1/√ λ
Momento del coeficiente de kurtosis
α4 = 3 + 1/λ
________________________________________________________________ (Fuente: Spiegel, 1961) Ejemplo #9. La probabilidad de que una persona muera de un arresto cardiaco, por fumar en exceso, es de 0.002. Encontrar la probabilidad de que menos de 5 personas, de las siguientes 2,000, morirán de un síntoma del corazón. Encontrar, también, el promedio y la varianza. Solución: Primero calculamos el promedio y la varianza. Las fórmulas para esto son: µ = np = (2000)(0.002) = 4.0 σ2 = npq = (2,000)(0.002)(0.998) = 3.992
4-17
Dr. Héctor Quevedo Urías
Usando la tabla de Poisson y siguiendo este razonamiento da: P(X < 5) = P(X ≤ 4) = 0.6288 (de la tabla de Poisson) Ejemplos ilustrando como graficar los datos de la variable aleatoria X Ejemplo #10. Supóngase que en un estudio de contaminación ambiental se instala una red de 3,840 sensores de alto volumen para medir las concentraciones de partículas atmosféricas, menores que 10 micras. Si la probabilidad de que cualesquiera de estos muestreadores falle es de .00083 durante un año, entonces, determinar las probabilidades de que 0, 1, 2, 3, 4,… de los muestreadores fallen durante el año en cuestión. Hacer una gráfica usando papel semilogaritmo. Solución: Aquí se pudiera usar la distribución binomial, porque habla de una situación binaria, es decir, fallar o no fallar. Sin embargo, debido a que n es muy grande y p es pequeña, la distribución Poisson es aplicable. Siendo así, primero calculamos el valor de λ. λ = np = (3840)(0.00083) = 3.2 Enseguida, establecemos nuestro punto de partida con la variable aleatoria X, como variable independiente. f(x) = p(x;3.2) = (3.2)x e-3.2 / x! Luego sustituimos los valores de la variable aleatoria X en la fórmula de arriba p(0;3.2) = 3.20 (0.041)/0! = 0.041 p(1;3.2) = 3.21 (0.041)/1! = 0.130 p(2;3.2) = 3.22 (0.041)/2! = 0.209 p(3;3.2) = 3.23 (0.041)/3! = 0.223 p(4;3.2) = 3.24 (0.041)/4! = 0.178
4-18
Dr. Héctor Quevedo Urías
p(5;3.2) = 3.25 (0.041)/5! = 0.114 p(6;3.2) = 3.26 (0.041)/6! = 0.061 p(7;3.2) = 3.27 (0.041)/7! = 0.028 p(8;3.2) = 3.28 (0.041)/8! = 0.011 p(9;3.2) = 3.29 (0.041)/9! = 0.00397 p(10;3.2) = 3.210 (0.041)/10! = 0.0013 Para graficar los datos de la variable aleatoria X (abscisa) y de la probabilidad f(x) = p(x;µ) (ordenada), se usa papel semilogarítmico. Por ejemplo, la Figura 4.1 muestra el uso de papel semilogarítmico usado para graficar los valores de la variable aleatoria X (en la abscisa) y de la probabilidad f(x) = p(x;µ). La gráfica con estos valores se muestra abajo. De la Figura 4.1 estimar las siguientes probabilidades. (El estudiante lo deberá hacer). (a) La probabilidad de que fallen (inclusivamente), entre 3 y 9 muestreadores (b) La probabilidad de que fallen más de 8 muestreadores (c) La probabilidad de que fallen (exclusivamente), entre 4 y 6 muestreadores (d) La probabilidad de que fallen más de 10 muestreadores (e) La probabilidad de que fallen todos los muestreadores (f) La probabilidad de que no falle ningún muestreador
4-19
Dr. Héctor Quevedo Urías
Figura 4.1. Figura mostrando el uso del papel semilogaritmo graficando los valores de la variable aleatoria X (en la abscisa) y de p(x;µ) en la ordenada. (Elaboración propia)
4-20
Dr. Héctor Quevedo Urías
Problemas de la distribución de Poisson usando el programa de computadora Minitab Ejemplo #11.Supóngase que el número X de huracanes observados en la región del Caribe, durante los últimos 3 años tiene una distribución de Poisson con un promedio de λ = µ = 8. Calcular las siguientes probabilidades: (a) La probabilidad de que ocurran a lo más 8 huracanes. (b) La probabilidad de que ocurran exactamente 8 huracanes. (c) La probabilidad de que ocurran cuando menos 9 huracanes. (d) La probabilidad de que ocurran entre 5 y 8 huracanes incluso. (e) La probabilidad de que ocurran entre 5 y 8 huracanes excluso. (f) La probabilidad de que ocurran a lo más 8 huracanes, pero más de 5. (g) La probabilidad de que ocurran más de 2 huracanes. (h) Hacer gráficas de P(X = x) y P(X ≤ x) en función de x. Solucion: Procedimiento: Primeramente, usando el programa Minitab buscamos las ventanillas señaladas abajo, es decir procediendo como: Calc > Probability distribution > Poisson.. En la ventana de “Poisson distribution” para la primera corrida punteamos en “Probabability” y, para la segunda corrida ponemos el punto en “Cummulative Probability”. En la ventana de “Mean” ponemos el valor del promedio λ o µ igual a 8. En la ventana de “Input column” ponemos C1 (los valores de la variable aleatoria x = 0, 1, 2,...n). Aquí, es conveniente instruir al programa de que ponga los valores de las probabilidades de función de masa (probabilidades individuales P(X = x) en la columna C2. Asimismo, se instruye al programa que ponga las probabilidades acumuladas P(X ≤ x) en la columna C3. Una vez, que se corre el
4-21
Dr. Héctor Quevedo Urías
programa, se genera la tabla de abajo que muestra los resultados.
TABLA 4.2. Tabla mostrando la variable aleatoria x en función de la probabilidad, P(X=x) y de la probabilidad acumulada, P(X≤ x). Solución: (a) P(X ≤ 8). Aquí, este problema se puede hacer de dos maneras. Primero, se puede hacer sumando las probabilidades de función de masa P(X = x), es decir, de P(X = 0) hasta P(X = 8) de los valores de la columna C2 de la tabla. No obstante, este procedimiento es muy largo e impráctico. Sin embargo, si usamos las probabilidades acumuladas de la columna C3 o de la Figura 4.3, el resultado es precisamente 0.59255. (b) P(X = 8). Este cálculo lo hacemos leyendo x = 8 en la columna C2 de la tabla y da 0.1396. (c) P(X ≥ 9). Este cálculo se hace tomando el complemento. Es decir, P(X ≥ 9) = 1 – P(X < 9) = 1 – 0.5925 = 0.4075. (d) P(5 ≤ X ≤ 8) = 0.492 (e) P(5 < X < 8) = 0.251
4-22
Dr. Héctor Quevedo Urías
(f) P(5 < X ≤ 8) = P(X = 6) + P(X = 7) + P(X = 8) = 0.3159 (de C2) (g) 1 – P(X ≤ 2) = 0.9863 (h) Ver Figura 4.2 de abajo. Para esto, usar Graph > plot. En la ventana de “Graph variables” poner C3 en Y y C1 en X. En “Edit attributable” poner dash y, luego, dash en “Line type”, etc.
S c a tte r plot of P (X = x) v s X 0.14 0.12
P(X=x)
0.10 0.08 0.06 0.04 0.02 0.00 0
2
4
6
8
10
12
14
16
X
Figura 4.2. Gráfica mostrando la probabilidad, P(X = x) en función de la variable aleatoria x. Scatterplot of P(X 0, o para x ≤ 0}
5-3
Dr. Héctor Quevedo Urías
Determinar las probabilidades de que la variable aleatoria X adopte un valor de: (a) Entre 1 y 3 (b) Mayor que 0.5 (c) A lo más 3 Solución: Usando P(a ≤ X ≤ b) = ∫
∫
(a) (b) ∫
(c)
∫
b a
f(x) dx
Intervalo [1, 3]
3 1
e-2x dx = (-0.5) [e-2 – e-6] = 0.067
∞ 0.5
e-2x dx
Intervalo [0.5, ∞]
e-2x dx = (-0.5) [e-6 – 1] = 0.5
Intervalo [0, 3]
3 0
Ejemplo #2. Simbolizar con X la cantidad de tiempo de incubación de bacterias en un plato de prueba durante 2 horas. Supóngase que la variable aleatoria X tiene función de densidad de f (x) = 0.5x, para el conjunto posible de valores de X en el intervalo (0 ≤ X ≤ 2). Siendo así, calcular las siguientes probabilidades: (a) P (X ≤ 1) (b P (.5 ≤ X ≤ 1.5) (c) P (1.5 < X) Solución:
5-4
Dr. Héctor Quevedo Urías
(a)
∫
(b) ∫
(c)
∫
1 0
1 2
0.5x dx = 0.5 (x /2)│0 = 0.5 (0.5 – 0/2) = 0.25
1.5 0.5
1.5 2
0.5 x dx = 0.5 (x /2)│0.5 = (0.5)(1.125 - .125) = 0.5
2.0 1.5
2.0 2
0.5 x dx = 0.5(x /2) │1.5 = 0.5(2.0 – 1.125) = 0.44
Ejemplo #3. Supóngase que el error en la reacción de temperatura, en oC, de una incubadora de un laboratorio de bacteriología, para la incubación de un plato de agar, es una variable X continua que tiene una densidad de probabilidad de f(x) = x2/3, donde X puede asumir valores de entre (-1 < X ≤ 2). Encontrar la probabilidad de densidad de que la temperatura esté entre 0 oC y 1 oC. Solución: Aquí queremos encontrar P(0 < X ≤ 1) en el intervalo [0,1]. Entonces… P(0 < X ≤ 1) = ∫
1 0
1 2
3
x /3 dx = x /9 │ 0 = 1/9
Ejemplo #4. La proporción de industrias que responden a cierto cuestionario ecológico (voluntario, pero que, actualmente, va a ser obligatorio) es una variable aleatoria continua X cuya función de densidad es f(x) = 2(x + 2)/5. Esta función tiene una variable aleatoria X puede asumir valores de 0 < X < 1. Hacer lo siguiente: (a) Mostrar que P(0 < X < 1) = 1 (b) Encontrar la probabilidad de que más de 25%, pero menos que 50% de las industrias contactadas responderán voluntariamente a esta solicitación. Solución:
5-5
Dr. Héctor Quevedo Urías
(a) Usando la relación matemática de f(x) y g(x) cuyas funciones son continuas y tienen una antiderivada en el intervalo [a, b], siendo así, entonces, usamos la función (5-10) de abajo y sustituyendo da:
∫ ∫
b a
1 0
[f(x) + g(x)] dx = ∫ (2x/5 + 4/5) dx = ∫
b a
b
f(x) dx + ∫
a g(x)
1 0
(5-10)
1
2x/5 dx + ∫ 1
dx
0
4/5 dx = 2x2/(2)(5) + 4x/5
1
= x2/5│0 + 4x/5 │0 = [1/5 – 0] + [4/5 – 0] =1 (b) Aquí el intervalo es [0.25 < X < .50]. Esto dice que, a = 0.25 y b = 0.50 Por lo tanto: ∫
.50 .25 (2x/5
.50 2
+ 4/5) dx = x /5│ .25 + 4x/5 │
.50 .25
= [(0.5)2 /5 – (0.25)2/5] + [4(0.5)/5 – 4(0.25)/5] = 19/80 La distribución normal La distribución normal es el ejemplo más importante de una distribución de probabilidad continua. Abraham De Moivre (1667-1754) la inició en 1733. Desafortunadamente, su trabajo se perdió y, casi 100 años después, Karl Gauss (17771855) y Pierre Simon, Marques de Laplace desarrollaron, de manera independiente, la distribución normal. Por esta razón, a la distribución normal también se le llama distribución Gaussiana. Características de la distribución normal 1. Es simétrica alrededor de su promedio µ y en forma de campana.
5-6
Dr. Héctor Quevedo Urías
2. El promedio, la mediana y la moda son iguales. 3. El área total bajo la curva es igual a uno. El 50% de las observaciones están a la derecha del promedio y el otro 50% de las observaciones están a la izquierda del promedio. 4. La distribución normal se determina completamente por sus parámetros µ y σ. Cuando µ = 0 y σ = 1 la distribución normal está en su forma estandarizada. La distribución normal es realmente una familia de distribuciones distinguida una de la otra por los valores de µ y de σ. Sin embargo, el miembro más importante de esta familia de distribuciones es la que tiene un promedio de 0 y una desviación estándar de 1. La ecuación de la distribución normal estándar se escribe como: f (z) = 1/√ 2π exp -0.5 z 2
-∞ 1.24) = 1 – P(z < 1.24) = 1 – 0.8925 = 0.1075 La distribución normal es una distribución de probabilidad continua (en contraste con la Poisson, binomial, hipergeométrica, geométrica, etc., que son distribuciones de probabilidad discretas). Esto quiere decir que, los resultados de un experimento de probabilidad consisten de un innumerable e infinito conteo de valores. Así, una distribución de probabilidad continua nos permite medir nuestra variable a cualquier grado de precisión requerida y está asociada con variables aleatorias continuas. En contraste, las distribuciones de probabilidad discreta son como la distribución binomial o de Bernoulli y la Poisson, las cuales están asociadas con variables aleatorias discretas. Las variables discretas son mediciones precisas. Ejemplos de variables discretas son el tamaño de una familia o el número de autos que se tienen, o el número de estudiantes de una clase. Todas estas son variables discretas. Esto quiere decir que, cuando algo se puede medir con precisión, entonces, es una variable discreta. En contraste, las variables continuas no se pueden medir, precisamente,
5-12
Dr. Héctor Quevedo Urías
cuando incrementamos la precisión de la medición sacamos un sistema de conteo más fino. Una variable continua no viene en paquetes de unidad, sino que mide o representa un grado de precisión arbitrario, es decir, redondeado. Ejemplos de variables continuas son los pesos, la temperatura, la altura, las densidades, etc. Relación entre la curva normal y la binomial Si n es grande y, si ni p ni tampoco q están cercanas a cero, la distribución binomial puede aproximarse a la normal, con la variable estandarizada dada por la función estadística z = (x – np)/ √ npq. La aproximación normal a la distribución binomial es buena si n es bastante grande con respecto a p. En particular, esto es cierto cuando np > 10 y n(1 - P) > 10. Para hacer las aproximaciones binomiales usando la distribución normal, se usa la variable aleatoria estandarizada z. (¿Cuál versión de la variable aleatoria de z se usaría: la variable aleatoria estandarizada de z poblacional o la variable aleatoria estandarizada de z muestral?). Por otra parte, Lapin (1982) recapitula el hecho de que la gráfica de la distribución binomial tiende a la distribución normal a medida que n aumenta. Esto sugiere qué, para muestras de tamaños grandes, la distribución binomial se aproxima a la normal. Lapin da las guías aceptadas para usar las aproximaciones normales, de acuerdo a la regla popular de que la aproximación normal a la distribución binomial es adecuada, siempre y cuando, np ≥ 5 y n(1 – p) ≥ 5. La TABLA 5.1 muestra las guías comúnmente aceptadas para usar la aproximación normal a la distribución binomial. Sin embargo, se argumenta que algunos estadísticos insisten de que tamaños de muestras más grandes que los dados en la TABLA 5.1 deben ser usados antes de que la aproximación sea aceptable. Esto se debe a que, el sesgo de la distribución binomial es tan pronunciado para tamaños de p grandes o pequeños de tal
5-13
Dr. Héctor Quevedo Urías
manera que, la forma de campana se asume por la distribución binomial, solamente, para un tamaño de n muy grande. TABLA 5.1. Tabla mostrando las guías más comúnmente aceptadas para usar la aproximación normal a la distribución binomial. ___________________________________________________________________ Siempre que p iguale a: Usar la aproximación normal, solamente, si n no es más pequeña que: ___________________________________________________________________ .5 10 .40 o .60 13 .30 o .70 17 .20 o .80 25 .10 o .90 50 .05 o .95 100 .01 o .99 500 .005 o .995 1,000 .001 o .999 5,000 __________________________________________________________________ Fuente: Statistics for Modern Business Decision. Lawrece L. Lapin (1981). Los siguientes ejemplos calculan las probabilidades para la distribución normal estandarizada Ejemplo #8. ¿Cuál es el área, la probabilidad, proporción o el porcentaje de encontrar un valor de z bajo la curva o distribución normal entre los valores de z = -1.73 y z = +2.45? Dibujar la gráfica. Solución: Delinear el intervalo de la variable aleatoria z, esto es, (-1.73 ≤ z ≤ 2.45) razonando de la siguiente manera: P(-1.73 ≤ z ≤ 2.45) = P(z ≤ 2.45) – P(z ≤ -1.73) Buscando z = 2.45 en la tabla de la distribución normal da una probabilidad de .9929.
5-14
Dr. Héctor Quevedo Urías
Enseguida, se hace lo mismo con el valor de z = -1.73 y da una probabilidad de .0418. Por lo tanto: P(-1.73 ≤ z ≤ 2.45) = P(z ≤ 2.45) – P(z ≤ -1.73) = .9929 - .0418 = .9511
Figura 5.3. Gráfica de la curva normal para el Ejemplo #8. (Elaboración propia) Ejemplo #9. ¿Cuál es la probabilidad, en la curva normal entre un valor de z = -1.54 y un valor de z = -.76? Solución: P(-1.54 ≤ z ≤ -.76) = P(z ≤ -.76) – P(z ≤ -1.54) = .2236 - .0618 = .1618 (de la tabla de z) Ejemplo #10. ¿Cuál es el área bajo la curva normal a la izquierda de z = -1.96? Solución: En la tabla de la distribución normal se busca el valor de la variable aleatoria z = -1.96 y da .025 es decir, P(z < -1.96) = .0250 Ejemplo #11. ¿Cuál es el área bajo la curva normal a la izquierda de un valor de z = 1.42?
5-15
Dr. Héctor Quevedo Urías
Solución: Se busca el valor de z = 1.42 en la tabla de z y da .9222. Esto es lo mismo que, área requerida de .5000 + .4222 = .9222. Ejemplo #12. Encontrar la probabilidad de que la variable Z esté entre -05 y 1.25. Solución: P(-0.5 < Z < 1.25) = 1.0 – 0.3085 – 0.1056 = 0.5859 La Figura 5.4 muestra esquemáticamente esta situación.
Figura 5.4. Figura mostrando la probabilidad de P(-05 < Z < 1.25). (Elaboración propia) Los siguientes problemas calculan las probabilidades para cualquier variable normal distribuida usando la variable estandarizada Z = (X - µ)/σ y/o su estimador estadístico correspondiente, z = (X - X )/s. Ejemplo #13. Si X es una variable normalmente distribuida, con un promedio aritmético de X = 24 y una desviación estándar de 3, ¿cuál es el valor de la variable normal estandarizada (tipificada), z que corresponde a un valor de X = 19? Solución: Primero transformamos (estandarizamos) el valor de X = 19 a valores de z, es decir: z19 = (X - X )/s = (19 - 24)/3 = -1.67 Aquí, se nota que, el valor de X = 19 está 1.67 desviaciones estándar abajo del promedio de 24.
5-16
Dr. Héctor Quevedo Urías
Ejemplo #14. Si X es una variable normalmente distribuida, con un promedio aritmético de 150 y una desviación estándar de 24, ¿cuál es el valor de z correspondiente a un valor de X = 182? Solución: z182 = (182 - 150)/24 = 1.33 Este valor de 182 está a 1.33 desviaciones estándar arriba del promedio de X = 150. Ejemplo #15. Si X es una variable normalmente distribuida, con un promedio de 100 y una desviación estándar de 15, calcular la probabilidad de: P(70 < X < 130). Solución: Primero transformamos (estandarizamos) los valores de X = 70 y X = 130 a valores de la variable aleatoria z. Esto es: z70 = (70 - 100)/15 = -2.00 z130 = (130 - 100)/15 = 2.00 El valor de z correspondiente al intervalo (70 < X < 130) es de (-2.00 < z < +2.00) y la probabilidad es: P(70 ≤ X ≤ 130) = P(-2.0 ≤ z ≤ 2.0) = P(z ≤ 2.0) – P(z ≤ -2.0) = .9772 - .0228 = 0.9544 Aquí, se puede ver qué, sin consultar la tabla de la z, ya sabemos que, a 2.0 unidades de z arriba del promedio están comprendidas el 97.72% de las observaciones. Similarmente, a -2.0 unidades abajo del promedio están comprendidas el 2.28% de las observaciones; por lo tanto, .9772 - .0228 = 0.9544. La Figura 5.5 muestra esto.
5-17
Dr. Héctor Quevedo Urías
Figura 5.5. Gráfica mostrando la curva normal para este problema. (Elaboración propia). Ejemplo #16. En una investigación de higiene industrial y seguridad, relacionada con un proceso industrial, se requiere una aptitud mental muy alta. Para esto, los trabajadores se sometieron a una prueba del coeficiente de intelecto (IQ). Si se saca una muestra al azar que da X = 120 puntos y s = 20 puntos, ¿Cuál es la probabilidad de que un trabajador seleccionado tendrá un valor de coeficiente de intelecto que esté entre 80 y 140 puntos? Solución: Aquí estamos buscando la probabilidad de P(80 < X < 140) = P(-2.00 < z < +1.00). Por lo tanto, el área total o la probabilidad requerida es igual a 0.8185. Esto dice que, cerca del 82% de la población tiene un IQ de esta prueba del intelecto que está entre 80 y 140 puntos. Ejemplo #17. Si una muestra aleatoria de una población normal de intensidades de viento, en m/segundo, tiene un promedio de 10 m/seg y una varianza de 4: (a) ¿Qué porcentaje y/o probabilidad de las intensidades del viento caen entre 9 y 14 m/seg.? (b) ¿Entre 13 y 15? Solución:
5-18
Dr. Héctor Quevedo Urías
(a) % = (Área de -∞ a 2) - (área de -∞ a -.5) = .9772 - .3085 O sea: P(9 ≤ X ≤ 14) = P(-0.5 ≤ z ≤ 2) = 0.9772 - 0.3085 = 0.6687 = 66.87% Aquí, se nota que, si el valor de s es igual a 2, por lo tanto, hay 2 unidades de desviación estándar para los valores de X = 14 y X = 9, es decir, a la derecha e izquierda del promedio. (b) Aquí estamos diciendo que 13 está a 1.5 unidades abajo del promedio y 15 está a 2.5 unidades arriba del promedio. Esto es: P(13 ≤ X ≤ 15) = P(1.5 ≤ z ≤ 2.5) = .9938 – .9332 = 0.06 = 6% Encontrando los valores de z dando las probabilidades Ejemplo #18. Un área de .4370 está bajo la curva normal entre el promedio y un valor positivo de z. ¿Cuál es el valor de z? Solución: Buscando el valor de 0.4370 en la tabla de la z vemos que corresponde a z = +1.53. Ejemplo #19. Un área de .4808 está bajo la curva normal entre el promedio y un valor de z negativo. ¿Cuál es el valor de z? Solución: Buscamos el valor de .4808 en la tabla y da z = -2.07. Ejemplo #20. El 90% de la distribución de partículas atmosféricas de una curva normal está a la izquierda de un valor de z en particular. ¿Cuál es el valor de z? Solución: El valor de z debe de estar a la derecha del promedio, porque el 50% de la distribución está a la izquierda del promedio. Eso deja 0.400 de la curva entre el promedio y el valor requerido de z. De manera que, ahora tenemos que encontrar el valor de z que corresponde a una área de .400 en la tabla de la curva normal (.900 -
5-19
Dr. Héctor Quevedo Urías
.500). Sin embargo, aquí vemos que no hay entrada de 0.4000, no obstante, lo más cercano es .3997 que corresponde al valor de z = 1.28. Encontrando los valores z del punto de expansión para variables normalmente distribuidas Ejemplo #21. Calcular dentro de que rango estarán comprendidas el 95% de las observaciones centrales o de en medio, si el promedio es de 10 y la desviación estándar es de 2. Hacer una gráfica. Solución: Aquí, vamos a usar la relación: X = X ± z (s), con X = 10.0 y s = 2.0, es decir: 10 ± 1.96 (2) = 10 ± 3.92 para dar (6.08 ≤ X ≤ 13.92). La figura de abajo muestra esta situación.
Figura 5.6. Grafica mostrando los resultados de este problema. (Elaboración propia) Ejemplo #22. Si X = 10 y s = 2, ¿Dentro de que rango están comprendidas el 99% de las observaciones de en medio de la curva normal? (b) ¿El 90%? Solución: Usando la relación X = X ± z.01 (s) y sustituyendo da: (a) X = X ± z.01(s) = 10 ± 2.57(2) = (4.85 ≤ X ≤ 15.15)
5-20
Dr. Héctor Quevedo Urías
Figura 5.7. Gráfica mostrando los resultados del ejemplo #22. Ejemplo #23. Si X = 20 y s2 = 9, dentro de que rango están comprendidas: (a) ¿El 99% de las observaciones de en medio de la curva normal? (b) ¿El 90%? (c) ¿El 80%? Solución: Usando la relación X = X ± z.01 (s) y sustituyendo da: (a) X = X ± z.01(s) = 20 ± 2.57(3) = 20 ± 7.41 = (12.29 ≤ X ≤ 27.31) (b) Usando la relación X = X ± z0.1(s) y sustituyendo da: X = X ± z0.1(s) = 20 ± 1.645(3) = 20 ± 4.935 = (21.96 ≤ X ≤ 24.94) (c) Usando la relación X = X ± z0.05 (s) y sustituyendo da: X = X ± z0.20 (s) = 20 ± 1.28 (3)
5-21
Dr. Héctor Quevedo Urías
= 20 ± 3.84 = (16.16 ≤ X ≤ 23.84) Problemas ilustrando las aproximaciones normales a la distribución binomial Ejemplo #24. Una máquina produce tornillos de los cuales 10% son defectuosos. Encontrar la probabilidad de que, en una muestra aleatoria de 400 tornillos producidos por esta máquina: (a) A lo más 30 tornillos estarán defectuosos (b) Entre 30 y 50 estarán defectuosos (c) Entre 35 y 45 estarán defectuosos (e) 55 o más tornillos estarán defectuosos Solución: Primero se calcula el promedio y la desviación estándar: µ = np = (400)(0.1) = 40 y σ = npq = [(400)(0.1)(.90)]0.5 = 6.0 Enseguida, se calcula el valor de la variable aleatoria Z usando la relación: Z = (X – µ) / σ. (a) P(X ≤ 30). Para calcular esto, primero se transforma el valor de 30, a valores de Z usando la función de arriba, es decir, Por lo tanto:
Z30 = (30 – 40)/6.0 = -1.67
P(X ≤ 30) = P(Z ≤ -1.59) = 0.0559 (b) P(30 ≤ X ≤ 50). Para calcular esto, primero transformamos los valores de 30 y 50 a valores de Z, es decir, Z30 = (30 – 40) / 6.0 = -1.67; Z50 = (50 – 40) / 6.0 = 1.67
5-22
Dr. Héctor Quevedo Urías
Por lo tanto, P(30 ≤ X ≤ 50) = P(X ≤ 50) – P(X ≤ 30) = P(Z ≤ 1.59) - (Z ≤ -1.59) = .9441 - 0.0559 = .8882 (c) La probabilidad de qué, entre 35 y 45 tornillos estén defectuosos, es, P(35 ≤ X ≤ 45). Para esto, primero transformamos los valores de X a valores de Z. Z35 = (35 – 40)/6.0 = -0.83 y Z45 = (45 – 40)/6.0 = 0.83. Por lo tanto, P(35 ≤ X ≤ 40) = P(-1.59 ≤ Z ≤ 0.79) = .7852 - .0559 = 0.7293 (e) Primero estandarizamos el valor de X = 55 a valores de Z. z55 = (55 – 40) / 6.0 = 2.50 que corresponde a una probabilidad de .9938. Por lo tanto: P(X ≥ 55) = 1 – P(X ≤ 55) = 1 - .9938 = .0062 Ejemplo #25. La probabilidad de que X asuma un valor exacto de 4 se da abajo, esto es, usando la distribución binomial. P(X = 4) = B(4;15,0.4) = 0.1268 Siendo así usar la distribución normal como una aproximación: Solución: Primero se calcula el valor del promedio, µ = np y da µ = (15)(0.4) = 6. La desviación estándar es σ = npq = (15)(0.4)(0.6) = 1.897. Además, X = 4 puede asumir valores de 3.5 y 4.5. Enseguida, transformando los valores usando la variable aleatoria normal Z da:
5-23
Dr. Héctor Quevedo Urías
Z3.5 = (3.5 – 6) / 1.9 = -1.32 y Z4.5 = (4.5 – 6) / 1.9 = -0.79 Si X es una variable aleatoria binomial y Z es una variable normal, entonces: P(X = 4) = B(4;15,0.4) ≈ P(-1.32 < Z < -0.79) = P(Z < -0.79) – P(Z < -1.32) = 0.2148 – 0.0934 = 0.1214 Este valor sacado usando la distribución normal como una aproximación a la distribución binomial está muy cercano al de 0.1268 calculado por la distribución binomial. Distribución exponencial La distribución exponencial es una distribución continua de probabilidad para describir el tiempo que se tarda en realizar una actividad. Esta distribución es un caso especial de la distribución gamma. Esta función se usa para modelar las vidas de las baterías, de transistores, de valeros, etc. También se usa para modelar la distancia entre los principales defectos en una carretera, etc. A pesar de que la distribución exponencial es continua, esta distribución está cercanamente relacionada con la distribución de Poisson, que es discreta. Esto ocurre en el sentido que, una variable aleatoria Poisson cuenta el número de ocurrencias de un evento durante un intervalo de tiempo dado. En contraste la variable aleatoria exponencial X que puede ser usada para medir el tiempo que transcurre antes de la primera ocurrencia de un evento, donde
las
ocurrencias
del
evento
siguen
a
una
distribución
Poisson.
Equivalentemente, una variable aleatoria exponencial puede ser usada para medir el tiempo que transcurre entre las ocurrencias de un evento Las aplicaciones de la distribución exponencial, a la ingeniería ambiental son varias. Por ejemplo, se puede usar para modelar el tiempo que se tardan los pesticidas en degradarse en la tierra o para medir el tiempo en que se toma en degradarse una
5-24
Dr. Héctor Quevedo Urías
sustancia radiactiva. Igualmente, es útil para medir la cinética de la
demanda
bioquímica de oxígeno (DBO5). Análogamente, se puede usar para medir el tiempo que tardan las partículas atmosféricas en caer a la superficie de la tierra. Una variable aleatoria continua X se dice que está exponencialmente distribuida si su función de densidad es: f (x) = λ e-λx para X ≥ 0, λ ≥ 0
(5-16)
Donde: λ es un parámetro de la distribución, y e una constante igual a 2.71828 2
2
X y s de la variable aleatoria exponencial X son E(X) = 1/λ y V(X) = 1/λ ,
respectivamente. Se puede demostrar que el promedio y la desviación estándar de una distribución exponencial son iguales el uno al otro, esto es: µ = σ = 1/λ. Por otro lado, Keller et al. (1990) afirma que, en el caso de una variable aleatoria exponencial X, se puede demostrarse que la probabilidad de que X pueda tomar un valor más grande que un número especificado no negativo a, es e-λa. Esto se puede expresar usando cálculo integral, es decir: P(X ≥ a) = ∫
∞
∞
-λx
a λe
-λx
dx = -e
| a = e-λa
(5-16a)
El cálculo de las funciones exponenciales involucra la evaluación de integrales de probabilidad entre los límites de a y b. Para esto, se da una tabla de probabilidades exponenciales. Las siguientes fórmulas se usan con esa tabla. P(a ≤ X ≤ b) = e-λa – e-λb
(5-17a)
P(X ≤ a) = 1 – e-λa
(5-17b)
P(X ≥ a) = e-λa
(5-17c)
La distribución exponencial es una familia de distribuciones modificadas por un solo parámetro, λ, las cuales se muestran en la Figura 5.8.
5-25
Dr. Héctor Quevedo Urías
Figura 5.8. Gráficas de tres distribuciones exponenciales. Fuente: Devore (2000) Ejemplo #26. Supongamos que el tiempo promedio que se tarda una sustancia radiactiva en degradarse es de µ = 15 y su función de densidad es f(x) = 1/15 e-x/15. Si los valores de la variable aleatoria x son 5, 15, 25, 35, y 45, calcular las siguientes probabilidades: (a) A lo más 6 años (b) Entre 6 y 18 años Solución: (a) Usando (5-17b) con µ = 1/λ, es decir, λ = 1/15 y a = x = 6 y sustituyendo en la función P(X ≤ a) = 1 – e-λa, da: P(X ≤ 6) = 1 – e-(6/15) = 0.3297 (b) Usando la función (5-17a) y sustituyendo da: P(Tiempo de caída 6 ≤ X ≤ 18 años) = .6988 - .3297 = .3691 Ejemplo #27. Refiriéndose al Ejemplo #26, ¿Cuál es la probabilidad de que la degradación de la sustancia radiactiva dure cuando menos 10 años. Solución: Usando la función (5-17c), es decir: P(X ≥ a) = e-10/15 = 0.51
5-26
Dr. Héctor Quevedo Urías
Figura 5.9. Gráficas mostrando los resultados para (a) y (b), del ejemplo #26. Ejemplo #28. El tiempo requerido para que ocurra una reacción química está exponencialmente distribuida con un tiempo esperado de 5 minutos. (a) ¿Qué proporción de la sustancia se formará dentro de 1 minuto? (b) ¿En 5 minutos? (c) ¿Entre 4 y 8 minutos? (d) Si la cantidad de la sustancia química es de 5.00 gramos, ¿cuánto es lo que se va formando en cada uno de los intervalos? (El lector lo hará) Solución: Usaremos intervalos de 1 minuto para calcular la probabilidad. Por lo tanto, debido a que la reacción se hace en 5 minutos en promedio (pensamos de esto produciéndose en 5 intervalos continuos de un minuto) el número esperado de producción en un minuto es 1/5 = .20 = λ (o sea el número esperado de ocurrencias en 1 minuto). La variable aleatoria X se define como el tiempo, en minutos, requerido para completar la reacción. Por lo tanto: (a) P[X ≤ 1] = 1 – e-(0.20(1) = 0.8187 = 81.87% (Usando la fórmula 5-17b) (b) P[X ≤ 5] = 1 – e-(0.20)(5) = 0.3679 = 36.87% (usando la fórmula 5-17b) (c) P[4 < X < 8] = e-(0.20)(4) – e-(0.20)(8) = 0.2474 (usando la fórmula 5-17a) (d) 4.09 g., 1.84 y 1.23 g, respectivamente.
5-27
Dr. Héctor Quevedo Urías
Distribución gamma continua A pesar de que la distribución normal puede resolver muchos problemas en ingeniería, hay otras situaciones que requieren de diferentes tipos de funciones de densidad. Funciones como éstas son la exponencial, la gamma, la Weibull, la beta, etc. Hay muchas situaciones en que la variable de interés, para el experimentador, pueda tener una distribución oblicua. Siendo así, entonces, una familia de funciones de probabilidad de densidad (pdf) que dan una amplia variedad de distribuciones sesgadas es la familia de distribuciones gamma. Como se dijo antes, la distribución gamma es un caso especial de la distribución exponencial. Las funciones exponenciales y la función gamma juegan un papel muy importante en la teoría de filas que esperan el orden de su llegada. La distribución gamma puede ser vista como una distribución gamma estandariza o como una distribución gamma no estandarizada. Si una variable aleatoria continua x tiene una distribución gamma, con parámetros α y β, entonces, para cualquier x > 0 la distribución acumulada de frecuencia (cdf) de x está dada por: P(X ≤ x) = F(x;α,β) = F(x/β;α)
(5-18)
Donde: α es el primer parámetro de forma que define la distribución gamma β es el parámetro de escala que define la distribución gamma (porque valores mayores que la comprimen o estiran la función de probabilidad de densidad (pdf) en la dirección de x); F(x/β;α) es una función de gamma incompleta. En la familia de distribuciones gamma una variable aleatoria continua X se dice que tiene una distribución gamma no estandarizada si la pdf de X es: f(x;α,β) = {1/βα Г(α) xα-1 e-x/β
5-28
x≥ 0
(5-19)
Dr. Héctor Quevedo Urías
o de otra manera Donde los parámetros α y β satisfacen α > 0 y β > 0 Si se pone β = 1 la expresión (5-19) se reduce a la forma de de la distribución gamma estándar descrita abajo. f (x;α) = ∫
x 0
xα-1 e-x / Г(α) dx x > 0
(5-20)
La función (5-20) se llama función de gamma incompleta, cuando no tiene el denominador con Г(α) en el integrador. Cuando se usan las funciones (5-19) y (5-20) la tarea se facilita usando la tabla de la distribución gamma, con valores de α = 1, 2, 3,…,10 y de x = 1, 2,…,15. El promedio y la varianza de la distribución gamma son, respectivamente: y
E(X) = µ = αβ
(5-21)
V(X) = σ2 = αβ2
(5-21a)
Figura 5.10. Gráficas con distribuciones gamma de densidad con diferentes valores de α y β y curvas de densidad gamma estándar. Nótese que cuando β = 1, es la curva exponencial. (Devore 2000). Ejemplo #29. Supóngase que se tiene una distribución gamma estándar con parámetro α = 3, calcular:
5-29
Dr. Héctor Quevedo Urías
(a) La probabilidad de que X esté entre 4 y 5. (b) La probabilidad de que X sea mayor que 4 Solución: Debido a que P(a ≤ X ≤ b) = F(b) – F(a) cuando X es continua, por lo tanto: (a) P(4 ≤ X ≤ 5) = F(5;3) – F(4;3) = 0.875 – 0.762 = 0.113 (b) P(X > 4) = 1 – P(X ≤ 4) = 1 – F(4,3) = 1 - .762 = 0.238 Ejemplo #30. Este problema involucra un experimento con conejillos de India seleccionados al azar. Este es un estudio relacionado con el tiempo X de supervivencia, en semanas. Los animales fueron expuestos a una radiación de 400 rads (dosis de radiación absorbida), es decir, de radiación gamma (energía radiante). Se asume que esta situación sigue a una distribución gamma con parámetros de escala de α = 10 y β = 20. Siendo así, hacer los siguientes cálculos: (a) Calcular la media de supervivencia y la varianza. (b) Calcular la probabilidad de que un conejillo sobreviva entre 80 y 120 días. (c) La probabilidad de que un animal sobreviva, cuando menos 20 días. Solución: Aquí usamos la distribución gamma no estandarizada. (a) El promedio es: E(X) = µ = αβ = (10)(20) = 200 días. La varianza es: V(X) = σ2 = αβ2 = (10)(20)2 = 4000 días. (b) P(80 ≤ X ≤ 120) = F(120/20;10) – F(80/20;10) = F(6;10) – F(4;10) = 0.084 - 0.008 (de la tabla de la distribución de gamma)
5-30
Dr. Héctor Quevedo Urías
= 0.076 Esto dice que el valor de 0.076 es la probabilidad de que un conejillo sobreviva entre 80 y 120 días. (c) P(X ≥ 20) = 1 - P(X < 20) = 1 - F(20/20;10) = 0.000 (de la tabla de la distribución gamma) Distribución Weibull La distribución Weibull fue introducida por el físico sueco Waloddi Weibull en 1939. En forma análoga a las distribuciones gamma y exponencial la distribución de Weibull tiene aplicaciones relacionadas con tiempo de falla o longitud de vida. Es decir, para medir la confiabilidad de un componente o producto, como la probabilidad de que si funcionará apropiadamente, por cuando menos un tiempo especificado bajo condiciones experimentales especificadas. Esta función, igualmente, se usa en el diseño de sistemas complicados, cuya operación o seguridad depende de los varios componentes involucrados en el sistema. Por ejemplo, una columna de acero puede vencerse. Otra aplicación es el modelado de algún aparato sensible al calor que pueda fallar. Otra aplicación sería el estudio de componentes idénticos sujetos a condiciones ambientales idénticas, que puedan fallar a tiempos diferentes e impredecibles. La función de probabilidad de densidad (pdf) de la distribución Weibull es: f (x) = α xα-1 exp-(x/β)2 / βα , x > 0 Donde α y β son los parámetros condicionados a α > 0 y β > 0
5-31
(5-22)
Dr. Héctor Quevedo Urías
Figura 5.11. Gráfica mostrando la curva de densidad de Weibull. Nótese que cuando α = 1 y β = 1, la curva se torna exponencial. (Devore, 2000) Proposición: La función de distribución acumulada (cdf) de una variable aleatoria que tiene parámetros α y β es: F(x;α,β) = {1 – exp-(x/β)α x ≥ 0
(5-22a)
Ejemplo #31. Supóngase que X tiene una distribución de Weibull con parámetros α = 20 y β = 100 (Devore, 2000). Entonces, calcular: (a) P(X ≤ 105) (b) P(98 ≤ X ≤ 102) Solución: (a) P(X ≤ 105) = F(105;20,100) = 1 – exp-(105/100)20 = 1 - .070 = .930 (b) P(98 ≤ X ≤ 102) = F(102;20,100) – F(98;20,100) = exp-(.98)20 – exp-(1.02)20 = .513 - .226 = .287 Intervalos de confianza para µ con σ2 conocida Se sabe que la estadística Z = ( X - µ) / σ/√ n sigue a la distribución normal, con µ = 0
5-32
Dr. Héctor Quevedo Urías
y σ = 1. Si todas las muestras posibles de un tamaño n son sacadas de una población y el valor de Z se calcula para cada muestra, el 95% o 99% de los valores de Z caerán entre –zα/2 y zα/2. Sabemos que la probabilidad de que z esté entre –zα/2 y zα/2 es 1 – α. Esto se puede expresar como: P(-zα/2 < Z < zα/2) = 1 – α.
(5-23)
Para esto se sustituye el valor de Z y se multiplica cada elemento de (5-23) por σ/√ n y luego se le resta X de cada término. Después de esto, se multiplica por -1 (reversando el sentido de las desigualdades) y nos da la función de abajo: P( X - zα/2 σ/ n < µ < X + zα/2 σ/ n ) = 1 – α
(5-24)
Donde: La probabilidad 1 – α se llama el nivel de confianza X – zα/2 σ/ n se llama el límite de confianza inferior X + zα/2 σ/ n se llama el límite de confianza superior
TABLA 5.2. Tabla mostrando los niveles de confianza más comunes (Elaboración propia) ___________________________________________________________________ Nivel de confianza 1 – α α α/2 zα/2 _________________________________________________________________ .95 .05 .025 1.96 .99 .01 .005 2.58 .90 .10 .05 1.645 Ejemplo #32. En una muestra aleatoria de 100 observaciones de concentraciones de óxidos de nitrógeno (NO) atmosférico sacada de una población normal tiene σ = 25 y X = 20, con un tamaño de muestra de n = 100. Encontrar el intervalo de confianza
5-33
Dr. Héctor Quevedo Urías
estimado del 95% para el promedio poblacional µ. Solución: Usando la ecuación (5-24), con σ = 25, X = 20 y n = 100, α = 0.05 y con regiones críticas de ±1.96 da: P(20 – 1.96 (25)/ 100 < µ < 20 + 1.96 (25)/ 100 ) = 1 - α 15.1 < µ < 24.9 Estadística inferencial. Teoría de decisión estadística. Pruebas de hipótesis En la práctica es necesario hacer decisiones acerca de problemas basándose en muestras estadísticas. Semejantes decisiones se llaman decisiones estadísticas. Las pruebas de hipótesis se pueden hacer con la distribución normal para estimar los parámetros de población µ, σ2, σ, ρ, β, etc., si el tamaño de la muestra es n ≥ 30 observaciones. Sin embargo, si el tamaño de la muestra es n < 30 casos, entonces, se puede usar lo que se llama teoría de muestreo pequeño, usando la distribución de t de Estudiante. En este renglón, para hacer pruebas de hipótesis e intervalos de confianza, también se puede usar la distribución de la JI cuadrada (χ2), para estimar los parámetros poblacionales σ2 y σ. Además, se puede usar la distribución F, es decir, haciendo tablas de análisis de varianzas, etc. Pruebas de Hipótesis estadísticas. Hipótesis nula (Ho:) e hipótesis alternativas Para problemas de pruebas de hipótesis clásicas (se dice que son clásicas, porque se diseñaron el siglo antepasado) se contrastan con el nuevo enfoque moderno del cálculo de la probabilidad, p de programas de computadora de la era cibernética. Al tratar de alcanzar decisiones estadísticas, es necesario asumir situaciones acerca de las poblaciones involucradas en trabajos de investigación. Semejantes
5-34
Dr. Héctor Quevedo Urías
suposiciones, que pueden o no ser verdaderas, se llaman hipótesis nulas. En muchas ocasiones formulamos una hipótesis estadística, con el propósito de rechazarla o, cuando menos, de no aceptarla en base de la evidencia obtenida. Con la investigación científica la idea detrás de hacer pruebas de hipótesis es la de tratar de producir evidencia para rechazar la hipótesis. Esto se debe a que, el rechazo de una hipótesis, en trabajos de investigación denota diseños experimentales fuertes, precisos y concisos. Además, con la ingeniería de manufactura, el propósito de hacer pruebas de hipótesis es con el objeto de verificar el control de calidad de los productos producidos por la industria manufacturera. No obstante, si la hipótesis no se puede rechazar pueda deberse a que la evidencia que pudiera rechazar la hipótesis, no se puede producir. Esto puede resultar de una muestra pequeña o de un error experimental excesivo (donde hay mucha variación). La manera de producir evidencia para rechazar la hipótesis es analizando el error estándar del promedio, el cual prueba que ambos errores, I (alfa) y II (beta) pueden ser reducidos aumentando el tamaño de la muestra o disminuyendo la desviación estándar. Esto lo podemos demostrar analizando el error estándar de la muestra. Esto es: o su estimador
σX =σ/ N s=s/ n
(5-25) (5-25a)
Aquí, sin embargo, cabe notar que existen varios errores estándares de las distribuciones estadísticas. Esta información se da en la tabla de abajo.
5-35
Dr. Héctor Quevedo Urías
TABLA 5.3. Errores estándares de distribuciones estadísticas. (Elaboración propia) ___________________________________________________________________ Estadística Error estándar Observaciones especiales ___________________________________________________________________ Promedios σx = σ / n Esto es verdadero para muestras pequeñas o grandes. La distribución de la muestra es normal para n ≥30, aun si la población no es normal. Desviaciones estándares
σs = σ / 2 N σs = µ4- µ2/4Nµ2
(1) (2) Para N ≥ 100 casos, la distribución de s es normal. σs se da en (1), solamente si hay normalidad. No obstante, si la población no es normal, la ecuación (2) se puede usar. Nótese que (2) se reduce a (1) cuando µ 2= σ2 y µ4 = 3σ4, para poblaciones normales. Para n ≥ 30s = σ
Varianzas
σ2s = σ2 2 / N
(3)
σs2 = µ4 - µ22 / N
(4)
Las observaciones hechas para la desviación estándar aplican aquí también. Nótese que (2) da (1) en el caso de una población normal. ___________________________________________________________________
5-36
Dr. Héctor Quevedo Urías
Tipos de errores I (alfa) y II (beta) Cualesquiera de las hipótesis que sea correcta, siempre hay la posibilidad de que un error de muestreo nos incline a cometer lo que se llaman errores I o II. Así, podemos rechazar una hipótesis nula Ho: que es verdadera o podemos aceptar una hipótesis nula que es falsa. Si se rechaza una hipótesis, cuando debió ser aceptada, se dice que se cometió el error I. En contraste, si se acepta una hipótesis falsa, cuando debió ser rechazada, se dice que se cometió el error II. Como se verá, estos dos errores se pueden evitar aumentando el tamaño de la muestra estadística y/o reduciendo la desviación estándar (esto se puede probar a través del error estándar del promedio, que es igual a s/ n ). De cualquier manera, como se asentó antes, la idea de una prueba de hipótesis es tratar de producir evidencia para rechazar la hipótesis nula, Ho: Si no se puede rechazar la hipótesis nula, esta falta de evidencia puede resultar, ya sea a través de una muestra insuficientemente grande o a través de un error de laboratorio excesivamente grande (que se refleja en la desviación estándar, σ). También, la aceptación de una hipótesis falsa puede deberse a una variación inherente de la población que estamos muestreando (como en el caso de las temperaturas a nivel mundial cuyos registros se están rompiendo cada año, por el calentamiento global debido a las emisiones de bióxido de carbono). De cualquier manera de estas tres variables, σ es la más sensible.
5-37
Dr. Héctor Quevedo Urías
Figura. 5.12. Distribución de los promedios de dos muestras de las curvas A y B ilustrando el tipo de error II o beta con µ = 50 (en curva A) y σ = 10, con un nivel de significancia de α = 0.05 y con un tamaño de muestra de n = 16. (Li 1964)
Figura 5.13. Gráficas mostrando como se reduce la probabilidad de cometer los errores I y II, al aumentar el tamaño de n. (Li 1964). Niveles de significancia En la prueba de una hipótesis, la máxima probabilidad con la cual pudiéramos arriesgar el tipo de error I se llama el nivel de significancia de la prueba. Este nivel se
5-38
Dr. Héctor Quevedo Urías
especifica antes de que se saquen las muestras y se haga la prueba de hipótesis, para que no haya influencia sobre los resultados obtenidos. La prueba de significancia es cuando se especifica la probabilidad con la cual estamos dispuestos a arriesgar el rechazo de la hipótesis, acerca del promedio poblacional, aun cuando es verdadero. Los niveles de significancia más usados en las pruebas de hipótesis son el de α = 0.05 y α = 0.01. Estos valores corresponden a niveles críticos de 1.96 y 2.58, cuando se usa la distribución normal z. Por ejemplo, en pruebas de hipótesis bilaterales, con α = 0.05, si la z calculada es z < -1.96 o z > 1.96, se rechaza la hipótesis. Igualmente ocurre si el nivel de significancia es α = 0.01, es decir, cuando z < -2.58 y z > 2.58, entonces, se rechaza la hipótesis. De otra manera se retiene o se dice que no hubo suficiente evidencia para rechazar Ho: Esta prueba de significancia nos ayuda a decidir si la diferencia entre el promedio de la muestra estadística y el promedio poblacional asumido, se atribuye a la casualidad o si es estadísticamente significante, esto es, si es muy grande para ser atribuido a la casualidad. La TABLA 5.4 da los valores críticos más comunes. TABLA 5.4. Tabla mostrando las regiones críticas que se definen de acuerdo al valor del nivel de significancia usado, es decir, si la prueba de hipótesis es bilateral, unilateral derecha o unilateral izquierda. (Elaboración propia) Nivel de significancia α
0.10
0.05
0.01
0.005
0.002
±1.28
±1.645
±2.33
±2.58
±2.88
±1.645
±1.96
±2.58
±2.81
±3.08
Valores críticos de z para pruebas unilaterales (derecha o izquierda) Valores críticos de z para pruebas bilaterales Por ejemplo si usamos un nivel de confianza de 95%, es decir, un nivel de
5-39
Dr. Héctor Quevedo Urías
significancia de α = 0.05, para una prueba de hipótesis unilateral izquierda, entonces, bajo estas condiciones, el valor crítico de z es -1.28. Similarmente, si se usa el nivel de significancia de α = 0.10, para una prueba de hipótesis unilateral derecha, entonces, el valor crítico de z es de +1.28. Cabe notar qué, para las pruebas de hipótesis, los valores de los niveles de significancia más comunes son los de α = 0.05 y de α = 0.01. Por ejemplo, para una prueba bilateral con α = 0.05, los valores críticos de z son de ±1.96. No obstante, para una prueba unilateral izquierda con α = 0.05, el valor crítico de z sería de de -1.645 y así sucesivamente. ¿Cuál es la diferencia en la decisión de aceptar o de rechazar una hipótesis nula? Para ver esta situación, supongamos que el valor de la hipótesis nula es igual a un valor esperado de µo = 10, esto es, Ho:µ = 10. Además, supongamos que X = 12, σ = 4.5 y n = 25 y, si después de sustituir los valores en la variable aleatoria normal calculada por zcalc. = ( X - µo) / σ/√ n, con α = 0.05 con sus valores críticos de ±1.96, entonces, zcalc. = 2.22, y, por lo tanto, 2.22 > 1.96 y se rechaza Ho: Aquí, la confiabilidad es dictada por el valor de la probabilidad p, esto es, p = 1 - .9861 = .0139. Esto dice que, la probabilidad de haber hecho una decisión equivocada en rechazar una hipótesis verdadera es de, aproximadamente, 1 en 100. Ahora, supongamos que zcalc. = 1.2, con σ = 8.333 y con las demás variables constantes. Bajo estas condiciones, 1.2 < 1.96 y, se acepta Ho: con un valor de probabilidad de p = 1 - .8849 = .12. Aquí, el valor de p dice que, la probabilidad de haber hecho una decisión errónea, en haber aceptado una hipótesis falsa es de 1 posibilidad en 10. Entonces, de acuerdo al razonamiento expuesto anteriormente, ¿en cuál de las dos situaciones hay más confiabilidad, es decir, más certeza en nuestras decisiones?
5-40
Dr. Héctor Quevedo Urías
Con la ingeniería de manufactura, un rechazo de hipótesis (especialmente, si el valor de la probabilidad p es mucho muy significante, e.g., p = .001) sugiere que la línea de producción de la fábrica o de la manufactura industrial de herramientas, artículos, refacciones, etc., está trabajando en forma óptima. En forma análoga, con la investigación científica, un rechazo de hipótesis, de una muestra de los resultados obtenidos de laboratorio, indica un diseño experimental conciso y preciso. No obstante, una aceptación de hipótesis sugiere que deben de refinarse las técnicas de laboratorio o de la producción. También se puede hacer seleccionando tamaños de muestras más grandes (aunque esto es más costoso). Componentes de la prueba de hipótesis formal 1. Pruebas de hipótesis clásicas. Estas pruebas tradicionales se diseñaron el siglo 19. Estas pruebas de hipótesis nulas se denotan por Ho: y es una afirmación acerca del valor del parámetro de población, µ. Esta prueba de hipótesis nula (Ho:) se denota usando desigualdades algebraicas, las cuales se describen con los símbolos =, ≤ , ≥ . Esto quiere decir que, la prueba de hipótesis nula y, las hipótesis alternativas tienen tres formas posibles: (a)
Ho: µ = µo
(5-26)
Esta relación quiere decir que es "igual" al valor esperado de µo. (b)
Ho: µ ≥ µo
(5-26a)
Esta relación con la desigualdad ≥ quiere decir "cuando menos" que o "igual o mayor que" el valor esperado de µo) (c)
Ho: µ ≤ µo
(5-26b)
En esta relación la desigualdad ≤ quiere decir "a lo menos", "nomás que" o "igual o menor que" el valor esperado de µo 2. Pruebas alternativas. Estas pruebas se denotan por los símbolos H1:, H2: o H3:.
5-41
Dr. Héctor Quevedo Urías
Estas pruebas alternativas no deben de contener igualdades, como en el caso de usar los símbolos =, ≥ , o ≤ , que denotan las hipótesis nulas, sino que deben de tener desigualdades como > o µo, si Ho:µ ≤ µo
(5-26e)
Por ejemplo, si se prueba la hipótesis nula de que el valor esperado poblacional es µo = 50.0, entonces, la prueba de hipótesis nula es Ho:µ = 50.0, y las hipótesis alternativas son Ho:µ ≠ 50.0, H1:µ > 50 y H2:µ < 50. Además, si estuviéramos probando las hipótesis nulas de Ho:µ ≥ 50.0, entonces, la hipótesis alternativa es H1:µ < 50. De igual manera, si estuviéramos probando la hipótesis nula de que Ho:µ ≤ 50, entonces la hipótesis alternativa debe ser H1:µ > 50.0 Nota 1. Si estamos haciendo nuestras propias pruebas, deberíamos arreglar las hipótesis nulas y las alternativas de tal manera que, el error más serio fuera el rechazo de una prueba de hipótesis verdadera (error I). Aquí, en este texto, estamos asumiendo que estamos haciendo las pruebas hechas por alguien más. Idealmente, deberíamos hacer todas las pruebas y reclamos de tal manera que todas fueran hipótesis nulas. Estas líneas fueron escritas con el entendimiento de que, no todos los reclamos son como deberían de ser, porque algunos ejercicios involucran reclamos que son pruebas de hipótesis nulas y otros que involucran hipótesis alternativas. Por ejemplo, si queremos decidir si un procedimiento es mejor que otro, formulamos la hipótesis de que no hay diferencias entre los procedimientos. Semejantes hipótesis se denominan hipótesis nulas y se denotan por Ho. También podemos empezar con hipótesis alternativas (o hipótesis de investigación) que difieren de una hipótesis nula
5-42
Dr. Héctor Quevedo Urías
sustentada. En el establecimiento de las hipótesis, esto, sin embargo, debe estar basado en hechos, pero no en prejuicios. De cualquier manera, si se rechaza la hipótesis nula, (Ho:) nos inclinamos por la hipótesis alternativa (H1:). El criterio para rechazar o aceptar Ho: siguiendo el método clásico, es de que si el valor de la z calculada, es decir, usando la estadística z = ( X - µ) / σ/ n , es mayor que la z tabulada (zα), con su correspondiente valor crítico de α, entonces se rechaza Ho: y se inclina por la hipótesis alternativa H1:. De otra manera, no se rechaza Ho: o se pospone la decisión. 3. Pruebas de hipótesis no tradicionales. Esta pruebas involucran los cálculos de la probabilidad, p. Estas pruebas son formas no clásicas de hacer pruebas de hipótesis nulas, Ho: Estas pruebas vienen en todos los programas de computadora y se pueden hacer con la distribución de z, con la distribución de t de Estudiante, con la JI cuadrada o la distribución F. Identificando las pruebas de estadística de inferencia bilaterales de (con la cola derecha o con la izquierda) y pruebas bilaterales (con dos colas de las distribuciones probadas) Cuando estamos haciendo pruebas de hipótesis, algunas veces es necesario hacer estas pruebas en forma bilateral o unilateral (unilateral derecha o izquierda). Esto se hace usando la distribución normal, la t de Estudiante, la JI cuadrada, la distribución de Fisher, etc. Cuando hacemos nuestras propias pruebas de hipótesis, y sabemos por experiencia que los valores esperados de µo van a ser mayores de ciertos valores (o cuando decimos que H1:µ > µo), entonces usamos el extremo derecho de la distribución y ponemos el nivel de significancia de α = 0.05 o 0.01, con Ho: = a cierto valor. En forma análoga, si los valores esperados van a ser menores de ciertos valores
5-43
Dr. Héctor Quevedo Urías
(o H1:µ < que cierto valor), usamos el extremo izquierdo de la distribución y ponemos el nivel de significancia de α = 0.05 o 0.01. Finalmente, si esperamos que los valores vayan a ser menores o mayores de ciertas cantidades (Ho:µ = a un determinado valor), entonces usamos los dos extremos de la distribución y dividimos α, igualmente, entre dos, para que nos dé, α = 0.05/2 o α = 0.01/2, etc. Si hacemos las pruebas de otros, por medio del examen de la hipótesis nula, Ho: podemos deducir si la prueba es de dos colas o de una cola (derecha o izquierda). Por ejemplo, si Ho:µ = 98.6, entonces H1:µ ≠ 98.6 y se dice que las pruebas alternativas son de H1:µ > 98.6 y H1:µ < 98.6. No obstante, si la prueba de hipótesis nula es de Ho:µ ≥ 98.6, entonces, la cola de la hipótesis alternativa (que es lo contrario de la hipótesis nula Ho:) apunta a la izquierda (como µ < 98.6), y la prueba es de la cola izquierda (unilateral izquierda). Sin embargo, si Ho:µ ≤ 98.6, entonces la prueba es de que µ > 98.6, y la prueba es de la cola derecha (unilateral derecha). Resumen en el establecimiento de las pruebas de hipótesis bilaterales (dos colas) o unilaterales (de la cola derecha o de la izquierda): Si la prueba de hipótesis nula es Ho:µ = µo, entonces, la prueba es bilateral y las hipótesis alternativas son: H1:µ ≠ µo. H2:µ > µo y H3:µ < µo, donde µo es el valor esperado. Si la prueba de hipótesis nula es Ho:µ ≥ µo, entonces, la prueba es unilateral izquierda y la hipótesis alternativa es H1:µ < µo. Si la prueba de hipótesis nula es Ho:µ ≥ µo, entonces, la prueba es unilateral derecha y la hipótesis alternativa es H1:µ > µo. Definiendo los pasos clásicos en el procedimiento para hacer pruebas de hipótesis 1. Establecer la prueba de hipótesis nula (Ho:) y el promedio esperado µo y las pruebas
5-44
Dr. Héctor Quevedo Urías
de hipótesis alternativas (H1, H2:, H3:). En este renglón, si se usa la distribución normal, también es necesario hacer ciertas suposiciones de que la muestra es aleatoria, de que la población muestreada es normal y, de que la desviación estándar poblacional, σ es conocida. 2. Seleccionar el nivel de significancia de α deseado (0.05, 0.01, etc., e. g. del 95%, del 99%, etc.). Aquí, para la prueba de dos colas, es zα/2 y para las colas derecha o izquierda, simplemente α. 3. Determinar la prueba estadística que se va a usar para el promedio, la varianza, las proporciones, etc., que se van a probar, es decir, usando las distribuciones z, t, χ2, F, etc. De esta manera, si n ≥ 30 casos se usa la distribución de z para el promedio. De otra manera, si n < 30 se usa lo que se llama teoría de muestreo pequeño, como la t de estudiante, la JI cuadrada, etc. 4. Definir las regiones críticas, es decir, de una cola (izquierda o derecha) o de dos colas. (Ver resumen de pruebas para dos colas, para la derecha o para la izquierda). Por ejemplo, si H1:µ > un valor, se usa la cola derecha. Si µ < que un valor, se usa la cola izquierda, pero si µ es desigual a un valor dado se usan dos colas. Aquí, sin embargo, es de notarse que estas circunstancias dependen del diseño experimental que se quiera hacer. 5. Definir la regla de decisión, es decir, de rechazar o de retener o aceptar la hipótesis nula, Ho: y/o de inclinarse por las hipótesis alternativas, H1:, H2:, etc. 6. Hacer los cálculos necesarios de los datos de la muestra y calcular el valor de la función estadística de las distribuciones de z, de t, de χ2, etc., que se vayan a usar. Por ejemplo, si usamos la distribución normal de z o la de t de estudiante para el promedio aritmético, usamos: z = ( X - µ) / σ/ n o bien t = ( X - µ) / s/ n
5-45
Dr. Héctor Quevedo Urías
Nótese que la única diferencia entre la z y la t es de que en la z se usa σ y en la t se usa s para la desviación estándar. 7. Comparar el valor de la función usada con la regla de decisión establecida, y hacer la decisión estadística clásica o tradicional (que se diseñó en el siglo antepasado) acerca de la hipótesis nula. Aquí también se puede hacer la prueba de la probabilidad de p, que es una prueba no tradicional o moderna de la era cibernética. Así, si el valor de la estadística calculada es mayor que la zc o t tabuladas, se rechaza la hipótesis nula, Ho: y se inclina por la hipótesis alternativa. De otra manera no se rechaza Ho: o no se hace ninguna decisión. Esta prueba de probabilidad p, se hace para ver, con qué tanta fidelidad (en términos de probabilidad) pudiéramos estar acertados o equivocados en haber rechazando la hipótesis nula. Aquí, por ejemplo, si el valor de p es menor que el valor del nivel de significancia de α, se rechaza la hipótesis y se dice si es significante o muy significante, etc. Reglas de decisión bajo varias condiciones con las distribuciones z y t Para la distribución normal: Cuando n ≥ 30 casos, σ conocida y, a sabiendas que la distribución es normal. Para pruebas bilaterales (dos colas): rechazar Ho: y aceptar H1:, si el valor de la estadística z es mayor que la zc tabulada; de otra manera aceptar Ho: o postergar la decisión. Para pruebas unilaterales (una sola cola), digamos, la izquierda: rechazar Ho: y aceptar H1: si el valor de la estadística z es menor que la zc tabulada. De otra manera, aceptar o retener Ho: Para pruebas unilaterales (una sola cola), digamos la derecha: rechazar Ho: y aceptar H1: si el valor de la estadística z es mayor que la zc tabulada; de otra manera, aceptar la Ho:
5-46
Dr. Héctor Quevedo Urías
Para la distribución de t de Estudiante: Cuando n ≥ 30 casos, σ desconocida y sabiendo que la población muestreada es normal. Para pruebas bilaterales (dos colas): rechazar Ho: y aceptar H1: si el valor de la estadística t > +tα/2. Hacerlo de igual manera, si el valor de la estadística t < -tα/2; de otra manera, retener Ho: Para una sola cola, digamos la izquierda, rechazar Ho: y aceptar H1: si el valor de la estadística t < -tα; de otra manera aceptar Ho o no hacer ninguna decisión Para una sola cola, digamos la derecha: rechazar Ho: y aceptar H1: si el valor de la estadística t > +tα. De otra manera aceptar Ho: La idea detrás de hacer pruebas de hipótesis Como se dijo antes, la idea de hacer pruebas de hipótesis es la de acumular evidencia para rechazar la hipótesis nula. En el campo de la investigación científica, todos los investigadores siempre están esperanzados en rechazar las hipótesis nulas de sus trabajos de investigación. Cosa similar ocurre con la ingeniería industrial y de manufactura. Los ingenieros industriales siempre tienen que hacer pruebas de hipótesis periódicas de los productos manufacturados o de los artículos producidos por la industria de manufactura. Esto se hace con el objeto de revisar la eficiencia de la línea de producción de la fábrica. Esto se debe a que, al rechazar una hipótesis nula, esto denota un diseño experimental fuerte y confiable. En la industria de manufactura los rechazos de hipótesis indican que la línea de producción está operando normalmente. En las pruebas de hipótesis, el valor de s o de σ es muy importante, porque ahí se refleja las técnicas del laboratorio refinadas o defectuosas. Un valor bajo de s refleja técnicas de laboratorio muy sofisticadas o refinadas, mientras que un valor alto
5-47
Dr. Héctor Quevedo Urías
de s, refleja lo contrario. Todo esto se explica y se prueba a través del poder de la prueba y de los errores estándar del promedio, de la desviación estándar, etc. El valor de p en la toma de decisiones En las pruebas de hipótesis hay otra forma alternativa moderna computarizada de probar la misma situación (que se hace con la prueba clásica de hipótesis que se diseñó en el siglo antepasado), es decir, el enfoque moderno. En verdad, el valor de p es la probabilidad, bajo la hipótesis nula (o la probabilidad, si la hipótesis nula es verdadera), de obtener un valor tan inusual o más inusual que aquél que obtuvimos de la muestra, cuando la hipótesis nula es verdadera (una situación inusitada). Esta prueba no tradicional se hace usando el valor de la probabilidad p. Por ejemplo, cuando rechazamos o aceptamos una hipótesis nula Ho: y nos inclinamos por la hipótesis alternativa, H1:, con un nivel de significancia de α = 0.05 o igual a 0.01, etc., queremos saber, qué tanta confiabilidad podemos poner al hacer nuestras decisiones estadísticas. Este grado de confiabilidad se da por la probabilidad, p. En verdad, el concepto filosófico del valor de p es que este valor representa un decremento en el grado de confiabilidad en un resultado. Este enfoque está diseñado para darnos la alternativa (en términos de probabilidad), de rechazar o no rechazar la hipótesis sustentada. Así, entre más bajo sea el valor de p, menos podemos creer en la hipótesis nula. Específicamente hablando, el nivel de p representa la probabilidad de error en aceptar los resultados observados como válidos. Por ejemplo, con un valor de p = .05 esto significa 1/20, es decir que pudiéramos estar equivocados con una probabilidad de 1 en 20 en la decisión de rechazar la hipótesis nula, Ho: sustentada. Además, si p = .01, esto es, 1/100, indica que pudiéramos estar equivocados en nuestra decisión de rechazar la hipótesis con una probabilidad de 1 en 100. (Aquí, en estos casos, nadie va a argumentar que vamos
5-48
Dr. Héctor Quevedo Urías
a equivocarnos en nuestra decisión, con esta probabilidad tan baja). En términos generales, valores grandes de p, digamos > 0.1 apoyan el no rechazo de la hipótesis (es decir se acepta o se reserva una decisión). Por otro lado, valores pequeños de p apoyan el rechazo de la hipótesis. Los tipos de mecanismos que se siguen para establecer las pruebas de hipótesis 1. La hipótesis nula se puede hacer como: Ho:µ = µo. Bajo estas condiciones de igualdad, las hipótesis alternativas son: H1:µ ≠ µo, H2:µ < µo y H3:µ > µo, donde µo es el promedio poblacional que se quiere probar. Aquí, cabe notar que en este caso, la prueba de hipótesis es bilateral o de dos colas. 2. También la hipótesis nula se puede hacer como: Ho:µ ≥ µo. En este caso, la hipótesis alternativa es Ho:µ < µo. Aquí, la prueba de hipótesis es unilateral izquierda. 3. Igualmente, la hipótesis nula se puede hacer como: Ho:µ ≤ µo. En este caso la hipótesis alternativa es H1:µ > µo. Aquí, la prueba de hipótesis es unilateral derecha. 4. Seleccionar un nivel de significancia de tamaño α, esto es, α = .05 o α = .01 con sus respectivos niveles de confianza de 95% y 99%. También, se pueden usar otros niveles de significancia, como el .10, .20, etc., pero los más comunes son los de 0.05 y .01. 5. Seleccionar la estadística apropiada (por ejemplo, si n > 30 casos se usa la distribución z. Si la muestra es n < 30 casos y la población muestreada no es normal se usa la distribución de t, etc. 6. Se establecen las regiones críticas usando niveles de confianza del 95%, 99%, 90%, 80% etc. (95% y 99% los más comunes) 7. Se estima el valor de la prueba de estadística de la muestra y se compara con el valor de la estadística calculada, es decir, zcalc. o tcalc. (de las regiones críticas) y se
5-49
Dr. Héctor Quevedo Urías
comparan con ztab. o ttab. Si la estadística calculada es mayor que la estadística tabulada (de las regiones críticas) se rechaza la hipótesis nula. De otra manera, se acepta la hipótesis o no se hace ninguna decisión. De esta manera, si el valor de la estadística calculada se mete en las regiones críticas se rechaza la hipótesis nula (o también si el valor de p es menor o igual al nivel de significancia, α deseado). Nota: Aquí es importante recordar que, la prueba de hipótesis nula estadística se diseñó el siglo antepasado. En tiempos modernos de la era cibernética, existe la prueba no tradicional relacionada con el valor de la probabilidad p. También es importante notar que muchos programas de computadora dan únicamente el valor de p y el investigador o lector tiene que interpretarlo acordemente. Mecanismos para calcular los valores de la probabilidad p (para la distribución normal) cuando se hacen las pruebas de hipótesis no tradicionales (calculando el valor de p) 1. Para calcular el valor de la probabilidad p, se busca el valor de la z calculada en la tabla de la distribución normal, con el valor del nivel de significancia usado. Los criterios que se siguen se hacen comparando el valor de la p con el valor de α. 2. Los criterios que se siguen para interpretar el valor de p son: P ≤ .05 La prueba está en el umbral de la significancia. Aquí casi siempre se acepta la hipótesis nula. Es un argumento débil y no convincente en la pruebas de hipótesis. Nos deja en una situación de incertidumbre. Nos dice que, “tal vez así sea”. P ≤ .01 La prueba es altamente significativa. Se considera un argumento estadístico muy fuerte en contra de la aceptación de la hipótesis nula. La probabilidad de .01 dice que pudiéramos habernos equivocado en la decisión de rechazar la hipótesis nula, con una probabilidad de 1 en 100 de haber
5-50
Dr. Héctor Quevedo Urías
rechazado una hipótesis verdadera, cuando debió ser aceptada. P ≤ .001 La prueba es mucho muy significativa. Se considera un argumento estadístico mucho muy fuerte, conciso y preciso. Aquí, la probabilidad con la cual pudiéramos habernos equivocado en haber hecho una decisión errónea en el rechazo de la hipótesis nula es de una milésima, es decir, de 1 en 1000. Interpretación matemática de los valores de la probabilidad p (Pfaffenberg et al. 1987) Forma I. Valor de p = 2P[X > x], si Ho: µ = µo con H1: µ > µo Valor de p = 2P[X < x], si H2: µ < µo Forma II. Valor de p = [X < x], si Ho: µ ≥ µo, con H1: µ < µo Forma III. Valor de p = P[X > x], si Ho: µ ≤ µo con H1: µ > µo Donde: X es ≤ , ≥ , = , que, el promedio muestral X Ejemplo #33. Abajo se dan los valores de la z calculada. Calcular el valor de la probabilidad p, si: (a) El valor de z = 3.2, con Ho:µ = µo. (b) El valor de z = 3.0, con Ho:µ ≤ µo (c) El valor de z = -3.2, con Ho:µ ≥ µo. Solución: (a) Buscamos el valor de z = 3.2 en la tabla de la distribución normal y da un valor de .9993. Entonces, para calcular el valor de la probabilidad p procedemos como sigue: p = 1 - .9993 = .0007. Sin embargo, debido a que la prueba es bilateral, este valor de p se multiplica por 2 para dar p = .0014. (b) Buscamos el valor de z = 3.0 en la tabla de la distribución normal y nos da .9987. Entonces, para calcular el valor de la probabilidad, p procedemos como:
5-51
Dr. Héctor Quevedo Urías
p = 1 - .9987 = .0013 Como la prueba es unilateral, así se queda. (c) Para z = -3.2 con Ho: µ ≥ µo. Esta es una prueba unilateral izquierda (porque el valor de z es negativo). Buscamos este valor en la tabla de la distribución normal y da .0007. Metodología para calcular los valores de la probabilidad p dependiendo de la estadística usada Para las pruebas de hipótesis no tradicionales, es decir, usando el valor de la probabilidad p, es necesario hacer interpolaciones de los valores obtenidos. Sin embargo, en el caso de la distribución normal, para estimar el valor de la probabilidad p, no es necesario hacer interpolaciones, porque se puede leer directamente en la tabla de la distribución normal el valor de la estadística z calculada. No obstante, para la distribución de t de estudiante, para la distribución Fisher, para la distribución de la JI cuadrada, etc., si es necesario hacer interpolaciones. Esto se hace buscando el valor de la estadística calculada en la tabla de la distribución que se está usando con su correspondiente valor de grados de libertad y del valor porcentual deseado. Fórmula empírica para hacer interpolaciones y calcular el valor de la probabilidad p Aquí vamos a dar un método para hacer interpolaciones usando una fórmula empírica diseñada por el autor de este libro, el Dr. Héctor Quevedo Urías (autor de este libro) y por la Dra. Socorro Arteaga. Esta fórmula se da como: (λ2 – λ1)/(TR2 – TR1) = (λ2 – X)/(TR2 – TRcalc.) Donde: λ2 = El nivel de confianza más alto de la tabla de la distribución usada.
5-52
(5-27)
Dr. Héctor Quevedo Urías
λ1 = El nivel de confianza más bajo de la tabla usada. TR2 = probabilidad de la estadística usada correspondiente a λ2. TR1 = probabilidad de la estadística usada correspondiente a λ1. X = valor que se quiere interpolar. Aquí, cuando la prueba es bilateral este valor se multiplica por 2. TRcalc. = valor de la estadística calculada. Fórmulas para calcular el valor de p por medio de interpolaciones para diferentes distribuciones Para la distribución de t de Estudiante (la cual se retomará en el capítulo 6): (λ2 – λ1) / (t2 – t1) = (λ2 – X) / (t2 – tcalc.)
(5-28)
Para la distribución de la JI cuadrada: (λ2 – λ1) / (χ22 – χ21) = (λ2 – X) / (χ22 – χ2calc.)
(5-29)
Para calcular la distribución F: (λ2 – λ1) / (F2 – F1) = (λ2 – X) / (F2 – Fcalc.)
(5-30)
Ejemplos mostrando la manera de calcular el valor de la probabilidad p Ejemplo #34. Supóngase qué, si el valor calculado de la estadística de la distribución de z fuera, digamos de z = - 3.4 con una prueba de hipótesis bilateral, entonces, buscamos este valor en la tabla de la distribución normal y nos da .0003. Este valor es precisamente el valor de la probabilidad p. Pero como la prueba es bilateral, se multiplica por dos y da p = .0006. Ejemplo #35. Supóngase ahora que el valor de la estadística z fuera digamos z = 3.4 con una prueba bilateral. Entonces buscamos este valor en la tabla de la distribución normal y vemos que está al extremo derecho con un valor de .9998. Ahora le restamos 1 y nos da p = 1 - .9998 = .0002. Nuevamente, como la prueba es bilateral, el valor lo multiplicamos por dos y da p = .0004.
5-53
Dr. Héctor Quevedo Urías
5-54
Dr. Héctor Quevedo Urías
Prueba de hipótesis para un solo promedio poblacional µ con varianza σ2 conocida usando la distribución normal Una hipótesis estadística es una aseveración o conjetura con respecto a una o más poblaciones. En estadística, una hipótesis es un enunciado de que algo es verdadero. En la verdad o falsedad de una hipótesis estadística siempre hay una incertidumbre, porque no se puede muestrear toda la población (esto sería imposible). En lugar de esto, se toma una muestra aleatoria de la población de interés y se usan los datos para proporcionar evidencia (en términos de la probabilidad p) para apoyar o refutar la hipótesis. Por ejemplo, la aceptación de una hipótesis nula implica que no hay suficiente evidencia para poder rechazar la hipótesis. No obstante, si se rechaza una hipótesis hay una evidencia más fuerte e implica un diseño experimental fuerte, preciso y conciso. Contrariamente, el no rechazo de una hipótesis implica un diseño experimental débil, con una muestra de insuficiente tamaño o técnicas de laboratorio defectuosas que conllevan mucha variación. La estadística que se usa para hacer pruebas de hipótesis para un solo promedio poblacional µ, con varianza conocida α usando la distribución normal, a sabiendas de que la población muestreada es normal o que n > 30 casos, es: z = ( X – µo) / σ/ n
(5-31)
Donde: z = variable aleatoria normal estándar X = promedio estadístico
µo = valor esperado del promedio σ = desviación estándar conocida n = tamaño de la muestra La tabla de abajo muestra los cálculos de las regiones críticas usando diferentes
5-55
Dr. Héctor Quevedo Urías
niveles de significancia. TABLA 5.5. Tabla mostrando las regiones críticas de acuerdo al valor del nivel de confianza usado, es decir, si la prueba de hipótesis es bilateral, unilateral derecha o unilateral izquierda. (Elaboración propia) Nivel de confianza (%)
90%
95%
99%
99.5%
1.28
1.645
2.33
2.58
o -1.28
o -1.645
o -2.33
o -2.58
Valores críticos de z para pruebas unilaterales (derecha o izquierda)
___________________________________________________________________ Valores críticos de z para
±1.645
±1.96
±2.58
±2.81
pruebas bilaterales Por ejemplo si usamos un nivel de confianza de 95%, es decir, un nivel de significancia de α = 0.05, para una prueba de hipótesis unilateral izquierda, entonces, bajo estas condiciones, el valor crítico de z es -1.645. Similarmente, si se usa el nivel de significancia de α = 0.10, para una prueba de hipótesis unilateral derecha, entonces, el valor crítico de z es de +1.28. Cabe notar qué, para las pruebas de hipótesis, los valores de los niveles de significancia más comunes son los de α = 0.05 y de α = 0.01. Por ejemplo, para una prueba bilateral con α = 0.05, los valores críticos de z son de ±1.96. No obstante, para una prueba unilateral izquierda con α = 0.05, el valor crítico de z sería de de -1.645 y así sucesivamente. Ejemplos de pruebas de hipótesis usando la distribución normal Ejemplo #36. Se saca una muestra de 36 análisis de nitratos (NO3-) para el diseño de una planta de tratamiento de aguas industriales. Para esto, se calcula un promedio
5-56
Dr. Héctor Quevedo Urías
estadístico de X = 92 mg/L. Estudios previos indican una desviación estándar conocida de σ = 9 mg/L. Probar la hipótesis de que el valor esperado de µo es 100 mg/L. Asumir α = 0.05 y calcular el valor de la probabilidad p. Solución: 1. La hipótesis nula es Ho:µ = 100. 2. Las hipótesis alternativas son H1:µo ≠ 100, H2:µo > 100, H3:µo < 100. 3. Las suposiciones son que la poblacional muestreada es normal, σ es conocida y, la muestra es aleatoria. 4. Con el nivel de significancia de α = 0.05 (nivel de confianza 95%), las regiones críticas y los coeficientes críticos son de ±1.96. 5. La estadística usada es la de la distribución z , z = ( X – µo) / σ/ n 6. Sustituyendo los valores de X = 92, µo = 100, σ = 9 y n = 36 en la fórmula de arriba da: z = (92 – 100) / 9/ 36 = - 5.3 7. Ahora comparando la zcalc. = – 5.3 con la z tabulada ztab. Igual a -1.96, se rechaza la hipótesis y nos inclinamos por H3:µo < 100. 8. El valor de la probabilidad p se calcula buscando el valor de –5.3 en la tabla de la distribución normal, pero como no está tomamos el valor de .0003. Además, como la prueba es bilateral, entonces, multiplicamos .0003 por 2, es decir, (2)(.0003) = .0006. Este valor es mucho muy significante y da mucha evidencia para apoyar el rechazo de la hipótesis. Ejemplo #37. Una muestra aleatoria de 36 concentraciones atmosféricas de óxidos de nitrógeno (NOx), en mg/L, mostró un promedio estadístico o de la muestra de X =
5-57
Dr. Héctor Quevedo Urías
74.0 mg/L. Suponiendo que σ2 = 81.0 mg/L, ¿indicaría esto que un límite de concentraciones de NOx esté arriba de 70 mg/L? Usar α = 0.05. Solución: 1. La prueba de hipótesis nula debe ser Ho:µ ≤ 70, porque la hipótesis alternativa, dada por el problema, es H1:µ > 70. 2. Por lo tanto, la prueba de hipótesis es una prueba unilateral derecha. 3. La región crítica es zα = z0.05 = 1.645 4. La estadística usada es z = ( X – µo) / σ/ n Sustituyendo los valores del promedio X = 74, de la desviación estándar σ = 9, n = 36 y µo = 70 en la función estadística z da: z = (74 – 70) / 9/ 36 = 2.66 5. Al comparar el valor de zcalc. = 2.66, con ztab. = 1.645, se rechaza la hipótesis nula y se dice que, H1:µ > 70, con un valor de p = 1 - .9961 = .0039, de haber hecho la decisión equivocada. Aquí, nótese que el valor de p no se multiplica por 2, porque la prueba es unilateral derecha. Como resultado, la evidencia a favor de H1: es más fuerte que la sugerida por un nivel de significancia de 0.05 (porque .0039 4.85. Las regiones críticas con α = 0.05 y α = 0.01, para una prueba de hipótesis bilateral son, respectivamente, ±1.96 y ±2.58. Usando la estadística z = ( X – µo) / σ/ n con X = 5 ppm, µo = 4.85, σ = 0.3 y n = 36 y sustituyendo todos estos valores en la estadística de arriba nos da: z = (5.0 – 4.85) / 0.3/ 36 = 3.0 En conclusión, debido a que el valor de zcalc. = 3.00 es mayor que el valor crítico de 1.96 se rechaza Ho: y nos inclinamos por la hipótesis alternativa de H3:µ > 3.85. Cosa similar ocurre con el nivel de significancia de α = 0.01, porque el valor de 3.00 es mayor que el valor crítico de 2.58. Por otra parte, con respecto a la estimación del intervalo de confianza del 95%, que corresponde a un nivel de significancia de α = 0.05, los valores críticos son de ±1.96. La estimación puntual de µ es X = 5.0. Para calcular el intervalo de confianza de 95%, se sustituyen los valores en ecuación (5-24) de abajo para dar: X – zα/2 σ/ n < µ < X + zσ/2 σ/ n
5.0 – (1.96)(0.3)/ 36 ) < µ < 5.0 + (1.96)(0.3/ 36 ) El cual se simplifica a:
5-61
Dr. Héctor Quevedo Urías
4.902 < µ < 5.098 Por otra parte, el valor correspondiente a un intervalo de confianza del 99%, es decir, con un nivel de significancia de α = 0.01, en este caso los valores críticos son de ±2.575. La estimación puntual de µ es X = 5.0. De aquí que el intervalo de confianza del 99%, es: 5.0 – (2.58)(0.3/ 36 ) < µ < 5.0 + (2.58)(0.3/ 36 ) El cual se simplifica a: 4.871 < µ < 5.129 Ejemplo #41. En un estudio de higiene industrial y seguridad, las temperaturas del cuerpo de un grupo de 100 trabajadores industriales, que laboran un frigorífico, se analizaron. La temperatura promedio fue de 98.2 oF con una desviación estándar de 0.62 oF. Encontrar el mejor punto estimador del parámetro poblacional µ de todas las temperaturas del cuerpo. Para un nivel de confianza de 95%, encontrar, ambos, el margen de error E y el intervalo de confianza para µ. Solución: Usando la función: X – zα/2(σ n ) < µ < E + zα/2(σ/ n )
(5-32)
Donde: E = margen de error = zα/2(σ/√ n). Ahora, sustituyendo los valores apropiados, con zα/2 = 1.96, σ = s = 0.62 (porque n > 30), X = 98.2 y n = 100, obtenemos: 98.2 – 1.96(0.62)/( 100 ) < µ < 98.2 + 1.96(0.62)/ 100 ) 98.2 – 0.12 < µ < 98.2 + 0.12 98.08 < µ < 98.32 El valor del margen de error es E = 1.96(0.62)/( 100 ) = 0.1215. Este intervalo 98.08 < µ < 98.32 dice que si fuéramos a seleccionar muchas muestras
5-62
Dr. Héctor Quevedo Urías
de un tamaño de 100 y construyéramos un intervalo de confianza, el 95% de estas muestras contendrían el promedio poblacional µ. Aquí, nótese que el intervalo de confianza no contiene el valor de 98.6 oF, la cual es la temperatura normal del cuerpo. Ejemplo #42. Se saca una muestra aleatoria de una población normal. Los valores de las observaciones son: 22, 24, 22, 25, 30, 28, 29, 28, 24, 23, 25, 27, 26, 23, 24, 21, 22, 21, 25, 21, 23, 24, 21, 20, 21, 20, 22, 28, 27. Hacer los siguientes cálculos usando el programa Minitab. (a) Calcular la estadística descriptiva y determinar el 95% del intervalo de confianza para el promedio poblacional µ. (b) Determinar el 95% del intervalo de confianza para la desviación estándar σ, y la mediana. (c) Hacer una prueba de normalidad usando la estadística de Kolmogorov-Smirnov. Solución: Para estimar los incisos (a) y (b) usar el programa Minitab de la siguiente manera: Stat > Basic statistics > Graphical Summary Esto genera la Figura 5.15 de abajo, la cual incluye histograma con curva normal sobrepuesta, los intervalos de confianza para el promedio poblacional, la mediana, la desviación estándar, la estadística descriptiva, la prueba de Anderson-Darling, los cuartiles, etc..
5-63
Dr. Héctor Quevedo Urías S umma r y for V a lor e s de la s obs e r v a cione s A n d e rs o n -D a rlin g N o rm a lity T e s t
20
22
24
26
28
A -S q u a re d P -V a lu e
0 .6 4 0 .0 8 5
M ean S tD e v V a ria n ce S k e w ness K u rto s is N
2 4 .0 0 0 2 .8 6 6 8 .2 1 4 0.488813 -0 . 8 2 2 3 1 6 29
M in im u m 1 s t Q u a rtile M e d ia n 3 rd Q u a rtile M a xim u m
30
2 0 .0 0 0 2 1 .5 0 0 2 4 .0 0 0 2 6 .5 0 0 3 0 .0 0 0
9 5 % C o n f id e n ce I n te rv a l fo r M e a n 2 2 .9 1 0
2 5 .0 9 0
9 5 % C o n f id e n ce I n te rv a l fo r M e d ia n 2 2 .0 0 0
2 5 .0 0 0
9 5 % C o n fid e n c e I n te rv a l f o r S tD e v
9 5 % C o n f id e n c e I n te r v a ls
2 .2 7 4
3 .8 7 6
M e an M edian 22.0
22.5
23.0
23.5
24.0
24.5
25.0
Figura 5.15. Figura mostrando el histograma de los datos con curva normal sobrepuesta, los intervalos de confianza para el promedio y la mediana y la estadística descriptiva. Para el inciso (c), es decir, para la prueba de normalidad de los datos esto se hace usando la estadística de Kolmogorov-Smirnov, del programa Minitab. Siendo así, se procede de la siguiente manera: Basic Statistics → Normality Test En la ventanilla del recuadro de Normality Test introducir las variables y puntear Kolmogorov-Smirnov. Esto genera la figura de abajo.
5-64
Dr. Héctor Quevedo Urías
Figura mostrando la grafica de los valores. Normal 99
Mean StDev N KS P-Value
95 90
24 2.866 29 0.085 >0.150
Percent
80 70 60 50 40 30 20 10 5
1
16
18
20
22
24 C1
26
28
30
32
Figura 5.16. Gráfica mostrando la prueba de normalidad usando la función de Kolmogorov-Smirnov. Como se ve en la Figura 5.16, las probabilidades (o porcentajes en este caso) se grafican en función de los valores estipulados por el problema. Luego el programa traza una línea de los cuadrados mínimos, con el objeto de verificar si los puntos están dentro de las bandas de confianza. Sin embargo, es de notarse que, en comparación con la función de Anderson-Darling o de Lilliefors, la prueba de Kolmogorov es menos precisa que la función de Anderson-Darling. Sin embargo, la función de Kolmogorov-Smirnov se sigue usando, tradicionalmente, por muchos investigadores estadísticos. Ejemplo #43. Un fabricante de sistemas de aspersión contra incendios, que se instalan dentro de casas y edificios, argumenta que el promedio poblacional de temperatura de sus sistemas de aspersión contra incendios es de 54.4 oC. Para esto se saca una muestra aleatoria de 16 unidades, las cuales, al probarse dan un promedio estadístico
5-65
Dr. Héctor Quevedo Urías
de 55.0 oC, con una desviación estándar de 1.0 oC. Si se sabe que la distribución de los tiempos de activación de los sistemas de aspersión, contra los incendios, de este fabricante, es normal, ¿se refutaría el argumento del fabricante de que el verdadero promedio es el que se menciona arriba? Asumir un nivel de significancia de 0.05. 1. Aquí la prueba de hipótesis es Ho:µ = 54.4 contra la prueba de hipótesis alternativa de H1:µ ≠ 54.4. 2. Debido a que la prueba de hipótesis llena la condición de igualdad, la prueba es bilateral, es decir, z ≥ z.025 y z ≤ z.025, esto es, z ≥ 1.96 o z ≤ -1.96. 3. Usamos la distribución de z, aunque el tamaño de la muestra no sea de n > 30 casos. Esto es así, porque sabemos de antemano que la población muestreada es normal. También se pudiera usar la distribución de t de estudiante, pero en este caso es mejor usar la distribución z porque es mas precisa. 4. Siendo así, el valor de la prueba estadística es: z = (55.0 – 54.4) / 1.0/ 16 = 2.4 5. De acuerdo al inciso (4) el promedio muestral observado se encuentra a 2.4 desviaciones estándar arriba de lo que se hubiera esperado, si Ho: fuera verdadera. 6. En conclusión, debido a que el valor calculado de z cae en la región crítica derecha, se rechaza la prueba de hipótesis tradicional. 7. Ahora, para hacer la prueba de hipótesis no tradicional, es decir, calculando el valor de p, buscamos en la tabla de la distribución normal el valor de 2.4 y vemos que el valor de la probabilidad p es p = 2(1 – 0.9918) = 0.0164. 8. El valor de p = 0.0164 contradice la afirmación del fabricante de que el verdadero promedio de sus productos contra incendios es de 54.4 oC.
5-66
Dr. Héctor Quevedo Urías
Pruebas de hipótesis para las diferencias de dos promedios poblacionales (µ1 – µ2), para muestras grandes (n ≥ 30) usando la distribución normal, con varianzas conocidas e iguales (σ21 = σ22). Aquí se asume que las dos muestras son independientes Hasta ahora, hemos discutido pruebas de hipótesis de una sola muestra aleatoria, es decir, para un solo promedio. Ahora, vamos a discutir pruebas de hipótesis donde se involucran 2 muestras provenientes de dos poblaciones. De esta manera, en muchos problemas prácticos estamos interesados en comparar dos poblaciones con relación a alguna característica cuantitativa. Por ejemplo, la comparación de dos métodos para medir el mismo proceso cualitativo o cuantitativo. En ingeniería ambiental, por ejemplo, se pueden comparar dos métodos para medir las concentraciones de arsénico en muestras de agua. Otra aplicación sería medir dos métodos para el cadmio en muestras de agua, y así sucesivamente. En términos estadísticos, si se tienen dos poblaciones con medias µ1 y µ2 y con varianzas σ1 y σ2 respectivamente, el estimador puntual de la diferencia de los promedios (µ1 - µ2) lo da el estadístico ( X 1 – X 2). Por lo tanto, para obtener una estimación puntual de (µ1 – µ2) se seleccionan dos muestras aleatorias independientes, una de cada población de tamaños n1 y n2 y se calcula la diferencia, X 1 – X 2. De esta manera, dejemos que X 1 y X 2 sean los promedios de dos muestras grandes de tamaños n1 y n2 sacados de dos poblaciones que tienen promedios de µ1 y µ2 y desviaciones estándar de σ1 y σ2, respectivamente. Entonces, si ponemos µ1 = µ2 estamos diciendo que no hay diferencias entre ambos promedios poblacionales, que es lo mismo que decir, que dos muestras se sacaron de poblaciones que tienen el mismo promedio, µ. La estadística que se usa para estimar las diferencias entre dos promedios es:
5-67
Dr. Héctor Quevedo Urías
z = [( X 1 - X 2) - (µ1 - µ2)] /
σ +σ n
2
2
1
2
n
1
(5-33)
2
Donde: X 1, X 2 = promedios de muestras uno y dos, respectivamente
σ21, σ22 = varianzas de muestras uno y dos respectivamente ( X 1 – X 2) = estimador puntual de (µ1 – µ2) n1 y n2 = tamaños de muestras uno y dos, respectivamente z = variable normal estándar Si se asume que σ1 = σ2 = σ, la estadística de arriba se reduce a: z = ( X 1 – X 2) – (µ1 – µ2) / σ
1
+
1
n n 1
(5-34)
2
Las funciones para las pruebas de hipótesis nulas y las alternativas, son: Ho:µ1 - µ2 = 0
es decir, que
µ1 = µ2
H1:µ - µ2 ≠ 0 y H2:µ1 - µ2 > δ y H3:µ1 - µ2 < δ Aquí, aunque δ puede ser cualquier valor constante, muchas veces el valor de δ es de 0 y se prueba la hipótesis nula de no "diferencia", es decir Ho:µ1 = µ2. Ejemplo #44. Para medir la calidad del aire de cierta zona industrial, con relación a los óxidos de azufre, se sacaron dos muestras de tamaños 50 y 75, respectivamente. Los promedios fueron de 76 mg/L y de 82 mg/L, respectivamente. Asumir que las varianzas de estas poblaciones son conocidas e iguales a 16. Asumir un nivel de significancia de α = .05. Usando el valor de p, probar que no hay deferencias entre las dos poblaciones muestreadas, que es lo mismo que µ1 = µ2, esto es, µ1 – µ2 = 0 Solución: 1. Usamos la función de z, porque las muestras son grandes. 2. Las hipótesis nulas y alternativas, son, respectivamente:
5-68
Dr. Héctor Quevedo Urías
Ho:µ1 – µ2 = 0 y H1:µ1 – µ2 ≠ 0 3. Los valores críticos correspondientes a las regiones críticas, con α = .05 son de ±1.96. 4. Los valores que se substituyen en la fórmula (5-34) son: X 1 = 76, X 2 = 82, n1 = 50, n2 = 75, σ1 = σ2 = 16. Substituyendo estos valores en la
fórmula (5-34) nos dan: z = [( X 1 – X 2) – (µ1 – µ2)] / σ
1
1
n n 1
= [(76 – 82) – 0] / 16]
+
2
1 1 = 2.05 + 50 75
5. En conclusión, debido a que el valor calculado de z = 2.05 es mayor que la región crítica derecha de 1.96, se rechaza la hipótesis y se concluye que los promedios no son iguales. 6. El valor de la probabilidad p se calcula buscando el valor de z = 2.05 en la tabla de la distribución normal y da 0.9798. Por lo tanto, el valor de la probabilidad es p = 2(1 - .9798) = 0.04. Ejemplo #45. Una compañía farmacéutica quiere probar una droga para la fibrosis pulmonar, la cual es muy común entre los trabajadores industriales. Para esto se prueban dos grupos, es decir, el de "control" (que no usan la droga) y el grupo de "tratamiento" (que si usan la droga). Se toma una muestra de 50 trabajadores a los cuales se les da la droga y otro grupo más de 100 personas, al cual no se les da la droga. La presión arterial se toma para cada sujeto. La compañía de drogas afirma que la droga no causa ningún efecto secundario, para el grupo de tratamiento. Dicho en otras palabras, esto dice que el promedio µ1 del grupo control y el promedio µ2 del grupo de tratamiento son iguales. Probar el reclamo de la compañía de que no hay
5-69
Dr. Héctor Quevedo Urías
efectos secundarios entre el grupo que toma la droga y el que no la toma. (Nota: En este problema, de acuerdo al autor de este libro de estadística, el uso de medicamentos artificiales siempre causará efectos secundarios. Esto se debe a qué, el cuerpo es una esencia natural, que no puede aceptar artificialismos, por ser antagónicos al diseño natural del organismo humano. Además, el medicamento artificial ataca un efecto reactivo (el síntoma de la enfermedad), más no su origen causal (vida antinatural). En verdad, el efecto secundario es una reacción orgánica natural, en respuesta a la acción incompatible del artificialismo médico. De cualquier manera, para este problema usar el nivel de significancia de α = .05. Los cálculos de las variables y sus valores se dan en la tabla de abajo. TABLA 5.6. Tabla mostrando los datos del Ejemplo #45. _________________________________________________________________ Grupo de tratamiento Grupo de control _________________________________________________________________ n1 = 50 n2 = 100 X 1 = 203.4 X 2 = 189.4 σ1 = 39.4 σ2 = 39.0 _________________________________________________________________ Nótese que también se pudiera usar s en lugar de σ, debido a que, el valor de la muestra n es n >>> 30. Solución: 1. El reclamo de la compañía se expresa como µ1 = µ2. Esto quiere decir que, en ninguno de los dos grupos hay un efecto secundario de alta presión arterial. 2. Si el reclamo original es falso, entonces µ1 ≠ µ2 3. La prueba de hipótesis nula contiene la condición de igualdad de manera que, las pruebas de hipótesis nulas y las alternativas son:
5-70
Dr. Héctor Quevedo Urías
Ho:(µ1 - µ2) = 0, H1:(µ1 - µ) ≠ 02, H2:(µ1 - µ2) > 0, H3:(µ1 – µ2) < 0 4. El nivel de significancia es de α = .05 5. El problema satisface las suposiciones de normalidad. 6. Usamos la estadística de z (5-33) que se da abajo y se sustituyen los valores correspondientes: z = [( X 1 - X 2) - (µ1 - µ2)] /
σ +σ n
2
2
1
2
1
= [(203.4 - 189.4) - (0)] /
n
2
39.42 39.02 + = 2.06 50 100
7. Las regiones críticas son de zα/2 = 0.05/2 = ±1.96 8. Debido a que la estadística z cae en la región crítica derecha se rechaza la Ho: µ1 = µ2 y se dice que los promedios son desiguales. 9. Se concluye que si hay efectos secundarios y la droga si causa alta presión arterial. Por lo tanto, se rechaza el reclamo de que, ambos grupos tengan el mismo promedio. De esta manera, se concluye que H2: µ1 - µ2 > 0. 10. Ahora para calcular el valor de la probabilidad p, se busca el valor de z = 2.06 en la tabla de la distribución normal y el valor de la probabilidad correspondiente es de 0.9803. Por lo tanto, el valor de p es de: p = 0.5000 - 0.4803 = 0.0197. Sin embargo, debido a que la prueba de hipótesis es bilateral, el valor de 0.0197 se debe de multiplicar por 2. La Figura 5.17 de abajo muestra toda la información requerida por este problema.
5-71
Dr. Héctor Quevedo Urías
Figura 5.17. Figura mostrando la distribución de las diferencias de los promedios de los dos grupos de control y de tratamiento. (Elaboración propia). Ejemplo #46. Se quieren probar dos analizadores de CO de diferentes marcas, para ver si los dos dan los mismos resultados en las mediciones de CO. Llamemos al primer analizador A y al segundo B. Probar que los resultados de las dos mediciones de CO provenientes de los dos analizadores son iguales. Asumir α = 0.05. Calcular del valor de la probabilidad p. Los datos se dan abajo. TABLA 5.7. Tabla mostrando los datos de este problema. __________________________________________________________________ Muestreador de CO (A)
Muestreador de CO (B)
__________________________________________________________________ n1 = 50
n2 = 100
X 1 = 4.53 kgs.
X 2 = 4.01 kgs.
σ1 = 0.80
σ2 = 0.80
__________________________________________________________________ Solución: Los dos promedios son independientes y σ1 y σ2 son conocidos, por lo tanto, usamos 5-72
Dr. Héctor Quevedo Urías
la distribución normal. Usamos el nivel de significancia de α = 0.05. La prueba involucra dos colas. 1. Las pruebas de hipótesis son: Ho:µ1 = µ2 (o µ1 - µ2 = 0) H1:µ1 ≠ µ2 (o µ1 - µ2 ≠ 0) 2. Las regiones críticas son de ±1.96 3. Una vez que se sustituyen todos los valores en la ecuación de z (5-33), el resultado es de z = 4.06. 4. Debido a que 4.06 cae dentro de la región crítica derecha, se rechaza la hipótesis nula y se concluye que los promedios poblacionales correspondientes a ambos muestreadores de CO no son iguales. Tal parece que el muestreador A da resultados de mediciones de CO, con una probabilidad mucho más significante que el muestreador B. 5. Para calcular el valor de p buscamos z = 4.06 en la tabla de la distribución normal y vemos que el valor más cercano es .9997 o sea 1 - .9997 = .0003, lo cual dice que p Probability distributions > Normal… En la ventana de “Cummulative probability” puntear cummulative probability. En la ventana de “Input column” poner los valores de -4 hasta +4, es decir, en C1. En la ventana de “Optional storage” poner C2, para registrar los valores de la probabilidad acumulada. Por otro lado, si se quieren hacer las gráficas de frecuencia relativa y de frecuencia acumulada, de la distribución normal proceder como está abajo y seguir las instrucciones: Graph > Plot Además, para calcular los valores de la distribución normal no estandarizada: Calc > Probability distributions > Normal… En la ventana de “Mean” y de “Estándar deviation” poner los valores del promedio y de la desviación estandar deseados. En la columna C1 poner los valores de la variable aleatoria X que se quieran estandarizar. Para las gráficas proceder como arriba. Además, para calcular los valores de la distribución exponencial irse a: Calc > Probability distributions > Exponential.. En la ventana de “Exponential distribution” puntear “Cummulative probability”. En la ventana de “Mean” poner el promedio deseado. Para calcular los valores de la distribución Weibull: Calc > Probability distributions > Weibull… En la ventana de “Weibull distribution” puntear “Cummulative distribution”. En la ventana de “Shape parameter” y “Scale parameter” teclear los valores de α y β. Para
5-79
Dr. Héctor Quevedo Urías
el resto proceder como arriba. Para las gráficas hacer lo mismo que arriba. Similarmente, para calcular los valores de la distribución Gamma: Calc > Probability distributions > Gamma… Proceder en forma análoga a como se hizo con la función Weibull Ejemplo #51. Calcular las siguientes probabilidades bajo la curva normal estándar usando el paquete de computadora Minitab: (a) Entre z = -1.5 y z = -1 (b) P(z ≥ 2) (c) Entre z = 1 y z = -1 (d) Hacer una gráfica Solución: Abrir el programa Minitab y seguir las instrucciones correspondientes. Esto generará una tabla de abajo. TABLA 5.8. Valores de la variable aleatoria X y la cpd. (Elaboración propia) ___________________________________________________________________ Columnas C1 C2 Variable aleatoria z Distribución de Probabilidad acumulada 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
-4.0 -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 0.0 1.0 1.5 2.0 2.5 3.0 3.5 4.0
.000032 .000233 .001350 .006210 .022750 .066807 .158655 .500000 .841345 .933193 .977250 .993790 .998650 .999767 .999968
(a) P(-1.5 ≤ z ≤ -1.0) = 0.1587 – 0.0668 = 0.0919 (de la tabla de arriba)
5-80
Dr. Héctor Quevedo Urías
(b) P(z ≥ -2) = 1 – P(z ≤ -2.5) = 1 – 0.0062 = 0.9938 (c) P(1 ≤ z ≤ -1) = 0.6827 (sin consultar la tabla. ¿Por qué?) Ejemplo #52. Calcular la distribución de las probabilidades acumuladas para los valores de la variable aleatoria X = 2.5, 2.6, 2.7, 2.8, 2.9, 3.0, 3.1, 3.2, 3.3, 3.4. Además, calcular los siguientes enunciados: (a) P(X ≥ 2.9) (b) P(2.6 ≤ X ≤ 3.2) (c) El valor de X es de cuando menos 3.4 Solución: Usando el programa Minitab, primeramente calculamos el promedio y la desviación estándar, de los valores de la variable aleatoria X, y da los resultados de la estadística descriptiva de abajo. Figura 5.17. Resultados de la estadística descriptiva usando el Minitab. __________________________________________________________________ Estadística Descriptiva: Variable aleatoria x Variable
N Promedio Error estándar
Variable aleatoria
10 2.9500
Variable
Q1
Mediana
Variable aleatoria 2.6750 2.9500
0.0957
s
s2
0.3028 0.0917
Q3
Maximum
3.2250
3.4000
Coef. de Var. 10.26
Sesgo Kurtosis 0.00
-1.20
__________________________________________________________________ Después, tableando los valores de X en C1 con X = 2.95 y s = 0.3028, en sus ventanas respectivas, se genera la tabla de abajo.
TABLA 5.9. Tabla mostrando la variable aleatoria X y probabilidades acumuladas. (Elaboración propia)
5-81
Dr. Héctor Quevedo Urías
__________________________________________________________________ Columnas C1 C2 Variable aleatoria X Probabilidad acumulada 1 2.5 0.068622 2 2.6 0.123865 3 2.7 0.204508 4 2.8 0.310167 5 2.9 0.434423 6 3.0 0.565577 7 3.1 0.689833 8 3.2 0.795492 9 3.3 0.876135 10 3.4 0.931378 Ahora, para resolver los incisos pedidos por el problema se procede como: (a) P(X ≥ 2.9) = 1 – 0.3102 = 0.6890 (de la tabla de arriba) (b) P(2.6 ≤ X ≤ 3.2) = 0.795492 – 0.068622 = 0.7269 (c) P(X ≥ 3.4) (para resolverse por el lector) Ejemplo #53. Supongamos que el tiempo promedio que se tarda una sustancia radiactiva (un isótopo radiactivo que tiene el mismo número atómico pero diferente peso molecular) en descomponerse es de µ = 15 años; siendo así: (a) Hacer una tabla con los valores de la función exponencial de densidad para los valores de la variable aleatoria X = 0, 5, 10, 15, 20, 25, 30, 35, 40, 45 y 50 años. (b) Graficar las probabilidades individuales y las probabilidades acumuladas en función del tiempo en años. (c) ¿Cuál es la probabilidad que el isótopo tarde en degradarse a lo más en 5 años? (d) ¿La probabilidad de que el isótopo tarde en oxidarse en cuándo menos 20 años? (e) ¿La probabilidad de que el isótopo tarde en degradarse entre 20 y 50 años? (f) ¿Cuánta radiactividad quedó después de 40 años?
5-82
Dr. Héctor Quevedo Urías
(g) ¿Cuánta energía se liberó después de 40 años? (h) ¿Qué cantidad del isótopo radiactivo quedó después de 50 años? TABLA 5.10. Tabla mostrando los valores generados de la probabilidad acumulada y la probabilidad individual. (Elaboración propia) __________________________________________________________________
Solución: (a) Ver TABLA 5.10 (b) Para este inciso, las gráficas de abajo muestran esta situación. Scatterplot of Radiactividad restante vs Tiempo en años 0.07
Radiactividad restante
0.06 0.05 0.04 0.03 0.02 0.01 0.00 0
10
20 30 Tiempo en años
40
50
Figura 5.18. Gráfica mostrando la radiactividad restante, en función del tiempo en años. (Elaboración propia)
5-83
Dr. Héctor Quevedo Urías
Scatterplot of Energia liberada vs Tiempo en años 1.0
Energia liberada
0.8
0.6
0.4
0.2
0.0 0
10
20 30 Tiempo en años
40
50
Figura 5.19. Gráfica mostrando la energía liberada (o la cantidad de la sustancia ejercida) del isótopo radiactivo, en función del tiempo en años. (Elaboración propia) (c) P(X ≤ 5) = 0.2835 (de la Tabla 5.10 de la probabilidad acumulada) (d) P(X ≥ 20) = 1 – P(X ≤ 15) = 1 – 0.6321 = 0.3679 (e) P(20 ≤ X ≤ 50) = 0.3322 (f) P(X > 40) (resolverse por el lector) (g) (Resolverse por el lector) (h) (Resolverse por el lector) En forma análoga para hacer gráficas de probabilidad para las diferentes distribuciones como la Lognormal, gamma, Weibull, Logística, etc., irse a: Graph → Probability Plot Haciendo esto aparece la ventana de “Probability Plots” y luego poner OK, lo que lleva a la ventana de “Probability Plot Single”. Después de irse a “Distribution” y aparece la ventana con la lista de todas las distribuciones como normal, lognormal, Weibull, logística, gamma, exponencial, etc. Se le pide al lector hacer un ejercicio haciendo
gráficas
de
probabilidad
para
5-84
las
distribuciones
continuas.
Dr. Héctor Quevedo Urías
Ejercicios Capítulo 5 5.1. En un muestreo de partículas atmosféricas, el promedio de la muestra fue de 72 micras y la desviación estándar fue de 15 micras. Determinar las unidades de desviación estándar de las partículas que tuvieron valores de: (a) 60
(-0.80)
(b) 93
(1.4)
(c) 72 micras
(0)
5.2. Refiriéndose al problema anterior, encontrar los valores de la variable aleatoria normal z correspondientes a: (a) z = -1 (b) z = 1.6 5.3. En un estudio independiente, dos industrias contaminantes fueron informadas de que recibieron evaluaciones ecológicas de variables aleatorias normales estándares de z de 0.7 y -0.5, respectivamente. Si sus resultados (evaluaciones) fueron de 90 y 74, respectivamente, y asumiendo que s = 13.32, encontrar el promedio aritmético, para ambos casos.
( X = 80.67, X = 60.67)
5.4. Encontrar el área o la
proporción de la valores de la variable aleatoria z de la curva normal entre z = 0 y z = 1.2. 5.5. Encontrar el área entre z = 0.81 y z = 1.94.
(0.1828)
5.6. Encontrar la probabilidad de que una z observada se encuentre a la derecha de z = 2.05 y a la izquierda de z = -1.44. 5.7. Determinar el valor o los valores de z cuando: (a) La probabilidad entre 0 y z es de 0.3770
(±1.16)
(b) La probabilidad a la izquierda de z es de 0.8621
(1.09)
5.8. El peso promedio de residuos tóxicos peligrosos generados por 500 industrias es
5-85
Dr. Héctor Quevedo Urías
de 151 toneladas métricas, con una desviación estándar de 15 toneladas. Si los pesos de los residuos tóxicos generados por estas industrias están normalmente distribuidos, encontrar todo lo siguiente: (a)
Cuántas
industrias
generan
entre
120
y
155
toneladas,
inclusive.
(b) Cuántas generan más de 185 toneladas (c) Cuántas generan cuando menos 128 toneladas (d) Cuántas generan igual a 128 toneladas (e) Cuántas generan más de 75, pero menos de 100 toneladas 5.9. Si los diámetros de unas chumaceras de una maquinaria están normalmente distribuidos, con un promedio de 0.6140 pulgadas y una desviación estándar de .0025 pulgadas, determinar la probabilidad de que las chumaceras tengan diámetros de: (a) Entre .610 y .618 pulgadas inclusivamente
(0.8904)
(b) > .617 pulgadas
(0.1151)
(c) < .608 pulgadas
(.0207)
(d) Igual a .615 pulgadas 5.10. Si una muestra aleatoria de análisis de las concentraciones de demanda bioquímica de oxígeno de 5 días (DBO5) está normalmente distribuidas, ¿qué probabilidad hay de que éstas difieran del promedio por? (a) Más de la mitad de la desviación estándar (b) Menos que 0.75 de la desviación estándar. 5.11. Dada una distribución normal de precipitaciones pluviales con promedio de 50 mm y s = 10 mm. Encontrar la probabilidad de que X asuma un valor entre 45 mm y 62 mm de lluvia.
(0.5764)
5.12. Si el X y s son el promedio y la desviación estándar de una muestra aleatoria de análisis de aguas residuales de concentraciones de nitratos, en mg/L, ¿Cuál es la
5-86
Dr. Héctor Quevedo Urías
probabilidad de que las concentraciones estén? (a) Dentro del rango ( X ± 2s) (b) Afuera del rango ( X ± 1.2s) (c) Mayor que ( X - 1.5 s) 5.13. Dada una distribución normal de valores, en partes por millón, de CO atmosférico, con X = 300 y s = 50. Encontrar la probabilidad de que X asuma un valor mayor que 362.
(0.1075)
5.14. Dada una distribución normal con µ = 40 y σ = 6, encontrar el valor de X que tenga: (a) 45% del área a la izquierda (b) 14% del área a la derecha. 5.15. La tela de fibra de vidrio del equipo de control para partículas atmosféricas dura un promedio de 3.0 años, con una desviación estándar de 0.5 años. Si las duraciones de las telas están normalmente distribuidas, encontrar la probabilidad de que una tela de un filtro dure menos de 2.3 años.
(0.0808)
5.16. Una compañía fabrica electrodos para los precipitadores electrostáticos (equipo de control para partículas contaminantes en aire), cuya duración está normalmente distribuida, con un promedio igual a 800 horas y una desviación estándar de 40 horas. Encontrar la probabilidad de que un electrodo se funda entre 778 y 834 horas. 5.17. En un proceso industrial el diámetro de un balero se establece en sus especificaciones como 3.0 ± 0.01 cm. En la manufactura de estos valeros, la implicación es que no se acepta ningún balero que se salga de esta medida. Se saca una muestra de 100 valeros al azar y se calcula el promedio aritmético de 3.0 cm., con una desviación estándar de 0.005 cm. En promedio, ¿cuántos valeros fabricados se descartarán?
(≈ 5 valeros)
5-87
Dr. Héctor Quevedo Urías
5.18. Se utilizan medidores para rechazar todo los componentes cuyas dimensiones no se encuentren dentro del la especificación dada de 1.50 ± d. Sin embargo, se sabe que esta dimensión está normalmente distribuida con un promedio de 1.50 Y una desviación estándar de 0.2. Determinar el valor de d para que la especificación cubra el 90% de las mediciones. 5.19. Cuál es la probabilidad de que: (a) P(-0.5 < z < 1.25)
(0.5859)
(b) ¿El valor de z no esté entre estos dos valores?
(0.4144)
5.20. En un estudio de ingeniería de higiene industrial y seguridad, el supervisor de producción encuentra que, los trabajadores, en promedio, completan una tarea en 10 minutos cuando están expuestos a altas concentraciones de gases. Los tiempos requeridos para completar la tarea son aproximadamente normales con una desviación estándar de 3 minutos. Encontrar lo siguiente: (a) La proporción de empleados que completan la tarea en menos de 4 minutos. (b) El % de empleados que requieren más de 5 minutos en completar la tarea. (c) La probabilidad de que un empleado, quien acaba de ser asignado a la tarea, la completará dentro de 3 minutos. 5.21. Se llevó a cabo un muestreo y un análisis de las concentraciones de nitratos (NO-3) de un sistema de tratamiento de aguas industriales. Las concentraciones de nitratos se reportaron en mg/L. Los siguientes datos se dan en mg/L en la tabla de abajo:
5-88
Dr. Héctor Quevedo Urías
Tabla mostrando los datos del problema. (Elaboración propia) ___________________________________________________________________ 6.9 7.8 8.9 5.2 7.7 9.6 8.7 6.7 4.8 8.0 10.1 8.5 6.5 9.2 7.4 6.0 6.1 6.3 5.6 5.2 5.4 7.3 8.2 8.3 7.2 7.5 6.1 6.0 9.4 5.4 7.6 8.1 7.9 ___________________________________________________________________ Hacer los siguientes cálculos corriendo una estadística descriptiva que incluya: (a) El promedio muestral, la varianza, la desviación estándar y el rango. ( X = 7.26, s2 = 2.02, s = 1.42, rango = 5.3) (b) Encontrar el error estándar, el sesgo, la kurtosis, el valor máximo y el valor mínimo.
(0.25, 0.08, -.088, 10.1, 4.8)
(c) Evidenciar la simetría de los datos. (d) Si el límite de las concentraciones de nitratos en el efluente es de 8.5 mg/L, de acuerdo a la legislación ambiental de aguas, hacer una prueba de hipótesis con un nivel de significancia de α = .05 y calcular la probabilidad p e interpretarla acordemente.
(P µo = 0.343 z > + zα H1: µ ≠ µo = .0.343 z < - zα/2 o z > zα/2 __________________________________________________________________ 5.48. Una empresa de camiones de carga sospecha de la afirmación de que el ciclo de vida de ciertos neumáticos es de al menos 28,000 millas (≥ 28,000). Para verificar este argumento, la empresa instala 40 de esas llantas en sus camiones y obtiene un ciclo de vida promedio de 27,463 con σ = 1348 millas. ¿Qué se puede concluir, si la probabilidad de un error tipo alfa se fija en 0.01? Asumir una prueba de hipótesis unilateral izquierda. 5.49. Para un análisis de pesticidas clorinados hidrocarbonados en aguas residuales (usando cromatografía de gas), se dio una muestra conteniendo este pesticida a dos laboratorios. Los tamaños de las muestras fueron de 40 y 50 casos, respectivamente. Si las muestras tienen promedios de X 1 = 74 con desviación estándar de σ1 = 8, y de promedio de X 2 = 78 con una desviación estándar de σ2 = 7, decir si hay una diferencia significante entre los resultados de los dos laboratorios. Asumir niveles de significancia de α = .05 y α = .01.
(z = -2.49, p = .0064)
5.50. Una muestra aleatoria de 100 muertes en E. U. mostró una vida promedio de
5-100
Dr. Héctor Quevedo Urías
71.8 años con una desviación estándar de 8.9 años. ¿Pudiera esto indicar que la vida promedio de hoy en día es mayor que 70 años? Usar α = .05. 5.51. Un fabricante de cables de acero afirma que su producto tiene una resistencia de ruptura de 8.0 Kg. Probar la hipótesis nula de que Ho:µ = 8.0 Kg., contra la prueba alternativa de que H1:µ ≠ 8.0 Kg. Para esto, se sacó una muestra aleatoria de 50 cables y se encuentra que tiene una resistencia promedio de X = 7.8 Kg., con una desviación estándar de 0.5 Kg. Para esta prueba usar α = .05 y α = .01. (p = .0046) 5.52. En un estudio de la aplicación del pH (potencial hidrógeno que tiene una escala de 0 a 14, donde 7 es neutral y abajo de 7 es ácido y arriba de 7 es alcalino) para medir la alcalinidad y la acidez de soluciones, un científico, dedicado al estudio de la contaminación ambiental, asegura que dos muestras de soluciones (A y B) provienen del mismo lugar de un río, donde supuestamente hubo un descarga industrial de ácido clorhídrico (HCl). Si esto fuera cierto, entonces el pH de las dos muestras de soluciones serían iguales. Asumiendo que las observaciones provienen de poblacionales normales, probar la hipótesis nula de igualdad de los promedios de pH. Asumir α = 0.05. Hacer las siguientes estimaciones: (a) Hacer estos cálculos usando la distribución normal y la distribución de t de Estudiante. (b) También, calcular el valor de la probabilidad p en ambos casos y ver que diferencias hay. (c) Hacer intervalos de confianza usando las fórmulas para la distribución z y para la t de Estudiante. (d) ¿Desaprueban los datos la afirmación del científico? La tabla de abajo muestra la información requerida para este problema.
5-101
Dr. Héctor Quevedo Urías
Tabla mostrando los datos de las mediciones del pH. (Elaboración propia) Mediciones del pH de solución A Mediciones del pH de solución B ___________________________________________________________________ 6.24 6.27 6.31 6.25 6.28 6.33 6.30 6.27 6.25 6.24 6.26 6.31 6.24 6.28 6.29 6.29 6.22 6.34 6.28 6.27 ___________________________________________________________________ 5.53. Una compañía está en el proceso de decidirse si va a producir un nuevo componente electrónico. En la planta hay dos máquinas que pueden ser adaptadas para hacer este componente. Para esto, se hace una prueba en la máquina 1 y se mide el tiempo de producción por componente y da un promedio de X 1 = 5.23 minutos para una muestra de 100 componentes. En la máquina 2 el promedio de tiempo fue de X 2 = 5.37 minutos para una muestra de 64 componentes. En pasadas experiencias, se
sabe que las desviaciones estándar fueron de 0.15 y 0.10 minutos, respectivamente Asumir α = 0.05. Hacer los siguientes cálculos: (a) Probar la hipótesis de que no hay diferencias entre las dos poblaciones de componentes muestreadas. (b)
Hacer
un
intervalo
(z = -2.55 se rechaza Ho:) de
confianza
(c) Calcular el valor de p.
para
el
verdadero promedio µ. (p = 0.011)
5.54. En una investigación relacionada con las concentraciones de plomo (Pb), se
5-102
Dr. Héctor Quevedo Urías
sabe que el plomo es un veneno muy peligroso, en el cual el cuerpo se adapta crónicamente a las acumulaciones de este metal pesado. La presencia de Pb en el agua potable puede venir de descargas industriales, de minas y de fundiciones de metales. Hay algunos métodos para determinar las concentraciones de Pb en el agua. Uno de ellos es el método de absorción atómica espectrométrico (método A) y el método calorimétrico (método B). En esta investigación se pretende comparar los resultados de los métodos de absorción atómica y el de ditizone. El método de absorción atómica espectrométrica consiste en aspirar la muestra preparada en una flama y atomizándola. El método ditizone consiste en extraer en tetracloruro de carbono (CCl4), el Pb en una solución ligeramente básica. Los datos debajo dan las concentraciones (en mg/L) de dos muestras de método A y método B. Asumir un nivel de significación de 0.05. También, asumir que las poblaciones muestreadas son normales. Hacer los siguientes cálculos: (a) Probar que no hay diferencia entre las dos poblaciones analizadas. (b) Calcular el valor de p. (c) Hacer un intervalo de confianza con α = 0.05 La tabla de abajo muestra los resultados de las concentraciones de los dos métodos. Tabla mostrando las mediciones de Pb. (Elaboración propia) Método A | .055, .051, .052, .053, .055, .053, .055, .049, .048, .049, .05, .053, .052, .054, .056, .054, .057, .049, .048, .05, .057, .059, .040, .042, .043, .046, .055, .03, .07, .075, .08, .086, .056, .078, .076, .077 Método B |.057, .06, .07, .057, .059, .059, .049, .06, .07, .075, .06, .067, .068, .064, .069, .078, .07, .079, .074, .05, .06, .07, .08, .081, .072, .082, .079, .087, .04, .04, .04, .043, .044, .046, .081, .083
5.55. Dos astrónomos registraron observaciones de cierta estrella en el firmamento. Se obtuvieron 12 observaciones por el primer astrónomo y dio un promedio de 1.20 mediciones. El segundo astrónomo sacó una muestra de 8 observaciones y obtuvo un
5-103
Dr. Héctor Quevedo Urías
promedio de 1.15 mediciones. La experiencia pasada indicó que estos astrónomos obtuvieron mediciones con varianzas de 0.40 mediciones. Asumir que la población muestreada es normal. Usar el nivel de significación de 0.05 y probar las hipótesis: Ho:µ1 - µ2 = 0 contra las hipótesis alternativas de H2:µ > 0 y H3:µ < 0.
(z = 0.17)
5.56. Decir de cuántas colas se harán las siguientes pruebas de hipótesis y decir las pruebas alternativas: (a) Si la prueba de hipótesis nula es de Ho: µ = 14.00, entonces las pruebas alternativas son de: (b) Si la prueba de hipótesis nula es de Ho: µ ≥ 14.00, entonces las pruebas alternativas son de: (c) Si la prueba de hipótesis es de Ho: µ ≤ 14.00, entonces las
pruebas alternativas
son de: 5.57. Una muestra de 49 observaciones de análisis de ruidos (en decibeles, dB) se usó para probar la hipótesis nula de que el promedio poblacional es de µ = 145 dB. Se calculó un promedio muestral de X = 138.00 dB con una desviación estándar de 20. Hacer los siguientes cálculos: (a) Establecer las pruebas alternativas.
(H1:µ ≠ 145)
(b) Si el nivel de significancia es α = 0.05 establecer la región crítica.(tcrítica = ±1.96) (c) Si se rechaza la hipótesis nula, calcular el valor de p.
(p = .0142)
5.58. Después de analizar las temperaturas de 50 trabajadores de un frigorífico, el médico de la empresa afirma que, la temperatura promedio poblacional del cuerpo, es igual a 98.6 oF. El promedio estadístico de este grupo fue de X = 98.2 oF con una desviación estándar de σ = 0.62. Hacer lo siguiente: (a) Identificar la hipótesis nula Ho: (b) Identificar la o las hipótesis alternativas H1:
5-104
Dr. Héctor Quevedo Urías
(c) Establecer las regiones críticas usando el nivel de significación de α = 0.05 y α = 0.01. (d) Calcular el valor de la estadística z. (e) Si se rechaza la hipótesis nula, calcular el valor de la probabilidad, p. 5.59. Si se usa el valor significante de α = 0.01 encontrar los valores críticos de z (ztab.) si se usa: (a) Prueba bilateral, es decir de dos colas.
(±2.33)
(b) Prueba bilateral con α = 0.10.
(±1.28)
(c) Prueba bilateral con α = 0.005.
(±2.81)
5.60. Se dan los siguientes datos: Promedio aritmético, X = 31.8, σ = 0.25, n = 50, Ho: µ ≥ 32. Hacer los siguientes cálculos: (a) Decir cuál es la prueba de hipótesis alternativa (b) Establecer las regiones críticas usando α = 0.05 y α = 0.01 (c) Calcular el valor de la estadística z (zcalc ). (d) Si se rechaza la hipótesis en cualquiera de los dos niveles de significación de 0.05 y/o 0.01, calcular el valor de la probabilidad p. 5.61. Se saca un valor de n = 25 de una población normal, con s2 = 3. Usar α = .05. Hacer lo siguientes: (a) Calcular χ2.
(χ2 = 9.6)
(b) Estimar las regiones críticas χ2α/2;n-1 y χ21-α/2;n-1 (c) Probar Ho:σ2 = 75, y H1:σ2 ≠ 75
(12.4 y 39.4) (se rechaza Ho:) (p ≈ 0.01)
(d) Calcular el valor de p.
5.62. En un estudio ambiental hecho en varios lagos de Noruega, acerca del pH del agua, en respuesta a la preocupación de los efectos de la precipitación pluvial ácida, se hicieron dos muestreos hechos en los años de 1976 y 1981. Se quiere saber si hubo
5-105
Dr. Héctor Quevedo Urías
diferencias en las dos mediciones de pH de esos años 1976 y 1981. Los datos se dan en la tabla de abajo. Asumir que las varianzas de las dos poblaciones son iguales. Usar un nivel de significación de 0.05 y calcular el valor de la probabilidad p en la toma de decisiones. (Statistics for Environmental Sciences and Management, por Bryan Manly, p. 8).
5-106
Dr. Héctor Quevedo Urías
Tabla mostrando las mediciones de pH para 1975 y 1981. No. de lago 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
pH (1975)
pH (1981)
4.59 4.97 4.32 4.97 4.98 4.58 4.72 4.53 4.96 4.96 5.31 5.42 5.60 5.37 4.87 5.87 6.20 6.67 6.06 5.38 5.60 5.60 5.37 5.07 6.23 6.24 5.15 4.82 5.42 4.99 5.31 5.99 4.63 4.47 4.60 4.88 4.60 4.85 5.06 5.97 5.47
4.63 4.98 4.49 5.21 5.00 4.94 4.90 4.54 5.69 5.75 5.43 5.19 5.70 5.38 4.90 6.02 6.25 6.67 6.09 5.51 5.98 5.66 5.67 5.18 6.29 6.37 5.68 5.45 5.54 5.25 5.55 6.13 4.92 4.50 4.66 4.92 4.84 4.86 5.11 6.17 5.82
(Fuente: Statistics for Environmental Science and Management. Manly, 2001)
5-107
Dr. Héctor Quevedo Urías
Sugerencia: Usar la función estadística para pruebas de hipótesis para las diferencias de dos promedios. 5.63. El presidente de cierta compañía fabricante de partes de automóvil afirma qué, el número promedio de partes vendidas, diariamente, es de 1500. El director general de toda la cadena de establecimientos quiere comprobar esta afirmación. Para esto, se toma una muestra aleatoria consistente en 36 días, la cual mostró un promedio de 1450 partes. Asumir que se conoce el valor de σ = 120 partes. Usar α = 0.05. Calcular el valor de la prueba no tradicional, es decir, usando el valor de p. ¿Qué se puede concluir acerca de esta situación?
(z = -2.5 y se rechaza Ho:)
5.64. Jay Devore autor del libro Probabilidad y Estadística para Ingeniería y Ciencias (2201) discute el problema relacionado con el análisis de una muestra aleatoria de n1 = 20 especimenes de acero laminado en frío, para determinar su resistencia, dando, como resultado, una resistencia promedio muestral de X 1 = 29.8 ksi. Una segunda muestra aleatoria de n2 = 25 especimenes de acero galvanizado de dos lados dio una resistencia promedio muestral de X 2 = 34.7 ksi. Si se supone que las dos distribuciones de resistencia de los aceros son normales con σ1 = 4.0 y σ2 = 5.0 ksi (sugeridas por una gráfica en el artículo “Sinc-Coated Sheet Steel: An Overview”, Automotive Engr., diciembre de 1984, pp. 39-43). (a) ¿Significan estos datos que las verdaderas resistencias promedio µ1 y µ2 son diferentes? (b) Calcular el valor de p. (c) También hacer un intervalo de confianza para los dos promedios poblacionales. Realizar la prueba de hipótesis con α = 0.01. 5.65. En un estudio de higiene industrial y seguridad en carreteras estatales, al seleccionar un concreto de azufre para construir una carretera, es importante escoger
5-108
Dr. Héctor Quevedo Urías
un concreto con bajo valor de conductividad térmica, para reducir al mínimo los daños ocasionados por cambios de temperatura y, así, evitar accidentes automovilísticos en las carreteras. Supóngase que hay dos tipos de concreto, uno es un agregado escalonado y el otro no tiene agregados finos considerados para cierta carretera. La tabla de abajo resume los datos de un experimento realizado para comparar los dos tipos de concreto. ¿Sugiere esta información que el verdadero promedio de conductividad del concreto, con agregado escalonado supera al del concreto sin agregado fino? ( Probabilidad y Estadística para Ingeniería y Ciencias, J. L.Devore, 2000).
Tipo de concreto Escalonado Sin agregados finos
(3.36, p = .0004)
Tamaño muestral 42
Promedio muestral de conductividad .486
42
.359
Desviación estándar .187 .158
(Fuente: Devore, 2000) 5.66. El gerente de una cadena de hoteles está considerando construir un motel a lo largo de una autopista. El dueño que está vendiendo el terreno al gerente, para la construcción del motel, asegura qué, por ahí pasan 1100 vehículos por día. Sin embargo, el gerente de la cadena de hoteles dice que, una cifra mayor que 1100 vehículos, sería adecuada para la construcción del motel en ese sitio. Para esto se toma una muestra aleatoria durante 18 días. ¿Los resultados reafirman o desaprueban la afirmación del dueño del terreno? La tabla de abajo da la información requerida:
5-109
Dr. Héctor Quevedo Urías
Tabla mostrando los datos del problema. (Elaboración propia). Día | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 No. de vehículos |1150 1225 1195 1195 1210 1100 1150 1195 1105 1205 1121 1190 1195 1192 1100 1201 1090 1095
5.67. Encontrar las siguientes probabilidades: (a) P(-1.0 < Z < 2.0)
(0.8185)
(b) La probabilidad de que la variable aleatoria Z no se encuentre entre estos dos valores.
(0.1815)
(c) Si X = 4 y s = 1, encontrar los valores de la variable aleatoria X para el intervalo del inciso (a).
(X = 6)
5.68. La vida promedio de un pesticida órgano clorado depositado en la tierra es una variable aleatoria con la siguiente distribución de probabilidad: f (x) = 1/60 e-x/60 para x ≥ 0 (a) Dar el promedio del pesticida en cuestión. (b) Estimar la probabilidad de que el pesticida, en cuestión, dure 100 días. 5.69. Se sacó una muestra al azar de 49 análisis de aguas residuales y se calculó X = 800 mg/L con s = 60.0 mg/L. Probar la hipótesis nula de que el verdadero promedio es de 850 mg/L. Asumir α = 0.05. Calcular el valor de p.
(z = -5.83, p = .0003).
5.70. Se sacó una muestra aleatoria de SO3 atmosférico en unidades de ppm provenientes de un complejo industrial. Probar que µ = 52. Se sabe que la población muestreada es normal. Calcular el valor de p con α = 0.01. Tabla mostrando los datos. (Elaboración propia) ___________________________________________________________________ SO3 (ppm) | 50 52 56 57 55 55 54 55 56 57 56 54 ___________________________________________________________________
5-110
Dr. Héctor Quevedo Urías
5.71. En un estudio relacionado con el ahorro de combustible, se sabe que el 40% de los coches no americanos de 4 cilindros, el consumo de gasolina se reduce considerablemente, es decir, con relación a los coches americanos de 6 u 8 cilindros. Si se saca una muestra aleatoria de 15 coches de 4 cilindros, calcular la probabilidad de que 4 de estos coches sean eficientes en el ahorro de combustible. Hacer esto usando la distribución binomial y la normal. Comparar los resultados. (Usando la distribución normal da 0.1214; usando la distribución binomial da 0.1268) 5.72. Supóngase que el tiempo de reacción X a cierto estímulo en un individuo seleccionado aleatoriamente, tiene una distribución gamma estándar con α = 2s (Devore, 2001). Sugerencia: usar la relación P(a ≤ X ≤ b) = F(b) – F(a). Usar la tabla de la función de gamma incompleta. 5.73. Este es un problema que involucra el uso de la distribución gamma en donde aparecen distribuciones que no son estándar. Este problema dice así (Devore 2001, p. 171): Supóngase que el tiempo X de supervivencia, en semanas, de un ratón macho, seleccionado al azar y expuesto a 240 rads de radiación gamma, tiene una distribución gamma con α = 8 y β = 15. El tiempo esperado de supervivencia es de E(X) = (8)(15) = 120 semanas, en tanto que, V(X) = (8)(15)2 = 1800 y σx = √1800 = 42.43 semanas. Siendo así, encontrar la probabilidad de que un ratón sobreviva: (a) Entre 60 y 120 semanas.
(.496)
(b) Por lo menos 30 semanas.
(.999)
5.74. Sea X la resistencia final a la tensión (ksi) a -200 oF de un tipo de metal que presenta problemas de resistencia a temperaturas bajas. Supóngase que X tiene una distribución Weibull con parámetros α = 20 y β = 100. Calcular lo siguiente: (a) La probabilidad de que la resistencia final a la tensión (ksi) a -200 oF se de a lo más 105.
(.930)
5-111
Dr. Héctor Quevedo Urías
(b) Entre 98 y 102 5.75. El encargado de la caseta de cobro de una carretera ha observado que los vehículos llegan aleatoria e independientemente, con un promedio de 300 vehículos por hora. Sugerencia: usar P(X ≥ a) = e-λa para (a) y p(x) = e-µx/x! para (b). Siendo así, resolver los siguientes enunciados: (a) Usar la función exponencial para calcular la probabilidad de cuando menos 1 minuto pasará antes de que el siguiente motorista llegue.
(P(X ≥ 1.0) = e-5(1))
(b) Usar la distribución de Poisson para comparar el valor de la probabilidad obtenida en (a). 5.76. La duración de cierta refacción para automóviles sigue a una distribución Weibull con una tasa de falla A(t) = 1/√ t. Siendo así, encontrar las siguientes probabilidades: (a) La probabilidad de que la refacción en cuestión se deteriore antes de 4 años. (b) La probabilidad de que la refacción no se desgaste después de 4 años. 5.77. Una batería solar tiene una vida promedio que está exponencialmente distribuida con un promedio de vida de 10 horas. Usando cálculo integral, determinar las siguientes probabilidades: (a) La mediana de las vidas de las baterías.
(6.93 horas)
(b) La probabilidad de que la vida de una batería esté entre 8 y 12 horas. (0.148 horas) (c) La probabilidad de que la vida de una batería excederá 15 horas. (0.777 horas) (d) La probabilidad de que la vida de una batería solar esté entre 60 y 120 minutos. 5.78. Decir cuál de las siguientes afirmaciones es correcta: (a) A medida que el tamaño de la muestra, n disminuye y la desviación estándar, s aumenta, el valor de la probabilidad, p disminuye.
5-112
Dr. Héctor Quevedo Urías
(b) A medida que n disminuye y s disminuye, el valor del error estándar aumenta y, por lo tanto, el valor de p disminuye. (c) A medida que n aumenta y las técnicas del laboratorio se refinan causando una varianza pequeña, el error estándar del promedio baja y, por consiguiente, el valor de p aumenta y la hipótesis nula se rechaza. (d) A medida que el error estándar del promedio disminuye por tamaños de muestra grandes, con pequeñas variaciones, esto conlleva a un valor pequeño de p mucho muy significante, lo cual nos lleva a retener la hipótesis nula. (e) A medida que la varianza disminuye, con n constante, el valor de p disminuye y la hipótesis nula se rechaza. (f) A medida que n aumenta y las técnicas del laboratorio se refinan causando una varianza pequeña, el error estándar baja y, por consiguiente, el valor de p disminuye y se retiene Ho: (g) A medida que n aumenta y las técnicas del laboratorio se refinan causando una varianza pequeña, el error estándar baja y, por consiguiente, el valor de p disminuye y se acepta HA: (h) los incisos (d), (e) y (f) son correctos (i) Los incisos (e) y (g) son correctos 5.79. Actualmente, hay mucho debate, por saber si las emisiones de campos electromagnéticos producidos por teléfonos móviles (celulares) y sus estaciones de antenas base puedan estar afectando la salud. Con más de 500 millones de teléfonos móviles en todo el mundo, de acuerdo a al artículo Examining the effects of electromagnetic fields emitted by GSM mobile phones on human event-related potentials and performance during an auditory task publicado en Clinical Neurophysiology 115 (204) 171- 178 (http://www.wow-com.com/industry/stats),
5-113
Dr. Héctor Quevedo Urías
el desmesurado incremento del uso de la telefonía celular y sus consiguientes efectos en las funciones cognitivas y fisiológicas debido a las radiaciones electromagnéticas (RE), es una situación que está causando preocupación entre las personas conocedoras de este problema. Se han hecho muchas investigaciones con relación a los efectos en la salud producidos por la radiación de microondas debidas a la proximidad de los teléfonos celulares a la cabeza del usuario y de la proximidad a las estaciones de antenas base de telefonía celular, a estaciones eléctricas, a líneas de de alta tensión, hornos de microondas, etc. La mayoría de estas investigaciones coinciden en que los efectos de estos tipos de RE están afectando el cerebro y al sistema nervioso en mayor o menor grado. Hay estudios que han relacionado las emisiones electromagnéticas con casos de cáncer en el cerebro, efectos en la actividad enzimática y espermática, efectos visuales y auditorios, prevalecía de dolores de cabeza entre los usuarios de teléfonos móviles, problemas con el sueño, efectos en las células linfáticas humanas, mutaciones, etc., de las personas expuestas. En cuanto a la proximidad de las antenas base de telefonía móvil, y sus efectos en la salud, algunos países han estipulado, como un criterio seguro, el establecimiento de las antenas de microondas a distancias mínimas de 600 metros de complejos habitacionales. Siendo así, se diseña un ejemplo hipotético relacionado con las mediciones de radiación electromagnética y la proximidad a la fuente emisora, es decir, de mediciones a diferentes distancias de las antenas base de telefonía celular. Para este ejemplo, en particular, se calculan los promedios de una muestra de 30 mediciones de radiación electromagnética, para cada una de las siguientes distancias: 25, 50, 100, 200, 300, 400, 500 y 600 metros de la antena base de teléfonos móviles. Los promedios de la radiación electromagnética para cada distancia son: 950 MHz, 800 MHz, 550 MHz, 400
5-114
Dr. Héctor Quevedo Urías
MHz, 195 MHz, 80,000 Hz, 30,000 Hz y 500 Hz, respectivamente. Sus respectivas desviaciones estándares fueron 50 MHz, 40 MHz, 35 MHz, 80 MHz, 100 MHz, 20,000 Hz, 10,000 Hz y 100 Hz. El estudio se llevó a cabo durante todo un año, en un esfuerzo por evaluar variables, como la distancia, la altura, época del año, factores meteorológicos (como temperatura, presión atmosférica, intensidad y dirección del viento, humedad relativa), contaminación del aire por partículas y gases, etc., que pudieran afectar el poder de la densidad de la radiación electromagnética emitida. Para resolver este problema estimar el modelo matemático que mejor ajuste los datos. Una vez que se evalúe el modelo acordemente, predecir la radiación de microondas a una distancia de 10 y 1000 metros de la antena base. Si hubiese valores atípicos extremos, enlistar tres posibles factores que puedan explicar estas situaciones.
5-115
Dr. Héctor Quevedo Urías
CAPITULO 6 Distribuciones de t de Estudiante, JI cuadrada y F Propiedades de la distribución de t de Estudiante.- Intervalos de confianza para el promedio poblacional µ.- Prueba de hipótesis para µ.- Prueba de t pareada para detectar diferencias entre dos tratamientos.- Prueba de t para probar la hipótesis de dos promedios, cuando las varianzas son iguales.- Prueba de t para probar la hipótesis de dos promedios cuando las varianzas son desiguales.Mecanismos para calcular el valor de p cuando se hacen pruebas de hipótesis no tradicionales.- Intervalos de confianza y pruebas de hipótesis con la JI cuadrada, (χ2).- Aplicación de la JI cuadrada en cuanto a la prueba de bondad de ajuste comparando las frecuencias observadas y las frecuencias teóricas.- Distribución F y su aplicación en la comparación de varianzas muestrales.Aquí, discutiremos la distribución de t de Estudiante, que está relacionada con la teoría de muestreo pequeño. También, discutiremos la distribución de JI cuadrada y la distribución de F. En los capítulos anteriores hicimos hincapié de que, para muestras que fueran ≥ 30 casos, se usa la distribución normal. Sin embargo, para muestras menores que 30 observaciones se usa lo que se llama teoría de muestreo pequeño, que está relacionada con la distribución de t de Estudiante, con la JI cuadrada o con la distribución F. La distribución de t se nombró después de W.S. Gosset, quien usó el seudónimo de estudiante. Por ejemplo, cuando usamos la distribución normal siempre se conoce el valor de σ, el tamaño de la muestra es > 30 y se sabe que la distribución muestreada es normal. Pero cuando usamos la distribución de t de Estudiante, no se conoce σ y el tamaño de la muestra es menor que 30 casos, sin saber si la distribución muestreada
6-1
Dr. Héctor Quevedo Urías
es normal o no. Estas situaciones se explican usando las fórmulas de la distribución normal y la de t de Estudiante. Del Capítulo 5, ya sabemos que, para aplicar la distribución normal se usa la variable aleatoria normal estandarizada z, dada como z = ( X - µ) / σ/√n. Sin embargo, esta función tiene un uso limitado, porque la varianza σ2 de la población rara vez se conoce y porque la población muestreada debe ser normal o aproximadamente normal. La distribución de t de Estudiante no tiene esta limitación, porque aún, para muestras de n < 30 casos, se asume que σ = s. Así sustituyendo el valor de σ por s la función de t de Estudiante nos da: t = ( X - µ) / s/√n
(6-1)
Donde: X = promedio muestral
µ = promedio poblacional que se quiere probar s = desviación estándar muestral n = tamaño de la muestra s/√ n = error estándar del promedio Propiedades de la distribución de t de Estudiante La distribución de t de Estudiante es una familia de distribuciones, cada una caracterizada por el número de grados de libertad ν. Es similar a la distribución de z normal, con promedio igual a cero y es simétrica en forma de campana. Su forma depende en el tamaño de la muestra. Con tamaños de muestras pequeñas, la forma de esta curva es menos picuda que la normal, pero a medida que n llega a 30 casos o se va a infinito, s2 se aproxima a σ2 y la t de Estudiante se aproxima a la distribución normal. La gráfica de abajo muestra la distribución de t de Estudiante, con diferentes grados de libertad.
6-2
Dr. Héctor Quevedo Urías
Figura 6.0. Gráfica mostrando familias de curvas de la distribución de t de Estudiante con diferentes grados de libertad ν, demostrando cómo, a medida que ν → ∞, la distribución t se aproxima a la distribución normal. Diferencias entre la distribución de t de Estudiante y la distribución normal La distribución de t se usa en lugar de la distribución normal, cuando el tamaño de la muestra es menor que 30 casos. Cuando hablamos de la distribución normal, ésta requiere que la muestra sea de n ≥ 30 observaciones o que, la poblacional muestreada sea normal. Este tamaño de muestra se considera como una muestra grande. Pero cuando la muestra de casos es n < 30 observaciones, no se puede usar la curva normal y tenemos que usar lo que se llama "teoría de muestreo pequeño." Para tales efectos se usa la distribución de t de Estudiante, la JI cuadrada o la distribución, F. La estadística t se usa para comparar los promedios de dos distribuciones, mientras que la prueba de F se usa para comparar las varianzas de dos distribuciones. De hecho, las diferencias entre la distribución de t y la distribución normal son que la distribución t no necesita el parámetro de población, σ, mientras que la normal si lo requiere. Además, la función t no requiere de muestras grandes. Otrosí, la
6-3
Dr. Héctor Quevedo Urías
varianza, σ2 > 1 y, solamente, cuando n → ∞ entonces, ambas distribuciones son iguales (prácticamente, cuando n ≥ 30 casos). Funciones usadas con la distribución de t de Estudiante 1. Se usa para hacer intervalos de confianza para µ. 2. Se usa para probar la hipótesis de que µ tiene un valor determinado, como por ejemplo, Ho:µ = µo. 3. Se usa para probar diferencias entre dos tratamientos deliberadamente emparejados, esto es, Ho:µ1 - µ2 = 0. Aquí, los tamaños de distribuciones deben ser iguales. 4. Se aplica para probar diferencias entre dos promedios usando el método de selección completamente al azar (aleatorio), y con varianzas iguales. Aquí los tamaños de las distribuciones pueden ser iguales o desiguales. 5. Se aplica para selecciones completamente aleatorias (al azar) con varianzas desiguales. El tamaño del las distribuciones puede ser igual o desigual. Aplicaciones de la distribución de t de Estudiante Las aplicaciones de la t de Estudiante son varias. Por ejemplo, puede usarse para el control de la calidad industrial. También es muy útil para el control de la calidad de un sistema de tratamiento de aguas residuales en el campo de la ingeniería ambiental. Por otra parte, otra aplicación muy importante de la t de Estudiante, es la distribución pareada. Esto es, para comparar el promedio de dos distribuciones o tratamientos, como, por ejemplo, para probar la hipótesis nula de Ho:µ1 = µ2, es decir, que no hay diferencias entre los dos promedios. Aquí, pudiéramos estimar dos tipos de análisis usando dos métodos y tratamientos, digamos de oxígeno disuelto (OD) o la comparación de dos métodos en la ingeniería del agua como el método Winkler y el de electrodos y ver si hay diferencias entre los dos métodos usando la prueba de t apareadas. También se puede usar para comparar dos distribuciones seleccionadas,
6-4
Dr. Héctor Quevedo Urías
aleatoriamente, y, con varianzas iguales o desiguales. Aquí, cabe notar que, si se trata de comparar los promedios de más de 2 distribuciones, entonces se usa el análisis de varianza simple o múltiple. Descripción de las funciones usadas con la distribución de t de Estudiante Estadística descriptiva: n
Promedio: X = Σ Xi / n
(6-2)
Varianza muestral: s2 = [∑ X 2 – (∑X)2 /n ] / n - 1
(6-3)
x=0
Desviación estándar:
s = √ s2
(6-3a)
Intervalos de confianza para el promedio poblacional µ: Prob{ X - t[1 - α/2;ν] s/√n < µ < X + t[1 - α/2;ν} s/√n} = 1 - α
(6-4)
Donde: X = promedio muestral
t[1–α/2;ν] = valor porcentual de t con un nivel de significancia α, con ν grados de libertad s = desviación estándar n = tamaño de la muestra s/√ n = error estándar del promedio Prueba de hipótesis para el promedio poblacional µ t = ( X – µo) / s/√ n Donde: X = promedio muestral
µo = promedio poblacional que se desea probar s = desviación estándar de la muestra
6-5
(6-5)
Dr. Héctor Quevedo Urías
Prueba de t para observaciones pares, para detectar diferencias entre dos tratamientos t = ( D - µ d ) / (s d /√n)
(6-6)
Donde: D = Promedio de la muestra de las diferencias de las observaciones del par de
distribuciones s d = Desviación estándar de las diferencias de las observaciones del par de distribuciones n = número de observaciones µd = 0 Prueba de hipótesis para la diferencia entre dos promedios poblacionales. Esta función también aplica cuando las varianzas de las dos distribuciones son iguales y normales. ( X 1 - X 2) - (µ1 - µ2) t = ──────────────────────── s2p (1/n1 + 1/n2)
Donde: X 1, X 2 = promedios aritméticos de las dos distribuciones
n1, n2 = tamaños de las dos muestras µ1, µ2 = parámetros de población uno y dos a estimarse s2p = (ν1 s12 + ν2 s22) / (ν1 + ν2) Donde: s2p = la varianza combinada de las dos muestras ν1, ν2 = grados de libertad de muestras uno y dos
6-6
(6-7)
Dr. Héctor Quevedo Urías
s12, s22 = varianzas de muestras uno y dos, respectivamente Función de t para la misma situación que la función anterior, pero aplicándola cuando las varianzas de las dos distribuciones son desiguales y asumiendo que las poblaciones son normales ( X 1 - X 2) - (µ1 - µ2) t = ────────────────────── √(s12 / n1) + (s22 / n2)
(6-8)
Para calcular los grados de libertad, se usa la fórmula: ν = (s21/n1 + s22/n2)2 / [(s21/n1)2/n-1 + (s22/n2)2/n-1]
(6-9)
Donde: s21 y s22 = varianzas de las muestras uno y dos n1 y n2 = tamaños de las muestras uno y dos Nota importante: las diferencias entre las funciones de t (6-6), (6-7), y (6-8) se basan en el método de la selección al azar que se sigue. Por ejemplo, en la función (6-6), el método de selección en el emparejamiento de los pares de las observaciones de las distribuciones es deliberado. Sin embargo, en el caso de las funciones (6-7) y (6-8), con relación a la función (6-6), la selección es completamente aleatoria, sin hacer emparejamientos. Además, las diferencias entre el uso de las funciones (6-6), (6-7), y (6-8) es de que en el caso de la (6-6), el tamaño de las muestras pares debe de ser igual. En contraste, las funciones (6-7) y (6-8) pueden usarse con tamaños de muestras desiguales. También, con respecto a la uso de las funciones (6-7) y (6-8), éstas están relacionadas con la condición de igualdad o desigualdad de las varianzas. La función (6-7) requiere que las varianzas sean iguales y la función (6-8) no. Ahora bien, para hacer un decisión sobre cual de las dos funciones, (6-7) o (6-8) se vaya a
6-7
Dr. Héctor Quevedo Urías
usar, la manera de saber si las varianzas son iguales o desiguales, se puede deducir haciendo una prueba de igualdad de varianzas con la distribución F, esto es, usando la función de F = s21 /s22. Tipos de criterios que se siguen para establecer las pruebas de hipótesis (análogos a los de la distribución normal) 1. La hipótesis nula se puede hacer como: Ho:µ = µo. Bajo estas condiciones de igualdad, las hipótesis alternativas son: H1:µ ≠ µo, H2:µ < µo y H3:µ > µo. Donde µo es el promedio poblacional que se quiere probar. Aquí, cabe notar que en este caso, la prueba de hipótesis es bilateral o de dos colas. 2. También la hipótesis nula se puede hacer como: Ho:µ ≥ µo. En este caso, la hipótesis alternativa es Ho:µ < µo. Aquí, la prueba de hipótesis es unilateral izquierda. 3. Igualmente, la hipótesis nula se puede hacer como: Ho:µ ≤ µo. En este caso la hipótesis alternativa es H1:µ > µo. Aquí, la prueba de hipótesis es unilateral derecha. 4. Seleccionar un nivel de significación de tamaño α, esto es, α = .05 o α = .01 con sus respectivos niveles de confianza de 95% y 99%. También, se pueden usar otros niveles de significación, como el .10, .20, etc., pero los más comunes son los de 0.05 y .01. 5. Seleccionar la estadística apropiada (por ejemplo, si n > 30 casos se usa la distribución z. Si la muestra es n < 30 casos y la población muestreada no es normal se usa la distribución de t de Estudiante, la distribución de Ji cuadrada, la distribución F, etc. 6. Se establecen las regiones críticas usando niveles de confianza del 95%, 99%, 90%, 80% etc. (95% y 99% los más comunes) 7. Se estima el valor de la prueba de estadística de la muestra y se compara con el
6-8
Dr. Héctor Quevedo Urías
valor de la estadística calculada, es decir, zcalc. o tcalc. (De las regiones críticas) y se comparan con ztab. o ttab. Si la estadística calculada es mayor que la estadística tabulada (de las regiones críticas) se rechaza la hipótesis nula). De otra manera, se acepta la hipótesis o no se hace ninguna decisión. De esta manera, si el valor de la estadística calculada se mete en las regiones críticas se rechaza la hipótesis nula (o también si el valor de p es menor o igual al nivel de significación, α deseado). Nota: Aquí es importante recordar que, la prueba de hipótesis nula estadística se diseñó el siglo antepasado. En tiempos modernos de la era cibernética, existe la prueba no tradicional relacionada con el valor de la probabilidad p. También es importante notar que muchos programas de computadora dan únicamente el valor de p y el investigador tiene que interpretarlo acordemente. Mecanismos que se siguen para calcular el valor de la probabilidad p usando las tablas de las distribuciones de t de Estudiante, la JI cuadrada o la distribución F Aquí, para calcular el valor de la probabilidad p se puede hacer usando la función t es decir, haciendo interpolaciones aplicando una fórmula empírica diseñada por el autor de este libro, el Dr. Héctor Quevedo Urías y auxiliado por la Dra. Socorro Arteaga. (λ2 – λ1) / (t2 – t1) = (λ2 - X) / (t2 – tcalc.)
(6-10)
Donde: λ2 = el nivel de confianza más alto de la tabla de la t de Estudiante λ1 = el nivel de confianza más bajo de la tabla de la distribución de t t1 = la probabilidad correspondiente a λ1 t2 = la probabilidad correspondiente a λ2 X = valor desconocido de λ tcalc.= valor de la estadística de la distribución de t, con el nivel significante deseado, e.g., α = .05 o α = .01
6-9
Dr. Héctor Quevedo Urías
Donde: (n - 1) = ν = grados de libertad Nota: si se usa la distribución de JI cuadrada o la de Fisher, únicamente se substituye t por χ2 o por F, respectivamente. Ejemplo #1. Supongamos que queremos hacer la prueba de hipótesis no tradicional con la función t, es decir, usando el valor de la probabilidad p. Entonces, si el valor de la tcalc. = 2.83 con 4 grados de libertad, con α = 0.05 para Ho:µ = µo buscamos el valor de 2.83 en la tabla, pero no lo encontramos. Sin embargo, vemos que está entre 2.776 y 3.747, con sus respectivos valores de λ de .99 y .975. Entonces para encontrar X, procedemos usando la fórmula (6-10) de arriba, donde los valores correspondientes son: λ2 = .99, λ1 = .975, t2 = 3.747, t1 = 2.776, tcalc. = 2.83. Ahora, sustituyendo estos valores en la fórmula de interpolación y sustituyendo: ((λ2 - λ1) / (t2 – t1) = (λ2 – X) / (t2 – tcalc.) (.99 - .975) / (3.747 – 2.776) = (.99 – X) / (3.747 – 2.83) Resolviendo por X da X = 0.976. Por lo tanto, p = 1 – 0.976 = 0.024, pero como son dos colas, entonces, multiplicamos ese valor por 2 y da p = .048.
6-10
Dr. Héctor Quevedo Urías
Ejemplo #2. Se saca una muestra aleatoria de 8 observaciones de pH cuyos valores son: 5, 4, 6, 5, 4, 6, 5, 5. Probar la hipótesis nula de que el valor esperado del pH es de cuando menos 6.5 usando α = 0.05. Calcular el valor de la probabilidad p. Solución: 1. La hipótesis nula es Ho:µ ≥ 6.5; y la hipótesis alternativa es H1:µ < 6.5. Esto dice que la prueba es unilateral izquierda. 2. Usamos la estadística:
t = ( X – µo) / s/√ n = (5.0 – 6.5) / 0.756/√ 8 = - 5.6
3. La región crítica izquierda es t[α;ν] = t[0.05;7] = - 1.895 4. Debido a que tcalc.= - 5.6 < ttab. = - 1.895, se rechaza la hipótesis y nos inclinamos por la hipótesis alternativa. 5. El valor de la probabilidad p se calcula buscando |-5.6| con ν = 7 en la tabla de la distribución t y se sustituyen los valores de λ2 = .99975, t2 = 7.885, λ1 = .9995 t1 = 5.408 y tcalc. = -5.61 en la fórmula de interpolación y resolviendo por la variable X da: (.99975 - .9995)/(7.885 – 5.408) = (.99975 – X)/(7.8885 – 5.6) El valor de la probabilidad es p = 0.00048, el cual es mucho, muy significante Ejemplo #3. Un fabricante de cigarrillos afirma qué, el promedio de nicotina de sus productos es de cuando mucho 5 miligramos por cigarrillo fumado. Para comprobar esta aseveración, se sacó una muestra aleatoria de 25 cigarrillos y se encontró un promedio estadístico de X = 5.5 miligramos de nicotina por cigarro fumado, con una desviación estándar de s = 0.5. Probar la aseveración del fabricante que el verdadero promedio es de a lo más 5 miligramos por cigarrillo fumado. Asumir un
6-11
Dr. Héctor Quevedo Urías
valor significante de α = 0.05. Solución: 1. La prueba de hipótesis nula es: Ho:µ ≤ 5.0. La prueba de hipótesis alternativa es: y H1:µ > 5.0. 2. La región crítica es t0.05;24 = 1.711. 3. Usando la función de t y sustituyendo los valores da: t = (5.5 – 5.0) / 0.5/5 = 5.0 4. Debido a que 5.0 > 1.711 se rechaza la hipótesis nula. 5. No obstante, esta prueba de hipótesis tradicional no da una idea de la fuerza de convicción de que la decisión tomada es, en verdad, correcta. Sin embargo, usando la prueba de hipótesis no tradicional del valor de p, este valor si determina, qué tan verosímil es muestrear un valor del parámetro que sea igual o menor que X = 5.5, cuando µ = 5.0. 6. El valor calculado de p es de aproximadamente .00002. Ejemplo #4. Se dan los siguientes datos de una muestra aleatoria de 15 mediciones de partículas atmosféricas en ppm: 33.38, 32.15, 33.99, 34.10, 33.97, 34.34, 33.95, 33.85, 34.23, 32.73, 33.46, 34.13, 34.45, 34.19, 34.05. Hacer los siguientes cálculos de estadística descriptiva. (a) Estimar el tamaño de la muestra n ~ (b) Estimar el promedio X , la mediana X y la moda Xˆ
(c) Estimar la varianza y la desviación estándar muestrales (d) El valor máximo, mínimo, el rango y el error estándar (e) El sesgo (f) El número de grados de libertad, ν
6-12
Dr. Héctor Quevedo Urías
(g) El intervalo de confianza del 95%, es decir, el nivel de significancia de α = .05) para el promedio poblacional µ. También, hacer los siguientes cálculos de estadística de inferencia: (a) Probar la hipótesis nula de Ho:µ = 34.5 contra la hipótesis alternativa de H1:µ ≠ 34.5. Calcular el valor de la probabilidad p. (b) Probar la hipótesis de Ho:µ ≥ 34.5 contra la hipótesis alternativa de H1: µ < 34.5. Calcular el valor de p. (c) Probar la hipótesis nula de Ho:µ ≤ 33.2 contra H1:µ > 33.2. (d) Calcular el valor de la probabilidad p Solución: Los cálculos de la estadística descriptiva son: (a) El tamaño de la muestra es n = 15 (b) El promedio aritmético, la mediana y la moda son: X = ΣX / n = (33.38 + 32.15 +...+ 34.05)/15 = 33.8
La mediana es: 33.99. La moda no existe. (c) La varianza = s2 = [ΣX 2 – (ΣX) 2/n]/n-1 = [17,125.76 – (506.76)2/15] / 15-1 = 0.38 La desviación estándar = s = √ s2 = √0.38 = 0.62 (d) El valor máximo, mínimo y el rango son: Valor máximo = 34.45. Valor mínimo = 32.15 Rango = valor máximo – valor mínimo = 2.3 El error estándar del promedio es: Error estándar = σ/√ n = 0.62/√ 15 = 0.16
6-13
Dr. Héctor Quevedo Urías
(e) El sesgo denota la simetría de la distribución y en este caso es de 2.55, el cual comparado con el sesgo de la distribución normal estandarizada, que es de 0, indica que la distribución de los datos es oblicua a la derecha o con sesgo positivo. (f) El número de grados de libertad son: ν = n – 1 = 15 – 1 = 14 (g) El intervalo de confianza del 95% o α = .05, corresponde a los valores críticos de ±2.145, con ν = 14 grados de libertad. X – t[1-α/2;ν] (s/√ n) < µ < X + t[1-α/2;ν] (s/√ n)
33.8 – t[.975;14] (0.16) < µ < 33.8 + t[.975;14] (0.16) 33.8 - 2.145 (0.16) < µ < 33.8 + 2.145 (0.16) 33.45 < µ < 34.15 Los cálculos de la estadística de inferencia son: (a) Esta es una prueba de hipótesis bilateral con regiones críticas de ttab. = t[.975;14] = ±2.145 con 14 grados de libertad, con un nivel de significancia de α = .05 (de la tabla de la distribución de t). La estadística usada es la función t de abajo: tcalc. = ( X - µo) / s/√ n = (33.8 – 34.5) / 0.63/√ 15 = - 4.3 Ahora se compara la t calculada con la t tabulada, es decir, con los valores críticos. El criterio que se sigue es de que si la t calculada se introduce en las regiones críticas, entonces, se rechaza la hipótesis sustentada de que Ho:µ = 34.5 y se inclina por la hipótesis alternativa. En conclusión vemos que – 4.3 < - 2.145, es decir, se introduce en el extremo izquierdo de la curva. El valor de la probabilidad p se calcula usando la fórmula de interpolación (6-10) : (λ2 – λ1)/(t2 – t1) = (λ2 – X) / (t2 – tcalc.)
6-14
Dr. Héctor Quevedo Urías
Donde: λ2 = .99975, t2 = 4.499, λ1 = .9995, t1 = 4.14, tcalc. = -4.3 (aquí en este caso, se toma el valor absoluto), X igual a valor buscado el cual corresponden a la interpolación de t = -4.3 con ν = 14 g.l. Sustituyendo los valores en la fórmula de arriba da: (.99975 – .9995)/(4.499 – 4.14) = (.99999 - X)/(4.499 – 4.3) X = 0.99987 y el valor de p es p = 2(1 - .99999) = 0.00002. Este valor es mucho muy significativo y apoya, muy contundentemente, la contención de que el promedio no es mayor que 34.5. (b) Probando la hipótesis nula de Ho:µ ≥ 34.5 contra H1:µ < 34.5 La t calculada es la misma que en la parte (a), es decir, - 4.3. Esta es una prueba unilateral izquierda con α = 0.5 con el valor porcentual de t.95;14 = - 1.761 o sea que la región crítica izquierda es – 1.761 (de la tabla de la distribución de t). Para hacer una decisión de rechazar o de aceptar Ho: se compara el valor de t.95;14 = – 1.761 con tcalc. = – 4.3 y vemos, nuevamente, que se introduce en el extremo izquierdo de la distribución, por lo tanto, se rechaza la hipótesis. El valor de la probabilidad p se calcula buscando el valor absoluto de |-4.3| en la tabla con α = 0.05 y vemos que está entre 4.499 y 4.14 con sus respectivos valores de λ igual a .99975 y .9995. Es decir que el valor de p está entre .00025 < p < .0005, con un valor de p ≈ .0002. (c) Para probar la hipótesis de Ho:µ ≤ 33.2 contra la hipótesis alternativa de H1:µ > 33.2, se usa la estadística de t de Estudiante, es decir: t = (33.8 – 33.2)/0.63/3.87 = 3.68 La región crítica derecha es t.95;14 = 1.76 y vemos que 3.68 es mayor que este valor y se rechaza la hipótesis nula. Bajo estas condiciones, el valor de la probabilidad p es 0.001.
6-15
Dr. Héctor Quevedo Urías
Ejemplo #5. Un fabricante de llantas afirma qué, la vida promedio de cierto tipo de neumático, es mayor que 25,000 kilómetros, bajo condiciones normales de manejo y, para vehículos de cierto peso. Para esto, se saca una muestra aleatoria de 15 llantas y se calcula un promedio aritmético y una desviación estándar de 27,000 y 3,000, kilómetros, respectivamente. Asumir que α = 0.05 y que la población de llantas está normalmente distribuida ¿Se puede concluir de esta información que la contención del fabricante de llantas es legítima? Para resolver este problema hacer lo siguiente: (a) Establecer las pruebas de hipótesis nula y alternativa (b) Establecer la(s) región(es) crítica(s) (c) Calcular el valor de la estadística (d) Calcular y graficar el valor de p. Solución: (a) El problema está preguntando si se puede concluir que µ es mayor que 25,000 kilómetros. Por lo tanto, una afirmación de este efecto deberá ir en la prueba de hipótesis alternativa. Las hipótesis apropiadas son: Ho:µ ≤ 25,000 y H1:µ > 25,000 (b) La región crítica con α = 0.05 es: t0.95;14 = 1.7613 (c) El valor calculado de la estadística t con X = 27,000, error estándar = 774.61, n = 15 y µo = 25,000 es: t = (27,000 – 25,000) / 3000/√15 = 2.58 (d) Para encontrar el valor de la probabilidad p se procede de la siguiente manera: Se busca t = 2.58 en la tabla de la distribución de t con ν = 14 grados de libertad, y vemos que este valor está entre 2.624 y 2.1448, con sus respectivos percentiles de 0.10 y 0.025. De esta manera, si la hipótesis nula Ho: es cierta, entonces, la
6-16
Dr. Héctor Quevedo Urías
probabilidad de obtener un valor de t tan grande o más grande que 2.1448 es 0.025. Similarmente, la probabilidad de obtener un valor tan grande o más grande que 2.624 es de 0.10. Por lo tanto, si Ho: es verdadera, la probabilidad de obtener un valor de t tan grande o más grande que t = 2.58 está entre 0.010 y 0.025, es decir, 0.10 < p < 0.025. Las figuras de abajo muestran esta situación.
Figura 6.1. Figuras (a) y (b) mostrando el intervalo de la probabilidad p y el valor de la probabilidad p, respectivamente. Ejemplo #6. Para probar la eficiencia de una planta de tratamiento lodos activados se midió la concentración del DBO5 en la entrada y en el efluente (salida). Se requiere saber qué tan eficiente es este sistema de tratamiento del drenaje.
6-17
Dr. Héctor Quevedo Urías
TABLA 6.0. Tabla mostrando las concentraciones de DBO. (Elaboración propia) Concentraciones de
Concentraciones de
Diferencias de las
DBO en la entrada
DBO en el efluente
concentraciones
(mg/L)
(mg/L)
(mg/L) 170.5
140.4
30.1
207.4
174.7
32.7
215.9
170.2
45.7
209.0
174.6
34.4
171.6
154.6
17.0
201.2
185.0
16.2
209.9
118.9
91.0
213.3
169.8
43.5
184.1
174.7
9.4
220.4
176.7
43.7
__________________________________________________________________ Solución: Usando los valores de la TABLA 6.0 sacamos las diferencias entre las concentraciones en la entrada y en el efluente. Esto se muestra en la tercera columna de la tabla. Una vez hecho esto, se calcula el promedio aritmético de las diferencias (que es igual a D ) y la desviación estándar (que es igual sd), el error estándar, etc. 1. Usando un paquete de computadora se calcula el valor del promedio D = X = 36.37, la desviación estándar que es igual a sd = 22.95, n = 10, error estándar = 7.26 2. La prueba de hipótesis nula es de Ho:µ = 0 o sea que no hay diferencias entre el
6-18
Dr. Héctor Quevedo Urías
DBO de la entrada y del efluente. La hipótesis alternativa es H1:µ ≠ 0. 3. El nivel de significancia es α = 0.05. La región crítica es del extremo derecho y es igual a t.95;9 = 2.262, es decir, con 9 grados de libertad. 4. Se usa la función (6-6) para emparejamiento deliberado, y sustituyendo los valores da: t = ( D – µo) / sd/√ n t = (36.37 – 0)/7.26 = 5.01 5. Al comparar el valor de tcalc. = 5.01 con el valor de la t crítica de t.95;9 = 2.262, se rechaza la hipótesis nula y decimos que sí hay diferencias entre las concentraciones de la entrada y de la salida del drenaje. 6. Para calcular el valor de la probabilidad p usamos la fórmula de interpolación. Para esto buscamos 5.01 en la tabla de la t de Estudiante y vemos que está entre los valores porcentuales de λ2 = .99975 con t2 = 5.291 y λ1 = .9995 con t1 = 4.781. Ahora usando la fórmula de interpolación y sustituyendo todos los valores da: (.99975 - .9995)/(5.291 – 4.781) = (.99975 – X)/(5.291 – 5.01) Resolviendo por X da X = .9996, por lo tanto, p = 1 - .9996 = .00039. Este valor de p es mucho muy significante y apoya, en forma muy contundente, la decisión de haber rechazado la hipótesis, de que no hay diferencias entre las concentraciones de la entrada a la planta y de la salida. 6. En conclusión rechazamos la hipótesis Ho:µ = 0, esto es, de que no hay diferencias entre las concentraciones de la entrada y del efluente (en verdad si hay mucha diferencia, al juzgar por el valor de la probabilidad p).
6-19
Dr. Héctor Quevedo Urías
Ejemplo #7. Este es un ejemplo de ingeniería ambiental (ingeniería sanitaria) relacionado con el uso de la distribución t, cuando las varianzas de las distribuciones son desiguales, asumiendo que las poblaciones son normales. Aplicando este concepto, en un estudio se sabe que, el deterioro de muchas redes de tubería municipal de agua y drenaje en todo el país es un asunto que preocupa cada vez más a las autoridades. Unas de las tecnologías propuestas para la rehabilitación de las tuberías consisten en usar un forro flexible alrededor del tubo existente. El artículo “Effect of Welding on a High Density Polyethylene Liner” (J. of Materials in Civil Engineering, 1996, pp. 94-100), informa los datos siguientes de resistencia a la tensión, en lbs/in2 (psi), o sea libras por pulgada cuadrada, de especimenes de forro, tanto en el caso en que cierto proceso de fusión se usa, como cuando no se usa. La tabla de abajo da los datos crudos y procesados. Usar α = .05. Para esto hacer los siguientes cálculos: (a) Establecer la prueba de hipótesis nula y la prueba de hipótesis alternativa. Esto es, haciendo una prueba de hipótesis nula de que no hay diferencias en las resistencias a la tensión para los dos tratamientos. (b) Establecer la región crítica. (c) Usar la estadística más apropiada para elaborar este problema. (d) Hacer una decisión estadística usando el criterio tradicional, es decir, de rechazar o de retener la hipótesis nula. (e) Hacer una prueba de hipótesis no tradicional, es decir, calculando el valor del nivel de p.
6-20
Dr. Héctor Quevedo Urías
TABLA 6.1. Tabla mostrando los datos del problema. (Elaboración propia) Sin fusión (en libras por pulgada cuadrada) 2748
2700
2655
2822
2511
3149
3257
3213 3220
2753
2
n1 = 10
X 1 = 2902.8 s1 = 277.2 s 1 = 76,875.99
__________________________________________________________________ Con fusión (en libras por pulgada cuadrada) 3027
3356
n2 = 8
3359
3297
3125
X 2 = 3108.1 s2 = 205.9
2910
2889
2902
s22 = 42382.41.
__________________________________________________________________ Solución: (a) La prueba de hipótesis nula es: Ho:µ = 0 o sea que no hay diferencias entre las tensiones, para los dos tratamientos. Las pruebas de hipótesis alternativas son H1:µ > 0 y H2:µ < 0. (b) La región crítica es unilateral izquierda es igual a -1.75 (c) Se usa la función estadística de t para varianzas desiguales. Es decir, cuando se usan dos muestras aleatorias independientes de poblaciones normales, con varianzas desiguales. Esta estadística de la función de t, algunas veces se llama prueba de Smith-Satterthwaaie abajo mostrada. (Miller et al. 1976, p. 261) Sustituyendo los valores en la ecuación (6-7) da: 3108.10 – 2925.33 t = ———————————— √(277.3)2/10 + (205.9)2/8 = - 1.86
6-21
Dr. Héctor Quevedo Urías
Ahora, usando la fórmula de los grados de libertad, relacionada con la función de t que tiene varianzas desiguales (Li, 1964), es decir: (s21/n1 + s22/n2)2 ν = ————————————————— [(s21/n1)2/(n1-1)] + [s22/n2)2/(n2-1)]
(6-11)
Y sustituyendo todos los valores de: s21 = 76,875.96, n1 = 10, s22 = 42,382.41, n2 = 8 da: [(76,875.96)/(10) + 42,382.41/(8)]2 ν = ————————————————— [(76,875.96)/10)2/9) + (42,382.41/8)2/7] = 16 grados de libertad (d) Conclusión: se rechaza la prueba de hipótesis nula de no diferencias en las resistencias a la tensión debido a que el valor de la estadística t = -1.86 es menor que la región crítica izquierda de -1.75. (e) Para hacer la prueba de hipótesis no tradicional se busca el valor absoluto de la t calculada, es decir, |-1.86| en la tabla de la distribución de t de Estudiante con 16 grados de libertad y vemos que los valores percentiles son de 0.025 y 0.05 con sus puntos porcentuales de 1.746 y 2.120. Entonces, el razonamiento que se sigue para calcular el valor de p es como sigue. Si Ho: es verdadera, la probabilidad de obtener un valor de t tan grande o más grande que 1.746 es 0.025. Además, la probabilidad de obtener un valor tan grande o más grande que 2.120 es de 0.05. Por lo tanto, si Ho: es verdadera, la probabilidad de obtener un valor tan grande o más grande que el valor de -1.86 está entre 0.025 y .05. Para esta prueba en particular, 0.05 > p > 0.025. Ejemplo #8. Supóngase que se saca una muestra de 8 mediciones de nitratos (NO3-) y se calcula un valor de t = - 3.62, con un nivel de significancia de α = 0.05. Probar la
6-22
Dr. Héctor Quevedo Urías
hipótesis nula de Ho:µ = 32.0. Calcular el valor de la probabilidad p. Solución: Aquí la prueba es bilateral. Las regiones críticas son de t[.05;7] = 2.365. El valor de la t calculada es de t = -3.62. Se usa la función de P para dos colas dada como: P = P(t.025 < -|t|) + P(t.025 > |t|)
(6-12)
2. Estamos buscando la probabilidad de sacar un valor de t que exceda 3.62 con ν = 7 grados de libertad, pero vemos que este valor no está en la tabla de la distribución t. Entonces tenemos que interpolar este valor y lo buscamos en la tabla y vemos que está entre λ2 = .9975 con t2 = 4.029 y λ1 = .995 con t1 = 3.499. Además, sabemos que t[.05;7] = -2.375 (porque es de la cola izquierda). Ahora se sustituyen todos estos valores en la fórmula de interpolación (5-27) recapitulada abajo: P = (λ2 – λ1) / (t2 – t1) = (λ2 – X) / (t2 – tcalc.) Enseguida sustituyendo los valores de arriba da: p = [(.9975 - .995)/(4.029 – 3.499) = (.9975 – X)/(4.029 – 3.62)] = (.0025)/(0.53) = (.9975 – X)/(0.409) = .99785. La probabilidad p es 1 - .99785 = .002. Sin embargo, debido a que la prueba involucra dos extremos, por lo tanto, el valor de la probabilidad p se multiplica por 2 para dar p = .0043. Este valor es mucho muy significativo. Las figuras de abajo muestran esta situación.
6-23
Dr. Héctor Quevedo Urías
Figura 6.2. Figuras mostrando las regiones críticas. (Elaboración propia) La distribución de JI cuadrada (χ2) La distribución de JI cuadrada está relacionada con la varianza. Esta distribución se usa para hacer intervalos de confianza para la varianza poblacional y pruebas de hipótesis para la varianza poblacional. Esta estadística de χ2 también se usa para hacer pruebas de bondad de ajuste. Esto se hace para ver si los datos provienen de una población que sigue alguna distribución especificada, como discreta o continua, es decir, comparando los datos teóricos con los observados. Finalmente, la JI cuadrada también se usa para hacer pruebas de independencia, etc. La distribución de JI cuadrada está críticamente condicionada a muestreos de poblaciones normales, porque de otra manera puede conducir a errores muy grandes. Además, un tamaño de muestra grande, no garantiza una prueba confiable.
6-24
Dr. Héctor Quevedo Urías
Propiedades de la distribución de JI cuadrada (χ2) 1. La distribución de JI cuadrada no es simétrica, como la distribución normal o la distribución de t. Los valores de la JI cuadrada pueden ser de cero o positivos, pero no negativos. 3. La distribución de JI cuadrada es una familia de curvas y hay una distribución diferente para cada número de grados de libertad, ν. Pero, a medida que el número de grados de libertad aumenta, la distribución de la JI cuadrada se aproxima a la distribución normal.
Figura 6.3. Distribución de JI cuadrada (χ2) con varios grados de libertad, ν en función f (χ2) = [(χ2)ν/(2-1) e-χ2/2] / {2ν/2 [ν - 2ν) / 2]!}. (Dunn et al. 1974) Ejemplos para determinar las regiones críticas de la JI cuadrada usando los valores porcentuales de χ2p y de χ2[λ,ν]. Ejemplo #9. Encontrar los valores críticos de χ2 que determinen las regiones críticas que contengan un área de 0.025 en cada cola. Asumir que n = 10, por lo tanto, los grados de libertad son de ν = 10 – 1 = 9. Solución:
6-25
Dr. Héctor Quevedo Urías
La figura de abajo muestra una prueba bilateral. Para encontrar el valor crítico izquierdo, se refiere a la tabla de la JI cuadrada y se busca ν = 9 en la columna izquierda de la tabla y se va hasta la columna 0.975, porque el área total a la derecha de este valor es 0.975 que lo sacamos restando 0.025 de 1 y nos da χ2 = 2.700. Similarmente, para la región crítica derecha, se localiza el valor de ν = 9 y nos movemos hacia el valor de 0.025 y da χ2 = 19.023. La Figura 6.4 de abajo muestra esta situación.
↑
χ20.975;9 = 2.70
↑
χ20.025;9 = 19.023
Figura 6.4. Gráfica mostrando los valores críticos de la distribución, con un área de 0.025 en cada cola, con n = 10 y ν = n –1 = 10 – 1 = 9. Fuente: Triola (1995) Por ejemplo, recapitulando el razonamiento anterior, de la Figura 6.4, se puede ver que, para obtener el valor crítico o límite izquierdo de 2.70, hay que localizar 9 en la columna izquierda de grados de libertad y luego localizar 0.975 arriba de la tabla. El área total a la derecha de este valor crítico es 0.975, el cual se estima de 1 – 0.025. Similarmente, para obtener el valor crítico de 19.023, localizar 9 en la columna de grados de libertad y luego localizar 0.025 arriba de la tabla.
6-26
Dr. Héctor Quevedo Urías
Ejemplo #10. Encontrar los valores críticos de χ2 por los cuales el área del extremo derecho de la distribución es de 0.05, si: (a) ν = 15 (b) ν = 21 Solución: (a) El valor de la cola derecha de la distribución de JI cuadrada se busca en la tabla de esta distribución y es: χ2α;n-1 = χ2.05;16-1 = χ2.05;15 = 24.996 (b) El valor de la cola derecha es de χ2.05;21 = 32.7 Ejemplo #11. Para una distribución de JI cuadrada con 12 grados de libertad, encontrar el valor de χ2 de tal manera que: (a) El área a la derecha de χ2 es .05, (b) El área a la izquierda de χ2 es .99 Solución: (a) χ2.05;12 = 21.026 (b) χ2.01;12 = 26.22 Ejemplo #12. Encontrar los valores críticos de χ2 por los cuales el área a la derecha de la distribución es de α = .01, si ν = 5: Solución: Si el área sombreada sobre la derecha es .010, el área a la izquierda de χ22 es .99 y χ22 representa el 99avo percentil, χ2.99, el cual es igual a 15.1. Intervalos de confianza y pruebas de hipótesis usando la distribución de JI cuadrada χ2 El intervalo de confianza 1 – α para la varianza poblacional, σ2 se da como: (n – 1) s2 / χ2[1-α/2;n-1] < σ2 < (n – 1)s2 / χ2[α/2;n-1]
(6-14)
Ejemplo #13. Si una muestra aleatoria estadística de 17 mediciones tiene una
6-27
Dr. Héctor Quevedo Urías
varianza de s2 = 196.38, encontrar el intervalo de confianza para σ2 usando los niveles de confianza son de: (a) α = 0.05 (b) α = 0.01 Solución: (a) Se requiere la función P(χ21-α/2 < σ2 < χ2α/2) = 1 – α. Se calculan los límites superiores e inferiores y luego se sustituyen los valores correspondientes. Para el límite superior: χ2[1-α/2;n-1] = χ2[1-.05/2;17-1] = χ2.975;16 = 6.91 Para el límite inferior: χ2[α/2;n-1] = χ2.05/2;17-1 = χ2.025;16 = 28.8 Ahora, sustituyendo estos valores en la función (6-14) nos da: (17 – 1)(196.38) / 6.91 < σ2 < (17 – 1)(196.38 / 28.8) 454.7 < σ2 < 109.1 La cual se simplifica a:
453.7 > σ2 > 109.1
(b) Para calcular los superiores e inferiores, con un nivel de significancia de 0.01 se procede como sigue: Para el límite inferior: χ2[α/2;n-1] = χ2[.01/217-1] = χ2.005;16 = 34.13 Para el límite superior: χ2[1-α/2;n-1] = χ2[1-.01/2;17-1] = χ2.995;16 = 5.14 Enseguida, usando la fórmula del intervalo y sustituyendo da: (17 – 1)196.38 / 5.14 < σ2 < (17 – 1)196.38 / 34.13 Que se simplifica a: 92.06 < σ2 < 611.3 Este intervalo dice que estamos confiados en un 95% de que la varianza poblacional está entre 92.06 y 611.3. El intervalo de confianza para σ se calcula sacando la raíz cuadrada, lo cual da (10.45, 21.32) y (9.59, 24.72), para α = .05 y α = .01, respectivamente.
6-28
Dr. Héctor Quevedo Urías
Ejemplos de pruebas de hipótesis para la varianza usando la distribución de la JI cuadrada, χ2 asumiendo que la población muestreada es normal La función estadística usada para hacer pruebas de hipótesis para la varianza es la función (6-15) descrita abajo: χ2 = (n – 1)s2 / σ2
(6-15)
Donde: χ2 = estadística de la distribución de la JI cuadrada s2 = varianza muestral σ2 = varianza poblacional (la dada en la hipótesis nula) n = tamaño muestra Ejemplo # 14. Un fabricante de medidores de CO afirma que la desviación estándar poblacional de estos aparatos es menor que 3 ppt. Se saca una muestra aleatoria de 10 aparatos, y se calcula la desviación estándar muestral de 1.6. ¿Existe suficiente evidencia con α = 0.05 para apoyar la contención del fabricante? Solución: 1. Primeramente, debido a que ser requiere determinar si la desviación estándar es menor o menos que 3 ppt, la prueba de hipótesis alternativa es H1:σ2 < 9. Por lo tanto, la prueba de hipótesis nula debe ser Ho:σ2 = 9 2. La región de rechazo es χ2 < χ21-α;n-1 o sea χ2 < χ2.95;9 o sea χ2 < 3.33 3. La estadística a usarse es: χ2 = (n – 1)s2 / σ2 4. Los cálculos son: χ2 = 9(1.6)2 / 9 = 2.56 5. En conclusión, se rechaza la hipótesis nula y se dice que si hay suficiente evidencia para apoyar la contención del fabricante. 6. El valor de p se hace buscando 2.56 en la tabla de la distribución de JI cuadrada con ν = 9 y vemos que es (.025 < p < .01). Usando la función (5-29), y sustituyendo
6-29
Dr. Héctor Quevedo Urías
los valores da: (0.025 – 0.01)/(2.7 – 2.09) = (0.025 – X)/(2.7 – 2.56) y la probabilidad es p = 0.022. La figura de abajo muestra esta situación.
Figura 6.5. Gráfica mostrando el valor de la estadística χ2, la región de rechazo, la región crítica y el valor de la probabilidad p, para el Ejemplo #13.. Ejemplo #15. En un estudio de ahorro de energía eléctrica (lo que ocasionaría que hubiera menos contaminación del medio ambiente) se observa qué, la varianza (poblacional) del consumo es de 28.0 kWh. Se decide poner focos fluorescentes y apagar las luces cuando no se usen, para ver si hay una reducción en la variación del consumo. Para esto se saca una muestra aleatoria de 26 consumos de energía, y se estima una varianza muestral de 16.0 kWh. Usar un nivel de significancia de α = 0.05, y probar que la varianza del consumo de energía se ha reducido, bajo las condiciones dadas. También hacer una prueba de hipótesis no tradicional calculando el valor de la probabilidad p e interpretarla, acordemente. Solución: 1. La prueba de hipótesis nula es Ho:σ2 = 28.0. La prueba de hipótesis alternativa es
6-30
Dr. Héctor Quevedo Urías
H1:σ2 < 28.0. 2. La región crítica se calcula buscando el numero de grados de libertad ν = 26 en la tabla de la distribución de la JI cuadrada con χ2.05;26 y da 15.379 (probabilidades de la cola inferior o izquierda). 3. Usando la estadística de la distribución de la JI cuadrada χ2 para la prueba de hipótesis (6-15), esto es, χ2 = (n - 1)s2 / σ2, y sustituyendo los valores da: χ2calc. = (26 – 1)(16.0) / 28.0 = 14.29 4. Ahora, comparando el valor de χ2calc. = 14.29 con la región crítica izquierda de 15.38, es decir, χ2calc. = 14.29 < χ2.05;26 = 15.38, se rechaza la hipótesis Ho:σ2 = 28.0 y se inclina por la hipótesis alternativa. 5. El valor de p se hace buscando 14.29 en la tabla de la JI cuadrada con ν = 26 y vemos que está entre λ2 = .05 con χ22 = 15.379 y λ1 = .025 con χ21 = 13.844. Sustituyendo los valores en la función (5-29) y resolviendo por X da: (λ2 – λ1)/(χ22 – χ21) = (λ2 – X)/(χ22 – χ2calc.) (.05 - .025)/(15.4 – 13.8) = (.05 – X)/(15.4 – 14.29) La probabilidad es de p = .029. Por lo tanto, si la hipótesis nula es verdadera, esperaríamos de tener un valor de χ2 más grande que, o igual que 14.29, con una probabilidad de .03. Aplicación de la JI cuadrada, χ2 en cuanto a la prueba de bondad de ajuste comparando las frecuencias observadas (lo práctico o los resultados de laboratorio) y las frecuencias teóricas (lo esperado) La prueba de bondad de ajuste se usa para probar la hipótesis de que una frecuencia observada está de acuerdo con algunas distribuciones teóricas, o que hay consistencia entre una distribución hipotética (como la distribución normal, la binomial, etc.) qué encaje con una distribución empírica o muestral.
6-31
Dr. Héctor Quevedo Urías
Aquí se nota qué, las pruebas de hipótesis nulas son siempre unilaterales derechas. También, es de notarse que se puede usar la prueba de KolmogorovSmirnov en las pruebas de bondad de ajuste. Descripción de la estadística de χ2 usada para la prueba de bondad de ajuste χ2 = (o1 – e1)2 / e1 + (o2 – e2)2 / e2 +...+ (ok – ek) / ek k
χ2 = Σ (oj – ej)2 / ej j=1
(6-16) (6-17)
Donde: χ2 = estadística usada para la prueba de bondad de ajuste o = frecuencias observada e = frecuencia esperada k = número de categorías diferentes de un resultado n = número total de casos o tamaño de la muestra ν = k – 1 = número de grados de libertad Nota: En algunas ocasiones, si se van a acomodar los datos por distribuciones teóricas, como la binomial, se usa la relación ν = k – 1 – m (Spiegel, 1961). Cuando se usa la prueba de bondad de ajuste, el criterio para rechazar o retener la hipótesis nula es que, si χ2 = 0, entonces, las observaciones teóricas y las observadas son iguales. Pero, si χ2 > 0, entonces, las frecuencias teóricas y las observadas no son iguales. Esto quiere decir que, si el valor de la estadística χ2calc. > χ2tab., entonces, se rechaza la hipótesis nula; de otra manera, se retiene Ho:. Suposiciones para hacer las pruebas de bondad de ajuste 1. Los datos muestrales consisten de conteos de frecuencia de diferentes categorías, k de muestras aleatorias. 2. Para cada una de las categorías k, la frecuencia esperada es de cuando menos 5.
6-32
Dr. Héctor Quevedo Urías
f(χ2)
χ2α
0
Figura 6.6. Regla de decisión estadística mostrando la región crítica y la región de aceptación, para la prueba de bondad de ajuste, es decir, usando la distribución de JI cuadrada. (Elaboración propia) Ejemplo #16. En un estudio de seguridad municipal, se analiza el número de accidentes por días de la semana. Probar la hipótesis nula de que los accidentes ocurren con iguales frecuencias en los 5 días de la semana. Para esto usar un nivel de significancia de α = 0.05 y calcular el valor de p. Los datos se dan en la TABLA 6.3 de abajo. TABLA 6.3. Frecuencias observadas y esperadas. (Elaboración propia) Día de la semana
| Lunes
Accidentes observados|
31
Accidentes esperados |
29.4
Martes
Miércoles
Jueves
Viernes
42
18
25
31
29.4
29.4
29.4
29.4
6-33
Dr. Héctor Quevedo Urías
Solución: Los datos calculados y los resultados de la prueba de hipótesis se dan abajo. TABLA 6.5. Cálculos para la prueba de bondad de ajuste. (Elaboración propia) Categoría
Frecuencia Frecuencia observada esperada
(o – e)
(o – e)2
(o – e)2/e
Lunes
31
29.4
1.6
2.56
0.0871
Martes
42
29.4
12.6
158.76
5.4000
Miércoles
18
29.4
-11.4
129.56
4.4204
Jueves
25
29.4
-4.4
19.36
0.6585
Viernes
31
29.4
1.6
2.56
0.0871
5
χ2 = Σ(o – e)2 / e = (0.0871) + (5.400) + (4.4204) + (0.6585) + (0.8711) = 10.65 j=1
La prueba de hipótesis nula dice que no hay diferencias entre las frecuencias observadas y las esperadas (los accidentes si ocurren con la misma frecuencia). La región crítica es del extremo derecho, con ν = k – 1 = 5 – 1 = 4 grados de libertad. La estadística tabulada es de χ2α;ν = χ2.05;4 = 9.49. En conclusión, debido a que el valor de χ2 = 10.65 > χ2tab. = 9.49, se rechaza la hipótesis nula, y se dice que si hay diferencias entre las frecuencias observadas y las esperadas. Ahora usando la fórmula de interpolación para la JI cuadrada, con λ2 = .025, λ1 = .05, χ22 = 11.14, χ21 = 9.488 y χ2calc.= 10.65 y sustituyendo todos los valores da: (0.025 – 0.05)/(11.14 – 9.488) = (0.025 – X)/(11.14 – 10.65) Resolviendo por el valor a interpolarse da X = 0.015 = p = 0.015. Ejemplos con la t de Estudiante usando el programa Minitab Para usar el programa Minitab en las pruebas de hipótesis con la distribución de t se
6-34
Dr. Héctor Quevedo Urías
procede como: Stat > Basic Statistics > 1-sample t… Procedimiento: En la ventana de “Variables” poner los datos del problema en la columna C1. En la ventana de “Test mean” poner el promedio probado. En la ventana de “Options” en la ventanilla de “Alternative” poner la hipótesis alternativa deseada y luego presionar la tecla de “OK”. Ejemplo #17. Este problema está relacionado con el ejemplo de la sección de los mecanismos usados para calcular el valor de p. Usando los datos de ese ejemplo #4 correspondientes a esa sección y aplicando la función de arriba del programa Minitab, probar: (a) Ho:µ = 34.5 vs. H1:µ ≠ 34.5 (b) Ho:µ ≥ 34.5 vs. H1:µ < 34.5 (c) Ho:µ ≤ 33.2 vs. H1:µ > 33.2 Después de sustituir todos los valores, el programa Minitab da los resultados mostrados en la tabla de abajo.
6-35
Dr. Héctor Quevedo Urías
TABLA 6.4. Tabla mostrando los cálculos hechos por el Minitab. (Elaboración propia). ________________________________________________________________
Ejemplos de problemas de la t de Estudiante usando el programa de Excel Este es un ejemplo relacionado con un problema de observaciones pares. También se dan las instrucciones para probar las diferencias entre dos promedios poblacionales, cuando las varianzas son iguales. Finalmente se dan las instrucciones para resolver problemas cuando las varianzas son desiguales. Por ejemplo, para el uso de la función de t de Estudiante usada para emparejamientos deliberados se procede de la siguiente manera: Tools > Data analysis > t-Test Paired Two Simples for Means Ejemplo #17. Este es un ejemplo sacado del texto de Probabilidad y Estadística de Walpole et al. (1999). Esta investigación está relacionada con el desarrollo de lo llamado ectomycorrhizal, una relación simbiótica entre las raíces de los árboles y un hongo en la que se transfieren minerales del hongo a los árboles y azúcares de los
6-36
Dr. Héctor Quevedo Urías
árboles a los hongos. Este experimento consistió en aplicar nitrógeno a la mitad de los árboles y a la otra mitad o sea el grupo de control al cual no se le aplicó el nitrógeno. Los pesos de los árboles se registraron en gramos al final del experimento. Probar que no hay diferencias entre los pesos de las dos poblaciones de árboles. Asumir un pareamiento en este problema. Asumir α = 0.05. Los datos se dan en la tabla de abajo. TABLA 6.5. Tabla mostrando los datos del problema. (Walpole et al. 1999) Sin nitrógeno | 0.32 0.53 0.28 0.37 0.47 0.43 0.36 0.42 0.38 0.43 Con nitrógeno | 0.26 0.43 0.47 0.49 0.52 0.75 0.79 0.86 0.62 0.46 Solución: El programa Excel da los resultados en la tabla de abajo. TABLA 6.6. Tabla mostrando los resultados del programa Minitab. (Elaboración propia).
Como se ve en la TABLA 6.6, el valor de la estadística t es de -2.74. Las regiones críticas para una y dos colas son de 1.83 y 2.26, respectivamente. Además, los valores de la probabilidad p son de 0.01 y de 0.02 para una y dos colas, respectivamente. En
6-37
Dr. Héctor Quevedo Urías
conclusión, la hipótesis nula de no diferencias se rechaza en ambos casos y se concluye que si hay diferencias entre los pesos de las dos muestras de árboles. Probando las diferencias entre dos promedios poblacionales, cuando las varianzas son iguales: Tools > Data Analysis > t-Test Two Simples Assuming Equal Variances Similarmente, para la función de t de Estudiante cuando las varianzas son desiguales se procede como: Tools > Data Analysis > t-Test Two Simple Assuming Unequal Variances Se recomienda al lector usar estas dos últimas funciones de la t de Estudiante con el programa Minitab. Función probabilística de densidad de la distribución F y su aplicación en la comparación de varianzas muestrales La distribución F tiene mucha aplicación en la comparación de varianzas muestrales. Esta distribución F se encuentra en problemas que involucran dos a más muestras. Debido a que, la estadística F se define como una relación, la distribución F de probabilidad tiene dos parámetros representados por ν1 y ν2, donde estos valores son enteros positivos. El parámetro ν1 se llama número de grados de libertad del numerador y ν2 se llama el número de grados de libertad del denominador. Para estimar los grados de libertad ν1 y ν2 se usa la tabla de la distribución F dada en el apéndice de este libro. La distribución de F es similar a la distribución de t de Estudiante y de JI cuadrada (χ2), porque es una familia de distribuciones. Cada par de valores de ν1 y ν2 especifican una distribución de F diferente. Otrosí, F es una variable aleatoria continua que varía de cero hasta infinito. Debido a que las varianzas en ambos, el numerador y denominador de la relación F, están elevadas al cuadrado, el valor de
6-38
Dr. Héctor Quevedo Urías
F es siempre positivo. La forma de la curva F es asimétrica y sesgada hacia la derecha. Sin embargo, la distribución F tiende hacia la simetría, a medida que ν1 y ν2 aumentan. No obstante, la prueba de F es extremadamente sensible a distribuciones que no son normales y esta falta de robustez no se mejora con muestras grandes (More et al. 1993). La Figura 6.7 muestra varias curvas de densidad de la distribución de F para diferentes grados de libertad. La distribución de F se usa en situaciones con dos muestras para sacar inferencias acerca de más de dos varianzas poblacionales, como en el caso de problemas de análisis de varianza. Por ejemplo, si s21 y s22 son las varianzas de muestras aleatorias independientes de tamaño n1 y n2 tomadas de poblaciones normales con varianzas poblacionales σ21 y σ22, respectivamente, entonces la relación de abajo: F = s21/σ21 / s22/σ22 = σ22 s21 / σ21 s22
(6-18)
tiene una distribución de F con ν1 = n1 – 1 y ν2 = n2 – 1 grados de libertad La función (6-18) es ampliamente usada para hacer pruebas de hipótesis, para ver si las varianzas son iguales o desiguales. Una aplicación de la función (618) está enfocada en el uso, por ejemplo, de las funciones (6-7) o (6-8), es decir, para decidir si las varianzas son iguales o desiguales. Para probar por varianzas iguales poblacionales se usa el siguiente criterio para pruebas unilaterales y pruebas bilaterales. Esta información se da en la tabla de abajo (McClave et al. 1982).
6-39
Dr. Héctor Quevedo Urías
Tabla 6.7. Diagrama mostrando los criterios que se siguen para pruebas de hipótesis con la distribución F. __________________________________________________________________ Prueba unilateral Ho: σ21 = σ22
Prueba bilateral Ho: σ21 = σ22
Ha: σ21 < σ22
Ha: σ21 ≠ σ22
(o Ha: σ21 > σ22) Prueba estadística:
Prueba estadística:
F = s22/s21
F = Varianza muestral grande/varianza muestral pequeña
(o F = s21/s22 cuando Ha: σ21 > σ22)
= s21/s22 cuando s21 > s22 (o s22/s21 cuando s22 > s21)
Región de rechazo: Fcalc. > Ftab.
Región de rechazo: Fcalc. > Fα/2 cuando s21 > s22
donde Ftab. está basada en ν1 = n2 -1
donde Fα/2 se basa en ν1 = n2 -1
y ν2 = n1 – 1 grados de libertad.
y ν2 = n1 – 1 grados de libertad
(o Fcalc. > Ftab. donde Ha: σ21 > σ22
(o Fcalc. > Fα/2 cuando s21 > s22
donde Ftab. se basa en ν1 = n1 – 1
donde Fα/2 se basa ν1 = n1 – 1
y ν2 = n2 – 1 grados de libertad)
y ν2 = n2 – 1 grados de libertad)
Fuente: McClave et al. (1982)
6-40
Dr. Héctor Quevedo Urías
.
Frecuencia relativa
Figura 6.7. Gráfica mostrando una familia de distribuciones de F con diferentes grados de libertad. Nótese que para la curva con ν1 = 30 y ν2 = 30 grados de libertad, la región crítica es igual a 4.28.
Figura 6.8. Figura mostrando la distribución F, con el valor crítico de F igual a 4.26, con α = 0.05. Ejemplo #18. Este ejemplo está encaminado a encontrar los valores críticos usando la distribución F. Siendo así, encontrar:
6-41
Dr. Héctor Quevedo Urías
(a) F0.05 con ν1 = 6 y ν2 = 10 Solución: Los grados de libertad del numerador son ν1 = 6 y los grados de libertad del denominador son ν2 = 10. Con un valor de significancia de α = 0.05 de la tabla se lee 3.22. Por lo tanto, F0.05;6,10 = 3.22 (b) F0.01 con ν1 = 6 y ν2 = 10 Solución: Nuevamente se busca α = 0.01 en la tabla de F con ν1 = 6 y ν2 = 10 y da F0.01;6,10 = 5.39 (c) Si el tamaño de una muestra es de n1 = 3 y el tamaño de otra muestra es de n2 = 10, encontrar la región crítica con α = 0.05 y 0.01. Dibujar una gráfica señalando la región crítica cuando α = 0.05. Solución: F0.05;2,9 = 4.26 y F0.01;2,9 = 8.02 La Figura 6.8 muestra la región crítica y su valor correspondiente con un nivel de significancia de 5%. Ejemplo #19. Este problema está encaminado a estimar el valor de la probabilidad p para pruebas de F. Por ejemplo, con α = 0.05, para una prueba de hipótesis con n1 = 5 y n2 = 7 y con un valor de Fcalc. = 5.70 la región crítica es F0.05;4,6 = 4.53. Entonces, al comparar el valor de Fcalc. = 5.70 con F0.05;4,6 = 4.53 se rechaza la hipótesis. Sin embargo, esta prueba de hipótesis tradicional no dice, qué tanta fidelidad se le puede dar a el resultado obtenido. Para esto, se hace una prueba de hipótesis no tradicional usando el valor de la probabilidad p. Siendo así, se busca en la tabla de la distribución F el valor de Fcalc. = 5.70, con 4 y 6 grados de libertad y con α = 0.05, pero vemos que no está explícitamente mostrado. Sin embargo,
6-42
Dr. Héctor Quevedo Urías
vemos que está entre 4.53 y 9.15 con sus valores respectivos de α = 0.50 y .010, por lo tanto la probabilidad es .01 < p < .05. Ahora, para obtener un valor de p más especifico se usa la fórmula de interpolación (5-30) : (λ2 – λ1)/(F2 – F1) = (λ2 – X)/(F2 – Fcalc.) Donde λ2 = valor porcentual más alto que el valor de Fcalc., λ1 = valor porcentual más bajo que Fcalc., F2 = valor de la distribución F correspondiente a λ2, F1 = valor de la distribución F correspondiente a λ1, X valor que se quiere interpolar y Fcalc. = valor calculado. Ahora con λ2 = 0.05, λ1 = 0.01, F2 = 4.53, F1 = 9.15 y Fcalc. = 5.70 y sustituyendo y resolviendo por X da: (0.05 – 0.01)/(4.53 – 9.15) = (0.05 – X)/(4.53 – 5.70) X = p = 0.04 Ejemplo #20. Supóngase que un ingeniero ambiental saca dos muestras aleatorias de dos sitios diferentes a lo largo de una corriente de agua y mide las concentraciones de DBO5. Para la prueba de hipótesis el ingeniero quiere usar α = .10. La primera muestra consiste de n1 = 25 concentraciones de DBO5, cuyo promedio es de X 1 = 25 mg/L con una desviación estándar de s1 = 75 mg/L. Similarmente, la segunda muestra consiste de n2 = 25, X 2 = 125 mg/L con s2 = 46. Para esto, se tiene que hacer una decisión si se va a usar la distribución (6-7) de t de Estudiante que requiere de varianzas iguales y/o la distribución (6-8) que no requiere de varianzas iguales. Para resolver este problema hacer lo siguiente: (a) Probar la hipótesis nula de que las varianzas de las dos muestras son iguales. (b) Además, calcular el valor de p. Solución: 1. Debido a que se quiere detectar una diferencia en las varianzas poblacionales,
6-43
Dr. Héctor Quevedo Urías
tendremos que estimar, ya sea σ21 > σ22, o bien, σ22 > σ21. 2. Por lo tanto, la hipótesis alternativa es Ha:σ21 ≠ σ22. 3. La prueba es bilateral, es decir: Ho:σ21/σ22 = 1 y Ha:σ21/σ22. 4. La prueba estadística es: F = varianza muestral grande/varianza muestra pequeña = s21/s22 5. Las suposiciones son de que las muestras tienen frecuencias relativas que son aproximadamente normales. Además, se supone que las muestras son aleatorias e independientes. 6. La decisión estadística se basará en comparar la región crítica de 1.98, con el valor estadístico, esto es: Fcalc. > Ftab. = F.05;24,24 = 1.98 Donde ν1 = n1 – 1 = 24 y ν2 = n2 – 1 = 24 grados de libertad 7. Ahora se calcula la prueba estadística (6-18) y se sustituyen los valores: F = s21/s22 = (76)2/(46)2 = 2.73 8. Debido a que, 2.73 > 1.98, por lo que se rechaza Ho: de varianzas iguales. 9. Usando α = .10 esto dice qué, solamente una vez en diez, esta prueba estadística nos llevaría a concluir erróneamente que las varianzas σ21/σ22 fueran diferentes, cuando de hecho fueran iguales. 10. Para calcular p se busca el valor de 2.73 en la tabla F con ν1 = 24 y ν2 = 24 y está entre .100 y .050. Esto es: .050 < p < .100. No obstante, si se deseara más precisión se puede usar la fórmula de interpolación (5-30), con λ2 = .100, λ1 = .050, con F2 = 1.98, F1 = 2.41 y Fcalc. = 2.73 Sustituyendo todos los valores en (5-30) da: p = 0.013(2) = .02. (Nótese que aquí se multiplica por 2 porque la prueba es bilateral).
6-44
Dr. Héctor Quevedo Urías
Ejercicios Capítulo 6 6.1. Encontrar los valores críticos de t por los cuales el área del extremo derecho de la distribución de t es de α = 0.05, y de α = 0.01, si: (a) ν = 16
(t[α;ν] = t[.95;16] = 1.75, t[.99;16] = 2.583)
b) n = 28
(t[α;ν] = t[.95;16] = 1.70, t[.99;28] = 1.701
(c) ν = ∞
(t[α;ν] = t[.95;∞] = 2.33, t[99;∞] = 2.33)
6.2. Hacer el problema 6.1, pero bilateralmente. 6.3. Para mantener el control de la calidad industrial, un fabricante de sistemas de control de partículas (ciclones), supone que la producción de estos sistemas para el control de partículas < 10 micras, tienen un eficiencia promedio de 32%. Para probar esta aseveración se tomó una muestra de 8 ciclones y se midieron las eficiencias de cada uno para ese tamaño de partículas. Las eficiencias (%) fueron: 29.4, 30.8, 30.6, 31.5, 32.1, 31.7, 30.3, y 30.8%, respectivamente. Hacer las siguientes estimaciones: (a) Establecer un intervalo de confianza para µ, con α = 0.05.
(30.18 < µ < 31.62)
(b) Hacer una prueba de hipótesis bilateral al 95%.
(t = -3.62)
(c) Calcular el valor de la probabilidad, p.
(0.009)
6.4. En una prueba para medir la acumulación de plomo atmosférico (Pb) en la sangre, se realizó un experimento con 15 voluntarios. La prueba consistió en exponer los sujetos en un sitio aledaño a una planta de fundición de metales y de exaltar el metabolismo, esto es, corriendo. Después de que los sujetos terminaron de correr, se les sacó sangre y se medió la concentración de Pb, es decir, antes de correr y después de correr. Para esto usar la estadística de t más apropiada para resolver este problema y sacar las conclusiones apropiadas. La tabla de abajo muestra la información requerida para este experimento. Tabla mostrando los datos del problema. (Elaboración propia)
6-45
Dr. Héctor Quevedo Urías
___________________________________________________________________ No. sujeto
Concentración de Pb antes de correr
Concentración de Pb después de correr
1 2.76 7.02 2 5.18 3.10 3 2.68 5.44 4 3.05 3.99 5 4.10 5.21 6 7.05 10.26 7 6.60 13.91 8 4.79 18.53 9 7.39 7.91 10 7.30 4.85 11 11.78 11.10 12 3.90 3.74 13 26.00 94.03 14 67.48 94.03 15 17.04 41.70 __________________________________________________________________
6.5. En una prueba para diseñar un equipo de control para partículas emitidas por una fuente industrial, se hicieron dos pruebas para saber cual de los dos sistemas de control eran más eficientes. La primera prueba consistió en instalar un filtro de vidrio (baghouse). La otra prueba consistió en agregar al sistema de control del baghouse, un ciclón. Probar la hipótesis, al 95% de nivel de confianza de qué, con el equipo adicional, no hubo diferencia en las reducciones de contaminantes. Calcular el valor de la probabilidad, p. La tabla de abajo muestra los resultados de los dos equipos de control. Asúmase que el muestreo de selección fue completamente al azar, sin emparejamiento y asumir que las poblaciones son normales. (t = 3.54, p = 0.028)
6-46
Dr. Héctor Quevedo Urías
Tabla mostrando las concentraciones de partículas para ambas situaciones. (Elaboración propia) ___________________________________________________________________ Concentración de partículas con Concentración de partículas con el sistema el sistema de control agregado de control, al cual se le agregó el ciclón ___________________________________________________________________ Microgramos/m3 Microgramos/m3 ___________________________________________________________________ 421 207 462 17 400 412 378 74 413 116 ___________________________________________________________________ Observaciones y cálculos sugeridos: Antes de comenzar, tenemos que hacer una decisión sobre cual prueba de t es la más apropiada. Pudiéramos usar la versión de t para observación pares donde hay un aparejamiento deliberado, esto es usando la función (6-6). Tal vez pudiéramos usar la función de t que asume que las varianzas de las poblaciones son iguales y con muestras del mismo tamaño (función (6-7)). La tercera opción, sería usar la versión de t para varianzas desiguales y usando la función (6-8). Sin embargo, si asumimos que se usó el método de selección completamente aleatorio, sin emparejamiento, y si analizamos a simple vista los datos de la tabla de arriba, podemos ver que hay mucha variación en las observaciones (también se puede hacer una prueba de hipótesis con el objeto de ver si las varianzas son iguales), lo que nos inclinaría a usar la tercera opción, esto es, la función (6-8). No obstante, antes de decidirse por el uso de esta función es conveniente hacer una prueba con la función estadística F = s21/s22. 6.6. Para saber si una droga experimental puede curar los síntomas de la leucemia
6-47
Dr. Héctor Quevedo Urías
(porque la llamada leucemia no es una enfermedad en particular de la sangre, sino un síntoma que acusa que todo el cuerpo está enfermo, no únicamente la sangre. De no pensarse así, entonces, se diría que la sangre es una parte independiente del cuerpo), 10 sujetos con el síntoma avanzado, fueron sometidos a una prueba. Cinco de ellos recibieron el tratamiento experimental y cinco de ellos no. El tiempo de supervivencia, en años, se midió en cada uno de los sujetos. Probar con α = 0.05 que esta droga experimental fue efectiva. Asumir que las dos distribuciones son normales y con varianzas iguales. Los datos se dan abajo. Tabla mostrando los datos. (Elaboración propia) __________________________________________________________________ Supervivencia en años _______________________ Sujetos tratados 2.1 5.3 1.4 4.6 2.9 __________________________________________________________________ Sujetos sin tratamiento 1.9 1.5 2.8 3.1 2.0 __________________________________________________________________ 6.7. En un estudio de ingeniería del agua de análisis de oxígeno disuelto (OD) varios laboratorios se avocaron a hacer estos análisis usando el método de Winkler (MW) (titulación) y el método de electrodos (ME). Usar una t estadística de muestras pareadas y probar que no hay diferencias entre los dos métodos. Usar α = .05. Calcular el valor de p. Los datos se dan en la tabla de abajo. La tabla de abajo muestra los datos de oxígeno disuelto (OD) de varios laboratorios usando el método de Winkler y el método de electrodos. Las concentraciones del oxígeno disuelto (OD), se expresan en mg/L son en mg/L. Sugerencia: Usar el programa de computadora Minitab o Excel.
(t = -2.49, p = .01)
6-48
Dr. Héctor Quevedo Urías
Tabla mostrando los datos del problema. (Elaboración propia) Método de | 1.2 1.4 1.4 1.3 1.2 1.3 1.4 2.0 1.9 1.1 1.8 1.0 1.1 1.4 Winkler Método de | 1.6 1.4 1.9 2.3 1.7 1.3 2.2 1.4 1.3 1.7 1.9 1.8 1.8 1.8 Electrodos 6.8. Este es un experimento relacionado con higiene industrial y seguridad, para reducir el número de hombre-horas perdidas, como resultado de los accidentes industriales. Para esto se instaló un nuevo equipo de seguridad. En una prueba para medir la eficiencia del equipo de seguridad instalado, se examinó una muestra aleatoria en varios departamentos de esta industria. El número de horas-hombre perdido en el mes antes de la instalación del equipo y el siguiente mes después de instalar el equipo, el número de horas perdidas por accidentes industriales se registró. La tabla de abajo muestra los datos de la muestra aleatoria que se sacó. Tabla mostrando los datos de horas-hombre perdidas antes y después de instalar el equipo de seguridad. ___________________________________________________________________ Horas perdidas por departamento _______________________________________ Mes 1 2 3 4 5 6 ___________________________________________________________________ Antes de instalar el equipo 18 26 43 17 29 30 Después de instalar el equipo 15 20 31 17 25 27 ___________________________________________________________________ Hacer los siguientes cálculos: (a) ¿Realmente valió la pena la inversión en la instalación del equipo de seguridad?
6-49
Dr. Héctor Quevedo Urías
6.9. Se coleccionaron los siguientes datos de una muestra aleatoria de óxidos de azufre (SO2), en ppm, provenientes de una fundición. Asumir que los datos provienen de una población normal de óxidos de azufre. Usar α = 0.05. La tabla de abajo da la información. Tabla mostrando los datos del problema. (Elaboración propia) Óxidos de azufre (ppm) | 56 58 58 59 57 57
56
57
58
Hacer los siguientes cálculos: (a) Estimar el intervalo de confianza del 95%. Incluir todos los pasos necesarios e interpretarlo acordemente.
(57.33 ± 0.768)
(b) Probar la hipótesis nula de que el promedio poblacional es de 58.5 ppm. Establecer todos los pasos que requiere este problema. Hacer una gráfica mostrando las regiones de rechazo y aceptación. (c) Hacer una prueba de hipótesis no tradicional e interpretarla acordemente. Hacer una gráfica con las probabilidades.
(t = -3.19)
(d) Si no se pudiera rechazar la hipótesis nula, mencionar tres factores que pudieran haber afectado el resultado de este experimento. 6.10. Hacer el mismo problema 6.9 de los óxidos de azufre y probar la hipótesis nula de que el valor del promedio poblacional es de no más de 56.1 ppm. Usar un nivel de significancia de 0.05. Además, estimar la hipótesis no tradicional (el valor de p) e interpretarla acordemente. Hacer una gráfica mostrando la probabilidad. 6.11. Hacer el mismo problema 6.10 de los óxidos de azufre y proceder de la siguiente manera: (a) Probar la hipótesis de que µ es de cuando menos 58.5 usando el nivel de significancia de 0.05.
(t = -3.51, se rechaza Ho:)
6-50
Dr. Héctor Quevedo Urías
(b) Calcular el valor de p.
(p = 0.0002)
(c) Graficar los resultados. 6.12. Un fabricante de fusibles afirma que con una sobrecarga de 25%, los fusibles se fundirán en 14.00 minutos, en promedio. Para probar esta afirmación, se tomo una muestra aleatoria de 20 fusibles y se sometió a una carga de 20% y los tiempos que tardaron en fundirse tuvieron un promedio de 10.63 minutos, con una desviación estándar de 2.48 minutos. Asumiendo que la población muestreada es normal, hacer una prueba de hipótesis para refrendar o rechazar la afirmación del fabricante de fusibles. Asumir α = .05. También, calcular el valor de p. 6.13. En un estudio de seguridad en los caminos carreteros, hecho para evitar los accidentes, la policía federal de caminos cree que la velocidad promedio de los motoristas, que manejan sobre cierta zona carretera, exceden el límite de velocidad de 110 kilómetros por hora. Para esto, se tomó una muestra aleatoria de 20 vehículos con sus respectivas velocidades, en kilómetros por hora registrada por el radar. Los resultados en kilómetros por hora de cada uno de los 20 vehículos fueron: 113.6, 115.0, 117.0, 118.0, 115.9, 84.0, 87.0, 90.0, 110.0, 95.0, 98.0, 99.0, 118.0, 120.0, 121.0, 119.0, 118.0, 111.0, 112.0, 112.6. Usar α = 0.05. Hacer las siguientes estimaciones: (a) ¿Proveen estos datos suficiente evidencia para apoyar la aseveración de la policía federal de caminos de que los motoristas están violando el reglamento del límite de velocidad de 110 kilómetros por hora? (No hay evidencia de que se esté violando a límite de velocidad de 110 kilómetros por hora) (b) Estimar el intervalo de confianza con α = 0.05 y con α = 0.1 para el promedio poblacional de velocidad. (103.14 < µ < 113.18) 6.14. En un estudio de ingeniería de manufactura, en un esfuerzo por establecer el
6-51
Dr. Héctor Quevedo Urías
tiempo estándar para realizar determinada tarea en el ensamble de partes de carburadores para automóviles, el ingeniero de producción selecciona, aleatoriamente, a 16 trabajadores experimentados para realizar esta faena. El tiempo promedio requerido por los 16 trabajadores fue de 13 minutos con una varianza de 9 minutos. El ingeniero de producción desea construir un intervalo de confianza de 99% para la longitud de tiempo del verdadero promedio µ requerido para realizar la faena. Hacer un intervalo de confianza con un nivel de significancia de 0.05. ¿Como se comparan los dos intervalos? ¿Cuál es más amplio y porqué? 6.15. En un estudio hipotético de consumo de gasolina, el kilometraje de gasolina dado por los autos de ciertos modelos es de 10.4 kilómetros por litro con una desviación estándar de 1.6 kilómetros por litro. Se calcula el promedio de rendimiento en kilómetros por litro para muestras de este tipo de modelos de autos. ¿Cuál es la probabilidad de que el promedio de rendimiento de gasolina sea de 12 kilómetros por litro, si se saca una muestra aleatoria de 20 autos? Asumir un nivel significante de α = (p ≈ .00098)
0.01.
6.16. El ingreso promedio mensual, de cierto grupo de profesionistas es como sigue: 30,000, 32,000, 31,000, 29,000, 29,500, 33,000, 31,500, 30,500, 29,800, 29,900. ¿Cuál es la probabilidad de que el verdadero promedio sea de 31,200 pesos? ¿Cuáles serían los factores que pudieran afectar el valor de la probabilidad p? 6.17. En un estudio estadístico, para demostrar que la prueba de t de estudiante es independiente de las unidades de medición, se sacaron muestras de las temperaturas de hornos de ladrilleras medidas en grados Celsius (oC) y en grados Fahrenheit (oF). La hipótesis es que el promedio de la temperatura del horno es de 50 oC. Hacer la misma prueba, pero ahora con el promedio en oF. La tabla de abajo muestra los resultados de las temperaturas de los hornos en oC. Convertir estas temperaturas a oF
6-52
Dr. Héctor Quevedo Urías
completar la tabla de abajo y comparar los resultados de las dos pruebas de hipótesis. ¿Son los resultados de la t de estudiante y de la probabilidad p, iguales o diferentes? Tabla mostrando las temperaturas. (Elaboración propia). Temperaturas oC | 47 55 68 55 51 50 49 45 53 47 48 51 ___________________________________________________________________ Temperaturas oF | ___________________________________________________________________ 6.18. Encontrar los valores críticos de χ2, por los cuales el área de la cola derecha de la distribución es de 0.05 (χ2.95), si los grados de libertad son de: (a) ν = 15 (b) ν 21 (c) ν = 50. 6.19. Para este problema, se dan los siguientes datos obtenidos de una muestra de concentraciones (en mg/L) de nitratos (NO3-) tomados del efluente de una planta de tratamiento de aguas residuales industriales. Construir un intervalo de confianza para el verdadero valor de la varianza, es decir, la varianza poblacional σ2, usando (0.21 < σ2 < 1.31)
un nivel significante de α = 0.01.
Tabla mostrando los datos del problema. (Elaboración propia) 37.61
38.61
37.69
37.72
36.75
38.61
38.88
38.19
37.88
38.00
37.20
37.20
37.53
38.21
38.11
37.40
37.40
39.39
6.20. Si una muestra de partículas de cadmio atmosférico de un tamaño de 17 micras tiene una varianza de s2 = 196.38, encontrar el intervalo de confianza para la varianza
6-53
Dr. Héctor Quevedo Urías
poblacional, si los niveles significantes son de: (a) 0.05 (b) 0.01. 6.21. Si tenemos un tamaño de muestra de n = 20 y un nivel de α = .05, entonces, encontrar los valores críticos de la distribución de la JI cuadrada si: (a) La prueba es unilateral izquierda
(10.117)
(b) Si la prueba es bilateral
(8.907, 31.41)
(c) Si se asume una prueba de bondad de ajuste
(30.14)
6.22. En un estudio de ahorro de energía eléctrica (que contribuiría a menos contaminación ambiental. Porque?) se enlistó el consumo de energía eléctrica (en kWh) durante 7 años diferentes. Usando un nivel de confianza de 95% probar la afirmación de que la desviación estándar para todos esos años es de 1,000,000. Tabla mostrando los datos del problema. (Elaboración propia) 11,943
11,463
10,789
9907
9012
9942
11,153
6.23. El libro Elementary Statistics del auto Mario Triola (1995) da un ejemplo de un radiador de un auto que contiene 3785 mL de anticongelante. Asumiendo que las fluctuaciones son inevitables, el manejador de control de calidad quiere estar seguro de que la desviación estándar sea menos que 30 mL. De otra manera, algunos radiadores se derramarían, mientras que otros, que no tendrían suficiente anticongelante, no. Para esto se selecciona una muestra aleatoria cuyos resultados se dan abajo. Usar estos datos para construir un intervalo de confianza del 99% para el verdadero valor de σ2. ¿Sugiere este intervalo de confianza que las fluctuaciones están en un nivel aceptable? Asúmase que las distribuciones de los llenados de los radiadores con el anticongelante están normalmente distribuidas.
6-54
Dr. Héctor Quevedo Urías
(38.2 < σ < 95.7) Tabla enlistando la muestra de los llenados de anticongelante. __________________________________________________________________ 3761 3861 3769 3772 3675 3861 3888 3819 3788 3800 3720 3748 3753 3821 3811 3740 3749 3839 (Fuente: Triola, 1995) 6.24. Una muestra aleatoria de 700 trabajadores de la industria participó en una prueba para determinar, cuánto tiempo necesitaban para su protección personal haciendo determinada faena. Esto se hizo después de tomar un curso de entrenamiento de higiene industrial y seguridad. Asúmase una prueba de bondad de ajuste. Asumir n = 8. Hacer lo siguiente (a) Probar la hipótesis nula de Ho: y revisar si la población muestreada es normal o aproximadamente normal.
(χ2 = 20.36, χ2crítica = 15.51, se rechaza Ho:)
(b) Calcular el valor de p.
(.05 < p < .005)
6.25. Un ingeniero ambiental mide la cantidad de DBO5 procedentes de 15 lugares a lo largo de una corriente, la cual está contaminada por a una descarga industrial. El ingeniero reporta las concentraciones en mg/L. Como información inicial se sabe que la suma de los cuadrados es igual a 508.1 mg/L. Construir un intervalo de confianza (90.2 > σ2 > 19.46)
del 95% para la varianza poblacional.
6-55
Dr. Héctor Quevedo Urías
CAPITULO 7 Análisis de Varianza Diseños de análisis de varianza completamente aleatorizados.- Método de comparaciones múltiples para saber cuales poblaciones son iguales y cuales son desiguales.- Análisis de varianza de diseño de bloques aleatorizados.Suposiciones del modelo de bloques aleatorios completos.- Análisis de varianza en dos sentidos.- Interacción con ANOVA de dos factores.- Análisis de varianza de tres sentidos: diseño completamente aleatorio.- Interacción con ANOVA de diseños factoriales de tres clasificaciones.- Ejemplos de análisis de varianza usando el programa Minitab.El método para comparar varios promedios se llama análisis de varianza o simplemente ANOVA. En su más simple forma, el análisis de varianza compara varios tratamientos para determinar la igualdad de los promedios. En contraste con la prueba de t de estudiante, que estudia la igualdad de dos poblaciones (Ho: µ1 = µ2), el análisis de varianza estudia más de 2 distribuciones, y usa la estadística F. Específicamente, el modelo ANOVA simple estudia las igualdades de más de 2 promedios, esto significa que estudia los efectos de más de dos "tratamientos," es decir, de la hipótesis nula Ho: µ1 = µ2 = µ3 = ..... = µn, esto es, de que las varianzas de los promedios son igual a cero (σ2µ = 0). A pesar de que este análisis de varianza estudia los promedios, analiza, de hecho, la varianza de las poblaciones. Las propiedades y suposiciones en el análisis de varianza (ANOVA) son: 1. Para las pruebas del análisis de varianza se usa la distribución de F. Esta distribución F no es simétrica, sino sesgada, es decir, oblicua hacia la derecha. 2.
Los
valores
de
F
pueden
ser
7-1
de
cero
o
positivos,
pero
no
Dr. Héctor Quevedo Urías
pueden ser negativos. 3. La prueba de hipótesis es siempre unilateral derecha. 4. Hay una distribución de F diferente para cada par de grados de libertad, (g.l.). La Figura 7.1 muestra esta situación. Para denotar los grados de libertad para el numerador se usa la anotación, ν1 y para los grados de libertad el denominador se usa la anotación, ν2. 5. Las poblaciones tienen distribuciones normales. 6. Las poblaciones tienen la misma varianza o desviación estándar. Si esta condición no puede ser cumplida, la prueba de F no es válida. En este caso se debe de usar una prueba de hipótesis diferente. 7. Las muestras son aleatorias e independientes una de la otra. Nota: Cuando no se pueden cumplir las condiciones de normalidad o de independencia de los datos, uno se tiene que remitir a la pruebas no paramétricas, que no requieren de estas suposiciones.
Figura 7.1. Gráfica mostrando la distribución F. Hay una distribución diferente de F para cada par de grados de libertad del numerador, ν1 y del denominador, ν2. (Elaboración propia).
7-2
Dr. Héctor Quevedo Urías
Diseños de análisis de varianza completamente aleatorizados Existen dos tipos básicos de análisis de varianza: el diseño completamente aleatorizado y el diseño de bloque completamente aleatorizado. En el caso del diseño completamente aleatorizado, conocido por análisis de varianza en un sentido (ANOVA de una clasificación), se asignan los tratamientos aleatoriamente a las unidades experimentales. En este diseño se sacan las muestras independientemente, por lo tanto, la selección de una muestra no afecta la selección de cualquier otra muestra. Para cada muestra se puede calcular el promedio, X j y la varianza s2j. Por ejemplo, supóngase que se quieran probar cuatro marcas de neumáticos, 1, 2, 3 y 4, para determinar si hay diferencias con respecto a la duración. Para esto se pueden asignar, aleatoriamente, una muestra de 10 neumáticos de cada marca, a digamos 25 vehículos y probar su desgastamiento. Una vez probadas las marcas de los neumáticos, se usa el análisis de varianza, para ver si las marcas difieren con respecto a su duración. Por otra parte, en el caso de ANOVA de diseño de bloques completamente aleatorios, este enfoque se usa cuando el error experimental es grande, lo que conlleva al no rechazo de hipótesis debido a que hay mucha variación. De manera que, al “bloquear” las observaciones se reduce la variación. El término “bloque” se deriva de diseños experimentales aplicados a la agricultura, en los cuales las parcelas de tierras de cultivos se refieren como “bloques”. Por ejemplo, en el caso del diseño de bloque aleatorio, los tratamientos (como fertilizantes) se asignan aleatoriamente a unidades dentro de cada bloque, es decir, de parcelas que tengan suelos parecidos. Una suposición importante del modelo para un diseño de bloques completos aleatorizados es que los efectos de tratamiento y de bloqueo se asume que son
7-3
Dr. Héctor Quevedo Urías
aditivos. Por ejemplo, para ilustrar esta situación, si se grafican los promedios poblacionales versus tratamientos, digamos de bloque 1 y 2 y, si las gráficas son paralelas, se dice que los efectos de tratamiento y de bloques son aditivos o que no interactúan. Sin embargo, si las líneas se cruzan entre si, se dice que hay interaccion o no aditividad. El formato de la tabla de ANOVA de un sentido completamente aleatorizado se da abajo. La TABLA 7.1 da una descripción de todos los componentes de clasificaciones unilaterales o de diseños completamente aleatorizados. TABLA 7.1. Análisis de varianza de un sentido de diseños completamente aleatorizados. Fuente de la
Suma de (SS)
Grados de
Cuadrado (MSa)
variación
los cuadrados
libertad
medio
SSa
a–1
Tratamientos Error
SSe
a(n – 1)
Total
SSt
an – 1
MSa = SSa/(a – 1) s2e
Fcalc.
Ftab.
de p F1 = MSa/s2
F[1-α;a-1,a(n-1)]
= SSe/[a(n – 1)]
Donde: a
SSa = n Σ ( y i. - y .. )2
(7-1)
i=1
a
n
SSe = Σ Σ (yij – y i.)2 = SSt – SSa
(7-2)
i=1 j=1 a
n
SSt = Σ Σ (yij – y ..)2
(7-3)
i=1 j=1
a = número de tratamientos n = tamaño de la muestra
7-4
Valor
Dr. Héctor Quevedo Urías
Para denotar los simbolismos usados en la TABLA 7.1, estos se dan en la tabla de abajo. TABLA 7.2. Tabla mostrando los simbolismos usados en la TABLA 7.1. (Walpole et al. 1999) Tratamiento:
1
2
……
i
y11
y11
……
yi1
……
yk1
y12
y22
……
yi2
……
yk2
. .
. .
……
……
y1n
y2n
….
. . yin
…..
. . ykn
Total
T1.
T2.
….
Ti.
….
Tk.
Promedio
y 1.
y 2.
….
y i.
……
….
k
T..
y k.
y ..
Donde: yij = j-ésima observación del i-ésimo tratamiento y i. = promedio de todas las observaciones para el i-ésimo tratamiento y .. = promedio de todas las an observaciones o promedio de los
promedios Ti. = Total de todos los promedios Ejemplo #1. Este es un ejemplo relacionado con el uso de ANOVA unilateral o de diseño completamente aleatorizado. Para esto se coleccionaron las concentraciones atmosféricas de SO2 (en ppm) provenientes de 5 muestreadores localizados a diferentes distancias (aleatoriamente asignadas), de una fuente industrial emisora. Probar la hipótesis nula de que las 5 poblaciones de SO2 son iguales, es decir, Ho: µ1 = µ2 = µ3 = µ4 = µ5. Calcular el valor de p. Los datos se dan en la tabla de abajo. Usar un paquete de computadora para procesar los datos.
7-5
Dr. Héctor Quevedo Urías
TABLA 7.3. Tabla mostrando los datos del problema. Número de muestreador |
1
2
3
4
5
500
550
648
720
890
510
540
630
700
900
490
500
620
710
920
530
520
600
736
880
Solución: Si se usa el programa Excel irse a: ANOVA → Single factor. Usando este programa, los resultados se dan abajo: TABLA 7.4. Tabla mostrando los resultados de este problem usando el programa de Excel. ANOVA: Un solo factor RESUMEN Grupos Columna 1 Columna 2 Columna 3 Columna 4 Columna 5
Conteo 4 4 4 4 4
Suma 2030 2110 2498 2866 3590
Promedio 507.5 527.5 624.5 716.5 897.5
Varianza 291.6667 491.6667 401 235.6667 291.6667
Tabla de ANOVA Fuente de Variación Entre los grupos Dentro de los grupos
SS 406123.2
gl 4
MS 101530.8
Fcalc. 296.5846
5135
15
342.3333
Total
411258.2
19
7-6
Valor-p 4.4E-14
Fcrit. 3.055568
Dr. Héctor Quevedo Urías
Si se usa el programa Minitab irse a: Stat → ANOVA → One way (unstacked). Los resultados de este problema usando el Minitab se dan en la tabla de abajo. TABLA 7.5. Tabla mostrando los resultados usando el Minitab. One-way ANOVA: Muestreador 1, Muestreador 2, Muestreador 3, Muestreador 4, Muestreador 5 Source Factor Error Total
DF 4 15 19
s = 18.50
SS 406123 5135 411258
MS 101531 342
R-Sq = 98.75%
F 296.58
P 0.000
R-Sq(adj) = 98.42%
Nótese que cada uno de estos paquetes de computadora tiene sus ventajas y desventajas. De cualquier manera, al juzgar por el valor de F = 296.58 >>>> Fcrítica = 3.06, la hipótesis nula de igualdad de poblaciones de SO2 se rechaza de una manera mucho muy significante. Esta decisión es contundentemente apoyada por el valor tan pequeño de p = 4.4x10-14. Ejemplo #2. Se da la siguiente información en la tabla de abajo relacionada con cierto estudio ecológico. Asúmase un diseño completamente aleatorizado. Sacar las conclusiones adecuadas. TABLA 7.6. Tabla mostrando los datos del problema. (Elaboración propia) 6
Tratamiento
Observaciones
∑ yij
y i.
J=1
1
99 40 61 72 76 84
432
72
2
96 84 82 104
99 105
570
95
3
63 57 81 59
64 72
396
66
4
79 92 91 87
78 71
498
83
Solución:
7-7
Dr. Héctor Quevedo Urías
Usando un paquete de programa de computadora da: TABLA 7.7. Tabla de análisis de varianza. (Elaboración propia) Grupos Tratamiento 1 Tratamiento 2 Tratamiento 3 Tratamiento 4
Conteo 6 6 6 6
Suma 432 570 396 498
Promedio 72 95 66 83
Varianza 406.8 97.6 80.8 69.2
Fcalc. 5.99022
Tabla de ANOVA Fuente de Variacion Entre los Grupos Dentro de los grupos
SS 2940
gl 3
MS 980
3272
20
163.6
Total
6212
23
Valor-p 0.004387
Fcrit. 3.098391
El valor de la probabilidad de p es de 0.0044. Este valor también se puede calcular manualmente buscando el valor de la Fcalc. = 5.99 en la tabla de la distribución F e interpolando entre el valor más alto y el más bajo usando la relación (7-4) de abajo: (λ2 – λ1) / (F2 – F1) = (λ2 – X) / (F2 – Fcalc.)
(7-4)
Donde: λ2 = valor porcentual de F más alto que el valor de Fcalc. λ1 = valor porcentual de F más bajo que el valor de Fcalc. F2 = valor de la distribución F correspondiente a λ2 F1 = valor de la distribución F correspondiente a λ1 X = valor que se quiere interpolar Fcalc. = valor calculado usando la tabla de la distribución F. Nota: El mecanismo que se sigue para interpolar es buscando el valor de la Fcalc. =
7-8
Dr. Héctor Quevedo Urías
5.99 en la tabla de la distribución F con ν1 = 3 (numerador) y ν2 = 20 (denominador) y vemos que 5.99 está entre λ2 = .001 con F2 = 8.10 (valor más alto) y λ1 = .01 con F1 = 4.94 (valor más bajo). Enseguida, sustituimos el valor de la Fcalc. = 5.99 y los demás valores en la fórmula de interpolación (7-4) para dar: (.001 - .01)/(8.10 – 4.94) = (.001 – X)/(8.10 – 5.99) Resolviendo por X = .005= p = .005. Este valor está muy de acuerdo al valor de .0044 de la TABLA 7.7. En conclusión, el valor de p = .0044 indica un diseño experimental preciso y conciso. Ejemplo #3. Los nitratos (NO-3) representan la fase más oxidada en el ciclo del nitrógeno. Generalmente, esto ocurre en muy pequeñas cantidades en las superficies de los almacenamientos de agua, pero puede existir en grandes cantidades en algunas aguas subterráneas. En cantidades excesivas, los nitratos pueden ocasionar una enfermedad infantil llamada metemeglobinemia. (Métodos Estándares para el examen del agua y de las aguas residuales, 1971). Por esta razón, el límite es de 45 mg/L para el agua potable. Para los análisis de los nitratos, existen varios métodos. Por ejemplo, un método es el del ácido fenoldisulfónico; otro es el método de la reducción de cadmio; otro más es el método de ácido cromotrópico y, otro más es el método de brucina (alcaloide tóxico). Para esto, se hizo un estudio estadístico para comparar los resultados de los cuatro métodos mencionados arriba para analizar los nitratos. Los siguientes datos se dan abajo. Para esto, llamemos tratamiento (1) al método del ácido fenoldisulfónico, tratamiento (2) al método de la reducción del cadmio, tratamiento (3) al método de ácido cromotrópico, y tratamiento (4) al método de brucina. La tabla de abajo da los resultados en mg/L. Asumir un nivel de significancia de 0.05. Hacer los
7-9
Dr. Héctor Quevedo Urías
siguientes cálculos: (a) Enlistar las suposiciones implicadas por el modelo de ANOVA. (b) Hacer una tabla de análisis de varianza y probar que no hay diferencias entre los 4 métodos. (c) Estimar el valor de la probabilidad p y sacar las conclusiones apropiadas. TABLA 7.8. Tabla con los datos. (Elaboración propia) Tratamiento
Resultados de los seis análisis en mg/L
(1)
99
40
61
72
76
84
(2)
96
84
82
104
99
105
(3)
63
57
81
59
64
72
(4)
79
92
91
87
78
71
Solución: (a) Las suposiciones implicadas por el modelo de análisis de varianza de una sola clasificación son: 1. Las cuatro poblaciones de los nitratos están normalmente distribuidas. 2. Las varianzas de las cuatro poblaciones de nitratos son iguales. 3. Las 24 observaciones (análisis) son independientes, es decir, que las muestras fueron seleccionadas aleatoriamente. (b) Usando el programa Minitab irse a: Stat → ANOVA → One way (unstacked) da los iguientes resultados mostrados en la Tabla 7.9.
7-10
Dr. Héctor Quevedo Urías
TABLA 7.9. Tabla de ANOVA para los resultados de ejemplo de arriba usando el Minitab. (Elaboración propia) One-way ANOVA: Tratamiento 1, Tratamiento 2, Tratamiento 3, Tratamiento 4 Source Factor Error Total
DF 3 20 23
SS 2940 3272 6212
MS 980 164
√MS = √164 = s = 12.81
F 5.99
P 0.004
R-Sq = 47.33%
R-Sq(adj) = 39.43%
Por otra parte, un método corto para hacer análisis de varianza de un sentido, es decir, manualmente, se da usando el formato de la tabla de abajo. TABLA 7.10. Tabla de análisis de varianza (ANOVA) para una clasificación, con muestras de tamaños iguales usando el método abreviado. (Elaboración propia). Fuente de
Suma de los
Variación
cuadrados
g.l.
Cuadrado del
Fcalc.
Ftab.
promedio
Debido al SSa = ∑T2/n – G2/an a–1 MSa = SSa/(a-1) MSa/s2e F[1-α;a-1,a(n-1)] tratamiento Residuo SSr = ∑X2 - ∑ T2/n a(n-1) s2e = SSr/a(n-1) Total
SSt = ∑X2 – G2/an
na-1
Donde: T2 = cuadrado de los totales g.l. = ν = grados de libertad n = tamaño de la muestra G = gran total a = número de muestras
7-11
Valor de p Estimado
Dr. Héctor Quevedo Urías
Ejemplo #4. La tabla de abajo muestra los datos de los análisis de demanda química de oxígeno (DQO) hechos por 3 laboratorios diferentes. Se tomaron 3 muestras de 5 observaciones cada una. Asumir que las 3 muestras vienen de poblaciones normales aleatorias y que tienen la misma varianza. Asumir un nivel de significancia de α = 0.05. Hacer lo siguiente: (a) Una tabla con un análisis de varianza para el DQO. (b) Establecer la región crítica. (c) Probar la hipótesis nula de Ho: µ1 = µ2 = µ3, o sea que σ2µ = 0, es decir, que los promedios de las tres poblaciones de DQO son iguales. Además, establecer la hipótesis alternativa apropiada. (d) Si se rechaza Ho: calcular el valor de la probabilidad p. Se da la tabla de abajo con algunos cálculos preliminares: TABLA 7.11. Tabla mostrando los cálculos preliminares. (Elaboración propia) Número de muestra Observación
(1)
(2)
(3)
3
9
1
7
12
2
7
11
6
6
8
4
2
5
7
Combinación
__________________________________________________________________ Totales
25
45
20
Promedio X
5
9
4
Solución: Usando las estadísticas de la TABLA 7.10, los cálculos son:
7-12
G = 90 X =6
Dr. Héctor Quevedo Urías
G = ΣT = ΣX = T1 + T2 + T3 +...+ Tk = 25 + 45 + 20 = 90, an = (3)(5) = 15 Promedio general o promedio de los promedios = X = G / an = 90 / 15 = 6 También, X = ( X 1 + X 2 + X 3) / a = (5 + 9 + 4) / 3 = 6 ΣX 2 = 688, n = 5, a = 3, ΣT2 / n = 3,050 / 5 = 610 SS(entre las muestras) = (ΣT2 / n) - (ΣT)2 / an = ΣT2 / n - G2/an = (252 + 452 + 202)/5 - [(25 + 45 + 20)2] / [(3)(5)] = 70.0 Nota 1: la suma de los cuadrados SSa = SS(entre las muestras) mide la variación entre los promedios muestrales a. SS(dentro de las muestras) = ΣX 2 - ΣT2/n = Σ(X - X )2 = 688 - 610 = 78 Nota 2: SSr = SS(dentro de las muestras) mide la variación de las observaciones dentro de los promedios muestrales. SS(total) = SS(entre las muestras) + SS(dentro de las muestras) = ΣX 2 - G2/an = Σ(X - X )2 Nota 3. SS(total) mide la variación total de las observaciones an. La varianza de los promedios muestrales es: s2 x = cuadrado del promedio de SS(entre las muestras) = Σ(X - X )2 / a-1 = [(5 - 6)2 + (9 - 6)2 + (4 - 6)2]/3 - 1 = (-12 + 32 - 22)/2 = 7.0 s2e = cuadrado del promedio de SS(dentro de las muestras) = Σ(X - X )2 / a (n - 1) = SS(dentro de las muestras) / a (n - 1) = 78 / 3(5 - 1) = 6.5
7-13
Dr. Héctor Quevedo Urías
Método de comparaciones múltiples para saber cuales poblaciones son iguales y cuales son desiguales Una vez que se prueban las hipótesis de que los promedios son iguales, o desiguales, entonces, necesitamos saber cuales promedios son desiguales y cuales son iguales. Para esto, se usa lo que se llaman comparaciones múltiples explicados por Walpole et al. 1993. El análisis de varianza es un procedimiento poderoso para probar la homogeneidad de un grupo de promedios. Sin embargo, si rechazamos la hipótesis de igualdad (Ho:µ1 = µ2 = µ3 = µn), y nos inclinamos por la hipótesis alternativa de qué, cuando menos dos de los promedios son iguales, todavía no sabemos cuales de los promedios son iguales y cuales son desiguales. El uso del método de comparaciones múltiples implica hacer varias comparaciones emparejadas entre los tratamientos o promedios. Por ejemplo, las comparaciones emparejadas son pruebas como la de abajo las cuales dicen que son iguales o que no hay diferencia: Ho:µi - µj = 0
(7-5)
H1:µi - µj ≠ 0
(7-5a)
Para hacer estas pruebas emparejadas usamos la versión de t de Estudiante de la forma de: Xi- Xj t = _—————————− s 2/n
Donde: X i = unos de los promedios que se quiera comparar
X j = otro de los promedios que se quiera comparar
7-14
(7-6)
Dr. Héctor Quevedo Urías
s = desviación estándar combinada o la raíz cuadrada del cuadrático promedio del error MS n = tamaño de la muestra de cada tratamiento Ejemplo #5. El libro Probabilidad y Estadístisca de Walpole et al. (1993) da un ejemplo del uso de las comparaciones múltiples. La tabla de abajo da los datos relacionados con este problema. Asumir un nivel de significancia de α = 0.05. Estimar de valor de la probabilidad p. TABLA 7.12. Tabla mostrando los datos del problema. Número de Agregados 1
2
3
4
5
551
595
639
417
563
457
580
615
449
631
450
508
511
517
522
731
583
573
438
613
499
633
648
415
656
632
517
677
555
679
Resolver los siguientes enunciados: (a) Correr un análisis de varianza usando en paquete de computadora. (b) Probar la hipótesis nula de que la población del agregado 1 es igual a la población del agregado 5, es decir, Ho:µ1 = µ5 contra la hipótesis alternativa de H1:µ1 ≠ µ5. (c) Probar la hipótesis nula de que la población del agregado 4 es igual a la población del agregado 5, es decir, Ho:µ4 – µ5 = 0, contra H1:µ4 - µ5 ≠ 0.
7-15
Dr. Héctor Quevedo Urías
Solución: Usando un programa de computadora como EXCEL da los siguientes resultados. (a) La tabla de abajo muestra los resultados obtenidos usando el paquete de computadora. TABLA 7.13. Resultados usando análisis de varianza de un solo factor. Análisis de varianza de un solo factor Resumen Grupos Agregado 1 Agregado 2 Agregado 3 Agregado 4 Agregado 5
Conteo 6 6 6 6 6
Suma 3320 3416 3663 2791 3664
Promedios 553.3333 569.3333 610.5 465.1667 610.6667
Varianzas 12133.87 2302.667 3593.5 3318.567 3455.467
ANOVA Fuente de Variación Entre los grupos Dentro de los grupos
SS 85356.47 124020.3
gl 4 25
MS 21339.12 4960.813
F calc. 4.301536
Total
209376.8
29
Valor-p 0.008752
F crit. 2.75871
Al juzgar por los resultados obtenidos se rechaza los hipótesis de igualdad de promedios, es decir, Ho:µ1 = µ2 = µ3 = µ4 = µ5, con una probabilidad de p = 0.009. (b) Ahora bien, para probar la hipótesis de que la población del agregado 1 es igual
a la población del agregado 5, se usa la relación: Ho:µ1 = µ5 y H1: µ1 ≠ µ5. Usando la función (7-6) y sustituyendo los valores de µ1 = 553.33, µ5 = 610.67, desviación estandar combinada = s = √ 4960.813 = 70.43 y n = 6 da: Xi- Xj t = ──────── s 2/n
7-16
Dr. Héctor Quevedo Urías
t = (553.33 – 610.67) / [(70.43) (√ 2/6)] = -1.41 Para calcular el valor de la probabilidad p se busca el valor absoluto, |-1.41| en la tabla de la distribución de t de Estudiante y está entre 0.05 y 0.10 y por interpolación da p = 0.17. Este valor no es significante y, por lo tanto, se dice que “tal vez” µ1 = µ5. (c) Aquí se quiere probar la hipótesis nula de que no hay diferencias entre las poblaciones de los agregados 4 y 5, esto es, Ho:µ4 = µ5. Para esto, se procede en forma análoga al inciso (b) usando los valores de µ4 = 465.17, µ5 = 610.67, s = 70.43 y tamaño de muestra de n = 6. Sustituyendo todos estos valores en la función (7-6) da: t = (465.17 – 610.67) / [(70.43)(√ 2/6) = -3.58 Para calcular el valor de la probabilidad p se consulta la tabla de la distribución de t con 25 grados de libertad y vemos que el valor p correspondiente a 3.58 está entre .0005 < p < 0.001. Por interpolación, el valor calculado de p es igual a 0.0008. Este valor apoya, definitivamente, la hipótesis alternativa de H1:µ4 ≠ µ5. Análisis de varianza de diseño de bloques completamente aleatorizados Como se dijo anteriormente, el diseño de bloques completamente aleatorios se usa para reducir el error experimental, ya sea debido a muestras pequeñas o debido a variación inherente de las observaciones. Con este tipo de diseño por bloques completos es posible controlar la variación dentro de las muestras (residual) generada por algun factor indeseable. De manera qué, al bloquear las observaciones, se reduce la variación, que tal vez no se pueda controlar cuando se usan diseños completamente aleatorizados. El diseño de bloques aleatorizados también se refiere como ANOVA con
7-17
Dr. Héctor Quevedo Urías
dos factores, en el sentido de que se usa I para representar el número de niveles del primer factor A y J para representar el número de niveles del segundo factor B (bloques). Siendo así, hay IJ posibles combinaciones que constan de un nivel de factor A y otro de factor B. Cada una de estas combinaciones se llama tratamiento, por lo que hay IJ diferentes tratamientos. Aquí, en el diseño de bloques, el número de observaciones hechas en el tratamiento IJ se representan con Kij = 1, el cual es un caso especial del diseño de bloques aleatorizados, donde un solo factor A es de interés principal, y el otro factor (B) bloques es incluido para reducir el error experimental. En la siguiente discusión de ANOVA de dos factores, nos centraremos en el caso de Kij = K > 1, para diferenciarlo del diseño de bloques aleatorios con Kij = 1. De cualquier manera, el término “bloque” se deriva de diseños experimentales agrícolas, en los cuales las parcelas de tierras de cultivos se refieren como “bloques”. Por ejemplo, en el caso del diseño de bloques aleatorios, los tratamientos se asignan aleatoriamente a unidades dentro de cada bloque con características de suelos semejantes. De no ser así, las parcelas a las que se le aplica fertilizante, no todas pudieran tener el mismo tipo de tierra, nutrientes o humedad, (lo que puediera causar variaciones en los rendimientos agrícolas). Al agrupar las parcelas por características similares de suelos, minerales, nutrientes, humedad, etc., el error experimental se reduce. Otro ejemplo, es el relacionado con experimentos médicos. Por ejemplo, si los tratamientos son 3 drogas y hay 24 pacientes, usando el diseño completamente aleatorizado, 8 pacientes son asignados aleatoriamente a cada uno de los tratamientos. Pero puede ocurrir que el historial clínico de los 24 pacientes no sea el mismo, lo cual puede afectar su comportamiento a las drogas (lo que puede
7-18
Dr. Héctor Quevedo Urías
causar un error o residual grande). Sin embargo, agrupando los pacientes por historiales clínicos similares, edades, sexo, pesos, fumadores, tomadores, orientaciones sexuales, etc., se controla esta variación. En el caso de la ingeniería ambiental, usando modelos de contaminación atmosférica, se esperaría que las concentraciones de los contaminantes disminuyeran en función de la distancia (siempre y cuando las alturas de los muestreadores fueran iguales, las condiciones metereológicas fueran uniformes y el tipo terreno por donde está pasando la pluma fuera similar). Al controlar estos factores, las concentraciones de los contaminantes disminuyen exponencialmente, en función de la distancia de la fuente emisora, sin producir mucha variación. La tabla de abajo da el ANOVA para el diseño de bloques completos. TABLA 7. 14. ANOVA de un diseño aleatorizado por bloques completos. Fuente de
Suma de los
Grados de
Cuadrado
variación
cuadrados
libertad
medio
SSa
a–1
MSa = SSa/(a – 1)
MSa/s21
F[1-α;a-1,(a-1)(b-1)]
SSb
b–1
MSb = SSb/(b – 1)
MSb/s22
F[1-α;b-1,(a-1)(b-1)]
Debido a los
Fcalc.
Ftab.
Valor de p Calculada
tratamientos Debido a los bloques Residual (Error)
SSe
Total
SSt
(a – 1)(b – 1) MSe = SSe/[(a – 1)(b - 1)] ab – 1
____________________________________________________________________________________
Donde: a
SSa = b Σ ( y i. – y .. )2
Suma de cuadrados de tratamientos
(7-7)
Suma de cuadrados de bloques
(7-8)
i=1
b
SSb = a Σ ( y .j – y .. )2 J=1
7-19
Dr. Héctor Quevedo Urías a
b
SSe = Σ Σ (yij – y i. – y .j + y .. )2
Suma de cuadrados del error
(7-9)
i=1 j=1
a
b
i=1
j=1
SSt = Σ Σ (yij – y ..)2
Suma total de los cuadrados
(7-10)
Donde: y i. = promedio de las observaciones para el i-ésimo tratamiento y .j = promedio de las observaciones para el j-ésimo bloque y .. = promedio de todas las ba observaciones o el promedio de los promedios
yij = j-ésima observación del i-ésimo tratamiento Suposiciones del modelo de bloques aleatorios completos El modelo o diseño de bloques aleatorios completos asume cuatro suposiciones (Dunn et al. 1974) : 1. La respuesta al i-ésimo tratamiento en el j-ésimo bloque proviene de una distribución normal. 2. Los promedios de las distribuciones normales ab pueden expresarse en la forma de µ + α + β. Esta propiedad usualmente se llama aditividad o no interacción. 3. Las varianzas de las poblaciones ab son todas iguales. Esto se llama homoscedasticidad. Este término se discutirá, nuevamente, en el capítuo de regresión y correlación. 4. Las deviaciones de los promedios εij son independientes. Por ejemplo, si se sabe que ε11 es grande, no se puede esperar que ε12 sea pequeña o grande. Una suposición importante del modelo para un diseño de bloques completos aleatorizados es que los efectos de tratamiento y de bloqueo se asumen que son aditivos. Por ejemplo, para ilustrar esta situación, si se grafican los promedios
7-20
Dr. Héctor Quevedo Urías
poblacionales versus tratamientos, digamos de los bloques 1 y 2 y, si las gráficas son paralelas, se dice que los efectos de tratamiento y de bloques son aditivos o que no interactúan. Sin embargo, si las líneas de la gráfica se cruzan entre si, se dice que hay interacción. En este renglón, si no se cumple la condición de aditividad, esto conduce a conclusiones erróneas. El diseño completamente aleatorio, tiene muchas aplicaciones en la producción industrial y en a modelos educativos. Para esto vamos a usar un ejemplo para ilustrar esta situación. Ejemplo #6. Supóngase que 4 diferentes máquinas son manejadas por 4 operadores diferentes. Se quiere saber si los operadores difieren con respecto a la productividad de tiempo, cuando son asignados a variados tipos de maquinarias. Aplicar el análisis de varianza más apropiado para este problema, usando α = 0.05. Sacar conclusiones al respecto usando un paquete de computadora. Los datos se dan en la tabla de abajo: TABLA 7.15. Tabla mostrando la productividad por tiempo de los diferentes operadores asignados aleatoriamente a 4 tipos de máquinas diferentes. Operadores Máquinas
1
2
3
4
A
68.5
79.2
83.8
87.5
B
72.2
80.6
89.3
95.3
C
73.3
80.2
88.0
94.1
D
81.1
88.8
95.2
100.5
Solución:
7-21
Dr. Héctor Quevedo Urías
Usando un paquete de computadora como Excel, se procede como: Tools → Data Analysis → Analysis Tools → Anova: Two Factors Without Replication (Aquí, sin embargo, hay que instalar el módulo de Data Analysis) Las pruebas de hipótesis para los operadores y las máquinas se establecen de la siguiente manera: Ho: Los operadores no difieren con respecto al promedio de productividad por tiempo, contra H1: Los operadores si difieren con respecto al promedio de productividad por tiempo Ho: Las máquinas no difieren con respecto al promedio de productividad por tiempo, contra H1: Las máquinas si difieren con respecto a la productividad Usando el programa Excel da los siguientes resultados mostrados abajo. TABLA 7.16. Tabla mostrando el análisis de varianza con dos factores. Anova con dos factores RESUMEN Máquina A Máquina B Máquina C Máquina D
Conteo 4 4 4 4
Suma 319 337.4 335.6 365.6
Promedio 79.75 84.35 83.9 91.4
Varianza 67.77667 102.03 82.3 70.03333
4 4 4 4
295.1 328.8 356.3 377.4
73.775 82.2 89.075 94.35
28.0625 19.70667 22.1825 28.57
Tabla de ANOVA Fuente de variación Maquinaria Operadores Error
SS 280.26 951.115 15.305
gl 3 3 9
MS 93.42 317.0383 1.700556
Fcalc. 54.93499 186.4322
Total
1246.68
15
Operador 1 Operador 2 Operador 3 Operador 4
7-22
Valor de p .00000414 .00000002
Fcrítica 3.862548 3.862548
Dr. Héctor Quevedo Urías
Conclusión: Con respecto a la maquinaria, debido a que el valor de la Fcalc. = 54.9 >>> Fcrítica se rechaza Ho: Esta decisión es mucho muy significativa, al juzgar por el valor de p = .000004. Las máquinas sí difieren muy significantemente, con respecto a la productividad. Con respecto a los operadores, debido a que el valor de Fcalc. = 186.4 >>>> Fcrítica se rechaza Ho: Esta decisión es mucho, mucho muy significante al juzgar por el valor de p = 2x10-8. Los operadores sí difieren muy significantemente, con respecto a la productividad de tiempo. Esto es apoyado, muy contundentemente, por el valor tan bajo de la probabilidad p. Ejemplo #7. Este es un ejemplo relacionado con un experimento de bloques aleatorios completos para determinar los efectos corrosivos de cuatro sustancias químicas diferentes, v.g., HCl, H2SO4, HNO3 y HF. Es decir, ácidos gaseosos que entran en el flujo de aire (flujo transportador que entra al equipo de control, el cual se genera de un procesamiento industrial), que pasan por los filtros, es decir, en las telas usadas en los filtros o baghouses (hechas de fibra de vidrio, asbestos, dacron, nilón, polietileno), para controlar la contaminación del aire. Para tales fines se seleccionan cinco muestras de telas y se aplica un diseño aleatorio por bloques completos, por medio de probar cada sustancia química, en un orden aleatorio, sobre cada una de las muestras de las telas. Sacar las conclusiones debidas. Los datos se dan en la tabla de abajo. Hacer lo siguiente: (a) Probar la hipótesis nula de igualdad de promedios (b) Hacer una tabla de análisis de varianza de diseño aleatorizado por bloques completos. Sacar las conclusiones apropiadas
7-23
Dr. Héctor Quevedo Urías
TABLA 7. 17. La respuesta de los índices de corrosividad de las cuatro sustancias químicas en las muestras de telas. (Elaboración propia) Tipos de telas _________________________________________ Sustancias químicas Vidrio asbestos dacron nilón polietileno HCl 1.8 2.1 1.1 1.7 1.6 H2SO4 2.7 2.9 0.8 2.5 2.5 HNO3 2.3 2.3 1.1 2.0 1.8 HF 4.4 4.8 2.5 4.4 3.9 Los resultados usando el paquete de Excel se dan abajo. TABLA 7.18. Resultados de las resistencias a la corrosión de las telas usando un diseño aleatorizado de bloques completos. Anova de dos factores sin replicaciones Resumen HCl H2SO4 HNO3 HF
Conteo 5 5 5 5
Suma 8.4 11.4 9.5 19
Promedio 1.68 2.28 1.9 3.8
Varianza 0.157 0.712 0.245 0.605
4 4 4 4 4
11.2 11.2 5.5 10.6 9.8
2.8 2.8 1.375 2.65 2.45
1.273333 0.54 0.5825 1.47 1.083333
Fuente de variación Debido a los ácidos Debido a las telas Error
SS 13.7095 5.738 1.138
gl 3 4 12
MS 4.569833 1.4345 0.094833
Fcalc. 48.18805 15.12654
Total
20.5855
19
Vidrio Asbestos Dacron Nilón Polietileno
Tabla de ANOVA Valor de p 5.75E-07 0.000123
Fcritica 3.490295 3.259167
Debido a que el valor de la Fcalc. = 48.19 > F0.05,3,12 = 3.49 se rechaza la hipótesis
7-24
Dr. Héctor Quevedo Urías
nula de igualdad de tratamientos, y se dice que hay una diferencia muy significativa en la acción de los ácidos, en cuanto el efecto que tienen sobre la resistencia promedio de las telas. Esta contención está muy bien sustentada por el valor tan pequeño de p = 5.75x10-7. Por otra parte, en cuanto a modelos estadísticos para controlar la variación, existe otro tipo de diseño para reducir el error experimental llamado cuadrados latinos. Aún, cuando el diseño en bloques aleatorizados es muy efectivo para reducir el error experimental (residual), al eliminar una fuente de variación, los cuadrados latinos son muy útiles para reducir dos fuentes de variación, mientras se reduce el número de combinaciones. Este diseño, sin embargo, no se discutirá en este texto. Clasificaciones cruzadas: Análisis de varianza en dos sentidos El análisis de varianza en dos direcciones o de dos clasificaciones o de dos sentidos es útil para estudiar dos tipos diferentes de tratamientos. La característica del diseňo factorial en dos sentidos es que, cada nivel de un factor, se usa en combinación con cada nivel del otro factor. Por ejemplo, considérese el caso de n réplicas de las combinaciones del tratamiento que se determinan por a niveles del factor A y b niveles del factor B. En este aspecto, las observaciones se estructuran por medio de un arreglo rectangular, donde los renglones representan los niveles del factor A y las columnas representan los niveles del factor B. Siendo así, hay ab celdas, cada una de las cuales contenienen n observaciones (tamaňo de la muestra). Por ejemplo, si un ingeniero agrónomo investiga el comportamiento de dos tipos de semillas, por medio de variar el nivel del fertilizante, digamos, a tres niveles, alto, mediano y bajo, un factor sería el tipo de semilla y el segundo factor sería el nivel de fertilizante. Este sería un ejemplo factorial con dos factores, el
7-25
Dr. Héctor Quevedo Urías
cual consistiría en usar seis tratamientos formados por medio de usar cada tipo de semilla con cada nivel de fertilizante. Otro ejemplo, de ANOVA de dos factores está relacionado con la medición de las concentraciones de contaminates del aire emitidos por una fuente industrial. Aquí para un factor se pueden seleccionar diferentes niveles distancias de la fuente emisora y, para el otro factor, se pueden seleccionar diferentes alturas donde están situados los muestreadotes (porque la altura afecta las concentraciones). Interacción con ANOVA de dos factores Cuando se estudian experimentos factoriales es importante determinar si los factores principales tienen una influencia en la respuesta, sino también analizar lo que se llama interacción (no aditividad) entre los factores. El texto de Dunn et al. (1974) aplica un experimento de dos clasificaciones, para explicar el concepto de la interacción. Por ejemplo, en la Figura 7.2, en un experimento que involucra tres niveles de agua y tres niveles de fertilizante, las líneas son paralelas, lo que indica que no hay interacción, o sea que hay independencia en los datos. Sin embargo, en la Figura 7.3 se observa qué, en ambas gráficas hay una respuesta promedio con interacción, es decir, que hay dependencia. Por ejemplo, en la primera gráfica un nivel alto de fertilizante interacciona positivamente con un nivel alto de agua; mientras que en la segunda gráfica niveles altos de agua y fertilizante resultan en una respuesta baja, en comparación con la respuesta a niveles bajos y medianos de agua. En términos simples, se dice que hay interacción entre dos factores (digamos A y B), si el cambio en uno de los factores (digamos factor B) produce un cambio en respuesta a un nivel (digamos nivel 1) del otro factor (digamos A) diferente de aquél producido en los otros niveles (digamos nivel 2) de este segundo factor A, donde un nivel es uno de los tratamientos dentro de un factor.
7-26
Dr. Héctor Quevedo Urías
Figura 7.2. Gráfica indicando una respuesta promedio sin interacción (aditividad), o sea que hay independencia en los datos. (Dunn et al. 1974).
Figura 7.3. Gráficas indicando una respuesta promedio con interacción (no aditividad) o sea que hay dependencia entre los datos. (Dunn et al. 1974). Cuando ocurre una interacción en algún experimento es importante investigar porque ocurrió. Por ejemplo, cuando se establece la tabla de análisis de varianza, se estudian los comportamientos de los efectos principales y también, la posible interacción entre los dos factores bajo estudio. En términos estadísticos, si la F calculada es mayor que la F crítica eso indica que los factores están
7-27
Dr. Héctor Quevedo Urías
interactuando. No obstante, la interacción puede ocurrir por mera casualidad. Pero también la interacción puede ocurrir, causalmente, debido a algún valor extremo o a algún factor que no se ha podido controlar. La interacción, también se puede deber a algún problema en los datos o a una respuesta errónea. De cualquier manera cuando los datos obtenidos indican que existe una interacción grande, los efectos principales correspondientes serán de poca utilidad. De esta manera, en el ejemplo #7 de abajo, hay interacciones entre las alturas y las distancias. Cuando se modelan las emisiones de contaminantes atmosféricos, hay muchas variables que pueden afectar los resultados. En este ejemplo, tal vez hubo cambios metereológicos imprevistos, emisiones fugitivas o diferencias en los tipos de terreno por donde pasa la pluma de la chimenea. Esto pudo contribuir a la interacción de los dos factores estudiados en ese ejemplo. Situaciones similares pueden ocurrir en estudios de agricultura. Por ejemplo, si el ingeniero agrónomo desea estudiar los rendimientos agrícolas usando dos factores, como el tipo de semilla y la cantidad de fertilizante aplicado, tiene que analizar si hubo interacción entre los factores semilla-fertilizante. Si hay interacción entre estos dos factores, esto pudo deberse a que, en las parcelas seleccionadas para los cultivos experimentales, no había uniformidad de variables como humedad, tipos de suelos, o de cantidad de nutrientes. Para remediar esta situación se tendría que hacer un experimento por bloques aleatorizados, es decir, teniendo cuidado de que las parcelas agrícolas fueran todas uniformes en las variables anteriormente descritas. De cualquier manera, la tabla de abajo muestra el formato que se usa para experimentos factoriales en dos sentidos o con dos tratamientos.
7-28
Dr. Héctor Quevedo Urías
La TABLA 7.19 de abajo muestra el formato que se sigue para los análisis de varianza en dos sentidos. TABLA 7. 19. Tabla de análisis de varianza en dos sentidos. (Elaboración propia) Fuente de variación Efecto principal
SS
g.l.
MS
Fcalc.
Ftab.
Debido a A
SSa
a-1
MSa= SSa/(a-1)
F1 = MSa/s2e
F[1-α;a-1,ab(n-1)]
Debido a B
SSb
b-1
MSb = SSb/(b-1)
F2 = MSb/s2e
F[1-α;b-1,ab(n-1)]
Interacción de dos factores Debido a AB
SSab
(a-1)(b-1)
Residual
SSe
ab(n-1)
Total
SSt
abn-1
MSab = SSab/(a-1)(b-1) F3 = MSab/s2e
F[1-α;(a-1)(b-1),ab(n-1)]
s2e=SSe/[ab(n-1)]
Donde: a
SSa = bn i=1 Σ ( y i.. - y …)2
(7-11)
b
SSb = an J=1 Σ ( y .j. - y ... )2 a
(7-12)
b
SSab = n i=1 Σ j=1 Σ ( y ij. - y i.. - y .j. + y …)2 a
b
(7-13)
n
SSe = i=1 Σ Σ Σ (yijk - y ij.)2 j=1 k=1 a
b
(7-14)
n
SSt = i=1 Σ Σ Σ (yijk – y …)2 j=1 k=1
(7-15)
7-29
Dr. Héctor Quevedo Urías
A = variación debido al primer factor A B = variación debido al segundo factor B AB = interacción entre el factor A y B (interacción que ocurre cuando no hay aditividad) s21, s22, s23 y s2e son la formación de los cuadrados medios y se obtienen dividiéndolos entre sus correspondientes grados de libertad y = suma de las observaciones en la (ij)-ésima celda ijk
y i.. = promedio de las observaciones para el i-ésimo nivel del factor A y … = promedio de todas las abn observaciones y .j. = promedio de las observaciones para el j-ésimo nivel del factor B y ij. = promedio de las observaciones en la (ij)-ésima celda
yijk = k-ésima observación en el i-ésimo nivel del factor A y el nivel j-ésimo nivel del factor B a = número de muestras del primer factor b = número de muestras del segundo factor n = número total de casos En el análsis de varianza de dos sentidos, para el modelo bajo estudio se divide cada observación yijk en cuatro partes y la quinta en las desviaciones de las observaciones del promedio poblacional (Dunn et al. 1974). Esto es: yijk = µ + αi +βj + (αβ)ij + εijk para i = 1,…. , a; j = 1,…., b; k = 1,..., n,
(7-16)
Donde: a
b
a
i=1
j=1
i=1
b
Σ αi = Σ βj = Σ (αβ)ij = Σ (αβ)ij = 0 j=1
Y donde:
7-30
(7-17)
Dr. Héctor Quevedo Urías
µ = respuesta promedio del conjunto o la respuesta promedio de las poblaciones ab; αi = el efecto del i–ésimo nivel del factor A promediado sobre b niveles del factor B; βj = efecto j–ésimo nivel del factor B; (αβ)ij = interacción entre el i–ésimo nivel del factor A y el j–ésimo nivel del factor B y; εijk = desviación de las observaciones yijk de la respuesta del promedio poblacional para la ij-ésima población. Aquí, es importante recapitular las suposiciones del model de ANOVA en dos direcciones, es decir: 1. Los errores εijk deben ser independientes 2. Los residuales εijk deben estar normalmente distribuidos 3. Los residuales εijk deben de venir de una población con la misma varianza De no cumplirse con estas suposiciones, el diseño será incierto. Ejemplo #8. Para estudiar los efectos de la altura y la distancia en las concentraciones de contaminantes atmosféricos (SO2) emitidos por una chimena industrial se instalaron tres muestreadores, a tres alturas diferentes (3 niveles de A) y, a cuatro distancias diferentes (4 niveles de B) viento abajo de la fuente emisora. Para esto se dan los siguientes avances informativos: SSa = 7.00, SSb = 20.00, SSe = 7.0 y SSt = 45.00. Asumiendo un nivel de significancia de α = 0.05, resolver los siguientes enunciados: (a) Establecer una tabla de análisis de varianza. (b) Hacer pruebas de F para demostrar que ninguno de los valores de F para interacciones de la altura y la distancia es significativo. Probar la hipótesis nula H’o: de que no hay diferencias en las concentraciones promedio de SO2 en las distancias, cuando se usan tres alturas diferentes, en las cuales fueron situados los muestredores que están midiendo las concentraciones del bióxido de azufre.
7-31
Dr. Héctor Quevedo Urías
Además, probar la hipótesis nula H’’o: de que no hay diferencia en las concentraciones promedio en las cuatro distancias a las que se situaron los sensores. Finalmente, probar la hipótesis nula H’’’o: de que no hay interaccion entre las diferentes alturas y las diferentes distancias de los sensores. (c) Ver cuales efectos principales son significativos. (d) Calcular los valores de p. Solución: (a) La tabla de ANOVA con los valores sustituidos se da abajo. TABLA 7.20. Tabla de ANOVA para el problema de los efectos de la altura y la distancia en las concentraciones de contaminantes del aire. __________________________________________________________________ Fuente de
Suma de los
variación
cuadrados (SS)
g.l.
Cuadrado medio
Fcalc.
Ftab.
Valor p
(MS)
______________________________________________________________________________ Debido a la
7.00
2
3.50
6.03
3.89
.001 < p < .01
20.00
3
6.67
11.50
3.49
p >> 5.32, se rechaza la hipótesis sustentada de que Ho:β1 = 0 y se inclina por Ho:β1 ≠ 0. La conclusión es de que la pendiente de la línea no es igual a 0 u horizontal. (3) La tabla de abajo muestra los valores del intercepto en la ordenada, el gradiente de la línea de regresión, los errores estándar, la pruebas de hipótesis usando la t de estudiante, los valores de la probabilidad p y los intervalos de confianza (95%) para βo (intercepto) y β1 (pendiente). TABLA 8.2. Tabla mostrando los valores del intercepto, pendiente, pruebas de t de Estudiante, valor del nivel de p y sus intervalos. (Elaboración propia) __________________________________________________________________ Coeficiente Error Prueba t Valor p Límite Límite estándar inferior superior ___________________________________________________________________ Intercepto 1.02 3.79 0.27 0.79 -7.772 9.76 ___________________________________________________________________P endiente 2.73 0.19 14.23 5.8x10-7 2.29 3.18 __________________________________________________________________ Aquí, nótese que el intervalo de confianza para el intercepto es muy amplio y la hipótesis no se puede rechazar, puesto que el valor de t es muy pequeño y el valor de 8-18
Dr. Héctor Quevedo Urías
p = 0.79 es grande. Esto es apoyado por el valor de 0.79 de p y por un error estándar de 3.79, relativamente grande; lo contrario ocurre con las pruebas estadísticas de la pendiente, cuyo valor de t es grande y cuyo valor de p es muy pequeño. Ejemplo #2. En un estudio de microbiología ambiental, en muestras de agua, se dieron los siguientes datos de la tabla de abajo. Estos datos se refieren al crecimiento de una colonia de bacterias en un medio de cultivo. TABLA 8.3. Tabla mostrando los datos. (Elaboración propia) Tiempo en días de | 3 6 9 12 15 18 inoculación (X) __________________________________________________________________ No. bacterias (Y) | 115,000 147,000 189,000 235,600 257,900 286,400 Hacer los siguientes cálculos: (a) Calcular la línea de regresión. (b) Calcular el coeficiente de determinación R2 y el coeficiente de correlación R. (c) Con la ecuación de regresión, estimar el número de bacterias después de 20 días (d) Encontrar los intervalos de confianza para α y β usando el paquete de EXCEL. (e) Usar el programa Minitab y estimar los valores residuales y analizarlos subjetivamente, para revisar por la calidad del modelo de regresión. Solución: (a) La ecuación de la línea de regresión es: Y = 81,520.00 + 11,774.29 X (b) El coeficiente de determinación lineal múltiple R2 es igual a 0.9880. El coeficiente de correlación R es igual a 0.9940. (c) Cuando X = 20 días, el número de bacterias es de: Y = 81,520 + 11,774.29 (20) ≈ 317,006 bacterias (d) En cuanto a los intervalos de confianza para α y β, el programa de computadora de 8-19
Dr. Héctor Quevedo Urías
EXCEL arroja los siguientes resultados: Intervalo de confianza de 95% para α: 61,259.45 < α < 101,780.6; valor de la probabilidad p = 0.0004; Intervalo de confianza de 95% para β es: 10040.14 < β < 13508.43, con un valor de la probabilidad p = 0.000046 (e). Las figuras de abajo muestran las gráficas que tratan de validar el modelo de regresión lineal, con del número de bacterias en función del tiempo de incubación.
Figura 8.5. Figuras mostrando los resultados del número de bacterias versus el tiempo de incubación. La gráfica (a) muestra la relación entre Y y X, con la línea recta de Y ; la gráfica (b) muestra los residuos crudos versus X; la gráfica (c) muestra los residuos crudos versus los renglones y, la gráfica (d) muestra los residuos crudos versus residuos rezagados (Elaboración propia). 8-20
Dr. Héctor Quevedo Urías
Todas estas gráficas sugieren, subjetivamente, que el modelo de regresión lineal es confiable. ¿Por qué? Ejemplo #3. En un estudio de agricultura, relacionado con la siembra de algodón, en cierto estado de la Unión Americana, la precipitación anual y el rendimiento de la cosecha de algodón son como sigue. TABLA 8.4. Tabla mostrando los datos. (Elaboración propia) Precipitación | 7.12 en pulgadas (X) Rendimiento de | 1037 la cosecha en libras/acre (Y)
63.54
47.38
45.92
8.68
50.86
44.46
380
416
427
619
388
321
Hacer los siguientes cálculos: (a) Calcular los valores del intercepto a y la pendiente b. (b) Escribir la ecuación de la línea de regresión. (c) Calcular el coeficiente de determinación R2 y el coeficiente de correlación R. (d) Predecir el rendimiento de la cosecha de algodón, si la precipitación es de 30 pulgadas. (e) Hacer una tabla de análisis de varianza. Solución: (a) Usando un paquete de computadora como el Excel da: Intercepto en la ordenada = a = 880.40 Pendiente de la línea = b = -9.61 (b) Por lo tanto, la ecuación de la línea de regresión es: Y = 880.40 – 9.61 (X) (c) El coeficiente de determinación = R2 = 0.6991 8-21
Dr. Héctor Quevedo Urías
El coeficiente de correlación = R = 0.8361 (d) Cuando la precipitación de lluvia es de 30 pulgadas, el rendimiento de la cosecha se calcula usando el modelo de regresión obtenido, es decir sustituyendo el valor de X = 30. De esta manera, usando la ecuación de regresión dada arriba y sustituyendo el valor de X = 30 nos da: Y = 880.4 – 9.61 (30) = 592.1 (e) La tabla de análisis de varianza dada por el paquete Excel se da abajo. TABLA 8.5. Tabla de análisis de varianza (ANOVA). (Elaboración propia) Fuente de variación
g.l.
SS
MS
Fcalc.
Ftab.
Valor de p
Debido a la Regresión
1 260,628.2 260,628.2 11.62
5.32
0.019
Residuo
5 112,165.5
Total
6
22,433.11
372793.7
En conclusión, al comparar el valor de la estadística calculada F con el valor crítico de F se rechaza la hipótesis sustentada con un valor de p igual a 0.019. Ejemplo #4. El libro Applied Statistics: Análisis of Variance and Regression de Dunn y Clark (1974) describe un estudio de física, es decir, de óptica, donde se obtuvieron los datos de abajo que muestran los diámetros de las fibras ópticas (en micras) en función de la fuerza de rompimiento de éstas. Para este problema hacer los siguientes cálculos (a) Hacer todos los calculos preliminares y calcular la ecuación de la línea de regresión muestral que estima a la ecuación de regresión poblacional µY|X = α + βX. (b) Usando un paquete de computadora, encontrar el intervalo de confianza para el coeficiente de regresión poblacional α (intercepto en Y), que estima a a. (c) En forma análoga que con en el inciso (b), encontrar el intervalo de confianza para el coeficiente de regresión β (la pendiente de la línea) cuyo estimador es b. 8-22
Dr. Héctor Quevedo Urías
(d) Probar la hipótesis nula de Ho:β = βo, es decir, β = 0 contra la hipótesis alternativa de H1:β > 0 y H2:β < 0. Calcular el valor de la probabilidad p. (e) Hacer un intervalo de confianza para µY|Xo. (f) Calcular los criterios evaluadores del modelo de regresion, v. g., R2, PRESS y s. (g) Hacer una prueba de hipótesis para el coeficiente de correlación poblacional ρ. (h) Graficar los datos y trazar la ecuación de la línea de regresión sobre la gráfica y trazar la línea horizontal correspondiente al valor del promedio Y . (i) Emitir un juicio subjetivo que ayude a validar el uso del modelo de regresión. La tabla de abajo muestra los datos. TABLA 8.6. Tabla mostrando el diámetro de fibras vs. fuerza de rompimiento. Diámetro de la fibra (X)
Log de la fuerza de rompimiento (Y)
22.5 .19 28.0 .62 27.5 .51 25.5 .53 22.0 .24 30.5 .87 23.0 .25 25.0 .25 23.5 .37 27.0 .32 21.5 .13 22.0 .35 29.0 .53 20.5 .22 27.0 .65 (Fuente: Dunn et al. 1974. Applied Statistics: Analysis of Variance and Regression)
Solución: (a) Los cálculos preliminares son: 8-23
Dr. Héctor Quevedo Urías
n = 15, ΣX = 374.5, (ΣX)2/n = 9,350.0, ΣY = 6.03, (ΣY)2/n = 2.42, ΣXY = 158.25, ΣX 2
= 9,482.75, ΣY 2 = 3.03, (ΣXΣY)/n = 2,258.24/15 = 150.55, X = 24.97, Y = 0.402,
Σx2 = ΣX 2 – (ΣX)2/n = 9,482.75 – 9,350.0 = 132.75, Σxy = ΣXY – ΣXΣY/n = 158.25 – 150.55 = 7.70, Σy2 = ΣY 2 – (ΣY)2/n = 3.03 – (6.03)2/15 = .6074 Para calcular la línea de regresión de la muestra, primero calculamos manualmente, los coeficientes a y b de la línea de regresión muestral que estiman a α y β. b = Σxy/Σx2 = 7.70/132.75 = .058 a = Y – b X = 0.402 – (0.058)(24.97) = -1.046 Por lo tanto, la línea de regresión muestral es: y = a + b(X) y = -1.046 + 0.058(X) (b) El intervalo de confianza para α es usando la función (8-18) o usando un paquete de computadora como Excel procediendo como: Tools → Data análisis → Regression y OK. Enseguida, después de que los datos se introdujeron en las columnas A y B de la hoja de Excel irse a la ventanilla de “Input Y Range” y “Input X Range”, lo que genera la TABLA 8.7 de abajo. TABLA 8.7. Tabla mostrando el valor del intercepto, la pendiente, los valores de t y p y los intervalos de confianza para α y β.
Por lo tanto, el intervalo de confianza para el intercepto (α) se lee de la tabla como: -1.5706 < α < -0.5224 (c) En forma análoga el intervalo de confianza para β se lee de la TABLA 8.7 como: 8-24
Dr. Héctor Quevedo Urías
0.0788 > β > 0.0371 (d) Para probar la hipótesis nula Ho:β = βo es decir, β = 0, contra H1:β > 0 y H2:β < 0 usamos la distribución de t de estudiante con ν = n – 2 = 15 – 2 = 13 g.l. La fórmula es: t = (b – βo) / s/√ Σx2. Sustituyendo todos los valores de βo = 0 y demás valores en la fórmula de arriba da: t = (0.058 – 0) / 0.12/ 132.73 = 5.8 Las regiones críticas son: t = ± 2.16. En conclusión: debido a que tcalc. = 5.8 > ttab. = 2.16, se rechaza la hipótesis nula de Ho:β = 0 y se inclina por H1:β > 0. El valor de la probabilidad se calcula usando la fórmula de interpolación (6-10): (λ2 – λ1)/(t2 – t1) = (λ2 – X)/(t2 – tcalc.) Sustituyendo los valores apropiados de la tabla de t nos da: (.00001 - .00002)/(6.287 – 5.607) = (.00001 – X)/(6.287 – 5.8) Lo que da X = p = .00002. Pero como la prueba es bilateral, lo multiplicamos por 2 y da p = .00004. Este valor apoya, muy contundente, la hipótesis alternativa de H1:β > 0. (e) El intervalo de confianza para la variable dependiente de la línea de regresión poblacional, µY|X estimada por Y, con nivel de significancia de α = 0.05, dar varios valores a Xo. Para hacer esto, se usa la función de abajo: Y´o - t[α/2;n-2] s
1 1 +(Xo– X )2/Σx2 < µY|X < Y´ó + t[α/2;n-2] s +(Xo– X )2/Σx2 n n
(8-28)
Donde: X = promedio
t[α/2;n-2] = valor de t con ν = n – 2 g.l. t[.025;13] = ± 2.16 Xo = los diferentes valores que se le den a Xo para construir los límites o bandas de 8-25
Dr. Héctor Quevedo Urías
confianza para µY|X Ahora bien, con los valores de: a = -1.047, X = 24.97, Σx2 = 132.73, s = 0.12, t.0.25;13 = ± 2.16 y asignándole valores a Xo, digamos de 19, 28, 30.0, etc., se procede de la siguiente manera: Para Xo = 19.0; Y’o = -1.047 + 0.058(19.0) = 0.055, etc. Enseguida, usando la fórmula (8-28) y sustituyendo los valores, es decir, para Xo = 19 da: .055–2.16(0.12)
1 +(19.0-24.97)2/132.73 < µ < .055+2.16(0.12) 1 +(19.0-24.97)2/132.73 Y|19 15 15
El cual se simplifica a:
0.335 > µY|19 > 0.299
Así se puede continuar dando diferentes valores de Xo y sustituyéndolos, como se hizo arriba, para, finalmente, hacer las bandas de confianza para µY|X. (f) Para calcular los valores de R, R2, s y PRESS se pueden hacer con un paquete de computadora. Por ejemplo, si se hace manualmente, el coeficiente R se calcula usando la ecuacion (8-14), etc. De otra manera, si se usa el Mintab proceder como: Stat → Regression → Regression En la ventana de “Response” poner la variable dependiente, y en la ventana de “Predictors” poner la variable independiente. También se pueden usar las ventanas de “Graphs”, “Options” y “Results” para obtener información adicional. Por ejemplo los valores de las estadísticas objetivistas de inferencia dadas por el programa son: R2 = 73.6%, R = 0.858, s = 0.1112, PRESS = 0.2204. Por ejemplo, el valor de R = 0.8576 indica indica una correlación positiva que va de acuerdo con la pendiente positiva de la curva de .058. Los valores tan pequeňos de s y de PRESS indican un buen ajuste de los datos al modelo de regresión. (g) Para la prueba de hipótesis Ho:ρ = 0, es decir, para el coeficiente de correlación poblacional, ρ con α = 0.05, contra la hipótesis alternativa de H1:≠ 0, esto es, H2:ρ > 0 8-26
Dr. Héctor Quevedo Urías
y H3:ρ < 0 se usan las siguientes estadísticas: (1) Usando la estadística de t de Estudiante (8-25): t=
n − 2 R / 1− R
2
Donde: R = ya definida Para calcular las regiones críticas se usa la distribución de t, es decir, t[α/2;n-2] = t.025;13 = ± 2.16 Entonces, usando la fórmula de abajo y sustituyendo los valores da: R = Σxy /
∑x ∑ y 2
2
= 7.701 /
(132.73)(0.6074) = 0.86
y R2 = 0.7396
Ahora, usando la estadística de abajo y sustituyendo da t=
n−2
R/
1− R
2
t = 13 (0.86) / .2604 = 6.07 Si se desea sacar el valor de p se busca 6.07 en la tabla de la distribución de t con ν = 13 y con α = .05, lo que da .025 < p < .05. (h) Para graficar los datos aunados a la ecuación de la línea de regresión con una línea horizontal correspondiente al valor del promedio Y se hace usando un paquete de computadora.
8-27
Dr. Héctor Quevedo Urías
Figura 8.6. Gráfica mostrando la fuerza de rompimiento (log10) en función del diámetro de la fibra, con la ecuación de la linea de regresión Y = -1.046 + 0.058(X) y con el promedio Y = 0.402. (Elaboración propia). (i) Emitir un juicio subjetivo que ayude a validar el uso del modelo de regresión. Para responder a esta pregunta se hacen los siguientes gráficos: Residuals Versus the Order of the Data (response is Log fuer) 2
Standardized Residual
1
0
-1
-2 2
4
6
8
10
12
14
Observation Order
Figura 8.7a. Gráfica mostrando los residuos estandarizados versus el orden de la observación. Esta es una gráfica que muestra todos los residuales en el orden en el cual los datos fueron coleccionados. Aquí hay el mismo número de datos positivos y negativos. Esta gráfica también sirve para encontrar errores no aleatorios, especialmente, en efectos relacionados con el tiempo.
8-28
Dr. Héctor Quevedo Urías
Residuals Versus the Fitted Values (response is Log fuer) 2
Standardized Residual
1
0
-1
-2 0.1
0.2
0.3
0.4
0.5
0.6
0.7
Fitted Value
Figura 8.7b. Está gráfica muestra los residuales versus valores ajustados. Para que el modelo de regresión sea aceptable, se requiere que: los puntos en la gráfica sean aleatorios en ambos lados de 0; no debe haber series de puntos que aumenten o disminuyan; no debe haber predominancia de residuales positivos o negativos, ni tampoco debe haber patrones de residuales que aumenten con valores ajustados que aumenten. Como se ve, todas estas condiciones están bien sustentadas. Normal Probability Plot of the Residuals (response is Log fuer) 2
Normal Score
1
0
-1
-2 -2
-1
0
1
2
Standardized Residual
Figura 8.7c. Gráfica mostrando la prueba de normalidad. Los datos deben formar una línea recta si los residuales están normalmente distribuidos (situación que ocurre aquí). De otra manera, la suposición de normalidad se inválida. 8-29
Dr. Héctor Quevedo Urías
Como se observa en estas gráficas, la emision de un juicio subjetivo es aceptable, porque el modelo de regresión seleccionado ajusta bien los datos. Esto se debe a que, en la Figura 8.7a hay aleatoridad en los datos, es decir, con el mismo número de valores positivos y negativos. Además, en la Figura 8.7b la descripción de ésta, sugiere un modelo de regresión representativo de la información dada. Situación similar ocurre con la descripción de la Figura 8.7c. Ejemplo #5. En un estudio de ingeniería del agua relacionado con las reducciones de los sólidos suspendidos, en función de la demanda química de oxígeno (DQO), se sacó una muestra aleatoria, cuyos datos se dan en la tabla de abajo. Para lo siguiente: (a) Identificar la variable dependiente y la independiente y hacer una gráfica de DQO versus reducción de sólidos. (b) Calcular la ecuación de la línea de regresión. (c) Hacer una tabla de análisis de varianza que incluya la F crítica y el valor de p. (d) Validar el modelo candidato, a través de estadísticas como R2, PRESS, s y de la estadística de Durbin-Watson (para la prueba de autocorrelación de residuales). (e) Evaluar la utilidad del modelo a través de gráficos subjetivos: TABLA 8.8. Tabla mostrando las mediciones de sólidos y la demanda química de oxígeno. (Elaboración propia) __________________________________________________________________ Sólidos supendidos DQO ___________________________________________________________________ 30 29 33 37 25 32 29 27 31 36 25 31 30 30 33 30 35 31 29 28 32 29 30 30 29 30 34 30 36 30 28 29 34 29 34 29 34 31 36 29 31 30 33 30 35 28 30 28 28 31 36 28 33 32 26 30 34 28 30 31 27 32 36 27 31 32 27 32 34 26 29 31 Solución: 8-30
Dr. Héctor Quevedo Urías
(a) La variable dependiente es DQO y la variable independiente es reducción de sólidos suspendidos. La figura 8.8 de abajo muestra las concentraciones de DQO versus reducción de sólidos suspendidos. Figura mostrando la grafica de DQO y solidos suspendios.
DQO (Y)
35
30
25 27
32
37
Solidos suspendidos (X)
Figura 8.8. Gráfica mostrando el DQO versus reducción de sólidos. (Elaboración propia) (b) La ecuación de la línea de regresión es: DQO (Y) = 1.53 + 0.909 X(sólidos suspendidos) La pendiente es igual a 0.909 y el intercepto es 1.53 (c) La tabla de abajo muestra la información de ANOVA. TABLA 8.9. Tabla de ANOVA de sólidos suspendidos y DQO. Fuente de SS g.l. MS Fcalc. Fcrítica Valor de p Variación Entre los grupos 32.00 1 32.00 4.35 3.98 0.04 Residual (error) 515.44 70 7.35 Total 546.44 71 __________________________________________________________________ (d) s = 0.9039 R2 = 88.8% PRESS = 31.8928 R2(predecida) = 87.13%
R2(ajustada) = 88.5% Durbin-Watson statistic = 1.67
8-31
Dr. Héctor Quevedo Urías
Aquí, el coeficiente de determinacion R2, mide, qué tan bien el modelo de regresión ajusta los datos. Análogamente, el estadístico PRESS (suma de cuadrados de error de predicción) mide la calidad del modelo de regresión. En cuanto a la estadística Durbin-Watson, si está cercana a 2 no hay autocorrelaciones en series positivas o negativas. La variación de los datos la da la estadística s. (e) La Figura 8.9 da la información subjetiva para la evaluación del modelo. (a) Residuals Versus the Fitted Values (response is DQO (Y)) 2
Standardized Residual
1
0
-1
-2
-3
-4 25
30
35
Fitted Value
(b) Normal Probability Plot of the Residuals (response is DQO (Y))
2
Normal Score
1
0
-1
-2 -4
-3
-2
-1
0
1
2
Standardized Residual
Figura 8.9. La figura (a) prueba por la autocorrelación o falta de independencia de los datos. Además, la figura (b) prueba por la normalidad de los datos. 8-32
Dr. Héctor Quevedo Urías
Regresión y correlación lineal múltiple Muchas aplicaciones del análisis de regresión involucran situaciones donde se tiene más de una variable independiente. En la mayor parte de los problemas de investigación se necesitan varias variables independientes para ver el efecto en la variable dependiente. La variable dependiente o de respuesta (Y) puede estar relacionada con muchas variables independientes o regresoras X1, X2, etc. En el estudio de regresión lineal múltiple se pueden usar el enfoque matricial. También se pueden hacer pruebas de hipótesis, intervalos de confianza, análisis subjetivos (análisis de los gráficos) y análisis objetivos (estadística de inferencia), como los cálculos de los coeficientes de determinación (R2) o de correlación (R), como en el caso de la regresión lineal simple. Sin embargo, en este caso, se puede calcular el coeficiente de correlación general y coeficientes de correlación parciales, es decir, en forma análoga a como se hace con los coeficientes βo, β1, etc. Cuando hablamos de regresión lineal múltiple tenemos las siguientes situaciones: 1. Modelo de primer orden con dos variables regresoras o independientes. 2. Modelo de primer orden con más de dos variables independientes. Modelo de regresión múltiple generalizado Cuando este modelo general es lineal en los coeficientes se denomina modelo de regresión múltiple. Por ejemplo, para el caso de k variables independientes x1, x2, x3,..., xk, el promedio está dado por Y|x1, x2, x3,..., xk y se da por el modelo de regresión múltiple poblacional: Y = µY|x1, x2, x3,..., xk = βo + β1x1 + β2x2 + ...+ βkxk + εk
(8-29)
Este modelo, también se puede expresar con otra anotación como: Yˆ j = βo + β1X1j + β2X2j + ……. + βkXkj + εj
(8-29a)
Los parámetros βj, j = 0, 1, 2, 3,.., k se conocen como coeficientes de regresión 8-33
Dr. Héctor Quevedo Urías
poblacionales. Por ejemplo, el parámetro βj representa el cambio esperado en la respuesta Y, por unidad de cambio en xj, cuando todos los demás pronosticadores xi se mantienen constantes. Además, εi y ei son los errores aleatorios o residuos de población y de la estadística asociados con la respuesta Yi. El modelo de regresión lineal múltiple de la muestra que estima al modelo poblacional de arriba es: Y = bo + b1X1 + b2x2 + ... + bkXk + e
(8-30)
Donde cada coeficiente de regresión parcial βi es estimado por bi. Esto se debe a qué, cada coeficiente parcial βi mide el cambio esperado en Y por unidad de cambio en x1, cuando x2 se mantiene constante, y β2 mide el cambio esperado en Y por unidad de cambio en x2 cuando x1 se mantiene constante. El modelo de primer orden con dos variables independientes es: Yi = βo + β1Xi1 + β2Xi2 + ε
(8-31)
Donde Yi, la variable dependiente que denota la respuesta en las -ésimas tentativas; Xi1 y Xi2 son las dos variables independientes de la -ésima tentativa; βo, β1, β2 son los coeficientes de regresión y, ε es el error o residuo. Modelo de regresión múltiple con más de dos variables independientes Yi = βo + β1Xi1 + β2Xi2 + … + βp-1Xi,p-1 + ε
(8-32)
Cuando hablamos de regresión lineal múltiple, el principal objetivo es la obtención de la ecuación de la línea de regresión muestral, para predicción y estimación, la cual emula a la ecuación poblacional. Sin embargo, antes de poder usar el modelo de regresión calculado, éste se tiene que evaluar, para ver qué tanta confiabilidad se le pueda dar. La evaluación o validación del modelo de regresión estimado se hace a través de análisis objetivos y subjetivos, en forma análoga como en la regresión lineal simple. Por ejemplo, los análisis objetivistas se hacen a través de funciones estadísticas de inferencia. Posteriormente, para que la validación del modelo sea 8-34
Dr. Héctor Quevedo Urías
completa, el procedimiento se complementa usando enfoques subjetivistas, a través de análisis de las gráficas de los valores residuales. Si la validación no es satisfactoria, se procede con remediación del modelo, ya sea haciendo transformaciones de los ejes o probando otros modelos más apropiados, como cuadráticos o cúbicos, etc. Aplicación de análisis subjetivos y objetivos para la evaluación del modelo de regresión Como se ha estado mencionando anteriormente, se sugieren dos maneras de revisar la utilidad del modelo obtenido. Estas maneras son: (1) análisis de gráficas de residuos y, (2) pruebas estadísticas de inferencia. Por ejemplo, para validar el modelo de regresión aplicando análisis subjetivos, es decir, a través de los gráficos de los residuos (ei), éstos se describen como las diferencias entre los puntos y la línea de regresión. Siendo así, las suposiciones son de que los residuos deben ser independientes y normalmente distribuidos, con promedio igual a cero y con varianzas constantes. Más explícitamente, las descripciones de las suposiciones son: 1. Los valores de la variable aleatoria estadística ei deben estar normalmente distribuidos. Para lograr esto, se grafican los residuos (crudos o estandarizados) de la variable dependiente en función de los valores de z o normales esperados. Para que se reúna la condición de normalidad de los datos, todos los puntos deben de estar dentro de las bandas de confianza y deben de estar muy cercanos a la línea de regresión. Además, si los términos del error ei están normalmente distribuidos, los residuales estandarizados o crudos deberán estar, aproximadamente, de acuerdo con las reglas del 68%, 94% y 99%. Esto quiere decir qué, el 68% de los residuos deberán estar entre z = ±1; el 95% deberán estar entre z = ±2 y, finalmente, el 99% de los residuos deberán estar entre z = ±3. 8-35
Dr. Héctor Quevedo Urías
2. Los valores de la variable aleatoria ei deben ser independientes uno del otro. No debe haber colinialidad o correlación en serie. Esto se revisa graficando los residuos (estandarizados o crudos) en función de los renglones. Si no hay, aproximadamente, los mismos residuos positivos y negativos en la gráfica, entonces, el modelo lineal calculado no es el apropiado y tendrán que buscarse otras alternativas (como funciones polinomiales, cuadráticas, cúbicas, etc.). Aquí cabe notar que la suposición de independencia es la más importante que se pueda violar, porque es la base para las pruebas estadísticas como la R2, el error de lo estimado (s dado por el programa Minitab), ANOVA, etc. 3. Los valores de la variable aleatoria ei deben de tener la misma varianza. Esto se llama homoscedasticidad. Esto se puede revisar visualmente graficando los residuales estandarizados o no estandarizados (crudos) contra cada valor de las variables independientes (Xi). Aquí, nuevamente, tiene que haber la misma cantidad de valores positivos y negativos expresados en la gráfica. Aquí, sin embargo,
existen
otros
métodos
para
revisar
por
el
problema
de
heteroscedasticidad que se retomarán en el capítulo de regresión polinomial. Otros investigadores estadísticos (Devore, 2000) sugieren cuatro gráficos de diagnóstico subjetivo, para la validación del modelo de regresión múltiple. Estos gráficos de diagnóstico son: 1. El gráfico de los residuos estandarizados y/o crudos en la ordenada versus los valores de Xi en la abscisa. 2. El gráfico de los residuos estandarizados y/o crudos en la ordenada versus los valores pronosticados (en la abscisa) por el programa de computadora usado. 3. El gráfico de los valores pronosticados en la ordenada versus los valores de Yi en la abscisa. 4. Gráfico de normalidad de los residuos estandarizados versus los percentiles de z 8-36
Dr. Héctor Quevedo Urías
(valores de z). 5. Histogramas. Aplicación de análisis objetivos para la evaluación del modelo de regresión Por otro lado, en cuanto al enfoque objetivista (estadística inferencial) para la validación del modelo de regresión, éste está relacionado con el uso de estadísticas como el coeficiente de determinación múltiple R2 (o r2), el coeficiente de determinación ajustado R2ajustada, el error estándar de lo estimado, s, tablas de análisis de varianza, pruebas de t de Estudiante, intervalos de confianza, el criterio de Mallow de Cp, PRESS, etc. De esta manera, cuando se habla de coeficientes en el modelo de regresión múltiple, existen cuatro tipos de coeficientes: (1) El coeficiente de determinación múltiple (R2) (2) El coeficiente de correlación múltiple (R) (3) El coeficiente de determinación ajustado (R2ajustada) (4) El coeficiente parcial de correlación múltiple (Rij.k) Por ejemplo, el coeficiente de determinación múltiple R2 es, tal vez, la medida estadística más popular usada para medir, qué tan bien encaja el modelo de regresión en los datos de la muestra. En realidad el uso de R2 es una técnica para medir la adecuación de un modelo de regresión lineal múltiple. Esta estadística se puede definir como una proporción o como un porcentaje. Como proporción, sus valores varían de cero a uno. Por ejemplo, si el valor de R2 está cercano a cero, esto indica que no hay una relación lineal entre Y y las X´s, mientras que, un valor cercano a uno, indica una ajuste perfecto. Sin embargo, el valor de R2 no debe de interpretarse ligeramente, sin el apoyo del error estándar de lo estimado (s), el residual (PRESS), el criterio de Mallow (Cp) o los factores de variación inflados (variance inflation factors, VIF). Además la validación del modelo debe estar 8-37
Dr. Héctor Quevedo Urías
apoyada por los análisis de los gráficos subjetivos. De acuerdo a la lógica del programa de NCSS, los siguientes enunciados dan algunas calificaciones de la interpretación de R2. 1. El valor de R2 puede incrementarse agregando más variables independientes, pero esto puede causar un aumento en el error del cuadrado medio, especialmente, cuando la muestra es pequeña. 2. La magnitud de R2 está influenciada por el rango de cada variable independiente. R2 aumenta a medida que el rango de las X´s aumenta y viceversa. 3. El valor de R2 no mide la magnitud de las pendientes. 4. La magnitud de R2 no mide la aptitud del modelo lineal; mide la fuerza lineal del componente del modelo. 5. Un valor grande de R2 no necesariamente significa una predicción grande. Lo opuesto también es correcto. Todo esto tiene que ser complementado o corroborado por otras funciones estadísticas y por el análisis gráfico subjetivo. 6. El valor de R2 es altamente sensible al número de observaciones. Entre más grande sea el tamaño de la muestra, más alto será el valor de R2. Más adelante, hay lo que se llama el valor ajustado del coeficiente de determinación múltiple ajustado (R2ajustada). Este coeficiente de determinación múltiple ajustado R2ajustada es una versión ajustada de R2 la cual busca remover la distorsión causada por un tamaño de muestra pequeño. Igualmente, también hay lo que se llama PRESS (predicted sum of squares) que se usa para validar el modelo de regresión en términos de predicción. Aquí, entre más pequeño sea el valor de PRESS, mejor será el modelo candidato. En forma análoga, también hay lo que se llama el coeficiente de correlación múltiple R. Este coeficiente R mide la fuerza de la relación lineal entre la variable dependiente Y y las variables independientes X1, X2, X3,…, Xk. En contraste con el 8-38
Dr. Héctor Quevedo Urías
coeficiente de correlación lineal simple, el rango de este coeficiente de correlación múltiple es de 0 ≤ R ≤ 1. Esto se debe a que R no indica la pendiente de la ecuación de regresión debido a que no es posible indicar los signos de todos los coeficientes de regresión que relacionan la variable dependiente Y a las variables independiente Xi. Así como en el caso de la correlación lineal, la medición de R2 es más fácil de interpretar que el coeficiente de correlación múltiple, R. Otro tipo de correlación relacionado con regresión y correlación múltiple es lo que se llama coeficiente parcial de correlación múltiple. Este coeficiente mide la fuerza de la relación lineal entre la variable dependiente Y y las variables independientes X1, X2, X3,…, Xk. Este coeficiente se puede expresar como Rij.k el cual es el estimador del coeficiente de correlación múltiple poblacional ρij.k. Rij.k se puede usar para ver la relación causal entre Y y una de las variables independientes, manteniendo las demás constantes. Este coeficiente, también se puede usar para ver la relación entre dos variables independientes. Más adelante, dentro de la categoría de análisis objetivos de estadística inferencial relacionados con regresión múltiple, tenemos lo que se llama análisis de varianza (ANOVA) discutido en capítulos anteriores. En forma análoga como el uso de R2, este análisis es un método complementario para revisar las suposiciones del modelo de regresión. La confiabilidad de los resultados del ANOVA está mancomunada a la suposición de que los residuales están normalmente distribuidos. El uso de ANOVA prueba los promedios poblacionales donde se analiza la variación total. ANOVA evalúa la utilidad del modelo de regresión probando la hipótesis nula de que todos los coeficientes (βi) de la ecuación de regresión (pendientes) son igual a cero. Los componentes del análisis de varianza o de ANOVA, son parecidos a los del análisis de varianza simple explicados en capítulos anteriores. Los componentes son la fuente de variación, los grados de 8-39
Dr. Héctor Quevedo Urías
libertad, la suma de los cuadrados, el cuadrado del promedio, la prueba de F y el nivel de probabilidad. Por ejemplo, la fuente de variación representa las particiones de la variación en Y. Hay cuatro fuentes de variación es decir, el intercepto, el modelo, el residuo o error y, el total ajustado. La prueba de inferencia con la estadística F se usa para probar la hipótesis de todas las βi = 0. Más importante todavía, es el cálculo del nivel de probabilidad p. El valor de p es la probabilidad de obtener un estadístico de prueba, al menos tan contradictorio o más extremo para Ho:, como el valor observado que se obtuvo, asumiendo que Ho: es verdadera. Si el valor de p es menor qué, digamos α = 0.05, la hipótesis nula se rechaza; de otra manera se retiene. Entre más pequeño sea el valor de p, menos credibilidad tendrá la hipótesis nula. Otros estadísticos objetivistas para validar el modelo de regresión son las pruebas individuales de t de estudiante para probar la hipótesis de que β1, β2, β3, βk son iguales a cero. Además se pueden usar los intervalos de confianza. Por ejemplo, en regresión múltiple el valor de t de estudiante se usa para probar la hipótesis de que uno de los coeficientes es igual a cero, después de remover la influencia de los otros. Los investigadores Paffenberger et al. (1987) dan la función para el intervalo de confianza para βi. Sin embargo, si se concluye que β1 o βk no son igual a cero esto, no necesariamente, dice que el modelo de regresión es útil para predicción. En verdad, para determinar si el modelo es apropiado, en lugar de probar que β1 = 0 y β2 = 0, separadamente (usando la prueba de t), se usa una prueba conjunta como el análisis de varianza (ANOVA). De cualquier manera, la prueba de hipótesis bilateral para probar los coeficientes individuales βi se usa el siguiente formato dado en la tabla de abajo.
8-40
Dr. Héctor Quevedo Urías
TABLA 8.10. Tabla mostrando los mecanismos para una prueba de hipótesis bilateral para los coeficientes individuales βi incluidos en el modelo de regresión múltiple. (Elaboración propia) Hipótesis nula: Ho:βi = 0, hipótesis alternativa: H1:βi ≠ 0 Valor del estadístico: t = bi / sbi Regla de decisión: Rechazar Ho: si t > tα/2;n-(k+1) o bien si t < -tα/2;n-(k+1). No rechazar Ho: si tα/2;n-(k+1) ≤ t ≤ tα/2;n-(k+1) Donde: βi son los coeficientes de regresión individuales. bi = estimadores de βi sbi = errores estándar α = nivel de significancia deseado n = número de observaciones k = número de variables independientes t = función estadística de t de Estudiante Ejemplos aplicando la regresión y correlación múltiple Ejemplo #6. En la adsorción de tierra y sedimento, la magnitud de la acumulación en forma condensada de los productos químicos en la superficie es una característica importante que influye en la eficiencia de insecticidas y varios otros productos
químicos.
El
artículo
“Adsorption
of
Phosphate,
Arsenate,
Methanearsonate and Cacodylate by Lake and Stream Sediments: Comparison with Soils” (J. of Environ. Qual., 1984, pp. 499-504) presenta los siguientes datos en la tabla de abajo. Aquí se toma Y como la variable dependiente, la cual denota el índice de adsorción de fosfato,
X1 es una de las variables independientes
denotando la cantidad de hierro extraíble y, X2 es otra de las variables independientes denotando la cantidad de aluminio extraíble. (Devore, 2000) 8-41
Dr. Héctor Quevedo Urías
TABLA 8.11. Tabla mostrando los datos del ejemplo. _________________________________________________________________ Observación
X1 (Hierro extraíble)
X2 (Aluminio extraíble)
Y (Índice de adsorción)
__________________________________________________________________ 1 61 13 4 2 175 21 18 3 111 24 14 4 124 23 18 5 130 64 26 6 173 38 26 7 169 33 21 8 169 61 30 9 160 39 28 10 244 71 36 11 257 112 65 12 333 88 62 13 199 54 40 ________________________________________________________________ (Fuente: Devore, 2000) Hacer los cálculos pertinentes. Solución: Usando un paquete de computadora da: bo = -7.351, desviación estándar = 3.485, b1 = 0.11273, desviación estándar = 0.02969, b2 = 0.34900, s = 0.07131 La ecuación de la línea de regresión lineal múltiple es: Y = -7.351 + (0.11273)(X1) + (0.34900)(X2) Enseguida, para ver, qué tan confiable es el modelo de regresión calculado, primero procedemos a efectuar el análisis subjetivo, es decir, el análisis de las gráficas de los residuos.
8-42
Dr. Héctor Quevedo Urías
Figura 8.10 Figura mostrando las gráficas de los residuos estandarizados versus valores esperados de z (1); gráfica mostrando el residuo estandarizado versus la variable independiente X1 (2); gráfica mostrando el residuo estandarizado versus la variable independiente X2 (3); gráfica mostrando el residuo estandarizado versus el valor de Y pronosticado (4) y, finalmente, gráfica de Y pronosticada versus adsorción (5). (Elaboración propia) 8-43
Dr. Héctor Quevedo Urías
Figura 8.11 Esta gráfica muestra un enfoque un poco diferente al de la figura anterior, es decir usando los residuos no estandarizados en contraste con la figura 8.10 que usa los residuos estandarizados. Gráfica mostrando la prueba de normalidad (1). Gráfica mostrando la prueba de independencia de residuos versus renglones (2). Gráfica mostrando los residuos versus valores pronosticados (3). Gráfica mostrando los residuos versus variable independiente de hierro (4). Gráfica mostrando los residuos versus variable independiente aluminio (5). (Elaboración propia) 8-44
Dr. Héctor Quevedo Urías
El valor del coeficiente de determinación múltiple es: R2 = 0.9480 El coeficiente de determinación ajustado es: R2ajustada = 0.9380 El coeficiente de correlación múltiple es: R = 0.9736 Los coeficientes parciales se pueden estimar si se desea saber la relación entre el índice de adsorción y el aluminio extraíble, poniendo la variable independiente, hierro constante. También, si se deseara saber la relación entre el índice de adsorción y el hierro extraíble, se pondría la variable aluminio constante. Similarmente, si se deseara saber la relación entre las variables aluminio y la variable del hierro, se pondría la variable índice de adsorción fija. TABLA 8.12. Tabla mostrando los coeficientes de regresión, valores de t de Estudiante, niveles de p y decisiones tomadas en Ho: (Elaboración propia) _________________________________________________________________ Variable Coeficiente Valor de t Nivel Decisión independiente de regresión de p (5%) _________________________________________________________________ Intercepto -7.35066 -2.1094 0.0611 Aceptar Hierro 0.11273 3.7969 0.0035 Rechazar Aluminio 0.34900 4.8944 0.0006 Rechazar _________________________________________________________________ TABLA 8.13. Tabla de análisis de varianza. (Elaboración propia) _________________________________________________________________ Fuente de g.l. Suma de los Cuadrado Fcalc. Valor Poder de Variación cuadrados medio de p la prueba _________________________________________________________________ Intercepto 1 11580.31 11580.31 Regresión 2 3259.90 1764.95 92.03 0.000 1.0000 Error 10 191.79 19.18 _________________________________________________________________ Total 12 3721.69 310.14
8-45
Dr. Héctor Quevedo Urías
TABLA 8.14. Tabla mostrando el reporte de residuos. (Elaboración propia) _________________________________________________________________ Renglón Valor Valor Residuo Error estándar actual pronosticado _________________________________________________________________ 1 4 4.0630 -6.3052 5.0077 2 18 19.7066 -1.7066 4.9511 3 14 13.5387 0.4612 4.7055 4 18 14.6552 3.3447 4.6862 5 26 29.6406 -3.6406 5.1051 6 26 25.4141 0.5858 4.5996 7 21 23.2182 -2.2182 4.6488 8 30 32.9902 -2.9902 4.6623 9 28 24.2976 3.7024 4.5671 10 36 44.9352 -8.9352 4.7012 11 65 60.7097 4.2902 5.4250 12 62 60.9014 1.0986 5.4195 13 40 33.9292 6.0707 4.5649 _________________________________________________________________ TABLA 8.15. TABLA mostrando los intervalos de confianza para este problema. (Elaboración propia) _________________________________________________________________ Variable Límite inferior (95%) Límite superior (95%) independiente _________________________________________________________________ Intercepto -15.1149 0.4137 Hierro (X1) 0.0467 0.1789 Aluminio (X2) 0.1901 0.5079 __________________________________________________________________
8-46
Dr. Héctor Quevedo Urías
TABLA 8.16. Tabla mostrando la estadística descriptiva. (Elaboración propia) _________________________________________________________________ Variable Conteo Promedio Desviación Valor Valor estándar mínimo máximo _________________________________________________________________ Hierro (X1) 13 177.31 70.10 61 333 Aluminio (X2) 13 49.31 29.19 13 112 Índice de (Y) 13 29.85 17.61 4 65 adsorción _________________________________________________________________ Conclusiones: El modelo de regresión obtenido es válido para predicción y estimación. Los datos encajan bien con un modelo lineal múltiple. Esta contención está basada en el análisis subjetivo de las gráficas de los residuos. Por ejemplo, en la figura 8.10 y 8.11 la prueba de normalidad es buena, porque todos los puntos están dentro de las bandas, y muy cercanos a la línea de regresión. Además, los puntos están de acuerdo con la regla del 68%, 95% y 99%, es decir, el 68% de los puntos están dentro de z = ±1, el 95% están dentro de z = ±2, etc. En la figura 8.11 de los residuos versus los renglones, esto satisface la suposición de independencia, porque hay el mismo número de residuos positivos y negativos. Además, las gráficas de los residuos versus las variables independientes no violan la suposición de no linealidad, porque no hay tendencias definidas. Finalmente, la gráfica de residuos versus valores pronosticados están de acuerdo con la suposición de varianzas iguales (homoscedasticidad). En cuanto a los análisis objetivistas, es decir, usando pruebas estadísticas, nuevamente, presuponen un buen ajuste del modelo de regresión estimado. Esto se debe a qué, el valor del coeficiente de determinación múltiple R2 está muy cercano a uno. Además, el valor de R = 0.9736 indica muy buena correlación entre la variable dependiente y las variables independientes. Con respecto a la tabla del análisis de varianza, el valor de F es mucho menor que el valor crítico y esto está 8-47
Dr. Héctor Quevedo Urías
demostrado por el valor de la probabilidad p el cual es mucho muy significante. Las pruebas de t de estudiante, también son muy aceptables y demuestran que las pendientes de βi no son iguales a cero. Los intervalos de confianza dan resultados similares y sugieren que el modelo de regresión es buen pronosticador. Se pueden seguir haciendo pruebas de hipótesis para todos los parámetros poblacionales y, sin lugar a dudas, éstas también apoyarían la contención de que, el modelo de regresión, es aplicable. Ejemplo #7. Considerar los datos de la tabla de abajo. Usando el programa de computadora Minitab obtener el modelo de regresión más apropiado, es decir, un modelo múltiple lineal (Modelo 1); modelo con transformación en el eje vertical (Modelo 2) y un modelo con transformaciones de los ejes horizontales y del eje vertical (Modelo 3). TABLA 8.17. Tabla mostrando los datos bivariados de regresión. (Elaboración propia) X1 |
4
4
4
6
3
6
3
2
X2 |
3
4
3
4
2
4
2
2
Y |
3
2
7
6
5
6
7
4
Solución: Abajo se dan los resultados de los tres modelos. Al juzgar por los resultados, se le pide al lector que decida cual modelo es el más apropiado.
8-48
Dr. Héctor Quevedo Urías
TABLA 8.18. Resultados mostrando el resumen de los tres modelos. (Elaboración propia) _______________________________________________________________ Regression Analysis: Y versus X1, X2 (Modelo 1) The regression equation is: Y = 6.00 + 2.00X1 – 3.00X2 Predictor Constant X1 X2
Coef 6.0000 2.0000 -3.0000
SE Coef 1.803 0.7746 1.183
T 3.33 2.58 -2.54
P 0.021 0.049 0.052
s = 1.414 R-Sq = 58.3% R-Sq(adj) = 41.7% PRESS = 0.1274 R-Sq(pred) = 51.62% Analysis of Variance Source Regression Residual Error Total
DF 2 5 7
SS 14.000 10.000 24.000
MS 7.000 2.000
F 3.50
P 0.112
Regression Analysis: Log Y versus X1, X2 (Modelo 2) The regression equation is: Log Y = 0.810 + =.225X1 – 0.348X2 Predictor Constant X1 X2 s = 0.1272 PRESS = 0.1274
Coef 0.8101 0.2248 -0.3479
SE coef 0.1622 0.0697 0.1065
T 4.99 3.23 -3.27
P 0.004 0.023 0.022
R-Sq = 69.3% R-Sq(adj) = 57.0% R-Sq(pred) = 51.62%
Analysis of Variance Source Regression Residual Error Total
DF 2 5 7
SS 0.1824 0.0809 0.2634
MS 0.0912 0.0162
F 5.63
P 0.052
Regression Analysis: Log Y vs Log X1, Log X2 (Modelo 3) The regression equation is: Log Y = 0.595 + 1.83 Log X1 – 2.16 Log X2 Predictor Constant Log X1 Log X2 s = 0.1483 PRESS = 0.3005
Coef 0.5949 1.8342 -2.1573
SE Coef 0.2095 0.7288 0.8332
T 2.84 2.52 -2.59
P 0.036 0.053 0.049
R-Sq = 58.2% R-Sq(adj) = 41.5% R-Sq(pred) = 0.00%
Analysis of Variance Source Regression Residual Error Total
DF 3 5 7
SS 0.1533 0.1100 0.2634
MS 0.0767 0.0220
F 3.48
8-49
P 0.113
Dr. Héctor Quevedo Urías
TABLA 8.19. Tabla mostrando los datos originales del problema. (Elaboración propia) ___________________________________________________________________________ C1 C2 C3 C4 C5 C6 ___________________________________________________________________________ Y X1 X2 Log Y Log X1 Log X2 ___________________________________________________________________________ 1 3 4 3 0.477121 0.602060 0.477121 ___________________________________________________________________________ 2 2 4 4 0.301030 0.602060 0.602060 ___________________________________________________________________________ 3 7 4 3 0.845098 0.602060 0.477121 ___________________________________________________________________________ 4 6 6 4 0.778151 0.778151 0.060206 ___________________________________________________________________________ 5 5 3 2 0.698970 0.477121 0.301030 ___________________________________________________________________________ 6 6 6 4 0.778151 0.778151 0.602060 ___________________________________________________________________________ 7 7 3 2 0.845098 0.477121 0.301030 ___________________________________________________________________________ 8 4 2 2 0.602060 0.301030 0.301030 ___________________________________________________________________________
Ejemplo #8. En estudios de química analítica, el uso del análisis de fluorescencia de rayos X se usa como una herramienta para estimar los porcentajes de los ingredientes de muchas mezclas. A menudo, la estimación de las concentraciones depende en la habilidad para ajustar modelos de regresión. En una investigación intitulada “Corrections for Matrix Effects in X-rays fluorescent Analisis Using Multiple Regression Methods”, publicado por Analytical Chemistry (Vol. 37, 1965)
mezclas
contiendo
4
ingredientes
(Xi)
fueron
preparadas.
Las
concentraciones de los componentes variaron en las mezclas para producir tipos estándares de calibración (Yi). (Walpole, 1992, p. 421). Los datos de este problema se dan abajo.
8-50
Dr. Héctor Quevedo Urías
TABLA 8.20. Tabla mostrando los datos del problema de arriba. Yi
X1
0.5514 1.1240 0.4426 0.9285 0.5631 1.1214 0.5624 1.1635 0.4505 0.9415 0.5290 1.0712 0.4702 0.9561 0.5001 1.0186 0.4425 0.9039 (Fuente: Walpole et al. 1992)
X2 0.8980 0.8872 0.8030 0.8706 0.8064 0.8404 0.8731 0.8431 0.8314
X3
X4
0.8219 0.9308 0.7668 0.9272 0.9026 0.8662 0.8206 0.8346 0.7596
0.9906 0.9944 1.1221 0.9832 1.1127 1.0836 1.0290 1.0591 1.0994
(a) Ajustar un modelo lineal de regresión múltiple a los datos de la tabla. Enseguida, estimar las concentraciones del ingrediente A para una mezcla cuya tasa de intensidades de rayos-X sean, respectivamente, X1 = 1.10, X2 = 0.900, X3 = 0.800 y X4 = 0.995. Solución: (a) Usando un paquete de computadora y asumiendo un modelo de regresión lineal múltiple se obtiene la ecuación de regresión. Y = -0.3004 + 0.5387X1 + 0.1770X2 – 0.0704X3 + 0.1506X4 Sustituyendo las variables independientes, se obtiene el valor de la respuesta Y, es decir: Y = -0.3004 + 0.538(1.10) + 0.1770(0.90) – 0.0704(0.80) + 0.1506(0.995) = 0.50 Ejemplo #9. Montgomery y Peck (1992) describen el uso de un modelo de regresión para relacionar la cantidad de tiempo que requiere un vendedor para dar servicio a una máquina expendedora de artículos y el número de empaques contenidos en la máquina y la distancia del vehículo (pies) de servicio del sitio 8-51
Dr. Héctor Quevedo Urías
donde se encuentra la máquina. Este modelo de regresión múltiple fue utilizado para diseñar la ruta, los horarios y la salida de los vehículos. La tabla de abajo muestra 25 observaciones del tiempo de suministro, número de empaques y la distancia, del vehículo. TABLA 8.21. Tabla mostrando los datos de suministro. No. de observación
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Tiempo de suministro
No. de envases
9.45 24.45 31.75 35.00 25.02 16.86 14.38 9.60 24.35 27.50 17.08 37.00 41.95 11.66 21.65 17.89 69.00 10.30 34.93 46.59 44.88 54.12 56.23 22.13 21.15
2 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5
(Fuente: Montgomery et al. 1992)
8-52
Distancia del vehículo
50 110 120 550 295 200 375 375 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400
Dr. Héctor Quevedo Urías
Para este problema calcular los siguientes enunciados: (a) El modelo de regresión lineal múltiple poblacional. (b) El modelo de regresión lineal múltiple de la muestra que estima al modelo poblacional. (c) Predecir el tiempo de suministro para pares de valores de las variables de regresión, número de empaques (x1) y distancia (x2), cuando x1 = 1 empaque y la distancia es igual a x2 = 25 pies. (d) Evaluar el modelo de regresión obtenido usando técnicas objetivistas y sujetivistas, como las descritas en este capítulo. Discutir el razonamiento que se sigue en la validación subjetiva de los gráficos. Solución: (a) El modelo de regresión múltiple, para 2 variables independientes es: µY|x1,x2| = βo + β1x1 + β2x2 + ε (b) El correspondiente modelo de regresión lineal múltiple muestral es: Y = bo + b1X1 + b2X2 + e Donde: Y = tiempo de suministro X1 = no de envases X2 = distancia del vehículo El modelo de regresión de la muestra es: Y = 1.74 + 2.78 (X1) + 0.013 (X2) (c) Para predecir el tiempo de suministro (Y) en relación con el número de envases, cuando X1 = 1 y con la distancia del vehículo, cuando X2 = 25 pies se obtiene sustituyendo los valores en la ecuación de regresión, es decir: Y = 1.74 + 2.78(1) + 0.013(25) = 4.85 (d) Los resultados objetivistas estadísticos son: R2 = 98.1%; R2ajustada = 97.9%; s = 8-53
Dr. Héctor Quevedo Urías
2.32; PRESS = 159.89. TABLA 8.22. Tabla mostrando los valores de T y de P. (Elaboración propia). Predictor
Coeficiente
Constante
1.743
No. de envases Distancia del vehículo
SE coeficiente
T
P
1.155
1.51
0.145
2.790
0.092
30.09
0.000
0.013
0.003
4.33
0.000
_________________________________________________________________ TABLA 8.23. Tabla de análisis de varianza. (Elaboración propia) Fuente de Variación Debido a la Regresión Error
g.l.
SS
MS
F
p
2
5984.8
2992.4
555.2
0.000
22
118.6
5.4
Total
24 Para la validación subjetiva del modelo de regresión, analizando las gráficas
de los residuos estandarizados, deben existir, aproximadamente, el mismo número de residuos positivos y negativos. Además, en la prueba de normalidad, todos los puntos deben estar dentro de las bandas de confianza. El estudiante deberá hacer los diagnósticos subjetivos para complementar la refrendación o confiabilidad del modelo de regresión. Procedimiento de regresión múltiple usando el programa Minitab Procedimiento: 1. Irse a: Stat → Regression → Regression 2.
En la ventana de “Regression” aparecen las entradas de la variable
dependendiente (Y) y de las variables independientes X1, X2, en sus columnas respectivas relacionadas con el problema 8-54
Dr. Héctor Quevedo Urías
3. En la ventanilla de “Response” (de esta ventana de Regression) entrar la variable dependiente y, en la ventanilla de “Predictors,” entrar las variables independientes (que se copiaron en las columnas del programa). 4. Debajo de esta venta de Regression están las ventanillas de “Graphs, Options, Results y Storage”. Por ejemplo si se desea usar Graphs se pueden seleccionar los residuales regulares o los estandarizados. En la ventanilla de “Option residual plots”, puntear las gráficas de las cuatro opciones, para el análisis subjetivista. 5. En la ventana de “Regression-Options” puntear las funciones deseadas, v.g., variance “Inflation factors, Durbin-Watson statistics, PRESS”, etc. 6. En la ventana de “Regression-Results” puntear las funciones deseadas de las cuatro enlistadas, v.g., “In addition de sequential sum…..” Ejemplo #10. Este es un ejemplo del libro Applied Statistics: Análisis of Variance and Regresion de los autores Dunn y Clark. Esta es una investigación relacionada con la temperatura, tomada como la variable de respuesta, en función de variables regresoras como la altitud, longitud y latitud. La tabla de abajo muestra los resultados. Usando el programa Minitab: (a) Encontrar el modelo de regresión más apropiado (b) Validar el modelo usando metodos estadísticos, es decir, estimando el coeficiente de determinación múltiple R2, R2 ajustada, s, PRESS, tabla de ANOVA, y gráficas subjetivistas, como residuos versus órdenes, residuos versus valores ajustados y pruebas de normalidad. (c) Hacer comentarios acerca de los resultados
8-55
Dr. Héctor Quevedo Urías
TABLA 8.24. Tabla mostrando los valores de la temperatura en oF (Y), Altitud en pies (X1), Longitud en grados (X2) y Latitud en grados (X3). Temperatura (Y)
Altitud (X1)
Longitud (X2)
Latitud (X3)
55.7
1083
112
33
37.8
457
86
38
56.4
312
118
34
51.0
305
90
32
34.5
5221
105
40
34.0
2842
116
44
36.7
807
94
41
33.4
4260
112
41
32.6
815
83
40
49.1
3920
106
32
46.6
1054
84
34
36.3
4397
120
39
18.2
830
93
45
36.7
465
90
39
13.3
1162
92
47
30.1
787
82
41
__________________________________________________________________
Solución: (a) Se assume un modelo de regresión lineal (b) La utilidad del modelo se da por los valores de R2, s, PRESS, etc. mostrados por las Figuras 8.12 (a), (b) y (c). Regression Analysis: (Y) Temperatura versus (X1) Altitud, (X2) Longitud (X3) The regression equation is: (Y) Temperatura = 99.2 - 0.00138 (X1) Altitud + 0.299 (X2) Longitud - 2.29 (X3) Latitud Predictor Constant (X1) Altitud (X2) Longitud (X3) Latitud
Coef 99.24 -0.0013780 0.29877 -2.2900
SE Coef 10.79 0.0005968 0.07736 0.1779
8-56
T 9.20 -2.31 3.86 -12.87
P 0.000 0.040 0.002 0.000
VIF 1.7 1.7 1.0
Dr. Héctor Quevedo Urías
s = 3.12166, R-Sq = 94.6%, R-Sq(adj) = 93.2%, PRESS = 214.855, R-Sq(pred) = 90.08% Analysis of Variance Table Source Regression Residual Error Total
DF 3 12 15
SS 2048.54 116.94 2165.48
MS 682.85 9.74
F 70.07
F crítica F.05;3,12 = 3.49
P αo, y de H3: α < αo.- Intervalo de confianza para µY|X de la línea de regresión poblacional estimada por Y.- Regresión y correlación múltiple.- Métodos para validar el modelo de regresión lineal simple y múltiple: a través de estadística de inferencias y a través del análisis gráfico de los residuales estandarizados. Procedimiento de regresión múltiple usando el programa Minitab.El objetivo de estudiar regresión lineal simple es para obtener el modelo de regresión más apropiado, es decir, una ecuación de regresión lineal simple o múltiple para fines de predicción y estimación. Los componentes de esta ecuación de regresión lineal, con solo una variable independiente, también llamado modelo lineal de primer orden, son la variable dependiente Y´ o función de respuesta y, la variable independiente X. El modelo de esta ecuación, que describe la relación de la variable X con la variable Y, se llama la ecuación de regresión de Y sobre X y, la gráfica de esta función, se llama la curva de regresión. 8-1
Dr. Héctor Quevedo Urías
El modelo de regresión lineal poblacional que describe la relación entre la respuesta o variable dependiente Y y, la variable independiente o regresora X es: Y = βo + β1x1 + ε
i = 1, 2, …., n
(8-1)
Donde: Y = variable dependiente poblacional (también se usa la anotación y) βo = intercepto en la ordenada β1 = pendiente de la línea x1 = variable independiente ε = error aleatorio con promedio de 0 y varianza σ2 constante. Este valor de ε es la diferencia entre el valor teórico de Yi y el valor de Y calculado u observado. Las condiciones de ε son de que este parámetro debe estar normalmente distribuido; sus valores deben de ser independientes uno del otro y la varianza de ε es Var(ε) = σ2ε n = número de (x, y) pares de observaciones La ecuación de la línea de regresión muestral que estima a modelo de regresión poblacional (8-1) de arriba se da como: Y = a + bx + e
(8-2)
Donde: Y = valor de la variable dependiente de la muestra a = intercepto en la ordenada b = pendiente de la línea e = error o residual de la muestra denotado por ei = yi - Yi. Esta estadística es la estimadora del parámetro ε
8-2
Dr. Héctor Quevedo Urías
Suposiciones del modelo de regresión lineal 1. Los valores de Y son independientes uno del otro, es decir, no deben de estar correlacionados. 2. Las distribuciones condicionales de probabilidad de Y dado X son normales. 3. La varianza del error es σ2 y es constante. 4. Los coeficientes βo y β1 son desconocidos y deben de estimarse. Para estimar la ecuación de regresión lineal simple y múltiple se usa lo que se llama el método de los cuadrados mínimos que ajusta los datos de la muestra a la línea de regresión. Esta es una de las técnicas más usadas en investigaciones científicas, para encontrar la relación entre dos o más variables que están casualmente relacionadas. En esta sección veremos el problema de regresión lineal de una variable dependiente (Y) otra independiente (X), con fines de predicción y estimación. Sin embargo, una vez que se obtiene la ecuación de regresión lineal, ésta se tiene que evaluar o validar para ver qué tanta confiabilidad se le puede poner al modelo para usos de predicción. Esto se hace usando enfoques objetivos y subjetivos. Por ejemplo, el enfoque objetivo se hace haciendo pruebas estadísticas de inferencia. Este enfoque se complementa usando enfoques subjetivos, es decir, analizando las gráficas de los residuales estandarizados o no estandarizados, a través de inspecciones visuales. Por ejemplo, las condiciones o suposiciones requeridas para validar el modelo, subjetivamente, se hace a través de los análisis de los residuos crudos o estandarizados (para diferenciarlos de los residuos estandarizados). Los llamados residuos se definen como las diferencias entre el valor actual de Y y el valor pronosticado de Y por el modelo de regresión estimado. Los residuos se denotan por ei, esto es, ei = Yi – Y´i. En verdad, las gráficas de los residuos dan información 8-3
Dr. Héctor Quevedo Urías
muy importante, acerca de la naturaleza y fuerza de la relación entre las variables. La figura de abajo muestra los residuos que son las diferencias entre los valores de Y1, Y2, Y3,…,Yk y los valores observados de Y´1, Y´2, Y´3,…,Y´k de la línea de regresión de la muestra. Por otra parte, los residuos estandarizados se obtienen dividiéndolos por sus respectivas desviaciones estándares.
Figura. 8.0. Gráfica mostrando los residuos de un ejemplo. (Elaboración propia) Las suposiciones de los valores residuales son: (a) Los residuales ei están normalmente distribuidos (εi están normalmente distribuidos). (b) Los residuos tienen la misma varianza (εi son constantes). (c) Los residuales ei no están correlacionados, es decir, son independientes. Otro método menos popular que el análisis de los residuos, para evaluar la ecuación de regresión es comparando el diagrama esparcido de los puntos, con respecto a la línea de regresión, con la gráfica de los puntos con respecto al promedio de y . Esto se debe a qué, sin importar el valor de X, el promedio y siempre permanece constante (línea horizontal trazada en el diagrama esparcido de la gráfica). De esta manera, si la dispersión de los puntos con relación a la línea de 8-4
Dr. Héctor Quevedo Urías
regresión es mucho menor, que la dispersión de los puntos con respecto a la línea horizontal de y , entonces, se puede concluir que la ecuación de la línea de regresión da un buen ajuste para los datos de la muestra (Daniel et al. 1989). Como se dijo antes, el enfoque objetivista es la otra manera que se usa para evaluar el modelo de regresión lineal, esto es, a través de análisis estadísticos. Para esto, se pueden usar las siguientes funciones estadísticas: (a) Coeficiente de determinación lineal R2 (o r2), el coeficiente de correlación lineal R, s y PRESS. (b) Análisis de varianza simple (ANOVA), para probar los coeficientes del modelo de regresión (β), para ρ, etc. (c) Intervalos de confianza para ρ2, para βo, βi, µy|x, etc. Tipos de correlación lineal 1. Correlación simple que consiste de dos variables, una dependiente (Y) y la otra independiente (X). Dentro de esta categoría tenemos: (a) Correlación directa. Esta correlación consiste en el incremento en una variable la cual es acompañada por el incremento de otra variable (correlación positiva). (b) Correlación inversa. Esta correlación consiste en el incremento de una variable la cual es acompañada por el incremento de otra (correlación negativa). (c) Correlación no lineal. En esta correlación no hay ninguna asociación entre las dos variables. 2. Correlación múltiple. Aquí, hay más de dos variables. Una variable es dependiente (Y), mientras que las otras son independientes X1, X2,…, Xk, etc. Las figuras de abajo representan varios tipos de correlaciones.
8-5
Dr. Héctor Quevedo Urías
Fig. 8.1. Diagramas esparcidos con líneas de cuadrados mínimos. La Figura (a) representa una línea recta con X fija; la Figura (b) representa línea no recta con X fija; la Figura (c) representa una distribución adjunta con línea recta; la Figura (d) representa una distribución adjunta con línea no recta; la Figura (e) representa un diagrama donde no hay asociación entre las dos variable y; la Figura (f) representa una relación causal. Las otras dos gráficas representan correlaciones perfectas. (Elaboración propia)
8-6
Dr. Héctor Quevedo Urías
Tipos de curvas más comunes
Figura 8.2. La figura (a) representa la función exponencial; la figura (b) representa la función de potencia, la figura (c) representa una función recíproca y, la figura (d) representa una función hiperbólica. (Elaboración propia) 8-7
Dr. Héctor Quevedo Urías
Ecuaciones normales para calcular el intercepto en la ordenada a y la pendiente b de la curva o línea de regresión Las variables a y b se obtienen de las ecuaciones normales de abajo, es decir, resolviéndolas simultáneamente: ΣY = a n + b ΣX
(8-3)
ΣXY = a ΣX + b ΣX
(8-4)
Al resolverse simultáneamente dan el intercepto, a en la ordenada y, la pendiente de la línea, b: Intercepto = a = Y – b X
(8-5)
Pendiente = b = [n ΣXY – (ΣX)(ΣY)] / [n ΣX 2 – (ΣX)2 ]
(8-6)
= Σxy / Σx2
(8-7)
Donde: Σxy y Σx2 se dan por las ecuaciones (8-8) y (8-9) de abajo. Nota 1. Las siguientes ecuaciones son muy importantes. Σx2 = Sxx = ΣX 2 – (ΣX)2 / n
(8-8)
Σxy = Sxy = ΣXY – ΣXΣY / n
(8-9)
Σy2 = Syy = ΣY 2 – (ΣY)2 / n
(8-10)
Nota 2. Es muy importante notar las diferencias entre el uso de las variables minúsculas y las mayúsculas en las ecuaciones de arriba. Coeficiente de determinación R2 de la muestra que estima a ρ2 el coeficiente de determinación poblacional El cálculo del coeficiente de determinación múltiple R2 es una prueba objetivista de estadística. Esta es una función estadística muy importante, para validar el modelo de regresión lineal. Este coeficiente R2 mide la proporción de variación en la variable dependiente Y explicada por la variable independiente X. Los valores de R2 varían de 0 a 1. Por ejemplo, un valor cercano a 0 indica que no hay una 8-8
Dr. Héctor Quevedo Urías
relación lineal entre Y y X, mientras que un valor cercano a uno indica un ajuste lineal perfecto. Aquí, sin embargo, es necesario aclarar que, un valor alto de R2, no necesariamente indica un buen ajuste del modelo de regresión, sino hasta que se hacen todas las pruebas objetivistas y subjetivas. La función que calcula R2 es: R2 = (Σxy)2 / Σx2Σy2
(8-11)
= 1 – SSe / SSt
(8-12)
Donde Σxy, Σx2 y Σy2 se dan por las ecuaciones (8-8), (8-8) y (8-10) descritas para la ecuación (8-11). Además, para la ecuación (8-12) SSe es la suma de los cuadrados del error o residual y SSt es la suma de los cuadrados del total, mismos que se describen en el formato de la tabla de ANOVA. También hay el llamado coeficiente R2 de determinación ajustado. Esta es una versión ajustada de R2, el cual busca remover la distorsión debida a un tamaño de muestra pequeño. Se define como: R2ajustada = 1 – [(1 – R2) (n – 1)/(n – 2)]
(8-13)
Donde R2 ya se definió y n es el tamaño de la muestra Coeficiente de correlación R de la muestra que estima a ρ, el coeficiente de correlación poblacional El coeficiente de correlación R, que estima a ρ, también se llama coeficiente de correlación de Pearson. Este coeficiente es un índice de la fuerza de la asociación lineal entre las variables X e Y. El coeficiente de correlación R es: R=
∑ xy ∑x ∑ y 2
2
(8-14)
Donde: Σxy, Σx2 y Σy2 se dan por las ecuaciones (8-8), (8-9) y (8-10) Nota: El coeficiente de correlación R explica el grado de asociación entre las variables X e Y. Este coeficiente R varía de –1 a 0, si la correlación es negativa, es 8-9
Dr. Héctor Quevedo Urías
decir, con pendiente negativa. Pero, si la correlación es positiva, entonces, R varía de 0 a 1. Así, a medida que R se aproxima a ±1, mejor asociación habrá entre las variables X e Y. Nótese que, en caso de la regresión lineal múltiple, tenemos lo que se llaman coeficientes parciales de regresión usados para medir la relación lineal entre la variable dependiente y la variable independiente especificada. Intervalo de confianza para el coeficiente poblacional β componente de la línea de regresión µY|X = α + βX, estimado por b, la pendiente de la línea. b – t[1-α/2;n-2] s /
∑x
2
< β < b + t[1-α/2;n-2] s /
∑x
2
(8-15)
Donde: b = Σxy / Σx2 t[1-α/2;n-2] = valor de la distribución de t de Estudiante Σx2 = ΣX2 – (ΣX)2 / n (∑ y − b∑ xy ) 2
s=
(8-16)
n−2
∑ y − (∑ y ) 2
= SSE/(n – 2) =
2
n
- (bΣXY - ΣXΣY/n)] / n-2
La ecuación de la varianza es: s2 = (Σy2 – bΣxy) / (n – 2)
(8-17)
β = coeficiente poblacional de la pendiente de la línea, el cual es estimado por b = Σxy / Σx2 o sea el coeficiente de la línea de regresión muestral. Intervalo de confianza para el parámetro poblacional α, el intercepto de la ordenada de la línea de regresión µY|X = α + βX, cuyo estimador es a
(8-18) Donde: 8-10
Dr. Héctor Quevedo Urías
a ya se definió anteriormente t[1-α/2;n-2] = a un valor usando la distribución de t de estudiante con ν = n – 2 grados de libertad s = de la ecuación (8-16) Sxx = Σxy (de la ecuación (8-9)) Hipótesis nula Ho:β = βo contra las hipótesis alternativas H1:β < 1 y H2:β > 1. Para esta prueba también se usa la distribución de t de Estudiante con ν = n – 2 grados de libertad, es decir: t = (b – βo) / s/Σx2
(8-19)
Donde: t = la estadística de la distribución de t de Estudiante βo = un valor dado b = pendiente de la línea Hipótesis nula Ho:α = αo contra las hipótesis alternativas H1:α ≠ αo, H2:α > αo, y H3: α < αo Aquí, nuevamente, se usa la distribución de t de Estudiante con grados de libertad, ν = n – 2. Para esto se usa la fórmula de abajo:
(8-20)
8-11
Dr. Héctor Quevedo Urías
Donde: αo = un valor dado s = ya definida anteriormente a ya se definió anteriormente Intervalo de confianza para µY|X de la línea poblacional estimada por Y El intervalo de confianza para el valor de µY|X se hace es usando la fórmula (8-21) de abajo: Yo’– t[α/2;ν] s
1 1 + (Xo - X )2/Σx2 < µY|X < Yo’+ t[α/2;ν] s + (Xo - X )2/Σx2 n n
(8-21)
Donde: Yo’ = a + b Xo = valor de la línea de regresión con un valor de Xo dado
(8-22)
t[α/2;n-2] = valor de la distribución de t con un nivel de significancia de α = .05 o bien 0.01 con ν = n – 2 grados de libertad a = ya definida anteriormente s = ya definida anteriormente Xo = un valor dado X = promedio de la muestra
Hipótesis nula Ho:β = 0 contra las hipótesis alternativas H1:β > 0 y H2:β < 0 Para hacer esta prueba usamos la distribución de t de Estudiante con ν = n – 2 grados de libertad. La función estadística usada para tales fines es: t = (b – bo) / s / Donde: s = ya definida anteriormente 8-12
∑x
2
(8-23)
Dr. Héctor Quevedo Urías
b = intercepto en la ordenada Y bo = un valor dado Σy2 = ΣY2 – (ΣY)2/n Σxy = ΣXY – ΣXΣY/n βo = 0 Aquí, también se tienen que calcular las regiones críticas usando la distribución de t, es decir, t[1-α/2;ν], donde α es el nivel de significancia deseado y, ν es el número de grados de libertad, es decir, n - 1. Después de esto, se compara el valor de tcalc., con el valor crítico de ttab. y se sigue el mismo procedimiento para cualquier prueba de hipótesis. Hipótesis nula de Ho:α = αo contra las hipótesis alternativas H1:α > 0 y H2:α < 0 Para hacer esta prueba de hipótesis se usa la estadística de t de Estudiante mostrada abajo:
(8-24) Donde: s = ya definida anteriormente Donde: Σy2 = ΣY2 – (ΣY)2/n Σxy = ΣXY – ΣXΣY/n b = ya definida anteriormente Aquí, también se tiene que establecer las regiones críticas usando la distribución de t de Estudiante. Estas regiones críticas son: t[1-α/2;ν], donde α es el nivel de significancia usado.
8-13
Dr. Héctor Quevedo Urías
Pruebas de hipótesis Ho:ρ = 0, contra la hipótesis alternativas H1:ρ ≠ 0, para el coeficiente de correlación poblacional ρ estimado por R. (Dunn et al. 1974) Para estos fines se usa la estadística de t de Estudiante: t=√ν R/
1− R
2
(8-25)
Donde: R = Σxy /
∑x ∑ y 2
2
(8-26)
ν = n – 2 grados de libertad Aquí, nuevamente, para calcular las regiones críticas se usa la t de Estudiante, es decir, t[α/2;n-2]. Ejemplos de problemas usando regresión y correlación lineal simple Ejemplo #1. Este problema está relacionado con un estudio acerca de la cantidad de precipitación pluvial y la cantidad de contaminación atmosférica. TABLA 8.0. Tabla mostrando los datos. (Elaboración propia) ___________________________________________________________________ Lluvia (0.026”) | 18 7 14 31 21 5 11 16 26 29 Remoción de contaminación | 55 17 36 85 62 18 33 41 63 87 Hacer las siguientes estimaciones: (a) Identificar la variable dependiente y la variable independiente. Hacer una gráfica que vaya en función de la variable dependiente Y, y la variable independiente X. (b) Calcular los valores de la estadística descriptiva de los datos. (c) Obtener la ecuación de regresión lineal simple y trazarla en la gráfica. (d) Validar la confiabilidad del modelo de regresión, es decir, a través de la emisión de un juicio subjetivo analizando los valores de los residuos estandarizados, de la siguiente manera: 1. Hacer una gráfica que muestre la prueba de normalidad. 8-14
Dr. Héctor Quevedo Urías
2. Hacer una gráfica con los residuales estandarizados versus valores ajustados de Y . (El valor predecido o ajustado de Y i es el valor de Y que se esperaría cuando se usa la línea de regresión. En otras palabras, los valores ajustados de Y 1, Y 2,.., Y n se obtienen sustituyendo, sucesivamente, x1, x2, .., xn en la ecuación de la línea de regresión estimada: Y i = βo + β1xi, .., βo + β1xn. 3. Hacer un histograma de residuales. 4. Hacer una grafica que muestre los residuales estandarizados versus renglones. (e) Complementar la evaluación del modelo con inferencias estadísticas, como: 1. Cálculo del coeficiente de determinación R2 y el coeficiente de correlación R. 2. Hacer una tabla de análisis de varianza (ANOVA). 3. Hacer una tabla con los coeficientes, los errores estándares, las pruebas de t, los valores de p, y los intervalos de confianza para el intercepto y la pendiente. Solución: (a) La variable dependiente es la remoción de contaminantes (Y) y la variable independiente es la cantidad de lluvia (X). La figura de abajo muestra esta solución:
Figura 8.3. Gráfica mostrando Y versus X, con una línea recta horizontal correspondiente al valor del promedio de Y = 49.7000. (Elaboración propia) (b) Los valores de la estadística descriptiva son: X = 17.8000, Y = 49.7000. Los valores máximos y mínimos de los valores de Y son 8-15
Dr. Héctor Quevedo Urías
87.000 y 17.000, respectivamente. Los valores máximos y mínimos de los valores de X son 31.000 y 5.0000, respectivamente. Cuadrado medio del error = s2y|x = 26.667; error cuadrático medio es sy|x = 5.164 (c) Usando un programa de computadora se estiman los valores del intercepto en la ordenada y la pendiente. Estos son: intercepto = a = 1.0213, pendiente de la línea = b = 2.7348. Sustituyendo estos valores dan la línea de regresión muestral (misma que se ve en la Figura 8.3), da. Y = a + bX Y = 1.0213 + 2.7348(X) (d) Para este inciso la Figura 8.4 muestra la información requerida. Residual Plots for Remocion de contaminatnes (Y) Normal Probability Plot of the Residuals
Residuals Versus the Fitted Values
99 5 Residual
Percent
90 50 10 1
-10
-5
0 Residual
5
Histogram of the Residuals
20
40 60 Fitted Value
80
Residuals Versus the Order of the Data 5
2
Residual
Frequency
-5 -10
10
3
1 0
0
-8
-4 0 Residual
4
0 -5 -10
1
2
3
4 5 6 7 Observation Order
8
9
10
Figura 8.4. Gráficas mostrando las respuestas para el inciso (d). Como se ve en la Figura 8.4 la figura superior izquierda muestra la prueba de normalidad con todos los puntos formando una linea recta. Esto indica que la 8-16
Dr. Héctor Quevedo Urías
distribución de los datos es normal. Igualmente, la figura superior derecha muestra los residuales en función de los valores ajustados de Y. Aquí, hay aleatoriedad en la distribución de los puntos con la misma cantidad de puntos negativos y positivos, lo que indica que no hay correlacion de los datos. La figura inferior izquierda muestra la frecuencia versus los residuales. Finalmente, la figura inferior derecha muestra los residuales en función de los órdenes de las observaciones. Aquí, en esta figura hay aleatoriedad y el mismo numero de puntos positivos y negativos, lo que sugiere que no hay colinealidad o correlacion en serie de la información suministrada. (e) Para complementar el estudio objetivista, esto se hace haciendo pruebas estadísticas de inferencia. (1) Como se dijo antes, el coeficiente de determinación R2 es un enfoque objetivista, que sirve para validar el modelo de regresión. Este coeficiente de determinación R2, mide la fuerza relativa de la relación lineal entre X e Y (mide la proporción de variación en Y que puede ser explicada por la variación en X) es dado por la ecuación (8-11) y por las ecuaciones (8-6), (8-7) y (8-8), respectivamente: R2 = 0.9620 El cálculo del coeficiente de correlación R es: R=
R 2 = 0.9808
(2) Para el análisis de varianza (ANOVA), que también sirve para validar el modelo de regresión, es una función estadística objetivista que prueba la hipótesis nula de que la pendiente es igual a 0. Aquí se verá que, un valor grande de F indica que el modelo de regresión seleccionado es util. Sin embargo, es necesario analizar todos los demás criterios antes de emitir un juicio final. La tabla de ANOVA de abajo da los resultados.
8-17
Dr. Héctor Quevedo Urías
TABLA 8.1. Tabla de análisis de varianza (ANOVA) para el ejemplo. (Elaboración propia) __________________________________________________________________ Fuente de Suma de los g.l. Cuadrado del Fcalc. Ftab. Valor de p variación cuadrados promedio __________________________________________________________________ Debido al 5,396.77 1 5,396.77 202.38 5.32 0.00001 tratamiento Residual (error) 213.33 8 26.67 ___________________________________________________________________ Total 5,610.1 9 El valor de Ftab. se saca consultando la tabla de la distribución de F, esto es Fα;ν1,ν2, el cual da F.95;1,8 = 5.32. Aquí, debido a que el valor de Fcalc. = 202.38 >>> 5.32, se rechaza la hipótesis sustentada de que Ho:β1 = 0 y se inclina por Ho:β1 ≠ 0. La conclusión es de que la pendiente de la línea no es igual a 0 u horizontal. (3) La tabla de abajo muestra los valores del intercepto en la ordenada, el gradiente de la línea de regresión, los errores estándar, la pruebas de hipótesis usando la t de estudiante, los valores de la probabilidad p y los intervalos de confianza (95%) para βo (intercepto) y β1 (pendiente). TABLA 8.2. Tabla mostrando los valores del intercepto, pendiente, pruebas de t de Estudiante, valor del nivel de p y sus intervalos. (Elaboración propia) __________________________________________________________________ Coeficiente Error Prueba t Valor p Límite Límite estándar inferior superior ___________________________________________________________________ Intercepto 1.02 3.79 0.27 0.79 -7.772 9.76 ___________________________________________________________________P endiente 2.73 0.19 14.23 5.8x10-7 2.29 3.18 __________________________________________________________________ Aquí, nótese que el intervalo de confianza para el intercepto es muy amplio y la hipótesis no se puede rechazar, puesto que el valor de t es muy pequeño y el valor de 8-18
Dr. Héctor Quevedo Urías
p = 0.79 es grande. Esto es apoyado por el valor de 0.79 de p y por un error estándar de 3.79, relativamente grande; lo contrario ocurre con las pruebas estadísticas de la pendiente, cuyo valor de t es grande y cuyo valor de p es muy pequeño. Ejemplo #2. En un estudio de microbiología ambiental, en muestras de agua, se dieron los siguientes datos de la tabla de abajo. Estos datos se refieren al crecimiento de una colonia de bacterias en un medio de cultivo. TABLA 8.3. Tabla mostrando los datos. (Elaboración propia) Tiempo en días de | 3 6 9 12 15 18 inoculación (X) __________________________________________________________________ No. bacterias (Y) | 115,000 147,000 189,000 235,600 257,900 286,400 Hacer los siguientes cálculos: (a) Calcular la línea de regresión. (b) Calcular el coeficiente de determinación R2 y el coeficiente de correlación R. (c) Con la ecuación de regresión, estimar el número de bacterias después de 20 días (d) Encontrar los intervalos de confianza para α y β usando el paquete de EXCEL. (e) Usar el programa Minitab y estimar los valores residuales y analizarlos subjetivamente, para revisar por la calidad del modelo de regresión. Solución: (a) La ecuación de la línea de regresión es: Y = 81,520.00 + 11,774.29 X (b) El coeficiente de determinación lineal múltiple R2 es igual a 0.9880. El coeficiente de correlación R es igual a 0.9940. (c) Cuando X = 20 días, el número de bacterias es de: Y = 81,520 + 11,774.29 (20) ≈ 317,006 bacterias (d) En cuanto a los intervalos de confianza para α y β, el programa de computadora de 8-19
Dr. Héctor Quevedo Urías
EXCEL arroja los siguientes resultados: Intervalo de confianza de 95% para α: 61,259.45 < α < 101,780.6; valor de la probabilidad p = 0.0004; Intervalo de confianza de 95% para β es: 10040.14 < β < 13508.43, con un valor de la probabilidad p = 0.000046 (e). Las figuras de abajo muestran las gráficas que tratan de validar el modelo de regresión lineal, con del número de bacterias en función del tiempo de incubación.
Figura 8.5. Figuras mostrando los resultados del número de bacterias versus el tiempo de incubación. La gráfica (a) muestra la relación entre Y y X, con la línea recta de Y ; la gráfica (b) muestra los residuos crudos versus X; la gráfica (c) muestra los residuos crudos versus los renglones y, la gráfica (d) muestra los residuos crudos versus residuos rezagados (Elaboración propia). 8-20
Dr. Héctor Quevedo Urías
Todas estas gráficas sugieren, subjetivamente, que el modelo de regresión lineal es confiable. ¿Por qué? Ejemplo #3. En un estudio de agricultura, relacionado con la siembra de algodón, en cierto estado de la Unión Americana, la precipitación anual y el rendimiento de la cosecha de algodón son como sigue. TABLA 8.4. Tabla mostrando los datos. (Elaboración propia) Precipitación | 7.12 en pulgadas (X) Rendimiento de | 1037 la cosecha en libras/acre (Y)
63.54
47.38
45.92
8.68
50.86
44.46
380
416
427
619
388
321
Hacer los siguientes cálculos: (a) Calcular los valores del intercepto a y la pendiente b. (b) Escribir la ecuación de la línea de regresión. (c) Calcular el coeficiente de determinación R2 y el coeficiente de correlación R. (d) Predecir el rendimiento de la cosecha de algodón, si la precipitación es de 30 pulgadas. (e) Hacer una tabla de análisis de varianza. Solución: (a) Usando un paquete de computadora como el Excel da: Intercepto en la ordenada = a = 880.40 Pendiente de la línea = b = -9.61 (b) Por lo tanto, la ecuación de la línea de regresión es: Y = 880.40 – 9.61 (X) (c) El coeficiente de determinación = R2 = 0.6991 8-21
Dr. Héctor Quevedo Urías
El coeficiente de correlación = R = 0.8361 (d) Cuando la precipitación de lluvia es de 30 pulgadas, el rendimiento de la cosecha se calcula usando el modelo de regresión obtenido, es decir sustituyendo el valor de X = 30. De esta manera, usando la ecuación de regresión dada arriba y sustituyendo el valor de X = 30 nos da: Y = 880.4 – 9.61 (30) = 592.1 (e) La tabla de análisis de varianza dada por el paquete Excel se da abajo. TABLA 8.5. Tabla de análisis de varianza (ANOVA). (Elaboración propia) Fuente de variación
g.l.
SS
MS
Fcalc.
Ftab.
Valor de p
Debido a la Regresión
1 260,628.2 260,628.2 11.62
5.32
0.019
Residuo
5 112,165.5
Total
6
22,433.11
372793.7
En conclusión, al comparar el valor de la estadística calculada F con el valor crítico de F se rechaza la hipótesis sustentada con un valor de p igual a 0.019. Ejemplo #4. El libro Applied Statistics: Análisis of Variance and Regression de Dunn y Clark (1974) describe un estudio de física, es decir, de óptica, donde se obtuvieron los datos de abajo que muestran los diámetros de las fibras ópticas (en micras) en función de la fuerza de rompimiento de éstas. Para este problema hacer los siguientes cálculos (a) Hacer todos los calculos preliminares y calcular la ecuación de la línea de regresión muestral que estima a la ecuación de regresión poblacional µY|X = α + βX. (b) Usando un paquete de computadora, encontrar el intervalo de confianza para el coeficiente de regresión poblacional α (intercepto en Y), que estima a a. (c) En forma análoga que con en el inciso (b), encontrar el intervalo de confianza para el coeficiente de regresión β (la pendiente de la línea) cuyo estimador es b. 8-22
Dr. Héctor Quevedo Urías
(d) Probar la hipótesis nula de Ho:β = βo, es decir, β = 0 contra la hipótesis alternativa de H1:β > 0 y H2:β < 0. Calcular el valor de la probabilidad p. (e) Hacer un intervalo de confianza para µY|Xo. (f) Calcular los criterios evaluadores del modelo de regresion, v. g., R2, PRESS y s. (g) Hacer una prueba de hipótesis para el coeficiente de correlación poblacional ρ. (h) Graficar los datos y trazar la ecuación de la línea de regresión sobre la gráfica y trazar la línea horizontal correspondiente al valor del promedio Y . (i) Emitir un juicio subjetivo que ayude a validar el uso del modelo de regresión. La tabla de abajo muestra los datos. TABLA 8.6. Tabla mostrando el diámetro de fibras vs. fuerza de rompimiento. Diámetro de la fibra (X)
Log de la fuerza de rompimiento (Y)
22.5 .19 28.0 .62 27.5 .51 25.5 .53 22.0 .24 30.5 .87 23.0 .25 25.0 .25 23.5 .37 27.0 .32 21.5 .13 22.0 .35 29.0 .53 20.5 .22 27.0 .65 (Fuente: Dunn et al. 1974. Applied Statistics: Analysis of Variance and Regression)
Solución: (a) Los cálculos preliminares son: 8-23
Dr. Héctor Quevedo Urías
n = 15, ΣX = 374.5, (ΣX)2/n = 9,350.0, ΣY = 6.03, (ΣY)2/n = 2.42, ΣXY = 158.25, ΣX 2
= 9,482.75, ΣY 2 = 3.03, (ΣXΣY)/n = 2,258.24/15 = 150.55, X = 24.97, Y = 0.402,
Σx2 = ΣX 2 – (ΣX)2/n = 9,482.75 – 9,350.0 = 132.75, Σxy = ΣXY – ΣXΣY/n = 158.25 – 150.55 = 7.70, Σy2 = ΣY 2 – (ΣY)2/n = 3.03 – (6.03)2/15 = .6074 Para calcular la línea de regresión de la muestra, primero calculamos manualmente, los coeficientes a y b de la línea de regresión muestral que estiman a α y β. b = Σxy/Σx2 = 7.70/132.75 = .058 a = Y – b X = 0.402 – (0.058)(24.97) = -1.046 Por lo tanto, la línea de regresión muestral es: y = a + b(X) y = -1.046 + 0.058(X) (b) El intervalo de confianza para α es usando la función (8-18) o usando un paquete de computadora como Excel procediendo como: Tools → Data análisis → Regression y OK. Enseguida, después de que los datos se introdujeron en las columnas A y B de la hoja de Excel irse a la ventanilla de “Input Y Range” y “Input X Range”, lo que genera la TABLA 8.7 de abajo. TABLA 8.7. Tabla mostrando el valor del intercepto, la pendiente, los valores de t y p y los intervalos de confianza para α y β.
Por lo tanto, el intervalo de confianza para el intercepto (α) se lee de la tabla como: -1.5706 < α < -0.5224 (c) En forma análoga el intervalo de confianza para β se lee de la TABLA 8.7 como: 8-24
Dr. Héctor Quevedo Urías
0.0788 > β > 0.0371 (d) Para probar la hipótesis nula Ho:β = βo es decir, β = 0, contra H1:β > 0 y H2:β < 0 usamos la distribución de t de estudiante con ν = n – 2 = 15 – 2 = 13 g.l. La fórmula es: t = (b – βo) / s/√ Σx2. Sustituyendo todos los valores de βo = 0 y demás valores en la fórmula de arriba da: t = (0.058 – 0) / 0.12/ 132.73 = 5.8 Las regiones críticas son: t = ± 2.16. En conclusión: debido a que tcalc. = 5.8 > ttab. = 2.16, se rechaza la hipótesis nula de Ho:β = 0 y se inclina por H1:β > 0. El valor de la probabilidad se calcula usando la fórmula de interpolación (6-10): (λ2 – λ1)/(t2 – t1) = (λ2 – X)/(t2 – tcalc.) Sustituyendo los valores apropiados de la tabla de t nos da: (.00001 - .00002)/(6.287 – 5.607) = (.00001 – X)/(6.287 – 5.8) Lo que da X = p = .00002. Pero como la prueba es bilateral, lo multiplicamos por 2 y da p = .00004. Este valor apoya, muy contundente, la hipótesis alternativa de H1:β > 0. (e) El intervalo de confianza para la variable dependiente de la línea de regresión poblacional, µY|X estimada por Y, con nivel de significancia de α = 0.05, dar varios valores a Xo. Para hacer esto, se usa la función de abajo: Y´o - t[α/2;n-2] s
1 1 +(Xo– X )2/Σx2 < µY|X < Y´ó + t[α/2;n-2] s +(Xo– X )2/Σx2 n n
(8-28)
Donde: X = promedio
t[α/2;n-2] = valor de t con ν = n – 2 g.l. t[.025;13] = ± 2.16 Xo = los diferentes valores que se le den a Xo para construir los límites o bandas de 8-25
Dr. Héctor Quevedo Urías
confianza para µY|X Ahora bien, con los valores de: a = -1.047, X = 24.97, Σx2 = 132.73, s = 0.12, t.0.25;13 = ± 2.16 y asignándole valores a Xo, digamos de 19, 28, 30.0, etc., se procede de la siguiente manera: Para Xo = 19.0; Y’o = -1.047 + 0.058(19.0) = 0.055, etc. Enseguida, usando la fórmula (8-28) y sustituyendo los valores, es decir, para Xo = 19 da: .055–2.16(0.12)
1 +(19.0-24.97)2/132.73 < µ < .055+2.16(0.12) 1 +(19.0-24.97)2/132.73 Y|19 15 15
El cual se simplifica a:
0.335 > µY|19 > 0.299
Así se puede continuar dando diferentes valores de Xo y sustituyéndolos, como se hizo arriba, para, finalmente, hacer las bandas de confianza para µY|X. (f) Para calcular los valores de R, R2, s y PRESS se pueden hacer con un paquete de computadora. Por ejemplo, si se hace manualmente, el coeficiente R se calcula usando la ecuacion (8-14), etc. De otra manera, si se usa el Mintab proceder como: Stat → Regression → Regression En la ventana de “Response” poner la variable dependiente, y en la ventana de “Predictors” poner la variable independiente. También se pueden usar las ventanas de “Graphs”, “Options” y “Results” para obtener información adicional. Por ejemplo los valores de las estadísticas objetivistas de inferencia dadas por el programa son: R2 = 73.6%, R = 0.858, s = 0.1112, PRESS = 0.2204. Por ejemplo, el valor de R = 0.8576 indica indica una correlación positiva que va de acuerdo con la pendiente positiva de la curva de .058. Los valores tan pequeňos de s y de PRESS indican un buen ajuste de los datos al modelo de regresión. (g) Para la prueba de hipótesis Ho:ρ = 0, es decir, para el coeficiente de correlación poblacional, ρ con α = 0.05, contra la hipótesis alternativa de H1:≠ 0, esto es, H2:ρ > 0 8-26
Dr. Héctor Quevedo Urías
y H3:ρ < 0 se usan las siguientes estadísticas: (1) Usando la estadística de t de Estudiante (8-25): t=
n − 2 R / 1− R
2
Donde: R = ya definida Para calcular las regiones críticas se usa la distribución de t, es decir, t[α/2;n-2] = t.025;13 = ± 2.16 Entonces, usando la fórmula de abajo y sustituyendo los valores da: R = Σxy /
∑x ∑ y 2
2
= 7.701 /
(132.73)(0.6074) = 0.86
y R2 = 0.7396
Ahora, usando la estadística de abajo y sustituyendo da t=
n−2
R/
1− R
2
t = 13 (0.86) / .2604 = 6.07 Si se desea sacar el valor de p se busca 6.07 en la tabla de la distribución de t con ν = 13 y con α = .05, lo que da .025 < p < .05. (h) Para graficar los datos aunados a la ecuación de la línea de regresión con una línea horizontal correspondiente al valor del promedio Y se hace usando un paquete de computadora.
8-27
Dr. Héctor Quevedo Urías
Figura 8.6. Gráfica mostrando la fuerza de rompimiento (log10) en función del diámetro de la fibra, con la ecuación de la linea de regresión Y = -1.046 + 0.058(X) y con el promedio Y = 0.402. (Elaboración propia). (i) Emitir un juicio subjetivo que ayude a validar el uso del modelo de regresión. Para responder a esta pregunta se hacen los siguientes gráficos: Residuals Versus the Order of the Data (response is Log fuer) 2
Standardized Residual
1
0
-1
-2 2
4
6
8
10
12
14
Observation Order
Figura 8.7a. Gráfica mostrando los residuos estandarizados versus el orden de la observación. Esta es una gráfica que muestra todos los residuales en el orden en el cual los datos fueron coleccionados. Aquí hay el mismo número de datos positivos y negativos. Esta gráfica también sirve para encontrar errores no aleatorios, especialmente, en efectos relacionados con el tiempo.
8-28
Dr. Héctor Quevedo Urías
Residuals Versus the Fitted Values (response is Log fuer) 2
Standardized Residual
1
0
-1
-2 0.1
0.2
0.3
0.4
0.5
0.6
0.7
Fitted Value
Figura 8.7b. Está gráfica muestra los residuales versus valores ajustados. Para que el modelo de regresión sea aceptable, se requiere que: los puntos en la gráfica sean aleatorios en ambos lados de 0; no debe haber series de puntos que aumenten o disminuyan; no debe haber predominancia de residuales positivos o negativos, ni tampoco debe haber patrones de residuales que aumenten con valores ajustados que aumenten. Como se ve, todas estas condiciones están bien sustentadas. Normal Probability Plot of the Residuals (response is Log fuer) 2
Normal Score
1
0
-1
-2 -2
-1
0
1
2
Standardized Residual
Figura 8.7c. Gráfica mostrando la prueba de normalidad. Los datos deben formar una línea recta si los residuales están normalmente distribuidos (situación que ocurre aquí). De otra manera, la suposición de normalidad se inválida. 8-29
Dr. Héctor Quevedo Urías
Como se observa en estas gráficas, la emision de un juicio subjetivo es aceptable, porque el modelo de regresión seleccionado ajusta bien los datos. Esto se debe a que, en la Figura 8.7a hay aleatoridad en los datos, es decir, con el mismo número de valores positivos y negativos. Además, en la Figura 8.7b la descripción de ésta, sugiere un modelo de regresión representativo de la información dada. Situación similar ocurre con la descripción de la Figura 8.7c. Ejemplo #5. En un estudio de ingeniería del agua relacionado con las reducciones de los sólidos suspendidos, en función de la demanda química de oxígeno (DQO), se sacó una muestra aleatoria, cuyos datos se dan en la tabla de abajo. Para lo siguiente: (a) Identificar la variable dependiente y la independiente y hacer una gráfica de DQO versus reducción de sólidos. (b) Calcular la ecuación de la línea de regresión. (c) Hacer una tabla de análisis de varianza que incluya la F crítica y el valor de p. (d) Validar el modelo candidato, a través de estadísticas como R2, PRESS, s y de la estadística de Durbin-Watson (para la prueba de autocorrelación de residuales). (e) Evaluar la utilidad del modelo a través de gráficos subjetivos: TABLA 8.8. Tabla mostrando las mediciones de sólidos y la demanda química de oxígeno. (Elaboración propia) __________________________________________________________________ Sólidos supendidos DQO ___________________________________________________________________ 30 29 33 37 25 32 29 27 31 36 25 31 30 30 33 30 35 31 29 28 32 29 30 30 29 30 34 30 36 30 28 29 34 29 34 29 34 31 36 29 31 30 33 30 35 28 30 28 28 31 36 28 33 32 26 30 34 28 30 31 27 32 36 27 31 32 27 32 34 26 29 31 Solución: 8-30
Dr. Héctor Quevedo Urías
(a) La variable dependiente es DQO y la variable independiente es reducción de sólidos suspendidos. La figura 8.8 de abajo muestra las concentraciones de DQO versus reducción de sólidos suspendidos. Figura mostrando la grafica de DQO y solidos suspendios.
DQO (Y)
35
30
25 27
32
37
Solidos suspendidos (X)
Figura 8.8. Gráfica mostrando el DQO versus reducción de sólidos. (Elaboración propia) (b) La ecuación de la línea de regresión es: DQO (Y) = 1.53 + 0.909 X(sólidos suspendidos) La pendiente es igual a 0.909 y el intercepto es 1.53 (c) La tabla de abajo muestra la información de ANOVA. TABLA 8.9. Tabla de ANOVA de sólidos suspendidos y DQO. Fuente de SS g.l. MS Fcalc. Fcrítica Valor de p Variación Entre los grupos 32.00 1 32.00 4.35 3.98 0.04 Residual (error) 515.44 70 7.35 Total 546.44 71 __________________________________________________________________ (d) s = 0.9039 R2 = 88.8% PRESS = 31.8928 R2(predecida) = 87.13%
R2(ajustada) = 88.5% Durbin-Watson statistic = 1.67
8-31
Dr. Héctor Quevedo Urías
Aquí, el coeficiente de determinacion R2, mide, qué tan bien el modelo de regresión ajusta los datos. Análogamente, el estadístico PRESS (suma de cuadrados de error de predicción) mide la calidad del modelo de regresión. En cuanto a la estadística Durbin-Watson, si está cercana a 2 no hay autocorrelaciones en series positivas o negativas. La variación de los datos la da la estadística s. (e) La Figura 8.9 da la información subjetiva para la evaluación del modelo. (a) Residuals Versus the Fitted Values (response is DQO (Y)) 2
Standardized Residual
1
0
-1
-2
-3
-4 25
30
35
Fitted Value
(b) Normal Probability Plot of the Residuals (response is DQO (Y))
2
Normal Score
1
0
-1
-2 -4
-3
-2
-1
0
1
2
Standardized Residual
Figura 8.9. La figura (a) prueba por la autocorrelación o falta de independencia de los datos. Además, la figura (b) prueba por la normalidad de los datos. 8-32
Dr. Héctor Quevedo Urías
Regresión y correlación lineal múltiple Muchas aplicaciones del análisis de regresión involucran situaciones donde se tiene más de una variable independiente. En la mayor parte de los problemas de investigación se necesitan varias variables independientes para ver el efecto en la variable dependiente. La variable dependiente o de respuesta (Y) puede estar relacionada con muchas variables independientes o regresoras X1, X2, etc. En el estudio de regresión lineal múltiple se pueden usar el enfoque matricial. También se pueden hacer pruebas de hipótesis, intervalos de confianza, análisis subjetivos (análisis de los gráficos) y análisis objetivos (estadística de inferencia), como los cálculos de los coeficientes de determinación (R2) o de correlación (R), como en el caso de la regresión lineal simple. Sin embargo, en este caso, se puede calcular el coeficiente de correlación general y coeficientes de correlación parciales, es decir, en forma análoga a como se hace con los coeficientes βo, β1, etc. Cuando hablamos de regresión lineal múltiple tenemos las siguientes situaciones: 1. Modelo de primer orden con dos variables regresoras o independientes. 2. Modelo de primer orden con más de dos variables independientes. Modelo de regresión múltiple generalizado Cuando este modelo general es lineal en los coeficientes se denomina modelo de regresión múltiple. Por ejemplo, para el caso de k variables independientes x1, x2, x3,..., xk, el promedio está dado por Y|x1, x2, x3,..., xk y se da por el modelo de regresión múltiple poblacional: Y = µY|x1, x2, x3,..., xk = βo + β1x1 + β2x2 + ...+ βkxk + εk
(8-29)
Este modelo, también se puede expresar con otra anotación como: Yˆ j = βo + β1X1j + β2X2j + ……. + βkXkj + εj
(8-29a)
Los parámetros βj, j = 0, 1, 2, 3,.., k se conocen como coeficientes de regresión 8-33
Dr. Héctor Quevedo Urías
poblacionales. Por ejemplo, el parámetro βj representa el cambio esperado en la respuesta Y, por unidad de cambio en xj, cuando todos los demás pronosticadores xi se mantienen constantes. Además, εi y ei son los errores aleatorios o residuos de población y de la estadística asociados con la respuesta Yi. El modelo de regresión lineal múltiple de la muestra que estima al modelo poblacional de arriba es: Y = bo + b1X1 + b2x2 + ... + bkXk + e
(8-30)
Donde cada coeficiente de regresión parcial βi es estimado por bi. Esto se debe a qué, cada coeficiente parcial βi mide el cambio esperado en Y por unidad de cambio en x1, cuando x2 se mantiene constante, y β2 mide el cambio esperado en Y por unidad de cambio en x2 cuando x1 se mantiene constante. El modelo de primer orden con dos variables independientes es: Yi = βo + β1Xi1 + β2Xi2 + ε
(8-31)
Donde Yi, la variable dependiente que denota la respuesta en las -ésimas tentativas; Xi1 y Xi2 son las dos variables independientes de la -ésima tentativa; βo, β1, β2 son los coeficientes de regresión y, ε es el error o residuo. Modelo de regresión múltiple con más de dos variables independientes Yi = βo + β1Xi1 + β2Xi2 + … + βp-1Xi,p-1 + ε
(8-32)
Cuando hablamos de regresión lineal múltiple, el principal objetivo es la obtención de la ecuación de la línea de regresión muestral, para predicción y estimación, la cual emula a la ecuación poblacional. Sin embargo, antes de poder usar el modelo de regresión calculado, éste se tiene que evaluar, para ver qué tanta confiabilidad se le pueda dar. La evaluación o validación del modelo de regresión estimado se hace a través de análisis objetivos y subjetivos, en forma análoga como en la regresión lineal simple. Por ejemplo, los análisis objetivistas se hacen a través de funciones estadísticas de inferencia. Posteriormente, para que la validación del modelo sea 8-34
Dr. Héctor Quevedo Urías
completa, el procedimiento se complementa usando enfoques subjetivistas, a través de análisis de las gráficas de los valores residuales. Si la validación no es satisfactoria, se procede con remediación del modelo, ya sea haciendo transformaciones de los ejes o probando otros modelos más apropiados, como cuadráticos o cúbicos, etc. Aplicación de análisis subjetivos y objetivos para la evaluación del modelo de regresión Como se ha estado mencionando anteriormente, se sugieren dos maneras de revisar la utilidad del modelo obtenido. Estas maneras son: (1) análisis de gráficas de residuos y, (2) pruebas estadísticas de inferencia. Por ejemplo, para validar el modelo de regresión aplicando análisis subjetivos, es decir, a través de los gráficos de los residuos (ei), éstos se describen como las diferencias entre los puntos y la línea de regresión. Siendo así, las suposiciones son de que los residuos deben ser independientes y normalmente distribuidos, con promedio igual a cero y con varianzas constantes. Más explícitamente, las descripciones de las suposiciones son: 1. Los valores de la variable aleatoria estadística ei deben estar normalmente distribuidos. Para lograr esto, se grafican los residuos (crudos o estandarizados) de la variable dependiente en función de los valores de z o normales esperados. Para que se reúna la condición de normalidad de los datos, todos los puntos deben de estar dentro de las bandas de confianza y deben de estar muy cercanos a la línea de regresión. Además, si los términos del error ei están normalmente distribuidos, los residuales estandarizados o crudos deberán estar, aproximadamente, de acuerdo con las reglas del 68%, 94% y 99%. Esto quiere decir qué, el 68% de los residuos deberán estar entre z = ±1; el 95% deberán estar entre z = ±2 y, finalmente, el 99% de los residuos deberán estar entre z = ±3. 8-35
Dr. Héctor Quevedo Urías
2. Los valores de la variable aleatoria ei deben ser independientes uno del otro. No debe haber colinialidad o correlación en serie. Esto se revisa graficando los residuos (estandarizados o crudos) en función de los renglones. Si no hay, aproximadamente, los mismos residuos positivos y negativos en la gráfica, entonces, el modelo lineal calculado no es el apropiado y tendrán que buscarse otras alternativas (como funciones polinomiales, cuadráticas, cúbicas, etc.). Aquí cabe notar que la suposición de independencia es la más importante que se pueda violar, porque es la base para las pruebas estadísticas como la R2, el error de lo estimado (s dado por el programa Minitab), ANOVA, etc. 3. Los valores de la variable aleatoria ei deben de tener la misma varianza. Esto se llama homoscedasticidad. Esto se puede revisar visualmente graficando los residuales estandarizados o no estandarizados (crudos) contra cada valor de las variables independientes (Xi). Aquí, nuevamente, tiene que haber la misma cantidad de valores positivos y negativos expresados en la gráfica. Aquí, sin embargo,
existen
otros
métodos
para
revisar
por
el
problema
de
heteroscedasticidad que se retomarán en el capítulo de regresión polinomial. Otros investigadores estadísticos (Devore, 2000) sugieren cuatro gráficos de diagnóstico subjetivo, para la validación del modelo de regresión múltiple. Estos gráficos de diagnóstico son: 1. El gráfico de los residuos estandarizados y/o crudos en la ordenada versus los valores de Xi en la abscisa. 2. El gráfico de los residuos estandarizados y/o crudos en la ordenada versus los valores pronosticados (en la abscisa) por el programa de computadora usado. 3. El gráfico de los valores pronosticados en la ordenada versus los valores de Yi en la abscisa. 4. Gráfico de normalidad de los residuos estandarizados versus los percentiles de z 8-36
Dr. Héctor Quevedo Urías
(valores de z). 5. Histogramas. Aplicación de análisis objetivos para la evaluación del modelo de regresión Por otro lado, en cuanto al enfoque objetivista (estadística inferencial) para la validación del modelo de regresión, éste está relacionado con el uso de estadísticas como el coeficiente de determinación múltiple R2 (o r2), el coeficiente de determinación ajustado R2ajustada, el error estándar de lo estimado, s, tablas de análisis de varianza, pruebas de t de Estudiante, intervalos de confianza, el criterio de Mallow de Cp, PRESS, etc. De esta manera, cuando se habla de coeficientes en el modelo de regresión múltiple, existen cuatro tipos de coeficientes: (1) El coeficiente de determinación múltiple (R2) (2) El coeficiente de correlación múltiple (R) (3) El coeficiente de determinación ajustado (R2ajustada) (4) El coeficiente parcial de correlación múltiple (Rij.k) Por ejemplo, el coeficiente de determinación múltiple R2 es, tal vez, la medida estadística más popular usada para medir, qué tan bien encaja el modelo de regresión en los datos de la muestra. En realidad el uso de R2 es una técnica para medir la adecuación de un modelo de regresión lineal múltiple. Esta estadística se puede definir como una proporción o como un porcentaje. Como proporción, sus valores varían de cero a uno. Por ejemplo, si el valor de R2 está cercano a cero, esto indica que no hay una relación lineal entre Y y las X´s, mientras que, un valor cercano a uno, indica una ajuste perfecto. Sin embargo, el valor de R2 no debe de interpretarse ligeramente, sin el apoyo del error estándar de lo estimado (s), el residual (PRESS), el criterio de Mallow (Cp) o los factores de variación inflados (variance inflation factors, VIF). Además la validación del modelo debe estar 8-37
Dr. Héctor Quevedo Urías
apoyada por los análisis de los gráficos subjetivos. De acuerdo a la lógica del programa de NCSS, los siguientes enunciados dan algunas calificaciones de la interpretación de R2. 1. El valor de R2 puede incrementarse agregando más variables independientes, pero esto puede causar un aumento en el error del cuadrado medio, especialmente, cuando la muestra es pequeña. 2. La magnitud de R2 está influenciada por el rango de cada variable independiente. R2 aumenta a medida que el rango de las X´s aumenta y viceversa. 3. El valor de R2 no mide la magnitud de las pendientes. 4. La magnitud de R2 no mide la aptitud del modelo lineal; mide la fuerza lineal del componente del modelo. 5. Un valor grande de R2 no necesariamente significa una predicción grande. Lo opuesto también es correcto. Todo esto tiene que ser complementado o corroborado por otras funciones estadísticas y por el análisis gráfico subjetivo. 6. El valor de R2 es altamente sensible al número de observaciones. Entre más grande sea el tamaño de la muestra, más alto será el valor de R2. Más adelante, hay lo que se llama el valor ajustado del coeficiente de determinación múltiple ajustado (R2ajustada). Este coeficiente de determinación múltiple ajustado R2ajustada es una versión ajustada de R2 la cual busca remover la distorsión causada por un tamaño de muestra pequeño. Igualmente, también hay lo que se llama PRESS (predicted sum of squares) que se usa para validar el modelo de regresión en términos de predicción. Aquí, entre más pequeño sea el valor de PRESS, mejor será el modelo candidato. En forma análoga, también hay lo que se llama el coeficiente de correlación múltiple R. Este coeficiente R mide la fuerza de la relación lineal entre la variable dependiente Y y las variables independientes X1, X2, X3,…, Xk. En contraste con el 8-38
Dr. Héctor Quevedo Urías
coeficiente de correlación lineal simple, el rango de este coeficiente de correlación múltiple es de 0 ≤ R ≤ 1. Esto se debe a que R no indica la pendiente de la ecuación de regresión debido a que no es posible indicar los signos de todos los coeficientes de regresión que relacionan la variable dependiente Y a las variables independiente Xi. Así como en el caso de la correlación lineal, la medición de R2 es más fácil de interpretar que el coeficiente de correlación múltiple, R. Otro tipo de correlación relacionado con regresión y correlación múltiple es lo que se llama coeficiente parcial de correlación múltiple. Este coeficiente mide la fuerza de la relación lineal entre la variable dependiente Y y las variables independientes X1, X2, X3,…, Xk. Este coeficiente se puede expresar como Rij.k el cual es el estimador del coeficiente de correlación múltiple poblacional ρij.k. Rij.k se puede usar para ver la relación causal entre Y y una de las variables independientes, manteniendo las demás constantes. Este coeficiente, también se puede usar para ver la relación entre dos variables independientes. Más adelante, dentro de la categoría de análisis objetivos de estadística inferencial relacionados con regresión múltiple, tenemos lo que se llama análisis de varianza (ANOVA) discutido en capítulos anteriores. En forma análoga como el uso de R2, este análisis es un método complementario para revisar las suposiciones del modelo de regresión. La confiabilidad de los resultados del ANOVA está mancomunada a la suposición de que los residuales están normalmente distribuidos. El uso de ANOVA prueba los promedios poblacionales donde se analiza la variación total. ANOVA evalúa la utilidad del modelo de regresión probando la hipótesis nula de que todos los coeficientes (βi) de la ecuación de regresión (pendientes) son igual a cero. Los componentes del análisis de varianza o de ANOVA, son parecidos a los del análisis de varianza simple explicados en capítulos anteriores. Los componentes son la fuente de variación, los grados de 8-39
Dr. Héctor Quevedo Urías
libertad, la suma de los cuadrados, el cuadrado del promedio, la prueba de F y el nivel de probabilidad. Por ejemplo, la fuente de variación representa las particiones de la variación en Y. Hay cuatro fuentes de variación es decir, el intercepto, el modelo, el residuo o error y, el total ajustado. La prueba de inferencia con la estadística F se usa para probar la hipótesis de todas las βi = 0. Más importante todavía, es el cálculo del nivel de probabilidad p. El valor de p es la probabilidad de obtener un estadístico de prueba, al menos tan contradictorio o más extremo para Ho:, como el valor observado que se obtuvo, asumiendo que Ho: es verdadera. Si el valor de p es menor qué, digamos α = 0.05, la hipótesis nula se rechaza; de otra manera se retiene. Entre más pequeño sea el valor de p, menos credibilidad tendrá la hipótesis nula. Otros estadísticos objetivistas para validar el modelo de regresión son las pruebas individuales de t de estudiante para probar la hipótesis de que β1, β2, β3, βk son iguales a cero. Además se pueden usar los intervalos de confianza. Por ejemplo, en regresión múltiple el valor de t de estudiante se usa para probar la hipótesis de que uno de los coeficientes es igual a cero, después de remover la influencia de los otros. Los investigadores Paffenberger et al. (1987) dan la función para el intervalo de confianza para βi. Sin embargo, si se concluye que β1 o βk no son igual a cero esto, no necesariamente, dice que el modelo de regresión es útil para predicción. En verdad, para determinar si el modelo es apropiado, en lugar de probar que β1 = 0 y β2 = 0, separadamente (usando la prueba de t), se usa una prueba conjunta como el análisis de varianza (ANOVA). De cualquier manera, la prueba de hipótesis bilateral para probar los coeficientes individuales βi se usa el siguiente formato dado en la tabla de abajo.
8-40
Dr. Héctor Quevedo Urías
TABLA 8.10. Tabla mostrando los mecanismos para una prueba de hipótesis bilateral para los coeficientes individuales βi incluidos en el modelo de regresión múltiple. (Elaboración propia) Hipótesis nula: Ho:βi = 0, hipótesis alternativa: H1:βi ≠ 0 Valor del estadístico: t = bi / sbi Regla de decisión: Rechazar Ho: si t > tα/2;n-(k+1) o bien si t < -tα/2;n-(k+1). No rechazar Ho: si tα/2;n-(k+1) ≤ t ≤ tα/2;n-(k+1) Donde: βi son los coeficientes de regresión individuales. bi = estimadores de βi sbi = errores estándar α = nivel de significancia deseado n = número de observaciones k = número de variables independientes t = función estadística de t de Estudiante Ejemplos aplicando la regresión y correlación múltiple Ejemplo #6. En la adsorción de tierra y sedimento, la magnitud de la acumulación en forma condensada de los productos químicos en la superficie es una característica importante que influye en la eficiencia de insecticidas y varios otros productos
químicos.
El
artículo
“Adsorption
of
Phosphate,
Arsenate,
Methanearsonate and Cacodylate by Lake and Stream Sediments: Comparison with Soils” (J. of Environ. Qual., 1984, pp. 499-504) presenta los siguientes datos en la tabla de abajo. Aquí se toma Y como la variable dependiente, la cual denota el índice de adsorción de fosfato,
X1 es una de las variables independientes
denotando la cantidad de hierro extraíble y, X2 es otra de las variables independientes denotando la cantidad de aluminio extraíble. (Devore, 2000) 8-41
Dr. Héctor Quevedo Urías
TABLA 8.11. Tabla mostrando los datos del ejemplo. _________________________________________________________________ Observación
X1 (Hierro extraíble)
X2 (Aluminio extraíble)
Y (Índice de adsorción)
__________________________________________________________________ 1 61 13 4 2 175 21 18 3 111 24 14 4 124 23 18 5 130 64 26 6 173 38 26 7 169 33 21 8 169 61 30 9 160 39 28 10 244 71 36 11 257 112 65 12 333 88 62 13 199 54 40 ________________________________________________________________ (Fuente: Devore, 2000) Hacer los cálculos pertinentes. Solución: Usando un paquete de computadora da: bo = -7.351, desviación estándar = 3.485, b1 = 0.11273, desviación estándar = 0.02969, b2 = 0.34900, s = 0.07131 La ecuación de la línea de regresión lineal múltiple es: Y = -7.351 + (0.11273)(X1) + (0.34900)(X2) Enseguida, para ver, qué tan confiable es el modelo de regresión calculado, primero procedemos a efectuar el análisis subjetivo, es decir, el análisis de las gráficas de los residuos.
8-42
Dr. Héctor Quevedo Urías
Figura 8.10 Figura mostrando las gráficas de los residuos estandarizados versus valores esperados de z (1); gráfica mostrando el residuo estandarizado versus la variable independiente X1 (2); gráfica mostrando el residuo estandarizado versus la variable independiente X2 (3); gráfica mostrando el residuo estandarizado versus el valor de Y pronosticado (4) y, finalmente, gráfica de Y pronosticada versus adsorción (5). (Elaboración propia) 8-43
Dr. Héctor Quevedo Urías
Figura 8.11 Esta gráfica muestra un enfoque un poco diferente al de la figura anterior, es decir usando los residuos no estandarizados en contraste con la figura 8.10 que usa los residuos estandarizados. Gráfica mostrando la prueba de normalidad (1). Gráfica mostrando la prueba de independencia de residuos versus renglones (2). Gráfica mostrando los residuos versus valores pronosticados (3). Gráfica mostrando los residuos versus variable independiente de hierro (4). Gráfica mostrando los residuos versus variable independiente aluminio (5). (Elaboración propia) 8-44
Dr. Héctor Quevedo Urías
El valor del coeficiente de determinación múltiple es: R2 = 0.9480 El coeficiente de determinación ajustado es: R2ajustada = 0.9380 El coeficiente de correlación múltiple es: R = 0.9736 Los coeficientes parciales se pueden estimar si se desea saber la relación entre el índice de adsorción y el aluminio extraíble, poniendo la variable independiente, hierro constante. También, si se deseara saber la relación entre el índice de adsorción y el hierro extraíble, se pondría la variable aluminio constante. Similarmente, si se deseara saber la relación entre las variables aluminio y la variable del hierro, se pondría la variable índice de adsorción fija. TABLA 8.12. Tabla mostrando los coeficientes de regresión, valores de t de Estudiante, niveles de p y decisiones tomadas en Ho: (Elaboración propia) _________________________________________________________________ Variable Coeficiente Valor de t Nivel Decisión independiente de regresión de p (5%) _________________________________________________________________ Intercepto -7.35066 -2.1094 0.0611 Aceptar Hierro 0.11273 3.7969 0.0035 Rechazar Aluminio 0.34900 4.8944 0.0006 Rechazar _________________________________________________________________ TABLA 8.13. Tabla de análisis de varianza. (Elaboración propia) _________________________________________________________________ Fuente de g.l. Suma de los Cuadrado Fcalc. Valor Poder de Variación cuadrados medio de p la prueba _________________________________________________________________ Intercepto 1 11580.31 11580.31 Regresión 2 3259.90 1764.95 92.03 0.000 1.0000 Error 10 191.79 19.18 _________________________________________________________________ Total 12 3721.69 310.14
8-45
Dr. Héctor Quevedo Urías
TABLA 8.14. Tabla mostrando el reporte de residuos. (Elaboración propia) _________________________________________________________________ Renglón Valor Valor Residuo Error estándar actual pronosticado _________________________________________________________________ 1 4 4.0630 -6.3052 5.0077 2 18 19.7066 -1.7066 4.9511 3 14 13.5387 0.4612 4.7055 4 18 14.6552 3.3447 4.6862 5 26 29.6406 -3.6406 5.1051 6 26 25.4141 0.5858 4.5996 7 21 23.2182 -2.2182 4.6488 8 30 32.9902 -2.9902 4.6623 9 28 24.2976 3.7024 4.5671 10 36 44.9352 -8.9352 4.7012 11 65 60.7097 4.2902 5.4250 12 62 60.9014 1.0986 5.4195 13 40 33.9292 6.0707 4.5649 _________________________________________________________________ TABLA 8.15. TABLA mostrando los intervalos de confianza para este problema. (Elaboración propia) _________________________________________________________________ Variable Límite inferior (95%) Límite superior (95%) independiente _________________________________________________________________ Intercepto -15.1149 0.4137 Hierro (X1) 0.0467 0.1789 Aluminio (X2) 0.1901 0.5079 __________________________________________________________________
8-46
Dr. Héctor Quevedo Urías
TABLA 8.16. Tabla mostrando la estadística descriptiva. (Elaboración propia) _________________________________________________________________ Variable Conteo Promedio Desviación Valor Valor estándar mínimo máximo _________________________________________________________________ Hierro (X1) 13 177.31 70.10 61 333 Aluminio (X2) 13 49.31 29.19 13 112 Índice de (Y) 13 29.85 17.61 4 65 adsorción _________________________________________________________________ Conclusiones: El modelo de regresión obtenido es válido para predicción y estimación. Los datos encajan bien con un modelo lineal múltiple. Esta contención está basada en el análisis subjetivo de las gráficas de los residuos. Por ejemplo, en la figura 8.10 y 8.11 la prueba de normalidad es buena, porque todos los puntos están dentro de las bandas, y muy cercanos a la línea de regresión. Además, los puntos están de acuerdo con la regla del 68%, 95% y 99%, es decir, el 68% de los puntos están dentro de z = ±1, el 95% están dentro de z = ±2, etc. En la figura 8.11 de los residuos versus los renglones, esto satisface la suposición de independencia, porque hay el mismo número de residuos positivos y negativos. Además, las gráficas de los residuos versus las variables independientes no violan la suposición de no linealidad, porque no hay tendencias definidas. Finalmente, la gráfica de residuos versus valores pronosticados están de acuerdo con la suposición de varianzas iguales (homoscedasticidad). En cuanto a los análisis objetivistas, es decir, usando pruebas estadísticas, nuevamente, presuponen un buen ajuste del modelo de regresión estimado. Esto se debe a qué, el valor del coeficiente de determinación múltiple R2 está muy cercano a uno. Además, el valor de R = 0.9736 indica muy buena correlación entre la variable dependiente y las variables independientes. Con respecto a la tabla del análisis de varianza, el valor de F es mucho menor que el valor crítico y esto está 8-47
Dr. Héctor Quevedo Urías
demostrado por el valor de la probabilidad p el cual es mucho muy significante. Las pruebas de t de estudiante, también son muy aceptables y demuestran que las pendientes de βi no son iguales a cero. Los intervalos de confianza dan resultados similares y sugieren que el modelo de regresión es buen pronosticador. Se pueden seguir haciendo pruebas de hipótesis para todos los parámetros poblacionales y, sin lugar a dudas, éstas también apoyarían la contención de que, el modelo de regresión, es aplicable. Ejemplo #7. Considerar los datos de la tabla de abajo. Usando el programa de computadora Minitab obtener el modelo de regresión más apropiado, es decir, un modelo múltiple lineal (Modelo 1); modelo con transformación en el eje vertical (Modelo 2) y un modelo con transformaciones de los ejes horizontales y del eje vertical (Modelo 3). TABLA 8.17. Tabla mostrando los datos bivariados de regresión. (Elaboración propia) X1 |
4
4
4
6
3
6
3
2
X2 |
3
4
3
4
2
4
2
2
Y |
3
2
7
6
5
6
7
4
Solución: Abajo se dan los resultados de los tres modelos. Al juzgar por los resultados, se le pide al lector que decida cual modelo es el más apropiado.
8-48
Dr. Héctor Quevedo Urías
TABLA 8.18. Resultados mostrando el resumen de los tres modelos. (Elaboración propia) _______________________________________________________________ Regression Analysis: Y versus X1, X2 (Modelo 1) The regression equation is: Y = 6.00 + 2.00X1 – 3.00X2 Predictor Constant X1 X2
Coef 6.0000 2.0000 -3.0000
SE Coef 1.803 0.7746 1.183
T 3.33 2.58 -2.54
P 0.021 0.049 0.052
s = 1.414 R-Sq = 58.3% R-Sq(adj) = 41.7% PRESS = 0.1274 R-Sq(pred) = 51.62% Analysis of Variance Source Regression Residual Error Total
DF 2 5 7
SS 14.000 10.000 24.000
MS 7.000 2.000
F 3.50
P 0.112
Regression Analysis: Log Y versus X1, X2 (Modelo 2) The regression equation is: Log Y = 0.810 + =.225X1 – 0.348X2 Predictor Constant X1 X2 s = 0.1272 PRESS = 0.1274
Coef 0.8101 0.2248 -0.3479
SE coef 0.1622 0.0697 0.1065
T 4.99 3.23 -3.27
P 0.004 0.023 0.022
R-Sq = 69.3% R-Sq(adj) = 57.0% R-Sq(pred) = 51.62%
Analysis of Variance Source Regression Residual Error Total
DF 2 5 7
SS 0.1824 0.0809 0.2634
MS 0.0912 0.0162
F 5.63
P 0.052
Regression Analysis: Log Y vs Log X1, Log X2 (Modelo 3) The regression equation is: Log Y = 0.595 + 1.83 Log X1 – 2.16 Log X2 Predictor Constant Log X1 Log X2 s = 0.1483 PRESS = 0.3005
Coef 0.5949 1.8342 -2.1573
SE Coef 0.2095 0.7288 0.8332
T 2.84 2.52 -2.59
P 0.036 0.053 0.049
R-Sq = 58.2% R-Sq(adj) = 41.5% R-Sq(pred) = 0.00%
Analysis of Variance Source Regression Residual Error Total
DF 3 5 7
SS 0.1533 0.1100 0.2634
MS 0.0767 0.0220
F 3.48
8-49
P 0.113
Dr. Héctor Quevedo Urías
TABLA 8.19. Tabla mostrando los datos originales del problema. (Elaboración propia) ___________________________________________________________________________ C1 C2 C3 C4 C5 C6 ___________________________________________________________________________ Y X1 X2 Log Y Log X1 Log X2 ___________________________________________________________________________ 1 3 4 3 0.477121 0.602060 0.477121 ___________________________________________________________________________ 2 2 4 4 0.301030 0.602060 0.602060 ___________________________________________________________________________ 3 7 4 3 0.845098 0.602060 0.477121 ___________________________________________________________________________ 4 6 6 4 0.778151 0.778151 0.060206 ___________________________________________________________________________ 5 5 3 2 0.698970 0.477121 0.301030 ___________________________________________________________________________ 6 6 6 4 0.778151 0.778151 0.602060 ___________________________________________________________________________ 7 7 3 2 0.845098 0.477121 0.301030 ___________________________________________________________________________ 8 4 2 2 0.602060 0.301030 0.301030 ___________________________________________________________________________
Ejemplo #8. En estudios de química analítica, el uso del análisis de fluorescencia de rayos X se usa como una herramienta para estimar los porcentajes de los ingredientes de muchas mezclas. A menudo, la estimación de las concentraciones depende en la habilidad para ajustar modelos de regresión. En una investigación intitulada “Corrections for Matrix Effects in X-rays fluorescent Analisis Using Multiple Regression Methods”, publicado por Analytical Chemistry (Vol. 37, 1965)
mezclas
contiendo
4
ingredientes
(Xi)
fueron
preparadas.
Las
concentraciones de los componentes variaron en las mezclas para producir tipos estándares de calibración (Yi). (Walpole, 1992, p. 421). Los datos de este problema se dan abajo.
8-50
Dr. Héctor Quevedo Urías
TABLA 8.20. Tabla mostrando los datos del problema de arriba. Yi
X1
0.5514 1.1240 0.4426 0.9285 0.5631 1.1214 0.5624 1.1635 0.4505 0.9415 0.5290 1.0712 0.4702 0.9561 0.5001 1.0186 0.4425 0.9039 (Fuente: Walpole et al. 1992)
X2 0.8980 0.8872 0.8030 0.8706 0.8064 0.8404 0.8731 0.8431 0.8314
X3
X4
0.8219 0.9308 0.7668 0.9272 0.9026 0.8662 0.8206 0.8346 0.7596
0.9906 0.9944 1.1221 0.9832 1.1127 1.0836 1.0290 1.0591 1.0994
(a) Ajustar un modelo lineal de regresión múltiple a los datos de la tabla. Enseguida, estimar las concentraciones del ingrediente A para una mezcla cuya tasa de intensidades de rayos-X sean, respectivamente, X1 = 1.10, X2 = 0.900, X3 = 0.800 y X4 = 0.995. Solución: (a) Usando un paquete de computadora y asumiendo un modelo de regresión lineal múltiple se obtiene la ecuación de regresión. Y = -0.3004 + 0.5387X1 + 0.1770X2 – 0.0704X3 + 0.1506X4 Sustituyendo las variables independientes, se obtiene el valor de la respuesta Y, es decir: Y = -0.3004 + 0.538(1.10) + 0.1770(0.90) – 0.0704(0.80) + 0.1506(0.995) = 0.50 Ejemplo #9. Montgomery y Peck (1992) describen el uso de un modelo de regresión para relacionar la cantidad de tiempo que requiere un vendedor para dar servicio a una máquina expendedora de artículos y el número de empaques contenidos en la máquina y la distancia del vehículo (pies) de servicio del sitio 8-51
Dr. Héctor Quevedo Urías
donde se encuentra la máquina. Este modelo de regresión múltiple fue utilizado para diseñar la ruta, los horarios y la salida de los vehículos. La tabla de abajo muestra 25 observaciones del tiempo de suministro, número de empaques y la distancia, del vehículo. TABLA 8.21. Tabla mostrando los datos de suministro. No. de observación
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Tiempo de suministro
No. de envases
9.45 24.45 31.75 35.00 25.02 16.86 14.38 9.60 24.35 27.50 17.08 37.00 41.95 11.66 21.65 17.89 69.00 10.30 34.93 46.59 44.88 54.12 56.23 22.13 21.15
2 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5
(Fuente: Montgomery et al. 1992)
8-52
Distancia del vehículo
50 110 120 550 295 200 375 375 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400
Dr. Héctor Quevedo Urías
Para este problema calcular los siguientes enunciados: (a) El modelo de regresión lineal múltiple poblacional. (b) El modelo de regresión lineal múltiple de la muestra que estima al modelo poblacional. (c) Predecir el tiempo de suministro para pares de valores de las variables de regresión, número de empaques (x1) y distancia (x2), cuando x1 = 1 empaque y la distancia es igual a x2 = 25 pies. (d) Evaluar el modelo de regresión obtenido usando técnicas objetivistas y sujetivistas, como las descritas en este capítulo. Discutir el razonamiento que se sigue en la validación subjetiva de los gráficos. Solución: (a) El modelo de regresión múltiple, para 2 variables independientes es: µY|x1,x2| = βo + β1x1 + β2x2 + ε (b) El correspondiente modelo de regresión lineal múltiple muestral es: Y = bo + b1X1 + b2X2 + e Donde: Y = tiempo de suministro X1 = no de envases X2 = distancia del vehículo El modelo de regresión de la muestra es: Y = 1.74 + 2.78 (X1) + 0.013 (X2) (c) Para predecir el tiempo de suministro (Y) en relación con el número de envases, cuando X1 = 1 y con la distancia del vehículo, cuando X2 = 25 pies se obtiene sustituyendo los valores en la ecuación de regresión, es decir: Y = 1.74 + 2.78(1) + 0.013(25) = 4.85 (d) Los resultados objetivistas estadísticos son: R2 = 98.1%; R2ajustada = 97.9%; s = 8-53
Dr. Héctor Quevedo Urías
2.32; PRESS = 159.89. TABLA 8.22. Tabla mostrando los valores de T y de P. (Elaboración propia). Predictor
Coeficiente
Constante
1.743
No. de envases Distancia del vehículo
SE coeficiente
T
P
1.155
1.51
0.145
2.790
0.092
30.09
0.000
0.013
0.003
4.33
0.000
_________________________________________________________________ TABLA 8.23. Tabla de análisis de varianza. (Elaboración propia) Fuente de Variación Debido a la Regresión Error
g.l.
SS
MS
F
p
2
5984.8
2992.4
555.2
0.000
22
118.6
5.4
Total
24 Para la validación subjetiva del modelo de regresión, analizando las gráficas
de los residuos estandarizados, deben existir, aproximadamente, el mismo número de residuos positivos y negativos. Además, en la prueba de normalidad, todos los puntos deben estar dentro de las bandas de confianza. El estudiante deberá hacer los diagnósticos subjetivos para complementar la refrendación o confiabilidad del modelo de regresión. Procedimiento de regresión múltiple usando el programa Minitab Procedimiento: 1. Irse a: Stat → Regression → Regression 2.
En la ventana de “Regression” aparecen las entradas de la variable
dependendiente (Y) y de las variables independientes X1, X2, en sus columnas respectivas relacionadas con el problema 8-54
Dr. Héctor Quevedo Urías
3. En la ventanilla de “Response” (de esta ventana de Regression) entrar la variable dependiente y, en la ventanilla de “Predictors,” entrar las variables independientes (que se copiaron en las columnas del programa). 4. Debajo de esta venta de Regression están las ventanillas de “Graphs, Options, Results y Storage”. Por ejemplo si se desea usar Graphs se pueden seleccionar los residuales regulares o los estandarizados. En la ventanilla de “Option residual plots”, puntear las gráficas de las cuatro opciones, para el análisis subjetivista. 5. En la ventana de “Regression-Options” puntear las funciones deseadas, v.g., variance “Inflation factors, Durbin-Watson statistics, PRESS”, etc. 6. En la ventana de “Regression-Results” puntear las funciones deseadas de las cuatro enlistadas, v.g., “In addition de sequential sum…..” Ejemplo #10. Este es un ejemplo del libro Applied Statistics: Análisis of Variance and Regresion de los autores Dunn y Clark. Esta es una investigación relacionada con la temperatura, tomada como la variable de respuesta, en función de variables regresoras como la altitud, longitud y latitud. La tabla de abajo muestra los resultados. Usando el programa Minitab: (a) Encontrar el modelo de regresión más apropiado (b) Validar el modelo usando metodos estadísticos, es decir, estimando el coeficiente de determinación múltiple R2, R2 ajustada, s, PRESS, tabla de ANOVA, y gráficas subjetivistas, como residuos versus órdenes, residuos versus valores ajustados y pruebas de normalidad. (c) Hacer comentarios acerca de los resultados
8-55
Dr. Héctor Quevedo Urías
TABLA 8.24. Tabla mostrando los valores de la temperatura en oF (Y), Altitud en pies (X1), Longitud en grados (X2) y Latitud en grados (X3). Temperatura (Y)
Altitud (X1)
Longitud (X2)
Latitud (X3)
55.7
1083
112
33
37.8
457
86
38
56.4
312
118
34
51.0
305
90
32
34.5
5221
105
40
34.0
2842
116
44
36.7
807
94
41
33.4
4260
112
41
32.6
815
83
40
49.1
3920
106
32
46.6
1054
84
34
36.3
4397
120
39
18.2
830
93
45
36.7
465
90
39
13.3
1162
92
47
30.1
787
82
41
__________________________________________________________________
Solución: (a) Se assume un modelo de regresión lineal (b) La utilidad del modelo se da por los valores de R2, s, PRESS, etc. mostrados por las Figuras 8.12 (a), (b) y (c). Regression Analysis: (Y) Temperatura versus (X1) Altitud, (X2) Longitud (X3) The regression equation is: (Y) Temperatura = 99.2 - 0.00138 (X1) Altitud + 0.299 (X2) Longitud - 2.29 (X3) Latitud Predictor Constant (X1) Altitud (X2) Longitud (X3) Latitud
Coef 99.24 -0.0013780 0.29877 -2.2900
SE Coef 10.79 0.0005968 0.07736 0.1779
8-56
T 9.20 -2.31 3.86 -12.87
P 0.000 0.040 0.002 0.000
VIF 1.7 1.7 1.0
Dr. Héctor Quevedo Urías
s = 3.12166, R-Sq = 94.6%, R-Sq(adj) = 93.2%, PRESS = 214.855, R-Sq(pred) = 90.08% Analysis of Variance Table Source Regression Residual Error Total
DF 3 12 15
SS 2048.54 116.94 2165.48
MS 682.85 9.74
F 70.07
F crítica F.05;3,12 = 3.49
P 0, la parábola es cóncava. Estas situaciones se ven en la Figura 9.0(a) y en la Figura 9.0 (b). El coeficiente βo representa el intercepto en la ordenada. 9-2
Dr. Héctor Quevedo Urías
Los coeficientes β1 y β2 controlan la parábola, relativo a la ordenada. Por ejemplo, si β1 = 0, la parábola es simétrica y centrada alrededor de y = 0. No obstante, si β1 y β2 tienen el mismo signo, la parábola se desvía hacia la izquierda, pero si β1 y β2 tienen signos opuestos, la parábola se desvía hacia la derecha. Además, el coeficiente β2 describe la curvatura. Por otra parte, si β2 = 0, no hay curvatura. Esto se ve en la Figura 9.0(c). Entre más grande sea el valor de β2, mayor será la tasa de curvatura. Sin embargo, entre más pequeño sea el valor de β2, menor será la curvatura (Keller et al. 1990). Todas estas situaciones se ven en estas gráficas. Modelo de polinomios de tercer orden (k = 3), con una variable independiente y = βo + β1x + β11x2 + β111x3 + ε
(9-2)
Donde: y = variable dependiente β1 = coeficiente de efecto lineal β11 = coeficiente de efecto cuadrático β111 = coeficiente de efecto cúbico. Las Figuras 9.0 (d) y (e) de abajo muestran este tipo de ecuación. Como se ve, cuando β3 < 0, sobre el rango de x, el valor de y disminuye, pero cuando β3 > 0, el valor de y aumenta. Sin embargo, las aplicaciones del modelo cúbico son muy pocas.
9-3
Dr. Héctor Quevedo Urías
Figura 9.0. Figuras mostrando las gráficas del modelo cuadrático y cúbico. Por ejemplo, gráfica (a) muestra el modelo de segundo orden, con β2 < 0; la gráfica (b) muestra el modelo con β2 > 0 y con varios valores de β2. La gráfica (c) muestra los modelos de tercer orden con β3 < 0 y, (d), con β3 > 0. (Fuente: Keller et al. 1990)
9-4
Dr. Héctor Quevedo Urías
Los modelos polinomiales de poderes más altos que k = 3 deben de usarse con precaución. Esto se debe a que, la interpretación de los coeficientes es difícil, y las interpolaciones pueden ser peligrosas. Además, cuando hablamos de modelos con valores de k = 4, o k = 5, el comportamiento de semejantes modelos es extraño y de aplicaciones raras y, por lo tanto, no se discutirán aquí. Modelo de segundo orden con más de dos variables independientes con interacción Antes de discutir estos modelos de regresión hay que definir el término interacción. Interacción significa que, el efecto de x1 sobre y, es influenciado por el valor de x2, que también significa que, el efecto de x2 sobre y, es influenciado por x1. Para ver el efecto de interacción, supóngase que la ecuación de la línea de regresión muestral es y = 6 + 4x1 + 5x2 – 3x1x2. Para explicar este efecto supóngase que le demos valores a x2 de 1, 2, y 3. Al sustituir los valores de x2 = 1, 2, y 3, en la ecuación muestral de arriba, se producen las siguientes ecuaciones: y = 5 + x1, con x2 = 1; y = 10 – 2x1 con x2 = 2 y, además, y = 15 – 5x1, con x2 = 3. Analizando estas tres ecuaciones modificadas vemos que el intercepto y los coeficientes de x1 también varían. Aquí se ve que el efecto de x1 sobre y es influenciado por el valor de x2. Al graficar estas tres ecuaciones vemos que las tres líneas rectas se cruzan entre si. Esto se ve en la Figura 9.1 (b). En esta gráfica, claramente, se ve que hay interacción, es decir, cuando las líneas rectas se cruzan entre si. Modelo de segundo orden (cuadrático) con interacción Si un investigador cree que en sus datos existe una relación cuadrática entre la variable dependiente (y) y cada una de las variables independientes x1 y x2, es decir, cuando las variables independientes interaccionan entre si (decisión que se logró después de analizar las gráficas con tres curvas interaccionando entre si), entonces, se
9-5
Dr. Héctor Quevedo Urías
debe de inclinar por el modelo de segundo orden con interacción. El modelo polinomial con dos variables independientes con interacción se da como: y = βo + β1x1 + β2 x2 + β3 x21 + β4 x22 + β5 x1x2 + ε
(9-3)
Este modelo, también se puede expresar con diferentes anotaciones, como las señaladas abajo: y = βo + β1x1 + β2 x2 + β12 x21 + β22 x22 + β12 x1x2 + ε
(9-3a)
Donde: β12 = coeficiente de efecto de interacción, donde x1 y x2 representan la interacción entre los pronosticadores o variables independientes x1 y x2. Aquí, nótese que, la diferencia entre la ecuaciones (9-2) y (9-3), es el último término de la derecha, el cual denota el efecto de la interacción. Modelo polinomial (de segundo orden o cuadrático) con tres variables independientes sin interacción El modelo de segundo orden con tres variables independientes, cuando estas variables no interaccionan entre si, es: y = βo + β1x1 + β2 x2 + β3 x3 + β11 x21 + β22 x22 + β33 x23 + ε
(9-4)
Modelo polinomial (de segundo orden o cuadrático), con tres variables independientes con interacción El modelo de segundo orden con tres variables independientes, con interacción (Neter et al. 1996) es: y = βo + β1x1 + β2x2 + β3x3 + β11x21 + β22x22 + β33x23 + β12x1x2 + β13x1x3 + β23x2x3 + ε
Donde: y = variable dependiente o función de respuesta βo = intercepto en la ordenada
9-6
(9-5)
Dr. Héctor Quevedo Urías
β12, β13, β23 = los coeficientes del efecto de interacción entre los pares de variables de predicción x1x2, x1x3 y x2x3 x1x2, x1x3, x2x3 representan la interacción entre las variables independientes x1, x2, x3,x1, x2, x3 = variables independientes En la solución de problemas relacionados con modelos de regresión lineal, múltiple o de regresión polinomial, con una o más variables independientes es siempre conveniente graficar los datos y examinar el diagrama esparcido. Esto se hace con el objeto de analizar, visualmente, el diagrama esparcido y ver el tipo de curva mostrado y, por consiguiente, el modelo de regresión o función que pueda encajar mejor en los datos.
Figura 9.1. Gráficas mostrando modelos polinomiales de primero y segundo orden, con dos variables independientes. La gráfica (a) muestra la ecuación y = 6 + 4x1 + 5x2. Cuando x2 = 1, 2 y 3, las ecuaciones modificadas se ven en la gráfica en cada uno de sus casos. 9-7
Dr. Héctor Quevedo Urías
En estas figuras se ve que no hay interacción (las líneas no se cruzan, porque es un modelo aditivo). La gráfica (b) muestra la ecuación y = 6 + 4x1 + 5x2 – 3x1x2. Cuando x2 = 1, 2 y 3, la gráfica muestra las ecuaciones modificadas. Aquí se ve que, la ecuación polinomial de primer orden tiene interacción. Finalmente, las gráficas (c) y (d) muestran los modelos de regresión polinomial de segundo orden, sin interacción y, con efecto de interacción de inferencia, respectivamente. Esto se vería después de que se sustituyeran los valores de x2 = 1, 2 y 3 a una ecuación muestral que emulará al modelo (9-6). (Keller et al. 1990). Evaluación de los modelos de regresión La regresión polinomial es un caso especial de los modelos de regresión lineal simple y múltiple. La validación de estos modelos es análoga a la de los modelos de regresión lineal. Sin embargo, antes de estar totalmente seguros acerca de la utilidad del modelo de regresión seleccionado, para fines de predicción y estimación, hay que ver que el modelo represente adecuadamente la relación entre las variables. Esto se puede hacer a través de estadística de inferencia y de análisis de gráficos. Para la evaluación de los modelos se puede proceder, jerárquicamente, ajustando modelos de segundo y tercer orden, con interacción y sin interacción y, luego se explora la posibilidad de ajustar un modelo de orden más bajo como modelos de regresión lineal múltiple, pero, nuevamente, con interacción y sin interacción. De cualquier manera, como se dijo antes, para evaluar los modelos de regresión se procede explorando los criterios estadísticos, como el coeficiente de determinación múltiple (R2), el error estándar de lo estimado (sε), el coeficiente de determinación múltiple (R2), el criterio Cp de Mallow, PRESS (la sigla de suma de cuadrados de error de predicción) o, los valores de t, etc. Además, se revisan los valores de VIF (factores de varianza inflada; en donde valores grandes de VIFs indican grandes diferencias entre los coeficientes de regresión estimados y los estandarizados), para ver posibles 9-8
Dr. Héctor Quevedo Urías
problemas de colinealidad. También, se puede usar la estadística de Durbin-Watson para revisar problemas de autocorrelación de los residuos en series de tiempo. Aquí, para regresión múltiple, de acuerdo a la lógica del programa NCSS, ésta dice que, si esta función está cercana a 2, no hay autocorrelación, pero si es muy diferente de 2, entonces, si la hay. Análogamente, se pueden usar otros métodos como “Regresión por Pasos” o “Todas las Regresiones Posibles”, que seleccionan los modelos óptimos basándose en los criterios arriba citados, es decir, agregando y/o eliminando las variables independientes o de respuesta. Finalmente, todo esto se puede complementa usando un análisis subjetivo, es decir, analizando los gráficos de los residuos estandarizados o no estandarizados, esto es, examinando la prueba de normalidad, residuos versus valores ajustados, de los órdenes, etc. A. Análisis de estadística de inferencia (objetivo) para complementar la validación del modelo 1. Cálculo del coeficiente de determinación R2. Este criterio indica, qué proporción de la variación total en la respuesta Y se explica con el modelo ajustado. En términos simples, esto dice que R2 indica la proporción de variación explicada por las variables independientes x1, x2, x3, …., xk. Este coeficiente de determinación R2 ya se describió anteriormente, es decir: R2 = (Σxy)2 / Σx2Σy2
(9-6)
Donde: Σxy = ΣXY – ΣXΣY/n, Σx2 = ΣX 2 – (ΣX)2/n y Σy2 = ΣY 2 – (ΣY)2/n, las cuales se definen por las ecuaciones (8-8), (8-9) y (8-10) dadas en el capítulo 8. 2. El error estándar de lo estimado: sε =
SSE = Σ(y – y p)2/(n – 2) n −1 − k
(9-7)
Donde, SSE = Σe2i se refiere a la suma de los cuadrados del error o residuo, y p es línea 9-9
Dr. Héctor Quevedo Urías
de regresión, n es el tamaño de muestra y, k, es el número de coeficientes βi probados en el modelo de regresión polinomial. Un valor pequeño de SSE, indica un buen ajuste del modelo. La función SSE es un diagnóstico muy importante. 3. Criterio Cp. Este diagnóstico está relacionado con el error cuadrático medio de un valor ajustado. En general, se prefieren valores pequeños de Cp. El modelo óptimo tiene un valor de Cp cercano a (p + 1), donde, p es el número de variables independientes. Un Cp mayor que (p + 1) indica que el modelo de regresión contiene variables innecesarias que puedan dar problemas de colinialidad, pero si el Cp es menor que (p + 1), esto indica que se han omitido variables importantes. 4. Análisis de ANOVAS y pruebas de t de Estudiante para ver cual modelo de regresión ajusta mejor los datos. B. Análisis gráfico (subjetivo). Para hacer la evaluación, subjetivamente, de la bondad de ajuste de los modelos usados se analizan los siguientes gráficos: 1. Prueba de normalidad. Para que exista normalidad, los residuos deberán formar una línea recta o estar dentro de las bandas de confianza. Si no es así, la suposición de normalidad es inválida. 2. Histogramas de residuos. Esta gráfica deberá asemejarse a una distribución normal. 3. Gráfica de residuos versus valores ajustados de Y para la prueba de independencia. Aquí, debe haber aleatoriedad de los residuos. No debe haber tendencias crecientes o decrecientes. Además, debe haber el mismo número de residuos positivos y negativos. De no ser así, se violan las suposiciones del modelo. 4. Autocorrelación (valores de ε fijos). Para diagnosticar la autocorrelación en series de tiempo, gráficar residuos vs. tiempo. Usar prueba de Durbin-Watson para ver si existe autocorrelación de primer orden. Se mitiga haciendo transformaciones del eje Y´. 5. Análisis de gráficos para diagnosticar colinialidad (correlación o dependencia casi lineal entre las variables de regresión). Para mitigar esto hacer transformaciones como 9-10
Dr. Héctor Quevedo Urías
Y´= Log Y, Y = Y 2, Y ´= √ Y e Y ´= 1/Y. 6. Prueba de heteroscedasticidad (hetero- = desigual; -scedasticidad = esparcido) o de residuales no uniformes (implica error de varianza de σ2ε no constante en todos los casos, en contraste con homoscedasticidad, la cual implica error de varianza σ2ε constante). Para diagnosticar el problema de heteroscedasticidad graficar los residuales versus valores predecidos, Y. Análogamente, para diagnosticar este problema de heteroscedasticidad se puede hacer aplicando las pruebas de White y de Breusch-Pagan. Para mitigar el problema de la falta de homoscedasticidad, esto se puede hacer por medio de transformaciones, como en el incio (5). También se puede hacer probando otros modelos que ajusten mejor los datos. Resumen de los modelos de regresión usados A. Modelo de regresión lineal simple (de primer orden), con una variable independiente y = βo + β1x1 + ε B. Modelo de regresión lineal múltiple, con dos variables independientes, sin interacción y = βo + β1x1 + β2 x2 + ε C. Modelo de regresión lineal múltiple, con dos variables independientes, con interacción y = βo + β1x1 + β2 x2 + β12 x1x2 + ε D. Modelo cuadrático, con una variable independiente y = βo + β1x1 + β2 x22 + ε
9-11
Dr. Héctor Quevedo Urías
F. Modelo cúbico, con una variable independiente y = βo + β1x1 + β2x22 + β3x33 + ε F. Modelo de segundo orden (cuadrático), con 2 variables independientes, sin interacción y = βo + β1x1 + β2 x2 + β11 x21 + β22 x22 + ε G. Modelo cuadrático con dos variables independientes con interacción y = βo + β1x1 + β2 x2 + β11 x21 + β22 x22 + β12 x1x2 + ε H. Modelo de segundo orden con 3 variables independientes, sin interacción y = βo + β1x1 + β2 x2 + β3 x3 + β11 x21 + β22 x22 + β33 x23 + ε I. Modelo cuadrático con 3 variables independientes con interacción y = βo + β1x1 + β2x2 + β3x3 + β11x21 + β22x22 + β33x23 + β12x1x2 + β13x1x3 + β23x2x3 + ε Ejemplo #1. En un artículo del J. Agricultural Eng. Research, 1975 (p. 353-361) se reportan los datos con el número de días después de la floración (x), el rendimiento de la cosecha, en Kg./ha (y). (Devore, 2001). La tabla de abajo muestra los datos. TABLA 9.1. Tabla mostrando los datos del problema. x | 16
18
20
22
24
26
28
30
32
34
36
38
40
42
44
46
y | 2508 2518 3304 3423 3507 3190 3500 3883 3823 3646 3708 3333 3517 3241 3103 2776
(Fuente: Devore, 2001) Hacer los siguientes cálculos: (a) Hacer una gráfica que vaya en función de (y) y de los días de floración (x). (b) Ajustar el modelo de regresión más apropiado. (c) Hacer una relación de los cálculos de los coeficientes de la desviación estándar y de una tabla de análisis de varianza. (d) Estimar el valor del coeficiente de determinación múltiple R2. (e) Hacer una prueba de hipótesis Ho:β2 = 0 versus H1:β2 ≠ 0. Hacer otra prueba más
9-12
Dr. Héctor Quevedo Urías
con Ho:β1 = 0 versus H1:β1 ≠ 0. Solución: (a) La gráfica de abajo indica que, una función polinomial cuadrática, con β < 0, sería la más apropiada.
Figura 9.2. Diagrama esparcido de los datos del rendimiento de la cosecha (y) y el número de días de floración (x). (Fuente: Devore, 2001). (b) La tabla de abajo muestra los resultados. (Elaboración propia) ___________________________________________________________________ Pronosticador Coeficiente Desviación estándar Valor de t Valor de p ___________________________________________________________________ Constante -1070.4 617.3 -1.73 0.107 β1 293.48 42.18 6.96 0.000 β2 -4.5358 0.6744 -6.73 0.000 SSE = 203.9 R2 = 0.794 R2ajustada = 0.762 ___________________________________________________________________ Los niveles críticos para una prueba bilateral, con un nivel significante de α = 0.05 son: -2.16 ≤ t[.025;13] ≤ 2.160 (c) Los resultados obtenidos de este inciso se muestran en la tabla de abajo.
9-13
Dr. Héctor Quevedo Urías
TABLA 9.0. Tabla de análisis de varianza. (Elaboración propia) _________________________________________________________________ Fuente de g.l. SS MS Fcalc. Valor de p Variación _________________________________________________________________ Debido a la 2 2,084,779 1,042,389 25.08 0.0000 regresión Error 13 540,388 41,568 ________________________________________________________________ Total 15 2,625,167 Conclusión: Debido a que Fcalc. = 25.08 >>> Fcrítica = 3.81, se rechaza la hipótesis nula Ho:β2 = 0 y, por lo tanto, se inclina por la hipótesis alternativa de H1:β2 ≠ 0. (d) La estimación del coeficiente de determinación es: R2 = 1 – SSerror/SStotal = 1 – 540,388/2,625,167 = 0.794 (e) Para la prueba de hipótesis nula Ho:β2 = 0 y la hipótesis alternativa H1:β2 ≠ 0, usamos los datos de arriba. Por ejemplo, β2 = -4.5358 y la desviación estándar es de sβ2 = 0.6744. La prueba de Ho:β2 = 0 es lo mismo que decir que el modelo polinomial cuadrático no aplica a los datos y, H1:β2 ≠ 0 dice que si aplica. La función de t usada es: t = β2 / sβ2
(9-8)
Sustituyendo los valores correspondientes nos da: t = -4.5358 / 0.6744 = -6.73 La prueba está basada en n - (k + 1) grados de libertad (ν), es decir, con n = 16 y k = 2. Por lo tanto, ν = 13. Las regiones críticas son: -2.160 ≤ t.025;13 ≤ 2.160. En conclusión, debido a que la tcalc. = -6.73 < tcrítica = -2.160, se rechaza la hipótesis nula 9-14
Dr. Héctor Quevedo Urías
de Ho:β2 = 0 y se inclina por la prueba de hipótesis alternativa de H1:β2 ≠ 0. No obstante, si se rechaza la hipótesis nula, se dice que el modelo cuadrático si encaja bien en los datos; de otra manera se acepta la hipótesis nula. Para hacer la prueba de hipótesis nula de Ho:β1 = 0 versus H1:β1 ≠ 0, se procede en forma similar. (f) Para las gráficas de los residuos estandarizados, en función de las observaciones, estas gráficas se pueden formular usando la información dada en la tabla de abajo. Prueba estadística para comparar la suma de los cuadrados del error (SSE) de cada modelo probado, para saber cual modelo es superior Los autores Keller et al. (1990) del libro Statistics for Management and Economics dan una prueba estadística que mide las diferencias de la suma de los cuadrados del error (SSE), para probar la superioridad de cada modelo probado. Esto se debe a que SSE mide, qué tan bien encajan los datos en el modelo. Esta prueba se hace comparando la suma de los cuadrados del error (SSE1) del modelo simple o abreviado y, la suma de los cuadrados del error (SSE2) del modelo completo o complejo. Esto se hace, porque siempre es conveniente usar modelos simples (el uso de modelos complejos no necesariamente los hace superiores). La prueba estadística para medir la relación entre SSE1 y SSE2 es:
Donde:
(SSE1 – SSE2)/(k2 – k1) F = ——————————— SSE2 / (n – k2 – 1)
(9-9)
F = distribución de Fisher, con ν1 = k2 – k1 y ν2 = n – k2 – 1 grados de libertad. Donde: n – k2 – 1 = número de grados de libertad asociados con el modelo completo. Donde: k2 = número de coeficientes (βi) probados del modelo completo k1 = número de coeficientes (βi) probados del modelo simple. n = tamaño de la muestra SSE1 = suma de los cuadrados del error del modelo simple probado 9-15
Dr. Héctor Quevedo Urías
SSE2 = suma de los cuadrados del modelo completo probado Nota: Si el ajuste del modelo completo no es significantemente mejor que el modelo simple o abreviado, el valor de SS1 será pequeño. Por ende, la relación SS1 – SS2 será pequeña y, por lo tanto, el valor de F será pequeño y no se podrá rechazar la hipótesis nula. Sin embargo, si el ajuste del modelo completo es bueno, el valor de SS2 será pequeño y la relación SS1 – SS2 será grande y, por consiguiente, el valor de F será grande y se rechazará la hipótesis nula. La región de rechazo para la ecuación de arriba (9-9) es dada por la siguiente función estadística: F > F[α;k2-k1,n-k2-1]
(9-9a)
Donde: F = el valor de la estadística F calculada α = nivel significante de 0.05 o 0.01 de la distribución de F k2 = número de coeficientes βi del modelo superior k1 = número de coeficientes βi del modelo abreviado n = tamaño de la muestra Ejemplo #2. El libro Statistics for Management and Economics de Keller et al. (1990) da un ejemplo, para determinar el modelo de regresión más apropiado. Para esto, se saca una muestra de 25 áreas (casos). Cada área consiste en, aproximadamente, 5,000 viviendas. Se registra la ganancia anual total de las ventas, el ingreso promedio anual de las viviendas y la edad promedio de los niños de este problema. Hacer los siguientes cálculos: (a) Probar un modelo de regresión cuadrático, con interacción. En este caso, lo llamaremos modelo superior o modelo completo. (b) Después, probar un modelo de regresión cuadrático, sin interacción. El este caso, lo llamaremos modelo abreviado. 9-16
Dr. Héctor Quevedo Urías
(c) Finalmente, probar un modelo de regresión lineal múltiple, sin interacción. Este modelo, lo llamaremos modelo lineal simple. (d) Describir las ecuaciones de los modelos de regresión poblacionales de los incisos (a), (b) y (c). (e) Para decidir cual modelo es mejor, hacer una tabla con los resultados de los tres modelos, basándose en los diagnósticos objetivistas como las estadísticas R2, R2ajustada, s, PRESS, ANOVA, etc. (f) Hacer una prueba de hipótesis para ver si el efecto de interacción es viable. Además, usar la ecuación 9-9, para seleccionar el modelo de regresión más apropiado.
9-17
Dr. Héctor Quevedo Urías
TABLA 9.2. Tabla mostrando los datos para este problema. Ingreso anual Ingreso promedio Edad promedio de ventas anual de los niños ___________________________________________________________________ Área (y) (x1) (x2) 1 1,128 23.5 10.5 2 1,005 17.6 7.2 3 1,212 26.3 7.6 4 893 16.5 5.9 5 1,073 22.3 6.6 6 1,179 26.1 6.3 7 1,109 24.3 12.1 8 1,019 20.9 14.9 9 1,228 27.1 8.9 10 812 15.6 3.4 11 1,193 25.7 10.6 12 983 30.5 6.0 13 1,281 26.5 8.6 14 1,156 25.7 11.6 15 1,032 21.8 13.7 16 856 33.6 5.8 17 978 17.9 10.3 18 1,017 18.3 5.3 19 1,091 30.1 6.3 20 1,048 29.8 5.3 21 1,192 28.5 10.4 22 1,256 27.5 8.7 23 1,215 26.8 9.5 24 1,233 24.3 8.3 25 950 17.8 6.1 __________________________________________________________________ (Fuente: Statistics for Management and Economics de Keller et al., 1990) Solución:
9-18
Dr. Héctor Quevedo Urías
Figura 9.3. Figura mostrando los resultados usando el programa Minitab de los tres modelos probados. (Elaboración propia) (a) Primero, se prueba el modelo de regresión polinomial cuadrático, con interacción, es decir, el modelo completo. The Regression Equation is: (y) = -1135 + 173(X1) + 23.6(X2) – 3.73(X21) – 3.8(X22) + 1.97(X1X2) Predictor Constant (X1) (X2) (X1SQR) (X2SQR) (X1X2)
Coef -1134.7 173.24 23.62 -3.7270 -3.8720 1.9671
SE Coef 319.8 28.19 32.21 0.5420 1.1790 0.9424
T -3.55 6.15 0.73 -6.88 -3.28 2.09
p 0.002 0.000 0.472 0.000 0.004 0.051
s = 44.68 R-Sq = 90.7% R-Sq(adj) = 88.2% PRESS = 72380.6 R-Sq(pred) = 82.18% Analysis of Variance Table Source Due to regression Residual Error Total
DF 5 19 24
SS 368162 37934 406096
MS 73632 1097
F 36.88
p 0.000
Nota: Aquí, la región crítica de F, con α = 0.05 y con 5 y 19 grados de libertad, es 2.74. (b) Enseguida se prueba el modelo de regresión cuadrático, sin interacción, es decir, el modelo abreviado. El programa Minitab arroja los siguientes resultados: The Regression Equation is: (y) = -1558 + 198(X1) + 70.8(X2) – 3.98(X21) – 4.12(X22) Predictor Constant (X1) (X2) (X1SQR) (X2SQR) s = 48.29 PRESS = 78054
Coef -1558.30 198.07 70.76 -3.997 -4.117 R-Sq = 88.5% R-Sq(pred) = 80.78%
SE Coef 267.1 27.62 24.83 0.5709 1.268
T -5.83 7.17 2.85 -6.97 -3.25
R-Sq(adj) = 86.2%
9-19
p 0.000 0.000 0.010 0.000 0.004
Dr. Héctor Quevedo Urías
Analysis of Variance Table Source Due to Regression Residual Error Total
DF 4 20 24
SS 359463 46633 406096
MS 89866 2832
F 38.54
p 0.000
(c) Finalmente, se prueba el modelo de regresión lineal sin interacción, es decir, el modelo simple. El programa Minitab arroja los siguientes resultados: The Regression Equation is: (y) = 668 + 11.4(X1) + 16.8(X2) Predictor Constant (X1) (X2) s = 111.6 PRESS = 392674
Coef 667.8 11.425 16.829
SE Coef 132.2 4.676 7.988
T 5.05 2.44 2.11
p 0.000 0.023 0.047
R-Sq = 32.6% R-Sq(adj) = 26.4% R-Sq(pred) = 3.31%
Analysis of Variance Source Due to regression Residual Error Total
DF 2 22 24
SS 132253 273844 406096
MS 66126 12447
F 5.31
p 0.013
Nota: Para probar que los coeficientes son iguales, en cuanto al análisis de varianza, la función de ANOVA prueba la longitud total de la utilidad del modelo. (d) La descripción de los tres modelos poblacionales, a estimarse, por los modelos de regresión estadística son: 1. El modelo cuadrático con interacción o completo es: y = βo + β1x1 + β2 x2 + β3 x21 + β4 x22 + β5 x1x2 + ε 2. El modelo cuadrático sin interacción o abreviado es: y = βo + β1x1 + β2 x2 + β3 x21 + β4 x22 + ε 3. El modelo de regresión lineal múltiple es: y = βo + β1x1 + β2 x2 + ε
9-20
Dr. Héctor Quevedo Urías
(e) El resumen de los resultados de los tres modelos se da en la tabla de abajo. TABLA 9.3. Tabla mostrando los resultados de las estadísticas de los tres modelos de regresión probados. (Elaboración propia) R2
s
PRESS
R2(ajustada)
Modelo completo
90.7%
44.7
72,380.6
88.2%
Modelo abreviado
88.5%
48.3
78,054.0
86.2%
Modelo lineal simple
32.6%
111.6
392,674.0
26.4%
Tipo de modelo
Al juzgar por los resultados, tal parece que los mejores modelos candidatos son el modelo completo y el abreviado. (Para hacer una decision final usar la función (9-9). (f) Ahora se va a inquirir si existe suficiente evidencia, para concluir que, el modelo cuadrático, con interacción, es el modelo óptimo. Esto se debe a qué, si a los modelos de regresión se les agregan variables innecesarias, que pudieran dar un mejoramiento pequeño, no es recomendable. Bajo estas condiciones, la adición de variables innecesarias conlleva a problemas de colinealidad (correlación entre las variables regresoras). Por esta razón, es conveniente dejar el modelo de regresión, lo más simple posible, a menos de que existan buenas razones estadísticas para agregarle variables adicionales. Una manera de revisar, si el efecto de interacción es necesario, se prueba β5 (el coeficiente de interacción) haciendo una prueba de hipótesis, como sigue: La prueba de hipótesis nula es: Ho:β5 = 0 La prueba de hipótesis alternativa es: H1:β5 ≠ 0 Con un nivel significante de α = 0.05, la región de rechazo es: |t| > tα/2;n-k-1; > t0.05/2;25-6-1; > t.025;19; > 2.093 De la Figura 9.3, en la columna de las pruebas de t, se ve que, para el efecto de 9-21
Dr. Héctor Quevedo Urías
interacción de (x1x2) el valor de T es igual a 2.09 con p = .051. Por consiguiente, debido a que T = 2.09 es menor que la T crítica de 2.093, esto indica que, la inclusión del término de interacción β5x1x2 no mejora al modelo completo, es decir, al incluir el factor de interacción. Esta decisión nos lleva al modelo cuadrático, sin interacción, como el mejor modelo para este problema. Otra forma de comprobar lo mismo que arriba, se puede hacer usando la ecuación (9-9). Esta estadística dada por Keller et al. (1990) está relacionada con la suma de los cuadrados SS, la cual mide, qué tan bien encajan los datos en el modelo. Como se dijo antes, este procedimiento consiste en comparar la suma de los cuadrados SS1 del modelo abreviado y SS2 del modelo completo. Por ejemplo, si SS2 es significativamente más pequeña que SS1, se concluye que el modelo completo es superior al modelo abreviado; de otra manera, se concluiría que, el modelo completo no sería, realmente, superior. Para tales fines se usa la estadística (9-9) y se procede a sustituir los siguientes valores sacados de la Figura 9.3 es decir, SS1 = 46633, SS2 = 37934, k2 = 5, k1 = 4, n = 25. La prueba de hipótesis nula es: Ho:β3 = β4 = β5 = 0. La prueba de hipótesis alternativa es que los coeficientes de regresión no son igual a 0 o, cuando menos, uno de los coeficientes β3, β4 y β5 no es igual a 0. Si el modelo completo (con interacción en este caso) es mejor que el abreviado (sin interacción en esta instancia), el valor de SSE2 será más pequeño que SSE1, el valor de F será grande, y se rechazará Ho:, y se concluirá que si hay evidencia para afirmar que el modelo completo, con interacción, es mejor que el modelo sin interacción. Sin embargo, si el modelo completo no es significantemente mejor que el modelo abreviado, entonces, la relación SSE1 – SSE2, será, aproximadamente, igual a cero. Por consiguiente, el valor de F será pequeño y no se rechazará la hipótesis nula Ho: Bajo estas condiciones se concluirá que, el modelo abreviado (sin interacción), es mejor. 9-22
Dr. Héctor Quevedo Urías
La región crítica, con α = 0.05, es usando la distribución F. F > F[α(k2-k1),(n-k2-1)] > F[0.05(1),(19)] > 4.38 Ahora usando la ecuación (9-9) y sustituyendo los valores da: (46,633 – 37,934)/(5 – 4) F = ——————————— = 4.35 37,934/(25 – 5 – 1) En conclusión, debido a que la Fcalc. = 4.35 < Fcrítica = 4.38, se dice que no hay evidencia para afirmar que el modelo de regresión con interacción es superior al modelo abreviado. Ejemplo #3. El desarrollo de microorganismos sigue a un crecimiento exponencial matemático. Para esto decidió usar un modelo cúbico, donde Y es el conteo de microorganismos y X es el número de horas que han pasado. Usar el programa Minitab para tales propósitos. Solución: La ecuación es:
Y = -8.10 + 12.7X – 0.905(X 2) + 2.14(X 3)
s = 41.845 R2 = 0.998 R2(ajustada) = 99.8% TABLA 9.4. Tabla de análisis de varianza. (Elaboración propia) Fuente de variación
g.l.
SS
MS
Fcalc.
Debido a la regresión
3
12,331,818
4,110,606
1370202
Residuo (error)
13
22,760
1,751
Total
16
12,354,578
9-23
Dr. Héctor Quevedo Urías
Modelos de regresión no lineales y de regresión logística Dentro de esta categoría, hay modelos de regresión exponencial y modelos de regresión logística. El modelo de regresión exponencial se usa en estudios relacionados con el crecimiento de algún proceso, donde la tasa de crecimiento, a un tiempo X dado, es proporcional a la cantidad de crecimiento que queda, a medida que el tiempo se incrementa. Otro uso es el estudio de la relación entre la concentración de una sustancia (y), en función del tiempo transcurrido (X). En forma análoga, los modelos de regresión logística se usan en estudios poblacionales, para relacionar el número de especies (Y) en función del tiempo (X). Estos modelos también se pueden usar cuando la variable dependiente es cualitativa; sin embargo, estos modelos no se discutirán en este texto, como en el caso de los modelos exponenciales. Modelos de regresión exponenciales paramétricos, con una sola variable independiente (Neter et al. 1996) Yi = γo exp(γ1Xi) + εi
(9-10)
Un modelo más generalizado de regresión exponencial no lineal es: Yi = γo + γ1 exp(γ2Xi) + εi
(9-11)
Donde: Yi es la función de respuesta o variable dependiente γo, γ1, γ2 = los parámetros a estimarse por a, b y c Xi = variables constantes εi = error o residuo normalmente distribuido y con varianza constante El correspondiente estimador estadístico es: y = a + b exp(-cx) + ei Donde: a, b, c = estimadores estadísticos de γo,γ1 y γ2, respectivamente ei = el error o residual estadístico. 9-24
(9-12)
Dr. Héctor Quevedo Urías
Los modelos exponenciales se usan en ejemplos de crecimiento que va en función del tiempo (como el crecimiento de bacterias en un plato de agar, o para describir el crecimiento exponencial de los gases de invernadero como el CO2, en función del tiempo, que están ocasionando el calentamiento global y la corrupción del clima del planeta). Con relación a los modelos de regresión logísticos, la función poblacional que describe estos modelos se da como (Neter et al. 1996):
Donde:
γo Yi = ———————— + ε 1 + γ1 exp(γ2Xi)
(9-13)
Yi = función de respuesta γo = parámetro a estimarse por sus estadística correspondiente γ1 = parámetro a estimarse por su estadística γ2 = parámetro a estimarse por sus estadística La evaluación y estimación de los parámetros de regresión no lineal se hacen igual que con la regresión lineal. Por ejemplo, para el diagnóstico subjetivo, se analizan las gráficas para la prueba de normalidad, los gráficos de los residuos en función del tiempo, y también en función de los valores ajustados, etc. Sin embargo, en la interpretación de las gráficas de los residuales de la regresión no lineal hay que recordar que, los residuales, no necesariamente, suman a cero. También, se pueden hacer transformaciones de las variables para hacer un mejor ajuste del modelo superior. En cuanto a las inferencias estadísticas, con la regresión no lineal, se basan en la teoría de muestreo grande, esto es, con tamaños de muestras grandes. Las funciones de modelos de regresión exponencial, también se pueden tratar dentro del
9-25
Dr. Héctor Quevedo Urías
tópico de series de tiempo. Ejemplo #4. Este es un problema sacado del libro Statistics for Management and Economics de Keller (1990), Warrack y Bartel relacionado con el ajustamiento y análisis de modelos de regresión no lineales relacionado con datos estadísticos del SIDA en los Estados Unidos de Norteamérica, en función del tiempo. Nota: Independientemente de los datos dados por el autor de este problema, a juicio del del autor de este libro de estadística, el nombre médico convencional del acrónimo SIDA (AIDS en las siglas del inglés, es decir, acquired inmunodeficiency síndrome) está diciendo que el llamado SIDA es una enfermedad o una deficiencia, en particular, del sistema inmune del cuerpo. Esto no es posible, porque el sistema inmunológico del cuerpo es una parte dependiene de todo el organismo, como unidad independiente. Si este término “SIDA” fuera correcto, entonces, se tendría que decir que el sistema inmune del cuerpo es una parte independiente del resto del organismo, y no una parte dependiente de todo el cuerpo como unidad independiente. En términos más simples, esto significa qué, el organismo humano está compuesto por órganos, partes o sistemas contingentes, cuya función, en turno, depende de todo el cuerpo entero, como unidad independiente, es decir, cuando el organismo está en un estado de salud perfecto. De acuerdo a este razonamiento, el llamado SIDA es un síntoma de enfermedad (pero no de una enfermedad en particular), que acusa que todo el cuerpo está enfermo (toda la unidad orgánica distorsionada por vida antinatural), no únicamente, el sistema inmunológico, como comúnmente se cree. De manera qué, para curar los síntomas de este mal, es necesario curar todo el complejo orgánico, a través de artes médicas naturales. La lógica siempre aconsejará qué, para curar un efecto (síntomas del SIDA), primero hay que atender el origen causal más recóndito, que no es otra cosa más que la vida no natural. Al proceder de otra manera, siempre habrá complicaciones que agravarán el problema del enfermo. 9-26
Dr. Héctor Quevedo Urías
TABLA 9.5. Tabla mostrando los datos de este problema. Años Periodo de tiempo t Número de casos de SIDA _________________________________________________________________ 1981 1 1,000 1982 2 6,000 1983 3 10,000 1984 4 14,000 1985 5 25,000 1986 6 48,000 1987 7 63,000 1988 8 108,000 1989 9 161,000 _________________________________________________________________ (Fuente: Keller et al., 1990) Hacer los siguientes cálculos: (a) Hacer una gráfica con los datos y obtener la ecuación de regresión del modelo apropiado. Poner la ecuación sobre la gráfica. (b) Predecir el número de casos de SIDA para el año 2000 (t = 20). Solución: (a) Usando el programa Minitab con una función de regresión estadística de series de tiempo y análisis de tendencia (trend analysis), da la gráfica y la ecuación señalada abajo.
9-27
Dr. Héctor Quevedo Urías
Figura 9.4. Gráfica mostrando los casos de SIDA, en función del tiempo de este problema. (Elaboración propia) (b) Cuando t = 20 (año 2000), el número de casos de SIDA sería: y = (1290.84)(1.75974) 20 = 104,674,894.9
9-28
Dr. Héctor Quevedo Urías
Ajustamiento de curvas En el ajustamiento de curvas, para seleccionar el modelo que mejor encaja en los datos se dan abajo varios tipos de curvas. Estas funciones ayudan a seleccionar la forma más apropiada para los datos. Estos tipos de curvas son sugeridos por el programa de computadora NCSS.
Figura 9.5. Gráficas mostrando los diferentes tipos de funciones usados en los ajustes de curvas, para seleccionar el mejor modelo de regresión que pueda encajar en los datos.
9-29
Dr. Héctor Quevedo Urías
Figura 9.6. Gráficas mostrando los diferentes tipos de curvas usados en el ajustamiento de modelos de regresión más apropiados.
9-30
Dr. Héctor Quevedo Urías
Procedimientos para la Identificación de valores atípicos extremos. Diagnóstico y mitigación de multicolinealidad Los procedimientos para refinar el modelo de regresión son la identificación y eliminación de valores inusuales extremos. En algunas ocasiones, estos valores extremos se encuentran en la generación de datos muestrales. Estos valores extremos se refieren a datos univariados que son inconsistentes con el resto de la información. Los valores extremos ocurren a menudo debido a errores de medición, ya sea por mal funcionamiento del equipo o por negligencia del personal, falta de mantenimiento de los instrumentos, etc. En regresión múltiple, los valores extremos pueden ocurrir con las variables independientes y con la variable dependiente. Estos valores, una vez analizados se pueden eliminar o retener, si se sabe que son, en realidad, valores extremos. Siendo así, es necesario eliminarlos, porque pueden distorsionar el modelo de regresión ajustado o causar serios errores en los cálculos de regresión. La identificación de valores extremos se puede hacer de las siguientes maneras: 1. Usando gráficas de tallo y hoja. 2. Usando gráficas de caja. 3. Usando gráficos de probabilidad normal. 4. Usando la estadística DFITS que identifica valores extremos potenciales, cuando DFITS > 2 p / n , donde p es el número de variables independientes y, n, es el tamaño de la muestra. 5. Usando gráficos de residuos semiestudentizados, los cuales identifican los valores extremos, cuando los valores absolutos de los residuales semiestudentizados son ≥ 4. 6. Usando DFBETAS cuando estos valores son ≥ ±2/ n . 7. Usando los gráficos de Rstudent vs. Hat Diagonal. 8. Usando regresión robusta (robust regression) recomendados por la lógica del
9-31
Dr. Héctor Quevedo Urías
programa NCSS. 9. También se puede hacer usando el valor crítico de Bonferroni, que identifica los valores absolutos de los residuales estudentizados. Esta prueba citada por Neter et al. (1996) se da como t(1 – α/2n;n – p – 1). 10. También se hace con la estadística Cook´s Distance (lógica del programa NCSS), la cual dice que, si ésta es mayor que F(.50,p,n-p), donde F es un valor de la distribución F, entonces, esto sugiere un valor extremo. 11. Los valores extremos también se pueden identificar con los gráficos de los residuos que van en función de X o de Y. Diagnóstico de multicolinealidad En regresión múltiple hay lo que se llama colinealidad, multicolinealidad o intercorrelación. Esta situación existe cuando las variables independientes están correlacionadas entre si. Lo ideal en regresión múltiple es de que las variables independientes x1, x2,…, xkn no estén correlacionadas, de tal manera que, cada una explique un porcentaje separado de la variación en la variable dependiente. El mal efecto de multicolinealidad es que las desviaciones estándar de los coeficientes del modelo de regresión están sobreestimadas. Como resultado de esto, cuando se hacen las pruebas de hipótesis, la estadística t es más pequeña de lo que debería ser. Además, algunas variables independientes o exógenas aparecen como si no estuvieran relacionadas linealmente con la variable Y, cuando en realidad si lo están. Existen dos métodos para descubrir la multicolinealidad, es decir, métodos informales y métodos formales. Los métodos informales para detectar colinealidad severa son: 1. Estudios de los signos algebraicos de los coeficientes del modelo de regresión. Si hay colinealidad, los signos algebraicos de los coeficientes son opuestos, a lo que se debería esperar de consideraciones teóricas o de experiencia a posteriori. 9-32
Dr. Héctor Quevedo Urías
2. Otra situación que pudiera indicar multicolinealidad es el hecho de que ocurren grandes cambios en los coeficientes estimados de regresión, cuando una variable explicativa o independiente se agrega o se elimina. 3. Cuando se hacen pruebas de hipótesis de Ho:β´s = 0, las pruebas de t no son significantes. Esta condición también pudiera indicar colinealidad. 4. Cuando hay grandes correlaciones entre pares de variables independientes, esta situación también indica multicolinealidad. 5. Con la lógica del modelo de computadora NCSS, con números de los Eigenvalues mayores que 1000, esta condición indica colinealidad severa. Sin embargo, con valores de Eigenvalues entre 100 y 1000, esta condición implica colinealidad moderada a fuerte. 6. Nuevamente, con la lógica del programa NCSS, en la sección de correlación de matrices, grandes correlaciones entre las variables explicativas conllevan diagnósticos de colinealidad. 7. Los valores extremos, también pueden causar problemas de colinealidad. Por otra parte, los métodos formales para detectar multicolinealidad son los factores de inflación de varianza (Variance Inflation Factors, VIF). En este contexto, el problema de multicolinealidad se considera severo, cuando el máximo valor de VIP es mayor que 10 o bien, cuando el promedio de los VIF´s es considerablemente > 1. (Pfaffenberger, 1987). En cuanto a situaciones relacionadas con la multicolinealidad se enlistan los siguientes postulados: 1. Si el modelo se va a usar, únicamente, para estimar respuestas promedio o para hacer predicciones de los valores de la variable dependiente Y, y las predicciones son
9-33
Dr. Héctor Quevedo Urías
hechas, solamente, sobre las región de los valores de las variables independientes y, los coeficientes de regresión estimados no se usarán para propósitos de interpretación, concerniendo las relaciones de las variables explicativas (X´s) y de la variable de respuesta (Y), entonces, la multicolinealidad, aun cuando sea severa, no será un problema (Pfaffenberger, 1987). Aquí, sin embargo, la determinación de la región muestreada es difícil. Por ejemplo, si hay una variable independiente, entonces, la región es un intervalo sobre la línea real entre el valor mínimo de x y el valor máximo de x en la muestra. Además, con cuatro variables independientes, la región muestreada es en el espacio de cuatro dimensiones de las x´s y sus linderos no son obvios. Por lo tanto, bajo estas condiciones, hay que ejercer precaución, de tal manera que, la predicción no represente una extrapolación más allá de la región muestreada de las x´s, cuando existe multicolinealidad severa.
Por otra parte, si se desea hacer
interpretaciones de los coeficientes de correlación (bi), entonces la multicolinealidad no se puede tolerar. 2. El hecho de que algunos o todas las variables independientes estén correlacionadas entre si, en general, no obstruye la habilidad para obtener un buen ajuste de los datos. Esta situación tampoco interfiere en las inferencias acerca de las respuestas promedio de predicciones de nuevas observaciones, siempre y cuando, estas inferencias sean hechas dentro de la región de las observaciones. 3. Cuando las variables independientes están altamente correlacionadas, los coeficientes de regresión estimados tienden a tener una gran variación de muestreo. Por lo tanto, bajo estas condiciones, los coeficientes de regresión tienden a variar ampliamente de una muestra a otra. Como resultado de esto, solamente, se obtiene información imprecisa acerca de los coeficientes individuales. 4. Cuando hay multicolinealidad, la interpretación de un coeficiente de regresión,
9-34
Dr. Héctor Quevedo Urías
como medida de un cambio en el valor esperado en Y, cuando una variable independiente, digamos X1 se incrementa por una unidad, manteniendo constantes las demás variables, no es totalmente aplicable. 5. Otros efectos causados por la multicolinealidad están relacionados con la suma de los cuadrados, los efectos en los coeficientes de determinación parcial, efectos en el error estándar de lo estimado s, efectos sobre los valores ajustados, efectos en las pruebas simultáneas de los coeficientes β´s, etc. (Neter et al. 1996). Medidas para corregir multicolinealidad severa 1. El método más obvio para remediar la multicolinealidad es el de no incluir en el modelo las variables independientes que están altamente correlacionadas. Esto se hace para reducir los errores estándar de los coeficientes de regresión estimados de las variables independientes que queden en el modelo. Sin embargo, este remedio tiene dos limitaciones porque, de esta manera, ya no habrá información directa de la variable independiente excluida. En segundo lugar, las magnitudes de los coeficientes de regresión, para los coeficientes restantes son afectadas por las variables independientes correlacionadas, que no se incluyan en el modelo. 2. Otro método para corregir la multicolinealidad se refiere como regresión de cima (ridge regression). Siendo así, cuando hay multicolinealidad, los estimados de los cuadrados mínimos son imparciales, pero sus varianzas son grandes, de tal manera que puedan estar alejados del valor verdadero. Agregando un grado de parcialidad a los estimados de la regresión, la regresión de cima (o ridge regression) reduce los errores estándares, de tal manera que el efecto neto dará coeficientes estimadores más confiables (Neter et al. 1996). 3. Otro método para reducir la multicolinealidad severa es la regresión por pasos. La regresión por pasos incluye, solamente, las variables independientes que están
9-35
Dr. Héctor Quevedo Urías
significantemente relacionadas linealmente, con la variable dependiente. Esto tiende a reducir la colinealidad porque, si hay dos variables independientes, altamente correlacionadas entre si, al incluir una, usualmente se elimina la segunda. En el mecanismo, en la regresión por pasos, una variable independiente, a un tiempo, es incluida en la ecuación. En el paso 1, la variable independiente, más fuertemente relacionada con la variable dependiente, es incluida en el modelo. En el paso 2, la siguiente variable independiente (entre las variables independientes restantes) más fuertemente relacionada con la variable dependiente, se incluyen en el modelo. Esta situación continúa hasta qué, solamente, las variables independientes, que no están relacionadas con la variable dependiente (dado que las otras variables ya están en el modelo) permanecen fuera de la ecuación. De cualquier manera, para evitar problemas, la regresión por pasos debe usarse en conjunción con un profundo razonamiento estadístico. La pregunta de cuantas variables independientes (incluyendo las variables transformadas) deben de incluirse en el modelo de regresión es el tema a tratar, cuando se habla de los procedimientos usados en el programa Minitab, como “Todas las Regresiones Posibles” (All Possible Regressions), “Regresión por Pasos” (Stepwise Regression) y “Regresión de los Mejores Conjuntos” (Best Subset Regression). Para encontrar el número ideal de variables independientes, esto involucra dos objetivos opuestos. Primero se desea que el modelo de regresión sea lo más completo y realista posible. Esto dice que se debe incluir cada variable independiente, aunque parezca remotamente relacionada con la variable dependiente. En segundo término, se debe de incluir lo menos posible de variables independientes. Esto se debe a que, cada variable independiente, que no sea relevante al modelo, disminuye la precisión
9-36
Dr. Héctor Quevedo Urías
de los coeficientes calculados y de los valores pronosticados. De esta manera, la finalidad de la selección de las variables es parsimoniosa, esto quiere decir que debe haber un balance entre lo simple (lo menos posible de variables) y el ajuste (la inclusión de todas las variables que sean pertinentes). Hay diferentes estrategias para la selección de las variables más apropiadas para el modelo de regresión. Por ejemplo el modelo NCSS recomienda que, si no hay más de quince candidatos de variables independientes (sin incluir el intercepto), entonces, se debe usar el procedimiento de “Todas las Regresiones Posibles” (All Possible Regressions). Esto se debe a que este procedimiento dará modelos tan buenos o mejores que el procedimiento de “Regresión por Pasos”. Sin embargo, si hay más de quince candidatos de variables, entonces, se recomienda el procedimiento de “Regresión por Pasos” (Stepwise Regression). Otra función dada por el programa Minitab está relacionada con la “Regresión de Mejores Conjuntos” (Best Subsets Regression). Después de que se haya formado un conjunto de candidatos de variables independientes (una vez que se eliminaron las observaciones extremas y se mitigó la multicolinealidad), la siguiente tarea es la de establecer una base para comparar dos modelos finalistas. ¿Cómo se puede decir, si el modelo A es mejor que el modelo B? Para hacer esta decisión crítica el consenso de investigadores de estadística está basado en las funciones estadísticas citadas anteriormente, como R2, s, PRESS, etc. Como ya se explicó anteriormente, estas funciones son: (a) El coeficiente de determinación R2 (b) El error estándar estimado s (c) El criterio Cp de Mallow (d) PRESS Otros criterios son los valores de t, tablas de ANOVA, análisis de gráficos, etc., pero 9-37
Dr. Héctor Quevedo Urías
los penúltimos cuatro diagnósticos son los más populares. Ejemplos de problemas de regresión polinomial usando el programa de computadora Minitab Ejemplo #15. Este problema está relacionado con un experimento del consumo de gasolina usando la velocidad baja (overdrive) de una camioneta liviana. Aquí la variable independiente es la velocidad constante dada, en millas por hora (X). Además, la variable dependiente (Y), está relacionada con las millas por galón obtenidas bajo estas condiciones de manejo. Hacer los siguientes cálculos: (a) Graficar los datos. (b) Ajustar un modelo cuadrático. (c) Ajustar un modelo cúbico. (d) Complementar el diagnóstico del inciso (d) con los análisis de los gráficos subjetivos para el modelo superior. (f) De acuerdo a los análisis de los criterios objetivitas y subjetivistas, decidir cual de los dos modelos es superior.
TABLA 9.6. Tabla mostrando los valores originales y los valores del cuadrado y del cubo de los valores de X. (Elaboración propia) Nota: para hacer esta tabla cuadrar y cubicar los valores de X antes de ponerlos en las columnas. Después de esto, se corre el programa como si fuera una regresión lineal. 9-38
Dr. Héctor Quevedo Urías
Solución: (a) La figura de abajo muestra la gráfica de los datos.
Grafica mostrando la relacion entre el tipo de manejo y el consumo de gasolina
Millas por galon (y)
40
30
20 40
50
60
Velocidad constante (x)
Figura 9.7. Figura mostrando el rendimiento de gasolina en función del tipo de manejo. (Elaboración propia) (b) Los resultados asumiendo un modelo cuadrático son: y = -183 + 8.98(X) – 0.0911(X2) Con s = 1.727, R2 = 0.947, PRESS = 49.26 TABLA 9.7. Tabla de ANOVA para el ajuste de un modelo cuadrático. (Elaboración propia) Fuente de variación
g.l.
SS
MS
Fcalc.
Valor p
Debido a la regresión
2
483.17
241.58
81.0
0.000
Error o residual
9
26.83
2.98
11
510.00
Total
9-39
Dr. Héctor Quevedo Urías
TABLA 9.8. Tabla mostrando los coeficientes, los errores estándares de los coeficientes, los valores de t y de p para el modelo cuadrático. (Elaboración propia) Predictores
Coeficientes
Constante X1 XSQR
Error estándar de coeficientes 17.68 0.76 0.008
-182.58 8.98 -0.09
Valor t
Valor p
-10.33 11.80 -11.39
0.000 0.000 0.000
(c) La ecuación de un modelo de regresión cúbico ajustado es: y = -74 + 1.85(X) + 1.85 + 0.062(X 2) – 0.001(X 3) Los diagnósticos estadísticos son: R2 = 0.952, s = 1.75, PRESS = 59.22 TABLA 9.9. Tabla de para el modelo cúbico. (Elaboración propia) Fuente de variación
g.l.
SS
MS
Fcalc.
Valor de p
3
485.50
161.83
52.85
0.000
Debido a la regresión Error o residual Total
8
24.50
11
510.00
3.06
TABLA 9.10. Tabla mostrando los coeficientes, los errores estándares de los coeficientes, los valores de t y de p para el modelo cúbico. (Elaboración propia) Predictores Coeficientes Error estándar Valor t Valor p de coeficientes Constante -73.9 125.7 -0.59 0.57 X1 1.85 8.2 0.23 0.83 XSQR 0.06 17.5 0.35 0.73 XCUBE -0.001 0.001 -0.87 0.41 La figura de abajo muestra los residuos estandarizados en función del orden de la observación para el modelo de regresión cuadrático
9-40
Dr. Héctor Quevedo Urías
Residuals Versus the Order of the Data (response is Millas p)
Standardized Residual
1
0
-1
-2 2
4
6
8
10
12
Observation Order
Figura 9.8. Residuos estandarizados en función del orden de la observación para el modelo de regresión cuadrático. Aquí, nótese que existen aproximadamente, el mismo número de residuos positivos y negativos. En contraste, la gráfica del modelo cúbico (que no se muestra aquí), no muestra el mismo número de residuos positivos y negativos. (Elaboración propia) Residuals Versus the Fitted Values (response is Millas p)
Standardized Residual
1
0
-1
-2 20
30
40
Fitted Value
Figura 9.9. Gráfica de los residuos estandarizados versus los valores ajustados de Y para el modelo cúbico. Nótese que, en esta gráfica hay el mismo número de valores positivos y negativos. En contraste, el modelo cúbico ajustado (no mostrado aquí) no muestra el mismo número de residuos positivos y negativos. (Elaboración propia).
9-41
Dr. Héctor Quevedo Urías
Normal Probability Plot of the Residuals (response is Millas p) 2
Normal Score
1
0
-1
-2 -2
-1
0
1
Standardized Residual
Figura 9.10. Gráfica mostrando la prueba de normalidad para el modelo cuadrático. (Elaboración propia). (d) De acuerdo a los datos tabulados de abajo, y de los diagnósticos gráficos, tal parece que el mejor modelo es el modelo cuadrático. Esto se debe a que, a pesar de que los valores de R2 y s de los dos modelos son parecidos, los valores de PRESS difieren uno del otro. Además, los valores de t del modelo cuadrático son muy significantes en comparación con los del modelo cúbico (TABLAS 9.8 y 9.10). También la Figura 9.7 de Y versus X sugiere a una función cuadrática; no cúbica. Finalmente, los análisis de los gráficos de los residuales para la función cuadrática son más convincentes que los del modelo cúbico. TABLA 9.11. Tabla mostrando los datos del problema. __________________________________________________________________ Diagnósticos estadísticos _________________________________________ Clase de Modelo R2 s PRESS __________________________________________________________________ Modelo cuadrático 0.947 1.727 49.26 __________________________________________________________________ Modelo cúbico 0.952 1.750 59.22 9-42
Dr. Héctor Quevedo Urías
Ejemplo #16. Se obtiene una muestra aleatoria de 25 mediciones de partículas atmosféricas (en micras). Se desea saber si hay valores inusuales extremos o moderados. Usar un diagrama de caja. Tabla 9.14. Tabla mostrando los datos (Elaboración propia) 5 8 14 74 85 88 90 92 92 93 94 94 95 95 96 96 96 97 97 98 99 101 104 106 114
Solución: Antes de comenzar, vamos a tomar en cuenta la definición que dice como calcular el cuarto inferior y el cuarto superior de un diagrama de caja. Esta definición dice que, una vez que se ordenan los datos en forma ascendente, el cuarto inferior y el cuarto superior se definen como: Cuarto = Mediana de los mínimos n/2 casos, cuando n es par inferior Mediana de los mínimos (n + 1)/2 casos, cuando n es impar Cuarto = Mediana de los máximos n/2 casos, cuando n es par superior Mediana de los máximos (n + 1)/2 casos, cuando n es impar El investigador Devore (2001) enlista los valores atípicos usando un diagrama de caja. Estos datos son: El valor mínimo y el valor máximo, el cuarto inferior y el cuarto superior, la mediana, la cuarta dispersión fs (la cual es la diferencia entre el cuarto superior y el cuarto inferior). Además, para identificar la presencia de valores inusuales moderados y extremos se dice que, toda observación mayor que 1.5fs, del cuarto más cercano, es un valor inusual. Análogamente, si 3fs es mayor que el cuarto más cercano, entonces, el valor inusual es extremo. Los cálculos para este problema son:
9-43
Dr. Héctor Quevedo Urías
X = 95.0, n = 25, valor mínimo = 5.0, valor máximo = 114.0, X = 84.92, s = 29.55,
error estándar del promedio = 5.91, Q1 = 89.0, Q3 = 97.5 Cuarto inferior para observaciones impares = mediana de los mínimos (25 + 1)/2 = 13 Cuarta dispersión fs = cuarto superior – cuarto inferior = 97 - 90 = 7 Además, 1.5fs = (1.5)(7) = 10.5 y 3fs = (3)(7) = 21 Para estimar los valores atípicos inusuales, el criterio es: cualquier observación menor que el cuarto inferior, menos 1.5fs o mayor que el cuarto superior más 1.5fs es un valor atípico inusual. Esto es: 90 – 10.5 = 79.5 y 97 + 10.5 = 107.5 Analizando los datos de la TABLA 9.14, se ve que hay un valor atípico (114) mayor en el extremo superior de la muestra. Además hay cuatro valores, de este tipo (5, 8, 14, 74), en el extremo inferior. Para identificar los valores extremos se calcula la diferencia entre el cuarto inferior y 3fs, es decir, 90 – 21 = 69. Refiriéndose a la TABLA 9.14 y la Figura 9.11, vemos que las tres observaciones 5, 8 y 14 son valores extremos (que se eliminarán) y los valores 85 y 114 son valores atípicos moderados. Boxplot of C1
0
50
100
C1
Figura 9.11. Diagrama de caja con los 3 valores atípicos extremos (5, 8, 14) y los valores atípicos moderados (85, 114). (Elaboración propia) 9-44
Dr. Héctor Quevedo Urías
Ejemplo #17. Este ejemplo está encaminado a analizar el efecto que pueda ocurrir en el modelo de regresión estimado, cuando se eliminan valores extremos. Para los datos de la tabla de abajo, asumir un modelo polinomial cúbico. En la primera instancia, estimar el modelo cúbico incluyendo todas las variables. Enseguida, ajustar un modelo de regresión polinomial, como el anterior, pero esta vez excluyendo los valores extremos (5, 8 y 14) estimados en el ejemplo anterior. Analizar en cada caso, los valores de R2, R2ajustada, el error estándar de lo estimado s, PRESS (la sigla de suma de cuadrados de predicción), ANOVA, etc. Ver si hay diferencias significantes en cada uno de los dos casos. Hacer una tabla con los dos modelos de regresión que incluya las estadísticas anteriores, correspondientes a cada uno de los dos modelos probados, bajo las dos condiciones. TABLA 9.15. Tabla mostrando los datos de mediciones (micras) de partículas atmosféricas de la variable dependiente, en función de sus respectivos casos (X). (Elaboración propia) 6 8 14 85 88 90 92 92 93 94 94 95 95 96 96 96 97 97 98 99 101 104 106 114 1 2 3 4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
El esquema mostrando los resultados del Minitab, en el ajustamiento de un modelo de regresión polinomial cúbico, el cual incluye todos los datos y, otro ajustamiento más, de un modelo de regresión polinomial cúbico, el cual excluye los valores extremos se da en la TABLA 9.16. Como se ve en esta tabla, primeramente, se ajusta un modelo de regresión polinomial cúbico: (Y) versus (X), (XSQR), (XCUBE). Este modelo incluye los valores extremos. Después se incluye otro modelo de regresión polinomial que no incluye los valores inusuales extremos. Los resultados obtenidos usando el programa Minitab se dan en la TABLA 9.16 de abajo. 9-45
Dr. Héctor Quevedo Urías
9-46
Dr. Héctor Quevedo Urías
TABLA 9.16. Tabla mostrando los resultados del Minitab. The regression equation is: (Y) = -26.4 + 27.1(X) – 1.86 (X2) + 0.0403 (X3) Predictor Constant (X) (XSQR) (XCUBE)
Coef -26.434 27.079 -1.8595 0.0403
s = 9.491 PRESS = 2749.98
SECoef 8.891 2.904 0.2568 0.0065
T -2.97 9.33 -7.24 6.20
R-Sq = 91.0% R-Sq(pred) = 86.88%
p 0.007 0.000 0.000 0.000
VIF 121.7 682.9 259.3
R-Sq(adj) = 89.7%
Analysis of Variance Table Source of variation Due to Regression Residual Error Total
DF 3 21 24
SS 19072.1 1891.7 20963.8
MS 6357.4 90.1
F 70.57
p 0.000
Durbin-Watson statistic = 1.40 (measures autocorrelation for time series)
Ajustando un Modelo de Regresión Polinomial Cúbico: (Y) versus (X), (XSQR), (XCUBE). Este modelo no incluye los valores inusuales extremos. The regression equation is: (Y) = 71.8 + 6.21 (X) – 0.540 (X2) + 0.0155 (X3) Predictor Constant (X) (XSQR) (XCUBE)
Coef 71.819 6.2092 -0.5400 0.0155
s = 1.482 PRESS = 105.104
SE Coef 1.514 0.5576 0.0557 0.0016
R-Sq = 96.9% R-Sq(pred) = 91.74%
T 47.42 11.14 -9.70 9.75
p 0.000 0.000 0.000 0.000
VIF 125.3 700.9 265.1
R-Sq(adj) = 96.4%
Analysis of Variance Source of Variation Due to Regression Residual Error Total
DF 3 18 21
SS 1232.81 39.56 1272.36
MS 410.94 2.20
Durbin-Watson statistic = 1.58
9-47
F 187.00
p 0.000
Dr. Héctor Quevedo Urías
TABLA 9.17. Tabla mostrando el resumen de los resultados de los dos modelos probados, es decir, con y sin los valores extremos. (Elaboración propia) R2
Tipo de modelo
R2ajustada
s
PRESS
Modelo con valores extremos
91.0%
89.7%
9.491
2749.98
Modelo sin valores extremos
96.9%
96.5%
1.482
105.10
Analizando la tabla de arriba se nota claramente qué, si hubo un mejoramiento significativo en la obtención de los modelos de regresión, cuando se eliminaron los valores inusuales extremos. Por ejemplo, el error estándar de lo estimado s, disminuyó considerablemente, al excluir los valores extremos, es decir, de 9.49 a 1.482. Situación similar ocurrió con la predicción de la suma de los cuadrados PRESS, la cual disminuyó de 2749.98 a 105.10. En cuanto el coeficiente de determinación R2, este valor aumentó de 91% a 96.9%, es decir, al excluir los valores extremos. Igualmente, el valor de F de la tabla de ANOVA, que mide la longitud total aumentó considerablemente, al excluir los valores extremos. Todos estos diagnósticos estadísticos, aunados a los gráficos de los residuales estandarizados (que no se muestran aquí, pero que el estudiante debe analizarlos), indican que la exclusión de los valores inusuales extremos, en el modelo de regresión, si lo mejoraron significantemente. Autocorrelación en datos de series de tiempo En los modelos básicos de regresión se asume que los términos de los errores aleatorios εi son variables aleatorias sin correlacionar o variables aleatorias normales independientes (no autocorrelación). Sin embargo, para series de tiempo, la suposición de errores sin correlacionar (valores de ε independientes) no es aplicable, porque los términos de los errores εi están positivamente correlacionados sobre el tiempo. Bajo 9-48
Dr. Héctor Quevedo Urías
semejantes condiciones, los errores aleatorios εi se dice que están autocorrelacionados o serialmente correlacionados (autocorrelación). La causa primordial de obtener errores aleatorios positivamente autocorrelacionados se debe a la omisión de variables claves del modelo (Neter et al. 1996). Comúnmente, cuando los datos están agrupados secuencialmente sobre un periodo de tiempo es decir, en series de tiempo, los valores residuales están correlacionados. Por ejemplo, las figuras 9.12 y 9.13 muestran gráficas de los residuales, en función del tiempo, los cuales exhiben autocorrelación, mientras que la gráfica de la Figura 9.14 indica independencia de los residuales. Las maneras de detectar problemas de autocorrelación de primer orden, una condición que implica una correlación entre los residuos et y et - 1, donde t es el periodo de tiempo, son usando la estadística Durbin-Watson. Matemáticamente, esta ecuación se define como: n
Σ (et – et-1)2
t=2
D = ─────────
(9-14)
n
Σ e2t
t=1
Donde: D es la estadística de Durbin-Watson et y et-1 relación entre los residuos sobre el periodo de tiempo n es el número de casos En general, a menos que las observaciones sean de series de tiempo, la estadística de Durbin-Watson debería ser ignorada, porque esta estadística da una prueba de autocorrelación positiva o negativa, solamente, para series de tiempo. 9-49
Dr. Héctor Quevedo Urías
Cuando se están aplicando series de tiempo y existen problemas de autocorrelación pueden existir un número de importantes consecuencias. Por ejemplo, coeficientes de regresion pueden ser ineficientes, el MSE seriamente subestimará los errores de la varianza, el s{bk} calculado por la función de los cuadrados mínimos seriamente subestimará la desviación estándar y los coeficientes de regresión, etc. (Neter et al. 1996). Las medidas para mitigar problemas de autocorrelación son los de agregar una o más variables predictoras al modelo de regresión o de usar variables transformadas (Neter et al. 1996).
Figura 9.12. Gráfica de valores residuales versus tiempo mostrando patrones de autocorrelación (falta de independencia).
Figura 9.13. Gráfica de valores residuales versus tiempo indicando autocorrelación (falta de independencia). 9-50
Dr. Héctor Quevedo Urías
Figura 9.14. Gráfica de valores residuales versus tiempo indicando independencia de los datos. En aplicaciones en la economía y negocios, debido a que estas estimaciones tienden a mostrar correlación de serie parcial, se pueden usar pruebas de hipótesis como: Ho:ρ = 0 (No hay autocorrelación o independencia) Ha:ρ > 0 (autocorrelación)
(9-15) (9-16)
La prueba consiste en determinar si el parámetro de autocorrelación ρ es igual a cero o es mayor que cero. Por ejemplo, si ρ = 0 los términos del error εt son independientes debido a que los términos ut son independientes. No obstante, los valores críticos son difíciles de obtener, pero la prueba de Durbin-Watson ha obtenido los linderos superiores e inferiores dU y dL de tal manera que, un valor de D fuera de estos linderos lleva a una decisión definitiva. De esta manera, Neter et al. (1996), da la regla de decisión para probar entre estas alternativas, esto es: Si D > dU, se concluye Ho:
(9-17)
Si D < dL se concluye Ha:
(9-18)
Si dL ≤ D ≤ dU, la prueba es inconclusa
(9-19)
Valores pequeños de D conllevan a la conclusión de que la prueba de hipotesis de Ha:ρ
9-51
Dr. Héctor Quevedo Urías
> 0, porque los errores aleatorios adyacentes εt y εt-1 tienden a ser de la misma magnitud cuando están positivamente autocorrelacionados. Por lo tanto, la diferencia en los resultados εt - εt-1 tienden a ser menores cuando ρ > 0, lo cual lleva a un numerador pequeño en la función de D y, por lo tanto, a una prueba estadística de D pequeña. Las tablas de abajo muestran las pruebas de los linderos de Durbin-Watson, para un nivel de significancia de α = 0.05 y 0.01. Como se ve, la columna de la izquierda señala los valores de n. Las siguientes columnas dan los valores para cada k con sus correspondientes linderos. Siendo así, las tablas de abajo muestran las pruebas de los linderos de Durbin-Watson para los niveles significancia de α = 0.05 y α = 0.01.
9-52
Dr. Héctor Quevedo Urías
Tabla 9.19. Tabla mostrando las pruebas de los linderos de Durbin-Watson para un nivel de significancia de α = 0.05.
Fuente: Keller, G, Brian Warrack, Henry Bartel. Statistics for Management and Economics (1990).
9-53
Dr. Héctor Quevedo Urías
Tabla 9.20. Tabla mostrando las pruebas de los linderos de Durbin-Watson para un nivel de significancia de α = 0.01 (continuación).
Fuente: Keller, G, Brian Warrack, Henry Bartel. Statistics for Management and Economics (1990).
9-54
Dr. Héctor Quevedo Urías
Ejemplo #18. Se dan los siguientes datos adaptados del libro Applied Linear Regresión Models de Neter et al. (1996): (et – et-1)2 = 0.09794, e2t = 0.1333018 con una tamaño de muestra de n = 20. Probar las hipótesis (de autocorrelación positiva) señaladas abajo usando niveles de significancia de 0.05 y 0.01: Ho:ρ = 0 Ha:ρ > 0 Solución: Usando la ecuación (9-14) y sustituyendo da: 20
Σ (et – et-1)2
t=2
0.09794 D = ───────── = ──────── = 0.735 0.13330 20 2 Σe t t=1
Usando la Tabla 9.19 con α = 0.05, n = 20 y con p – 1 = 1 (porque X = 1, es decir, con una sola variable independiente), da: dL = 1.20 y dU = 1.41. Debido a que D = .735 es pequeño y cae debajo de 1.41, se dice que D < dL y se concluye que ρ > 0 o sea Ha: es decir que hay autocorrelación o falta de independencia, o que los términos de error εt están positivamente autocorrelacionados. Cosa similar ocurre si se usa un nivel de α = 0.01. Nota: Si se hace una prueba de autocorrelación negativa, la estadística usada es 4 – D, donde D se da en las ecuaciones de arriba. Si es así, entonces, la prueba se conduce de la misma manera que para la autocorrelación postiva. Esto quiere decir que si la cantidad 4 – D cae debajo de dL, se concluye ρ < 0. Además, si se usa una prueba bilateral para Ho:ρ = 0 versus Ha:ρ ≠ 0 se hace usando separadamente las pruebas 9-55
Dr. Héctor Quevedo Urías
unilaterales. (Neter et al. 1996). Heteroscedasticidad y homoscedasticidad Esta sección dará una definición de lo que se denominan heteroscedasticidad y homoscedasticidad. Por ejemplo, cuando la varianza del error, ε(σ2ε), no es constante, esta condición se llama heteroscedasticidad. En contraste, cuando la varianza del error, ε(σ2ε), es constante, esta condición se llama homoscedasticidad. El método más comun para diagnosticar el problema de heteroscedasticidad es graficando los residuales contra los valores pronosticados de y. Siendo así, se analiza el esparcimiento de los puntos graficados. Por ejemplo la Figura 9.15 describe los residuales mostrando heteroscedasticidad, es decir, cuando el error σ2ε no es constante. Como resultado de esto, si existen cambios sistemáticos de los residuales con las funciones de las variables independientes. Esta condición se prueba analizando la Figura 9.15 porque el error σ2ε aparece pequeño cuando el valor pronosticado de y es pequeño y grande cuando el valor de y es grande. En contraste, la Figura 9.16 muestra una condicion de homoscedasticidad, es decir, de σ2ε constante. Como resultado de esto, no hay cambios aparentes en la variación de los residuales.
Figura 9.15. Gráfica de residuales mostrando la condición de heteroscedasticidad, es decir, de la varianza del error, σ2ε no constante.
9-56
Dr. Héctor Quevedo Urías
Figura 9.16. Gráfica de residuales mostrando la condición de homoscedasticidad, cuando la varianza del error, σ2ε es constante es decir, cuando los residuales son independientes Prueba de White para el problema de heteroscedasticidad Hay funciones estadísticas para probar el problema de heteroscedasticidad. Una de éstas es la prueba de White. De esta manera, Hal White propuso una forma simple para probar por heteroscedasticidad, es decir, de variaciones sistemáticas de los residuales con las variables regresoras (White, Halbert, 1980. A Heterscedasticity-Consistent Covariance Matriz and a Direct Test for Heteroscedasticity. Econometrica 48:817-838). Para explicar la prueba de White para heteroscedasticidad, supóngase que se tienen k variables regresoras incluyendo una constante xí = (1, xi2, … , xik). De acuerdo a White, después de estimar el modelo de regresión, se pueden estimar los residuales y la ecuación de regresión auxiliar: e2i = α´zi + vi
(9-20)
Donde α es un vector de parámetros, vi es un error y zi contiene todos los productos cruzados de los elementos en xi, es decir: zí = (1, xi2,….., xik, x2i2,….., x2ik, xi2xi3,….xi,k-1xik) 9-57
(9-21)
Dr. Héctor Quevedo Urías
Las pruebas de hipotesis nulas se pueden hacer de la siguiente manera: Por ejemplo, la prueba de hipótesis de homoscedasticidad, es decir, de que la varianza del error, σ2ε es constante es: Ho:σ21 = σ22 = … = σ2n
(9-22)
La prueba de hipótesis alternativa de heteroscedasticidad es: Ho:σ21 ≠ σ22 ≠ … ≠ σ2n
(9-23)
Cuando se usa la distribución de la JI cuadrada, si el producto de la estadistica R2 y el tamaño de la muestra tiene una aproximación a
χ2
con [k(k + 1) / 2] -1 grados de
libertad, entonces la función se da como: nR2 ≈
χ2 (k[k + 1) / 2] – 1)
Si el valor de nR2 es mayor que el valor crítico de la JI cuadrada hipótesis nula a favor de la prueba alternativa de heteroscedasticidad.
9-58
(9-24)
χ2 se rechaza la
Dr. Héctor Quevedo Urías
Ejercicios Capítulo 9 9.1. Este es un ejercicio relacionado con el ajustamiento del mejor modelo de regresión. La tabla de abajo da los datos. Tabla mostrando los datos. (Elaboración propia) X | 0 1 2 3 4 5 6 7 8 9 ___________________________________________________________________ Y | 9.1 7.3 3.2 4.6 4.8 2.9 5.7 7.1 8.8 10.2 (a) Obtener el modelo de regresión más apropiado, es decir, lineal, cuadrático o cúbico de acuerdo a los criterios R2, Rajustada, s y PRESS calculados. (b) Complementar la decisión del mejor modelo candidato basándose en el diagnóstico subjetivo del análisis gráfico. La tabla de abajo da las respuestas objetivistas. Tabla mostrando los datos. (Elaboración propia). __________________________________________________________________ Tipo de modelo de regresión R2 R2ajustada s PRESS Modelo de regresión cuadrático 46.3% 30.9% 2.102 100.404 Modelo de regresión cúbico 61.3% 42.0% 1.926 421.055 Modelo de regresión lineal 38.2% 30.5% 2.109 51.316 9.2. Se hace un experimento con un nuevo modelo de automóvil, para determinar la distancia, después de frenar a varias velocidades. La siguiente data se da: Tabla mostrando los datos. (Elaboración propia) Velocidad, v (km/hr) | 37 52 67
82
97
113
Distancia después de frenar el auto, d (m) | 17
63
89
120
27
43
(a) Ajustar el modelo o la curva de regresión múltiple poblacional µd|ν = βo + β1v1 + β2v2, la cual es estimada por la ecuación de la muestra Y = bo + b1x1 + b2x2 (b) Estimar la distancia después de frenar, cuando el coche lleva una velocidad de 70 9-59
Dr. Héctor Quevedo Urías
kilómetros por hora. (c) Estimar la distancia después de frenar, cuando el coche lleva una velocidad de 120 Km/hr. 9.3. La viscosidad de un tipo de lubricante se midió con 6 velocidades diferentes. Se asumió un modelo cuadrático de regresión como el más apropiado y la función de regresión polinomial estimada resultante de una muestra de n = 6 fue: y = -113.0937 + 3.3684x – 0.01780x2 (a) Identificar la variable dependiente. (b) Identificar la variable independiente. (c) Calcular la viscosidad del lubricante cuando la velocidad es 75 rpm. (39.41) 9.4. El texto de Probabilidad y Estadística para Ingenieros de los autores Ronald E. Walpole et al. 1999, discuten un experimento con el fin de determinar si el flujo sanguíneo cerebral en seres humanos se puede predecir a partir de la presión (en mm Hg) del oxígeno arterial. Para esto se usaron 15 voluntarios en el estudio y se observaron los siguientes datos: Tabla mostrando los datos de este problema. ___________________________________________________________________ Flujo sanguíneo (Y) | 84.33 87.80 82.20 78.21 78.44 80.01 83.53 79.46 75.22 76.58 77.90 78.80 80.67 86.60 78.20 Presión de oxígeno (x)
| 603.40 582.50 556.20 594.60 558.90 575.20 80.10
451.20 404.00 484.00 452.40 448.40 320.30 350.30 ___________________________________________________________________ (Fuente: Walpole et al. 1999) Estimar la ecuación cuadrática o cúbica que mejor encaje en los datos. Una vez que se decida por el mejor modelo polinomial (de segundo o tercer orden), predecir el flujo sanguíneo cuando la presión del oxígeno es de 760 torr, es decir de 760 mm Hg = 1 9-60
Dr. Héctor Quevedo Urías
atmósfera). Sugerencia: Usar una regresión por pasos. 9.5. Se dan los siguientes datos en la tabla de abajo. (Elaboración propia): Tabla mostrando la información para este problema. ____________________ (X) | 0 1 2 3 4 5 6 ____________________ (Y) | 1 4 5 3 2 3 4 ____________________ (a) ¿Realmente encaja un modelo cúbico mejor que un modelo de regresión cuadrático o lineal? Justificar el argumento. (Si, porque el valor de R2 = 87.5% es el más alto de los 3 modelos probados; además el valor de s = 0.6726 y el valor de PRESS = 18.43 son los valores más bajos de los 3 modelos probados. Además, los diagnósticos gráficos también apoyan a la noción de un modelo cúbico) (b) Si el modelo cúbico es superior (justificando el argumento), entonces, pronosticar Y cuando X = 2.
(4.422)
9.6. El libro de Probabilidad y Estadística Aplicadas a la Ingeniería de Montgomery et al. 1996, p.583 da un ejemplo relacionado con los paneles de las paredes laterales de un avión formados en una prensa de 1500 toneladas. El costo de fabricación de cada unidad cambia con el tamaño del lote de producción. La tabla de abajo proporciona los datos. (a) Hacer un diagrama de dispersión y decidir qué grado del modelo polinomial es conveniente usar. (b) Hacer un análisis de varianza y probar que los coeficientes son igual a cero. Calcular el valor de p y sacar conclusiones. (c) Obtener el modelo polinomial que mejor encaje en los datos usando la ecuación (9-9), con su respectiva prueba de hipótesis.
9-61
Dr. Héctor Quevedo Urías
Tabla mostrando los datos de este ejercicio. __________________________________________________________________ y | 1.81 1.70 1.65 1.55 1.48 1.40 1.30 1.26 1.24 1.21 1.20 1.18 x | 20
25
30
35
40
50
60
65
70
75
80
90
Fuente: Montgomery et al. 1996 9.7. Se dan los siguientes datos en la tabla de abajo. Tabla mostrando los datos del problema. (Elaboración propia) ___________________________________________________________________ Y | 24.60 24.71 23.90 39.50 39.60 57.12 67.11 67.24 67.15 77.87 80.11 84.67 X | 4.0 4.0 4.0 5.0 5.0 6.0 6.5 6.5 6.8 7.0 7.1 7.3 (a) Ajustar los datos a un modelo polinomial de segundo orden. (b) Ajustar los datos a un modelo polinomial de tercer orden. (c) Usando métodos subjetivos y objetivos, decidir cuál de los dos modelos encaja mejor en los datos justificando el argumento. (Un modelo cuadrático es el mejor candidato. Justificar la aserción) 9.8. Los datos de la tabla de abajo corresponden a un estudio para la obtención de cierto producto etílico relacionado con el tiempo. Tabla con los datos. ____________________________________________ x| 1 1 2 4 4 4 6 ____________________________________________ y | 25.0 27.5 28.0 31.9 33.0 34.6 22.0 ____________________________________________ (a) Obtener el modelo probabilístico (cuadrático o cúbico, sin asumir interacción), más adecuado para los datos y estimar la función de regresión correspondiente. (b) Validar el modelo determinado en (a) construyendo una gráfica con los residuales 9-62
Dr. Héctor Quevedo Urías
estandarizados y analizando, subjetivamente, la conformación de los datos de la gráfica. (c) Estimar el coeficiente de determinación R2. De acuerdo con el criterio de R2, y demás estadísticas ¿encajan bien los datos en el modelo de regresión seleccionado? (d) Hacer un análisis de varianza y estimar el nivel de probabilidad p. (e) Complementar el procedimiento usando la ecuación (9-12) y, de acuerdo a los resultados, y a la prueba de hipótesis, decir cuál de los dos modelos encaja mejor en los datos. (f) Usar el criterio de Cp de Mallow para analizar si hubiere muchas variables independientes o superfluas, que se puedan eliminar del modelo si Cp > (p + 1). No obstante, si
Cp < (p + 1) esto pudiera indicar que se han omitido variables
independientes importan. 9.9. En un estudio de seguridad para los motoristas en las carreteras estatales, se sabe que el número de accidentes automovilísticos, en cierta parte de de una carretera, está relacionado con el número de vehículos y la velocidad de éstos. Para esto, al encargado de este estudio se le piden los promedios de las estadísticas de los últimos 10 años, con el objeto de establecer un modelo de regresión para predecir el número de accidentes. Siendo así, se decide poner como variable dependiente el número de accidentes (Y). Además, como variables independientes se ponen el número de vehículos que pasan por el trecho (x1) y, la velocidad promedio a que viajan (millas por hora), como (x2). Se decide probar cuatro modelos de regresión, es decir, uno lineal múltiple sin interacción y otro con interacción. Para el otro modelo probado se decide por uno cuadrático, con y sin interacción. Todo esto se hace para ver cual de los modelos encaja mejor en los datos. Hacer los siguientes cálculos: (a) Calcular los valores de R2, R2ajustada, s, PRESS, F y el valor de p para cada uno de los modelos probados. 9-63
Dr. Héctor Quevedo Urías
(b) Hacer un resumen de los resultados de los 4 modelos de regresión probados y decidir cual sistema es superior. Tabla mostrando los promedios anuales del número de accidentes, en función del número de vehículos y la velocidad (millas por hora) en que viajan. (Elaboración propia) Número de (Y) Número de (X1) Velocidad del (X2) accidentes vehículos vehículo 5 40 53 9 55 73 15 64 90 3 25 55 4 27 60 6 30 70 1 5 50 10 56 85 6 35 80 8 60 67 (b) Completar la tabla de abajo con los resultados de los cuatro modelos probados y decir cual es el modelo superior. Tabla mostrando los datos del problema (Elaboración propia) Tipo de modelo
R2
R2ajustada
Modelo lineal sin interacción Modelo lineal con interacción Modelo cuadrático sin interacción Modelo cuadrático
9-64
s
PRESS
F
p
Dr. Héctor Quevedo Urías
con interacción 9.10. Analizar las gráficas de abajo de y versus x1 para una variedad de valores de x2 y determinar si hay o no interacción.
Gráficas (a), (b), (c), (d), (e) y (f) de y en función de varios valores de x. (Elaboración propia) 9.11. El texto de los autores Michael J. Neter, H., Kutner, Christopher J. Nachtsheim y William Wasserman, cuyo título es Applied Linear Regression Models (1996) discute la eficiencia de un tipo de un mecanismo de transmisión que funciona a más de la capacidad normal se prueba para reducir el consumo de gasolina y, por ende, la reducción de la contaminación ambiental (por las emisiones de gases de invernadero). Esto se estudió en 12 pruebas, con una camioneta equipada con este tipo de transmisión. La tabla de abajo muestra la velocidad constante (xi), en millas por hora, en función de las millas por galón obtenidas (yi). Asúmase un modelo de regresión de segundo orden. Los datos se dan en la tabla de abajo.
9-65
Dr. Héctor Quevedo Urías
Tabla mostrando los datos del problema del rendimiento de gasolina. No. de prueba
|1
2
3
4
5
6
7
8
9
Velocidad (xi)
| 35 35 40 40 45 45 50 50 55
Rendimiento (yi) | 22 20 28 31 37 38 41 39 34
10
11
12
55
60
60
37
27
30
(Fuente: Neter et al. 1996) (a) Graficar los de datos millas por galón versus velocidad. (b) Ajustar el modelo de regresión polinomial de segundo orden. (Y = -183 + 8.98X – 0.0911(X 2)) (c) Validar la función probabilística cuadrática graficando los residuos versus valores observados de y. También, hacer un histograma de frecuencia versus valores residuales. También, preparar una gráfica de probabilidad normal, es decir, de residuos versus valores de z. (d) Validar el modelo cuadrático estimando el valor de SSe, R2 y R. Asimismo, hacer una tabla de ANOVA y hacer pruebas de hipótesis con la t de estudiante. Sacar conclusiones apropiadas. (e) Probar un modelo cúbico y comparar los resultados con los del modelo cuadrático. (f) ¿Cuál de los dos modelos es superior? 9.12. En una investigación científica agrícola, se estudió, en 10 pruebas, los efectos de la humedad de la tierra (xi en pulgadas) y la temperatura (x2 en oC) en función del rendimiento (en fanegas), de cierta variedad de plantas gramíneas (Y). Los datos se dan abajo. Tabla mostrando los datos. (Elaboración propia). __________________________________________________________________ Humedad (x1) | 6 6 6 6 14 14 14 15 16 16 Temperatura (x2) | 20 21 22 22 22 23 23 23 24 24 Rendimiento (Y) | 49 48 48 48 48 42 44 44 40 40 9-66
Dr. Héctor Quevedo Urías
El ingeniero agrónomo investigador espera un modelo de la forma: yi = βo + β1xi1 + β2xi2 + β11x2i1 + β22x2i2 + β12xi1xi2 + ε (a) Graficar los valores de yi contra los valores ajustados. (b) Calcular R2. (c) Calcular el valor de F y p. (d) Estimar el rendimiento promedio (en fanegas), cuando la humedad es igual a 8 y cuando la temperatura es igual 22 grados Celsius. (e) ¿Se pudiera eliminar el término de interacción, sin menoscabar la eficiencia del modelo de regresión, que espera el ingeniero agrónomo? 9.13. La suma de los cuadrados del error de un modelo de regresión polinomial cuadrático completo, con interacción conteniendo dos variables independientes es de SSe = 200.0. La suma de los cuadrados del modelo simple, sin interacción, con una variable independiente es de SSa = 500. Asumir k1 = 4, k2 = 5, n = 50 y α = 0.05. (a) Determinar cuál de los dos modelos es superior. (El modelo completo es superior. Justificar el argumento) 9.14. Probar las siguientes hipótesis usando la función (9-9): (a) Prueba de hipótesis nula es Ho: β3 = β4 = β5 = 0 contra la hipótesis alternativa de cuando menos uno de los tres coeficientes β3, β4, β5 no es igual a cero. Asumir, k1 = 2, k2 = 5, n = 100, α = 0.05, SSE1 = 7,000.0 del modelo abreviado y SSE2 = 6,000.0 del modelo completo. De acuerdo a estos datos, ¿Cuál de los dos modelos es superior? (b) Prueba de hipótesis nula Ho:β4 = β5 = β6 = β7 = 0 contra H1: cuando menos uno de estos coeficientes no es igual a 0. Asumir k1 = 3, k2 = 7, n = 45, α = 0.05, SSe1 = 1,600, SSe2 = 900.0. ¿Cuál de los dos modelos es el mejor? (c) Ho:β3 = β4 = 0 contra H1:β3 ≠ β4 ≠ 0 de que cuando menos uno de los dos coeficientes no es igual a 0. Asumir k1 = 2, k2 = 4, n = 30, α = 0.05, suma del error de las 9-67
Dr. Héctor Quevedo Urías
cuadrados del modelo simple es 130.0 y la suma de los cuadrados del modelo complejo es de 100.0. 9.15. En una investigación relacionada con la contaminación del aire por el ozono, a nivel del suelo, se sacó una muestra de 5 años (1999-2003) procedente de una estación muestreadora localizada en el Parque Chamizal en El Paso, Texas. El mantenimiento y calibración de los aparatos de esta estación muestreadora fue hecha por la E. P. A. de Los Estados Unidos. El estudio consistió en el procesamiento estadístico de variables, como el ozono (O3), el monóxido de nitrógeno (NO), el bióxido de nitrógeno (NO2) y la temperatura en grados Fahrenheit (oF). Esto se hizo con el objeto de obtener un modelo de regresión estadístico para fines de predicción. El procedimiento consistió en sacar los promedios (de los valores espacio-temporales de una hora), de cada una de las 4 variables independientes de cada una de las 24 horas del día de cada mes de cada uno de los 5 años. Aproximadamente, se procesaron 178,560 datos (24 horas x 31 días x 12 meses x 5 años x 4 variables). Los promedios de los promedios, en partes por billón (ppb) se dan abajo. Hacer los siguientes cálculos: (a) Graficar los datos para ver el tipo de la función gráfica que se pueda esperar. Sugerencia: Usar el paquete de computadora Excel. (b) Para obtener el mejor candidato del modelo de regresión usar un “best subset regresión” (mejor subconjunto de regresión) y un “Stepwise Regresión” (regresión por pasos). Evaluar la utilidad del modelo usando los criterios R2, s, Cp y PRESS y los criterios subjetivos (gráficas de residuales y prueba de normalidad). (c) Usando el modelo de regresión seleccionado, para el mes de julio, predecir la concentración de ozono, si la concentración de NO es igual a 4.0 ppb, NO2 igual a 11.8 ppb, y la temperatura es de 23.5 oC. La tabla de abajo muestra la información requerida.
9-68
Dr. Héctor Quevedo Urías
Tabla mostrando los datos del problema de arriba. (Elaboración propia). Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
Ozono (ppb) 16.7 19.4 30.0 34.4 35.8 37.5 38.7 36.4 30.7 21.2 16.6 14.9
NO (ppb) 28.2 23.0 12.5 10.2 6.2 4.0 3.3 3.9 8.8 9.8 33.0 34.9
Temperatura (oF) 49.68 53.06 58.82 68.00 77.36 82.94 83.66 83.12 78.44 67.10 56.30 46.18
NO2 (ppb) 21.0 18.9 16.3 14.4 12.8 10.9 12.7 14.4 16.6 20.9 22.7 23.8
(a) Usando el programa Excel introducir los datos en la hoja de Excel, de la siguiente manera: En la primera columna poner los meses del año, en la segunda columna poner los valores de O3, en la tercera columna poner los valores de NO y en la última columna poner los valores de NO2. Una vez hecho esto irse a: Chart Wizard → En la ventana de Chart-Wizard-Step 1 of 4 Chart 5 → Chart Type → Line → Next → Data Range (sombreando los datos) → Column → Next → Título → Finísh. Todos estos órdenes generan la gráfica mostrada abajo. 90 80 70 60
Conc. O3
50
Conc. NO
40
Conc. NO
30
Temperatura
20 10 0 E F M A M J J A S O N D
9-69
Dr. Héctor Quevedo Urías
Como se ve en la gráfica, las concentraciones de O3 son directamente proporcionales a las temperaturas, pero inversamente proporcionales a las concentraciones de NO y NO2. Con la química atmosférica, estas relaciones matemáticas están de acuerdo a una lógica a posteriori. ¿Por qué es así? Se le pide al lector contestar esta pregunta. Para el inciso (b) usando el Best Subsets Regression de la función del Minitab con Y versus X2, X2, …… para obtener el siguiente esquema mostrado abajo: (Elaboración propia). ___________________________________________________________________ XXXX 1234 SSSS XXXQQQQ Vars R-Sq R-Sq(adj) Cp s 2 2 4 R R R R 1 97.4 96.9 95.2 1.6294 X 1 96.7 96.0 123.5 1.8434 X 2 98.2 97.5 68.2 1.4597 X X 2 98.2 97.5 68.5 1.4630 X X 3 99.5 99.3 16.0 0.7796 X X X 3 98.9 98.3 40.9 1.2029 X X X 4 99.7 99.5 10.7 0.6489 X X X X 4 99.7 99.4 12.4 0.6995 X X X X *5 99.9 99.8 5.4 0.4036 X X X X X 5 99.9 99.8 5.9 0.4294 X X X X X 6 99.9 99.8 7.0 0.4214 X X X X X X 6 99.9 99.8 7.2 0.4313 X X X X X X 7 99.9 99.7 9.0 0.4859 X X X X X X X Stepwise regression: Y versus X1, X2, X3, X4,X1SQR, X3SQR Alpha to enter: 0.15 Alpha to remove: 0.15 Response is: on 6 predictors, with N = 12 __________________________________________________________________ De acuerdo a lo observado arriba, se puede decir que, al juzgar por los valores de R2, s y Cp, el modelo más apropiado es el que excluye a X 22 y a X 24, pero que incluye a 9-70
Dr. Héctor Quevedo Urías
(NO2), como la mejor alternativa, es decir, usando un modelo de regresión cuadrático de la forma de abajo (que excluye a X 22 y X 24). Y = βo + β1X1 + β2X2 + β3X3 + β4X4 + β5X 21 + β6X 23 La utilidad del modelo candidato se da de acuerdo a los valores de: s = 0.4036, R2 = 99.9%, R2adj. = 99.8%, R2pred. = 99.7% y PRESS = 3.1174. Además, haciendo un análisis de regresión por pasos se observa que, siempre se van despreciando los valores de X 22 y X 24, pero siempre se selecciona a X 23 como mejor alternativa. Esta situación es confirmada por los valores de T y de P mostrados en la tabla de abajo. Tabla mostrando los coeficientes y los valores de T y P. (Elaboración propia) Predictor Coef. SE Coef T P Constant 17.273 6.2660 2.76 0.040 X1 -2.0544 0.1502 -13.67 0.000 X2 -0.3758 0.1159 -3.24 0.023 X3 1.4376 0.1991 7.22 0.001 X4 -10.8350 2.8080 -3.86 0.012 X1SQR 0.0323 0.0029 11.73 0.000 X3SQR -0.0120 0.0016 -7.47 0.001 Para contestar las preguntas del inciso (c) usar el modelo de regresion seleccionado. 9.16. Las tablas de abajo muestran datos sacados de un experimento, el cual consiste en 4 variables independientes. Se usa un paquete de computadora, el cual selecciona tres de los modelos candidatos más apropiados. (a) Confirmar la selección del los tres candidatos modelos de regresión más apropiados usando el paquete Minitab, NCSS o SAS. (b) De los tres modelos finalistas señalados en la tabla de abajo, seleccionar el modelo más óptimo basando el criterio en los diagnósticos estadísticos R2, s, PRESS y Cp. Complementar la decisión usando enfoques subjetivistas, es decir, analizando los gráficos de los residuos estandarizados. Hacer, además, una prueba de normalidad. 9-71
Dr. Héctor Quevedo Urías
Tabla mostrando los datos originales. (Elaboración propia) __________________________________________________________________ (Y) X1 X2 X3 X4 _______
79.3 200.1 163.2 200.1 146.0 177.7 30.9 291.9 160.0 339.4 159.6 86.3 237.5 107.2 155.0
5.5 2.5 8.0 3.0 3.0 2.9 8.0 9.0 4.0 6.5 5.5 5.0 6.0 5.0 3.5
31 55 67 50 38 71 30 56 42 73 60 44 50 39 55
10 8 12 7 8 12 12 5 8 5 11 12 6 10 10
8 6 9 16 15 17 8 10 4 16 7 12 6 4 4
La tabla de abajo muestra los tres mejores candidatos de modelos, para que el lector haga una decisión sobre cual de los tres modelos es el mejor. Hacer esta decisión final basándose en los criterios estadísticos R2, s, PRESS y Cp. ¿Pudiera una interacción mejorar el modelo de regresión? Tabla mostrando los resultados. (Elaboración propia) Modelo de regresión X2, X3 X1, X2, X3 X1, X2, X3, X4
Fcalc.
R2
s
PRESS
Cp
998 0.9940 6.6749 782.1896 11.4013
Durbin-Watson 1.91
1200 0.9970 4.9795 643.3578
3.4075
2.02
852 0.9971 5.1193 741.7557
5.0000
2.02
9.17. Este problema está relacionado con una información de datos de un experimento relacionado entre el pH (X) y la conductividad eléctrica (Y). Los datos se dan en la tabla 9-72
Dr. Héctor Quevedo Urías
de abajo (elaboración propia). Basando el razonamiento en los resultados dados por el paquete Minitab, decidir si el modelo de regresión más apropiado es un modelo de cuadrático o un modelo de regresión cúbico.
Quadratic Regression Analysis: (Y) versus (X), XSQR The regression equation is: (Y) = 46.9 – 19.9 (X) + 2.12 XSQ Predictor Coef SE Coef T P Constant 46.907 9.432 4.97 0.000 (X) -19.909 4.310 -4.62 0.000 XSQ 2.1161 0.4911 4.31 0.001 S = 0.09332 R-Sq = 94.0% R-Sq(adj) = 93.1% PRESS = 0.173201 R-Sq(pred) = 90.88% Analysis of Variance Table Source DF SS Regression 2 1.78578 Residual Error 13 0.11322 Total 15 1.89900
MS F P 0.89289 102.53 0.000 0.00871
Cubic Regression Analysis: (Y) versus (X), XSQR, XSCUBE The regression equation is: (Y) = 248 – 158(X) + 33.6 XSQR – 2.40 XCUBE
9-73
Dr. Héctor Quevedo Urías
Predictor Constant (X) XSQ XCUBE
Coef 247.9 -157.9 33.64 -2.397
SE Coef T 206.4 1.20 141.6 -1.11 32.35 1.04 2.459 -0.97
P 0.253 0.287 0.319 0.349
S = 0.09350 R-Sq = 94.5% R-Sq(adj) = 93.1% PRESS = 0.172799 R-Sq(pred) = 90.90% Analysis of Variance Table ____________________________________________________ DF SS MS F P Regression 3 1.79409 0.59803 68.41 0.000 Residual Error 12 0.10491 0.00874 Total 15 1.89900 9.18. Se dan los siguientes datos relacionados con la manufactura de chumaceras para vehículos. Se sospecha que ciertas mediciones no están dentro del rango permitido, posiblemente, debido a fallas de los operadores o tal vez de la maquinaria. Tabla mostrando los datos del problema (Elaboración propia). Mediciones | 2.75 2.62 2.74 3.85 2.34 2.74 3.93 4.21 3.88 4.33 3.46 4.52 2.43 No. muestra| 1 2 3 4 5 6 7 8 9 10 11 12 13
3.65 2.78 3.56 3.01 14
15 16
17
Hacer los siguientes cálculos: (a) Poner los datos en forma ascendente. (b) Determinar el valor del cuarto inferior del cuarto superior. (c) Calcular la cuarta dispersión fs, 1.5fs y 3fs. (d) Calcular un modelo de regresión que incluya todos los datos. (e) Calcular otro modelo de regresión que excluya los valores atípicos extremos calculados en los incisos anteriores. (f) De acuerdo a los diagnósticos objetivistas y subjetivistas, determinar cual de los dos 9-74
Dr. Héctor Quevedo Urías
modelos es superior. 9.19. Se da la tabla de abajo con datos relacionados con las concentraciones de monóxido de carbono (CO) emitidas por motores de combustión interna. Sin embargo, se argumenta que, el aparato analizador que muestreaba el CO, pudo haber tenido fallas durante el muestreo de CO debido a que se notaron valores fuera de lo normal. Para verificar si en verdad hubo valores atípicos en las concentraciones de CO, se requiere saber, cuales fueron los valores extremos. Para tales fines usar diagramas de caja que identifiquen valores atípicos extremos. Para esto se da la tabla de abajo. Tabla mostrando los valores de las concentraciones de monóxido de carbono (ppm). (Elaboración propia). Concentración de CO | 95 90 90 80 75 65 45 60 57 95 97 130 130 120 105 103 100 99 99 No. de observación | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Hacer los siguientes cálculos: (a) Ordenar los datos en forma ascendente. (b) Estimar la mediana, el valor máximo, el valor mínimo, el cuarto inferior, el cuarto superior, la cuarta dispersión fs, 1.5fs, 3fs, el cuarto inferior Q1 y el cuarto superior Q3. (95, 130, 45, 77.5, 104, 26.5, 75, 103) (c) Hacer una gráfica con un diagrama de caja y hacer comentarios al respecto. (d) Identificar los valores atípicos inusuales extremos de CO. (e) Correr un modelo de regresión, es decir, asumiendo un modelo de regresión cuadrático, con los valores originales y, otro más, con los valores extremos eliminados. ¿Hay un mejoramiento significante en el modelo corregido, es decir, de acuerdo a los valores de R2, R2ajustada, s y PRESS, de cada uno de los dos modelos de regresión cuadráticos, esto es, incluyendo y excluyendo los valores atípicos extremos? (Tal parece que si hay un mejoramiento significante con el modelo de regresión cuadrático, 9-75
Dr. Héctor Quevedo Urías
que no incluye los valores extremos. Bajo estas condiciones, los valores de los diagnósticos estadísticos, para el modelo de regresión, sin los valores atípicos extremos son: R2 = 98,4%, R2ajustada = 98.2%, s = 2.51, PRESS = 135.74. En contraste, para el modelo de regresión cuadrático, que incluye todos los valores atípicos extremos, los valores de los diagnósticos estadísticos son: R2 = 93.6, R2ajustada = 92.8%, s = 6.26 y PRESS = 949.77) (f) De acuerdo a los diagnósticos objetivistas y subjetivistas, determinar cual de los dos modelos es superior. 9.20. El texto de Jay L. Devore intitulado Probabilidad y Estadística para Ingeniería y Ciencias (2001) cita una investigación para determinar la concentración de cocaína en la sangre (mg/L) en una muestra de individuos quienes murieron de delirio excitado (DE) debido al uso de la cocaína. Además, hubo otra muestra de cocaína en la sangre de otro grupo de adictos a esta droga, quienes murieron por sobredosis, sin delirio excitado. El tiempo de supervivencia de ambos grupos fue de 6 horas. Los datos adjuntos se graficaron en un diagrama de caja. Este estudio se publicó en la revista “Fatal Excited Delirium Following Cocaine Use” (J. of Forensic Sciences, 1997, pp. 25-31). Los datos de este estudio se dan en la tabla de abajo.
9-76
Dr. Héctor Quevedo Urías
Tabla mostrando los resultados de este problema. Con delirio excitado (DE) 0 0 0 0 .1 .1 .1 .1 .2 .2 .3 .3 .3 .4 .5 .7 .8 1.0 1.5 2.7 2.8 3.5 4.0 8.9 9.2 11.7 21.0 Sin delirio excitado (Sin DE) 0 0 0 0 .1 .1 .1 .1 .2 .2 .2 .3 .3 .3 .4 .5
.6 .5 .7 .6 .8
1.0 1.2 1.4 1.5 1.7 2.0 3.2 3.5 4.1 4.3 4.8 5.0 5.6 5.9 6.0 6.4 7.9 8.3 8.7 9.1 9.6 9.9 11.0
11.5 12.2 12.7 14.0 16.6 17.8
(Fuente: Devore, 2001) (a) Determinar las medianas, el cuarto inferior Q1, el cuarto superior Q2, los cuartos inferiores y superiores y las cuartas dispersiones fs de las dos muestras y el promedio. (Para ED: .4,.12.75,2.65, 2.607; para no ED: 1.6, .3, 7.9, 7.60, 4.25) (b) Identificar los valores atípicos moderados y extremos. (ED: 8.9 y 9.2 son valores atípicos moderados y 11.7 y 21.0 son valores atípicos extremos. En la muestra de no ED: no hay valores atípicos). (c) Trazar un diagrama de caja comparativo y usarlo para comparar y diferenciar las muestras con y sin delirio excitado. (Existe una asimetría positiva apreciable en ED y en no ED; menor variabilidad en observaciones de la muestra ED, esto es, menor fs. Además, las observaciones de la muestra no ED son mayores que las de la muestra no ED) 9.21. El texto de química intitulado Chemistry: The Central Science de Brown et. al. (2000), discute la fase gaseosa de la descomposición de NO2, la cual es dada por: NO2(gas) → NO(gas) + ½ O2(gas) (a) Decir si la reacción es de primero o segundo orden con respecto a la concentración de NO2. Después, ratificar la decisión hecha usando técnicas de regresión evaluadas
9-77
Dr. Héctor Quevedo Urías
por estadísticos objetivistas (como R2, s, PRESS y ANOVA) y complementadas por medio de gráficos subjetivistas (como prueba de normalidad, residuos vs. valores ajustados, etc.). Además, calcular el valor de la constante de la reacción k (pendiente). Los valores se dan abajo. Tabla mostrando los datos del problema ___________________________ Tiempo (seg) [NO2] (M) ___________________________ 0.0 0.1000 5.0 0.0170 10.0 0.0090 15.0 0.0062 20.0 0.0047 ___________________________ Fuente: Chemistry: The Central Science. Brown et al. (2000) 9.22. Los autores Sawyer C. N., Perry L. McCarty del libro Chemistry for Sanitary Engineers, 2nd. Edition (1967) proporcionan los siguientes datos provenientes de un experimento para evaluar la desinfección de un almacenamiento de agua con una dosis de cloro dada para matar las bacterias coliformes. Usando el programa Minitab o cualquier otro programa de computadora, correr un análisis de regresión estadístico y hacer lo siguiente: (a) Decir el orden de la reacción de estos datos.
(Primer orden)
(b) ¿Que tan bien encajan los datos en el modelo de regresión? Para esto, usar un criterio objetivista y uno subjetivista para justificar la aserción. (c) Calcular la vida media (d) Calcular la tasa de la reacción
(0.1848)
(e) ¿Predecir el tiempo que se llevaría para aniquilar el 50% de las bacterias coliformes? 9-78
Dr. Héctor Quevedo Urías
Tabla mostrando los datos del problema. ____________________________________________ Tiempo (min) Porcentaje de coliformes que van quedando ____________________________________________ 0 100 10 70 20 21 30 6.3 60 0.6 ____________________________________________ (Fuente: Sawyer et al. 1967) 9.23. El texto de Mongomery, Peck y Vining, intitulado Introducción al Análisis de Regresión Lineal (2001) da un estudio relacionado con la ingeniería química y mecánica en la cual se necesita conocer la presión de vapor de agua a diversas temperaturas; para esto se pueden usar la “infames” tablas de vapor. Los datos de la presión de vapor y del agua a diversas temperaturas se dan abajo. Tabla mostrando los datos del problema. _________________________________________________________________ y = presión de vapor de agua (mm Hg) x = Temperatura (oC) __________________________________________________________________ 9.2 10 17.5 20 31.8 30 55.3 40 92.5 50 149.4 60 Fuente: Montgomery et al. (2001) (a) Ajustar un modelo de regresión de primer orden sustentado por estadísticos objetivos y gráficos. (b) Ajustar un modelo de regresión de segundo orden sustentado con estadísticos objetivos y gráficos. 9-79
Dr. Héctor Quevedo Urías
(c) De acuerdo a los resultados obtenidos en los incisos (a) y (b) decidir cual de los dos modelos es superior, es decir, el modelo de regresión que ajusta mejor a los datos. 9.24. En un experimento relacionado con la velocidad del vehículo y el consumo de gasolina se estudia en una muestra de un tamaño 15, es decir, usando un solo vehículo. Los datos se dan en la tabla de abajo. Tabla mostrando los datos de este experimento. __________________________________________________________________ Velocidad (km/hr) | 57 57.6 64 66 66 80 81 89.6 98 99 Consumo de gasolina (L/km) | 20 21 25 26.3 26.5 29 29 27 25.5 25 Hacer los siguientes cálculos: (a) Identificar la variable dependiente y la variable independiente (b) Graficar los datos de la variable dependiente versus la variable independiente. (c) Ajustar el modelo de regresión que mejor encaje en los datos (d) Evaluar la utilidad del modelo candidato mediante análisis objetivistas (R2, R2ajustada, error estándar de lo estimado s, PRESS, y análisis de varianza). Complementar la decisión obtenida usando gráficos subjetivistas (Gráficos de prueba de normalidad, residuales versus valores ajustados de Y, residuales versus ordenes, etc.) (e) Una vez que se haya obtenido el modelo superior, predecir el consumo de gasolina cuando la velocidad es de 96 km/hr
9-80
Dr. Héctor Quevedo Urías
CAPITULO 10 Estadística no paramétrica. El modelo de ANOVA libre Ventajas de los métodos no paramétricos.- Desventajas de los métodos no paramétricos.- Prueba de H de Kruskal-Wallis para análisis de varianza por rangos.- Pruebas de hipótesis con las funciones no paramétricas.Procedimientos de pruebas de Kruskal-Wallis para ANOVA simple.- Pruebas de hipótesis no tradicionales, para la prueba de Kruskal-Wallis, es decir, usando el valor de la probabilidad p.Cuando se estudian procedimientos libres o de pruebas no paramétricas se incluyen la prueba de suma de rangos de Wilcoxon, la prueba de Kruskal-Wallis para diseños completamente aleatorizados, la prueba de Friedman, la prueba de Kolmogorov-Smirnov, etc. Existen muchas aplicaciones en la ciencia y en la ingeniería donde los datos se reportan, no como valores continuos, sino en una escala ordinal de tal manera que se puedan asignar rangos a los datos obtenidos. Todos los métodos discutidos anteriormente, como la distribución normal, la distribución de t de estudiante, la distribución de F, el modelo de regresión, etc., se llaman métodos estadísticos paramétricos. Esto se debe a qué, estas distribuciones continuas asumen que la variación aleatoria de los datos debe de seguir a la suposición de normalidad. Sin embargo, existen situaciones en que las suposiciones de normalidad no se satisfacen para las pruebas de hipótesis. Para resolver este problema, los estadísticos han diseñado varias alternativas para aquellos investigadores que estén renuentes a aceptar las suposiciones de normalidad, es decir, de funciones no paramétricas. Estos procedimientos no paramétricos se aplican igualmente a distribuciones paramétricas y a distribuciones no paramétricas. 10-1
Dr. Héctor Quevedo Urías
En el uso de las estadísticas no paramétricas, como la prueba de KruskalWallis, la prueba de signos, la prueba de Wilcoxon, la prueba de rangos de signos, etc., es necesario aclarar qué, estos procedimientos no paramétricos no son tan poderosos como sus contrapartes, es decir, los métodos paramétricos, como la distribución normal, la t de estudiante, etc. Esto se debe a qué, para una probabilidad de error I, las pruebas no paremétricas darán una probabilidad más alta del error tipo II. Esto también ocurre, porque una prueba que ignore la normalidad de los datos (como lo hacen las pruebas no paramétricas), no será tan buena como aquellas pruebas que la sigan (como las paramétricas). Otra limitación de las pruebas no paramétricas es que las poblaciones muestreadas deben se ser independientes. Esto quiere decir qué, un grupo no debe de tener influencia sobre el otro. Sin embargo, haciendo a un lado la condición de normalidad, en que se basan las estadísticas paramétricas, las pruebas no paramétricas tienen muchas aplicaciones en el campo de la ingeniería. Ventajas de los métodos no paramétricos 1. Estos métodos pueden aplicarse a un gran número de situaciones, porque no requieren de las condiciones de normalidad requeridas por sus contrapartes paramétricas y son más simples que su contraparte, los métodos paramétricos. 2. En contraste con los métodos paramétricos, los métodos no paramétricos pueden ser aplicados a datos no numéricos. Desventajas de los métodos no paramétricos 1. Los métodos no paramétricos tienden desperdiciar información, porque los datos numéricos exactos usualmente se reducen a forma cualitativa. Por ejemplo, en una prueba no paramétrica, digamos de pruebas de signos, la pérdida de peso por dietistas se registran simplemente signos negativos. Con este método de signos, la
10-2
Dr. Héctor Quevedo Urías
pérdida de peso de una sola libra, recibe la misma representación que la pérdida de 50 libras. 2. Las pruebas no paremétricas no tienen la eficiencia de las pruebas paramétricas. Esto se debe a qué, con los métodos no paramétricos, en las pruebas de hipótesis se necesita una fuerte evidencia, antes de que se pueda rechazar la hipótesis. La TABLA 10.0 muestra una comparación entre los métodos paramétricos y los no paramétricos. TABLA 10.0. Tabla mostrando una comparación entre los métodos paramétricos y los métodos no paramétricos. (Elaboración propia) Aplicación
Prueba paramétrica
Prueba no paramétrica
Datos pareados para muestras dependientes
Prueba de z o de t*
Prueba de signo
0.63
Datos para muestras independientes
Prueba de z o de t**
Prueba de signos de rangos de Wilcoxon
0.95
Prueba de KruskalWallis
0.95
Varias muestras independientes (ANOVA)
Análisis de varianza (prueba F)
Correlación
Correlación lineal
Eficiencia
Aleatoriedad
Prueba de correlación de rangos Prueba no paramétrica Pruebas corridas
** t = ( X 1 – X 2) – (µ1 – µ2) /
s
0.91
No hay base ______________________________________________________________________________ * t = ( D - µo)/ sD/√ n 2 p
(
1
1
+
n n 1
** z = ( X 1 – X 2) – (µ1 – µ2) /
2
σ +σ 2
2
1
2
n
1
)
n
con σ1 y σ2 conocidas
2
10-3
Dr. Héctor Quevedo Urías
Prueba de H de Kruskal-Wallis para análisis de varianza por rangos La única prueba que se discutirá en este capítulo es la prueba de Kruskal-Wallis, la cual está relacionada con la estadística paramétrica del análisis de varianza. El análisis de varianza o ANOVA paramétrico se aplica para ver si tres o más promedios poblacionales son iguales, es decir, que no hay diferencias en los promedios. Sin embargo, aquí se asume qué, las poblaciones muestreadas, están normalmente distribuidas y, las desviaciones estándar de estas distribuciones son iguales. No obstante, si no se pueden seguir las suposiciones de la ANOVA paramétrica, lo apropiado es usar las pruebas no paramétricas, como la prueba de Kruskal-Wallis, prueba de signos de rangos de Wilcoxon o prueba U de MannWhitney. Empero, como ya se dijo, aquí debe existir independencia entre las poblaciones muestreadas. De cualquier manera, si se reúne esta condición, entonces si podemos usar la función de Kruskal-Wallis para hacer análisis de varianza, para ver si existen diferencias entre los promedios poblacionales. Procedimientos de pruebas de Kruskal-Wallis para ANOVA simple 1. Todos los valores de la muestra son combinados. 2. Los rangos ordenados son del más alto al más bajo. 3. Los valores ordenados se reemplazan por rangos empezando por uno para el más pequeño hasta el más alto. 4. Para la prueba de hipótesis se usa la distribución de la JI cuadrada y es unilateral derecha. Para la prueba no tradicional se usa el cálculo de la probabilidad p usando la tabla de la distribución de la JI cuadrada (χ2). La función de Kruskal-Wallis se designa por la función H que está muy cercana a la distribución de la JI cuadrada. Esta función se da como:
10-4
Dr. Héctor Quevedo Urías
12 (ΣR1)2 (ΣR2)2 (ΣRk)2 H = ─────── [─────── + ────── + …… + ──────] – 3(N + 1) N(N+1) n1 n2 nk
(10-1)
Con ν = k – 1 grados de libertad Donde k es el número de poblaciones muestreadas o número de muestras Donde: ΣR1, ΣR2,… ΣRk = suma de los rangos para la k-ésima muestra n1, n2, …,nk = tamaños de muestras 1, 2, .., k N = número total de las observaciones para todas las muestras combinadas. Si el valor computado de la estadística H cae en la región crítica derecha (las pruebas siempre son unilaterales derechas), es decir, H > χ2α;ν, con ν = k – 1 grados de libertad, entonces, se rechaza Ho: al nivel de significancia usado. De otra manera se retiene Ho: Pruebas de hipótesis con las funciones no paramétricas Para las pruebas de hipótesis tradicionales se usan los mismos términos que en las pruebas paramétricas de ANOVA, es decir, si H > χ2α, con ν = k – 1 grados de libertad cae en la región crítica derecha, se rechaza la hipótesis sustentada, Ho:. De otra manera se retiene, se acepta o no se hace ninguna decisión. La prueba de hipótesis nula para la prueba de Kruskal-Wallis es la tradicional, es decir: Ho: µ1 = µ2 = µ3 = …… = µk
(10-2)
H1:µ1 ≠ µ2 ≠ µ3 ≠ ….≠ µk
(10-3)
La hipótesis alternativa es:
10-5
Dr. Héctor Quevedo Urías
Los niveles de significancia son los mismos que las pruebas paramétricas, es decir, α = .05 y α = .01. Estos valores se buscan en la tabla de la JI cuadrada con χ2α, donde α es igual a .05 o .01 (extremo derecho de la tabla). Pruebas de hipótesis no tradicionales, para la prueba de Kruskal-Wallis, es decir, usando el valor de la probabilidad p Para hacer estas pruebas de hipótesis no tradicionales usando el valor de p, se siguen los mismos criterios usado anteriormente. El procedimiento se hace buscando el valor de la estadística calculada H en la tabla de la distribución de JI cuadrada, y se hace una interpolación usando la misma fórmula usada con las pruebas paramétricas. Ejemplos usando la prueba de Kruskal-Wallis Ejemplo #1. Se quiere probar si existen diferencias en las concentraciones de óxidos de nitrógeno (NO2) provenientes de tres muestreadores (1, 2 y 3) localizados en diferentes lugares. Probar que no hay diferencias entre las concentraciones de óxido de nitrógeno, entre las tres poblaciones muestreadas. Usar α = 0.05. Las concentraciones de NO2 se dan en la tabla de abajo. TABLA 10.1. Tabla mostrando las concentraciones de óxidos de nitrógeno (NOx) en ppm provenientes de los tres muestreadores. (Elaboración propia) Muestreador 1
Muestreador 2
Muestreador 3
51 32 17 69 86 62 96 97
14 31 68 87 20 28 77
89 20 60 72 56 22
10-6
Dr. Héctor Quevedo Urías
Solución: Primeramente, se tienen que ordenar los rangos, para cada uno de los tres muestreadores. Aquí, sin embargo, hay que tener cuidado de tomar en consideración situaciones donde hay repeticiones. En este caso hay dos repeticiones en los muestreadores 2 y 3. Estas situaciones se modifican como se ve en la TABLA 10.2 de abajo. Analizando la tabla de abajo, vemos que, el marcador más bajo, es el 14 de la columna dos, el 17 de la columna uno y, el 20 de la columna dos y tres. La tabla de abajo muestra el orden de los rangos. TABLA 10.2. Tabla mostrando los datos de los marcadores con sus respectivos rangos. (Elaboración propia) __________________________________________________________________ Mestreador 1 Muestreador 2 Muestreador 3 Marcador 51 32 17 69 86 62 96
Rango 9 8 2 14 17 12 20
Marcador Rango 14 1 31 7 68 13 87 18 20 *3.5 28 6 77 16 97 21
Marcador Rango 89 19 20 *3.5 60 11 72 15 56 10 22 5
*Debido a que hay dos números 20 entonces, (3 + 4)/2 = 3.5 Ahora se procede a sumar los rangos para cada una de las tres columnas: ΣR1 = 82
ΣR2 = 85.5
ΣR3 = 63.5
n1 = 7
n2 = 8
n3 = 6
La región crítica derecha se calcula usando la distribución de la JI cuadrada. El valor de χ2α;ν, es decir, χ20.05;ν que, en este caso, es de χ2 0.05;2 = 5.991, esto es, con ν = k – 1 = 3 – 1 = 2 grados de libertad. 10-7
Dr. Héctor Quevedo Urías
Enseguida, sustituyendo los valores de la fórmula de Kruskal-Wallis (10-1) y resolviendo por H da: 12 (82)2 (85.5)2 (63.5)2 H = ────────[───── + ────── + ─────] – 3 (21+1) 21(21+1) 7 8 6 = (0.026)[(960.57) + (913.78) + (672.04)] - 66 = 0.21 Conclusión: Debido a que el valor de la estadística χ2 = H = 0.21 es menor que χ20.05;2 = 5.991, no se puede rechazar la hipótesis nula de igualdad de promedios y se dice que la prueba no es significante. Esto dice que tenemos una evidencia muy insuficiente para rechazar la hipótesis nula de que las concentraciones de las tres poblaciones de NO2 provenientes de los tres muestreadores son iguales. Ejemplo #2. En un estudio de toxicología, con el objeto de verificar el contenido de alquitrán se prueban cuatro muestras aleatorias de cigarrillos. Como no se sabe si la población muestreada es normal, en lugar de usar un análisis de varianza paramétrico, se decide usar un método no paramétrico, es decir, el de KruskalWallis. Usando un nivel de significancia de α = .05 probar que no hay diferencias entre las cuatro poblaciones de marcas de cigarrillos. Los datos de las cuatro marcas de cigarrillos con sus respectivas concentraciones de alquitrán se dan en la tabla de abajo. También calcular el valor de la probabilidad p. TABLA 10.3. Tabla mostrando los datos. (Elaboración propia) Marca A Marca B Marca C Marca D 10 18 15 20 11 14 14 19 13 15 12 21 14 16 16 17 Solución: 10-8
Dr. Héctor Quevedo Urías
1. Primero sacamos los rangos correspondientes, como se ve en la tabla de abajo. TABLA 10.4. Tabla mostrando los rangos. (Elaboración propia) Marca A Rango Marca B Rango Marca C Rango Marca D 10 1 18 13 15 8.5 20 11 2 14 6 14 6 19 13 4 15 8.5 12 3 21 14 6 16 10.5 16 10.5 17
Rango 15 14 16 12
2. Enseguida, establecemos la región crítica unilateral derecha (no hay más que esa, ¿por qué?). χ2[α;k-1] = χ2[.05;4-1] = χ2[.05;3] = 7.82 (de la tabla de la JI cuadrada) 3. Usando la fórmula de Kruskal-Wallis (10-1) y sustituyendo: N = 16, (ΣR1)2 = (13)2 = 169, (ΣR2)2 = (38)2 = 1444, (ΣR3)2 = (28)2 = 784, (ΣR4)2 = (57)2 = 3249, n1 = n2 = n3 = n4 = 4, da: H = 12/16(16+1) [169/4 + 1444/4 + 784/4 + 3249/4] – 3(16+1) = 11.06. 4. Conclusión: Debido a que 11.27 > 7.82 se rechaza la hipótesis de igualdad de poblaciones, y se dice que si hay diferencias entre los promedios de las concentraciones de alquitrán en los cigarrillos. 5. El valor de la probabilidad p se saca buscando 11.06, con 3 grados de libertad en la tabla de la JI cuadrada y está entre .025 y .01. Si se requiere mas precisión se puede usar la fórmula de interpolación (5-28), es decir, buscando el valor de 11.27. Los valores interpolados son: λ2 = 0.99, χ2 = 11.345, λ1 = 0.975, χ2 = 9.348, H = 11.06 Sustituyendo estos valores en la fórmula de interpolación: (λ2 – λ1) / (χ22 – χ21) = (λ2 – X) / (λ2 – χ2calc.) (0.99 – 0.975)/(11.345 – 9.348) = (0.99 – X)/(11.345 – 11.06)
10-9
Dr. Héctor Quevedo Urías
Ahora, resolviendo por X da X = .9879. El valor de p es igual a p = 1 - .9879 = 0.01. Este valor de la probabilidad p es significante. Ejemplo #3. El libro Statistics for Modern Business Decision de Lawrence L. Lapin, menciona un estudio de química analítica, relacionado con las impurezas que contienen los reactivos químicos, las cuales pueden interferir en las reacciones químicas, es decir, en cuanto a la cantidad de tiempo requerido para que se logre la reacción química. Los datos se dan en la tabla de abajo. TABLA 10.5. Tabla mostrando los niveles de impurezas en los reactivos químicos en función del tiempo para que se haga la reacción. Niveles de impurezas .001
.01
.05
.10
Tiempo de reacción en minutos 103
104
153
207
111
113
127
183
107
117
143
173
105
120
119
113
138 143
Fuente: Lapin (1982) (a) Calcular la estadística H de Kruskal-Wallis. (b) Usando un nivel de significancia de α = 0.05 probar la hipótesis nula de que los niveles de impurezas en los reactivos químicos no afectan el tiempo de reacción. Hacer esto, usando la prueba de hipótesis tradicional y la prueba de hipótesis no tradicional. Solución: 10-10
Dr. Héctor Quevedo Urías
La tabla de abajo enlista los marcadores y sus rangos correspondientes. TABLA 10.6 Tabla mostrando los valores de los marcadores en forma ascendente de los cuatro niveles de impurezas en los reactivos químicos y el tiempo. Marcador | 103
104 105 107 111 113 113 117 119 120 127 138 143 143 153 173 183 207
Rango
2
|
1
3
4
5
6
7
8
9
10
11
12
13
14
15
16 17 118
TABLA 10.7. Tabla mostrando los cuatro marcadores con sus correspondientes rangos. (1) (2) (3) (4) .001 .01 .05 .10 _______________ ______________ ______________ _______________ Marcador Rango Marcador Rango Marcador Rango Marcador Rango 103
1
104
2
153
15
207
18
111
5
113
6.5*
127
11
183
17
107
4
117
8
143
13.5*
173
16
105
3
120
10
119
9
113
6.5*
138
12
143
13.5*
*Debido a que hay dos 113 y dos 143, entonces el rango correspondiente a 113 es (6+7)/2 = 6.5 y el rango correspondiente a 143 es (13 + 14)/2 = 13.5 Ahora se procede a sumar los rangos para cada una de las cuatro columnas. ΣR1 = 13
ΣR2 = 33
ΣR3 = 74
ΣR4 = 51
n1 = 4
n2 = 5
n=6
n=3
La región crítica derecha se calcula usando la distribución de JI cuadrada. El valor de χ2α;ν = χ20.05;3 = 7.82, es decir, donde ν = k – 1 = 4 – 1 = 3. Enseguida sustituyendo los valores de arriba en la ecuación (10-1) 10-11
Dr. Héctor Quevedo Urías
(13)2
12
(33)2
(74)2
(51)2
[
]
H = ─────── ─────── + ────── + ────── + ────── – 3(18 + 1) 18(18+1) 4 5 6 3
= 0.035 [42.25 + 217.8 + 912.67 + 867.0] - 57 = 0.035(2039.72) – 57 = 14.39 Conclusión: debido a que el valor de la estadística χ2 = H = 14.39 es mayor que 7.82 se rechaza la hipótesis nula y se dice que los niveles de impurezas si están afectando el tiempo de las reacciones químicas. Ahora bien, para hacer la prueba de hipótesis de p o no tradicional, se hace usando la fórmula de interpolación de abajo: (λ2 – λ1) / (χ22 – χ21) = (λ2 – X) / (χ22 - χ2calc.) Se busca en la tabla de JI cuadrada el valor de χ2calc. = 14.39 con 4 g.l. y está entre 14.86 con valor porcentual de .005 y 13.277 con valor porcentual de .01. Es decir, con los valores de λ2 = .005, λ1= .01, χ22 = 14.86, χ21 = 13.277, y χ2calc. = 14.39. Sustituyendo todos estos valores en la fórmula de arriba y resolviendo por X da: (.005 - .01) / (14.86 – 13.277) = (.005 – X) / (14.86 – 14.39) X = 0.0072 = p Este valor de 0.0072 es mucho muy significante y refrenda la decisión tomada en afirmar que si hay diferencias entre los niveles de impurezas que retardan las reacciones químicas.
10-12
Dr. Héctor Quevedo Urías
Ejercicios Capítulo 10 10.1. En un experimento para determinar, cuál de tres tipos de motores usaban menos gasolina, se hizo un estudio tratando de mantener todas las demás variables constantes. Usar un nivel significante de α = 0.05. (a) Establecer Ho: y H1: y calcular H.
(Ho:µ1 = µ2 = µ3; H1:µ1 ≠ µ2 ≠ µ3, H = 1.66 y se retiene Ho:) (h > χ20.05;2 = 5.991)
(b) Establecer la región crítica.
(c) Usar la prueba no paramétrica de Kruskal-Wallis y probar que no hay diferencias en el consumo de gasolina de los tres motores, en cuanto al millaje obtenido.
(H = 1.66 y se retiene Ho:)
Tabla mostrando los datos. (Elaboración propia) Motor 1
Motor 2
Motor 3
24.0 16.7 22.8 19.8 18.9 17.8
23.2 19.8 18.1 17.6 20.2 18.9 18.8 19.3
18.4 19.1 17.3 17.3 19.7
10.2. La tabla de abajo da las temperaturas de 5 sujetos seleccionados, aleatoriamente, de tres grupos diferentes. Usando un nivel de significancia de α = 0.05 probar que las tres poblaciones de temperaturas son iguales. Calcular p.
10-13
Dr. Héctor Quevedo Urías
Tabla mostrando las temperaturas del cuerpo (oF) clasificadas por edades. (Elaboración propia) 18-20 años
21-29 años
>30 años
98.0 98.4 97.7 98.5 97.1
99.6 98.2 99.0 98.2 97.9
98.6 98.6 97.0 97.5 97.5
10.3. Un panel de siete expertos fue consultado para calificar a cinco industrias (A, B, C, D, E) en cuanto a la probabilidad de que cambios tecnológicos produzcan mejoras en el control de la contaminación ambiental, en el curso de los próximos 10 años. Las calificaciones en se dan en la tabla de abajo. Tabla mostrando los datos. (Elaboración propia) Industrias _________________________________________________ A B C D E _________________________________________________ Experto 1 2 3 4 5 6 7
0.15 0.30 0.20 0.00 0.10 0.25 0.40
0.75 0.60 0.80 0.50 0.55 0.70 0.95
0.10 0.20 0.30 0.25 0.15 0.35 0.45
0.00 0.05 0.00 0.10 0.15 0.25 0.20
0.30 0.25 0.50 0.60 0.40 0.45 0.35
(a) Probar con el nivel de significancia de α = 0.05, que las poblaciones son idénticas. (b) Calcular el valor de la probabilidad p. 10-14
Dr. Héctor Quevedo Urías
10.4. El libro Probabilidad y Estadística para Ingeniería y Ciencias de Jay L. Devore (p. 662) proporciona los siguientes datos, los cuales se refieren a la concentración del isótopo estroncio 90, en muestras de leche obtenidas de 5 lecherías seleccionadas, aleatoriamente, en cada una de cuatro regiones diferentes. Tabla mostrando los datos de las concentraciones de estroncio en leche. Región 1
6.4
5.8
6.5
7.7
6.1
Región 2
7.1
9.9
11.2
10.5
8.8
Región 3
5.7
5.9
8.2
6.6
5.1
Región 4
9.5
12.1
10.3
12.4
11.7
(Fuente: Devore, 2001) Hacer los siguientes cálculos: (a) Probar con el nivel de significancia de 0.10 para verificar si el promedio de concentraciones de estroncio 90 difiere, al menos en dos de las regiones. (b) Calcular el valor de p. (c) Hacer un análisis de varianza paramétrico y comparar los resultados. 10.5. Los datos de abajo muestran 4 tratamientos para determinado proceso, en el cual no se sabe si la población muestreada es normal. Usar la ANOVA paramétrica y, luego, usar el método no paramétrico de Kruskal-Wallis. ¿Hay suficiente evidencia, con α = 0.05, que nos permita concluir que existen diferencias entre los 4 tratamientos? En ambos casos comparar los resultados y examinar el valor de F y de p. ¿Cuál de los dos métodos (paramétricos o no paremétricos) sería el más preciso, si se supiera que la población muestreada fuera normal?
10-15
Dr. Héctor Quevedo Urías
Datos del problema de arriba. (Elaboración propia) Tratamientos 1 2 3 4 12 10 10 9 15 12 8 6 13 11 12 8 18 14 15 7 20 10 13 9 19 11 11 7 15 12 13 6 ________________________________________________________________
10-16
Dr. Héctor Quevedo Urías
CAPITULO 11 Series de tiempo Clasificación de los movimientos de las series de tiempo.- Tendencias a largo plazo.- Componentes cíclicos de series de tiempo.- Variaciones estacionales.Variación irregular.- Métodos para encontrar líneas de tendencia.- Línea de los cuadrados mínimos y parábolas de los cuadrados mínimos.Cualquier variable en función del tiempo, en sucesión, se llama series de tiempo. Las series de tiempo son una secuencia de valores de variables tomadas en periodos de tiempo sucesivos. La gráfica de una serie de tiempo es un diagrama, con el eje vertical mostrando el valor observado (y) y, con el eje horizontal denotando el tiempo (minutos, días, años, etc.). Las gráficas como los histogramas o diagramas de tallo y hoja son métodos visuales útiles para mostrar la variación en los datos. Sin embargo, el tiempo es un factor muy importante que contribuye a la variación observada de los datos, que los histogramas o las gráficas de caja no los toman en cuenta. Las series de tiempo son un conjunto de observaciones tomadas a tiempos específicos, usualmente, a intervalos iguales en un orden cronológico. Las series de tiempo o secuencias de tiempo se definen como datos estadísticos que son coleccionados, registrados u observados en incrementos de tiempos sucesivos. El análisis de los datos de las series de tiempo es de interés para aquéllos quienes deseen entender la naturaleza de los datos pasados y presentes. También, las series de tiempo son de interés para aquellos investigadores, quienes deseen usar el conocimiento de datos pasados para predecir el futuro. Las aplicaciones de las series de tiempo son muy comunes en la economía, pero también en la economía o la ingeniería. Por ejemplo: 11-1
Dr. Héctor Quevedo Urías
1. Los gobiernos de las naciones industrializadas quieren saber los valores futuros de las tasa de intereses monetarios. Las naciones en desarrollo quieren saber las tendencias de las tasas de devaluación de la moneda. También es deseable predecir las tasas de empleos o de desempleos. Igualmente, es importante saber los porcentajes de los incrementos de los costos de la vida. 2. Otras aplicaciones de las series de tiempo son los pronósticos de las tasas de interés para la construcción de viviendas y el costo de los materiales de construcción. 3. También las compañías manufacturadoras quieren pronosticar la demanda de sus productos y sus acciones en el mercado. 4. En ingeniería ambiental, los activistas y protectores del medio ambiente quieren saber cuáles son las tendencias en los aumento de los gases de invernadero, como el bióxido de carbono (ocasionado por la emisiones vehiculares, la industria, fuegos forestales, etc.) que están calentando la tierra, fundiendo los glaciares montañosos y las capas polares y cambiando el clima mundial. También es interesante saber las tendencias y los aumentos de la radiación ultravioleta, que tanto daño está causando al ser humano, por la destrucción del ozono natural estratosférico, causado por la irracionalidad del hombre moderno. 5. Las series de tiempo también aplican para saber las tendencias y pronósticos de los incrementos de la población mundial, etc. Cuando se grafican las mediciones de series de tiempo, a menudo se observan tendencias, ciclos o variaciones importantes de los datos que, de otra manera, pasarían inadvertidos. Definición: Matemáticamente, una serie de tiempo se define por valores Y1, Y2,....... de una variable Y, como la temperatura, concentraciones de contaminantes, como CO2, SO2, partículas atmosféricas, etc., a tiempos t1, t2,.... Por lo tanto, Y es una función de t 11-2
Dr. Héctor Quevedo Urías
simbolizada por Y = F(t). Clasificación de los movimientos de las series de tiempo Los movimientos característicos de las series de tiempo pueden clasificarse en cuatro tipos llamados componentes de series de tiempo. Estos componentes de las series de tiempo se describen como sigue: 1. Tendencias a largo plazo o movimientos seculares. 2. Movimientos o fluctuaciones cíclicas. 3. Variaciones estacionales o movimientos estacionales. 4. Variaciones o movimientos irregulares o aleatorios. Tendencias a largo plazo La tendencia a largo plazo o tendencia secular de una serie de tiempo es el componente uniforme de las series que representan el crecimiento o decremento de tiempos, sobre un periodo grande de tiempo. La tendencia secular se refiere a la dirección general en la cual la gráfica de unas series aparecen moverse durante un intervalo de tiempo. Por ejemplo, la población de los Estados Unidos durante los últimos 40 años ha mostrado una tendencia de crecimiento de 137 millones de personas a 246 en 1988. Las tendencias a largo plazo se ve en la Figura 11.0(a). La determinación de las tendencias de las líneas y de las curvas se puede hacer usando el método de ajustamiento de curvas. También se puede hacer por medio del análisis de los diagramas esparcidos, para encontrar la función matemática que mejor encaje en los datos. Componentes cíclicos de series de tiempo Los componentes cíclicos se refieren a los movimientos recurrentes de arriba y abajo de las tendencias de las series de tiempo. Estas fluctuaciones de onda, llamadas ciclos de los negocios, son diferentes de las fluctuaciones estacionales. Es decir, en el 11-3
Dr. Héctor Quevedo Urías
sentido de que cubren periodos largos de tiempo, tienen causas diferentes y son menos predecibles. Las fluctuaciones duran de 2 a 10 años, o más, cuando se miden las ondas de cresta a cresta o de canal a canal. Ejemplos de componentes ciclos son periodos de recesiones económicas o de periodos de inflación, demanda de productos a largo plazo, etc. Esta situación se ve en la Figura 11.0 (b) Variaciones estacionales Este tipo de series de tiempo se refieren a variaciones periódicas, pero no están limitadas a variaciones con la estación del año. Estos son patrones de periodos en las series de tiempo que se completan en un año y, luego se repiten de acuerdo al mismo patrón de periodo en años, subsecuentes. Por ejemplo, los precios de los mercados financieros pueden mostrar tendencias altas o bajas en un día o en una semana. En estudios ambientales, las fluctuaciones de los contaminantes muestran tendencias cíclicas durante el día, como en el caso del estudio de las concentraciones de ozono troposferico. Otros ejemplos son la producción de ciertos productos de granjas agrícolas, el número de vehículos que pasan por cierto punto, entre dos sitios, etc. La unidad de tiempo en variaciones estacionales es menos que un año, pero pueden ser de un mes, una semana, o parte del día. Esta situación se ve en la Figura 11.0(c). Variación irregular Este es un tipo de variación que no está considerado por tendencias, ciclos o factores estacionales, sino que se compone de fuerzas no recurrentes, esporádicas que no se describen como o atribuidas a factores de tendencias, ciclos, o estacionales. Ejemplos de variaciones irregulares son movimientos esporádicos de series de tiempo debido a inundaciones, granizadas, heladas, tornados, huracanes, sequías, fuegos forestales, etc. 11-4
Dr. Héctor Quevedo Urías
Además, las figuras de abajo muestran ejemplos de algunos posibles patrones de tendencia en series de tiempo. Por ejemplo, la Figura 11.1(a) muestra una tendencia no lineal. La Figura 11.1(b) muestra una tendencia lineal que disminuye. La Figura 11.1(c) muestra una gráfica sin tendencia.
Figura 11.0. Gráficas mostrando los tipos de tendencias. La gráfica (a) muestra una tendencia de línea a largo plazo o de movimiento secular. La gráfica (b) muestra una línea de tendencia a largo plazo con un movimiento cíclico sobrepuesto. La gráfica (c) muestra tendencias cíclicas a largo plazo y movimientos estacionales. (Spiegel, 1961).
Figura 11.1. Ejemplos de algunos patrones de tendencias en series de tiempo. Aplicaciones de las funciones de series de tiempo Las aplicaciones en ingeniería de las tendencias a largo plazo o tendencias seculares son varias. Ejemplos de estas aplicaciones son los incrementos de la contaminación ambiental. Un ejemplo clásico es el aumento constante de las concentraciones de bióxido de carbono, gas metano, vapor de agua, etc., a nivel mundial, que han estado ocurriendo desde el inicio de la era industrial hasta al presente. Esto, como es bien 11-5
Dr. Héctor Quevedo Urías
sabido, está corrompiendo el clima de nuestro planeta, al estarse calentando la tierra y las aguas marinas. Otros ejemplos, a los cuales se les pueden aplicar las series de tiempo, son los incrementos en la radiación ultravioleta (en sus formas de UV-A y UV-B), que están causando cáncer en la piel (en sus tres formas, melanoma, basal y escamoso) y daños en la visión y alteraciones en la estructura del DNA. Otras aplicaciones de las series de tiempo están relacionadas con los crecimientos poblacionales o demográficos. Otros más están relacionados con la producción industrial, la producción de energía, la economía, etc. Tipos de funciones matemáticas para líneas de tendencia Las ecuaciones o funciones matemáticas más comunes para aproximar los datos gráficos de líneas de tendencia de un diagrama esparcido se dan el la tabla de abajo. Aquí, las letras a, b y c representan valores constantes y, las letras X e Y, representan las variables independientes y dependientes, respectivamente.
11-6
Dr. Héctor Quevedo Urías
TABLA 11.0. Tabla mostrando los tipos de funciones matemáticas más comunes usadas para líneas de tendencia. (Elaboración propia) Función matemática
Descripción
(1) y = a + bx (2) y = f(x) = ax2 + bx + c (3) y = ax3 + bx2 + cx + d (4) y = ax4 + bx3 + cx2 + dx + e (5) y = a + bx + cx2 + ... + an xn (6) y = abx o Log y = Log a + (Log b) x (7) y = axb o Log y = Log a + b Log x (8) y = 1/a + bx o 1/y = a + bx (9) y = pqbx o Log y = Log p + bx Log q (10) y = abx + g (11) y = axb + g (12) y = Ln x (13) y = a – (a – b) exp(-(c)|x|)d (14) y = a – (a – b)/(1 + (c|x|)d (15) y = a(1 + (b – 1) exp(-c(x – d))1/(1 - b)
Línea recta Curva cuadrática o parabólica Curva cúbica Curva cuártica Polinomial generalizado Curva exponencial Curva geométrica Función hipérbola Curva de Gompertz Curva exponencial modificada Curva geométrica modificada Función logarítmica Función de Weibull Función de Morgan-Mercer-Floding Función de Richards
Para decidir, cuál función matemática es la más apropiada, para ajustar los datos se puede hacer viendo un diagrama esparcido de la gráfica de los datos. Por ejemplo, si el diagrama esparcido en papel semilogaritmo de Log (y) vs. x muestra una relación lineal, la ecuación tiene la forma de la curva exponencial (6). Si se usa el papel logaritmo completo, Log y-Log x, y los datos muestran una relación lineal, la ecuación tiene la forma de una curva geométrica (7). De cualquier manera, los programas de computadora, como el SAS, Minitab, NCSS, etc., son las mejores herramientas para encontrar la función que mejor ajuste los datos. Métodos para encontrar líneas de tendencia 1. El método a mano libre o visual. 11-7
Dr. Héctor Quevedo Urías
2. El método de los cuadrados mínimos. 3. El método de semipromedios. 4. El método de promedios en movimiento. 1. El método a mano libre consiste en ajustar la tendencia de una línea o curva, examinando la gráfica visualmente. Sin embargo, este método subjetivo depende mucho del juicio individual. 2. El método de los cuadrados mínimos puede usarse para encontrar la ecuación de la tendencia de la curva. Hay muchos programas de computadora que ayudan a esto. 3. El método del promedio del movimiento. Usando los órdenes apropiados del movimiento de promedios, los patrones cíclicos, estacionales o irregulares pueden ser eliminados dejando, solamente, la tendencia del movimiento. 4. Método de semipromedios. Este método consiste en separar los datos en dos partes (preferentemente iguales) promediando los datos en cada parte, obteniendo dos puntos en la gráfica de las series de tiempo. Enseguida, una línea de tendencia se dibuja obteniendo dos puntos en la gráfica de las series de tiempo. Este método es simple, pero puede dar resultados pobres. Este método es aplicable, solamente, cuando la tendencia es lineal o aproximadamente lineal. Método a mano libre para el ajustamiento de curvas Este es el método más simple para las series de tiempo. Consiste en graficar las series de tiempo y, por medio de observación visual, trazar una línea recta sobre los puntos. Una vez hecho esto, se estima la ecuación de la línea recta para después calcular cualquier valor de Yc sustituyendo el valor de X. Método de los cuadrados mínimos Este método es el más usado y preciso para encontrar la ecuación de una serie de tiempo. Considérese la Figura 11.2 de abajo. 11-8
Dr. Héctor Quevedo Urías
Figura 11.2. Gráfica mostrando el método de los cuadrados mínimos. Fuente: Spiegel (1961). Los puntos de los datos se dan por (X1, Y1), (X2, Y2), ..., (Xn, Yn). Para un valor dado de X, digamos, X1, habrá una diferencia entre el valor Y1 y el valor correspondiente como se determinó de la curva C. Como se ve en la gráfica, denotamos esta diferencia por D1, la cual, en algunas ocasiones se refiere como la desviación, error o residual y puede ser positivo, negativo o cero. Similarmente, correspondiendo a los valores de X1, X2,.. Xn, obtenemos las desviaciones D2, D3, ..., Dn. La medición de “bondad de ajuste” se da por la relación D21 + D22 + ... + D2n. De esta manera, si la suma de estos cuadrados D21, D22, D23, etc., es pequeña, el ajuste es bueno. Pero, si la suma es grande, el ajuste es malo, lo cual quiere decir que, el error o residual será grande, indicando mucha variación entre los datos (Spiegel, 1961). Definición. De todas las curvas que aproximan un grupo de datos en el sentido de los cuadrados mínimos, la curva que tiene la propiedad de: D21 + D22 +... + D2n es un mínimo y se llama la curva que mejor ajusta los datos. Una curva que tenga esta propiedad se dice que ajusta los datos en el sentido del mejor cuadrado mínimo y se llama la curva de los cuadrados mínimos. Por lo tanto, una línea que tenga esta propiedad se llama la línea de los cuadrados mínimos, parábola de los cuadrados mínimos, etc. 11-9
Dr. Héctor Quevedo Urías
Línea de los cuadrados mínimos y parábolas de los cuadrados mínimos La línea de los cuadrados mínimos, que aproxima el conjunto de puntos (X1, Y1), (X2, Y2), ... (Xn, Yn), ya se discutió en el Capítulo 8, donde se habló de regresión y correlación simple y múltiple. En ese capítulo se describieron modelos de regresión de una línea recta. Análogamente, en el Capítulo 9, se describieron modelos polinomiales, con una o más de dos variables independientes. También, en ese capítulo se describieron modelos cúbicos. Siendo así, entonces, no se repetirán los mecanismos usados para ajustar los datos a los modelos más apropiados. Ejemplos usando las series de tiempo Ejemplo #1. Se dan los datos de las siguientes concentraciones de bióxido de carbono (CO2) (Y) en función del tiempo (X) en la tabla de abajo. TABLA 11.1. Tabla mostrando los datos de CO2 en función del tiempo. (Elaboración propia) Conc. de CO2 (Y) | 1 2 4 4 5 7 8 9 10 11.5 (Millones de toneladas) Tiempo (X) | 1900 1920 1930 1940 1950 1960 1970 1980 1990 2000 (Años codificados)
| 1
3
4
6
8
9
11
14
15
16
Hacer los siguientes cálculos: (a) Trazar a mano en la gráfica obtenida los datos y una línea recta. (b) Encontrar la ecuación de esta línea. (c) Usando estadística encontrar la línea ajustada de los cuadrados mínimos y comparar los valores de la pendiente y del intercepto Y encontrados en el inciso (b). (d) Trazar en la gráfica la línea de la ecuación encontrada (a). (e) Usando las ecuaciones encontradas en los incisos (b) y (c), estimar las concentraciones de CO2 para el año 2010. Solución: 11-10
Dr. Héctor Quevedo Urías
(a) Graficamos los puntos (1,1), (2,3), (4,4), (6,4), (8,5), (9,7), (11,8), (14,9) en un sistema de coordenadas rectangulares como se muestra en la Figura 11.3 de abajo. Gráfica mostrando las concentraciones de bióxido de carbono vs. tiempo 12
Conc. de CO2 (Y)
10 8 6 4 2 0 0
2
4
6
8 10 Tiempo (X)
12
14
16
Figura 11.3. Gráfica mostrando las concentraciones de CO2 en función del tiempo. (Elaboración propia) (b) Para obtener la ecuación de la línea, usamos la gráfica de arriba y seleccionamos cualesquiera de dos puntos sobre la línea trazada a mano, esto es, como punto P y punto Q. Enseguida, estimamos las coordenadas de estos dos pares puntos que son (1, 1) y (12, 7.5). Ahora usando la ecuación de los cuadrados mínimos dada por la función Y = a + b(X) y sustituyendo los valores de Y1 = 1, X1 = 0, Y2 = 7.5 y X2 = 12 nos da: 1.0 = a + b(0) 7.5 = a + b(12) Resolviendo da a = 1. 7.5 = 1 + b (12) y b = .542. Por lo tanto, la ecuación es: Yc = 1 + .542(X) Otra forma de hacer lo mismo es con la ecuación de la forma del punto de la pendiente de una línea, Y = Y1 = m(X – X1), donde m = (Y2 – Y1)/(X2 – X1), para dar: Y – Y1 = (Y2 – Y1)/(X2 – X1) (X – X1) 11-11
(11-1)
Dr. Héctor Quevedo Urías
Ahora sustituyendo los valores en (11-1) da: Y – 1 = (7.5 – 1)/(12 – 0) (X – 0), Y – 1 = .542 X, esto es Yc = 1 + .542 (X) (c) Para encontrar la ecuación de la línea recta usamos métodos estadísticos, es decir, usando las ecuaciones que estiman el intercepto en Y y la pendiente de la línea (Ver capítulo de regresión). (Σ Y)(Σ X 2) – (Σ X)(Σ XY) a = ──────────────── n Σ X 2 – (Σ X)2
(11-2)
n ΣXY – (ΣX)(ΣY) b = ──────────── n ΣX 2 – (ΣX)2
(11-3)
Para esto, podemos usar una calculadora de bolsillo o un programa de computadora y estimamos las siguientes sumatorias: ΣX = 56, ΣY = 40, ΣX 2 = 524, ΣY 2 = 256, (ΣY)2 = 1600, ΣXY = 364, ΣXΣY = 2240, (ΣX)2 = 3136, n = 8. Ahora, sustituyendo todos estos valores en las ecuaciones (11-2) y (11-3), para a y b dan los siguientes resultados: (40)(524) – (56)(364) Intercepto en Y = a = ────────────── = .545 (8)(524) – (56)2
11-12
Dr. Héctor Quevedo Urías
(8)(364) – (56)(40) Pendiente = b = ───────────── = .636 (8)(524) – (56)2 Por lo tanto, la ecuación de los cuadrados mínimos es: Yc = .545 + .636(X) Aquí, se puede ver que esta ecuación es más precisa, que la obtenida por medio del juicio individual. Ahora, para trazar la línea en la gráfica correspondiente a la ecuación de arriba, ponemos Y = 0 y resolvemos por X para dar X = -0.857. Enseguida, ponemos X = 0 y resolvemos por Y para dar Y = 0.545. Enseguida, usando estos dos pares de coordenadas, es decir, (–0.857, 0) y (0, 0.545) podemos trazar en la gráfica una línea más precisa que aquélla hecha a mano. (e) Usando las ecuaciones Y = 1 + .542(X) e Y = .545 + .636(X), cuando X = 17 (año 2010), nos da, respectivamente, Y = 10.21 y 11.36, este último valor siendo más preciso que el anterior. Ejemplo #2. Una compañía de programas de computadora reporta la demanda para un determinado paquete de computadora, sobre un periodo de tres años. Los datos se dan en la tabla de abajo: TABLA 11.2. Tabla mostrando los datos del problema. (Elaboración propia) Demanda trimestral (Y) | 37 22 62 80 77 95 94 131 148 155 126 161 Periodos de tiempo (X) | 1
2
3
4
5
6
7
8
9
10 11
12
Hacer los siguientes cálculos: (a) Visualmente ajustar una línea recta a los datos de la gráfica. (b) Usando métodos estadísticos estimar la ecuación lineal de las series de tiempo, es 11-13
Dr. Héctor Quevedo Urías
decir, Yc = a + b(X) Nótese que también se puede usar Y en lugar de Yc). (c) Trazar una línea recta usando el par de coordenadas derivados de esta ecuación. (d) Comparar la línea hecha a mano con la línea obtenida en (c). (e) Predecir el valor de Yc cuando X = 140 Solución: (a) La gráfica de abajo muestra el diagrama esparcido de los datos. Gráfica mostrando la demanda trimestral vs. periodos de tiempo 180
Demanda trimestral (Y)
160 140 120 100 80 60 40 20 0
2
4
6 8 Periodos de tiempo (X)
10
12
Figura 11.4. Gráfica mostrando los datos del ejemplo de arriba. (Elaboración propia) (a) Para obtener la ecuación de la línea, usamos la gráfica de arriba y seleccionamos cualesquiera de dos puntos sobre la línea trazada a mano, esto es, como punto P y punto Q. Enseguida, estimamos las coordenadas de estos pares de puntos que son (1, 1) y (12, 7.5). Ahora, usando la ecuación de los cuadrados mínimos dada por: Y = a + b(X)
(11-3)
Ahora, sustituyendo todos los valores de Y1 = 1, X2 = 0 y Y2 = 7.5 y X2 = 12, en la ecuación (11-3) de arriba, nos da: 1.0 = a + b(0) y 7.5 = a + b(12). (b) Usando métodos estadísticos calculamos las sumatorias: ΣX = 78, ΣX 2 = 650, (ΣX)2/n = 507, ΣY = 1188, ΣY 2 = 140774, (ΣY)2/n = 117,612 Intercepto Y = 20.55, Pendiente = 12.07, R = 0.95. 11-14
Dr. Héctor Quevedo Urías
Por lo tanto, la ecuación de lineal de las series de tiempo para este problema es: Yc = 20.55 + 12.07(X) Para trazar una línea recta sobre los datos, seleccionamos dos puntos, digamos X = 3 y X = 9 y resolviendo por Yc en la ecuación lineal de las series de tiempo, da las coordenadas (3, 56.76) y (9, 129.18). Ahora, juntamos los puntos de estas dos coordenadas y trazamos la línea como se ve en la figura de arriba, la cual muestra la demanda trimestral (Y) por un periodo de 3 años (X). (c) Para predecir el valor de Yc cuando X = 140 los podemos hacer por interpolación usando la Figura 11.4 o, simplemente, sustituyendo el valor de X = 140 en la ecuación de las series de tiempo, esto es: Yc = 20.55 + 12.07(X) = 20.55 + 12.07(140) = 1,710.35 Ejemplo #3. En un estudio hipotético relacionado con los casos de SIDA, se da la tabla de abajo. Estimar la función ajustada de tendencia usando análisis de tendencia con una función exponencial.
11-15
Dr. Héctor Quevedo Urías
TABLA 11.3. Tabla mostrando los casos de SIDA de un estudio hipotético. Años
Número hipotético de casos de SIDA
1981
1991
1,200
390,000
1982
1992
6,500
500,000
1983
1993
12,000
900,000
1984
1994
15,000
1,500,000
1985
1995
27,000
2,900,000
1986
1996
50,000
4,000,000
1987
1997
63,000
7,000,000
1988
1998
110,000
10,000,000
1989
1999
170,000
15,000,000
1990
2000
210,000
25,000,000
_____________________________________________________________________________________________
Hacer lo siguiente: (a) Derivar la ecuación del modelo propuesto. Con este modelo predecir el número de casos de SIDA para el año 2008. (El lector lo deberá hacer). No. de casos de SIDA para periodo (1981-2000) Growth Curve Model Yt = 2097.90 * (1.60517**t) 30000000
Variable A ctual Fits
Casos de SIDA
25000000
A ccuracy Measures MA PE 2.04662E+01 MA D 2.83975E+05 MSD 4.13874E+11
20000000 15000000 10000000 5000000 0 2
4
6
8
10 12 Index
14
16
18
20
Figura 11.5. Gráfica mostrando la relación de los casos de SIDA en función del tiempo.
11-16
Dr. Héctor Quevedo Urías
Ejercicios Capítulo 11. 11.1. Los datos de abajo muestran los millones de toneladas de bióxido de carbono emitidos a la atmósfera durante los años de 1950 a 1955 en cierta región industrial. Tabla mostrando los datos del problema. (Elaboración propia) ________________________________________________________________ Años (X) Codificados Millones de toneladas de CO2 (Y) 1950 (50) 5 1951 (51) 8 1952 (52) 12 1953 (53) 15 1954 (54) 20 1955 (55) 23 Hacer los siguientes cálculos: (a) Graficar los datos del diagrama esparcido. (b) Trazar una línea visualmente que mejor conecte los datos y derivar la ecuación y estimar la ecuación por juicio individual. (c) Estimar la ecuación de los cuadrados mínimos, es decir, usando métodos estadísticos.
(Y = 5 + 3.6 X)
(d) Predecir los millones de toneladas de CO2 (el valor de Y) para el aňo 2005. Sugerencia: Para resolver estos problemas usar el programa de computadora Minitab o SAS. 11.2. Este problema está relacionado con un estudio de contaminación atmosférica, de partículas menores que 10 micras emitidas en cierta región industrial, durante el periodo de 1984 a 1999. Los datos de las concentraciones promedio de las partículas se muestran en la tabla de abajo. (a) Hacer una gráfica con los datos (b) Usando métodos estadísticos (no de juicio individual) estimar la ecuación de la 11-17
Dr. Héctor Quevedo Urías
línea de las series de tiempo (Yc) y trazar una línea recta sobre los datos gráficos (c) Estimar las concentraciones promedio de partículas para el año 2003 por medio de interpolación y por medio de la ecuación. Tabla mostrando los datos del problema. (Elaboración propia) ________________________________________________________________ Años Conc. promedio Años Conc. promedio (ppm) (ppm) 1984 (84)
100
1992 (92)
116
1985 (85)
110
1993 (93)
117
1986 (86)
112
1994 (94)
118
1987 (87)
115
1995 (95)
120
1988 (88)
113
1996 (96)
123
1989 (89)
116
1997 (97)
125
1990 (90)
117
1998 (98)
124
1991 (91)
117
1999 (99)
125
11.3. Decir si la gráfica de abajo muestra tendencia o estacionalidad. Ventas
Tiempo 11.4. Qué tipo de tendencia muestra la gráfica de abajo, es decir, ¿tendencia o 11-18
Dr. Héctor Quevedo Urías
estacionalidad?
11.5. La gráfica de abajo muestra, ¿tendencia o estacionalidad?
(tendencia)
Ventas anuales (unidades)
Precio
11-19
Dr. Héctor Quevedo Urías
CAPITULO 11 Series de tiempo Clasificación de los movimientos de las series de tiempo.- Tendencias a largo plazo.- Componentes cíclicos de series de tiempo.- Variaciones estacionales.Variación irregular.- Métodos para encontrar líneas de tendencia.- Línea de los cuadrados mínimos y parábolas de los cuadrados mínimos.Cualquier variable en función del tiempo, en sucesión, se llama series de tiempo. Las series de tiempo son una secuencia de valores de variables tomadas en periodos de tiempo sucesivos. La gráfica de una serie de tiempo es un diagrama, con el eje vertical mostrando el valor observado (y) y, con el eje horizontal denotando el tiempo (minutos, días, años, etc.). Las gráficas como los histogramas o diagramas de tallo y hoja son métodos visuales útiles para mostrar la variación en los datos. Sin embargo, el tiempo es un factor muy importante que contribuye a la variación observada de los datos, que los histogramas o las gráficas de caja no los toman en cuenta. Las series de tiempo son un conjunto de observaciones tomadas a tiempos específicos, usualmente, a intervalos iguales en un orden cronológico. Las series de tiempo o secuencias de tiempo se definen como datos estadísticos que son coleccionados, registrados u observados en incrementos de tiempos sucesivos. El análisis de los datos de las series de tiempo es de interés para aquéllos quienes deseen entender la naturaleza de los datos pasados y presentes. También, las series de tiempo son de interés para aquellos investigadores, quienes deseen usar el conocimiento de datos pasados para predecir el futuro. Las aplicaciones de las series de tiempo son muy comunes en la economía, pero también en la economía o la ingeniería. Por ejemplo: 11-1
Dr. Héctor Quevedo Urías
1. Los gobiernos de las naciones industrializadas quieren saber los valores futuros de las tasa de intereses monetarios. Las naciones en desarrollo quieren saber las tendencias de las tasas de devaluación de la moneda. También es deseable predecir las tasas de empleos o de desempleos. Igualmente, es importante saber los porcentajes de los incrementos de los costos de la vida. 2. Otras aplicaciones de las series de tiempo son los pronósticos de las tasas de interés para la construcción de viviendas y el costo de los materiales de construcción. 3. También las compañías manufacturadoras quieren pronosticar la demanda de sus productos y sus acciones en el mercado. 4. En ingeniería ambiental, los activistas y protectores del medio ambiente quieren saber cuáles son las tendencias en los aumento de los gases de invernadero, como el bióxido de carbono (ocasionado por la emisiones vehiculares, la industria, fuegos forestales, etc.) que están calentando la tierra, fundiendo los glaciares montañosos y las capas polares y cambiando el clima mundial. También es interesante saber las tendencias y los aumentos de la radiación ultravioleta, que tanto daño está causando al ser humano, por la destrucción del ozono natural estratosférico, causado por la irracionalidad del hombre moderno. 5. Las series de tiempo también aplican para saber las tendencias y pronósticos de los incrementos de la población mundial, etc. Cuando se grafican las mediciones de series de tiempo, a menudo se observan tendencias, ciclos o variaciones importantes de los datos que, de otra manera, pasarían inadvertidos. Definición: Matemáticamente, una serie de tiempo se define por valores Y1, Y2,....... de una variable Y, como la temperatura, concentraciones de contaminantes, como CO2, SO2, partículas atmosféricas, etc., a tiempos t1, t2,.... Por lo tanto, Y es una función de t 11-2
Dr. Héctor Quevedo Urías
simbolizada por Y = F(t). Clasificación de los movimientos de las series de tiempo Los movimientos característicos de las series de tiempo pueden clasificarse en cuatro tipos llamados componentes de series de tiempo. Estos componentes de las series de tiempo se describen como sigue: 1. Tendencias a largo plazo o movimientos seculares. 2. Movimientos o fluctuaciones cíclicas. 3. Variaciones estacionales o movimientos estacionales. 4. Variaciones o movimientos irregulares o aleatorios. Tendencias a largo plazo La tendencia a largo plazo o tendencia secular de una serie de tiempo es el componente uniforme de las series que representan el crecimiento o decremento de tiempos, sobre un periodo grande de tiempo. La tendencia secular se refiere a la dirección general en la cual la gráfica de unas series aparecen moverse durante un intervalo de tiempo. Por ejemplo, la población de los Estados Unidos durante los últimos 40 años ha mostrado una tendencia de crecimiento de 137 millones de personas a 246 en 1988. Las tendencias a largo plazo se ve en la Figura 11.0(a). La determinación de las tendencias de las líneas y de las curvas se puede hacer usando el método de ajustamiento de curvas. También se puede hacer por medio del análisis de los diagramas esparcidos, para encontrar la función matemática que mejor encaje en los datos. Componentes cíclicos de series de tiempo Los componentes cíclicos se refieren a los movimientos recurrentes de arriba y abajo de las tendencias de las series de tiempo. Estas fluctuaciones de onda, llamadas ciclos de los negocios, son diferentes de las fluctuaciones estacionales. Es decir, en el 11-3
Dr. Héctor Quevedo Urías
sentido de que cubren periodos largos de tiempo, tienen causas diferentes y son menos predecibles. Las fluctuaciones duran de 2 a 10 años, o más, cuando se miden las ondas de cresta a cresta o de canal a canal. Ejemplos de componentes ciclos son periodos de recesiones económicas o de periodos de inflación, demanda de productos a largo plazo, etc. Esta situación se ve en la Figura 11.0 (b) Variaciones estacionales Este tipo de series de tiempo se refieren a variaciones periódicas, pero no están limitadas a variaciones con la estación del año. Estos son patrones de periodos en las series de tiempo que se completan en un año y, luego se repiten de acuerdo al mismo patrón de periodo en años, subsecuentes. Por ejemplo, los precios de los mercados financieros pueden mostrar tendencias altas o bajas en un día o en una semana. En estudios ambientales, las fluctuaciones de los contaminantes muestran tendencias cíclicas durante el día, como en el caso del estudio de las concentraciones de ozono troposferico. Otros ejemplos son la producción de ciertos productos de granjas agrícolas, el número de vehículos que pasan por cierto punto, entre dos sitios, etc. La unidad de tiempo en variaciones estacionales es menos que un año, pero pueden ser de un mes, una semana, o parte del día. Esta situación se ve en la Figura 11.0(c). Variación irregular Este es un tipo de variación que no está considerado por tendencias, ciclos o factores estacionales, sino que se compone de fuerzas no recurrentes, esporádicas que no se describen como o atribuidas a factores de tendencias, ciclos, o estacionales. Ejemplos de variaciones irregulares son movimientos esporádicos de series de tiempo debido a inundaciones, granizadas, heladas, tornados, huracanes, sequías, fuegos forestales, etc. 11-4
Dr. Héctor Quevedo Urías
Además, las figuras de abajo muestran ejemplos de algunos posibles patrones de tendencia en series de tiempo. Por ejemplo, la Figura 11.1(a) muestra una tendencia no lineal. La Figura 11.1(b) muestra una tendencia lineal que disminuye. La Figura 11.1(c) muestra una gráfica sin tendencia.
Figura 11.0. Gráficas mostrando los tipos de tendencias. La gráfica (a) muestra una tendencia de línea a largo plazo o de movimiento secular. La gráfica (b) muestra una línea de tendencia a largo plazo con un movimiento cíclico sobrepuesto. La gráfica (c) muestra tendencias cíclicas a largo plazo y movimientos estacionales. (Spiegel, 1961).
Figura 11.1. Ejemplos de algunos patrones de tendencias en series de tiempo. Aplicaciones de las funciones de series de tiempo Las aplicaciones en ingeniería de las tendencias a largo plazo o tendencias seculares son varias. Ejemplos de estas aplicaciones son los incrementos de la contaminación ambiental. Un ejemplo clásico es el aumento constante de las concentraciones de bióxido de carbono, gas metano, vapor de agua, etc., a nivel mundial, que han estado ocurriendo desde el inicio de la era industrial hasta al presente. Esto, como es bien 11-5
Dr. Héctor Quevedo Urías
sabido, está corrompiendo el clima de nuestro planeta, al estarse calentando la tierra y las aguas marinas. Otros ejemplos, a los cuales se les pueden aplicar las series de tiempo, son los incrementos en la radiación ultravioleta (en sus formas de UV-A y UV-B), que están causando cáncer en la piel (en sus tres formas, melanoma, basal y escamoso) y daños en la visión y alteraciones en la estructura del DNA. Otras aplicaciones de las series de tiempo están relacionadas con los crecimientos poblacionales o demográficos. Otros más están relacionados con la producción industrial, la producción de energía, la economía, etc. Tipos de funciones matemáticas para líneas de tendencia Las ecuaciones o funciones matemáticas más comunes para aproximar los datos gráficos de líneas de tendencia de un diagrama esparcido se dan el la tabla de abajo. Aquí, las letras a, b y c representan valores constantes y, las letras X e Y, representan las variables independientes y dependientes, respectivamente.
11-6
Dr. Héctor Quevedo Urías
TABLA 11.0. Tabla mostrando los tipos de funciones matemáticas más comunes usadas para líneas de tendencia. (Elaboración propia) Función matemática
Descripción
(1) y = a + bx (2) y = f(x) = ax2 + bx + c (3) y = ax3 + bx2 + cx + d (4) y = ax4 + bx3 + cx2 + dx + e (5) y = a + bx + cx2 + ... + an xn (6) y = abx o Log y = Log a + (Log b) x (7) y = axb o Log y = Log a + b Log x (8) y = 1/a + bx o 1/y = a + bx (9) y = pqbx o Log y = Log p + bx Log q (10) y = abx + g (11) y = axb + g (12) y = Ln x (13) y = a – (a – b) exp(-(c)|x|)d (14) y = a – (a – b)/(1 + (c|x|)d (15) y = a(1 + (b – 1) exp(-c(x – d))1/(1 - b)
Línea recta Curva cuadrática o parabólica Curva cúbica Curva cuártica Polinomial generalizado Curva exponencial Curva geométrica Función hipérbola Curva de Gompertz Curva exponencial modificada Curva geométrica modificada Función logarítmica Función de Weibull Función de Morgan-Mercer-Floding Función de Richards
Para decidir, cuál función matemática es la más apropiada, para ajustar los datos se puede hacer viendo un diagrama esparcido de la gráfica de los datos. Por ejemplo, si el diagrama esparcido en papel semilogaritmo de Log (y) vs. x muestra una relación lineal, la ecuación tiene la forma de la curva exponencial (6). Si se usa el papel logaritmo completo, Log y-Log x, y los datos muestran una relación lineal, la ecuación tiene la forma de una curva geométrica (7). De cualquier manera, los programas de computadora, como el SAS, Minitab, NCSS, etc., son las mejores herramientas para encontrar la función que mejor ajuste los datos. Métodos para encontrar líneas de tendencia 1. El método a mano libre o visual. 11-7
Dr. Héctor Quevedo Urías
2. El método de los cuadrados mínimos. 3. El método de semipromedios. 4. El método de promedios en movimiento. 1. El método a mano libre consiste en ajustar la tendencia de una línea o curva, examinando la gráfica visualmente. Sin embargo, este método subjetivo depende mucho del juicio individual. 2. El método de los cuadrados mínimos puede usarse para encontrar la ecuación de la tendencia de la curva. Hay muchos programas de computadora que ayudan a esto. 3. El método del promedio del movimiento. Usando los órdenes apropiados del movimiento de promedios, los patrones cíclicos, estacionales o irregulares pueden ser eliminados dejando, solamente, la tendencia del movimiento. 4. Método de semipromedios. Este método consiste en separar los datos en dos partes (preferentemente iguales) promediando los datos en cada parte, obteniendo dos puntos en la gráfica de las series de tiempo. Enseguida, una línea de tendencia se dibuja obteniendo dos puntos en la gráfica de las series de tiempo. Este método es simple, pero puede dar resultados pobres. Este método es aplicable, solamente, cuando la tendencia es lineal o aproximadamente lineal. Método a mano libre para el ajustamiento de curvas Este es el método más simple para las series de tiempo. Consiste en graficar las series de tiempo y, por medio de observación visual, trazar una línea recta sobre los puntos. Una vez hecho esto, se estima la ecuación de la línea recta para después calcular cualquier valor de Yc sustituyendo el valor de X. Método de los cuadrados mínimos Este método es el más usado y preciso para encontrar la ecuación de una serie de tiempo. Considérese la Figura 11.2 de abajo. 11-8
Dr. Héctor Quevedo Urías
Figura 11.2. Gráfica mostrando el método de los cuadrados mínimos. Fuente: Spiegel (1961). Los puntos de los datos se dan por (X1, Y1), (X2, Y2), ..., (Xn, Yn). Para un valor dado de X, digamos, X1, habrá una diferencia entre el valor Y1 y el valor correspondiente como se determinó de la curva C. Como se ve en la gráfica, denotamos esta diferencia por D1, la cual, en algunas ocasiones se refiere como la desviación, error o residual y puede ser positivo, negativo o cero. Similarmente, correspondiendo a los valores de X1, X2,.. Xn, obtenemos las desviaciones D2, D3, ..., Dn. La medición de “bondad de ajuste” se da por la relación D21 + D22 + ... + D2n. De esta manera, si la suma de estos cuadrados D21, D22, D23, etc., es pequeña, el ajuste es bueno. Pero, si la suma es grande, el ajuste es malo, lo cual quiere decir que, el error o residual será grande, indicando mucha variación entre los datos (Spiegel, 1961). Definición. De todas las curvas que aproximan un grupo de datos en el sentido de los cuadrados mínimos, la curva que tiene la propiedad de: D21 + D22 +... + D2n es un mínimo y se llama la curva que mejor ajusta los datos. Una curva que tenga esta propiedad se dice que ajusta los datos en el sentido del mejor cuadrado mínimo y se llama la curva de los cuadrados mínimos. Por lo tanto, una línea que tenga esta propiedad se llama la línea de los cuadrados mínimos, parábola de los cuadrados mínimos, etc. 11-9
Dr. Héctor Quevedo Urías
Línea de los cuadrados mínimos y parábolas de los cuadrados mínimos La línea de los cuadrados mínimos, que aproxima el conjunto de puntos (X1, Y1), (X2, Y2), ... (Xn, Yn), ya se discutió en el Capítulo 8, donde se habló de regresión y correlación simple y múltiple. En ese capítulo se describieron modelos de regresión de una línea recta. Análogamente, en el Capítulo 9, se describieron modelos polinomiales, con una o más de dos variables independientes. También, en ese capítulo se describieron modelos cúbicos. Siendo así, entonces, no se repetirán los mecanismos usados para ajustar los datos a los modelos más apropiados. Ejemplos usando las series de tiempo Ejemplo #1. Se dan los datos de las siguientes concentraciones de bióxido de carbono (CO2) (Y) en función del tiempo (X) en la tabla de abajo. TABLA 11.1. Tabla mostrando los datos de CO2 en función del tiempo. (Elaboración propia) Conc. de CO2 (Y) | 1 2 4 4 5 7 8 9 10 11.5 (Millones de toneladas) Tiempo (X) | 1900 1920 1930 1940 1950 1960 1970 1980 1990 2000 (Años codificados)
| 1
3
4
6
8
9
11
14
15
16
Hacer los siguientes cálculos: (a) Trazar a mano en la gráfica obtenida los datos y una línea recta. (b) Encontrar la ecuación de esta línea. (c) Usando estadística encontrar la línea ajustada de los cuadrados mínimos y comparar los valores de la pendiente y del intercepto Y encontrados en el inciso (b). (d) Trazar en la gráfica la línea de la ecuación encontrada (a). (e) Usando las ecuaciones encontradas en los incisos (b) y (c), estimar las concentraciones de CO2 para el año 2010. Solución: 11-10
Dr. Héctor Quevedo Urías
(a) Graficamos los puntos (1,1), (2,3), (4,4), (6,4), (8,5), (9,7), (11,8), (14,9) en un sistema de coordenadas rectangulares como se muestra en la Figura 11.3 de abajo. Gráfica mostrando las concentraciones de bióxido de carbono vs. tiempo 12
Conc. de CO2 (Y)
10 8 6 4 2 0 0
2
4
6
8 10 Tiempo (X)
12
14
16
Figura 11.3. Gráfica mostrando las concentraciones de CO2 en función del tiempo. (Elaboración propia) (b) Para obtener la ecuación de la línea, usamos la gráfica de arriba y seleccionamos cualesquiera de dos puntos sobre la línea trazada a mano, esto es, como punto P y punto Q. Enseguida, estimamos las coordenadas de estos dos pares puntos que son (1, 1) y (12, 7.5). Ahora usando la ecuación de los cuadrados mínimos dada por la función Y = a + b(X) y sustituyendo los valores de Y1 = 1, X1 = 0, Y2 = 7.5 y X2 = 12 nos da: 1.0 = a + b(0) 7.5 = a + b(12) Resolviendo da a = 1. 7.5 = 1 + b (12) y b = .542. Por lo tanto, la ecuación es: Yc = 1 + .542(X) Otra forma de hacer lo mismo es con la ecuación de la forma del punto de la pendiente de una línea, Y = Y1 = m(X – X1), donde m = (Y2 – Y1)/(X2 – X1), para dar: Y – Y1 = (Y2 – Y1)/(X2 – X1) (X – X1) 11-11
(11-1)
Dr. Héctor Quevedo Urías
Ahora sustituyendo los valores en (11-1) da: Y – 1 = (7.5 – 1)/(12 – 0) (X – 0), Y – 1 = .542 X, esto es Yc = 1 + .542 (X) (c) Para encontrar la ecuación de la línea recta usamos métodos estadísticos, es decir, usando las ecuaciones que estiman el intercepto en Y y la pendiente de la línea (Ver capítulo de regresión). (Σ Y)(Σ X 2) – (Σ X)(Σ XY) a = ──────────────── n Σ X 2 – (Σ X)2
(11-2)
n ΣXY – (ΣX)(ΣY) b = ──────────── n ΣX 2 – (ΣX)2
(11-3)
Para esto, podemos usar una calculadora de bolsillo o un programa de computadora y estimamos las siguientes sumatorias: ΣX = 56, ΣY = 40, ΣX 2 = 524, ΣY 2 = 256, (ΣY)2 = 1600, ΣXY = 364, ΣXΣY = 2240, (ΣX)2 = 3136, n = 8. Ahora, sustituyendo todos estos valores en las ecuaciones (11-2) y (11-3), para a y b dan los siguientes resultados: (40)(524) – (56)(364) Intercepto en Y = a = ────────────── = .545 (8)(524) – (56)2
11-12
Dr. Héctor Quevedo Urías
(8)(364) – (56)(40) Pendiente = b = ───────────── = .636 (8)(524) – (56)2 Por lo tanto, la ecuación de los cuadrados mínimos es: Yc = .545 + .636(X) Aquí, se puede ver que esta ecuación es más precisa, que la obtenida por medio del juicio individual. Ahora, para trazar la línea en la gráfica correspondiente a la ecuación de arriba, ponemos Y = 0 y resolvemos por X para dar X = -0.857. Enseguida, ponemos X = 0 y resolvemos por Y para dar Y = 0.545. Enseguida, usando estos dos pares de coordenadas, es decir, (–0.857, 0) y (0, 0.545) podemos trazar en la gráfica una línea más precisa que aquélla hecha a mano. (e) Usando las ecuaciones Y = 1 + .542(X) e Y = .545 + .636(X), cuando X = 17 (año 2010), nos da, respectivamente, Y = 10.21 y 11.36, este último valor siendo más preciso que el anterior. Ejemplo #2. Una compañía de programas de computadora reporta la demanda para un determinado paquete de computadora, sobre un periodo de tres años. Los datos se dan en la tabla de abajo: TABLA 11.2. Tabla mostrando los datos del problema. (Elaboración propia) Demanda trimestral (Y) | 37 22 62 80 77 95 94 131 148 155 126 161 Periodos de tiempo (X) | 1
2
3
4
5
6
7
8
9
10 11
12
Hacer los siguientes cálculos: (a) Visualmente ajustar una línea recta a los datos de la gráfica. (b) Usando métodos estadísticos estimar la ecuación lineal de las series de tiempo, es 11-13
Dr. Héctor Quevedo Urías
decir, Yc = a + b(X) Nótese que también se puede usar Y en lugar de Yc). (c) Trazar una línea recta usando el par de coordenadas derivados de esta ecuación. (d) Comparar la línea hecha a mano con la línea obtenida en (c). (e) Predecir el valor de Yc cuando X = 140 Solución: (a) La gráfica de abajo muestra el diagrama esparcido de los datos. Gráfica mostrando la demanda trimestral vs. periodos de tiempo 180
Demanda trimestral (Y)
160 140 120 100 80 60 40 20 0
2
4
6 8 Periodos de tiempo (X)
10
12
Figura 11.4. Gráfica mostrando los datos del ejemplo de arriba. (Elaboración propia) (a) Para obtener la ecuación de la línea, usamos la gráfica de arriba y seleccionamos cualesquiera de dos puntos sobre la línea trazada a mano, esto es, como punto P y punto Q. Enseguida, estimamos las coordenadas de estos pares de puntos que son (1, 1) y (12, 7.5). Ahora, usando la ecuación de los cuadrados mínimos dada por: Y = a + b(X)
(11-3)
Ahora, sustituyendo todos los valores de Y1 = 1, X2 = 0 y Y2 = 7.5 y X2 = 12, en la ecuación (11-3) de arriba, nos da: 1.0 = a + b(0) y 7.5 = a + b(12). (b) Usando métodos estadísticos calculamos las sumatorias: ΣX = 78, ΣX 2 = 650, (ΣX)2/n = 507, ΣY = 1188, ΣY 2 = 140774, (ΣY)2/n = 117,612 Intercepto Y = 20.55, Pendiente = 12.07, R = 0.95. 11-14
Dr. Héctor Quevedo Urías
Por lo tanto, la ecuación de lineal de las series de tiempo para este problema es: Yc = 20.55 + 12.07(X) Para trazar una línea recta sobre los datos, seleccionamos dos puntos, digamos X = 3 y X = 9 y resolviendo por Yc en la ecuación lineal de las series de tiempo, da las coordenadas (3, 56.76) y (9, 129.18). Ahora, juntamos los puntos de estas dos coordenadas y trazamos la línea como se ve en la figura de arriba, la cual muestra la demanda trimestral (Y) por un periodo de 3 años (X). (c) Para predecir el valor de Yc cuando X = 140 los podemos hacer por interpolación usando la Figura 11.4 o, simplemente, sustituyendo el valor de X = 140 en la ecuación de las series de tiempo, esto es: Yc = 20.55 + 12.07(X) = 20.55 + 12.07(140) = 1,710.35 Ejemplo #3. En un estudio hipotético relacionado con los casos de SIDA, se da la tabla de abajo. Estimar la función ajustada de tendencia usando análisis de tendencia con una función exponencial.
11-15
Dr. Héctor Quevedo Urías
TABLA 11.3. Tabla mostrando los casos de SIDA de un estudio hipotético. Años
Número hipotético de casos de SIDA
1981
1991
1,200
390,000
1982
1992
6,500
500,000
1983
1993
12,000
900,000
1984
1994
15,000
1,500,000
1985
1995
27,000
2,900,000
1986
1996
50,000
4,000,000
1987
1997
63,000
7,000,000
1988
1998
110,000
10,000,000
1989
1999
170,000
15,000,000
1990
2000
210,000
25,000,000
_____________________________________________________________________________________________
Hacer lo siguiente: (a) Derivar la ecuación del modelo propuesto. Con este modelo predecir el número de casos de SIDA para el año 2008. (El lector lo deberá hacer). No. de casos de SIDA para periodo (1981-2000) Growth Curve Model Yt = 2097.90 * (1.60517**t) 30000000
Variable A ctual Fits
Casos de SIDA
25000000
A ccuracy Measures MA PE 2.04662E+01 MA D 2.83975E+05 MSD 4.13874E+11
20000000 15000000 10000000 5000000 0 2
4
6
8
10 12 Index
14
16
18
20
Figura 11.5. Gráfica mostrando la relación de los casos de SIDA en función del tiempo.
11-16
Dr. Héctor Quevedo Urías
Ejercicios Capítulo 11. 11.1. Los datos de abajo muestran los millones de toneladas de bióxido de carbono emitidos a la atmósfera durante los años de 1950 a 1955 en cierta región industrial. Tabla mostrando los datos del problema. (Elaboración propia) ________________________________________________________________ Años (X) Codificados Millones de toneladas de CO2 (Y) 1950 (50) 5 1951 (51) 8 1952 (52) 12 1953 (53) 15 1954 (54) 20 1955 (55) 23 Hacer los siguientes cálculos: (a) Graficar los datos del diagrama esparcido. (b) Trazar una línea visualmente que mejor conecte los datos y derivar la ecuación y estimar la ecuación por juicio individual. (c) Estimar la ecuación de los cuadrados mínimos, es decir, usando métodos estadísticos.
(Y = 5 + 3.6 X)
(d) Predecir los millones de toneladas de CO2 (el valor de Y) para el aňo 2005. Sugerencia: Para resolver estos problemas usar el programa de computadora Minitab o SAS. 11.2. Este problema está relacionado con un estudio de contaminación atmosférica, de partículas menores que 10 micras emitidas en cierta región industrial, durante el periodo de 1984 a 1999. Los datos de las concentraciones promedio de las partículas se muestran en la tabla de abajo. (a) Hacer una gráfica con los datos (b) Usando métodos estadísticos (no de juicio individual) estimar la ecuación de la 11-17
Dr. Héctor Quevedo Urías
línea de las series de tiempo (Yc) y trazar una línea recta sobre los datos gráficos (c) Estimar las concentraciones promedio de partículas para el año 2003 por medio de interpolación y por medio de la ecuación. Tabla mostrando los datos del problema. (Elaboración propia) ________________________________________________________________ Años Conc. promedio Años Conc. promedio (ppm) (ppm) 1984 (84)
100
1992 (92)
116
1985 (85)
110
1993 (93)
117
1986 (86)
112
1994 (94)
118
1987 (87)
115
1995 (95)
120
1988 (88)
113
1996 (96)
123
1989 (89)
116
1997 (97)
125
1990 (90)
117
1998 (98)
124
1991 (91)
117
1999 (99)
125
11.3. Decir si la gráfica de abajo muestra tendencia o estacionalidad. Ventas
Tiempo 11.4. Qué tipo de tendencia muestra la gráfica de abajo, es decir, ¿tendencia o 11-18
Dr. Héctor Quevedo Urías
estacionalidad?
11.5. La gráfica de abajo muestra, ¿tendencia o estacionalidad?
(tendencia)
Ventas anuales (unidades)
Precio
11-19
Dr. Héctor Quevedo Urías
CAPITULO 12 Selección del tamaño de la muestra Derivación de la fórmula para estimar el tamaño más apropiado de la muestra para el promedio.- Selección del tamaño de la muestra para dos poblaciones.En estudios de diseños experimentales estadísticos es necesario estimar el tamaño de la muestra más apropiado para la estimación de promedios, proporciones, etc. La selección más apropiada del tamaño de la muestra es importante, porque no queremos sacar un tamaño de muestra excesivamente grande, que va a ser muy costoso. Por la misma razón, tampoco queremos sacar un tamaño de muestra pequeño, que nos incline a aceptar hipótesis nulas, es decir, de cometer el error II. De esta manera, el tamaño apropiado de la muestra es importante, porque tamaños de muestras innecesariamente grandes son costosos y desperdician dinero y tiempo y, también, porque tamaños de muestras pequeños dan resultados pobres. Existen varias funciones estadísticas para determinar el tamaño más apropiado de la muestra estadística, es decir, para estimar el promedio poblacional µ, la varianza σ2, la desviación estándar σ, la proporción ρ, etc. Para estimar estos parámetros usamos la distribución normal, pero es necesario saber si la población muestreada es normal o aproximadamente normal. Esto se hace para las pruebas de hipótesis usando los niveles de significancia de 0.05 y 0.01, que dan los coeficientes críticos de 1.96 y 2.58, es decir, correspondientes a los niveles de confianza de 95% y 99%. En situaciones donde puede controlarse el tamaño de la muestra es posible elegir un tamaño de muestra n, de modo que se tenga una confianza del 100(1 – α) 12-1
Dr. Héctor Quevedo Urías
por ciento de que el error, al estimar, digamos µ, sea menor que el error especificado E, esto es, lo que queremos arriesgar. En la determinación del tamaño de la muestra en un experimento estadístico tenemos que saber dos cosas: 1. Qué tan cerca deseamos que nuestra estimación esté del verdadero valor del parámetro poblacional. 2. Qué tanta certeza deseamos que nuestra estimación esté dentro del número de unidades seleccionadas del valor del parámetro. Derivación de la fórmula para estimar el tamaño más apropiado de la muestra para el promedio Para derivar la fórmula para estimar el tamaño óptimo de la muestra, usamos la distribución de la estadística del promedio X . Por ejemplo, sabemos qué, de la distribución del promedio X mostrada abajo, el intervalo µ ± 2σX contiene, aproximadamente, el 95% de los valores de la estadística del promedio X .
Figura 12.0. Gráfica mostrando la distribución de la estadística del promedio. (Elaboración propia) Acordemente, si deseamos estar, a no más de E unidades de µ con nuestro 12-2
Dr. Héctor Quevedo Urías
estimador estadístico del promedio X , entonces, dejamos que E = 2σX esto es, E = 2 σ / √n
(12-1)
n = 4σ2 / E2
(12-2)
Ahora, resolviendo por n da: Esta función (12-2) tiene un coeficiente de confianza de (1 – α) = 0.9544. Si queremos un coeficiente de confianza de (1 – α), entonces, se deja que: zα/2 σX = E
o bien
zα/2 σ/√n = E
(12-3)
Que resulta en la fórmula: n = zα/2 σ2/E2 = (zα/2 σ/E)2
(12-4) (12-5)
Donde: zα/2 = valor de la distribución normal estándar de tal manera que, P(Z ≥ zα/2) = α/2. Aquí, usualmente, los valores críticos de zα/2 son de 1.97 y 2.58, σ = desviación estándar poblacional. E = error máximo de la estimación De acuerdo a la ecuación anterior, el error E es dado por: E = zα/2(σ√n)
(12-6)
Para poder usar la fórmula (12-4) necesitamos conocer (1 – α), E y σ. Si el tamaño de la muestra es n ≥ 30 casos o si la población muestreada es normal, entonces, se puede aproximar σ a s. Definición: Si el promedio X se usa como estimación de µ, entonces, puede tenerse una confianza del 100(1 – α) por ciento de que el error | X – µ| no será mayor que una cantidad específica E cuando el tamaño de la muestra sea n = (zα/2 σ / E)2. Esta función puede ser usada para determinar el tamaño de 12-3
Dr. Héctor Quevedo Urías
muestra necesario, para producir buenos resultados a un grado de confianza deseado y margen de error. No obstante, esta fórmula requiere de los valores de σ o de σ2. Estos valores se pueden conocer de estudios previos o pueden ser razonablemente, estimados de estudios anteriores o estudios pilotos. Ejemplos ilustrando la determinación del tamaño de muestra más apropiado para el promedio X Ejemplo #1. Un consultor estadístico intenta usar el promedio de una muestra aleatoria de tamaño n = 150, para estimar la aptitud mecánica promedio (promedio mediante cierta prueba) de obreros de la línea de montaje de una industria. Si con base en la experiencia, el estadístico puede suponer que σ = 6.2, entonces, para estos datos, ¿qué puede afirmar este consultor, con probabilidad de 0.99, acerca de la dimensión máxima del error E? Solución: Para estimar E usamos n = 150, σ = 6.2, zα/2 = z0.01/2 = 2.575. Usando la fórmula (12-5) y sustituyendo da: E = zα/2 (σ/√n) = 2.575(6.2/√150) = 1.30 Con este resultado, el estadístico puede afirmar, con un nivel de confianza de 99% (o con una probabilidad de 0.99), que su error será cuando más de 1.30. Ejemplo #2. Refiriéndose al problema anterior, supongamos ahora que el consultor estadístico desea un nivel de confianza del 95%, siendo así, ¿cuál sería la magnitud del error, E? Solución: Usando, nuevamente, la fórmula (12-6), con zα/2 = z0.05/2 = z.025 = 1.96 12-4
Dr. Héctor Quevedo Urías
E = 1.96(6.2/√150) = 0.992 Aquí, nótese que debido a que queremos menos precisión (usando el nivel de confianza de 95%) el error es más pequeño que si usamos el nivel de confianza de 99%. También es de notarse que, a medida que el tamaño de n se hace más grande, el error E disminuye. Ejemplo #3. En un estudio de química, en un artículo publicado en el Journal of Heat Transfer, se describe un nuevo método para medir la conductividad térmica del hierro Armco. Supóngase que se desea que el error promedio en la conductividad térmica del hierro Armco sea menor que 0.05 Btu/hr-ft-oF, con un nivel de confianza del 95%. Entonces, si de estudios previos se sabe que la desviación estándar es de σ = 0.10, estimar el tamaño de muestra requerido. Solución: Aquí, zα/2 = z0.05/2 = z0.025 = ±1.96, σ = 0.10, E 0.05. Usando la ecuación (12-4): n = (zα/2 σ/ E)2 y sustituyendo estos valores nos da: n = [(1.96)(0.10) / 0.05)]2 = 15.37 ≈ 16 Nota 1. Siempre queremos redondear el tamaño de la muestra de manera que, el número requerido en la muestra sea cuando menos adecuado, en lugar de un poco adecuado. Esto es un convencionalismo. Ejemplo #4. En un estudio de recolección de basura desechada por el sector doméstico, es decir, del salvamento de basura reciclable, queremos estimar el promedio del plástico desechado por las casas. ¿Qué tamaño de muestra de casas debe ser seleccionado, aleatoriamente, si queremos estar seguros, en 99%, que el promedio muestral esté dentro de 0.250 kilogramos del verdadero promedio poblacional µ? Asumir que estudios pilotos dan una desviación estándar conocida 12-5
Dr. Héctor Quevedo Urías
de σ = 1.100 kilogramos. Solución: Queremos un tamaño de muestra n, dado que α = 0.01 (99% de nivel de confianza) de manera que, zα/2 = z0.01/2 = 2.575 (valor constante de la tabla de la distribución normal con 99% nivel de confianza). Además, E = 0.250, σ = 1.100. Así, usando la fórmula (12-5) nos da: n = (zα/2 σ / E)2 = [(2.575)(1.100) / (0.250)]2 = 128.37 ≈ 129 En conclusión, debemos de obtener una muestra, de cuando menos 129 casas domésticas seleccionadas aleatoriamente (que están descartando el plástico). Con semejante muestra, estaremos confiados en un 99% de que el promedio muestral X estará dentro de 0.250 kilos de µ.
Ejemplo #5. Refiriéndose al ejemplo anterior, si quisiéramos tener resultados menos precisos usando un margen de error de 0.500 kilos, calcular el tamaño de la muestra n asumiendo las mismas condiciones anteriores. Solución: Usando la fórmula (12-4) obtenemos: n = [(2.575)(1.100) / (0.500)]2 = 32.09 ≈ 33 Se observan los siguientes puntos en la relación general entre el tamaño de la muestra, la longitud deseada del intervalo 2E, el nivel de confianza 100(1 – α) por ciento y σ: 12-6
Dr. Héctor Quevedo Urías
1. Conforme disminuye la longitud del intervalo 2E, el tamaño requerido de la muestra n aumenta para un valor fijo de σ y para el nivel de confianza especificado. 2. A medida que σ aumenta, el tamaño requerido de la muestra n aumenta, para una longitud deseada 2E fija y un nivel de confianza especificado. 3. Conforme aumenta el nivel de confianza, el tamaño requerido de la muestra n aumenta para una longitud fija deseada 2E y una desviación estándar σ. Selección del tamaño de la muestra para dos poblaciones También se puede seleccionar el tamaño de la muestra, más apropiado, para la diferencia de dos promedios. Por ejemplo, si se conocen las desviaciones estándar de las muestras uno y dos, es decir, σ1 y σ2, y los tamaños de las dos muestras son iguales, es decir, n1 = n2 = n, entonces, puede determinarse el tamaño más apropiado de la muestra. Esto se hace de modo que se tenga una confianza de 100(1 – α) por ciento en que el error E en la estimación de la diferencia de µ1 – µ2, por los promedios de las muestras X 1 – X 2 sea menor que E. La ecuación usada para calcular el tamaño de la muestra más apropiado para la diferencia de dos poblaciones es: n = (zα/2 / E)2 (σ21 + σ22)
(12-7)
Nota 1. Recuérdese que es necesario redondear n, si este valor no es un entero. Con esto, se asegura que el nivel de confianza no sea menor que 100(1 – α) por ciento. Ejemplo #6. Se prueban dos fórmulas diferentes de gasolina oxigenada para reducir las emisiones de monóxido de carbono (CO) emitidas por los motores de combustión interna. Se sabe de antemano que la varianza para la primera fórmula es de σ21 = 1.5, mientras que la varianza para la segunda fórmula es de σ22 = 1.2. ¿Qué tamaño de muestra debe usarse para cada población muestreada, si se desea 12-7
Dr. Héctor Quevedo Urías
tener una confianza del 95% de que el error, al estimar la diferencia entre los promedios de las dos fórmulas diferentes, sea menor que 1? Solución: Aquí, usamos la fórmula (12-7) para calcular el tamaño de la muestra de dos poblaciones, es decir, n = (zα/2 / E)2 (σ21 + σ22) Donde: zα/2 = z0.05/2 = z.025 = 1.97, E = 1, σ21 = 1.5, σ22 = 1.2 Sustituyendo estos valores en la fórmula de arriba da: n = (1.95 / 1)2 (1.5 + 1.2) = 10.27 ≈ 11 Por lo tanto, el tamaño de la muestra para las poblaciones µ1 y µ2 es: n = n1 = n2 = 11
12-8
Dr. Héctor Quevedo Urías
Ejercicios Capítulo 12 12.1. Se sabe que la duración, en horas, de un foco de 75 watts tiene una distribución, aproximadamente normal, con una desviación estándar de 25 horas. Supóngase que se desea una confianza del 95% en que el error en la estimación de la duración promedio sea menor que 5 horas. ¿Qué tamaño de muestra debe usarse?
(≈ 97)
12.2. Hacer el mismo problema que el anterior, pero ahora usando una confianza de 99% y un error E = 1 y comparar los resultados. 12.3. Un ingeniero automotriz desea determinar el tiempo promedio que tardaría un mecánico en girar las llantas de un auto. Este ingeniero quiere estimar, con una confianza de 95%, que el promedio de su muestra es imprecisa en cuando más 0.50 minutos. Si sabe de estudios pilotos anteriores que la desviación estándar es de σ = 1.6 minutos, ¿qué tan grande deberá ser la muestra que debe de seleccionar, aleatoriamente? Sugerencia: Usar la fórmula n = (zα/2 σ/E)2 (39.3 ≈ 40 mecánicos) 12.4. El director de cierta universidad desea usar el promedio de una muestra aleatoria para estimar el monto promedio de tiempo que se les lleva a los estudiantes para ir de un salón a otro y tomar sus clases sin llegar tarde. Para esto desea afirmar con 99% de confianza que el error es cuando más de 0.25 minutos. Experiencias anteriores estiman una desviación estándar de σ = 1.40 minutos. Siendo así, ¿qué tan grande deberá ser la muestra que se deba tomar? 12.5. La Environmental Protection Agency (EPA) de los Estados Unidos desea conducir una prueba de millaje de cierto modelo de un auto importado. El ingeniero estadístico de la EPA desea estimar el promedio µ, de millas por galón de combustible usado por este modelo, con 95% de nivel de confianza. Asumiendo 12-9
Dr. Héctor Quevedo Urías
que σ = 2.5 millas por galón, ¿qué tamaño de muestra (número de autos de este modelo) deberá tomar para conducir esta prueba?
(n = 25)
12.6. Considerar el ejemplo 12.1 de la gasolina oxigenada, para la estimación del tamaño de las muestras para las poblaciones uno y dos. Siendo así, estimar los tamaños de las muestras apropiados, si queremos una confianza de 99% y el error de la estimación de las diferencias entre los promedios sea menor que 4.
12-10
Dr. Héctor Quevedo Urías
CAPITULO 12 Selección del tamaño de la muestra Derivación de la fórmula para estimar el tamaño más apropiado de la muestra para el promedio.- Selección del tamaño de la muestra para dos poblaciones.En estudios de diseños experimentales estadísticos es necesario estimar el tamaño de la muestra más apropiado para la estimación de promedios, proporciones, etc. La selección más apropiada del tamaño de la muestra es importante, porque no queremos sacar un tamaño de muestra excesivamente grande, que va a ser muy costoso. Por la misma razón, tampoco queremos sacar un tamaño de muestra pequeño, que nos incline a aceptar hipótesis nulas, es decir, de cometer el error II. De esta manera, el tamaño apropiado de la muestra es importante, porque tamaños de muestras innecesariamente grandes son costosos y desperdician dinero y tiempo y, también, porque tamaños de muestras pequeños dan resultados pobres. Existen varias funciones estadísticas para determinar el tamaño más apropiado de la muestra estadística, es decir, para estimar el promedio poblacional µ, la varianza σ2, la desviación estándar σ, la proporción ρ, etc. Para estimar estos parámetros usamos la distribución normal, pero es necesario saber si la población muestreada es normal o aproximadamente normal. Esto se hace para las pruebas de hipótesis usando los niveles de significancia de 0.05 y 0.01, que dan los coeficientes críticos de 1.96 y 2.58, es decir, correspondientes a los niveles de confianza de 95% y 99%. En situaciones donde puede controlarse el tamaño de la muestra es posible elegir un tamaño de muestra n, de modo que se tenga una confianza del 100(1 – α) 12-1
Dr. Héctor Quevedo Urías
por ciento de que el error, al estimar, digamos µ, sea menor que el error especificado E, esto es, lo que queremos arriesgar. En la determinación del tamaño de la muestra en un experimento estadístico tenemos que saber dos cosas: 1. Qué tan cerca deseamos que nuestra estimación esté del verdadero valor del parámetro poblacional. 2. Qué tanta certeza deseamos que nuestra estimación esté dentro del número de unidades seleccionadas del valor del parámetro. Derivación de la fórmula para estimar el tamaño más apropiado de la muestra para el promedio Para derivar la fórmula para estimar el tamaño óptimo de la muestra, usamos la distribución de la estadística del promedio X . Por ejemplo, sabemos qué, de la distribución del promedio X mostrada abajo, el intervalo µ ± 2σX contiene, aproximadamente, el 95% de los valores de la estadística del promedio X .
Figura 12.0. Gráfica mostrando la distribución de la estadística del promedio. (Elaboración propia) Acordemente, si deseamos estar, a no más de E unidades de µ con nuestro 12-2
Dr. Héctor Quevedo Urías
estimador estadístico del promedio X , entonces, dejamos que E = 2σX esto es, E = 2 σ / √n
(12-1)
n = 4σ2 / E2
(12-2)
Ahora, resolviendo por n da: Esta función (12-2) tiene un coeficiente de confianza de (1 – α) = 0.9544. Si queremos un coeficiente de confianza de (1 – α), entonces, se deja que: zα/2 σX = E
o bien
zα/2 σ/√n = E
(12-3)
Que resulta en la fórmula: n = zα/2 σ2/E2 = (zα/2 σ/E)2
(12-4) (12-5)
Donde: zα/2 = valor de la distribución normal estándar de tal manera que, P(Z ≥ zα/2) = α/2. Aquí, usualmente, los valores críticos de zα/2 son de 1.97 y 2.58, σ = desviación estándar poblacional. E = error máximo de la estimación De acuerdo a la ecuación anterior, el error E es dado por: E = zα/2(σ√n)
(12-6)
Para poder usar la fórmula (12-4) necesitamos conocer (1 – α), E y σ. Si el tamaño de la muestra es n ≥ 30 casos o si la población muestreada es normal, entonces, se puede aproximar σ a s. Definición: Si el promedio X se usa como estimación de µ, entonces, puede tenerse una confianza del 100(1 – α) por ciento de que el error | X – µ| no será mayor que una cantidad específica E cuando el tamaño de la muestra sea n = (zα/2 σ / E)2. Esta función puede ser usada para determinar el tamaño de 12-3
Dr. Héctor Quevedo Urías
muestra necesario, para producir buenos resultados a un grado de confianza deseado y margen de error. No obstante, esta fórmula requiere de los valores de σ o de σ2. Estos valores se pueden conocer de estudios previos o pueden ser razonablemente, estimados de estudios anteriores o estudios pilotos. Ejemplos ilustrando la determinación del tamaño de muestra más apropiado para el promedio X Ejemplo #1. Un consultor estadístico intenta usar el promedio de una muestra aleatoria de tamaño n = 150, para estimar la aptitud mecánica promedio (promedio mediante cierta prueba) de obreros de la línea de montaje de una industria. Si con base en la experiencia, el estadístico puede suponer que σ = 6.2, entonces, para estos datos, ¿qué puede afirmar este consultor, con probabilidad de 0.99, acerca de la dimensión máxima del error E? Solución: Para estimar E usamos n = 150, σ = 6.2, zα/2 = z0.01/2 = 2.575. Usando la fórmula (12-5) y sustituyendo da: E = zα/2 (σ/√n) = 2.575(6.2/√150) = 1.30 Con este resultado, el estadístico puede afirmar, con un nivel de confianza de 99% (o con una probabilidad de 0.99), que su error será cuando más de 1.30. Ejemplo #2. Refiriéndose al problema anterior, supongamos ahora que el consultor estadístico desea un nivel de confianza del 95%, siendo así, ¿cuál sería la magnitud del error, E? Solución: Usando, nuevamente, la fórmula (12-6), con zα/2 = z0.05/2 = z.025 = 1.96 12-4
Dr. Héctor Quevedo Urías
E = 1.96(6.2/√150) = 0.992 Aquí, nótese que debido a que queremos menos precisión (usando el nivel de confianza de 95%) el error es más pequeño que si usamos el nivel de confianza de 99%. También es de notarse que, a medida que el tamaño de n se hace más grande, el error E disminuye. Ejemplo #3. En un estudio de química, en un artículo publicado en el Journal of Heat Transfer, se describe un nuevo método para medir la conductividad térmica del hierro Armco. Supóngase que se desea que el error promedio en la conductividad térmica del hierro Armco sea menor que 0.05 Btu/hr-ft-oF, con un nivel de confianza del 95%. Entonces, si de estudios previos se sabe que la desviación estándar es de σ = 0.10, estimar el tamaño de muestra requerido. Solución: Aquí, zα/2 = z0.05/2 = z0.025 = ±1.96, σ = 0.10, E 0.05. Usando la ecuación (12-4): n = (zα/2 σ/ E)2 y sustituyendo estos valores nos da: n = [(1.96)(0.10) / 0.05)]2 = 15.37 ≈ 16 Nota 1. Siempre queremos redondear el tamaño de la muestra de manera que, el número requerido en la muestra sea cuando menos adecuado, en lugar de un poco adecuado. Esto es un convencionalismo. Ejemplo #4. En un estudio de recolección de basura desechada por el sector doméstico, es decir, del salvamento de basura reciclable, queremos estimar el promedio del plástico desechado por las casas. ¿Qué tamaño de muestra de casas debe ser seleccionado, aleatoriamente, si queremos estar seguros, en 99%, que el promedio muestral esté dentro de 0.250 kilogramos del verdadero promedio poblacional µ? Asumir que estudios pilotos dan una desviación estándar conocida 12-5
Dr. Héctor Quevedo Urías
de σ = 1.100 kilogramos. Solución: Queremos un tamaño de muestra n, dado que α = 0.01 (99% de nivel de confianza) de manera que, zα/2 = z0.01/2 = 2.575 (valor constante de la tabla de la distribución normal con 99% nivel de confianza). Además, E = 0.250, σ = 1.100. Así, usando la fórmula (12-5) nos da: n = (zα/2 σ / E)2 = [(2.575)(1.100) / (0.250)]2 = 128.37 ≈ 129 En conclusión, debemos de obtener una muestra, de cuando menos 129 casas domésticas seleccionadas aleatoriamente (que están descartando el plástico). Con semejante muestra, estaremos confiados en un 99% de que el promedio muestral X estará dentro de 0.250 kilos de µ.
Ejemplo #5. Refiriéndose al ejemplo anterior, si quisiéramos tener resultados menos precisos usando un margen de error de 0.500 kilos, calcular el tamaño de la muestra n asumiendo las mismas condiciones anteriores. Solución: Usando la fórmula (12-4) obtenemos: n = [(2.575)(1.100) / (0.500)]2 = 32.09 ≈ 33 Se observan los siguientes puntos en la relación general entre el tamaño de la muestra, la longitud deseada del intervalo 2E, el nivel de confianza 100(1 – α) por ciento y σ: 12-6
Dr. Héctor Quevedo Urías
1. Conforme disminuye la longitud del intervalo 2E, el tamaño requerido de la muestra n aumenta para un valor fijo de σ y para el nivel de confianza especificado. 2. A medida que σ aumenta, el tamaño requerido de la muestra n aumenta, para una longitud deseada 2E fija y un nivel de confianza especificado. 3. Conforme aumenta el nivel de confianza, el tamaño requerido de la muestra n aumenta para una longitud fija deseada 2E y una desviación estándar σ. Selección del tamaño de la muestra para dos poblaciones También se puede seleccionar el tamaño de la muestra, más apropiado, para la diferencia de dos promedios. Por ejemplo, si se conocen las desviaciones estándar de las muestras uno y dos, es decir, σ1 y σ2, y los tamaños de las dos muestras son iguales, es decir, n1 = n2 = n, entonces, puede determinarse el tamaño más apropiado de la muestra. Esto se hace de modo que se tenga una confianza de 100(1 – α) por ciento en que el error E en la estimación de la diferencia de µ1 – µ2, por los promedios de las muestras X 1 – X 2 sea menor que E. La ecuación usada para calcular el tamaño de la muestra más apropiado para la diferencia de dos poblaciones es: n = (zα/2 / E)2 (σ21 + σ22)
(12-7)
Nota 1. Recuérdese que es necesario redondear n, si este valor no es un entero. Con esto, se asegura que el nivel de confianza no sea menor que 100(1 – α) por ciento. Ejemplo #6. Se prueban dos fórmulas diferentes de gasolina oxigenada para reducir las emisiones de monóxido de carbono (CO) emitidas por los motores de combustión interna. Se sabe de antemano que la varianza para la primera fórmula es de σ21 = 1.5, mientras que la varianza para la segunda fórmula es de σ22 = 1.2. ¿Qué tamaño de muestra debe usarse para cada población muestreada, si se desea 12-7
Dr. Héctor Quevedo Urías
tener una confianza del 95% de que el error, al estimar la diferencia entre los promedios de las dos fórmulas diferentes, sea menor que 1? Solución: Aquí, usamos la fórmula (12-7) para calcular el tamaño de la muestra de dos poblaciones, es decir, n = (zα/2 / E)2 (σ21 + σ22) Donde: zα/2 = z0.05/2 = z.025 = 1.97, E = 1, σ21 = 1.5, σ22 = 1.2 Sustituyendo estos valores en la fórmula de arriba da: n = (1.95 / 1)2 (1.5 + 1.2) = 10.27 ≈ 11 Por lo tanto, el tamaño de la muestra para las poblaciones µ1 y µ2 es: n = n1 = n2 = 11
12-8
Dr. Héctor Quevedo Urías
Ejercicios Capítulo 12 12.1. Se sabe que la duración, en horas, de un foco de 75 watts tiene una distribución, aproximadamente normal, con una desviación estándar de 25 horas. Supóngase que se desea una confianza del 95% en que el error en la estimación de la duración promedio sea menor que 5 horas. ¿Qué tamaño de muestra debe usarse?
(≈ 97)
12.2. Hacer el mismo problema que el anterior, pero ahora usando una confianza de 99% y un error E = 1 y comparar los resultados. 12.3. Un ingeniero automotriz desea determinar el tiempo promedio que tardaría un mecánico en girar las llantas de un auto. Este ingeniero quiere estimar, con una confianza de 95%, que el promedio de su muestra es imprecisa en cuando más 0.50 minutos. Si sabe de estudios pilotos anteriores que la desviación estándar es de σ = 1.6 minutos, ¿qué tan grande deberá ser la muestra que debe de seleccionar, aleatoriamente? Sugerencia: Usar la fórmula n = (zα/2 σ/E)2 (39.3 ≈ 40 mecánicos) 12.4. El director de cierta universidad desea usar el promedio de una muestra aleatoria para estimar el monto promedio de tiempo que se les lleva a los estudiantes para ir de un salón a otro y tomar sus clases sin llegar tarde. Para esto desea afirmar con 99% de confianza que el error es cuando más de 0.25 minutos. Experiencias anteriores estiman una desviación estándar de σ = 1.40 minutos. Siendo así, ¿qué tan grande deberá ser la muestra que se deba tomar? 12.5. La Environmental Protection Agency (EPA) de los Estados Unidos desea conducir una prueba de millaje de cierto modelo de un auto importado. El ingeniero estadístico de la EPA desea estimar el promedio µ, de millas por galón de combustible usado por este modelo, con 95% de nivel de confianza. Asumiendo 12-9
Dr. Héctor Quevedo Urías
que σ = 2.5 millas por galón, ¿qué tamaño de muestra (número de autos de este modelo) deberá tomar para conducir esta prueba?
(n = 25)
12.6. Considerar el ejemplo 12.1 de la gasolina oxigenada, para la estimación del tamaño de las muestras para las poblaciones uno y dos. Siendo así, estimar los tamaños de las muestras apropiados, si queremos una confianza de 99% y el error de la estimación de las diferencias entre los promedios sea menor que 4.
12-10
APENDICE A. LISTA DE TABLAS TABLA 1. Probabilidades binomiales acumuladas TABLA 2. Probabilidades de Poisson acumuladas TABLA 3. Áreas bajo la curva normal P(z ≤ zo) TABLA 4. Puntos porcentuales de t[λ;ν] de la distribución de t de Estudiante TABLA 5. Puntos porcentuales de χ2( λ;ν) de la distribución de JI cuadrada TABLA 6. Función de gamma incomplete TABLA 7. Valores críticos para la distribución de F P(F ≤ Fo) TABLA 8. Puntos porcentuales de la distribución de r10
TABLA 1. Probabilidades binomiales acumuladas
Fuente: Daniel W. W. y James Terrell. Business Statistics. Houghton Mifflin Company (1989).
Por ejemplo, si F(X) = P(X ≤ x), y si p = 0.20, x = 2, n = 7, entonces, F(2) = P(X ≤ 2) = 0.8520
Apéndice A-1
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-2
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-3
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-4
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-5
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-6
Tabla 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-7
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-8
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-9
TABLA 1. Probabilidades binomiales acumuladas
Apéndice A-10
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-11
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-12
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-13
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-14
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-15
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-16
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-17
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-18
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-19
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-20
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-21
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-22
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-23
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-24
TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-25
TABLA 2. Probabilidades acumuladas de Poisson. c
F(c) = P(X ≤ c) = Σ µx e-µ / x! x=0
Fuente: Morris Hamburg. Statistical Analysis for Decision Making. Harcourt Brace Javanovich, Inc. (1991).
Ejemplo: Si µ = 1.00 y x = c = 2, entonces, F(2) = P(X ≤ 2) = 0.9200
Apéndice A-26
TABLA 2. Probabilidades acumuladas de Poisson (Continuación)
Apéndice A-27
TABLA 2. Probabilidades acumuladas de Poisson (Continuación)
Apéndice A-28
TABLA 2. Probabilidades acumuladas de Poisson (Continuación)
Apéndice A-29
TABLA 3. Áreas bajo la curva normal
Fuente: Daniel W. W. y James Terrel. Business Statistics. Houghton Mifflin Company (1989). Apéndice A-30
TABLA 3. Áreas bajo la curva normal (Continuación)
Apéndice A-31
TABLA 3. Áreas bajo la curva normal (Continuación)
Apéndice A-32
TABLA 3. Áreas bajo la curva normal. (Continuación)
Apéndice A-33
TABLA 3. Áreas bajo la curva normal. (Continuación)
Apéndice A-34
TABLA 4. Puntos porcentuales de t(λ;ν) de la distribución de t de Estudiante.
____________________________________________________________________ Fuente: Dunn, O. J. y Virginia A. Clark. Applied Statistics: Analysis of Variance and Regression. John Wiley and Sons, Inc., New York (1974).
Ejemplo de interpolación usando ν = 32 grados de libertad con λ = 0.95 35 – 1.609 32 – x 30 – 1.697
(32 – 30)/(35 – 30) = X/(1.697 - 1.690), x = .0028 Enseguida agregar .0028 a 1.690 para dar 1.6923. Por lo tanto, el valor de t[.95;32] = 1.693 Apéndice A-35
TABLA 4. Puntos porcentuales de t(λ;ν) de la distribución de t de Estudiante (Continuación).
________________________________________________
Apéndice A-36
TABLA 5. Distribución de JI cuadrada (χ2).
Fuente: Mario F. Triola. Elementary Statistics. Addison-Wesley Publishing Company (1995).
Apéndice A-37
Tabla 7. Valores críticos para la distribución F(P)F ≤ Fo)
____________________________________________________________ Fuente: J. L. Devore. Probabilidad y Estadística para Ingeniería y Ciencias. Thomson Learning (2001).
Apéndice A-38
TABLA 7. Valores críticos para la distribución F (P(F ≤ Fo) (Continuación).
_______________________________________________________________
Apéndice A-39
TABLA 7. Valores críticos para la distribución F (P(F ≤ Fo) (Continuación).
_________________________________________________________________
Apéndice A-40
TABLA 7. Valores críticos para la distrtibución F (P(F ≤ Fo) Continuación).
________________________________________________________________
Apéndice A-41
TABLA 7. Valores críticos para la distribución F (P(F ≤ Fo) (Continuación).
_____________________________________________________________________
Apéndice A-42
TABLA 6. Función de gamma incompleta. F(x;α) = ∫
x 0
1 / Γ(α) yα-1 e-ydy
Fuente: Jay L. Devore. Probabilidad y estadística para ingeniería y ciencias. ThomsonLearning (2001).
Apéndice A-43
TABLA 8. Puntos porcentuales de la distribución de r10.
________________________________________________________ Fuente: Dunn, O. J. y Virginia A. Clark. Applied Statistics: Analysis of Variance and Regression. John Wiley and Sons, Inc. New York (1974)
Apéndice A-44
Apéndice B Bibliografía Anderson, D. R, Dennis J. Sweeney, Thomas A. Williams. Estadística para Administración y Economía. Vol. 1. Séptima edición. South-Western Publishing (1999). Berthoux, P. M., Linfield C. Brown. Statistics for Environmental Engineers. Lewis Publishers (1994). Brown L. Theodore, H. Eugene Le May, Jr., Bruce E. Bursten. Chemistry. The Central Science. Prentice Hall, Upper Saddle River, New Jersey. Eight Edition, (2000). Daniel, W. W., James C. Terrell. Business Statistics. First Edition. Houghton Mifflin Company (1989). Devore, J. L. Probabilidad y Estadística Para Ingeniería y Ciencias. Quinta edición. Thomson Learning. (2001) Dunn, O. J., Virginia A. Clark. Applied Statistics: Analysis of Variance and Regression. John Wiley and sons. New York London, Sydney, Toronto (1974). Freund, J.E. Statistics. A First Course. Second Edition. Prentice Hall, Inc. Englewood Cliffs, New Jersey (1976). Goldber, Ss. Probability. An Introduction. Published by Prentince Hall, Inc. Englewood Cliffs, N. J. (1960). Hamburg, M. Statistical Analysis for Decision Making. Fifth Edition. Harcourt Brace Jovanovich, Publishers. Academic Press. San Diego, New York, Chicago, Austin, Washington, D. C. (1989). Herber A., Raymond R. Colton. Statistical Methods. Fourth Edition. Barnes and Noble, Inc. New York (1966).
Jerome, C. R. Li. Statistical Inference. Distributed by Edwards Brothers, Inc. Ann Arbor, Michigan. (1964). Keller, G., Brian Warrock, Henry Bartel. Statistics for Management and Economics: a Systematic Approach. Second Edition. Wardsworth Publishing Company, Belmont, California (1990). Kutner, M. H., Chistopher J. Nachtsheim, John Neter, Willliam Li. Applied Linear Statistical Models. Fifth edition. McGraw-Hill International Edition (2005). Lapin, L. L. Statistics for Modern Business Decisions. Harcourt Brace Javanovich, Inc. (1981). Manly, B. F. J. Statistics for Environmental Science and Management. Chapman & Hall/CRC (2001). Montgomery, D., George C. Runger. Probabilidad y Estadística Aplicadas a la Ingeniería. Mcgraw Hill Interamericana Editores, S.A. De C. V. (1996). Montgomery, D. C. Elizabeth A. Peck, G. Geoffrey Vining. Introducción al Análisis Lineal. Grupo Patria Cultural, S. A. De C. V. (2002). Myers, W., Raymond H. Myers. Probabilidad y Estadística. Cuarta Edición. Mcgraw Hill/Interamericana de Mexico, S. S. De C. V. (1992). Neter, J., Michael H. Kutner, Christopher J. Nachtsheim, William Wasserman. Applied Linear Regression Models. Third Edition. Irwin (1996). Sanders, D. H. Statistics. A First Course. Fifth Edition. Sawyer, N.C., Perry L. Mccarty. Chemistry for Sanitary Engineers. Second Edition. Mcgraw-Hill (1967). Smith, G. Statistical Reasoning. Allyn And Bacon, Inc. Boston London Sydney Toronto (1985). Spiegel, M. R. Schaum's Outline of Theory and Problems of Statistics. Schaum Publishing Company, New York (1961).
Standard Methods for the Examination of Water and Wastewater. Prepared And Published Jointly by: American Public Health Association, American Water Works Association and Water Pollution Control Federation. American Public Health Association, 1015 Eighteenth Street, N.W., Washington, D.C. 20036 (1971). McClave, J. T., George Benson. Statistics for Business and Economics. Second Edition. Dellen Publishing Company, San Francisco and Santa Clara, California (1982). Triola, M. F. Elementary Statistics. Sixth Edition. Copyright 1995. AddisonWesley Publishing Company, Inc. Walpole, E. R., Raymond H. Myers. Probability and Statistics for Engineers and Scientists. Fifth Edition. Prentice Hall, Inc. (1993). Yamane, T. Statistics, an Introductory Analysis. Harper & Row, Publishers, Incorporated, 49 East 33rd Street, New York 16, N.Y. (1964).
Apéndice C Papel de gráfica Papel de gráfica semilogarítmico de 5 ciclos Papel de gráfica logarítmico Papel de gráfica de probabilidad Papel de gráfica de probabilidad binomial para analizar datos enumerados Papel de gráfica de frecuencia relativa acumulada en función de la variable aleatoria X
Apéndice C
Papel de escala semilogarítmica
Papel de gráfica de escala logarítmica completa.
Papel de gráfica logarítmico de 2x2 ciclos
Papel de gráfica de escala aritmética
Papel de grafica de frecuencia relativa acumulada en función de la variable aleatoria X
Apéndice D Índice Ajustamiento de curvas, 9-29, 9-30 Análisis de varianza en dos sentidos, 7-25 Análisis de varianza en tres sentidos, 7-36 – 7-39 Análisis de varianza, 7-1 análisis de varianza de bloques completamente aleatorizados, 7-17 diseños de ANOVA completamente aleatorizados, 7-3 ANOVA con tres factores usando el Minitab, 7-50, 7-53 Aplicaciones de la distribución de Poisson, 4-1. Ver distribución de Poisson dentro de sus propios términos y como una aproximación a la distribución binomial, 4-6, 4-7 Aplicaciones de la distribución de t de Estudiante, 6-4 Aplicaciones de la distribución hipergeométrica usando el programa Minitab, 3-40 Áreas bajo la curva normal, 5-7 Autocorrelación, 8-30, 8-58, 9-9, 9-47, 9-48, 9-49, 9-54 Axiomas y propiedades básicas de la probabilidad, 2-6 Coeficiente de correlación R, 8-9, 8-17 Coeficiente de determinación R2, 8-8, 8-17 Combinaciones ortogonales, 7-43 Combinaciones, 2-32 Complemento, 2-11 Componentes de la prueba de hipótesis, 5-41 Cuartiles, 1-30, 1-31 Curvas de frecuencia, tipos de, 1-19 Desviación estándar, 1-10 Desviaciones del promedio, 1-13 Diagramas de árbol, 2-24 Diagramas de tallo y hoja, 1-27 Diagramas de Venn, 2-18 Diferencias entre la distribución de Poisson y la distribución binomial, 4-2 Distribución binomial, 3-1 Distribución de gamma, 5-28 Distribución de JI cuadrada, 6-24 Distribución de Poisson, 4-1 Distribución de t de Estudiante, 6-1 Distribución de Weibull, 5-31 Distribución exponencial, 5-24 Distribución hipergeométrica, 3-1, 3-31 Distribución normal estándar y distribución normal no estándar, 5-10 Distribución normal, 5-6 Distribuciones de frecuencia, 1-17, 1-21 Distribuciones de probabilidad continua, 5-1 Durbin-Watson, prueba de autoacorrelación, 9-48- 9-53
Estadística inferencial, 5-34 Error estándar, 1-14, 5-36 Estadística, definición de, 1-1 Estadística no paramétrica, 10-1 Ensayo de Bernoulli, 3-2 Ecuación de la línea de regresión, 8-2 Eventos mutuos excluyentes, 2-13 Eventos dependientes e independientes, 2-16 Estocástico, definición de, 2-18 Estadística descriptiva, 1-1, 1-3 Espacio muestral, 2-8 Evaluaciones de los modelos de regresión, 8-37, 9-8 Función de densidad de probabilidad de la variable aleatoria continua x, 5-2 Fórmula empírica para hacer interpolaciones para calcular el valor de la probabilidad p, 5-53 Fórmula fundamental del cálculo, 5-3 Heteroscedasticidad y homoscedasticidad, 9-55 prueba de hipótesis para heteroscedasticidad, 9-57 Hipótesis nula para β, α, y µY|X, 8-11, 8-12 Histogramas, 1-20 Interacción con ANOVA de dos factores, 7-26, 7-27, 7-28 Interacción con ANOVA de tres factores, 7-39, 7-40 Intersección de eventos, 2-10 Intervalo de confianza para el coeficiente β, 8-10 Intervalos de confianza para la diferencia de dos promedios (µ1 – µ2) con varianzas conocidas, 5-72 Intervalos de confianza para proporciones, 5-77 Intervalos de confianza para σ2 usando la distribución de JI cuadrada, 6-28 Intervalos de confianza para µ con varianza σ2, conocida, 5-32 Intervalo de confianza para α, 8-10 Kolmogorov-Smirnov para prueba de normalidad, 5-63 Kurtosis, 1-14 Mediana, 1-6 Medidas de tendencia central, 1-4 Moda, 1-7 Modelo de regresión cuadrático con 2 y 3 variables independientes, con y sin interacción, 9-24 Modelo de regresión múltiple generalizado, 8-33 Modelo de segundo orden con mas de dos variables independientes con interacción, 9-5 Modelos de regresión múltiple con mas de dos variables regresoras, 8-34 Modelos de regresión no lineales y de regresión logística, 9-24, 9-25 Multicolinealidad, diagnóstico de, 8-17, 8-58, 9-21, 9-31, 9-32, 9-33
Niveles de significancia, 5-33, 5-38, 5-40, 4-49, 5-50, 5-55, 9-5 Niveles de confianza. Ver niveles de significancia
Papel de probabilidad, uso de, 1-24 Permutaciones, 2-28 Probabilidad de frecuencia relativa, 2-4 Probabilidad subjetiva, 2-5Rango, 1-13 Probabilidad, definición de, 2-1, 2-2 Promedio aritmético, 1-4, 1-5 Promedio geométrico, 1-9 Prueba de bondad de ajuste usando la distribución de JI cuadrada, 6-31, 9-32 Prueba de Kruskall-Wallis para funciones no paramétricas, 10-4 Prueba de normalidad, usando la función de Anderson-Darling, 5-63 Prueba de White para heteroscedasticidad, 9-56 Pruebas de hipótesis para el promedio µ usando la t de Estudiante, 6-5 Pruebas de hipótesis para observaciones pares, 6-6 Pruebas de hipótesis para proporciones, 5-74, 5-75 Pruebas de hipótesis, 5-34 Pruebas estadísticas para seleccionar el mejor modelo de regresión, 9-15 Rango, 1-13 Regla aditiva para eventos mutuos excluyentes y no mutuos excluyentes, 2-40 Regla de multiplicación mas general, 2-22 Regla de multiplicación para eventos dependientes e independientes, 2-37 Regla del producto para pares ordenados, 2-12 Regla factorial, 2-23 Regresión lineal múltiple, 8-1 Regresión múltiple usando el paquete Minitab, 8-54 Regresión polinomial, 9-31 modelos polinomiales de segundo orden, 9-2 modelos polinomiales de tercer orden, 9-3 Relación entre la distribución binomial y la distribución de Poisson, 3-6 Relación entre la distribución binomial y la distribución normal, 3-6 Relación entre la distribución hipergeométrica y la distribución binomial, 3-33 Series de tiempo, 11-1 clasificaciones de los movimientos de series de tiempo, 11-3 Sesgo, 1-14 Tamaño de la muestra, 12-1 Técnicas de conteo, 2-20 Tipos de errores I y II, 5-37 Triángulo de Pascal, 3-4 Unión, 2-9 Valor de la probabilidad p, 5-48, 5-50, 6-16, 6-17
metodología para calcular el valor de p, 5-42 Valores atípicos extremos, diagnóstico de, 9-31 Valores de varianza inflada (VIF), 9-33 Variable aleatoria continua definición de, 1-4, 2-18 Variable aleatoria discreta, 2-18 Variable aleatoria estandarizada z, 1-12, 5-8 Variable aleatoria, definición de, 2-17 Varianza, 1-10
View more...
Comments