Inferencia Estadistica Para Economia y Empresa
Short Description
Download Inferencia Estadistica Para Economia y Empresa...
Description
INFERENCIA ESTADÍSTICA PARA ECONOMÍA Y EMPRESA
This page intentionally left blank
José Agulló Candela Vicente Carratalá Pastor Joaquín Gimeno Aranda
INFERENCIA ESTADÍSTICA PARA ECONOMÍA Y EMPRESA (Teoría y ejercicios resueltos)
UNIVERSIDAD DE ALICANTE
José Agulló Candela, Vicente Carratalá Pastor y Joaquín Gimeno Aranda © de la presente edición Publicaciones de la Universidad de Alicante Campus de San Vicente s/n 03690 San Vicente del Raspeig Publicaciones @ ua.es http://publicaciones.ua.es Diseño de portada: Alfredo Candela Impresión: Compobell, S.L. Salón de Ruiz Hidalgo, bajo 9. Murcia I.S.B.N.: 84-7908-458-8 Depósito Legal: MU-2239-1999
Reservados todos los derechos. No se permite reproducir, almacenar en sistemas de recuperación de la información ni o transmitir alguna parte de esta publicación, cualquiera que sea el medio empleado -electrónico, mecánico, fotocopia, grabación, etc.-, sin el permiso previo de los titulares de los derechos de la propiedad intelectual.
ÍNDICE GENERAL
PRÓLOGO
11
CAPÍTULO 1. INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA 1. 2. 3. 4. 5.
Introducción Muestreo aleatorio simple Generación de una m.a.s. de una distribución conocida Definición de estadístico Distribución muestral de un estadístico 5.1. Distribución muestral de la media muestral 5.2. Corrección por población finita 5.3. Esperanza de la varianza muestral 6. Muestreo de una población normal 7. Teorema central del límite 8. Distribución de la proporción muestral Ejercicios
13 14 15 18 19 19 21 21 22 25 27 29
CAPÍTULO 2. ESTIMACIÓN PUNTUAL 1. 2. 3. 4. 5.
Introducción Insesgadez Criterio del error cuadrático medio Consistencia Método de los momentos 5.1. Introducción 5.2. Ejemplos de estimadores obtenidos por el método de los momentos. 5.3. Propiedades de los estimadores obtenidos por el método de los momentos
39 39 41 43 45 45 45 46
8
6. Método de la máxima verosimilitud 6.1. Introducción 6.2. Ejemplos de estimadores maximoverosímiles 6.3. Propiedades de los estimadores maximoverosímiles Ejercicios
índice
46 46 47 49 50
CAPÍTULO 3. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 1. Introducción 2. Intervalos de confianza bajo normalidad 2.1. Problema de una muestra 2.1.1.Intervalo para la media poblacional, varianza conocida 2.1.2. Intervalo para la media poblacional, varianza desconocida 2.1.3.Intervalos para la varianza poblacional 2.2. El problema de dos muestras 2.2.1.Intervalo para la diferencia de dos medias, varianzas conocidas. 2.2.2.Intervalo para la diferencia de dos medias, varianzas desconocidas 2.2.3.Intervalo para la diferencia de dos medias, muestras apareadas 2.2.4.Intervalo para el cociente de varianzas 3. Intervalos de confianza para muestras grandes Ejercicios
63 66 66 66 67 67 68 68 68 69 69 70 72
CAPÍTULO 4. CONTRASTES DE HIPÓTESIS 1. Introducción 2. Contrastes de hipótesis bajo normalidad 2.1. Problema de una muestra 2.1.1. Contrastes para la media poblacional, varianza conocida 2.1.2.Contrastes para la media poblacional, varianza desconocida.... 2.1.3.Contrastes para la desviación típica poblacional 2.2. El problema de dos muestras 2.2.1.Contraste para la igualdad de dos medias, varianzas conocidas 2.2.2.Contraste para la igualdad de dos medias, varianzas desconocidas 2.2.3.Contraste para la igualdad de dos medias, muestras apareadas 2.2.4. Contraste para el cociente de varianzas 2.3. Problema de k muestras 3. Contrastes de hipótesis para muestras grandes Ejercicios
83 90 91 91 94 97 100 100 102 103 103 106 109 111
CAPÍTULO 5. MÉTODOS ROBUSTOS Y NO PARAMÉTRICOS 1. Introducción 2. Métodos basados en la media recortada 2.1. Intervalos de confianza y contrastes para una muestra
135 137 137
índice
2.2. Contrastes e intervalos de confianza para dos muestras 2.3. Corrección de Satterthwaite para dispersiones desiguales 2.4. El problema de k muestras y el procedimiento FSD aplicado a medias recortadas 2.5. Una aplicación a diferencias apareadas 3. Uso de las transformaciones potencia para homogeneizar dispersiones .... 4. Métodos basados en la transformación rango 4.1. Rangos y un método para calcularlos 4.2. Una aplicación de la transformación rango para un problema de dos muestras 4.3. Un ejemplo de k muestras 4.4. Una aplicación a diferencias apareadas 4.5. Un método de diferencias apareadas basado en los rangos con signo Ejercicios
9
139 142 143 145 147 151 152 152 156 157 159 161
CAPÍTULO 6. BONDAD DE AJUSTE 1. Introducción 2. Test Ji-cuadrado 3. Test de Kolmogorov-Smirnov 4. Comparación de los contrastes Ejercicios
185 186 189 192 194
CAPÍTULO 7. CONTROL DE CALIDAD 1. Introducción 2. Control de calidad de fabricación por variables 2.1. Introducción 2.2. Parámetros conocidos 2.2.1.Límites de control para la media 2.2.2.Límites de control para la desviación típica 2.2.3.Límites de control para el rango 2.3. Parámetros desconocidos 2.4. Resumen 3. Control de calidad de fabricación por atributos 3.1. Cartas de control para la fracción de defectuosos 3.2. Cartas de control para el número de defectuosos 4. Control de calidad de fabricación por número de defectos Ejercicios
213 217 217 218 218 219 219 220 221 223 223 224 224 225
This page intentionally left blank
PRÓLOGO El presente libro proporciona material de apoyo para un curso cuatrimestral de Inferencia Estadística. Su nivel está adaptado al de los alumnos de los nuevos planes de estudio de las licenciaturas y diplomaturas en Economía y en Administración y Dirección de Empresas de las Facultades y Escuelas Universitarias de Ciencias Económicas y Empresariales. El libro presupone que el lector tiene conocimientos de Estadística descriptiva (incluyendo conceptos básicos de Estadística exploratoria tales como el gráfico tallo y hoja, el gráfico caja y el diagrama esquemático) y de teoría de la probabilidad. Cada capítulo del libro consta de dos partes. En la primera parte se presentan los resultados teóricos necesarios para la resolución de los ejercicios. Después de los resultados teóricos se presenta una colección de ejercicios resueltos. El libro comienza con una introducción a la Inferencia Estadística en la que se presentan los conceptos de muestreo aleatorio y distribuciones muéstrales de los estadísticos asociados al muestreo de poblaciones normales (capítulo 1). En el capítulo 2 se presentan los métodos de estimación puntual y en el capítulo 3 los métodos de estimación por intervalos de confianza. En el capítulo 4 se estudian los procedimientos clásicos de contraste de hipótesis basados en el supuesto de normalidad. En el capítulo 5 se recogen bajo el título de "métodos robustos y no paramétricos" un conjunto de técnicas inferenciales aplicables cuando el análisis exploratorio de la información muestral sugiere que los supuestos clásicos no son adecuados. El capítulo 6 describe los contrastes de bondad de ajuste basados en la distribución Ji-cuadrado y en el estadístico de Kolmogorov-Smirnov. Por último, el capítulo 7 introduce los conceptos básicos del control estadístico de la calidad. Los autores son profesores del Departamento de Fundamentos del Análisis Económico de la Universidad de Alicante y han acumulado una larga experiencia en la docencia de la Inferencia Estadística en la Facultad de Económicas y Empresariales de la citada universidad. Finalmente, los autores agradecen al profesor José Rodríguez Alejandre su paciencia y esmerada colaboración en las tareas técnicas.
This page intentionally left blank
CAPITULO 1 INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA 1. INTRODUCCIÓN Si alguien está interesado, pongamos por caso, en evaluar las preferencias políticas de la población formada por todos los votantes españoles, entrevistará lógicamente a una muestra formada por algunos de tales votantes. Después usará la información muestral para sacar conclusiones relativas a la población, por ejemplo, estimar la fracción real de todos los votantes que son favorables a una determinada formación política. Dos preguntas importantes que surgen son cómo seleccionar los elementos de la muestra y cómo aproximar los valores de los parámetros de la distribución poblacional usando la información muestral. Y, si podemos contestar tales preguntas, ¿cómo calcular o hacernos una idea del grado de fiabilidad o precisión de tales estimaciones? Cualquier conclusión basada en una muestra está sujeta a incertidumbre, pues a partir de un subconjunto de la población no podemos sacar conclusiones verdaderas sobre la población sino conclusiones probables. Intuitivamente, podemos afirmar que cuanto mayor sea el número de votantes incluidos en la muestra, tanto mayor será la probabilidad de obtener una buena estimación de la fracción de todos los votantes que son favorables a una determinada formación política. Pero, para tener una estimación que esté cerca del parámetro, la muestra debe ser representativa de la población de la que procede. La muestra representativa ideal sería una en la que la distribución de frecuencias muestral coincidiese con la distribución de frecuencias poblacional, pero para seleccionarla necesitamos justamente la información que buscamos. Para garantizar la representatividad de las muestras, el muestreo ha de ser aleatorio, es decir, generado por algún mecanismo de azar. Si las muestras se extraen aleatoriamente, las observaciones muéstrales son variables aleatorias en el proceso de muestreo repetido. Los estadísticos son funciones de estas observaciones, así que son variables aleatorias también. Los estimadores son estadísticos y tienen, por tanto, distribuciones de probabilidad. Estas distribucio-
14
Introducción a la Inferencia Estadística
nes de probabilidad, llamadas distribuciones muéstrales de los estimadores, hacen posible la inferencia estadística. 2. MUESTREO ALEATORIO SIMPLE Existen diferentes métodos de muestreo aleatorio pero en este libro sólo estudiaremos el prototipo fundamental llamado muestreo aleatorio simple. A menudo se omite el adjetivo simple, siempre que se haga referencia únicamente a este método de muestreo. El muestreo aleatorio simple es el proceso de seleccionar observaciones a partir de una población, de modo que toda observación de la población tiene la misma probabilidad de ser incluida en la muestra que cualquier otra (la observación tiene la distribución de probabilidad de la población) y además toda observación es independiente de cualquier otra (es decir, no afecta a otra selección ni se ve afectada por otra observación). Formalizando estas condiciones, vamos a caracterizar el muestreo aleatorio simple de una distribución de probabilidad. Denotemos por X la variable aleatoria (v. a.) objeto de estudio y supongamos que X tiene función de distribución F(x) y función de densidad f ( x } si es continua o función de masa de probabilidad P( X = x) si es discreta. Supongamos que se ha extraído una muestra de n observaciones de X y representemos los elementos de la muestra por X\,...,Xn. Decimos que X^,...,Xn es una muestra aleatoria simple (m.a.s.) de la distribución F si y solo si X{,...,Xn son v.a. independientes e idénticamente distribuidas con función de distribución común F. Así pues, s i X { , . . . , X n es una m.a.s. de F, la función de distribución de cada X¡ es igual a F y, además, las X¡ son independientes. En consecuencia, la función de distribución conjunta de *„...,*„ es
Si F es continua, entonces la función de densidad conjunta deX¡,...,Xn es
mientras que si F es discreta, la función de masa de probabilidad conjunta de^,,...,^, 7 es
Ejemplo 2.1. Fiabilidad de componentes electrónicos. Para estudiar la fiabilidad de unos componentes electrónicos, el tiempo de vida X (en horas) de un componente dado puede suponerse que es una variable aleatoria con distribución exponencial de media 9. Entonces la función de densidad de X es , y cero en otro caso. Una muestra aleatoria de n
15
componentes se somete a un test. Entonces, la distribución conjunta de la muestra X},...,Xn tiene función de densidad conjunta
si Xj > O,..., jcw > O , y cero en otro caso. En la práctica, el mejor método de conseguir una muestra aleatoria simple es emplear números aleatorios, como veremos en la siguiente sección. 3. GENERACIÓN DE UNA M.A.S. DE UNA DISTRIBUCIÓN CONOCIDA En ocasiones ocurre que las distribuciones de probabilidad de variables aleatorias de determinadas poblaciones son conocidas en su forma y parámetros. Vamos a ver cómo el conocimiento deductivo de lo que ocurrirá al tomar muestras aleatorias de distribuciones conocidas va a ser fundamental en el proceso de inferencia porque, aunque se conozcan las distribuciones de estas variables aleatorias, en ocasiones es difícil obtener las distribuciones de ciertas funciones de ellas. Estas distribuciones de probabilidad representan modelos para el comportamiento de las frecuencias relativas de las funciones en un muestreo repetitivo. Por ejemplo, la distribución de la diferencia de las variables aleatorias Xc = «radio del cilindro» y Xp= «radio del pistón» en el ejercicio 8 es difícil de obtener. Sin embargo podemos obtener m.a.s. simuladas de la distribución conjunta de Xc y Xp, y a partir de ellas aproximar la distribución de la diferencia Xc — Xp. Cuanto mayor sea el número de muestras simuladas que obtengamos, más se aproximarán la distribución de frecuencias muestral y la distribución de probabilidad real. Veamos cómo simular observaciones de una distribución conocida. Las tablas de dígitos aleatorios (o una simple calculadora científica) nos permiten obtener simulaciones de m.a.s. de una distribución uniforme en el intervalo [0,1]. Para obtener una m.a.s. de una distribución poblacional conocida, partimos de una m.a.s. de una distribución £7(0,1) y utilizamos un procedimiento basado en la llamada transformación integral de probabilidad. Si la distribución corresponde a una variable aleatoria continua, la transformación integral considera los valores simulados de una distribución £7(0,1) como si fueran valores de la función de distribución de la variable que queremos simular. Teorema 1.1. Teorema de la transformación integral de probabilidad Sea X una variable aleatoria continua con función de distribución F(x). Sea Y=F(X). Entonces Y ~ £7(0,1). Demostración Como F es monótona creciente por ser la función de distribución de una v.a. continua, la existencia de F"1 está garantizada. La función de distribución de Y, que denotamos por G(y), cumple
16
Introducción a la Inferencia Estadística
Así, G(y) es la función de distribución de una variable £7(0,1) y, por tanto, Y ~ £7(0,1). Además, el recíproco del teorema 1.1 también es cierto: Si F ~ £7(0,1) yF~l(Y) = X, entonces X tiene función de distribuciónF. En efecto, sea// la función de distribución de X. Entonces,
ya que Y ~ £7(0,1). Luego H=F. En este resultado se basa la simulación de variables aleatorias continuas. Si tenemos una m.a.s. yl,...,yn de una distribución £7(0,1), entonces el conjunto de valores xl = F~l(y}),...,xn =F~\yn) constituyen una m.a.s. de X. Por tanto, la transformación integral nos permite generar una m.a.s. de una variable continua cuya distribución es conocida. En resumen, el procedimiento para simular una m.a.s de tamaño n de una v.a. continua consiste en repetir n veces las siguientes etapas: a) Obtener un número aleatorio y entre O y 1. b) Considerar y como un valor de F(x) y tomar * = F~l(y) como observación de^T. Ejemplo 3.1. Sea X una v.a. continua con función de densidad
, y cero
en otro caso. Vamos a generar utilizando la transformación integral una m.a.s. de tamaño 3 de la variable aleatoria X usando la siguiente m.a.s de una distribución uniforme en el intervalo [0,1]: 0.408, 0.225, 0.063. La función de distribución de X Tomando
y = F(x),
obtenemos
• Así, los valores simulados de X para y respectivamente. La figura 4.1 proporciona la relación unívoca entre cada y¡ y su correspondiente x¡ a través de la representación gráfica de la función de distribución de X. Para simular una m.a.s. de tamaño n de una v.a. discreta se repiten n veces las siguientes etapas: a) Obtener un número aleatorio _y entre O y 1. b) Considerar y como un valor de la función de distribución F de la variable X que simulamos, y tomar como observación simulada el valor x más pequeño tal que F(x) > y , es decir, min
17
Figura 4.1.
Ejemplo 3.2 Sea X = «número de niñas en familias de 5 hijos» y supongamos que X ~ 5(5,1/2). La función de distribución de X es 0
si x < O
0.0312
siO6 entonces g(0n)—^—-»g(0). 2. Si 6 entonces:
entonces 0
es dicir
para todox en
que F es continua. La demostración de este resultado se omite. Sin embargo la utilidad del resultado se ilustra en los siguientes ejemplos. Ejemplo 4.2. Estimación de la varianza poblacional Sabemos que si X^,...,Xn es una m.a.s. de una población con varianza o1 1 n entonces la varianza muestral es un estimador insesgado de a . Supongamos E(X¡ ) < o o . Entonces, por la consistencia de los momentos muéstrales para los momentos poblacionales y la parte 2 de la proposición 4.2, tenemos que
En consecuencia, 52 es consistente para O" 2 . Por la parte 1 de la proposición 4.2 resulta que S es consistente para (7, aunque 5 no es insesgado para a. Observamos que
también es consistente par
Ejemplo 4.3. La variable aleatoria T converge en distribución a una normal Cuando muestreamos una población normal, sabemos que
tiene una
distribución t de Student con (n-l) grados de libertad y puede escribirse como Observamos que (X-ju)^n/(7 normal tipificada mientras S/G
tiene una distribución exacta
>1 (según el ejemplo anterior). Por tanto, la
45
parte 3 de la proposición 4.2 implica que T converge en distribución a una normal tipificada. Si las X¡ no son normales pero tienen varianza finita cr2 y E(Xf} < °°, entonces por el teorema central del límite se obtiene el mismo resultado. Ejemplo 4.4. Consistencia de la función de distribución empírica Sea X\,...,Xn una m.a.s. de una función de distribución F. La función de distribución empírica de la muestra se define por número de X¡ menores o iguales que F = «numero de X¡ meñores o iguales que x». Entonces Y sigue una distribución binomial con parámetros Por la consistencia de la media muestral para la media poblacional resulta que 5. MÉTODO DE LOS MOMENTOS 5.1. Introducción El método de los momentos es posiblemente el método de estimación más antiguo. Consiste en tomar como estimador de la característica numérica de la población (parámetro) la correspondiente característica numérica de la muestra (estadístico); por ejemplo, tomar como estimador de la media poblacional fj. la media muestral X, como 9 9 estimador de la varianza poblacional o la varianza muestral S , etc. Supongamos que se trata de estimar un vector de parámetros 9 = (9^...,9k] cuyas componentes son funciones de los momentos poblacionales:
Entonces, calculamos
los correspondientes momentos muéstrales y los sustituimos en el sistema de ecua-
ciones. Así obtenemos los estimadores por el método de los momentos de 61,62,...,0k. 5.2. Ejemplos de estimadores obtenidos por el método de los momentos a) Sea X\,...,Xn una m.a.s. de una distribución de Poisson con parámetroÁ desconocido. Como m\ = E(X} es A , tenemos que Á = m} y, por tanto, el estimador de A por el método de los momentos es
46
Estimación puntual
b) Sea X\,...,Xn una m.a.s. de una distribución uniforme en el intervalo [0,b] donde b es desconocido. Como w¡ = E(X] es b/2, tenemos que consecuencia, el estimador de b por el método de los momentos es c) Sea X¡,...,Xn una m.a.s. de una distribución normal con media JUQ y varianza L(0 2 ) intuitivamente pensaríamos que, a la vista de los resultados muéstrales, el valor de 9} es «más plausible» o «más verosímil» que el de 9 . El método de estimación maximoverosímil (o de la máxima
47
verosimilitud) consiste en elegir como estimador de 6 aquel valor 6 que haga máxima la probabilidad de aparición de los valores muéstrales efectivamente observados o, lo que es lo mismo, que maximice la función de verosimilitud. En la práctica, para encontrar el estimador maximoverosímil conviene trabajar con el logaritmo neperiano de la función de verosimilitud denotado por In L. Como el logaritmo es una función monótona creciente, si L alcanza el máximo en 6 entonces In L también alcanza el máximo en 9. Diremos, por tanto, que 6^y es el estimador maximoverosímil de 6 (estimador MV de 6) si LÍ0MV;x{,...,xn} = sup L(6;x\,...,xn} o, equivalentemente, Si la función de verosimilitud es diferenciable en el espacio paramétrico 0, para obtener 9MV podemos resolver las ecuaciones de verosimilitud = O y comprobar que 6.2. Ejemplos de estimadores maximoverosímiles a) Estimación maximoverosímil de la media de una distribución Poisson El número de llamadas equivocadas recibidas en una centralita telefónica se modeliza con frecuencia mediante una distribución de Poisson. Sean X^,...,Xn el número de llamadas equivocadas en n días diferentes. Si suponemos que el número medio de llamadas equivocadas es el mismo, digamos A,, en cada día y que los sucesos son independientes, entonces
En consecuencia
proporciona el estimador maximoverosímil
b) Estimación de 6 para una distribución uniforme U(Q,0) Supongamos que un autobús llega a una parada entre la hora O y la hora 6 (inclusive) y que la probabilidad de llegada en cualquier subintervalo de tiempo es proporcional a la longitud del subintervalo. Entonces el tiempo X que tiene que esperar una persona que llega a la hora O sigue una distribución uniforme en el intervalo [0,0]. Para estimar 9 suponemos que tomamos una m.a.s. de n observacio-
48 nes
Estimación puntual
de
X.
La
función
de
verosimilitud
de
la
muestra
es
en otro caso Pero esta función no es diferenciable para todo 6 (no es continua para todo 0). Observando que Q ft (i = 1 , . . . , n) usamos una función indicador. Sea A un conjunto cualquiera. Definimos la junción indicador de A mediante . Las funciones indicador tienen propiedades simples, y la
53
Ejercicios
propiedad más útil que necesitamos es que I A ( x ) - I B ( x ) = IAl^B(x) . Usando la función indicador podemos reescribir L(P) como anBna Además es ¿(l)= > como equivalente a ;c (1) >/3, la función de verosimilitud también se puede escribir como Observamos que L(/3) es positiva para valores P iguales o menores que el mínimo valor observado de la muestra y cero para valores P mayores que el mínimo valor observado de la muestra. Como resulta que L(j3) es una función creciente con p. Por tanto, el dft p máximo de L(p) se alcanza en x (1) . Así, el estimador maximoverosímil de P es ¿ =*(!)•
Si queremos encontrar un estimador insesgado de P basado en el estimador P=X(V), calculamos la esperanza de X^. Para encontrar la esperanza de.Y(1) necesitamos la función de densidad de X(l}, que es de la forma
pues Asi, Luego
es un estimador insesgado de P basado en el estimador maxi-
moverosímil. 4. Se extrae una m.a.s. de tamaño n de una variable aleatoria X con función de densidad a) Demostrar que
y cero en otro caso. como estimador de 6 es insesgado y consistente.
b) Encontrar razonadamente otro estimador insesgado para 6. c) Calcular la eficiencia relativa del estimador insesgado obtenido en el apartado b) respecto al estimador insesgado obtenido en el apartado a).
54
Estimación puntual
Solución a) El estimador
es insesgado para 9 ya que
Por la parte 1 de la proposición 4.2, como nua, entonces
es conti, es decir, el estimador
es
consistente para d. b) La función de verosimilitud de la muestra es e
0X(n} y cero para (n). Entonces el máximo de L(0) se alcanza en X(ny Así, el estimador maximoverosímil de 6 es O = X (w) . Por tanto, el estimador maximoverosímil para (a,0)
b)
El
primer
momento
poblacional
es
6. Expresando a como función de Wj obtenemos « =
— . Sustituyendo el primer momento poblacional por el
primer momento muestral obtenemos que el estimador por el método de los momentos de d es
Este estimador es consistente para a pues haciendo uso de la proposición 4.2 tenemos que plim
57
Ejercicios
6. Sea Xl,...,Xn una muestra aleatoria simple de una población X con función de densidad f ( x ) = — exp{-O -//)/cr} si x > ¿u , y cero en otro caso. ju, y cero en otro caso. El logaritmo de la parte positiva de la función de verosimilitud es In a w obtenemos
Diferenciando con respecto = — > O, es decir, L(a, ¡u Vi = !,...,« es equivalente a x(1) > //, tenemos que L(n,a) es positiva para / / < x(1) y cero para // > jc (1) . Entonces, el máximo de L(n, 0, y cero en otro caso. Supongamos que se toma una m.a.s. de tamaño n de dicha variable aleatoria X. a) Encontrar un estimador maximoverosímil del coste fijo 9. b) Estimar el coste fijo O por el método de los momentos y analizar la consistencia del estimador obtenido. c) Obtener los estimadores insesgados del coste fijo Abasados en los estimadores encontrados en a) y b). d) Encontrar la eficiencia relativa de los dos estimadores insesgados obtenidos en c). Solución a) La función de verosimilitud de la muestra es
L(0) es positiva para 0^xü) (y cero para 0>*(1)) y creciente para 9>xw. Luego el máximo se alcanza en jc (1) . Por tanto, el estimador maximoverosímil de 0es 6 = X(^. b) El primer momento poblacional es
El parámetro 0como función del primer momento poblacional es d=[i-l. Sustituyendo el primer momento poblacional por el primer momento muestral obtenemos que el estimador por el método de los momentos de 6 es 6 — X — 1. Este estimador es consistente para 0pues haciendo uso de la proposición 4.2 tenemos que por lo que y, por tanto,
59
Ejercicios
c) Para facilitar la obtención de la esperanza de X(l) observamos que Y=X- 9~Exp(l), es decir, Y se distribuye con una función de densidad f ( y ) = exp{-^} si y > O , y cero en otro caso. Entonces, la función de densidad de
Por tanto, Y
tiene una distribución exponencial con media l/n, es decir,
asi
luego
consecuencia, X({) — es un estimador insesgado de 6. Por otra parte, Luego X -1 es otro estimador insesgado para 9. d) Vamos a comparar la eficiencia de los dos estimadores insesgados mediante el criterio de mínima varianza. La eficiencia relativa de X(]) — respecto a X-l es ER\X(])-- X-l =-r-
_ = __ = -7-3- = / i , que es mayor que la
unidad para n > 1. Luego el estimador insesgado basado en el estimador máximoverosímil es más eficiente que el estimador insesgado obtenido por el método de los momentos. 9. Sea X},...,Xn una m.a.s. de una distribución gamma con función de densidad cero en otro caso. a) Suponiendo que r y A son desconocidos, obtener por el método de los momentos los estimadores de r y A . b) Si r = 3, calcular el estimador de A por el método de los momentos. c) Si r — 3, obtener el estimador maximoverosímil de A . Solución a) Los dos primeros momentos de la distribución gamma con parámetros r y /I son
Resolviendo para los parámetros r y A
se obtienen las siguientes expresiones: A =
^ . Sustituyendo
el primer y segundo momentos poblacionales por los correspondientes momentos muéstrales obtenemos que los estimadores por el método de los momentos de A y r
60
Estimación puntual
son, respectivamente,
b) Como w1 = — , entonces A = — es el estimador de A por el método de los momentos. c) La función de verosimilitud es logaritmo neperiano es ln
el valor de
que maximiza esta función se obtiene resolviendo para A la ecuación que en este caso es
. Así, el estimador maximoverosímil de Á es
10. Sea X},...,Xn una m.a.s. de una población con función de densidad f ( x ) = 2x/62 si 0 OQ) usando una región crítica de la forma C = {T > k] , donde T denota el estadístico de prueba.
Figura 1.1.
87
El test ideal sería aquel para el que ambos tipos de error tienen probabilidad igual a cero, pero esta situación es imposible salvo en casos triviales. En la práctica tenemos que conformarnos con mantener estas probabilidades en un nivel pequeño aceptable. Se acostumbra a fijar la probabilidad del error de tipo I en un nivel (pequeño) prefijado a, 0< a< 1, y entonces se intenta minimizar la probabilidad del error de tipo II. Se dice que un test de la hipótesis nula H0: 6e 0Q contra //,: 0e @j tiene tamaño a, 0< a< 1, si sup Pe (Rechazar //0) = a. El tamaño elegido a es a veces inalcanza060,)
ble. De hecho, en varios problemas sólo son alcanzables una cantidad numerable de niveles a de [O, l]. En este caso tomamos el mayor valor menor que a que sea alcanzable. También decimos que una región crítica C es de nivel de significación a si Pe( C)e00
C es menor que su nivel de significación a. Con frecuencia el nivel de significación elegido es alcanzable. Si //0 es una hipótesis simple, entonces es obvio que ^//0(O es el tamaño de la región crítica C, pero PH (C) no es necesariamente igual al nivel de significación a prefijado. La elección de un valor específico para a es arbitraria. De hecho no es estrictamente un problema estadístico. La elección de a dependerá de consideraciones tales como las posibles consecuencias de rechazar H0 erróneamente, las implicaciones prácticas y económicas de rechazar // 0 , etc. A veces es posible usar un enfoque alternativo que consiste en indicar el llamado P-valor del estadístico de prueba observado. El P-valor es el mínimo nivel de significación a para el cual el estadístico muestral observado implica el rechazo de la hipótesis nula. Antes de dar una definición formal del P-valor, vamos a volver al ejemplo 1.1. Supongamos que el número observado de caras es 5 = 5. Entonces bajo HQ, P(S = 5) = 0.0938 . Sin embargo, la probabilidad de interés no es P(S = 5) sino P(S > 5) = 0.1094, ya que la probabilidad PH (S = 6) es incluso menor, y si rechazamos HQ cuando observamos s = 5 lo mismo debemos hacer cuando observamos un valor más extremo de 5. Esto motiva la definición del P-valor. Supongamos que la región crítica apropiada para contrastar H0 contra //, es unilateral. Esto es, supongamos que C es de la forma [T > c\} o \T < c2} , donde T es el estadístico de prueba. Entonces el P-valor es la probabilidad de observar bajo H0 un resultado muestral al menos tan extremo como el observado en la muestra. Si /o es el valor observado del estadístico de prueba y la región crítica es unilateral con rechazo por la derecha, es decir, C es de la forma {T > c } ] , entonces el P-valor es PH ( r > / 0 ) . Si la región crítica es unilateral con rechazo por la izquierda, es decir, C es de la forma {r0,(7 2 >OJ , entonces
Como el P-valor (probabilidad estimada de observar un valor de X mayor o igual que 6.1 bajo el supuesto //0:// = 5.8) es muy pequeño, la evidencia muestral en contra de HQ es fuerte. 2. CONTRASTES DE HIPÓTESIS BAJO NORMALIDAD En esta sección presentamos los contrastes de hipótesis relativos al muestreo de poblaciones normales. El supuesto de normalidad de la distribución poblacional ha jugado un papel muy importante en los procedimientos de contraste clásicos basados en muestras pequeñas. Primero describiremos los contrastes relativos a los parámetros de una distribución normal (problema de una muestra). Después estudiaremos contrastes relativos a los parámetros de dos poblaciones normales (problema de dos muestras). Por último consideraremos el contraste de igualdad de las medias de k poblaciones normales (problema de k muestras). Para cada contraste específico construiremos el estadístico de prueba e indicaremos la distribución del estadístico de prueba bajo la hipótesis nula, que nos permitirá por una parte establecer la región crítica para que la
91
probabilidad del error de tipo I sea igual a a (usualmente 0.05 ó 0.01), y por otra parte obtener la expresión del P-valor. El contraste de hipótesis consistirá en rechazar la hipótesis nula cuando el valor muestral del estadístico de prueba pertenece a la región crítica o, de forma equivalente, rechazar la hipótesis nula cuando el P-valor asociado al valor del estadístico de prueba es menor o igual que a. También desarrollaremos la fórmula analítica para calcular la probabilidad del error de tipo II (y, por tanto, la potencia del contraste) en los casos en que este desarrollo sea fácil. Asimismo indicaremos cómo determinar el tamaño muestral (o los tamaños muéstrales) para que las probabilidades de los errores de tipo I y de tipo II del procedimiento de contraste sean aceptables para el usuario. 2.1. Problema de una muestra Sea X{,...,Xn una m.a.s. de una distribución NÍju ,cr J . En este apartado consideramos contrastes de hipótesis relativos a los parámetros ¡¿ y o. 2.1.1. Contrastes para la media poblacional, varianza conocida Consideremos el contraste bilateral de la hipótesis nula H0:¡u =// 0 contra la hipótesis alternativa
Q
. El estadístico de prueba es Z0 =
p-, que bajo
la hipótesis nula sigue una distribución jV(0,l). Como X es un estimador insesgado del parámetro ¡i, si la hipótesis nula es verdadera cabe esperar que el valor muestral de Z0 sea pequeño. Por tanto, dudaremos de HQ cuando el valor muestral de Z0 sea lo suficientemente grande. Si deseamos que la probabilidad del error de tipo I del contraste sea igual a «, la región crítica que debemos elegir es C = {Z 0 /Z 0 >z f f / 2 o Z 0 z0|), donde Z ~ N(Q,\) y z0 es el valor muestral del estadístico de prueba. La regla de decisión consiste en rechazar //0 si Z0 e C y aceptar HQ si Z0 £ C. Esta regla es equivalente a rechazar H0 si el P-valor es menor o igual que a y aceptar HQ si el P-valor es mayor que a. Para el contraste unilateral de la hipótesis nula //0:// =¿/ 0 contra la hipótesis alternativa H^.ju > / / o > se utiliza el mismo estadístico de prueba Z0 que en el contraste bilateral. Dudaremos de HQ cuando el valor muestral de Z0 sea lo suficientemente grande. Para que la probabilidad del error de tipo I sea igual a a, la región crítica es El P-valor es El contraste unilateral de la hipótesis nula H0:ju = JUQ contra la hipótesis alternativa //,:// / / 0 , la probabilidad de aceptar la hipótesis nula cuando
En este contraste las figuras 4.3 y 4.4 representan las curvas características de operación para a=0.05 y a=0.01, respectivamente. La abscisa de estos gráficos corresponde a d = ——— = — como en el contraste bilateral. 0) es la misma que en el otro contraste unilateral, es decir
Además, también se
pueden usar las curvas características de operación de las figuras 4.3 y 4.4, tomando como abscisa Si el experimentador tiene la oportunidad de seleccionar el tamaño muestral al inicio del experimento y desea simultáneamente tener una probabilidad del error de tipo I igual a a y aceptar la hipótesis nula cuando ^=/n0+8 con probabilidad igual a /?, el tamaño muestral necesario para cumplir los anteriores requisitos en el contraste bilateral se puede obtener analíticamente. En efecto, como la probabilidad del error se pe
93
quena comparada con /? se obtiene que P=Q>\za/2
, por lo que
-a/2
El cálculo del tamaño muestral, para a, S y /3 dados, también se puede realizar gráficamente usando los haces de curvas OC de las figuras 4.1 y 4.2. Para el procedimiento de contraste unilateral de la hipótesis nula H0:¿u = ju0 contra la hipótesis alternativa H[:ju> JUQ, el tamaño muestral requerido para tener simultáneamente una probabilidad del error de tipo I igual a a y una probabilidad del error de tipo II igual a /? cuando I¿=n0+ 8( £>0), también se puede calcular analíticamente. En efecto, como la probabilidad del error tipo II es entonces z Esta expresión para el tamaño muestral es también aplicable cuando la hipótesis alternativa es H^.ju < //0 • En los dos contrastes unilaterales, el tamaño muestral para a, 8 y {$ dados, también se puede calcular gráficamente usando los haces de curvas OC de las figuras 4.3 y 4.4.
Figura 4.1. Curvas OC para una prueba normal bilateral con a=0.05
Figura 4.2. Curvas O C para una prueba normal bilateral con a=0.01
94
Contrastes de hipótesis
Figura 4.3. Curvas OC para una prueba normal unilateral con a=0.05
Figura 4.4. Curvas OC para una prueba normal unilateral con «=0.01 2.7.2. Contrastes para la media poblacional, varianza desconocida Para realizar el contraste bilateral de la hipótesis nula H0:¿u = jU0 contra la hipótesis alternativa H\\n ^ JÜQ cuando la varianza poblacional JUQ a un nivel de significación a la región crítica es C = ltQ /1()> ta.n_}\ y P-valor = P(t mientras que para el contraste unilateral //0:¿/ = // 0 frente a la región crítica es y P-valor
95
Para determinar la probabilidad de error de tipo II necesitamos conocer la distribución del estadístico de prueba t0 cuando H0 es falsa. Cuando /¿=[10+S, el estadístico de prueba es t0 = Z ~ #(0,1), W ~
donde
y las variables Z y W son independientes. La distribución
obtenida se denomina distribución t no central con w-1 grados de libertad y parámetro de no centralidad
donde A2 = —r-. De esta forma, la probabilidad del error de tipo II en el contraste bilateral es
Esta expresión permite calcular ¡3 (o n dado j8) con las tablas de la distribución X2 si conocemos A . La expresión para calcular la probabilidad del error de tipo II en los contrastes con hipótesis alternativas unilaterales se puede obtener de forma similar. Las figuras 4.9 y 4.10 presentan las curvas OC del contraste bilateral para a=0.05 y a=0.01, respectivamente. Las figuras 4.11 y 4.12 muestran las curvas OC para el caso //,:CT 0 , y las figuras 4.13 y 4.14 representan las curvas OC para //,: cr< a a) con a=0.05
99
Figura 4.12. Curvas OC para una prueba X unilateral de cola derecha (rechazo en a> O0) con a=0.01
Figura 4.13. Curvas OC para una prueba X unilateral de cola izquierda (rechazo en a< o(}) con a=0.05
Figura 4.14. Curvas OC para una prueba X unilateral de cola izquierda {rechazo en a< aa) con a=0.01
100
Contrastes de hipótesis
2.2. El problema de dos muestras En esta sección suponemos (salvo que se indique expresamente lo contrario) que X\ y X2 son dos poblaciones independientes tales que representan m. a. s. de respectivamente. 2.2.7. Contraste para la igualdad de dos medias, varianzas conocidas En
el
contexto
que
estamos
considerando
sabemos
que
y, portante, Si las varianzas poblacionales son conocidas y queremos contrastar la hipótesis nula HQ\H\ = jU2 contra la hipótesis alternativa bilateral H\.fa * jU2, el estadístico de prueba adecuado es Z0 = ,
'
2
Cuando la hipótesis nula es verdade-
ra, el estadístico de prueba Z0 sigue una distribución jV(0,l). Si deseamos que el nivel de significación del contraste sea a, la región crítica es C = \Z Si ZQ denota el valor muestral del estadístico de prueba, el P-valor es 2 • PÍZ > z0\\ El mismo estadístico de prueba Z0 se usa para contrastar las hipótesis alternativas unilaterales. Sin embargo, las expresiones para la región crítica y el P-valor son diferentes. Como la notación X¡ y X2 es arbitraria, denotando mediante X} la población que bajo Hl tiene mayor media poblacional, es suficiente con estudiar el contraste de H0:ji¿l = jU2 contra Hl:¿u] > jU2. Para este contraste la región crítica de tamaño a es C = {Z Para determinar la probabilidad del error de tipo II (o calcular la potencia del contraste), es necesario obtener la distribución del estadístico de prueba cuando la hipótesis alternativa es verdadera. Si suponemos que fi\-(j,2=8, el estadístico de prueba se puede expresar como Z
Por
tanto,
el
. En consecuencia,
estadístico
de
prueba
verifica
que
101 Si la hipótesis alternativa es bilateral, la probabilidad del error de tipo II es J3 = P( Aceptar
Tomando « =
, la expresión de la probabilidad
del error de tipo II se simplifica a
• Compa-
rando esta expresión de /3 con la del contraste bilateral de la media poblacional en un problema de una muestra (apartado 2.1.1), concluimos que en el contraste bilateral que estamos estudiando se pueden usar también las curvas OC de las figuras 4.1 y 4.2 tomando como abscisa \d\. Si la hipótesis alternativa es Hl:jul> ]U2, 1a probabilidad del error de tipo II cuando 5=/í,-/í 2 >0, es
La expresión permite calcular analíticamente la probabilidad del error de tipo II en los contrastes unilaterales. Para calcular gráficamente j3 se pueden usar las curvas OC de las figuras 4.3 y 4.4. Un problema interesante es determinar los tamaños muéstrales «¡ y «2 ^e forma que simultáneamente la probabilidad del error de tipo I sea a y que la probabilidad del error de tipo II cuando ^-^=8 sea igual a j3. En el contraste bilateral los requisitos deseados se pueden expresar analíticamente como ft = OÍz de forma equivalente como z
En consecuencia
En el contraste unilateral, ¡3 = Oí z a
za -
dje donde
. Una vez calculado n, los tamaños muéstrales deseados n\ y n2 han de cumplir n =
. Una solución posible es n
102
Contrastes de hipótesis
2.2.2. Contraste para la igualdad de dos medias, varianzas desconocidas Supondremos en este apartado que las varianzas de las dos poblaciones son desconocidas pero iguales, es decir, o\ = 0\. Denotaremos mediante ¿u-, la región crítica de tamaño a es C = {/o//o > /l a ;Wl + w ,-2J Y P-valor = P(t^+^_2 ^ ¿o) • Para determinar la distribución del estadístico de prueba cuando la hipótesis alternativa es verdadera, hemos de tener en cuenta que dado 2=
como ?
que
5, el estadístico de prueba se puede expresar
. En consecuencia,
suponemos además que w,1 = «29 = « , obtenemos
si
de
modo que í0 sigue aproximadamente una distribución t no central con 2 -2
= 2«-2 grados de libertad y parámetro de no centralidad
(Observar que 2n — 1, número que aparece dentro de la raíz, es igual al número de grados de libertad más uno). Este resultado sugiere que para los contrastes que consideramos en este apartado podemos usar las curvas OC construidas para los contrastes t de una muestra (apartado 2.1.2) con tal de que el parámetro del eje de abscisas sea d = 151/2(7 y que el tamaño muestral que aparece en las curvas OC se interprete como n* = 2n -1.
103 2.2.3. Contraste para la igualdad de dos medias, muestras apareadas Supongamos que ( X U , X 2 ¡ ) (/ = !,...,«) es una m.a.s. de ( X ¡ , X 2 ) de tamaño n, donde X{ y X2 son v.a. dependientes. Las diferencias D¡ = Xlf - X2¡ constituyen una m.a.s. de la v.a. D = X¡-X2. El contraste de contra H]:^il ^ ¿U2 es equivalente al contraste de HO:JL¿D = 0 contra donde JU D es la media poblacional de D. Si suponemos que es desconocida, las anteriores hipótesis se pueden contrastar usando el estadístico de prueba tQ =
r~r=-> donde D y SD son la
media y la varianza muéstrales de las diferencias. La región crítica de tamaño a es [ y el P-valo sis alternativas unilaterales es similar.
0|).
El tratamiento de las hipóte-
2.2.4. Contraste para el cociente de varianzas Sean X¡ y X2 dos poblaciones normales independientes tales que X¡ ~N(fj,^ 0.45 frente a la hipótesis alternativa H\:p< 0.45 . Un buen estimador de p es la proporción muestral p. Como valores pequeños de p favorecen //!, la región crítica debe ser de la forma C = {p < k] , donde k se ha de elegir de manera que la probabilidad del error de tipo I no sea superior a 0.05. Como el tamaño muestral es grande, la distribución de la proporción muestral es aproximadamente normal, y se puede utilizar el estadístico de prueba y la región crítica C = {Z
Para la muestra
El valor observado
del estadístico
de prueba es
Como Z0 = -2.34 pertenece a la región crítica, se debe rechazar la hipótesis nula de que el porcentaje de votos a favor es al menos del 45% al nivel de significación del 5%. Por otra parte, como el P-valor del resultado de la encuesta es P(Z < -2.34) = 1 - 0.9904 = 0.0096, la hipótesis nula se debe rechazar para cualquier nivel de significación mayor o igual que 0.0096. b) Si p = 0.43, la potencia del contraste planteado en el apartado a) es la probabilidad de que se rechace H0 cuando p = 0.43 . Como la hipótesis nula se rechaza cuando el estadístico de prueba pertenece a la región crítica, la potencia pedida es #(0.43) = P(C / p = 0.43). La región crítica es
ASI,
Por tanto, la potencia aproximada del contraste es del 46.02%. 7. El contenido medio de sulfates de determinada agua mineral era de 13.8 mg/1 (miligramos por litro) en 1997. En la actualidad sospechamos que el contenido medio de sulfatos es diferente. Para verificar nuestra sospecha requerimos un procedimiento de contraste de hipótesis que asegure que si el contenido medio actual es el mismo que en 1997 el procedimiento estadístico llegue a una decisión contraria sólo el 5% de las veces. Además, exigimos una potencia de al menos 0.90 cuando el contenido medio de sulfatos es en realidad de 12 mg/1. Suponiendo que el contenido de sulfatos sigue una distribución normal:
117
Ejercicios
a) Plantear el contraste de hipótesis. Si la desviación típica es o = 2, obtener razonadamente el mínimo número de análisis necesarios para cubrir nuestros requisitos de riesgo. b) Para el mínimo número de análisis encontrado en a), ¿es aceptable el procedimiento para detectar que la media actual es 0.5 mg/1 mayor que la de 1997? c) Suponiendo ahora que G = 2.5 y que a partir de una m.a.s. de 21 análisis hemos obtenido X = 15.0 mg/1 y S = 2.1 mg/1, ¿a qué conclusión debemos llegar respecto del contenido medio de sulfates? Calcular el P-valor. Solución a) Denotemos por X el contenido actual de sulfates y por fj. la media poblacional de X. La hipótesis nula a contrastar es que la media poblacional de X es igual al contenido medio de sulfates de 1997, es decir, //0:// = 13.8. En caso de rechazar HQ aceptaremos la hipótesis alternativa //,://^13.8 . Los requisitos exigidos son que P(rechazar HQ/HO) = 0.05 y P(rechazar H0/fi = 12) > 0.90, es decir, a=0.05 y j8(12) < 1 - 0.90 = 0.10. Suponiendo que X sigue una distribución normal con media // y ¿0025 = 1-96} • Como X = 15.0 , el valor muestral del estadístico de prueba cumple que Z
Luego se
rechaza que el contenido medio de sulfates es 13.8. Una forma equivalente de tomar la decisión consiste en comprobar que el P-valor del resultado muestral no supera al nivel de significación del 5%. En efecto, P-valor = 2,P(Z > 2.2) = 0.027 < 0.05. 8. Sea X una v.a. discreta con la siguiente distribución de probabilidad X
-1
0
1
P(X = x)
(l-0)/4
1/2
(l+0)/4
donde 0e[-l,l]. Supongamos que se extrae al azar una observación de dicha distribución. a) Encontrar la región crítica para contrastar H(): 6=-3/4 contra H} : 6 > -3/4 al nivel de significación a=0.10. b) Para la región crítica encontrada en el apartado a), calcular la potencia en 6= 1/2. Solución a) Como valores grandes de X apoyan la hipótesis alternativa y, por tanto, la región crítica debe ser de la forma C = {X > £} . Para determinar la constante k imponemos el requisito de que la probabilidad del error de tipo I ha de ser no superior a 0.1, es decir, P(X > k / 9 - -3/4) < 0.1. La distribución de probabilidad de X bajo la hipótesis nula //0: 0=-3/4 cumple X
-1
0
1
P(X = x)
7/16
1/2
1/16
P(X>x}
1
9/16
1/16
En consecuencia, el valor de k ha de cumplir k > 1. Para k = 1 la región crítica es C - {X > 1} y la probabilidad del error de tipo I es igual a 1/16 = 0.0625, mientras que si k > 1 la región crítica es C = {X > 1} y la probabilidad de error de tipo I es cero. Ambas regiones críticas tienen tamaño no superior al 10% pero C = {X>l]
Ejercicios
119
tiene potencia positiva mientras que C = {X > 1} tiene potencia cero. Por tanto, preferimos la región crítica b) La potencia de la región crítica es
9. Actualmente la duración de las lámparas eléctricas fabricadas por una empresa tiene una media de 2000 horas y una desviación típica de 250 horas. Se está considerando la implantación de un nuevo proceso de fabricación. El proceso nuevo se implantará si la duración media de n lámparas fabricadas con dicho proceso es por lo menos un 10% mayor que la duración media poblacional del proceso actual. Se supone que la duración de las lámparas fabricadas mediante el nuevo proceso sigue una distribución normal con una desviación típica de 250 horas. a) Plantear el contraste de hipótesis que está considerando la empresa para decidir si implantará el nuevo proceso de fabricación. Suponiendo n = 6, ¿cuál es la probabilidad del error de tipo I? b) ¿Cuál debe ser el tamaño muestral mínimo para que exista un riesgo menor del 1 % de no implantar el nuevo proceso cuando dicho proceso proporciona lámparas con una duración media de 2250 horas? Solución a) Sea X la duración de las lámparas fabricadas con el nuevo proceso. Suponemos ^-7^(^,250). La empresa está considerando el contraste de la hipótesis nula H0:jLi = 2000 contra la alternativa //¡:// > 2000 . Aceptar el nuevo proceso es equivalente a aceptar //, . Como la regla de decisión adoptada consiste en aceptar el nuevo proceso si una muestra de tamaño 6 cumple X > 2000 H 2000, la región crítica del contraste es La probabilidad del error de tipo I es por definición la probabilidad de aceptar //! cuando H0 es verdadera, y para el procedimiento de la empresa es
b) El riesgo de no implantar el nuevo proceso cuando éste proporciona lámparas con una duración media de 2250 horas es la probabilidad del error de tipo II para H = 2250 .Si C = \X > 2200} , la probabilidad del error de tipo II para ju = 2250 es
Para que j3 sea menor del 1%, el tamaño muestral n ha de cumplir la desigualdad Observamos que esta desigualdad es equivalente a las siguientes desigualdades: Por tanto, el tamaño muestral mínimo exigido es n = 136.
120
Contrastes de hipótesis
10. El coste total X de producir una unidad de output es la suma de un coste fijo 6 y de un coste variable. El coste variable es inobservable de modo que 9 es un parámetro desconocido positivo. El coste total X se distribuye con una función de. densidad f(x) = exp(9-x) úx>9, y cero en otro caso. Una m.a.s. de 5 unidades de output ofreció los siguientes valores del coste total: 3.12, 2.80, 3.71, 2.07, 2.45. Se desea inferir si el valor del coste fijo 6 es 2 de modo que cuando el coste fijo 9 es realmente 2 se concluya (erróneamente) que el coste fijo 9 no es 2 con una probabilidad no superior a 0.10. a) Establecer el problema en términos estadísticos y encontrar una regla de decisión basada en el estimador maximoverosímil. b) ¿Cuál es el P-valor correspondiente a la muestra obtenida? ¿Qué decisión debemos tomar? c) Si el verdadero valor del coste fijo 9 es 2.5, ¿cuál es la probabilidad de concluir (erróneamente) que el coste fijo 9 es 2? Solución a) Para decidir si el valor del coste fijo 9 es 2 hay que considerar el contraste de la hipótesis nula H0: 9=2 contra la hipótesis alternativa H}: 9^2. El requisito de que el procedimiento concluya que el coste fijo 9 no es 2 cuando 9 es 2 con una probabilidad no superior a 0.10 es equivalente a que la probabilidad del error de tipo I sea a lo sumo del 10%, es decir, P(C/ HQ) < 0.1 -a. Es fácil comprobar que el estimador maximoverosímil de 9 es X^ y que T=Xw-9~Exp(n), de modo que Dudaremos de la hipótesis nula tanto para valores pequeños de Xw como para valores grandes de X^ , de modo que la región crítica debe ser de la forma Para determinar las constantes repartimos la probabilidad de error de tipo I máxima en partes iguales a cada una de las colas, es decir, Como
la constante k}
ha de cumplir que -5(k¡ - 2) = ln(l - 0.05), de donde Por otra parte,
Para que esta probabilidad sea igual a 0.05, se ha de cumplir que -5(&2 - 2) = In 0.05 y, en consecuencia, k
Así, la región crítica del contraste es de modo que la hipótesis nula debe rechazarse
Ejercicios
\2\
b) El valor muestral de X(]) es 2.07. Bajo la hipótesis nula,
y El P-valor es igual a 2(rom{P(X Como el P-valor es mayor que 0.10, se acepta HQ . c) La probabilidad de aceptar la hipótesis nula cuando 6=2.5 es
11. Un autobús pasa cada 9 minutos por una parada. Dos amigos, Pedro y Juan, que toman ese autobús en dicha parada, no conocen el valor de 6 y desean efectuar inferencias sobre 6. Saben que el tiempo que esperan el autobús sigue una distribución uniforme en el intervalo [O, 6]. Pedro cree que 6 es menor o igual que 00=30 minutos, mientras que Juan cree que 9 es mayor que 0 0 =30 minutos. Deciden contrastar si 9 < 30, de modo que cuando este supuesto es verdadero la probabilidad de sacar una conclusión equivocada sea a lo sumo 0.05. Si la primera vez que miden el tiempo de espera obtienen 25 minutos: a) Establecer la regla de decisión. Asociar los dos tipos de error con los riesgos de Pedro y Juan. ¿A qué amigo favorece el contraste elegido? b) Calcular el P-valor del resultado muestral. c) Calcular el tamaño del riesgo de Juan cuando 9 es 35. Solución a) Sea X el tiempo de espera. Se supone que X~ í/(0, 9) con 9 desconocido. El contraste que desean realizar Pedro y Juan considera la hipótesis nula H0: 9< 30 frente a la hipótesis alternativa H\: 9> 30. Obsérvese que H0 es la creencia de Pedro mientras que H} es la creencia de Juan. El riesgo de Pedro consiste en rechazar HQ cuando H0 es verdadera. Por tanto, el riesgo de Pedro está asociado con el error de tipo I. El riesgo de Juan consiste en aceptar //0 cuando su creencia ( H \ ) es verdadera, de modo que el riesgo de Juan está asociado con el error de tipo II. El tamaño del riesgo de Pedro será a lo sumo del 5% ya que han decidido fijar una probabilidad del error de tipo I a lo sumo del 5%, mientras que el tamaño del riesgo de Juan no está acotado de antemano. Por tanto, el contraste elegido favorece la creencia de Pedro ( H 0 ) . La hipótesis nula se debe rechazar cuando el tiempo de espera es lo suficientemente grande, y por tanto la región crítica debe ser de la forma Para que la probabilidad del error de tipo I sea a lo sumo 0.05, la constante k ha de
cumplir
0.05> P(C 19= 30) =
.
En
consecuencia,
122
Contrastes de hipótesis
k = 0.95-30 = 28.5 . Como el valor muestral de X es 25, el resultado muestral no pertenece a la región crítica y, por tanto, se debe aceptar la creencia de Pedro (// 0 ). b) El P-valor es la probabilidad de obtener el resultado muestral o un resultado más desfavorable a la hipótesis nula cuando la hipótesis nula es verdadera. Como valores grandes del tiempo de espera apoyan la hipótesis alternativa, el P-valor es P( X > 25 / 6 = 30) =
—dx = 0.16 • Como el P-valor es mayor que la probabili-
dad del error de tipo I prefijada, no hay suficiente evidencia en contra de la hipótesis nula y debe aceptarse //0 . c) Cuando d es 35, el tamaño del riesgo de Juan es Obsérvese que mientras el contraste garantiza que el tamaño del riesgo de Pedro es a lo sumo del 5%, el tamaño del riesgo de Juan es mucho mayor para valores de d poco mayores que 30. 12. En una población de familias se quiere contrastar a un nivel de significación del 5% si un aumento de precio de un bien disminuye el número medio de unidades compradas. Para una m.a.s. de 10 familias se midieron las variables X e Y, número de unidades compradas la semana anterior y posterior al aumento respectivamente, obteniéndose los siguientes resultados: 1
2
3
4
5
6
7
8
9
10
X (antes)
40
16
30
28
20
18
36
12
60
30
Y (después)
25
16
20
20
22
20
28
16
45
19
Familia
a) Establecer las hipótesis nula y alternativa. Establecer los supuestos necesarios sobre las distribuciones para que el contraste a realizar sea válido. Calcular el P-valor muestral. ¿Cuál es la conclusión? b) ¿Cuál es la probabilidad aproximada de detectar una disminución media de 4.4 unidades? c) ¿Cuál debería ser el número de familias muestreadas si se deseara que la probabilidad del error de tipo II para una disminución media de 4.4 unidades fuera menor de 0.20? Solución a) El contraste a realizar considera la hipótesis nula H0:jux = JUY contra la hipótesis alternativa H\\nx > JUY . Como las observaciones muéstrales corresponden a una muestra apareada, las variables X e Fno se pueden considerar independientes. Sin embargo, si consideramos la variable diferencia D = X - Y y hacemos ¿UD = jux - jUY , las hipótesis nula y alternativa pueden reescribirse como H0:¿uD=0 y Hl:juD> O , respectivamente. Si suponemos que D sigue una distribución normal
123
Ejercicios
y que las variables prueba í
son independientes, el estadístico de sigue, bajo HQ , una distribución t de Student con n -1 grados
de libertad. Como debe dudarse de la hipótesis nula para valores grandes del estadístico de prueba, la región crítica de tamaño 5% es C - \ t0 > t005.9 = 1.83\ y el P-valor es igual a P(t9>t0}. Los resultados muéstrales ofrecen « = 10, Z)=5.9, SD = 7.2641 y tQ = 2.5685. Como el estadístico de prueba pertenece a la región crítica, concluimos a un nivel de significación del 5% que el aumento de precio del bien disminuye el número medio de unidades compradas. El mínimo nivel de significación que, dados los resultados muéstrales, conlleva el rechazo de la hipótesis nula HQ es el P-valor, que es P(t9 > 2.5685) € (0.01, 0.025). En consecuencia, concluimos que para niveles de significación mayores o iguales que el 2.5% la hipótesis nula es falsa. b) La probabilidad de detectar una disminución media de 4.4 unidades se puede calcular de forma aproximada utilizando el haz de curvas OC correspondiente a los contrastes t unilaterales a un nivel de significación a=0.05. Para « = 10 y se obtiene que la probabilidad del error de tipo II es p = 0.45 , y por tanto la probabilidad de detectar el cambio es I-/? E 0.55. c) Si se deseara que la probabilidad del error de tipo II para una disminución media de 4.4 unidades fuera menor de 0.20, el mínimo número de familias necesario se puede calcular haciendo uso del haz de curvas OC indicado en el apartado b). Para se obtiene « = 20. Luego « = 20 es el mínimo tamaño de muestra necesario. 13. La resistencia de los fusibles de 5 ohmios producidos por una empresa es una v.a. normal. Se desea contrastar la hipótesis nula de que la resistencia media es igual a 5 ohmios. Para la prueba se establecen los siguientes requisitos: Si la resistencia media es de 5 ohmios se desea rechazar la hipótesis nula con una probabilidad de 0.01, mientras que si la resistencia media se separa de 5 en 0.02 ohmios se quiere detectar tal cambio con probabilidad al menos de 0.80. a) Si una m.a.s. de 10 fusibles ofreció las siguientes resistencias en ohmios: 4.994, 4.984, 5.007, 5.009, 4.992, 4.946, 5.001, 5.015, 5.004, 5.017, ¿satisface esta muestra los requisitos establecidos? En caso negativo, ¿cuál es el número mínimo de fusibles adicionales que hay que tomar? b) Si una muestra cuyo tamaño es el mínimo necesario para satisfacer los requisitos proporciona los resultados P-valor muestral? ¿Debe aceptarse la hipótesis nula?
¿cuál es el
124
Contrastes de hipótesis
Solución a) Si denotamos la resistencia media de los fusibles por fJ., las hipótesis del contraste son H0:ju = 5 y //,:// ^ 5. Como se supone que la resistencia sigue una distribución normal y la desviación típica es desconocida, el contraste se debe realizar mediante un test t bilateral. Los requisitos establecidos exigen que la probabilidad del error de tipo I sea igual a 0.01 y que la potencia del contraste cuando ¿u = 5 + 0.02 sea al menos 0.80. Si denotamos por C la región crítica, los requisitos son P(C¡i¿ = 5) = 0.01 y P(C / \ju -5 = 0.02) > 0.8. Para saber si una m.a.s. de tamaño 10 satisface los requisitos usaremos el haz de curvas OC para el contraste t bilateral con nivel de significación del 1% (figura 4.6). Para que la muestra cumpla los requisitos es necesario que para d =J
=
, la probabilidad del error de
tipo II sea no superior al 20%. El valor aproximado de d se obtiene estimando cr mediante la desviación típica muestral S = 0.0206 , de modo que d = —:
= 1. Se
observa en la figura 4.6 que para d = 1 la probabilidad del error de tipo II es aproximadamente del 50% cuando n es 10 y aproximadamente del 20% cuando n es 15. Por tanto la muestra obtenida no cumple los requisitos establecidos y faltan al menos 15-10 = 5 observaciones adicionales. b) Suponiendo « = 15, la desviación típica muestral es 0.0249 y el valor del estadístico de prueba es Entonces P-valor= 2• P(t}á >0.6113)e (0.5,0.6). Como el P-valor es mayor que el nivel de significación «=0.01, se acepta la hipótesis nula de que la resistencia media es igual a 5 ohmios. 14. Se sospecha que la fábrica A produce más artículos diarios, en promedio, que la fábrica B. Las desviaciones típicas de sus producciones diarias son conocidas e iguales a a^ =10 y (75 =12. Se supone que las producciones diarias de las dos fábricas son independientes y se distribuyen normalmente. Para realizar el contraste se elige el nivel de significación 0.01 y si JUA—JUB =16 el procedimiento debe detectar esa diferencia con probabilidad 0.8. a) Plantear el contraste y determinar, analítica y gráficamente, el número de observaciones necesarias. b) Calcular el P-valor asociado a los resultados XA =1433.42, SA =9.37, XB = 1426.80 y SB = 12.02 , obtenidos a partir de dos muestras con los tamaños encontrados en a). c) Determinar analíticamente la potencia del contraste si JUA= 1338.7 y 05=1327.0.
125
Ejercicios
Solución a) Las desviaciones típicas son crA=10 y (7fi=12. El nivel de significación del contraste es a=0.01 y se quiere que /'(detectar nA>nB/fj.A-fiB= 16) = 0.8. Se desea comprobar si la diferencia en las medias muéstrales es significativa para concluir que la sospecha es cierta, o sea, para concluir fJLA > JLIB . Entonces se debe contrastar la hipótesis nula HQ:JUA = JUB contra la alternativa Como las producciones diarias de las dos fábricas son independientes y tienen distribuciones normales con desviaciones típicas conocidas, se trata de un contraste para la diferencia de medias poblacionales con varianzas conocidas. El estadístico de prueba es Z0
Se rec
azará la hipótesis nula si el estadísti-
co de prueba Z0 pertenece a la región crítica C = {Z0 >z 0 oi =2.33}. Se desea detectar H} cuando JUA-¡UB=16 con probabilidad 0.8, luego la probabilidad del error de tipo II debe ser j3=0.2 para jUA-juB=l6. El tamaño común de las muestras viene dado por
También podemos calcular el tamaño muestral haciendo uso del haz de curvas OC para los contrastes unilaterales basados en la normal con a=0.01. La abscisa es y la ordenada es /3=0.2. Observamos que por el punto (1, 0.2) pasa la curva OC correspondiente a « = 10. Por tanto, el número de observaciones necesarias para efectuar el contraste es nA = nB = 10. b) El valor muestral del estadístico de prueba es Como valores grandes del estadístico de prueba hacen dudar de HQ , el P-valor muestral es P(Z > 1.34) = 0.09 . Como el P-valor es mayor que el nivel de significación del contraste a=0.01, se debe aceptar que las producciones medias de las dos fábricas son iguales. c) Por definición, la potencia del contraste cuando es la probabilidad de rechazar la hipótesis nula cuando es decir, P(Z Como bajo la hipótesis alternativa el estadístico de prueba Z0 sigue una distribución
la potencia es
126
Contrastes de hipótesis
15. Un adivino afirma que en el 90% de los casos predice con éxito el sexo de los niños antes del nacimiento. Se desea contrastar la veracidad de su afirmación mediante muestras de tamaño 15. a) Establecer las hipótesis del contraste. ¿Cuál debe ser la forma de la región crítica? ¿Por qué? b) Obtener la región crítica para un nivel de significación del 6%. ¿Cuál es el tamaño del contraste? c) Para la región crítica encontrada en b) determinar la probabilidad del error de tipo II. d) Si suponemos que los resultados muéstrales han sido E, A, A, E, E, A, A, E, A, A, A, E, A, E y A, donde A denota "acierto" y E "error", ¿cuál es el P-valor asociado a la muestra anterior? ¿Cuál es la conclusión respecto a la afirmación del adivino? Solución a) Se trata de efectuar un contraste relativo a p, proporción poblacional de aciertos. Como hipótesis nula se considera que el adivino acierta por azar, H0\p = l/2, y como hipótesis alternativa que el adivino acierta con probabilidad 0.9, H\:p = 0.9. Si denotamos por X el número de aciertos del adivino en 15 pruebas, entonces la regla de decisión debe rechazar HQ cuando X sea mayor que un determinado valor, es decir, rechazar //0 cuando el número de aciertos sea lo suficientemente grande. En consecuencia la región crítica C será de la forma C = {X>k}.
b) Si a=0.06, la región crítica se determina eligiendo el mínimo k tal que P(X > k I p = 0.5) < 0.06 .Si p = 05, entonces X ~ 5(15,0.5). Utilizando unas tablas de probabilidades binomiales se obtiene que P(X > 11 / p = 0.5) = 0.059 < 0.06 y P(X > IQ/p = 0.5) = 0.151 > 0.06. Por tanto, el mínimo k tal que C tiene nivel de significación del 6% es 11. El tamaño de la región crítica C = {X > 11} es 0.059. c) La probabilidad del error de tipo II es la probabilidad de aceptar la hipótesis nula cuando la hipótesis alternativa es verdadera. En nuestro caso, esta probabilidad esj8 = l - j P ( J f > l l / / ? = 0.9). Usando que la distribución de X cuando p = 0.9 es 5(15,0.9), obtenemos que j3 = 1-0.9873 = 0.0127 . d) El número de éxitos en la muestra ha sido 9, es decir, X - 9 . Por tanto, el P-valor muestral es P( X > 9 / p = 0.5) = 1 - 0.6964 = 0.3036. El P-valor es mayor que los niveles de significación usuales 0.05 y 0.01. En consecuencia, no existe suficiente evidencia para rechazar H0 , de modo que se debe aceptar H0 : el adivino acierta por azar. 16. El número de vehículos X que llegan al peaje de una autopista en un minuto sigue una distribución de Poisson con parámetro A . Se sabe que bajo condiciones normales de tráfico A es 0.5. La empresa responsable del peaje sospecha que
Ejercicios
127
durante los meses de verano A es 2. Para decidir si la sospecha es verdadera se toma durante los meses de verano una m.a.s. de cinco intervalos de minuto obteniéndose los siguientes valores de X : 1, 2, O, 2, 3. Suponiendo que la empresa asume un riesgo máximo del 5% de concluir que Á. es 2 cuando realmente es 0.5: a) Establecer el contraste de hipótesis, determinar la región crítica y calcular su tamaño. b) Calcular la potencia del contraste. c) Para la muestra observada, calcular el P-valor. ¿Cuál es la conclusión? Solución a) Sea X el número de vehículos que llegan al peaje de una autopista en un minuto. Se cumple que X~3P(A). Se trata de contrastar la hipótesis nula H0:A = 0.5 contra la hipótesis alternativa H\.X = 2. Para una muestra de 5 intervalos de minuto, X¡ denota el número de vehículos que llegan al peaje en el minuto /-ésimo. Sea
X¡ . Como la hipótesis alternativa favorece valores
grandes de T, la región crítica debe ser de la forma C = \T > k] . Bajo la hipótesis nula, la distribución de T es 3^(5-0.5). Como la empresa desea tener un riesgo de tipo I de tamaño no superior al 5%, el valor de k debe verificar que P(C I //0) < 0.05 , o de forma equivalente que P(T < k -1///0) > 0.95 . Consultando en las tablas de la distribución de Poisson, obtenemos que k -1 > 5 y, por tanto, la empresa debe elegir k - 6 porque de esa manera minimiza la probabilidad del error de tipo II sujeto a la restricción de que la probabilidad del error de tipo I no supere el 5%. Entonces la región crítica es C = {T>6] y el tamaño de C es X ( r > 6 / / / 0 ) = 0.042. b) La potencia del contraste es la probabilidad de rechazar H0 cuando //, es verdadera. Bajo //¡ , la variable T sigue una distribución de Poisson de parámetro X = 10 y P(T > 6) = 0.933. Por tanto, la potencia del contraste es 0.933. c) En la muestra T = 8 y el P-valor muestral es P(T>8/H0) = 0.0042. Puesto que el P-valor muestral es menor del 5%, se debe rechazar H0 . 17. Un mayorista frutero desea comprar una partida muy grande de melones si el 70% o más de los melones pesan más de tres kilos. Desea tener una probabilidad a lo sumo de 0.05 de equivocarse si rechaza la partida cuando realmente verifica la condición requerida. Después de pesar una muestra de 100 melones extraídos al azar de la partida, encuentra que 60 pesan más de 3 kg. a) Formular la hipótesis nula y la hipótesis alternativa. Especificar la región crítica. Calcular el P-valor. ¿Qué decisión tomará el mayorista? b) Calcular la probabilidad de aceptar la partida cuando la proporción de melones que pesan más de tres kilos es del 50%. c) Si el mayorista quiere rechazar la partida cuando tiene un 60% de melones que pesan más de tres kilos con una probabilidad 0.90, determinar analíticamente el tamaño de muestra necesario.
128
Contrastes de hipótesis
Solución a) Sea p la probabilidad de que un melón pese más de tres kilos. El mayorista desea comprar la partida si p > 0.7 , de modo que el contraste a realizar considera la hipótesis nula HQ:p> 0.7 contra la hipótesis alternativa //,:/?< 0.7 . Como n = 100 es un tamaño muestral grande, se puede realizar un contraste asintótico para la proporción poblacional basado en el estadístico de prueba Z donde p es la proporción muestral y pQ = 0.7 . La hipótesis nula debe rechazarse si la proporción muestral de melones con peso mayor de 3 kilos es pequeña, o de forma equivalente cuando el valor del estadístico de prueba Z0 es menor que una constante k. Como el comportamiento bajo HQ del estadístico de prueba Z0 es aproximadamente normal, la región crítica de nivel de significación a aproximadamente igual a 0.05 Como la proporción muestral es p = 0.60, el valor muestral del estadístico de prueba es Zn = . '
'
=-2.182 y el
P-valor muestral es P(Z < -2.18) = 0.0146. Como el P-valor es menor que a=0.05, el mayorista frutero rechazará H0 , es decir, no comprará la partida. b) La probabilidad de aceptar la partida cuando la proporción de melones que pesan más de tres kilos es del 50% es igual a
c) La probabilidad de rechazar la partida cuando p = 0.6 es igual a
Si el mayorista desea que esta probabilidad sea igual a 0.90, el tamaño muestral n ha de cumplir z n i n = 1-28 =
,
, de donde operando obtene-
mos 1.28V0.6• 0.4 = -1.645-N/0/7-03+0.lV« y, en consecuencia, el tamaño muestral debe ser n =
\ 29
Ejercicios
18. Un proceso productivo genera componentes electrónicos cuya vida media es 50. En el departamento de investigación se ha descubierto un nuevo método que parece alargar la vida media de los componentes. El departamento de producción decide contrastar el nuevo método, para lo cual toma una muestra de 10 componentes fabricados por el nuevo método, obteniendo las siguientes vidas: 57, 69, 106, 121, 201, 51, 77, 87, 12, 230. Suponiendo que la vida de los componentes fabricados por el nuevo método sigue una distribución exponencial y teniendo en cuenta que el doble de la suma de n exponenciales independientes de media uno sigue una distribución X con 2n grados de libertad: a) Establecer las hipótesis nula y alternativa. Determinar la región crítica de tamaño 0.05. b) Para los resultados muéstrales obtenidos ¿es efectivo el nuevo método? Calcular el P-valor. c) Si el nuevo método consigue que la vida media de los componentes sea 100, ¿cuál es la potencia del contraste? Solución a) Sea X la vida de un componente electrónico producido por el nuevo método y ju la media de X. Suponemos que X ~ Exp(\¡'//). Para contrastar el nuevo método consideramos como hipótesis nula HQ: // < 50 y como hipótesis alternativa //,://> 50. Sabemos que el estimador maximoverosímil de ¿u es X. Como valores grandes de X apoyan H\, la región crítica debe ser de la forma C = \ X > k \. Para que el tamaño de la región crítica sea igual al 5%, k debe cumplir que P(CI 7/0) < 0.05.
Como P(C/// lor de k es k — 2.5-^0.05-20 =78.525 y la región crítica es C = |X > 78.525j . b) La media muestral es ^=101.1. Como 101.1 pertenece a C, se acepta H } , es decir, concluimos que el nuevo método es efectivo. El P-valor muestral es y cumple la acotación 0.001 < P-valor < 0.01. c) Si // es 100, la potencia del contraste (probabilidad de rechazar 7/0) es
Usando unas tablas de la distribución Ji-cuadrado se comprueba que 0.70 < n < 0.80. 19. Los siguientes datos son notas de un examen final de un curso de Estadística impartido por el mismo profesor durante un periodo de tres años. Año 1: 4.9, 3.1,4.1, 2.6, 5.2, 3.9, 4.6, 4.0, 3.7, 5.8,4.3, 3.4, 5.4, 2.8,4.8,4.0, 2.2, 3.2, 3.5, 4.5
130
Contrastes de hipótesis
Año 2: 5.4, 4.8, 3.6, 5.3,4.5, 3.1, 4.9, 4.2, 4.6, 4.4, 4.1, 5.1, 6.3,4.5, 5.9, 3.9, 5.0, 3.3, 4.7, 4.3, 5.7, 2.7, 3.7, 4.0, 4.6 Año 3: 5.9, 5.1, 5.8,4.5, 5.3, 4.1, 5.0, 4.4, 3.8, 5.6, 6.8, 4.7, 6.4, 3.2, 5.5, 5.0,4.2, 6.2, 3.6, 4.9 Se supone que las notas de los tres años siguen distribuciones normales con varianzas iguales. a) Contrastar, al 5% de significación, la igualdad de notas medias en los tres años. b) Aplicar, si procede, la etapa de agrupación de medias del procedimiento FSD. Solución a) Sean //,, // 2 Y ^3 las n°tas medias de los años 1, 2 y 3 respectivamente. Queremos contrastar H0:¿il = ¿U2 = //3 contra H}:no H0. Los estadísticos resumen de los datos multiplicados por 10 se muestran en la siguiente tabla: Año 1
Año 2
Año 3
X
40
45.04
50
s
9.6245
8.6626
9.6245
La tabla ANO VA es Fuente
Suma de cuadrados
Grados de libertad
Cuadrado medio
Razón F
P-valor
Entre
1000.02
2
500.012
5.83
0.0048
Dentro
5320.96
62
85.8219
Total
6320.98
64
Como el P-valor muestral es 0.0048 < 0.05, rechazamos la hipótesis nula de igualdad de medias al 5% de significación, concluyendo que las medias (poblacionales) de las notas del examen son diferentes. El diagrama esquemático aparece en la figura 19.1.
Figura 19.1.
131
Ejercicios
b) Puesto que se rechaza la hipótesis nula al 5% de significación, procede aplicar la segunda etapa del procedimiento FSD. De la tabla ANOVA encontramos que la estimación de la desviación típica combinada es S = V MSW = V85.822 = 9.230 y los grados de libertad "dentro" son 62. El valor crítico bilateral 5% es /o 025-02 = 1-98. Los dos tamaños de muestra más grandes son 20 y 25. Por tanto, LSDmín =1.98-9.23-J
1
=5.483. Como los dos tamaños de muestra más pe-
queños son 20 y 20, tenemos que LSD Es fácil comprobar que las diferencias entre las medias muéstrales son Como las diferencias para los años 1 y 2 y los años 2 y 3 son ambas menores que LSDm-n, la media del año 1 y la del año 2 pertenecen al mismo grupo así como las de los años 2 y 3. Por otra parte, la diferencia para los años 1 y 3 excede LSDmax, de modo que la media del año 1 y la del año 3 pertenecen a distinto grupo. Se da, por tanto, la siguiente agrupación curiosa: { año 1, año2 } < { año2, año3 }. Este resultado se interpreta diciendo que existe evidencia insuficiente en las muestras para detectar una diferencia sobre un periodo de un año, pero la diferencia sobre el periodo de dos años es significativa. Por tanto, se detecta una posible mejora en la enseñanza del profesor sobre el periodo de los tres años de estudio pero no sobre un periodo más corto de tiempo. Las agrupaciones solapadas como la de este ejercicio son obviamente no deseadas porque dificultan la interpretación, pero a veces son inevitables. 20. Un agricultor quiere probar cuatro fertilizantes en su campo de tomates. Selecciona parcelas del mismo tamaño con suelo, drenaje y exposición al sol similares. Prueba los fertilizantes A, B, C y D sobre 6, 8, 9 y 7 parcelas respectivamente obteniendo los siguientes rendimientos: Fertilizante A B C D
Rendimiento 47, 42, 43, 46, 44, 42 51,58,62,49,53,51,50,59 37,39,41,38,39,37,42,36,40 42, 43, 42, 45, 47, 50, 48
Se supone que los rendimientos de los cuatro fertilizantes siguen distribuciones normales con varianzas iguales. a) ¿Existe diferencia significativa en los rendimientos medios? b) Aplicar, si procede, la etapa de agrupación de medias del procedimiento FSD. Solución a) Sean hipótesis nula
los rendimientos medios. Deseamos contrastar la contra la hipótesis alternativa de que no
132
Contrastes de hipótesis
todas las medias son iguales. Observamos que k = 4, nA = 6, nB = 8 , nc = 9 nD =1 y « = 30. Los estadísticos resumen aparecen en la siguiente tabla: Fertilizante
/
"/
X,
s}
A
1
6
44.000
4.400
B
2
8
54.125
23.554
C
3
9
38.778
3.944
D
4
7
45.286
9.905
Es fácil comprobar que la suma de cuadrados "entre" y la suma de cuadrados "dentro"
son,
respectivamente,
y
La tabla ANO VA es Fuente
Suma de cuadrados
Grados de libertad
Cuadrado medio
Razón F
P-valor
Entre
1015.51
3
338.503
31.67
=0
Dentro
277.859
26
10.6869
Total
1293.37
29
Como la región crítica del contraste es C = ÍF0 / FQ > ^005-3 20} y F005.3 26 = 2.89 , rechazamos HQ al 5% de significación y concluimos que no todos los fertilizantes tienen el mismo rendimiento medio. El diagrama esquemático aparece en la figura 20.1.
Figura 20.1.
Ejercicios
133
b) Puesto que se rechaza la hipótesis nula al 5% de significación, procede aplicar la segunda etapa del procedimiento FSD. Las cantidades máxima y mínima de la diferencia significativa mínima son, respectivamente:
Es fácil comprobar que las diferencias entre las medias muéstrales son:
Luego los grupos son
This page intentionally left blank
CAPITULO 5 MÉTODOS ROBUSTOS Y NO PARAMÉTRICOS
1. INTRODUCCIÓN Existen dos criterios para juzgar o evaluar los procedimientos estadísticos inferenciales (tales como los intervalos de confianza y los contrastes de hipótesis): el criterio de validez y el criterio de sensibilidad. Para un intervalo de confianza, el requisito de validez exige que el intervalo de confianza contenga al parámetro de interés con una probabilidad al menos 1 - a. Sin embargo, en la práctica, este requisito puede no cumplirse cuando la distribución de probabilidad de las observaciones es desconocida. Por ejemplo, los intervalos de confianza bajo normalidad pueden dejar de ser válidos si la distribución de las observaciones no es normal. La sensibilidad de un intervalo de confianza se refiere a la precisión; y una medida de la precisión, como ya sabemos, es la amplitud del intervalo: cuanto menor es la amplitud del intervalo, mayor es su precisión. Para un contraste de hipótesis sabemos que la probabilidad del error de tipo I no debe superar el nivel de significación a prefijado. Este es un requisito de validez para todo contraste de hipótesis. En la práctica, si la distribución de la población no es normal, los contrastes clásicos (que suponen normalidad) pueden tener probabilidad del error de tipo I mayor que a. En estos casos decimos que dichos contrastes no son válidos. La sensibilidad de un contraste de hipótesis se mide mediante la potencia del test (o también la probabilidad del error de tipo II, que es uno menos la potencia). Gran sensibilidad del test es equivalente a gran potencia, es decir, gran probabilidad de rechazar HQ cuando HQ es falsa, o lo que es lo mismo, gran capacidad del test para distinguir el verdadero valor del parámetro especificado por //, del especificado por H0 . Los métodos clásicos de inferencia (vistos en capítulos anteriores) suponen normalidad e igualdad de las varianzas. Cuando se aplican a problemas reales pueden aparecer algunas dificultades (datos atípicos, diferencias en las dispersiones,...). Cuando estos problemas se detectaron en el pasado, la primera respuesta fue crear
136
Métodos robustos y no paramétricos
una colección nueva de métodos aparentemente distintos llamados métodos no paramétricos. A pesar de su atractivo teórico, los métodos no paramétricos carecen con frecuencia de la unidad de concepción propia de los métodos clásicos. Además, el problema contemplado por los métodos no paramétricos (la falta de validez) no es el problema principal de los métodos clásicos. Tukey en 1960 observó que cuando existen valores atípicos en los datos (situación muy frecuente en la práctica) los procedimientos clásicos tienen poca sensibilidad. Esta observación favoreció el desarrollo de unos procedimientos estadísticos nuevos llamados métodos robustos. Informalmente, un método estadístico es robusto cuando sus propiedades de sensibilidad y validez cambian poco si la distribución de las observaciones se desvía poco de la supuesta en la construcción del método (usualmente la distribución normal). Una característica atractiva de los métodos robustos que presentaremos aquí es que se obtienen modificando los métodos tradicionales de una manera intuitiva. Además, estas modificaciones están basadas en estimadores de cálculo fácil. Por ejemplo, la media recortada es simplemente una media ordinaria con algunas de las observaciones (entre ellas las observaciones atípicas) eliminadas. Por otra parte, los métodos basados en la transformación potencia o en la transformación rango consisten en transformar los valores muéstrales y después aplicar el procedimiento clásico a los valores transformados. Ejemplo 1.1. Ilustración de la baja sensibilidad de un procedimiento clásico Una muestra de rentas familiares de un barrio ofreció los siguientes resultados: Renta anual (en millones de ptas.)
5
4
2
8
6
4
2
5
40
17
0
3
Familia
1
2
3
4
5
6
7
8
9
10
11
12
En la figura 1.1 se presenta el gráfico caja para esta muestra.
Figura 1.1.
137
Para un nivel de confianza del 95%, el intervalo de confianza clásico para ¿u es 1.04 < ¡JL < 14.96 y en la siguiente sección veremos que el intervalo basado en la media recortada es 2.18 < // r < 7.06. Recordemos que para los intervalos de confianza buena sensibilidad significa intervalos estrechos. En este ejemplo el intervalo de confianza basado en la media muestral es mucho menos sensible que el intervalo basado en la media recortada. Como el atípico mayor es más atípico de lo que ordinariamente encontramos en la práctica, este ejemplo es algo extremo, pero el mismo fenómeno ocurre, en menor grado, en varios problemas prácticos y con frecuencia pasa desapercibido y, por tanto, no se corrige. En este caso, puede que los análisis efectuados resulten inútiles. En las secciones restantes estudiaremos las siguientes familias de métodos robustos: • Métodos basados en la media recortada • Métodos basados en las transformaciones potencia • Métodos basados en la transformación rango. 2. MÉTODOS BASADOS EN LA MEDIA RECORTADA En este apartado presentamos contrastes de hipótesis para los problemas de una, dos y k muestras, e intervalos de confianza para la media recortada y la diferencia de medias recortadas. El método de las medias recortadas consigue corregir los problemas causados por los atípicos, pero no es útil por sí mismo para tratar las diferencias en dispersión. Para mitigar el impacto de la desigualdad de dispersiones puede usarse la llamada corrección de Satterthwaite después de un análisis de medias recortadas o bien desde un principio si las muestras son razonablemente normales. 2.1. Intervalos de confianza y contrastes para una muestra Ilustraremos el cálculo de intervalos de confianza para la media recortada utilizando los datos de renta familiar del ejemplo 1.1. El gráfico tallo y hojas es el siguiente: O* 10.2(1 3 4 4 0 . 1 5 5 6[8] 1* I 1 .17 HII40 Como se ha visto en el capítulo de intervalos de confianza, los límites del intervalo de confianza clásico para la media son
. El intervalo de
confianza basado en la media recortada se calcula exactamente de la misma manera, pero reemplazando el tamaño muestral, la media y la desviación típica por el tamaño
138
Métodos robustos v no paramétricos
de la muestra recortada, la media recortada y la desviación típica recortada, respectivamente. Adoptaremos el criterio de seleccionar la fracción de recorte igual al menor múltiplo del 5% que elimina todos los datos atípicos identificados por el gráfico caja. Esta estrategia determina una fracción de recorte del 10% para los datos de la renta familiar. El número de observaciones que deben recortarse en cada cola es 0.10-12= 1.2 que redondeamos por exceso a 2. Las hojas correspondientes a las observaciones que se han de recortar están subrayadas en el anterior gráfico tallo y hojas. El tamaño de la muestra recortada es el número de observaciones que quedan después del recorte, nT = 8. La media recortada es la media aritmética de las observaciones de la muestra recortada, de modo que XT = 4.625 . Sin embargo, la desviación típica recortada no es la desviación típica de la muestra recortada, sino que se calcula usando la desviación típica de la muestra winsorizada. La muestra winsorizada se obtiene reemplazando los valores subrayados en el gráfico tallo y hojas (que son los valores que se eliminan en la muestra original para obtener la muestra recortada) por los números que aparecen recuadrados, que son el mínimo y el máximo de la muestra recortada. Así, O y 2 deben reemplazarse por 2 en la cola inferior, y 17 y 40 por 8 en la cola superior. Obsérvese que la muestra winsorizada es una muestra artificial que tiene el mismo tamaño que la muestra original. La desviación típica de la muestra winsorizada es Sw = 2.34 y la desviación típica recortada es
Los datos resumen nT, XT y ST sustituyen a n, X y S en el cálculo del intervalo de confianza. El punto crítico de la t recortada es taii;nT-\ •> de modo que para un nivel de confianza del 95% es ta/2.n _¡ ='0 025-8-1 =2.365. Por tanto, los límites del intervalo de confianza para la media recortada (al nivel de confianza del 95%) son
Concluimos con una confianza del 95% que la renta media del barrio está entre 2.18 y 7.06 millones de pts. Es fácil comprobar que los límites del intervalo de confianza clásico para la media al 95% son L = 1.04 y U = 14.96. Es obvio que el intervalo basado en la media recortada es mucho más útil para estimar el centro de la distribución de rentas que el intervalo de confianza clásico. Debe enfatizarse que los intervalos de confianza basados en la media muestral y en la media recortada son para dos parámetros de posición central diferentes: la media poblacional y la media recortada poblacional, respectivamente. Cuando la distribución poblacional es simétrica, estas medidas son iguales. Sin embargo, para distribuciones asimétricas pueden ser algo diferentes. No obstante, en distribuciones con colas largas, plantear intervalos de confianza para la media recortada viene
139 motivado por el hecho de que, en general, en estos casos la media recortada proporciona una medida de posición central más razonable que la media. Los contrastes de hipótesis basados en la media recortada se construyen como en el capítulo anterior reemplazando el estadístico t clásico por el estadístico recortado . Así, para el ejemplo anterior, un test bilateral de la hipótesis de que la renta media para el barrio es 11 millones de pesetas debe rechazar H cuando ce=0.05. El valor del estadístico recortado es . Como tr, > 2.365, al nivel de significación del 5% debemos rechazar la hipótesis de que la renta media es 11 millones de pts. 2.2. Contrastes e intervalos de confianza para dos muestras Ejemplo 2.1. Para medir las diferencias en intensidad entre las tormentas de verano ocurridas de junio a octubre y las ocurridas durante el resto del año, se apuntó para 12 veranos y 14 no-veranos el porcentaje de lluvia caída durante los primeros 5 minutos de la tormenta en períodos seleccionados al azar entre 1920 y 1995, obteniéndose los siguientes resultados: Verano: 18.2, 80.0, 8.6, 45.0, 28.6, 20.7, 50.0, 21.2, 60.7, 34.6, 40.7, 6.7. No-verano: 23.8, 10.5, 14.3, 40.0, 16.1, 11.1, 5.0, 3.4, 8.3, 66.7, 15.0, 11.8, 18.2, 26.3. Queremos, en primer lugar, contrastar la hipótesis nula de igualdad de porcentajes promedio de lluvia en verano y no-verano. Para ello, vamos a ignorar, en principio, los análisis exploratorios y usaremos directamente los contrastes de hipótesis clásicos. El método clásico para dos muestras necesita la siguiente información resumen: Verano
No-verano
n
12
14
X
34.5833
19.3214
S
21.8612
16.5916
El valor del estadístico tQ es tQ = 2.02. Para 24 grados de libertad, el P-valor para el test bilateral de no diferencia en medias es P-valor = 2 • P(t24 ^ 2.02). En las tablas de la distribución t de Student observamos que 0.025 < P(t24 > 2.02) < 0.05 . Por tanto, el P-valor pertenece al intervalo (0.05,0.10) y el contraste clásico no detecta diferencia en las medias para cualquier nivel de significación de los usados habitualmente. Este sería el punto final de cualquier estudio clásico. Vamos a ver que la conclusión de este análisis es discutible, cuando no, falsa. Como veremos, el
140
Métodos robustos y no paramétricos
fallo en la detección de una diferencia en las medias es el resultado de usar el test t estándar cuando la información muestral sugiere que se violan las hipótesis sobre las que está basado. Es un fallo del análisis, no de los datos. Este problema puede evitarse efectuando un análisis exploratorio antes del análisis inferencial de los datos. En la figura 2.1 aparece el diagrama esquemático de las muestras bajo consideración. El atípico en la muestra de "no-verano" sugiere que el supuesto de normalidad no es razonable. Comparando las longitudes de las cajas (recorridos intercuartílicos), parece que el supuesto de dispersiones iguales de las dos poblaciones también es cuestionable. La estrategia usual para intentar detectar dispersiones poblacionales distintas consiste en efectuar un contraste de hipótesis para la igualdad de las desviaciones típicas, antes de realizar un test para las medias. Por desgracia, las dispersiones distintas están con frecuencia vinculadas con formas serias de no-normalidad tales como distribuciones de colas largas. En estos casos los tests clásicos para contrastar el cociente de varianzas (basados en la distribución F de Fisher) quedan afectados incluso más seriamente que los tests t.
Figura 2.1.
Es fácil comprobar que en nuestro ejemplo el test F para la igualdad de desviaciones típicas acepta la igualdad para todo nivel a aceptable (P-valor > 0.1). Esta conclusión se contradice con la que se deduce del diagrama esquemático y esto se debe casi totalmente al atípico de la muestra de "no-verano". La siguiente etapa en un análisis estándar de estos datos sería el uso del test t de dos muestras que conduciría al resultado mostrado antes. Los contrastes de igualdad de dispersiones deben usarse con mucho cuidado por su capacidad potencial de generar conclusiones que inducen a error. En todo caso, el análisis exploratorio basado en el diagrama esquemático constituye una herramienta de diagnosis más fiable. El test t de dos muestras basado en las medias recortadas se comporta mejor cuando las dispersiones, medidas por las longitudes de las cajas del diagrama esque-
141
mático, no son muy diferentes. Suponiendo que ocurre así en nuestro ejemplo, ilustraremos a continuación el procedimiento de contraste de igualdad de medias basado en las medias recortadas. Para abordar el problema de la desigualdad de dispersiones que se observa en las dos muestras, mejoraremos el procedimiento basado en las medias recortadas con la llamada corrección de Satterthwaite. Vamos a contrastar la hipótesis de que las intensidades medias de lluvia en los dos periodos del año son iguales usando como medida de posición central la media poblacional recortada con fracción de recorte del 5%. Obsérvese que el 5% es la mínima fracción de recorte (múltiplo del 5%) que elimina todos los atípicos indicados por el diagrama esquemático. Los gráficos tallo y hojas «espalda con espalda» para los valores muéstrales multiplicados por 10 son los siguientes: Verano 86,67
82 12,07 86 46 07 50 00 800. 607
No-verano
0* 0. 1* 1. 2* 2. 3* 3. 4* 4. 5* HI
34 50,83 05, 11, 18,43 50, 61, 82 38 63 00
667
En la muestra de verano el tamaño muestral es n = 12 y el número de observaciones recortadas en cada cola debe ser igual a 1 que es el resultado de redondear por exceso 0.05-12 = 0.6. Los valores a recortar están subrayados en el gráfico tallo y hojas. Para la muestra de no-verano, n ~ 14 y el número de valores recortados en cada cola es 0.05-14 = 0.7, que también redondearemos a 1. Los estadísticos resumen para las muestras recortadas son los siguientes: Verano
No-verano
nT
10
12
XT
32.83
16.7
ST
20.41
12.32
142
Métodos robustos y no paramétricos
La expresión para la desviación típica (recortada) combinada es análoga a la del test t estándar de dos muestras, pero utiliza los estadísticos resumen recortados:
El valor del estadístico t de dos muestras es t Para 20 grados de libertad, el P-valor bilateral es P(\t2o - 2.29) y satisface las desigualdades 0.02 < P-valor < 0.05 . En consecuencia, la hipótesis de no diferencia en las intensidades medias de las tormentas debe rechazarse al 5% de significación, y debemos concluir que la intensidad media es mayor en verano que en no-verano. Para cuantificar la diferencia en las medias poblacionales podemos construir un intervalo de confianza para la diferencia de medias recortadas. La expresión del intervalo de confianza para la diferencia de medias puede aplicarse a los estadísticos resumen recortados para obtener un intervalo al 95% de confianza para la diferencia en las medias recortadas con fracción de recorte del 5%. La expresión del intervalo clásico es
Usando los estadísticos recortados obtenemos
donde O es la diferencia entre la media recortada poblacional de verano y la media recortada poblacional de no-verano. 2.3. Corrección de Satterthwaite para dispersiones desiguales Cuando las dispersiones de las dos poblaciones no son iguales es importante modificar el test t estándar porque en estos casos puede quedar afectada la sensibilidad del test y también puede resultar afectada su validez. Este efecto aumenta cuando los tamaños muéstrales son diferentes. Cuando el diagrama esquemático sugiere normalidad razonable pero dispersiones diferentes, puede aplicarse el método de este apartado para corregir el test t estándar y el intervalo de confianza estándar. Cuando el diagrama esquemático indica la existencia de atípleos, la corrección puede aplicarse al test t recortado y al intervalo de confianza recortado. El procedimiento de corrección consiste en reemplazar la expresión de la desviación típica (combinada) de la diferencia de medias muéstrales (en el denominador del estadístico t) por la versión «no combinada»
, y reempla-
143 zar los grados de libertad por otra expresión. Definiendo esviación típica es entonces SE = ^g\ + g libertad es v =
2
y la expresión para los grados de
.Si v no es un número natural, se re-
dondea al entero más próximo. En los contrastes de hipótesis se utiliza el estadístico de vprueba tn = —'
. Los intervalos de confianza se calculan usando los
límites corregidos, obteniéndose Vamos a aplicar la corrección de Satterthwaite a los estadísticos recortados del ejemplo 2.1 ya que el diagrama esquemático sugería desigualdad de dispersiones y, además, las desviaciones típicas recortadas son bastante diferentes. Asignando el subíndice 1 para denotar la muestra de verano y el subíndice 2 para la de no-verano obtenemos
La desviación típica co-
rregida es
y los grados de libertad corregidos son valor que debe redondearse a 14. El estadístico f_
recortado y corregido es entonces t
. Para 14 grados de liber-
tad, el P-valor bilateral de la hipótesis de igualdad de medias pertenece al intervalo (0.02,0.05). Por tanto, debemos rechazar la hipótesis de igualdad de medias al nivel de significación del 5%, pero no al nivel del 1%. Esta conclusión coincide con la que se obtuvo después de aplicar el test t recortado. Un intervalo al 95% de confianza para la diferencia de medias (recortadas al 5%) de intensidad de lluvia en verano respecto a no-verano tiene límites (32.83-16.7) + 2.14 -7.37, donde 7.37 = SE y 2.14 = Í0.o25;i4- Estos límites son 0.36 y 31.9. Así, con un 95% de confianza la intensidad media de las tormentas de verano excede a la de no-verano entre 0.36 y 31.9. 2.4. El problema de k muestras y el procedimiento FSD aplicado a medias recortadas El procedimiento FSD descrito en el capítulo 4 se puede aplicar a los datos resumen de las muestras recortadas. El procedimiento resultante es una extensión inmediata del procedimiento de dos muestras que presenta un comportamiento excelente al preservar la validez y mejorar la sensibilidad cuando las distribuciones poblacionales tienen colas más largas que las de una distribución normal.
144
Métodos robustos y no paramétricos
Ejemplo 2.2. Una empresa productora de pequeños electrodomésticos quería comparar los tiempos promedio de montaje de un cierto modelo de electrodoméstico en cada una de sus tres factorías A, B y C. Para ello tomó una muestra de tiempos de montaje (en minutos) en cada factoría, obteniendo los siguientes datos: Factoría A: 7.8, 7.9, 8.0, 8.1, 8.3, 8.4, 8.4, 8.5, 9.5. Factoría B: 7.3, 7.9, 8, 8.1, 8.1, 8.2, 8.2, 8.6. Factoría C: 7.4. 8.2, 8.4, 8.4, 8.5, 8.6, 8.6, 8.6, 8.8, 9.3. El análisis de la varianza basado en los supuestos de normalidad e igualdad de dispersiones obtiene los siguientes resultados: Fuente
Suma de cuadrados
Grados de libertad
Cuadrado medio
Razón F
P-valor
Entre
0.828444
2
0.414222
1.97
0.1616
Dentro
5.05156
24
0.210481
5.88
26
Total
Por tanto, a un nivel de significación del 5% el contraste clásico de k muestras no detecta diferencias entre los tiempos promedio de montaje. No obstante, en la práctica los supuestos de normalidad e igualdad de dispersiones deben explorarse usando la información muestral antes de efectuar el análisis inferencial. La figura 2.2 muestra el diagrama esquemático de los tiempos de montaje en las tres factorías.
Figura 2.2.
Como vemos, la información muestral sugiere que las distribuciones poblacionales no cumplen el supuesto de normalidad. El supuesto de igualdad de dispersiones de las distribuciones poblacionales también es discutible, aunque las diferencias en los recorridos intercuartílicos muéstrales no son muy grandes. Para mitigar el problema de no normalidad, vamos a efectuar un análisis de la varianza basado en los estadísticos recortados.
145
Para una fracción de recorte del 5% los estadísticos recortados aparecen en la tabla siguiente: A
B
C
nT
7
6
8
XT
8.23
8.08
8.51
ST
0.288
0.151
0.242
La tabla del análisis de la varianza basada en los estadísticos recortados es la siguiente: Fuente
Suma de cuadrados
Grados de libertad
Cuadrado medio
Razón F
P-valor
Entre
0.677
2
0.338
5.94
0.0104
Dentro
1.021
18
0.057
Total
1.698
20
Por tanto, al nivel de significación del 5% el análisis de k muestras basado en las medias recortadas detecta diferencias entre los tiempos promedio de montaje. Entonces es pertinente realizar la segunda etapa del procedimiento FSD para agrupar las factorías. El máximo y el mínimo de la diferencia significativa mínima son, respectivamente,
Calculando las diferencias entre las medias recortadas muéstrales, se obtiene la agrupación {A, B}\. La muestra de las diferencias es: Paciente
1
2
3
4
5
6
7
8
D.
1.6
1.8
2.8
1.3
1.3
1.1
1.8
0.2
Los estadísticos resumen son: D = 1.4875 y SD = 0.7376 . El estadístico de prueba es /0 = zarse HQ
= 1.87. Para un nivel de significación del 5%, debe recha-
si el estadístico de prueba pertenece a la región crítica
Como el valor muestral del estadístico de prueba no pertenece a C, se acepta H0 . b) Usaremos el subíndice 1 para el hospital general y el subíndice 2 para el hospital comarcal. En consecuencia, D{ = (temperatura «antes»)-(temperatura «después») en el hospital general y D2 = (Temperatura «antes»)-(Temperatura «después») en el hospital comarcal. Se quiere contrastar HQ\/J.D =/J.D contra //¡:// , de forma equivalente, HQ:JUD¡ -/¿Dj =0 contra Las muestras de las diferencias son: H. General: 0.2, 1.1, 1.3, 1.3, 1.6, 1.8, 1.8, 2.8. H. Comarcal: 0.9, 1.2, 1.3, 1.4, 1.4, 1.5, 1.6, 1.7, 2.1. El diagrama esquemático para estas muestras aparece en la figura 1.1.
Figura 1.1.
La aparición de atípicos con una frecuencia mayor de la que cabe esperar en distribuciones normales sugiere que las distribuciones poblacionales de las diferencias no son normales. Además, la desigualdad de los recorridos intercuartílicos
163
Ejercicios
muéstrales sugiere que las distribuciones poblacionales de las diferencias no tienen la misma dispersión. Parece adecuado aplicar un contraste basado en las medias recortadas con la corrección de Satterthwaite, o bien un contraste basado en la transformación rango. Consideremos primero el contraste basado en las medias recortadas. Comprobamos que una fracción de recorte del 5% es suficiente para eliminar los atípicos de las dos muestras. En efecto, para el hospital general el 5% de 8 es igual a 0.4, que redondeado por exceso es 1. Para el hospital comarcal el 5% de 9 es igual a 0.45, que redondeado por exceso es 1. Las muestras recortadas y las muestras winsorizadas para el hospital general y el hospital comarcal son las siguientes: Hospital General Muestra recortada Muestra winsorizada
1.1
1.1
1.3
1.3
1.6
1.8
1.8
1.1
1.3
1.3
1.6
1.8
1.8
1.8
Hospital Comarcal Muestra recortada Muestra winsorizada
1.2
1.2
1.3
1.4
1.4
1.5
1.6
1.7
1.2
1.3
1.4
1.4
1.5
1.6
1.7
1.7
Los estadísticos recortados de las dos muestras aparecen en la siguiente tabla: Hospital
XT
General
1.483
Comarcal
1.443
sw
ST
0.3105
0.3674
0.194
0.2244
nT 6 7
El estadístico de prueba (usando la corrección de Satterthwaite) es Suponiendo //o verdadera, /0 sigue aproximadamente una distribución t de Student con
gra-
dos de libertad. Usando los estadísticos recortados obtenemos t El P-valor muestral es 2- P(t% > 0.232), que es mayor que los niveles de significación habituales. Por tanto, se acepta //0 y concluimos que las medias de descenso de temperatura en los dos hospitales son iguales. Realicemos a continuación el contraste basado en la transformación rango. La siguiente tabla presenta la asignación de rangos a los valores muéstrales:
164
Métodos robustos y no paramétrícos
H. general
0.21
l.l 3
1.36
1.36
1.611-5
1.8R5 1.814-5 2.817
H. comarcal
0.92
1.24
1.36
1.48-5
1.48-5
1.510
1.6"-5
1.713
2.116
Los estadísticos resumen para las muestras de rangos son:
El
n
~X_
S
H. general
8
9.1875
5.9578
H. comarcal
9
8.83
4.4088
estadístico
de
prueba
es
con
Sustituyendo en estas fórmulas los estadísticos resumen
de los
rangos
obtenemos
o
El P-valor muestral es 2 • P(t\ * > 0.1417) que es muy grande. Luego de nuevo aceptamos HQ , es decir, concluimos que los dos hospitales registran el mismo descenso medio de temperatura. El diagrama esquemático para rangos se muestra en la figura 1.2. Este gráfico sugiere que no existen diferencias en los centros de las distribuciones de las diferencias, lo que está de acuerdo con la conclusión obtenida en el contraste basado en la transformación rango.
Figura 1.2.
Obsérvese que la transformación rango ha normalizado las muestras (no aparecen atípicos en los gráficos caja) aunque las dispersiones son algo diferentes. 2. Se quiere comparar la resistencia a la oxidación de 3 diferentes tipos de pintura industrial. Se aplicó la pintura en 15 trozos de 10 cm2 y se anotó en cada caso el
165
Ejercicios
tiempo hasta la oxidación, en horas, obteniéndose para los diferentes tipos de pintura los resultados siguientes: Tipo A: 484,841,484,676,900,961; Tipo B: 64,256,625,100,64; Tipo C: 576,1089,2116,784;
M = 758.5 M = 100.0 M = 936.5
/£?/? = 416.0 IQR = 192.0 IQR = 922.5
La tabla ANOVA para estos datos es: Fuente
Suma de cuadrados
Grados de libertad
Cuadrado medio
Razón F
P-valor
Entre
1910375.1
2
955187.56
6.207
0.0141
Dentro
1846716.9
12
153893.07
Total
3757092.0
14
Los gráficos caja múltiples para los datos originales y para los datos transformados mediante rangos aparecen en las figuras 2.1 y 2.2, respectivamente.
Figura 2.1.
Figura 2.2.
166
Métodos robustos y no paramétricos
Consideramos un nivel de significación del 1%. a) Suponiendo válidos los supuestos clásicos, ¿se pueden considerar iguales las medias de tiempo en los distintos tipos de pinturas? A la luz de los gráficos caja, ¿qué supuestos clásicos parecen violarse? ¿Es adecuado aplicar un método basado en la transformación rango? Proponer razonadamente un método de contraste alternativo al de la transformación rango. b) Aplicar el método escogido en el apartado anterior y poner de manifiesto (con métodos exploratorios) su validez. Realizar el procedimiento FSD. Solución a) Las hipótesis del contraste son H():/LIA = ¿UB = fj.c y //,:noH Q . En la tabla ANO VA se observa que P-valor > 0.01. En consecuencia, el contraste clásico no rechaza H() y, por tanto, considera iguales las medias poblacionales. El diagrama esquemático de las observaciones originales sugiere que se incumplen los supuestos de normalidad e igualdad de dispersiones. Aunque es adecuado aplicar un método basado en la transformación rango, no lo aplicaremos ya que, como vemos en el diagrama esquemático de los rangos, esta transformación no consigue igualar las dispersiones ni tampoco normaliza las muestras (sigue existiendo un atípico después de la transformación rango). Puesto que se observa en las muestras originales un aumento de la dispersión con la mediana, parece más adecuado el método de la transformación potencia. b) Los estadísticos resumen de los valores originales aparecen en la tabla siguiente: Tipo
M
IQR
ln(M)
\n(IQR)
A
758.5
416.0
6.631
6.031
B
100.0
192.0
4.605
5.257
C
936.5
922.5
6.842
6.827
La pendiente de la recta de regresión minimocuadrática de In(IQR) sobre ln( M) es 6 = 0.57. Por tanto, el parámetro de la transformación de potencia es q = 1 - b = 0.43 = 1 / 2 . En consecuencia, la transformación potencia que usamos convierte los valores originales en sus raíces cuadradas. Los datos transformados son: A: 22, 29, 22, 26, 30, 31 B: 8, 16, 25, 10, 8 C: 24, 33, 46, 28 El procedimiento de la diferencia significativa mínima de Fisher aplicado a los datos transformados, en su primera etapa, ofrece la siguiente tabla ANO VA: Fuente
Suma de Cuadrados
Grados de libertad
Cuadrado Medio
Razón F
P-valor
Entre
910.45
2
455.225
9.66
0.0032
Dentro
565.283
12
47.1069
Total
1475.73
14
\ 67
Ejercicios
Como vemos, el P-valor es muy pequeño y conduce al rechazo de H0, lo que concuerda con el diagrama esquemático de los valores transformados (Fig. 2.3). Como se rechaza H0 , procede realizar la segunda etapa del procedimiento FSD para agrupar las medias. Los valores máximo y mínimo de la diferencia significativa mínima son, respectivamente,
_ Las medias muéstrales de los datos transformados son Jf = 32.75. Es fácil comprobar que la única diferencia menor que LSDmin es Además, LSDAE = LSDmm 12.59 . Es fácil -j comprobar que el valor del estadístico Ji-cuadrado es %Q = 231.26. Como este valor es mayor que 12.59, debemos rechazar HQ . Es decir, al 5% de significación concluimos que las verdaderas proporciones del jurado difieren de las del distrito. También se puede calcular el P-valor asociado al estadístico de prueba mediante la fórmula P-valor = P(%v > %Q). El P-valor indica el mínimo nivel de significación para el que se tendría que rechazar HQ. La demostración matemática de la distribución asintótica de %Q está fuera del alcance de este libro. Sin embargo, para k = 2, la distribución asintótica resultante se sigue fácilmente del teorema central del límite. En efecto, si k = 2, entonces O2 = n-Ol y Pi+p2 = I- Por tanto
De los resultados de la sección 8 del capítulo 1 se deduce que, bajo H0, el estadistico
madamente una distribución
normal estándar para n grande. Por tanto, bajo // 0 , %Q es aproximadamente una variable aleatoria Ji-cuadrado con un grado de libertad. Varios investigadores han sugerido reglas para garantizar que la distribución Ji-cuadrado aproxime bien la distribución del estadístico %Q bajo //0 . Una de estas reglas es que todas las frecuencias esperadas de las categorías deben ser mayores o iguales que 1. Nosotros emplearemos una regla más estricta (usada con frecuencia) que exige que todas las categorías tengan frecuencias esperadas mayores o iguales que 5. En caso de que la muestra no cumpla esta regla, para que la aproximación sea buena es necesario recurrir a la estrategia de combinar (agrupar) categorías, lo que al reducir el número de categorías implica una reducción del número de grados de libertad. En algunas aplicaciones la hipótesis nula HQ no especifica completamente la distribución y para determinar las frecuencias teóricas pf se requiere estimar algunos parámetros desconocidos a partir de la muestra. Si en estos casos se usa el método de estimación de la máxima verosimilitud, entonces se puede seguir utilizando el estadístico Ji-cuadrado pero hay que tener presente que cada parámetro estima-
189
do reduce un grado de libertad. Por tanto, v = k - r — 1, donde r es el número de parámetros estimados usando la información muestral. 3. TEST DE KOLMOGOROV-SMIRNOV El contraste de Kolmogorov-Smirnov es un test de bondad de ajuste cuya hipótesis nula especifica completamente la función de distribución teórica. Sin embargo, a diferencia del test Ji-cuadrado, el test de Kolmogorov-Smirnov compara la función de distribución teórica con la distribución de frecuencias acumuladas observada, sin necesitar agrupar los valores de la variable en categorías. El test de KolmogorovSmirnov es válido para v.a. continuas y es más conveniente que el test Ji-cuadrado pues no requiere ninguna elección arbitraria de clases o categorías en las que agrupar los valores de la variable. Además, tiene la ventaja de que se puede aplicar en muestras pequeñas. Para facilitar la descripción del test de Kolmogorov-Smirnov empezamos recordando algunas propiedades de la función de distribución empírica, función que describe el comportamiento de la distribución de frecuencias acumuladas muéstrales. La función de distribución empírica de una m.a.s. X¡,...,Xn se definió (sección 4, capitulo 2) como Fn(x)N =
número de X.menores o iguales que x . La función n
F W (JC) definida de esta manera se puede considerar como la función de distribución de una distribución discreta que asigna probabilidad 1 / n a cada observación muestral. Se probó que la proporción Fn(x) de observaciones de la muestra que son menores o iguales que x es un estimador consistente para F(x), Vx E R, donde F(x) denota la función de distribución poblacional. Esta propiedad expresa el hecho de que en cada punto x la función de distribución empírica Fn(x) converge en probabilidad a la verdadera función de distribución F(x) de la distribución de donde se seleccionó la muestra aleatoria. Intuitivamente, una versión suavizada de Fn(x) en la que se eliminen los saltos proporcionará una estimador razonable de F ( x ) . Supongamos que deseamos contrastar la hipótesis de que la muestra procede de una población de tipo continuo con función de distribución F0(x) frente a la alternativa general de que la verdadera función de distribución no es F 0 ( x ) . Bajo H0 , se espera que para cualquier valor de x, Fn(x) aproxime bien a FQ(x), es decir, las diferencias entre Fn(x) y F 0 ( x ) , para una muestra suficientemente grande, serán pequeñas. La prueba de Kolmogorov-Smirnov considera la mayor de estas diferencias entre Fn(x} y F O (JC) como estadístico de prueba. Específicamente, el estadístico de Kolmogorov-Smirnov es La distribución muestral de Dn bajo HQ es conocida e independiente de la distribución F0(x) que provisionalmente se ha atribuido a la población. Esto se debe a que por el teorema de la transformación integral si la v.a X es continua entonces Y=F(X) siempre tiene una distribución £7(0,1), con lo que
190
Bondad de ajuste
sup
sup
tiene la misma distribución de pro-
babilidad cualquiera que sea F Además, como consecuencia de la consistencia de la función de distribución empírica Fn(x) para la función de distribución teórica F(x), bajo HQ el estadístico Dn converge en probabilidad a 0. Esto es, el valor de Dn tenderá a ser pequeño si la hipótesis nula HQ es cierta y tenderá a ser grande si la verdadera función de distribución es distinta de F0(x). Por tanto, un procedimiento de contraste razonable para verificar la hipótesis nula de que la muestra procede de la distribución continua F0(x) al nivel de significación a consiste en utilizar la región crítica C = [Dn > c}, donde c es una constante apropiada tal que P(Dn >c/HQ) = a.Siel valor muestral del estadístico Dn pertenece a la región crítica C, se rechaza la hipótesis nula. Los valores críticos c para diferentes niveles de significación y distintos tamaños muéstrales se recogen en la tabla 3.1. Para aplicar el test de Kolmogorov-Smirnov en la práctica se siguen las siguientes etapas: 1) Se ordenan los valores de la muestra en orden creciente, obteniéndose 2) Se calcula la función de distribución empírica de la siguiente forma:
3) Se calcula el valor del estadístico
Para calcular Dn, se calcula para cada valor muestral
Entonces, D
4) Fijado el nivel de significación a, se busca en la tabla 3.1 el valor c para que P(Dn>c/HQ) = a. Si Dn >c, se rechaza H0 En la
figura 3.1 se ilustran gráficamente para un ejemplo las distancias . La mayor de estas dos distancias se denota median-
19]_ te D W (JC (/) ) en la descripción que hemos realizado de las etapas del test de Kolmogorov-Smirnov. El estadístico Dn se define como la mayor de las discrepancias Dn(x(¡}),i=l,...,n. Tabla 3.1. Puntos críticos del test de Kolmogorov-Smirnov Tamaño muestral n
Nivel de significación, a
0.20
|
0.15
|
0.10
|
0.05
|
0.01
1
0.900
0.925
0.950
0.975
0.995
2
0.684
0.726
0.776
0.842
0.929
3
0.565
0.597
0.642
0.708
0.828
4
0.494
0.525
0.564
0.624
0.733
5
0.446
0.474
0.510
0.565
0.669
6
0.410
0.436
0.470
0.521
0.618
7
0.381
0.405
0.438
0.486
0.577
8
0.358
0.381
0.411
0.457
0.543
9
0.339
0.360
0.388
0.432
0.514
10
0.322
0.342
0.368
0.410
0.490
11
0.307
0.326
0.352
0.391
0.468
12
0.295
0.313
0.338
0.375
0.450
13
0.284
0.302
0.325
0.361
0.433
14
0.274
0.292
0.314
0.349
0.418
15
0.266
0.283
0.304
0.338
0404
16
0.258
0.274
0.295
0.328
0.392
17
0.250
0.266
0.286
0.318
0.381
18
0.244
0.259
0.278
0.309
0.371
19
0.237
0.252
0.272
0.301
0.363
20
0.231
0.246
0.264
0.294
0.356
25
0.21
0.22
0.24
0.27
0.32
30
0.19
0.20
0.22
0.24
0.29
35
0.18
0.19
0.21
0.23
0.27
>35
1.07/V»
1.14/Vñ
1.22/Vw
1.36/Vw
1.63/V«
192
Bondad de ajuste
Figura 3.1.
4. COMPARACIÓN DE LOS CONTRASTES Hemos presentado dos procedimientos de contraste de la bondad del ajuste para una muestra. En esta sección comparamos estos dos procedimientos señalando las ventajas y desventajas de cada contraste en términos de los criterios de validez y sensibilidad. Para probar una hipótesis acerca de si la muestra procede de una distribución poblacional específica podemos usar uno de los dos tests de bondad de ajuste: el test Ji-cuadrado o el test de Kolmogorov-Smirnov. El test Ji-cuadrado se recomienda para modelos discretos (variables categóricas). Para modelos continuos, el P-valor del contraste Ji-cuadrado depende mucho de la elección de las clases o categorías en las que se agrupe la variable. En distribuciones continuas se recomienda utilizar el test de Kolmogorov-Smirnov ya que no requiere ninguna elección arbitraria de intervalos de clase pues trata las observaciones muéstrales separadamente. De esta manera el test de Kolmogorov-Smirnov, a diferencia del test Ji-cuadrado, no pierde información por la agrupación en intervalos de clase. Con una variable continua, si la muestra es pequeña y, por consiguiente, las categorías adyacentes deben combinarse para que la distribución del estadístico Ji-cuadrado pueda aproximarse apropiadamente, el test Ji-cuadrado tiene menor potencia (menor sensibilidad) que el test de Kolmogorov-Smirnov. Además, para muestras muy pequeñas, la prueba Ji-cuadrado no será adecuada, mientras que la de Kolmogorov-Smirnov sí lo es. El test Ji-cuadrado deberá usarse cuando los datos estén en categorías discretas y cuando las frecuencias esperadas sean suficientemente grandes. Cada frecuencia
193
esperada deberá ser 5 o mayor para que sea adecuada la aproximación Ji-cuadrado del estadístico de prueba bajo la hipótesis nula. El test de Kolmogorov-Smirnov deberá usarse cuando se puede suponer que la variable bajo consideración tiene una distribución continua. Sin embargo, si se usa cuando la distribución poblacional es discreta, el error de la aseveración resultante de probabilidad se dirige a la «seguridad». Es decir, si se usa la tabla de valores críticos del estadístico de Kolmogorov-Smirnov, que supone que la función de distribución de la población es continua, para probar una hipótesis acerca de una variable discreta, la prueba es conservadora: al rechazar la hipótesis nula con esta prueba podemos confiar plenamente en esa decisión. La distribución del estadístico de Kolmogorov-Smirnov no se conoce en el caso de ciertos parámetros desconocidos de la población cuya estimación se hace a partir de la muestra. Sin embargo, se ha comprobado que si en tales casos se aplica el test de Kolmogorov-Smirnov, el uso de los puntos críticos de la tabla 3.1 conduce a una prueba conservadora. Esto es, si el valor del estadístico de Kolmogorov-Smirnov es mayor que el punto crítico de la tabla 3.1, confiadamente podemos rechazar la hipótesis nula y concluir con gran seguridad que hay una diferencia significativa entre la distribución muestral y la teórica específica. En los casos donde deban estimarse algunos parámetros a partir de la muestra, el test Ji-cuadrado puede modificarse fácilmente reduciendo el número de grados de libertad. Sin embargo, como hemos indicado, para el test de Kolmogorov-Smirnov no se conocen modificaciones semejantes.
194
Bondad de ajuste
EJERCICIOS 1. En un experimento biológico se subdividió un milímetro cuadrado de cultivo de levadura en 400 cuadrados de la misma área, y se registró el número de células de levadura en cada cuadrado de la subdivisión. La tabla siguiente resume los resultados obtenidos: Número de células Frecuencia observada
0 129
1
2
137
83
3 38
4 10
5 2
6 1
>6 0
Se sabe que si las células de levadura estuvieran distribuidas aleatoriamente sobre el área examinada, el número de células por cuadrado seguiría una distribución de Poisson. Contrastar al nivel de significación a = 0.05 si el número de células por cuadrado sigue una distribución de Poisson. Solución Sea X la variable «número de células por cuadrado». Queremos contrastar la hipótesis nula H0: «X tiene distribución de Poisson con parámetro A» contra la alternativa //,: no HQ. Puesto que la hipótesis nula no especifica totalmente la distribución de X (A es desconocido), debemos estimar A. El estimador máximo ve- — 1 -r-a rosímil de A es Á= X = — > x, -O/ , donde k es el número de categorías. La información necesaria para estimar A se recoge en la siguiente tabla:
*/
0
1 2
3 4 5 6
Oi 129 137 83 38 10 2 1
ti'Oi
0 137 166 114 40 10 6
Es fácil comprobar que Á = 1.2 . La regla de adecuación para la aproximación a la distribución X del estadístico de prueba XQ , que exige que todas las frecuencias esperadas sean mayores o iguales que 5, nos obliga a combinar las categorías en las que x¡ es 4, 5, 6 o más. La siguiente tabla muestra para la nueva agrupación los cálculos necesarios para realizar el contraste.
195
Ejercicios
x
i
o,
0
1 2 3 4, 5, 6 o más
129 137
P? 0.3012 0.3614
E, 120.48 144.56
83 38
0.2169 0.0867
13
0.0338
86.76 34.68 13.52
(Oi-Ei)2/E¡ 0.60250996 0.39536248 0.16295067 0.3178316 0.02
A partir de estos datos obtenemos el valor del estadístico Ji-cuadrado =1.49865. Los grados de libertad son v = A - r - l = 5 - l - l = 3 y el P-valor es P(%1 > 1.49865) e (0.5,0.75). Como el P-valor es mayor que el nivel de significación a=0.05, se debe aceptar la hipótesis nula, es decir, el número de células por cuadrado sigue una distribución de Poisson. 2. Un departamento de policía municipal registró el número de accidentes de tráfico en los que hubo daños personales durante 60 mañanas de días laborables. Los resultados fueron los siguientes: Número de accidentes Frecuencia observada
0 17
1 17
2 16
3 7
4 2
5 1
>5 0
Contrastar la hipótesis de que la variable número de accidentes de tráfico en los que hay daños personales durante un día laborable sigue una distribución de Poisson. Usar un nivel de significación ce=0.05. Solución Sea X la variable «número de accidentes de tráfico en los que hay daños personales en una mañana laborable». Queremos contrastar la hipótesis nula HQ: «X tiene distribución de Poisson con parámetro A» contra la hipótesis alternativa Hl:noH0. Puesto que la hipótesis nula no especifica totalmente la distribución de X (A es desconocido), debemos estimar A. El estimador maximoverosímil de A es }:
, siendo k el número de categorías. La información necesaria
para estimar A se recoge en la siguiente tabla:
196
Bondad de ajuste
x
i
o¡
xrOi
0
3 4 5
17 17 16 7 2 1
>5
0
0 17 32 21 8 5 0
1 2
Es fácil comprobar a partir de aquí que /I = 1.4. En este caso es conveniente combinar las categorías 3, 4, y 5 o más para garantizar que la aproximación Ji-cuadrado es buena. Los cálculos necesarios para realizar el contraste son los siguientes:
x
i
o,
P?
0
17 17 16 10
0.2466
14.796
(Oi-Etf/E, 0.32830603
0.3452
20.712
0.66526381
0.2417
14.502
0.15473755
0.1665
9.99
1.001E-05
1 2 3, 4, 5 o más
Ef
A partir de aquí obtenemos que
Los grados de
libertad s o n v = £ - r - l = 4-l-l = 2 y P-valor = P(¿ > 1.1483) e (0.5,0.75). Como el P-valor es mayor que el nivel de significación a=0.05, se acepta que X sigue una distribución de Poisson. 3. El mismo departamento del ejercicio anterior registró también el número de personas lesionadas en accidentes de tráfico ocurridos en un día laborable con los siguientes resultados: Número de heridos Frecuencia observada
0 17
1
2
8
9
3 8
4 10
5 4
6 2
7
>7
2
0
Decidir si los datos proceden de una distribución Poisson a un nivel de significación del 5%.
197
Ejercicios
Solución Sea X la variable «número de personas lesionadas en accidentes de tráfico en una mañana laborable». Queremos contrastar la hipótesis nula 7/0: «X tiene distribución de Poisson con parámetro A» contra la alternativa //,: no H0 . Puesto que bajo HQ A es desconocido, debemos estimarlo. El estimador maximoverosímil de A es . La información necesaria para estimar A se recose en la siguiente tabla:
x
i
O;
0
17
*,..0/ 0
1
8
8
2
9
18
3
8
24
4
10
40
5
4
20
6
2
12
7
2
14
El estimador maximoverosímil de A es En este caso, después de combinar las categorías 5, 6, y 7 o más con el objeto de obtener que las frecuencias esperadas de todas las clases sean al menos 5, obtenemos los siguientes resultados:
o,
P? 0.10365713
2 3 4
17 8 9 8 10
0.26628365 0.20119209 0.11400885
6.84053099
1 .37325796 1.45927917
>5
8
0.07990213
4.79412776
2.14379285
*/
0
1
0.23495616
E, 6.21942772
14.0973695 15.9770188 12.0715253
El valor observado del estadístico de prueba es
(Oi-Eif/E¡ 18.6867255 2.63722354 3.04680062
IOS
grados de libertad son v= k-r-\ = 6-1-1 = 4 y el P-valor es P(z1 ^ 29.347) < 0.005. Como el P-valor es menor que el nivel de significación a=0.05, se rechaza la distribución de Poisson a dicho nivel de significación del 5%.
198
Bondad de ajuste
4. De los 83 accidentes registrados en el ejercicio 2, 22 ocurrieron en lunes, 13 en martes, 11 en miércoles, 12 en jueves y 25 en viernes. ¿Son coherentes estos resultados con la hipótesis de que los accidentes tienen la misma probabilidad de ocurrir en cualquier día de la semana laboral al nivel de significación ce=0.05? Solución Queremos contrastar la hipótesis nula H0:pf =1/5 (/' = 1,2,3,4,5), siendo pf la probabilidad de que ocurra un accidente el día /-ésimo (/ = 1 para lunes, etc.), contra la hipótesis alternativa //j: no H0. Los cálculos necesarios se recogen en la siguiente tabla:
o, 22
rf 0.2
E, 16.6
(Oi-E^/E, 1.75662651
13
13
0.2
16.6
0.78072289
Miércoles
11
11
0.2
16.6
1.88915663
Jueves
12
12
0.2
16.6
1.2746988
Viernes
25
25
0.2
16.6
4.25060241
Lunes
*/ 22
Martes
Obtenemos para el estadístico Ji-cuadrado un valor Los
grados
de libertad son v=k-\-5-1-4 y el P-valor es Como el P-valor es menor que el nivel de significación cc=0.05, los datos no son coherentes con la hipótesis nula.
5. Un experimento consiste en lanzar 6 veces una moneda y anotar el número de caras. La tabla siguiente muestra las frecuencias observadas en 210 repeticiones del experimento. Número de caras
0
1
2
3
4
5
6
Frecuencia observada
3
19
49
580
57
22
2
Estudiar si los resultados están de acuerdo con la hipótesis de que las monedas están equilibradas al nivel de significación a =0.05. Solución Sea X la variable aleatoria «número de caras al lanzar 6 veces una moneda». Queremos contrastar la hipótesis nula H0: «La moneda está equilibrada», que es equivalente a H0:«X sigue una distribución binomial con parámetros n = 6 y p - 1/2 ». La hipótesis alternativa es H}:no H0. Los datos resumen, combinando
199
Ejercicios
las categorías O y 1 por un lado y las categorías 5 y 6 por otro lado, se recogen en la siguiente tabla: x
i
o¡
Oó 1 2 3 4 566
22 49 58 57 24
(0¡-Ei)2/E¡
E, 22.96875 49.21875 65.625 49.21875 22.96875
PÍ 0.109375 0.234375 0.3125 0.234375 0.109375
0.04085884 0.00097222 0.8859528 1.23017857 0.04630102
Obtenemos para el estadístico Ji-cuadrado un valor con grados de libertad v= £-1 = 5-1 = 4 y P-valor Como el P-valor es mayor que 0.05, se acepta que la moneda está equilibrada al nivel de significación a=0.05. 6. Se lanzaron 12 dados 26306 veces. Cada vez se anotó el valor de la variable X = «número de dados en los que salió un 5 o un 6». Los resultados obtenidos se muestran en la siguiente tabla:
*/• o¡
0 185
1
2
3
4
5
6
7
1149 3265 5475 6114 5194 3067 1331
9
10
11
12
403 105
14
4
0
8
Contrastar que los dados están equilibrados al nivel de significación a=0.05. Solución Queremos contrastar la hipótesis nula //0:«Los dados están equilibrados», que es equivalente, si las pruebas son independientes, a H0:«X sigue una distribución binomial con parámetros n-\2 y /? = 1 / 3 » (siendo p la probabilidad de obtener 5 ó 6). La hipótesis alternativa es //,:no HQ. Combinando las categorías 10, 11 y 12, se obtienen los siguientes resultados:
200
Bondad de ajuste
*l
o¡
0
185 1149 3265 5475 6114 5194 3067 1331 403 105 18
1 2 3 4 5 6 7 8 9 10, 11 ó 12
rf 0.00770735 0.04624408 0.12717122 0.21195203 0.23844604 0.19075683 0.11127482 0.04768921 0.01490288 0.00331175 0.0005438
E,
(0¡-Eif/Ei
202.74946 1216.49676 3345.3661 5575.61016 6272.56143 5018.04915 2927.19533 1254.51229 392.03509 87.1189088 14.3053208
1.55385541 3.74502678 1.93064357 1.81547927 4.00820749 6.1694699 6.67715753 4.66346196 0.30667985 3.67008067 0.95423615
El estadístico Ji-cuadrado es ^o = 35.49, con grados de libertad v = * - l = ll-l = 10y P-valor = P(x\Q > 35.49) < 0.005. Como el P-valor es menor que 0.05, se rechaza que los dados están equilibrados al nivel de significación del 5%. 7. Para los datos de altura de 60 niños, tenemos la siguiente distribución de frecuencia construida a partir de 8 intervalos de clase de igual amplitud: Intervalo de clase
Frecuencia observada
Marca de clase
[16.35, 17.25[
4
16.8
[17.25, 18.15[
7
17.7
[18.15, 19.05[
12
18.6
[19.05, 19.95[
8
19.5
[19.95, 20.85[
6
20.4
[20.85, 21.75[
11
21.3
[21.75, 22.65[
9
22.2
[22.65, 23.55]
3
23.1
Contrastar si los datos proceden de una distribución normal al nivel de significación a=0.05.
201
Ejercicios
Solución Sea X la variable aleatoria «altura». Queremos contrastar la hipótesis nula //0: «X sigue distribución normal con media ¿u y varianza o2 » contra la alternativa H}: no H0. Puesto que // y
View more...
Comments