Libro Ejercicios Jimenez y Olea Tomo I

May 7, 2017 | Author: Ricardo Sanzana | Category: N/A
Share Embed Donate


Short Description

Descripción: Ejercicios Resueltos Estadistica UC...

Description

Ejercicios Resueltos y Propuestos Cursos EYP2214 y EYP2216 Primera Edici´ on

Trabajo de Recopilaci´on, Organizaci´on y Elaboraci´on Patricia Jim´enez P. & Ricardo Olea O. Departamento de Estad´ıstica - Facultad de Matem´aticas Pontificia Universidad Cat´olica de Chile Santiago, Diciembre 2004

Prefacio Con la intenci´on de apoyar la labor docente que desarrolla el Departamento de Estad´ıstica de la Facultad de Matem´aticas de la Pontificia Universidad Cat´olica de Chile, se ha realizado un trabajo de recopilaci´on y elaboraci´on de ejercicios resueltos y propuestos para los curso EYP2216 y EYP2214, algunos de los cuales fueron desarrollados en ayudant´ıas y han sido parte de interrogaciones en semestre anteriores. Queremos agradecer muy en especial a FONDEDOC, por haber confiado en este proyecto y habernos entregado todo su apoyo para poder ver realizada esta necesidad tanto para el Departamento de Estad´ıstica, como para todos los alumnos y alumnas que son beneficiados de los cursos de servicio que ofrece el mismo. Este trabajo ha sido fruto de la labor que desarrollaron docentes y ayudantes que dictaron el curso entre los a˜ nos 2001 y 2004. Espec´ıficamente deseamos agradecer a los profesores Claudio Beltr´an Rolando de la Cruz H´ector G´omez Patricia Jim´enez Ricardo Olea Alexis Rojas Adem´as quisi´eramos agradecer el aporte de Jorge Gonz´alez y Mario Tagle, tanto por el material donado, como por la revisi´on de este libro. Atentamente. Direcci´on Departamento de Estad´ıstica Facultad de Matem´aticas Santiago, Diciembre 2004 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

II

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

´Indice general 1. An´ alisis Descriptivo 1.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1 1 18

2. Probabilidad 2.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

27 27 42

3. Variables Aleatorias Discretas 3.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

45 45 54

4. Variables Aleatorias Continuas 4.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

59 59 70

5. Sensibilidad y Especificidad 5.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

73 73 77

6. Estimaci´ on 79 6.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 6.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 7. Intervalos de Confianza y Test de Hip´ otesis 105 7.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 7.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 8. Test de Homogeneidad, Independencia y Bondad de Ajuste 131 8.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 8.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 9. An´ alisis de Regresi´ on 151 9.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 9.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

´INDICE GENERAL

IV

A. Formulario de Distribuciones

I

B. Formulario de An´ alisis de Regresi´ on Simple C. Tablas de distribuci´ on C.1. Distribuci´on t de Student . C.2. Distribuci´on χ2 . . . . . . C.3. Distribuci´on F (α = 0,05) C.4. Distribuci´on Normal . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

III

. . . .

. . . .

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

VII VII VIII IX XI

Cap´ıtulo 1 An´ alisis Descriptivo 1.1.

Ejercicios Resueltos

EJERCICIO 1 Unos transductores de temperatura de cierto tipo se embarcan en lotes de 50. Se seleccion´o una muestra de 60 lotes y se determin´o la cantidad de transductores en cada lote que no se apegaban a las especificaciones de dise˜ no y resultaron los siguientes datos: 2 0 5

1 2 4 2 0 2

4 0 1 3 3 2

1 1 1

3 2 1 3 0 6

0 5 4 1 4 2

3 2 1

3 1 3 2 6 0

3 2 2 8 3 3

4 4 3

7 0 5 1 6 1

2 3 3 1 2 3

(a) Diga que tipo de datos son estos. (b) Construya una tabla de distribuci´on de frecuencias adecuada para los valores de x: cantidad de transductores defectuosos en un lote. (c) ¿Qu´e proporci´on de lotes en la muestra tienen cuando m´as cinco transductores defectuosos? (d) ¿Qu´e proporci´on tienen cuando menos cinco unidades defectuosas? (e) Trace un histograma de los datos con la frecuencia relativa en el eje vertical y comente sus propiedades. (f) Calcule e interprete la media aritm´etica a partir de la tabla de frecuencias. (g) Obtenga e interprete la mediana por medio de la tabla de frecuencias. ´ SOLUCION

(a) Datos Discretos. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

2

Cap´ıtulo 1. An´ alisis Descriptivo (b) Tabla de distribuci´on de frecuencias: Considerando que son datos discretos, la forma correcta de hacer esta tabla es dejando una clase por n´ umero de transductores que no se apegaban a las especificaciones. Resultando la siguiente: Clase 0 1 2 3 4 5 6 7 8

Frec. 7 12 13 14 6 3 3 1 1

Frec. Relativa 0.12 0.20 0.21 0.23 0.10 0.05 0.05 0.02 0.02

Frec. Acumulada 7 19 32 46 52 55 58 59 60

Frec. Relativa Acumulada 0.12 0.32 0.53 0.76 0.86 0.91 0.96 0.98 1.0

(c) Aqu´ı debemos considerar todos aquellos lotes que ten´ıan 0, 1, 2, 3, 4, o 5 transductores defectuosos 55 = 0,917 60 (d) An´alogamente a la parte (c), aqu´ı debemos considerar todos aquellos lotes que ten´ıan 5, 6, 7 o 8 transductores defectuosos 52 8 =1− = 1 − 0,867 = 0,133 60 60 (e) El Histograma tiene una asimetr´ıa positiva apreciable. Se dispersa bastante respecto a su centro.

Figura 1.1: Histograma

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

3

(f) La media es: m

X=

1X xi fi n i=1

Donde m es el n´ umero de clases, xi el valor de la clase i, y fi frecuencia de la clase i. 8

∴ X=

1X 152 ≈ 2,5 xi fi = 8 i=1 60

Aunque esta no es una medida de posici´on adecuada para este caso, en promedio hay 2.5 traductores que no se apegaban a las especificaciones del dise˜ no. (g) El calculo de la mediana para este caso es obvio por la composici´on de las clases, ya que cada clase esta compuesta de un solo valor, es decir, lo m´as simple ser´ıa ver en que frecuencia acumulada se encuentra el valor n2 = 60 = 30 y a que clase corresponde, 2 para este caso el valor 30 se encuentra en la frecuencia acumulada de la clase 2, por lo que la M e = 2. De una manera m´as formal ser´ıa por el procedimiento para el caso de datos tabulados y discretos, siendo este como sigue: i. Observemos en la tabla de la parte (a) la columna de las Frecuencias acumuladas (”menor que”). ii. Se determina la menor frecuencia acumulada Nj que supera a n2 . Es decir n < Nj 2 En esta situaci´on puede ocurrir que

n 2

≥ Nj−1 . O sea que se puede tener

Nj−1 ≤ 1. Cuando

n 2

n < Nj 2

> Nj−1 , entonces la mediana es: M e = yj

2. Cuando n2 = Nj−1 , en esta situaci´on se acostumbra a tomar como valor de la mediana: yj−1 + yj Me = 2 ∴ Como n2 = 30, N2 = 32 tenemos que M e = y2 = 2 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

4

Cap´ıtulo 1. An´ alisis Descriptivo EJERCICIO 2 Un Constructor Civil visita 25 villas en una ciudad y en cada una anot´o el n´ umero de casas que han sufrido da˜ nos ocasionados por un terremoto, de lo cual resultaron los datos: 15 16 18 19 19

20 17 18 16 18

25 18 19 17 19

15 20 16 17 18

18 18 17 17 15

(a) Diga que tipo de datos son estos. (b) Construya una tabla de distribuci´on de frecuencias adecuadas a este conjunto de datos. (c) ¿Cu´antas villas tienen a lo m´as 20 casas que han sufrido da˜ nos? (d) ¿Que proporci´on de villas tienen por lo menos 17 casas que han sufrido da˜ nos? (e) ¿Qu´e proporci´on de villas tienen 18 casas que han sufrido da˜ nos? (f) ¿Qu´e proporci´on y que porcentaje de villas tienen 18 o menos casas que han sufrido da˜ nos? (g) Calcular e interpretar la media aritm´etica de los datos a partir de la tabla que construyo en la parte (b) (h) Obtenga e interprete la mediana de los datos agrupados a partir de la tabla que construyo en la parte (b) (i) Construya un gr´afico adecuado y haga comentarios. ´ SOLUCION (a) Discretos. (b) Como son datos discretos, la tabla de frecuencias presentar´a una clase por cada valor en los datos, resultando la siguiente tabla Clase 15 16 17 18 19 20 25

Frecuencia Frecuencia Acumulada 3 3 3 6 5 11 7 18 4 22 2 24 1 25

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

5

(c) Considerando la frecuencia acumulada hasta 20, tenemos que el n´ umero de villas que tienen a lo m´as 20 casa con da˜ nos es 24. (d) Para contestar esto, nos sirven todas las villas que tuvieron 17 casa o m´as con da˜ nos 5+7+4+2+1 = 0,76 ≈ 76 % 25 (e) De la tabla de frecuencias rescatamos que son 7 de un total de 25, esto es 7 = 0,28 ≈ 28 % 25 (f) Para contestar esto, nos sirven todas las villas que tuvieron 18 casa o menos con da˜ nos 18 = 0,72 ≈ 72 % 25 (g) La media es: 5 X

X=

xi · fi

i=1 5 X

=

445 15 · 3 + 16 · 3 + 17 · 5 + 18 · 7 + 19 · 4 + 20 · 2 + 25 · 1 = = 17,8 25 25

fi

i=1

(h) Del Ejercicio 1, tenemos que n2 = 12,5, entonces la clase que contiene a Nj (La frecuencia acumulada que supera a n2 ) es la 4, es decir N4 = 7. ∴ como

n 2

= 12,5 > N3 = 11 tenemos que M e = y4 = 18

(i) Del Histograma de la figura siguiente se aprecia que lo que se dio con mayor frecuencia en las villas, fueron 18 casas con da˜ nos, seguidas por 17 y 19, manteni´endose las otras clases relativamente semejantes.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

6

Cap´ıtulo 1. An´ alisis Descriptivo

Figura 1.2: Histograma EJERCICIO 3 La siguiente distribuci´on de frecuencias es el resultado de registros sobre la duraci´on de 220 l´amparas (o focos) de 60 watts. L´ımites de Clase [500 − 600) [600 − 700) [700 − 800) [800 − 900) [900 − 1000) [1000 − 1100) [1100 − 1200) [1200 − 1300) [1300 − 1400) [1400 − 1500]

Frecuencia 3 7 14 28 64 57 23 13 7 4

(a) Construya un histograma para estos datos, cuyo eje vertical corresponda a las frecuencias relativas. (b) Obtenga la duraci´on media. (c) Obtenga la desviaci´on est´andar. (d) Encuentre e interprete un intervalo que contenga el 60 % central de los datos. (e) M´as o menos, ¿Cu´al es la mediana de la duraci´on de las ampolletas? ´ SOLUCION

(a) tenemos la siguiente tabla tabulada: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos Clase [500 − 600) [600 − 700) [700 − 800) [800 − 900) [900 − 1000) [1000 − 1100) [1100 − 1200) [1200 − 1300) [1300 − 1400) [1400 − 1500]

7 Frecuencia Frecuencia Relativa 3 0.014 7 0.032 14 0.064 28 0.127 64 0.291 57 0.259 23 0.105 13 0.059 7 0.032 4 0.018

Frecuencia Acumulada 3 10 24 52 116 173 196 209 216 220

luego el histograma queda de la siguiente forma

Figura 1.3: Histograma

(b) La media es: 10 X

X=

yi · fi

i=1 10 X

=

219100 = 995,91 220

fi

i=1

donde yi es la marca de clase o punto medio de la i-esima clase y fi la frecuencia absoluta de la misma clase. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

8

Cap´ıtulo 1. An´ alisis Descriptivo (c) La varianza para datos tabulados se calcula de la siguiente manera: n X

S2 =

fi (yi − X)2

i=1

n−1

en este caso S 2 = 28613,325 ∴ La desviaci´on est´andar es: S=



S2 =

p

28613,325 = 169,15

(d) El intervalo pedido es: [P20 − P80 ] P20 : ¿En que clase esta?:

n·p 220 · 20 = = 44 100 100

es decir, esta en la 4a clase. P80 : ¿En que clase esta?:

n·p 220 · 80 = = 176 100 100

es decir, esta en la 7a clase. La f´ormula para calcular el percentil en datos tabulados es:   n∗p − Nj−1 100 Pp = LI + cj Nj − Nj−1 donde: i. LI: Limite Inferior de la clase que contiene a Pi . ii. cj : Amplitud de la clase que contiene a Pi . iii. Nj : Frecuencia acumulada en la clase que contiene Pi . Reemplazando tenemos lo siguiente: 

 44 − 24 P20 = 800 + 99 = 870,71 52 − 24   176 − 173 P80 = 1100 + 99 = 1112,91 196 − 173 Por lo tanto el intervalo que contiene al 60 % de los datos es: (870,71; 1112,91) Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

9

(e) Para el calculo de la Mediana en datos tabulados y continuos, el procedimiento es el siguiente: Se observa la columna de las frecuencias acumuladas y se determina la menos frecuencia acumulada Nj tal que n Nj > 2 En esta situaci´on puede ocurrir que

n 2

≥ Nj−1 . Es decir, se puede tener

Nj−1 ≤ i. Si ocurre que

n 2

n < Nj 2

= Nj−1 , la mediana est´a dada por: M e = yj−1

donde yj−1 es el l´ımite inferior de la clases mediana. ii. Si ocurre que

n 2

> Nj−1 , la mediana est´a dada por:   n − Nj−1 2 M e = yj−1 + cj Nj − Nj−1

Dado esto tenemos que n2 = 220 = 110, lo que indica que Nj = N5 = 116 y como 2 n = 110 > N = N = 52 tenemos que la mediana es: j−1 4 2 

 110 − 52 M e = 900 + 99 = 989,718 116 − 52 EJERCICIO 4 Los tiempos de CPU que se indican en la tabla de frecuencias representan el tiempo (en segundos) que 25 trabajos estuvieron en control de la unidad de proceso (CPU) de una computadora mainframe grande. Intervalo de Clase Frecuencia de Clase [0.015-0.715) 5 [0.715-1.415) 9 4 [1.415-2.115) [2.115-2.815) 3 [2.815-3.515) 1 [3.515-4.215) 2 [4.215-4.915] 1 (a) Calcule el tiempo promedio de CPU. (b) Calcule e interprete la desviaci´on est´andar. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

10

Cap´ıtulo 1. An´ alisis Descriptivo (c) Construya e interprete un histograma de frecuencia. (d) Encuentre e interprete el intervalo intercuartil.

´ SOLUCION A continuaci´on la tabla de frecuencias completa Intervalo de Clase [0.015-0.715) [0.715-1.415) [1.415-2.115) [2.115-2.815) [2.815-3.515) [3.515-4.215) [4.215-4.915]

f 5 9 4 3 1 2 1

F 5 14 18 21 22 24 25

fr 0,2 0,36 0,16 0,12 0,04 0,08 0,04

Fr 0,2 0,56 0,72 0,84 0,88 0,96 1

yi 0,35 1,065 1,765 2,465 3,165 3,865 4,565

donde N = 25 yi : punto medio de la clases i-´esima fi : frecuencia absoluta de la clases i-´esima (a) El tiempo promedio de CPU es:

x=

7 1 X fi · yi N i=1

=

1 (0,365 · 5 + 1,065 · 9 + 1,765 · 4 + 2,465 · 3 + 3,165 · 1 + 3,865 · 2 + 4,565 · 1) 25

=

41,325 25

= 1,653 (b) La desviaci´on est´andar es la siguiente:

7

S2 =

1 X fi (yi − x)2 N − 1 i=1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

S2 =

11

1  5 · (−1,288)2 + 9 · (−0,588)2 + 4 · (0,122)2 24 +3 · (0,812)2 + 1 · (1,512)2 + 2 · (2,212)2 + 1 · (2,912)2

=



33,9864 24

= 1,4161 ∴ S=

p

1,4161

= 1,19 La desviaci´on est´andar es una medida de dispersi´on de los datos con respecto a la media. En este caso S = 1,19 seg., es alta, lo cu´al indica la presencia de datos extremos. (c) El histograma de frecuencia se muestra en la figura siguiente.

Figura 1.4: Histograma Se aprecia que el histograma es asim´etrico, que m´as de la mitad de los tiempos de la unidad de proceso fueron menores que 1.415 seg., se aprecia que casi tres cuartas partes fueron menores que 2.115 seg. y aproximadamente un cuarto de las CPU tardan m´as de 2.815 seg. (d) El intervalo intercuartil es el siguiente (Q1 , Q3 ) Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

12

Cap´ıtulo 1. An´ alisis Descriptivo este rango indica que en ´el se ubica el 50 % central de los datos, donde Q1 = P25 y Q3 = P75 . De la tabla de frecuencias tenemos que Q1 ∈ Clase 2 y Q3 ∈ Clase 4. Luego los percentiles son P25 = 0,715 + 0,7 ·

6,25−5 14−5

P75 = 2,115 + 0,7 ·

18,75−18 21−18



= 0,812 

= 2,290

Se tiene que el 50 % de los 25 trabajos estuvieron en control de la CPU entre 0.812 y 2.290 seg. EJERCICIO 5 El n´ umero de divorcio en una ciudad, de acuerdo con al duraci´on de casados, est´a representada por la siguiente tabla. A˜ nos de casados No de divorcio [0-6) 2800 1400 [6-12) 600 [12-18) [18-24) 150 50 [24-30] (a) ¿Cu´al es la duraci´on media de los casamientos? (b) Encuentre la desviaci´on est´andar de la duraci´on de los casamientos. (c) Construya un histograma. (d) Encuentre el intervalo intercuantil.

´ SOLUCION

(a) La duraci´on media de los casamientos es Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

13

6 1 X x= fi · yi N i=1

=

1 (2800 · 3 + 1400 · 9 + 600 · 15 + 150 · 21 + 50 · 27) 5000

=

34500 5000

= 6,9 Los matrimonios duran en promedio 6.9 a˜ nos. (b) La desviaci´on est´andar de la duraci´on de los casamientos es: S2 =

138150 = 27,64 ⇒ S = 5,3 a˜ nos 4999

(c) Histograma de No de divorcio vs Clase de A˜ nos de casados.

Figura 1.5: Histograma La mayor´ıa de los matrimonios se separan en los primeros 6 a˜ nos. S´olo el 10 % de los matrimonios dura entre los 24 y 30 a˜ nos. (d) El intervalo intercuantil es I = (P25 ; P75 ) = (Q1 ; Q3 ) tenemos que n 5000 = = 1250 < N1 ⇒ la clase del percentil 25 es 0 − 6 4 4 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

14

Cap´ıtulo 1. An´ alisis Descriptivo luego  Q1 = P25 = 0 + 6 ·

 1250 − 0 = 2,7 2800

3n 3 · 5000 = = 1250 < N2 ⇒ la clase del percentil 75 es 6 − 12 4 4 luego  Q3 = P75 = 6 + 6 ·

 3750 − 2800 = 10,1 1400

As´ı tenemos I = (2,7; 10,1) El 50 % central de los matrimonios dura entre los 2.7 a˜ nos y 10.1 a˜ nos. EJERCICIO 6 La siguiente informaci´on corresponde al ingreso neto (X) como porcentaje de sus activos, para las 20 compa˜ n´ıas exitosas: 17 23 22 18 8 7 12 2 49 14 14 36 16 7 3 8 10 11 20 21 De los ingresos netos como porcentajes de las ventas (Y), informados por 250 Compa˜ n´ıas regularmente exitosas se sabe que: 250 X i=1

yi = 2125

250 X

yi2 = 18625

i=1

(a) Compare el coeficiente de variaci´on del ingreso neto como porcentaje de la activos, con la del ingreso neto como porcentaje de las ventas, para las Compa˜ n´ıas exitosas y las regularmente exitosas, respectivamente. ¿Cu´al ingreso neto es m´as homog´eneo? (b) Si en las Compa˜ n´ıas regularmente exitosas, se eliminan dos valores extremos 0.8 y 14.5, ¿cu´al es la desviaci´on est´andar del ingreso neto como porcentaje de las ventas, para las 248 Compa˜ n´ıas restantes? (Utilice 3 decimales) ´ SOLUCION (a) el Coeficiente de variaci´on (C.V) se calcula como: C.V =

S X

2 Se puede calcular considerando Sn−1 (varianza muestral) ´o Sn2 (varianza poblacional). En la siguiente tabla se entrega el resumen de ambos casos

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

15

X Y

2 X Sn−1 C.V Sn2 C.V 15.9 124.199 0.700 130.735 0.719 8.5 2.259 0.176 2.250 0.176

Como C.V (Y ) < C.V (X), se puede concluir que el ingreso neto como porcentaje de las ventas es m´as homog´eneo que el ingreso neto como porcentaje de la activos. (b) Si consideramos varianza poblacional tenemos que dado lo siguiente: 248 X

yi = 2125 − 0,8 − 14,5

= 2109,7

⇒ Y = 8,506

i=1 248 X

yi2 = 18625 − 0,82 − 14,52 = 18414,11 ⇒ Y 2 = 74,250

i=1

la desviaci´on est´andar es q Sn =

2

Y2−Y =

p

74,250 − 8,5062 = 1,377

EJERCICIO 7 Actualmente existe un reglamento con respecto de la obligaci´on de las construcciones por cumplir normas m´ınimas de seguridad, entre ellas se encuentra la resistencia al fuego de los elementos de una construcci´on. Un sistema de protecci´on consiste en utilizar una pintura que permite aislar el elemento, llamada pintura “´ıntumescente”. Antes de la construcci´on de un edificio se realizaron ensayos en pilares de acero que fueron expuestos al fuego por sus 4 caras, los cuales fueron pintados con diferentes espesores de esta pintura, en micrones y se midi´o su resistencia al fuego, en minutos, hasta que se comenzaba a deteriorar. La informaci´on se presenta a continuaci´on. ESPESOR DE LA PINTURA (micrones) [0 − 335) [335 − 670) [670 − 1005) [1005 − 1340) [1340 − 1675]

RESISTENCIA AL FUEGO (minutos) Menos de 22 22 - 52 52 - 82 82 y m´as 10 6 1 0 5 8 2 0 1 3 3 1 0 1 7 10 0 0 10 15

(a) Seg´ un el tiempo de exposici´on al fuego antes de ser da˜ nado el pilar, la resistencia al fuego se clasifica como clases F30, si este tuvo una duraci´on entre 30 y 59 minutos. ¿Qu´e porcentaje de los pilares no se clasificar´ıan como clase F30? Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

16

Cap´ıtulo 1. An´ alisis Descriptivo (b) ¿Cu´al distribuci´on es m´as homog´enea en relaci´on al espesor de la pintura “´ıntumescente”, la de los pilares que mostraron una resistencia al fuego de menos de 52 minutos o la de los pilares con resistencia igual o superior a 52 minutos? (c) Si consideramos solo los pilares que fueron pintados con un espesor entre 670 y 1005 micrones. Grafique la distribuci´on de estos pilares seg´ un sea su resistencia al fuego.

´ SOLUCION (a) Considerando solo la resistencia al fuego tenemos las siguiente tabla de frecuencias y con la cual podremos obtener el porcentaje de de pilares que no se clasifican como F30. Resistencia < 22 [22 − 52) [52 − 82) ≥ 82

f 16 18 23 26

F 16 34 57 83

Fr 0.19 0.41 0.69 1.00

Se calcula el percentil a que corresponde 30 y 59 en resistencia al fuego. Pα = 30 = 22 + 30 ×

Pβ = 59 = 52 + 30 ×

α×83 100

 − 16 ⇒ α = 25,06 18

α×83 100

 − 34 ⇒ β = 47,43 23

luego β − α = 22,37 %, es decir, el 22.37 % de los pilares se clasifica como F30, por ende el 73.63 % no corresponde a esa categor´ıa. (b) La idea es calcular los coeficientes de variaci´on, para los dos grupos de resistencia, para ello reconstruimos la tabla de frecuencias como sigue: Espesor [000 − 335) [335 − 670) [670 − 1005) [1005 − 1340) [1340 − 1675)

R < 52 R ≥ 52 mi 16 1 167.5 13 2 502.5 4 4 837.5 1 17 1172.5 0 25 1507.5

luego los coeficienes de variaci´on son los siguientes: C.V (Espesor|R < 52) =

263,6446 ≈ 0,6526 403,970

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.1 Ejercicios Resueltos

17

C.V (Espesor|R ≥ 52) =

310,1497 ≈ 0,2446 1268,2142

∴ la distribuci´on es m´as homog´enea en relaci´on al espesor de la pintura en la correspondiente a los pilares con resistencia igual o superior a 52 minutos. (c) Considerando solo el grupo de Espesor entre 670 y 1005 la tabla de frecuencias obtenida es la siguiente: Resistencia < 22 [22 − 52) [52 − 82) ≥ 82

frecuencia 1 3 3 1

Gr´aficamente la distribuci´on es la siguiente:

Figura 1.6: Histograma

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

18

Cap´ıtulo 1. An´ alisis Descriptivo

1.2.

Ejercicios Propuestos

1. La resistencia del concreto depende del procedimiento que se utilice para curarlo. Dos m´etodos distintos de curado mostraron los siguientes resultados en ensayos independientes. Se considera que el concreto queda con resistencia ´optima, cuando es superior a 3220 libras/pulgadas2 . Resistencia M´etodo 1 M´etodo 2 [2500-2740) 3 2 [2740-2980) 4 3 [2980-3220) 5 7 [3220-3460) 5 5 6 4 [3460-3820] a) ¿Qu´e porcentaje de los ensayos con el m´etodo 1 de curado, resultan con concreto de resistencia ´optima? b) ¿Qu´e porcentaje de los ensayos con el m´etodo 2 de curado, resultan con concreto de resistencia ´optima? c) Construya un gr´afico adecuado que muestre la distribuci´on de los ensayos con el m´etodo 1 seg´ un resistencia de concreto y ubique en dicho gr´afico el valor num´erico de su resistencia media. d ) Construya un gr´afico adecuado que muestre la distribuci´on de los ensayos con el m´etodo 2 seg´ un resistencia de concreto y ubique en dicho gr´afico el valor num´erico de su resistencia media. 2. Denote por X n y Sn2 la media y la varianza para la muestra X1 , . . . , Xn , y denote por 2 X n+1 y Sn+1 estas cantidades cuando una observaci´on adicional Xn+1 se a˜ nade a la muestra. a) Demuestre c´omo X n+1 se puede calcular de X n y Xn+1 . b) Muestre que 2 = (n − 1)Sn2 + nSn+1

n (Xn+1 − X n )2 n+1

2 de modo que Sn+1 se puede calcular de Xn+1 , X n y Sn2 .

c) Suponga que una muestra de 15 hebras de hilo de pa˜ no dio como resultado una media muestral de elongaci´on de 12.58 mm y una desviaci´on est´andar muestral de 0.512 mm. Una d´ecima sexta hebra da un valor de elongaci´on de 11.8. ¿¿Cu´ales son los valores de la media muestral y de la desviaci´on est´andar muestral para las 16 observaciones de elongaci´on? Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.2 Ejercicios Propuestos

19

3. Las longitudes de las rutas de transporte en determinada l´ınea suelen variar entre s´ı. En el art´ıculo ”Planning of City Bus Routes”(J. of the Institution of Engineers, 1995, pp. 211-215) aparece la siguiente informaci´on sobre las longitudes (en km) de determinada l´ınea: Longitud Frecuencia [6 − 8) 6 [8 − 10) 23 [10 − 12) 30 [12 − 14) 35 [14 − 16) 32 [16 − 18) 48 [18 − 20) 42 [20 − 22) 40 [22 − 24) 28 [24 − 26) 27 [26 − 28) 26 [28 − 30) 14 [30 − 35) 27 [35 − 40) 11 [40 − 45] 2 a) Trace el histograma para estas frecuencias. b) ¿Qu´e proporci´on de las rutas tienen una longitud menor que 20? ¿Qu´e proporci´on de estas rutas tienen longitudes de cuando menos 30? c) M´as o menos, ¿cu´al es el valor del 90◦ percentil de la distribuci´on de longitudes de ruta? d ) M´as o menos, ¿cu´al es la mediana de la longitud de las rutas? 4. El art´ıculo C ¸ an We really Walk Straight”(Amer. J. of Physical Anthropology, 1992 pp. 19-27) report´o un experimento en el que se pidi´o, a cada uno de 20 hombres sanos, que caminaran en l´ınea recta tan derecho como fuera posible hacia un blanco situado a 60 m a velocidad normal. Considere las siguientes observaciones sobre cadencia (n´ umeros de pasos por segundo): 0.95 0.85 0.92 0.95 0.93 0.86 1.00 0.92 0.85 0.81 0.78 0.93 0.93 1.05 0.93 1.06 1.06 0.96 0.81 0.96 Utilice los m´etodos desarrollados en el cap´ıtulo 1 para resumir la informaci´on; incluya una interpretaci´on o discusi´on, siempre que sea apropiado. (Nota: el autor del art´ıculo utiliz´o una an´alisis estad´ıstico de gran complejidad para analizar estos datos). 5. Para cada una de las siguientes afirmaciones indique si ella es verdadera ( V ) o falsa ( F ). Justifique Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

20

Cap´ıtulo 1. An´ alisis Descriptivo a) M e = (Q1 + Q3 )/2 , siendo Me = Mediana, Qi = i - ´esimo cuartil ( i = 1, 3 ) b) Si el valor m´aximo entre ( X1 , X2 , . . . , Xk ) = 18 , entonces , Moda = 18. c) Si una variable es de nivel de medici´on nominal , entonces la medida de tendencia central m´as adecuada es la mediana. 6. Responda brevemente : a) D´e dos definiciones de tipos de muestreo b) Diga cuando una variable es del tipo discreta y cuando es del tipo continua c) Diga que se entiende por : ”No depende de la unidad de medida se˜ nale por lo menos dos medidas que cumplan y dos medidas que no cumplan con lo antes se˜ nalado. 2

d ) Describa en que consiste el percentil p ( Pp ) e) ¿¿ Qu´e porcentaje de la muestra est´a contenido en el Rango-Intercuartil ? 7. La exposici´on aguda al cadmio produce dolores respiratorios, da˜ nos en los ri˜ nones, h´ıgado y puede ocasionar la muerte. Por esta raz´on se controla el nivel de polvo de cadmio y de humo de ´oxido de cadmio en el aire. Este nivel se mide en miligramos de cadmio por metro c´ ubico de aire. Una muestra de treinta y cinco lecturas arroja estos datos : (Basado en un informe de Environmental Management , Septiembre de 1981, p´ag. 414) 0.044 0.049 0.050 0.070 0.054

0.030 0.030 0.056 0.061 0.042

0.052 0.040 0.061 0.061 0.051

0.044 0.045 0.042 0.058

0.046 0.039 0.055 0.053

0.020 0.039 0.037 0.060

0.066 0.039 0.062 0.047

0.052 0.057 0.062 0.051

a) Construya una tabla de Frecuencias utilizando la f´ormula de Sturges para el n´ umero de intervalos. Sturges: N.I : 1 + [ 3,3 log10 n] , donde [x] := Es la parte entera de x. Amplitud : A = ( Xmax − Xmin ) / N.I. b) Construya el histograma utilizando las frecuencias absolutas. ¿¿ Parece razonable pensar que el nivel de cadmio del aire posee una distribuci´on en forma de campana ? c) Calcular las medidas de tendencia central utilizando los datos originales y utilizando la tabla construida en el apartado ( b ). d ) Compare sus resultados en relaci´on a la simetr´ıa de los datos, los puntos ( c ) y ( d ). 8. La Av´ıcola ”El Super Pollo”preocupada por los recientes reclamos de clientes con respecto al peso de los pollos, decidi´o estudiar la distribuci´on de los pesos de 1000 pollos, con los siguientes resultados: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.2 Ejercicios Propuestos

21 Peso (gramos) Frecuencia [960 − 980) 60 160 [980 − 1000) [1000 − 1020) 280 260 [1020 − 1040) [1040 − 1060) 160 80 [1060 − 1080] Total 1000

a) ¿Cu´al es el peso medio? b) Construya el histograma. c) Construya la ojiva y la poligonal de frecuencias d ) Interesa dividir los pollos en cuatro categor´ıas, con respecto al peso, de modo que: i) ii) iii) iv)

El El El El

20 % 30 % 30 % 20 %

de de de de

los los los los

pollos pollos pollos pollos

m´as livianos sean clasificados en categor´ıa D que siguen en peso sean clasificados en categor´ıa C que siguen en peso sean clasificados en categor´ıa B restantes sean clasificados en categor´ıa A.

¿Cu´ales son los l´ımites de peso en cada categor´ıa? 9. ¿Qu´e ocurre con la mediana, media y desviaci´on est´andar de una serie de datos, cuando: a) cada observaci´on es multiplicada por 2 b) se le suma 10 a cada observaci´on c) se le resta la media a cada observaci´on d ) a cada observaci´on se le resta la media y se divide por la desviaci´on est´andar. 10. La distribuci´on de los 20.000 empleados de la empresa alfa, seg´ un antig¨ uedad (X) y sueldo mensual (Y) se muestra en la siguiente tabla de proporciones (frecuencias relativas) conjuntas: X (en a˜ nos) Menos de 4 a˜ nos 4 a 8 a˜ nos M´as de 8 a˜ nos

[50 − 90) 0,12 0,08 0,00

Y (en miles de $) [90 − 130) [130 − 170) 0,08 0,04 0,12 0,10 0,12 0,18

[170 − 250] 0,00 0,05 0,11

(a) Clasifique las variables del problema seg´ un si son cualitativas o cuantitativas y diga si son nominal u ordinal y continua discreta. (b) Grafique la distribuci´on de los empleados seg´ un sueldo mensual. (c) ¿En qu´e grupo son m´as homog´eneos los sueldos de la empresa, en el de los empleados m´as nuevos ´o en el de los m´as antiguos? Justifique su respuesta. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

22

Cap´ıtulo 1. An´ alisis Descriptivo (d) Si para las fiestas patrias la empresa otorg´o un aguinaldo de $25.000 a los empleados cuyo sueldo era inferior a los $120.000, mientras que para aquellos cuyo sueldo era superior a esa cifra el aguinaldo fue de $15.500, ¿cu´antos de los empleados que tienen m´as de 8 a˜ nos de antig¨ uedad en la empresa recibieron un aguinaldo de $15.500? 11. Una empresa que se dedica a la fabricaci´on de mallas de acero para hormig´on armado, ha tomado una muestra de las mallas que compr´o una constructora en un mes determinado, registrando por cada unidad el peso de la malla (en Kg) X, el tipo de malla Y (con borde ”C” y sin bordo ”S”) y el di´ametro de las barras (en mm) Z. Los resultados obtenidos fueron los siguientes:

Z Y Menos de 5 C S [5 − 7] C S M´as de 7 C S

(15-28] (28-41] 10 6 8 4 2 8 2 6 0 4 0 2

X (41-54] 4 2 3 5 4 5

(54-67] M´as de 67 2 0 0 0 11 4 11 0 20 7 15 5

(a) Clasifique las variables seg´ un escala de medici´on y tama˜ no de recorrido. (b) Encuentre la medida de posici´on m´as adecuada para el peso de la malla. (c) ¿Qu´e porcentaje de las mallas con bordes tienen un di´ametro de barras superiores a 5.5 mm? (d) ¿Cu´al es la variabilidad del peso de las mallas sin bordes que tienen di´ametros de barras menores de 5.0 mm? 12. Los siguientes datos corresponden a las cantidades m´aximas de emisi´on diaria de oxido de azufre (en toneladas) registrada seg´ un planta de emisi´on, en cierta zona industrial. Cantidad de ´oxido (ton) [05 − 10) [10 − 15) [15 − 20) [20 − 25) [25 − 30]

Planta A 50 30 60 20 40

Planta B 40 30 0 10 20

Planta C 20 40 70 15 5

(a) Indique la unidad de informaci´on y clasifique las variables seg´ un escala de medici´on y tama˜ no de recorrido (b) Entre las plantas B y C, ¿cu´al presenta mayor variabilidad relativa su promedio de ´oxido de azufre emitido? (c) ¿Qu´e porcentaje de las emisiones producidas por la planta C, supera las 28 toneladas? Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.2 Ejercicios Propuestos

23

13. En una empresa constructora se ha registrado informaci´on respecto: ingreso mensual (Y), especialidad (X) y permanencia (Z) en la empresa (en que A = antiguo, N = reci´en ingresado), de sus trabajadores, obteniendo lo siguiente:

Especialidad Alba˜ nil A N Carpintero A N Electricista A N Pintor A N

Ingreso mensual, en miles de pesos [100 − 150) [150 − 200) [200 − 300] M´as 6 9 5 9 11 1 1 6 7 1 2 3 3 5 8 1 5 4 2 20 2 1 10 5

de 300 0 0 9 3 1 0 0 0

(a) Clasifique las variables involucradas seg´ un nivel de medici´on. Calcule la medida de posici´on m´as adecuada en cada caso. Indique unidad de informaci´on. (b) Construya un gr´afico que permita mostrar la distribuci´on de los trabajadores seg´ un especialidad. (c) Construya un gr´afico que permita compara los ingresos de los pintores seg´ un permanencia en la empresa. (d) Si entre carpinteros y electricistas tienen un sueldo promedio de $225.000 ¿Cu´al es el sueldo promedio de los trabajadores de la empresa? (e) Si la empresa decide mejorar los sueldos de los trabajadores con ingresos inferiores a $180.000 ¿Qu´e % de los trabajadores se beneficiar´a con esta medida? (f) Si a los alba˜ niles se les otorga una bonificaci´on de $20.000. Compare la dispersi´on de los ingresos de los alba˜ niles despu´es de la bonificaci´on con la de los ingresos de los pintores. 14. Una empresa constructora de parques y plazas, ha ganado una propuesta para construir ´areas verdes en plazas de una determinada regi´on. Las superficies sembradas, en metros cuadrados, en 80 plazas y la mezcla de semilla de pasto utilizadas, se resumen en la siguiente tabla:

Superficie Sembrada Mezcla [200 − 1180) [1180 − 3140) [3140 − 5100) [5100 − 6080] Manquehue 7 4 6 2 Estadios 3 6 8 4 Ray-grass 0 7 9 5 Lon grass trevol 2 5 4 1 Total 12 22 27 12 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

M´as de 6080 0 3 4 0 7

24

Cap´ıtulo 1. An´ alisis Descriptivo (a) Clasifique las variables involucradas seg´ un nivel de medici´on y tama˜ no de recorrido. (b) Calcule las medidas marginales de posici´on m´as adecuadas para cada variable e indique las correspondientes medidas de dispersi´on. (c) Construya un gr´afico que muestre la distribuci´on de las plazas sembradas seg´ un mezcla de semilla utilizada. (d) Compare la dispersi´on de las superficies sembradas con mezcla de manquehue con la dispersi´on de las superficies sembradas con mezcla Long grass tr´ebol. (e) Si un kilo de mezcla manquehue sirve para plantar una superficie de 13 metros cuadrados. ¿Qu´e porcentaje de las superficies plantadas en que se utiliz´o esta mezcla, ocupar´a m´as de 284 kilos? 15. El n´ umero de llamadas telef´onicas de larga distancia nacional registrada por una empresa distribuidora durante una hora de un d´ıa determinado, se realizara en horarios normales y se consideraron llamadas de a lo m´as 3 minutos de duraci´on.

Carrier 188

171

123

Valor de la llamada (U.M) Regi´on [5-6] (6-8] (8-10] (10-20] II 3 8 10 4 IV 7 9 10 4 X 3 7 5 5 II 4 3 9 6 IV 5 5 8 3 X 2 4 7 7 II 3 4 7 8 IV 7 4 4 5 X 6 7 4 3 Total 40 51 64 45

Total 25 30 20 22 21 20 22 20 20 200

(a) Clasifique las variables involucradas seg´ un nivel de medici´on y tama˜ no de recorrido e indique la medida marginal de tendencia central m´as adecuadas para el valor de la llamada y para el carrier en la IV regi´on. (b) ¿Qu´e porcentaje son tales que superan al valor promedio de las llamadas realizadas a trav´es del carrier 171? (c) Al mes siguiente de haber efectuado este estudio, el valor de la llamada de larga distancia del carrier 123, aument´o en un 2 % m´as de U.M por cada 3 minutos de duraci´on. ¿En que porcentaje disminuye (aumenta) la variabilidad del valor de la llamada al mes siguientes? 16. Una empresa constructora con varias obras en el pa´ıs desea efectuar un estudio sobre las ca˜ ner´ıas hidr´aulicas, de una pulgada, adquiridas por la empresa. Para ello, se seleccion´o una muestra de las compras efectuadas durante un mes, anotando el precio de la tira de ca˜ ner´ıas, la cantidad de tiras, y el tipo de material de fabricaci´on. La informaci´on obtenida se presenta en la siguiente tabla: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1.2 Ejercicios Propuestos Material P.V.C Fierro Cobre P.V.C Fierro Cobre P.V.C Fierro Cobre

Cantidad de tiras 2300-3000 0,08 0-10 0,02 0,00 0,10 10-20 0,02 0,00 0,07 20 y m´as 0,01 0,00 Total 0,30

25 Precios (pesos) 3000-4500 4500-6000 6000 y m´as Total 0,04 0,01 0,00 0,13 0,07 0,02 0,00 0,11 0,00 0,09 0,04 0,13 0,02 0,00 0,00 0,12 0,08 0,01 0,00 0,11 0,02 0,06 0,12 0,20 0,01 0,00 0,00 0,08 0,03 0,01 0,00 0,05 0,00 0,03 0,04 0,07 0,27 0,23 0,20 1,00

(a) Clasifique las variables involucradas seg´ un nivel de medici´on y tama˜ no de recorrido. Indique las medidas marginales de posici´on y dispersi´on m´as adecuadas. (b) ¿qu´e porcentaje de las compras, en las que se requieren menos de 20 tiras de ca˜ ner´ıa, tienen un precio entre 3.000 y 6.000 pesos? (c) Construya un gr´afico que muestre la distribuci´on de frecuencias de las compras de ca˜ ner´ıas de P.V.C, seg´ un precio.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

26

Cap´ıtulo 1. An´ alisis Descriptivo

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

Cap´ıtulo 2 Probabilidad 2.1.

Ejercicios Resueltos

EJERCICIO 1 Las tres opciones preferidas en cierto tipo de departamento nuevo, son con resistencia antis´ısmica (A), calefacci´on central (B) y con excelentes terminaciones (C). Si 70 % de los compradores piden A, 80 % B, 75 % C, 85 % A o B, 90 % A o C, 95 % B o C y 98 % A, B o C, calcule las probabilidades de los siguientes eventos: (a) El siguiente comprador selecciona, por lo menos, una de las tres opciones. (b) El siguiente comprador est´a interesado en otras opciones. (c) El siguiente comprador s´olo selecciona que tenga resistencia antis´ısmica y ninguna de las otras dos opciones. (d) El siguiente comprador selecciona exactamente una de las tres opciones. ´ SOLUCION Reescribamos la informaci´on que nos entregan: P (A) = 0,7 P (B) = 0,8 P (C) = 0,75 P (A ∪ B) = 0,85 P (A ∪ C) = 0,9

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

28

Cap´ıtulo 2. Probabilidad P (B ∪ C) = 0,95 P (A ∪ B ∪ C) = 0,98 Luego: (a) P (A ∪ B ∪ C) = 0,98 (b) 1 − P (A ∪ B ∪ C) = 0,02 (c) P (A ∪ B ∪ C) − P (B ∪ C) = 0,98 − 0,95 = 0,03 (d) P (A ∪ B ∪ C) − P (B ∪ C) + P (A ∪ B ∪ C) − P (A ∪ C) + P (A ∪ B ∪ C) − P (A ∪ B) = 3P (A ∪ B ∪ C) − P (B ∪ C) − P (A ∪ C) − P (A ∪ B) = 3 · 0,98 − 0,95 − 0,9 − 0,85 = 0,24 EJERCICIO 2 Se toman muestras de una pieza fundida de aluminio y se clasifican de acuerdo con el acabado de la superficie (en micropulgadas) y con las mediciones de longitud. A continuaci´on se resumen los resultados obtenidos con 100 muestras.

Acabado de la Superficie

Excelente Bueno

Longitud Excelente Bueno 75 7 10 8

Sean A: el evento donde la muestra tiene un acabado excelente, y B: el evento donde la muestra tiene una longitud excelente. Determine el n´ umero de muestras en Ac ∩ B, B c , y A ∪ B. Dibuje un diagrama de Venn que represente estos datos. Determine las siguientes probabilidades. (a) P (A) (b) P (B) (c) P (Ac ) (d) P (A ∩ B) (e) P (A ∪ B) (f) P (Ac ∪ B) ´ SOLUCION: Sean los eventos A: Acabado Excelente y B: Longitud Excelente, y respectivamente Ac : Acabado bueno y B c : Longitud Buena, entonces: Ac ∩ B = 10;

B c = 15;

A ∪ B = 75 + 7 + 10

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

29

Figura 2.1: Diagrama de Venn (a) P (A) = P (A ∩ B) + P (A ∩ B c ) =

75+7 100

(b) P (B) = P (B ∩ A) + P (B ∩ Ac ) =

75+10 100

(c) P (Ac ) = P (Ac ∩ B) + P (Ac ∩ B c ) = (d) P (A ∩ B) =

=

82 100

=

10+8 100

85 100

=

18 100

75 100

(e) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) =

92 100

(f) P (Ac ∪ B) = P (Ac ) + P (B) − P (Ac ∩ B) =

93 100

EJERCICIO 3 A continuaci´on se ofrece un resumen de varias ´ordenes de compra de dispositivos de alumbrado, de acuerdo con las caracter´ısticas opcionales solicitadas para ´estos. Proporci´ on de o ´rdenes de compra Sin caracter´ısticas opcionales 0.3 Una caracter´ıstica opcional 0.5 M´as de una caracter´ıstica opcional 0.2 (a) ¿Cu´al es la probabilidad de que en una orden se solicite al menos una caracter´ıstica opcional? (b) ¿Cu´al es la probabilidad de que en una orden no se pida m´as de una caracter´ıstica opcional? ´ SOLUCION: Sean los eventos: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

30

Cap´ıtulo 2. Probabilidad S: Sin caracter´ısticas opcionales. U: Una caracter´ısticas opcional. M: M´as de una caracter´ısticas opcional. Entonces (a) P (al menos una caracter´ıstica) = P (U ) + P (M ) = 0,5 + 0,2 = 0,7 (b) P (no m´as de una caracter´ıstica) = P (S) + P (U ) = 0,3 + 0,5 = 0,8 EJERCICIO 4 La tabla siguiente presenta un resumen del an´alisis realizado a las flechas de un compresor para determinar el grado con que ´estas satisfacen ciertos requerimientos.

el acabado superficial cumple con los requerimientos

la curva cumple con los requerimientos s´ı no s´ı 345 5 no 12 8

(a) Si se toma una flecha al azar, ¿cu´al es la probabilidad de que cumpla con los requerimientos de acabado superficial? (b) ¿Cu´al es la probabilidad de que la flecha seleccionada cumpla con los requisitos de acabado o con los de curvatura? (c) ¿Cu´al es la probabilidad de que la flecha seleccionada cumpla con los requisitos de acabado o que no cumpla con los de curvatura? (d) ¿Cu´al es la probabilidad de que la flecha seleccionada cumpla con los requisitos de acabado y curvatura? ´ SOLUCION: Sean los eventos A: Cumple con acabado superficial, Ac : No cumple con acabado superficial, C: Cumple con curvatura, C c : No cumple con curvatura. (a) P (A) = P (A ∩ C) + P (A ∩ C c ) =

345+5 370

=

(b) P (A ∪ C) = P (A) + P (C) − P (A ∩ C) =

350 370 350+357−345 370

=

362 370

350+13−5 370

=

358 370

350+357−362 370

=

345 370

(c) P (A ∪ C c ) = P (A) + P (C c ) − P (A ∩ C c ) = (d) P (A ∩ C) = P (A) + P (C) − P (A ∪ C) =

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

31

EJERCICIO 5 Continuaci´on del ejercicio anterior. Las flechas se clasifican, adem´as, en t´erminos de la m´aquina herramienta utilizada en su fabricaci´on. M´aquina Herramienta 1

el acabado superficial cumple con los requerimientos

la curva cumple con los requerimientos s´ı no s´ı 200 1 no 4 2

M´aquina Herramienta 2

el acabado superficial cumple con los requerimientos

la curva cumple con los requerimientos s´ı no s´ı 145 4 no 8 6

(a) Si se elige una flecha al azar, ¿cu´al es la probabilidad de que cumpla con los requerimientos de acabado o con los de curvatura, o que provenga de la m´aquina herramienta 1? (b) Si se escoge una flecha al azar, ¿cu´al es la probabilidad de que cumpla con los requerimientos de acabado o que cumpla con los de curvatura o que provenga de la m´aquina herramienta 2? (c) Si se elige una flecha al azar, ¿cu´al es la probabilidad de que cumpla con los requisitos de acabado y curvatura o que provenga de la m´aquina herramienta 2? (d) Si se toma una flecha al azar, ¿cu´al es la probabilidad de que cumpla con los requisitos de acabado o que provenga de la m´aquina herramienta 2? ´ SOLUCION: Agregaremos a los eventos definidos en el ejercicio anterior, M1: m´aquina 1 y M2: m´aquina 2. (a) P (A ∪ C ∪ M 1) = P (A) + P (C) + P (M 1) − P (A ∩ C) − P (A ∩ M 1) − P (C ∩ M 1) + P (A ∩ C ∩ M 1) =

350+357+207−345−201−204+200 370

=

364 370

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

32

Cap´ıtulo 2. Probabilidad (b) P (A ∪ C ∪ M 2) = P (A) + P (C) + P (M 2) − P (A ∩ C) − P (A ∩ M 2) − P (C ∩ M 2) + P (A ∩ C ∩ M 2) =

350+357+163−345−149−153+145 370

=

368 370

(c) P ((A ∩ C) ∪ M 2) = P (A ∩ C) + P (M 2) − P (A ∩ C ∩ M 2) = (d) P (A ∪ M 2) = P (A) + P (M 2) − P (A ∩ M 2) =

350+163−149 370

=

345+163−145 370

=

363 370

364 370

EJERCICIO 6 En cierta gasolinera, 40 % de los clientes utilizan gasolina regular sin plomo (A1 ), 35 % gasolina extra sin plomo (A2 ) y 25 % gasolina premium sin plomo (A3 ). De los clientes que consumen gasolina regular, solo 30 % llenan sus tanques (evento B). De los que consumen gasolina extra, 60 % llenan sus tanques, mientras que, de los que usan premium, 50 % llenan sus tanques. (a) ¿Cu´al es la probabilidad de que el siguiente cliente pida gasolina extra sin plomo y llene su tanque?. (b) ¿Cu´al es la probabilidad de que el siguiente cliente llene el tanque?. (c) Si el siguiente cliente llena el tanque, ¿Cu´al es la probabilidad de que pida gasolina regular?, ¿extra? y ¿premium?. ´ SOLUCION Sean los siguientes eventos: A1 : Gasolina regular sin plomo A2 : Gasolina extra sin plomo A3 : Gasolina Premium sin plomo B: Llena el tanque Reescribiendo la informaci´on entregada obtenemos: P (A1 ) = 0,4 P (A2 ) = 0,35 P (A3 ) = 0,25

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

33

P (B|A1 ) = 0,3 P (B|A2 ) = 0,6 P (B|A3 ) = 0,5

(a) P (A2 ∩ B) = P (B|A2 )P (A2 ) = 0,6 · 0,35 = 0,21 (b) P (B) = P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 ) = 0,3 · 0,4 + 0,6 · 0,35 + 0,5 · 0,25 = 0,455 (c) P (A1 |B) =

P (A1 ∩B) P (B)

=

P (B|A1 )P (A1 ) P (B)

=

0,3·0,4 0,455

P (A2 |B) =

P (A2 ∩B) P (B)

=

P (B|A2 )P (A2 ) P (B)

=

0,6·0,35 0,455

= 0,4615

P (A3 |B) =

P (A3 ∩B) P (B)

=

P (B|A3 )P (A3 ) P (B)

=

0,5·0,25 0,455

= 0,2747

= 0,2637

EJERCICIO 7 En relaci´on al ejercicio anterior, considere la siguiente informaci´on adicional sobre el uso de las tarjetas de cr´edito: 70 % de los clientes que consumen gasolina regular y llenan su tanque usan una tarjeta de cr´edito. 50 % de todos los clientes que consumen gasolina regular y no llenan su tanque usan tarjeta de cr´edito. 60 % de todos los clientes que consumen gasolina extra y llenan su tanque usan tarjeta de cr´edito. 50 % de todos los clientes que consumen gasolina extra y no llenan su tanque usan tarjeta de cr´edito. 50 % de todos los clientes que consumen gasolina premium y llenan su tanque usan tarjeta de cr´edito. 40 % de todos los clientes que consumen gasolina premium y no llenan su tanque usan tarjeta de cr´edito. Calcule la probabilidad de cada uno de los siguientes eventos para el siguiente cliente que llegue: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

34

Cap´ıtulo 2. Probabilidad (a) {extra,llena el tanque y usa tarjeta de cr´edito}. (b) {premium, no llena el tanque y usa tarjeta de cr´edito}. (c) {premium y usa tarjeta de cr´edito} (d) {usa tarjeta de cr´edito}, (un diagrama de ´arbol puede ser u ´til). ´ SOLUCION: A los eventos definidos en el ejercicio anterior, agregaremos C: Usa tarjeta de cr´edito. Reescribiendo nuevamente la informaci´on entregada en esta parte, obtenemos: P (C|A1 ∩ B) = 0,7 P (C|A1 ∩ B c ) = 0,5 P (C|A2 ∩ B) = 0,6 P (C|A2 ∩ B c ) = 0,5 P (C|A3 ∩ B) = 0,5 P (C|A3 ∩ B c ) = 0,4 (a) P (A2 ∩ B ∩ C) =P (C|A2 ∩ B) · P (A2 ∩ B) =P (C|A2 ∩ B)P (B|A2 )P (A2 ) =0,6 · 0,6 · 0,35 = 0,126

(b) P (A3 ∩ B c ∩ C) =P (C|A3 ∩ B c )P (A3 ∩ B c ) =P (C|A3 ∩ B c )P (B c |A3 )P (A3 ) =0,4 · 0,5 · 0,25 = 0,05

(c) P (A3 ∩ C) =P (A3 ∩ C ∩ B) + P (A3 ∩ C ∩ B c ) =P (C|A3 ∩ B)P (A3 ∩ B) + P (C|A3 ∩ B c )P (A3 ∩ B c ) =P (C|A3 ∩ B)P (B|A3 )P (A3 ) + P (C|A3 ∩ B c )P (B c |A3 )P (A3 ) =0,5 · 0,5 · 0,25 + 0,4 · 0,5 · 0,25 = 0,1125

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

35

(d) P (C) = P (A1 ∩ B ∩ C) + P (A1 ∩ B c ∩ C) + P (A2 ∩ B ∩ C) + P (A2 ∩ B c ∩ C) + P (A3 ∩ B ∩ C) + P (A3 ∩ B c ∩ C) = P (C|A1 ∩ B)P (A1 ∩ B) + P (C|A1 ∩ B c )P (A1 ∩ B c ) + P (C|A2 ∩ B)P (A2 ∩ B) + P (C|A2 ∩ B c )P (A2 ∩ B c ) + P (C|A3 ∩ B)P (A3 ∩ B) + P (C|A3 ∩ B c )P (A3 ∩ B c ) = P (C|A1 ∩B)P (B|A1 )P (A1 )+P (C|A1 ∩B c )P (B c |A1 )P (A1 )+P (C|A2 ∩B)P (B|A2 )P (A2 )+ P (C|A2 ∩B c )P (B c |A2 )P (A2 )+P (C|A3 ∩B)P (B|A3 )P (A3 )+P (C|A3 ∩B c )P (B c |A3 )P (A3 ) = 0,7 · 0,3 · 0,4 + 0,5 · 0,7 · 0,4 + 0,6 · 0,6 · 0,35 + 0,5 · 0,4 · 0,35 + 0,5 · 0,5 · 0,25 + 0,4 · 0,5 · 0,25 = 0,5325

Figura 2.2: Arbol EJERCICIO 8 En la empresa Coca-Cola el llenado de las botellas con bebida es realizado autom´aticamente por una m´aquina que funciona a distintas velocidades. La probabilidad de que el volumen de llenado sea incorrecto es de 0.001 cuando el proceso se realiza a baja velocidad. Cuando el proceso de llenado se realiza a alta velocidad, la probabilidad de llenado incorrecto es de 0.01. Suponga que el 25 % de las botellas son llenadas cuando el proceso se realiza a alta velocidad, mientras que el resto de botellas son llenadas a una baja velocidad. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

36

Cap´ıtulo 2. Probabilidad (a) ¿Cu´al es la probabilidad de encontrar una botella con un volumen incorrecto en su interior? (b) ¿Cu´al es la probabilidad de encontrar un botella llena con un volumen incorrecto y que haya sido llenado cuando el proceso se realiza a baja velocidad? (c) ¿Cu´al es la probabilidad de que el proceso de llenado de las botellas haya sido a baja velocidad, si se sabe que la botella est´a efectivamente con un volumen correcto? (d) Si se encuentra una botella llenada con un volumen incorrecto, ¿cu´al es la probabilidad de que haya sido llenado cuando el proceso se realiza a alta velocidad? ´ SOLUCION: Se definen los siguientes eventos: A: Llenado a alta velocidad. B: Llenado a baja velocidad. C: Volumen llenado correcto I: Volumen llenado incorrecto

Figura 2.3: Arbol

(a) P (I) = P (A ∩ I) + P (B ∩ I) = P (I|A)P (A) + P (I|B)P (B) = 0,25 · 0,01 + 0,75 · 0,001 = 0,00325 (b) P (I ∩ B) = P (I|B)P (B) = 0,00075 (c) P (B|C) = (d) P (A|I) =

P (B∩C) P (C) P (A∩I) P (I)

=

=

0,75×0,999 0,75×0,999+0,25×0,99

0,25×0,01 0,25×0,01+0,75×0,001

= 0,7516

= 0,7692

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

37

EJERCICIO 9 ´ ES ESTO!”. Un jugador A, comienza Un juego para dos jugadores se denomina ”¡QUE lanzando un dado numerado en cinco de sus caras: 1, 2, 3, 4 y 6; y en la sexta cara tiene escrita ´ ES ESTO!”. Las caras numeradas son las puntuaciones que va obteniendo la frase ”¡QUE ´ ES ESTO!”. Entonces, el turno cada vez. El jugador A sigue jugando hasta que saque ”¡QUE pasa al jugador B que lanza un segundo dado. Este dado indica en cuatro de sus caras que el turno de lanzar el dado numerado pasa al jugador B y otras dos caras que indican que el jugador A contin´ ua con el dado numerado. (a) ¿Cu´al es la probabilidad de que el jugador A saque un total de 4 ptos. en dos tiradas, ´ ES ESTO!”? sin que haya salido ”¡QUE (b) ¿Cu´al es la probabilidad de que, despu´es de lanzar el dado el jugador A, lance el jugador B y el jugador A pierda su turno? (c) ¿Cu´al es la probabilidad de que el jugador A le toque lanzar en la tercera tirada? ´ SOLUCION: Sea definen los siguientes eventos: Ak : resultado en el k-´esimo lanzamiento del dado numerado por el jugador A. Ak : Turno k-´esimo de jugar el dado numerado corresponde al jugador A; con k = 2, 3, . . .. B k : Turno k-´esimo de jugar el dado numerado corresponde al jugador B; con k = 2, 3, . . ..

´ Figura 2.4: Arbol (a) P ((A1 = 1 ∩ A2 = 3) ∪ (A1 = 2 ∩ A2 = 2) ∪ (A1 = 3 ∩ A2 = 1)) =

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1 1 1 1 1 1 · + · + · 6 6 6 6 6 6

=

3 36

=

1 12

38

Cap´ıtulo 2. Probabilidad (b) P (B 2 ∩ B 3 ) = P (B 2 )P (B 3 )

=

1 4 · 6 6

=

4 36

=

1 9

(c) P ((A2 ∩ A3 ) ∪ (B 2 ∩ A3 )) = P (A2 ∩ A3 ) + P (B 2 ∩ A3 ) = P (A2 )P (A3 ) + P (B 2 )P (A3 )

=

5 5 1 2 · + · 6 6 6 6

=

27 36

=

3 4

EJERCICIO 10 Un aficionado usa el siguiente sistema para pronosticar el tiempo atmosf´erico. Clasifica un d´ıa como seco o mojado y supone que la probabilidad de que un d´ıa dado sea igual al anterior est´a dado por p (0 ≤ p ≤ 1). En base a ciertos registros se sabe que el primer d´ıa de Enero tiene probabilidad β (0 ≤ β ≤ 1) de ser seco. Si βn = P (n-´esimo d´ıa del a˜ no es seco), obtenga una expresi´on para β2 y β3 en funci´on de β y p. (Hind: Puede ser u ´til aplicar probabilidad totales) ´ SOLUCION: Definamos como: Di : ”El d´ıa i-´esimo del a˜ no es seco”;

i = 1, 2, . . . , n.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

39

c P (Di | Di−1 ) = p = P (Dic | Di−1 )

P (D1 ) = β luego tenemos que β2 = P (D2 ) = P (D2 ∩ D1 ) + P (D2 ∩ D1c ) ⇒ β2 = P (D2 | D1 )P (D1 ) + P (D2 | D1c )P (D1c ) ⇒ β2 = p × P (D1 ) + (1 − p) × P (D1c ) ⇒ β2 = p × β + (1 − p) × (1 − β) ∴ β2 = (2p − 1)β + (1 − p) Ahora se obtiene de la misma manera β3 β3 = P (D3 ) = P (D3 ∩ D2 ) + P (D3 ∩ D2c ) ⇒ β3 = P (D3 | D2 )P (D2 ) + P (D3 | D2c )P (D2c ) ⇒ β3 = p × P (D2 ) + (1 − p) × P (D2c ) ⇒ β3 = p × P (D2 ) + (1 − p) × (1 − P (D2 )) ⇒ β3 = (2p − 1) × P (D2 ) + (1 − p) ⇒ β3 = (2p − 1) × β2 + (1 − p) ⇒ β3 = (2p − 1) × {(2p − 1)β + (1 − p)} + (1 − p) ∴ β3 = (2p − 1)2 β + (2p − 1)(1 − p) + (1 − p) EJERCICIO 11 En la serie mundial de b´eisbol, dos equipos A y B juegan una serie de partidos uno contra otro y el primer equipo que gana un total de tres partidos es el ganador de la serie mundial. Si la probabilidad de que el equipo A gane un partido contra el equipo B es 31 . (a) Describa el espacio muestral de este experimento. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

40

Cap´ıtulo 2. Probabilidad (b) ¿Cu´al es la probabilidad de que el equipo A gane la serie mundial? (c) Si la probabilidad de que el equipo A gane cualquier partido es p (0 < p < 1). ¿Cu´al es la probabilidad de que sea necesario jugar los 5 partidos para determinar al ganador de la serie? (d) Si la serie termina en el cuarto juego, ¿cu´al es la probabilidad de que el ganador sea el equipo B?

´ SOLUCION

(a) El espacio gr´aficamente ser´ıa:

´ Figura 2.5: Arbol o de la misma manera todas las combinaciones que est´an en el ´arbol como sigue: Ω = {AAA, AABA, AABBA, AABBB, . . . , BBB} donde #Ω = 20. (b) Sea S: A gana el mundial P (S) = P ({AAA} ∪ {AABA} ∪ {AABBA} ∪ {ABAA} ∪ {ABABA} ∪ {ABBAA}∪ {BAAA} ∪ {BAABA} ∪ {BABAA} ∪ {BBAAA})  3  3  3   2 1 1 2 1 2 = +3 +6 3 3 3 3 3 (c) T : Es necesario jugar 5 partido para determinar el ganador de la serie mundial Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

2.1 Ejercicios Resueltos

P (T ) = P ({AABBB} ∪ {ABABA} ∪ {ABABB} ∪ {BAABA}∪ {BAABB} ∪ {BABAA} ∪ {BABAB} ∪ {BBAAA} ∪ {BBAAB}) = 6p3 (1 − p)2 + 6p2 (1 − p)3 = 6p2 (1 − p)2 (p + 1 − p) = 6p2 (1 − p)2 (d) Sea C: La serie termina en el cuarto juego.

P (S c |C) =

P (S c ∩ C) P (C)

=

P (ABBB ∪ BABB ∪ BBAB) P (AABA ∪ ABAA ∪ ABBB ∪ BAAA ∪ BABB ∪ BBAB)

=

3p(1 − p)3 3p(1 − p)3 + 3p3 (1 − p)

=

3p(1 − p)3 3p(1 − p){(1 − p)2 + p2 }

=

(1 − p)2 p2 + (1 − p)2

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

41

42

Cap´ıtulo 2. Probabilidad

2.2.

Ejercicios Propuestos

1. Una costura hecha en un avi´on necesita 25 remaches. La costura tendr´a que volver a realizarse si cualquiera de los remaches est´a defectuoso. Suponga que los remaches est´an defectuosos independientemente unos de otros, cada uno con la misma probabilidad. a) Si 14 % de todas las costuras necesitan volver a efectuarse, ¿cu´al es la probabilidad de que un remache est´e defectuoso? b) ¿Qu´e tan peque˜ na debe ser la probabilidad de un remache defectuoso para asegurar que s´olo 10 % de todas las costuras necesiten volver a ejecutarse? 2. Dos bombas conectadas en paralelo fallan independientemente una de la otra en un d´ıa dado. La probabilidad de que la bomba m´as vieja falle es 0.10 y la probabilidad de que s´olo la bomba m´as nueva falle es 0.05. ¿Cu´al es la probabilidad de que el sistema de bombeo falle en cualquier d´ıa dado (lo que suceder´a si ambas bombas fallan)? 3. Se tienen 5 aspirantes (Juan, Dario, Mar´ıa, Susana y Natalia) para dos trabajos id´enticos. Un supervisor selecciona dos aspirantes para ocupar esos puestos. a) Hacer un lista de los modos posibles en que se pueden ocupar los puestos. Es decir, hacer una lista de todas las selecciones posibles de dos de los cincos aspirantes. b) Sea A el conjunto de selecciones que contienen por lo menos un hombre. ¿¿Cu´antos elementos tiene A? c) Sea B el conjunto de selecciones que contienen exactamente un hombre. ¿¿Cu´antos elementos tiene B? d ) Escribir el conjunto que contiene dos mujeres, en t´erminos de A y B. e) Hacer una lista de los elementos en A, AB, A ∪ B, y AB. 4. Una compa˜ n´ıa manufacturera tiene dos expendios al menudeo. Se sabe que el 30 % de los clientes potenciales compran productos s´olo en la tienda I, el 50 % compra en la tienda II, el 10 % compra en la tienda I y II, y el 10 % de los consumidores no compra en ninguna de las dos. Sea A el evento en el que un cliente potencial, seleccionado al azar, compra en I y B el evento el evento en el que compra en II. Calcular las siguientes probabilidades: a) P (A) b) P (B) c) P (A ∪ B) d ) P (AB) ¯ e) P (A¯B) f ) P (A ∪ B) Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

2.2 Ejercicios Propuestos 5. De las personas que llegan a un aeropuerto peque˜ no, el 60 % vuela en aeroplanos privados y el 10 % vuela en aeroplanos comerciales que no pertenecen a una aerol´ınea. De las personas que llegan por aerol´ıneas principales, el 50 % viaja por negocios, mientras que esa cifra es de 60 % para los que llegan en aeroplanos privados y de 90 % para los que llegan en otros aviones comerciales. Para una persona que se selecciona al azar de entre un grupo de llegadas, calcular la probabilidad de que a) la persona est´e en viaje de negocios. b) la persona est´e en viaje de negocios y llegue en un aeroplano privado. c) la persona est´e en viaje de negocios, y se sabe que lleg´o en un aeroplano comercial. d ) la persona haya llegado en un aeroplano privado, dado que viaja por negocios. 6. Sup´ongase que las calles de una ciudad se trazan en una red que va de norte a sur y de oriente a poniente. Consid´erese el planteamiento siguiente para patrullar una zona de 16 por 16 manzanas. Un patrullero comienza a caminar en el cruce central de la zona. En la esquina de cada cuadra elige al azar dirigirse al norte, al sur, al este o al oeste. a) ¿Cu´ales es la probabilidad de que alcance el l´ımite de su zona de patrullaje para cuando haya caminado seis cuadras? b) ¿Cu´ales es la probabilidad de que regrese a su punto de partida despu´es de haber caminado exactamente cuatro cuadras? 7. Se tienen dos eventos mutuamente excluyentes, A y B, tales que P (A) > 0 y P (B) > 0. ¿Son independientes A y B? Demuestre su respuesta. 8. Un armador de ventiladores el´ectricos usa motores de dos proveedores. La compa˜ n´ıa A le suministra el 90 % y la compa˜ n´ıa B el otro 10 % de los motores. Sup´ongase que se sabe que el 5 % de los motores que suministra la compa˜ n´ıa A son defectuosos y que el 3 % de los que suministra la compa˜ n´ıa B tambi´en lo son. Se encuentra que un ventilador ya armado tiene un motor defectuoso. ¿Cu´al es la probabilidad de que ese motor haya sido suministrado por la compa˜ n´ıa B?

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

43

44

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

Cap´ıtulo 2. Probabilidad

Cap´ıtulo 3 Variables Aleatorias Discretas 3.1.

Ejercicios Resueltos

EJERCICIO 1 Fernando y Nicol´as juegan un partido de tenis al mejor de tres sets (esto es, el que gana dos sets gana el partido). Suponga que la probabilidad de que Fernando gane el primer set es 0,5. Para los siguientes sets, la probabilidad de que Fernando gane es: 0,5 + (−1)Y (0,1)(k − 1) , k = 2, 3 donde  1, si Fernando perdi´o el set anterior Y = 0, si Fernando gan´o el set anterior (a) Sea X: N◦ de sets que Fernando perdi´o. Encuentre la funci´on de distribuci´on de X (esto es, ”la tabla”). (b) Calcule la probabilidad de que Fernando gane el partido. (c) Suponga que la empresa ”ABCDE” le paga a Fernando mil d´olares por el encuentro, pero por cada set que ´este pierde se le descuentan 100 d´olares. Sea G: ganancia obtenida por Fernando. Encuentre E(G). Sugerencia: Puede ser u ´til para este problema hacer el diagrama de ´arbol. ´ SOLUCION Las posibles secuencia del partido se aprecian en el ´arbol siguiente:

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

46

Cap´ıtulo 3. Variables Aleatorias Discretas

Figura 3.1: Arbol

(a) Definimos X: no set que Fernando perdi´o con X ∈ {0, 1, 2}. Luego las probabilidades para todos los casos son: P (X = 0) = P (GG) = 0,5 × 0,6 = 0,3 P (X = 1) = P (GP G ∨ P GG) = 0,5 · 0,4 · 0,3 + 0,5 · 0,4 · 0,7 = 0,2 P (X = 2) = 1 − P (X = 0) − P (X = 1) = 1 − 0,3 − 0,2 = 0,5 Luego la funci´on de distribuci´on de x es: X 0 1 2 P (X) 0.3 0.2 0.5 (b) P (Fernando gane el partido) = P (X = 0) + P (X = 1) = 0,3 + 0,2 = 0,5 (c) Sea H:ganancia obtenida por Fernando, por lo tanto H ∈ {800, 900, 1000}. Luego las probabilidades para las ganancias son: P (H = 800) = P (x = 2) = 0,5 P (H = 900) = P (x = 1) = 0,2 P (H = 1000) = P (x = 0) = 0,3 ∴ E(H) =

X

h · P (H = h) = 800 · 0,5 + 900 · 0,2 + 1000 · 0,3 = 880

Rec H

EJERCICIO 2 Sea X: n´ umero de neum´aticos de un autom´ovil seleccionado al azar, que tengan baja la presi´on.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

3.1 Ejercicios Resueltos

47

(a) ¿Cu´al de las siguientes tres funciones p(x) es una pmf leg´ıtima para x, y por qu´e no se permiten las otras dos? x 0 1 2 p(x) 0.3 0.2 0.1 p(x) 0.4 0.1 0.1 p(x) 0.4 0.1 0.2

3 4 0.05 0.05 0.1 0.3 0.1 0.3

(b) Para la pmf leg´ıtima de la parte (a), calcule P (2 ≤ X ≤ 4), P (X ≤ 2) y P (X 6= 0). (c) Si p(x) = c(5 − x), para x = 0, 1, 2, 3, 4. ¿Cu´al es el valor de c?. ´ SOLUCION

(a) Recordemos que para que una pmf sea leg´ıtima debe cumplir con que la suma de ella, sobre todo el recorrido, resulte 1, y 0 ≤ p(x) ≤ 1. Luego observando las tres pmf propuestas, podemos observar que las tres tiene valores entre 0 y 1, pero s´olo la segunda suma 1.

 0,4, x=0;     0,1, x=1;    0,1, x=2; ∴ p(x) = 0,1, x=3;     0,3, x=4;    0,0, e.o.c. (b) P (2 ≤ X ≤ 4) = 0,1 + 0,1 + 0,3 = 0,5 P (X ≤ 2) = 0,4 + 0,1 + 0,1 P (X 6= 0) = 0,1 + 0,1 + 0,1 + 0,3 = 0,6 (c) Si p(x) es la nueva pmf, debe cumplir que la suma sobre todo su recorrido de 1.

4 X

c(5 − x) = 1 → c

x=0

4 X

(5 − x) = 1 → c(5 + 4 + 3 + 2 + 1) = 1 → 15c = 1 → c =

x=0

1 . 15

EJERCICIO 3 Si el 90 % de todos los solicitantes para cierto tipo de hipoteca no llenan correctamente el formato de solicitud en la primera remisi´on, ¿Cu´al es la probabilidad de que entre 15 de estos solicitantes seleccionados al azar: (a) Por lo menos 12 no la llenen a la primera remisi´on? Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

48

Cap´ıtulo 3. Variables Aleatorias Discretas (b) Entre 10 y 13 inclusive no la llenen a la primera remisi´on? (c) A lo sumo 2 llenen correctamente sus formatos en la primera remisi´on? ´ SOLUCION (a) Sea X: n´ umero de personas que rellenan err´oneamente la solicitud. Luego X ∼ Bin(15, 0,9)

x = 0, 1, 2, ...

Por lo tanto lo que nos piden es: P (X ≥ 12) = P (X = 12) + P (X = 13) + P (X = 14) + P (X = 15) =

15   X 15 x=12

x

0,9x (1 − 0,9)15−x = 0,9444

(b) P (10 ≤ X ≤ 13) = P (X = 10) + P (X = 11) + P (X = 12) + P (X = 13) 13   X 15 = 0,9x (1 − 0,9)15−x = 0,4488 x x=10 (c) Sea Y: n´ umero de personas que llenan correctamente sus formatos. Luego Y ∼ Bin(15, 0,1)

y = 0, 1, 2, ...

Por lo tanto lo que nos piden es: P (Y ≤ 2) = P (Y = 0) + P (Y = 1) + P (Y = 2) =

2   X 15 y=0

y

0,1y (1 − 0,1)15−y = 0,8159

EJERCICIO 4 El voltaje de una bater´ıa nueva puede ser aceptable (A) o no aceptable (B). Cierta linterna de mano necesita dos bater´ıas, as´ı que estas han de seleccionarse y probarse independientemente hasta encontrar dos aceptables. Supongamos que el 80 % de todas las bater´ıas tienen voltaje aceptable y denotemos por Y el n´ umero de bater´ıas que deben ser probadas. (a) ¿Cu´anto vale p(2), es decir, P (Y = 2)? (b) ¿Cu´anto vale p(3) ? (c) Para tener Y=5. ¿Qu´e debe ser cierto de la quinta bater´ıa seleccionada?. (Hint: Haga una lista de los casos favorables de Y=5 y luego determine p(5)). (d) Utilice el lector del modelo de sus respuestas para las partes (a) a la (c) para obtener una f´ormula general para p(y). Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

3.1 Ejercicios Resueltos

49

´ SOLUCION Considerando que una bater´ıa es aceptable con probabilidad 0.8 y por ende no aceptable con probabilidad 0.2: (a) P (Y = 2) = P (A ∩ A) = 0,8 · 0,8 = 0,64 (b) En este caso hay dos formas de obtener Y=3: P (Y = 3) = P (A ∩ B ∩ A) + P (B ∩ A ∩ A) = 0,8 · 0,2 · 0,8 + 0,2 · 0,8 · 0,8 = 0,256 (c) Como se revisa hasta encontrar 2 buenas en voltaje, entonces la quinta obligadamente debe ser Aceptable (A). La lista de los posibles resultados son: ABBBA BABBA BBABA BBBAA Luego calculamos lo pedido: P (Y = 5) = 0,82 · 0,23 · 4 = 0,204 (d) Si observamos la relaci´on que tienen (a), (b) y (c), podemos rescatar que P (Y = y) = (y − 1)0,82 0,2y−2 , y ≥ 2  P (Y = y) =

 y−1 0,82 0,2y−2 , y ≥ 2 2−1

Y la forma que tiene esta pmf, corresponde a la conocida Binomial Negativa. Y ∼ BN (r, p) donde r corresponde a los ´exitos que se quieren obtener, en este caso 2 y p es la probabilidad del ´exito, en este caso 0.8. EJERCICIO 5 Un director t´ecnico de tenis tiene una canasta de 25 pelotas; 15 de estas son pelotas Penn y las otras 10 son Wilson. Cada uno de cuatro jugadores seleccionan 3 pelotas para un juego. (a) ¿Cu´al es la probabilidad de que exactamente 8 de las pelotas seleccionadas sean Penn? (b) ¿Cu´al es la probabilidad de que todas las pelotas seleccionadas sean Wilson? Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

50

Cap´ıtulo 3. Variables Aleatorias Discretas ´ SOLUCION Resumiendo los datos entregados, tenemos lo siguiente: N:25 pelotas P:15 Penn W:10 Wilson n:12 tama˜ no muestra Sea X: n´ umero de pelotas de las que me sirven, en la muestra sin reposici´on, en este caso pelotas Penn. Luego  N −P  P X ∼ Hiper(15, 10, 12) → P (X = x) =

x

n−x  N n

(a) P (X = 8) =

15 8



10 4

25 12



 = 0,2599

(b) P (X = 0) =

15 0



10 12

25 12



 =0

 Pues 10 no est´a definido, es decir no existe, ya que es il´ogico sacar m´as pelotas de un 12 tipo de las que tengo, luego es un evento imposible. EJERCICIO 6 Un art´ıculo de Los Angeles Times (3 de Dic. de 1993) reporta que de cada 200 personas, una lleva el gene defectuoso que ocasiona c´ancer de colon hereditario. En una muestra de 1000 personas ¿Cu´al es la distribuci´on aproximada del n´ umero de quienes llevan este gene?. Utilice esta distribuci´on para calcular la probabilidad aproximada de que: (a) Entre 4 y 7 inclusive, personas lleven el gene. (b) Por lo menos 8 lleven el gene. ´ SOLUCION Por las caracter´ısticas del problema, con X= n´ umero de personas con el gene. X ∼ P oisson(5) (a) P (4 ≤ X ≤ 7) = P (X = 4) + P (X = 5) + P (X = 6) + P (X = 7) =

54 e−5 55 e−5 56 e−5 57 e−5 + + + = 0,602 4! 5! 6! 7!

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

3.1 Ejercicios Resueltos

51

(b) P (X ≥ 8) =

∞ X 5x e−5 x=8

=1−

7 X 5x e−5 x=0

x!

x!

= 0,133

EJERCICIO 7 Una compa˜ n´ıa telef´onica emplea cinco operadoras de informaci´on que reciben solicitudes de informaci´on independientemente una de otra, cada una seg´ un un proceso de Poisson con tasa λ = 2× minuto. (a) ¿Cu´al es la probabilidad de que durante un periodo dado de un minuto, la primera operadora no reciba solicitudes? (b) ¿Cu´al es la probabilidad de que durante un periodo dado de un minuto, exactamente 4 de las 5 operadoras no reciban solicitudes? (c) Escriba una expresi´on para la probabilidad de que durante un periodo dado de un minuto, todas las operadoras reciban exactamente el mismo n´ umero de solicitudes. ´ SOLUCION Es importante tener presente que las operadoras atienden solicitudes independientemente una de otra. Luego Sea X: n´ umero de llamadas en un minuto de la operadora x. Por lo tanto X ∼ P oisson(2) P (X = 0) =

e−2 20 = e−2 = 0,1353 0!

(b) En este caso tenemos un experimento incluido en el otro, ya que cuando contamos el n´ umero de operadoras que cumplen con algo de entre un total, estamos hablando de un experimento Binomial, en el cual, la probabilidad del ´exito est´a modelada por la distribuci´on Poisson. Luego Y: n´ umero de operadoras que reciben cero llamadas entre las 5 Y ∼ Bin(5, P (X = 0)), recuerde que X ∼ P oisson(2)   5 → P (Y = 4) = 0,13534 (1 − 0,1353)5−4 = 0,001451 4 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

52

Cap´ıtulo 3. Variables Aleatorias Discretas (c) Como las operadoras son independientes una de las otras y las 5 tienen exactamente la misma distribuci´on, basta considerar la de una operadora y potenciarla a las 5. Luego la expresi´on para tal c´alculo ser´ıa: ∞ X

[P (X = x)]5

x=0

EJERCICIO 8 Para promocionar sus helados de paleta, una fabrica pone cada 15 helados una etiqueta que dice ”vale otro”. Cualquiera persona que compre un helado y le salga ”vale otro” obtiene un helado gratis. Estos helados cuestan 100 pesos cada uno. Si Ud. decide comprar estos helados hasta obtener uno gratis ¿cu´anto esperar´ıa gastar? ´ SOLUCION Sea X: no helados comprados hasta obtener el primero gratis. De lo anterior de deduce que la variable X tiene distribuci´on geom´etrica X ∼ Geometrica(p)

p = P (Salga gratis) =

1 15

Sea G = 100X, luego la que uno esperar´ıa gastar ser´ıa la E(G). 1 E(G) = 100E(X) = 100 = 100 · 15 = 1500 p ∴ lo que se esperar´ıa gastar si se compran helados hasta obtener uno gratis ser´ıan $1500. EJERCICIO 9 Un examen consta de n preguntas con k alternativas cada una. Suponga que cierto alumno responde cada pregunta de acuerdo al siguiente procedimiento: si conoce la alternativa correcta, entonces la escoge con probabilidad 1; si no la sabe, entonces escoge una alternativa al azar. Suponga que la probabilidad de que el alumno conozca la alternativa correcta es p (0 < p < 1), igual para todas las preguntas y que las distintas preguntas se responden en forma independiente. (a) Sea X el n´ umero de preguntas respondidas correctamente. Encuentre la funci´on de probabilidad o cuant´ıa de X. (b) ¿Si una de estas preguntas fue respondida correctamente, cu´al es la probabilidad de que el alumno haya sabido la alternativa correcta? ´ SOLUCION

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

3.1 Ejercicios Resueltos

53

(a) Sean los eventos: S: Saber la respuesta. C: respuesta correcta. Entonces, por probabilidad total.

P (C) = P (C|S)P (S) + P (C|S 0 )P (S 0 )

=1·p+

=p+

1 · (1 − p) k

(1 − p) k

como las respuestas a cada pre4gunta son independientes y p∗ = P (C), la probabilidad de responder correctamente una pregunta, es constante para cada pregunta, se tiene que: X ∼ Bin(n, p∗) con p∗ = p +

1−p . k

Luego   n p(x) = P (X = x) = (p∗)x (1 − p∗)n−x , x

x = 0, 1, 2, 3, . . . , n.

(b) Bayes

P (S|C) =

=

=

P (C|S)P (S) P (C) 1·p

p+

(1−p) k

kp (k + 1)p + 1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

54

Cap´ıtulo 3. Variables Aleatorias Discretas

3.2.

Ejercicios Propuestos

1. Suponga que cada una de las llamadas que hace una persona a una estaci´on de radio muy popular tiene una probabilidad de 0.02 de que la l´ınea no est´e ocupada. Suponga que las llamadas son independientes. a) ¿Cu´al es la probabilidad de que la primera llamada que entre sea la d´ecima que realiza la persona? b) ¿Cu´al es la probabilidad de que sea necesario llamar m´as de cinco veces para hallar desocupada la l´ınea? c) ¿Cu´al es le n´ umero promedio de llamadas que deben hacerse para hallar desocupada la l´ınea? 2. Un negocio de computadores que atiende pedidos por correo tiene seis l´ıneas telef´onicas. Simbolicemos con correo X el n´ umero de l´ıneas con uso en un momento espec´ıfico. Supongamos que la pmf de X est´as dada en la tabla siguiente. x 0 1 2 3 4 5 6 p(x) 0.1 0.15 0.20 0.25 0.20 0.06 0.04 Calcule la probabilidad de cada uno de los siguientes eventos: a) A lo sumo 3 l´ıneas est´an en uso b) Menos de 3 l´ıneas est´an en uso c) Por lo menos 3 l´ıneas est´an en uso d ) Entre 2 y 5 l´ıneas est´an en uso e) Entre 2 y 4 l´ıneas no est´an en uso f ) Por lo menos 4 l´ıneas no est´an en uso 3. Una compa˜ n´ıa de seguros ofrece a sus tenedores de p´olizas varias opciones diferentes para el pago de primas. Para un tenedor seleccionado al azar, sea X=n´ umero de meses entre pagos sucesivos. La cdf de X es como sigue:  0     0,30    0,40 F (x) =  0,45    0,60    1

si si si si si si

x x) = e−λx adem´as tenemos que E(X) = µX =

1 λ

y

2 Var(X) = σX =

1 λ2

(a) Que la probabilidad sea a lo sumo 100 metros es P (X ≤ 100) = 1 − e−λ·100 = 1 − e−0,01386·100 = 0,4799 y que est´e entre 100 y 200 metros es P (100 < X < 200) = P (X < 200) − P (X < 100) = 1 − e−λ·200 − 1 − e−λ·200 = e−λ·100 − e−λ·200 = 0,1875 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.



66

Cap´ıtulo 4. Variables Aleatorias Continuas (b) La probabilidad pedida se puede escribir como P (X > E(X) + 2σX ) = P (X > 3σX )  =P

3 X> 0,01386



= P (X > 216,450) = e−λ·216,450 = 0,049 ≈ 0,05 (c) Se pide la mediana, sabemos que esta se encuentra en el percentil 50. Luego se tiene que Z

mediana

fX (x)dx = 0,5 ⇐⇒ FX (mediana) = 0,5 0

Al reemplazar por la funci´on de distribuci´on acumulada de la exponencial se logra la siguiente igualdad 1 − e−λ·mediana = 0,5 ⇒

1 − 0,5 = e−λ·mediana



ln(0,5) = −λ · mediana



ln(0,5) −0,01386



= mediana

50,01 = mediana

EJERCICIO 6 La presi´on del aire de un neum´atico seleccionado al azar, instalado en un autom´ovil nuevo, est´a normalmente distribuida con valor medio de 31 lb/pulg2 y desviaci´on est´andar de 0.2 lb/pulg2 . (a) ¿Cu´al es la probabilidad de que la presi´on de un neum´atico, seleccionado al azar, exceda de 30.5 lb/pulg2 ? (b) ¿Cu´al es la probabilidad de que la presi´on de un neum´atico, seleccionado al azar, se encuentre entre 30.5 y 31.5 lb/pulg2 ? Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

4.1 Ejercicios Resueltos

67

(c) Suponga que un neum´atico se considera con presi´on baja si est´a debajo de 30.4 lb/pulg2 . ¿Cu´al es la probabilidad de que al menos uno de los cuatro neum´aticos de un autom´ovil se encuentre con presi´on baja? ´ SOLUCION Sea X la presi´on de aire, luego tenemos que X ∼ N (31, 0,22 )

(a) P (X > 30,5) = P (Z >

30,5−31 ) 0,2

= P (Z > −2,5) = P (Z < 2,5) = 0,9938

(b) P (30,5 < X < 31,5) = P (X < 31,5) − P (X < 30,5)  =P

31,5 − 31 Z< 0,2



 −P

30,5 − 31 Z< 0,2



= P (Z < 2,5) − P (Z < −2,5) = 0,9938 − (1 − 0,9938) = 0,9876

(c) Sea Y : no de neum´aticos con presi´on baja. Se puede deducir que Y ∼ Bin(4, p), donde p = P (X < 30,4). Luego calculando tenemos que  p = P (X < 30,4) = P



30,4 − 31 Z< 0,2

 = P (Z < −3) = 0,0013

Y ∼ Bin(4, 0,0013)

Se pide Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

68

Cap´ıtulo 4. Variables Aleatorias Continuas

P (Y ≥ 1) = 1 − P (Y < 1) = 1 − [P (Y = 0)]   4 0 =1− p (1 − p)4 0 = 1 − [1 − 0,0013]4 = 0,005189 EJERCICIO 7 Suponga que el n´ umero de horas X que funcionar´a una m´aquina antes de fallar es una variable aleatoria con distribuci´on Normal de par´ametros µ = 720 y σ 2 = 482 . Suponga que en el momento en que la m´aquina comienza a funcionar Ud. debe decidir cuando el inspector regresar´a a revisarla. Si el vuelve antes de que la m´aquina falle, se ocasiona un costo de a d´olares por haber desperdiciado una inspecci´on. Si vuelve despu´es de que la m´aquina haya fallado, se ocasiona un costo de b d´olares por el no funcionamiento de la m´aquina. (a) Determine una expresi´on para el costo esperado, considerando que el tiempo hasta que el inspector vuelve a inspeccionar la m´aquina es de t horas. (b) Suponga que el inspector decide volver en un tiempo de t = 816hrs. Calcule la probabilidad de que el inspector llegue tarde a la inspecci´on, es decir, la m´aquina ya ha dejado de funcionar. (c) Se observa este proceso durante 15 per´ıodos. Determine de que el inspector llegue tarde m´as de 12 veces. ´ SOLUCION Sea X : Tiempo de funcionamiento de una m´aquina hasta que falle. X ∼ N (720, 482 ) (a) Tenemos que Costo =

  a X>t 

b X t) + bP (X < t) = a − aP (X < t) + bP (X < t) = a + P (X < t){b − a}  = a + (b − a)FZ

t − 720 48



(b) 

X − 720 816 − 720 < 48 48



96 Z< 48

P (X < 816) = P

=P





= P (Z < 2) = 0,9772499 (c) Sea X : N´ umero de veces que el inspector llega tarde. X ∼ Bin(15, 0,9772499) entonces P (X > 12) =

15   X 15 x=13

x

(0,9772499)x (1 − 0,9772499)15−x

= 0,9956363

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

70

Cap´ıtulo 4. Variables Aleatorias Continuas

4.2.

Ejercicios Propuestos

1. Si Y ∼ U [0, 5] ¿Cu´al es la probabilidad de que las ra´ıces de la ecuaci´on 4x2 + 4xY + Y + 2 = 0 sean ambas reales? 2. Las calificaciones X de un examen del curso EYP* siguen una distribuci´on normal de media 4.2 y desviaci´on est´andar 0.6. El profesor sospecha que el examen fue dif´ıcil. De acuerdo a lo anterior ajusta las calificaciones en la forma Y = aX + b, a > 0, a) ¿Qu´e valores deben asignarse a las constantes a y b de manera que las nuevas calificaciones tengan un promedio de 5.3 y una desviaci´on est´andar de 0.3? b) Encuentre c ∈ [0; 7] para que, con probabilidad igual a 0.9, las calificaciones ajustadas superen a c. 3. El tiempo que transcurre entre las llamadas a una empresa de art´ıculos para plomer´ıa tiene una distribuci´on exponencial con un tiempo promedio entre llamadas de 15 minutos. (a) ¿Cu´al es la probabilidad de que no haya llamadas en un lapso de 30 minutos? (b) ¿Cu´al es la probabilidad de recibir al menos una llamada en un intervalo de 10 minutos? (c) ¿Cu´al es la probabilidad de recibir la primera llamada en un intervalo entre 5 y 10 minutos despu´es de haber abierto la empresa? (d) Calcule la dimensi´on de un intervalo de tiempo, de modo tal que la probabilidad de recibir al menos una llamada en ese lapso sea 0.9. 4. La funci´on de densidad de probabilidad del tiempo de falla (en horas) de un componente −x/1000 electr´onico de una copiadora es fX (x) = e 1000 para x > 0. Calcule la probabilidad de que: a) El componente tarde m´as de 3000 horas en fallar. b) El componente falle en el lapso comprendido entre 1000 y 2000 horas. c) El componente falle antes de 1000 horas. d ) Calcule el n´ umero de horas en las que fallar´an el 10 % de todos los componentes. 5. El peso regular de apoyo de una pastilla de est´ereo, que actualmente est´a puesta a 3 gr. en un tocadiscos, puede considerarse como una v.a. X continua con pdf:  k[1 − (x − 3)2 ], 2 ≤ x ≤ 4; f (x) = 0, e.o.c. a) Dibuje la gr´afica de f (x). Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

4.2 Ejercicios Propuestos

71

b) Encuentre el valor k. c) ¿Cu´al es la probabilidad de que el peso de apoyo sea mayor que el peso especificado? d ) ¿Cual es la probabilidad de que el peso difiera del peso especificado en m´as de .5 gr.? 6. El art´ıculo “The Prediction of Corrosion by Statistical Analysis of Corrosion Profiles” sugiere la siguiente cdf, para la profundidad X de la picadura m´as profunda en un experimento donde interviene la exposici´on de acero al manganeso carbono a agua de mar acidulada: −(x−α)/β

F (x; α, β) = e−e

,

−∞ < x < ∞

Los autores proponen los valores α = 150, β = 90. Suponga que este es el modelo correcto. a) ¿Cu´al es la probabilidad de que la profundidad de la picadura m´as profunda sea a lo sumo 150? ¿A lo sumo 300? ¿Entre 150 y 300? b) ¿Cual es la funci´on de densidad de X? c) Se puede demostrar que E(X) ≈ ,5772β + α. ¿Cu´al es la media para los valores dados α y β, y c´omo se compara con la mediana? 7. El tiempo en minutos en ir de un hotel al aeropuerto por la ruta A se distribuye N (27, 25). Mientras que por la ruta B se distribuye N (30, 4).¿Qu´e ruta conviene utilizar si se dispone de: a) 30 minutos? b) 34 minutos? 8. Si X tiene una distribuci´on exponencial con par´ametro λ, derive una expresi´on general para el (100p) avo percentil de la distribuci´on. Luego especifique c´omo obtener la mediana.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

72

Cap´ıtulo 4. Variables Aleatorias Continuas

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

Cap´ıtulo 5 Sensibilidad y Especificidad 5.1.

Ejercicios Resueltos

EJERCICIO 1 En una investigaci´on sobre el factor de crecimiento de carcinoma mamario (FCCM), el estudio piloto revel´o que estaba elevado en los pacientes con carcinomas de mama confirmados. Se hizo un estudio cl´ınico que incluy´o a 1600 pacientes donde por biopsia se determin´o carcinoma en 600 y 1000 estaban sanos. Se consider´o como positivo al FCCM un resultado mayor o igual a 150 unidades por litro. La tabla obtenida fue la siguiente: Con carcinoma de mama FCCM (+) 570 FCCM (-) 30 Total 600

Sin carcinoma de mama Total 150 720 850 880 1000 1600

(a) Explique e identifique para este ejemplo: i. Verdaderos Positivos. ii. Falsos Positivos. iii. Verdaderos Negativos. iv. Falsos Negativos. (b) ¿Qu´e es la Prevalencia? Calc´ ulela. (c) ¿Cu´al es la probabilidad de que un sujeto enfermo sea clasificado como positivo?, ¿cu´al es el nombre t´ecnico de esta probabilidad y c´omo podr´ıa aumentarla? (d) ¿Cu´al es la probabilidad de que un sujeto sano sea clasificado como negativo?, ¿cu´al es el nombre t´ecnico de esta probabilidad y c´omo podr´ıa aumentarla? (e) ¿Cu´al es la probabilidad de que el individuo tenga carcinoma de mama si la prueba FCCM es positivo?, ¿cu´al es la probabilidad de que no la padezca si la prueba FCCM es negativa?, ¿t´ecnicamente que se est´a pidiendo? Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

74

Cap´ıtulo 5. Sensibilidad y Especificidad ´ SOLUCION

(a) Identificaci´on en la tabla

Con carcinoma de mama FCCM (+) 570 (VP) 30 (FN) FCCM (-) Total 600

Sin carcinoma de mama Total 150 (FP) 720 850 (VN) 880 1000 1600

i. Verdaderos Positivos (V P ): Son los individuos que realmente tienen la enfermedad (con carcinoma de mama) y su test sali´o positivo (FCCM (+)). ii. Falsos Positivos (F P ): Son los individuos que realmente no tienen la enfermedad (sin carcinoma de mama) y su test sali´o positivo (FCCM (+)). iii. Verdaderos Negativos (V N ): Son los individuos que realmente no tienen la enfermedad (sin carcinoma de mama) y su test sali´o negativo (FCCM (-)). iv. Falsos Negativos (F N ): Son los individuos que realmente tienen la enfermedad (con carcinoma de mama) y su test sali´o negativo (FCCM (-)). (b) La prevalencia es la proporci´on de individuos que est´an realmenete enfermos (Prevalencia Real) con respecto al total. P revalencia =

VP 570 # de realmente enf ermos = = = 0,35625 # total de individuos T otal 1600

(c) La probabilidad pedida se llama Sensibilidad (Sp ). Sp =

570 570 VP = = = 0,95 V P + FN 570 + 30 600

∴ La Probabilidad de que un individuo obtenga positivo en el test (FCCM(+)), dado que est´a realmente enfermo es de 95 %. La manera de poder aumentar la Sp es disminuyendo los Falsos Negativos (FN). (d) La probabilidad pedida se llama Especificidad (Ep ). Ep =

VN 850 850 = = = 0,85 V N + FP 850 + 150 1000

∴ La Probabilidad de que un individuo obtenga negativo en el test (FCCM(-)), dado que esta realmente no est´a enfermo es de 85 %. La manera de poder aumentar la Ep es disminuyendo los Falsos Positivos (FP). Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

5.1 Ejercicios Resueltos

75

(e) Lo que est´an pidiendo t´ecnicamente es el valor predictivo positivo y negativo.

V PP =

V PN =

570 570 VP = = = 0,79167 V P + FP 570 + 150 720 850 850 VN = = = 0,9659 V N + FN 850 + 30 880

∴ La Probabilidad de que un individuo est´e enfermo (con carcinoma de mama) dado que el test sali´o positivo (FCCM(+)) es de 79 % y la probabilidad de que el individuo no tenga carcinoma de mama dado que el test sali´o negativo (FCCM(-)) es de 96.6 %. EJERCICIO 2 La mastitis es una enfermedad que afecta a las vacas que est´an produciendo leche. Para un productor de leche es muy importante detectar una enfermedad tempranamente. Un grupo de investigadores desarroll´o un examen para este efecto con una confiabilidad del 90 %, es decir, de 100 vacas con la enfermedad el examen detecta 90 vacas enfermas. De las vacas libres de mastitis un 99 % de los ex´amenes se consideran libres de la enfermedad y un 1 % se diagnostican como mostrando mastitis, se seleccionan al azar una y se le somete al examen que arroja como resultado que s´ı posee la enfermedad. ¿Cu´al es la probabilidad que la vaca tenga realmente mastitis? ´ SOLUCION Sean E : Vaca enferma S : vaca sin enfermedad + : Examen positivo − : Examen negativo donde las probabilidades son: P (E) = 0,001 P (S) = 0,999 P (+|E) = 0,9 P (−|S) = 0,01 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

76

Cap´ıtulo 5. Sensibilidad y Especificidad lo que se pide es lo siguiente: P (E|+) =

=

P (+|E)P (E) P (+|S)P (S) + P (+|E)P (E) 0,01 · 0,999 0,9 · 0,001 + 0,9 · 0,001

= 0,0826446 A esta probabilidad se le llama usualmente la valor predictivo positivo

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

5.2 Ejercicios Propuestos

5.2.

Ejercicios Propuestos

1. Se quiere estudiar la utilidad de la reacci´on en cadena de la polimerasa (PCR) en el diagn´ostico de la meningitis meningoc´ocica. Se estudian 115 l´ıquidos cefalorraqu´ıdeos procedentes de otros tantos pacientes con sospecha de meningitis. Los resultados que se obtienen se recogen en la siguiente tabla:

Prueba (+) Prueba (-) Total

Meningitis meningoc´ocica Meningitis no meningoc´ocica Total 34 1 35 5 75 80 39 76 115

donde En 34 personas con meningitis meningoc´ocica la PCR fu´e positiva (Verdaderos Positivos). En 5 personas con meningitis meningoc´ocica la PCR fu´e negativa (Falsos Negativos). En 75 personas sin meningitis meningoc´ocica la PCR fu´e negativa (Verdaderos Negativos). En 1 persona sin meningitis meningoc´ocica la PCR fu´e positiva (Falsos Positivos). Responda lo siguiente: a) ¿Qu´e es la Prevalencia? Calc´ ulela. b) ¿Cu´al es la probabilidad de que un sujeto enfermo sea clasificado como positivo?, ¿C´omo se podr´ıa aumentar esta probabilidad? c) ¿Cu´al es la probabilidad de que un sujeto sano sea clasificado como negativo?, ¿C´omo se podr´ıa aumentar esta probabilidad? d ) ¿Cu´al es la probabilidad de que el individuo tenga meningitis meningoc´ocica si la prueba es positivo?, ¿cu´al es la probabilidad de que no la padezca si la prueba es negativa? 2. Con el objeto de diagnosticar la colelietasis se usan los ultrasonidos. Tal t´ecnica tiene una sensibilidad del 91 % y una especificidad del 98 %. En la poblaci´on que nos preocupa, la probabilidad de colelietasis es de 0,2. a) Si a un individuo de tal poblaci´on se le aplican los ultrasonidos y dan positivos, ¿cu´al es la probabilidad de que sufra la colelietasis? b) Si el resultado fuese negativo, ¿cu´al ser´ıa la probabilidad de que no tenga la enfermedad?

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

77

78

Cap´ıtulo 5. Sensibilidad y Especificidad 3. Dadas las siguientes tablas:

Tabla A Enfermos Examen Si No Total (+) 58 4 62 (-) 12 28 40 Total 70 32 102 Tabla B Enfermos Examen Si No Total (+) 58 40 98 (-) 12 280 292 Total 70 320 390 a) Calcule y comente para cada una de ellas su Prevalencia, Sensibilidad y Especificidad. b) Para la Tabla A conociendo la sensibilidad y la especificidad del ex´amen diagn´ostico calcule aplicando el Teorema de Bayes: VPPP (valor predictivo de la prueba positiva) y VPPN (valor predictivo de la prueba negativa), comente.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

Cap´ıtulo 6 Estimaci´ on 6.1.

Ejercicios Resueltos

EJERCICIO 1 Suponga que se tiene una m.a. de tama˜ no 2n tomada de una poblaci´on X, con E(X) = µ y V ar(X) = σ 2 . Sean: 2n n 1 X 1X X1 = xi y X 2 = xi 2n i=1 n i=1 dos estimadores de µ. ¿Cu´al es el mejor estimador de µ? Explique su elecci´on. ´ SOLUCION El mejor estimador ser´a aquel que tenga menor error cuadr´atico medio E.C.M.. Primero veamos si son insesgados los estimadores. ! 2n 2n X 1 X 1 1 E xi = 2nµ = µ E(X 1 ) = E(xi ) = 2n 2n 2n i=1 i=1 ! n n X 1 1X 1 E(X 2 ) = E xi = E(xi ) = nµ = µ n n i=1 n i=1 Luego ambos estimadores son insesgados, por lo tanto el mejor estimador de entre los dos, ser´a aquel que tenga menor varianza. ! 2n 2n X 1 1 X 1 σ2 V ar(X 1 ) = 2 V ar xi = 2 V ar(xi ) = 2 2nσ 2 = 4n 4n i=1 4n 2n i=1 ! n n X 1 1 X 1 σ2 2 V ar(X 2 ) = 2 V ar xi = 2 V ar(xi ) = 2 nσ = n n i=1 n n i=1 Luego, como el que tiene menor varianza es X 1 , escogemos ´este, pues es el que produce un menor E.C.M. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

80

Cap´ıtulo 6. Estimaci´ on EJERCICIO 2 ˆ1 y Θ ˆ 2 son estimadores insesgados del par´ametro θ. Se sabe que V ar(Θ ˆ 1 ) = 10 Suponga que Θ ˆ y V ar(Θ2 ) = 4. ¿Cu´al es el mejor y en que sentido lo es? ´ SOLUCION Como ambos son insesgados, el mejor estimador ser´a aquel que tenga menor varianza, lo ˆ 2 tiene que, en este caso, conlleva a tener un menor E.C.M.. Luego observando, vemos que Θ ˆ 1 , por lo tanto escogemos Θ ˆ 2 como mejor estimador de θ. menor varianza que Θ EJERCICIO 3 ˆ1 y Θ ˆ 2 son estimadores del par´ametro θ. Se sabe que E(Θ ˆ 1 ) = θ, E(Θ ˆ 2) = θ , Suponga que Θ 2 ˆ 1 ) = 10 y V ar(Θ ˆ 2 ) = 4. ¿Cu´al es el mejor y en qu´e sentido lo es? V ar(Θ ´ SOLUCION ˆ 1 es insesgado para θ pero que Θ ˆ 2 no lo es. Si observamos cuidadosamente, vemos que Θ Ahora la mejor forma de ver cual es mejor es comparando los E.C.M. de cada uno, ya que esta medida considera el sesgo producido por cada estimador y la varianza que tienen. ˆ 1 ) = V ar(Θ ˆ 1 ) + Sesgo2 (Θ ˆ 1 ) = 10 + 02 = 10 E.C.M.(Θ 2  2  θ θ 2 ˆ ˆ ˆ −θ =4+ − E.C.M.(Θ2 ) = V ar(Θ2 ) + Sesgo (Θ2 ) = 4 + 2 2 Como se puede ver, el E.C.M. de Θ2 depende del verdadero valor que tiene θ, luego debemos ˆ 2 ser´a mejor que Θ ˆ 1. hacer un an´alisis m´as detallado, para saber cuando Θ Cuando ocurre: ˆ 1 ) ≤ E.C.M.(Θ ˆ 2) E.C.M.(Θ  2 θ 10 ≤ 4 + − 2 16 + θ2 10 ≤ 4 40 ≤ 16 + θ2 θ2 ≥ 40 − 16 θ2 ≥ 24 ˆ 2 ser´a mejor estimador de θ que Θ ˆ 1 cuando el verdadero valor de θ sea: Es decir, Θ √ √ θ ≥ 24 o cuando θ ≤ − 24 ˆ 1 ser´a mejor estimador de θ que Θ ˆ 2 cuando Equivalentemente, Θ √ √ − 24 < θ < 24

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

81

EJERCICIO 4 Sea X1 , . . . , Xn una muestra aleatoria de tama˜ no n, de una poblaci´on N (µ, σ 2 ). 2

(a) Demuestre que X es un estimador sesgado de µ2 . (b) Determine la magnitud del sesgo en el estimador. (c) ¿Qu´e sucede con el sesgo a medida que aumenta el tama˜ no n de la muestra? ´ SOLUCION ¯ ∼ N (µ, σ2 ), luego si queremos demostrar (a) Como X ∼ N (µ, σ 2 ) entonces se sabe que X n ¯ 2 es sesgado para µ2 ocupamos la siguiente relaci´on: que X 2

V ar(X) = E(X ) − E 2 (X) σ2 2 = E(X ) − µ2 n Luego despejando lo que necesitamos, obtenemos: 2

E(X ) =

σ2 + µ2 n

Lo cual es distinto de µ2 , que es el caso donde habr´ıa sido insesgado el estimador. (b) La magnitud del sesgo, no es m´as que el tama˜ no de ´este, es decir, su valor. 2

2

Sesgo(X ) = E(X ) − µ2 2

Sesgo(X ) =

σ2 σ2 + µ2 − µ2 = n n

(c) A medida que el tama˜ no de muestra aumenta, el sesgo es asint´oticamente (cuando n → ∞) insesgado.

σ2 n

→ 0, es decir, el estimador

EJERCICIO 5 Una m´aquina produce art´ıculos defectuosos con probabilidad π. En la inspecci´on de art´ıculos se define la v.a.

 Yi =

1, si el art´ıculo i es defectuoso; 0, si el art´ıculo i no es defectuoso.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

82

Cap´ıtulo 6. Estimaci´ on En una muestra de tama˜ no 5 se observan dos art´ıculos defectuosos. Proponga un modelo apropiado para el problema y estime la proporci´on de art´ıculos defectuosos usando el m´etodo de m´axima verosimilitud. ´ SOLUCION Dada la definici´on del problema y la estructura de la variable aleatoria, Y tiene una distribuci´on Bernoulli Y ∼ Ber(p) → P (Y = y) = py (1 − p)1−y donde el par´ametro p, que es la probabilidad del ´exito, es desconocida, por lo que la estimaremos por m´axima verosimilitud. L(y|p) = L(y|p) = p

5 Y

i=1 P5 i=1

pyi (1 − p)1−yi

yi

(1 − p)5−

P5

i=1

yi

Aplicando logaritmo natural, obtenemos: X    5 5 X `(y|p) = yi ln(p) + 5 − yi ln(1 − p) i=1

i=1

Luego, para maximizar la funci´on de verosimilitud, derivamos con respecto al par´ametro p, que es el que estamos buscando e igualamos a cero para despejar p. ! 5 5 X X yi yi − 5 ∂` i=1 i=1 = + =0 ∂p p 1−p 5 X

pˆ =

yi

i=1

5 Pero como nos dicen que se observaron dos art´ıculos defectuosos, es decir s´olo dos de los yi son 1, la suma de ´estos es 2, 2 ∴ pˆ = 5 EJERCICIO 6 El n´ umero de conexiones mal soldadas por microcircuito integrado en una operaci´on de manufactura electr´onica sigue una distribuci´on Binomial(20,p) con p desconocida. El costo de corregir los errores, por microcircuito, es: C = 3X + X 2 En base a una muestra aleatoria X1 , X2 , ..., Xn encuentre el EMV del costo esperado de corregir los errores de estos n microcircuitos observados.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

83

´ SOLUCION Considerando que el par´ametro p es desconocido, debemos estimarlo, lo que haremos por el m´etodo de M´axima Verosimilitud. L(x|p) =

n   Y 20 i=1

L(x|p) = p

Pn

i=1 xi

xi

pxi (1 − p)20−xi

20n−

(1 − p)

Pn

i=1 xi

n   Y 20 i=1

xi

Aplicando logaritmo natural, obtenemos: `(x|p) =

X n





xi ln(p) + 20n −

i=1

n X

 xi ln(1 − p) +

i=1

n X i=1

  20 ln xi

Luego, para maximizar la funci´on de verosimilitud, derivamos con respecto al par´ametro p, que es el que estamos buscando e igualamos a cero para despejar p. ! n n X X xi yi − 20n ∂` i=1 i=1 = + =0 ∂p p 1−p n X

pˆ =

xi

i=1

20n Ya teniendo este estimador, lo que sigue es calcular el EMV del costo. E(C) = 3E(X) + E(X 2 ) = 3np + np(1 − p) + (np)2 = 3np + np − np2 + n2 p2 = 4np + np2 (n − 1) [ = 4nb Luego el E.M.V. de E(C) es E(C) p + nb p2 (n − 1) por invarianza del E.M.V. EJERCICIO 7 En encuestas, es dif´ıcil obtener respuestas precisas a preguntas delicadas tales como ¿Has usado alguna vez hero´ına? o ¿Has hecho trampa alguna vez en un examen?. Warner introdujo el m´etodo de respuestas aleatorizadas para tratar tales situaciones. El encuestado hace girar una flecha en una rueda o extrae una bola desde una urna que contiene dos bolas de dos colores para determinar cual de las dos afirmaciones contestar´a: (1)“Tengo la caracter´ıstica Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

84

Cap´ıtulo 6. Estimaci´ on A”, o (2)“No tengo la caracter´ıstica A”. El encuestador no conoce cual afirmaci´on ser´a contestada pero solamente anotar´a un s´ı o un no. Se cree que es m´as probable que el encuestado responda verazmente si ´el o ella saben que el encuestador no conoce cual afirmaci´on ser´a contestada. Sea R la proporci´on de una muestra que contesta S´ı. Sea p la probabilidad que la afirmaci´on 1 sea contestada (p es conocido desde la estructura del m´etodo aleatorizado), y sea q la proporci´on de la poblaci´on que tiene la caracter´ıstica A. Sea r la probabilidad que un encuestado responda s´ı. (a) Muestre que r = (2p − 1)q + (1 − p) (b) Si r es conocida, ¿C´omo podr´ıa determinarse q? ´ SOLUCION Definamos como: R: Proporci´on de la muestra que contesta s´ı. p: Probabilidad que la afirmaci´on 1 sea contestada. q: Probabilidad de la poblaci´on que tiene la caracter´ıstica A. r: Probabilidad que un encuestado responda si. (a) r = P (responda s´ı) = P (responda s´ı | contesta afirmaci´on 1)P (contesta afirmaci´on 1) + P (responda s´ı | no contesta afirmaci´on 1)P (no contesta afirmaci´on 1) = pq + (1 − p)(1 − q) = pq + 1 − p − q + pq = 2pq + 1 − p − q = (2pq + 1)q + (1 − p) (b) Ser´ıa cosa de despejar q, es decir, r − (1 − p) = (2p − 1)q luego q=

r+p−1 2p − 1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

85

EJERCICIO 8 Sup´ongase que X1 , X2 , ..., Xn constituyen una m.a. de una distribuci´on cuya funci´on densidad es la siguiente  θ−1 θx , 0 < x < 1; f (x|θ) = 0, e.o.c. Adem´as, sup´ongase que el valor de θ es desconocido (θ > 0). (a) Determine el EMV de θ. (b) Determine el EMV de E(X). ´ SOLUCION

(a) L(x1 , . . . , xn , θ) =

n Y

θxθ−1 i

i=1 n Y

= θn

!θ−1 xi

/ ln

i=1

`(x1 , . . . , xn , θ) = n ln θ + (θ − 1)

n X

ln xi

/∂θ

i=1

∂`(x1 ,...,xn ,θ) ∂θ

=

n θ

+

n X

ln xi

i=1



θbEM V

−n = X n ln xi i=1

(b) Z E(X) =

xθx 0

\= Luego E(X)

θˆ ˆ θ+1

1 θ−1

Z dx =

1

θxθ dx =

0

θ θxθ+1 1 = θ 0 θ+1

por la invarianza del E.M.V.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

86

Cap´ıtulo 6. Estimaci´ on EJERCICIO 9 Sean X1 , X2 , . . . , Xn variables aleatorias i.i.d. con funci´on densidad dada por  (α + 1)xα ;0 < x < 1 fX (x) = 0 ;e.o.c. (a) Encuentre el estimador de α por el m´etodo de momentos. (b) Encuentre el estimador de α por el m´etodo de m´axima verosimilitud. (c) Eval´ ue ambos estimadores usando los siguientes datos: X 0.1 - 0.3 0.3 - 0.6 0.6 - 0.7 0.7 - 0.9 Frecuencia 3 1 2 3 ´ SOLUCION

(a) El m´etodo de momentos consiste en igualar el momento muestral con el momento poblacional. Para el caso k = 1 tenemos la siguiente igualdad E(X) = X Necesitamos calcular E(X): Z E(X) =

Z xfX (x)dx =

x · (α + 1)xα dx

Rec X

Rec X

Z = (α + 1)

1

xα+1 dx

0

= (α + 1)

=

α+1 α+2

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

xα+2 1 α+2 0

6.1 Ejercicios Resueltos

87

Luego

E(X) = X



α+1 =X α+2

⇒ α + 1 = αX + 2X ⇒ α(1 − X) = 2X − 1

⇒α ˆM M =

2X − 1 1−X

(b) L(x, α) =

n Y

n n Y Y f (xi ) = (α + 1)xαi = (α + 1)n xi

i=1

i=1

`(x, α) =n ln(α + 1) + α

i=1

n X

\∂α

ln(xi )

i=1

n

X n ∂` = + ln(xi ) = 0 ∂α α + 1 i=1 n

X n ⇒ =− ln(xi ) α+1 i=1 ⇒α+1=

−n n X

ln(xi )

i=1

 ⇒α ˆM V



    n  = − + 1 n  X   ln(xi ) i=1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

!α \ ln

88

Cap´ıtulo 6. Estimaci´ on (c) Para evaluar los estimadores necesitamos convertir los datos tabulados a un set de datos compuestos por las marcas de cada clases (0.2) (0.45) (0.65) (0.8) 0.1 - 0.3 0.3 - 0.6 0.6 - 0.7 0.7 - 0.9 X Frecuencia 3 1 2 3 Se puede representar el conjunto de valores para X como: [X : 0,2; 0,2; 0,2; 0,45; 0,65; 0,65; 0,8; 0,8; 0,8] Calculando ahora lo necesario para poder evaluar los estimadores con estos datos tabulados k

1X 1 X= mi · fi = (0,2 · 3 + 0,45 · 1 + 0,65 · 2 + 0,8 · 3) = 0,5277 n i=1 9 n X

ln(xi ) = ln

i=1

n Y

! = ln(0,000778752) = −7,15781

xi

i=1

Luego al evaluar estos resultados en los estimadores, estos toman los siguientes valores: α ˆM M =  α ˆM V

2X − 1 2 · 0,52777 − 1 = 0,117612 = 1 − 0,52777 1−X 

      9 n   = − n + 1 = − + 1 = 0,257367 −7,15781 X  ln(xi ) i=1

EJERCICIO 10 Sean X1 , ..., Xn , Y1 , ..., Yn v.a. independientes con Xi ∼ Exp( α1 ) e Yj ∼ Exp( β1 ), con i = 1, ..., n; j = 1, ..., n. Se define el par´ametro θ = (θ1 , θ2 ) por θ1 = α y θ2 = αβ . (a) Determine los EMV (estimador m´aximo veros´ımil) para θ1 y θ2 (b) Encuentre el sesgo y el ECM (error cuadr´atico medio) de θˆ1 ´ SOLUCION (a) Dada la independencia existente entre las variables, tenemos que la densidad conjunta yi xi es fXi ,Yj (xi , yj ) = α1 e− α β1 e− β , luego la verosimilitud conjunta es la siguiente: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

89

L(θ) =

P

xi α

1 e− αn β n

`(θ) = −

P

xi α



e

P

yi β



P

yi β

\ ln

− n ln(α) − n ln(β) \∂α

∂` ∂α

=

P



n α

= 0 −→ α ˆ = x¯ = θˆ1

∂` ∂β

=

P



n β

= 0 −→ βˆ = y¯

xi α2

yi β2

ˆ Tenemos que por la invarianza de los EMV’s, θˆ2 = αβˆ , luego reemplazando queda que θˆ2 = xy¯¯ .

(b) Por f´ormula el ECM (θˆ1 ) = V ar(θˆ1 ) + Sesgo2 (θˆ1 ), donde el Sesgo(θˆ1 ) = E(θˆ1 ) − θ1 . Luego veremos primero si tiene sesgo (sesgado): 

n X



xi   n n  i=1  1 X 1X ˆ   E(θ1 ) = E  E(xi ) = α=α = n i=1  n  n i=1 Luego como es insesgado (recuerde que θ1 = α), el Sesgo(θˆ1 ) = 0. Por lo tanto para calcular el ECM (θˆ1 ) basta calcular su varianza. 

n X



! xi   n X  i=1  1  V ar(θˆ1 ) = V ar  xi  n  = n2 V ar   i=1 ind

=

Por lo tanto ECM (θˆ1 ) =

α2 n

n n 1 X 1 X 2 α2 V ar(x ) = α = i n2 i=1 n2 i=1 n n→∞

el cual −→ 0.

EJERCICIO 11 Sean X1 , ..., Xn iid con densidad λe

−λx

,

x ≥ 0,

n ≥ 2. Sea Sn =

n X i=1

que Z = λSn tiene densidad: fZ (z) =

z n−1 e−z , (n − 1)!

ˆ= Utilice esto para calcular el sesgo y el ECM de λ

z≥0 n−1 . Sn

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

Xi . Es bien conocido

90

Cap´ıtulo 6. Estimaci´ on ´ SOLUCION ˆ Nesecitamos calcular la esperanza y varianza de λ.













      n−1  1   λ  ˆ =E  = (n − 1)E   = (n − 1)E   E(λ) n n n   X X  X        xi xi λ xi i=1

i=1

i=1

    1 λ = λ(n − 1)E = (n − 1)E Z Z = λ(n − 1)E(Z −1 ) ∞

Z = λ(n − 1)

z

−1 z

e dz = λ(n − 1) (n − 1)!

0

λ(n − 1) = n−1

Z 0



n−1 −z

Z 0



z n−2 e−z dz (n − 1)!

z n−2 e−z dz = λ (n − 2)!

ˆ es un estimador insesgado, es decir, Sesgo(λ) ˆ = 0. Luego queda que: Por lo tanto λ

ˆ = V ar(λ) ˆ = E(λ ˆ 2 ) − E 2 (λ) ˆ ECM (λ)  =E

n−1 Sn

2 !

λ2 Z2



2

= (n − 1) E

− λ2



− λ2

= λ2 (n − 1)2 E(Z −2 ) − λ2

2

2

Z

= λ (n − 1)

0



z −2

z n−1 e−z dz − λ2 (n − 1)!

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

91 λ2 (n − 1)2 = (n − 1)(n − 2)

ˆ = Por lo tanto el ECM (λ)

=

λ2 (n − 1) − λ2 (n − 2)

=

λ2 n−2

λ2 n→∞ −→ n−2

Z 0



z n−3 e−z dz − λ2 (n − 3)!

0.

EJERCICIO 12 iid

Sean Y1 , ..., Yn ∼ U (0, θ). Sea T = M ax(Y1 , ..., Yn ) y considere los estimadores de θ de la forma cT, c ≥ 0. (a) ¿Para qu´e valor de c, cT es insesgado? (b) ¿Para qu´e valor de c, el ECM (cT ) es m´ınimo? ´ SOLUCION Si T corresponde al M´aximo, entonces su funci´on densidad es de la forma fT (t) = n[FY (t)]n−1 fY (t), donde fY (t) = 1θ y FY (t) = θt . (a) Calcularemos la esperanza para determinar el insesgamiento. E(cT ) = cE(T ) θ

Z =c

tn 0

cn = n θ

= Luego si c =

n+1 , n

Z 0

tn−1 1 dt θn−1 θ

θ

tn dt =

cn tn+1 θ θn n + 1 0

cn θn+1 cnθ = n θ n+1 n+1

cT es insesgado.

(b) En primer lugar calcularemos lo necesario para obtener el ECM y as´ı despu´es encontrar el c que lo minimice. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

92

Cap´ıtulo 6. Estimaci´ on

E(θˆ2 ) = E((cT )2 ) = c2 E(T 2 )

=c

2

θ

Z

tn−1 1 c2 n t n n−1 dt = n θ θ θ 2

0

c2 n = n θ



tn+2 θ n+2 0

 =

θ

Z

tn+1 dt

0

c2 nθ2 n+2

ˆ Ahora calculemos V ar(θ): 2 2 2 2 2 ˆ = c nθ − c n θ V ar(θ) n + 2 (n + 1)2

2

= c nθ

2

2

= c nθ

2

2

2

= c nθ



n 1 − n + 2 (n + 1)2





(n + 1)2 − n(n + 2) (n + 1)2 (n + 2)



1 (n + 1)2 (n + 2)





Por lo tanto el sesgo queda de la siguiente forma: ˆ = cnθ − θ = θ Sesgo(θ) n+1



cn − n − 1 n+1



y as´ı obtenemos el ECM , resultando: ˆ = ECM (θ)

c2 nθ2 + θ2 (n + 1)2 (n + 2)



(cn − n − 1)2 (n + 1)2



Ahora utilizando los m´etodos matem´aticos (1a Derivada) para minimizar, encontraremos el c correspondiente. ˆ ∂ECM (θ) 2cnθ2 2θ2 n(cn − n − 1) = + =0 ∂c (n + 1)2 (n + 2) (n + 1)2 n+2 n+1 Para verificar si realmente es m´ınimo, se calcula la segunda derivada. −→ c =

ˆ ∂ 2 ECM (θ) 2nθ2 = ∂c2 n+2 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

93

la cual es positiva ∀n > 0, luego cuando c =

n+2 , n+1

ˆ se minimiza. el ECM (θ)

EJERCICIO 13 Suponga que X sigue una distribuci´on de Pareto, su funci´on de densidad est´a dada por:

f (x|α, θ) = θαθ x−θ−1 , x ≥ α y

θ≥1

Asuma que α > 0 es conocido y que X1 , . . . , Xn son v.a. iid. (a) Encuentre un estimador de momentos para θ. (b) Determine el EMV de θ. ´ SOLUCION Como los Xi siguen distribuci´on de Pareto, se tiene que su esperanza y varianza son conocidas:

E(X) =

θα , θ−1

θ>1

V ar(X) =

θα2 , (θ − 1)2 (θ − 2)

θ>2

(a) Igualando el momento poblacional con el muestral, se obtiene el estimador de momentos: n

1X θα = Xi θ−1 n i=1 θα =X θ−1 θα − θX = −X

θˆ =

X X −α

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

94

Cap´ıtulo 6. Estimaci´ on (b) Teniendo que las observaciones distribuyen Pareto, la funci´on de verosimilitud es la siguiente:

L(α, θ) =

n Y

−(θ+1)

θαθ xi

i=1

= θn αnθ

n Y

!−(θ+1) \ ln

xi

i=1

`(α, θ) = n ln(θ) + nθ ln(α) − (θ + 1)

n X

ln(xi ) \∂θ

i=1

∂` ∂θ

=

n θ

+ n ln(α) −

n X

ln(xi ) = 0

i=1

→ θˆ =

−n

n ln(α)−

n X

ln(xi )

i=1

EJERCICIO 14 Sea Y1 , ..., Yn una muestra aleatoria proveniente de una poblaci´on N (θ, θ), con θ > 0 y desconocido. A partir de una muestra aleatoria correspondiente a 25 pesos de circuitos, con n n X X Yi = 1264 y con Yi2 = 5240, determine la estimaci´on m´aximo verosimil de θ. i=1

i=1

´ SOLUCION

L(θ) =

n Y i=1

1 √ exp 2πθ



1 (yi − θ)2 2θ

( −n 2

= (2πθ)

1 exp − 2θ

n X



) (yi − θ)2

i=1

`(θ) = − n2 ln(2π) −

n 2

ln(θ) −

1 2θ

n X i=1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

(yi − θ)2

\ ln

6.1 Ejercicios Resueltos

=

− n2

95

ln(2π) −

n 2

ln(θ) −

1 2θ

n X

(yi2 − 2θyi + θ2 )

i=1

= − n2 ln(2π) −

n 2

ln(θ) −

1 2θ

n X

yi2 +

i=1

∂` ∂θ

=

n − 2θ

1 2θ2

+

n X

yi2 −

i=i

X −→

− nθ

+

−nθ +

yi2

θ2 n X

n X

yi −

i=1

nθ2 \∂θ 2θ

n =0 2

−n=0

\ · θ2

yi2 − nθ2 = 0

\ · − n1

i=1

θ−

n X

yi2 /n + θ2 = 0

i=1

θ2 + θ − y 2 = 0 √ θˆ =

−1±

1+4y 2 2

EJERCICIO 15 Ingenieros el´ectricos japoneses han inventado un sistema de radar llamado detector de blancos m´oviles (MTD, moving target detector), dise˜ nado para rechazar los ecos par´asitos provocados por el terreno, la lluvia, las aves y otras fuentes de interferencia. Los investigadores han demostrado que la magnitud X de la frecuencia Doppler de una se˜ nal recibida por radar se puede modelar por una distribuci´on Weibull, con par´ametro α = 2 y β > 0, tal que:   1 2 2x exp − x f (x) = β β

x>0

En base a una muestra aleatoria de tama˜ no n,determine el estimador m´aximo ımil de P50 veros´ 2 β y obtenga su estimaci´on con las siguientes magnitudes de frecuencias si i=1 xi = 51,9.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

96

Cap´ıtulo 6. Estimaci´ on ´ SOLUCION

L(β) =

n Y 2xi

β

i=1

=

2n βn

 exp

1 2 x β i



(

n Y

n 1X 2 xi exp − xi β i=1 i=1

`(β) = n ln(2) − n ln(β) +

n X

)

ln(xi ) −

i=1 n X ∂` ∂β

= − βn + n X



βˆ =

n 1X 2 x \∂β β i=1 i

x2i

i=1 β2

=0

x2i

i=1 n n X

\ ln

=

β2 β

x2i

i=1 n

Reemplazando por los valores dados en el inicio, queda que βˆ = 1,038 EJERCICIO 16 En una f´abrica se seleccionan diariamente motores y se inspeccionan hasta encontrar el primer motor defectuoso. Sea (X1 , . . . , Xn ) una m.a. de X distribuida geom´etricamente con p desconocido. (a) Determine el estimador de momentos para p. (b) Determine el estimador m´aximo veros´ımil de p. (c) De los registros de 100 d´ıas se obtuvo la siguiente informaci´on del n´ umero de motores inspeccionados. N o de motores inspeccionados 1 2 3 4 5 N o de d´ıas 8 10 15 25 42 Estime la probabilidad de que en un d´ıa cualquiera se deban inspeccionar m´as de dos motores para encontrar uno defectuoso. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

97

´ SOLUCION Dado que Xi ∼ Geom(p) tenemos que: P (X = x) = p(1 − p)x−1 ;

E(X) =

1 p

V ar(X) =

(a) Igualando momento poblacional con el muestral, queda: n X

1 = p

pˆ =

xi

i=1

n n n X

= xi

1 x

i=1

(b) Encontremos ahora los estimadores M.V.

L(p) =

n Y

p(1 − p)xi −1

i=1

n X n

= p (1 −

(xi − 1)

p) i=1 n X

xi − n

n

= p (1 − p) i=1 n X `(p) = n ln(p) + ( xi − n) ln(1 − p) i=1

= n ln(p) +

n X

xi ln(1 − p) − n ln(1 − p)

i=1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

1 p2

98

Cap´ıtulo 6. Estimaci´ on

n X

xi n n ∂` i=1 = − + =0 ∂p p 1−p 1−p n X

n = p

xi − n

i=1

1−p n X

n(1 − p) = p

! xi − n

i=1

pˆ =

n n X

xi

i=1

(c) Recordando la propiedad de invarianza que tienen los estimadores m´aximo veros´ımiles, lo que se pide, se puede traducir estad´ısticamente en: P (X > 2) = 1 − P (X ≤ 2) = 1 − P (X = 1) − P (X = 2) = 1 − pˆ(1 − pˆ)1−1 − pˆ(1 − pˆ)2−1 = 1 − pˆ − pˆ(1 − pˆ) = (1 − pˆ)2 = 0,261

EJERCICIO 17 Sean X1 , . . . , Xn i.i.d. ∼ U (θ1 , θ2 ). Es decir, la densidad de Xi es: f (x) =

1 θ2 − θ1

θ1 ≤ x ≤ θ2

(a) Encuentre el estimador de momentos para los par´ametros de esta distribuci´on. (b) Encuentre el estimador m´aximo veros´ımil para θ1 y θ2 .

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

6.1 Ejercicios Resueltos

99

´ SOLUCION

(a) Se necesita encontrar los estimadores de θ1 y θ2 , luego por ser dos par´ametros, utilizaremos el primer y segundo momento para armar un sistema de ecuaciones. Momentos poblacionales: E(X) =

θ1 + θ2 2 Z

2

θ2

E(X ) = θ1

x2

1 dx θ2 − θ1

θ22 + θ2 θ1 + θ12 = 3 Igualando momentos poblacionales con muestrales, queda el siguiente sistema de ecuaciones: θ1 + θ2 =x 2

(1)

θ22 + θ2 θ1 + θ12 = x2 3

(2)

Despejando tenemos de (1) que θ1 = 2x − θ2 y reemplazando en la segunda ecuaci´on se obtiene:

2

(2x − θ2 ) + (2x − θ2 )θ2 +

2

4x − 4xθ2 +

θ22

+ 2xθ2 −

θ22

+

θ22

θ22

x2i n

P =3

x2i n

P =3

θ22 − 2xθ2 + 4x2 − 3x2 = 0 Resolviendo esta ecuaci´on de segundo grado con los m´etodos usuales, se obtiene: p

p √ 4x2 − 16x2 + 12x2 = x ± 3x2 − 3x2 = x ± 3S 2 2 √ Luego reemplazando θˆ2 en (1) se tiene que θˆ1 = 1 − θˆ2 = 1 − x ∓ 3S 2 . θˆ2 =

2x ±

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

100

Cap´ıtulo 6. Estimaci´ on (b) En el caso de aquellas distribuciones en que su dominio depende de los par´ametros a estimar (en este caso la distribuci´on es v´alida cuando θ1 ≤ x ≤ θ2 ), el procedimiento de estimaci´on debe considerar un muy peque˜ no detalle como se muestra a continuaci´on:

L(θ1 , θ2 ) =

1 I(θ ,θ ) (x1 ) . . . I(θ1 ,θ2 ) (xn ) (θ2 − θ1 )n 1 2

n Y 1 I(θ ,θ ) (xi ) = (θ1 , θ2 )n i=1 1 2

n Y 1 = I(x >θ ) (xi )I(xi θ1 ) (xi )I(max(xi ) 0

a) Se puede demostrar que E(X 2 ) = 2θ. Utilice este hecho para construir un estimador insesgado de θ con base en ΣXi2 y use las reglas para demostrar que es insesgado. b) Estime θ de las siguientes n = 10 observaciones sobre el esfuerzo vibratorio de una paleta de turbina bajo condiciones espec´ıficas: 16,88 14,23 10,23 19,87 4,59 9,40 6,66 6,51 13,68 10,95 8. Suponga que el verdadero valor promedio de crecimiento µ de un tipo de planta, durante un periodo de un a˜ no, es id´entico al de un segundo tipo, pero la varianza de crecimiento para el primer tipo es σ 2 , mientras que para el segundo tipo la varianza es 4σ 2 . Sean X1 , . . . , Xm las m observaciones independientes de crecimiento en el primer tipo (entonces, E(Xi ) = µ, V (Xi ) = σ 2 ).Sean Y1 , . . . , Yn las n observaciones independientes de crecimiento en el segundo tipo (E(Yi ) = µ, V (Yi ) = 4σ 2 ). a) Demuestre que para cualquier δ entre 0 y 1, el estimador µ b = δX + (1 − δ)Y es insesgado para µ. b) Para m y n fijas, calcule V (b µ) y luego encuentre el valor de δ que reduzca V (b µ) al m´ınimo. (Sugerencia: derive V (b µ) con respecto a δ.) 9. Se selecciona una muestra aleatoria de n cascos para ciclistas, fabricados por cierta compa˜ n´ıa. Sea X = n´ umero entre los n que tienen defectos y p = P(con defectos). Suponga que s´olo se observa X, en lugar de las secuencia de las S y las F . a) Obtenga el estimador de m´axima verosimilitud de p. Si n = 20 y x = 3, ¿cu´al es la estimaci´on? b) ¿Es insesgado el estimador del inciso a)? c) Si n = 20 y x = 3, ¿cu´al es el EMV de la probabilidad (1 − p)5 de que ninguno de los siguientes cinco cascos que se examinen tengan defectos? 10. Se observan dos sistemas diferentes de computadora durante un total de n semanas. Represente con Xi el n´ umero de descomposturas del primer sistema durante la i-´esima semana y suponga que las Xi son independientes y obtenidas de una distribuci´on de Poisson con par´ametro λ1 . De forma similar, represente con Yi el n´ umero de descomposturas del segundo sistema durante la i-´esima semana y suponga independencia en cada Yi de Poisson, con par´ametro λ2 . Obtenga los EMV de λ1 , λ2 y λ1 − λ2 . (Sugerencia: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

104

Cap´ıtulo 6. Estimaci´ on mediante el uso de independencia, escriba la pdf conjunta (verosimilitud) de las Xi , y Yi juntas.) 11. Se determina la resistencia al corte de cada una de diez soldaduras el´ectricas por puntos de prueba, obteni´endose los siguientes datos (lb/pulg 2 ): 392 376 401 367 389 362 409 415 358 375 a) Si se supone que la resistencia al corte est´a normalmente distribuida, estime el verdadero promedio de resistencia al corte y su desviaci´on est´andar con el m´etodo de m´axima verosimilitud. b) Otra vez, suponiendo una distribuci´on normal, estime el valor de resistencia abajo del cual 95 % de todas las soldaduras tendr´an sus resistencias. (Sugerencia: ¿cu´al es el percentil 95 en t´erminos de µ y σ? Ahora utilice el principio de invarianza.) 12. Consulte el ejercicio anterior. Suponga que decidimos examinar otra soldadura por puntos de prueba. Sea X = resistencia al corte de la soldadura. Utilice la informaci´on dada para obtener el EMV de P (X ≤ 400). (Sugerencia: P (X ≤ 400) = Φ((400 − µ)/σ).) 13. Represente por X1 , . . . , Xn una muestra aleatoria de la distribuci´on de Rayleigh con la funci´on de densidad dada en el ejercicio 7. Determine: a) El estimador de m´axima verosimilitud de θ y despu´es calcule la estimaci´on para los datos de esfuerzo vibratorio proporcionados en ese ejercicio. ¿Es este estimador el mismo que el insesgado sugerido en el ejercicio 7? b) El EMV de la mediana de la distribuci´on del esfuerzo vibratorio. (Sugerencia: primero exprese la mediana en t´erminos de θ.) 14. En el tiempo t = 0 se ponen a prueba 20 componentes id´enticos. La distribuci´on de duraci´on de cada uno es exponencial con par´ametro λ. El experimentador sale entonces de la planta de prueba, la cual queda sin vigilancia, y a su regreso, 24 horas despu´es, termina de inmediato la prueba, despu´es de observar que y = 15 de los 20 componentes todav´ıa est´an en operaci´on (es decir, 5 fallaron). Obtenga el EMV de λ. (Sugerencia: sea Y = n´ umero que resisti´o 24 horas. Entonces, Y ∼ Bin(n, p). ¿Cu´al es el EMV de p? Ahora observe que p = P (X ≥ 24) donde Xi est´a distribuida exponencialmente. Esto relaciona λ con p, de modo que la primera se puede estimar una vez que la u ´ltima se haya estimado.) 15. Sea X1 , X2 , . . . , Xn una muestra aleatoria tomada de una distribuci´on gamma con par´ametros r y λ . a) Encuentre la funci´on y el log de la verosimilitud. b) Encuentre las ecuaciones de definen los estimadores de m´axima verosimilitud para r y λ. Pueden resolverse de manera expl´ıcita? c) Demuestre que el estimador de m´axima verosimilitud de µ =

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

r λ

es µ ˆ = X.

Cap´ıtulo 7 Intervalos de Confianza y Test de Hip´ otesis 7.1.

Ejercicios Resueltos

EJERCICIO 1 Una compa˜ n´ıa de taxis est´a tratando de decidir si compra la marca A o la marca B de neum´aticos para su flota de autom´oviles. Para estimar la diferencia entre las dos marcas, se lleva a cabo un experimento con 12 neum´aticos de cada marca. Los n´ umeros se utilizan hasta que se gastan. Los resultados son: Marca Media (Km) A 36.300 B 38.100

Desv. Stand. (Km) 5.000 6.100

(a) Calcule un intervalo de confianza para µ1 − µ2 , suponiendo que las poblaciones tienen distribuci´on normal con varianzas iguales. (b) Encuentre un intervalo de confianza para µ1 − µ2 , si se asigna un neum´atico de cada compa˜ n´ıa en forma aleatoria a las ruedas traseras de ocho taxis y se registran, en kil´ometros las siguientes distancias: Taxi Marca A Marca B 1 34.400 36.700 2 45.500 46.800 3 36.700 37.700 4 32.000 31.100 5 48.400 47.800 6 32.800 36.400 7 38.100 38.900 8 30.100 31.500 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

106

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis Asuma que las diferencias de las distancias est´an distribuidas aproximadamente en forma normal. (c) Determine un intervalo de confianza de 90 % para σ22 /σ12 . ¿Qu´e puede concluir? ´ SOLUCION Tenemos que nA = nB = 12.

(a) I.C para µ1 − µ2 suponiendo varianzas iguales y desconocidas es el siguiente:

r (X−Y )−Sp

1 1 + t(n +n −2,1− α2 ) ≤ µ1 −µ2 ≤ (X−Y )+Sp n1 n2 1 2

r

1 1 + t(n +n −2,1− α2 ) n1 n2 1 2

Luego necesitamos Sp2 =

De aqu´ı obtenemos Sp =



(n1 −1)S22 +(n2 −1)S12 n1 +n−2−2

=

(12−1)50002 +(12−1)61002 12+12−2

=

684310000 22

=

31105000

31105000 = 5577,18.

∴ el I.C. queda r (36300−38100)−5577,18

1 1 + t ≤ µ1 −µ2 ≤ (36300−38100)+5577,18 12 12 (22;0,975)

r

1 1 + t 12 12 (22;0,975)

Reemplazando t(22;0,975) = 2,0738, el I.C. al 95 % de Confianza para µ1 − µ2 es: −6521,94 ≤ µ1 − µ2 ≤ 2921,94 (b) Lo que nos piden es un I.C. para datos pareados. Primero que todo tenemos que calcular las diferencias para cada par de datos como sigue: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

107 Taxi Marca A Marca B 1 34.400 36.700 2 45.500 46.800 3 36.700 37.700 4 32.000 31.100 5 48.400 47.800 6 32.800 36.400 7 38.100 38.900 8 30.100 31.500

di -2300 -1300 -1000 900 600 -3600 -800 -1400

Un I.C. para µ1 − µ2 esta definido como: SD SD d − √ t(n−1;1− α2 ) ≤ µ1 − µ2 ≤ d + √ t(n−1;1− α2 ) n n donde, d = X A − X B = 37250 − 38362,5 = −1112,5

2 SD

Pn =

− d)2 n−1

i=1 (di

luego 2 SD =



14808750 = 2115535,71428 7 SD = 1454,488127

Ocupando un α = 0,05 el valor para t(n−1;1− α2 ) es t(7;0,975) = 2,3646. Reemplazando el I.C. para µ1 − µ2 queda: −111,5 −

1454,4881 1454,4881 √ √ · 2,3646 ≤ µ1 − µ2 ≤ −111,5 + · 2,3646 8 8

es decir, un I.C. al 95 % para µ1 − µ2 es −2328,47 ≤ µ1 − µ2 ≤ 103,47 (c) Un I.C. para σ22 /σ12 al 90 % esta determinado por: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

108

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis

S22 α F S12 n1 −1;n2 −1−; 2



σ22 σ12



S22 α F S12 n1 −1;n2 −1;1− 2

61002 F 50002 11;11;0,05



σ22 σ12



61002 F 50002 11;11;0,95

61002 50002



σ22 σ12





σ22 σ12



· 0,3548

0,528

61002 50002

· 2,82

4,1973

Como el 1 se encuentra en el I.C. no se rechaza que σ12 = σ22 . EJERCICIO 2 Dos tipos diferentes de aleaci´on, A y B, se han utilizado para fabricar espec´ımenes experimentales de un peque˜ no eslab´on de tensi´on, empleado en cierta aplicaci´on de ingenier´ıa. Se determin´o la resistencia m´axima (en ksi) de cada esp´ecimen y los resultados se resumen en la siguiente tabla de distribuci´on de frecuencia.

26-30 30-34 34-38 38-42

A B 6 4 12 9 15 19 7 10 40 42

Calcule un intervalo de confianza de 95 % para la diferencia entre las proporciones reales de todos los espec´ımenes de aleaciones A y B que tengan una resistencia m´axima de por lo menos 34 ksi. ´ SOLUCION Un I.C para las diferencias de proporciones esta definido por: s (b pA −b pB )−

pbA (1 − pbA ) pbB (1 − pbB ) + ×Z1− α2 ≤ pA −pB ≤ (b pA −b pB )+ n1 n2

s

pbA (1 − pbA ) pbB (1 − pbB ) + ×Z1− α2 n1 n2

Mirando en la tabla los rangos, sumamos las frecuencias de los rangos que cumplen tener una resistencia mayor de 34 ksi, luego reemplazando pbA = 22 , pbB = 29 y Z0,975 = 1,96. 40 42 ∴ el I.C. al 95 % para pA − pB es: −0,348 ≤ pA − pB ≤ 0,067 Como el 0 ∈ al Intervalo, se puede decir con un 95 % de confianza que pA = pB .

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

109

EJERCICIO 3 Una firma decide estudiar una muestra aleatoria de 20 proyectos que envi´o para ser evaluados, tanto a consultores externos, como a su propio departamento de proyectos. Las variables medidas fueron X: no de d´ıas que demoro la evaluaci´on. Y : no de variables consideradas en la evaluaci´on. Z: Consultor al que se le envi´o el proyecto   −1 ; Depto. de Evaluaci´on 0 ; Robani Consultores Z=  1 ; Tanaka Ltda. W : Costo de la evaluaci´on (en U.F.) Los resultados de este muestreo son: No X Y Z W

1 4 3 -1 40

2

3

2 1 -1 30.5

8 6 0 80.3

4 10 8 0 68.5

5

6

7

8

9

1 3 0 24.7

3 2 0 40.5

8 6 1 90.6

3 2 0 38.5

2 1 0 50.4

10 2 1 1 50.2

11 4 4 -1 60.1

12 4 4 -1 60.8

13 5 4 0 70.9

14 6 7 1 80

15 7 10 1 90

16 2 3 -1 30

17 1 2 -1 27

18 3 4 0 40

19 4 5 1 50

20 9 10 -1 40

Explicitando los supuestos necesarios: (a) Estime con un 90 % de confianza el costo medio de los proyectos. (b) Estime con un 90 % de confianza la proporci´on de proyectos cuyo costo fue inferior a 50 U.F. dado que no involucraron m´as de 6 variables y que fueron resueltos en un tiempo superior a 2 d´ıas. (c) El Depto. de control afirma que el costo medio de enviar los proyectos a asesores externos es significativamente mayor que el de evaluarlos all´ı mismo. ¿Qu´e concluye usando α = 0,05? (d) Tanaka Ltda. Afirma que la proporci´on de proyectos que ellos eval´ uan, que toman m´as tiempo de m´as de 4 d´ıas, no es superior a la proporci´on de proyectos que eval´ ua Robani Consultores, que toman un tiempo m´as de 4 d´ıas, no es superior a la proporci´on de proyectos que eval´ ua Robani Consultores, que toman un tiempo m´as de 4 d´ıas. Concluya si la afirmaci´on de Tanaka Ltda. es correcta. (Use α = 0,01) ´ SOLUCION

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

110

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis (a) IC(µW ) = W ∓ tn−1;1− α2 S√Wn , donde α = 5 % = 0,05 → t20−1;1− 0,05 = t19;0,975 = 2,093 2

Luego con 2 W SW SW n 53,15 20,948 438,828 20

tenemos que el IC(µW ) es: 20,978 IC(µW ) = 53,15 ∓ 2,093 · √ 20 ⇒ µW ∈ (43,346; 62,953) (b) IC(p) = pˆ ∓ Z1− α2 ·

q

pˆqˆ , n

donde α = 10 % = 0,1 → Z1− 0,1 = Z0,95 = 1,645 2

luego con pˆ qˆ n 1 1 8 2 2 tenemos que el IC(p) es: IC(p) =

0,5 · 0,5 1 ∓ 1,645 · 2 8

⇒ p ∈ (0,209; 0,790) (c) Definamos primero: E: Asesores externos L: Asesores locales (internos) Luego tenemos la siguiente tabla resumen n X S S2 E 13 59,584 21,629 467,838 L 7 41,2 14,058 197,636 Sea µE : costo medio asesores externos µL : costo medio asesores locales (internos) Las hip´otesis son H0 : µ E = µ L

vs

H 1 : µE > µ L

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

111

primero haremos un test de varianzas para determinar como son ´estas y as´ı saber como testamos las medias. Las hip´otesis son: H0 :

σE2 =1 σL2

vs

H1 :

σE2 6= 1 σL2

las cuales se dociman mediante el estad´ıstico F: F =

SE2 = 2,367 SL2

Y se rechaza H0 si: F > F1 ∨ F < F2 donde F1 y F2 considerando α = 0,05 son: F1 = FnE −1;nL −1;1− α2 = F12;6;0,975 = 5,37 F2 = FnE −1;nL −1; α2 = F12;6;0,025 =

1 F6;12;0,975

=

1 = 0,268 3,73

Como F (2.367) no es mayor que F1 ni menor que F2 , no existe suficiente evidencia bajo un 95 % de confianza para rechazar H0 , es decir, se pueden considerar las varianzas desconocidas pero iguales. Ahora hacemos un test de diferencias de medias, donde el estad´ıstico Tc es: Tc =

XE − XL q Sp n1E + n1L

donde

Sp2 =

=

(nE − 1)SE2 + (nL − 1)SL2 nE + nL − 2 12 · 467,8382 + 6 · 197,6362 18

= 158934,925

⇒ Sp = 398,666 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

112

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis Reemplazando el estad´ıstico queda: Tc =

59,584 − 41,2 q 1 398,666 · 13 +

= 0,098 1 7

Luego se rechaza H0 si Tc > tν,1−α . donde tν,1−α es: tν,1−α = tnE +nL −2,1−α = t18;0,95 = 1,734 como Tc no es mayor que tν,1−α , no existe suficiente evidencia para rechazar H0 , luego la opini´on del Depto. no es correcta. (d) La hip´otesis para este caso es la siguiente: H0 : p T ≤ p R

vs

H1 : pT > p R

necesitaremos la siguiente informaci´on pˆT pˆR nT nR qˆT qˆR 0,8 0,25 5 8 0,2 0,75 El estadistico Zc es Zc = q

pˆT − pˆR pˆT ·ˆ qT nT

+

pˆR ·ˆ qT nR

=q

0,8 − 0,25 0,8·0,2 5

+

= 2,335

0,25·0,75 8

Se rechaza H0 si Zc > Z1−α . Z1−α = Z1−0,01 = Z0,99 = 2,325 Como Zc > Z0,99 , se rechaza H0 , por lo tanto Tanaka Ltda tiene raz´on. EJERCICIO 4 La consejal´ıa de la Juventud de un Ayuntamiento maneja el dato de que la edad a la que los hijos se independizan de sus padres es una variable aleatoria normal con media 29 a˜ nos. Aunque la desviaci´on est´andar no plantea dudas, se sospecha que la media ha aumentado, sobre todo por el poco apoyo a la pol´ıtica de ayuda al empleo que ha llevado a cabo el Ayuntamiento. As´ı de un estudio reciente sobre 100 j´ovenes que se acaban de independizar, se ha obtenido una media de 30.7 a˜ nos de edad y una desviaci´on est´andar de 3 a˜ nos. (a) Con un nivel de significancia del 1 %, ¿es correcta la sospecha que se tiene, acerca de la edad media en que se independizan los j´ovenes? Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

113

(b) Se sabe que el porcentaje de personas que corresponden al sexo femenino y se independizan antes de los 29 a˜ nos, no supera el 45 %. Si en la muestra, 60 j´ovenes son mujeres, y 35 de ellas cumplen con las caracter´ısticas antes expuestas, ¿Qu´e se puede concluir con un nivel de significancia del 5 %?. ´ SOLUCION Rescatemos que n = 100, x¯ = 30,7 y s = 3 (a) La hip´otesis adecuada para esta conjetura es:

H0 : µ ≥ 29

H1 : µ < 29

Debemos hacer una prueba para la media, con σ 2 desconocido, ocupando el estad´ıstico :

T =

30,7 − 29 x¯ − µ0 √ = √ = 5,66 s/ n 3/ 100

Ahora, por las caracter´ısticas de la hip´otesis, rechazamos H0 , si T < −tn−1,1−α donde el −tn−1,1−α se obtiene buscando en una tabla t-Student −t99,0,99 (α = 0,01) el cual resulta -2.36. Por lo tanto, como: 5,66 ≮ −2,36 No existe evidencia suficiente en los datos para rechazar H0 , es decir, la edad media de independencia en los j´ovenes ha aumentado. (b) Rescatando, tenemos que las mujeres que se independizan antes de los 29 a˜ nos no superan el 45 %, lo cual puede reescribirse en la hip´otesis, de la siguiente manera:

H0 : p ≤ 0,45

H1 : p > 0,45

Lo cual corresponde a un test de hip´otesis para la proporci´on, en donde se ocupa el estad´ıstico :

pˆ − p0

Z=p

p0 (1 − p0 )/n

Pero nos dicen que de 60 mujeres, 35 cumplen con que se independizan antes de los 29 35 a˜ nos, luego pˆ = 60 = 0,5833. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

114

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis Por lo tanto, queda que el estad´ıstico es:

Z=p

0,5833 − 0,45 0,45(1 − 0,45)/60

= 2,07

Ahora, por las caracter´ısticas de la hip´otesis, rechazamos H0 , si Z > Z1−α donde el Z1−α se obtiene buscando en una tabla Normal Z0,95 (α = 0,05) el cual resulta 1.64. Por lo tanto, como: 2,07 > 1,64 existe evidencia suficiente en los datos para rechazar H0 , es decir, la proporci´on de mujeres que se independiza antes de los 29 a˜ nos, supera el 45 %.

EJERCICIO 5 En un estudio sobre h´abitos de alimentaci´on en pel´ıcanos, se marcan 25 hembras y 11 machos, y se les rastrea por radio. La variable de inter´es es la distancia (en mts.) que recorren volando en una pasada, en busca de alimento. Se obtuvieron estos resultados: Hembras: Distancia Media 205 mts. Desv. Est´andar 100 mts. Machos: Distancia Media 135 mts. Desv. Est´andar 90 mts. ¿Puede afirmarse que el comportamiento es diferente, respecto a la distancia media recorrida? ´ SOLUCION Resumiendo tenemos: nh = 25 x¯h = 205 sh = 100 nm = 11 x¯m = 135 sm = 90 Para contestar la pregunta, debemos hacer un test de hip´otesis para la diferencia de medias, es decir: H0 : µh − µm = 0 H1 : µh − µm 6= 0 Pero para esto necesitamos saber el comportamiento de las varianzas en ambas poblaciones. Luego debemos probar si son iguales o no. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

115

H0 :

σh2 =1 2 σm

H1 :

σh2 6= 1 2 σm

Esta hip´otesis, la rechazamos si: s2h > Fnh −1,nm −1,1− α2 s2m

s2h < Fnh −1,nm −1, α2 s2m

o

con α = 0,05, luego reemplazando nos preguntamos: 1002 > F24,10,0,975 ? 902

o

1002 < F24,10,0,025 ? 902

1 donde F24,10,0,975 = 3,36 y F24,10,0,025 = F10,24,0,975 = 0,3788, luego comparando, observamos que las desigualdades no se dan, por lo tanto no existe evidencia en los datos para rechazar que las varianzas de ambas poblaciones son iguales.

Luego ahora docimamos nuestra hip´otesis original, ya sabiendo que las varianzas poblaciones son iguales pero desconocidas, con el estad´ıstico : T = donde

s Sp =

x¯ − x¯m qh Sp n1h + n1m

(nh − 1)s2h + (nm − 1)s2m = 97,165 nh + nm − 2

Luego reemplazando en el estad´ıstico, tenemos que: T =

205 − 135 q 1 97,165 25 +

= 1,99 1 11

Ahora, H0 la rechazamos si: x¯ − x¯m qh > tν,1− α2 Sp n1h + n1m

o

x¯ − x¯m qh < −tν,1− α2 Sp n1h + n1m

con ν = nh + nm − 2, luego tν,1− α2 = t34,0,975 = 2,03. Luego haciendo las comparaciones respectivas, concluimos que no existe evidencia en los datos para rechazar H0 , es decir, las distancias medias recorridas para ambos sexos, en los pelicanos no difieren significativamente. EJERCICIO 6 Se investiga el di´ametro de las varillas de acero fabricadas por dos m´aquinas diferentes de extrusi´on. Para ello se toman dos muestras aleatorias de tama˜ no n1 = 15 y n2 = 18; 2 las medias y las varianzas muestrales son x¯ = 8,73, S1 = 0,35, x¯2 = 8,68 y S22 = 0,4, respectivamente. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

116

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis (a) Suponga que σ12 = σ22 . Construya un intervalo de confianza bilateral del 95 % para la diferencia en el di´ametro promedio de la varilla. (b) Construya un intervalo de confianza bilateral del 95 % para el cuociente de las varianzas σ2 poblacionales σ12 . Parece razonable concluir que las varianzas son iguales? 2

(c) Pruebe la hip´otesis H0 : µ1 = µ2 versus H1 : µ1 6= µ2 . Utilice α = 0,05 y obtenga conclusiones. (d) Calcule el valor p aproximado para esta prueba. ´ SOLUCION (a) Para el caso dado, tenemos el siguiente pivote: (¯ x − y¯) − (µ1 − µ2 ) q ∼ tn1 +n2 −2 Sp n11 + n12 donde

(n1 − 1)S12 + (n2 − 1)S22 n1 + n2 − 2 Por lo tanto reemplazando los datos entregados, en el pivote y en Sp2 correctamente, se tiene que Sp2 = 0,38, t15+18−2,1− α2 = 2,042 y r p 1 1 IC(µ1 − µ2 ) = 8,73 − 8,68 ± 0,38 + · 2,042 15 18 Luego se obtiene que con un 95 % de confianza la diferencia de los di´ametros promedios de las varillas se encuentra en Sp2 =

µ1 − µ2 ∈ [−0,39, 0,49] Note que el 0 ∈ al intervalo, luego esto quiere decir que las medias se pueden considerar iguales con un 95 % de confianza. (b) Para el caso dado, tenemos el siguiente pivote: S12 /σ12 ∼ Fn1 −1,n2 −1 S22 /σ22 Luego el intervalo queda de la forma   2  2 S2 S22 σ2 IC = Fn −1,n2 −1,α/2 , 2 Fn1 −1,n2 −1,1−α/2 σ12 S12 1 S1 Luego reemplazando se tiene σ22 ∈ [0,393, 3,109] σ12 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

117

Note que el 1 pertenece al intervalo, luego con un 95 % de confianza, se puede decir que las varianzas son iguales. (c) Para tal test de hip´otesis y considerando los resultados de las letra (b), el estad´ıstico de prueba es

T =

x¯ − y¯ q Sp n11 +

1 n2

∼ tn1 +n2 −2

El cual rechaza la hip´otesis nula si T > tn1 +n2 −2,1−α/2 o bien T < −tn1 +n2 −2,1−α/2 . Luego reemplazando y evaluando se tiene que

T =

x¯ − y¯ q Sp n11 +

=√

1 n2

8,73 − 8,63 q 1 1 0,38 15 + 18

= 0,23

Luego como T ≯ 2,039 y T ≮ −2,039, no existe evidencia presente en los datos para rechazar H0 . (d) El V alor−p = P (Z > 0,23) = 0,492 y como ´este es mayor que 0.05 (α), no se rechaza H0 . EJERCICIO 7 Los siguientes datos fueron recabados en un experimento dise˜ nado para verificar si existe diferencia sistem´atica en los pesos obtenidos con dos balanzas diferentes.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

118

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis Peso en Gramos Roca Balanza 1 Balanza 2 1 11.23 11.27 2 14.36 14.41 3 8.33 8.35 4 10.50 10.52 5 23.42 23.41 6 9.15 9.17 7 13.47 13.52 8 6.47 6.46 9 12.40 12.45 10 19.38 19.35

Pruebe si la diferencia de las medias de los pesos obtenidos con las balanzas es significativa. ´ SOLUCION En este caso lo que tenemos son muestras pareadas y lo que se pide es testear las siguientes hip´otesis H 0 : µx = µy

vs H1 : µx 6= µy

Cuyo estad´ıstico de prueba es

T =

n X

donde

2 SD

=

X −Y √ ∼ tn−1 SD / n n X

¯2 (di − d)

i=1 n−1

, di = Xi − Yi y d¯ =

di

i=1 n

.

el cual rechaza H0 si T > tn−1,1−α/2 o bien si T < −tn−1,1−α/2 Luego tenemos que 1 2 3 4 5 6 7 8 9 10 i Xi − Yi −0,04 −0,05 −0,02 −0,02 0,01 −0,02 −0,05 0,01 −0,05 0,03 2 de donde se obtiene que d¯ = −0,02 y SD = 0,028672 Luego el estad´ıstico queda

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

119

T =

=

X −Y √ SD / n 12,871 − 12,891 √ 0,0286/ 10

= −2,2114

Por lo tanto, como T ≯ 2,26 = t9,0,975 y T ≮ −2,26 = −t9,0,975 , no existe evidencia en los datos para rechazar H0 . EJERCICIO 8 De dos procesos de producci´on de pl´astico se seleccionaron de cada 10 espec´ımenes en forma independiente. Las mediciones de resistencia fueron:

Pl´astico A 3.03 5.53 5.6 9.3 9.92 12.51 12.95 15.21 16.04 16.84 Pl´astico B 3.19 4.26 4.47 4.53 4.67 4.69 12.87 6.79 9.37 12.75

Utilice la teor´ıa normal para testear la hip´otesis que no existe diferencia entre los procesos de producci´on. ´ SOLUCION Bajo la teor´ıa de Normalidad tenemos: H 0 : µA = µB

vs H1 : µA 6= µB

lo cual se testea con el estad´ıstico T =

XA − XB q ∼ tnA +nB −2 Sp n1A + n1B

el cual rechaza H0 si T > tnA +nB −2,1−α/2 o bien si T < −tnA +nB −2,1−α/2 .

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

120

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis Luego reemplazando tenemos que Sp =



T =

=

18,096 = 4,25 y por lo tanto

XA − XB q Sp n1A + n1B 10,693 − 6,75 p 4,25 2/10

= 2,075

Finalmente como T = 2,075 ≯ 2,10 = t0,975,18 y T = 2,075 ≮ −2,10 = −t0,975,18 , no existe evidencia presente en los datos para rechazar H0 , es decir, con un 95 % de confianza, no existe diferencia entre los procesos. EJERCICIO 9 Los siguientes datos se refieren a los efectos de un f´armaco en la presi´on sangu´ınea de pacientes hipertensos. Los valores corresponden a la presi´on sist´olica de los pacientes despu´es del per´ıodo placebo y despu´es del tratamiento con la droga (se realiz´o una prueba cruzada, actuando cada paciente como su propio control). Placebo 211 210 210 191 196 190 191 177 173 170 156 Droga 181 172 196 203 167 161 178 160 149 119 163 ¿Sugieren estos datos que la nueva droga reduce significativamente el sist´olico de la presi´on sangu´ınea?. Use α = 0,05. ´ SOLUCION Bajo la teor´ıa de normalidad tenemos que las hip´otesis a testear son: H 0 : µP ≤ µD

vs H1 : µP > µD

Considerando que tenemos observaciones pareadas, es decir, dos observaciones a cada individuo (antes y despu´es). Por lo tanto el estad´ıstico a utilizar es:

T =

donde d = X A − X B y

2 SD

=

Pn

i=1 (di −d)

n−1

2

x¯P − x¯D √ ∼ tn−1 SD / n

= 340,77, el cual rechaza H0 , si T > tn−1,1−α .

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

121

T =

=

x¯P − x¯D √ SD / n 188,6 − 168,1 √ 18,46/ 11

= 3,68

Por lo tanto como T = 3,68 > 1,812 = t10,0,95 , se rechaza H0 , es decir, con un 95 % de confianza la nueva droga reduce la presi´on. EJERCICIO 10 Un instructor de perros est´a entrenando a 27 animales para que obedezcan cierto mandato. El instructor utiliza dos t´ecnicas de entrenamiento diferentes, una en la que recompensa y alimenta (I), y otra en la que no se da recompensa alguna (II). La tabla siguiente muestra el n´ umero de sesiones de obediencia que fueron necesarias antes de que un can obedeciera el mandato. ¿Tiene el instructor la evidencia suficiente para aseverar que el m´etodo de la recompensa requerir´a, en promedio, menos tiempo de entrenamiento?. Plantee las hip´otesis, llegue a conclusiones utilizando un nivel de significancia de α = 0,05. Entrenamiento I Entrenamiento II

29 27 32 40 44 33

25 26

27 31

28 23 31 29 34 31

37 38

28 33

22 42

24 28 31 35

34

´ SOLUCION Tenemos que son dos muestras independientes, y por simplicidad asumiremos que las varianzas poblacionales de cada una de las muestras son iguales. Luego las hip´otesis quedan: H0 : µI ≥ µII

vs H1 : µI < µII

Las cuales se testean con el estad´ıstico

T =

q

2 (n −1)S 2 +(n −1)SII

I II I donde Sp = nI +nII −2 en este caso tenemos

X I − X II q ∼ tnI +nII −2 Sp n1I + n1II

= 5, el cual rechaza H0 cuando T < −tnI +nII −2,1−α . Luego

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

122

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis

T =

X I − X II q Sp n1I + n1II

28,4 − 34,7 = q 1 1 5 15 + 12 = −3,25 Por lo tanto como T = −3,25 < −1,7 = t25,0,05 se rechaza H0 , es decir, el instructor tiene evidencia para aseverar que el m´etodo de la recompensa, requiere menos sesiones de entrenamiento. EJERCICIO 11 En un proceso de ba˜ no qu´ımico utilizado para grabar tarjetas de circuito impreso, se est´an comparando dos diferentes catalizadores para determinar si requieren diferentes tiempos de inmersi´on para remover cantidades id´enticas de material fotorresistente. Se efectuaron 12 ba˜ nos con el catalizador 1, resultando un tiempo de inmersi´on medio de x1 = 24,6 min. y una desviaci´on est´andar de s1 = 0,85 min.. Con el catalizador 2 se efectuaron 15 ba˜ nos, siendo el tiempo de inmersi´on medio de x2 = 22,1 min. y una desviaci´on est´andar de s2 = 0,98 min. Se desea determinar si hay diferencia significativa en los tiempos de inmersi´on al utilizar un catalizador en especial. Para responder esto construya un intervalo de confianza al 95 % de confianza. Considere que no se conoce el comportamiento de las varianzas poblacionales. ´ SOLUCION Primero se debe concluir el comportamiento de las varianzas para decidir que tipo de intervalo hacer. Para ello se construir´a un intervalo de confianza para el cuociente de varianzas al 95 % de confianza. s22 σ22 s22 F ≤ ≤ F11,14,0,975 11,14,0,025 s21 σ12 s21 0,982 σ12 0,982 · 0,2977 ≤ 2 ≤ · 3,094 0,852 σ2 0,852 σ12 ≤ 4,112 σ22 Luego con un 95 % de confianza, puesto que el intervalo incluye la unidad, podr´ıamos no requerir que las varianzas de los tiempos de inmersi´on para los dos catalizadores sean diferentes. 0,395 ≤

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.1 Ejercicios Resueltos

123

Luego debemos hacer un intervalo de confianza para diferencia de medias, con varianzas desconocidas pero iguales. Usando Minitab:

Two-Sample T-Test and CI Sample 1 2

N 12 15

Mean 24,600 22,100

StDev 0,850 0,980

SE Mean 0,25 0,25

Difference = mu (1) - mu (2) Estimate for difference: 2,50000 95% CI for difference: (1,76213; 3,23787) T-Test of difference = 0 (vs not =): T-Value = 6,98 Both use Pooled StDev = 0,9251

P-Value = 0,000

DF = 25

De aqu´ı concluimos con 95 % de confianza que el catalizador 1 requiere un tiempo de inmersi´on, que est´a entre 1.76 min. y 3.24 min., m´as largo que el requerido por el catalizador 2.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

124

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis

7.2.

Ejercicios Propuestos

1. Un fabricante produce anillos para los pistones de un motor de autom´ovil. Se sabe que el di´ametro del anillo est´a distribuido aproximadamente de manera normal, y que tiene una desviaci´on est´andar σ = 0,001 mm. Una muestra aleatoria de 15 anillos tiene un di´ametro promedio de X = 74,036 mm. a) Construya un IC bilateral del 99 % para el di´ametro promedio del anillo. b) Construya un l´ımite inferior de confianza del 95 % para el di´ametro promedio del anillo. 2. Se utilizan dos m´aquinas para llenar botellas de pl´astico con detergente para m´aquinas lavaplatos. Se sabe que las desviaciones est´andar del volumen de llenado son σ1 = 0,10 onzas de l´ıquido y σ2 = 0,15 onzas de l´ıquido para las dos m´aquinas, respectivamente. Se toman dos muestras aleatorias, n1 = 12 botellas de la m´aquina 1 y n2 = 10 botellas de la m´aquina 2. Los vol´ umenes promedio de llenado son x1 = 30,87 onzas de l´ıquido y x2 = 30,68 onzas de l´ıquido. a) Construya un IC bilateral del 90 % para la diferencia entre las medias del volumen de llenado. b) Construya un IC bilateral del 95 % para la diferencia entre las medias del volumen de llenado. Compare el ancho de este intervalo con el ancho del c´alculo en el inciso a). c) Construya un IC superior del 95 % para la diferencia de medias del volumen del llenado. 3. Se prueban dos f´ormulas diferentes de un combustible oxigenado para motor en cuanto al octanaje. La varianza del octanaje para la f´ormula 1 es σ12 = 1,5, mientras que para la f´ormula 2 es σ22 = 1,2. Se prueban dos muestras aleatorias del tama˜ no n1 = 15 y n2 = 20. Los octanajes promedios observados son x1 = 89,6 y x2 = 92,5. Construya un IC bilateral del 95 % para la diferencia en el octanaje promedio. 4. Considere la situaci´on sobre pruebas de octanaje descrita en el ejercicio anterior. ¿Qu´e tama˜ no de muestra se requiere para cada poblaci´on si se desea tener una confianza del 95 % de que el error al estimar la diferencia entre las medias de octanaje sea menor que 1? 5. Se piensa que la concentraci´on del ingrediente activo de un detergente l´ıquido para ropa, es afectada por el tipo de catalizador utilizado en el proceso de fabricaci´on. Se sabe que la desviaci´on est´andar de la concentraci´on activa es de 3g/l sin importar el tipo de catalizador utilizado. Se realizan diez observaciones con cada catalizador, y se obtiene los datos siguientes: Catalizador1 : 57,9 66,2 65,4 65,4 65,2 62,6 67,6 63,7 67,2 71,0 Catalizador2 : 66,4 71,7 70,3 69,3 64,8 69,6 68,6 69,4 65,3 68,8

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.2 Ejercicios Propuestos

125

a) Encuentre un IC del 95 % para la diferencia entre las medias de las concentraciones activas para los dos catalizadores. b) ¿Existe alguna evidencia que indique que las concentraciones activas medias dependen del catalizador utilizado? 6. Un ingeniero civil hace pruebas con la resistencia a la comprensi´on del concreto. Para ello elimina 12 espec´ımenes y obtiene los siguientes datos 2216 2237 2249 2204 2225 2301 2281 2263 2318 2255 2275 2295 a) Construya un IC bilateral del 95 % para la resistencia promedio. b) Construya un IC inferior del 95 % para la resistencia promedio. 7. La pintura para autopistas se surte en dos colores: blanco y amarillo. El inter´es se centra en el tiempo de secado de la pintura; se sospecha que la pintura de color amarillo se seca m´as r´apidamente que la blanca. Se obtienen mediciones de ambos tipos de pintura. Los tiempos de secado (en minutos) son los siguientes: Blanca : 120 132 123 122 140 110 120 107 Amarilla : 126 124 116 125 109 130 125 117 129 120 a) Encuentre un IC del 95 % para la diferencia entre los tiempos de secado promedio, suponiendo que las desviaciones est´andar de ´estos son iguales. Suponga que el tiempo de secado est´a distribuido de manera normal. b) ¿Existe alguna evidencia que indique que la pintura amarilla se seca m´as r´apidamente que la blanca? 8. Considere los datos del ejercicio 6). Construya lo siguiente. a) Un IC bilateral de 99 % para σ 2 . b) Un IC inferior del 99 % para σ 2 . c) Un IC superior del 99 % para σ 2 . 9. Considere los datos del ejercicio 5). Encuentre un IC del 95 % para el cuociente de las dos varianzas σ12 /σ22 . ¿Parece razonable concluir que las dos varianzas son iguales? 10. Se toma una muestra de 50 cascos de suspensi´on utilizados por los corredores de motocicleta y los conductores de autom´oviles de carrera, y se sujetan a una prueba de impacto. En 18 de los cascos se observa cierto da˜ no. a) Encuentre un IC bilateral del 95 % para la verdadera proporci´on de cascos de este tipo que demostrar´an da˜ no como resultado de la prueba. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

126

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis b) Al utilizar la estimaci´on puntual de p obtenida a partir de la muestra preliminar de 50 cascos, ¿cu´antos cascos deben probarse para tener una confianza del 95 % que el error al estimar el verdadero valor de p sea menor que 0.02? c) ¿De qu´e tama˜ no debe ser la muestra si se desea tener una confianza de al menos 95 % de que el error al estimar p sea menor que 0.02, sin importar el valor verdadero de p? 11. Se analiza la fracci´on de productos defectuosos producidos por dos l´ıneas de producci´on. Una muestra aleatoria de 100 unidades provenientes de la l´ınea 1 contiene 10 que son defectuosos, mientras que una muestra aleatoria de 120 unidades de la l´ınea 2 tiene 25 que son defectuosas. Encuentre un IC del 99 % para la diferencia en fracciones de productos defectuosos producidos por las dos l´ıneas. 12. Un fabricante de gasolinas mide el octanaje de sus productos. A continuaci´on se presentan los datos obtenidos de 30 muestras tomadas del proceso de producci´on. Encuentre un intervalo de tolerancia del 95 % que contenga al menos el 95 % de los valores de octanaje para la gasolina producida por ese proceso. 86,98 87,10 87,10 86,94 86,91

86,90 87,13 86,91 86,92 86,83

86,94 86,92 87,03 87,16 87,19

87,11 87,04 86,91 87,08 86,81

86,80 86,92 87,05 87,13 86,98

87,02 87,13 86,95 86,84 86,97

13. Sup´ongase que conocemos que un saco podr´ıa contener 1 bola roja y 4 bolas blancas o, alternativamente, 4 bolas rojas y 1 blanca. Una bola es extra´ıda, y la hip´otesis que una bola es roja y 4 bolas son blancas puede ser no rechazada si y solo s´ı la bola extra´ıda es blanca. (a) Encontrar α y β (b) Cuales son los valores de α y β si la alternativa es 3 bolas rojas y 2 bolas blancas 14. Sup´ongase que sabemos que un saco podr´ıa contener 2 bolas rojas y 3 blancas (la hip´otesis a ser testeada) o 3 bolas rojas y 2 blancas (la alternativa). Dos bolas son extra´ıdas sin reemplazo, y la hip´otesis es rechazada si y solo si ambas bolas extra´ıdas son rojas. Hallar α y β 15. Una caja contiene 10 bolas, y queremos testear la hip´otesis que 2 bolas son rojas y 8 son blancas frente a la alternativa que m´as de 2 bolas son rojas. Extraemos 2 bolas sin reemplazo y rechazamos la hip´otesis si y solo si ambas bolas extra´ıdas son rojas. a) Hallar a b) Hallar b(q) y graficar la funci´on potencia (a) Hallar α (b) Hallar β(θ) y graficar la funci´on potencia 16. ¿Si una moneda es tirada 5 veces y sale 5 veces cara, podemos concluir que la moneda no es honesta? Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.2 Ejercicios Propuestos

127

17. Considere el siguiente caso no matem´atico como una prueba de hip´otesis. En la escena de un accidente grave, un m´edico contrasta la hip´otesis nula “esta v´ıctima est´a viva”. (a) Establezca cuidadosamente el significado de los cuatro resultados posibles indicados en la tabla 1. (b) Decida sobre la gravedad de los errores posibles. (c) Si α y β pudiesen ser controlados estad´ısticamente, ¿qu´e conjunto de probabilidades ser´ıan preferibles para la v´ıctima? I. α=0.001 y β=0.10 II. α=0.05 y β=0.05 III. α=0.10 y β=0.001 Tabla 1 Hip´otesis Nula Decisi´on Verdadera Falsa No se rechaza Ho Decisi´on correcta Error tipo II Se rechaza Ho Error tipo I Decisi´on correcta 18. Un fabricante de fibras textiles est´a investigando una nueva fibra para tapicer´ıa, la cual tiene una elongaci´on media por hilo de 12 kg. con una desviaci´on est´andar de 0.5 kg. La compa˜ n´ıa desea probar la hip´otesis H0 : µ < 12, utilizando para ello una muestra aleatoria de 4 espec´ımenes. 19. Un consumidor de cierto producto acusa al fabricante diciendo que m´as del 20 % de las unidades producidas eran defectuosas. Para confirmar su acusaci´on se utiliz´o una muestra de tama˜ no 50 donde el 27 % de los art´ıculos eran defectuosos ¿Qu´e concluye usted? 20. Una f´abrica de hamburguesas inici´o un proceso de revisi´on de los est´andares de calidad de sus productos. Dichos est´andares establecen ciertas dimensiones para el di´ametro de sus hamburguesas, el di´ametro medio es de 13.9 cm con una desviaci´on est´andar estimada de 0.9 cm. Un est´andar de calidad establece que el di´ametro medio de las hamburguesas debe ser de 14.5 cm. ¿Hay alguna evidencia en los datos que las hamburguesas tienen un di´ametro incorrecto? ¿Qu´e supuesto utiliz´o? 21. Se utilizan dos m´aquinas para llenar botellas de pl´astico con un volumen neto de 16.0 onzas. Las distribuciones de los vol´ umenes de llenado pueden suponerse normales, con desviaciones est´andar σ1 = 0,020 y σ2 = 0,025 onzas. Un miembro del grupo de ingenier´ıa de calidad sospecha que el volumen neto de llenado de ambas m´aquinas es el mismo, sin importar si ´este es o no de 16 onzas. De cada m´aquina se toma una muestra aleatoria de 10 botellas. M´aquina 1: 16,03 16,04 16,05 16,05 16,02 16,01 15,96 15,98 16,02 15,99 M´aquina 2: 16,02 15,97 15,96 16,01 15,99 16,03 16,04 16,02 16,01 16,00

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

128

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis a) ¿ Se encuentra el ingeniero en lo correcto? Utilice α = 0,05. b) ¿Cu´al es el valor-p de esta prueba? c) Si se supone que el tama˜ no de las muestras es el mismo, ¿qu´e tama˜ no de muestra debe utilizarse para asegurar que β = 0,05 si la diferencia verdadera entre las medias es 0.08? Suponga que α = 0,05. d ) ¿Cu´al es la potencia de la prueba del inciso a) si la diferencia verdadera entre las medidas es 0.08? 22. Existen dos tipos de pl´asticos apropiados para su uso por un fabricante de componentes electr´onicos. La tensi´on de ruptura de este pl´astico es un par´ametro importante. Se sabe que σ1 = σ2 = 1,0 psi. De una muestra aleatoria de tama˜ no n1 = 10 y n2 = 12, se tiene que x1 = 162,5 y x2 = 155,0. La compa˜ n´ıa no adoptar´a el pl´astico 1 a menos que la tensi´on de ruptura de ´este exceda a la del pl´astico 2 al menos por 10 psi. Con base a la informaci´on contenida en la muestra, ¿La compa˜ n´ıa deber´a utilizar el pl´astico 1? Utilice α = 0,05 para llegar a una decisi´on. 23. En una industria se desea verificar si la productividad media de los operarios del per´ıodo diurno es igual a la productividad media de los operarios del per´ıodo nocturno. Se supone que las productividades de los operarios de los diferentes per´ıodos son independientes y normalmente distribuidas. Se seleccionan muestran de igual tama˜ no para cada uno de los per´ıodos obteni´endose los siguientes resultados: Per´ıodo No de operarios Diurno 15 Nocturno 15

Media Varianza 12 35.71 10 36.43

a) Verifique igualdad de varianzas con nivel α = 0,1 b) Verifique si las productividades medias son iguales con nivel α = 0,05. c) Determine la probabilidad de aceptar la igualdad de medias en (b), si la realidad es que la diferencia entre las productividades medias es de una unidad. Aproxime los valores t1−α por z1−α . 24. Para alcanzar la m´axima eficiencia en una operaci´on de ensamblaje en una f´abrica los obreros nuevos requieren alrededor de un mes de capacitaci´on. Se sugiere un nuevo m´etodo de capacitaci´on y se realiza una prueba para compararlo con el tradicional. Para este fin se capacitan dos grupos de nueve obreros durante un per´ıodo de tres semanas; uno de los grupos aplica el nuevo m´etodo y el otro el tradicional. Al final de las tres semanas de capacitaci´on se mide el tiempo (en minutos) que le toma a cada obrero ensamblar el dispositivo. Los resultados obtenidos de las muestras son los siguientes (asuma normalidad de los datos) Estad´ıstico n Promedio Varianza

M´etodo Tradicional Nuevo 9 9 35 31 25 20

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

7.2 Ejercicios Propuestos

129

¿Hay suficiente evidencia que indique que las medias de los tiempos reales son diferentes con los dos m´etodos? Realice una prueba con el nivel α = 5 %. Determine el valor-p de la prueba. (sea expl´ıcito, d´e hip´otesis, test y conclusi´on). 25. El contenido de nicotina de dos marcas de cigarros, medidas en miligramos, es la siguiente: A B

2.1 4.0 6.3 5.4 4.8 3.7 6.1 3.3 4.1 0.6 3.1 2.5 4.0 6.2 1.6 2.2 1.9 5.4

¿Los contenidos de nicotina de las dos marcas ser´an diferentes?. Considere α = 5 %. 26. Un experimento quiere determinar la eficacia de un nuevo elemento versus la dieta actual (control) para reducir la cantidad de grasa en los cerdos. Los datos se encuentran en la siguiente tabla: Nuevo Control

676 206 230 256 280 433 88 570 605 617 653 2913

337 466 497 924 286 1098

512 794 982 2346

428 452 512 321 615 519

Utilice la teor´ıa normal para testear la hip´otesis de que existe diferencia entre los dos tipos de producci´on. 27. Para la elaboraci´on de un neum´atico se utilizan dos m´etodos. A dichos neum´aticos se les mide el desgaste. Se seleccionan 12 neum´aticos de cada tipo y siendo sus mediciones de desgaste, las siguientes: Proceso 1 329 436 457 463 477 479 1297 1319 1340 1385 1398 1440 Proceso 2 313 563 670 940 1002 1261 1305 1531 1614 1694 1701 1708 Utilice la teor´ıa de normalidad para testear la hip´otesis de que no existe diferencia entre los m´etodos de elaboraci´on. 28. Se efect´ ua una prueba de impacto Izod sobre 20 muestras de tuber´ıa PVC. El est´andar ASTM para este material requiere que la resistencia al impacto Izod sea mayor que 1.0 ft-lb/in. El promedio y la desviaci´on est´andar muestrales son x = 1,25 y s = 0,25, respectivamente. Pruebe H0 : µ = 1,0 contra H1 : µ > 1,0 utilizando α = 0,01. Obtenga conclusiones. 29. En la fabricaci´on de semiconductores, a menudo se utiliza una sustancia qu´ımica para quitar el silicio de la parte trasera de las obleas antes de la metalizaci´on. En este proceso es importante la rapidez con la que act´ ua la sustancia. Se han comparado dos soluciones qu´ımicas, utilizando para ello dos muestras aleatorias de 10 obleas para cada soluci´on. La rapidez de acci´on observada es la siguiente (en mils/min): Soluci´on 1: 9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1 Soluci´on 2: 10,2 10,6 10,7 10,4 10,5 10,0 10,2 10,7 10,4 10,3

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

130

Cap´ıtulo 7. Intervalos de Confianza y Test de Hip´ otesis a) ¿Los datos apoyan la informaci´on que la rapidez promedio de acci´on es la misma para ambas soluciones? Para obtener sus conclusiones, utilice α = 0,05 y suponga que las varianzas de ambas poblaciones son iguales. b) Calcule el valor-p para la prueba del inciso (a). c) Construya diagramas de caja para las dos muestras. ¿Estas gr´aficas apoyan la hip´otesis de que las varianzas son iguales? Escriba una interpretaci´on pr´actica de estas gr´aficas. 30. El sistema de enfriamiento de un submarino nuclear est´a formado por un ensamble de tuber´ıas soldadas por donde circula un l´ıquido refrigerante. Las especificaciones requieren que la resistencia de la soldadura sea mayor o igual que 150 psi. a) Suponga que los ingenieros del dise˜ no deciden probar la hip´otesis H0 : µ = 150 contra H1 : µ > 150. Explique por qu´e esta elecci´on de hip´otesis alternativa es mejor que H1 : µ < 150. b) Al tomar una muestra aleatoria de 20 soldaduras se tiene que x = 153,7 psi. y s = 11,3 psi. ¿Qu´e conclusiones pueden obtenerse con respecto a la hip´otesis del inciso a)? Utilice α = 0,05.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

Cap´ıtulo 8 Test de Homogeneidad, Independencia y Bondad de Ajuste 8.1.

Ejercicios Resueltos

EJERCICIO 1 Un ginec´ologo analiza la posible relaci´on entre la edad de la menarqu´ıa y la aparici´on de c´ancer de mama. Con el fin de estudiarlo clasifica a las mujeres que acuden a su consulta en dos grupos, aquellas que tuvieron la menarqu´ıa antes de los 12 a˜ nos (a las que distingue con el valor cero), y aquellas que la tuvieron despu´es de esta edad ( a las que distingue con el valor 1). Se presentan a continuaci´on los resultados obtenidos: Cancer de Edad de la Menarqu´ıa S´ı 0 64 47 1

Mama No 53 139

Determine si existe relaci´on o no entre estas variables. ´ SOLUCION Para medir si existe relaci´on entre la edad de la menarquia y el c´ancer de mama, realizamos un test de independencia. H0 : n i j =

ni· · n·j n··

H1 : no existe independencia

Para tal hip´otesis, ocupamos el estad´ıstico χ2 . 2

χ =

X (obs − esp)2 i,j

esp

en donde los observados son los valores que aparecen en la tabla y los esperados los calculamos mediante H0 , por ejemplo, el esperado para la casilla Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

132

Cap´ıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

n11 =

117 · 111 n1· · n·1 = = 42,8613 n·· 303

Luego para cada casilla, los esperados ser´ıan los que se muestran a continuaci´on: Cancer Si No 64 53 42,86 74,14

0 Edad 1

Total 117

47 68,14

139 117,86

186

111

192

303

Total

Luego el estad´ıstico nos queda de la siguiente manera: χ2 =

(64 − 42,86)2 (53 − 74,14)2 (47 − 68,17)2 (139 − 117,86)2 + + + 42,86 74,14 68,14 117,86

= 10,425 + 6,027 + 6,558 + 3,791 = 26,801 Ahora, rechazamos H0 si χ2 > χ2(f ilas−1)(columnas−1),1−α donde filas en este caso tenemos 2 y columnas 2 y el α lo escogemos como 0.05. Por lo tanto tenemos χ21,0,95 = 3,84 buscado en una tabla de la distribuci´on Chi-Cuadrado. Luego, como χ2 = 26,801 > χ21,0,95 = 3,84 se rechaza la hip´otesis de que ambas variables sean independientes con un 95 % de confianza. EJERCICIO 2 De un proceso de fabricaci´on, se seleccionan 100 ampolletas de 75 watts y se lleva a cabo una prueba para determinar la vida u ´til de estas ampolletas. El resultado de esta prueba, en miles de horas, se resume en la siguiente tabla: Tiempo de Duraci´on N o de Ampolletas

0 - 0.2 0.2 - 0.4 0.4 - 0.6 0.6 - 0.8 0.8 - 1 1 - 1.1 29 20 15 9 12 15

¿ Se puede concluir al nivel de significancia del 5 %, que la vida u ´til de todas las ampolletas se distribuye exponencial?

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

133

´ SOLUCION En este caso debemos hacer un test de Bondad de Ajuste, para una distribuci´on exponencial de los datos. Para esto debemos sacar las frecuencias esperadas para cada uno de los rangos, bajo la hip´otesis de una distribuci´on exponencial, luego primero debemos estimar el par´ametro λ de la exponencial. Sabemos que la E(X) = λ1 cuando X ∼ Exp(λ), luego ocupemos el estimador de la media: P x¯ =

M C · fi 1 P = 0,4865 = fi λ

La media la calculamos as´ı por tener los datos en una tabla de frecuencias. Luego, obtenemos que: λ=

1 = 2,055 0,4865

Posteriormente, calculamos las probabilidades de estar en cada uno de las clases de la tabla de frecuencias, para despu´es calcular la frecuencia esperada. 0,2

Z

2,055e−2,055x dx = 0,337

P (0 < X < 0,2) = 0 0,4

Z

2,055e−2,055x dx = 0,2234

P (0,2 < X < 0,4) = 0,2 0,6

Z

2,055e−2,055x dx = 0,1481

P (0,4 < X < 0,6) = 0,4 0,8

Z

2,055e−2,055x dx = 0,0982

P (0,6 < X < 0,8) = 0,6

Z

1

2,055e−2,055x dx =

P (0,8 < X < 1,0) =

0,0651

0,8

Z P (1,0 < X < 1,1) =

1,1

2,055e−2,055x dx = 0,0237

1

Como tenemos un total de 100 observaciones, las frecuencias esperadas las obtenemos multiplicando la probabilidad de estar en la clase por 100, es decir: fesperada [0 − 0,2] = P (0 < X < 0,2) · 100 = 33,7 Luego haciendo el c´alculo para cada celda, queda: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

134

Cap´ıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste Tiempo de Duraci´on 0 - 0.2 0.2 - 0.4 0.4 - 0.6 0.6 - 0.8 0.8 - 1 1 - 1.1 N o de Ampolletas 29 20 15 9 12 15 o N de Amp. Esperado 33.7 22.34 14.81 9.82 6.51 2.37 Finalmente para testear nuestra hip´otesis H0 : Los datos distribuyen Exponencial v/s H1 : No distribuyen exponencial Ocupamos el estad´ıstico χ2 =

X (obsi − espi )2 i

=

espi

(29 − 33,7)2 (20 − 22,34)2 (15 − 14,81)2 (9 − 9,82)2 (12 − 6,51)2 (15 − 2,37)2 + + + + + 33,7 22,34 14,81 9,82 6,51 2,37

= 72,9 umero de clases y p Luego rechazamos H0 si χ2 > χ21−α,k−p−1 = χ20,95,6−1−1 = 9,48 con k el n´ el n´ umero de par´ametros de la distribuci´on. Por lo tanto, como 72,9 > 9,48 se rechaza la postura de una distribuci´on exponencial en los datos del tiempo de vida de las ampolletas. EJERCICIO 3 Un mec´anico analiza la posible relaci´on entre la edad de la maquina y la aparici´on de una falla grave. Con el fin de estudiarlo clasifica a las maquinas en dos grupos, aquellas que tuvieron una falla grave antes de los 12 a˜ nos (a las que distingue con el valor 0), y aquellas que la tuvieron despu´es de esta edad (a las que distingue con el valor 1). Se presentan a continuaci´on los resultados obtenidos: Falla Si Edad M´aquina 0 64 1 47

Grave No 53 139

(a) Calcule el Test χ2 de Pearson. (b) Determine si existe relaci´on o no entre la variables ´ SOLUCION Completamos la tabla dada con los valores esperados Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

135 Falla Grave Si No 0 64 53 42,861 74,139

Total 117

Edad M´aquina 1

Total

47 68,139

139 117,861

186

111

192

303

(a) Dada la tabla completa con los los valores esperados calculamos el estad´ıstico como sigue: r X c X (Oij − Eij )2 χ = Eij i=1 j=1 2

2 X 2 X (Oij − Eij )2 = Eij i=1 j=1

=

(64 − 42,8613)2 (53 − 74,138)2 (47 − 68,138)2 (139 − 117,861)2 + + + 42,8613 74,138 68,138 117,861

= 10,425 + 6,027 + 6,558 + 3,791 = 26,801 (b) Se rechaza H0 : ∃ independencia entre la edad de la m´aquina y si la falla es grave si χ2 > χ(1−α;(f −1)·(c−1)) Como χ2 = 26,801 > 3,841459 = χ0,95;1 Se rechaza la hip´otesis de independencia entre las fallas graves y la edad de las m´aquinas. EJERCICIO 4 Suponga que cierto art´ıculo puede presentar hasta 4 defectos diferentes. Una muestra aleatoria de 625 de estos art´ıculos es clasificado de acuerdo al n´ umero de defectos, obteni´endose lo siguiente: # de defectos # de casos

0 1 82 185

2 182

3 110

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

4 66

136

Cap´ıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste Un ingeniero afirma que el n´ umero de defectos X es una variable aleatoria con distribuci´on de probabilidad  1 2x x = 1, 2, 3, 4 7 x! P (X = x) = 0 e.o.c ¿Qu´e podr´ıa concluir, en base a los datos de la muestra, con α = 0,05, respecto de lo firmado por el ingeniero? ´ SOLUCION Necesitamos calcular las frecuencia esperadas, mediante las probabilidades. P (X = 0) =

1 20 7 0!

= 0,1428

P (X = 1) =

1 21 7 1!

= 0,2857

P (X = 2) =

1 22 7 2!

= 0,2857

P (X = 3) =

1 23 7 3!

= 0,1904

P (X = 4) =

1 24 7 3!

= 0,0952

luego el n´ umero de casos esperados ser´a Ei = P (X = i) · 625 = no de defectos igual a i una vez calculados estos valores tenemos lo siguiente # de defectos (i) 0 1 2 3 4 # de casos observado (Oi ) 82 185 182 110 66 # de casos esperados (Ei ) 89.25 178.56 178.56 119 59.5 Para la hip´otesis H0 : los datos distribuyen con la funci´on de probabilidad dada. Se rechaza H0 si χ2 =

5 X (Oi − Ei )2 i=1

o

Ei

> χ21−α;k−p−1

o

donde k: n de clases y p: n de par´ametros. Luego χ2 = 2,2782 ≯ χ20,95;5−0−1 = 9,4877 por lo tanto no existe evidencia suficiente bajo un 95 % de confianza para rechazar H0 , es decir, los datos pueden ser modelados por la distribuci´on dada.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

137

EJERCICIO 5 Una empresa empaca determinado producto de latas de tres tama˜ nos distintos, cada uno en distinta l´ınea de producci´on. La mayor parte de las latas se apegan a las especificaciones, pero un ingeniero de control de calidad ha identificado los siguientes defectos: Mancha en la lata. Grieta en la lata. Ubicaci´on incorrecta del anillo de apertura. Falta del anillo de apertura. Otras. Se selecciona una muestra de unidades defectuosas de cada una de las tres l´ıneas, y cada unidad se clasifica seg´ un el defecto, la siguiente tabla de contingencia incluye esos datos: Defecto Mancha Grieta Ubicaci´on L´ınea 1 34 65 17 de 2 23 52 25 Producci´on 3 32 28 16 Total 89 145 58

Falta 21 19 14 54

Otras 13 6 10 29

Tama˜ no de la muestra 150 125 100 375

¿Los datos sugieren desigualdad en las proporciones que caen en las distintas categor´ıas de las tres l´ıneas? ´ SOLUCION Los par´ametros de inter´es son las diversas proporciones y las hip´otesis relevantes son: H0 : Las l´ıneas de producci´on son homog´eneas con respecto a las 5 categor´ıas que no cumplen las especificaciones. H1 : Las l´ıneas de producci´on no son homog´eneas con respecto a las 5 categor´ıas que no cumplen las especificaciones. Ahora se presenta una tabla resumen con los valores esperados y el valor de (Obs. − Esp.)2 /Esp. 1

C1 34 35,60 0,072

C2 65 58,00 0,845

C3 17 23,20 1,657

C4 21 21,60 0,017

C5 13 11,60 0,169

Total 150

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

138

Cap´ıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste 2

23 29,67 1,498

52 48,33 0,278

25 19,33 1,661

19 18,00 0,056

6 9,67 1,391

125

3

32 23,73 2,879

28 38,67 2,943

16 15,47 0,018

14 14,40 0,011

10 7,73 0,664

100

Total

89

145

58

54

29

375

luego, bajo un 95 % de confianza χ2 = 14,159 ≯ 15,50731 = χ20,95;(3−1)·(5−1) lo que indica que no existe suficiente evidencia para rechazar H0 , es decir las l´ıneas de producci´on ser´ıan homog´eneas con respecto a las 5 categor´ıas que no cumplen las especificaciones. Si disminuimos la confianza a un 90 % tenemos que χ2 = 14,159 > 13,36157 = χ20,90;(3−1)·(5−1) luego, ahora s´ı existir´ıa evidencia bajo este nivel de significancia para rechazar H0 . EJERCICIO 6 Un estudio de la relaci´on entre las condiciones de las instalaciones en gasolineras y la agresividad en el precio de la gasolina reporta los siguientes datos basados en una muestra de n = 144 gasolineras. Agresividad Anticuada 24 52 Est´andar Moderna 58 n.j 134

Neutral 15 73 86 174

No agresiva ni. 17 56 80 205 36 180 133 441

En el nivel 0.01, ¿la informaci´on sugiere que las condiciones de instalaciones y las pol´ıticas de precios son independientes entre si? ´ SOLUCION La hip´otesis a docimar es: H0 : Las condiciones de las instalaciones con la pol´ıtica de precios son independientes. vs H1 : No existe independencia. La siguiente tabla resumen entrega la informaci´on necesaria para calcular el estad´ıstico χ2 . Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos C1 24 17,02 2,867

C2 15 22,10 2,278

C3 17 16,89 0,001

Total 56

2

52 62,29 1,700

73 80,88 0,769

80 61,83 5,343

205

3

58 54,69 0,200

86 71,02 3,159

36 54,29 6,159

180

Total

134

174

133

441

1

139

luego, bajo un 99 % de confianza χ2 = 22,476 > 13,2767 = χ20,99;(3−1)·(3−1) lo que indica que existe suficiente evidencia con este nivel de confianza para rechazar H0 , es decir el conocimiento de la pol´ıtica de precios de una gasolinera proporciona informaci´on acerca de la condici´on de las instalaciones de la gasolinera. EJERCICIO 7 Se obtuvo una muestra aleatoria de individuos que viajan solos en autom´ovil al trabajo, en una gran zona metropolitana, y cada individuo fue clasificado de acuerdo con el tama˜ no de su autom´ovil y la distancia de recorrido citadino. ¿La siguiente informaci´on sugiere que dicha distancia y el tama˜ no del autom´ovil est´an relacionados en la poblaci´on a la cual se hizo el muestreo? Exprese las hip´otesis pertinentes y utilice una prueba Chi-cuadrado con un nivel 0.05.

Subcompacto Tama˜ no de Compacto Autom´ovil Mediano Grande

Distancia de Recorrido [0, 10) [10, 20) [20, . . .) 6 27 19 8 36 17 21 45 33 14 18 6

´ SOLUCION La hip´otesis a docimar es: H0 : Existe independencia entre la distancia de recorrido y el tama˜ no del autom´ovil. vs H1 : No existe independencia. La siguiente tabla resumen entrega la informaci´on necesaria para calcular el estad´ıstico χ2 . Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

140

Cap´ıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste C1 6 10,19 1,724

C2 27 26,21 0,024

C3 19 15,60 0,741

Total 52

2

8 11,96 1,309

36 30,74 0,899

17 18,30 0,092

61

3

21 19,40 0,131

45 49,90 0,480

33 29,70 0,367

99

4

14 7,45 5,764

18 19,15 0,069

6 11,40 2,558

38

Total

49

126

75

250

1

luego, bajo un 95 % de confianza χ2 = 14, 158 > 12,59159 = χ20,95;(4−1)·(3−1) lo que indica que existe suficiente evidencia con este nivel de confianza para rechazar H0 , es decir, la distancia de recorrido proporciona informaci´on acerca el tama˜ no del autom´ovil. EJERCICIO 8 Una empresa quiere contratar a cierta cantidad de personas y de los postulantes que se presentan se hace una preselecci´on de 24 hombres y 24 mujeres de entre los cuales el jefe de personal decide quien ser´a contratado y quien no. Despu´es de que el jefe de personal hizo la selecci´on de los contratados los resultados fueron los siguientes, Hombre Contratado 21 No contratado 3

Mujer 14 10

Alguien acusa al empleador de tener un sesgo de selecci´on a favor de los hombres ya que 21 de 24 hombres fueron contratados y s´olo 14 de 24 mujeres tambi´en lo fueron. ¿Existir´a discriminaci´on por parte del jefe de personal?. Plantee las hip´otesis con palabras y param´etricamente, llegue a conclusiones utilizando un nivel de significancia de α = 0,05. ´ SOLUCION Hip´otesis: H0 : No existe discriminaci´on (Homogeneidad) vs H1 : Existe discriminaci´on (No Homogeneidad) Equivalentemente H0 : p1j = p2j j = 1, 2 vs H1 : p1j 6= p2j para alg´ un j Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

141

Para testear tales hip´otesis, se ocupa el estad´ıstico n X m X (oij − eˆij )2 χ = eˆij i=1 j=1 2

donde eˆij =

ni· n·j , n··

el cual rechaza H0 cuando χ2 ≥ χ21−α,(I−1)(J−1) .

Luego la tabla de valores esperados es: Hombre M ujer T otal ni· Contratado 17,5 17,5 35 N o contratado 6,5 6,5 13 T otal n·j 24 24 48

Por lo tanto el estad´ıstico de prueba queda

χ2 =

(21 − 17,5)2 (14 − 17,5)2 (3 − 6,5)2 (10 − 6,5)2 + + + = 5,1692 17,5 17,5 6,5 6,5

Como χ2 = 5,1692 > 3,84 = χ20,95,1 , se rechaza H0 , es decir, con un 95 % de confianza existe discriminaci´on hacia la mujer por parte del jefe de personal. EJERCICIO 9 De cada una de tres comunidades se sac´o una muestra de j´ovenes casados. A cada pareja se le pidi´o que especificara la cantidad m´ınima de educaci´on que esperaba que sus hijos recibieran. La siguiente tabla muestra los resultados que se observaron en la muestra:

Nivel M´ınimo Colegio Educ. comercial Universitario Total

Comunidad A B C Total 30 28 24 82 30 19 46 95 90 78 130 298 150 125 200 475

¿Qu´e se puede concluir respecto a la homogeneidad de las aspiraciones en la educaci´on de los hijos? ´ SOLUCION Las hip´otesis son:

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

142

Cap´ıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste H0 : Las 3 poblaciones son homog´eneas respecto de las aspiraciones de educaci´on para sus hijos. (p11 = p12 = p13 ). H1 : Las 3 poblaciones no son homog´eneas (Por lo menos 2 proporciones de una misma fila no son iguales entre si.) Para testear tales hip´otesis, se ocupa el estad´ıstico I X J X (oij − eˆij )2 χ = eˆij i=1 j=1 2

donde eˆij =

ni· n·j , n··

el cual rechaza H0 cuando χ2 ≥ χ21−α,(I−1)(J−1) .

Luego la tabla de valores esperados es:

Nivel M´ınimo Colegio Educ. comercial Universitario Total

Comunidad A B C 25.89 21.58 34.53 30.00 25.00 40.00 94.11 78.42 125.5 150 125 200

Total 82 95 298 475

Por lo tanto el estad´ıstico de prueba queda

χ2 =

+

(30 − 25,89)2 (28 − 21,58)2 (24 − 34,53)2 (30 − 30)2 (19 − 25)2 (46 − 40)2 + + + + + 25,89 21,58 34,53 30 25 40 (90 − 94,11)2 (78 − 78,42)2 (130 − 125,5)2 + + 94,11 78,42 125,5

= 8,455

Como χ2 = 8,455 < 9,488 = χ20,95,4 , no existe evidencia en los datos para rechazar H0 , es decir, con un 95 % de confianza existe homogeneidad entre las comunidades. EJERCICIO 10 Se seleccion´o una muestra al azar de 275 alumnos de u ´ltimo a˜ no de colegio de cada uno de los siguientes tres grupos de rendimiento atl´etico: alto, medio y bajo. Los muchachos se clasificaron de acuerdo con la inteligencia tal como aparece en la tabla. ¿Indican estos datos una diferencia en la distribuci´on de la inteligencia entre los tres grupos?

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

143

Rendimiento Inteligencia Alto Medio Bajo Alta 45 60 68 Media 10 15 25 Baja 5 15 32 Total 60 90 125

Total 173 50 52 100

´ SOLUCION Las hip´otesis son: H0 : Los 3 niveles de inteligencia son homog´eneos respecto del rendimiento. (p1j = p2j = p3j ). H1 : Los 3 niveles de inteligencia no son homog´eneos respecto del rendimiento (Por lo menos 2 proporciones de una misma columna no son iguales entre si.) Para testear tales hip´otesis, se ocupa el estad´ıstico χ2 =

donde eˆij =

ni· n·j , n··

I X J X (oij − eˆij )2 eˆij i=1 j=1

el cual rechaza H0 cuando χ2 ≥ χ21−α,(I−1)(J−1) .

Luego la tabla de valores esperados es: Rendimiento Inteligencia Alto Medio Bajo Total Alta 37.77 56.62 78.64 173 Media 10.91 16.36 36.36 50 Baja 11.35 17.02 23.64 52 Total 60 90 125 100 Por lo tanto el estad´ıstico de prueba queda

χ2 =

+

(45 − 37,77)2 (60 − 56,62)2 (68 − 78,64)2 (10 − 10,91)2 (15 − 16,36)2 (25 − 36,36)2 + + + + + 37,77 56,62 78,64 10,91 16,36 36,36 (5 − 11,35)2 (15 − 17,02)2 (32 − 23,64)2 + + 11,5 17,02 23,64

= 10,199

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

144

Cap´ıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste Como χ2 = 10,199 > 9,488 = χ20,95,4 , se rechaza H0 , es decir, con un 95 % de confianza no existe homogeneidad entre los niveles intelectuales. EJERCICIO 11 Un investigador desea saber si es posible concluir que hay relaci´on entre el grado de liberalismo y la posici´on en la universidad en una poblaci´on de estudiantes universitarios. Para estos efectos se seleccion´o una muestra de 500 estudiantes. La tabla siguiente muestra la clasificaci´on de los datos seg´ un sus respuestas: Grado de Liberalismo Clase Ligero Moderado Alto Total 1er. a˜ no 30 83 37 150 2o. a˜ no 19 56 50 125 3er. a˜ no 16 46 63 125 4o. a˜ no 10 38 52 100 Total 75 223 202 500 ¿Qu´e se puede concluir respecto al problema del investigador? ´ SOLUCION Las hip´otesis son: H0 : Existe independencia entre el grado de liberalismo y el a˜ no universitario. (nij =

ni· n·j ). nij

H1 : No existe independencia entre el grado de liberalismo y el a˜ no universitario.(nij 6=

ni· n·j ). nij

Para testear tales hip´otesis, se ocupa el estad´ıstico χ2 =

donde eˆij =

ni· n·j , n··

I X J X (oij − eˆij )2 eˆij i=1 j=1

el cual rechaza H0 cuando χ2 ≥ χ21−α,(I−1)(J−1) .

Luego la tabla de valores esperados es: Grado de Liberalismo Clase Ligero Moderado Alto Total 1er. a˜ no 22.50 66.90 60.60 150 2o. a˜ no 18.75 55.75 50.50 125 3er. a˜ no 18.75 55.75 50.50 125 4o. a˜ no 15.00 44.60 40.40 100 Total 75 223 202 500 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

8.1 Ejercicios Resueltos

145

Por lo tanto el estad´ıstico de prueba queda

χ2 =

+

(30 − 22,5)2 (83 − 66,9)2 (37 − 60,6)2 (19 − 18,75)2 (56 − 55,75)2 (50 − 50,5)2 + + + + + 22,5 66,9 60,6 18,75 55,75 50,5 (16 − 18,75)2 (46 − 55,75)2 (63 − 50,5)2 (10 − 15)2 (38 − 44,6)2 (52 − 40,4)2 + + + + + 18,75 55,75 50,5 15 44,6 40,4

= 26,751

Como χ2 = 26,751 > 12,592 = χ20,95,6 , se rechaza H0 , es decir, con un 95 % de confianza el grado de liberalismo en los estudiantes universitarios no es independiente del a˜ no que cursa el alumno. EJERCICIO 12 Una muestra de 500 personas responde dos preguntas: filiaci´on pol´ıtica y actitud hacia una reforma de impuestos, los resultados son los siguientes:

Filiaci´on Dem´ocrata Republicano Total

Actitud hacia Reforma A favor Indiferente En contra Total 138 83 64 285 64 67 84 215 202 150 148 500

¿Existe relaci´on entre la tendencia pol´ıtica y la actitud hacia la reforma de impuestos?. Plantee la hip´otesis necesaria y concluya. ´ SOLUCION Las hip´otesis son: H0 : Existe independencia entre la tendencia pol´ıtica y la actitud hacia la reforma. (nij = ni· n·j ). nij H1 : Existe asociaci´on entre la tendencia pol´ıtica y la actitud hacia la reforma.(nij 6= Para testear tales hip´otesis, se ocupa el estad´ıstico χ2 =

I X J X (oij − eˆij )2 eˆij i=1 j=1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

ni· n·j ). nij

146

Cap´ıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste donde eˆij =

ni· n·j , n··

el cual rechaza H0 cuando χ2 ≥ χ21−α,(I−1)(J−1) .

Luego la tabla de valores esperados es:

Filiaci´on Dem´ocrata Republicano Total

Actitud hacia Reforma A favor Indiferente En contra Total 115.14 85.5 84.36 285 86.86 64.5 63.64 215 202 150 148 500

Por lo tanto el estad´ıstico de prueba queda

χ2 =

(138 − 115,14)2 (83 − 85,5)2 (64 − 84,36)2 (64 − 86,86)2 (67 − 64,5)2 (84 − 63,64)2 + + + + + 115,14 85,5 84,36 86,86 64,5 63,64

= 22,51

Como χ2 = 22,51 > 5,99 = χ20,95,2 , se rechaza H0 , es decir, con un 95 % de confianza la tendencia pol´ıtica influye en la actitud hacia la reforma. EJERCICIO 13 En una muestra aleatoria de 100 universitarios se clasific´o cada uno de ellos seg´ un si hab´ıa consumido alguna vez droga o no y el promedio de notas. A partir de los datos tabulados en la tabla, ¿proporcionan estos datos evidencia suficiente como para concluir que hay una relaci´on entre las dos variables? Use α = 0,05.

Promedio notas ≤ 4,0 > 4,0 Total

¿Ha consumido Drogas? Si No Total 10 29 39 20 41 61 30 70 100

´ SOLUCION Las hip´otesis son: H0 : Existe independencia entre el consumo de drogas y el promedio de notas (nij = H1 : Existe asociaci´on entre el consumo de drogas y el promedio de notas.(nij 6=

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

ni· n·j ). nij

ni· n·j ). nij

8.1 Ejercicios Resueltos

147

Para testear tales hip´otesis, se ocupa el estad´ıstico χ2 = donde eˆij =

ni· n·j , n··

I X J X (oij − eˆij )2 eˆij i=1 j=1

el cual rechaza H0 cuando χ2 ≥ χ21−α,(I−1)(J−1) .

Luego la tabla de valores esperados es: ¿Ha consumido Drogas? Promedio notas Si No Total ≤ 4,0 11,7 27,3 39 > 4,0 18,3 42,7 61 Total 30 70 100 Por lo tanto el estad´ıstico de prueba queda

χ2 =

(10 − 11,7)2 (29 − 27,3)2 (20 − 18,3)2 (41 − 42,7)2 + + + 11,7 27,3 18,3 42,7

= 0,578

Como χ2 = 0,578 < 3,841 = χ20,95,1 , no se rechaza H0 , es decir, con un 95 % de confianza el consumo de droga no influye en el promedio de notas de los estudiantes.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

148

Cap´ıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

8.2.

Ejercicios Propuestos

1. (a) Se observ´o la duraci´on en horas de 100 pilas de una determinada marca, obteni´endose los siguientes resultados: < 20 20 − 40 40 − 60 60 − 80 ≥ 80 Horas Frecuencia 5 26 34 22 13 ¿Hay evidencia suficiente para rechazar la hip´otesis de que los datos siguen una distribuci´on normal de par´ametros µ = 50 y σ = 20? (b) Las ampolletas pueden clasificarse seg´ un su potencia (watts) y se piensa que de alguna forma existe una relaci´on entre la duraci´on y la potencia. Para verificar lo anterior se tabulan los datos, obteni´endose lo siguiente: Duraci´on superior a 200 horas Si No Potencia < 100W 30 20 ≥ 100W 20 30 2. (a) El n´ umero de accidentes sufridos por operadores de m´aquina de herramientas en determinada industria se registr´o durante cierto periodo con los resultados siguientes: Accidentes por Operador 0 1 2 3 4 5 6 7 8 N´ umero de Operadores 296 74 26 8 4 4 1 0 1 Con el nivel de significancia del 5 %, probar la hip´otesis de que los datos provienen de una distribuci´on Poisson. (b) Una muestra aleatoria de 200 hombres casados, todos retirados, se clasific´o de acuerdo a la educaci´on y el n´ umero de hijos de cada uno de ellos: Cantidad de hijos 0 − 1 2 − 3 m´as de 3 Primaria 14 37 32 Educaci´on Secundaria 19 42 17 Bachillerato 12 17 10 Pruebe la hip´otesis, con un nivel de significancia del 5 %, que el tama˜ no de una familia es independiente del nivel de educaci´on del padre. 3. Cada uno de 325 individuos que participan en cierto programa de medicamentos, se clasific´o con respecto a la presencia o ausencia de hipoglucemia y con respecto a la dosis media diaria de insulina. ¿Apoyan los datos siguientes lo dicho de que la presencia o ausencia de hipoglucemia es independiente de las dosis de insulina? Pruebe usando α = 0,05. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

8.2 Ejercicios Propuestos

149

Condici´on de Presente Hipoglucemia Ausente

Dosis diaria de insulina < 0,25 0,25 − 0,49 0,5 − 0,74 0,75 − 0,99 > 1,0 4 21 28 15 12 40 74 59 26 46

4. Los siguientes datos corresponden a combinaciones de sexo de los recombinantes que resultan de seis diferentes genotipos masculinos. ¿Soportan los datos la hip´otesis de que la distribuci´on de frecuencia entre las tres combinaciones de sexo es homog´enea con respecto a los diferentes genotipos? Defina los par´ametros de inter´es, exprese H0 y H1 pertinentes, y realice el an´alisis.

1 2 Genotipo 3 Masculino 4 5 6

Combinaci´on de sexo M/M M/F F/F 35 80 39 41 84 45 33 87 31 8 26 8 5 11 6 30 65 20

5. Una muestra aleatoria de 200 hombres casados, todos retirados, se clasifico de acuerdo a la educaci´on y el n´ umero de hijos de cada uno de ellos: Cantidad de hijos 0 − 1 2 − 3 m´as de 3 Primaria 14 37 32 Educaci´on Secundaria 19 42 17 Bachillerato 12 17 10 Pruebe la hip´otesis, con un nivel de significancia del 5 %, que el tama˜ no de una familia es independiente del nivel de educaci´on del padre. 6. Una compa˜ n´ıa opera cuatro m´aquinas, tres turnos al d´ıa. De los registros de producci´on, se obtuvieron los siguientes datos sobre el n´ umero de fallas:

Turno 1 2 3

A 41 31 15

M´aquinas B C 20 12 11 9 17 16

D 16 14 10

Pruebe la hip´otesis (con α = 0,05) de que el n´ umero de fallas es independiente del turno. Encuentre el valor-p de esta prueba. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

150

Cap´ıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste 7. Un art´ıculo publicado en el Journal of M arketing Ressearch (1970, p´ag. 36-42) contiene un estudio de la relaci´on entre las condiciones de las instalaciones de la gasoliner´ıas y la din´amica de la pol´ıtica de mercadotecnia seguida por ellas. Para ello se investig´o una muestra de 441 gasoliner´ıas, y se obtuvieron los resultados siguientes. Condici´on Pol´ıtica Subest´andar Est´andar Din´amica 24 52 Neutral 15 73 No din´amica 17 80

Moderna 58 86 36

¿Existe evidencia de que la pol´ıtica de mercadotecnia y las condiciones de la gasoliner´ıa son independientes? Utilice α = 0,05. 8. Se dise˜ na un generador de n´ umeros seudoaleatorios de modo que los enteros 0 a 9 tengan la misma probabilidad de ocurrencia. Los primeros 10 mil n´ umeros son: 1 2 3 4 5 6 7 8 9 0 967 1008 975 1022 1003 989 1001 981 1043 1011 a) ¿El generador trabaj´o de manera apropiada? Utilice α = 0,01. b) Calcule el valor-p de esta prueba. 9. Se toma una muestra aleatoria de 50 observaciones sobre el di´ametro de puntos de soldadura y el valor correspondiente de la resistencia al esfuerzo cortante. a) Dado que r = 0,62 , pruebe la hip´otesis de que ρ = 0 utilizando α = 0,01. ¿Cu´al es el valor-p de esta prueba? b) Encuentre un intervalo de confianza del 99 % para ρ. c) Con base en el intervalo de confianza del inciso b), ¿puede concluirse que ρ = 0,5 con un nivel de significancia de 0.01?

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

Cap´ıtulo 9 An´ alisis de Regresi´ on 9.1.

Ejercicios Resueltos

EJERCICIO 1 Suponga que se tiene inter´es en ajustar un modelo de regresi´on lineal simple Yi = β0 + β1 xi + εi ,

i = 1, ..., n

donde εi ∼ N (0, σ 2 ) y β0 y σ 2 son conocidos. (a) Encuentre el estimador de m´ınimos cuadrados de β1 . (b) ¿Cu´al es la varianza del estimador encontrado en el inciso (a)? (c) Encuentre una expresi´on para el intervalo de confianza del 100(1 − α) % para la pendiente β1 . ¿Este intervalo es mayor que el intervalo correspondiente al caso donde tanto β0 como β1 son desconocidos? ´ SOLUCION (a) Estimador de m´ınimos cuadrados para β1 n X

ε2i =

i=1

n X

(yi − βo − β1 xi )2

i=1

luego derivando con respecto al par´ametro tenemos



n X i=1

∂β1

ε2i = −2

n X

(yi − β0 − β1 xi ) · xi = 0

i=1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

152

Cap´ıtulo 9. An´ alisis de Regresi´ on



n X

(yi − β0 − β1 xi ) · xi = 0

i=1



n X

(xi yi − β0 xi − β1 x2i ) = 0

i=1



n X

xi yi − β0

n X

xi − β1

i=1

i=1

n X

x2i = 0

i=1

luego despejando y recordando que β0 es conocido, nos queda n X

βˆ1 =

xi yi − β0

n X

i=1

xi

i=1 n X

x2i

i=1

(b) Se pide calcular la V ar(βˆ1 ).



n X

xi yi − β0   i=1 V ar(βˆ1 ) = V ar  n  X  x2i

n X i=1

 xi     

i=1

=

1 n X

!2 V ar

x2i

n X

xi yi − β0

i=1

i=1

i=1

=

1 n X

!2 V ar

x2i

n X

! xi yi

i=1

i=1 ind

=

n X

1 n X

!2 x2i

n X

x2i V ar(yi )

i=1

i=1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

! xi

9.1 Ejercicios Resueltos

153

=

n X

1 n X

!2 x2i

x2i σ 2

i=1

i=1

n X

= σ2

x2i

i=1 n X

!2 x2i

i=1

=

σ2 n X x2i i=1

(c) Cuando ambos par´ametros son desconocidos el intervalo para β1 es de la siguiente forma: i h ˆ ˆ α β1 ∈ β1 ∓ t(n−2),1− 2 · s.e(β1 ) donde v u 2 u σ ˆ s.e(β1 ) = u n uX t x2 i

i=1

considerando σ 2 conocido. EJERCICIO 2 Suponga que se especifica un modelo lineal simple sin intercepto yi = µxi + εi ,

i = 1, . . . , n

εi ∼ N (0, σ 2 ) (a) Encuentre el estimador de m´ınimos cuadrados de µ, µ ˆ y de σ 2 , σ ˆ2. (b) Calcule E(ˆ µ) y V ar(ˆ µ). (c) Estime la ecuaci´on de regresi´on a partir del siguiente conjunto de datos x 2 2 3 4 4 y 5 6 9 11 13 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

154

Cap´ıtulo 9. An´ alisis de Regresi´ on ´ SOLUCION (a) Estimador de m´ınimos cuadrados para µ n X

ε2i

n X

=

i=1

(yi − µxi )2

i=1

luego derivando con respecto al par´ametro tenemos



n X i=1

∂µ

ε2i = −2

n X

(yi − µxi ) · xi = 0

i=1



n X

(yi − µxi ) · xi = 0

i=1



n X

(xi yi − µx2i ) = 0

i=1



n X

xi yi − µ

i=1

n X i=1

luego despejando nos queda n X

µ ˆ=

xi yi

i=1 n X

x2i

i=1

Ahora para σ 2 tenemos que el estimador es

σ ˆ2 =

SSE n−2 n X

=

ε2i

i=1

n−2

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

x2i = 0

9.1 Ejercicios Resueltos

155 n X

=

i=1

n−2 n X

=

(yi − µ ˆxi )2

yi2

− 2ˆ µ

i=1

n X

xi yi + µ ˆ

n X

2

x2i

i=1

i=1

n−2

n X

2 yi2 −

i=1

!2

n X

n X

xi yi

i=1 n X

!2 xi yi

i=1

+

n X

x2i

i=1 i=1

=

n−2 n X n X

yi2 −

i=1

xi yi

i=1 n X

x2i

i=1

=

n−2 n X

=

!2

n X

yi2

i=1

n−2



!2 xi yi

i=1

(n − 2)

n X

! x2i

i=1

(b) 1 E(ˆ µ) = n X

E x2i

n X

! xi yi

i=1

i=1

1 = n X

n X

xi E (yi )

x2i i=1

i=1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

, n X x2i

i=1  !2

x2i

156

Cap´ıtulo 9. An´ alisis de Regresi´ on

=

1 n X

n X

x2i

xi · µxi

i=1

i=1

, n X 1 = n, ·µ· x2i X i=1 x2i i=1

=µ ∴ µ ˆ es un estimador insesgado. (c) Para estimar la recta debemos solo calcular µ ˆ en base a los datos n X

µ ˆ=

xi yi

i=1 n X

= x2i

10 + 12 + 27 + 44 + 52 = 2,959 4 + 4 + 9 + 16 + 16

i=1

luego la recta pedida es de la forma: yˆ = 2,959 · xi EJERCICIO 3 Se presentan los siguientes datos sobre x = % de absorci´on de luz a 5800A e y = pico de fotovoltaje: x y

4.0 0.12

8.7 12.7 19.1 21.4 24.6 28.9 29.8 30.5 0.28 0.55 0.68 0.85 1.02 1.15 1.34 1.29

(a) Construya una gr´afica de dispersi´on de estos datos. ¿Qu´e sugiere? (b) Obtenga la ecuaci´on de la recta de regresi´on estimada suponiendo que el modelo de regresi´on lineal simple es apropiado. (c) ¿Qu´e proporci´on de la variaci´on observada en pico de fotovoltaje se puede explicar por el modelo de regresi´on? (d) Pronostique el pico de fotovoltaje cuando el % de absorci´on sea 19.1 y calcule el valor del residuo correspondiente. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

157

(e) Se piensa que hay una regresi´on lineal u ´til entre % de absorci´on y pico de fotovoltaje. ¿Est´a de acuerdo?. Realice una prueba formal. ´ SOLUCION (a) Observando el gr´afico de dispersi´on siguiente se sugiere que hay una asociaci´on lineal entre el % de absorci´on de luz y el pico de fotovoltaje

Figura 9.1: Gr´afico de dispersi´on (b) La ecuaci´on de la recta estimada es la siguiente: yˆ = βˆ0 + βˆ1 x con βˆ0 = y − βˆ1 x

y

Sxy βˆ1 = Sxx

de los datos obtenemos que y = 0,8088889

y

x = 19,96667

adem´as se obtienen tambi´en

Sxx =

9 X

(xi − x)2

= 746,4

(yi − y)2

= 1,514089

i=1

Syy =

9 X i=1

Sxy =

9 X

(xi − x)(yi − y) = 33,32567

i=1 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

158

Cap´ıtulo 9. An´ alisis de Regresi´ on luego, reemplazando tenemos que βˆ0 = −0,08259353

y

βˆ1 = 0,04464854

quedando la ecuaci´on de la recta estimada como sigue yˆi = −0,08259353 + 0,04464854 · xi (c) Lo que se pide corresponde a la definici´on de R2 R2 =

SSE SSR =1− Syy Syy

donde

SSE = Syy − βˆ1 · Sxy = 1,514089 − 0,04464854 · 33,32567 = 0,02614669 reemplazando tenemos que

R2 = 1 −

0,02614669 1,514089

= 0,9827311 ≈ 98,27 % Luego, el modelo explica el 98.27 % de variabilidad presente en los datos, lo que se considera muy bueno. (d) El pron´ostico cuando el % de absorci´on es de 19.1 es

yˆ = −0,08259353 + 0,04464854 · 19,1 = 0,7701936 El residuo ser´a la diferencia entre el verdadero valor observado para x = 19,1 y el calculado por medio de la recta de estimaci´on Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

159

x y yˆ 19,1 0,68 0,7701936 luego el residuo es e = 0,68 − 0,7701936 = −0,0901936 (e) Dado que se pide una verificaci´on para la regresi´on lineal, tenemos que probar si el coeficiente β1 es significativo, es decir distinto de cero. La hip´otesis a docimar es la siguiente: H0 : β1 = 0

H1 : β1 6= 0

vs

El estad´ıstico de prueba es tc =

βˆ1 − 0 s.e(βˆ1 )

Se rechaza H0 si |tc | > t(n−2),1− α2 Tenemos que s s.e(βˆ1 ) =

σ ˆ2 Sxx

y

σ ˆ2 =

=

SSE n−2 0,02614669 7

= 0,003735241 luego el estad´ıstico Tc queda Tc =

0,04464854 − 0 q = 19,95877 0,003735241 746,4

al comparar tenemos que |Tc | = 19,95877 > t7,1− α2 = 2,364624.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

160

Cap´ıtulo 9. An´ alisis de Regresi´ on Existe suficiente evidencia para rechazar H0 con un 95 % de confianza, es decir, hay una relaci´on lineal u ´til entre el % de absorci´on de luz y el pico de fotovoltaje. EJERCICIO 4 En el cultivo de tejidos in vitro se ha observado que si se colocan dos n´ ucleos, a esto se llama un campo de atracci´on, los campos de atracci´on se forman con mayor frecuencia si los n´ ucleos est´an cercanos. En un experimento se colocaron 20 n´ ucleos a distancias diferentes y se midi´o la incidencia de campos de atracci´on (Y ) para las diferencias distancias (X). Lamentablemente se borr´o parte del an´alisis de regresi´on y se le solicita completarlo. (a) Completa la tabla ANOVA que se entrega a continuaci´on: Tabla ANOVA Fuente g.l SS MS Regresi´on 1 2.0559 Error Total

F 301.08

(b) ¿Qu´e porcentaje de la variable total est´a siendo explicada por el modelo? (c) Utilizando la siguiente informaci´on realice test de hip´otesis para los par´ametros del modelo. Concluya. Ecuaci{\’o}n de regresi{\’o}n Y = 1.18 - 0.278 X Predictor Coef Stdev t-ratio Const 1.176232 0.03839 30.64 Distancia -0.278010 0.01602 -17.35

´ SOLUCION

(a) La tabla ANOVA esta compuesta de los siguientes elementos.

Fuente Regresi´on Error Total

Tabla ANOVA g.l SS MS F p SSR SSR /p M SR /M SE n − 1 − p SSE SSE /(n − 1 − p) n−1 SST

luego la tabla queda Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

161

Fuente Regresi´on Error Total

Tabla ANOVA g.l SS MS F 1 2.0559 301.08 0.1229 18 0.1229 0.0068 19 2.1788

(b) Lo que se pide es el R2 . R2 =

SSE SSR =1− Syy Syy

reemplazando tenemos que

R2 = 1 −

0,1229 2,1788

= 0,9435928 ≈ 94,36 % luego, el modelo explica el 94.36 % de variabilidad presente en los datos. (c) Mediante el test T docimaremos las siguientes hip´otesis: Ho : β0 = 0

vs

H1 : β0 6= 0

Ho : β1 = 0

vs

H1 : β1 6= 0

y donde la regi´on de rechazo para este caso esta definida por  R : |Tc | > tn−2;1− α2 Como t7,0,975 = 2,365 tenemos que |T0 | = 30,64 > t7,0,975 y |T1 | = 17,35 > t7,0,975 , en ambos casos se rechaza H0 con un 95 %, es decir, los par´ametros son significativos. EJERCICIO 5 Se ha comprobado que las aleaciones amorfas tienen una excelente resistencia a la corrosi´on. En Corrosion Science(Septiembre de 1993) se inform´o de la resistividad de una aleaci´on amorfa de hierro, boro y silicio despu´es de la cristalizaci´on. Se reconocieron cinco espec´ımenes de la aleaci´on a 700o C, cada uno durante un intervalo de tiempo distinto. Despu´es se midi´o el potencial de pasivaci´on -una medida de la resistividad de la aleaci´on cristalizada- para cada espec´ımenes. Los datos experimentales son los siguientes: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

162

Cap´ıtulo 9. An´ alisis de Regresi´ on Tiempo de Recorrido Potencial de Pasivaci´on (minutos) (m V) y x 10 -408 -400 20 45 -392 -379 90 120 -385 (a) Construya un diagrama de dispersi´on para los datos. (b) Suponiendo que la mejor forma de describir la relaci´on entre las variables es con una l´ınea recta, utilice el m´etodo de m´ınimos cuadrados para estimar la ordenada al origen y la pendiente de la l´ınea recta. Interprete estos valores. (c) Trace la l´ınea de m´ınimos cuadrados sobre el diagrama de dispersi´on. (d) Seg´ un la l´ınea de m´ınimos cuadrados. ¿Cu´al es el potencial de pasivaci´on esperado y, cuando el tiempo de recocido es de x = 30 minutos?. (e) Calcule el R2 para este modelo. Proporcione una interpretaci´on de esta cantidad. (f) Realice los test individuales con α = 0,05, H0 : βi = 0 vs H1 : βi 6= 0, i = 0, 1. ´ SOLUCION

(a) En la figura se muestra el gr´afico de dispersi´on de los datos.

Figura 9.2: Gr´afico de Dispersi´on (b) Lo estimadores de m´ınimos cuadrados para la ordenada de origen (βˆ0 ) y la pendiente de la l´ınea recta (βˆ1 ) son: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

163

Sxy βˆ1 = Sxx

βˆ0 = y − βˆ1 x

y

Para poder estimarlos necesitamos

Sxx =

5 X

(xi − x)2

= 8780

(yi − y)2

= 534,8

i=1

Syy =

5 X i=1

Sxy =

5 X

(xi − x)(yi − y) = 1918

i=1

adem´as y = −392,8

y

x = 57

reemplazando tenemos que βˆ1 = 0,218451

y

βˆ0 = −405,2517

luego la recta es de la forma yˆ = −405,2517 + 0,218451 · x (c) Ahora sobre el gr´afico de dispersi´on se construye la recta de regresi´on.

Figura 9.3: Recta de regresi´on

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

164

Cap´ıtulo 9. An´ alisis de Regresi´ on (d) El potencial de pasivaci´on esperado y, cuando el tiempo de recorrido es de x = 30 minutos es yˆ = −405,2517 + 0,218451 · 30 = −398,6982 (e) Para poder calcular el R2 necesitamos SSE = Syy − βˆ1 · Sxx = 534,8 − 0,218451 · 1918 = 115,811 luego reemplazando tenemos

R2 =

SSR Syy

=1−

SSE Syy

=1−

115,811 534,8

= 0,78345 ≈ 78,35 % (f) Se pide docimar hip´otesis para β0 = 0 y β1 = 1. Docimemos primero la siguiente: H0 : β0 = 0

vs

H1 : β0 6= 0

el estad´ıstico de prueba es βˆ0 − β0,0 tc = q ˆ V ar(β) βˆ0 − β0,0 =r n o 2 σ ˆ n1 + Sxxx

=r

βˆ0 − β0,0 n o SSE 1 x2 · + n−2 n Sxx

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

165

=q

−405,2517 − 0  115,811 572 · 15 + 8780 5−2

= −86,38847 La regi´on de rechazo esta dada por |tc | > t(n−(k+1)),1− α2 ,

donde k es el no de variables explicativas

considerando un α = 0,05 (95 % de confianza), se tiene que: t(n−(k+1)),1− α2 = t(5−2),0,975 = 3,182446 Como |tc | = 86,38847 > t3,0,975 = 3,182446, existe evidencia suficiente bajo un 95 % de confianza para rechazar H0 , es decir, el par´ametro β0 es significativo consider´andose como distinto a cero. Ahora docimemos la siguiente hip´otesis H0 : β = 1

H1 : β 6= 1

vs

el estad´ıstico de prueba es βˆ1 − β1,0 tc = q V ar(βˆ1 )

=

βˆ1 − β1,0 q σ ˆ Sxx

=

0,218451 − 0 q 115,811 5−2

8780

= 3,294481 La regi´on de rechazo al igual que el caso anterior esta dada por |tc | > t(n−(k+1)),1− α2 ,

donde k es el no de variables explicativas

considerando nuevamente α = 0,05 (95 % de confianza) t(n−(k+1)),1− α2 = t3,0,975 = 3,182446 Como |tc | = 3,294481 > t3,0,975 = 3,182446, existe evidencia suficiente bajo un 95 % de confianza para rechazar H0 , es decir, el par´ametro β1 es significativo y se puede considerar como distinto a cero. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

166

Cap´ıtulo 9. An´ alisis de Regresi´ on EJERCICIO 6 La presencia de carburos duros en aleaciones de hierro blanco con alto cromo da como resultado una excelente resistencia a la abrasi´on, por lo mismo son adecuados para el manejo de materiales en la industria minera. Los datos de y = p´erdida por desgaste abrasivo (mm3 ) y x = contenido de austenita retenida ( %), en pruebas de desgaste de pernos con granete como abrasivo, fueron analizados con un modelo de regresi´on lineal simple. Utilice el resultado que se presenta de MINITAB para contestar las siguientes preguntas: ¿Cu´al es la ecuaci´on de la recta de regresi´on estimada? Complete la tabla de an´alisis de varianza (tabla ANOVA). ¿Qu´e proporci´on de la variaci´on observada de p´erdida de desgaste se puede atribuir al modelo de regresi´on lineal simple para esa relaci´on? Pruebe la utilidad del modelo de regresi´on lineal simple, use α = 0,01. Estime la p´erdida real promedio por desgaste cuando el contenido es 50 % ofreciendo informaci´on acerca de la confiabilidad y la precisi´on. ¿Qu´e valor de p´erdida por desgaste pronosticar´ıa cuando el contenido es 30 %, y cu´al es el valor del residuo correspondiente, sabiendo que el valor observado fue de 0.80? Otros datos relevantes: n X

x2i = 41574,84

y

x = 42,32941

i=1

Regression Analysis: y versus x Predictor Coef Constant 0.787218 x 0.007570

SE Coef 0.09525879 0.00192626

T 8.264 3.930

P 0.0001 0.0013

Analysis of Variance (tabla ANOVA) Source Regression Residual Error Total

DF

SS 0.63690

MS

F

15 1.25551

´ SOLUCION (a) Con los datos entregados por la salida de Minitab la recta de regresi´on estimada es: yˆ = 0,787218 + 0,007570x Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

167

(b) La tabla Anova queda como sigue:

Fuente Regresi´on Error Total

Tabla ANOVA g.l SS MS F 1 0.6369 0.6369 15.443 15 0.6186 0.04124 16 1.2555

(c) Se pide el R2 .

R2 =

=

SSR Syy 0,6369 1,255

= 0,5072 ≈ 50,72 % luego, el modelo explica un 50.72 % de variabilidad presente en los datos. (d) Observando el valor-p de x, tenemos que valor-p = 0,0013 < 0,01 = α Por lo tanto se rechaza la hip´otesis H0 : β1 = 0. (e) La estimaci´on para la p´erdida real promedio por desgaste cuando el contenido es 50 % es: yˆ = 0,787218 + 0,00757 · 50 = 1,165718 (f) El valor de p´erdida por desgaste que pronosticar´ıa cuando el contenido es 30 % es: yˆ = 0,787218 + 0,00757 · 30 = 1,014318 Sabiendo que le verdadero valor observado fue 0.8, el residuo es e = y − yˆ = 0,8 − 1,014318 = −0,214318 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

168

Cap´ıtulo 9. An´ alisis de Regresi´ on EJERCICIO 7 Se ha observado que para predecir la demanda (consumo) de combustible para la calefacci´on, resulta ser m´as preciso el pron´ostico a largo plazo de las temperaturas y el uso de la relaci´on temperatura-consumo que el tratar de pronosticar directamente analizando las ventas de combustible. Un distribuidor de combustible mantiene un registro de ventas mensuales de combustible y de temperaturas m´aximas en esos meses. A continuaci´on aparecen los datos de nueve de estos meses seleccionados al azar. Ventas (y) 26.2 Temperaturas (x) 46.5

17.4 54.6

7.8 12.3 65.2 62.3

35.9 41.9

42.1 38.6

26.4 19.0 43.7 52.0

10.1 59.8

(a) Encuentre la recta de m´ınimos cuadrados para estos datos. (b) Grafique los puntos y la recta como una verificaci´on de sus c´alculos. (c) Utilice la ecuaci´on de la recta ajustada para predecir la venta observada cuando la temperatura es de 50o F. (d) Estime σ 2 . (e) Pruebe la significancia de la regresi´on con α = 0,5. ¿A qu´e conclusiones puede llegarse? (f) Encuentre un intervalo de confianza del 90 % para las ventas mensuales esperadas (medias) en aquellos meses en que el promedio de la temperatura m´axima sea de 45o F. (g) Calcule e interprete el R2 . ´ SOLUCION

(a) Para poder calcular los estimadores de la recta de regresi´on, necesitamos los siguientes resultados:

Total

x y x2 y2 x·y 46.5 26.2 2162.25 686.44 1218.30 54.6 17.4 2981.16 302.76 950.04 65.2 7.8 4251.04 60.84 508.56 62.3 12.3 3881.29 151.29 766.29 41.9 35.9 1755.61 1288.81 1504.21 38.6 42.1 1489.96 1772.41 1625.06 43.7 26.4 1909.69 696.96 1153.68 52.0 19.0 2704.00 361.00 988.00 59.8 10.1 3576.04 102.01 603.98 464.6 197.2 24711.04 5422.52 9318.12

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

169

de la tabla anterior se extraen los siguientes resultados: 9 X

xi

=

464,6 ⇒ X = 51,62

yi

=

197,6 ⇒ Y = 21,91

x2i

= 24711,04

yi2

=

5422,52

xi yi =

9318,12

i=1 9 X i=1 9 X i=1 9 X i=1 9 X i=1

Con esto podemos calcular

Sxx =

9 X

2

= 24711,04 − 9 · (51,62)2

=

729,4204

2

= 5422,52 − 9 · (21,91)2

=

1102,0871

x2i − 9X

i=1

Syy =

9 X

yi2 − 9Y

i=1

Sxy =

9 X

xi yi − 9X · Y

= 9318,12 − 9 · (51,62)(21,91) = −860,8278

i=1

Luego Sxy −860,8278 βˆ1 = = = −1,180 Sxx 729,4204 βˆ0 = Y − βˆ1 X = 21,91 + 1,180 · 51,62 = 82,822 Donde la recta de regresi´on es: yˆ = 82,822 − 1,180x (b) El gr´afico de los puntos y la recta de regresi´on se presenta a continuaci´on Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

170

Cap´ıtulo 9. An´ alisis de Regresi´ on

Figura 9.4: Recta de regresi´on (c) La predicci´on de las ventas para una temperatura de 50o F es: yˆ = 82,822 − 1,180 · 50 = 23,822 (d) Tenemos que σ ˆ2 =

SSE n−2

SSE = Syy − βˆ1 Sxy

y

Con los resultados obtenidos en (a) se calcula SSE.

SSE = Syy − βˆ1 Sxy = 1102,0871 + 1,180 · (−860,8278) = 86,31 Luego σ ˆ2 =

86,31 = 12,33 7

(e) La hip´otesis de significancia para la regresi´on es: Ho : β1 = 0

vs

Se rechaza Ho si |T1 | > tn−2;1− α2 , donde T1 =

H1 : β1 6= 0 βˆ1 . se(βˆ1 )

Para este caso tenemos que: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

171

−1,180 T1 = se(βˆ1 ) T1 = −

con

se(βˆ1 ) =

r

12,33 = 0,13 729,4204

1,180 ≈ −9,1 0,13

como t7;0,975 = 2,365 tenemos que |T1 | > t7;0,975 . Luego rechazamos la hip´otesis nula, es decir, los datos presentan suficiente evidencia de que las ventas de combustible est´an relacionadas linealmente con la temperatura. (f) El intervalo pedido es el siguiente: s ˆy/x0 ∓ tn−2;1− α2 IC(µy/x0 ) = µ

 σ ˆ2

1 (x0 − x)2 + n Sxx



Reemplazando s



IC(µy/45 ) = (82,822 − 1,180 · (45)) ∓ 1,895 12,33

1 (45 − 51,62)2 + 10 729,4204



= 29,72 ∓ 2,66 = (27,06; 32,38) (g) R2 = 1 −

SSE Syy

=1−

86,31 1102,0871

= 0,9268

Existe un 92.68 % de variaci´on en los datos mensuales que se explica por la temperatura m´axima promedio.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

172

Cap´ıtulo 9. An´ alisis de Regresi´ on EJERCICIO 8 Los siguientes datos se refieren al flujo de cloro (X, en cm3 normales por minuto) por una boquilla, utilizada en el mecanismo de grabado, y la rapidez de grabado (Y , en 100 A/min). X Y

1.5 1.5 2.0 2.5 2.5 3.0 3.5 3.5 4.0 23.0 24.5 25.0 30.0 33.5 40.0 40.5 47.0 49.0

P P P P Los estad´ısticos de resumen son: xi = 24,0, x2i = 70,50, yi = 312,5, yi2 = 11626,75, P xi yi = 902,25, βˆ0 = 6,448718, βˆ1 = 10,602564. (a) ¿El modelo de regresi´on lineal simple especifica una relaci´on u ´til entre el flujo de cloro y la rapidez de grabado? (b) Estime el cambio real promedio de rapidez de grabado asociado con un aumento de 1 cm3 normal por minuto en el flujo, con un intervalo de confianza del 95 %, e interprete el intervalo. (c) Calcule el intervalo de confianza de 95 % de confianza para µY |x=3 , la rapidez real promedio de grabado cuando el flujo es igual a 3. ¿Se estim´o con precisi´on este promedio? (d) Calcule el intervalo de predicci´on de 95 % de confianza para una sola observaci´on futura sobre la rapidez de grabado cuando el flujo es igual a 3. ¿Es probable que la predicci´on sea exacta? (e) ¿Recomendar´ıa calcular un intervalo de predicci´on de 95 % para un flujo de 6? Explique. ´ SOLUCION

(a) Hay que realizar el test: H0 : β1 = 0

H1 : β1 6= 0

vs

El estad´ıstico de prueba es tc =

βˆ1 s.e(βˆ1 )

Se rechaza H0 si |tc | > t α2 (n − 2) Tenemos que s s.e(βˆ1 ) =

σ ˆ2 Sxx

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

173

Necesitamos los siguientes resultados

Sxx =

9 X

2

)2 = 70,5 − 9 · ( 24 9

=

2

= 11626,75 − 9 · ( 312,5 )2 9

= 776,06

x2i − 9X

6,5

i=1

Syy =

9 X

yi2 − 9Y

i=1

Sxy =

9 X

= 902,25 − 9 · ( 24 )( 312,5 ) = 9 9

xi yi − 9X · Y

i=1

luego reemplazando obtenemos el valor de σ ˆ 2 como sigue:

σ ˆ2 =

SSE n−2

=

Syy − βˆ1 Sxy n−2

=

776,06 − 10602564 · 68,92 9−2

=

45,33 7

= 6,48 Luego s.e(βˆ1 ) =

r

6,48 = 0,998 6,2

por lo tanto el estad´ıstico de prueba queda como tc =

10,602564 ≈ 10,62 0,998

y considerando α = 5 % tenemos que t(n−2),1− α2 = t7,0,975 = 2,365 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

68,92

174

Cap´ıtulo 9. An´ alisis de Regresi´ on (a) como |tc | > 2,365 se rechaza H0 Por lo tanto el modelo de regresi´on lineal especifica una regresi´on u ´til entre X e Y . (b) Hay que encontrar un I.C. para β1 : h i ˆ ˆ α β1 ∈ β1 ∓ t(n−2), 2 · s.e(β1 ) β1 ∈ [10,602564 ∓ 2,365 · 0,998] β1 ∈ [8,2422; 12,9628] Con un 95 % de confianza, estimamos el cambio real promedio de rapidez de grabado entre 8.2422 y 12.9628 asociado con un aumento de 1 cm3 normal por minuto en el flujo. (c) El intervalo pedido es el siguiente: s IC(µy/x0 ) = µ ˆy/x0 ∓ tn−2;1− α2

 σ ˆ2

1 (x0 − x)2 + n Sxx



luego necesitamos X=

24 = 2,67 9

adem´as

µ ˆy/x0 =3 = βˆ0 + βˆ1 x0 = 6,448718 + 10,602564 · 3 = 38,25641 ahora reemplazando tenemos que "

s



µy/x0 =3 ∈ 38,25641 ∓ 2,365 6,48

1 (3 − 2,67)2 + 9 6,5

µy/x0 =3 ∈ [38,25641 ∓ 2,365 · 0,9102] Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

#

9.1 Ejercicios Resueltos

175

µy/x0 =3 ∈ [36,10; 40,41]

Se aprecia que s´ı se estimo con precisi´on este promedio, ya que si observamos la tabla de datos cuando x = 3, el valor de y es 40 y este valor pertenece al I.C. (d) El intervalo pedido es el siguiente: s IC(y0 ) ∈ y0 ∓ t

n−2;1− α 2

σ ˆ2

  1 (x0 − x)2 1+ + n Sxx

necesitamos

yˆ0 = βˆ0 + βˆ1 x0 = 6,448718 + 10,602564 · 3 = 38,25641 Luego reemplazando s

 # 1 (3 − 2,67)2 y0 ∈ 38,25641 ∓ 2,365 6,48 1 + + 9 6,5 "

y0 ∈ [38,25641 ∓ 2,365 · 2,70] y0 ∈ [31,87; 44,64]

Por lo tanto es probable que la predicci´on sea exacta. (e) No cambia ya que el nivel de confianza es el mismo. (f) Como el valor 6.0 est´a muy alejado del rango en el cual var´ıa x no ser´ıa recomendable calcular un I.C. EJERCICIO 9 Es dif´ıcil determinar la resistencia al corte de puntos de soldadura, mientras que es relativamente sencillo medir el di´ametro de soldadura de puntos. Seria ventajoso si se pudiera predecir la resistencia al corte de una medici´on del di´ametro de soldadura. Los datos son: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

176

Cap´ıtulo 9. An´ alisis de Regresi´ on Y : Resistencia al corte (psi) X: Di´ametro de soldadura (0.0001 pulg) 370 400 800 780 1210 1210 1600 1560 1980 2000 2500 2450 3070 3100 3550 3600 3940 4000 4000 3950 (a) ¿Existe evidencia para pensar que el ajuste de una regresi´on lineal es adecuada? (b) Docime si la correlaci´on entre ambas variables es nula. (c) Determine la recta por m´ınimos cuadrados. (d) Calcule las varianzas de los par´ametros encontrados. (e) Docime las hip´otesis β1 = 1 y β0 = 0, usando un nivel de significaci´on igual a 0.01. (f) Rectifique el punto anterior usando intervalos de confianza adecuados. ´ SOLUCION (a) La evidencia se puede obtener al graficar los puntos o calcular el coeficiente de correlaci´on r.

Figura 9.5: Gr´afico de puntos Del gr´afico se aprecia una fuerte asociaci´on lineal entre la resistencia al corte y el di´ametro de la soldadura.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

177

Calculemos ahora el coeficiente de correlaci´on para verificar esta apreciaci´on.

n X

r=

(xi − x)(yi − y)

s ni=1 X

(xi − x)2

i=1

n X i=1

n· = v u n u X u x2i − t n i=1

=p

=√

=

(yi − y)2

n X

xi yi −

i=1 n X

n X

xi

n X

i=1

!2   xi

 · n

i=1

yi

i=1 n X

yi2 −

n X

i=1

!2  yi



i=1

10 · 68674100 − 23210 · 22860 (10 · 69644100 − 538704100) · (10 · 67719400 − 522579600)

156160400 15773690 · 154614400

156160400 156167846

= 0,9999 Por lo tanto, como r = 0,9999 ≈ 1 hay una fuerte asociaci´on lineal entre el di´ametro de soldadura, la resistencia al corte, misma conclusi´on obtenida observando el gr´afico. Hay evidencia emp´ırica para pensar que el ajuste de la regresi´on lineal es adecuado. (b) La hip´otesis que se pide docimar es la siguiente: Sea ρ: correlaci´on H0 : ρ = ρ 0

vs

H1 : ρ > ρ 0

esta prueba de hip´otesis tiene una regi´on de rechazo dada por: R = {Zc > z1−α } Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

178

Cap´ıtulo 9. An´ alisis de Regresi´ on donde Zc =

=

=

1 2

1+r 1−r

ln





− 21 ln

1+ρ0 1−ρ0



√1 n−3

1 2

1+r 1−r

ln



√1 n−3

1 2

ln (1999) √1 7

= 10,05439 considerando α = 0,05 tenemos que z1−0,05 = 1,64. Luego, como Zc = 10,05439 > z1−α = 1,64, existe evidencia suficiente para rechazar H0 , esto implica que la correlaci´on entre ambas variables no es nula. (c) La estimaci´on de la recta por m´ınimos cuadrados est´a dada por ˆ yˆ = α ˆ + βx donde α ˆ y βˆ son los estimadores de m´ınimos cuadrados. n X

βˆ =

(xi − x)(yi − y)

i=1



n X

(xi − x)2

i=1

n· =

n X

x i yi −

i=1



n X i=1

=

n X

xi

i=1

x2i −

n X

n X

yi

i=1

!2 xi

i=1

10 · 68674100 − 23210 · 2280 10 · 69644100 − 538704100

= 0,99

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

179

α ˆ = y − βˆ · x = 22,86 − 0,99 · 2321 = 2286 − 2297,79 = −11,79 As´ı la recta es yˆ = −11,79 + 0,99 · x n X

ˆ = (d) V ar(β)

(xi − x)2

i=1  n X  (xi 

2 V

ar(yi )

− x)2 

i=1

como V ar(yi ) = σ 2 tenemos que ˆ = V ar(β)

σ2 n X

(xi − x)2

i=1

ahora para α ˆ

ˆ − 2xCov(y, β) ˆ V ar(ˆ α) = V ar(y) + x2 V ar(β)

=

σ2 σ2 + x2 n − 2x · 0 X n 2 (xi − x) i=1





  2   1 x  = σ2  + n n X    (xi − x)2 i=1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

180

Cap´ıtulo 9. An´ alisis de Regresi´ on

σ = n·

2

n X

x2i

i=1 n X

(xi − x)2

i=1

pero notese que σ 2 hay que estimarlo. SCE σ ˆ = , n−1 2

donde SCE =

n X

e2i

=

i=1

n X

(yi − yˆi )2

i=1

luego reemplazando tenemos que 10 X

ei = (−14,19942)2 + (−0,2016205)2 + (23,89612)2 + (−12,20603)2 + (11,79177)2

i=1

+ (−13,21099)2 + (12,78571)2 + (−2,217046)2 + (−8,21925)2 + (1,78075)2 = 1474,369 luego la estimaci´on de σ 2 es σ ˆ2 =

por lo tanto, como tenemos que

1474,369 = 163,8187 10 − 1

10 X

(xi − x)2 = 15773690 y al reemplazar en las igual-

i=1

dades obtenidas para α ˆ y βˆ se calculan las varianzas para estos par´ametros:

ˆ = 163,8187 V ar(β) 15773690 = 0,00001038557

V ar(ˆ α) =

=

163,8187 · 69644100 10 · 15773690 11409007637 157736900

= 72,32935 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

181

(e) Se pide docimar hip´otesis para α = 0 y β = 1. Docimemos primero la siguiente: H0 : α = 0

vs

H1 : α 6= 0

el estad´ıstico de prueba es α ˆ−α tc = p V ar(ˆ α) −11,79 − 0 = √ 72,32935 = −1,386298 La regi´on de rechazo est´a dada por |tc | > t(n−(k+1)),1− α2 ,

donde k es el no de variables explicativas

considerando un α = 0,01 (99 % de confianza) t(n−(k+1)),1− α2 = t(10−2),0,995 = 3,355387 Como |tc | = 1,386298 ≯ t8,0,995 = 3,355387, no existe evidencia suficiente bajo un 99 % de confianza para rechazar H0 , es decir, el par´ametro α no ser´ıa significativo y se puede considerar como igual a cero. Ahora docimemos la siguiente hip´otesis H0 : β = 1

vs

H1 : β 6= 1

el estad´ıstico de prueba es βˆ − β tc = q ˆ V ar(β)

=√

0,99 − 1 0,00001038557

= −3,103022 La regi´on de rechazo, al igual que el caso anterior, est´a dada por |tc | > t(n−(k+1)),1− α2 ,

donde k es el no de variables explicativas

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

182

Cap´ıtulo 9. An´ alisis de Regresi´ on considerando nuevamente α = 0,01 (99 % de confianza) t(n−(k+1)),1− α2 = t8,0,995 = 3,355387 Como |tc | = 3,103022 ≯ t8,0,995 = 3,355387, no existe evidencia suficiente bajo un 99 % de confianza para rechazar H0 , es decir, el par´ametro β se puede considerar como igual a uno. (f) Haremos I.C al 99 % para los par´ametros α y β. El I.C(α) esta dado por

  α) α∈ α ˆ ∓ t α2 (n − 2) · s.e(ˆ h

α ∈ −11,79 ∓ 3,355387 ·

p

i 72,32935

α ∈ [−40,32645; 16,74645] como en el I.C se encuentra el cero, se ratifica lo obtenido en (e) El I.C(β) esta dado por h

i ˆ ˆ α β ∈ β ∓ t 2 (n − 2) · s.e(β) h

β ∈ 0,99 ∓ 3,355387 ·

p

i 0,00001038557

β ∈ [0,9791867; 1,000813] como en el I.C se encuentra el uno, tambi´en se ratifica lo obtenido en (e) para β. EJERCICIO 10 Demuestre que en el modelo de regresi´on lineal simple yi = β0 + β1 xi + εi los estimadores βˆ0 y βˆ1 pueden ser escritos como combinaciones lineales de las respuestas yi . Encuentre expl´ıcitamente las constantes en la combinaci´on lineal.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

183

´ SOLUCION Sabemos que al m´ın

n X

β0 β1

ε2i

i=1

se obtiene: βˆ0 = y − βˆ1 x n X

βˆ1 =

(xi − x)(yi − y)

i=1 n X

(xi − x)2

i=1

en el caso de βˆ1 se tiene que n X

(xi − x)(yi − y) =

n X

(xi yi − xi y − xyi + xy)

i=1

i=1

=

n X

(xi yi − y(xi − x) − xyi )

i=1

=

n X

yi (xi − x) − y(xi − x)

i=1

=

n X

yi (xi − x) − y

n X i=1

i=1

=

n X

yi (xi − x) − y · 0

i=1

=

n X

yi (xi − x)

i=1

luego n X

βˆ1 =

(xi − x)

i=1

Sxx

yi =

n X

di yi

i=1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

(xi − x)

184

Cap´ıtulo 9. An´ alisis de Regresi´ on

donde di =

(xi −x) Sxx

y Sxx =

n X

(xi − x)2 .

i=1

para βˆ0 tenemos que n X

βˆ0 = y −

=

n X i=1

=

n X

(xi − x)

i=1

yi x

Sxx  1 − n

X

(xi − x) Sxx

 x yi

ci yi

i=1 n X

con ci =

1 n



(xi − x)

i=1 Sxx

x

EJERCICIO 11 Demuestre que n σ2 X 2 ˆ β0 ∼ N (β0 , x) y nSxx i=1 i

con Cov(βˆ0 , βˆ1 ) = −

σ2 βˆ1 ∼ N (β1 , ) Sxx σ2x Sxx

´ SOLUCION Como yi ∼ N (β0 + β1 xi , σ 2 ) y βˆ0 es combinaci´on lineal de yi entonces βˆ0 ∼ N (·, ·) donde los par´ametros son:

E(βˆ0 ) = E

n X

! ci E(yi )

i=1

=

n X

ci (β0 + β1 xi )

i=1

=

n  X 1 i=1

(xi − x) − n Sxx x

 (β0 + β1 xi )

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

185

= β0

= β0

n X

ci + β1

n X

ci xi

i=1

i=1

n X

n  X xi

ci + β1

i=1

i=1

(xi − x)xi x − n Sxx

(

n x X x− (xi − x)xi Sxx i=1

= β0 + β1

  x Sxx = β0 + β1 x − Sxx = β0 n X

V ar(βˆ0 ) = V ar

! ci yi

i=1

ind

=

n X

V ar(ci yi )

i=1



2

n X

c2i

i=1

" =σ

2

n 1 X 2 x nSxx i=1 i

#

para βˆ1 E(βˆ1 ) = E

n X

! di yi

i=1

=

n X

di (β0 + β1 xi )

i=1

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

)



186

Cap´ıtulo 9. An´ alisis de Regresi´ on

= β0

n X

di + β1

n X

i=1

di xi

i=1

n X

(xi − x)xi

= 0 + β1 i=1

Sxx

=0 n X

V ar(βˆ1 ) = V ar

! di yi

i=1

ind

= σ

n X

2

d2i

i=1

= σ2

n X (xi − x)2

Sxx

i=1

=

σ2 Sxx

Finalmente la covarianza es Cov(βˆ0 , βˆ1 ) = Cov

n X

ci yi ,

i=1

=

n X n X

n X

! di yi

i=1

ci dj Cov(yi , yj )

i=1 j=1

ind

= σ

2

n X

ci di

i=1



2

n  X 1 i=1



2

(xi − x) x − n Sxx

n  X 1 (xi − x) i=1

n

Sxx



(xi − x) Sxx

(xi − x)2 x − 2 Sxx

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.





9.1 Ejercicios Resueltos

187



2

=−



x 0− Sxx



σ2x Sxx

EJERCICIO 12 Montgomery y Peck (1992) describen el uso de un modelo de regresi´on para relacionar la cantidad de tiempo que requiere un vendedor para dar servicio a una maquina expendedora de refrescos, con el n´ umero de envases contenidos en la maquina (X1 ) y la distancia del veh´ıculo de servicio al sitio donde se encuentra la m´aquina (X2 ). Los datos se presentan a continuaci´on: Obs. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Y X1 9,95 2 24,45 8 31,75 11 35,00 10 25,02 8 16,86 4 14,38 2 9,60 2 24,35 9 27,50 8 17,08 4 37,00 11 41,95 12 11,66 2 21,65 4 17,89 4 69,00 20 10,30 1 34,93 10 46,59 15 44,88 15 54,12 16 56,23 17 22,13 6 21,15 5

X2 50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400

(a) Construya el modelo. (b) Determine paso a paso la tabla ANOVA y concluya. ´ SOLUCION

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

188

Cap´ıtulo 9. An´ alisis de Regresi´ on (a) El modelo es el siguiente: Y = β0 + β1 X1 + β2 X2 + ε para calcular el modelo ajustado Yˆ = βˆ0 + βˆ1 X1 + βˆ2 X2 necesitamos encontrar los estimadores de m´ınimos cuadrados a partir de βˆ = (X 0 X)−1 X 0 Y luego tenemos que 

25 X



25 X

Xi1 Xi2  n  i=1 i=1  25 25 25  X X X  0 2 (X X) =  Xi1 Xi1 Xi1 Xi2  i=1 i=1  i=1 25 25 25  X X X  2 Xi2 Xi1 Xi2 Xi2 i=1

i=1

     25 206 8294    206 2396 77177  =  8294 77177 3531848   

i=1

Invirtiendo (X’X) queda 

(X 0 X)−1

 0,2146526166 −0,00749091422 −3,403891e − 004 0,00167076313 −1,891781e − 005  =  −0,0074909142 −0,0003403891 −0,00001891781 1,495876e − 006

y 

25 X

Yi   i=1  25  X  X 0Y =  Xi1 Yi   i=1 25  X  Xi2 Yi

      725,42    8001,67  =  274580,71   

i=1

por lo tanto los estimadores de m´ınimos cuadrados son:  ˆ      β0 0,2146526166 −0,00749091422 −3,403891e − 004 725,42  βˆ1  =  −0,0074909142 0,00167076313 −1,891781e − 005  ·  8001,67  −0,0003403891 −0,00001891781 1,495876e − 006 274580,71 βˆ2  ˆ    β0 2,30920043  βˆ1  =  2,74036942  0,01243958 βˆ2 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.1 Ejercicios Resueltos

189

luego el modelo ajustado es Yˆ = 2,30920043 + 2,74036942 · X1 + 0,01243958 · X2 (b) La tabla ANOVA tiene la siguiente forma

Fuente Regresi´on Error Total

Tabla ANOVA g.l SS MS F k − 1 SSR SSR /(k − 1) M SR /M SE n − k SSE SSE /(n − k) n − 1 SST

para rellenarla necesitamos n X

SST = Y 0 Y −

!2 yi

i=1

n

= 27133,39 − 21049,37 = 6084,021 n X

ˆ0

0

SSR = β X Y −

!2 yi

i=1

n

= 27018,34 − 21049,37 = 5968,974 SSE = SST − SSR = 115,0465 n´otese que σ ˆ2 = S2 =

SSE , n−k

donde k es la cantidad de par´ametros a estimar. Luego σ ˆ2 =

115,0465 = 5,229388 25 − 3

Ahora la tabla rellenada queda como sigue: Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

190

Cap´ıtulo 9. An´ alisis de Regresi´ on

Fuente Regresi´on Error Total

Tabla ANOVA g.l SS MS 2 5968.974 2984.487 22 115.0465 5.229388 24 6084.021

F 570.7144

Para docimar la hip´otesis: H0 : β1 = β2 = 0

vs

H1 : Al menos un βi 6= 0 para i = 1, 2

Se compara el FAN OV A con un Fk−1;n−k;1−α de tabla. Si FAN OV A > Fk−1;n−k;1−α



se rechaza H0

como FAN OV A = 570,7144 > 3,443357 = F2;22 (0,95) Se rechaza H0 , es decir, la regresi´on es significativa. Al calcular el R2 tenemos que R2 =

SSR = 0,9810904 SST

luego el porcentaje de variabilidad presente en los datos es de 98.11 % aproximadamente.

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.2 Ejercicios Propuestos

9.2.

191

Ejercicios Propuestos

˜ 1. Un art´ıculo publicado en Concrete Research (Near Surface Characteristics of Concrete: Intrinsic Permeability’, vol. 41, 1989) presenta datos sobre la resistencia a la compresi´on x y la permeabilidad intr´ınsica y de varias mezclas y tratamientos de concreto. P P 2 P El resumen yi = 572, yi = 23530, xi = P es el siguiente: n = 14, P 2 de cantidades xi yi = 1697,80. Suponga que las dos variables est´an rela43, xi = 157,42 y cionadas de acuerdo con el modelo de regresi´on lineal simple. a) Calcule las estimaciones de m´ınimos cuadrados de la pendiente y la ordenada al origen. b) Utilice la ecuaci´on de la recta ajustada para predecir la permeabilidad que ser´a observada cuando la resistencia a la compresi´on sea x = 4,3. c) Proporcione una estimaci´on puntual de la permeabilidad promedio cuando la resistencia a la compresi´on para x = 3,7. d ) Suponga que el valor observado de la permeabilidad para x = 3,7 es y = 46,1. Calcule el valor del residuo correspondiente. 2. Un art´ıculo publicado en W ear (vol. 152, 1992, p´ags. 171-181) presenta datos sobre el desgaste del acero dulce y la viscosidad del aceite. A continuaci´on aparecen datos representativos, con x = viscosidad del aceite y y = volumen de desgaste (10−4 mm3 ). y 240 x 1.6

181 193 9.4 15.5

155 172 20.0 22.0

110 35.5

113 43.0

75 94 40.5 33.0

a) Construya una gr´afica de dispersi´on de los datos. ¿Parece plausible el uso de un modelo de regresi´on lineal simple? b) Si parece plausible, ajuste un modelo de regresi´on lineal simple utilizando la t´ecnica de m´ınimos cuadrados. c) Haga una predicci´on sobre el desgaste cuando la viscosidad es x = 30. d ) Obtenga el valor ajustado de y cuando x = 22,0 y calcule el residuo correspondiente. 3. Un art´ıculo publicado en el Journal of Environmental Engineering (vol. 115, n´ um. 3, 1989, p´ags. 608-619) informa los resultados de un estudio sobre la aparici´on de sodio y cloro en los arroyos de la parte central de Rhode Island. Los datos siguientes muestran la concentraci´on de cloro y (en mg/l) y el ´area que rodea a la cuenca x (en porcentaje). y 4.4 x 0.19 y 14.7 x 0.78

6.6 0.15 15.0 0.81

9.7 0.57 17.3 0.78

10.6 0.70 19.2 0.69

10.8 10.9 11.8 12.1 0.67 0.63 0.47 0.70 23.1 27.4 27.7 31.8 1.30 1.05 1.06 1.74

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

14.3 0.60 39.5 1.62

192

Cap´ıtulo 9. An´ alisis de Regresi´ on a) Dibuje un diagrama de dispersi´on de los datos. En este caso, ¿parece apropiado el uso de un modelo de regresi´on lineal simple? b) Ajuste un modelo de regresi´on lineal simple utilizando el m´etodo de m´ınimos cuadrados. c) Estime la concentraci´on promedio de cloro para una cuenca que tiene un ´area que sea el 1 % de la superficie circunvecina. d ) Encuentre el valor ajustado que corresponde a x = 0,47 as´ı como el residuo correspondiente. 4. Considere los datos del ejercicio 1. para x = resistencia a la compresi´on y y = permeabilidad intr´ınseca del concreto. a) Pruebe la significancia de la regresi´on utilizando α = 0,05. Encuentre el valor-p de esta prueba. ¿Puede concluirse que el modelo especifica una relaci´on lineal u ´til entre las dos variables? b) Estime σ 2 y la desviaci´on est´andar de βb1 . c) En este modelo, ¿cu´al es el error est´andar de la ordenada al origen? 5. El ejercicio 3, contiene datos para y = concentraci´on de cloro y x = ´area que rodea la cuenca. a) Pruebe la hip´otesis H0 : β1 = 0 contra H1 : β1 6= 0 utilizando el procedimiento del an´alisis de varianza con α = 0,01. b) Encuentre el valor-p de la prueba del inciso a). c) Estime σ 2 y los errores est´andar de βb1 y βb0 . d ) Pruebe que H0 : β0 = 0 contra H1 : β0 6= 0 con α = 0,01. ¿Qu´e conclusiones pueden obtenerse? ¿Parece que el modelo ajustar´ıa mejor los datos si se eliminase la ordenada al origen? 6. Con los datos del ejercicio 1. para x = resistencia a la compresi´on y y = permeabilidad intr´ınseca del concreto: a) Encuentre un intervalo de confianza del 95 % para la pendiente. b) Encuentre un intervalo de confianza del 95 % para la ordenada al origen. c) Encuentre un intervalo de confianza del 95 % para la permeabilidad promedio cuando x = 2,5. d ) Encuentre un intervalo de confianza del 95 % para la permeabilidad cuando x = 2,5. Explique por qu´e este intervalo es mayor que el calculado en el inciso c). 7. Con respecto a los datos del ejercicio 2. sobre y = desgaste del acero dulce y x = viscosidad del aceite:

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.2 Ejercicios Propuestos

193

a) Encuentre un intervalo de confianza del 95 % para la ordenada al origen. b) Encuentre un intervalo de confianza del 95 % para la pendiente. c) Encuentre un intervalo de confianza del 95 % para el desgaste promedio del acero dulce cuando la viscosidad del aceite es x = 30. 8. El ejercicio 3. presenta datos sobre y = concentraci´on de cloro y x = ´area de la cuenca en la regi´on de la cuenca en la central de Rhode Island. a) Encuentre un intervalo de confianza del 99 % para β1 . b) Encuentre un intervalo de confianza del 99 % para β0 . c) Encuentre un intervalo de confianza del 99 % para la concentraci´on promedio de cloro cuando el ´area es x = 1,0 %. d ) Encuentre un intervalo de predicci´on del 99 % para la concentraci´on de cloro cuando el ´area es x = 1,0 %. 9. El ejercicio 2. presenta datos sobre el volumen de desgaste y y viscosidad del aceite x. a) Calcule R2 para este modelo. Proporcione una interpretaci´on de esta cantidad. b) Haga una gr´afica de los residuos de este modelo contra yb y contra x. Interprete estas gr´aficas. c) Prepare una gr´afica de probabilidad normal de los residuos. ¿Parece ser que se satisface la hip´otesis de normalidad? 10. Con respecto al ejercicio 3: a) ¿Qu´e proporci´on de la variabilidad total en la concentraci´on de cloro est´a explicada por el modelo de regresi´on? b) Utilice las observaciones repetidas en x = 70 y x = 78 para obtener una estimaci´on del error puro con dos grados de libertad. c) Utilice el error puro calculado en el inciso b) para probar la falta de ajuste del modelo de regresi´on. Utilice α = 0,05. ¿Qu´e conclusi´on puede obtenerse sobre lo adecuado del modelo? d ) Haga una gr´afica de los residuos contra yb y contra x. Interprete las gr´aficas. e) Prepare una gr´afica de probabilidad normal de los residuos. ¿Parece que se satisface la hip´otesis de normalidad? 11. A continuaci´on se proporcionan los resultados obtenidos en la prueba final y los ex´amenes de 20 estudiantes seleccionados al azar, que tomaron un curso de estad´ıstica para ingenieros y otro en investigaci´on de operaciones. Sup´ongase que los promedios finales tienen una distribuci´on conjunta normal. Estad´ıstica 86 75 69 75 90 94 83 86 71 65 IO 80 81 75 81 92 95 80 81 76 72 Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

194

Cap´ıtulo 9. An´ alisis de Regresi´ on Estad´ıstica 84 71 62 90 83 75 71 76 84 97 IO 85 72 65 93 81 70 73 72 80 98 a) Encuentre la recta de regresi´on que relaciona el promedio final en estad´ıstica con el promedio final en IO. b) Pruebe la significancia de la regresi´on con α = 0,05. c) Estime el coeficiente de correlaci´on. d ) Pruebe la hip´otesis de que ρ = 0, utilizando para ello α = 0,05. e) Pruebe la hip´otesis de que ρ = 0,5 utilizando α = 0,05. f ) Construya un intervalo de confianza del 95 % para el coeficiente de correlaci´on. 12. Se observa y se nota la duraci´on de un ciclo de una m´aquina autom´atica. Segundos 2.10 Frecuencia 16

2.11 28

2.12 2.13 41 74

2.14 149

2.15 256

2.16 2.17 2.18 137 82 40

2.19 19

2.20 11

a) ¿La distribuci´on normal parece ser un modelo de probabilidad razonable para la duraci´on del ciclo? Utilice la prueba ji-cuadrada de bondad del ajuste, con α = 0,005. b) Encuentre el valor-p de esta prueba. 13. Los ingenieros civiles a menudo utilizan la ecuaci´on de l´ınea recta E(y) = βb0 + βb1 x para modelar la relaci´on entre la resistencia de corte media E(y) de las juntas de alba˜ niler´ıa y el esfuerzo de precompresi´on x. Con objeto de probar esta teor´ıa, se realiz´o una serie de pruebas de esfuerzo con tabiques s´olidos dispuestos en tripletas y unidos con mortero (P roceedings of the Institute of Civil Engineers, marzo de 1990). Se vari´o el esfuerzo de compresi´on para cada tripleta y se registr´o la carga de corte m´axima justo antes de la ruptura (llamada resistencia de corte). En la tabla se indican los resultados de esfuerzo para 7 tripletas (medidos en N/mm2 ). Prueba de tripleta Resistencia al corte, y Esfuerzo de compresi´on, x

1 1.00 0

2 3 4 5 6 7 2.18 2.24 2.41 2.59 2.82 3.06 .06 1.20 1.33 1.43 1.75 1.75

a) Grafique los siete puntos de datos en un diagrama de dispersi´on. ¿Parece ser lineal la relaci´on entre la resistencia de corte y el esfuerzo de precompresi´on? b) Utilice el m´etodo de m´ınimos cuadrados para estimar los par´ametros del modelo lineal. c) Interprete los valores de βb0 y βb1 . Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.2 Ejercicios Propuestos

195

14. El art´ıculo “Some Field Experience in the Use of an Accelerated Method in Estimating 28–Day Strength of Concrete”(J. Amer. Concrete Institute, 1969, p. 895) consider´o la regresi´on de la resistencia est´andar de curado y = 28 d´ıas (en lb/pulg2 ) contra x = resistencia acelerada (en lb/pulg2 ). Suponga que la ecuaci´on de la verdadera recta de regresi´on es y = 1800 + 1,3x. (a) ¿Cu´al es el valor esperado de la resistencia de 28 d´ıas cuando la resistencia acelerada = 2500?. (b) ¿Cu´anto podemos esperar que cambie la resistencia de 28 d´ıas cuando la resistencia acelerada aumenta en 1 lb/pulg2 . (c) Conteste el inciso (b) para un aumento de 100 lb/pulg2 . (d) Conteste el inciso (b) para una disminuci´on de 100 lb/pulg2 . 15. Refi´erase al estudio de Vietnam expuestos al agente Naranja (y la dioxina 2,3,7,8TCDD). La tabla de datos, que se reproduce a continuaci´on, proporciona las cantidades de 2,3,7,8-TCDD (medidas en partes por mill´on) tanto en plasma sangu´ıneo como un tejido graso extra´ıdos de cada uno de los 20 veteranos estudiados. Un objetivo de los investigadores es determinar el grado de asociaci´on lineal entre el nivel de dioxina observado en plasma sangu´ıneo y en tejido graso. Si se puede establecer una asociaci´on lineal entre las dos variables, los investigadores querr´an construir modelos para: (1) predecir el nivel de 2,3,7,8-TCDD observado en tejido graso y (2) predecir el nivel en tejido graso a partir del nivel en plasma sangu´ıneo. Veterano 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Niveles de TCDD en plasma 2.5 3.1 2.1 3.5 3.1 1.8 6.0 3.0 36.0 4.7 6.9 3.3 4.6 1.6 7.2 1.8 20.0 2.0 2.5 4.1

Niveles de TCDD en tejido graso 4.9 5.9 4.4 6.9 7.0 4.2 10.0 5.5 41.0 4.4 7.0 2.9 4.6 1.4 7.7 1.1 11.0 2.5 2.3 2.5

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

196

Cap´ıtulo 9. An´ alisis de Regresi´ on a) Encuentre las ecuaciones de predicci´on que necesitan los investigadores. Interprete los resultados. b) Pruebe la hip´otesis de que el nivel en tejido graso (x) sirve para predecir linealmente el nivel en plasma sangu´ıneo (y). Utilice α = 0,05. c) Pruebe la hip´otesis de que el nivel en plasma sangu´ıneo (x) sirve para predecir linealmente el nivel en tejido graso (y). Utilice α = 0,05. d ) Intuitivamente, ¿por qu´e deben coincidir los resultados de los incisos b) y c)? 16. Se realiz´o un experimento con objeto de estudiar el agrietamiento por esfuerzos de corrosi´on de acero inoxidable tipo 304 en un entorno simulado de reactor con agua en ebullici´on (T ransactions of the ASM E, enero de 1986). Seis espec´ımenes de acero inoxidable se recocieron y se sensibilizaron en agua a 289◦ C con ox´ıgeno y sulfato disueltos, someti´endolos a diversos factores de intensidad de esfuerzo (es decir, cargas). La tabla presenta la carga m´axima y la rapidez de crecimiento de grietas resultante (en metros por segundo) para los seis espec´ımenes. Carga m´axima 1 x, M P a · m 2 Rapidez de crecimiento de grietas y, m/s × 1010

30.0

35.6 41.5

50.2

55.5

61.1

1.0

2.2

5.8

5.0

14.0

3.9

a) ¿Hay suficientes pruebas que indiquen que la rapidez de crecimiento de grietas aumenta linealmente con la carga m´axima? Pruebe con α = 0,10. b) Estime el incremento medio en la rapidez de crecimiento de grietas por cada incremento unitario en la carga m´axima, empleando un intervalo de confianza de 90 %. Interprete el resultado. 17. Un modelo robusto y muy utilizado para el movimiento humano es la Ley de Fitts. Seg´ un esta ley, el tiempo T necesario para moverse y seleccionar un objetivo de anchura W que est´a a una distancia (o amplitud) A es: T = a + b log2 (2A/W ) donde a y b son constantes que se estiman mediante regresi´on lineal simple. La cantidad log2 (2A/W ) se denomina ´ındice de dificultad (ID) y representa la variable independiente (medida en bits) del modelo. Ciertas investigaciones de las que se inform´o en el Special Interest Group on Computer − Human Interaction Bulletin (julio de 1993) utilizaron la Ley de Fitts para modelar el tiempo (en milisegundos) necesario para realizar cierta tarea en una computadora. Con base en datos obtenidos de n = 160 ensayos (empleando diferentes valores de A y W ). Se obtuvo la siguiente predicci´on de m´ınimos cuadrados: Tb = 175,4 + 133,2(ID) a) Interprete las estimaciones, 175.4 y 133.2. b) El coeficiente de correlaci´on para el an´alisis es r = 0,951. Interprete este valor. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.2 Ejercicios Propuestos

197

c) Realice una prueba para determinar si el modelo de la Ley de Fitts es estad´ısticamente adecuado para predecir el tiempo de realizaci´on de las tareas. Utilice α = 0,05. d ) Calcule el coeficiente de determinaci´on, r2 . Interprete el resultado. 18. Refi´erase al experimento, informado en Combustion and F lame, de difusividad del ox´ıgeno. Los datos para las nueve muestras de mezcla de nitr´ogeno y ´oxigeno se reproducen en la siguiente tabla. Temperatura x 1,000 1,100 1,200 1,300 1,400 1,500 1,600 1,700 1,800

Difusividad de ox´ıgeno y 1.69 1.99 2.31 2.65 3.01 3.39 3.79 4.21 4.64

a) Calcule r y r2 . Interprete sus valores. b) Realice una prueba para determinar si la temperatura y la difusividad del ox´ıgeno exhiben una correlaci´on positiva. Utilice α = 0,05. 19. La exposici´on pasiva al humo de tabaco en el ambiente se ha asociado a la supresi´on del crecimiento y a un incremento en la frecuencia de infecciones de las v´ıas respiratorias en ni˜ nos normales. ¿Esta asociaci´on es m´as pronunciada en ni˜ nos que padecen fibrosis c´ıstica? Con el fin de contestar esta pregunta, se estudiaron 43 ni˜ nos (18 ni˜ nas y 25 ni˜ nos) que asistieron a un campamento de verano de dos semanas para pacientes con fibrosis c´ıstica (N ew England Journal of M edicine, 20 de septiembre de 1990). Entre las diversas variables que se midieron estuvieron el percentil de peso del ni˜ no (y) y el n´ umero de cigarrillos fumados por d´ıa en el hogar del ni˜ no (x). a) Para las 18 ni˜ nas, el coeficiente de correlaci´on entre y y x se inform´o como r = −0,50. Interprete este resultado. b) Refi´erase al inciso (a). El valor-p para probar H0 : ρ = 0 contra H1 : ρ 6= 0 se inform´o como p = 0,03. Interprete este resultado. c) Para los 25 ni˜ nos, el coeficiente de correlaci´on entre y y x se inform´o como r = −0,12. Interprete este resultado. d ) Refi´erase al inciso (c). El valor-p para probar H0 : ρ = 0 contra H1 : ρ 6= 0 se inform´o como p = 0,57. Interprete este resultado. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

198

Cap´ıtulo 9. An´ alisis de Regresi´ on 20. Los siguientes estad´ısticos de resumen se obtuvieron de un estudio que utiliz´o el an´alisis de regresi´on para investigar la relaci´on entre la flexi´on de un pavimento y la temperatura superficial del pavimento de varios lugares de una carretera estatal. Aqu´ı x = temperatura (o F) e y = factor de ajuste de flexi´on (y ≥ 0): n = 15 X

X

x2i = 139037,25

X xi = 1425 yi = 10,68 X X xi yi = 987,645 yi2 = 7,85183

(a) Calcule βˆ1 , βˆ0 y la ecuaci´on de la recta de regresi´on estimada. (b) ¿Cu´al es la estimaci´on de cambio esperado en el factor de ajuste de flexi´on cuando la temperatura aumenta 1o F?. (c) Suponga que la temperatura se midi´o en de regresi´on estimada?.

o

C en lugar de

o

F. ¿Cu´al ser´ıa la recta

21. Es sabido que la potencia de un veh´ıculo se relaciona directamente con el n´ umero de pistones. Sea Yi : potencia del veh´ıculo i (miles de rpm) y Xi : n´ umero de pistones del veh´ıculo i, se postula el modelo: Yi = β Xi + εi ,

i = 1, . . . , n

Supuestos. E(εi ) = 0, Var εi = σ 2 , Cov(εi , εj ) = 0 ∀ i 6= j. (a) Encuentre el estimador de m´ınimos cuadrados de β y obtenga una expresi´on para la varianza de dicho estimador. (b) Estime la ecuaci´on de regresi´on, si una muestra de 5 veh´ıculos entrega: X Y

2 2 3 5 6 9

4 11

4 13

22. El concreto sin finos, preparado con un agregado grueso clasificado uniformemente y una pasta de cemento y agua, es bueno en zonas de lluvia excesiva por sus excelentes propiedades de drenado. El art´ıculo “Pavement Thickness Design for No-Fines Concrete Parking Lots”. (J. of Transporting Engr., 1995, pp. 476–484) describe el empleo de un an´alisis de m´ınimos cuadrados para estudiar la forma como y = porosidad ( %) se relaciona con x = peso unitario (lb/pie3 ) en espec´ımenes de concreto. Utilice el resultado que se presenta del software MINITAB para contestar las siguientes preguntas: (a) ¿Cu´al es la ecuaci´on de la recta de regresi´on estimada?. (b) Interprete el valor estimado de β1 . (c) Construya un intervalo de confianza de 95 % para β1 . A partir del intervalo de confianza ¿Puede concluir que la variable x es significativa en el modelo de regresi´on simple?. (d) ¿Cu´al es la estimaci´on de σ?. Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

9.2 Ejercicios Propuestos

199

(e) ¿Cu´al es el valor de la variaci´on total que es explicada por el modelo?. (f) Encuentre una estimaci´on puntual para la porosidad promedio real de todos los espec´ımenes, cuyo peso unitario sea 110 lb/pie3 . Regression Analysis: y versus x Predictor Constant x

Coef 118,910 -0,90473

SE 4,499 0,04109

Coef T 26,43 -22,02

P 0,000 0,000

Analysis of Variance Source Regression Residual Error Total

DF 1 13 14

SS 426,62 11,44 438,06

MS 426,62 0,88

F 484,84

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

P 0,000

200

Cap´ıtulo 9. An´ alisis de Regresi´ on

Recopilaci´ on, Organizaci´ on y Elaboraci´ on por Patricia Jim´ enez P. & Ricardo Olea O.

Ap´ endice A Formulario de Distribuciones

X ∼ B(p)

P (X = x)

E(X)

V (X)

MX (t)

RX (x)

px (1 − p)1−x

p

pq

q + pet

0, 1

np

npq

(q + pet )n

0, 1, ..., n

1 p

q p2

r p

rq p

np

−n nM ( N −M )( N ) N N N −1

µ

µ

a+b 2

(b−a)2 12

1 λ

1 λ2

λ λ−t

µ

σ2

eµt+

αβ

αβ 2

(1 − βt)−α

x>0

r λ

r λ2

λ r ( λ−t )

x>0

n x p (1 x

X ∼ Bin(n, p)

pq x−1

X ∼ G(p)

x−1 r x−r p q r−1

X ∼ Bineg(r, p)



X ∼ H(M, N, n)

X ∼ N (µ, σ 2 )



N −M

1 , b−a

0,

a
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF