Evaluaciones Resueltas

September 11, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Evaluaciones Resueltas...

Description

 

Univer Uni versi sidad dad T´ ecnic ecn ica a Federi Fede rico co Santa San ta Mar´ Mar´ ıa

Departamento de Matem´aatica/ tica/ Campus Vitacura

Proba Pr obabi bili lidad dad y Est Estad ad´ ´ısti ıstica ca Evaluaciones resueltas Recopilado por Francisca Gonz´aalez lez L´oopez pez

Santiago, 10 de abril de 2015

 

´Indice Indice general 1. Estad´ıstica Descriptiva 2 1.1. Estad´ıstica univariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2. Estad´ıstica bivariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.3. Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2. Probabilidades 2.1.. Pro 2.1 Probab babili ilidad dad b´ aasic sicaa y condi ondiccio iona nada da.. In Inde depe pend ndeencia ncia.. . . 2.2. Variables Aleatorias . . . . . . . . . . . . . . . . . . . . 2. 2.3. 3. Es Espe pera ranz nza, a, var aria ianz nzaa y fu func ncio ione ness de var aria iabl bles es alea aleato tori rias as 2.4. Vectores Aleatorios . . . . . . . . . . . . . . . . . . . . 2.5. Propuestos . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

23 23 34 47 62 74

3. Inferencia Estad´ıstica 80 3.1.. Est 3.1 Estima imaci´ ci´ on puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 3.2.. Est 3.2 Estima imaci´ ci´ oon n intervalar y Pruebas de Hip´otesis . . . . . . . . . . . . . . . . . . . . . . 89 3.3. Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

1

 

Cap´ıtulo 1 Esta Es tad d´ıs ısti tica ca Desc Descri ript ptiva iva 1.1.

Estad Estad´ ´ıstica univ univariada ariada

1. La tabla presentada a co continuaci´ ntinuaci´oon n representa el consumo de energ energ´´ıa el´eectrica ctrica de 80 usuari usuarios: os: Cons Co nsum umoo (K (Kwh wh)) N´ u umero mero de usuarios 05 - 25 04 25 - 45 06 45 - 65 14 65 - 85 26 85 - 105 14 105 - 125 08 125 - 145 06 145 - 165 02 Total 80 a ) Dete Determine rmine la media y la media mediana na de la variabl ariablee consumo. b ) Calc Calcule ule el percent percentil il 25 y 75 para la vari variable able consum consumo. o. c ) Calc Calcule ule la desvi desviaci´ aci´ oon n est´aandar ndar de la variable consumo. d ) ¿Qu´ e porcentaje de usuarios consumen m´aass de 90 Kwh ?

Soluci´oon: n: Ya que los datos est´aan n agrupados los c´aalculos lculos son como sigue: a ) La media del consumo de energ energ´´ıa es

x =

 1 n



·

M C i ni

·

·

·

·

·

·

·

·

=   1 (15 4 + 35 6 + 55 14 + 75 26 + 95 14 + 115 8 + 135 6 + 155 2) 80 = 79 79,,5 2

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

La mediana debe ubicarse en la clase 4, 65-85, ya que esta clase es la prime primera ra en obten obtener er una frecuencia frecuencia relati relativ va acumalada may mayor or al 50 % (62.5 %) y su valo valorr se calc calcula: ula: −  n/22 N M  n/ e I  M e  =  = l l M e  + nM e  80//2 24  80 20 = 65 + 26 = 77 77,,3



·

−  ·

b ) Calc Calculamos ulamos   P 25 75 . La clase 3 acumula un 30% por lo que en ella se encunetra el 25   y   P 75

primer cuartil. n q/ q/100 100 N q− I  P 25  = l lq  + 25  = nq  80 25 25//100 10 = 45 + 20 14 = 45 + 14, 14,28 = 59 59,,28

·



·

·

−  ·

y el tercer cuartil est´a en la clase 5, 85-105, por lo tanto n q/ q/100 100 N q− I  P 75  = l lq  + 75  = nq  80 75 75//100 50 = 85 + 20 14 = 85 + 14, 14,28 = 99 99,,28

·



·

·

−  ·

c ) Calc Calculamos ulamos la var varianza ianza::



 1 s = ni M C i2 x2 n  1 = (4 152 + 6 352 + 14 552 + 26 752 + 14 952 + 8 1152 + 6 1352 + 2 1552 ) 80 = 7330 6320 6320,,25 = 1009, 1009,75 2

·

 · · −

 − ·

·

·

·

·

·

·

Por lo tanto la desviaci´oon n est´aandar ndar es 31,77. d ) Lo que queremos es el valor tal que  P q  = 90, por lo tanto en la ecuaci´ on on

n q/ q/100 100 P q  = 90 = l =  l q  + nq

·

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

N −



q

· I  3

2

− 79 79,,5

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

debemos encontrar el valor de q. La clase a la que corresponde es la  C 5 , por lo tanto

P q  = 85 +

·

−  · 20 = 90

 80 q/ q/100 100 50 14 80 q/ q/100 100 14 80 q/ q/100 100

· ·

50

  90

85

−  = 20 − − 50 = 0,0,25 · 14  = (3, (3,5 + 50) q  =

·  100 80

q  =  = 66 66,,87 Es decir, decir, alrede alrededor dor del 67 % consume men menos os de 90 Kwh, y por lo tant tanto, o, el 33 % consume m´aass de 90 Kwh. 2. El dep depart artame ament ntoo de pers persona onall de una ciert ciertaa firm firmaa rea realiz liz´´o un estudio sobre los salarios, en unidades monetarias(u.m.) de 120 funcionarios del sector administrativo, con los siguientes resultados : Salario / Salario M´ M´ınimo Frecuencia Relativ Relativaa 0-2 0.25 2-4 0.40 4-6 0.20 6-10 0.15 a ) Calc Calcule ule la media, medi mediana, ana, var varianza ianza y desviaci desviaci´´oon n est´aandar. ndar. b ) ¿Qu ¿Qu´´e ocurre con la media si se aumenta aumentan n los salari salarios os en 100 %?, ¿y con la varianz arianza?. a?.

Justifique. c ) ¿Qu´ e oocurre curre con la varianza si se aumentan los salarios en 0.8 u.m.? Justifique.

Soluci´oon: n: a ) Compl Completamo etamoss la tabla

 

Salarioo / Salario M´ınimo Salari 0-2 2-4 4-6 6-10

M C i 1 3 5 8

 

ni 30 48 24 18

 

f i 0.25 0.40 0.20 00..15

 

N i 30 78 102 11220

 

F i 0.25 0.65 0.85 1

Aplicando las f´oormulas rmulas tenemos que:  1 x  = n

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

k

 i=1

ni M C i  = 3,65

·

 

4

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

M e  =  = l l M e  +

 1 s = n 2

− M e

n 2

 − N 

I   = 2 +

·

− x)

nM e

120 2

  − 30  2 = 3,25 48

k

  ·

ni (M C i

i=1

2

= 5,12

Por lo tanto, s tanto,  s  = 2.264 b ) Si los sal salari arios os aumen aumentan tan en un 100 % qui quiere ere decir decir que el salar salario io se aum aumen enta ta al dob doble, le,

por lo que ahora en vez de contar con M con  M C i  contamos con M con  M C i∗  = 2M C i . As´ı, ı, la med media ia ser´a k



 1 x = n ∗

 1 =n

ni M C i∗

·

i=1 k

ni 2 M C i

 ·  · i=1

 1 =2 n

·

k

·

ni M C i

i=1

· ·

=2 x = 2 3,65 = 7,3 Por lo tanto la media aumenta al doble. Para la varianza,  1 s2T   =

n

= =

 1 n  1 n

k

 ·  · ·  ·

∗ 2

ni (M C i∗

 − X  )

i=1 k

·

ni (2 M C i

i=1 k

·

− X )

2

·

− X )

2

4 ni (M C i

i=1

 1 =4 n

2

− 2 · X )

k

ni (M C i

i=1

2

=4 s

·

Por lo tanto, si los sueldos se duplican, el sueldo promedio se duplica y la varianza se cuadriplica. Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

5

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

c ) El el punt puntoo ant anterior erior vimos que si mult multiplic iplicamos amos todas las observ observacion aciones es por una cons-

tante   a, entonces, la media aumenta   a  veces y la varianza de los datos transformados tante  2 es es σ  σ T    =  a2 σ2 , donde  donde   σ2 es la varianza de los datos originales. En este caso, lo que hacemos es sumar a todas las observaciones una constante, con esto media y varianza quedan de la siguiente manera:  1 x = n ∗

k

  

·

 +  a)) ni (M C i  + a

i=1 k

 1 = ( ni M C i  + n i=1

·

k

·

a ni )

i=1

k

·

 a n  1 ni M C i  + = (  ) n n i=1

·

=  x +  x  + a  a

 1 s2T   =

n

=

 1 n

= s

k

  i=1 k

i=1

·

 +  a ni (M C i  + a

·

ni (M C i



− (x

+ a))  a))2

2

− x)

2

Por lo tanto, si aumentamos en 0.8 u.m. los sueldos, la varianza media aumentar´a en (0 (0,,8) u.m con respecto al valor original, mientras que la varianza se mantendr´a igual a la de los datos originales. 3. ¿Qu´e oocurre curre con la mediana, media y desviaci´oon n est´aandar ndar de una secuencia de datos , cuando: i) cada obser observ vaci´ oon n es multiplicada por 2? ii) se le suma 10 a cada observaci´oon? n? Soluci´oon: n: i) Supongam Supongamos os que nues nuestros tros datos son son x  x1 , x2 , . . . , xn . Si multiplicamos todos los datos por 2, la nueva secuencia ser´a 2x1 , 2x2 , . . . , 2xn . La mediana ser´a el doble del valor anterior, y la media:

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

6

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

n

·

 1 x = n ∗

=

2 xi

i=1 n

 2

xi

 ·  1 =2· n =2·x n

 i=1 n

xi

i=1

Por lo tanto la mediana y la media aumentar´aan n al doble, mientras que la varianza  varianza   s2 aumentar´ a 4 veces veces s  s 2T   = 4 s2 , esto ya que

·

s2   = T 

n

 1

(2 xi  + 2 x)2

 · ·

n  1 = n

·

i=1 n

4 (xi

·

i=1 2

2

− x)

=4 s

Si multiplicamos todas las observaciones por una constante, la media y la mediana aumentar´an an en la misma magnitud de la constante, mientras que la varianza aumentar´a en el cuadrado de la constante utilizada. ii) Si sumamos 10 unidades a cada observaci´oon, n, la nueva secuencia ser´a (x1  + 10), 10), (x2  + 10),, . . . , (xn  + 10). Al aumentar todos los valores en la misma magnitud, la nueva me10) diana ser´a la l a mediana anterior m´as as 10 unidades.

 1 x = n ∗

 1 = n

n

 

(xi  + 10)

i=1 n

i=1

 1 xi  + n

n



10

i=1

= x +  x  + 10 La media y la mediana aumentar´aan n en 10 unidades.

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

7

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

La varianza  1 s2T   =

n

=

 1 n

=  s 2

n



[( [(x xi  + 10)

i=1 n

x)2

(xi i=1

2

− (x + 10)]





por lo que la varianza no cambiar´aa..

Si sumamos igual cantidad a todas las observaciones, las medidas de localizaci´oon n (media, mediana) se ver´an an alteradas, aumentando en la misma cantidad sumada, mientras que la dispersi´oon n se mantendr´aa.. 4. Dem Demuest uestre re que: a) El va valor lor que minimi minimiza za la funci´ on on f  f ((a) =

n

 1

 −   −

n es es a  a =  = x  x b) La v varianz arianzaa  s 2 satisface:  1 s = n 2

a)2

(xi i=1

n

x2

x2i

i=1

Soluci´oon: n: a) Sea la funci´oon: n:  1 f  f ((a) = n

n



(xi

i=1

2

− a)

Si minimizamos esta funci´oon n para para a  a df  f ((a)   1   = da n

n



2( 2(x xi

i=1

− a) · (−1) = 0

 −  (xi )

a  = 0

·

xi  = n  =  n a x = a  =  a

Para comprobar que es m´ınimo calculamos la segunda deriv derivada: ada:

  − ·−  −   

d2 f (a)   d 1   = da2 da n =  dda

n

a) ( 1)

2(x 2(xi

i=1

 n 2

xi  +   n 2

a

= 2 > 0  >  0 Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

8

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Por lo tanto, la varianza se minimiza con  con   a = x  =  x b) Desar Desarrolla rollamos mos el cuadrado 1 n

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica



(xi



 1 x) = n  1 =n  1 = n  1 = n  1 = n  1 = n 2

    

(x2i

2

 − 2x · x  + x  + x )

x2i

i

 1 2x n  1 2x n

 − · x  − ·  + x x  − 2x · x + x x  − 2x + x x  − x 2 i

2 i

2 i

2 i

2



 1 x2 n  1 xi  + n x2 n

xi  +

 ·

2

2

2

 

9

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

1.2.

Estad Estad´ ´ıstica biv bivariada ariada

1. Se des desarrol arroll´ l´o un experiemento para estudiar las propiedades de fragilidad del hidr´oogeno geno con base en mediciones de presi´oon n eelect lectrol´ rol´ııtica tic a d dee hi hidr´ dr´oogeno. geno. Se control´o la densidad de corriente de carga cat´oodica dica y se vari´o en cuatro niveles. Se observ´o la presi´oon n efectiva del hidr´oogeno geno como la respuesta. Sean X: densidad de corriente de carga (mA/cm (mA/cm2 ), Y: presi´oon n efectiva de hidr´oogeno geno (atm). Los datos son los siguientes: Corrida 1 2 3 4

X 1.65 1.65 1.65 1.65

Y 86.1 92.1 64.7 74.7

56 7 8 9 10 11 12 13 14 15

14..6458 4.48 4.48 12.2 12.2 12.2 12.2 33.1 33.1 33.1

222032..61 132.9 413.5 231.5 466.7 365.3 493.7 382.3 447.2 563.8

a) Calc Calcule ule media, mediana, vari varianza anza y desvi desviaci´ aci´ oon n est´aandar ndar de Y. ¿Qu´e puede decir de la distribuci´ oon n de esta variable? b) Calc Calcule ule la correl correlaci´ aci´ on on entre X e Y. ¿Cu´aall es el el R  R 2 del modelo Y  modelo  Y    = a + bX ? c) ¿Exis ¿Existe te alguna trans transforma formaci´ ci´ on on de las variables que aumente el valor de la correlaci´on on antes caculada? d) Determine cu´aall es el mejor modelo de regresi´oon n lineal utlizando el valor del coeficiente de determinacion. Soluci´oon: n: a) Los v valore aloress pedidos son y  = 282, 282,7 Mse2  = 231 ,5 ,5 = 231, 29937 29937, s  = 173, 173,02 Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

10

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

La alta variabilid variabilidad ad s=173.02 respecto de la media y la diferencia de ´eesta sta y la mediana nos indican que los datos se encuentran altamente dispersos (respecto de la media). b)   Corr( Corr(X, Y  Y )) = 0,84 lo que nos indica que el valor de   R2 del modelo   Y   Y   =   a + bX   +  bX    es 2 0,70 R



c) Si transfor transformamos mamos   x =   log log((x) obtenemos que  que   Corr( Corr (X  , Y ) Y ) = 0,93 y el  el   R2 del modelo Y  Y    =  a + b X  es 0,85. d) El mejor modelo es el que tiene mayor   R2 , por lo tanto el mejor modelo es   Y   Y   =   a + b log log((X )).. 2. Se ha encuestado a 100 familias en una ciudad sobre su gasto mensual en ocio,   Y , Y , y sus ingresos mensuales, X  mensuales,  X .. En la siguiente tabla se presentan los resultados obtenidos, donde las variables vienen expresadas en euros: Y X 0-100 11000-200 22000-800 600-1500 1133 9 4 1500-2000 9 12 23 2000-5000

6

9

15

a) Calc Calcule ule el gasto mensual prome promedio dio en ocio y el ingreso mensual prom promedio. edio. b) Calc Calcule ule la varianz arianzaa de cada va variable riable.. ¿Cu´aall le parece m´as as ho homo mog´ g´eenea? ne a? c) ¿Qui´eenes nes ggasta astan n m´as as en ocio: las familias con ingresos entre 1500 y 2000 o los que ganan m´aass de 2000? d) Calcule la mediana de gasto mensual en ocio. e) Calcule la cov covarianza arianza entre las var variables, iables, ¿qu´e sugiere sobre la relaci´oon n entre ellas? f) Calcule la correlaci´oon n lineal, ¿confirma o desestima lo obtenido en (e)? g) Calcule los coeficientes del ajuste lineal e interpr interpr´´eetelos. telos. h) ¿Le parece que este modelo es adecuado? Justi Justifique. fique. Soluci´oon: n: a) Consi Consideram deramos os n  n =  = 100 observaciones y construimos las tablas univariadas de frecuencia para X  para  X    e   Y  Y  sumando  sumando por filas y columnas, respectivamente, y queda: X M C i

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

Y  

ni

M C  j

1050

26

50

28

1750

44

150

30

3500

30

500

42

 

 

n j

11

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Con esto, aplicando la f´oorumla rumla para el c´aalculo lculo de la media para variabl ariables es agrup agrupadas adas queda x  =

 1 (1050 26 + 1750 44 + 3500 30) = 2093 100

y  =

 1 (50 28 + 150 30 + 500 42) = 269 100

·

·

·

an´aalogamente, logamente,

·

·

·

b) Para  Para   X : s2x  =

 1 (10502 26 + 17502 44 + 35002 30) 100

s2y   =

 1 (502 28 + 1502 30 + 5002 42) 100

·

·

·

 ·

2

− 2093

= 928501

Para   Y  Para Y ::

 ·

·

·

·

− 269

2

= 40089

La m´as as homo homog´ g´eenea ne a es es X   X ,, ya que la desviaci´oon n est´aandar ndar de de Y   Y ,, el gasto en ocio, es muy similar a la media, lo que indica una mayor variabilidad. (Tambi´ (Tambi´ een n es posible concluir a partir del coeficiente de var variaci´ iaci´oon n y ver que el de   X  X    es menor, C menor,  C V x  = 0,46, que el de Y  de  Y ,,  C V y   = 0,74) c) Es posible calcular la distribuci´oon n condicional del gasto en ocio para las familias de ingresos mensuales entre 1500-2000 y 2000-5000 como se muestra en las siguientes tablas: M C  j 50 150

 

f  j/i  j/i=1500 =1500− −2000 20.5 27.3

 

f  j/i  j/i=2000 =2000− −5000 20.0 30.0

500 52.3 50.0 Estos porcentajes son pr´aacticamente cticamente iguales, de hecho, al calcular el promedio para cada nivel de ingreso mensual es 312.5 y 305, siendo levemente mayor, el gasto en ocio de las familias que perciben ingresos mensuales entre 1500 y 2000 euros. d) Aplicamos la f´ormula ormula percentil para el percentil 50: −  n q/ q/100 100 N M  50 28 e  = l l M e  +   = 100 + 100 = 173, 173,3 M e  = I  = nM e 30

·



− ·

·

El 50 % de las famil familias ias tien tienee un gast gastoo men mensua suall en ocio menor o igu igual al a 173 173.3 .3 euros euros.. e) Para realizar este c´aalculo lculo debemos considerar una modificaci´oon n de la f´oormula rmula usual, ya que no tenemos las observaciones, sino que la informaci´oon n tabulada. Para esto consideremos, cada variable ser´a representada por su marca de clase, y cada una de las combinaciones de ´eestas stas (3 clases de de   X  X    y 3 clases de   Y , Y , 9 en total) est´a repetida   nij veces, con i,j=1,2,3. Entonces, la f´ormula ormula de covarianza queda Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

12

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

 1 C ov( ov(X, Y  Y )) = n  1 = n

 

xi yi

−x·y

·  − x · y · =   1  · (13 · 1050 · 50 + 9 · 1050 · 150 + . + . . . + 9 · 3500 · 150 + 15 · 3500 · 500) 100 − 2093 · 269 = 602875 − 563017 nij M C xi M C yj

= 39858

Ya que esta cantidad es positiva, sugiere que las variables se relaicionan de manera directa, es decir, en la medida que una crece, la otra tambi´ een n lo har har´´ıa. f) Para el c´alculo alculo de este coeficiente, utilizamos los valores antes obtenidos y reemplazamos ρ  =

  C ov ov((X, Y  Y )) = s2x s2y

·

39858 √  928501 · 40089 = 0,2065

 

Es concordante ya que es positivo, pero es un valor bajo como para asegurar que la relaci´ oon n entre las variables es lineal. g) Los coefici coeficient entes es son

  C ov ov((X, Y  Y ))   39858 =   = 0,042 2 sx 928501

    −  · b  =

a =  = y  y

b x  = 269

− 0,085 · 2093 = 179, 179,15

Por lo que el modelo queda

·

y  = 179, 179,15 + 0, 0,042 x donde la interpretaci´oon n del intercepto no tiene sentido, ya que supone que el ingreso mensual es cero, valor que no est´a en nuestro an´aalisis. lisis. El otro valor se interpreta como el incremento en 0.042 euros el gasto en ocio que se produce al incrementar en un euro el ingreso mensual por familia.

 

h) No parece adecuado, por el bajo valor de la correlaci´oon n (ρ   = 0,21) que implica que 2 R = 0,04, es decir, m´aass de un 90 % de la variab ariabilidad ilidad del gasto en ocio ser ser´´ıa atrib atribuido uido al azar. 3. Un comerci comerciant antee al detal detalle le llev llevaa a cabo un estud estudio io para determina determinarr la relac relaci´ i´oon n entre los costos semanales por publicidad y las ventas. Sean X: costos de publicidad($) Y: ventas ($) Se regis registran tran los siguie siguiente ntess datos: Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

13

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

X 40 20 25 20 30 50 40 20 50 40 25 50

Y 385 400 395 365 475 440 490 420 560 525 480 510

 

X 2 1600 400 625 400 900 2500 1600 400 2500 1600 625 2500

Y 2 148225 160000 156025 133225 225625 193600 240100 176400 313600 275625 230400 260100

XY 15400 8000 9875 7300 14250 22000 19600 8400 28000 21000 12000 25500

 

 −  −

Y  Y  -68.7 -53.7 -58.7 -88.7 21.2 -13.7 36.3 -33.8 106.3 71.3 26.3 56.3

a) Calc Calcule ule los valo valores res estima estimados dos de de a  a  y  b  del modelo Y  modelo  Y    = a + bX . b) Estime las ventas semanales cuando los costos de publicidad son $20, $25, $30, $40 y $50. c) El coeficien coeficiente te de dete determinac rminaci´ i´on R on  R 2 se puede calcular como 2

R =1

 −  −− 

yi )2 y )2

(yi (yi

Calcule este valor y determine si el ajuste es confiable. d) ¿A qu´e se debe que la estimaci´oon n sea o no fiable? Soluci´oon: n: a) Calc Calculamos ulamos

 

b  =

  C ov ov((X, Y ) Y ) s2x 1 xi   yi x y n

x2i x2 1 15503,,12 15503 12 191325 = 1 15650 1167 1167,,4 12   440 440,,63 = 136,,77 136 = 3,22 =

1 n

 −− −  · −

 ·

Con esto el valor ajustado de a de  a  es

  − 

a  =  = y  y bx bx  1 = yi 12

 1 3,22 12



− · x =   1  · 5445 − 3,22 ·   1  · 410 12 12

i

= 343, 343,73 Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

14

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a   = 343, Por lo que el modelo que da   venta venta = 343,73 + 3, 3,22 costo

·

b) Con el modelo antes calcu calculado lado obtene obtenemos mos Costo   V  enta enta 20 408.13 2350 40 50

442440..2333 472.53 504.73

c) El coeficien coeficiente te de dete determinac rminaci´ i´on R on  R 2 se puede calcular como 2

R =

 −  − (yi (yi

y)2 y)2

Calcule este valor y determine si el ajuste es confiable. Y 385 400 395 365 475 440 490 420 560 525 480 510

Y 472.53 408.13 424.23 408.13 440.33 504.73 472.53 408.13 504.73 472.53 424.23 504.73

  

 −  −

Y  Y -68.7 -53.7 -58.7 -88.7 21.2 -13.7 36.3 -33.8 106.3 71.3 26.3 56.3

 −  −

Y  Y  -87.5 -8.12 -29.22 -43.12 34.67 -64.74 17.46 11.87 55.25 52.46 55.77 5.25

 

Por lo tanto  25226,,21 −  25226 42256,,25 42256 = 1 − 0,596

R2 = 1

= 0,403

d) Depend Dependee del valor del coeficien coeficiente te de dete determinac rminaci´ i´oon n que en este cas casoo es inf inferi erior or al 70 % lo que genera un estimaci´oon n poco confiable. 4. Se quiere explicar la respuesta respuesta a un est est´´ımulo ımulo a lo largo del tiempo. Sean Sean   X , el tiempo de respuesta e Y  e  Y ,, el est est´´ımulo entregado. A continuaci´oon n se muestran medidas de resumen para las 14 observaciones:

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

15

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

  

xi  = 82 log(yyi ) = log(

  

x2i  = 662, 662,5

(log yi )2 = 22 22,,70

−3,72

xi log(  log(yyi ) =

  

82 82,,48



ei  = 7,187

yi  = 20 20,,97 xi yi  = 54 54,,43



yi2  = 64 64,,26

ei  = 1,523

En clases vimos gr´aaficamente ficamente que el ajuste exponencial era “mejor” que el ajuste lineal. Calcule correlaci´oon n entre entre   X   X   e   Y  Y    y entre  entre   X  X    y log(Y  log(Y ). ). Calcule adem´aass el coeficiente de determinaci´ oon n de ambos ajustes. ¿Son consistentes estos resultados con lo comentado en clases? Soluci´oon: n: De las cantidades entregadas calculamos los siguientes estad estad´´ısticos: 2

x  = 51,,857 497 y  =

ssx2   = 13 13,,015 y = 2,347

  

−0,266 C ov ov((x, y) = −4,885 log(yy) = log(

s2log( log(y y )  = 1,551

   

C ov ov((x, log( log(yy)) =

−4,332

Con esto,

Corr((x, y) = Corr y Corr((x, log( Corr log(yy )) =

−4,885   = −0,883 √  13 13,,015 · 2,347 4,332 √  13 · 1,551   = −0,964 13,− ,015

El modelo lineal ajustado es y  = 3,70 y el el R  R 2 es 2

R =1 =1 =1

− 0,375 · x

 − −  −

e2i

(yi y)2 e2i n sy2   7,187

·

−− ·

14 2,347 = 1 0,218 = 0,781 Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

16

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Por lo que X  que  X  explic  explicaa un 78 % de la variab variabilidad ilidad de de Y   Y .. El modelo exponencial ajustado es log(yy) = 1,684 log(

− 0,332 · x

El coeficiente R coeficiente  R 2 es

 − −  −

(ei )2 R =1 (log(yyi ) log( (log( log(yy))2 (ei )2 =1 n s2log( log(y y)   1,523 =1 14 1,551 = 1 0,070 = 0,929 2

·

− · −

y la variable X  variable  X  explica  explica un 92.9 % de la variab variabilidad ilidad de log( log(Y  Y ), ), con lo que comprobamos que el ajuste exponencial es mejor que el ajuste lineal. 5. Los datos a conti continuac nuaci´ i´oon n representan el tama˜ n noo y precio de 6 terrenos de una determinada localidad. Tama˜ n no, o, X (cien (cien m  m 2 ) 4.4 8.2 10.3 15.3 19 30.2 Precio, Y (millones) 0.3 0.57 0.93 1.4 1.48 2.42 4.0 4.07 El Principio de Parsimonia establece que si hay m´aass de una soluci´oon n posible a un problema, se debe escoger la m´aass simple. Bajo este criterio y el an´aalisis lisis de los estad estad´´ısticos que se presentan, determine qu´e modelo representa mejor la relaci´oon n ent entre re las variab ariables. les. Interpr Interprete ete el modelo escogido. 2

corr(X,Y) a b R Lineal 0.992 -0.583 0.151 0.985 Expo pon nencial 0.958 -1.303 0.0 0.099 0. 0.9919 Polinomial 0.994 -3.363 11..401 00..989

    

Soluci´ o on: n: Las variables y sus transformaciones presentan una correlaci´oon n may mayor or al 95 %, lo qu quee no noss indica que se justifica el ajuste de los tres modelos. De los tres, el de menor correlaci´oon n es el modelo esponencial, por lo que decidiremos entre los otros dos modelos. Tanto anto el mode modelo lo lin lineal eal como el mode modelo lo poli polinom nomial ial pre presen sentan tan un 99 % de cor correl relaci aci´´oon n y un 2 R supe superio riorr al 98 %, sie siendo ndo may mayor or el del modelo polino polinomia mial. l. Com Comoo am ambos bos ind indica icador dores es son similares, y aun cuando el modelo polinomial parece m´aass adecuado, por parsimonia el mejor ajuste ser´a el lineal, ya es m´as as simple y explica lo mismo que el modelo polinomial.

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

17

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

El modelo ajustado es yi  =

 

−0,583 + 0,0,151 · x

i

lo que quiere decir que cuando el tama˜n noo del terreno aumenta en 100 m 100  m 2 el precio aumenta en 0.151 millones. El intercepto no tiene una interpretaci´oon n en el contexto de las variables. 6. El crecim crecimien iento to de una colon colonia ia de ab abejas ejas est´ a determinado por la siguiente ecuaci´oon: n:   230 y  = 1 + α + α e−β ·t

·

Donde   y  representa el n´ Donde  u umero mero de abejas y y   t  el tiempo medido en meses. Se obtuvieron los siguientes datos. t   1 13 23 33 53 63 y   5,746 5,746 157, 157,49 4966 22 227, 7,41 4122 229, 229,93 9355 235, 235,00 0000 23 235, 5,00 0000 Determine una estimaci´oon n de de α  α  y   β . Soluci´oon: n:   230   depeja depejando ndo en t´eerminos rminos de y 1 + α + α e−β ·t   230 y α e−β ·t =   aplicando logaritmo natural para linealizar y 230 y ln (α) β  t = ln   que es una represen representaci´ taci´oon n lineal y y  =

·

− ·



·







Realizando el cambio de variable pertinente: t 1 13 23 33 53 63

y   5,746 157,496 227,412 229,935 225,000 225,000



ln((230 y)/y /y)) 3,664 0,776 4,476 8,171 -3,850 -3,850

Se obtiene: Coeficiente de correlaci´oon n m´ ulti u ltipl plee Coeficiente de determinaci´oon R n  R 2 R2 a justado Error t´ıpico Observaciones Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

0,602 0,60214 1433 0,362576 0,203221 3,563255 6 18

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Coeficientes

In Intter erce cept ptoo 0,23 0,2389 8998 98 Variable X  Variable  X 1   -0,101574 β   =

−0, 101574,

ln (α1) ,= 0, 238998, α  = 269976 Por lo que el modelo a ajustar es:

y  =

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

  230 101574··t 1 + 1, 1, 269976 e0,101574

·

 

19

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

1.3. 1. 3.

Pr Prop opue uest stos os

1. Los datos a con contin tinuaci´ uaci´ oon n presentan el precio medio por factor de carga en tarifas no horarias de uso general.

Donde, Tarifa 2: Cargo fijo mensual y cargo por energ energ´´ıa consumida. Tarifa 3: Cargo por demanda m´aaxima xima medida y cargo por energ energ´´ıa consumida. Tarifa O-M: Cargo por demanda m´aaxima xima medida y cargo por energ energ´´ıa consumida. Determinar el mejor ajuste entre factor y cargo de acuerdo a tarifa 2. El % de permeabili permeabilidad dad en una tela es una medida de cali calidad dad de este produc producto. to. El encar encargado gado de control de calidad tiene la sospecha de que este indicador se encuentra estrechamente relacionado con el % de poli´eester ster de la misma. La siguiente tabla muestra los an´aalisis lisis de una muestra de 120 telas.

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

20

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

X 60.69 61.82 62.95 64.08 65.21 66.34 67.47

Y 17.12 18.76 20.4 22.04 23.68 0 0 0 2 4 0 0 0 6 1 0 1 2 8 9 0 6 34 5 1 2 2 12 0 0 15 9 0 0 0 0 1 0 0 0

Si  Si   X : % de perm permeab eabili ilidad dad ee   Y  Y :: % de pol poli´ i´eester. ster. a ) ¿Qu´e us usar´ ar´ııaa p para ara deci decidir dir (con (consid sideran erando do llos os d dist istintos intos nivel niveles es d dee p poli´ oli´eester) ste r) qu´e tel telas as ttiene ienen n

un % de perme permeabi abilid lidad ad m´as as ho homo mog´ g´eeneo? ne o? De Deter term m´ınelo ın elo.. b ) Determine la cov covarianza arianza Cov(X,Y) c ) ¿Est´ a sustentada, en los datos obtenidos, la sospecha del fabricante?

3. Con Consid sidere ere los sig siguie uient ntes es dat datos os de la vari ariabl ablee sala salario rio act actual ual (en cien cientos tos de d´ oolares) lares) de 474 trabajadores de una empresa

Comente las estad estad´´ısticas de resumen y esboce una gr´aafica fica adecuada para dicha variable.   La  paradoja de Simpson   o o efecto Yule-Simpson describe el cambio en el sentido de una asociaci´  on entre dos variables cuando se controla el efecto de una tercera variable .

4. Consi Considere dere el siguien siguiente te estudio en que intere interesa sa el efec efecto to de una campa˜ n naa para crear conciencia en conductores conductores de los peligros de conducir bajo la influencia del alcohol. Previo Previo a la campa˜na na se le realiz´o alcoholemia a 550 conductores y posterior a la campa˜n na, a, a 650. Los datos se presentan a continuaci´oon: n: Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

21

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Campa˜n naa Previo Pre vio Po Poste sterio riorr Alcoholemia P Poositiva 126 150 Negativa 424 500 Total 550 650 Los mismos datos fueron disgregados por sexo del conductor (H:hombre; M:mujer) como se muestra a continuaci´oon. n. Campa˜n naa Pr Prev evio io Poste osteri rior or H M H M Alcoholemia Positiva 45 81 120 30 Negativa 100 324 335 165 Total 145 405 455 195 ¿Qu´e po podemos demos decir acerca del ´eexito xito de la campa campa˜ n na? ˜a? ¿Disminuye el n´ u umero mero de alcoholemias positivas? Analice los datos conjuntos y separados por sexo. 5. En un proce proceso so de des destilac tilaci´ i´oon n qu´ıımico, mi co, eell porce p orcenta ntaje je Y   Y    de pur pureza eza de ox ox´´ıgeno prod producido ucido est´a relacionado con el porcentaje  porcentaje   X  X  de  de hidrocarburo, presente en el condensador principal de la unidad de destilaci´oon. n. Se efectuaron 55 mediciones, en las cuales se observaron conjuntamente las variables X  variables  X    e  Y   Y ,, cuyos resultados se incluyen en la siguiente tabla: % pure pureza za del ox ox´´ıge ıgeno no % hi hidr droc ocar arbu burro 87 87-9 -900 90-9 90-933 9393-96 96-9 96-999 0.87-1.07 10 5 0 0 1.07-1.27 5 12 2 1 1.27-1.47 1 4 9 2 1.47-1.67 0 1 2 1 Calcule el porcentaje de variabilidad del nivel de pureza del ox ox´´ıgeno para los casos en que se observ obser va en el conde condensador nsador princ principal ipal un niv nivel el de hidroca hidrocarburo rburo infer inferior ior a 1.27 % 6. Se determinaron las siguien siguientes tes mediciones del pulso a 40 personas saludables, de edad similar, de sexo masculino, al serles inoculado un antibi´ootico tico que se estima provoca cierta alteraci´on on en el ritmo del pulso. Se determinaron 4 medidas distintas 0.1 ml, 0.2ml, 0.3ml, 0.4ml y los resultados fueron (el ritmo normal es de 60 pulsaciones por minuto) 0.1: 0.2: 0.3: 0.4:

53 51 56 54

65 67 52 65

54 68 57 66

55 58 59 68

60 59 60 69

65 54 66 70

58 57 65 52

59 65 64 51

60 68 53 50

63 69 58 69

±

(Considere normalidad entre 60 2 pulsaciones por minuto). Determine el pulso promedio de un individuo al que se le inocula 0,25 ml de la droga. Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

22

 

Cap´ıtulo 2 Probabilidades 2.1.

Probab Probabilidad ilidad b´ a asica sica y condicion condicionada. ada. Independencia.

1. Un banco debe elegir una directiv directivaa compuesta por 5 cargos: director, subdirector, interventor, interventor, cajero y cobrador, entre 8 candidatos. Los candidatos son: 3 hombres: Felipe elipe,, G Gonzalo onzalo y Jo Joaqu aqu´´ın. 5 mujeres: Alicia, B´aarbara, rbara, Evelyn, Claudia y Natalia. Suponga que si una persona pertenece a esta directiva, esta persona puede ocupar s´oolo lo un cargo y suponga que todas las posibles directivas que pueden formarse tienen la misma probabilida probab ilidad d de ocurrir ocurrir.. a ) Determine el n´ u umero mero de direc directiv tivas as difer diferent entes es que es posible formar. b ) Calcule la probabilidad que Felipe y Gonzalo NO est´een n simult´aaneamente neamente en la directiva. c ) Calcule la probabilidad que la directiv directivaa est´e compuesta p por or al menos 3 mujeres.

Soluci´oon: n: a ) Usando el Principio Multiplicativo, el n´ u umero mero de directivas diferentes que pueden for-

· · · ·

marse es: 8 7 6 5 4. ) b ) Defi Defina na el even evento to A  A : : “Gonzalo y Felipe no est´  an simult´  aneamente en la directiva ”. ”.

Alternativa 1: Note que  P (A) = 1 P(A ). Para saber cu´aantos ntos elementos tiene tiene A  A  , considere lo siguiente: (i).   Hay 52 2! = 20 formas de Felipe y Gonzalo ocupen un cargo en la directiva (pues, cargos son diferentes). (ii).   Una vez asig asignados nados los cargos de F Felipe elipe y Gonzalo, ha hay y 6 5 4 formas de llenar los cargos restantes. Luego, A Luego,  A  tiene 20 6 5 4 elementos (Principio Multiplicativo).



 ·

· ·

· · ·

Por tanto, dada la equiprobabilidad entre todas las directivas posibles, la probabi-

23

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

lidad pedida es: P (A) = 1

 

−P A   20 · 6 · 5 · 4 = 1− 8 7 6 5 4 · · · ·

Alternativa 2: Defina los eventos: G : “Gonzalo est´  a en la directiva, pero Felipe no lo est´  a ”. ”. a en la directiva, pero Gonzalo no lo est´  a ”. F  F    : “Felipe est´  ”. N   : “Ni Gonzalo ni Felipe est´  an en la directiva ”. ”. Note que A que  A =  = G  G F  N  N  y  y adem´aass los eventos eventos G  G,,  F    F   y  N   N  son  son disjuntos dos a dos. Por tanto,  P (A) =  P (G) + P(F  F )) + P(N ). ). Para saber cu´aantos ntos elementos tiene tiene G  G,, consi considere dere lo siguie siguiente nte:: (i) Hay 5 formas de elegir el cargo que ocupar´a Gonzalo (pues, cargos son diferentes). (ii) Una vez asi asignado gnado el cargo de Gonz Gonzalo, alo, hay 6 5 4 3 formas de llenar los cargos restantes (pues, Felipe no debe estar en la directiva). Luego, el n´ u umero mero de elementos de de   G  es: 5 6 5 4 3. Por tanto, dada la equiprobabilidad entre todas las directivas posibles,

∪  ∪  ∪

· · · · · · ·

P (G) =

· · · · · · · ·

  5 6 5 4 3   15  = 8 7 6 5 4 56

An´aalogamente, logamente, P (F  F )) = 15/ 15/56. Para obtener el n´ u umero mero de elementos de de N   N ,, note que si Gonzalo y Felipe no deben estar en la directiva, entonces N  entonces  N  tiene  tiene 6 5 4 3 2 elementos. Por tanto, dada la equiprobabilidad entre todas las directivas posibles,

· · · ·

· · · · · · · · Finalmente, la probabilidad pedida es:   P(A) =   P(G) +  P(F ) F ) +  P(N ) N ) = 36/ 36/56 = P (N ) =

 6 5 4 3 2   6  = 8 7 6 5 4 56

9/14. c ) Para cada   j mujeres ”.

  ∈ {3,   4,  5 }, defina el evento   M    : “En la dire directiva ctiva hay exacta exactamen mente  te   j  j

Para calcular el n´u umero mero de elementos que tiene tiene   M 3  considere lo siguiente:



n mujeres (pues los cargos son (i) Ha Hay y 53   formas de elegir los cargos que ocupar´aan diferentes). (ii) Una vez hec hecho ho lo ant anterior erior,, estos cargos pueden ser llenados de 5 4 3 formas. (iii) (iii) Una ve vezz hec hecho ho   (i)   y   (ii), hay 3   2 formas de llenar los cargos compuestos por hombres.

· ·

 ·

Luego,  M 3  tiene 53 5 4 3 3 2 = 3600 elementos (Principio Multiplicativo). Luego, M  Usandoo argume Usand argumento ntoss simila similares, res, se tiene que: M 4  tiene



Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

5 4

 ·

· · · · · 5 · 4 · 3 · 2 · 3 = 1800 eleme elemento ntos. s.  

24

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

· · · ·

M 5  tiene 5 4 3 2 1 = 120 eleme elemento ntos. s. Por tanto, la probabilidad pedida en esta parte es:

P (M 3 ) + P (M 4 ) + P (M 5 ) =

  3600 + 1800 + 120 8 7 6 5 4

· · · ·

·

 ⊆ Ω. Determine  ⊆

2. Sea Ω un esp espacio acio m muestr uestral al y P( ) una medida de probabilidad. Sean A Sean A,, B, C  si la siguiente proposici´oon n es verdadera o falsa. 



| ≥ P(B | C ) y  P (A | C  ) ≥ P(B | C  ),

Si   P(A C )

en ento tonc nces es P (A)

≥ P(B).

Si la proposici´oon n es verdadera, demu´eestrela. strela. Si es ffalsa, alsa, provea un co contraejemplo ntraejemplo.. Contraejem Contraejem-plos deben inclu incluir: ir: el espac espacio io mue muestral stral Ω, los event eventos os A  A,,  B   y  C ,  C , y la medida de probabilidad P( ).

·

Soluci´oon: n: La proposic proposici´ i´oon n es verdadera.

Demostraci´ o on n: Seg´ u un n la definici´oon n de proba probabilida bilidad d condi condicional cional

| ≥ P (B | C ) ⇒   P P(A(C ∩ )C  ) ≥   P (PB(C ∩)C ) ⇒   P (A ∩ C ) ≥ P (B ∩ C )

P (A C )

    ∩ ∩  ≥ | ≥  | ⇒     ⇒  ∩   ≥   ∩       ∩ ≥ ∩ ∩ ∩   P A C  P C 





P B C 

P A C 

C 

 P A

Luego,

P (A

C ) + P A

C 

P (B

  P B C  P C  P B

C 

C ) + P B

C 

⇒   P (A) ≥ P (B) lo que completa la demostraci´oon. n.

3. Sean A Sean  A,,  B   y  C  tres  C  tres eventos tales que  que   A

P (( ((A A

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

∩ C   = ∅, demostrar que:

∪ C ) | B) = P (A | B) + P (C  | | B)  

25

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Soluci´oon: n:

P (( ((A A

) ∩ B) ∪ C ) | B) =   P ((((AAP∪(C  B)

  P (( ((A A

B ) (C  B )) = P (B )   P (A B )  P (C  B ) =   + P (B ) P (B ) = P (A B ) + P (C  B )

∩ ∪ ∩ ∩ ∩

|

 

(2.1)

 | |

∩ C   = ∅  entonces  entonces A  A ∩ B   y  C  ∩ B  son disjuntos. 4. Sean  Sean   A   y  B  dos eventos tales que   P(A) = 1/4,   P(B | A) = 1/2, y   P(A | B ) = 1/4. Decir si (2.1) ya que si A si  A

son ciertas o falsas las siguientes relaciones: a)   A

⊂B

b)   A y  B  son independientes c)   A y  B  son independientes. d)   A  y  B  son disjuntos. e)   P(A B  ) = 1/2

|

f)   P(A B ) + P(A B  ) = 1

|

|

Soluci´oon: n: a) Si A Si  A

⊂ B, entonces A entonces  A ∩ B  =  = A  A,, y por lo tanto se cumplir cumplir´´ıa que   P(A ∩ B )   P(A)  1 P(B/A B/A)) =   =  = 1  = P(A)

Lo que nos dice que no se cumple  A

P(A)

2

⊂B

b) Si A Si  A  y  B  son independientes se debe cumplir que

|

P(A B ) =  P (A) lo que en este caso se cumple, ya que ambas probabilidades son 1/4. Tambi´een n se cum cumple ple que

P(A

∩ B) = P(B | A) · P(A) =   12 · 14   =   18   = P(A) · P(B)

c) Basta probar que  P (B  A ) =  P (B  ). Notemos por (b) que  P (B ) =  P (B A) = 1/2 Entonces,

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 |

|  

26

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a



P(A

|

  P(A B  ) B )= P(B  )   P(( ((A A B ) ) =  P(B )   1 P(A B ) = P(B  )   1 (P(A) + P(B ) P(A B )) = P(B  )   1 (P(A) + P(B ) P(A) P(B )) = 1 P(B )   1 (1 (1//4 + 1/ 1 /2 1/4 1/2) = 1 1/2   1 5/8 = 1/2





















·







− −

·

=   3/8 1/2 = 1/4 = P (A ) Por lo tanto, A tanto,  A  y   B  tamb tambi´ i´een n so son n ind indep ependi endientes entes.. d) A y B no pueden ser disjuntos, ya que son independientes. En efecto, si son disjuntos, A B   =  y como son independientes se tiene que





|

P(A B ) = =



  P(A B )   ,   si son disju disjunto ntoss P(B )   P( )



P(B ) = 0 = P (A)



e) En (c) calcula calculamos mos lo p pedido edido,, que es clara claramen mente te distin distinto to a 1/2. f) Es claro que no se cumple, ya que

P(A/B A/B)) = 1/4   y   P(A /B  ) = 1/4 entonces

P(A/B A/B)) + P(A B  ) = 1/2 = 1



|

5. Un ingenie ingeniero ro desea escoge escoger, r, entr entree los dos dise˜ n nos os de circuitos que se muestran en la figura, aquel que brinda una mayor probabilidad de que la corriente circule entre el punto A y el punto B. Si las componentes (resistencias) funcionan de forma independiente y cada una tiene una probabilidad q de fallar. ¿Cu´aall de los dos dise˜ n nos os debiera escoger el ingeniero?. Justifique su respuesta. Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

27

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Soluci´oon: n: Sean los eventos:

SD:   La componente Superior Derecha funciona. SI:   La componente Superior Izquierda funciona. ID:   La componente Inferior Derecha funciona. II:   La componente Inferior Izquierda funciona. F i :  El circuito i funciona (i = 1, 2). Entonces la probabilidad de que cada componente funcione es  p =  p  = 1

∪ ∪



− q   y



P  P ((F 1 ) =  P   P (( ((SI  SI  I I ) (SD I D)) = [P ( P (SI  I I ))]]2 (por independencia e igualdad de las componentes) = [P ( P (SI  SI )) + P  + P ((I I ) P ( P (SI  I I )] )]2 = [ p +  p + p  p  p2 ]2 =  p2 (2  p)  p)2



− −

∩ ∩ − −





∩ ∩

P ( P (F 2 ) =  P   P (( ((SI  SI  SD SD)) (I I  I D)) =  P  + P ((I I  I D) P ((  P ((SI  SD SD)) + P  P ((SI  SI  SD SD)) (I I  I D)) (por independencia e igualdad de las componentes) =  p2 + p2  p4 =  p2 (2  p2 )









2

2

− p)  p) ≥ 2 − p ya que: 4 − 4 p +  p + p  p ≥ 2 − p 2 − 4 p +  p + 2 p 2 p ≥ 0 1 − 2 p +  p + p  p ≥ 0 ( p − 1) ≥ 0   ∀   0 ≤  p ≤ 1

Comparando, tenemos que (2

2

2

2

2

2

Por tanto, el primer dise˜no no debe ser el elegido pues tiene una mayor probabilidad de funcionar cualquiera sea el valor de p. Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

28

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

6. Un banco revisa ssu u pol´ııtica tica d dee tarjetas de cr´eedito, dito, ccon on el ob objetivo jetivo de can cancelar celar al algunas gunas de ellas ellas.. En el pasado, el 5 % de los clie cliente ntess con tarjeta ha pasado a ser moroso, esto esto es ha deja dejado do de pagar sin que el banco pudiera recuperar la deuda. Adem´aas, s, el banco ha comprobado que la probabilidad de que un cliente normal se atrase en un pago es de 0,2. Naturalmente, la probabilidad de que un cliente moroso se atrase en un pago es 1. a ) Iden Identific tificaa y da nombre a los suces sucesos os que aparecen en el enu enunciad nciado. o. b ) Elegido un cliente al azar, ¿qu´e probabilidad hay de que el cliente se atrase en un pago

mensual? c ) Si un clien cliente te se atrasa en un pago mensual, calcul calcular ar la probab probabilidad ilidad de que el clien cliente te se

convierta en moroso. d ) Al b banco anco le ggustar´ ustar´ııaa cancelar la l´ınea de cr´eedito dito de u un n cli cliente ente si la probab probabilidad ilidad de qu quee

´este este acabe convirti convirti´´eendose ndose en moroso es mayor de 0,25. De acuerdo con los resultados anteriores, ¿debe cancelar una l´ınea si un cliente se atrasa en un pago? ¿Por qu´ee?? Soluci´oon: n: a ) Sean los ev event entos: os: M ::  Clientes Morosos. M  M  : Clientes no Morosos. A: Clientes atrasado en un pago.

  

| 

P (M  M )) = 0, 05 ,   P M   = 0, 95 ,   P (A M ) = 1 ,   P A M   = 0, 2

|

b ) Utili Utilizando zando la ley de probabilid probabilidad ad total,

P (A) = P (A M  M )) P (M  M )) + P A M 

|

·

c ) Aplic Aplicando ando el teorem teoremaa de Bay Bayes, es,

  ||

P (M  A) =

0, 2 0, 95 = 0, 0, 24 P M   = 1 0, 05 + 0,

·

 | ·   |

·

·

·

  P (A M ) P (M  M ))   1 0, 05   =   = 0, 208 P (A) 0, 24

 | |

d ) Para cancelar la l´ınea de cr´ edito edito se debe cumplir que   P (M  A)   >   0, 25, dado que se

tiene que: 0, 0, 208 208 >  > 0  0,, 25, entonces no existe posibilidad de cerrarla. 7. Los direct directivo ivoss de la agencia de viajes de Barcelo Barcelona na Cabarna S.A. quiere quieren n plantea plantearr una estrategia de expansi´oon n hacia el resto de comarcas, por lo que se plantea si fusionarse con la empresa Sol S.A., compran la empresa de la competencia o bien ampliar sus instalaciones. La decisi´ oon n se tomar´a en funci funci´oon ´n de la evoluci´oon n futura de las ventas. El departamento comercial prev´´e que las ven prev ventas tas pueden ser altas, medias o bajas, con una probabilid probabilidad ad del 25 %, 45 % y 30 % respectivame respectivamente. nte. Por otra parte parte,, las ganancias de acuerdo con la estrategia seleccionada con las siguientes: Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

29

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

ALTERN AL TERNA ATIV TIVAS AS VENT VENTAS AS AL ALT TAS VENT VENTAS AS MEDI MEDIAS AS VENT VENTAS AS BAJA BAJAS S 25 % 45 % 35 % FUSION 350000 140000 60000 COMPRAR 300000 180000 50000 AMPLIACION 275000 160000 80000 Determinar las ganancias esperadas y decidir por cu´al al alternativa optar. Soluci´oon: n:

· · · C  =   = 300000 · 0, 25 + 180000 · 0, 45 + 50000 · 0, 3 = 171000 A  = 275000 · 0, 25 + 160000 · 0, 45 + 80000 · 0, 3 = 164750

F  = F  = 350000 0, 25 + 140000 0, 45 + 60000 0, 3 = 168500

Por lo tanto la alternativa es comprar, ya que es la que tiene la mayor ganancia esperada. 8. Se ha nomina nominado do a tres miem miembros bros de un club priv privado ado para oocupar cupar la preside presidencia ncia del mismo. La probabilidad de que se elija al se˜ n nor A or  A es  es de 0.3; la que se haga lo propio con el se˜n nor B or  B , de 0.5, y la de que gane la se˜n nora C  ora  C ,, de 0.2. En caso que se elija al se˜n nor A or  A,, la probabilidad de que la cuota de ingreso incremente es de 0.8, si se elije al se˜n nor  or   B  o a la se˜n nora  ora   C , las correspondientes probabilidades de que haya un incremento en la cuota son de 0.1 y 0.4. a ) ¿Cu´ al al es la probabilidad de que haya un incremen incremento to en la cuota de membres membres´´ıa? b ) Dado que la cuota se ha incrementado, ¿cu´a all es el candidato con mayor probabilidad

de haber sido electo presidente? ¿Ten ¿T en´´ıa este candidato la mayor probabilidad de ser electo inicialmente? Comente. Soluci´oon: n: a ) Definamo Definamoss lo loss eventos de inter´es: es:

A  : B  : C   : E  : :

nor A es elegido como presidente ”. “el se˜  “el se˜  nor B es elegido como presidente ”. ”. “el se˜  nor C es elegido como presidente ”. ”. “el candidato electo incrementa la cuota ”.

Para esto utilizamos probabilidades totales (equivalentemente, podemos definir un diagrama de ´aarbol), rbol), ya que necesitamos   P(E ). ). Del enunciado tenemos que:

P(A) = 0,3

 | |

P(E  A) = 0,8

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

   

P(B ) = 0,5

  ||

P(E  B ) = 0,1

 

   

P(C ) = 0,2

 | |

P(E  C ) = 0,4

30

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Por lo tanto,

 | | ·

 | | · ·

 | | ·

P(E ) =  P(E  A) P(A) + P(E  B ) P(B ) + P(E  C ) P(C ) = 0,3 0,8 + 0, 0,5 0,1 + 0, 0 ,2 0,4 = 0,37

·

·

por lo tant tanto, o, la proba probabilida bilidad d de que la couta se incremen incremente te es de un 37 %. b ) Nece Necesitamo sitamoss utili utilizar zar el teore teorema ma de Bay Bayes es para calc calcular ular las proba probabilida bilidades des a posteri posteriori ori

de aumentar la cuota. As´ı,

|

 | |

  P(E  A)P(A) P(E )   0,3 0,8 = 0,37 = 0,65

P(A E ) =

·

 |

 | |

  P(E  B )P(B ) P(E )   0,5 0,1 = 0,37 = 0,14

P(B E ) =

·

 | |

P(C  E ) = =

 | |

  P(E  C )P(C ) P(E )   0,2 0,4

·

0,37 = 0,21 Dado que la cuota se incrementa, el candidato con mayor probabilidad de ser electo es el se˜ n nor or A. Aun cuando a priori sab sab´´ıamos que el se se˜ n nor ˜or B ten ten´´ıa mayor p probabil robabilidad idad de ser electo, el aumento de cuota resulta ser un beneficio para la candidatura del se˜n nor or A. ´ 9. Un inver inversionist sionistaa tien tienee tres opciones de inv inversi´ ersi´ on on que le presenta el mercado,   I 1 ,   I 2   e   I 3 .   El decide dec ide por una de ´eestas stas y le pre presen senta ta su pro propue puesta sta al cli clien ente, te, el cua cuall pue puede de cam cambia biarla rla o mantener la sugerida por el inversionista. Sean los eventos D eventos  D i , el cliente decide la opci´oon n de inversi´on i on  i,,  i  i =  = 1, 2, 3 La tabla adjunta presenta la probabilidad de que el cliente decida por la opci´on D on  D j  dado que el inversionista le presenta la inversi´oon I  n  I k .

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

31

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

D1 I 1   0. 0.7 I 2   0. 0.1 I 3   0. 0.0

  D2 0.1 0.8 0.1

  D3 0.2 0.1 0.9

Suponga P(I 1 ) = 0que ,10 la probabilidad de que el inversionista escoja cada una de las tres opciones es: P(I 2 ) = 0,40 P(I 3 ) = 0,50 a) Calc Calcule ule la probabilid probabilidad ad de que el client clientee decida por la segun segunda da opci´oon n de inversi´on D on  D 2 . b) Dado que el cliente escogi´o la segunda opci´on on de inversi´oon, n, calcule la probabilidad de que el inv inversio ersionista nista le sugiri sugiri´´o esa opci´oon. n. c) Para cada k cada  k  por separado, calcule la probabilidad de que el inversionista decida por la opci´on  k  y el cliente la acepte. d) En t´eerminos rminos de llos os eventos eventos I   I  y  y los eventos  eventos   D  defina el evento: C : la decisi´on on del inversionista y el cliente es la misma. e) Calc Calcule ule la probab probabilidad ilidad del eve evento nto C   C .. Soluci´oon: n: a) Por teor teorema ema de probabili probabilidad dad total,

 |

 |

 |

P(D2 ) = P (D2 I 1 )P(I 1 ) + P(D2 I 2 )P(I 2 ) + P(D2 I 3 )P(I 3 ) Con los datos de la tabla y las probabilidades de I  de  I k , obtenemos

 |

 |

 | ·

P(D2 ) = P (D2 I 1 )P(I 1 ) + P(D2 I 2 )P(I 2 ) + P(D2 I 3 )P(I 3 ) = 0,1 0,1 + 0, 0,8 0,4 + 0, 0,1 0,5 = 0,38

·

·

Por lo tanto, la probabilidad de que el cliente escoja la segunda opci´oon n de opci´oon n de inversi´oon, n, sin importar lo que sugiere el inversionista es 0.38. b) Se pide calcular

 |

P(I 2 D2 ) Aplicando el teorema de Bayes, nos queda

 |

 | ·

  P(D2 I 2 ) P(I 2 ) P(D2 )   0,8 0,40 = 0,38

P(I 2 D2 ) =

·

= 0,842 Por lo tanto, dado que el cliente escogi´o la segunda opci´oon, n, la probabilidad que el inversionista la haya sugerido es 0.84. Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

32

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

c) Para cada k cada  k  = 1,

P(D1

∩ I  ) = P(D  | I  )P(I  ) = 0,7 · 0,1 = 0,07

P(D2

∩ I  ) = P(D  | I  )P(I  ) = 0,8 · 0,4 = 0,32

P(D3

∩ I  ) = P(D  | I  )P(I  ) = 0,9 · 0,5 = 0,45

1

1

1

1

Para cada k cada  k  = 2, 2

2

2

2

Para cada k cada  k  = 3, 3

3

3

3

d) Sea C  Sea  C :: la decisi´on on del inversionista y el cliente es la misma. Entonces C   = (D1

∩ I  ) ∪ (D ∩ I  ) ∪ (D ∩ I  ) 1

2

2

3

3

e) Como los ev event entos os son independie independiente ntes, s, en entonce toncess 1 1) 3 3 P(C ) = ((D (D2 I 2I ) ) +(D P(D3I  ))I 3 )  P (( = P (DD1 I I  2 1 ) + P(D2 = 0,07 + 0, 0,45 + 0, 0,32 = 0,84

∩∩ ∪

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

∩∩ ∪

 

∩∩

33

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

2.2. 2. 2.

Vari ariabl ables es Al Alea eato tori rias as

1. Sea X  Sea  X    = n´u umero mero de sustancias nocivas en un material de trabajo escogido al azar. a ) ¿Cu´ aall de las siguientes tres funciones de probabilidad es una funci´oon n de probabilidad

legitima para X  para  X ,, ¿Por qu´e no se permiten las otras 2? x 0 1 2 3 4 p(x) 0.3 0.2 0.1 0.05 0.05 p(x) 0.4 0.1 0.1 0.1 0.3 p(x) 0.4 0.2 -0.3 0.5 0.2

 ≤   X  ≤  ≤   4),

b ) Para la funci´ oon n de probabilidad legitima de la parte anterior. Calcule   P(2

 ≤ 2) y   P(X    ≤  = 0)

P(X 

c ) Escriba la funci´ oon n de probab probabilidad ilidad acumul acumulada. ada.

Soluci´oon: n:

a ) Para que una funci´ on p on  p((x) sea se a fu funci´ nci´oon nd distr istribu ibuci´ ci´on on de una variable aleatoria debe cum-

plir que:

≥

i)   p(x) ii) ii)

0

  ∀ x ∈ R

 p(  p(x) = 1

x∈R

Es claro que la primera funci´oon n no cumple la segunda condici´oon n y la tercera, no cumple la primera ( p ( p(2) (2)   <   0). Por lo tanto la ´u unica nica funci´oon n de probabilidad leg leg´´ıtima es la segunda. b)

P(2



≤  ≤

4) = P (X  =   = 2) + P(X  =   = 3) + P(X   = 4) = 0,1 + 0, 0,1 + 0, 0 ,3 = 0,5

 ≤ 2) = P(X  =  ≤  = 0) + P(X  =   = 1) + P(X   = 2)

P(X 

= 0,4 + 0, 0 ,1 + 0, 0,1 = 0,6

   

P(X  = 0) =  P (X >  0)

−−

 ≤ 0)  ≤

= 1 P(X  = 1 0,4 = 0,6 Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

34

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

c ) Reco Recordemo rdemoss que la funci´ oon n distribuci´oon n acumulada (f.d.a) se define como

 ≤ x),  ≤

F  F ((x) =  P(X 

x

∈R

Por lo tanto la f.d.a para la funci´oon n elegida es x 0 1 2 3 4 F(x) 0.4 0.5 0.6 0.7 1

· − x) para x para  x  = 0, 1, 2, 3. ¿Cu´aall es el valor de de c  c??

2. Si  Si   p(x) =  c (5 Soluci´oon: n:

Recordemos que la si  si   p(x) es funci´oon n de probabilidad debe cumplir que tanto para calcular c calcular  c  debemos verificar que cumpla esta propiedad. As As´´ı,

 p(  p(x) = 1, por lo

3

3

c (5

 p(  p(x) = x=0

 



x)

x=0

· −· −

· − 1) + c + c · (5 − 2) + c + c · (5 − 3)

=  c (5 0) + c + c (5 =  c (5 + 4 + 3 + 2) =  c 14

· ·

1 Por lo tanto 14 c = 1 y el valor de c de  c que  que hace que p que  p((x) sea funci´oon n de probabilidad es es c  c =  =   14 .

·

3. Una multinaci multinacional onal pro produce duce determin determinado ado art art´´ıculo electr´oonico nico que se emplea en el ´area ar ea m´eedic d ica, a, y las especificaciones dicen que solo un 2 % de los art art´´ıculos producidos presentan fallas. Dos ingenieros, expertos en control de calidad, realizan su propio plan de inspecci´oon: n: el ingeniero A comienza a insp inspeccionar eccionar los art art´´ıculos de uno a la vez hasta detectar el primer defectuoso y acepta las especificaciones si realiza m´aass de dos extracciones; el ingeniero B toma una muestra de tama˜ n noo 5 y acepta las especificaciones del fabricante si no encuentra defectuosos. ¿Cu´aall de los dos ingenieros tiene mayor probabilidad de rechazar las especificaciones dadas por el fabricante? Soluci´oon: n: Calculemos la probabilidad de rechazar las especificaciones de cada ingeniero, y notemos que p = P(encont P(encontrar rar un art art´´ıculo defectuoso) = 0.02.

Ingeniero A: el experimento que realiza es insp inspeccionar eccionar art art´´ıculos de uno a la vez de manera independiente hasta detectar el primer defectuoso, lo que corresponde a la realizaci´oon n de una v.a. Geom´eetrica trica de par´aametro metro p. Acepta las especificaciones si realiza m´aass de dos extracciones (X (X > 2), por lo que las rechaza

Probabi Pro babilid lidad ad y E Esta stad dıstica ıst ica

 

35

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

 ≤ 2).  ≤

cuando realiza a lo m´aass dos extracciones ((X  X 

Entonces, sea X: n´ u umero mero art art´´ıculos inspeccionados hasta detectar el primero defectuoso,

 ∼ Geom(p = 0.02)

X y la probabilidad pedida es

 ≤ 2) = P(X  =  ≤   = 1) + P(X   = 2) = (1 − 0,02) 0,02 + (1 − 0,02)

P(X 

1−1

2−1

0,02

= 0,02 + 0, 0,0196 = 0,0396

Ingeniero B: el experimento que realiza es tomar una muestra de tama˜n noo 5 e inspeccionarla. Acepta las especificaciones del fabricante si no encuentra defectuosos, esto es, no encuentra “´eexitos” xitos” en su muestra, lo que corresponde a una v.a. Binomial de par´aametros metros n y p. Entonces, sea Y: n´ u umero mero art art´´ıculos defectuosos en la muestra de tama˜n noo 5,

 ∼ Bin(n=5,p=0.02)

Y y la probabilidad pedida es

− P(Y Y    = 0) 5 = 1− (1 − 0,02) 0

P(Y > 0) = 1



5−0

(0, (0,02)0

= 0,096 Como el ingeniero ingeniero A rec rechaza haza las especificac especificaciones iones el 4 % de las vece veces, s, mientr mientras as que el ingeni ingeniero ero B, un 9 %, es ´eeste ste ingeniero quien tiene mayor probabilidad de rechazar las especificaciones. 4. El 70 % de los av avion iones es lige ligeros ros que desapa desaparec recen en en vue vuelo lo en cie cierto rto pa´ pa´ıs son des descub cubier iertos tos posteriormen posteri ormente. te. De las naves descub descubiert iertas, as, el 60 % tiene localiza localizador dor de emer emergenci gencia, a, en tanto que el 90 % de las nav naves es no descubier descubiertas tas no tiene ese localizado localizador. r. a) Calc Calcule ule la probabilid probabilidad ad que un avi avi´´oon n ligero tenga localizador de emergencia. En las partes (b), (c) y (d), suponga que la probabilidad que un avi´oon n ligero tenga localizador de emergen emergencia cia es del 45 %. b) Consi Considere dere 10 avi aviones ones ligeros desapare desaparecidos cidos.. ¿Cu´ aall es la probabilidad que exactamente 2 de ellos tengan localizador de emergencia?

Probabi Pro babilid lidad ad y E Esta stad dıstica ıst ica

 

36

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

c) Ud. obser observ va indepe independien ndienteme temente nte avione avioness liger ligeros os hasta obtener el prime primerr avi avi´´oon n con localizador de emergencia. ¿Cu´aall es la probabilidad que el proceso finalice en a lo m´aass 10 observaciones? d) Ud. obser observ va indepen independien dienteme temente nte avione avioness liger ligeros os hasta obtener el terc tercer er avi avi´´oon n con localizador de emergencia. ¿Cu´al al es la probabilidad que el proceso finalice al menos 4 observaciones? Soluci´oon: n: a ) Defina los siguien siguientes tes eventos: eventos:

D  : “Avi´oon n ligero descubierto” L  : “Avi´oon n ligero tiene localizador de emergencia” Seg´ u un n enunciado,   P(L D) = 6/10,   P(L D ) = 9/10 y   P(D) = 7/10. Usando la probabilidades totales, la probabilidad pedida es:

|

|

P(L) = P(L D) P(D) + P(L D ) P(D )

| ·

=

|

·

 6  7  1  3   45  +  = 10 10 10 10 100

 ·

 ·

b ) Sea   X  X    : n´umero umero de aviones con localizador de emergencia, de entre los 10 aviones

 {

}

  ∼   Bin(n Bin(n   = 10;  10;   p   =

disponibles. Claramente, Rec(X  Rec(X ) = 0,  1,  1 , . . . ,  ,   10   y adem´as as   X  0,45). Por tanto, la probabilidad pedida es: P(X  =   = 2) =

 · 10 2

(0,55)8 (0, (0,45)2 (0,

·

c ) Sea   Y  Y    : N´u umero mero de aviones que es necesario observar hasta obtener el primer avi´on

 {

}

 ∼

con localizador de emergencia. Claramente, Rec(Y  Rec( Y )) = 1,   2,  3,  3 , . . .   y adem´as as   Y  Geom( p =  p  = 0,45). Por tanto, la probabilidad pedida es: 10

P(Y 

  ≤ 10) =

(1 y =1

y −1

− 0,45) · (0, (0,45)



d ) Sea   Z  Z    : N´u umero mero de aviones que es necesario observar hasta obtener el tercer avi´on on

 {

}

 ∼

con localiz localizador ador de emerg emergenci encia. a. Clara Claramen mente, te, Rec( Rec(Z  Z ) = 3,   4,  5,  5 , . . .   y adem´as as   Z  BinNeg(rr  = 3; BinNeg( 3; p  p =  = 0,45). Por tanto, la probabilidad pedida es: P(Z 

 ≥ 4) = 1 − P(Z   = 3)  ≥ 3−1 · (0, = 1− (0,45) · (0, (0,55) 3−1

 

3

3−3

5. En una determi determinada nada regi´ oon n la distribuci´on on de ingresos por familia en unidades monetarias (u.m) es una variable aleatoria  aleatoria   X  con   con funci´oon n de densidad de probabilidad dada por:

f  f ((x) =

 − 

x  1  + ,   si 0 x 2; 10 10 3x   +   9 ,   si 2  < x 6; 40 20 0,   en ot otro ro ca caso. so.

≤ ≤ ≤

Probabi Pro babilid lidad ad y E Esta stad dıstica ıst ica

 

37

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

a ) Verifiq erifique ue que que f   f ((x) es funci´oon n densidad. b ) Dete Determine rmine la fu funci´ nci´ oon n de distribuci´on on acumulada de la variable aleatoria X  aleatoria  X .. c ) Se selecc seleccionan ionan famil familias ias al azar hasta encon encontrar trar 3 con ingre ingreso so superior a 3 u.m. Hacie Hacienn-

do los supuestos que sean necesarios, determine la probabilidad de que sea necesario entrevistar a m´aass de 5 familias. d ) Suponga que se seleccionan 50 familias. Haciendo los supuestos que sean necesarios determine la probabilidad de que al menos 3 tengan ingreso inferior a 1 u.m. Soluci´oon: n: a ) Par Paraa mostrar que es func funci´ i´oon n densidad debemos mostrar dos propiedades:

(i)   f  f ((x)

≥ 0   ∀ x ∈ R

+1 Es claro que   f (x) =   x10 2  < x 6.

  ≥   0, cuando 0  ≤   x ≤   2 y   f ( f (x) =



(ii)

)dx   f  f ((x)d x  = 1

 

f  f ((x)d )dx x  =

 2

   0

0

= =

x + 1  dx + 10

x2   x  + 20 10

 6

 

18

2

  x=2

− 3 x dx

40

18 18x x 40

 −

+

x=0

  3x2 80



40

40

b ) Debemos hacerlo por tramos:

≤ x ≤ 2,

 1 F  F ((x) = 10  1 = 10

 x

(t + 1)dt 1)dt

   0

x

t2   + t 2

0

  x2   x =  + 20 10 Si 2  < x

≤ 6,

 1 F ( F (x) = 10

 

 2

0

 1 (t + 1)dt 1)dt +  + 40

  −  x

( 3t + 18) dt

2

3t2 =  F (2)  F (2) +   + 18 18tt 40 2   2  3  3x x2  9x  9 x  3 =  + 5 80 20 4  1

 −

x=6 x=2

·   −  3 · 18  −  2 · 18  +   6

  4   2  18  1 8 6  +  + 20 10 40

=1 Si 0

  ≥   0 cuando

  ∀   x ∈ R.  6

 

  18 18− −3x 40

−

 −



x 2

40

Probabi Pro babilid lidad ad y E Esta stad dıstica ıst ica

 

38

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Entonces la funci´oon n de distribuci´oon n acum acumulada ulada queda:

F ( F (x) =

   −

0,   si x si  x  6.

c ) Definir  Definir   Y  Y    como el n´ u umero mero de familias seleccionadas hasta encontrar 3 con ingreso su-

  ∼ BinNeg(3 BinNeg(3,, p), donde  ≤ 3)  p =  p =  P (X > 3) = 1 − P (X  ≤ −27  + 27  −   7 =1− 80 20 20

perior a 3 u.m. Con esto,  Y 





0, 3375 3375 . .



Entonces,

− P (Y   ≤ 5) y−1 =1− 2

P (Y > 5) = 1

  5

(1

y =3

y −3 3

− p)  p)

 p = 0,925

Notar que y que  y  = 3, 4, . . . d ) Sea Z  Sea  Z  el  el n´ u umero mero de familias que tienen ingreso inferior a 1 u.m. de un total de 50. Con

 ∼ Bin(50  ∼ Bin(50,, q ), ), donde

esto, Z  esto,  Z 

q   = =  P (X <  1) =  20 1  +  10 1   =  20 3   = 0,15 15 . . Entonces,

 ≥ 3) = 1 − P (Z n n +  + k  k X > n) =  P (X > k )

 |

Interprete esta propiedad.

Probabi Pro babilid lidad ad y E Esta stad dıstica ıst ica

 

39

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Soluci´oon: n:

 |

P(X > n n +  + k  k X > n) =

  P(X > n n +  + k  k,, X > n n)) P(X > n)

  P(X > n n +  + k  k)) = P(X > n)

  ∞

=

x−1

· − p)  p)

 p (1

x=n+k+1 ∞

 p (1  p)  p)x−1

· −

x=n+1

  (1  p)  p)n+k+1 =   ( ) (1  p)  p)n+1 =

− − (1 − p)  p)



k

=   P(X > k ) Lo que se interpreta como que el n´ u umero mero de ensayos Bernoulli que ya se han realizado buscando el primer ´eexito xito no influyen en que se realicen realicen k  k  ensayos m´aas. s. (*) se deduce de ∞

 

ax =   ak + ak+1 + . . .

 

(2.2)

x=k ∞

a

ax =   ak+1 + ak+2 + . . .

 

(2.3)

x=k

Restando (2.2) y (2.3) ∞



(1

x=k

− a)a

x

=   ak

x

  ak = 1 a





a

x=k

, o bien



7. La funci´oon n distribuci´oon n acumulada de una variable aleatoria Rayleigh es F  F ((x) = 1

− exp

− 

  x2 , 2σ2

x > 0

a) Mues Muestre tre que esta fun funci´ ci´ on on es efectivamente una funci´oon n de  distribuci´ o on n acumulada. b) Encue Encuentr ntree la funci´ oon n densidad Rayleigh.

Probabi Pro babilid lidad ad y E Esta stad dıstica ıst ica

 

40

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

c) Encue Encuentr ntree el percen percentil til 25 de esta distribuc distribuci´ i´oon. n. Soluci´oon: n: a) Mostr Mostramos amos cumpla dos propiedad propiedades: es: i) l´ımx→∞ F  F ((x) = 1 Calcula Calc ulamos mos dicho l´ımi ımite: te: l´ım

x→∞

 −  −  1

exp

  x2 2σ2

−   l´ım exp = 1−0

 = 1

x→∞

−    x2 2σ2

=1

iiii)) l´ıım m x→−∞ F  F ((x) = 0 En est estee cas caso, o, cal calcul culamos amos el l´ımi ımite te de x ten tendie diendo ndo a cer cero, o, que es el men menor or valo alorr que puede tomar y a lo que hace referencia la expresi´on anterior (hacer tender x al menor valor que puede tomar). l´ım

x→−∞

 −  −  1

exp

  x2 2σ2

− 

− l´ım exp = 1−e = 1−1

 = 1

x→0

  x2 2σ2

0

=0

Como tambi´ een n se cumple esta propiedad, F(x) es funci´ oon n distribuci´oon n acumulada. b) Deriv Derivamos amos la f.d.a y queda f  f ((x) =

 d F  F ((x) dx

=0



2

 2 x − exp −  2xσ · − 2x 2σ

  −  2

 x   f (x) = 2  exp σ

2

  x2 , 2σ2

x >  0

c)   P 2255  corresponde al valor de  de   x  que satisface que  que   F ( F (x) = 0,25. despejamos esta ecuaci´on on y obtenemos

Probabi Pro babilid lidad ad y E Esta stad dıstica ıst ica

 

41

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

→ 1 − exp

− 

  x2  = 0,25 2σ 2

  x2

exp

 = 0,75

2

→   x − 2σ → − 2σ  = ln(0, ln(0,75) → x = −2σ ln(0 ln(0,,75) → x =  = σ  σ 0,575 →   x = 0,75 75σ σ

    2

2

2

2

8. Los procesos de falla de cada una de 10 compone componente ntess se comportan de maner maneraa probab probabil il´´ısticamente independientes y siguiendo un mismo modelo probabil probabil´´ıstico. Sea Sea   X i  el tiempo de falla de la i-´ eesima sima componen componente, te, expresado en miles de horas horas.. Suponga que su densid densidad ad de probabilidad es f  f ((x) =



  0,8e−x + 0, 0,4e−2x ,   x  0; 0,   e.o.c.

 ≥

para cualquier i cualquier  i =  = 1, 2, . . . , 10 a ) Dete Determine rmine la fu funci´ nci´ oon n distribuci´oon n acumulada de de X   X 3 b ) Cal Calcul culee la pro probab babili ilidad dad de que a lo m´aass 3 componentes fallen antes de 1.5 horas.

Soluci´oon: n: a ) La funci´ oon n distribuci´oon n de la variable variable X   X 3  viene dada por:

0,

F X  X 3 (x) =

          −  −

 

 x

si x

 ≤ 0

0,8e−t + 0, 0,4e−2t dx,   si x  >0  > 0

0

0,

=

  −t

e

d + 0, 0 ,4

0,

0,8(1

  e−x )

0,

=

1

0,8e−x

−2x

 

− 0,2e

 ≤ 0

si x

− 0,2e

,   si x  >0  > 0 si x

−2x

 ≤ 0

e−2t dx,   si x  >0  > 0

0

0

=

si x

 x

 x

0,8

 

 ≤

0

,   si x  >0  > 0

Probabi Pro babilid lidad ad y E Esta stad dıstica ıst ica

 

42

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

b ) La probabilidad de que una componente cualquiera falle antes de las 1.5 horas, viene

dada por:

P(X  j   <  1,  1, 5) = F X  (1,, 5) = 1 X j (1

−2·1,5

−1,5

− 0, 8e − 0, 2e

Denotemos esta probabilidad por p por  p,, o sea,  p =  p  = 1

−1,5

−2·1,5

− 0, 8e − 0, 2e

= 0,81

Sea ahora Y: n´ u umero mero de componentes que fallan antes de 1.5 horas.

  ∼ Bin Bin(10 (10,, p) y lo que se pide es

Entonces,  Y 

  · 3

  ≤ 3) =

P(Y 

x=0

10 x

 px (1

· − p)  p)

10 10− −x

= 0,00058

9. Se efec efectuaro tuaron n 10 medic mediciones iones independi independient entes es   X 1 , X 2 , . . . , X10    en una poblaci´oon n donde cada 2 una de ellas sigue una distribuci´on  on   N (µ, σ ). a ) ¿Cu´ aall es la probabilidad que la tercera medici´oon n realizada se encuentre entre (µ (µ

(µ + σ)?  σ )?

− σ) y

b ) Par Paraa cualq cualquier uier distribuc distribuci´ i´oon n de probabilidad se define el   Rango Rango intercuantil  intercuantil   como la

distancia que hay entre los percentiles 25 y 75. Calcule el Rango intercuantil para una distribuci´oon n N(µ N(µ,  σ 2 ). Soluci´oon: n: a) Se pide la probabili probabilidad dad que la tercera medi medici´ ci´ on on efectuada se encuentre entre (µ (µ (µ + σ),  σ ), luego se tiene que   X 3

P(µ

b) Si X

−σ <

X 3  <

µ 1 < µ + σ)  σ ) = P σ    0,  0,

y > 0

Usando el cambio de variable propuesto Z   = X   + Y +  Y

W   =

⇒ X   = Z W

  X  X  + Y   +  Y 

Y   Y   =  Z (1 (1

− W  W ))

Calculamos el Jacobiano





∂ (x, y) J  =  = ∂ (z, w)

||

 

  w 1 w



   − z  z 

 =

| − z | = z 

Luego, por el teorema de cambio de variables la funci´oon n de distribuci´oon n densidad con junta de de Z   Z    y  W   W    es:

− ||

f Z,W (z, w) = f X,Y  (zw,z (1 (1 w)) J  −z = (zw zw))e z  = z 2 e−z w, z >  0,  0,   0 < w <  1

||

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

63

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Para obtener las marginales de Z  de  Z    y  W   W  procedemos  procedemos de la siguiente manera:

 

 1

2 −z

f ZZ  (z ) =  z  e

wdw

0

  z 2 −z =  e , 2

 

z > 0

 ∞

f W  W (w ) =  w

z 2 e−z dz 

0

= wΓ(3)  w Γ(3) = 2w, 0  < w x) 1 − P(X   > x, x, X   > x, . . . , X    > x) 1 − P(X   > x)P(X   > x) · · · P(X   > x) (por (por inde indepe pend nden enci ciaa de las las v.a. v.a.)) 1 − (1 − P(X   ≤ x))(1 − P(X   ≤ x)) · · · (1 − P(X   ≤ x))

= 1

(1) (1)

=

1

= =

2

1

n

2

n

2

1

n

n

= 1

 − −  ≤  − − (1

P(X i

x))

i=1

= 1

1

F X  X (x)

n

(ya que todas tienen la misma distribuci´oon) n)

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

64

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Por lo tanto, la funci´oon n densidad de de X   X (1) (1)   es f X  X ( 1) (x) =

dF X  X (1) (x) dx n−1

F (x)) − n[1 − F  (x) ·  d(1 −dxF ( =   −n[1 − F  (x) · −f ( f (x) · f ( =   n[1 − F  (x) f (x)

= 0



X  X 



X  X 



X  X 

n−1

n−1

4. Sea (X, (X, Y  Y )) un vector aleatorio con funci´on on de densidad conjunta −x f X,Y  X,Y  (x, y ) =  c y e ,   0

||

≤ x ≤ ∞;   −x ≤ y ≤ x

a ) Encue Encuentr ntree la densidad margi marginal nal de de X   X  en  en t´eermino rmino de la constante constante c  c.. Demuestre que c que  c =  =

1/2.

b ) Encue Encuentr ntree la densi densidad dad margina marginall de de Y   Y  y  y obtenga E(Y  E(Y ). ). c ) Encue Encuentr ntree la densi densidad dad condici condicional onal de de Y  dado  X    = 1.  Y    dado X 

Soluci´oon: n: a ) La densidad marginal de X  de  X  se  se obtiene de la siguiente manera

  | |  x

f X  X (x) =  c

y e−x dy,

x >  0

−x

 x −x

=  ce

2

   0

y dy,

x

=  ce −x y2 ,

x >  0

x >  0

0

=  cx2 e−x ,

x >  0

Para demostrar que  que   c   = 1/2, por comparaci´oon n con la densidad de Gamma(3,1) y por definici´ oon n de Γ(3) se deduce deduce c  c  = 1/2. b ) La densidad de Y  de  Y  se  se obtiene de la siguiente manera

  ||

 1 f YY   (y) = y 2

 ∞

e−x dx

|y |

−|y | , =   1 y e−|y 2

||

  −∞ < y < ∞

Luego, por p or simetr simetr´´ıa de la densidad se tiene que E(Y  E(Y )) = 0.

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

65

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

c )

  f X,Y  X,Y  (x, y ) f X  X (x) y e−x , x = 2 − x xe f YY | |X (y 1) = y , 1 y

|

f YY | |X (y x) =

 | | y x ≤ 1 ≤ | |   −   ≤−  ≤

|

5. Un grupo de empre empresas sas desti destina na sus benefic beneficios ios a una inv invers ersi´ i´ oon n y a pago de dividendos a sus accionistas. Sean X  Sean  X    e Y   Y  variables  variables aleatorias que representan porcentajes destinados a nuevas inversiones y a pagos de dividendos respectivamente, con funci´oon n densidad conjunta: f  f ((x, y) =  k,  k ,   0 < x  0 y2

f  f ((y) =

·

· · ·

·

; y >  0

c) Calc Calcule ule la probabilida probabilidad d de que dado que la operador operadoraa se demor demoraa 5 min minutos utos en ingresar la llamada, el sistema la ingrese en menos de 2 minutos.

Soluci´ o on: n: Sea Y=5

 

 2

P ( P (X <  2/Y   2/Y    = 5) =

0

  1 = 25

x e−x/y   dx y2

·

 

 2 x/5 5 xe−x/ dx

0

Integrando por partes con los cambios de variable se tiene: x/5 5 x = u  =  u dv = dv  = e  e −x/ dx x/5 5 dx = dx = du  du v  = 5e−x/



 

; y  = 5

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

68

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

   ·−  − ·− − −  

2

0

10 10ee

5e

= 25   1 = 25  1 = 5

+5



 2

  1 x/5 5 = xe−x/ 5 +5 25 0   1 −2/5

−x/ x/5 5

xe

dx

−2/5

0

·

+ 5 5e

35 35ee−2/5 + 25



7e−2/5 + 5

d) En la pr´aactica, ctica, ¿deber´ııan an ser indep independientes endientes X   X   e Y  ?,  Y  ?, ¿lo son en esta densidad conjunta? Soluci´ o on: n:

·

Para comprobar independencia se tiene que cumplir que  f (  f (x) f ( f (y) = f (  f (x, y) En este caso no son indep independientes endientes ya que es claro que el t´eermino  rmino   e−x/y no es posible descomponerlo como un producto entre funciones de  x   y de de y  y.. e) Calc Calcule ule la distribuc distribuci´ i´oon n de de Z   Z    = eY  . Soluci´ o on: n: Z   = e Y 

⇔ ln( ln(Z ) = Y    ⇒

 1  Z   =  Y 

·

f  f ((z ) =   f y (ln( ln(z )) )) 1/z  ln((z ) 1/z  = 0,0625 [ln( ln(z )] )]2 e−0,5·ln =  1 ⇒ f f ((z ) = 0,0625 · [ln( ln(z ))]] · z  2

=

3/2

· · 0,0625 · [ln( ln(z )] )] · e 2

ln ln((z

0,5 )



·

· 1/z 

  ; z >  0

;   z > 0

7. Dos l´ıneas de producci´oon n manufacturan cierto tip tipoo de art art´´ıculos. Sup Suponga onga que la capacidad (en cualquier d´ıa dado) es dos art art´´ıculos para la l´ınea I y 3 para la l´ınea II. Con base en la tabla adjunta que mue muestra stra la distr distribuci ibuci´´oon n de probabilidades conjunta: X=I— Y=II 0 1 2 3 0 0 0.04 0.12 0.09 1 0.02 0.14 0. 0.21 0.14 2 0.07 0.06 0. 0.06 0.05 a ) Obten Obtener er las funcione funcioness marginale marginaless de de   X   e  Y   Y .. b ) Calcule  P (1 (1 < X 2, 0   0

√    ∼ χ , utilizando que Γ(1/ Γ(1/2) = π

Para k Para  k  = 1, demuestre que Y  que  Y 

2 1

18. Dada una varia variable ble aleator aleatoria ia bidimensi bidimensional onal ((X, X, Y ) Y ) , con funci´oon n densidad conjunta π

π

[0,, 2 ]×[0 [0,, 2 ] (x, y ) f  f ((x, y) =  k (cos( (cos(x x) + cos(y cos(y)) I [0

a) Dete Determine rmine k  k.. b) Encue Encuentr ntree la marginal de de Y   Y 

·

·

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

78

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

 | |

c) Dete Determine rmine la distribu distribuci´ ci´ on on condicional de  de   X  Y   Y   =  y d) ¿Son X e Y independientes?

19. Sea (X, (X, Y  Y )) el resultado de escoger un punto en el plano al azar de la regi´oon n de dos dimensiones acotada por las rectas x rectas  x =  = 1, 1, x  x =  = 2, 2,   y  = 1 x, y  y  = 1 x. Calcu Calcule: le:



a ) Las densid densidades ades margi marginales nales de de   X   e  Y   Y ..



− −

b )   P(X Y > 0)

|

c ) E( E(Y  Y  X   = x)  x)

20. Sean Sean   X  X    e   Y  Y    variables aleatorias independientes con distribuci´oon n exponencial de par´aametro metro λ  = 1. Se definen   X  U   =  , V   V   = X  + Y   +  Y  X   + Y  +  Y  a ) Dete Determine rmine la densid densidad ad conjun conjunta ta de ((U, U, V ). V ). b ) Dete Determine rmine las densida densidades des marginal marginales es de de U   U    y  V .  V  . c ) ¿Son U  ¿Son  U    y  V  variables  V  variables aleatorias independientes?

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

79

 

Cap´ıtulo 3 Infe In fere renc ncia ia Esta Estad d´ıs ısti tica ca 3.1. 3. 1.

Es Esti tima maci ci´ on o ´n puntual

1. Sea Sea   X 1 , . . . , Xn   una muestra aleatoria de la distribuci´oon n Pareto, con funci´oon n densidad dada por X (x) =  θα θ x−(θ +1) , f X  x Asuma que α que  α  es conocido y encuentre el EMV de θ de  θ..

≥ α,

θ

≥ 1.

Soluci´oon: n: Siguiendo los pasos vistos en clases: n

L(x, θ) =

 

f  f ((xi )

i=1 n

=

(θ+1) θαθ x− i

i=1 n

=  θ α

   n



−(θ +1)

xi

i=1

As´´ı, la log-verosi As log-verosimilitu militud d queda n

logL log  + nθ logα L(x, θ) = nlog  n logθθ +  nθlog α ∂   n logL log L  =   + nlog  nlogα α ∂θ θ   n θ  = n  logx xi i=1 log

  



− (θ + 1)

n



  

logx log xi

i=1

logx log xi  = 0 i=1



− nlog logα α

θ =θ

 

80  

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

2. Sea Sea X   X 1   y  X 2  una muestra aleatoria de tama˜n noo 2 proveniente de una poblaci´on X  on  X  con  con media 2 para  µ,, varianza   σ . Si disponemos de dos estimadores para µ µ  y varianza  µ1  =

  X 1  +  + X   X 2   2

y

µ2  =

  X 1  + 2X  2 X 2 3

 

 

¿Cu´aall de los dos es el mejor? Soluci´oon: n: Calculemos el sesgo de los dos estimadores

  



  



X 1  + X   + X 2 E(µ1 ) = E 2  1 = (µ + µ)  µ) 2 =  µ y

X 1  + 2X  2 X 2 E(µ2 ) = E 3  1 = (µ + 2µ 2µ) 3 = µ Como los dos son insesgados, calculemos sus varianzas 2 V(µ1 ) = V X 1  + X   + 2  X   1 = (σ2 + σ 2 ) 4  1 = σ2 2

  



  



X 1  + 2X  2 X 2 V(µ2 ) = V 3  1 = (σ2 + 4σ 4σ 2 ) 9 =   5 σ2 9

Dado que µ  tiene menor varianza que µ , entonces µ  es mejor estimador que µ .

 

 

 

 

1

2

1

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

2

 

81

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

3. Sea X una variabl ariablee aleatori aleatoriaa con densi densidad dad   θ3 2 −θx f  f ((x) =  x e , 2

x > 0

donde θ donde  θ > 0 es desconocido.

 

a) Muestre que θ  = 2/X  es   es un estimador insesgado para  θ

 

b) Encue Encuentr ntree la varianz arianzaa de θ

c) Encue Encuentr ntree la Infor Informaci´ maci´ oon n de Fisher para el par´ametro θ ametro  θ.. d) ¿Alcanza el estimador la cota de Cram´eerr- Rao? Soluci´oon: n:

 

a) Par Paraa mostrar que es insesgad insesgadoo debe cumpl cumplirse irse que E(θ) = θ,  θ , por lo tanto

         2 X 

E(θ) = E =

 ∞

0

2 θ3 x 2 e−θx dx x2

 ∞

θ3 xe−θx dx

=

0

 

 ∞

·

=   θ Γ(2)

0

θ2 2−1 −θx x e dx Γ(2)

·

= θ 1 Por lo tan tanto to es inse insesgado sgado pa para ra   θ. b) Par Paraa calc calcular ular la varianz arianza, a, recordem recordemos os que V(X ) = E(X  V(X  E(X 2 )

2

− E (X )

Entonces s´oolo lo nos falta calcular E(2 )

         4 X 2

2

E(θ ) = E

 ∞

=

0

4 θ3 2 −θx  x e dx x2 2

 ∞

2θ3 e−θx dx

=

0

= 2θ3 2

· −θ1  e

θx

2θ Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

82

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

y con esto

 

V(θ) = 2θ2

−θ

2

=  θ 2

c) Sabemos que la Inf Informac ormaci´ i´oon n de Fisher est´a dada por 2

I (θ) =

−E



d logL( logL dθ2(x, θ)



En este caso, como s´oolo lo contamos con una observaci´oon, L n,  L((x, θ) = f (  f (x), por lo tanto   θ3 2 −θx L(x, θ) =  x e 2 log(L log( L) = 3 lo l og(θ)

− log(2) − 2log( 2log(x x) − θx

dlog(L) dlog(L  3   = dθ θ

 − x

d2 log( log(L L)

3

dθ2   = Por lo tanto

  −θ

2

I (θ) =

−E(− θ3 ) =  θ3 2

2

 

d) Un estimador insesgado alcanza la cota si V(θ) = I −1 (θ). En este caso   θ2 V(θ) = θ >   =  I −1 (θ) 3

 

2

por lo tanto, no alcanza la cota de Cram´eerr- Rao. 4. Consi Considere dere una muest muestra ra aleatori aleatoriaa  X 1 , . . . , Xn   con funci´oon n distribuci´oon n densidad dada por:

f  f ((x) =

 

α

α α−1 x exp θ

{ −θx  },   x ≥  0, θ 0,  θ >0, α 0,  α >0, conocido;

0,

 

e.o.c.

a ) Demuestre que la distribuci´ oon n de   Y  Y    =   X α es exponencial de par´aametro metro 11/θ /θ.. (Y 

 ∼

exp(1/θ exp(1 /θ)) )) b ) Calcule el EMV de  de   θ. c ) Mues Muestre tre que es inses insesgado gado y calc calcule ule su varian arianza. za. d ) Calcule la cota de Cram´ eer-Rao r-Rao de θ  y determine si el estimador es eficiente.

Soluci´oon: n:

 

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

83

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

a ) Usand Usandoo teorema de cambio de varia variable, ble, α

−1

Y  Y    =  g(  g (X ) =  X  ,

g (y) =  y

  dg −1   1 1/α −1 J  =   = y /α− dy α

1/α

||

as´ı, 1/α ) J  f YY   (y ) = f X  X (y  α y   1 1/α −1 = (y1/α )α−1 exp y /α− θ α θ  α y   1 1/α −1 = y1−1/α exp y /α− θ θ α   1 −y/θ = e θ

·| |

{−  } · {−  } ·

  ∼ exp (1/θ ). exp(1 /θ).

Por lo tanto, Y  tanto,  Y  b

) Par Paraa encon encontrar trar el EMV:

n

L(x, θ) =

   · i=1

=

α i

{ −x   }

α α−1 x   exp θ i

α θ

θ

n

n

xiα−1

  · exp

i=1

 {−   } xαi θ

n

log L(x, θ) = n log α

− n log θ + (α ( α − 1)

log xi i=1



n  1  + θ θ2





xαi   = 0

 

θ =θ

Por lo tanto, n

    1 θ  = n

xαi



 dlog L   = dθ

−  1θ

xαi

i=1

 

 ∼

c ) Para mostrar que es insesgado, debe cumplirse que E(θ ) =  θ.  θ . Recordemos que si  si   Y  2

exp(1/θ exp(1 /θ), ), entonces E(Y  E(Y )) = θ   y V( V(Y  Y )) =  θ .

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

84

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

n

  

1 E(θ) = E( n

 

xαi  )

i=1

n

=  n 1 =

 1 n

E(x E(xαi  )

i=1 n

θ

i=1

= θ Por lo tanto, el estimador encontrado es insesgado. Calculamos su varianza: 1 V(θ) = V( n

n

xαi ) i=1 n

    =

=

 1 n2

 1 n2

V(x V( xαi )

i=1 n

θ2

i=1

2

=

 θ n

d ) Calculamos la cota de Cram´ eerr- Rao  I   I ((θ)−1

I (θ) =

E

d2 L(x, θ) 2

dθ −  n   2  − θ = −E θ

    −  − 2

n

xαi

3

i=1

 2 (E(xi )α ) (E(x 3 θ  2  n = 3 (θ) θ θ2  2  n = 3 nθ θ θ2  n = 2 θ =

 n θ2



−1

2

Por loa tanto, es  I   I ((θ) es eficiente. =  θ /n, /n, por lo tanto, como la varianza del estimador es igual la cota,laelcota estimador 5.   a ) Sean X  Sean  X 1 , X 2

iid

∼ exp  exp((λ). Determinar la funci´oon n densidad de de Y   Y    =  X   + X   +  X  1

2

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

85

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

b ) Sea Y  Sea  Y 1 , . . . , Yn   una muestra aleatoria con funci´oon n densi densidad dad

f YY   (y) =  λ2 y   e−λy ,

y > 0,  0 ,

λ> > 0  0

Determinar un estimador insesgado y eficiente para   µ   = 1/λ. /λ. Determinar la cota de Cram´eerr- R Rao ao para el xes estimado timadorr en encontrado. contrado.

c ) Verifiq n no depende de  de   µ. Use lo erifique ue que   Q   = e µ es un pivote, es decir, su distribuci´oon

hecho en la parte anterior. Soluci´oon: n:

 − Z ,  −

a ) Sea Y  Sea  Y    =  X 1 + X 2  y Z   y  Z    =  X 1 . Con esto, las funciones inversas son X  son  X 1  = Z   =  Z    y  X 2  = Y   =  Y 

por lo que

 −



1 0  = 1 1 1

|J | =

Como 0 < 0 < X 1  < X 1  +  + X   X 2 , entonces 0 < 0  < Z < Y  As As´´ı, la dis distrib tribuci´ uci´oon n conjunta de de   Y, Z  queda   queda

− || · − || · λe

z ) J  f Y Z (y, z ) = f X  X 1 x2 (z, y = f X  z ) 1 X 2 (z ) f X  X 1 (y = λe  λe−λ·z

(por indepen independenc dencia ia de de X   X 1   y   X 2 )

 

−λ·(y −z )

= λ2 e−λy ,   0  < z < y Por lo tanto, la funci´oon n densidad marginal de de Y   Y    es

 

 y

f YY   (y) =

λ2 e−λ·y dz 

0

· 

y

2 −λ·y

=  λ e



0

=  λ2 ye−λ·y ,

  ∼ Gamma Gamma(2 (2,, λ)

Es decir, Y  decir,  Y 

y >  0

b ) Por m´ aaxima xima verosimilitud, determinemos un EMV para para   µ. n

L(y, µ) =



µ−2 yi e−yi /µ

i=1

n

= µ−2n





 − y /µ

(yi )e

i

i=1

log(L) = 2n log( log(L log(µ µ) + log(yyi ) log( dlog(L dlog( L) 2n   1   =  + 2 yi  = 0 dµ µ µ

−  −

 

log

 − 

yi /µ



 d dµ

µ=µ

 

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

86

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Por lo tanto,

n

    1 µ  = 2n

yi

i=1

Para comprobar que sea insesgado, recordemos que si   Y  E( E(Y  Y )) = 2/λ y /λ  y V( V(Y  Y )) = 2/λ2

  Gamma(2 Gamma(2,, λ) entonces,

 ∼ E(µ) = E(

 

   

 1 2n

 1 2n  1 = 2n  1 = 2n  1 = 2n n = µ

=

yi )

E(y E(yi ) 2/λ 2µ

 · · 2µ

Por lo tanto, µ  es insesgado.

 

Calculemos Calculem os su varianza y compar´eemosla mosla con la cota de Cram´eer-Rao. r-Rao.

  

 1 V(µ) = V( 2n  1 = 2 4n

 

yi )

V(yyi ) V(

=  41n2 2/λ2  1 = 2 2µ2 4n  1 = 2 n 2µ2 4n   µ2 = 2n

 · ·

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

87

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

La cota est´a dada por por I   I ((µ)−1 donde 2

I (µ) =

−E( ddµL ) 2

=

E(



2n

 2

µ2

µ3

yi )

  − −

 2  2n  2 n = 3 E(y E(yi ) µ µ2  2   2n = 3 2nµ µ µ2   4n  2n  2 n = 2 µ µ2   2n = 2 µ



 −

Entonces

  µ2 I (µ) =   = V(µ) 2n Por lo tanto, el estimador alcanza la cota, por lo que es eficiente. −1

 

6. Sea X  Sea  X 1 , . . . , Xn   una muestra aleatoria de la distribuci´oon n Rayleigh, es decir,  x f  f ((x) = 2  exp θ

− 

  x2 , 2θ2

x >  0,  0,

θ > 0.  0 .

 

a ) Dete Determine rmine el est estimador imador de m´ aaxima xima verosimilitud de de θ  θ 2 , θ2 .

     

b ) Determine si θ 2 es insesg insesgado ado c ) Calc Calcule ule la var varianza ianza de θ2 .

d ) Determine si θ 2 es consistente en error cuadr´ aatico tico medio. Hint : Si X  Si  X 

Soluci´oon: n:

 Raileigh(θθ), entonces X   Raileigh( entonces  X 2 distribuye exponencial de media 2θ 2θ 2 )

 ∼

 

a ) Plan Planteamo teamoss la funci´ oon n de verosimilitud para resolverla en funci´oon n de θ2 .

 −  −     − −  n

2

L(x, θ ) =

i=1

=

log L   = dlog L

  x2i 2θ2

xi  exp θ2

 1 (xi ) 2n  exp θ log(x log( xi )

2n

x2i 2θ2

2n log( log(θθ)

x2i

2 i 2θx2



  =

 

θ

 +

θ3

  =0

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

88

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Por lo tanto

   θ2 =

b ) Para ver si θ 2 es insesg insesgado ado

 1 2n

x2i

E(θ2 ) = E   1 2n

 

 

    x2i

=

  1 2n

E(x E(x2i )

=

  1 2n

2θ2

=   θ2

 

∴ θ 2 es insesgado c ) Calc Calculamos ulamos su var varianza ianza

 

2

V(θ ) = V

     1 2n

x2i

=

  1 4n2

V(x V( x2i )

=

  1 4n2

4θ 4

  θ4 = n d ) En este caso, ECM(θ ) = V(θ ), ya que es insesgado. Como

   

θ4 l´ım ECM(θ) = l´ım ım   = 0 n→∞ n→∞ n

 

entonces el estimador encontrado es consistente en error cuadr´aatico tico medio.

3.2. 3. 2.

Es Esti tima maci ci´ on o ´n intervalar y Pruebas de Hip´ o otesis tesis

1. En un estudio de mercado se desea analiz analizar ar la pref preferen erencia cia del consumid consumidor or con respecto a dos marcas de bebidas gaseosas. Se seleccionan al azar 50 personas, se dividen en dos grupos y se les pide que clasifiquen la bebida que se les asign´o mediante una nota (X) en el rango [1,10]. Los encargados del estudio suponen que la evaluaci´on on de las bebidas es distinta, hip´ootesis tesis que quieren probar bajo dos criterios:

Criterio 1   La diferencia ser´a evaluada de acuerdo a la nota promedio que entreguen las

personas seleccionadas. Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

89

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Criterio 2  La diferencia ser´a evaluada de acuerdo a la proporci´oon n de personas que evalu´o la bebida con nota mayor a 4. Los datos del estudio se presentan a continuaci´oon: n: n   x   s x>4 Bebida A 25 6.0 2.41 9 Bebida B 25 3.84 2.01 10 a ) Determine si hay diferencias entre las bebidas seg´ u un n el Criterio 1, con un nivel de

significanc signifi cancia ia del 5 %. b ) Determine si hay diferencias entre las bebidas seg´ u un n el Criterio 2, con un nivel de

significanc signifi cancia ia del 5 %. c ) Los inve investigad stigadores ores concluir concluir´´aan n a favor de su hip´ootesis tesis s´oolo lo si los dos criterios concluyen

que hay diferencias. De acuerdo a lo anterior, ¿podemos afirmar que las bebidas obtienen una evaluaci´oon n distinta? Soluci´oon: n: a ) Las hip´ ootesis tes is de inter´eess son

 =  µ2 H 0  :   µ1  = µ H 1  :   µ1 = µ2

 

Pero primero debemos saber si las varianzas poblacionales son iguales o no. Planteamos las hip´ootesis: tesis: H 0  :

  σ12 σ22

=1

H 1  :

  σ12 σ22

=1



  s21

El estad´ııstico stico de prueba es

s22

=

2,412 2,012

 

 = 1,437

Los valores cr cr´´ıti ıticos cos son son   F 24, 24, 4,24 24,,0,975  = 2,269 24,24, 24,0,025  = 0,44 y  F 2 En esta caso, no podemos rechazar   H 0 , por lo tanto, no podemos rechazar que las varian arianzas zas poblacional poblacionales es son iguale igualess con 5 % de signifi significanci cancia. a. Como no podemos asumir que las varianzas poblacionales son distintas (ya que la evidencia no nos permiti´o rec rechazar hazar la iguald igualdad), ad), ent entonces onces realizare realizaremos mos la compa comparaci´ raci´ oon n de mediass utili media utilizando zando vari varianzas anzas p poblac oblacionale ionaless iguale iguales. s. Usamos la prueb pruebaa para diferenc diferencia ia de mediass con varian media arianzas zas desc desconocidas onocidas pero iguale iguales. s. La regla es rechazar H  rechazar  H 0   si T 0 > t ν,1 donde   ν   =  n1  + n  +  n2 ν,1−α/ α/2 2 , donde  Para calcular  calcular   T 0 , prime primero ro calcu calculamos lamos   s p2

 | |

2

  (n1

2 1

2 2

− 1)1)ss  + (n 1)ss ( n − 1) 2

2.



  24 2,412 + 24 2,012

·

·

s p  =

n1  +  + n  n2

 

−2

=

25 + 25

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

−2

 

= 4,92

 

90

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Entonces T 0  =

  6,0

− 3,84 = 4,867

2,219 y la regi´oon n cr´ııtica ti ca co con n  α  = 0,05 es  α =

 

 2 50

tν,1  = t  t25+25  =  t 48 25+25− −2,1−0,025  = t 48,,0,975  = 2,01 ν,1−α/ α/2 2  = Compara ndo el valor cr Comparando cr´´ıtico con el estad´ııstico stico de pr prueba ueba vemos qu quee lo loss da datos tos nos entregan evidencia en contra de   H 0   (rechazamos  (rechazamos   H 0 ), por lo que podem podemos os afir afirma marr co con n 5% de significancia que las calificaciones de las bebidas son distintas. b ) Bajo el segundo criterio, debemos realizar una comparaci´ oon n de proporciones. Las hip´ootete-

sis son H 0  :   p1  = p  =  p2 H 1  :   p1 =  p2

 

 | |

La regla es rechazar H  rechazar  H 0   si z 0 > z 1−α/ α/2 2 la regi´oon n de rechazo con con   α  = 0,05 est´a dada por z 1−α/  = z   z 1−0,025  = z   =  z 0,975  = 1,96 α/2 2  = y el estad estad´´ıstico de prueba z 0  =

  0,36

 

− 0,40

0,36· 36·0,64   25

+   0,425·0,6

=

−0,291

En consecuencia consecuencia,, y con una significanc significancia ia del 5 %, no podemos recha rechazar zar H   H 0 , es decir, no podemos afirmar que la cantidad de notas mayores a 4 sea distinta para cada bebida. c ) Bajo el criterio 1, las bebidas obtienen una evaluaci´o on n distinta, mientras que bajo el

criterio 2 no podemos afirmar que la proporci´oon n de notas mayores a 4 sea distinta dependiendo de la bebida, por lo que para efectos de las hip´otesis planteadas en este estudio, no podemos concluir que las bebidas obtienen una evaluaci´oon n distinta.

2. Se toman dos mue muestras stras indepen independien dientes tes para comparar las medias de dos poblacio poblaciones. nes. Muestra n   X    s A 50 57.5 6.2 B 50 5544.4 1100.6 a ) ¿Se puede concluir que, al nivel del 0.02, la media de la poblaci´ oon n A ha de ser mayor

que la de B? b ) Verifique con qu´ e valor de (1

− α) % tales va valor lores es de   n  son   son aceptables.

Solucion: Soluci on: Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

91

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

a ) Prime Primero, ro, necesita necesitamos mos saber si las varian arianzas zas poblacionale poblacionaless son iguales o disti distinta ntas. s. Par Paraa

eso, necesitamos testear las hip´ootesis tesis H 0 :  σ 12   =  σ22 H 1 :  σ 12 =  σ22

 

con   α  = 0,05. El estad con  estad´´ıstico para la comparaci´ oon n de varianzas es es   F 0   =  s 1 /s2  el cual se compara con los percentiles  percentiles   α/ α/22 y 1 α/ α/22 de la distribuci´oon n F de Fisher.



  (6 (6,,2)2   = 0,34 F 0  = (10,,6)2 (10







− −

α/2), 2), es decir, α/2) 2) ´o  F 0  > F ( n1 1, n2 1, 1 α/ Rechazamos  H 0   si Rechazamos H  si F   F 0  < F ( n1 1, n2 1, α/ basta que se cumpla una de las dos desigualdades para que rechazemos la hip´ootesis tesis nula. En este caso F (49, 52 >  > 0  0,,34 (49,59, 59,0,01)  = 0,52 F (49, (49,59, 59,0,99)  = 1,88 As´ıı,, se rech rechaza aza  H 0  y las varianzas poblacionales son distintas. Ahora testeamos las hip´ootesi t esiss de int inter´ er´eess

 ≤  ↔ µ − µ  ≤ 0  ↔ µ − µ   > 0

H 0 :  µ A µB H 1 :  µ A  > µB

A

B

A

B

Rechazamos  H 0  cuando

T 0  =

 ≤ −t

y rechazo H  rechazo  H 0   si T  si  T 0

ν,1 ν,1−α  donde

ν   =

 −

  (xA

xB )

s2A nA

−0 ∼t

ν 

  s2 + nBB

2 2 s2A   sB + nA nB 2 /n )2   (sB (s2A /nA )2 B   + nB −1 nA −1





(6,,2)2 s2A   (6 (10,,6)2   s2A   (10 = =   = 0,768 768,,   = 1,872 nA 50 nA 60 2 2 2 s2A (6 (6,,2)2 s2A (10,,6)2 (10 = = 0,589 589,, = nA 50 nA 60

   

   

As´ı,   (0 (0,,768 + 1, 1,872)2 ν   = 0,589 589//49 + 3, 3,506 506//59   6,969 = 0,0714

2

= 3,506

= 97 97,,55 Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

92

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Con  ν > 30, ocupamos la aproximaci´oon Con ν n al percentil normal. As´ı,   57 57,,5

54 54,,4

1,872 T 0  = 0,768 + 1, = 1,907

√  −





El percentil es z 1−α/ como  T 0  > z 1−α/ rechazamos  H 0  y no podemos α/2 2  = -2.326, y como T  α/2 2 , no rechazamos H  afirmar que la media de A sea mayor a la de B. b ) Debem Debemos os en encontrar contrar eell m´ıınimo nimo  α  tal que

T 0  =

−z 

1−α/ α/2 2

Entonces

P(Z <  1,  1,907) = 0, 0,9717 es decir, con (1

− α) % ≥ 0,9717 aceptamos la hip´ootesis tesis nula. ((α α  = 0,028)

3. Muc Muchos hos estu estudia diant ntes es se han quej quejado ado de que la m´ aquina aquina vendedora de refrescos A despacha menos bebidas que la m´aaquina quina B. Los siguientes son los datos de las muestras: M´aaquina quina A   n1   = 10   x1 =4.38   s21 =1.59 M´aaquina quina B   n1   = 12   x2 =5.92   s22 =0.83 a ) Construya un intervalo de confianza para la diferencia de despacho medio de cada

m´aaquina, quina, asumie asumiendo ndo

2 2 1 2 que que σ  σ   =  σ .

b ) Con α Con  α =  = 0,05, ¿Respalda la evidencia la hip´ootesis tesis de que la cantidad media despachada

por la m´aquina aquina A es menor que la despachada por la m´aaquina quina B? Asuma que las varianzas poblacionales son iguales. c ) ¿Qu´e ssuced uceder´ er´a con el intervalo de confianza en (a) si aumentamos la confianza con que

lo construimos? ¿Qu´ ¿Q u´e suced su ceder´ er´a si s´oolo lo hubi´ eeramos ramos tomado dos muestras de tama˜n noo 5? Comente d ) Determine con 95 % de confianza si las v varianzas arianzas poblacionales son efectiv efectivamente amente iguales.

Soluci´oon: n: a ) Un IC para la dife diferenc rencia ia de medias con 95 % de confianza, suponiendo suponiendo var varianzas ianzas igua iguales les

est´a dado por



 

 1

 1



(µA

µB )



(xA

xB )

± z 

s p

1−α/ α/2 2

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

nA

+

nB

 

93

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

Entonces,   (nA s p2  =

2 ( nB A  + (n

− 1)s 1)s



2 B

− 1)s 1)s

nA + nB 2   9 1,59 + 11 0,83

=

·

10 + 12   23 23,,44 = 20 = 1,172

−· 2

s p  = 1,082 El IC queda

 →  → − →−  → −  → −

(4 (4,,38

− 5,92) ± z  · 1,082 0,975

1,54

± 1,96 · 1,082 · 0,428

1,54

± 0,907

1,54

± 0,907 −

   ·   1   1  + 10 12

  

2,447; 0,633

b ) Planteamos las hip´ ootesis tesis de acuerdo a la pregunta

 ≥  ↔ µ − µ  ≥ 0  ↔ µ − µ    0

 

a ) Encon Encontrar trar el estim estimador ador m´ aaxim x imoo vero veross´ımil ımil β  β  de de   β   =   α1

 

b ) Verific erificar ar si β β   es es insesgado o no.

 

c ) Determinar si β  β  es es eficiente.

2. Usted como encar encargado gado de un depar departamen tamento to de producc producci´ i´oon n en una f´aabrica, brica, recibe un lote de 2000 piezas necesarias para la fabricaci´oon n de un art art´´ıculo y tiene la respo responsabili nsabilidad dad de aceptar o rechazar el lote, si estima que la calidad de ´eeste ste no es suficiente. a ) ¿Cu´ aantas ntas piezas decid decidee examinar para que con un nivel de confianza del 95 %, el erro errorr

que cometa en la estimaci´oon n de la proporci´oon n poblacional de piezas defectuosas no sea mayor que 0.05? Suponga que la proporci´oon n estimada fuera la m´aass desfavorable. b ) El fabric fabricant antee dice que, en este lote, no hay m´aass de 100 piezas defectuosas, ¿cu´al al ser se r´ıa el

tama˜ n noo de la muestra para que la estimaci´oon n de la verdadera proporci´oon n de defectuosas tenga un error de estimaci´oon n de 0.05? Use una confi confianz anzaa del 95 %. c ) Si dec decide ide tom tomar ar una mu muest estra ra de 100 art art´´ıcu ıculos los esc escogid ogidos os al aza azarr del lot lotee y rea realiz lizaa el

recuento de piezas defectuosas en la muestra, encontrando 4 art recuento art´´ıculos defectuosos, construyaa un int truy interv ervalo alo de confianza del 95 % para la proporc proporci´ i´oon n de defectuosas. ¿Contradice esto lo afirmado por el fabricante? 3.   a ) Sea una muestra aleatoria de tama˜n noo 15 de de   X  tal   tal que 2

 ∼ N ((0,0, σ )

X 1 , . . . , X6 

2

 ∼ N (0, (0,3, σ )

y   X 7 , . . . , X15  

1) Dete Determine rmine eell estim estimador ador de m´ aaxima xima verosimilitud de de σ  σ 2 usando la muestra de tama˜ no no 15. 2) Dem Demuestr uestree que el estimador encon encontrado trado en (a) es insesgado. b ) Una muestra de 8 ejec ejecutiv utivos os fue enviado a un curso de t´ eecnicas cnicas modernas de gesti gesti´´oon. n.

Los puntajes punta jes de rendimiento, evaluado por el jefe directo, antes y despu´eess del curso son los siguientes: Ejecutivo Ptje antes 67 75 64 72 69 82 63 60 Ptje despu´es 78 74 69 72 73 83 75 56 1) Calcu Calcule le un inter interv valo de confianz confianzaa para el puntaje medio prev previo io al curso con un 98 % de confianza. 2) Dete Determine rmine un interv intervalo alo de confian confianza za para la varianz arianzaa del puntaje posterior al curso con 95 % de con confian fianza. za.

3) ¿Es posible afirm afirmar ar que el puntaje prome promedio dio mejor mejora? a? Utilic Utilicee un 5 % de significac significaciion. Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

96

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

c ) Un banco decide estudiar las caracter´ caracter´ısticas de los clientes que llev llevan an m´aass de 3 meses sin

pagar. Para esto, estudia la relaci´oon n entre el historial del cliente y algunos indicadores, como se muestra en la siguiente tabla, la distribuci´oon n del nivel educacional y el historial de impagos anteriores

1) El banco quiere det determinar erminar si dichas variable variabless est´aan n asociadas. Plantee las hip´ootesis, tesis, la regla de rechazo y concluya con los datos entregados. 2) Reali Realice ce una pru prueba eba de hip hip´´ootesis tesis que le permit permitaa dete determinar rminar si el porcen porcentaje taje de clientes con impagos anteriores es mayor entre quienes no completaron el bachillerato que entre los que alcanzaron estudios superiores. 3) Calcu Calcule le el valor valor-p -p de la prueba realiz realizada ada en (b). ¿Es posible camb cambiar iar el valor de la significanci signifi canciaa para poder rec rechazar hazar H   H 0 ? Utilice α Utilice  α =  = 5 % 4. Sean Sean X   X 1 , . . . , Xn   una muestra aleatoria de uns distribuci´oon n de Rayleight con funci´oon n densidad dada por:   x − x2 f (x) = e 2θ , x >  0 θ a ) Muestre que E( E(X  X 2 ) = 2θ.   Sugerencia : use la sustituci´on u on  u =  = x  x2 . c ) Encuentre el EMV de θ de  θ..

n i=1

 

b ) Const Construy ruyaa un estim estimador ador insesg insesgado ado para para θ  θ  bas´aandose ndose en

X i2 .

d ) Calcule la cota de Cramer-Rao para θ para  θ,, ¿es eficiente?

Probabi Pro babilid lidad ad y E Esta stad d´ıstica ıst ica

 

97

 

Univer Uni versid sidad ad T´ ecnica ecn ica Federic Feder ico o Santa San ta Mar´ Mar´ ıa

Departament Depart amentoo d dee M Matem´ atem´aatica tic a

5. Sea X  Sea  X 1 , . . . , Xn   una muestra aleatoria con densidad f  f ((x) = β  x−(β +1) ,

·

 1 , x > 1,

β > 0

a ) Dete Determine rmine la distri distribuci´ buci´ oon n de probabilidad de de Y   Y  =  = log(X  log(X ). ). b ) Encon Encontrar trar el estim estimador ador m´ aaxim x imoo c ) Verific erificar ar si λ  es insesgado o no.

 

 1 vero veross´ımil ımil λ  λ =  = β

 

d ) Determinar si λ  es eficiente.

6. En un estudi estudioo realiz realizado ado a 32 mujer mujeres es en los ´ultimos ultimos 3 meses de embarazo se midieron niveles de ´aacido cido asc´oorbico rbico en plasma, obteni´eendose ndose los siguientes resultados:

No fum fumado adoras ras Fuma umador doras as 0.97 1.16 0.48 0.72 0.86 0.71 1.00 0.85 0.98 0.81 0.58 0.68 0.62 1.32 1.24 0.99 0.90 0.74 0.88 0.94

0.57 0.64 0.98 1.09 0.92 0.78 1.24 1.18

1.18 1.36 0.78 1.64

a ) Dete Determine rmine un inter interv valo de confia confianza nza del 95 % para la diferen diferencia cia de media medias. s. Interp Interprete rete.. b ) ¿Q ¿Qu´ u´e tam tamaan no ˜o muestral nece necesita sita para afirmar con un 95 % de confianza que las fumadoras

tienen niveles de ´aacido cido asc´orbico orbico menores a 1.00? La varianza poblacional es 0.35. 7. Un inv investig estigador ador sugiere utili utilizar zar el medic medicamen amento to   A   para aumentar la concentraci´oon n en el desarrollo de ciertas tareas. Para probar su hip´ootesis, tesis, selecciona 10 alumnos quienes rinden un test antes y despu´es es de tomar el medicamento medicamento A  A,, obten obteniendo iendo los siguie siguiente ntess punt puntajes: ajes: Antes 35 56 72 43 67 54 46 48 68 66 Despu´es 42 58 75 55 64 61 48 48 71 86 a ) Calc Calcule ule la co correl rrelaci´ aci´ oon n entre los puntajes, ¿le parece que las muestras son independientes? b ) Dete Determine rmine si al tomar el medic medicamen amento to   A  aumenta el puntaje promedio obtenido en el

test. c ) Un grupo de inve investigad stigadores ores plante planteaa que para consi considerar derar el medic medicamen amento to como efecti efectivo, vo,

el puntaje debe aumentar en al menos 10 puntos. Verifique esta hip´ootesis tesis co con n un 5 % de significancia. d ) ¿Cu´ aall es el menor valor de de   α  para el cual rechaza la hip´otesis otesis planteada en (c)?

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF