Deber 13

August 6, 2017 | Author: Josafat Plascencia | Category: Poisson Distribution, Statistical Theory, Statistics, Probability, Probability Theory
Share Embed Donate


Short Description

Descripción: Probabilidad y estadística, ejercicios resueltos...

Description

Andrés Miniguano Trujillo ESCUELA POLITECNICA NACIONAL FACULTAD DE CIENCIAS Materia: PROBABILIDADES Y ESTADÍSTICA Deber 13: BONDAD DE AJUSTE 1. En cierta autopista existen cuatro carriles para pagar el peaje. Para determinar si los conductores tienen preferencia por ciertos carriles se observaron 1000 autos durante cierto período, obteniéndose los siguientes resultados: Carril 1 2 3 4 Autos que pagaron en ese carril 294 276 238 192 ¿Los datos presentan evidencia suficiente que indique que hay preferencia por ciertos carriles?

H 0 : p1 =p 2= p3= p 4=0.25 Carril Valores Observados Valores Esperados

1 294 235

2 276 235

3 238 235

4 192 235

940 940

Comparamos estadísticamente lo observado con lo observado:

ν =k−1=4−1=3 2 ( v i−ei ) ( 294−235 )2 ( 276−235 )2 ( 238−235 )2 ( 192−235 )2 1404 =¿ + + + = ≈ 29.8723 ei 235 235 235 235 47 4

χ 2= ∑ ¿ i=1

χ 2 > χ 2α 2 2 2 2 χ α = χ 0.05 ( 3 ) =7.8147⇒ χ > χ α No se acepta H 0 ; es decir, hay evidencia suficiente para decir que existe una preferencia por Región de Rechazo:

ciertos carriles. 2. Los estudiantes universitarios insisten regularmente que deberían tener libertad de elección cuando existen diferentes paralelos de un mismo curso o materia. En cierta facultad, el semestre anterior, se programaron siete horarios diferentes de una misma materia, con diferentes profesores. La siguiente información presenta la cantidad de estudiantes que seleccionaron cada uno de los paralelos. ¿Los datos señalan que los estudiantes tuvieron preferencia por ciertos paralelos o que fue igualmente probable su elección? Paralelo 1 2 3 4 5 6 7 Número de estudiantes 18 12 25 23 10 19 14

H 0 : p1 =p 2= p3= p 4= p5= p 6= p7= Paralelo

vi ei

1 18 17.2857

2 12 17.2857

3 25 17.2857

1 7 4 23 17.2857

5 10 17.2857

Comparamos estadísticamente lo observado con lo observado:

ν =k−1=7−1=6

6 19 17.2857

7 14 17.2857

Total 121 121

2

2

( v i−ei )

=¿

ei

(

2

2

2

2

2

2

121 121 121 121 121 121 1 12− 25− 23− 10− 19− 14− 7 7 7 7 7 7 + + + + + + 121 121 121 121 121 121 121 7 7 7 7 7 7 7

) (

18−

) (

) (

) (

) (

) (

7

χ =∑ ¿ 2

i=1

2

χ >χ ( 6 ) =12.5916 ⇒ χ 2 < χ 2α

Región de Rechazo: 2 α

χ =χ

2 0.05

2 α

No hay evidencia suficiente para decir que existe una preferencia por ciertos paralelos, es más existe evidencia estadística para afirmar que dicha elección fue realizada con misma probabilidad. 3. Entre 100 tubos al vacío utilizados en un experimento, 46 tienen vida útil de menos de 20 horas, 19 tienen vida útil de mas de 20 horas pero menos de 40, 17 tienen vida útil de mas de 40 horas pero menos de 60, 12 tienen vida útil de mas de 60 horas pero menos de 80 y 6 tienen vida útil de mas de 80 horas. Pruebe si los datos tomados se pueden considerar como una muestra de una población exponencial con media 40 horas. X : Tiempo de vida útil

H 0 : X E ( θ ) , F ( x )=1−e

−x θ −x

θ=E [ X ] =μ=40 [ h ] ⇒ F ( x )=1−e 40 Vida útil

[ 0,20 )

[ 20,40 )

[ 40,60 )

[ 60,80 )

[ 80, ∞ )

vi

46

19

17

12

6

ei

100 1−e

(

−−23 20

−1 2

−3 2

−3 2

−1 2

) ≈100 ( e −e ) ≈100 ( e −e ) ≈1008.7795 (−e 68.3363 23. (8651 e −e ) ≈100 14.4749 −1

−1

−2

Tota l 100 −23

)

20 +e−2+ e 100 ≈−15.4558

Comparamos estadísticamente lo observado con lo observado:

ν =k−m=5−1=4 2

(46−100 ( 1−e )) + (19−100 ( e ( v −e ) =¿ −−23 20

2

i

i

ei

−−23 20

) 100 (1−e

2

2

−e )) ( 17−100 ( e −e )) (12−100 ( e −e + + 100 ( e −e ) 100 ( e −e ) 100 ( e −e ) −1 2

−1 2

−1

−1

−3 2

−1

−1

−3 2 5

χ 2= ∑ ¿ i=1

χ 2 > χ 2α χ 2α = χ 20.05 ( 4 )=47.4387 ⇒ χ 2 < χ 2α

Región de Rechazo:

Aparentemente se podría considerar que la hipótesis nula no es descartable, pero hay que fijarnos en un detalle, la probabilidad del quinto valor para el tiempo de vida útil nos arroja un valor negativo, lo cual ya de por sí es imposible, luego llegando al valor de χ 2 se obtuvo un valor negativo, valor para el cual no está definida la función, en tal caso es obvio que el dato no se arroja dentro de la región de rechazo, pero por esa probabilidad negativa y ese valor de χ 2 , se puede asegurar que los datos no siguen una distribución exponencial con media de 40 [h]. 4. Durante 400 intervalos de cinco minutos se han obtenido los siguientes resultados respecto a los mensajes de radio al centro de control de un aeropuerto: Número de mensajes 0 1 2 3 4 5 6 7 8 9 10 11 12

−3 2

−3 2



−2

3 Frecuencias observadas

3

15

47

76

68

74

46

39

15

9

5

2

1

a) Compruebe si es posible que este proceso se pueda estudiar con una distribución de Poisson, con el parámetro igual a 5.0.

X :¿ de mensajes H 0 : X Poisson P [ X =k ] = n=400 ν =k−m=13−1=12

e−5 5 k , k ∈ Z¿ k!

# mensajes 0 1 2 3 4 5 6 7 8 9 10 11 12 Comparamos los datos: 2

( v i−ei ) ei

vi

ei

3 15 47 76 68 74 46 39 15 9 5 2 1

0.6738 3.369 8.4224 14.0374 17.5467 17.5467 14.6223 10.4445 6.5278 3.6266 1.8133 0.8242 0.5453

(3−0.6738 )2 ( 1 5−3.369 )2 ( 47−8.4224 )2 ( 76−14.0374 )2 ( 68−17.5467 )2 ( 74−17.5 =¿ + + + + + 0.6738 3.369 8.4224 14.0374 17.5467 17.546

χ 2 > χ 2α 2 2 2 2 χ α = χ 0.05 ( 12 )=21.0261 ⇒ χ > χ α

Región de Rechazo:

Existe evidencia estadística para afirmar que este proceso no se lo puede estudiar con una distribución de Poisson bajo tal parámetro. b)

Haga el mismo estudio pero sin suponer que conoce el parámetro.

X :¿ d e mensajes H 0 : X Poisson P [ X =k ] = λ desconocido, por estimar: λ=E [ X ] =μ q

e−λ λk , k ∈ Z¿ k!

´ = 1 ∑ ( x i f ( xi ) )= 1813 ≈ 4.5325≈ λ ⇒ P [ X =k ]= ^μ= X 400 i=1 400 n=400 ν =k−m=13−1=12

e

−1813 400

1813 400 k!

(

k

) ,k∈Z

¿

4

# mensajes 0 1 2 3 4 5 6 7 8 9 10 11 12 Comparamos los datos:

vi

ei

3 15 47 76 68 74 46 39 15 9 5 2 1

1.07538 4.8741 11.046 16.6887 18.91038 17.1423 12.9496 8.3848 4.75053 2.3924 1.08437 0.4468 0.2546

2

( v i−ei ) ei

=¿ ≈ 926.5386 13

χ 2= ∑ ¿ i=1

2

2

χ > χα 2 2 χ α = χ 0.05 ( 12 )=21.0261 ⇒ χ 2 > χ 2α

Región de Rechazo:

Existe evidencia estadística para afirmar que este proceso no se lo puede estudiar con una distribución de Poisson bajo el parámetro estimado. Se puede suponer que en general el proceso no se puede estimar bajo una distribución de Poisson.

5. Si el número de errores que comete una secretaria al transcribir un documento es una variable aleatoria que tiene una distribución de Poisson. Se reviso 440 transcripciones hechas por ella y arrojo los siguientes resultados:

Número de errores

Frecuencia

0

18

1

53

2

103

3

107

5

4

82

5

46

6

18

7

10

8

2

9

1

Probar si los datos de los errores se ajustan a una distribución de Poisson.

X :¿ de mensajes

e−λ λk H 0 : X Poisson P [ X =k ] = , k ∈ Z¿ k! q

1 ∑ x f ( x ) = 1341 ≈ 3.04773 ≈ λ ⇒ P [ X=k ] = 440 i=1 ( i i ) 440 ν =k−m=10−1=9 ´= ^μ= X

# mensajes 0 1 2 3 4 5 6 7 8 9 Comparamos los datos: 10

χ =∑ 2

i=1

e

−1341 440

1341 440 k!

(

k

) ,k∈Z

vi

ei

18 53 103 107 82 46 18 10 2 1

20.8853 63.6528 96.9982 98.5414 75.0818 45.7658 23.2469 10.1215 3.8559 1.85034

¿

2

( v i−e i ) ei

≈ 6.3873

χ 2 > χ 2α χ 2α = χ 20.05 ( 9 ) =16.91898⇒ χ 2< χ 2α

Región de Rechazo:

Existe evidencia estadística para afirmar que este proceso se lo puede estudiar con una distribución de Poisson.

6

6. En una empresa distribuidora de productos enlatados, en el período anterior se recibieron 8 pedidos de 16 quintales, 25 pedidos de 20 quintales, 36 pedidos de 24 quintales, 54 pedidos de 32 quintales y 65 pedidos de 38 quintales. El departamento de ventas considera que si es posible aceptar que la función de probabilidad de los pedidos de ventas es igual a:

p ( x )=

{

x−10 80 0

si x=16,20, 24, 32,38 , para otros valores de x

ν =k−m=5−1=4 ,n=188 Se estiman los valores bajo la función y se procede a comparar: # Quintales 16 20 24 32 38 5

χ 2=∑ i=1

2

( v i−e i ) ei

=

vi

ei

8 25 36 54 65

14.1 23.5 32.9 51.7 65.8

34079 ≈ 3.1389 10857

χ 2 > χ 2α χ 2α = χ 20.05 ( 4 )=9.4877⇒ χ 2 < χ 2α

Región de Rechazo:

Existe evidencia estadística para afirmar que este proceso se lo puede estudiar con la función de probabilidad propuesta. 7. Los siguientes datos, tomados al azar, representan el número de kilómetros recorridos por 50 automóviles, con 10 galones de gasolina cada uno.

299

225

185

253

257

175

232

201

281

174

240

247

221

207

155

255

261

248

125

247

156

295

163

193

118

234

187

196

282

122

158

198

268

175

273

113

248

253

259

265

242

289

197

152

221

288

123

127

134

254

7

¿Es posible asegurar que el rendimiento de los autos tiene distribución normal? Agrupando valores:

L=M −m+1=299−113+ 1=187 r

w

e=wr −L

7

27

2

8

24

5

9

21

2

10

19

3

11

17

0

12

16

5

13

15

8

Se analizará:

X ( μ , σ 2 ) , n=50, μ=215.18 , σ =



1037367 350

i

Intervalos de Clase

Pt. Medio

f(i)

ei

1

111.5 – 138.5

125

7

3.9747

2

138.5 – 165.5

152

5

5.0624

3

165.5 – 192.5

179

5

7.8872

8

4

192.5 – 219.5

206

6

9.6567

5

219.5 – 246.5

233

7

9.2915

6

246.5 – 273.5

260

14

7.0257

7

273.5 – 300.5

287

6

7.1016

ν =k−m=7−2=5 2

7

χ =∑ 2

( v i−e i )

≈ 12.4039

ei

i=1

χ 2 > χ 2α χ 2α = χ 20.05 ( 5 )=11.0705 ⇒ χ 2 > χ 2α

Región de Rechazo:

Existe evidencia estadística para rechazar que el rendimiento de los autos siga una distribución normal. 8. En cierto análisis sobre el tiempo de duración de un proceso se han obtenido los siguientes resultados:  65.5. 12

Intervalos Frecuencias

65.5 – 76.5 18

76.5 – 87.5 22

87.5 – 98.5 16

98.5  14

¿Es posible asegurar que el tiempo de duración tiene un comportamiento normal? Considerando: Intervalos 54.5 - 65.5. 65.5 - 76.5 76.5 - 87.5 87.5 - 98.5 98.5 – 109.5 Pts. Medios 60 71 82 93 104 Frecuencias 12 18 22 16 14

n=82, μ=



3373 684376 , σ= 41 3321

 65.5. 12 9.9536

Intervalos

vi ei

65.5 – 76.5 18 18.2468

ν =k−m=5−2=3, n=82 5

χ =∑ 2

i=1

2

( v i−e i ) ei

≈ 2.1773

76.5 – 87.5 22 24.463

87.5 – 98.5 16 18.7513

98.5  14 10.5853

9

χ 2 > χ 2α 2 2 2 2 χ α = χ 0.05 ( 3 ) =7.8147⇒ χ < χ α

Región de Rechazo:

Existe evidencia estadística para afirmar que el tiempo de duración tenga un comportamiento normal. 9. En un análisis de laboratorio realizado sobre bloques de cierta mezcla se observaron los siguientes valores respecto a la resistencia a deformarse (en kg/cm2). Intervalos (en kg/cm2) Frecuencias 13.5 --- 22.5 12 22.5 --- 31.5 18 31.5 --- 40.5 24 40.5 --- 49.5 28 49.5 --- 58.5 26 58.5 --- 67.5 23 67.5 --- 76.5 16 ¿Se puede asegurar que la producción de este tipo de bloques tiene un comportamiento normal?. Si los resultados no permiten aceptar la normalidad, ¿Qué podría hacerse para mejorar esos resultados? Se analizará:

X ( μ , σ 2 ) , n=147, μ=



6991 3456283 ,σ= 147 10731

i

Intervalos de Clase

Pt. Medio

f(i)

ei

1

13.5 – 22.5

18

12

11.9543

2

22.5 – 31.5

27

18

15.3083

3

31.5 – 40.5

36

24

23.7554

4

40.5 – 49.5

45

28

28.816

5

49.5 – 58.5

54

26

27.3247

10

6

58.5 – 67.5

63

23

20.2544

7

67.5 – 76.5

82

16

19.5868

ν =k−m=7−2=5 2

7

χ =∑ 2

( v i−e i ) ei

i=1

≈ 1.60025

χ 2 > χ 2α χ 2α = χ 20.05 ( 5 )=11.0705 ⇒ χ 2 < χ 2α

Región de Rechazo:

Existe evidencia estadística para afirmar que la producción de este tipo de bloques sigue una distribución normal.

10. En una panadería se ha registrado el peso (en gramos) de los panes producidos durante 80 días, obteniéndose los siguientes resultados: 209.2 208.5 204.2 208.1 205.2 204.6 200.2 201.1 201.3 208.7 210.2 207.9 204.8 207.0 205.5 209.2 203.1 202.3 210.5 211.0 198.7 200.8 208.0 205.5 196.3 204.3 212.0 206.2 205.8 204.6 202.7 200.0 205.5 201.4 214.3 215.3 208.1 212.2 203.5 209.1 208.0 209.1 221.8 216.7 213.8 209.8 206.9 206.3 207.9 205.8 214.6 212.3 215.2 208.4 210.6 209.8 205.3 212.0 214.4 212.0 202.7 210.8 209.0 211.4 203.6 204.2 a) Construya un histograma en base a lo estipulado en clase.

200.6 210.2 207.8 215.7 216.2 212.9 212.6

209.5 206.2 205.9 212.3 211.9 207.6 212.3

Agrupando valores:

L=M −m+1=2218−1 963+1=256 r

w

6

43

i

e=wr −L 2

Intervalos de Clase

Pt. Medio

11

1

1961.5 – 2004.5

1983

2

2004.5– 2047.5

2026

3

2047.5– 2090.5

2069

4

2090.5– 2133.5

2112

5

2133.5– 2176.5

2155

6

2176.5– 2219.5

2198

Volviendo a los datos originales:

i

Intervalos de Clase

Pt. Medio

f(i)

1

196.15 – 200.45

198.3

4

2

200.45– 204.75

202.6

16

3

204.75– 209.05

206.9

26

4

209.05– 213.35

211.2

24

5

213.35– 217.65

215.5

9

6

217.65– 221.95

219.8

1

12

Histograma de Frecuencias con Datos Agrupados

b)

Determine si la producción de la panadería podría considerarse normal

Se analizará:

X ( μ , σ 2 ) , n=80, μ=

i

Intervalos de Clase



166423 14124511 ,σ = 800 632000

f(i)

ei

1

- ∞

– 204.75

17

19.5185

2

204.75– 209.05

26

27.3228

3

209.05– 213.35

24

22.7454

4

213.35–

10

10.4133



ν =k−m=4−2=2 7

χ =∑ 2

i=1

2

( v i−e i ) ei

≈ 0.5387 2

2

χ > χα 2 2 χ α = χ 0.05 ( 2 )=5.9914 ⇒ χ 2< χ 2α

Región de Rechazo:

Existe evidencia estadística que permite decir que posiblemente a la producción hay como determinarla bajo una distribución normal.

13 11. El Departamento de Psicología, basándose en informaciones anteriores, al final del semestre antepasado, el 80% de los alumnos aprobaron todas las materias inscritas, un 10% aprobó la mitad, un 6% reprobó todas las materias y un 4% se retiro. Al final del semestre pasado el departamento selecciono a 400 alumnos, resultado 287 aprobaron todas las asignaturas, 49 aprobaron la mitad, 30 reprobaron todas las asignaturas y 34 se retiraron. ¿Podemos concluir, a raíz de los resultados, que la información del semestre antepasado se ha vuelto a repetir el semestre pasado? Categorías Todas Mitad Reprobó Retiro

vi

ei

287 49 30 34

320 40 24 16

ν =k−1=4−1=3 7

χ =∑ 2

( v i−e i ) ei

i=1

2

≈ 27.17813 2

2

χ > χα 2 2 χ α = χ 0.05 ( 3 ) =7.8147⇒ χ 2> χ 2α

Región de Rechazo:

Existe evidencia estadística que permite decir que la información del semestre pasado no se ha vuelto a repetir en el semestre pasado.

12. Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se observó el número de caras de cada serie. El número de series en los que se presentaron 0, 1, 2, 3, 4 y 5 caras se muestra en la siguiente tabla.

Número de caras

0

1

2

3

4

5

Total

frecuencia

38

144

342

287

164

25

1000

0

1

2

3

4

5

Total

vi

38

144

342

287

164

25

1000

ei

20

200

200

200

200

20

1000

Ajustar una distribución binomial

H 0 : p1 =p 2= p3= p 4= p5=0.2 Número de caras

14

0

0

Comparamos estadísticamente lo observado con lo observado:

ν =k−1=6−1=5 2 4 ( v i−e i ) 2 χ =∑ ≈ 445.17 ei i=1 2 2 Región de Rechazo: χ > χ α 2 2 2 2 χ α = χ 0.05 ( 5 )=11.0705 ⇒ χ > χ α No se acepta H 0 ; es decir, hay evidencia suficiente para decir que esta no es una muestra que siga una distribución binomial.

13.

Sea: n = 60 clientes. Variable = Tiempo de servicio (en min) Interv ¿ ¿ ¿ ¿ ¿ alo li fi 11 8 9 7 6

¿ 5

¿ 4

¿ 2

¿ 3

¿ 3

¿ 1

¿ 1

Probar si los datos de tiempos de servicio se ajustan a una distribución exponencial.

X : Tiempo de vida útil

H 0 : X E ( θ ) , F ( x )=1−e n=60,θ=E [ X ] =μ=

−x θ

59 [ h ] ⇒ F ( x ) =1−e 15

−15 x 59

vi

Intervalo li

11 8 9 7 6 5 4 2 3 3 1 1

¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ν =k−1=12−1=11 7

χ =∑ 2

i=1

2

( v i−e i ) ei

≈ 7.0465

ei 13.4695 10.4457 8.1007 6.2822 4.8719 3.7782 2.93 2.2722 1.7621 1.3666 1.0598 3.6611

15

χ 2 > χ 2α 2 2 2 2 χ α = χ 0.05 ( 11 ) =19.6751⇒ χ < χ α

Región de Rechazo:

Existe evidencia estadística que permite decir que los datos de tiempos de servicio se ajustan a una distribución exponencial.

14. De cualquier tabla de números aleatorios tome 80 con un solo dígito. Construya la tabla de frecuencias de los dígitos 0, 1, 2, ..., 9 y pruebe si la hipótesis de aleatoriedad es sostenible. Agrupando valores:

L=M −m+1=9−0+1=1 0 r

w

e=wr −L

7

2

4

8

2

6

9

2

8

10

1

0

11

1

1

12

1

2

13

1

3

16 H 0 : p1 =p 2= p3= p 4=0. 1

i

Intervalos de Clase

Pt. Medio

f(i)

ei

1

-0.5 – 0.5

0

5

8

2

0.5 – 1.5

1

7

8

3

1.5 – 2.5

2

13

8

4

2.5 – 3.5

3

15

8

5

3.5 – 4.5

4

5

8

6

4.5 – 5.5

5

7

8

7

5.5 – 6.5

6

5

8

8

7.5 – 8.5

7

6

8

9

8.5 – 9.5

8

10

8

10

9.5 – 10.5

9

7

8

ν =k−m=10−1=9 7

χ =∑ 2

i=1

2

( v i−e i ) ei

=14 2

2

χ > χα 2 2 χ α = χ 0.05 ( 9 ) =16.919⇒ χ 2< χ 2α

Región de Rechazo:

Existe evidencia estadística para rechazar que haya una aleatoriedad real entre los valores, más existe evidencia para aceptar de que la probabilidad de espera de cada valor sea la misma.

17

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF