Deber 13
Short Description
Descripción: Probabilidad y estadística, ejercicios resueltos...
Description
Andrés Miniguano Trujillo ESCUELA POLITECNICA NACIONAL FACULTAD DE CIENCIAS Materia: PROBABILIDADES Y ESTADÍSTICA Deber 13: BONDAD DE AJUSTE 1. En cierta autopista existen cuatro carriles para pagar el peaje. Para determinar si los conductores tienen preferencia por ciertos carriles se observaron 1000 autos durante cierto período, obteniéndose los siguientes resultados: Carril 1 2 3 4 Autos que pagaron en ese carril 294 276 238 192 ¿Los datos presentan evidencia suficiente que indique que hay preferencia por ciertos carriles?
H 0 : p1 =p 2= p3= p 4=0.25 Carril Valores Observados Valores Esperados
1 294 235
2 276 235
3 238 235
4 192 235
940 940
Comparamos estadísticamente lo observado con lo observado:
ν =k−1=4−1=3 2 ( v i−ei ) ( 294−235 )2 ( 276−235 )2 ( 238−235 )2 ( 192−235 )2 1404 =¿ + + + = ≈ 29.8723 ei 235 235 235 235 47 4
χ 2= ∑ ¿ i=1
χ 2 > χ 2α 2 2 2 2 χ α = χ 0.05 ( 3 ) =7.8147⇒ χ > χ α No se acepta H 0 ; es decir, hay evidencia suficiente para decir que existe una preferencia por Región de Rechazo:
ciertos carriles. 2. Los estudiantes universitarios insisten regularmente que deberían tener libertad de elección cuando existen diferentes paralelos de un mismo curso o materia. En cierta facultad, el semestre anterior, se programaron siete horarios diferentes de una misma materia, con diferentes profesores. La siguiente información presenta la cantidad de estudiantes que seleccionaron cada uno de los paralelos. ¿Los datos señalan que los estudiantes tuvieron preferencia por ciertos paralelos o que fue igualmente probable su elección? Paralelo 1 2 3 4 5 6 7 Número de estudiantes 18 12 25 23 10 19 14
H 0 : p1 =p 2= p3= p 4= p5= p 6= p7= Paralelo
vi ei
1 18 17.2857
2 12 17.2857
3 25 17.2857
1 7 4 23 17.2857
5 10 17.2857
Comparamos estadísticamente lo observado con lo observado:
ν =k−1=7−1=6
6 19 17.2857
7 14 17.2857
Total 121 121
2
2
( v i−ei )
=¿
ei
(
2
2
2
2
2
2
121 121 121 121 121 121 1 12− 25− 23− 10− 19− 14− 7 7 7 7 7 7 + + + + + + 121 121 121 121 121 121 121 7 7 7 7 7 7 7
) (
18−
) (
) (
) (
) (
) (
7
χ =∑ ¿ 2
i=1
2
χ >χ ( 6 ) =12.5916 ⇒ χ 2 < χ 2α
Región de Rechazo: 2 α
χ =χ
2 0.05
2 α
No hay evidencia suficiente para decir que existe una preferencia por ciertos paralelos, es más existe evidencia estadística para afirmar que dicha elección fue realizada con misma probabilidad. 3. Entre 100 tubos al vacío utilizados en un experimento, 46 tienen vida útil de menos de 20 horas, 19 tienen vida útil de mas de 20 horas pero menos de 40, 17 tienen vida útil de mas de 40 horas pero menos de 60, 12 tienen vida útil de mas de 60 horas pero menos de 80 y 6 tienen vida útil de mas de 80 horas. Pruebe si los datos tomados se pueden considerar como una muestra de una población exponencial con media 40 horas. X : Tiempo de vida útil
H 0 : X E ( θ ) , F ( x )=1−e
−x θ −x
θ=E [ X ] =μ=40 [ h ] ⇒ F ( x )=1−e 40 Vida útil
[ 0,20 )
[ 20,40 )
[ 40,60 )
[ 60,80 )
[ 80, ∞ )
vi
46
19
17
12
6
ei
100 1−e
(
−−23 20
−1 2
−3 2
−3 2
−1 2
) ≈100 ( e −e ) ≈100 ( e −e ) ≈1008.7795 (−e 68.3363 23. (8651 e −e ) ≈100 14.4749 −1
−1
−2
Tota l 100 −23
)
20 +e−2+ e 100 ≈−15.4558
Comparamos estadísticamente lo observado con lo observado:
ν =k−m=5−1=4 2
(46−100 ( 1−e )) + (19−100 ( e ( v −e ) =¿ −−23 20
2
i
i
ei
−−23 20
) 100 (1−e
2
2
−e )) ( 17−100 ( e −e )) (12−100 ( e −e + + 100 ( e −e ) 100 ( e −e ) 100 ( e −e ) −1 2
−1 2
−1
−1
−3 2
−1
−1
−3 2 5
χ 2= ∑ ¿ i=1
χ 2 > χ 2α χ 2α = χ 20.05 ( 4 )=47.4387 ⇒ χ 2 < χ 2α
Región de Rechazo:
Aparentemente se podría considerar que la hipótesis nula no es descartable, pero hay que fijarnos en un detalle, la probabilidad del quinto valor para el tiempo de vida útil nos arroja un valor negativo, lo cual ya de por sí es imposible, luego llegando al valor de χ 2 se obtuvo un valor negativo, valor para el cual no está definida la función, en tal caso es obvio que el dato no se arroja dentro de la región de rechazo, pero por esa probabilidad negativa y ese valor de χ 2 , se puede asegurar que los datos no siguen una distribución exponencial con media de 40 [h]. 4. Durante 400 intervalos de cinco minutos se han obtenido los siguientes resultados respecto a los mensajes de radio al centro de control de un aeropuerto: Número de mensajes 0 1 2 3 4 5 6 7 8 9 10 11 12
−3 2
−3 2
−
−2
3 Frecuencias observadas
3
15
47
76
68
74
46
39
15
9
5
2
1
a) Compruebe si es posible que este proceso se pueda estudiar con una distribución de Poisson, con el parámetro igual a 5.0.
X :¿ de mensajes H 0 : X Poisson P [ X =k ] = n=400 ν =k−m=13−1=12
e−5 5 k , k ∈ Z¿ k!
# mensajes 0 1 2 3 4 5 6 7 8 9 10 11 12 Comparamos los datos: 2
( v i−ei ) ei
vi
ei
3 15 47 76 68 74 46 39 15 9 5 2 1
0.6738 3.369 8.4224 14.0374 17.5467 17.5467 14.6223 10.4445 6.5278 3.6266 1.8133 0.8242 0.5453
(3−0.6738 )2 ( 1 5−3.369 )2 ( 47−8.4224 )2 ( 76−14.0374 )2 ( 68−17.5467 )2 ( 74−17.5 =¿ + + + + + 0.6738 3.369 8.4224 14.0374 17.5467 17.546
χ 2 > χ 2α 2 2 2 2 χ α = χ 0.05 ( 12 )=21.0261 ⇒ χ > χ α
Región de Rechazo:
Existe evidencia estadística para afirmar que este proceso no se lo puede estudiar con una distribución de Poisson bajo tal parámetro. b)
Haga el mismo estudio pero sin suponer que conoce el parámetro.
X :¿ d e mensajes H 0 : X Poisson P [ X =k ] = λ desconocido, por estimar: λ=E [ X ] =μ q
e−λ λk , k ∈ Z¿ k!
´ = 1 ∑ ( x i f ( xi ) )= 1813 ≈ 4.5325≈ λ ⇒ P [ X =k ]= ^μ= X 400 i=1 400 n=400 ν =k−m=13−1=12
e
−1813 400
1813 400 k!
(
k
) ,k∈Z
¿
4
# mensajes 0 1 2 3 4 5 6 7 8 9 10 11 12 Comparamos los datos:
vi
ei
3 15 47 76 68 74 46 39 15 9 5 2 1
1.07538 4.8741 11.046 16.6887 18.91038 17.1423 12.9496 8.3848 4.75053 2.3924 1.08437 0.4468 0.2546
2
( v i−ei ) ei
=¿ ≈ 926.5386 13
χ 2= ∑ ¿ i=1
2
2
χ > χα 2 2 χ α = χ 0.05 ( 12 )=21.0261 ⇒ χ 2 > χ 2α
Región de Rechazo:
Existe evidencia estadística para afirmar que este proceso no se lo puede estudiar con una distribución de Poisson bajo el parámetro estimado. Se puede suponer que en general el proceso no se puede estimar bajo una distribución de Poisson.
5. Si el número de errores que comete una secretaria al transcribir un documento es una variable aleatoria que tiene una distribución de Poisson. Se reviso 440 transcripciones hechas por ella y arrojo los siguientes resultados:
Número de errores
Frecuencia
0
18
1
53
2
103
3
107
5
4
82
5
46
6
18
7
10
8
2
9
1
Probar si los datos de los errores se ajustan a una distribución de Poisson.
X :¿ de mensajes
e−λ λk H 0 : X Poisson P [ X =k ] = , k ∈ Z¿ k! q
1 ∑ x f ( x ) = 1341 ≈ 3.04773 ≈ λ ⇒ P [ X=k ] = 440 i=1 ( i i ) 440 ν =k−m=10−1=9 ´= ^μ= X
# mensajes 0 1 2 3 4 5 6 7 8 9 Comparamos los datos: 10
χ =∑ 2
i=1
e
−1341 440
1341 440 k!
(
k
) ,k∈Z
vi
ei
18 53 103 107 82 46 18 10 2 1
20.8853 63.6528 96.9982 98.5414 75.0818 45.7658 23.2469 10.1215 3.8559 1.85034
¿
2
( v i−e i ) ei
≈ 6.3873
χ 2 > χ 2α χ 2α = χ 20.05 ( 9 ) =16.91898⇒ χ 2< χ 2α
Región de Rechazo:
Existe evidencia estadística para afirmar que este proceso se lo puede estudiar con una distribución de Poisson.
6
6. En una empresa distribuidora de productos enlatados, en el período anterior se recibieron 8 pedidos de 16 quintales, 25 pedidos de 20 quintales, 36 pedidos de 24 quintales, 54 pedidos de 32 quintales y 65 pedidos de 38 quintales. El departamento de ventas considera que si es posible aceptar que la función de probabilidad de los pedidos de ventas es igual a:
p ( x )=
{
x−10 80 0
si x=16,20, 24, 32,38 , para otros valores de x
ν =k−m=5−1=4 ,n=188 Se estiman los valores bajo la función y se procede a comparar: # Quintales 16 20 24 32 38 5
χ 2=∑ i=1
2
( v i−e i ) ei
=
vi
ei
8 25 36 54 65
14.1 23.5 32.9 51.7 65.8
34079 ≈ 3.1389 10857
χ 2 > χ 2α χ 2α = χ 20.05 ( 4 )=9.4877⇒ χ 2 < χ 2α
Región de Rechazo:
Existe evidencia estadística para afirmar que este proceso se lo puede estudiar con la función de probabilidad propuesta. 7. Los siguientes datos, tomados al azar, representan el número de kilómetros recorridos por 50 automóviles, con 10 galones de gasolina cada uno.
299
225
185
253
257
175
232
201
281
174
240
247
221
207
155
255
261
248
125
247
156
295
163
193
118
234
187
196
282
122
158
198
268
175
273
113
248
253
259
265
242
289
197
152
221
288
123
127
134
254
7
¿Es posible asegurar que el rendimiento de los autos tiene distribución normal? Agrupando valores:
L=M −m+1=299−113+ 1=187 r
w
e=wr −L
7
27
2
8
24
5
9
21
2
10
19
3
11
17
0
12
16
5
13
15
8
Se analizará:
X ( μ , σ 2 ) , n=50, μ=215.18 , σ =
√
1037367 350
i
Intervalos de Clase
Pt. Medio
f(i)
ei
1
111.5 – 138.5
125
7
3.9747
2
138.5 – 165.5
152
5
5.0624
3
165.5 – 192.5
179
5
7.8872
8
4
192.5 – 219.5
206
6
9.6567
5
219.5 – 246.5
233
7
9.2915
6
246.5 – 273.5
260
14
7.0257
7
273.5 – 300.5
287
6
7.1016
ν =k−m=7−2=5 2
7
χ =∑ 2
( v i−e i )
≈ 12.4039
ei
i=1
χ 2 > χ 2α χ 2α = χ 20.05 ( 5 )=11.0705 ⇒ χ 2 > χ 2α
Región de Rechazo:
Existe evidencia estadística para rechazar que el rendimiento de los autos siga una distribución normal. 8. En cierto análisis sobre el tiempo de duración de un proceso se han obtenido los siguientes resultados: 65.5. 12
Intervalos Frecuencias
65.5 – 76.5 18
76.5 – 87.5 22
87.5 – 98.5 16
98.5 14
¿Es posible asegurar que el tiempo de duración tiene un comportamiento normal? Considerando: Intervalos 54.5 - 65.5. 65.5 - 76.5 76.5 - 87.5 87.5 - 98.5 98.5 – 109.5 Pts. Medios 60 71 82 93 104 Frecuencias 12 18 22 16 14
n=82, μ=
√
3373 684376 , σ= 41 3321
65.5. 12 9.9536
Intervalos
vi ei
65.5 – 76.5 18 18.2468
ν =k−m=5−2=3, n=82 5
χ =∑ 2
i=1
2
( v i−e i ) ei
≈ 2.1773
76.5 – 87.5 22 24.463
87.5 – 98.5 16 18.7513
98.5 14 10.5853
9
χ 2 > χ 2α 2 2 2 2 χ α = χ 0.05 ( 3 ) =7.8147⇒ χ < χ α
Región de Rechazo:
Existe evidencia estadística para afirmar que el tiempo de duración tenga un comportamiento normal. 9. En un análisis de laboratorio realizado sobre bloques de cierta mezcla se observaron los siguientes valores respecto a la resistencia a deformarse (en kg/cm2). Intervalos (en kg/cm2) Frecuencias 13.5 --- 22.5 12 22.5 --- 31.5 18 31.5 --- 40.5 24 40.5 --- 49.5 28 49.5 --- 58.5 26 58.5 --- 67.5 23 67.5 --- 76.5 16 ¿Se puede asegurar que la producción de este tipo de bloques tiene un comportamiento normal?. Si los resultados no permiten aceptar la normalidad, ¿Qué podría hacerse para mejorar esos resultados? Se analizará:
X ( μ , σ 2 ) , n=147, μ=
√
6991 3456283 ,σ= 147 10731
i
Intervalos de Clase
Pt. Medio
f(i)
ei
1
13.5 – 22.5
18
12
11.9543
2
22.5 – 31.5
27
18
15.3083
3
31.5 – 40.5
36
24
23.7554
4
40.5 – 49.5
45
28
28.816
5
49.5 – 58.5
54
26
27.3247
10
6
58.5 – 67.5
63
23
20.2544
7
67.5 – 76.5
82
16
19.5868
ν =k−m=7−2=5 2
7
χ =∑ 2
( v i−e i ) ei
i=1
≈ 1.60025
χ 2 > χ 2α χ 2α = χ 20.05 ( 5 )=11.0705 ⇒ χ 2 < χ 2α
Región de Rechazo:
Existe evidencia estadística para afirmar que la producción de este tipo de bloques sigue una distribución normal.
10. En una panadería se ha registrado el peso (en gramos) de los panes producidos durante 80 días, obteniéndose los siguientes resultados: 209.2 208.5 204.2 208.1 205.2 204.6 200.2 201.1 201.3 208.7 210.2 207.9 204.8 207.0 205.5 209.2 203.1 202.3 210.5 211.0 198.7 200.8 208.0 205.5 196.3 204.3 212.0 206.2 205.8 204.6 202.7 200.0 205.5 201.4 214.3 215.3 208.1 212.2 203.5 209.1 208.0 209.1 221.8 216.7 213.8 209.8 206.9 206.3 207.9 205.8 214.6 212.3 215.2 208.4 210.6 209.8 205.3 212.0 214.4 212.0 202.7 210.8 209.0 211.4 203.6 204.2 a) Construya un histograma en base a lo estipulado en clase.
200.6 210.2 207.8 215.7 216.2 212.9 212.6
209.5 206.2 205.9 212.3 211.9 207.6 212.3
Agrupando valores:
L=M −m+1=2218−1 963+1=256 r
w
6
43
i
e=wr −L 2
Intervalos de Clase
Pt. Medio
11
1
1961.5 – 2004.5
1983
2
2004.5– 2047.5
2026
3
2047.5– 2090.5
2069
4
2090.5– 2133.5
2112
5
2133.5– 2176.5
2155
6
2176.5– 2219.5
2198
Volviendo a los datos originales:
i
Intervalos de Clase
Pt. Medio
f(i)
1
196.15 – 200.45
198.3
4
2
200.45– 204.75
202.6
16
3
204.75– 209.05
206.9
26
4
209.05– 213.35
211.2
24
5
213.35– 217.65
215.5
9
6
217.65– 221.95
219.8
1
12
Histograma de Frecuencias con Datos Agrupados
b)
Determine si la producción de la panadería podría considerarse normal
Se analizará:
X ( μ , σ 2 ) , n=80, μ=
i
Intervalos de Clase
√
166423 14124511 ,σ = 800 632000
f(i)
ei
1
- ∞
– 204.75
17
19.5185
2
204.75– 209.05
26
27.3228
3
209.05– 213.35
24
22.7454
4
213.35–
10
10.4133
∞
ν =k−m=4−2=2 7
χ =∑ 2
i=1
2
( v i−e i ) ei
≈ 0.5387 2
2
χ > χα 2 2 χ α = χ 0.05 ( 2 )=5.9914 ⇒ χ 2< χ 2α
Región de Rechazo:
Existe evidencia estadística que permite decir que posiblemente a la producción hay como determinarla bajo una distribución normal.
13 11. El Departamento de Psicología, basándose en informaciones anteriores, al final del semestre antepasado, el 80% de los alumnos aprobaron todas las materias inscritas, un 10% aprobó la mitad, un 6% reprobó todas las materias y un 4% se retiro. Al final del semestre pasado el departamento selecciono a 400 alumnos, resultado 287 aprobaron todas las asignaturas, 49 aprobaron la mitad, 30 reprobaron todas las asignaturas y 34 se retiraron. ¿Podemos concluir, a raíz de los resultados, que la información del semestre antepasado se ha vuelto a repetir el semestre pasado? Categorías Todas Mitad Reprobó Retiro
vi
ei
287 49 30 34
320 40 24 16
ν =k−1=4−1=3 7
χ =∑ 2
( v i−e i ) ei
i=1
2
≈ 27.17813 2
2
χ > χα 2 2 χ α = χ 0.05 ( 3 ) =7.8147⇒ χ 2> χ 2α
Región de Rechazo:
Existe evidencia estadística que permite decir que la información del semestre pasado no se ha vuelto a repetir en el semestre pasado.
12. Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se observó el número de caras de cada serie. El número de series en los que se presentaron 0, 1, 2, 3, 4 y 5 caras se muestra en la siguiente tabla.
Número de caras
0
1
2
3
4
5
Total
frecuencia
38
144
342
287
164
25
1000
0
1
2
3
4
5
Total
vi
38
144
342
287
164
25
1000
ei
20
200
200
200
200
20
1000
Ajustar una distribución binomial
H 0 : p1 =p 2= p3= p 4= p5=0.2 Número de caras
14
0
0
Comparamos estadísticamente lo observado con lo observado:
ν =k−1=6−1=5 2 4 ( v i−e i ) 2 χ =∑ ≈ 445.17 ei i=1 2 2 Región de Rechazo: χ > χ α 2 2 2 2 χ α = χ 0.05 ( 5 )=11.0705 ⇒ χ > χ α No se acepta H 0 ; es decir, hay evidencia suficiente para decir que esta no es una muestra que siga una distribución binomial.
13.
Sea: n = 60 clientes. Variable = Tiempo de servicio (en min) Interv ¿ ¿ ¿ ¿ ¿ alo li fi 11 8 9 7 6
¿ 5
¿ 4
¿ 2
¿ 3
¿ 3
¿ 1
¿ 1
Probar si los datos de tiempos de servicio se ajustan a una distribución exponencial.
X : Tiempo de vida útil
H 0 : X E ( θ ) , F ( x )=1−e n=60,θ=E [ X ] =μ=
−x θ
59 [ h ] ⇒ F ( x ) =1−e 15
−15 x 59
vi
Intervalo li
11 8 9 7 6 5 4 2 3 3 1 1
¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ν =k−1=12−1=11 7
χ =∑ 2
i=1
2
( v i−e i ) ei
≈ 7.0465
ei 13.4695 10.4457 8.1007 6.2822 4.8719 3.7782 2.93 2.2722 1.7621 1.3666 1.0598 3.6611
15
χ 2 > χ 2α 2 2 2 2 χ α = χ 0.05 ( 11 ) =19.6751⇒ χ < χ α
Región de Rechazo:
Existe evidencia estadística que permite decir que los datos de tiempos de servicio se ajustan a una distribución exponencial.
14. De cualquier tabla de números aleatorios tome 80 con un solo dígito. Construya la tabla de frecuencias de los dígitos 0, 1, 2, ..., 9 y pruebe si la hipótesis de aleatoriedad es sostenible. Agrupando valores:
L=M −m+1=9−0+1=1 0 r
w
e=wr −L
7
2
4
8
2
6
9
2
8
10
1
0
11
1
1
12
1
2
13
1
3
16 H 0 : p1 =p 2= p3= p 4=0. 1
i
Intervalos de Clase
Pt. Medio
f(i)
ei
1
-0.5 – 0.5
0
5
8
2
0.5 – 1.5
1
7
8
3
1.5 – 2.5
2
13
8
4
2.5 – 3.5
3
15
8
5
3.5 – 4.5
4
5
8
6
4.5 – 5.5
5
7
8
7
5.5 – 6.5
6
5
8
8
7.5 – 8.5
7
6
8
9
8.5 – 9.5
8
10
8
10
9.5 – 10.5
9
7
8
ν =k−m=10−1=9 7
χ =∑ 2
i=1
2
( v i−e i ) ei
=14 2
2
χ > χα 2 2 χ α = χ 0.05 ( 9 ) =16.919⇒ χ 2< χ 2α
Región de Rechazo:
Existe evidencia estadística para rechazar que haya una aleatoriedad real entre los valores, más existe evidencia para aceptar de que la probabilidad de espera de cada valor sea la misma.
17
View more...
Comments