Soluciones Actividades de estadística y probabilidad HÉCTOR GONZÁLEZ.pdf
Short Description
Download Soluciones Actividades de estadística y probabilidad HÉCTOR GONZÁLEZ.pdf...
Description
SOLUCIÓN ACTIVIDADES DE ESTADÍSTICA
1. Las edades de los estudiantes de un curso de informática son: 17 17 18 19 18 20 20 17 18 18 19 19 21 20 21 19 18 18 19 21 20 18 17 17 21 20 20 19 20 18 a) Haz una tabla de frecuencias y representa los datos con un diagrama de barras.
Xi
ni
17 18 19 20 21
fi
5 8 6 7 4
Ni
0.17 0.27 0.2 0.23 0.13
5 13 19 26 30
Fi 0.17 0.44 0.64 0.87 1
b) Calcula la media y la desviación típica. 𝑥̅ =
∑ 𝑥𝑖 . 𝑛𝑖 17 · 5 + 18 · 8 + 19 · 6 + 20 · 7 + 21 · 4 567 = = = 18.9 𝑎ñ𝑜𝑠 𝑁 30 30
∑𝑛 𝑛𝑖 𝑥𝑖2 172 · 5 + 182 · 8 + 192 · 6 + 202 · 7 + 212 · 4 𝑠=√ 1 − 𝑥̅ 2 = √ − (18,9)2 = √1,69 𝑁 30 = 1,3 𝑎ñ𝑜𝑠
2. En una clínica infantil se han ido anotando, durante un mes, el número de metros que andan los niños, seguidos y sin caerse, el primer día que comienzan a andar. Se obtuvo así la tabla de observación siguiente:
Metros: Niños:
1 2
2 6
3 10
4 5
5 10
6 3
7 2
8 2
Se desea realizar: a) La tabla de distribución de frecuencias. xi
ni
1 2 3 4 5 6 7 8
fi
2 6 10 5 10 3 2 2
0.05 0.15 0.25 0.125 0.25 0.075 0.05 0.05
Ni 2 8 18 23 33 36 38 40
Fi 0.05 0.2 0.45 0.575 0.825 0.9 0.95 1
b) Las medidas de tendencia central o centralización 𝑥̅ =
∑ 𝑥𝑖 . 𝑛𝑖 1 · 2 + 2 · 6 + 3 · 10 + 4 · 5 + 5 · 10 + 6 · 3 + 7 · 2 + 8 · 2 162 = = 𝑁 40 40 = 4,05 𝑚. 𝑋𝑀𝑒 ⇒
𝑁𝑖=23 𝑁 40 = = 20 ⇒ 𝑋𝑀𝑒 = 4 𝑚. 2 2
𝑋𝑀𝑜 ⇒ 𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐵𝑖𝑚𝑜𝑑𝑎𝑙 {
𝑋𝑀𝑜 = 3 𝑚. 𝑋𝑀𝑜 = 5 𝑚.
c) Las medidas de dispersión 𝑅𝑒 = |8 − 1| = 7 𝑚. 𝑠2 = 𝑠2 =
∑𝑛1 𝑛𝑖 𝑥𝑖2 − 𝑥̅ 2 𝑁
12 · 2 + 22 · 6 + 32 · 10 + 42 · 5 + 52 · 10 + 62 · 3 + 72 · 2 + 82 · 2 − (4,05)2 40 = 19,5 − 16,4 = 3,1 𝑚2 𝑠 = √𝑠 2 = √3,1 = 1,76 𝑚. 𝐶. 𝑉 =
𝑠 1,76 = = 0,43 𝑥̅ 4,05
d) El tercer cuartil, el séptimo decil y el percentil 68. Q3 :
3·𝑁 4
=
3·40 4
𝑁𝑖 =33
= 30 ⇒
𝑄3 = 5
D7:
7·𝑁 10
P68:
68·𝑁 100
=
7·40 10
=
𝑁𝑖 =33
= 28 ⇒
68·40 100
𝐷7 = 5
𝑁𝑖 =33
= 27,2 ⇒
𝑃68 = 5
3. Realizando una prueba para el estudio de cáncer a 150 personas se obtuvo la siguiente tabla, según la edad:
Edades [10-30) [30-40) [40-50) [50-60) [60-90)
Personas 15 22 48 40 25
Se desea realizar: a) La tabla de distribución de frecuencias
Edades [10-30) [30-40) [40-50) [50-60) [60-90)
𝑥𝑖 20 35 45 55 75
Personas(𝑛𝑖 ) 15 22 48 40 25
𝑓𝑖 0,1 0,15 0,32 0,27 0,17
𝑁𝑖 15 37 85 125 150
𝐹𝑖 0,1 0,25 0,57 0,84 1
c) La media 𝑥̅ =
20 · 15 + 35 · 22 + 45 · 48 + 55 · 40 + 75 · 25 7305 = = 48,7 𝑎ñ𝑜𝑠 150 150
d) Las medidas de dispersión: varianza, desviación típica, coeficiente de variación y el recorrido. 𝑠2 =
202 · 15 + 352 · 22 + 452 · 48 + 552 · 40 + 752 · 25 − (48,7)2 150 = 240,14 𝑎ñ𝑜𝑠 2 𝑠 = √240,14 = 15,50 𝑎ñ𝑜𝑠 15,50 𝐶. 𝑉. = = 0,32 48,7 𝑅𝑒 = 90 − 10 = 80𝑎ñ𝑜𝑠
4. Se quiere estudiar el aumento comparativo entre la población reclusa de hombres y la de mujeres
Reclusos varones 36419 36292 36270 36816 36983 36926 37292 37802 37969 38209 38708 39138
Reclusos mujeres 3130 3131 3085 3122 3167 3146 3219 3257 3304 3288 3310 3368
a) Halla el rango o recorrido de las dos series de datos. ¿Sirve este dato para comparar ambas poblaciones? ¿Qué parámetro de dispersión consideras más adecuado? Ordenamos los datos en dos tablas diferentes.
VARONES 𝑥𝑖 36270 36292 36419 36816 36926 36983 37292 37802 37969 38209 38708 39138
𝑛𝑖 1 1 1 1 1 1 1 1 1 1 1 1
𝑅𝑒𝑣𝑎𝑟𝑜𝑛𝑒𝑠 = |39138 − 36270| = 2868 𝑟𝑒𝑐𝑙𝑢𝑠𝑜𝑠
MUJERES 𝑥𝑖 3085 3122 3130 3131 3146 3167 3219 3257 3288 3304 3310 3368
𝑛𝑖 1 1 1 1 1 1 1 1 1 1 1 1
𝑅𝑒𝑚𝑢𝑗𝑒𝑟𝑒𝑠 = |3368 − 3085| = 283 𝑟𝑒𝑐𝑙𝑢𝑠𝑎𝑠
Cuanto menor es el valor del rango o recorrido de un conjunto de datos, mayor es la centralización, y por lo tanto, la representatividad de las medidas de centralización es mayor. En este ejercicio observamos que la diferencia de rangos entre las dos poblaciones es muy diferente por lo que no servirá para comparar las dos poblaciones. El parámetro más adecuado en estos casos es el Coeficiente de Variación. b) Calcula la varianza. ¿En qué unidades está? 36270 + 36292 + 36419 + 36816 + 36926 + ⋯ + 39138 12 = 37402 𝑟𝑒𝑐𝑙𝑢𝑠𝑜𝑠 367202 + 362922 + 364192 + ⋯ + 391382 2 𝑠𝑣𝑎𝑟𝑜𝑛𝑒𝑠 = − (37402)2 = 12 = 840793 𝑟𝑒𝑐𝑙𝑢𝑠𝑜𝑠 2 3085 + 3122 + 3130 + ⋯ + 3368 𝑥̅𝑚𝑢𝑗𝑒𝑟𝑒𝑠 = = 3210,58 𝑟𝑒𝑐𝑙𝑢𝑠𝑎𝑠 12 30852 + 31222 + 31302 + ⋯ + 33682 2 𝑠𝑚𝑢𝑗𝑒𝑟𝑒𝑠 = − (3210,58)2 = 12 = 7843,74 𝑟𝑒𝑐𝑙𝑢𝑠𝑎𝑠 2 𝑥̅𝑣𝑎𝑟𝑜𝑛𝑒𝑠 =
c) Halla la desviación típica y el coeficiente de variación. ¿En qué unidades están? ¿Cuál de los dos valores medios es más representativo? 𝑠𝑣𝑎𝑟𝑜𝑛𝑒𝑠 = √840793 = 916,95 𝑟𝑒𝑐𝑙𝑢𝑠𝑜𝑠 916,95 𝐶. 𝑉.𝑣𝑎𝑟𝑜𝑛𝑒𝑠 = = 0,024(𝑎𝑑𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛𝑎𝑙) 37402 𝑠𝑚𝑢𝑗𝑒𝑟𝑒𝑠 = √7843,74 = 88,56 𝑟𝑒𝑐𝑙𝑢𝑠𝑎𝑠
𝐶. 𝑉.𝑚𝑢𝑗𝑒𝑟𝑒𝑠 =
88,56 = 0,028(𝑎𝑑𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛𝑎𝑙) 3210,58
Es más representativo el Coeficiente de Variación ya que es el que se utiliza para comparar dos poblaciones y el más representativo es el de los hombres reclusos ya que es menor.
5. La Oficina de Información y Turismo de una ciudad ha hecho un estudio sobre sus establecimientos hoteleros, agrupándolos según el número de plazas que poseen y ha obtenido: Plazas que poseen [0,100) [100,200) [200,300) [300,400) [400,500) [500,600) [600,700) [700,800) [800,900) [900,1000)
Número de hoteles 25 37 12 10 22 21 13 5 3 2
a) ¿Cuántos hoteles tienen entre 400 y 600 plazas? ¿Qué porcentaje representan? Entre 400 y 600 plazas el número de hoteles será: 22+41=43 hoteles. 43 %= · 100 = 28,67% 150 b) ¿Cuál es el porcentaje de establecimientos que tienen entre 100 y 500 plazas? Entre 100 y 500 plazas, el número de hoteles será: 37+12+10+22=81 hoteles 81 %= · 100 = 54% 150 c) ¿Qué número de hoteles representa el 25% de los hoteles? 𝑥
25% = 150 · 100 ; 150·25=100𝑥 ; 3750=100𝑥; 𝑥 = 37,5 ℎ𝑜𝑡𝑒𝑙𝑒𝑠 d) ¿Cuál es el número medio de plazas que poseen los hoteles de dicha ciudad? Plazas que poseen
𝑥𝑖
[0,100) [100,200) [200,300) [300,400) [400,500) [500,600) [600,700) [700,800) [800,900) [900,1000)
50 150 250 350 450 550 650 750 850 950
Número de hoteles(𝑛𝑖 ) 25 37 12 10 22 21 13 5 3 2
𝑁𝑖 25 62 74 84 106 127 140 145 148 150
𝑥̅ =
50 · 25 + 150 · 37 + 250 · 12 + ⋯ + 950 · 2 = 342,67 𝑝𝑙𝑎𝑧𝑎𝑠 150
e) ¿Qué significa el número 37 de la segunda columna? ¿Se relaciona con alguna medida de centralización? El número de hoteles con un número de plazas entre 100 y 200. Se relaciona con la Moda. f)
Halla el intervalo mediano y el intervalo modal 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑀𝑒𝑑𝑖𝑎𝑛𝑜 ⇒
𝑁𝑖=84 𝑁 150 = = 75 ⇒ 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑀𝑒𝑑𝑖𝑎𝑛𝑜 = [300 − 400[ 2 2 𝑛𝑖=37
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑀𝑜𝑑𝑎𝑙 ⇒
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑀𝑜𝑑𝑎𝑙 = [100 − 200[
6. Se selecciona al azar una carta de una baraja española (40 cartas y 4 palos). Se desea la probabilidad de los sucesos siguientes al realizar una extracción: a) De salir un oro. 𝑃(𝐴) =
10 1 = 40 4
𝑃(𝐵) =
12 3 = 40 10
𝑃(𝐶) =
4 1 = 40 10
b) De salir una figura.
c) De salir un caballo.
d) Del suceso: A-B. 𝑃(𝐴 − 𝐵) =
10 − 3 7 = 40 40
e) Del suceso: A∩B. 𝑃(𝐴 ∩ 𝐵) =
3 40
19
f) Del suceso: A∪B. 𝑃(𝐴 ∪ 𝐵) = 40 g) Del suceso contrario de A. 𝑃(𝐴̅) = 1 − 𝑃(𝐴) = 1 −
10 3 = 40 4
h) De salir el as de oros al realizar 20 extracciones. 1
1
1
1
1 20
1
Con reemplazamiento: 𝑃(𝐻) = 40 · 40 · 40 · 40 ··· 40 = (40) 1
0
0
0
Sin reemplazamiento: 𝑃(𝐻) = 40 · 39 · 38 · 37 = 0 i) De salir un siete al realizar 10 extracciones. 4
4
4
4
1 10
Con reemplazamiento: 𝑃(𝐼) = 40 · 40 · 40 ··· 40 = (10) 4
3
2
1
0
Sin reemplazamiento:𝑃(𝐼) = 40 · 39 · 38 · 37 · 36 ···= 0
NOTA: Los apartados h, i tienen diferentes interpretaciones. Los resultados que se dan corresponden a interpretar que los enunciados piden que salga el as de oros en todas las extracciones para el apartado h, o que salga un 7 en todas las extracciones para el apartado i. Las demás interpretaciones suponen tener en cuenta muchos más casos posibles, que excede del nivel exigido en este curso. 7. En un experimento obtenemos que: a) P(A)= 0,1 P (B)= 0,1 P (AUB)= 0,11. ¿Cómo son los sucesos A y B? Calcula su intersección. 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) 0,11 = 0,1 + 0,1 − 𝑃(𝐴 ∩ 𝐵) 𝑃(𝐴 ∩ 𝐵) = 0,1 + 0,1 − 0,11 𝑃(𝐴 ∩ 𝐵) = 0,09 Son sucesos compatibles porque 𝑃(𝐴 ∩ 𝐵) = 0.09 ≠ 0 Son sucesos dependientes porque 𝑃(𝐴 ∩ 𝐵) = 0,09 𝑃(𝐴) · 𝑃(𝐵) = 0,1 · 0,1 = 0,01 𝑃(𝐴 ∩ 𝐵) ≠ 𝑃(𝐴) · 𝑃(𝐵) b) P(C) = 0,32 y P (CUD)= 8/25. Si C y D son sucesos incompatibles, ¿cuál es la probabilidad del suceso D? ¿qué tipo de suceso es? 𝑃(𝐶 ∩ 𝐷) = 0, 𝑝𝑜𝑟 𝑠𝑒𝑟 𝑖𝑛𝑐𝑜𝑚𝑝𝑎𝑡𝑖𝑏𝑙𝑒𝑠 𝑃(𝐶 ∪ 𝐷) = 𝑃(𝐶) + 𝑃(𝐷) − 𝑃(𝐶 ∩ 𝐷) 8 = 0,32 + 𝑃(𝐷) − 0 25 0,32 = 0,32 + 𝑃(𝐷) 𝑃(𝐷) = 0, 𝑙𝑢𝑒𝑔𝑜 𝐷 𝑒𝑠 𝑢𝑛 𝑠𝑢𝑐𝑒𝑠𝑜 𝑖𝑚𝑝𝑜𝑠𝑖𝑏𝑙𝑒
8. En una determinada población, se sabe que el 70% de las personas mayores de 18 años no son fumadoras y el 30% fumadoras. Se conoce que el 60% de los fumadores padecen algún problema respiratorio, así como el 10% de los no fumadores. a) Se elige una persona al azar mayor de 18 años ¿cuál es la probabilidad de que tenga algún problema respiratorio?
Problema Respiratorio 𝑃 Fumador 𝑃 𝐹 = 0.3
𝑅 𝐹
= 0.6
Sin problema respiratorio 𝑃
𝑅̅ 𝐹
= 0.4
Población Problema respiratorio 𝑃 No fumador 𝑃 𝐹̅ = 0.7
𝑅 𝐹̅
= 0.1
Sin problema respiratorio 𝑃
𝑅̅ 𝐹̅
=0.9
𝑅 𝑅 𝑃(𝑅) = 𝑃(𝐹) · 𝑃 ( ) + 𝑃(𝐹̅ ) · 𝑃 ( ) = (0,3) · (0,6) + (0,7) · (0,1) = 0,25 𝐹 𝐹̅
b) Se elige al azar una persona mayor de 18 años y resulta que padece algún defecto respiratorio. Calcular la probabilidad de que esta persona sea fumadora.
𝑅 𝑃(𝐹) · 𝑃 ( ) (0,3) · (0,6) 𝐹 𝐹 = 𝑃( ) = = 0,72 (0,25) 𝑅 𝑃(𝑅)
9. Por los síntomas observados a un enfermo se deduce que puede tener la enfermedad A con un 50% de probabilidad, la B con un 30% y la C con un 20%. Para precisar el diagnóstico se le somete al enfermo a una prueba que da positiva en el 10% de enfermos A, en el 20% de enfermos B y en el 90% de enfermos C; el resultado de la prueba resulta ser positivo, ¿cuál de las tres enfermedades se diagnosticará? Positivo 𝑃 Enfermedad A
𝑃 𝐴
=0.1
𝑃 𝐴 = 0.5 Negativo 𝑃
Enfermedad
Enfermedad B 𝑃 𝐵 = 0.3
Enfermedad C 𝑃 𝐶 = 0.2
𝑃̅ 𝐴
=0.9
Positivo 𝑃 𝑃 = 0.2 𝐵 Negativo 𝑃̅ 𝑃 = 0.8 𝐵
Positivo 𝑃 𝑃 = 0.9 𝐶 Negativo 𝑃̅ 𝑃 = 0.1 𝐶
Calculamos primero la probabilidad de que el diagnóstico sea positivo: 𝑃 𝑃 𝑃 𝑃(𝑃) = 𝑃(𝐴) · 𝑃 ( ) + 𝑃(𝐵) · 𝑃 ( ) + 𝑃(𝐶) · 𝑃 ( ) = 𝐴 𝐵 𝐶 = (0,5) · (0,1) + (0,3) · (0,2) + (0,2) · (0,9) = 0,29 Ahora, la probabilidad que tiene cada una de las enfermedades para saber cuál es la más probable que aparezca: (0,5) · (0,1) 𝐴 𝑃( ) = = 0,17 𝑃 0,29 (0,3) · (0,2) 𝐵 𝑃( ) = = 0,21 𝑃 0,29 (0,2) · (0,9) 𝐶 𝑃( ) = = 0,62 𝑃 0,29 Por lo que podemos concluir que la enfermedad que se diagnosticará será la C.
10. El 80% de los hombres y el 10% de las mujeres beben cerveza. En un grupo de personas hay 20 hombres y 30 mujeres. a) Elegida una persona al azar, ¿Cuál es la probabilidad de que beba cerveza?
Bebe cerveza 𝑃
𝐶 𝐻
=0.8
Hombre 𝑃 𝐻 =
20 50
=0.4
No bebe cerveza 𝐶̅ 𝑃 = 0.2 𝐻
Persona Bebe cerveza 𝐶 𝑃 = 0.1 𝑀 Mujer 𝑃 𝑀 =
30 50
=0.6 No bebe cerveza 𝑃
𝐶̅ 𝑀
=0.9
𝑃(𝐶) = (0,4) · (0,8) + (0,6) · (0,1) = 0,38
b) Elegida una persona al azar, ¿cuál es la probabilidad de que sea mujer, sabiendo que bebe cerveza? (0,6) · (0,1) 𝑀 𝑃( ) = = 0,16 𝐶 0,38
11. En cierta región se ha hecho un estudio sobre el carácter daltónico de las personas y se ha encontrado que 8 de cada 1000 hombres y 1 de cada 500 mujeres padece daltonismo. Se elige una persona al azar y se sabe que presenta daltonismo. ¿Qué probabilidad hay de que se trate de una mujer?, ¿y de qué se trate de un hombre?
Daltónico 𝐷 8 𝑃 = 𝐻 1000 Hombre 𝑃 𝐻 = 0.5
No daltónico 𝐷 992 𝑃 = 𝐻 1000
Región Daltónico 𝐷 1 𝑃 = 𝑀 500 Mujer 𝑃 𝑀 = 0.5
No daltónico 𝐷 499 𝑃 = 𝑀 500
Calculamos, en primer lugar, la probabilidad de que una persona de esa región sea daltónica:
8 1 𝑃(𝐷) = (0,5) · ( ) + (0,5) · ( ) = 0,005 1000 500
Mujer:
𝑀
𝑃 (𝐷 ) =
𝐻 𝐷
Hombre: 𝑃 ( ) =
1 ) 500
(0,5)·(
0,005
(0,5)·(
8 ) 1000
0,005
= 0,2
= 0,8
12. Un autobús recorre diariamente el trayecto de ida y vuelta entre dos ciudades. La probabilidad de que ocurra un accidente en un día con lluvia es de 0,002 y la probabilidad de accidente en un día sin lluvia es de 0,0003. Un mes de septiembre tuvo 20 días con lluvia y 10 días sin lluvia. a) Si se sabe que ese mes ocurrió un accidente, ¿cuál es la probabilidad de que se tratara de un día con lluvia?
Lluvia 20 𝑃 𝐿 = 30
Accidente 𝐴 𝑃 = 0.002 𝐿
No accidente 𝐴̅ 𝑃 = 0,998 𝐿
Ruta diaria
No lluvia 10 𝑃 𝐿̅ = 30
Accidente 𝐴 𝑃 = 0,0003 𝐿̅
No accidente 𝐴̅ 𝑃 = 0,9997 𝐿̅
Calculamos la probabilidad de que tenga un accidente: 20 10 𝑃(𝐴) = ( ) · (0,002) + ( ) · (0,0003) = 1,43 · 10−3 30 30 20 (30) · (0,002) 𝐿 𝑃( ) = = 0,93 𝐴 1,43 · 10−3
b) Si se sabe que el 10 de septiembre el autobús no tuvo ningún accidente, ¿cuál es la probabilidad de que ese día haya llovido? Calculamos primero la probabilidad de que no haya accidente, mediante el suceso contario: 𝑃(𝐴̅) = 1 − 𝑃(𝐴) = 1 − 1,43 · 10−3 = 0,99857 20 (30) · (0,998) 𝐿 𝑃( ) = = 0,67 0,99857 𝐴̅
View more...
Comments