Aplicación de Estadística Descriptiva
Short Description
Ejemplos de aplicación de estadística descriptiva...
Description
Estadística Estadística descriptiva Enunciado
A continuación se muestran datos de 55 miembros de un equipo de béisbol. Cada observación indica la posición principal que juegan los miembros del equipo: pitcher (P), catcher (H), primera base (1), segunda base (2), tercera base (3), shortstop (S), left fiel (L), center field (C) y right field (R). LPCH2PR1SS1LPRP PPPRCSLRPCCPPRP 23PHLP1CPPPS1LR R12HS3H2LP a. Para resumir estos datos use una distribución de frecuencia y otra de frecuencia relativa. b. ¿Cuál es la posición que ocupan más miembros del equipo? c. ¿Cuál es la posición que ocupan menos miembros del equipo? d. ¿Qué posición de campo (L, R, C) es la que juegan más miembros del equipo? e. Compare las posiciones L, R, y C con las posiciones 1, 2, 3 y S. Respuesta
a) Distribución de frecuencia Posición
pitcher catcher primera base segunda base tercera base shortstop left fiel center field right field Total
P H 1 2 3 S L C R
Frecuencia
Frecuencia relativa
17 4 5 4 2 5 6 5 7
0.31 0.07 0.09 0.07 0.04 0.09 0.11 0.09 0.13
55
1.00
b) Es la de "pitcher" con 17 miembros (31%) c) Es la "tercera base" con 2 miembros (4%) d) Es la de "right field" con 7 miembros (13%) e) La posiciones de "L, R y C" tienen 18 miembros (33% del total) en comparación a las posiciones de "1, 2, 3, S" que tienen 16 miembros (29 % del total)
Ejercicio 2 (página 43, ejercicio 21) Enunciado
Nielsen Home Technology Technology Report informa sobre la tecnología en el hogar y su uso. Los datos siguientes son las horas de uso de computadora por semana en una muestra de 50 personas. 4.1 1.5 10.4 5.9 3.4 5.7 1.6 6.1 3.0 3.7 3.1 4.8 2.0 14.8 5.4 4.2 3.9 4.1 11.1 3.5
4.1 4.1 8.8 5.6 4.3 3.3 7.1 10.3 6.2 7.6 10.8 2.8 9.5 12.9 12.1 0.7 4.0 9.2 4.4 5.7 7.2 6.1 5.7 5.9 4.7 3.9 3.7 3.1 6.1 3.1 Resuma estos datos construyendo: a. Una distribución de frecuencia (como ancho de clase use tres horas). b. Una distribución de frecuencia relativa. c. Un histograma. d. Una ojiva. e. Haga un comentario sobre lo que indican los datos respecto al uso de la computadora en el hogar. f. Otros estadígrafos Respuesta
a) y b) Distribución de frecuencias Nota: en cada clase el límite inferior es cerrado y el límite superior es abierto, excepto el límite superior de la última clase que es cerrado. Horas por semana
Punto medio ( )
Frecu encia
0-3 3-6 6-9 9 - 12 12 - 15
1.5 4.5 7.5 10.5 13.5
5 28 8 6 3 50
Frecuencia acumulada
Frecuen cia relativa
Frecuencia relativa acumulada
0.10 0.56 0.16 0.12 0.06
0.10 0.66 0.82 0.94 1.00
5 33 41 47 50
̅
7.5 126.0 60.0 63.0 40.5 297
98.55 57.96 19.44 124.74 171.45 472.4
1.67 9.33 2.67 2.00 1.00
12
15
c) Histograma Histograma 30
25
s a
n 20 o sr e p
e 15 d or e m
ú 10 N
5
0
0
3
6
9
Horas por semana
d) Ojiva
11.25 567.00 450.00 661.50 546.75 2236.50
Ojiva 1 ,0
a 0,9 d la
u 0,8 m u
c 0,7 A a
vi 0,6 t la
re 0,5 ai c
n 0,4 e u c
er 0,3 F
0,2 0,1 0
3
6
9
12
15
Horas por semana
e) Más del la mitad de las personas utiliza entre 3 y 6 horas por semana, se puede ver en el histograma que se tiene un sesgo hacia la derecha (positivo), también se puede ver en la distribución de frecuencias que solo el 10% de las personas de la muestra usan menos de 3 horas semanales y el 34% usan 6 o más horas semanales. f) Media:
Mediana:
Moda:
donde:
Varianza:
Desviación estándar: Coeficiente de variación:
Cuartiles:
Desviación intercuartílica:
Rango intercuartílico:
̅ ∑ 25097 5.94 − 330.5 0. 1 5.14 0.5 0.56 7.66 66 4.60 3 37. 666. −+ 9.9.3331. 6 7 7. 6 6 32.67 6.66 ̅ 472.14 9.64 ∑ 1 501 √ 9.64 3.1048 ̅ 100 3.5.190484 100 52.27% − 330.250.1 0 3.80 0.25 0. 5 6 − 6 30.750.6 6 7.69 0.75 0.16 8 0 2 7.693. 2 1.94
Para el diagrama de caja:
Media armónica:
Media cuadrática:
Media geométrica:
7.693.80 3.89 3. íí 1.1.55 3. 8 01. 5 8 9 2. 0 4 7.691.53.89 13.53
∑= 1.55 4.285 7.8505 10.6 5 13.3 5 4.38 ∑ 2236.50 5 6.69 log ∑ 0.7138 Mg antilog0.7138 5.17 ̅ 1 2 1.04 ̅ 1 3 1 [ 1 2 3 ] 2 3 0.66
Sesgo (utilizando Minitab):
Curtosis (utilizando Minitab):
Ejercicio 3 (página 65, ejercicio 49) Enunciado
¿Generan más ingresos las grandes empresas? Los datos siguientes muestran la cantidad de empleados y el ingreso anual de 20 de las empresas de Fortune 1000 (Fortune, 17 de abril de 2000).
a. Haga un diagrama de dispersión para mostrar la relación entre las variables ingreso y empleados. b. Haga un comentario sobre la relación entre estas variables.
c. Covarianza, desviaciones estándar y coeficiente de correlación Respuesta
a) Diagrama de dispersión
b) Evidentemente existe una relación directamente proporcional entre el número de empleados y los ingresos percibidos, es decir a más empleados más ingresos, claro que los ingresos percibidos están sujetos a innumerables variables internas y externas de cada empresa. c) Empresa
Toro H&R Block American Financial Sunbeam Consolidated Edison Phillips Petroleum Steelcase Borders Group CBS Cardinal Health IBP Computer Sciences Super Value Fluor Georgia-Pacific Time Warner Chase Manhattan MCI Worldcom Sprint Wells Fargo Total
La media:
Empleados
Ingresos
1.275,00 4.200,00 9.400,00 12.200,00 14.269,00 15.900,00 16.200,00 23.500,00 29.000,00 36.000,00 45.000,00 50.000,00 50.000,00 53.561,00 57.000,00 69.722,00 74.801,00 77.000,00 77.600,00 89.355,00 805.983,00
4.673,00 1.669,00 3.334,00 2.398,00 7.491,00 13.852,00 2.743,00 2.999,00 7.510,00 25.034,00 14.075,00 7.660,00 17.421,00 12.417,00 17.796,00 27.333,00 33.710,00 37.120,00 19.930,00 21.795,00 280.960,00
365.851.406,25 446.871.377,85 331.053.493,10 327.355.097,50 170.679.693,55 4.782.233,40 272.440.890,75 185.613.808,35 73.873.842,70 -47.230.461,90 126.922,95 -61.969.029,80 32.720.967,05 -21.630.077,35 62.594.785,80 390.882.562,25 678.375.374,70 846.762.011,20 219.403.599,70 380.035.669,95 4.658.594.168,00
1.522.884.283,22 1.303.148.630,72 954.757.470,72 789.562.230,72 677.568.709,02 595.318.520,72 580.769.030,72 282.211.440,72 127.670.790,72 18.482.690,72 22.097.990,72 94.106.490,72 94.106.490,72 175.876.665,42 278.918.390,72 865.704.102,12 1.190.377.653,42 1.346.952.390,72 1.391.353.410,72 2.406.476.419,22 14.718.343.802,55
87.890.625,00 153.239.641,00 114.789.796,00 135.722.500,00 42.994.249,00 38.416,00 127.803.025,00 122.080.401,00 42.745.444,00 120.692.196,00 729,00 40.806.544,00 11.377.129,00 2.660.161,00 14.047.504,00 176.491.225,00 386.594.244,00 532.317.184,00 34.597.924,00 60.016.009,00 2.206.904.946,00
La covarianza:
Las desviaciones estándar:
̅ ∑ 805.20983,00 40.299,15 ∑ 280.20960,00 14.048,00 594.168,00 245.189.166,74 ∑ 1̅ 4.658.201 ̅ ∑ 343.802,55 27.832,53 1 14.718.201 ∑ 904.946,00 10.777,43 1 2.206.201 27. 8245.32,1589.3∗10.166,777,74 43 0.82
El coeficiente de correlación:
Ejercicio 4 (página 163, ejercicio 26) Enunciado
Datos sobre las 30 principales acciones y fondos balanceados proporcionan los rendimientos porcentuales anuales y a 5 años para el periodo que termina el 31 de marzo de 2000 (The Wall Street Journal, 10 de abril de 2000). Suponga que considera altos un rendimiento anual arriba de 50% y un rendimiento a cinco años arriba de 300%. Nueve de los fondos tienen un rendimiento anual arriba de 50%, siete de los fondos a cinco años lo tienen arriba de 300% y cinco de los fondos tienen tanto un rendimiento anual arriba de 50% como un rendimiento a cinco años arriba de 300%. a. ¿Cuál es la probabilidad de un rendimiento anual alto y cuál es la probabilidad de un rendimiento a cinco años alto? b. ¿Cuál es la probabilidad de ambos, un rendimiento anual alto y un rendimiento a cinco años alto? c. ¿Cuál es la probabilidad de que no haya un rendimiento anual alto ni un rendimiento a cinco años alto? Respuesta
a)
b)
c)
Sea: A = rendimiento anual arriba de 50% B = rendimiento a cinco años arriba de 300%
97⁄⁄30 0.0.2303 30 ∩ 5⁄30 0. 1 7 ∪ ∩ 0. 3 00. 2 30. 1 7 0. 3 6 1 ∪ 10.36 0.64
Ejercicio 5 (página 180, ejercicio 50)
Enunciado
En una encuesta por teléfono para determinar la opinión de los televidentes respecto a un nuevo programa de televisión se obtuvieron las opiniones siguientes:
a. ¿Cuál es la probabilidad de que un televidente tomado aleatoriamente opine que el nuevo programa es bueno o le dé un calificativo mejor. b. ¿Cuál es la probabilidad de que un televidente tomado aleatoriamente opine que el nuevo programa es regular o le dé un calificativo inferior? Respuesta
Mediante el método de frecuencia relativa: Opción
Malo (M) Regular (R) Bueno (B) Muy bueno (MB) Excelente (E) Total
a) b)
Frecuencia
4 8 11 14 13 50
Frecuencia relativa
0.08 0.16 0.22 0.28 0.26 1.00
∪ ∪ 0.220.280.26 0.76 ∪ 0.160.08 0.24
Ejercicio 5 (página 180, ejercicio 51)
Enunciado
En la siguiente tabulación cruzada se muestra el ingreso familiar de acuerdo con el nivel de estudios del cabeza de familia (Statistical Abstract of the United States: 2002).
a. Elabore una tabla de probabilidad conjunta. b. ¿Cuál es la probabilidad de que el cabeza de familia no haya terminado la preparatoria? c. ¿Cuál es la probabilidad de que el cabeza de familia haya terminado la universidad o tenga estudios de posgrado? d. ¿Cuál es la probabilidad de que si el cabeza de familia terminó la universidad, el ingreso familiar sea $100 000 o más? e. ¿Cuál es la probabilidad de que el ingreso familiar sea menor a $25 000? f. ¿Cuál es la probabilidad de que una familia en la que el cabeza de familia terminó la universidad, tenga un ingreso familiar menor a $25 000? g. ¿El ingreso familiar es independiente del nivel de educación? Respuesta
a) Tabla de probabilidad conjunta
Nivel de estudio Preparatoria sin terminar Preparatoria terminada Estudios universitarios sin terminar Estudios universitarios terminados Estudios de posgrado Total
A B C D E
Menos de 25 I1 0.09 0.10 0.06 0.02 0.01 0.28
25.0 49.9 I2 0.04 0.10 0.08 0.04 0.01 0.28
50.0 74.9 I3 0.02 0.06 0.06 0.04 0.02 0.19
75.0 99.9 I4 0.01 0.03 0.03 0.03 0.02 0.11
100 o más I5 0.004 0.02 0.03 0.05 0.03 0.14
Total 0.16 0.31 0.26 0.18 0.09 1.00
0.16 ∪ 0.180.09 0.27 0 . 0 5 5| 5∩ 0.18 0.28 1 0.28 0 . 0 2 1| 1∩ 0.18 0.11
b) c) d)
e) f)
|
g) El ingreso familiar NO es independiente del nivel de educación, pues para que sea independiente debería cumplir la regla y podemos observar que dicha regla no se cumple, por lo tanto es dependiente.
Ejercicio 5 (página 180, ejercicio 51)
Enunciado
En la siguiente tabulación cruzada se muestra el ingreso familiar de acuerdo con el nivel de estudios del cabeza de familia (Statistical Abstract of the United States: 2002).
a. Elabore una tabla de probabilidad conjunta. b. ¿Cuál es la probabilidad de que el cabeza de familia no haya terminado la preparatoria? c. ¿Cuál es la probabilidad de que el cabeza de familia haya terminado la universidad o tenga estudios de posgrado? d. ¿Cuál es la probabilidad de que si el cabeza de familia terminó la universidad, el ingreso familiar sea $100 000 o más? e. ¿Cuál es la probabilidad de que el ingreso familiar sea menor a $25 000? f. ¿Cuál es la probabilidad de que una familia en la que el cabeza de familia terminó la universidad, tenga un ingreso familiar menor a $25 000? g. ¿El ingreso familiar es independiente del nivel de educación? Respuesta
a) Tabla de probabilidad conjunta
Nivel de estudio Preparatoria sin terminar Preparatoria terminada Estudios universitarios sin terminar Estudios universitarios terminados Estudios de posgrado Total
b) c) d)
e) f)
A B C D E
Menos de 25 I1 0.09 0.10 0.06 0.02 0.01 0.28
25.0 49.9 I2 0.04 0.10 0.08 0.04 0.01 0.28
50.0 74.9 I3 0.02 0.06 0.06 0.04 0.02 0.19
75.0 99.9 I4 0.01 0.03 0.03 0.03 0.02 0.11
100 o más I5 0.004 0.02 0.03 0.05 0.03 0.14
Total 0.16 0.31 0.26 0.18 0.09 1.00
0.16 ∪ 0.180.09 0.27 5∩ 0 . 0 5 0. 0 3 (5|∪5|) 5|5| 5∩ 0.18 0.09 0.280.33 0.61 1 0.28 1∩ 0 . 0 2 0. 0 1 (1|∪1|) 1|1| 1∩ 0.18 0.09 0.110.11 0.22 |
g) El ingreso familiar NO es independiente del nivel de educación, pues para que sea independiente debería cumplir la regla y podemos observar que dicha regla no se cumple, por lo tanto es dependiente.
View more...
Comments