Ejercicios de estadística

November 4, 2017 | Author: Francisco Marcillo Martinez | Category: Standard Deviation, Median, Salary, Data Analysis, Statistics
Share Embed Donate


Short Description

Descripción: Contiene algunos ejercicios resueltos de estadística descriptiva...

Description

TALLER DE ESTADÍSTICA DESCRIPTIVA

INTEGRANTES: WALTER BENAVIDES ELIANA GUERRERO FRANCISCO MARCILLO CAMILO PORTILLA

UNIVERSIDAD DE NARIÑO TUQUERRES marzo de 2014

TALLER DE ESTADÍSTICA DESCRIPTIVA 1.) La Tabla siguiente presenta cifras que muestran el número de estudiantes de último semestres de 5 especialidades distintas. Represente los datos mediante un diagrama de sectores. SOLUCIÓN PORCENTAJE CARRERA ESTUDIANTES PORCENTAJE ACUMULADO Ingeniería 440 47,77% 47,77% Humanidades 220 23,89% 71,66% Agricultura 120 13,03% 84,69% Economía 80 8,69% 93,38% Bellas Artes 61 6,62% 100,00% TOTAL 921 100,00%

GRADOS 172° 86° 47° 31° 24° 360°

GRADOS ACUMULADOS 172° 258,00 305° 336 360°

2. ) De las empresas industriales de la Ciudad de Cali, se seleccionaron a 50 obreros para analizar la estatura (con el fin de sacar un promedio y exigir requisitos de admisión en las empresas). Se obtuvieron los siguientes resultados (en cm.) a.) Cuál es la Población, cuál es la muestra, cuál es la variable y de qué tipo es?. La población es la empresa, la muestra son los empleados a analizar, la variable es la estatura y es de tipo cuantitativa discreta

b.) Construir una distribución de frecuencias y graficar la ojiva para las frecuencias relativas acumuladas. SOLUCIÓN Se agrupo los datos en intervalos de la siguiente manera: Se calculó el número de intervalos usando la regla de Sturges: m=1+3,3*log(n) m=1+3,3*log(50) m=2,8 Quedando los intervalos así: 1) [153-155,8) 2) [155,8158,6) 3) [158,6161,4) 4) [161,4164,2) 5) [164,2-167) 6) [167-169,8) 7) [169,8172,6)

II IIII IIII IIII IIII IIII IIII IIII IIII IIII II III

DISTRIBUCION DE FRECUENCIAS ESTATURA Linf. Lsup. 153 155,8 155,8 158,6 158,6 161,4 161,4 164,2 164,2 167 167 169,8 169,8 172,6 TOTAL

# de Marca de clase obreros Xi fi 154,4 157,2 160 162,8 164,7 168,4 171,2

2 6 9 14 9 7 3 50

Fi

hi

Hi

2 8 17 31 40 47 50

4% 12% 18% 28% 18% 14% 6% 100%

4% 16% 34% 62% 80% 94% 100%

3.) De acuerdo a los datos anteriores hallar en calculadora la media, la desviación estándar corregida, la desviación estándar sin corregir y el coeficiente de variación. Analizar cada resultado. SOLUCIÓN MEDIA Aplicando la fórmula para encontrar la “media aritmética” obtuvimos que

para datos agrupados

= Obteniendo que la media está acorde con los datos que se analizaron. Para encontrar la desviación estándar corregida se tuvo que calcular en primera instancia la “varianza corregida” la cual la obtuvimos aplicando su fórmula de la siguiente manera: = Ya obtenido la varianza corregida se prosigue a calcular “La Desviación Estándar Corregida” aplicando su fórmula así: S

=

= 4,1144

La “variación Estándar Sin Corregir” se obtuvo calculando en primer lugar la varianza sin corregir aplicando la formula

Ya con la varianza sin corregir proseguimos a obtener la “variación Estándar Sin Corregir” aplicando la formula

=

= 4,0731

Obtenido los anteriores datos se prosigue a calcular el “Coeficiente de Variación” el cual está regido por la formula

4.) De un grupo de 7 administradores y 10 de comercio internacional se quiere formar un comité de 5 personas para investigación. ¿Cuántos comités de 5 personas es posible formar si en cada comité debe haber máximo 3 administradores? SOLUCIÓN Se organizó las posibilidades con las que se pueden formar los grupos:

Luego se realiza las operaciones: = 35*45 + 21*120 + 7*210 + 252 = 2520+ 1575 + 1470 + 252 = 5565 + 252 = 5817 Se pueden formar 5817 comités. 5.) De las empresas de la ciudad de Pasto se seleccionaron a 50 trabajadores para analizar el peso y si es el caso programar secciones deportivas en horas extras. Se obtuvieron los siguientes resultados (en kilogramos) 65 63 65 63 69

64 65 64 72 68

64 65 64 71 68

63 65 63 70 67

64 64 63 69 67

67 53 58 60 61

66 55 57 60 62

66 56 59 61 62

66 57 59 61 62

66 58 60 61 62

a.) Construir una distribución de frecuencias, utilizando los siguientes intervalos: 53-56; 56-59; 59-62; 62-65; 65-68; 68-71; 71-74. SOLUCIÓN Peso Peso(kg) Límite Límite inferior superior 53 56 56 59 59 62 62 65 65 68 68 71 71 74

Marca(Kg.) de #Conteo clase empleados 53-56 ll =2 Xi56-59 llllfi =5

Fi

59-62 llll llll =9 2 2 llll llll llll =15 5 7 llll9llll ll =1216 llll15 =5 31 ll 12=2 43

54.5 62-65 57.5 65-68 60,5 68-71 63.5 71-74 66.5 69.5 72.5

5 2 50

48 50

hi 4% 10% 18% 30% 24% 10% 4% 100%

Hi 4% 14% 32% 62% 86% 96% 100%

TOTAL

b.) Graficar el histograma y el polígono de frecuencias. SOLUCIÓN

c.) Calcular y analizar: media aritmética, desviación estándar , Mediana(Me), Moda(Mo), P15, Q3. SOLUCIÓN Media aritmética: X

∑(xi*fi)/n

63.68 kg

Este valor de la media aritmética representa el promedio de todos los valores en este caso representada en kilogramos.

Desviación estándar(s): Raíz de ∑(Xi-ẋ) ^2fi/(n-1) 4,2170

S

Esta desviación estándar (s) nos indica que los pesos de los empleados pueden alejarse del peso promedio en 4,21 kg. Mediana (Me): L me

25.5

Mediana(me)

63.875

Lme: nos indica que la mediana se encuentra ente los trabajadores # 25 y 26 de la tabla anterior me: la mediana es 63,875 kg lo que quiere decir que 50% de personas pesan menos de 63.875 y el otro 50% pesa más que este valor. Moda (Mo): Clase modal

15

Amplitud modal(c)

3

Moda(mo)

64

La clase modal corresponde al valor que más se repite que en nuestro caso es entre 62 y 65 kg a esta clase modal se le resta la anterior frecuencia y la siguiente para encontrar las dos variaciones también tenemos la amplitud de clase modal que se la obtiene con el límite superior –el límite inferior del intervalo luego tan solo aplicaremos la fórmula para encontrar Mo Moda: esta nos indica de los datos que el peso que más se repite es 64kg. Percentil (15) P15: equivale al 15% de los datos. L p15

7.65

P15

60.031

L p15 quiere decir que el P15 se encuentra entre el dato 7 y el dato 8

P15 esto quiere decir que el 15% de los empleados tienen pesos menores a 60.o31 kg y el 85% tienen pesos superiores a este dato. Cuartil (3) Q3: equivale al 75% de los datos. L Q3

38.25

Q3

66.961

L Q3 quiere decir que el Q3 se encuentra entre el dato de lugar 38 y el dato de lugar 39 y la frecuencia acumulada inmediatamente mayor a 38.25 es 43 y corresponde al quinto intervalo. Q3 esto significa que el 75% de los empleados pesa menos de 66.951 kg y el 25% de los empleados pesa más de 66.961 kg. d.) Calcular y analizar: Coeficiente da variación, Coeficiente de simetría y coeficiente de curtosis SOLUCIÓN Coeficiente de variación: Cv= S/x*100% Cv= 4,2170/63,68 *100%

Cv= 6.6221%

Según la tabla concluimos que el porcentaje es menor de 11% esto quiere decir que los pesos de los empleados son muy homogéneos porque no varían de manera muy considerable. Coeficiente de simetría

-COEFICIENTE DE SIMETRIA: a3 = m3 / s3 = -7,796736 / -7,9559 = 0,98 

Análisis: Teniendo en cuenta a3 > 0, la distribución es asimétrica a la derecha o de sesgo positivo.

Coeficiente de curtosis a4 = m4 / s4 = 820,3247 / 837,0660 = 0,98 

Análisis: Teniendo en cuenta a4 > 0, la distribución es apuntada o leptocorticos.

6.) Resuelva y analice. a.) Sumando 4 a cada uno de los números de la serie: 2, 6, 5, 9, 1, se obtiene la serie: 6, 10, 9, 13 y 5. Calcular las varianzas, media y coeficientes de variación de cada serie. Compararlas y analizar los resultados obtenidos entre las dos series. SOLUCIÓN DATOS A= 2, 6, 5, 9, 1 B= 6, 10, 9, 13, 5 VARIANZAS VARIANZA CORREGIDA A=

=

= 10,3

B=

=

= 10,3

El valor de las varianzas dio el mismo porque se afecta de igual manera a cada dato, aumentándole 4 a cada uno. VARIANZA SIN CORREGIR A=

=

= 8,24

B=

=

= 8,24

El valor de las varianzas dio el mismo porque se afecta de igual manera a cada dato, aumentándole 4 a cada uno. MEDIA ARITMETICA A=

=

= 4,6

B=

=

= 8,6

La diferencia entre la media de A y la media de B, es de 4, el mismo valor que se le aumento a cada valor.

COEFICIENTE DE VARIACION = = = =

= 69,78%

= 3,21 =

= 37,33%

El coeficiente de variación de A es mayor al coeficiente de variación de B, esto significa que entre más alto el valor de las variables, los datos se vuelven más homogéneos.

b.) La media de un centenar de artículos es 50, y la suma de los cuadrados de las desviaciones respecto a la media es de 3600, calcular el coeficiente de variación. SOLUCIÓN COEFICIENTE DE VARIACION = =

=

=

=

=

=6

= 12%

7.) Los siguientes datos corresponden a los salarios diarios, en pesos, pagados por una fábrica a su personal de obreros en un día de trabajo. Salario diario No. de obreros 150 10 180 16 200 35 230 26 250 13 En la fábrica se presenta un conflicto laboral. El gerente propone un aumento del 10% diario para cada uno de los obreros y la Junta de empleados propone un aumento de $20. Se solicita su asistencia para que discuta qué es más ventajoso para la fábrica y qué para cada grupo de obreros, según su clasificación por niveles de salarios. Cómo actuaría usted? SOLUCIÓN Lo que debemos hacer en esta circunstancia es realizar las tablas de aumento de salario para cada uno de los grupos de los trabajadores tanto en la propuesta de los empleados de aumentar en $20 su salario como la de la empresa de aumentar el salario en un 10%. Salario diario No. de obreros Aumento $20 Aumento grupo 150 10 20 200 180 16 20 320 200 35 20 700 230 26 20 520 250 13 20 260 100 2000 Salario diario No. de obreros Aumento 10% Aumento grupo 150 10 15 150 180 16 18 288 200 35 20 700 230 26 23 598 250 13 25 325 101 2061 Tenemos que tener en cuenta cual es el grupo de trabajadores tiene mayoría de trabajadores el cual es el grupo tres con 35 obreros pero a ellos no afecta si el salario es aumentado en cualquiera de las formas propuestas entonces procedemos a tomar el próximo que tenga el

mayor número de trabajadores para poder tomar una decisión con respecto a que si cualquiera de los dos aumentos tiene que favorecer a la mayoría de los trabajadores. De los datos anteriores nos damos cuenta que la mejor opción para la mayoría de los trabajadores es el 10% ya que aumenta en mayor cantidad la cantidad el dinero que la empresa gasta en salarios. Para la empresa lo más factible es el aumento de 20 pesos porque a la empresa lo que le interesa minimizar al máximo sus salidas. 8.) Calcular analizar la mediana, Q3 y P15 de la siguiente información Peso de los Numero de Pacientes(kg.) pacientes 20-30 12 30-40 16 40-50 21 50-60 14 60-70 11 70-80 5 TOTAL 80 SOLUCIÓN

Peso(kg) Límite inferior 20 30 40 50 60 70

Peso(kg) Límite superior 30 40 50 60 70 80

Marca de clase

# pacientes

Xi 25 35 45 55 65 75

Fi 12 16 21 14 11 5 79

Q3

45.48

FI 12 28 49 63 74 79

hi 15.19% 20.25% 26.58% 17.72% 13.92% 6.33% 100%

Hi 15.19% 35.44% 62.03% 79.75% 93.67% 100.00%

Mediana: L me

40

L me: es el lugar que ocupa la mediana en este caso es 40.

me : La mediana es el valor donde se encuentra el centro del conjunto de datos y esto indica que la mediana se encuentra en 45.48 kg . L Q3

60

Q3

57.321428

L Q3: esto nos indica que el Q3 se encuentra en el lugar 60 Q3 : nos indica que el 75% tienen pesos menores a 57.321428 kg y el 25% d ellos es

superior a este valor. L P15

12

P15

23.46

L P15 : esto indica que el P15 está ubicado en el lugar 12 P15 : esto significa que el 15% de los pacientes tendrían pesos menores a 23.46 kg y el 85%

tienen pesos superiores este mismo valor.

9.) Según la información del punto anterior, calcular y analizar: la media, la varianza, la desviación estándar y el coeficiente de variación. SOLUCIÓN Media aritmética: X

∑(xi*fi)/n

46.39 kg

Este valor de la media aritmética representa el promedio de todos los valores en este caso representada en kilogramos. Coeficiente de variación (cv) Cv= S/x*100%

CV

31.38 %

Según la tabla concluimos que el porcentaje es mayor de 26% esto quiere decir que los pesos de los pacientes son muy heterogéneos porque varían de manera considerable. Desviación estándar(s): Raíz de ∑(Xi-ẋ) ^2fi/(n-1) 14.56 kg

S

Esta desviación estándar (s) nos indica que los pesos de los empleados pueden alejarse del peso promedio en 14.56 kg. Varianza S^2

∑(Xi-ẋ)´2fi/(n-1)

212.14

Indica que los valores pueden alejarse ciertas unidades de la media 10.) El peso medio de 25 personas es de 50 kg. El peso medio de 20 de ellos des de 45 kg. ¿cuál es el peso medio de las otra cinco personas?. SOLUCIÓN Utilizamos la fórmula de la media:

∑(xi*fi)/n   

x =50 Kg

20

 

x 1 =45Kg



x 2 =?

=5

Aplicando la formula y despejando x 2 que es lo que necesitamos podemos encontrar en peso medio de las 5 personas faltantes, así: 50 = 50*25=

1250 = 900 350 = 70 = x 2 11.) Los médicos de un hospital piden $200000 de aumento en sus salarios mensuales. L@s enfermer@s piden el 10% de aumento a sus salarios mensuales. Si los salarios actualmente son: Profesión Salario actual Médico 1 2500000 Médico 2 2000000 Médico 3 2400000 enfermer@ 1 1700000 enfermer@ 2 1800000 enfermer@ 3 1500000 Si usted es el gerente del hospital que decisión tomaría?. Justifique su respuesta. SOLUCIÓN 200000 medico1 medico2 medico3 enfermera 1 enfermera 2 enfermera 3 sumatoria

Aumento Aumento Aumento Aumento 10% 1 2 3 4 2500000 200000 250000 250000 200000 2000000 200000 200000 200000 200000 2400000 200000 240000 240000 200000 1700000 170000 200000 170000 200000 1800000 180000 200000 180000 200000 1500000 150000 200000 150000 200000 1100000 1290000 1190000 1200000

La opción más viable para la empresa y como decisión del gerente seria la primera opción debido a que esta demandaría menos gastos para la empresa al cumplir el aumento del salario. 12.) De los datos de los puntos 2.) y 5.) realizar el gráfico de cajas y bigotes. SOLUCIÓN PUNTO 2 , el quinto dato es el cuartil, Q1 = 158 , el décimo dato es el cuartil, Q2 = 163 , el décimo dato es el cuartil, Q2 = 168 B1 = 158-[1,5*(168-158)] = 143 B2 = 168+[1,5*(168-158)] = 178 No existen valores atípicos, porque los bigotes sobrepasan el valor mínimo (153) y el valor máximo (172).

153,155, 156,157, 158,159, 160,161,162,163,164,165,166,167,168, 169, 170, 171, 172 PUNTO 5 , el quinto dato es el cuartil, Q1 = 58 , el décimo dato es el cuartil, Q2 = 63 , el décimo dato es el cuartil, Q2 = 68 B1 = 58-[1,5*(68-58)] = 43 B2 = 68+[1,5*(68-58)] = 83 No existen valores atípicos, porque los bigotes sobrepasan el valor mínimo (53) y el valor máximo (72).

53, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70,

71, 72

13.) La siguiente información corresponde a los puntajes de estudiantes de un colegio de la ciudad de Bogotá, en un examen de matemáticas (escala de 1 a 100 puntos) Puntaje obtenidos Número de por los estudiantes Estudiantes 40-50 25 50-60 30 60-70 40 70-80 50 80-90 10 90-100 5 Calcular y analizar: Q3, D2, a3 y a4

SOLUCIÓN puntajes por estudiante

# de estudiantes Fi

40

50

25

25

50 60

60 70

30 40

55 95

xiXi Xi*fi media 45 1125 20,3125 55 1650 10,3125 65 2600 -0,3125

(ximedia)^2

(ximedia)^2*fi

(ximedia)^3*fi

(ximedia)^4*fi

412,59766

10314,94141

-209522,25

4255920,649

106,34766 0,0976563

3190,429688 3,90625

-32901,306 -1,2207031

339294,7197 0,381469727

70 80 80 90 90 100 Total

50 10 5 160

145 75 3750 9,6875 155 85 850 19,6875 160 95 475 29,6875 10450

media

93,847656 387,59766 881,34766 1881,8359

4692,382813 3875,976563 4406,738281 26484,375

45457,4585 76308,2886 130825,043 10166,0156

440369,1292 1502319,431 3883868,456 10421772,77

65,313

según el lugar cuartil 3

Linf Fa fo C Q3

70 95 50 10 75

Cuartil 3 El 75% de los estudiantes tienen un puntaje inferior a 75 puntos, mientras que el otro 25% de los estudiantes tienen un puntaje superior a 75 puntos según el lugar del decil 2

Linf Fa fo c D2

50 25 30 10 52,333

Decil 2 Esto significa que el 20% de los estudiantes tienen puntajes inferiores a 52 puntos y el 80% de los estudiantes tienen puntajes superiores a 52 puntos varianza corregida S^2 11,835 desviación estándar corregida S 3,4403 coeficiente de simetría a3 1,5605 a4 465 a3, siendo mayor que cero hace referencia a que la distribución es simétrica a la derecha o de sesgo positivo. a4: siendo mayor que cero se refiere a que la distribución es simétrica a la derecha o de sesgo positivo 14.) Calcule y analice Me, Q3, P10 y D4 de la siguiente información: Utilidades Diarios(miles de pesos) 10-20 20-30 30-40 40-50 50-60 60-70 70-80 Total

Numero de Negocios 25 40 45 42 38 20 10 220

SOLUCIÓN Límite inferior 10 20 30 40 50 60 70

Límite superior 20 30 40 50 60 70 80

xi 15 25 35 45 55 65 75

mediana Q tres P 15 D4

fi 25 40 45 42 38 20 10 220

FI 25 65 110 152 190 210 220

lugitud 40 mediana 53,42105263 POSICION 18,68421053 POSICION 33,15789474 POSICION

hi 11,36% 18,18% 20,45% 19,09% 17,27% 9,09% 4,55% 1

Hi 11,36% 29,55% 50,00% 69,09% 86,36% 95,45% 100,00%

110,5 165,75 33,15 88,4

15.) Según la información del punto anterior a.) Qué porcentaje de los negocios tienen utilidades inferiores a 58000 pesos diarios? SOLUCIÓN Pk = 58 Linf = 50 Fa = 152 Fo = 38 C = 10 k = 83% Por lo que 83% de los negocios tienen utilidades inferiores a 58000 pesos diarios b.) Qué porcentaje de los negocios tienen utilidades superiores a 24000 pesos diarios? SOLUCIÓN Pk = 24 Linf = 20 Fa = 25 Fo = 40 C = 10 k = 18,6% 100% - 18,6% = 81,4% Por lo que el 81,4% de los negocios tienen utilidades superiores a 24000 pesos diarios 16.) Según la información del punto 14) calcule y analice x , Mg, SOLUCIÓN Media=8980/220= 40,81818182 Mg = 2,5148 S2 (varianza sin corregir)=457370,6777/220= 2078,957626

2

s



, s , CV.

S (desviación estándar corregida)= (457370,677)/(n-1) = 457370,677/219 = 2088,45058 = 45,7 S (desviación estándar corregida)= 45,7 C/V= (coeficiente de variación)= S/media*100% = (45,7/40,81818182)*100% C/V= (coeficiente de variación)= 1.11 % Media=8980/220= 40,81818182 S2=457370,6777/220= 2078,957626 17.) De un grupo de 100 obreros que laboran en una fábrica 40 de ellos trabajan en el día y el resto en la noche. Se sabe que el salario promedio de los 100 obreros es de 12720 pesos diarios y que los del turno de la noche reciben en promedio 800 pesos menos que los trabajadores del día. ¿Cuál es el salario promedio de cada grupo?. SOLUCIÓN Media= 12720 pesos N1=40 N2= 60x2= X1 – 8000 12720= 40X1+60(X1 - 800)/100 1272000= 100X1 – 48000 1320000/100 = 100X1 13200 = X1 Salario promedio del día =13200 X2= X1 – 800 = X2= 13200 – 800 X2= 21400 Salario promedio de la noche =21400 18.) Resolver a.) En un salón de clase de 30 estudiantes, la estatura promedio es de 168 cm. Si ingresa un estudiante el promedio se aumenta en 2cm. ¿cuál es la estatura del nuevo estudiante?. SOLUCIÓN Media 30 estudiantes = 168cm 30*168 = 5040 estatura acumulada por 30 estudiantes 5040+x /31= 170cm x = (170cm *31)- 5040 x = 230cm Para obtener un promedio de 170 cm, el nuevo estudiante tiene que medir 230 cm. b.) La media de un centenar de artículos es de 5 y la suma de los cuadrados de las desviaciones con respecto a la media es de 400. Calcule el coeficiente de variación.(sug. Utilice la desviación estándar sin corregir). SOLUCIÓN = =

= =

= =

=2

= 4%

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF