Monografia - Estadistica Descriptiva - Valentina Buitrago Navas
August 27, 2022 | Author: Anonymous | Category: N/A
Short Description
Download Monografia - Estadistica Descriptiva - Valentina Buitrago Navas...
Description
MONOGRAFIA
VALENTINA BUITRAGO NAVAS
JHANNIER JOHAN JARAMILLO TABIMA
UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE CIENCIAS AMBIENTALES – ESTADISTICA DESCRIPTIVA TEC. EN GESTIÓN DEL TURISMO SOSTENIBLE PEREIRA – RISARALDA 2021
MEDIDAS DE TENDENCIA CENTRAL Media aritmética datos no agrupados: Se agrupados: Se pide calcular la media aritmética de datos no agrupados de un conjunto de observaciones de 11 trabajadores que tienen una experiencia laboral en el parque consotá medida en años de servicio. Los tiempos de servicio se reflejan en la siguiente distribución: 14 12 15 13 12 14 16 12 14 14 12 Xi= 148/ 11= 13,45 años Análisis: 13.45 años son en promedio el tiempo de servicios total de trabajo de las personas, los individuos, los colaboradores, empleados del parque consotá. Media aritmética datos agrupados: determinar la media aritmética de la siguiente distribución de datos recolectados de un estudio de vulnerabilidad de unas viviendas ante eventos naturales que se encuentran en la siguiente tabla. Xi
Fi
xixFi
1
3
3
2
5
10
3
7
21
4
5
20
5
1
5
15
21
59
M = 59/21 = 2,8
2,8 es el número de viviendas que pueden versen afectadas ante eventos naturales teniendo en cuenta la cantidad de habitantes de dicha población. Mediana para datos impar: Se tienen en una distribución de datos una cantidad de observaciones de valor impar. 14 12 15 13 12 14 16 12 14 12 12 Solución: 12 12 12 12 12 13 14 14 14 15 16 = 11= N P= 13 Me= n+1/2= 11+1/2= 12/2= 6 Tarea: Encontrar la posición de la mediana para una serie de datos que se indica a continuación: 4 1 8 10 14 Solución: 1 4 8 10 14 P=8 Me= 5+1/2= 6/2=3 Mediana para datos par: Encontrar la mediana para una cantidad de observaciones par. 5-8-8-9-6-8-2-9-6-5 PI= 2-5-5-6-6-8-8-8-9-9 npar= Me= n/2=6+8/2=14/2= n/2=6+8/2=14/2=77 La moda: Para la siguiente serie de datos encontrar la moda e indicar a cual pertenece. Um: 1,2,3,3,4,5,6,7,3,9,1,3. La moda unimodal es igual a 3 porque es el valor que más se repite en esa serie de datos.
La moda bimodal: encontrar la moda en la siguiente serie de datos. 1,2,3,3,4,4,5,2,1,3,4,2,-3,4,6,3,3,4. La moda bimodal es 3 y 4 porque se repite las mismas veces. Moda ultimodal: Determinar la distribución de moda del número de materias de estudiantes de 4 semestre. #Mat
Frecuencia
5
4
6
11
7
3
8
11
9
5
10
11
Momm: 6, 8,10
De acuerdo al conjunto de datos de moda que corresponde al número de viajes realizados por 14 semanas del daño 2018 por grupos de personas con distribuciones diferentes, se pide encontrar la moda. 85 70 57 21 92 76 57 5 21 12 21 40 57 25 Moda Bm= 21 Y 57 La moda es igual a 57 porque es el valor que más se repite en esa serie de datos. MEDIANA PARA DATOS AGRUPADOS Se requiere calcular la mediana para datos agrupados de un grupo de trabajadores del hotel Sol y maría en una semana. A continuación se muestra la tabla con los datos de dicho trabajo. Horas
X(m.c)
fi
Fi
Xf
55-60
57.5
5
5
287.5
60-65
62.5
18
23
1125
65-70
67.5
20
43
1350
70-75
72.5
50
93
3625
75-80
77.5
17
110
1317.5
80-85
82.5
16
126
1320
85-90
87.5
4
130
350
130 X=9375/130= 72.11 horas Calculamos la mediana para datos agrupados: n/2= 130/2 = 65 Posición de la mediana= 65 Li=70 C=5 n 2
= 65
Fi-1=43 fi=50 Me= 70+5x 65-43 50
9375
Me= 72.2 horas Análisis: De acuerdo al valor obtenido que es de 72.2 horas se puede afirmar que Análisis: De el 50% de la distribución en horas en el trabajo por los empleados del hotel sol y maría se encuentra por encima del promedio en horas que trabajaban los empleados del hotel sol y maría que era de 72.11 horas. MODA PARA DATOS AGRUPADOS Horas 70-75 Mo= 70+5x
M.C (x) 72.5
fi 50
Fi 93
xfi 3625
50- 20 30+ (50-17)
Mo= 72.38 horas TAREA
Calcular la moda de una distribución estadística que viene dada más visitas al parque tayrona con un grupo de turistas las cuales se reflejan en la siguiente tabla: Nota: tenga en cuenta que las visitas se realizaron los días lunes, martes, miércoles, jueves, viernes en el mes de julio. VISITAS
m.c (x)
fi
Fi
xfi
60-63
61.5
5
5
307.5
63-66
64.5
18
23
1.161
66-69
67.5
42
65
2.835
69-72
70,5
27
92
1.904
72-75
75
8
100
600
Mo= 60+5 × 5-0 5+ (5+18) Mo= 88 Visitas al parque tayrona.
CUARTILES IMPARES DATOS NO AGRUPADOS: 0 0 0 0 0 Q1
Q3= 75% Q2=ME
25%
50%
CUARTILES PARES DATOS NO AGRUPADOS:
Q1
25%
Q2
50%
0-0-1-1-2-5-11-25-40-60
Q1=1 25%
Q2=2+5=3,5 2 50%
Q3
75%
Análisis: El valor de 3,5 corresponde del 50% de los datos totales de distribución eell cual está contenido en el cuartil Q de posición 2. Análisis: El valor de 1 corresponde del 25% de los datos totales de distribución el el cual está contenido en el cuartil Q de posición 1. Análisis: El valor de en 11 el corresponde 75% de 3. los datos totales de distribución el cual está contenido cuartil Q dealposición -2, -5, 0, 1, -7, 7, -1, -7, -5, -2, -1, 0, 1, 7
Q1= -2
Q2= -1
Q3= 0
EJERCICIO El cuartil de posición 3 para una distribución de datos dada en edades a una población de estudiantes de estadística de turismo sostenible. EDADES
fi
Fi
30-35
3
3
35-40
7
10
40-45
12
22
45-50
23
45
50-55
14
59
55-60
7
60
Paso 1: Encontrar posición del cuartil QK= k×n = 3×60 4
4
Q3K= 45 Q3= 45+5× 45 ̵ ̵ 22 23
Q3= 50 años
= 23 23
75%
DÉCILES Encontrar el D2 de la siguiente distribución de datos dada en edades para una población N. EDAD
Fi
Fi
30-35
3
3
35-40
7
10
40-45
12
22
45-50
23
45
50-55
14
59
55-60
1
60
P1 DK= D2 K
Kn = 2×60 = 120 = 12 10
10
10
P2 D2= 12
fi
D2= 40+ 12-10
×5
12-10
D2= 40+5 D2= 45 años Análisis: De acuerdo al cuartil 2 podemos interpretar que el 10% de la población para los datos con respecto a los valores inferiores y el resto de los datos que los contiene. Es decir ese porcentaje de datos que corresponde al rango de intervalos 0,2 según la edad o las l as edades entre 30 a 40 años. Los datos que de acuerdo a la distribución y posición calculada de valor 12 indica que las edades entre 40 a 60 años están por encima de los l os mismos de acuerdo al porcentaje de representación (90%). Los valores que podría asumir la población en general a un estudio más complicado para aquellos que están comprendidos entre 45 y 60 años. PERCENTILES P55 PK= 55×60 = 3300 = 33 100
PK55= 33
100
PK55= 45+ 33-22
×5
23-22
P55= 45+ 11
×5 1
P55= 100 años
Análisis: Con base a la distribución de datos actual que corresponde a la distribución de datos actual de 30 a 45 años que concluye el percentil 55 no es representativo para la distribución de datos inicial. Teniendo en cuenta en la parte de representación de valor 100 es igual al máximo de edad de 60 años no permite calcular porcentajes mayores o superiores a 90% por lo cual se solicita ajustar el percentil de posición 55 con percentil de valor menor que permita encontrar la posición de acuerdo a la distribución d istribución de datos en edades entre 30 y 60. MEDIDAS DE DISPERCIÓN La desviación media para datos no agrupados: Encontrar la desviación media de número de viajes a la ciudad de santa marta de grupo de turistas referenciados el último día de los meses enero hasta agosto. Enero
15 turistas
Febrero
12 turistas
Marzo
10 turistas
Abril
18 turistas
Mayo
14 turistas
Junio
22 turistas
Julio
17 turistas
Agosto
20 turistas
8 meses
128 turistas
Dm = 1
= 128
8
X = Dm = 12 1288 8
∑ Xi – X = Dm= 16 viajes
Desviación media para datos agrupados: Calcular la desviación media para los datos que se encuentran en la siguiente tabla de la distribución poblacional de 20 personas las cuales se les pregunta su edad. Edad
X?
fi
(x.f)
30-35
32.5
2
65
9.8
19.6
35-40
37.5
4
150
4.8
19.2
40-45
42.5
8
340
0.2
1.6
45-50
47.5
5
237.5
5.2
26.0
50-55
52.5
1
52.5
10.3
10.3
X = ∑ x fi = 845 = 42.3 N
20
X–X
X – X . fi
Dm= X-X . fi = 77 = 3,85 años, aproximadamente 4 años. N
20
EJERCICIO Un grupo de estudiantes de estadística se encuentra entre las siguientes edades. X
fi
Fi
13-14
3
3
14-15
14
171
15-16
23
40
16-17
10
50
17-18
5
55
18-19
4
59
19-20
1
60
Se pide calcular la posición del cuartil y el cuartil 1: QK= Kn 4
Q1= 1×60 4
Q1= 15 Q1= 14+1× 15-3
144
Q1= 14+1×0.85 Q1= 14.85
Calcular la posición del decil y del decil 6: DK= Kn y D6 10
DK= 6×60
= 36
10
D6= Li+ C Kn – Fi-1 10
f- Fi-1
D6= 15+1
36-17 23-17
= 19 = 3,16×15= 18,16 6
Se pide calcular la posición del percentil y percentil 5 PK= Kn
y P5
100
P5= 5×60
=3
100
P5= 13+1 × 3-0 3- 0
P5=13
EJERCICIO A continuación se tiene un conjunto poblacional de un número de personas a los cuales se les mide su edad y a las ves se obtiene una muestra para calcular lo siguiente: A= varianza B= desviación estándar C= coeficiente de variación D= análisis Edad
X?
fi
(x.f)
X–X
10-15
12.5
5
62.5
182.25
911.25
15-20
17.5
9
157.5
72.25
650.25
20-25
22.5
12
270
12.25
147
25-30
27.5
15
412.5
2.25
33.75
30-35
32.5
11
357.5
42.25
464.75
35-40
37.5
8
300
132.25
1058
1560
G
= 3265 = 54,4 años
2
60
( 2)
2
X – X . fi
3265
54,41 Años ( 2 ) G= √ 54,41
G= 38 años
25%
50%
Nota= C ≥ 25% Heterogéneos
C.V= 28% Análisis: De
acuerdo al resultado obtenido y en signifcancia del resultado de variación el cual corresponde a un 28% indica que los datos son dispersos y/o heterogéneos. También podemos concluir o analizar analizar que del 20% según el resultado de C.V el número de datos correspondiente y heterogéneo para esa población equivale a 17 datos. 100%
60
28,38
?
x= 17 datos
N G
n 2
2
S
G
g
C.V
28.38%
c.v
28,38%
2
S
2
S
= 3.265 60-1
= 3265 59 EJERCICIO DE RANGO INTERCUARTILICO
Los siguientes puntos de datos representan el número de servicios entregados del restaurante Doña Juana a un grupo N de personas. 4 4 10 11 15 7 6 14 12 Paso 1: ordenar los datos
4 4 6 7 10 11 12 14 15 15 Me
Q2 Me= 12+14 = 13
2
Paso 2: RIQ = Q3-Q1
RIQ= 8
EJERCICIO 2
De la siguiente distribución distribución de datos encuentre el rango intercuarlico.
7 9 9 10 10 10 11 12 12 14 Me= 10+10 = 10 2 Me= 9+9 = 9 2
Q1
Me= 12+12 = 12
Q3
2
Paso 3= R.I Q3-Q1= 3
12-9= 3
EJERCICIO
Encuentra el R I Q de los datos de la siguiente grafca 3
Viajes
Los viajes de cada turista a la ciudad de SA.
6
7
5
9
10
11
12
13 14 15
Encuentre por observación el R I Q mayor. El dato 10 corresponde a 3 viajes a San Andrés. BOX PLOTS
DIAGRAMA DE CAJAS
EJERCICIO:
Representa con un diagrama de caja la siguiente distribución. -
Se ha preguntado preguntado a varias varias personas personas apasionad apasionadas as por por el ocio ocio y disrute disrute de de vacaciones vacaciones a Cartagena para que indique en un año cuantas vacaciones ha realizado a dicha ciudad. Los datos son los siguientes:
0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 5 A- Elab Elaborar orar la la tabla tabla de valores valores de la la xi y las las recuenci recuencias as f y Fi B- Hall Hallar ar los cuarles cuarles por e ell método método de la la tabl tabla a de recuenci recuencia a C- Dib Dibuje uje e ell diagr diagrama ama de caja caja y b bigo igotes tes A Xi ( N de vacac acacio ione nes) s) Mini 0 Q1 1 Q2 2 Me
f 3 8 11
Fi 3 11 22
Q3 3 Q4 4 Maxi 5
13 2 1
35 37 38
B- Val Valor mí mín nimo imo Primer Q= Q1 Me = Q2 Tercer Q = Q3 Valor máximo
Bigotes
C- Diag Diagra rama ma de caja caja
2,5
0 1 2.5 3 5
D
1 Q1
2 Q2
3 Q3
4
5
View more...
Comments