Monografia - Estadistica Descriptiva - Valentina Buitrago Navas

August 27, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Monografia - Estadistica Descriptiva - Valentina Buitrago Navas...

Description

 

MONOGRAFIA

VALENTINA BUITRAGO NAVAS

JHANNIER JOHAN JARAMILLO TABIMA

UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE CIENCIAS AMBIENTALES – ESTADISTICA DESCRIPTIVA TEC. EN GESTIÓN DEL TURISMO SOSTENIBLE PEREIRA – RISARALDA 2021

 

MEDIDAS DE TENDENCIA CENTRAL Media aritmética datos no agrupados: Se agrupados: Se pide calcular la media aritmética de datos no agrupados de un conjunto de observaciones de 11 trabajadores que tienen una experiencia laboral en el parque consotá medida en años de servicio. Los tiempos de servicio se reflejan en la siguiente distribución: 14 12 15 13 12 14 16 12 14 14 12 Xi= 148/ 11= 13,45 años Análisis: 13.45 años son en promedio el tiempo de servicios total de trabajo de las personas, los individuos, los colaboradores, empleados del parque consotá. Media aritmética datos agrupados: determinar la media aritmética de la siguiente distribución de datos recolectados de un estudio de vulnerabilidad de unas viviendas ante eventos naturales que se encuentran en la siguiente tabla. Xi

Fi

xixFi

1

3

3

2

5

10

3

7

21

4

5

20

5

1

5

  15

21

59

M = 59/21 = 2,8

 

2,8 es el número de viviendas que pueden versen afectadas ante eventos naturales teniendo en cuenta la cantidad de habitantes de dicha población. Mediana para datos impar: Se tienen en una distribución de datos una cantidad de observaciones de valor impar. 14 12 15 13 12 14 16 12 14 12 12 Solución: 12 12 12 12 12 13 14 14 14 15 16 = 11= N P= 13 Me= n+1/2= 11+1/2= 12/2= 6 Tarea: Encontrar la posición de la mediana para una serie de datos que se indica a continuación: 4 1 8 10 14 Solución: 1 4 8 10 14 P=8 Me= 5+1/2= 6/2=3 Mediana para datos par: Encontrar la mediana para una cantidad de observaciones par. 5-8-8-9-6-8-2-9-6-5 PI= 2-5-5-6-6-8-8-8-9-9 npar= Me= n/2=6+8/2=14/2= n/2=6+8/2=14/2=77 La moda: Para la siguiente serie de datos encontrar la moda e indicar a cual pertenece. Um: 1,2,3,3,4,5,6,7,3,9,1,3. La moda unimodal es igual a 3 porque es el valor que más se repite en esa serie de datos.

 

La moda bimodal: encontrar la moda en la siguiente serie de datos. 1,2,3,3,4,4,5,2,1,3,4,2,-3,4,6,3,3,4. La moda bimodal es 3 y 4 porque se repite las mismas veces. Moda ultimodal: Determinar la distribución de moda del número de materias de estudiantes de 4 semestre. #Mat

Frecuencia

5

4

  6

11

  7

3

8

11

9

5

  10

11

Momm: 6, 8,10

De acuerdo al conjunto de datos de moda que corresponde al número de viajes realizados por 14 semanas del daño 2018 por grupos de personas con distribuciones diferentes, se pide encontrar la moda. 85 70 57 21 92 76 57 5 21 12 21 40 57 25 Moda Bm= 21 Y 57 La moda es igual a 57 porque es el valor que más se repite en esa serie de datos. MEDIANA PARA DATOS AGRUPADOS Se requiere calcular la mediana para datos agrupados de un grupo de trabajadores del hotel Sol y maría en una semana. A continuación se muestra la tabla con los datos de dicho trabajo. Horas

X(m.c)

fi

Fi

Xf

 

 

55-60

57.5

5

5

287.5

60-65

62.5

18

23

  1125

65-70

67.5

20

43

1350

70-75

72.5

50

93

3625

75-80

77.5

17

110

1317.5

80-85

82.5

16

126

1320

85-90

87.5

4

130

350

130 X=9375/130= 72.11 horas Calculamos la mediana para datos agrupados: n/2= 130/2 = 65 Posición de la mediana= 65 Li=70 C=5 n 2

= 65

Fi-1=43 fi=50 Me= 70+5x 65-43 50

9375

 

Me= 72.2 horas Análisis: De acuerdo al valor obtenido que es de 72.2 horas se puede afirmar que Análisis: De el 50% de la distribución en horas en el trabajo por los empleados del hotel sol y maría se encuentra por encima del promedio en horas que trabajaban los empleados del hotel sol y maría que era de 72.11 horas. MODA PARA DATOS AGRUPADOS Horas 70-75 Mo= 70+5x

M.C (x) 72.5

fi 50

Fi 93

xfi 3625

50- 20 30+ (50-17)

Mo= 72.38 horas TAREA

Calcular la moda de una distribución estadística que viene dada más visitas al parque tayrona con un grupo de turistas las cuales se reflejan en la siguiente tabla: Nota: tenga en cuenta que las visitas se realizaron los días lunes, martes, miércoles,  jueves, viernes en el mes de julio. VISITAS

m.c (x)

fi

Fi

xfi

60-63

61.5

5

5

307.5

63-66

64.5

18

23

1.161

66-69

67.5

42

65

2.835

69-72

70,5

27

92

1.904

72-75

75

8

100

600

 

Mo= 60+5 × 5-0 5+ (5+18) Mo= 88 Visitas al parque tayrona.

CUARTILES IMPARES DATOS NO AGRUPADOS: 0 0 0 0 0 Q1

Q3= 75% Q2=ME

25%

50%

CUARTILES PARES DATOS NO AGRUPADOS:  

Q1

25%

Q2

50%

0-0-1-1-2-5-11-25-40-60

Q1=1 25%

Q2=2+5=3,5   2 50%

Q3

 75%

 

Análisis: El valor de 3,5 corresponde del 50% de los datos totales de distribución eell cual está contenido en el cuartil Q de posición 2. Análisis: El valor de 1 corresponde del 25% de los datos totales de distribución el el cual está contenido en el cuartil Q de posición 1. Análisis: El valor de en 11 el corresponde 75% de 3. los datos totales de distribución el cual está contenido cuartil Q dealposición -2, -5, 0, 1, -7, 7, -1, -7, -5, -2, -1, 0, 1, 7

Q1= -2

Q2= -1

Q3= 0

EJERCICIO El cuartil de posición 3 para una distribución de datos dada en edades a una población de estudiantes de estadística de turismo sostenible. EDADES

fi

Fi

30-35

3

3

35-40

7

10

40-45

12

22

45-50

23

45

50-55

14

59

 

55-60

7

60

Paso 1: Encontrar posición del cuartil QK= k×n = 3×60 4

4

Q3K= 45 Q3= 45+5× 45 ̵ ̵ 22 23

Q3= 50 años

= 23 23

75%

DÉCILES Encontrar el D2 de la siguiente distribución de datos dada en edades para una población N. EDAD

Fi

Fi

30-35

3

3

35-40

7

10

40-45

12

22

45-50

23

45

50-55

14

59

55-60

1

60

 

P1 DK= D2 K

Kn = 2×60 = 120 = 12 10

10

10

P2 D2= 12

fi

D2= 40+ 12-10

×5

12-10

D2= 40+5 D2= 45 años Análisis: De acuerdo al cuartil 2 podemos interpretar que el 10% de la población para los datos con respecto a los valores inferiores y el resto de los datos que los contiene. Es decir ese porcentaje de datos que corresponde al rango de intervalos 0,2 según la edad o las l as edades entre 30 a 40 años. Los datos que de acuerdo a la distribución y posición calculada de valor 12 indica que las edades entre 40 a 60 años están por encima de los l os mismos de acuerdo al porcentaje de representación (90%). Los valores que podría asumir la población en general a un estudio más complicado para aquellos que están comprendidos entre 45 y 60 años. PERCENTILES P55 PK= 55×60 = 3300 = 33 100

PK55= 33

100

 

PK55= 45+ 33-22

×5

23-22

P55= 45+ 11

×5 1

P55= 100 años

Análisis: Con base a la distribución de datos actual que corresponde a la distribución de datos actual de 30 a 45 años que concluye el percentil 55 no es representativo para la distribución de datos inicial. Teniendo en cuenta en la parte de representación de valor 100 es igual al máximo de edad de 60 años no permite calcular porcentajes mayores o superiores a 90% por lo cual se solicita ajustar el percentil de posición 55 con percentil de valor menor que permita encontrar la posición de acuerdo a la distribución d istribución de datos en edades entre 30 y 60. MEDIDAS DE DISPERCIÓN La desviación media para datos no agrupados: Encontrar la desviación media de número de viajes a la ciudad de santa marta de grupo de turistas referenciados el último día de los meses enero hasta agosto. Enero

15 turistas

Febrero

12 turistas

Marzo

10 turistas

Abril

18 turistas

Mayo

14 turistas

Junio

22 turistas

Julio

17 turistas

 

Agosto

20 turistas

8 meses

128 turistas

Dm = 1

= 128

8

X = Dm = 12 1288   8

∑ Xi – X = Dm= 16 viajes

Desviación media para datos agrupados: Calcular la desviación media para los datos que se encuentran en la siguiente tabla de la distribución poblacional de 20 personas las cuales se les pregunta su edad. Edad

X?

fi

(x.f)

30-35

32.5

2

65

9.8

19.6

35-40

37.5

4

150

4.8

19.2

40-45

42.5

8

340

0.2

1.6

45-50

47.5

5

237.5

5.2

26.0

50-55

52.5

1

52.5

10.3

10.3

X = ∑ x fi = 845 = 42.3 N

20

X–X

X – X . fi

 

Dm= X-X . fi = 77 = 3,85 años, aproximadamente 4 años. N

20

EJERCICIO Un grupo de estudiantes de estadística se encuentra entre las siguientes edades. X

fi

Fi

13-14

3

3

14-15

14

171

15-16

23

40

16-17

10

50

17-18

5

55

18-19

4

59

19-20

1

60

Se pide calcular la posición del cuartil y el cuartil 1: QK= Kn 4

Q1= 1×60 4

Q1= 15 Q1= 14+1× 15-3

144

 

Q1= 14+1×0.85 Q1= 14.85

Calcular la posición del decil y del decil 6: DK= Kn y D6 10

DK= 6×60

= 36

10

D6= Li+ C Kn – Fi-1 10

 

f- Fi-1

D6= 15+1

36-17 23-17

= 19 = 3,16×15= 18,16 6

Se pide calcular la posición del percentil y percentil 5 PK= Kn

y P5

100

P5= 5×60

=3

100

P5= 13+1 × 3-0 3- 0

 

P5=13

EJERCICIO A continuación se tiene un conjunto poblacional de un número de personas a los cuales se les mide su edad y a las ves se obtiene una muestra para calcular lo siguiente: A= varianza B= desviación estándar C= coeficiente de variación D= análisis Edad

X?

fi

(x.f)

X–X

10-15

12.5

5

62.5

182.25

911.25

15-20

17.5

9

157.5

72.25

650.25

20-25

22.5

12

270

12.25

147

25-30

27.5

15

412.5

2.25

33.75

30-35

32.5

11

357.5

42.25

464.75

35-40

37.5

8

300

132.25

1058

1560

G

 

= 3265 = 54,4 años

2

  60

( 2)

2

X – X . fi

3265

 

54,41  Años ( 2 ) G= √ 54,41

G= 38 años

25%

50%

Nota= C ≥ 25% Heterogéneos

C.V= 28% Análisis: De

acuerdo al resultado obtenido y en signifcancia del resultado de variación el cual corresponde a un 28% indica que los datos son dispersos y/o heterogéneos. También podemos concluir o analizar analizar que del 20% según el resultado de C.V el número de datos correspondiente y heterogéneo para esa población equivale a 17 datos. 100%

60

28,38

?

x= 17 datos

N G

n 2

2

 

S

G

 

g

C.V

28.38%

c.v

28,38%

2

S

2

S

 = 3.265  60-1

= 3265 59 EJERCICIO DE RANGO INTERCUARTILICO

Los siguientes puntos de datos representan el número de servicios entregados del restaurante Doña Juana a un grupo N de personas. 4 4 10 11 15 7 6 14 12 Paso 1: ordenar los datos

 

4 4 6 7 10 11 12 14 15 15 Me

Q2 Me= 12+14 = 13  

2

Paso 2: RIQ = Q3-Q1  

RIQ= 8

EJERCICIO 2

De la siguiente distribución distribución de datos encuentre el rango intercuarlico.

7 9 9 10 10 10 11 12 12 14 Me= 10+10 = 10 2 Me= 9+9 = 9 2

Q1

Me= 12+12 = 12

Q3

2

Paso 3= R.I Q3-Q1= 3  

12-9= 3

EJERCICIO

Encuentra el R I Q de los datos de la siguiente grafca 3

Viajes

Los viajes de cada turista a la ciudad de SA.

 

 

6

7

5

9

10

11

12

13 14 15

Encuentre por observación el R I Q mayor. El dato 10 corresponde a 3 viajes a San Andrés. BOX PLOTS

DIAGRAMA DE CAJAS

EJERCICIO:

Representa con un diagrama de caja la siguiente distribución. -

Se ha preguntado preguntado a varias varias personas personas apasionad apasionadas as por por el ocio ocio y disrute disrute de de vacaciones vacaciones a Cartagena para que indique en un año cuantas vacaciones ha realizado a dicha ciudad. Los datos son los siguientes:

0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 5 A- Elab Elaborar orar la la tabla tabla de valores valores de la la xi y las las recuenci recuencias as f y Fi B- Hall Hallar ar los cuarles cuarles por e ell método método de la la tabl tabla a de recuenci recuencia a C- Dib Dibuje uje e ell diagr diagrama ama de caja caja y b bigo igotes tes A Xi ( N de vacac acacio ione nes) s) Mini 0 Q1 1 Q2 2 Me

f 3 8 11

Fi 3 11 22

Q3 3 Q4 4 Maxi 5

13 2 1

35 37 38

B- Val Valor mí mín nimo imo Primer Q= Q1 Me = Q2 Tercer Q = Q3 Valor máximo

Bigotes

C- Diag Diagra rama ma de caja caja

2,5

0 1 2.5 3 5

 

D

1 Q1

2 Q2

3 Q3

4

5

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF