Trabajo Estadística

Share Embed Donate


Short Description

Estadísticas trabajo de universidad...

Description

UNIVERSIDAD TECNOLÓGICA DEL PERÚ

TRABAJO FINAL

Trabajo que como parte del curso de ESTADÍSTICA INFERENCIAL presentan los alumnos

LASTRES SORIANO, Pedro Martín Código - U17200547 HILARIO TRUJILLO, Salvador Mauricio Código - 0711416 MENDOZA BAUTISTA, Mirella Wendy Código  – U18217558

Lima, 13 de julio del 2017

1. Título Del Trabajo Aplicado: Sistema operativo más usado por los estudiantes de la UTP en sus celulares.

2. Objetivo: Se desea saber qué sistema operativo es usado frecuentemente para desarrollar una aplicación que se usara para los estudiantes de la UTP.

3. Modelo De Encuesta: Elaborar una base b ase de datos dat os con un mínimo de 2 variables (1cualitativa nominal y 1 cuantitativa continua) que puede estar relacionada de preferencia con alguna de las actividades de la carrera que está estudiando. La base de datos deberá tener 60 unidades de análisis.

4. Características De La Base De Datos: 4.1. Población:  Sistemas operativos usados por los estudiantes de la UTP en sus celulares.

4.2. Muestra: Sistema operativo usado por 60 estudiantes de la UTP en sus celulares.

4.3. Unidad de análisis:  Sistema operativo usado por un estudiante de la UTP en su celular.

4.4. Variables: Edad, género, carrera, estado laboral, uso de Smartphone, horas de uso diario de Smartphone, Sistema operativo de Smartphone.

4.5. Tipo de variable: ESCALA DE

VARIABLE

TIPO

Edad

Cuantitativa Continua

Razón

Género

Cualitativa Dicotómica

Nominal

Carrera

Cualitativa Politómica

Nominal

Uso de Smartphone

Cualitativa Dicotómica

Ordinal

Horas de uso diario de Smartphone

Cuantitativa Continua

Razón

Sistema Operativo de Smartphone

Cualitativa Politómica

Nominal

MEDICION

5. Elaboración De Tablas De Frecuencia: EDAD

Xi

fi

Fi

ni

Ni

Xi *fi

hi *100%

Hi*100%

17

-

20

18,5

18

18

0,30

0,30

333,00

30%

30%

20

-

23

21,5

14

32

0,23

0,53

301,00

23%

53%

23

-

26

24,5

12

44

0,20

0,73

294,00

20%

73%

26

-

29

27,5

11

55

0,18

0,92

302,50

18%

92%

29

-

32

30,5

2

57

0,03

0,95

61,00

3%

95%

32

-

35

33,5

2

59

0,03

0,98

67,00

3%

98%

35 - 38 TOTAL

36,5

1

60

0,02

1,00

36,50

2%

100%

1395,00

100%

60

1

35-38

1

   S    E    D32-35    A    D    E 29-32    E    D 26-29    O    L    A    V23-26    R    E    T 20-23    N    I

2 2 11 12 14

17-20

18

0

5

10

15

20

FRECUENCIA ABSOLUTA

H.U.S.

Xi

fi

Fi

ni

Ni

Xi *fi

hi *100%

Hi*100%

3,0

- 4,0

3,5

3

3

0,05

0,05

11

5%

5%

4,0

- 5,0

4,5

8

11

0,13

0,18

36

13%

18%

5,0

- 6,0

5,5

16

27

0,27

0,45

88

27%

45%

6,0

- 7,0

6,5

13

40

0,22

0,67

85

22%

67%

7,0

- 8,0

7,5

9

49

0,15

0,82

68

15%

82%

8,0

- 9,0

8,5

8

57

0,13

0,95

68

13%

95%

9,0 - 10,0 TOTAL

9,5

3

60

0,05

1,00

29

5%

100%

383

100%

60

9-10  .    S  .    U  .    H    E    D    I    K    A    V    R    E    T    N    I

1,00

3

8-9

8

7-8

9

6-7

13

5-6

16

4-5

8

3-4

3

0

5

10 FRECUENCIA ABSOLUTA

15

20

GENERO

fi

Fi

ni

Ni

hi*100%

M

35

35

0,58

0,58

58%

58%

F

25

60

0,42

1,00

42%

100%

TOTAL

60

   O    R    E    N    E    G

1,00

Hi*100%

100%

F

25

M

35

0

10

20

30

40

FRECUENCIA ABSOLUTA

S.O.S.

fi

Fi

ni

Ni

hi*100%

Hi*100%

ANDROID

43

43

0,72

0,72

72%

72%

iOS

14

57

0,23

0,95

23%

95%

indows Phon

3

60

0,05

1,00

5%

100%

TOTAL

60

1,00

WINDOWS PHONE  .    S  .    O  .    S

100%

3

IOS

14

ANDROID

43

0

10

20

30

FRECUENCIA ABSOLUTA

40

50

6. Medidas de tendencia central: 6.1. Media

EDAD

 ̅ = 23.25 años

El promedio de edad de los alumnos que estudian en el turno noche en la UTP es de 23.367 años. HORAS DE USO DE SMARTPHONE

̅ = 6.38 horas

6.2. Mediana

EDAD

HORAS DE USO DE SMARTPHONE

 = 22.57 años  = 6.23 horas

6.3. Moda

EDAD

HORAS DE USO DE SMARTPHONE

 = 19.45 años  = 5.73 horas

7. Medidas De Dispersión 7.1. Varianza

EDAD

 = 19.61 ñ2

HORAS DE USO DE SMARTPHONE

7.2. Desviación estándar

EDAD

 = 4.43 años

HORAS DE USO DE SMARTPHONE

7.3. Coeficiente de variación

EDAD

 = 19.05 %

HORAS DE USO DE SMARTPHONE

 = 2.41 ℎ2

 =1.55 horas  = 24.32 %

8. Con la información obtenida se deberán hacer los siguientes cálculos: 8.1 Intervalo de confianza para la medía de una población Los docentes desean saber cuánto tiempo emplea el estudiante de la UTP diariamente en el uso de su Smartphone, para lo cual se toma una muestra de 60 estudiantes, obteniendo una media muestral de 6.38 y su varianza muestral de 2.41 establecer un intervalo de confianza del 90 % para la media. Se considerará una distribución normal. Variable: X: horas de uso de Smartphone por los estudiantes de la UTP H.U.S.

Xi

fi

Fi

ni

Ni

Xi*fi

((Xi-X)^2)*fi

3.0 -

4.0

3.5

3

3

0.05

0.05

11

24.94

4.0 -

5.0

4.5

8

11

0.13

0.18

36

28.38

5.0 -

6.0

5.5

16

27

0.27

0.45

88

12.48

6.0 -

7.0

6.5

13

40

0.22

0.67

85

0.18

7.0 -

8.0

7.5

9

49

0.15

0.82

68

11.22

8.0 -

9.0

8.5

8

57

0.13

0.95

68

35.84

9.0 -

10.0

9.5

3

60

0.05

1.00

29

29.14

383

142.18

TOTAL

60

1.00

Tabla. Datos agrupados de 60 estudiantes de la UTP.

DATOS: n= 60 x= ∑ Xi*fi =6.38

  s  =− 2

∑ ((Xi-X)^2)*fi =2.41

s = 1.55



Nivel de confianza: 1-  = 0.90 

 ⁄2

Z  =1.645

⁄2 =0.05

=⁄ √  ≤≤+⁄ √ 

=6.381.645 1.√ 6505 ≤≤6. 3 8+1. 6 45 1.√ 6505 ≤ ≤ IC =6.051 

6.709

Conclusión: Para la media de uso de smartphone por los estudiantes se tiene un intervalo de confianza de 6.051 a 6.709 con un nivel de confianza de 0.9

8.2 Intervalo de confianza para las medias de dos poblaciones. Se desea comparar el tiempo de uso de smartphone entre los estudia ntes de la Sede Lima Centro (SLC) y la Sede Lima Norte (SLN), para lo cual se tiene una muestra de 30 alumnos por Sede, obteniendo en la SLC una media de 6.77 h y varianza muestral de 2.25 h y en la SLN una media de 5.8 h y varianza muestral de 2.03 h. calcular un intervalo de confianza de 96% sobre donde y corresponden a la media de uso diario de Smartphone.

  ,

 

Variable: X: tiempo de uso de Smartphone por los estudiantes de la SLN H.U.S.

Xi

fi

Fi

ni

Ni

Xi*fi

((XiX)^2)*fi

3.0

-

5.0

4.0

9

9

0.30

0.30

36

29.16

5.0

-

7.0

6.0

15

24

0.50

0.80

90

0.60

7.0

-

9.0

8.0

6

30

0.20

1.00

48

29.04

9.0

- 11.0

10.0

0

30

0.00

1.00

0

0.00

11.0 - 13.0

12.0

0

30

0.00

1.00

0

0.00

174

58.80

TOTAL

30

1.00

Tabla. Datos agrupados de 30 estudiantes de la UTP sede Lima Norte.

Variable: Y: tiempo de uso de Smartphone por los estudiantes de la SLC H.U.S.

Yi

fi

Fi

ni

Ni

Yi*fi

((Yi-Y)^2)*fi

4.5

-

5.5

5.0

8

8

0.27

0.27

40

24.97

5.5

-

6.5

6.0

7

15

0.23

0.50

42

4.11

6.5

-

7.5

7.0

5

20

0.17

0.67

35

0.27

7.5

-

8.5

8.0

4

24

0.13

0.80

32

6.08

8.5

-

9.5

9.0

6

30

0.20

1.00

54

29.93

203

65.37

TOTAL

30

1.00

Tabla. Datos agrupados de 30 estudiantes de la UTP sede Lima Centro.

DATOS: nx= 30 x= ∑ Xi*fi =5.8

  s  =− ny= 30  y=  s  =− 2

∑ ((Xi-X)^2)*fi =2.03

s = 1.42

∑ Yi*fi =5.8

2

∑ ((Yi-Y)^2)*fi =2.25

s = 1.50



Nivel de confianza: 1-  = 0.96 

⁄2 =0.02

 ⁄2

Z  =2.05

            =   ⁄  +  ≤  ≤ +⁄   + 

=6.775.82.05 230.03 + 2.3025 ≤  ≤6.775.8+2.05  230.03 + 2.3025 ≤   ≤ IC =0.196 

1.744

Conclusión: La diferencia de medias del tiempo de uso de smartphone por los estudiantes de las sedes lima norte y lima centro está comprendida entre 0.196 y 1.744 con un nivel de confianza de 0.96.

8.3 Prueba de hipótesis para la media de una población El director de la UTP menciona que sus alumnos pasan en promedio 5.5 horas en su smartphone, para lo cual se toma una muestra de 60 estudiant es obteniendo una media muestral de 6.38 h con una desviación estándar muestral de 1.55. ¿Esto sugiere que los alumnos usan su Smartphone más de 4.5 horas a un nivel de significancia de 0.05? Variable: X: tiempo de uso de Smartphone por los estudiantes de la UTP H.U.S.

Xi

fi

Fi

ni

Ni

Xi*fi

((Xi-X)^2)*fi

3.0 -

4.0

3.5

3

3

0.05

0.05

11

24.94

4.0 -

5.0

4.5

8

11

0.13

0.18

36

28.38

5.0 -

6.0

5.5

16

27

0.27

0.45

88

12.48

6.0 -

7.0

6.5

13

40

0.22

0.67

85

0.18

7.0 -

8.0

7.5

9

49

0.15

0.82

68

11.22

8.0 -

9.0

8.5

8

57

0.13

0.95

68

35.84

9.0 -

10.0

9.5

3

60

0.05

1.00

29

29.14

383

142.18

TOTAL

60

1.00

Tabla. Datos agrupados de 60 estudiantes de la UTP.

DATOS: n= 60 x= ∑ Xi*fi =6.38

  s  =− 2

∑ ((Xi-X) ^2)*fi =2.41

   =5. 5 ≠5.5

s = 1.55

a) Plantear las hipótesis Ha: Ho:



b) Nivel de significancia:  = 0.025 

c) Estadístico de prueba

=     √  5 = 6.31.85. 5√ 605 =4.398

d) Regla crítica

e) Regla de decisión

≥ /   ≤ / 4.398 1.645 v

Se rechaza el Ho

f) Conclusión Se concluye que el tiempo de uso de Smartphone entre los estudiantes es de 5.5 horas a un nivel de significancia de 0.05.

8.4 Prueba de hipótesis para dos medias poblacionales Pruebe la hipótesis de que no hay diferencia en el tiempo promedio de uso de Smartphone de las dos sedes. Se estima que las poblaciones se distribuyen de forma aproximadamente normal. Se usará un nivel de significancia de 0.05. Variable: X: tiempo de uso de Smartphone por los estudiantes de la SLN H.U.S.

Xi

fi

Fi

ni

Ni

Xi*fi

((XiX)^2)*fi

3.0

-

5.0

4.0

9

9

0.30

0.30

36

29.16

5.0

-

7.0

6.0

15

24

0.50

0.80

90

0.60

7.0

-

9.0

8.0

6

30

0.20

1.00

48

29.04

9.0

- 11.0

10.0

0

30

0.00

1.00

0

0.00

11.0 - 13.0

12.0

0

30

0.00

1.00

0

0.00

174

58.80

TOTAL

30

1.00

Tabla. Datos agrupados de 30 estudiantes de la UTP sede Lima Norte.

Variable: Y: tiempo de uso de Smartphone por los estudiantes de la SLC H.U.S.

Yi

fi

Fi

ni

Ni

Yi*fi

((Yi-Y)^2)*fi

4.5

-

5.5

5.0

8

8

0.27

0.27

40

24.97

5.5

-

6.5

6.0

7

15

0.23

0.50

42

4.11

6.5

-

7.5

7.0

5

20

0.17

0.67

35

0.27

7.5

-

8.5

8.0

4

24

0.13

0.80

32

6.08

8.5

-

9.5

9.0

6

30

0.20

1.00

54

29.93

203

65.37

TOTAL

30

1.00

Tabla. Datos agrupados de 30 estudiantes de la UTP sede Lima Centro.

Datos: nx= 30 x= ∑ Xi*fi =5.8

  s  =− ny= 30  y=  s  =− 2

∑ ((Xi-X)^2)*fi =2.03

s = 1.42

∑ Yi*fi =5.8

2

∑ ((Yi-Y)^2)*fi =2.25

s = 1.50

   =≠

a) Plantear las hipótesis Ha: Ho:

       =  +     = 5. 826..25 +772.003 30 30 =2.56

b) Nivel de significancia:  = 0.025  c) Estadístico de prueba

d) Regla crítica

e) Regla de decisión

≥ /   ≤ / 2.56 1.645 v

Se rechaza el Ho

f) Conclusión Se concluye que el tiempo de uso de Smartphone entre las dos sedes no es diferente a un nivel de significancia de 0.05.

8.5 Intervalo de confianza para la proporción de una población En una muestra aleatoria de n=60 estudiantes de la UTP, se encuentra que x=35 son del género masculino. Calcule un intervalo de confianza del 95 % para la proporción real de los estudiantes que son de la UTP y que además son del género masculino.

GENERO

fi

Fi

ni

Ni

hi*100%

Hi*100%

M

35

35

0.58

0.58

58%

58%

F

25

60

0.42

1.00

42%

100%

TOTAL

60

1.00

100%

Tabla. Datos agrupados de 60 estudiantes de la UTP.

DATOS: x = estudiante de la UTP del género masculino  p X   = proporción de estudiantes de la UTP que son del género masculino  p X  = 35/60 = 0.58 q X = (1 - 0.58) = 0.42 n= 60 N.C. = 95 % Z   /2  = 1.96

= ⁄  ≤≤ +⁄   4 2 =0.581.96 0.58∗0.60 42 ≤≤0. 5 8+1. 9 6 0.58∗0. 60 =0.=.≤≤. 5 80. 1 2≤≤0. 5 8+0. 1 2 Conclusión: La proporción real de estudiantes que son de la UTP y que además son del género masculino se encuentra entre 46% y 70%, a un nivel de confianza de 95%.

8.6 Intervalo de confianza para las proporciones de dos poblaciones Se considera que la sede Lima Centro de la UTP es en la que hay más estudiantes mujeres que varones. Para determinar si es cierta esta afirmación, se toman datos de estudiantes de la sede Lima Centro y la sede Lima Norte de la UTP. Si se encuentra que 12 de 30 estudiantes de la sede Lima Centro de la UTP son mujeres y 13 de 30 estudiantes de la sede Lima Norte también lo son, calcule un intervalo de confianza de 90 % para la diferencia verdadera en la proporción de estudiantes mujeres entre la sede Lima Centro y Lima Norte. GENERO

fi

Fi

ni

Ni

hi*100%

M

18

18

0.60

0.60

60%

60%

F

12

30

0.40

1.00

40%

100%

TOTAL

30

1.00

Hi*100%

100%

Tabla. Datos agrupados de 30 estudiantes de la UTP Sede Lima Centro. GENERO

fi

Fi

ni

Ni

hi*100%

Hi*100%

M

17

17

0.57

0.57

57%

57%

F

13

30

0.43

1.00

43%

100%

TOTAL

30

1.00

100%

Tabla. Datos agrupados de 30 estudiantes de la UTP Sede Lima Norte.

DATOS: x = estudiante de la UTP sede Lima Centro que es mujer  y = estudiante de la UTP sede Lima Norte que es mujer  p x   = proporción de estudiante de la UTP sede Lima Centro que son mujeres  p  y  = proporción de estudiante de la UTP sede Lima Norte que son mujeres  p x  = 12/30 = 0.40 p  y  = 13/30 = 0.43 q x= q  y = (1 - 0.43) = 0.57   (1 - 0.40) = 0.60 n x= n  y  = 30   30 N.C. = 90 % Z   /2  = 1.64

=( )⁄  +  ≤  ≤( )+⁄  + 

6 0 0. 4 3∗0. 5 7 0 . 4 0∗0. 6 0 0. 4 3∗0. 5 7   =0.400.431.64 0.40∗0. + ≤  ≤0. 4 00. 4 3+1. 6 4 +   30 30 30 30 =0.=.≤ 0 30. 2 1≤≤≤.0.03 +0.21 Conclusión: La diferencia verdadera en la proporción de estudiantes mujeres entre la sede Lima Centro y Lima Norte se encuentra en el rango de -24% y 18%, a un nivel de confianza de 90%.

8.7 Prueba de hipótesis para la proporción de una población. Se considera que en la UTP el 44 % de los estudiantes son del género masculino. Los resultados de una nueva encuesta realizada a 60 estudiantes de la UTP revelaron que 35 de ellos son del género masculino. ¿Esta evidencia es suficiente para concluir que hay un crecimiento significativo en la proporción de estudiantes de la UTP que son del género ma sculino? Utilice un nivel de significancia de 0.05. GENERO

fi

Fi

ni

Ni

hi*100%

M

35

35

0.58

0.58

58%

58%

F

25

60

0.42

1.00

42%

100%

TOTAL

60

1.00

Hi*100%

100%

Tabla. Datos agrupados de 60 estudiantes de la UTP.

DATOS: x = estudiante de la UTP que es del género masculino  p X   = proporción de estudiantes de la UTP que son del género masculino  p x   = 35/60 = 0.58  p 0 = 0.44 n= 60 N.S. = 0.05 a)  Plantear la hipótesis H 0:  p x  ≤ 0.44 H a:  p x   > 0.44  b)  Especificar nivel de significancia N.S. =   = 0.05 c)  Establecer la estadística de prueba

   =  1   80.4444  =  00..45410. 60  = 0.0.01644  =0.19

d)  Región crítica H a:  p x   > p 0

 =1.64  =2. 1 8   =1. 6 4  =2.18> =1.64

e)  Regla de decisión

Rechazar H 0:  p x  ≤ 0.44  f)  Conclusión Hay un crecimiento significativo en la proporción de estudiantes de la UTP que son del género masculino

8.8 Prueba de hipótesis para las proporciones de dos poblaciones. En un estudio sobre el sistema operativo de Smartphone que usan los estudiantes de la UTP, se seleccionan dos grupos de estudiantes de la UTP de entre 17 y 38 años de edad que usan Smartphone, y a cada uno se le preguntó si utilizaba el sistema operativo Android u otro. Se seleccionó un grupo de estudiantes de la UTP menores de 23 años y otro de estudiantes de la UTP con 23 años a más. Se obtuvo que 23 de 32 estudiantes de la UTP menores de 23 años usan el sistema operativo Android en sus smartphone’s, en comparación con 20 de 28 estudiantes de la UTP con 23 años a más. ¿Podemos concluir que la proporción de estudiantes de la UTP menores de 23 años que usan Android es significativamente mayor que la proporción de estudiantes de la UTP con 23 años a más que también lo usan? Usar un nivel de significancia de 0.01. S.O.S. ANDROID

OTROS

TOTAL

EDAD

fi

Fi

ni

Ni

hi*100%

Hi*100%

=23

20

20

0.71

0.71

71%

71%

=23

8

28

0.29

1.00

29%

100%

32

1.00

100%

28

1.00

100%

Tabla. Datos agrupados de 60 estudiantes de la UTP.

DATOS: x = estudiante de la UTP menor de 23 años que usa el S.O. Android  y = estudiante de la UTP con 23 años a más que usa el S.O. Android  p X   = proporción de estudiantes de la UTP menores de 23 años que usan el S.O. Android  p  y  = proporción de estudiantes de la UTP de 23 años a más que usan el S.O. Android  p x  = 23/32 = 0.72 p  y  = 20/28 = 0.71 n x  = 32 n  y  = 28 N.S. = 0.01 a)  Plantear la hipótesis H 0:  p x  ≤ p  y  H a:  p x   > p  y b)  Especificar nivel de significancia N.S. =   = 0.01 c)  Establecer la estadística de prueba

 =  1 1  1 + 

= ∑+∑  +

43 = 23+20 = 32+28 0.76020.=0.7712  =  0.7210.72 1 + 1  32 28  = 0.0.0112  =0.83

d)  Región crítica H a:  p x   > p  y

 =2.32  =0. 8 3   =2. 3 2  =0.8345,722  =  ≠2.55

Como  , rechazamos la hipótesis nula ( H0) la cual significa que la variaza es diferente de 2.55

H0: Ha:

2.55 (se rechaza)  (se acepta)

f) Conclusión:

Con un nivel de significación de 5% la varianza poblacional del promedio de horas diarias del uso de un Smartphone es diferente a 2.55.

8.12 Prueba de hipótesis para la razón de dos varianzas poblaciones. Un profesor de estadistica de la UTP estudia la variabilidad de dos muestras en función al promedio de edades en una encuesta relizada por sus alumnos .Se sabe que las muestras tienen una distribucion normal .Con un valor de significancia del 5 %. ¿Se puede concluir que hay mas variacion en la muestra A que el la B ?

Estas muestras aleatorias son de 30 cada una y son las siguientes : A

B

19

18

19

23

23

26

26

24

20

22

24

22

20

17

23

25

21

32

27

18

19

24

24

19

26

26

27

22

18

27

27

21

24

28

27

21

19

30

21

20

29

25

22

25

32

24

18

26

17

19

19

21

19

19

22

19

36

20

21

19

Datos :

a) H0= Ha= b)

Muestar A

Muestra B

S 2 =5.523

S 2 =2.908

n=30 V=30-1=29

n=30 V=30-1=29

 σ2A≤ σ2B σ2A> σ2B

 

=0,05 /2= 0,025

c) Estadístico de prueba

f 0,05;29;29=1,861

d) Región crítica

e)Regla de decisión:

  =    = .. =.

1.904 > 1.861 se rechaza Ho f)Conclusión: Como f calculado es 1.904 cae en la region critica rechazamos la hipotesis nula y concluimos que los valores del grupo A , tienen mayor variacion.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF