Trabajo Estadística
Short Description
Estadísticas trabajo de universidad...
Description
UNIVERSIDAD TECNOLÓGICA DEL PERÚ
TRABAJO FINAL
Trabajo que como parte del curso de ESTADÍSTICA INFERENCIAL presentan los alumnos
LASTRES SORIANO, Pedro Martín Código - U17200547 HILARIO TRUJILLO, Salvador Mauricio Código - 0711416 MENDOZA BAUTISTA, Mirella Wendy Código – U18217558
Lima, 13 de julio del 2017
1. Título Del Trabajo Aplicado: Sistema operativo más usado por los estudiantes de la UTP en sus celulares.
2. Objetivo: Se desea saber qué sistema operativo es usado frecuentemente para desarrollar una aplicación que se usara para los estudiantes de la UTP.
3. Modelo De Encuesta: Elaborar una base b ase de datos dat os con un mínimo de 2 variables (1cualitativa nominal y 1 cuantitativa continua) que puede estar relacionada de preferencia con alguna de las actividades de la carrera que está estudiando. La base de datos deberá tener 60 unidades de análisis.
4. Características De La Base De Datos: 4.1. Población: Sistemas operativos usados por los estudiantes de la UTP en sus celulares.
4.2. Muestra: Sistema operativo usado por 60 estudiantes de la UTP en sus celulares.
4.3. Unidad de análisis: Sistema operativo usado por un estudiante de la UTP en su celular.
4.4. Variables: Edad, género, carrera, estado laboral, uso de Smartphone, horas de uso diario de Smartphone, Sistema operativo de Smartphone.
4.5. Tipo de variable: ESCALA DE
VARIABLE
TIPO
Edad
Cuantitativa Continua
Razón
Género
Cualitativa Dicotómica
Nominal
Carrera
Cualitativa Politómica
Nominal
Uso de Smartphone
Cualitativa Dicotómica
Ordinal
Horas de uso diario de Smartphone
Cuantitativa Continua
Razón
Sistema Operativo de Smartphone
Cualitativa Politómica
Nominal
MEDICION
5. Elaboración De Tablas De Frecuencia: EDAD
Xi
fi
Fi
ni
Ni
Xi *fi
hi *100%
Hi*100%
17
-
20
18,5
18
18
0,30
0,30
333,00
30%
30%
20
-
23
21,5
14
32
0,23
0,53
301,00
23%
53%
23
-
26
24,5
12
44
0,20
0,73
294,00
20%
73%
26
-
29
27,5
11
55
0,18
0,92
302,50
18%
92%
29
-
32
30,5
2
57
0,03
0,95
61,00
3%
95%
32
-
35
33,5
2
59
0,03
0,98
67,00
3%
98%
35 - 38 TOTAL
36,5
1
60
0,02
1,00
36,50
2%
100%
1395,00
100%
60
1
35-38
1
S E D32-35 A D E 29-32 E D 26-29 O L A V23-26 R E T 20-23 N I
2 2 11 12 14
17-20
18
0
5
10
15
20
FRECUENCIA ABSOLUTA
H.U.S.
Xi
fi
Fi
ni
Ni
Xi *fi
hi *100%
Hi*100%
3,0
- 4,0
3,5
3
3
0,05
0,05
11
5%
5%
4,0
- 5,0
4,5
8
11
0,13
0,18
36
13%
18%
5,0
- 6,0
5,5
16
27
0,27
0,45
88
27%
45%
6,0
- 7,0
6,5
13
40
0,22
0,67
85
22%
67%
7,0
- 8,0
7,5
9
49
0,15
0,82
68
15%
82%
8,0
- 9,0
8,5
8
57
0,13
0,95
68
13%
95%
9,0 - 10,0 TOTAL
9,5
3
60
0,05
1,00
29
5%
100%
383
100%
60
9-10 . S . U . H E D I K A V R E T N I
1,00
3
8-9
8
7-8
9
6-7
13
5-6
16
4-5
8
3-4
3
0
5
10 FRECUENCIA ABSOLUTA
15
20
GENERO
fi
Fi
ni
Ni
hi*100%
M
35
35
0,58
0,58
58%
58%
F
25
60
0,42
1,00
42%
100%
TOTAL
60
O R E N E G
1,00
Hi*100%
100%
F
25
M
35
0
10
20
30
40
FRECUENCIA ABSOLUTA
S.O.S.
fi
Fi
ni
Ni
hi*100%
Hi*100%
ANDROID
43
43
0,72
0,72
72%
72%
iOS
14
57
0,23
0,95
23%
95%
indows Phon
3
60
0,05
1,00
5%
100%
TOTAL
60
1,00
WINDOWS PHONE . S . O . S
100%
3
IOS
14
ANDROID
43
0
10
20
30
FRECUENCIA ABSOLUTA
40
50
6. Medidas de tendencia central: 6.1. Media
EDAD
̅ = 23.25 años
El promedio de edad de los alumnos que estudian en el turno noche en la UTP es de 23.367 años. HORAS DE USO DE SMARTPHONE
̅ = 6.38 horas
6.2. Mediana
EDAD
HORAS DE USO DE SMARTPHONE
= 22.57 años = 6.23 horas
6.3. Moda
EDAD
HORAS DE USO DE SMARTPHONE
= 19.45 años = 5.73 horas
7. Medidas De Dispersión 7.1. Varianza
EDAD
= 19.61 ñ2
HORAS DE USO DE SMARTPHONE
7.2. Desviación estándar
EDAD
= 4.43 años
HORAS DE USO DE SMARTPHONE
7.3. Coeficiente de variación
EDAD
= 19.05 %
HORAS DE USO DE SMARTPHONE
= 2.41 ℎ2
=1.55 horas = 24.32 %
8. Con la información obtenida se deberán hacer los siguientes cálculos: 8.1 Intervalo de confianza para la medía de una población Los docentes desean saber cuánto tiempo emplea el estudiante de la UTP diariamente en el uso de su Smartphone, para lo cual se toma una muestra de 60 estudiantes, obteniendo una media muestral de 6.38 y su varianza muestral de 2.41 establecer un intervalo de confianza del 90 % para la media. Se considerará una distribución normal. Variable: X: horas de uso de Smartphone por los estudiantes de la UTP H.U.S.
Xi
fi
Fi
ni
Ni
Xi*fi
((Xi-X)^2)*fi
3.0 -
4.0
3.5
3
3
0.05
0.05
11
24.94
4.0 -
5.0
4.5
8
11
0.13
0.18
36
28.38
5.0 -
6.0
5.5
16
27
0.27
0.45
88
12.48
6.0 -
7.0
6.5
13
40
0.22
0.67
85
0.18
7.0 -
8.0
7.5
9
49
0.15
0.82
68
11.22
8.0 -
9.0
8.5
8
57
0.13
0.95
68
35.84
9.0 -
10.0
9.5
3
60
0.05
1.00
29
29.14
383
142.18
TOTAL
60
1.00
Tabla. Datos agrupados de 60 estudiantes de la UTP.
DATOS: n= 60 x= ∑ Xi*fi =6.38
s =− 2
∑ ((Xi-X)^2)*fi =2.41
s = 1.55
Nivel de confianza: 1- = 0.90
⁄2
Z =1.645
⁄2 =0.05
=⁄ √ ≤≤+⁄ √
=6.381.645 1.√ 6505 ≤≤6. 3 8+1. 6 45 1.√ 6505 ≤ ≤ IC =6.051
6.709
Conclusión: Para la media de uso de smartphone por los estudiantes se tiene un intervalo de confianza de 6.051 a 6.709 con un nivel de confianza de 0.9
8.2 Intervalo de confianza para las medias de dos poblaciones. Se desea comparar el tiempo de uso de smartphone entre los estudia ntes de la Sede Lima Centro (SLC) y la Sede Lima Norte (SLN), para lo cual se tiene una muestra de 30 alumnos por Sede, obteniendo en la SLC una media de 6.77 h y varianza muestral de 2.25 h y en la SLN una media de 5.8 h y varianza muestral de 2.03 h. calcular un intervalo de confianza de 96% sobre donde y corresponden a la media de uso diario de Smartphone.
,
Variable: X: tiempo de uso de Smartphone por los estudiantes de la SLN H.U.S.
Xi
fi
Fi
ni
Ni
Xi*fi
((XiX)^2)*fi
3.0
-
5.0
4.0
9
9
0.30
0.30
36
29.16
5.0
-
7.0
6.0
15
24
0.50
0.80
90
0.60
7.0
-
9.0
8.0
6
30
0.20
1.00
48
29.04
9.0
- 11.0
10.0
0
30
0.00
1.00
0
0.00
11.0 - 13.0
12.0
0
30
0.00
1.00
0
0.00
174
58.80
TOTAL
30
1.00
Tabla. Datos agrupados de 30 estudiantes de la UTP sede Lima Norte.
Variable: Y: tiempo de uso de Smartphone por los estudiantes de la SLC H.U.S.
Yi
fi
Fi
ni
Ni
Yi*fi
((Yi-Y)^2)*fi
4.5
-
5.5
5.0
8
8
0.27
0.27
40
24.97
5.5
-
6.5
6.0
7
15
0.23
0.50
42
4.11
6.5
-
7.5
7.0
5
20
0.17
0.67
35
0.27
7.5
-
8.5
8.0
4
24
0.13
0.80
32
6.08
8.5
-
9.5
9.0
6
30
0.20
1.00
54
29.93
203
65.37
TOTAL
30
1.00
Tabla. Datos agrupados de 30 estudiantes de la UTP sede Lima Centro.
DATOS: nx= 30 x= ∑ Xi*fi =5.8
s =− ny= 30 y= s =− 2
∑ ((Xi-X)^2)*fi =2.03
s = 1.42
∑ Yi*fi =5.8
2
∑ ((Yi-Y)^2)*fi =2.25
s = 1.50
Nivel de confianza: 1- = 0.96
⁄2 =0.02
⁄2
Z =2.05
= ⁄ + ≤ ≤ +⁄ +
=6.775.82.05 230.03 + 2.3025 ≤ ≤6.775.8+2.05 230.03 + 2.3025 ≤ ≤ IC =0.196
1.744
Conclusión: La diferencia de medias del tiempo de uso de smartphone por los estudiantes de las sedes lima norte y lima centro está comprendida entre 0.196 y 1.744 con un nivel de confianza de 0.96.
8.3 Prueba de hipótesis para la media de una población El director de la UTP menciona que sus alumnos pasan en promedio 5.5 horas en su smartphone, para lo cual se toma una muestra de 60 estudiant es obteniendo una media muestral de 6.38 h con una desviación estándar muestral de 1.55. ¿Esto sugiere que los alumnos usan su Smartphone más de 4.5 horas a un nivel de significancia de 0.05? Variable: X: tiempo de uso de Smartphone por los estudiantes de la UTP H.U.S.
Xi
fi
Fi
ni
Ni
Xi*fi
((Xi-X)^2)*fi
3.0 -
4.0
3.5
3
3
0.05
0.05
11
24.94
4.0 -
5.0
4.5
8
11
0.13
0.18
36
28.38
5.0 -
6.0
5.5
16
27
0.27
0.45
88
12.48
6.0 -
7.0
6.5
13
40
0.22
0.67
85
0.18
7.0 -
8.0
7.5
9
49
0.15
0.82
68
11.22
8.0 -
9.0
8.5
8
57
0.13
0.95
68
35.84
9.0 -
10.0
9.5
3
60
0.05
1.00
29
29.14
383
142.18
TOTAL
60
1.00
Tabla. Datos agrupados de 60 estudiantes de la UTP.
DATOS: n= 60 x= ∑ Xi*fi =6.38
s =− 2
∑ ((Xi-X) ^2)*fi =2.41
=5. 5 ≠5.5
s = 1.55
a) Plantear las hipótesis Ha: Ho:
b) Nivel de significancia: = 0.025
c) Estadístico de prueba
= √ 5 = 6.31.85. 5√ 605 =4.398
d) Regla crítica
e) Regla de decisión
≥ / ≤ / 4.398 1.645 v
Se rechaza el Ho
f) Conclusión Se concluye que el tiempo de uso de Smartphone entre los estudiantes es de 5.5 horas a un nivel de significancia de 0.05.
8.4 Prueba de hipótesis para dos medias poblacionales Pruebe la hipótesis de que no hay diferencia en el tiempo promedio de uso de Smartphone de las dos sedes. Se estima que las poblaciones se distribuyen de forma aproximadamente normal. Se usará un nivel de significancia de 0.05. Variable: X: tiempo de uso de Smartphone por los estudiantes de la SLN H.U.S.
Xi
fi
Fi
ni
Ni
Xi*fi
((XiX)^2)*fi
3.0
-
5.0
4.0
9
9
0.30
0.30
36
29.16
5.0
-
7.0
6.0
15
24
0.50
0.80
90
0.60
7.0
-
9.0
8.0
6
30
0.20
1.00
48
29.04
9.0
- 11.0
10.0
0
30
0.00
1.00
0
0.00
11.0 - 13.0
12.0
0
30
0.00
1.00
0
0.00
174
58.80
TOTAL
30
1.00
Tabla. Datos agrupados de 30 estudiantes de la UTP sede Lima Norte.
Variable: Y: tiempo de uso de Smartphone por los estudiantes de la SLC H.U.S.
Yi
fi
Fi
ni
Ni
Yi*fi
((Yi-Y)^2)*fi
4.5
-
5.5
5.0
8
8
0.27
0.27
40
24.97
5.5
-
6.5
6.0
7
15
0.23
0.50
42
4.11
6.5
-
7.5
7.0
5
20
0.17
0.67
35
0.27
7.5
-
8.5
8.0
4
24
0.13
0.80
32
6.08
8.5
-
9.5
9.0
6
30
0.20
1.00
54
29.93
203
65.37
TOTAL
30
1.00
Tabla. Datos agrupados de 30 estudiantes de la UTP sede Lima Centro.
Datos: nx= 30 x= ∑ Xi*fi =5.8
s =− ny= 30 y= s =− 2
∑ ((Xi-X)^2)*fi =2.03
s = 1.42
∑ Yi*fi =5.8
2
∑ ((Yi-Y)^2)*fi =2.25
s = 1.50
=≠
a) Plantear las hipótesis Ha: Ho:
= + = 5. 826..25 +772.003 30 30 =2.56
b) Nivel de significancia: = 0.025 c) Estadístico de prueba
d) Regla crítica
e) Regla de decisión
≥ / ≤ / 2.56 1.645 v
Se rechaza el Ho
f) Conclusión Se concluye que el tiempo de uso de Smartphone entre las dos sedes no es diferente a un nivel de significancia de 0.05.
8.5 Intervalo de confianza para la proporción de una población En una muestra aleatoria de n=60 estudiantes de la UTP, se encuentra que x=35 son del género masculino. Calcule un intervalo de confianza del 95 % para la proporción real de los estudiantes que son de la UTP y que además son del género masculino.
GENERO
fi
Fi
ni
Ni
hi*100%
Hi*100%
M
35
35
0.58
0.58
58%
58%
F
25
60
0.42
1.00
42%
100%
TOTAL
60
1.00
100%
Tabla. Datos agrupados de 60 estudiantes de la UTP.
DATOS: x = estudiante de la UTP del género masculino p X = proporción de estudiantes de la UTP que son del género masculino p X = 35/60 = 0.58 q X = (1 - 0.58) = 0.42 n= 60 N.C. = 95 % Z /2 = 1.96
= ⁄ ≤≤ +⁄ 4 2 =0.581.96 0.58∗0.60 42 ≤≤0. 5 8+1. 9 6 0.58∗0. 60 =0.=.≤≤. 5 80. 1 2≤≤0. 5 8+0. 1 2 Conclusión: La proporción real de estudiantes que son de la UTP y que además son del género masculino se encuentra entre 46% y 70%, a un nivel de confianza de 95%.
8.6 Intervalo de confianza para las proporciones de dos poblaciones Se considera que la sede Lima Centro de la UTP es en la que hay más estudiantes mujeres que varones. Para determinar si es cierta esta afirmación, se toman datos de estudiantes de la sede Lima Centro y la sede Lima Norte de la UTP. Si se encuentra que 12 de 30 estudiantes de la sede Lima Centro de la UTP son mujeres y 13 de 30 estudiantes de la sede Lima Norte también lo son, calcule un intervalo de confianza de 90 % para la diferencia verdadera en la proporción de estudiantes mujeres entre la sede Lima Centro y Lima Norte. GENERO
fi
Fi
ni
Ni
hi*100%
M
18
18
0.60
0.60
60%
60%
F
12
30
0.40
1.00
40%
100%
TOTAL
30
1.00
Hi*100%
100%
Tabla. Datos agrupados de 30 estudiantes de la UTP Sede Lima Centro. GENERO
fi
Fi
ni
Ni
hi*100%
Hi*100%
M
17
17
0.57
0.57
57%
57%
F
13
30
0.43
1.00
43%
100%
TOTAL
30
1.00
100%
Tabla. Datos agrupados de 30 estudiantes de la UTP Sede Lima Norte.
DATOS: x = estudiante de la UTP sede Lima Centro que es mujer y = estudiante de la UTP sede Lima Norte que es mujer p x = proporción de estudiante de la UTP sede Lima Centro que son mujeres p y = proporción de estudiante de la UTP sede Lima Norte que son mujeres p x = 12/30 = 0.40 p y = 13/30 = 0.43 q x= q y = (1 - 0.43) = 0.57 (1 - 0.40) = 0.60 n x= n y = 30 30 N.C. = 90 % Z /2 = 1.64
=( )⁄ + ≤ ≤( )+⁄ +
6 0 0. 4 3∗0. 5 7 0 . 4 0∗0. 6 0 0. 4 3∗0. 5 7 =0.400.431.64 0.40∗0. + ≤ ≤0. 4 00. 4 3+1. 6 4 + 30 30 30 30 =0.=.≤ 0 30. 2 1≤≤≤.0.03 +0.21 Conclusión: La diferencia verdadera en la proporción de estudiantes mujeres entre la sede Lima Centro y Lima Norte se encuentra en el rango de -24% y 18%, a un nivel de confianza de 90%.
8.7 Prueba de hipótesis para la proporción de una población. Se considera que en la UTP el 44 % de los estudiantes son del género masculino. Los resultados de una nueva encuesta realizada a 60 estudiantes de la UTP revelaron que 35 de ellos son del género masculino. ¿Esta evidencia es suficiente para concluir que hay un crecimiento significativo en la proporción de estudiantes de la UTP que son del género ma sculino? Utilice un nivel de significancia de 0.05. GENERO
fi
Fi
ni
Ni
hi*100%
M
35
35
0.58
0.58
58%
58%
F
25
60
0.42
1.00
42%
100%
TOTAL
60
1.00
Hi*100%
100%
Tabla. Datos agrupados de 60 estudiantes de la UTP.
DATOS: x = estudiante de la UTP que es del género masculino p X = proporción de estudiantes de la UTP que son del género masculino p x = 35/60 = 0.58 p 0 = 0.44 n= 60 N.S. = 0.05 a) Plantear la hipótesis H 0: p x ≤ 0.44 H a: p x > 0.44 b) Especificar nivel de significancia N.S. = = 0.05 c) Establecer la estadística de prueba
= 1 80.4444 = 00..45410. 60 = 0.0.01644 =0.19
d) Región crítica H a: p x > p 0
=1.64 =2. 1 8 =1. 6 4 =2.18> =1.64
e) Regla de decisión
Rechazar H 0: p x ≤ 0.44 f) Conclusión Hay un crecimiento significativo en la proporción de estudiantes de la UTP que son del género masculino
8.8 Prueba de hipótesis para las proporciones de dos poblaciones. En un estudio sobre el sistema operativo de Smartphone que usan los estudiantes de la UTP, se seleccionan dos grupos de estudiantes de la UTP de entre 17 y 38 años de edad que usan Smartphone, y a cada uno se le preguntó si utilizaba el sistema operativo Android u otro. Se seleccionó un grupo de estudiantes de la UTP menores de 23 años y otro de estudiantes de la UTP con 23 años a más. Se obtuvo que 23 de 32 estudiantes de la UTP menores de 23 años usan el sistema operativo Android en sus smartphone’s, en comparación con 20 de 28 estudiantes de la UTP con 23 años a más. ¿Podemos concluir que la proporción de estudiantes de la UTP menores de 23 años que usan Android es significativamente mayor que la proporción de estudiantes de la UTP con 23 años a más que también lo usan? Usar un nivel de significancia de 0.01. S.O.S. ANDROID
OTROS
TOTAL
EDAD
fi
Fi
ni
Ni
hi*100%
Hi*100%
=23
20
20
0.71
0.71
71%
71%
=23
8
28
0.29
1.00
29%
100%
32
1.00
100%
28
1.00
100%
Tabla. Datos agrupados de 60 estudiantes de la UTP.
DATOS: x = estudiante de la UTP menor de 23 años que usa el S.O. Android y = estudiante de la UTP con 23 años a más que usa el S.O. Android p X = proporción de estudiantes de la UTP menores de 23 años que usan el S.O. Android p y = proporción de estudiantes de la UTP de 23 años a más que usan el S.O. Android p x = 23/32 = 0.72 p y = 20/28 = 0.71 n x = 32 n y = 28 N.S. = 0.01 a) Plantear la hipótesis H 0: p x ≤ p y H a: p x > p y b) Especificar nivel de significancia N.S. = = 0.01 c) Establecer la estadística de prueba
= 1 1 1 +
= ∑+∑ +
43 = 23+20 = 32+28 0.76020.=0.7712 = 0.7210.72 1 + 1 32 28 = 0.0.0112 =0.83
d) Región crítica H a: p x > p y
=2.32 =0. 8 3 =2. 3 2 =0.8345,722 = ≠2.55
Como , rechazamos la hipótesis nula ( H0) la cual significa que la variaza es diferente de 2.55
H0: Ha:
2.55 (se rechaza) (se acepta)
f) Conclusión:
Con un nivel de significación de 5% la varianza poblacional del promedio de horas diarias del uso de un Smartphone es diferente a 2.55.
8.12 Prueba de hipótesis para la razón de dos varianzas poblaciones. Un profesor de estadistica de la UTP estudia la variabilidad de dos muestras en función al promedio de edades en una encuesta relizada por sus alumnos .Se sabe que las muestras tienen una distribucion normal .Con un valor de significancia del 5 %. ¿Se puede concluir que hay mas variacion en la muestra A que el la B ?
Estas muestras aleatorias son de 30 cada una y son las siguientes : A
B
19
18
19
23
23
26
26
24
20
22
24
22
20
17
23
25
21
32
27
18
19
24
24
19
26
26
27
22
18
27
27
21
24
28
27
21
19
30
21
20
29
25
22
25
32
24
18
26
17
19
19
21
19
19
22
19
36
20
21
19
Datos :
a) H0= Ha= b)
Muestar A
Muestra B
S 2 =5.523
S 2 =2.908
n=30 V=30-1=29
n=30 V=30-1=29
σ2A≤ σ2B σ2A> σ2B
=0,05 /2= 0,025
c) Estadístico de prueba
f 0,05;29;29=1,861
d) Región crítica
e)Regla de decisión:
= = .. =.
1.904 > 1.861 se rechaza Ho f)Conclusión: Como f calculado es 1.904 cae en la region critica rechazamos la hipotesis nula y concluimos que los valores del grupo A , tienen mayor variacion.
View more...
Comments