Trabajo de Estadistica
Short Description
Descripción: Solución de ejercicios de Estadística...
Description
MUESTRA Z PARA UNA POBLACIÓN Problema 01.- una encuesta nacional reciente hallo que estudiantes del bachillerato miraban un promedio de 6.8 videos por mes .Una muestra aleatoria de 36 estudiantes universitarios revelo que el número de medio de videos observado era de 6.2, con una desviación estándar de 0.5. En el nivel de significancia de 0.05, ¿se puede concluir que los estudiantes universitarios ven menos videos que los estudiantes de bachillerato? Solución: 1) Ho: µ ≥ 6.8 Ha: µ < 6.8 2) α = 0.05 3) 𝑧=
𝑥̅ − 𝜇 𝜎/√𝑛
=
6.2 − 6.8 0.5/√36
= −7.2
Rechazar si H0 si z < -1.65.
Decisión: rechazamos H0 por lo cual se puede concluir que el promedio de videos observados por los estudiantes universitarios es menor que los de bachillerato.
Problema 02.-un artículo publicado en una revista reporto que el tiempo libre promedio semanal de los hombre es de 40.0 horas, se requiere verificar este articulo para lo cual se selecciona una muestra aleatoria de 60 hombres, se obtienes una media de 37.8 horas con una desviación estándar de 12.2 horas, nivel de significancia de 0.05 ¿Puede concluirse que la información del artículo es falsa? Solución
H0: µ ≥ 40 H1: µ < 40 𝑥̅ −𝜇 √𝑛
𝑧 = 𝜎/
37.8−40 √60
= 12.2/
= −1.40
Rechaza H0 si z < -1.65.
Decisión: No se puede concluir que el tiempo libre de los hombres es menor a 40 horas semanalmente
Problema 03.-De acuerdo con el presidente del sindicato local, el ingreso bruto medio de plomeros en el área de Salt Lake City tiene una distribución normal, con una media de 30000$ y una desviación estándar de $3000. Recientemente, un reportero de investigación para un canal de televisión encontró, en una muestra de 120 plomeros, que el ingreso bruto medio era $30500.Al nivel de significancia de 0.10, ¿se puede concluir que el ingreso medio no es igual a 30000$? Solución: 𝐻0 : 𝜇 = 30000 𝐻1 : 𝜇 ≠ 30000 Estadístico de prueba 𝑧=
𝑥̅ − 𝜇 𝜎/√𝑛
=
30500 − 30000 3000/√120
= 1.83
Decisión: se puede concluir que el ingreso promedio no es de $30000.
PRUEBA DE HIPOTESIS PARA DOS MUESTRAS GRANDES: MEDIAS POBLACIONALES Problema 04.- Un analista financiero ha de comparar las tasas de las transacciones comerciales, en porcentaje, de participaciones en acciones de finanzas relacionadas con el petróleo, contra otras acciones, como las de industrias de manufactura (GE e IBM). Tomas 32 acciones relacionadas con el petróleo y 49 acciones de otras actividades. La tasa media del monto de transacciones relacionadas con el petróleo es 31.4%, y la desviación estándar, 5.1%. En las otras acciones la tasa media fue 34.9% y la desviación estándar, 6.7%. ¿Es esta una diferencia significativa en la tasa considerada de los dos tipos de acciones? Use el nivel de significancia 0.01. Solución: 𝐻0 : 𝜇1 = 𝜇2 𝐻1 : 𝜇1 ≠ 𝜇2 𝑛1 = 32 𝑋̅1 = 31.4 𝑠1 = 5.1
𝑛2 = 49 𝑋̅2 = 34.9 𝑠2 = 6.7 𝛼 = 0.01
RR:
𝐑𝐞𝐜𝐡𝐚𝐳𝐚𝐫 𝐥𝐚 𝑯𝟎 𝐬𝐢 𝐳 > 𝟐. 𝟓𝟖 𝐨 𝐳 < −𝟐. 𝟓𝟖. EP:
𝑧=
𝑋̅1 −𝑋̅2 2
2
𝑠 𝑠 √ 1+ 2
𝑛1 𝑛2
=
31.4−34.9 2
2
√5.1 +6.7 32
= −2.66
49
Decisión: Se rechaza la 𝑯𝟎 ; existe una diferencia significativa entre las tasas de acciones relacionadas con el petróleo y las tasas de acciones relacionadas con otras actividades.
MUESTRA Z PARA UNA PROPORCIÓN Problema 05.- Un artículo reciente, publicado en el diario USA today, indica que solo a uno de cada tres egresados les espera un puesto de trabajo. En una investigación a 200 egresados recientes de su universidad, se encontró que 80 tenían un puesto de trabajo. ¿Puede concluirse, en el nivel de significancia 0.02, que en su universidad la proporción de estudiantes que tienen trabajo es mayor? Solución: 𝑃0 =
1 80 = 0.333 𝑦 𝑃 = = 0.4 3 200
𝐻0 : 𝑃 = 0.333 𝐻𝑎 : 𝑃 > 0.333
𝑍𝑘 =
𝑃 − 𝑃0 √𝑃0 (1 − 𝑃0 ) 𝑛
⇒ 𝑍𝑘 =
0.4 − 0.33 √0.33(1 − 0.33) 200
⇒ 𝑍𝑘 = 2.1053
Prueba e IC para una proporción Prueba de p = 0.333 vs. p > 0.333 98% Límite Valor P Muestra X 1
N Muestra p inferior exacto
80 200 0.400000 0.328479 0.02
Decisión: Se concluye que en su universidad la proporción de estudiantes que tienen trabajo es mayor que 0.333.
Problema 06.-En una investigación hecha en una determinada universidad se encontró que 50% de los estudiantes después de un año de estudio, cambiaban de área principal de estudio. En una muestra de 100 estudiantes de la facultad de economía se encontró que 48 habían cambiado de área de estudio. ¿Ha habido una disminución significativa en la proporción de estudiantes que cambian de área de estudio? Emplee el nivel de significancia 0.05. Solución:
𝑃0 = 50% = 0.5 𝑦 𝑃 =
48 = 0.48 100
1) Estableciendo la HIPOTESIS 𝐻𝑎 : 𝑃 < 0.5 𝑍𝑘 =
𝐻0 : 𝑃 = 0.5
𝑃 − 𝑃0 √𝑃0 (1 − 𝑃0 ) 𝑛
⇒ 𝑍𝑘 =
0.48 − 0.5 √0.5(1 − 0.5) 100
⇒ 𝑍𝑘 = −0.4
Prueba e IC para una proporción
Prueba de p = 0.5 vs. p < 0.5 Límite Valor P Muestra X 1
N Muestra p superior 95% exacto
48 100 0.480000
0.566768 0.382
Decisión: Se puede concluir que no hay evidencias suficientes para afirmar que hay una disminución en la proporción de alumnos que cambian de área después de un año de estudios
Problema 07.- Un fabricante de receptores de televisión sabe, por experiencia, que 10%, o menos de sus equipos necesitará alguna reparación durante los primeros dos años de funcionamiento. De una muestra de 50 receptores que se fabricaron hace dos años, 9 habían necesitado una reparación. Empleando el nivel de significancia 0.05, ¿se puede decir que ha aumentado el porcentaje de equipos que necesitan alguna reparación? Solución:
𝐻0 : 𝑃 ≤ 0.10 𝐻1 : 𝑃 > 0.10 Estadístico de prueba 9 ( ) − 0.10 0.08 50 𝑧= = = = 1.89 √0.0018 0.10(1 − 0.10) 𝑝(1 − 𝑝) √ √ 𝑛 50 𝑝̅ − 𝑝
Decisión: Al ser el p (0.030) menor que α (0.05) se rechaza la hipótesis nula, con lo cual se puede concluir que ha aumentado el porcentaje de equipos que necesitan reparación.
MUESTRA T EN UNA POBLACIÓN Problema 08.- el departamento de reclamaciones de una aseguradora revela que el promedio cuesta $ 60 la realización de todos los tramites , por lo cual aplico medidas para bajar los precios. Se tomo una muestra de 26 demandas se encontró que el promedio de de $ 57 y la desviación es de $ 10.En el nivel de significancia de 0.01 ¿se puede concluir que la diferencia de $3 entre la media muestra y la media poblacional se debe al azar?
Solución: H0: µ ≥ 60 H1: µ < 60 𝑡=
𝑥̅ − 𝜇 𝑠/√𝑛
=
57 − 60 10/√26
t=-1.53 si : -1.53>- 2.485
Decisión : Aceptamos H0 , esto nos indica que las medidas tomadas no han abatido en el costo medio, la diferencia de $3 se debe al azar.
Problema 09.-Una empresa editora de libros universitarios, afirma que cada uno de sus representantes realiza 40 visitas a los profesores. Varios vendedores afirman que esta estimación es muy baja .Se toma una muestra aleatoria de 28 representantes reveló que el número medio de visitas fue de 42 con desviación estándar de 2.1.Al nivel de significancia de 0.05 ¿se puede concluir que el número de visitas es mayor que 40?
Solución: H0: µ ≤ 40 H1: µ > 40 𝑡=
𝑥̅ − 𝜇 𝑠/√𝑛
=
42 − 40 2.1/√28
t=5.040 Rechazar si t >1.703.
Decisión: Se concluye que el número medio de vistas es mayor a 40.
Problema 10.-Los registros de una empresa eléctrica revelo que la duración promedio de un juego de bujías eléctricas es de 22100 mil (millas). El fabricante afirma que el juego de bujías es mayor a 22100, una muestra de 18 juegos de bujía revelo que la duración media es de 23400 con desviación estándar de 1500 ¿Hay evidencia para aceptar la afirmación del fabricante al nivel de significancia de 0.05? Solución:
H0: µ ≤ 22100 H1: µ > 22100 𝑡=
𝑥̅ − 𝜇 𝑠/√𝑛
=
23400 − 22100 1500/√18
t=3.680 Rechazar si t >1.74.
Decisión: Se rechaza H0, por lo cual se puede concluir que la duración media de las bujías es mayor a 22100.
PRUEBA DE HIPOTESIS PARA DOS MUESTRAS PEQUEÑAS: MEDIAS POBLACIONALES Problema 11.- Lisa Monin es directora de presupuesto en la empresa New Process Company, desea comparar los gastos diarios de transporte del equipo de ventas y de personal de cobranza. Recopilo la siguiente información muestral (cantidad en dólares). Ventas ($) Cobranza ($)
131 130
135 102
146 129
165 143
136 149
142 120
139
A nivel de significancia de 0.10, ¿puede concluirse que los gastos medios diarios del equipo de ventas son mayores? ¿Cuál es el valor p? Solución: 𝐻0 : 𝜇1 ≤ 𝜇2 𝐻1 : 𝜇1 > 𝜇2 𝑛1 = 6 𝑋̅1 = 142.5 𝑠1 = 12.24
𝑛2 = 7 𝑋̅2 = 130.28 𝑠2 = 15.79
𝛼 = 0.10
RR:
𝐑𝐞𝐜𝐡𝐚𝐳𝐚𝐫 𝐥𝐚 𝑯𝟎 𝐬𝐢 𝐭 > 𝟏. 𝟑𝟔𝟑.
EP:
𝑠𝑝2 = 𝑡=
(𝑛1 −1)∗𝑠12 +(𝑛2 −1)∗𝑠22 𝑛1 +𝑛2 −2 ̅ −𝑋 ̅ 𝑋 1 2
1 1 √𝑠𝑝2 ∗(𝑛 +𝑛 ) 1 2
= 1.54
= 204.08
Decisión: Se rechaza la 𝑯𝟎 ; es un hecho que los gastos medios diarios del equipo de ventas son
mayores a los gastos medios diarios del equipo de cobranza.
PRUEBA DE HIPOTESIS PARA MUESTRAS DEPENDIENTES Problema 12.- Harry Hutchings es propietario de un gimnasio, y afirma que la ingestión de ciertas vitaminas aumenta la fuerza corporal. Se seleccionan aleatoriamente 10 estudiantes atletas y se les aplica una prueba de fuerza muscular. Después de dos semanas de tomar las vitaminas y de entrenamiento se les aplica nuevamente la prueba. Los resultados se muestran a continuación. Peso (lb) Nombre
Antes
Después
Evie Gorky Bob Mack Lou Brandon Karl Unger Sue Koontz Pat O’Leary Kim Dennis Connies Kaye Tom Dama Maxine Sims
190 250 345 210 114 126 186 116 196 125
196 240 345 212 113 129 189 115 194 124
¿Puede concluirse, empleando el nivel de significancia 0.01, que las vitaminas aumentaron la fuerza muscular de los estudiantes atletas? Solución: 𝐻0 : 𝜇𝑑 ≤ 0 𝐻1 : 𝜇𝑑 > 0
190 250 345 210 114 126 186 116 196 125
𝒅 -6 10 0 -2 1 -3 -3 1 2 1 1
196 240 345 212 113 129 189 115 194 124
𝑑̅ =
∑𝑑 1 = = 0.1 𝑛 10 2
𝑠𝑑 = 𝛼 = 0.01
(∑ 𝑑 ) 𝑛 = 4.28 𝑛−1
2 √∑ 𝑑 −
𝒅𝟐 36 100 0 4 1 9 9 1 4 1 165
0.99
0.01
2.821
RR:
𝐑𝐞𝐜𝐡𝐚𝐳𝐚𝐫 𝐥𝐚 𝑯𝟎 𝐬𝐢 𝐭 > 𝟐. 𝟖𝟐𝟏.
EP:
𝑡=
̅ 𝑑 𝑠𝑑 ⁄ √𝑛
= 0.073
Decisión: No se rechaza la 𝑯𝟎 ; no existe una diferencia significativa en que la variación
en el peso de estos estudiantes se haya dado por el aumento de fuerza muscular generado por la acción de las vitaminas; el cambio en el peso de los estudiantes se puede explicar por la casualidad.
ANALISIS DE VARIENZA Y LA F DE FISHER
Problema 13.- Las calificaciones promedio de 4 asignaturas de un curso de cierta universidad se ilustran en la siguiente tabla. La finalidad es determinar si existen diferencias reales entre las calificaciones de las cuatro asignaturas. Emplear un nivel de significancia de 0,05. Muestra A
B
C
D
6
8
9
9
9
7
8
7
9
10
8
10
6
8
9
10
5
9
10
9
Solución: Como me piden si existen diferencias entre las asignaturas se trataría de un “ANOVA” en una sola dirección para esto hallamos las sumas totales de cada columna y el cuadrado de esa suma. H0: UA = UB = UC = UD H1: UA ≠UB
Regla de rechazo: “ Si F < 3.2, no se rechaza la hipótesis nula; si F > 3.2 , se rechaza la hipótesis nula “
Tabla con totales:
Muestra A
B
C
D
6
8
9
9
9
7
8
7
9
10
8
10
6
8
9
10
5
9
10
9
35
42
44
45
*hallamos la suma de cuadrados de tratamientos 𝑇2
SST = ∑ [𝑛𝑐 ] − 𝑐
SST =
352 5
+
422 5
(∑𝑥)2 𝑁
+
442 5
+
452 5
−
(35+42+44+45)2 20
= (245 + 352.8 + 387.2 + 405) - 1377.8 = 12.2
*Hallamos la suma total de todos los elementos Total SS = ∑𝑋 2 -
(∑𝑋)2 𝑁
Total SS = 1418 – 1377.8 = 40.2
*Hallamos el error en los tratamientos SSE = Total SS – SST = 40.2 – 12.2 = 28
*Realizamos nuestro cuadro de resumen
Fuente de Variación
Suma de cuadrados
Grados de libertad
Cuadrados medios
Para tratamientos
12.2
3
12.2/3 = 4.07 = MST
Error
28
20- 4 = 16
28/16= 1.75 = MSE
Total
40.2
*Hallando el parámetro “F”
𝑴𝑺𝑻
𝟒.𝟎𝟕
F = 𝑴𝑺𝑬 = 𝟏.𝟕𝟓 = 2.32
Decisión: Para una prueba con un nivel de significancia del 5 % y con grados de libertad para el numerador de 3 y del numerador de 17 su estadístico F es igual a 3.2 Como 2.32 es menor a 3.2 no se rechaza la hipótesis nula , en otras palabras el promedio de las calificaciones en las cuatro asignaturas pueden ser consideradas como los profesores como iguales
Resumen Minitab
Problema 14.- Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión arterial, comparándola con la de una dieta sin sal. Para ello se seleccionan al azar
25 hipertensos y se distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le suministra ningún tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al cuarto el fármaco a una dosis determinada y al quinto el mismo fármaco
a otra dosis. Las presiones arteriales sistólicas de los 25 sujetos al finalizar los tratamientos son:
Grupo
Utilizar del
1
2
3
4
5
180
172
163
158
147
173
158
170
146
152
175
167
158
160
143
182 181
160 175
162 170
171 155
155 160
un nivel
significancia del 5%, para determinar si es que el tratamiento tiene éxito o no solución: H0 : U1 = U2 = U3 = U4 = U5 H1 : U1 ≠ U2 Tabal con totales:
Grupo
Totales
1
2
3
4
5
180
172
163
158
147
173
158
170
146
152
175
167
158
160
143
182
160
162
171
155
181
175
170
155
160
891
832
823
790
757
*hallamos la suma de cuadrados de tratamientos 𝑇2
SST = ∑ [𝑛𝑐 ] − 𝑐
SST =
8912 5
+
8322 5
(∑𝑥)2 𝑁
+
8232 5
7902 5
+
+
7572 5
(891+832+823+790+757)2 25
−
=
(158776.2 + 138444.8 + 135465.8 + 124820 + 114609.8) - 670105.96 = 2010.64
*Hallamos la suma total de todos los elementos Total SS = ∑𝑋 2 -
(∑𝑋)2 𝑁
Total SS = 673011 – 670105.96 = 2905.04
*Hallamos el error en los tratamientos SSE = Total SS – SST = 2905.04 – 2010.64 = 894.4
*Realizamos nuestro cuadro de resumen Fuente de Variación
Suma de cuadrados
Grados de libertad
Cuadrados medios
Para tratamientos
2010.64
4
2010.64/4 = 502.66 = MST
Error
894.4
25- 5 = 20
894.4/20 = 44.72= MSE
Total
2905.04
*Hallando el parámetro “F” 𝑴𝑺𝑻
F = 𝑴𝑺𝑬 =
𝟓𝟎𝟐.𝟔𝟔 = 𝟒𝟒.𝟕𝟐
11.24
Decisión: Para una prueba con un nivel de significancia del 5 % y con grados de libertad para el numerador de 4 y del numerador de 16 su estadístico F es igual a 2.87 Como 11.24 es mayor a 2.87 se rechaza la hipótesis nula , en otras palabras el tratamiento muestra que existe una diferencia considerable entre las presiones de los pacientes es decir el tratamiento a tenido resultado
Problema 15.-Una Variedad de trigo ha sido cultivada con 5 fertilizantes distintos, para estudiar el efecto de los mismos en la longitud de la planta. Se miden 5 series en 10 hectáreas. Efectué un análisis de la varianza con los 5 fertilizantes y las 10 hectáreas
H1
H2
H3
H4
H5
H6
H7
H8
H9
H10
totales
F1
10
12
8
10
6
13
9
10
9
9
96
F2
11
18
12
15
13
8
15
16
9
13
130
F3
7
14
10
11
9
10
9
11
7
9
97
F4
12
9
11
10
7
8
13
14
10
11
105
F5
7
6
10
7
7
5
6
7
9
6
70
59
51
53
42
44
52
58
44
48
498
totales 47
solución: *Para tratamientos H0 : todas las media de las hectareas son iguales H1 : al menos una media es diferente *Para bloques H0 : todas las media de los fertilizantes son iguales H1 : al menos una media es diferente *hallamos la suma de cuadrados de tratamientos 𝑇2
SST = ∑ [𝑛𝑐 ] − 𝑐
SST =
472 5
+
592 5
(∑𝑥)2 𝑁
+
512 5
+
532 5
+
422 5
= 5021.6 – 4960.08 = 61.52
+
442 5
+
522 5
+
582 5
+
442 5
+
482 5
−
(498)2 50
*hallamos la suma de cuadrados de bloques 𝑇2
SSB = ∑ [ 𝑏 ] − 𝑛 𝑏
SSB =
962 10
+
1302 10
(∑𝑥)2 𝑁
+
972 10
+
1052 10
+
702 10
−
(498)2 50
= 5145 – 4960.08 = 184.92
*Hallamos la suma total de todos los elementos Total SS = ∑𝑋 2 -
(∑𝑋)2 𝑁
Total SS = 5368 – 4960.08= 407.92 *Hallamos el error SSE = Total SS – SST - SSB = 407.92 – 61.52 – 184.92 = 161.48
*Realizamos nuestro cuadro de resumen Fuente de Variación
Suma de cuadrados
Grados de libertad
Cuadrados medios
Para tratamientos
61.52
9
61.52/9 = 6.84 = MST
Para Bloques
184.92
4
184.92/4 = 45.23 =MSB
Error
161.48
36
161.48/36 = 4.49 = MSE
Total
407.92
*Hallando el parámetro “F” *para tratamientos 𝑴𝑺𝑻
𝟔.𝟖𝟒
F = 𝑴𝑺𝑬 = 𝟒.𝟒𝟗 = 1.52 Decisión: Para una prueba con un nivel de significancia del 5 % y con grados de libertad para el numerador de 9 y del numerador de 36 su estadístico F es igual a 2.15 Como 1.52 es menor a 2.15 no se rechaza la hipótesis nula , en otras palabras la diferencia entre las longitudes del crecimiento del trigo no es significativa entre las 10 hectáreas
*para bloques 𝑴𝑺𝑩
F = 𝑴𝑺𝑬 =
𝟒𝟓.𝟐𝟑 = 𝟒.𝟒𝟗
10.07
Decisión: Para una prueba con un nivel de significancia del 5 % y con grados de libertad para el numerador de 4 y del numerador de 36 su estadístico F es igual a 2.65 Como 10.07 es mayor a 2.65 se rechaza la hipótesis nula , en otras palabras la diferencia entre las longitudes del crecimiento del trigo es significativa para el tipo de fertilizante q se utiliza, como recomendación se debe utilizar solo el fertilizante que tenga la más grande media entre longitudes
COEFICIENTE DE CORRELACION Y DETERMINACION Problema 16.- En los siguientes datos, y corresponde a los salarios mensuales y x es el promedio obtenido por los estudiantes que terminaron la licenciatura de administración con especialidad en sistemas de información. La ecuación de regresión estimada obtenida con estos datos es 𝑦̀ = 1790.5 + 581.1𝑥 Promedio 2.6 3.4 3.6 3.2 3.5 2.9
Salario mensual ($) 3300 3600 4000 3500 3900 3600
Calcule el coeficiente de correlación muestral y el coeficiente de determinación. Haga un comentario sobre la bondad de ajuste. Solución: ∑𝑿
∑𝒀
∑ 𝑿𝒀
∑ 𝑿𝟐
∑ 𝒀𝟐
2.6 3.4 3.6 3.2 3.5 2.9 19.2
3300 3600 4000 3500 3900 3600 21900
8580 12240 14400 11200 13650 10440 70510
6.76 11.56 12.96 10.24 12.25 8.41 62.18
10890000 12960000 16000000 12250000 15210000 12960000 80270000
Coeficiente de Correlación: 𝑟=
𝑟=
𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 √(𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 ) ∗ (𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 )
6 ∗ 70510 − 19.2 ∗ 21900 √(6 ∗ 62.18 − (19.2)2 ) ∗ (6 ∗ 80270000 − (21900)2 )
= 0.8636
Coeficiente de Determinación: 𝑟 2 = (0.8636)2 = 0.7458
Interpretación: El coeficiente de correlación es positivo y fuerte; esto significa que hay un gran nivel de correlación entre los salarios mensuales (y) y los promedios de los estudiantes con licenciatura en administración (x). El coeficiente de determinación nos indica un porcentaje del 74.58%; esto significa que más del 74% de los salarios mensuales de la muestra se explican por sus respectivos promedios de estudiantes (x).
REGRESIÓN MULTIPLE Problema 17.- Se quiere Ajustar Un modelo que permita estimar los gastos en alimentación de una familia (y) en base a la información que proporcionan las variables regresoras X1 = ingresos mensuales y X2= numero de miembros de la familia. Para ello se recoge una muestra aleatoria simple de 15 familias cuyos resultados son lo de la tabla adjunta ( el gasto e ingreso esta dado en cientos de miles de pesetas) Gasto
Ingreso
Tamaño
Gasto
Ingreso
Tamaño
0.43
2.1
3
1.29
8.9
3
0.31
1.1
4
0.35
2.4
2
0.32
0.9
5
0.35
1.2
4
0.46
1.6
4
0.78
4.7
3
1.25
6.2
4
0.43
3.5
2
0.44
2.3
3
0.47
2.9
3
0.52
1.8
6
0.38
1.4
4
0.29
1.0
5
Con estos damos obtenemos:
N = 15
∑X1 = 42
∑X2 = 55
∑Y = 8.07
∑X21 = 188.08
∑X2X1 = 140.8
∑YX1 = 32.063
∑X22 = 219
∑YX2 = 28.96
Por tanto S = XtX =
-1
15
42
55
T=
8.07
42
188.08
140.8
32.063
55
140.80
219
28.96
De donde S-1T =
1.360
-0.092
-0.282
8.07
-0.092
0.016
0.013
32.063
-0.282
0.013
0.067
28.96
-0.16 =
0.149 0.077
Entonces el Modelo de regresión lineal seria el siguiente:
Gasto = -0.16 + 0.149*Ingreso +0.077* tamaño
Esto quiere decir que por cada cien mil soles de ingreso que tenga una familia el gasto aumentara 0.149 en su valor y que aumenta 0.077 veces el valor de gasto por cada miembro de la familia
Problema 18.- Supongamos que estamos interesados en explicar los gastos en miles (en miles de soles) de las computadoras personales de un departamento comercial a partir de su edad (en años) y del número de horas diarias que trabajan (Horas/días). Se ha tomado en cuenta una muestra de cinco computadoras personales y se obtuvieron los siguientes datos Gasto (miles de soles)
Antigüedad(años)
Horas de trabajo ( hora/dia)
24.6
1
11
33
3
13
36.6
4
13
39.8
4
14
28.6
2
12
Con estos damos obtenemos:
N=5
∑X1 = 14
∑X2 = 63
∑Y = 162
∑X21 = 46
∑X2X1 = 182
∑YX1 = 486.4
∑X22 = 799
∑YX2 = 2075.8
Por tanto S = XtX =
-1
5
14
63
T=
162
14
46
182
486.4
63
182
799
2075.8
De donde S-1T =
181.5
14
-17.5
14
1.3 0
-1.4
-17.5
-1.4
1.7
162 486.4 2075.8
-5 =
2.6 2.4
Entonces el Modelo de regresión lineal seria el siguiente:
Gasto = -5 + 2.6*antigüedad* +2.4* Horas trabajadas
Es decir sin nos pidieran calcular cual sería el gasto que implicaría reparar una computadora con 6 años de antigüedad y que trabaja 8 horas diarias; reemplazando gasto = - 5 + 2.6*6 + 2.4*8 , es igual 139 mil soles
El programa nos indica que la observación 3 se consideraría un dato atípico al resto ya que se encuentra “dispersa” por así decirlo del grupo de las otras observaciones
PRUEBA CHI CUADRADO Problema 19.- El departamento de calidad de la empresa food, una cadena de tiendas de la ciudad de Chiclayo realiza una inspección mensual para revisar los precios anunciados. El siguiente cuadro resume los resultados de una muestra de 500 productos en el mes anterior ,la administración de la empresa desearía saber si existe relación entre las tasas de error en mercancía de precio regular y en los artículos de precio especial .utilice un nivel de significancia de 0.01.
Precio regular
Precio especial
Precio menor
20
10
Sobre precio
15
30
Precio correcto
200
225
Solucion: H0: No hay relación entre las cosas de error y el tipo de artículo. H1: Hay relación entre las cosas de error y el tipo de artículo
1) Calculamos las frecuencias esperadas y el valor de X2
Precio regular
Precio especial
Precio menor
fo=20;fe=14.1
fo=10;fe=15.9
Sobre precio
fo=15;fe=21.15
fo=30;fe=23.85
Precio correcto
fo=200;fe=209.15
fo=225;fe=225.25
(𝒇𝒐 − 𝒇𝒆)𝟐 𝒙𝟐 = ∑( ) 𝒇𝒆
2) Calculando para el problema (X2)
𝐱 𝟐 =8.02907
Gl=(r-1)(c-1)=2
X2critico=9.21
Decisión: Como el valor de X2 (8.029) es menor al valor critico(9.21) aceptamos H0; por lo tanto si existe relación entre el error y el tipo de articulo
Problema 20.- Una empresa de estudios de mercado lleva a cabo un sondeo entre 400 personas de dos ciudades diferentes: Buenos Aires y Montevideo. Se le pregunta a la gente cuál es su marca preferida de cereales, pudiendo elegir entre las opciones: Chocos, Zucos o Fruti. Las respuestas obtenidas se resumen en la siguiente tabla. Chocos
Zucos
Fruti
Total
Buenos Aires
43
85
62
190
Montevideo
57
35
118
210
Total
100
120
180
400
La empresa de estudios de mercado pone a prueba los datos obtenidos en el sondeo para determinar si la marca de cereales preferida de una persona está relacionada a la cuidad donde vive. Se lleva a cabo una prueba chi-cuadrado a un nivel de significancia del 5%. Establezca la hipótesis nula Establezca el número de grados de libertad. Compruebe que la frecuencia esperada para el número de personas que viven en Montevideo y que prefieren Zucos es igual a 63. Escriba el estadístico chi-cuadrado para estos datos. Establezca si la empresa de estudios de mercado acepta la hipótesis nula. Justifique de forma clara su respuesta.
Solución: 𝐻0 : 𝑁𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑝𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑢𝑛 𝑐𝑒𝑟𝑒𝑎𝑙 𝑐𝑜𝑛 𝑙𝑎 𝑐𝑢𝑖𝑑𝑎𝑑 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑟𝑒𝑎𝑙𝑖𝑧𝑎 𝑙𝑎 𝑒𝑛𝑐𝑢𝑒𝑠𝑡𝑎. 𝐻1 : 𝑆𝑖 𝑒𝑥𝑖𝑠𝑡𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑝𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑢𝑛 𝑐𝑒𝑟𝑒𝑎𝑙 𝑐𝑜𝑛 𝑙𝑎 𝑐𝑢𝑖𝑑𝑎𝑑 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑟𝑒𝑎𝑙𝑖𝑧𝑎 𝑙𝑎 𝑒𝑛𝑐𝑢𝑒𝑠𝑡𝑎.
Chocos
Zucos
Fruti
Total
Buenos Aires
fo=43 ; fe=47.5
fo=85;fe=57
fo=62;fe=85.5
190
Montevideo
fo=57,fe=52.5
fo=35;fe=63
fo=118;fe=94.5
210
Total
100
120
180
400
(𝒇𝒐 − 𝒇𝒆)𝟐 𝒙𝟐 = ∑( ) 𝒇𝒆
Calculando para el problema
𝐱 𝟐 = 𝟑𝟗. 𝟐𝟖
Gl=(r-1)(c-1)=2
X2critico=5.991
Decisión: Para un P (0.000) con un nivel de significancia de 0.05, al ser P
View more...
Comments