Trabajo de Estadistica

December 16, 2017 | Author: Diego Mendoza Samamé | Category: Correlation And Dependence, Sampling (Statistics), Hypothesis, Coefficient Of Determination, Statistics
Share Embed Donate


Short Description

Descripción: Solución de ejercicios de Estadística...

Description

MUESTRA Z PARA UNA POBLACIÓN Problema 01.- una encuesta nacional reciente hallo que estudiantes del bachillerato miraban un promedio de 6.8 videos por mes .Una muestra aleatoria de 36 estudiantes universitarios revelo que el número de medio de videos observado era de 6.2, con una desviación estándar de 0.5. En el nivel de significancia de 0.05, ¿se puede concluir que los estudiantes universitarios ven menos videos que los estudiantes de bachillerato? Solución: 1) Ho: µ ≥ 6.8 Ha: µ < 6.8 2) α = 0.05 3) 𝑧=

𝑥̅ − 𝜇 𝜎/√𝑛

=

6.2 − 6.8 0.5/√36

= −7.2

Rechazar si H0 si z < -1.65.

Decisión: rechazamos H0 por lo cual se puede concluir que el promedio de videos observados por los estudiantes universitarios es menor que los de bachillerato.

Problema 02.-un artículo publicado en una revista reporto que el tiempo libre promedio semanal de los hombre es de 40.0 horas, se requiere verificar este articulo para lo cual se selecciona una muestra aleatoria de 60 hombres, se obtienes una media de 37.8 horas con una desviación estándar de 12.2 horas, nivel de significancia de 0.05 ¿Puede concluirse que la información del artículo es falsa? Solución

H0: µ ≥ 40 H1: µ < 40 𝑥̅ −𝜇 √𝑛

𝑧 = 𝜎/

37.8−40 √60

= 12.2/

= −1.40

Rechaza H0 si z < -1.65.

Decisión: No se puede concluir que el tiempo libre de los hombres es menor a 40 horas semanalmente

Problema 03.-De acuerdo con el presidente del sindicato local, el ingreso bruto medio de plomeros en el área de Salt Lake City tiene una distribución normal, con una media de 30000$ y una desviación estándar de $3000. Recientemente, un reportero de investigación para un canal de televisión encontró, en una muestra de 120 plomeros, que el ingreso bruto medio era $30500.Al nivel de significancia de 0.10, ¿se puede concluir que el ingreso medio no es igual a 30000$? Solución: 𝐻0 : 𝜇 = 30000 𝐻1 : 𝜇 ≠ 30000 Estadístico de prueba 𝑧=

𝑥̅ − 𝜇 𝜎/√𝑛

=

30500 − 30000 3000/√120

= 1.83

Decisión: se puede concluir que el ingreso promedio no es de $30000.

PRUEBA DE HIPOTESIS PARA DOS MUESTRAS GRANDES: MEDIAS POBLACIONALES Problema 04.- Un analista financiero ha de comparar las tasas de las transacciones comerciales, en porcentaje, de participaciones en acciones de finanzas relacionadas con el petróleo, contra otras acciones, como las de industrias de manufactura (GE e IBM). Tomas 32 acciones relacionadas con el petróleo y 49 acciones de otras actividades. La tasa media del monto de transacciones relacionadas con el petróleo es 31.4%, y la desviación estándar, 5.1%. En las otras acciones la tasa media fue 34.9% y la desviación estándar, 6.7%. ¿Es esta una diferencia significativa en la tasa considerada de los dos tipos de acciones? Use el nivel de significancia 0.01. Solución: 𝐻0 : 𝜇1 = 𝜇2 𝐻1 : 𝜇1 ≠ 𝜇2 𝑛1 = 32 𝑋̅1 = 31.4 𝑠1 = 5.1

𝑛2 = 49 𝑋̅2 = 34.9 𝑠2 = 6.7 𝛼 = 0.01

RR:

𝐑𝐞𝐜𝐡𝐚𝐳𝐚𝐫 𝐥𝐚 𝑯𝟎 𝐬𝐢 𝐳 > 𝟐. 𝟓𝟖 𝐨 𝐳 < −𝟐. 𝟓𝟖. EP:

𝑧=

𝑋̅1 −𝑋̅2 2

2

𝑠 𝑠 √ 1+ 2

𝑛1 𝑛2

=

31.4−34.9 2

2

√5.1 +6.7 32

= −2.66

49

Decisión: Se rechaza la 𝑯𝟎 ; existe una diferencia significativa entre las tasas de acciones relacionadas con el petróleo y las tasas de acciones relacionadas con otras actividades.

MUESTRA Z PARA UNA PROPORCIÓN Problema 05.- Un artículo reciente, publicado en el diario USA today, indica que solo a uno de cada tres egresados les espera un puesto de trabajo. En una investigación a 200 egresados recientes de su universidad, se encontró que 80 tenían un puesto de trabajo. ¿Puede concluirse, en el nivel de significancia 0.02, que en su universidad la proporción de estudiantes que tienen trabajo es mayor? Solución: 𝑃0 =

1 80 = 0.333 𝑦 𝑃 = = 0.4 3 200

𝐻0 : 𝑃 = 0.333 𝐻𝑎 : 𝑃 > 0.333

𝑍𝑘 =

𝑃 − 𝑃0 √𝑃0 (1 − 𝑃0 ) 𝑛

⇒ 𝑍𝑘 =

0.4 − 0.33 √0.33(1 − 0.33) 200

⇒ 𝑍𝑘 = 2.1053

Prueba e IC para una proporción Prueba de p = 0.333 vs. p > 0.333 98% Límite Valor P Muestra X 1

N Muestra p inferior exacto

80 200 0.400000 0.328479 0.02

Decisión: Se concluye que en su universidad la proporción de estudiantes que tienen trabajo es mayor que 0.333.

Problema 06.-En una investigación hecha en una determinada universidad se encontró que 50% de los estudiantes después de un año de estudio, cambiaban de área principal de estudio. En una muestra de 100 estudiantes de la facultad de economía se encontró que 48 habían cambiado de área de estudio. ¿Ha habido una disminución significativa en la proporción de estudiantes que cambian de área de estudio? Emplee el nivel de significancia 0.05. Solución:

𝑃0 = 50% = 0.5 𝑦 𝑃 =

48 = 0.48 100

1) Estableciendo la HIPOTESIS 𝐻𝑎 : 𝑃 < 0.5 𝑍𝑘 =

𝐻0 : 𝑃 = 0.5

𝑃 − 𝑃0 √𝑃0 (1 − 𝑃0 ) 𝑛

⇒ 𝑍𝑘 =

0.48 − 0.5 √0.5(1 − 0.5) 100

⇒ 𝑍𝑘 = −0.4

Prueba e IC para una proporción

Prueba de p = 0.5 vs. p < 0.5 Límite Valor P Muestra X 1

N Muestra p superior 95% exacto

48 100 0.480000

0.566768 0.382

Decisión: Se puede concluir que no hay evidencias suficientes para afirmar que hay una disminución en la proporción de alumnos que cambian de área después de un año de estudios

Problema 07.- Un fabricante de receptores de televisión sabe, por experiencia, que 10%, o menos de sus equipos necesitará alguna reparación durante los primeros dos años de funcionamiento. De una muestra de 50 receptores que se fabricaron hace dos años, 9 habían necesitado una reparación. Empleando el nivel de significancia 0.05, ¿se puede decir que ha aumentado el porcentaje de equipos que necesitan alguna reparación? Solución:

𝐻0 : 𝑃 ≤ 0.10 𝐻1 : 𝑃 > 0.10 Estadístico de prueba 9 ( ) − 0.10 0.08 50 𝑧= = = = 1.89 √0.0018 0.10(1 − 0.10) 𝑝(1 − 𝑝) √ √ 𝑛 50 𝑝̅ − 𝑝

Decisión: Al ser el p (0.030) menor que α (0.05) se rechaza la hipótesis nula, con lo cual se puede concluir que ha aumentado el porcentaje de equipos que necesitan reparación.

MUESTRA T EN UNA POBLACIÓN Problema 08.- el departamento de reclamaciones de una aseguradora revela que el promedio cuesta $ 60 la realización de todos los tramites , por lo cual aplico medidas para bajar los precios. Se tomo una muestra de 26 demandas se encontró que el promedio de de $ 57 y la desviación es de $ 10.En el nivel de significancia de 0.01 ¿se puede concluir que la diferencia de $3 entre la media muestra y la media poblacional se debe al azar?

Solución: H0: µ ≥ 60 H1: µ < 60 𝑡=

𝑥̅ − 𝜇 𝑠/√𝑛

=

57 − 60 10/√26

t=-1.53 si : -1.53>- 2.485

Decisión : Aceptamos H0 , esto nos indica que las medidas tomadas no han abatido en el costo medio, la diferencia de $3 se debe al azar.

Problema 09.-Una empresa editora de libros universitarios, afirma que cada uno de sus representantes realiza 40 visitas a los profesores. Varios vendedores afirman que esta estimación es muy baja .Se toma una muestra aleatoria de 28 representantes reveló que el número medio de visitas fue de 42 con desviación estándar de 2.1.Al nivel de significancia de 0.05 ¿se puede concluir que el número de visitas es mayor que 40?

Solución: H0: µ ≤ 40 H1: µ > 40 𝑡=

𝑥̅ − 𝜇 𝑠/√𝑛

=

42 − 40 2.1/√28

t=5.040 Rechazar si t >1.703.

Decisión: Se concluye que el número medio de vistas es mayor a 40.

Problema 10.-Los registros de una empresa eléctrica revelo que la duración promedio de un juego de bujías eléctricas es de 22100 mil (millas). El fabricante afirma que el juego de bujías es mayor a 22100, una muestra de 18 juegos de bujía revelo que la duración media es de 23400 con desviación estándar de 1500 ¿Hay evidencia para aceptar la afirmación del fabricante al nivel de significancia de 0.05? Solución:

H0: µ ≤ 22100 H1: µ > 22100 𝑡=

𝑥̅ − 𝜇 𝑠/√𝑛

=

23400 − 22100 1500/√18

t=3.680 Rechazar si t >1.74.

Decisión: Se rechaza H0, por lo cual se puede concluir que la duración media de las bujías es mayor a 22100.

PRUEBA DE HIPOTESIS PARA DOS MUESTRAS PEQUEÑAS: MEDIAS POBLACIONALES Problema 11.- Lisa Monin es directora de presupuesto en la empresa New Process Company, desea comparar los gastos diarios de transporte del equipo de ventas y de personal de cobranza. Recopilo la siguiente información muestral (cantidad en dólares). Ventas ($) Cobranza ($)

131 130

135 102

146 129

165 143

136 149

142 120

139

A nivel de significancia de 0.10, ¿puede concluirse que los gastos medios diarios del equipo de ventas son mayores? ¿Cuál es el valor p? Solución: 𝐻0 : 𝜇1 ≤ 𝜇2 𝐻1 : 𝜇1 > 𝜇2 𝑛1 = 6 𝑋̅1 = 142.5 𝑠1 = 12.24

𝑛2 = 7 𝑋̅2 = 130.28 𝑠2 = 15.79

𝛼 = 0.10

RR:

𝐑𝐞𝐜𝐡𝐚𝐳𝐚𝐫 𝐥𝐚 𝑯𝟎 𝐬𝐢 𝐭 > 𝟏. 𝟑𝟔𝟑.

EP:

𝑠𝑝2 = 𝑡=

(𝑛1 −1)∗𝑠12 +(𝑛2 −1)∗𝑠22 𝑛1 +𝑛2 −2 ̅ −𝑋 ̅ 𝑋 1 2

1 1 √𝑠𝑝2 ∗(𝑛 +𝑛 ) 1 2

= 1.54

= 204.08

Decisión: Se rechaza la 𝑯𝟎 ; es un hecho que los gastos medios diarios del equipo de ventas son

mayores a los gastos medios diarios del equipo de cobranza.

PRUEBA DE HIPOTESIS PARA MUESTRAS DEPENDIENTES Problema 12.- Harry Hutchings es propietario de un gimnasio, y afirma que la ingestión de ciertas vitaminas aumenta la fuerza corporal. Se seleccionan aleatoriamente 10 estudiantes atletas y se les aplica una prueba de fuerza muscular. Después de dos semanas de tomar las vitaminas y de entrenamiento se les aplica nuevamente la prueba. Los resultados se muestran a continuación. Peso (lb) Nombre

Antes

Después

Evie Gorky Bob Mack Lou Brandon Karl Unger Sue Koontz Pat O’Leary Kim Dennis Connies Kaye Tom Dama Maxine Sims

190 250 345 210 114 126 186 116 196 125

196 240 345 212 113 129 189 115 194 124

¿Puede concluirse, empleando el nivel de significancia 0.01, que las vitaminas aumentaron la fuerza muscular de los estudiantes atletas? Solución: 𝐻0 : 𝜇𝑑 ≤ 0 𝐻1 : 𝜇𝑑 > 0

190 250 345 210 114 126 186 116 196 125

𝒅 -6 10 0 -2 1 -3 -3 1 2 1 1

196 240 345 212 113 129 189 115 194 124

𝑑̅ =

∑𝑑 1 = = 0.1 𝑛 10 2

𝑠𝑑 = 𝛼 = 0.01

(∑ 𝑑 ) 𝑛 = 4.28 𝑛−1

2 √∑ 𝑑 −

𝒅𝟐 36 100 0 4 1 9 9 1 4 1 165

0.99

0.01

2.821

RR:

𝐑𝐞𝐜𝐡𝐚𝐳𝐚𝐫 𝐥𝐚 𝑯𝟎 𝐬𝐢 𝐭 > 𝟐. 𝟖𝟐𝟏.

EP:

𝑡=

̅ 𝑑 𝑠𝑑 ⁄ √𝑛

= 0.073

Decisión: No se rechaza la 𝑯𝟎 ; no existe una diferencia significativa en que la variación

en el peso de estos estudiantes se haya dado por el aumento de fuerza muscular generado por la acción de las vitaminas; el cambio en el peso de los estudiantes se puede explicar por la casualidad.

ANALISIS DE VARIENZA Y LA F DE FISHER

Problema 13.- Las calificaciones promedio de 4 asignaturas de un curso de cierta universidad se ilustran en la siguiente tabla. La finalidad es determinar si existen diferencias reales entre las calificaciones de las cuatro asignaturas. Emplear un nivel de significancia de 0,05. Muestra A

B

C

D

6

8

9

9

9

7

8

7

9

10

8

10

6

8

9

10

5

9

10

9

Solución: Como me piden si existen diferencias entre las asignaturas se trataría de un “ANOVA” en una sola dirección para esto hallamos las sumas totales de cada columna y el cuadrado de esa suma. H0: UA = UB = UC = UD H1: UA ≠UB

Regla de rechazo: “ Si F < 3.2, no se rechaza la hipótesis nula; si F > 3.2 , se rechaza la hipótesis nula “

Tabla con totales:

Muestra A

B

C

D

6

8

9

9

9

7

8

7

9

10

8

10

6

8

9

10

5

9

10

9

35

42

44

45

*hallamos la suma de cuadrados de tratamientos 𝑇2

SST = ∑ [𝑛𝑐 ] − 𝑐

SST =

352 5

+

422 5

(∑𝑥)2 𝑁

+

442 5

+

452 5



(35+42+44+45)2 20

= (245 + 352.8 + 387.2 + 405) - 1377.8 = 12.2

*Hallamos la suma total de todos los elementos Total SS = ∑𝑋 2 -

(∑𝑋)2 𝑁

Total SS = 1418 – 1377.8 = 40.2

*Hallamos el error en los tratamientos SSE = Total SS – SST = 40.2 – 12.2 = 28

*Realizamos nuestro cuadro de resumen

Fuente de Variación

Suma de cuadrados

Grados de libertad

Cuadrados medios

Para tratamientos

12.2

3

12.2/3 = 4.07 = MST

Error

28

20- 4 = 16

28/16= 1.75 = MSE

Total

40.2

*Hallando el parámetro “F”

𝑴𝑺𝑻

𝟒.𝟎𝟕

F = 𝑴𝑺𝑬 = 𝟏.𝟕𝟓 = 2.32

Decisión: Para una prueba con un nivel de significancia del 5 % y con grados de libertad para el numerador de 3 y del numerador de 17 su estadístico F es igual a 3.2 Como 2.32 es menor a 3.2 no se rechaza la hipótesis nula , en otras palabras el promedio de las calificaciones en las cuatro asignaturas pueden ser consideradas como los profesores como iguales

Resumen Minitab

Problema 14.- Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión arterial, comparándola con la de una dieta sin sal. Para ello se seleccionan al azar

25 hipertensos y se distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le suministra ningún tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al cuarto el fármaco a una dosis determinada y al quinto el mismo fármaco

a otra dosis. Las presiones arteriales sistólicas de los 25 sujetos al finalizar los tratamientos son:

Grupo

Utilizar del

1

2

3

4

5

180

172

163

158

147

173

158

170

146

152

175

167

158

160

143

182 181

160 175

162 170

171 155

155 160

un nivel

significancia del 5%, para determinar si es que el tratamiento tiene éxito o no solución: H0 : U1 = U2 = U3 = U4 = U5 H1 : U1 ≠ U2 Tabal con totales:

Grupo

Totales

1

2

3

4

5

180

172

163

158

147

173

158

170

146

152

175

167

158

160

143

182

160

162

171

155

181

175

170

155

160

891

832

823

790

757

*hallamos la suma de cuadrados de tratamientos 𝑇2

SST = ∑ [𝑛𝑐 ] − 𝑐

SST =

8912 5

+

8322 5

(∑𝑥)2 𝑁

+

8232 5

7902 5

+

+

7572 5

(891+832+823+790+757)2 25



=

(158776.2 + 138444.8 + 135465.8 + 124820 + 114609.8) - 670105.96 = 2010.64

*Hallamos la suma total de todos los elementos Total SS = ∑𝑋 2 -

(∑𝑋)2 𝑁

Total SS = 673011 – 670105.96 = 2905.04

*Hallamos el error en los tratamientos SSE = Total SS – SST = 2905.04 – 2010.64 = 894.4

*Realizamos nuestro cuadro de resumen Fuente de Variación

Suma de cuadrados

Grados de libertad

Cuadrados medios

Para tratamientos

2010.64

4

2010.64/4 = 502.66 = MST

Error

894.4

25- 5 = 20

894.4/20 = 44.72= MSE

Total

2905.04

*Hallando el parámetro “F” 𝑴𝑺𝑻

F = 𝑴𝑺𝑬 =

𝟓𝟎𝟐.𝟔𝟔 = 𝟒𝟒.𝟕𝟐

11.24

Decisión: Para una prueba con un nivel de significancia del 5 % y con grados de libertad para el numerador de 4 y del numerador de 16 su estadístico F es igual a 2.87 Como 11.24 es mayor a 2.87 se rechaza la hipótesis nula , en otras palabras el tratamiento muestra que existe una diferencia considerable entre las presiones de los pacientes es decir el tratamiento a tenido resultado

Problema 15.-Una Variedad de trigo ha sido cultivada con 5 fertilizantes distintos, para estudiar el efecto de los mismos en la longitud de la planta. Se miden 5 series en 10 hectáreas. Efectué un análisis de la varianza con los 5 fertilizantes y las 10 hectáreas

H1

H2

H3

H4

H5

H6

H7

H8

H9

H10

totales

F1

10

12

8

10

6

13

9

10

9

9

96

F2

11

18

12

15

13

8

15

16

9

13

130

F3

7

14

10

11

9

10

9

11

7

9

97

F4

12

9

11

10

7

8

13

14

10

11

105

F5

7

6

10

7

7

5

6

7

9

6

70

59

51

53

42

44

52

58

44

48

498

totales 47

solución: *Para tratamientos H0 : todas las media de las hectareas son iguales H1 : al menos una media es diferente *Para bloques H0 : todas las media de los fertilizantes son iguales H1 : al menos una media es diferente *hallamos la suma de cuadrados de tratamientos 𝑇2

SST = ∑ [𝑛𝑐 ] − 𝑐

SST =

472 5

+

592 5

(∑𝑥)2 𝑁

+

512 5

+

532 5

+

422 5

= 5021.6 – 4960.08 = 61.52

+

442 5

+

522 5

+

582 5

+

442 5

+

482 5



(498)2 50

*hallamos la suma de cuadrados de bloques 𝑇2

SSB = ∑ [ 𝑏 ] − 𝑛 𝑏

SSB =

962 10

+

1302 10

(∑𝑥)2 𝑁

+

972 10

+

1052 10

+

702 10



(498)2 50

= 5145 – 4960.08 = 184.92

*Hallamos la suma total de todos los elementos Total SS = ∑𝑋 2 -

(∑𝑋)2 𝑁

Total SS = 5368 – 4960.08= 407.92 *Hallamos el error SSE = Total SS – SST - SSB = 407.92 – 61.52 – 184.92 = 161.48

*Realizamos nuestro cuadro de resumen Fuente de Variación

Suma de cuadrados

Grados de libertad

Cuadrados medios

Para tratamientos

61.52

9

61.52/9 = 6.84 = MST

Para Bloques

184.92

4

184.92/4 = 45.23 =MSB

Error

161.48

36

161.48/36 = 4.49 = MSE

Total

407.92

*Hallando el parámetro “F” *para tratamientos 𝑴𝑺𝑻

𝟔.𝟖𝟒

F = 𝑴𝑺𝑬 = 𝟒.𝟒𝟗 = 1.52 Decisión: Para una prueba con un nivel de significancia del 5 % y con grados de libertad para el numerador de 9 y del numerador de 36 su estadístico F es igual a 2.15 Como 1.52 es menor a 2.15 no se rechaza la hipótesis nula , en otras palabras la diferencia entre las longitudes del crecimiento del trigo no es significativa entre las 10 hectáreas

*para bloques 𝑴𝑺𝑩

F = 𝑴𝑺𝑬 =

𝟒𝟓.𝟐𝟑 = 𝟒.𝟒𝟗

10.07

Decisión: Para una prueba con un nivel de significancia del 5 % y con grados de libertad para el numerador de 4 y del numerador de 36 su estadístico F es igual a 2.65 Como 10.07 es mayor a 2.65 se rechaza la hipótesis nula , en otras palabras la diferencia entre las longitudes del crecimiento del trigo es significativa para el tipo de fertilizante q se utiliza, como recomendación se debe utilizar solo el fertilizante que tenga la más grande media entre longitudes

COEFICIENTE DE CORRELACION Y DETERMINACION Problema 16.- En los siguientes datos, y corresponde a los salarios mensuales y x es el promedio obtenido por los estudiantes que terminaron la licenciatura de administración con especialidad en sistemas de información. La ecuación de regresión estimada obtenida con estos datos es 𝑦̀ = 1790.5 + 581.1𝑥 Promedio 2.6 3.4 3.6 3.2 3.5 2.9

Salario mensual ($) 3300 3600 4000 3500 3900 3600

Calcule el coeficiente de correlación muestral y el coeficiente de determinación. Haga un comentario sobre la bondad de ajuste. Solución: ∑𝑿

∑𝒀

∑ 𝑿𝒀

∑ 𝑿𝟐

∑ 𝒀𝟐

2.6 3.4 3.6 3.2 3.5 2.9 19.2

3300 3600 4000 3500 3900 3600 21900

8580 12240 14400 11200 13650 10440 70510

6.76 11.56 12.96 10.24 12.25 8.41 62.18

10890000 12960000 16000000 12250000 15210000 12960000 80270000

Coeficiente de Correlación: 𝑟=

𝑟=

𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 √(𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 ) ∗ (𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 )

6 ∗ 70510 − 19.2 ∗ 21900 √(6 ∗ 62.18 − (19.2)2 ) ∗ (6 ∗ 80270000 − (21900)2 )

= 0.8636

Coeficiente de Determinación: 𝑟 2 = (0.8636)2 = 0.7458

Interpretación: El coeficiente de correlación es positivo y fuerte; esto significa que hay un gran nivel de correlación entre los salarios mensuales (y) y los promedios de los estudiantes con licenciatura en administración (x). El coeficiente de determinación nos indica un porcentaje del 74.58%; esto significa que más del 74% de los salarios mensuales de la muestra se explican por sus respectivos promedios de estudiantes (x).

REGRESIÓN MULTIPLE Problema 17.- Se quiere Ajustar Un modelo que permita estimar los gastos en alimentación de una familia (y) en base a la información que proporcionan las variables regresoras X1 = ingresos mensuales y X2= numero de miembros de la familia. Para ello se recoge una muestra aleatoria simple de 15 familias cuyos resultados son lo de la tabla adjunta ( el gasto e ingreso esta dado en cientos de miles de pesetas) Gasto

Ingreso

Tamaño

Gasto

Ingreso

Tamaño

0.43

2.1

3

1.29

8.9

3

0.31

1.1

4

0.35

2.4

2

0.32

0.9

5

0.35

1.2

4

0.46

1.6

4

0.78

4.7

3

1.25

6.2

4

0.43

3.5

2

0.44

2.3

3

0.47

2.9

3

0.52

1.8

6

0.38

1.4

4

0.29

1.0

5

Con estos damos obtenemos:

N = 15

∑X1 = 42

∑X2 = 55

∑Y = 8.07

∑X21 = 188.08

∑X2X1 = 140.8

∑YX1 = 32.063

∑X22 = 219

∑YX2 = 28.96

Por tanto S = XtX =

-1

15

42

55

T=

8.07

42

188.08

140.8

32.063

55

140.80

219

28.96

De donde S-1T =

1.360

-0.092

-0.282

8.07

-0.092

0.016

0.013

32.063

-0.282

0.013

0.067

28.96

-0.16 =

0.149 0.077

Entonces el Modelo de regresión lineal seria el siguiente:

Gasto = -0.16 + 0.149*Ingreso +0.077* tamaño

Esto quiere decir que por cada cien mil soles de ingreso que tenga una familia el gasto aumentara 0.149 en su valor y que aumenta 0.077 veces el valor de gasto por cada miembro de la familia

Problema 18.- Supongamos que estamos interesados en explicar los gastos en miles (en miles de soles) de las computadoras personales de un departamento comercial a partir de su edad (en años) y del número de horas diarias que trabajan (Horas/días). Se ha tomado en cuenta una muestra de cinco computadoras personales y se obtuvieron los siguientes datos Gasto (miles de soles)

Antigüedad(años)

Horas de trabajo ( hora/dia)

24.6

1

11

33

3

13

36.6

4

13

39.8

4

14

28.6

2

12

Con estos damos obtenemos:

N=5

∑X1 = 14

∑X2 = 63

∑Y = 162

∑X21 = 46

∑X2X1 = 182

∑YX1 = 486.4

∑X22 = 799

∑YX2 = 2075.8

Por tanto S = XtX =

-1

5

14

63

T=

162

14

46

182

486.4

63

182

799

2075.8

De donde S-1T =

181.5

14

-17.5

14

1.3 0

-1.4

-17.5

-1.4

1.7

162 486.4 2075.8

-5 =

2.6 2.4

Entonces el Modelo de regresión lineal seria el siguiente:

Gasto = -5 + 2.6*antigüedad* +2.4* Horas trabajadas

Es decir sin nos pidieran calcular cual sería el gasto que implicaría reparar una computadora con 6 años de antigüedad y que trabaja 8 horas diarias; reemplazando gasto = - 5 + 2.6*6 + 2.4*8 , es igual 139 mil soles

El programa nos indica que la observación 3 se consideraría un dato atípico al resto ya que se encuentra “dispersa” por así decirlo del grupo de las otras observaciones

PRUEBA CHI CUADRADO Problema 19.- El departamento de calidad de la empresa food, una cadena de tiendas de la ciudad de Chiclayo realiza una inspección mensual para revisar los precios anunciados. El siguiente cuadro resume los resultados de una muestra de 500 productos en el mes anterior ,la administración de la empresa desearía saber si existe relación entre las tasas de error en mercancía de precio regular y en los artículos de precio especial .utilice un nivel de significancia de 0.01.

Precio regular

Precio especial

Precio menor

20

10

Sobre precio

15

30

Precio correcto

200

225

Solucion: H0: No hay relación entre las cosas de error y el tipo de artículo. H1: Hay relación entre las cosas de error y el tipo de artículo

1) Calculamos las frecuencias esperadas y el valor de X2

Precio regular

Precio especial

Precio menor

fo=20;fe=14.1

fo=10;fe=15.9

Sobre precio

fo=15;fe=21.15

fo=30;fe=23.85

Precio correcto

fo=200;fe=209.15

fo=225;fe=225.25

(𝒇𝒐 − 𝒇𝒆)𝟐 𝒙𝟐 = ∑( ) 𝒇𝒆

2) Calculando para el problema (X2)

𝐱 𝟐 =8.02907



Gl=(r-1)(c-1)=2



X2critico=9.21

Decisión: Como el valor de X2 (8.029) es menor al valor critico(9.21) aceptamos H0; por lo tanto si existe relación entre el error y el tipo de articulo

Problema 20.- Una empresa de estudios de mercado lleva a cabo un sondeo entre 400 personas de dos ciudades diferentes: Buenos Aires y Montevideo. Se le pregunta a la gente cuál es su marca preferida de cereales, pudiendo elegir entre las opciones: Chocos, Zucos o Fruti. Las respuestas obtenidas se resumen en la siguiente tabla. Chocos

Zucos

Fruti

Total

Buenos Aires

43

85

62

190

Montevideo

57

35

118

210

Total

100

120

180

400



    

La empresa de estudios de mercado pone a prueba los datos obtenidos en el sondeo para determinar si la marca de cereales preferida de una persona está relacionada a la cuidad donde vive. Se lleva a cabo una prueba chi-cuadrado a un nivel de significancia del 5%. Establezca la hipótesis nula Establezca el número de grados de libertad. Compruebe que la frecuencia esperada para el número de personas que viven en Montevideo y que prefieren Zucos es igual a 63. Escriba el estadístico chi-cuadrado para estos datos. Establezca si la empresa de estudios de mercado acepta la hipótesis nula. Justifique de forma clara su respuesta.

Solución: 𝐻0 : 𝑁𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑝𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑢𝑛 𝑐𝑒𝑟𝑒𝑎𝑙 𝑐𝑜𝑛 𝑙𝑎 𝑐𝑢𝑖𝑑𝑎𝑑 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑟𝑒𝑎𝑙𝑖𝑧𝑎 𝑙𝑎 𝑒𝑛𝑐𝑢𝑒𝑠𝑡𝑎. 𝐻1 : 𝑆𝑖 𝑒𝑥𝑖𝑠𝑡𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑝𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑢𝑛 𝑐𝑒𝑟𝑒𝑎𝑙 𝑐𝑜𝑛 𝑙𝑎 𝑐𝑢𝑖𝑑𝑎𝑑 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑟𝑒𝑎𝑙𝑖𝑧𝑎 𝑙𝑎 𝑒𝑛𝑐𝑢𝑒𝑠𝑡𝑎.

Chocos

Zucos

Fruti

Total

Buenos Aires

fo=43 ; fe=47.5

fo=85;fe=57

fo=62;fe=85.5

190

Montevideo

fo=57,fe=52.5

fo=35;fe=63

fo=118;fe=94.5

210

Total

100

120

180

400

(𝒇𝒐 − 𝒇𝒆)𝟐 𝒙𝟐 = ∑( ) 𝒇𝒆

Calculando para el problema



𝐱 𝟐 = 𝟑𝟗. 𝟐𝟖



Gl=(r-1)(c-1)=2



X2critico=5.991

Decisión: Para un P (0.000) con un nivel de significancia de 0.05, al ser P
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF