Unifé: Administración de Negocios Internacionales Estadística Aplicada a los Negocios

Share Embed Donate


Short Description

Download Unifé: Administración de Negocios Internacionales Estadística Aplicada a los Negocios...

Description

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios

REGRESIÓN Y CORRELACIÓN LINEAL Si se tienen n observaciones bidimensionales, cada una correspondiente a la observación simultánea de dos variables en cada unidad estadística: ( X i , Yi ) : (X1 , Y1) , (X2 , Y2) , ........ , (Xn , Yn) Cada par de datos representa un punto en el sistema cartesiano.

Este conjunto de puntos ( X i , Yi ) se llama “diagrama de esparcimiento”, “diagrama de dispersión”, “dispersigrama” o ”nube de puntos”.

Regresión Es un método que se emplea para encontrar una función que se adapte o ajuste a un diagrama de esparcimiento con la finalidad de poder obtener una predicción aproximada de una de las variables a partir de la otra.

Modelos de Regresión: Estudian la relación cuantitativa (estocástica) entre una variable de interés Y (respuesta o dependiente), y un conjunto de variables explicativas ( x 1 , x 2 , .... , x n ) (regresoras o independientes)

Modelo de Regresión de Y sobre X: Sea ( x 1 , y 1 ) , ( x 2 , y 2 ) , ..... . ( x n , y n )  observaciones de las variables X e Y para una muestra de tamaño n, donde ( y 1 ,  y 2 , .... ,  y n )   son independientes. El modelo modelo de regresión lineal simple está dado por:

Yi = α + β X i + e i Donde α y β son parámetros desconocidos, ( x 1 , x 2 , .... , x n )   son valores fijos y ( e1 , e 2 , ... , e n )  son errores aleatorios. Para estimar α  y β se utiliza el método de Mínimos cuadrados, que consiste en encontrar aquellos valores de α  y β  que hagan mínima la suma de los cuadrados de las desviaciones de las observaciones respecto de la recta que representa el modelo, en el sentido vertical.

La suma de las distancias elevadas al cuadrado de cada punto hasta la línea debe ser tan pequeña como sea posible.

Gladys Enríquez Mantilla

212

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Recta de regresión estimada:

ˆ = a + bX Y

Se llama así a la recta que atraviesa el diagrama de esparcimiento y que mejor se ajusta a él. Si llegamos a conocer la ecuación, se podrá llegar a estimar valores de Y desconocidos a partir de valores de X conocidos.

Y = f ( X )

Y : Variable respuesta (dependiente o predictando) X : Variable predictora (independiente o explicativa)

Para hallar los valores de a y b deberán resolverse las dos ecuaciones siguientes, llamadas ecuaciones Normales: na + b∑ X =

a ∑ X + b ∑ X2 =

∑Y ∑XY

Al resolver estas ecuaciones usando la regla de Cramer se obtiene:

a =

∑ X2 ∑ Y − ∑ X ∑ XY 2 n ∑ X2 − (∑ X )

b =

∑ XY − ∑ X ∑ Y 2 n ∑ X 2 − (∑ X )

n

Error o residuo: e i

Es la distancia que hay del valor observado a la recta de regresión. Puede ser positivo o negativo. El error de cada dato se calcula ˆi mediante: e i =  y i −  y  El promedio de los errores es igual a cero, al igual que la suma.

SUPUESTOS: Para que sea válido un modelo de regresión lineal, es necesario que se cumplan los siguientes supuestos: linealidad, homogeneidad, homocedasticidad, independencia y normalidad. Estos supuestos son de suma importancia, pues permitirán al analista determinar de manera técnica, si la relación entre las variables puede ser explicada de manera consistente, o si existen aspectos que podrían indicar que el modelo no es una buena herramienta de predicción, o ajuste.

Gladys Enríquez Mantilla

213

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios

Linealidad Si pretendemos ajustar una línea recta a un conjunto de datos es fundamental que éstos tengan un aspecto compatible con el de una recta. Eso significa que los datos deben ser razonablemente rectos, es decir la recta de regresión debe representar bien la estructura de los datos.

Datos rectos

Datos no rectos

Para verificar la linealidad haremos el gráfico de dispersión X-Y, es decir el diagrama de esparcimiento asociado al conjunto de datos y comprobaremos si presentan una estructura lineal. Esta es una comprobación que realizamos antes de comenzar el análisis de regresión.

Homocedasticidad La varianza de los errores e i es constante constante y no depende del nivel de las las variables. Var ( e i ) = σ 2 ,

i : 1, 2 , .... , n

Esto significa que la nube de puntos de los datos tiene una anchura semejante a lo largo de la recta de regresión. Si lo datos tienen una variabilidad constante se dice que son Homocedásticos. Por el contrario, datos cuya variabilidad no es constante se denominan Heterocedásticos. Gráficamente, significa que la nube de puntos de los datos tiene una anchura más o menos constante a lo largo de la recta de regresión.

Datos homocedásticos homocedásticos

Datos heterocedásticos heterocedásticos

Homogeneidad El valor esperado o promedio de lo errores de estimación e i es cero cero:: E ( e i ) = 0 , i : 1, 2 , .... , n Esto significa que el ajuste que se va a realizar está centrado respecto de los datos, por lo tanto cabe esperar que la recta de regresión esté centrada en la nube de puntos de los datos.

Gladys Enríquez Mantilla

214

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios

Independencia Los errores o residuos e i son variables variables aleatorias aleatorias independientes. independientes. Significa que una observación observación (un punto) no debe dar información sobre las demás. El supuesto de independencia de los errores e i , se puede chequear gráficamente por medio de un diagrama de dispersión entre los residuales (eje Y) y el orden en que se tomaron las observaciones observaciones (si se tiene, en el eje X).

Normalidad Los errores tienen una distribución normal: e i ~ N ( 0 , σ 2 ) . Lo podemos verificar mediante un histograma o un gráfico probabilístico normal de los residuos.

DIAGNOSIS DEL MODELO Una vez ajustado el modelo es necesario comprobar que se cumplen las hipótesis que hemos realizado. Será necesario comprobar la linealidad de los datos, la homocedasticidad, y la normalidad. La comprobación de las propiedades anteriores se realiza mediante gráficos.

Linealidad: El más importante es el gráfico de residuos frente a valores ajustados o predichos, el cual debe presentar un aspecto totalmente aleatorio sin ninguna estructura. Si tiene algún tipo de estructura, entonces no se satisface la linealidad. Aspecto aleatorio

Gladys Enríquez Mantilla

Aspecto no aleatorio

215

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios

Homocedasticidad: Al analizar los residuos, también hay que verificar que su varianza sea más o menos constante. Serán útiles los gráficos de residuos frente a valores de X y de residuos frente a valores ajustados o predichos.

Ejemplo:

Una encuesta entre vendedores de autos usados para determinar la relación entre la cantidad de anuncios clasificados y la venta de autos usados, dio los siguientes resultados del número de avisos clasificados y el número de automóviles usados vendidos para cada uno de los negocios que no utilizaron ningún otro medio publicitario. Nº Anuncios clasificados Nº Autos vendidos a)

: :

74 139

45 110

50 95

38 78

29 60

17 54

Hallar la ecuación de regresión.

Digitar los datos en dos columnas diferentes

Estadísticas – regresión – Regresión…

Gladys Enríquez Mantilla

216

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Clic en Aceptar.

b)

Verificar los supuestos de regresión

LINEALIDAD: Gráfica – Gráfica de Dispersión…

Clic en Aceptar

Clic en Aceptar.

Gráfica de dispersión de AutosVend vs. Anuncios 140 130 120

Interpretación: En el diagrama de esparcimiento se observa que los datos tienen un aspecto compatible con la línea recta.

110

      d     n     e      V 100     s     o      t 90     u      A

80 70 60 50 10

20

30

Gladys Enríquez Mantilla

40 50  Anuncios

60

70

80

217

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios HOMOCEDASTICIDAD En el mismo diagrama de esparcimiento anterior se puede observar que la nube de puntos de los datos tiene una anchura semejante a lo largo de la recta de regresión.

NORMALIDAD Estadísticas – Regresión – Regresión…

Clic en Gráficas…

Clic en Aceptar y luego en Aceptar.

Gráfica de probabilidad normal (la respuesta es AutosVend) 99

95

Interpretación: Se observa que los puntos tienden alinearse alrededor de la recta por lo tanto se concluye que los residuos presentan una distribución normal.

90 80     e 70       j     a      t 60     n     e 50     c 40     r     o      P 30

20 10 5

1

-20

-10

Gladys Enríquez Mantilla

0 Residuo

10

20

218

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios c)

Realizar una diagnosis del modelo. Clic en Gráficas…

Estadísticas – Regresión – Regresión…

Clic en Aceptar y luego en Aceptar. vs. ajustes (la respuesta es AutosVend) 15

10     o     u       d       i     s     e       R

5

0

-5

-10 50

60

70

80

90

100

110

120

130

140

 Valor ajustado

Interpretación: Se observa un aspecto totalmente aleatorio sin ninguna estructura, por lo tanto se satisface la linealidad.

Correlación Es el método empleado para determinar el grado de relación entre las variables que se estudian para así determinar en qué medida una relación funcional describe o explica de una forma adecuada la relación entre estas variables. La regresión por si sola no es suficiente, ya que, es verdad que busca la mejor relación, pero ésta puede que no sea buena.

Coeficiente de correlación lineal simple: r Explica el grado de la bondad del ajuste del modelo de regresión. Se utiliza para saber si la función lineal es representativa de la relación entre dos variables X e Y. −1 ≤ r ≤ + 1

Gladys Enríquez Mantilla

219

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios El coeficiente de correlación lineal se calcula mediante: r =

∑ XY − ∑ X∑ Y 2  2 n 2 2  ∑ X − (∑ X )  n ∑ Y − (∑ Y )  n

En el ejemplo:

r=

6 × 25608 − 253 × 536 ( 6 × 12575 − 253 2 ) ( 6 × 53046 − 536 2 )

= 0.958217

Como el coeficiente de correlación pertenece a la región de confiabilidad entonces concluimos que con un modelo de regresión lineal podemos realizar pronósticos acertados.

Estadísticas – Estadísticas Básicas – Correlación…

Al hacer clic en Aceptar.

Coeficiente de determinación: r 2 El coeficiente de determinación es una medida que nos informan si, en términos globales, el ajuste es bueno o no. Se expresa en porcentaje. 0% ≤ r 2 ≤ 100% Si r 2 tiende a 0%, la bondad del ajuste es mala puesto que la regresión tiende a explicar el 0% de las variaciones de la variable respuesta Y. Si r 2 tiende a 100%, la bondad del ajuste es óptima, puesto que la totalidad de las variaciones de la variable respuesta Y vienen explicadas por la regresión. En el ejemplo:

r 2 = 0.958217 2 = 0.9182 = 91.82% Significa que el 91.78% de las variaciones en el número de autos vendidos están explicadas por el modelo de regresión lineal.

Gladys Enríquez Mantilla

220

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Coeficiente de determinación ajustado:

R-Sq(adj)

En general el r 2 ajustado es una medida más realista de lo que podemos esperar explicar con el modelo. Se ajusta de acuerdo al número de variables independientes en el modelo.

2 rAdj

 

n − 1    (1 − r 2 )   n − p − 1 

= 1 − 

Donde: n : Número de datos. p : Número de variables predictoras. En el ejemplo: 2 rAdj

  6 − 1   2  (1 − 0.958217 ) = 0.8977 = 89.77%   6 − 1 − 1 

= 1− 

Error Estándar de Estimación (margen de error) El error estándar de estimación mide la variabilidad de los datos alrededor de la línea recta ajustada. Si el margen de error tiende a cero, significa que cada valor de los e i tiende a tomar el valor cero, es decir la nube de puntos está muy próxima a la recta estimada. El error estándar de estimación se determina mediante:

SL  =

∑ Y2

− a

∑Y

− b

∑ XY

n−2

En el ejemplo:

SL  =

53046 − 22.8456 × 536 − 1.5768 × 25608 = 10.27 4

En promedio los valores reales se alejan con respecto a la recta de regresión en aproximadamente 10 autos.

En la salida del Minitab que nos dio la ecuación de regresión, tenemos:

Gladys Enríquez Mantilla

221

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios INFERENCIA RESPECTO A LOS PARÁMETROS Después de estimar los valores de los parámetros es conveniente analizar el grado de precisión de la estimación. Para ello nos valdremos de dos herramientas: intervalos de confianza y pruebas de hipótesis.

Intervalo de confianza: IC Un Intervalo de confianza del 95% significa que podemos estar 95% seguros de que este intervalo incluye el valor Y (promedio de Y), para un valor determinado x 0 de la variable predictora X. El intervalo de confianza IC para Y es: L i ≤ Y ≤ L s y se calcula mediante:

n ( x 0 − x )2 1 + 2 n n ∑ X2 − ( ∑ X )

a + b x 0 ± t 0 S L 

t 0 = t1 - α/2 , n − 2 En el ejemplo:

Para 55 avisos clasificados, hallar un intervalo de confianza del 95% para el número promedio de autos vendidos. Solución: t o = t1 - α/2 , n − 2 = t 0.975 , 4 = 2.776

x 0 = 55

22.845555 + 1.576785 × 55 ± 2.776 × 10.277 ×

x = 42.17 6 ( 55 − 42.17 )2 1 + 6 6 × 12575 − 253 2

95.22 ≤ Y ≤ 123.92 Con una confianza del 95%, para 55 avisos clasificados se espera que el número promedio de autos vendidos sea aproximadamente como mínimo 95 y como máximo 124.

Intervalo de predicción: PI Un Intervalo de Predicción del 95% significa que podemos estar 95% seguros de que este ˆ   (valor de una nueva observación individual), para un valor intervalo incluye a y  determinado x 0 de la variable predictora X. Este intervalo siempre es más ancho (menor precisión) que el intervalo de confianza correspondiente porque no buscamos predecir un valor medio sino un valor específico; es decir hay más incertidumbre en la predicción de una observación que en la predicción de un valor promedio. ˆ  es: L i ≤ Y ˆ ≤ L s y se calcula mediante: El intervalo de Predicción PI para Y

a + b x 0 ± t0 SL 

1 n ( x0 − x )2 + 1 + 2 n n ∑ X2 − ( ∑ X )

t 0 = t1 - α/2 , n − 2

Gladys Enríquez Mantilla

222

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios En el ejemplo:

Para 55 avisos clasificados, hallar un intervalo de pronóstico del 95% para el número de autos vendidos. Solución: t o = t1 - α/2 , n − 2 = t 0.975 , 4 = 2.776

x 0 = 55

22.845555 + 1.576785 × 55 ± 2.776 × 10.277 ×

1+

x = 42.17 6 ( 55 − 42.17 )2 1 + 6 6 × 12575 − 253 2

ˆ ≤ 141.50 77.63 ≤ Y Con una confianza del 95%, para 55 avisos clasificados se espera que el número de autos vendidos sea aproximadamente como mínimo 78 y como máximo 142.

Estadísticas – Regresión – Regresión…

Clic en Opciones…

Clic en Aceptar y luego en Aceptar.

Gladys Enríquez Mantilla

223

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Estadísticas – Regresión – Gráfica de línea ajustada…

Clic en Opciones…

Clic en Aceptar y luego en Aceptar. Gráfica de línea ajustada  AutosVend = 22,85 + 1,577 Anuncios 200

Regresión IC de 95% PI d e 95% S R-cuad. R- cu ad .(aju stad o)

150       d     n     e      V     s     o      t     u      A

10,2770 91,8% 89,8%

100

50

0 10

20

30

40 50  Anuncios

60

70

80

Por lo tanto se concluye que es aceptable utilizar este modelo para predecir el número de autos vendidos en función del número de anuncios clasificados.

Gladys Enríquez Mantilla

224

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Intervalo de confianza para β Este intervalo está centrado en la estimación puntual del parámetro y la cantidad que se extiende a cada lado de la estimación depende del nivel de confianza deseado y de la cantidad de variabilidad del estimador. Un intervalo de confianza del ( 1 − α )% para la pendiente regresión es: L i ≤ β ≤ L s

b

SL 

± to

∑ X2 −

β

de la verdadera recta de

t o = t1 - α/2 , n − 2

( ∑ X )2 n

Si el intervalo es muy ancho, la precisión de la estimación es baja. Por el contrario, un intervalo estrecho indica que tenemos una estimación muy precisa. En caso de que el valor 0 esté contenido podemos concluir que es posible que β = 0 . En caso de que el valor cero no esté comprendido en el intervalo, concluiremos que el cero es un valor incompatible con nuestras observaciones En el ejemplo:

Hallar un intervalo de confianza del 95% para el coeficiente de regresión β Solución: to = t1 - α/2 , n−2 = t0.975 , 4 = 2.776 1.576785 ± 2.776

10.277 12575 −

253 6

⇒ 2

0.92 ≤ β ≤ 2.23

Con una confianza del 95% se espera que el coeficiente de regresión β  esté variando entre 0.92 y 2.23.

ANÁLISIS DE VARIANZA (ANOVA) DE REGRESIÓN El ANOVA trata de responder a la siguiente pregunta: ¿es mejor usar X para predecir la variabilidad de Y, o por el contrario se puede conseguir la misma explicación de Y sin tener en cuenta los valores de X, simplemente usando el valor más representativo de Y, esto es, su media? Si sucediera esto último, la recta del modelo tendría pendiente cero, por lo que las hipótesis a verificar son: H0 : β = 0 H1 : β ≠ 0 Si se acepta H0 la variable predictora no influye y no hay relación lineal entre ambas variables.

Gladys Enríquez Mantilla

225

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Con frecuencia el problema de analizar la calidad de la línea de regresión estimada se maneja a través de un enfoque de Análisis de Varianza, donde la suma de cuadrados total se particiona en dos componentes: SCT = SCR + SCE Donde: SCR

: Refleja la cantidad de variación de los valores de Y explicados por el modelo lineal.

SCE

: Refleja la variación alrededor de la línea de regresión. Mide cuánta variación en Y es dejada sin explicación por el modelo, es decir cuánto no se puede atribuir a una relación lineal.

Procedimiento ANOVA de regresión: 1.

2.

3.

Hipótesis: H0 : β = 0

El modelo es Y = α , es decir la variación de Y resulta de fluctuaciones aleatorias que son independientes de los valores de X. No existe relación lineal entre las variables.

H1 : β ≠ 0

El modelo es Y = α + β X , es decir la variación de Y se puede atribuir a las variaciones de X. El modelo lineal es significativo.

F1 − α , 1 , n − 2

Valor Crítico:

F =

Estadística de Prueba:

CMR CME

 Tabla de Análisis de Varianza Fuente de Variación

Grados de Libertad

Suma de Cuadrados

1

SCR

Regresión Error

n-2

SCE

 Total

n-1

SCT

Cuadrado Medio SCR CMR = 1 CME =

SCE n- 2

   

∑X

F CMR CME

Donde: SCT  =

∑Y

2



(

∑ Y )2 n

SCR = b

2

2



(

∑ X )2  n

 

SCE = SCT - SCR 4.

Decisión: Si F pertenece a la región de aceptación, entonces aceptar H0

5.

Conclusión: Con una confianza del (1-α)%, si se acepta H 0 la variable predictora X no influye y no hay relación lineal entre ambas variables. En caso contrario, sí existe una relación lineal entre ambas variables.

Gladys Enríquez Mantilla

226

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios En la tabla de ANOVA se verifica: SCE

S L  =

n−2

r2 =

CME

=

SCR SCT 

En el ejemplo:

Con una confianza del 95%, ¿se puede afirmar que las variaciones en el número de autos vendidos se deben a fluctuaciones aleatorias que son independientes del número de anuncios clasificados? Solución: 1.

Hipótesis: H0 : β = 0 H1 : β ≠ 0 7.71

F1 − α , 1, n − 2

2.

Valor Crítico:

3.

Estadística de Prueba:

F =

= F0.95

,1, 4

= 7.71

CMR = 44.90 CME

 Tabla de Análisis de Varianza Fuente de Variación Regresión Error (residual)  Total

Grados de Libertad 1 4 5

Suma de Cuadrados 4740.96 422.37 5163.33

Cuadrado Medio 4740.96 105.59

F 44.90

Suma de cuadrados del total: (Variación Total) SCT  =

∑Y

2



(∑ Y )2 n

5362 = 53046 − = 5163.33 6

Suma de cuadrados de regresión: (Variación Explicada)  SCR = b   2

∑X

2



( ∑ X )2 n

  = 1.57682  

 2532   12575 −  = 4740.96 6  

Suma de cuadrados del Error: (Variación No Explicada) SCE = SCT  − SCR = 5163.33 − 4740.96 = 422.37 F = 44.90 ∈ RR ⇒ Re chazar H 0  y  Aceptar H1

4.

Decisión:

5.

Conclusión: Con una confianza del 95% no se puede afirmar que las variaciones en el número de autos vendidos se deben a fluctuaciones aleatorias independientes del número de anuncios clasificados.

Gladys Enríquez Mantilla

227

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios

En la salida anterior el Minitab nos mostró la tabla de Análisis de Varianza siguiente:

P = 0.003 < α = 0.05 ⇒

Aceptar H1

PRUEBA DE HIPÓTESIS DE CORRELACIÓN Después de calcular el coeficiente de correlación de Pearson debemos determinar si dicho coeficiente es estadísticamente diferente de cero. Para dicho cálculo se aplica un test basado en la distribución de la t Student. H0 : ρ ≥ 0

H0 : ρ ≤ 0

H0 : ρ = 0

H1 : ρ < 0

H1 : ρ > 0

H1 : ρ ≠ 0

t1−α , n − 2

tα , n − 2

± t1−α /2 , n − 2

Estadística de Prueba t =

r

n−2 1 − r2

Hipótesis: H0 : ρ ≥ 0

No existe correlación lineal negativa entre X e Y.

H1 : ρ < 0

Existe correlación lineal negativa entre X e Y.

Hipótesis: H0 : ρ ≤ 0

No existe correlación lineal positiva entre X e Y.

H1 : ρ > 0

Existe correlación lineal positiva entre X e Y.

Hipótesis: H0 : ρ = 0

No existe correlación lineal entre X e Y.

H1 : ρ ≠ 0

Existe correlación lineal entre X e Y.

Gladys Enríquez Mantilla

228

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios En el ejemplo:

Con una confianza del 95%, ¿se puede concluir que existe una correlación lineal entre X e Y? 1.

2.

Hipótesis: H0 : ρ = 0

No existe correlación lineal entre X e Y.

H1 : ρ ≠ 0

Existe correlación lineal entre X e Y.

Valor Crítico: 1 − α /2 , n − 2 =

t0.975 , 4

= 2.776

-2.776

3.

Estadística de Prueba: r n−2 t = = 2 1− r

0.958217

4

1 − 0.958217

2

4.

Decisión: 6.70 ∈ RR ⇒ rechazar H 0 y aceptar H1

5.

Conclusión:

+2.776

= 6.70

Con una confianza del 95%, existe suficiente evidencia para concluir que hay una asociación lineal entre X e Y.

Estadísticas – Estadísticas Básicas – Correlación…

Clic en Aceptar.

Gladys Enríquez Mantilla

229

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios

REGRESIÓN Y CORRELACIÓN CUADRÁTICA La parábola por lo general se aplica en aquellos casos en que se presenta una parte ascendente y en seguida una descendente o viceversa. En la práctica su uso es poco frecuente sin embargo a veces se utiliza para proyecciones de utilidad, ingresos.

Ecuación de Regresión Cuadrática Su gráfico: ˆ = a + b X + c X2 Y

Para hallar los valores de a, b y c se deben resolver las siguientes ecuaciones normales:

an

+ b ∑ X + c ∑ X2 = ∑ Y

a∑X

+ b ∑ X2 + c ∑ X3 = ∑ X Y

a ∑ X2 + b ∑ X3 + c ∑ X4 = ∑ X2 Y Este sistema se puede resolver utilizando la regla de Cramer.

Coeficiente de correlación cuadrático

a

r =



Y+b

∑ ∑ ∑ Y2 − n Y2

X2 Y − n Y

XY + c

2

Error estándar de Estimación cuadrático

∑ Y2

SC =

− a

∑Y

− b

∑ XY

− c

∑ X2Y

n − 3

Ejemplo:

En la una fábrica se tienen los siguientes datos correspondientes a las horas trabajadas (en miles) que producen cierto producto (en unidades). Horas Trabajadas Producción a)

: :

1 25

2 15

4 10

5 10

7 15

8 10

8 20

9 20

10 35

12 45

Ajustar a los datos un modelo cuadrático. ˆ = a + b X + c X2 Y

Gladys Enríquez Mantilla

230

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Al reemplazar los valores en las ecuaciones normales, resulta: 205 = 10 a + 66 b + 548 c 1560 = 66 a + 548 b + 5022 c 14750 = 548 a + 5022 b + 48788 c



10 66 548 548 5022 = 1 337 672 ∆ = 66 548 5022 48788

205 66 548 40 072 580 a = 1560 548 5022 = = 29.957 1 337 672 14750 5022 48788 10 205 548 − 10 578 600 b = 66 1560 5022 = = − 7.908 1 337 672 548 14750 48788 10 66 205 c = 66 548 1560 548 5022 14750

Hallar el volumen de producción esperado para 14 mil horas. Si X = 14

c)



ˆ = 29.96 − 7.91 × 14 + 0.78 × 142 = 72 Y

Calcular el coeficiente de correlación cuadrático. r = ⇒

d)

1 043 220 = 0.780 1 337 672

ˆ = 29.96 − 7.91 X + 0.78 X 2 Y

⇒ b)

=

29.957 × 205 − 7.908 × 1560 + 0.780 × 14750 − 10 × 20.5 2 5425 − 10 × 20.5 2

= 0.95

Un modelo cuadrático sí es confiable es decir, se pueden realizar pronósticos, porque el coeficiente de correlación pertenece a la región de confiabilidad.

Calcular el coeficiente de determinación cuadrático. r 2 = 0.952 = 90% El 90% de las variaciones que se producen en la producción se pueden atribuir a las variaciones producidas en el número de horas trabajadas, el 10% restante de estas variaciones son debidas a otros factores que no fueron considerados en este caso o se deben a efectos aleatorios.

e)

Calcular el error de estimación cuadrático. SC =

5425 − 29.95696 × 205 + 7.90822 × 1560 − 0.77988 × 14750 = 4.096 7

En promedio los valores reales se alejan con respecto a la ecuación de regresión cuadrática en aproximadamente 4 unidades.

Gladys Enríquez Mantilla

231

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios

Digitar los datos en dos columnas diferentes y luego: Estadísticas – Regresión – Gráfica de línea ajustada…

Clic en Opciones…

Clic en Aceptar y luego en Aceptar.

Gráfica de línea ajustada Produccion = 29,96 - 7,908 HorasTrab + 0,7799 HorasTrab** 2 Regresión IC de 95% PI d e 95%

60 50

S R-cuad. R- cu ad .(aju stad o)

40

    n     o       i     c     c     u 30       d     o     r      P

4,09621 90,4% 87, 6%

20 10 0 0

2

Gladys Enríquez Mantilla

4

6 8 HorasTrab

10

12

232

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios

REGRESIÓN Y CORRELACIÓN EXPONENCIAL Al graficar los valores X e Y se obtiene una curva creciente o decreciente, es decir que la variable predictora evoluciona en forma aritmética y la variable predictando evoluciona en forma geométrica. En la práctica son numerosas las variables que presentan un crecimiento geométrico: la población, ventas, salarios, ingresos, etc.

Ecuación de Regresión Exponencial: Su gráfico: ˆ = a . bX Y

Para facilitar la determinación de las ecuaciones normales, la función anterior se linealiza aplicando logaritmos: Log Y = Log a + X log b Ecuaciones normales:

∑ log Y = n log a ∑ X log Y = log a . ∑ X

∑X log b . ∑ X 2

+ log b . +

Coeficiente de Correlación Exponencial

r =

∑ X log Y − ∑ X . ∑ log Y ( n ∑ X2 − ( ∑ X )2 ) ( n ∑ ( log y )2 − ( ∑ log Y )2 ) n

Ejemplo:

La demanda de televisores (miles de unidades) dólares) en un país desde 2006 hasta 2010 fue: Gastos de Publicidad Demanda de TV a)

: :

2 3

y los gastos de publicidad (cientos de 4 6

5 12

7 24

12 45

Ajustar a los datos un modelo exponencial: ˆ = a . b X aplicando logaritmos: Log Y = Log a + X log b Y

5.37 = 5 log a + 30 log b 38.96 = 30 log a + 238 log b 5.37 30 38.96 208 log a = 290

log b =

5 5.37 30 38.96 290

=

=



∆ =

109.26 = 0.38 290

33.7 = 0.12 290

5 30 = 290 30 238

⇒ a = 2.38

⇒ b = 1.31

ˆ = 2.38 × 1.31X Aplicando antilogaritmos, el modelo exponencial será: Y

Gladys Enríquez Mantilla

233

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios b)

Realizar un pronóstico: Si X = 13

ˆ = 2.38 . 1.3113 = 79.63 ≈ 80 unidades ⇒  Y

Cuando los gastos de publicidad sean de 1300 dólares, se espera que la demanda de televisores sea 80 000. c)

Calcular el coeficiente de correlación exponencial: r =

5 × 38.96 − 30 × 5.37

( 5 × 238 − 302 ) (5 × 6.64 − 5.372 )

= 0.95 ⇒ Es confiable.

Digitar los datos en dos columnas diferentes y luego: Calc – Calculadora…

Entonces en la columna C3 aparecerán los logaritmos de la columna C2. A la columna C3, colocarle el título: LogY

Clic en Aceptar Estadísticas – Regresión – Regresión…

Al hacer clic en Aceptar el Minitab nos da la ecuación de regresión lineal (linealizada mediante logaritmos):

Por lo tanto, aplicando antilogaritmos, se obtiene la ecuación buscada: ˆ = a . bX Y

Gladys Enríquez Mantilla



ˆ = 2.371374 × 1.306171X Y

234

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios

REGRESIÓN Y CORRELACIÓN MÚLTIPLE En la mayor parte de los problemas que se generan en la industria en que se aplica el análisis de regresión, se requiere más de una variable independiente en el modelo de regresión. La complejidad de la mayoría de los mecanismos científicos es tal que, con objeto de estar en condiciones de pronosticar una respuesta, se necesita un modelo de regresión múltiple. Por lo tanto, es razonable pensar que puedan existir varias variables independientes X i que contribuyan a explicar la variable dependiente Y. Es entonces cuando se utiliza el modelo de regresión lineal múltiple.

Regresión Múltiple En la regresión múltiple se trata de predecir una sola variable respuesta a partir de dos o más variables predictoras. Permite utilizar una mayor información disponible para estimar la variable respuesta, de esta forma se trata de aumentar la precisión del estimado. Y 

Variable dependiente

= f ( X1 , X 2 , .... , X p )        

Variables independientes

Modelo de Regresión Múltiple: Un modelo de regresión múltiple expresa una relación lineal entre una variable dependiente  y dos o más variables independientes ( X1 , X 2 , .... , X p ) .

Y = β 0 + β1 X1 + β 2 X 2 + .... + β p X p + e i β i  mide el cambio esperado en la variable respuesta Y cuando X i aumenta en una unidad y

el resto de las variables predictoras permanecen constantes.

El modelo de regresión lineal simple presenta dos componentes:

Gladys Enríquez Mantilla

235

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Ecuación de Regresión para tres variables: Los estadísticos a través de los cuales estimaremos los valores de β 0 , β1  y  β 2   vienen dados por las expresiones de b 0 , b1  y  b 2 ⌢

Y = b0 + b1 X1 + b2X2 Y X1  y  X 2 b0 b1  y  b 2

: : : :

Variable predictando (dependiente o respuesta) Variables predictoras (independiente). constante de regresión. coeficientes de regresión parcial.

La ecuación de regresión lineal múltiple de Y sobre X1  y  X 2 en un sistema tridimensional de coordenadas rectangulares, representa un plano que se llama plano de regresión y es una generalización de la recta de regresión para dos variables.

Esta ecuación de regresión (plano de regresión) puede escribirse como: ⌢

Y = b 0.12 + b 01. 2 X1 + b 02.1 X 2 Donde: Y : b 0. 12 :

Varía parcialmente debido a la variación unitaria de X1 y X 2 Es el intercepto del plano de regresión con el eje Y. Mide la variación

b 01. 2

:

de Y cuando X1 y X 2 permanecen constantes. Es la pendiente asociada a X1 .

:

Indica el cambio (aumento o disminución) que sufrirá Y parcialmente por cada variación unitaria de X1 cuando X 2 permanece constante. Es la pendiente asociada a X 2 .

b 02. 1

Indica el cambio (aumento o disminución) que sufrirá Y parcialmente por cada variación unitaria de X 2 cuando X1 permanece constante. El criterio de mínimos cuadrados localizará el plano que minimice la suma de los cuadrados de los errores de estimación, obteniéndose las ecuaciones normales:

∑ X1 b1 ∑ X12 b1 ∑ X 1 X 2

∑ X2 b 2 ∑ X1 X 2 b 2 ∑ X 22

b0 n

+ b1

+ b2

=

∑ X1 b0 ∑ X2

+

+

=

b0

+

+

=

∑Y ∑ X1 Y ∑ X2 Y

Al resolver simultáneamente estas ecuaciones por el método de determinantes, se obtienen los valores de b 0 , b1 y b 2 .

Supuestos del modelo de regresión lineal múltiple: X 2   el modelo de regresión lineal múltiple Si tenemos dos variables predictoras X1 y requiere las mismas condiciones que el modelo de regresión lineal simple.

Gladys Enríquez Mantilla

236

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Linealidad Los datos deben satisfacer una relación lineal. Los puntos se aj ustan a un plano.

Si hay sólo dos variables predictoras X1 y X 2   entonces los datos deben estar aproximadamente contenidos en un plano.

Para tres o más variables predictoras, la ecuación de regresión es un hiperplano y no podemos visualizar los datos gráficamente.

Homocedasticidad La varianza debe ser constante: Var ( e i ) = σ 2

,

i :1, 2 , .... , n

La nube de puntos tiene el mismo grosor (su aspecto es de una almohada plana y de grosor constante).

Homogeneidad El valor esperado o promedio de lo errores de estimación e i es cero: E(ei ) = 0 ,

i : 1, 2 , .... , n

Independencia Los errores o residuos e i  son variables aleatorias independientes. Es decir, una observación no debe dar información sobre las demás.

Normalidad Los errores e i  tienen distribución normal: e i ~ N ( 0 , σ 2 ) .

Gladys Enríquez Mantilla

237

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Coeficientes de Correlación Simple Sólo comparan dos variables, sin tener en cuenta la tercera. Miden la proporción de la varianza de Y explicada por X1 y X 2 exclusivamente.

r01 r02 r12

: Correlación simple entre Y y X1 : Correlación simple entre Y y X 2 : Correlación simple entre X1 y

X2 0 ≤ R 20 . 12 ≤ 1

Coeficiente de Determinación Múltiple:

Es una medida que representa la proporción de la variación total de Y que está explicada por el plano de regresión es decir por la influencia conjunta de X1 , X 2 y por el azar. Mide la tasa porcentual de los cambios de Y que pueden ser explicados por X1 y X 2 simultáneamente.

R 20 . 12

=

b0

∑Y

+ b1

Coeficiente de Correlación Múltiple:

∑ X1 Y + b 2 ∑ X 2 Y 2 ∑ Y2 − n Y

− nY

2

R 0 . 12

Expresa el grado de relación existente entre tres a más variables. Si todos los valores de las variables, varían en forma proporcional ya sea directa o inversamente, es decir satisfacen una ecuación, se dice que las variables están correlacionadas o que existe una relación entre ellas. − 1 ≤ R 0 . 12 ≤ + 1

Error estándar de estimación múltiple La estimación se hace más precisa conforme el grado de dispersión alrededor del plano de regresión se hace más pequeño. El error estándar múltiple de la estimación es la medida de la eficiencia de la ecuación de regresión. Se expresa en las mismas unidades que la variable dependiente. Es difícil determinar cuál es un valor grande y cuál es uno pequeño para el error estándar.

SM =

∑ ( Yi

ˆ i )2 − Y

n − p −1

Y : Valores observados en la muestra ˆ : Valores estimados a partir a partir de la ecuación de regresión Y n : Número de datos p : Número de variables independientes Error estándar de estimación para dos variables predictoras:

S Y , X1 , X 2 =

Gladys Enríquez Mantilla

∑Y

2

− b0

∑Y −b ∑X Y −b ∑X 1

1

2

2

Y

n−3 238

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Ejemplo:

La siguiente tabla muestra las ventas de un artículo (en cientos), los gastos de publicidad por radio y los gastos de publicidad en periódicos (en miles de soles). Gastos de publicidad en radio (miles de soles) X1 4 7 9 12 a)

Gastos de publicidad en periódico (miles de soles) X2 1 2 5 8

Ventas (cientos) Y 7 12 17 20

ˆ = b + b X + b X Hallar el plano de regresión: Y 0 1 1 2 2

∑ X1 = 32 ∑ X12 = 290 ∑ X1 Y = 505

∑Y

∑ X 2 = 16 ∑ X 22 = 94 ∑ X 2 Y = 276

= 56

∑ Y 2 = 882 ∑ X1X 2 = 159

Las ecuaciones normales son: 4 b 0 + 32 b1 + 16 b 2 = 56 32 b 0 + 290 b1 + 159 b 2 = 505 16 b 0 + 159 b1 + 94 b 2 Usando el método de Cramer se calculan:

= 276

b 0 , b1  y  b 2

4 32 16 ∆ = 32 290 159 = 236 16 159 94

b0

56 32 16 505 290 159 276 159 94 = 236

4 56 16 32 505 159 16 276 94 b1 = 236

b2 ⇒

4 32 56 32 290 505 16 159 276 = 236

=

152 = 0.644 236

=

392 = 1.661 236

=

4 = 0.017 236

ˆ = 0.644 + 1.661 X1 + 0.017 X2 Y

Gladys Enríquez Mantilla

239

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios b)

c)

Interpretar : b 0 , b1  y  b 2 b0 = 0.644 ≈ 64 unid.

Es el incremento promedio en las ventas cuando los gastos de publicidad en radio y los gastos de publicidad en periódico permanecen constantes.

b1 = 1.661 ≈ 166 unid.

El promedio de ventas esperadas crece en aprox. 166 unidades cuando los gastos de publicidad en radio aumentan en S/.1000, manteniéndose constante los gastos de publicidad en periódicos.

b2 = 0.017 ≈ 2 unid.

El promedio de ventas esperadas crece en aprox. 2 unidades cuando los gastos de publicidad en periódico aumentan en S/.1000, manteniéndose constante los gastos de publicidad en radio.

Calculando el coeficiente de correlación lineal múltiple. R 0 .12 =

0.644 × 56 + 1.661 × 505 + 0.017 × 276 − 4 × 142 882 − 4 × 142

R 0 .12 = 0.987 d)

Por lo tanto un modelo lineal sí es adecuado.

Calculando el coeficiente de determinación múltiple. R 2 0 .12 = ( 0.987 )2 = 0.975   = 97.5% Alrededor del 98% de la variación total de las ventas se explica por medio de la ecuación de regresión.

e)

Calcular los coeficientes de correlación lineal: r12 = 0.9875

r13 = 0.959

r12 , r13 , r23 r23 = 0.9706

INFERENCIA RESPECTO A LOS PARÁMETROS El contraste de hipótesis del modelo de regresión permite verificar si todas las variables independientes tienen coeficientes significativos. Hipótesis: H 0 : β1 = β 2 = β 3 = .... = β p H1 : al menos uno de los β i no es cero Si se acepta H 0 significa que ninguna de las variables predictoras es relevante para explicar los cambios de Y.

Gladys Enríquez Mantilla

240

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios

Digitar los datos en tres columnas diferentes. Gráfica – Gráfica de Superficie 3D…

Clic en Aceptar.

Clic en Aceptar.

Gráfica de superficie de Y vs. X3; X2

20

 Y 

15

10

7,5 5,0 5,0

2,5 7,5  X2

Gladys Enríquez Mantilla

10,0

12,5

 X3

0,0

241

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Estadísticas – Regresión – Regresión…

Clic en Aceptar.

Para hallar los coeficientes de correlación lineal simple: Estadísticas – Estadísticas Básicas – Correlación…

Clic en Aceptar.

Gladys Enríquez Mantilla

242

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios SELECCIÓN DE VARIABLES EN REGRESIÓN MÚLTIPLE Método Paso a Paso (Stepwise) En el paso inicial se incluye en el modelo a todas las variables predictoras y en cada paso se va eliminando las variables que dan el P-Value más grande o el valor de t en valor absoluto menor que 2. Una variable que es eliminada del modelo ya no puede volver a entrar en un paso subsiguiente. El proceso termina cuando todos los “P-Values” son menores que 0.05 ó cuando todos los valores de t en valor absoluto son mayores que 2.

Aplicar el método Stepwise para elegir el mejor modelo teniendo en cuenta que se tienen las siguientes variables: Y : X2 : X3 : X4 : X5 : X6 :

Medida de severidad de la enfermedad respiratoria. Años de educación. Número de personas en el edificio donde vive la persona. Medida de la calidad del aire (un número grande indica pobre calidad). Nivel de nutrición. 0 es no fuma y, 1 sí fuma. Y 40 67 30 71 47 53 39 55 47 56 43 41 51 48 36

X2 7 7 6 15 11 10 8 14 10 9 8 8 9 8 8

X3 25 33 19 29 21 24 21 22 26 32 22 19 28 22 19

X4 22 61 30 50 43 54 28 35 22 43 48 27 32 62 37

X5 94 18 103 17 109 0 33 21 76 97 104 -37 87 131 53

X6 0 1 0 1 0 1 0 1 0 1 0 0 1 0 0

Ingresar la matriz de datos en columnas diferentes del Minitab. Estadísticas – Regresión – Paso a Paso…

Gladys Enríquez Mantilla

243

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios Clic en Methods…

Clic en Aceptar y luego en Aceptar.

Regresión paso a paso: Y vs. X2; X3; X4; X5; X6 Alfa a entrar: 0,15

Alfa a retirar: 0,15

La respuesta es Y en 5 predictores, con N = 15

Paso Constante   X2

1

2

-16,14

-12,17

1,95

Valor T Valor P

8,08 0,000

X3  

1,60

1,82

1,46

9,26 0,000

12,28 0,000

X4

0,293

0,279

Valor T Valor P

6,94 0,000

6,81 0,000

-0,048

-0,042

Valor T Valor P

-4,05 0,003

-3,90 0,003

X6 Valor T Valor P

-2,2 -1,13 0,288

S R-cuad. R-cuad.(ajustado) Cp de Mallows

1,88 98,15 97,13 6,0





b 2 = 1.82



b 3 = 1.46



b 4 = 0.279



b 5 = − 0.042

8,44 0,000

Valor T Valor P

X5

→ valor de la constante: b1 = − 12.17

1,91 97,89 97,05 5,3

ˆ = − 12.17 + 1.82 X 2 + 1.46 X 3 + 0.279 X 4 − 0.042 X 5 Y

Este mismo modelo se puede hallar, eliminando la variable X 6   y considerando sólo las demás variables.

Gladys Enríquez Mantilla

244

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios

PRÁCTICA Nº 6 Regresión y Correlación Lineal, Cuadrática, Exponencial y Múltiple

1.-

Una compañía presenta los siguientes datos con respecto a las ventas de un producto durante siete años. Años Ventas a) b)

d) e) f)

2004 28

2005 34

2006 52

2007 58

2008 62

2009 67

Un fabricante quiere establecer si hay una relación parabólica entre las ausencias al trabajo. X: número de permisos al mes e Y: edad del trabajador. Para ello selecciona una muestra aleatoria de 10 trabajadores, obteniendo la siguiente información: Y X a) b) c) d) e)

3.-

2003 36

Ajustar a los datos un modelo parabólico. ¿Se puede afirmar que el modelo hallado será eficiente para realizar pronósticos? Si tuvieras que elegir entre un modelo lineal y uno parabólico. ¿Por cuál te decidirías? Interpretar a , b y c. ¿Qué porcentaje de los cambios producidos en las ventas, no es explicado por el modelo parabólico? Estimar las ventas para el año 2015.

c)

2.-

: :

: :

28 5

32 8

46 4

24 7

28 10

36 4

42 3

37 4

51 3

42 4

Hallar la ecuación de regresión parabólica. Estimar la edad para una persona que solicita 6 permisos en el mes. ¿Es un modelo parabólico, el más adecuado? ¿por qué? ¿Qué porcentaje de los cambios que se producen en la variable predictando se pueden atribuir a otros factores o al azar? Si se usa un modelo lineal, ¿se puede afirmar que los cambios de la predictando se deben a los cambios en la predictora?

Se tienen los siguientes datos correspondientes a las horas de estudio y al número de errores cometidos en un examen de Estadística Aplicada por un grupo de alumnas del IV ciclo de Negocios Internacionales de la Unif é. Horas de estudio Nº de errores Nº de alumnas a) b) c) d) e) f)

: : :

5 7 3

2 14 1

9 6 5

6 7 3

7 5 3

3 8 1

4 10 2

8 4 4

¿Podemos afirmar que los pronósticos que realicemos con este modelo estarán cercanos a la realidad? ¿Por qué? ¿Podemos afirmar que las variaciones que se producen en la variable predictando se pueden atribuir a efectos aleatorios? ¿Por qué? ¿Qué porcentaje de las variaciones en el número de errores se deben a los cambios que se producen en las horas de estudio? ¿Qué tanto se alejan los puntos del diagrama de esparcimiento con respecto a 1.4738 la recta de regresión? ¿Cuántos errores espera cometer como máximo, un alumno que dedica 12 5.331 horas al estudio? ¿Qué se puede decir acerca de la pendiente del modelo de regresión poblacional? Obtener una conclusión altamente significativa.

-1.32 ; -0.46

Gladys Enríquez Mantilla

245

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 4.-

Una compañía recabó los datos adjuntos para comparar el precio de venta de casas nuevas con el tamaño de la construcción en cientos de pies cuadrados. Espacio construido Precio de venta a) b) c) d) e)

5.-

22 118

18 91

30 145

23 105

25 121

Se tiene la siguiente información con respecto a la producción total (miles de unidades) y el costo total (miles de dólares) de cierto artículo en una compañía.

a) b)

: :

30 10

36 20

40 30

48 40

50 50

54 60

66 70

88 80

Ajustar a los datos un modelo exponencial. ¿Podemos afirmar sin temor a equivocarnos que un modelo exponencial sería de mayor utilidad que un modelo lineal? Justifique. Si se tiene una producción de 53000 unidades, ¿cuál será el costo total esperado? Use el mejor modelo. ¿Qué porcentaje de los cambios en Y se pueden atribuir a otras variables o a efectos aleatorios?

c) d)

Los siguientes datos son las puntuaciones obtenidas por un grupo de alumnos en dos tests, que se quieren utilizar como “previsores” de la calificación media de los alumnos en el área de Lenguaje y las calificaciones medias reales obtenidas por dichos alumnos, más tarde, en su curso de lenguaje. Calificac. :  Test 1 :  Test 2 :

8,8 8,9 9,2

5,5 4,9 5,6

8,7 8,6 9,0

6,5 5,0 6,2

r13

r23

8,7 8,0 8,5

8,4 8,7 9,0

9,7 9,4 9,9

5,8 5,5 6,0

Calcular e interpretar:

b) c)

Hallar el plano de regresión. ¿Se puede afirmar que un modelo de regresión múltiple explica la relación entre la variable predictando y las variables predictoras? ¿Por qué? ¿Se puede decir que hay una asociación lineal entre la variable predictando y la mejor predictora? ¿Qué tanto se alejan los valores observados con respeto a la recta de regresión?

e)

r12

6,8 6,3 6,7

a)

d)

7.-

20 116

¿Podemos afirmar que a mayor espacio construido mayor precio de venta?  Justifique su respuesta. Hallar un intervalo altamente significativo para el coeficiente de regresión. Si el espacio construido es de 32 ¿cuál es el precio de venta mínimo y máximo que se espera? Con un nivel del 10%, hallar un intervalo para el precio de venta promedio, si el espacio construido es 35. ¿Qué tan alejados están los valores reales con respecto a los valores estimados?

Costo total Producción

6.-

: :

0,9664

0,9862

0,9920

Se tienen las estaturas (pulgadas) de un grupo de padres y sus hijos mayores. Padres Hijos

: :

65 68

63 66

64 68

68 69

62 66

a)

¿Podemos afirmar que existe una relación inversa entre la estatura de los padres y sus hijos? ¿Por qué?

b)

Hallar los valores mínimo y máximo para el verdadero cambio de la variable predictando cuando la variable predictora aumenta una unidad.

c)

¿Cuál será la estatura promedio de los hijos, si se sabe que la estatura de los padres es 70 pulgadas?

Gladys Enríquez Mantilla

246

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 8.-

Se ajustó el siguiente modelo de regresión con una muestra de 30 familias para explicar el consumo familiar de leche. Yi = α + β1 X1 + β2 X 2 + e i donde: consumo de leche en litros por semana.

Y i

:

X1 X2

: ingreso semanal, en cientos de dólares. : tamaño de familia.

La estimación de mínimos cuadrados de los parámetros de regresión fue: a = − 0.025 a) b) a)

9.-

b 2 = 1.14

Interpretar las estimaciones b1 y b 2 ¿Es posible hacer una interpretación con sentido de a ? Si se sabe que la suma de cuadrados total y la suma de cuadrados del error fueron: SCT  = 162.1  y  SCE = 88.2 Hallar e interpretar el coeficiente de determinación y el coeficiente de correlación múltiple.

Una compañía desea determinar si el número de anuncios transmitidos por televisión están correlacionados linealmente o no con las ventas de su producto, para lo cual obtuvo la siguiente información de a lgunas ciudades. Ciudad Nº comerciales TV Unidades vendidas a) b) c) d) e) f) g)

10.-

b1 = 0.052

: : :

A 12 7

B 6 5

C 9 10

D 15 14

E 11 12

F 15 9

G 8 6

¿Se puede afirmar que existe una relación lineal entre estas dos variables? Hallar la ecuación de un modelo lineal. Interpretar a y b. ¿Podemos afirmar que las variaciones en las unidades vendidas resultan de fluctuaciones aleatorias que son independientes del número de comerciales de TV? ¿Estarías dispuesto a invertir en publicidad? ¿Por qué? Con una confianza del 99%, ¿qué podemos afirmar acerca del cambio que se produce en las unidades vendidas cada vez que se incremente en uno el número de comerciales de TV? Si se anuncian 17 comerciales en la TV, ¿cuántas unidades se espera vender? Usar un nivel del 90%. En promedio, ¿cuántas unidades se espera vender si se sabe que en la TV se han anunciado 20 comerciales?

Para los siguientes datos correspondientes a las ventas de un producto durante el periodo 2003-2009: Años Ventas a) b) c) d) e) f)

: :

2003 545

2004 755

2005 919

2006 1200

2007 1600

2008 2500

2009 4200

Ajustar a los datos una curva exponencial. Estimar las ventas para los años 2013 y 2017. ¿Se puede afirmar que estos pronósticos son cercanos a la realidad? ¿Por qué? Calcular los errores de estimación para cada año. ¿Qué tanto explica el modelo de regresión hallado, la relación entre las variables predictora y predictando? En este caso, ¿sería más apropiado un modelo lineal o un modelo exponencial? ¿Por qué?

Gladys Enríquez Mantilla

247

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 11.-

12.-

El departamento de contabilidad de una fábrica de papel desea estimar la cantidad mensual de gastos generales de la fábrica (gastos indirectos de producción, en miles de dólares). En el pasado, la firma ha estimado estos gastos sobre la base del número esperado de horas directas de trabajo. En los últimos años, sin embargo, los gastos estimados se han vuelto un predictor errático de los gastos reales. Como resultado, la firma está buscando otro factor con el cual se pueda mejorar la ecuación de estimación. El departamento de contabilidad mantiene un historial del número de horas (en cientos) durante las cuales han estado en producción las máquinas de la firma. Se tienen los siguientes datos para los últimos diez meses. Y : X1 : X2 :

Gastos generales actuales de la fábrica (miles de dólares) Horas de trabajo directas (en cientos) Horas de máquina (en cientos).

Y : X1 : X2 :

29 45 16

24 42 14

27 44 15

25 45 13

26 43 13

28 46 14

30 44 16

28 45 16

28 44 15

27 43 15

a)

¿Se puede combinar esta información con los datos de horas de trabajo directas y obtener una ecuación de estimación más precisa para los gastos generales de la fábrica?

b)

Si quisieras hallar un modelo lineal, ¿cuál variable descartarías? ¿Por qué?

c)

¿Se podría afirmar que los cambios que se producen en la variable predictando se pueden atribuir a los cambios de la mejor variable predictora?

d)

¿En cuánto se alejan los puntos del dispersigrama con respecto a la recta de regresión?

e)

Al hallar un modelo lineal, ¿se puede decir que la relación es directa? ¿Por qué?

f)

Hallar un intervalo para el gasto promedio.

Se desea hacer un estudio para examinar el papel que juega la televisión en la vida de un grupo preseleccionado de personas de edades superiores a los 65 años. El propósito de dicho estudio es proporcionar información que permita hacer una programación adecuada a las necesidades de este grupo. Una muestra aleatoria de siete personas de edades superiores a los 65 años fue seleccionada y a cada persona le fue solicitada la siguiente información: Nº de horas TV Edad Escolaridad (años) a) b) c) d) e) f) g) h) i)

: : :

0.5 73 14

0.8 65 10

0.9 69 10

1.6 81 12

2.8 71 12

3.0 75 6

3.3 79 6

Hallar el plano de regresión. Interpretar los coeficientes de regresión. Calcular los residuos. ¿Qué tan alejados se encuentran los valores reales con respecto al plano de regresión? ¿Qué tanto explica el plano de regresión hallado, las variaciones de la variable predictando teniendo en cuenta las variaciones de las dos predictoras? ¿Cuál de las dos variables predictoras, explican mejor la variabilidad de la variable predictando? ¿Sería confiable un modelo lineal usando únicamente la mejor variable predictora? Si es así encuentre dicho modelo. Usando un modelo lineal, realizar un pronóstico con un nivel del 1%. ¿Qué tanto se alejan los valores observados con respecto a los valores estimados? ¿Se puede afirmar que a medida que aumenta la variable predictora, se espera que la variable predictando también crezca. ¿Por qué?

Gladys Enríquez Mantilla

248

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 13.-

Las pruebas acerca del consumo de combustible de un vehículo que viaja a diferentes velocidades produjeron los siguientes resultados: Velocidad Consumo a) b) c) d) e)

14.-

: :

40 19.1

50 19.3

60 19.5

70 19.7

80 19.8

El gerente de personal de una empresa considera que puede haber una relación entre el ausentismo (días), Salario (en miles de soles) y la edad (años). Selecciona una muestra aleatoria de 8 empleados, con los resultados siguientes:

a) b) c) d) e) f) g)

: : :

15 27 8.5

6 61 16.4

10 37 14.3

18 23 8.0

9 46 14.7

7 58 14.0

14 29 11.2

11 36 15.3

Encontrar los coeficientes de regresión múltiple. Interprete el significado de las pendientes. Predecir el número de días de ausencia de un empleado de 40 años de edad que gana S/ 13 000 al año. ¿Sería adecuado un modelo lineal, usando la mejor variable predictora? Hallar dicho modelo lineal, si fuera confiable. Usando dicho modelo, realizar una estimación interválica. ¿Qué tanto se alejan los puntos del diagrama de esparcimiento con respecto al plano de regresión?

Se tienen los siguientes datos:  Temperatura (ºC) Nº de helados vendidos a) b) c) d)

16.-

30 18.8

¿Qué porcentaje de las variaciones en el consumo se pueden atribuir a otros factores o a efectos aleatorios? Con una confianza del 99%, ¿se puede afirmar que un modelo lineal explica la relación existente entre velocidad y consumo? Con una confianza del 90%, ¿cuál sería el máximo valor esperado para el coeficiente de regresión poblacional? Con una confianza del 99%, ¿cuánto se espera que sea el consumo promedio si se sabe que la velocidad es 85? ¿Podemos concluir que hay una asociación lineal entre ambas variables?

Días ausente Edad Salario

15.-

20 18.3

: :

10 5

15 12

20 24

25 38

30 70

34 130

 Trazar el diagrama de esparcimiento. Hallar el modelo más adecuado. Si la temperatura es 32 ºC, ¿cuánto se espera que sea el promedio de helados vendidos? Cada vez que la temperatura se incremente en un grado ¿cuánto se espera que cambie en promedio la cantidad de helados vendidos?

Los siguientes datos corresponden a las horas de estudio para una prueba y al número de respuestas correctas obtenidas en dicha prueba por 17 alumnos. Horas de estudio Respuestas correctas Nº de alumnos a) b) c) d) e)

: : :

1 2 1

5 11 3

6 20 4

2 10 3

7 14 4

3 12 2

Si un modelo lineal es confiable, hallar un pronóstico altamente significativo e interpretarlo. ¿Qué tipo de relación existe entre las variables involucradas? ¿Por qué? Calcular los errores de estimación. ¿Cuál será el valor máximo esperado para el verdadero coeficiente de regresión? ¿En cuánto se alejan los valores observados con respecto a los valores estimados?

Gladys Enríquez Mantilla

249

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 17.-

Los siguientes datos indican las ventas mensuales (en miles de soles) y los años de experiencia en ventas de diez vendedores de una f ábrica. A.E. Ventas a) b) c) d)

18.-

: :

5 6

5 5

6 7

7 10

1 3

8 11

3 4

7 9

Una compañía asigna diferentes precios a un equipo de sonido particular en ocho regiones diferentes del país. Los siguientes datos muestran el número de unidades vendidas y los precios correspondientes (en miles de soles).

a) b) c)

: :

5 15

8 7

10 3

13 6

16 14

22 36

28 62

¿Se puede afirmar que el modelo parabólico es el mejor ajuste? Hallar el modelo de regresión parabólico. ¿Se puede afirmar que los pronósticos que se realicen usando el modelo parabólico serán acertados? ¿Por qué?

Se realizó un estudio para determinar los efectos de no dormir en la capacidad de las personas para resolver problemas sencillos. Un grupo de personas participó en el estudio que consistió en dar a cada persona, después de un periodo específico sin dormir, un conjunto de problemas sencillos de sumar y se registró el número de errores. Se obtuvieron los siguientes resultados: Nº.de errores Nº.horas sin dormir Nº. de personas a) b) c) d) e) f)

20.-

2 4

Hallar un modelo de regresión cuadrático. ¿Podemos afirmar que una curva parabólica expresa adecuadamente la relación entre las variables consideradas? ¿Por qué? ¿Cuánto se ganará en confiabilidad si se elige el mejor modelo entre un cuadrático y un lineal? ¿A qué distancia se encuentran los puntos del dispersigrama con respecto a la curva de regresión hallada?

Ventas Precio

19.-

4 5

: : :

9 8 3

6 12 2

8 16 3

14 20 4

16 24 5

¿Se puede afirmar que existe una relación directa entre número de errores y número de horas sin dormir? Explique el significado en este caso. Hallar el plano de regresión. Realizar un pronóstico e interpretarlo. Hallar un modelo lineal usando la mejor predictora. Interpretar a y b. Los cambios que se producen en Y, ¿se pueden atribuir a los cambios que suceden en la mejor predictora? Si la variable predictora se incrementa en una unidad, ¿qué podemos esperar que suceda con la variable predictando?

Los siguientes datos corresponden al grado de ansiedad de un grupo de alumnos elegidos aleatoriamente en cierta universidad y sus calificaciones. Ansiedad Calificación a) b) c) d)

: :

8 7

10 10

12 8

16 9

14 6

18 5

22 5

23 6

19 8

26 7

¿Se puede afirmar que a mayor nivel de ansiedad, calificaciones más bajas y a la recíproca? ¿Qué calificación cabe esperar partiendo de una ansiedad de 20 puntos? Obtener una conclusión altamente significativa. Para una ansiedad de 25 puntos, ¿cuánto se espera que sea en promedio la calificación? ¿Cuál será el cambio que se produce en la calificación, cuando la ansiedad se incremente en un punto?

Gladys Enríquez Mantilla

250

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 21.-

A continuación se presentan los datos obtenidos en un estudio realizado por una cadena de supermercados para determinar la eficiencia de varios soportes publicitarios sobre ventas. Los datos fueron obtenidos de las ventas semanales (en miles de soles), de los gastos publicitarios en revistas, en televisión, en radio y en boletines volantes distribuidos en casas. Ventas Revista  TV Radio Volante a) b) c) d) e)

22.-

: : : : :

649 48 40 7 36

441 56 14 8 41

807 62 28 6 34

450 41 31 3 33

828 69 21 0 32

314 73 36 5 7

472 88 38 6 8

¿Sobre cuál soporte publicitario se debería invertir? ¿Por qué? Hallar el modelo de regresión que permita estimar las ventas, teniendo en cuenta los dos soportes publicitarios más eficientes. ¿Qué porcentaje de las variaciones en las ventas se pueden atribuir a otros factores o al azar? Realice e interprete un pronóstico. Utilizando el método paso a paso, hallar el mejor modelo de regresión.

Se tienen los datos correspondientes a las calificaciones en una prueba de inteligencia, el número de clases perdidas y las calificaciones en el curso de Estadística Aplicada de un grupo de alumnas del IV ciclo de Negocios Internacionales de la Unifé. Prueba de Inteligencia Calific. Estadística Clases perdidas a) b) c) d) e) f)

23.-

365 61 36 13 32

: : :

50 7 6

54 12 7

62 13 5

70 17 2

75 18 1

80 19 3

90 20 2

Estimar la calificación de estadística de una estudiante que ha perdido 4 clases  y tiene una puntuación de 60 en la prueba de inteligencia. ¿Qué tanto de los cambios en la variable predictando son explicados por el plano de regresión? Encuentre un modelo lineal usando la mejor variable predictora. ¿Se puede afirmar que los cambios de la variable predictando se pueden atribuir a los cambios de la variable predictora? ¿Por qué? Realizar un pronóstico al nivel del 5% e interpretarlo. Si la variable predictora se incrementa en una unidad, ¿cuál será el cambio que se producirá en la variable predictando?

Una firma cree que sus ingresos anuales dependen de sus gastos por investigación. Se tiene la información de los últimos seis años (en miles de dólares). Ingreso Anual Gastos en Investigación a)

: :

31 5

40 11

30 4

34 5

25 3

20 2

¿Qué tipo de relación existe entre el ingreso anual y los gastos en investigación? ¿Por qué?

b)

¿Podemos afirmar que existe una asociación lineal entre ambas variables?

c)

¿Se puede concluir que los cambios que se producen en la variable predictando son atribuibles a los cambios de la variable predictora?

d)

Para un gasto de investigación de $8000, ¿cuánto se espera que sea el ingreso anual promedio? Usar un nivel del 10%.

e)

Si en investigación se tuvo un gasto de $6000, ¿cuál será el ingreso anual esperado?

f)

Al incrementarse el gasto en $1000, ¿qué cambio se producirá en el ingreso anual?

Gladys Enríquez Mantilla

251

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 24.-

La empresa "Autos S.A.", fabricante de automóviles, vende éstos por medio de distribuidores repartidos en todo el país. El gerente de dicha compañía, ha logrado desde el año 2005 un crecimiento de las ventas de 28%. Muy orgulloso de este resultado, lo atribuye sobre todo a la experiencia de sus vendedores. El ha recolectado los siguientes datos mensuales de ventas en unidades y del número de vendedores: Ventas (unidades) Nº de vendedores a)

c) d)

35 12

33 9

44 16

28 10

20 6

Se intenta estudiar la relación existente entre el número de años de afiliación a un partido político, la motivación por pertenecer a ese partido y el nivel de satisfacción con dicho partido. Para ello se parte de los datos de ocho individuos tomados al azar. Satisfacción : Años de afiliación : Fuerza motivación : a) b) c) d) e) f)

26.-

25 7

El gerente concluye que el 95% de la variación de las ventas son explicadas por la variación del número de vendedores, razón por la cual propone al Director, contratar más vendedores. ¿Es válida la conclusión del gerente? Explique por qué. Se afirma que por cada vendedor que se contrate, el número de unidades vendidas se incrementará. ¿Es correcta la afirmación? ¿Por qué? ¿Se puede concluir que ambas variables están relacionadas en forma lineal? Si se usa un modelo lineal para realizar pronósticos, ¿serán acertados estos pronósticos?

b)

25.-

: :

6 8 4

7 7 5

4 10 3

9 3 7

10 6 8

9 13 8

9 4 9

5 12 2

Calcular e interpretar: -0,256 0,8735 -0,2753 r12 r13 r23 encontrar la ecuación del plano de regresión de Y sobre X1  y X2 Estimar la satisfacción de una persona que lleva 9 años afiliada a su partido político y tiene una motivación de 7. ¿Qué porcentaje de los cambio que se producen en Y, se pueden atribuir a otros factores o al azar? Si tuvieras que descartar una de las variables predictoras, ¿cuál sería? ¿Por qué? ¿La mejor predictora está linealmente asociada con la predictando?

En una investigación sobre la relación que existe entre el número de veces que se repite una tarea y los errores que se cometen se ha constatado la relación curvilínea existente entre ambas variables. Veces repite Nº errores a) b) c) d) e) f) g) h)

: :

6 26

8 18

11 10

13 8

16 6

17 4

18 2

Hallar la ecuación de regresión exponencial de la variable Y sobre X. Realizar e interpretar un pronóstico, usando el modelo hallado. Los pronósticos que se realicen usando este modelo, ¿serán cercanos a la realidad? ¿Por qué? Si una tarea se repite 15 veces, ¿cuántos errores se espera cometer en promedio? Por cada vez que se repita una tares, ¿cómo variará el número de errores? ¿Cuántos errores se espera cometer, si la tarea se ha repetido diez veces? Los cambios que se producen en el número de errores, ¿los podemos atribuir a los cambios en el número de veces que se repite la tarea? ¿Se puede afirmar que la relación que hay entre ambas variables es lineal?

Gladys Enríquez Mantilla

252

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 27.-

28.-

Considerando la evolución del producto bruto interno de un país (millones dólares) desde el año 2002 al 2009 fue: Años

P.B.I.

2002 2003 2004 2005 2006 2007 2008 2009

2 4 3 5 6 6 5 8

a) b) c) d) e)

: :

50 1.1

ecuación

de

tendencia

b)

Calcular e interpretar el coeficiente de Correlación.

c)

Hallar la proyección del producto bruto Interno de los cinco años siguientes.

60 2.0

68 3.0

88 3.8

125 5.0

135 5.5

184 6.5

Si tuvieras que elegir entre un modelo lineal y un modelo exponencial, ¿cuál crees que sería de mayor utilidad? ¿Por qué? Hallar dicho modelo. Realizar e interpretar un pronóstico. Calcular los residuos. ¿Qué tanto de los cambios en la variable predictando se pueden atribuir a los cambios de la variable predictora?

Se tienen los siguientes datos que corresponden al espíritu de iniciativa personal en las situaciones de solución de problemas. Se tomó una muestra aleatoria de ingenieros de sistemas. Iniciativa Personal : Madurez Emocional : Seguridad en sí mismo: a) b) c) d) e) f)

30.-

Hallar la exponencial.

La demanda de televisores (miles de unidades) y los gastos de publicidad (cientos de dólares) en un país, desde 2003 hasta 2009 fue: Demanda Publicidad

29.-

a)

9 10 8

11 10 12

10 18 15

14 15 17

18 20 23

16 16 21

19 22 26

24 20 35

Si tuviera que hallar un modelo sólo con una variable predictora, ¿a cuál elegirías? ¿Por qué? Hallar un modelo lineal adecuado usando la mejor variable predictora. ¿Se puede afirmar que tanto la variable predictando como la variable predictora, varían en el mismo sentido? Explica. ¿Podemos afirmar que la variación de Y se puede atribuir a la variación de X, o se debe a fluctuaciones aleatorias? Hallar la ecuación del plano de regresión. ¿Qué puntaje se esperaría en Iniciativa Personal para un ingeniero que tiene 30 en seguridad en sí mismo y 19 en Madurez Emocional?

Las calificaciones de un grupo de estudiantes en su reporte de medio año y los exámenes finales fueron las siguientes: Medio Año Final a) b) c) d)

: :

77 82

50 66

71 78

72 34

81 47

94 85

96 99

Encontrar un modelo lineal. Interpretar a y b. Realizar un pronóstico al nivel del 99%. ¿Cuál será el valor máximo esperado para el verdadero cambio de la variable predictando cada vez que la variable predictora se incrementa en una unidad? Si la calificación a medio año es 85, ¿cuánto se espera que sea la nota promedio del examen final?

Gladys Enríquez Mantilla

253

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 31.-

Los siguientes datos corresponden a los CI verbal y no verbal así como las calificaciones en Inglés, de un grupo de estudiantes del IV ciclo de ingeniería de sistemas. Calificación CI Verbal CI No Verbal a) b) c) d) e)

32.-

60 90 92

80 100 104

95 140 135

90 120 118

El departamento de ventas de una compañía desea hallar un modelo exponencial que le permita estimar la demanda (en miles de dólares) de refrigeradoras para los próximos años, tomando en cuenta los datos históricos decrecientes desde el año 2003 hasta 2009.

a) b) c) d)

: :

550 2003

400 2004

250 2005

200 2006

100 2007

70 2008

90 2009

Hallar un modelo exponencial que se ajuste a los datos. ¿Podemos confiar en el modelo encontrado para realizar buenos pronósticos? ¿Cuál será la demanda esperada para los años: 2012 y 2015? ¿Qué tanto de los cambios en la variable predictando, lo podemos atribuir a los cambios de la variable predictora?

Un psicólogo experimental afirma que en un experimento controlado, cuanta más edad tenga un niño tanto menor será su número de respuestas irrelevantes. Los siguientes datos fueron recopilados para comprobar su aseveración. Edad Nº Rptas.Irrelev. a) b) c) d) e) f) g)

34.-

70 110 120

Calcular e interpretar el coeficiente de correlación múltiple R 1.23 ¿Qué porcentaje de los cambios en las calificaciones lo podemos atribuir a los cambios de ambas variables predictoras? ¿Hay una asociación lineal entre las calificaciones y la mejor predictora? Usar un nivel del 10%. Si la variable predictora toma el valor 95, ¿cuánto se espera que sea la calificación promedio? Obtener una conclusión altamente significativa. ¿Qué tan alejados se encuentran los puntos del dispersigrama con respecto a un modelo de regresión lineal?

Demanda Años

33.-

: : :

: 2 : 12

4 13

5 9

6 7

6 12

7 8

9 6

9 9

10 7

12 5

¿Parece válida la afirmación del psicólogo? Hallar la ecuación de un modelo lineal, sólo si es confiable. ¿Influye la variable predictora sobre la variable predictando? Hallar los límites esperados para el verdadero cambio que se produce en la variable predictando cuando la predictora se incrementa en una unidad. Realiza e interpreta un pronóstico altamente confiable. Calcular los errores de estimación. Si tuvieras que decidir entre un modelo lineal y un exponencial, ¿cuál elegirías y por qué?

Para los siguientes datos: Meses Enero Febrero Marzo Abril Mayo  Junio  Julio

Nº turistas 13 17 38 42 40 34 30

Gladys Enríquez Mantilla

a)

Ajustar a los datos un modelo de Regresión parabólica.

b)

Calcular el coeficiente de correlación.

c)

Estimar cuántos turistas se espera recibir para el mes de diciembre.

254

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 35.-

En un estudio sobre el efecto que produce el aire acondicionado en oficinas, se obtuvieron los siguientes datos correspondientes a la temperatura (°C) y el número de errores cometidos por un radiotelegrafista en una hora.  Temperatura Nº de errores a) b) c) d)

36.-

28 10

35 14

30 13

27 9

Una compañía desea encontrar un modelo que explique la relación existente entre la producción (miles de unidades por año) y el costo marginal de producción (dólares por unidad).

a) b) c)

: :

5 20

7 60

9 60

9 100

11 120

12 120

12 180

14 240

16 280

El asesor estadístico de la compañía asegura que el modelo que mejor describe la relación entre estas dos variables es un modelo exponencial, ¿estás de acuerdo con él? ¿Por qué? Hallar la ecuación del modelo más adecuado. Si el modelo lineal es el mejor, realiza e interpreta un pronóstico en forma de intervalo.

Se tienen los datos correspondientes a las edades (años), los ingresos (dólares) y el número de años desde que salieron de la universidad de un grupo ingenieros de sistemas que trabajan para la misma institución. Edad Nº de años Ingresos a) b) c) d) e) f)

38.-

26 12

Hallar los modelos de regresión de Y sobre X. ¿Qué tipo de relación existe entre ambas variables? ¿Por qué? ¿Los cambios en el número de errores, lo podemos atribuir a los cambios producidos en la temperatura? Si la temperatura es 38ºC, ¿cuántos errores se espera cometer en promedio? Obtener una conclusión altamente significativa.

Producción Costo Marg.

37.-

: :

: : :

57 13 512

60 19 650

45 14 550

42 16 500

36 12 540

45 16 680

62 25 680

36 10 456

52 18 590

Hallar un modelo lineal usando la mejor variable predictora. ¿Qué tipo de relación existe entre ambas variables? ¿Por qué? Hallar el plano de regresión de Y sobre X1 y X2 Interpretar b1 y b2 ¿Qué tanto explican a la variable predictando ambas variables predictoras en forma conjunta? ¿Qué tanto se alejan los puntos del dispersigrama con respecto al plano de regresión?

Los siguientes datos son los ingresos por ventas mensuales, en centenas de $ que obtuvo una compañía. Mes : Ingresos : a) b) c) d) e) f) g) h)

1 31

2 43

3 61

4 85

5 118

6 164

7 228

8 316

9 444

10 611

¿Podemos afirmar que un modelo exponencial es el más adecuado en este caso? ¿por qué? Encuentre la ecuación del modelo más adecuado. Realice un pronóstico puntual e interprete. Calcular los valores estimados y los errores de estimación. Usando un modelo lineal, ¿qué tan lejos están los puntos del diagrama de dispersión con respecto al modelo hallado? Influye linealmente la variable predictora sobre la variable predictando. ¿Qué porcentaje de los cambios de Y no son explicados por un modelo lineal? Hallar el valor mínimo esperado para el coeficiente de regresión.

Gladys Enríquez Mantilla

255

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 39.-

Un fabricante de juguetes que vende su producción en más de cien distritos de ventas, el año pasado introdujo un nuevo juguete de bajo precio y desea estimar las ventas de este nuevo juguete en el próximo año en términos de gastos de publicidad. Ventas (miles) Gastos de Publicidad.($) a)

d)

: Ventas anuales (× $ 10 000)

Y : X1 : X2 : a) b)

135 65

147 72

185 84

36 84 7

28 74 5

39 89 8

30 78 7

X1 : Resultado de aptitud X2 : Años de experiencia. 45 22 92 70 10 3

Hallar la ecuación del plano de regresión. Si un vendedor obtuvo 83 en la prueba de aptitud y tiene 7 años de experiencia, ¿cuáles serán las ventas que podrán esperarse de esta persona? ¿Qué tan lejos está el plano de regresión con respecto a los valores observados?

c)

Se tienen los siguientes datos correspondientes a: FV CI I FV CI I

42.-

180 60

El director ejecutivo de una asociación de ejecutivos nacionales de ventas sabe la relación que existe entre los resultados de un vendedor en las pruebas de aptitud, el número de años de experiencia en este campo y las ventas anuales de la persona. La información siguiente fue recogida para seis vendedores escogidos al azar. Y

41.-

120 50

Se tomó la decisión altamente significativa de hallar un modelo lineal. ¿Fue correcta la decisión? Encontrar dicho modelo de regresión lineal. Si el gasto de publicidad es $70, ¿cuánto se espera que sea como máximo el promedio de ventas? Por cada dólar que se incremente en publicidad, ¿cuánto se espera que sea como máximo el cambio que se produce en las ventas?

b) c)

40.-

: :

: : :

37 135 125

: : :

Fluidez Verbal (número de palabras / 3 m) Cociente Intelectual. Ingresos de los padres (miles de pesetas/mes) 13 92 50

35 135 115

10 97 55

17 103 60

33 118 100

15 104 65

22 124 100

20 110 70

28 115 95

20 113 80

a)

Hallar la ecuación de regresión para la predicción de la Fluidez verbal a partir de las otras dos variables.

b)

Los pronósticos que se realicen usando esta ecuación, ¿serán acertados?

c)

¿Qué porcentaje de los cambios producidos en la variable predictando se puede atribuir a las variaciones en las variables predictoras?

Una muestra muestra aleatoria de cinco familias da la siguiente información en relación al ingreso familiar anual y los gastos anuales en bienes durables (refrigeradoras, lavadoras, televisores, etc.) Ingreso Anual (miles de soles) Gastos (cientos de soles)

: :

5 7

8 14

7 8

10 15

15 20

a)

¿Se puede atribuir la variación en los gastos anuales a las variaciones en el ingreso anual?

b)

¿Podemos afirmar que ambas variables están asociadas linealmente?

Gladys Enríquez Mantilla

256

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 43.-

Una compañía distribuye un test de aptitud entre todos sus nuevos representantes de ventas. La dirección tiene interés en conocer la capacidad del test para predecir el eventual éxito de estos representantes. Los datos adjuntos recogen el valor (en miles de soles) de las ventas semanales medias y las puntuaciones obtenidas en el test de aptitud para una muestra aleatoria de ocho representantes. Ventas semanales Puntuación Test a) b) c) d)

44.-

: :

10 55

28 85

24 75

18 80

16 85

15 65

12 60

¿Se puede afirmar que un modelo lineal es un buen ajuste? ¿Por qué? ¿Podemos afirmar que a mayor puntuación obtenida en el test, se espera que sus ventas semanales sean mayores? ¿Por qué? Si un representante obtuvo 72 puntos en el test, ¿cuál será su venta semanal esperada? Para una puntuación de 78 en el test, ¿cuánto se espera que sea la venta semanal promedio?

Un estadístico de una fábrica de automóviles quiere desarrollar un modelo estadístico para predecir el tiempo de entrega (el número de días entre la fecha del pedido y la fecha de entrega del automóvil) de automóviles nuevos ordenados con mucho equipo opcional y la distancia de traslado (en cientos de millas). El estadístico selecciona una muestra aleatoria de 7 automóviles con los resultados siguientes: Opciones ordenadas : Distanc. Traslado :  Tiempo de entrega : a)

45.-

12 60

3 7.5 25

4 13.3 32

4 4.7 26

7 14.6 38

7 8.4 34

8 12.6 41

9 6.2 39

ˆ =13.6 + 2.34 X1 + 0.621 X 2 Y

Hallar el plano de regresión.

b)

¿Cuánto de los cambios de Y se pueden atribuir a la variación conjunta de X1 0.982  y X 2 ?

c)

¿Qué tanto se alejan los valores observados con respecto al plano de 1.0233 regresión?

d)

¿Cómo es la correlación entre la variable predictando y la mejor predictora 0.988 para valores constantes de la otra predictora? ¿Por qué?

e)

Usando un modelo lineal con la mejor predictora y con un margen de error del 1%, ¿qué valor se espera obtener en la variable respuesta partiendo de un 34.84 ; 77.30 valor de 15 en la variable predictora?

f)

¿Se puede afirmar que los cambios que se producen en la variable respuesta Sí 26.52 se deben a los cambios de la variable predictora?

Estamos interesados en investigar cómo varía el peso (libras) con la altura (pulgadas)  y edad (años) en los niños con una cierta deficiencia nutricional. Para tal efecto se obtiene una muestra aleatoria de niños, obteniéndose los siguientes resultados: Peso Altura Edad a) b) c) d)

64 57 8

71 59 10

53 49 6

67 62 11

55 51 8

58 50 7

77 55 10

57 48 9

56 42 10

51 42 6

76 61 12

68 57 9

¿Podemos afirmar que ambas variables son buenas predictoras? ¿Por qué? ¿Qué tanto de los cambios de la variable predictando se ven explicados por un modelo de regresión lineal? ¿En qué medida se alejan los valores observados con respecto al modelo de regresión? Realizar e interpretar un pronóstico, al nivel del 1%.

Gladys Enríquez Mantilla

257

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 46.-

Una tienda especialista en trajes para personas de negocios con éxito intenta determinar las variables que pueden explicar el nivel de compras de sus clientes. Se recogieron datos de las compras por cada visita en dólares, los ingresos de los clientes en miles y los años de permanencia del cliente en su empleo. Se pensaba que la última variable mide hasta dónde ha subido el cliente en la escala de puestos de la empresa y, por tanto, refleja su necesidad de vestir con elegancia. Compras : Ingresos : Años Perm. :

630 107 12

550 95 12

320 54 6

820 141 16

450 76 10

755 130 15

750 127 14

330 55 9

950 174 22

655 110 13

Después de recoger los datos, el director de la tienda se confiesa nulo en estadística  y no tiene ni idea de qué hacer con ellos, ¿puede ayudarle? a) b) c) 47.-

Hallar el plano de regresión. Si el director tiene la oportunidad de servir a un cliente con un año más de experiencia o a uno con 1000 más de ingreso, ¿a quién debe atender? ¿Permiten los datos determinar qué variable es la más importante para explicar las compras? ¿Por qué?

Los siguientes datos corresponden a las calificaciones y las puntuaciones en ansiedad obtenidas por un grupo de estudiantes: Ansiedad : Calificac. : a) b) c) d) e) f) g) h)

48.-

8 12

10 10

12 9

16 9

14 8

18 7

22 5

23 6

19 8

26 5

28 3

27 4

¿Sería apropiado utilizar un modelo lineal para realizar pronósticos? ¿Qué porcentaje de la variable predictando explica el modelo de regresión? Calcular el error estándar de estimación. Con un margen de error del 5%, ¿qué calificación cabe esperar partiendo de 4.868 , 8.394 una ansiedad de 20 puntos? Hallar un intervalo de confianza del 95% para la cantidad por la cual un estudiante de la población de la que se efectuó el muestreo puede esperar cambiar su calificación aumentando un punto en su ansiedad. Con una confianza del 90%, ¿se puede afirmar que los cambios que se producen en la variable predictando se pueden atribuir a los cambios de la variable predictora? ¿Se puede afirmar que existe una buena asociación lineal entre X e Y? Si la ansiedad toma el valor 25, ¿cuánto se espera que sea la calificación promedio?

Durante los últimos cuatro años, los gastos en publicidad y las ventas de una empresa (en millones de pesetas) han sido: Ventas Gastos a) b) c) d) e) f) g)

: :

100 1.0

126 1.3

180 1.7

210 2.0

¿Será un modelo lineal un buen ajuste? ¿Por qué? Si en el quinto año la empresa ha previsto tener un gasto de 2.17 millones de pesetas, y suponiendo que las condiciones de mercado no se alteran, ¿qué ventas obtendrá dicha empresa? ¿Con qué fiabilidad debe esperarse el resultado anterior? ¿Qué porcentaje de las variaciones en las ventas no se debe a los gastos en publicidad? ¿Se podría afirmar que los cambios que se producen en las ventas no se deben a efectos aleatorios? ¿Entre qué valores se espera que esté variando el coeficiente de regresión? Si el gasto es de 2.15 millones, ¿qué podemos afirmar acerca de las ventas promedio? Usar un nivel del 10%.

Gladys Enríquez Mantilla

258

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 49.-

Se sospecha que la tasa de fallos de cierto componente electrónico está relacionada con la temperatura. Se obtiene la siguiente muestra de la variable bidimensional: (Temperatura grados Fahrenheit , Fallos en una hora x 106) = (X , Y) 55;1.90 a) b) c) d) e)

50.-

65;1.93

75;1.97

85;2.00

95;2.01

105;2.01

 Trazar la nube de puntos de la muestra. Hallar la recta de regresión de la tasa de fallos sobre la temperatura. Calcular e interpretar el coeficiente de correlación lineal de Pearson. ¿Qué número de fallos puedes predecir que se producirán en una hora a 70º Fahrenheit? Obtener una conclusión altamente significativa. ¿Qué tan alejados están los puntos del diagrama de esparcimiento con respecto al modelo lineal de regresión?

Una empresa que fabrica circuitos electrónicos aplica un riguroso control de calidad. La producción se lanza por lote de 100 circuitos y luego se prueba cada circuito. Los circuitos defectuosos (por lote) son inmediatamente reparados por el servicio de reparación. Para poder planear adecuadamente la rotación del personal obrero en el servicio de reparación, es importante poder predecir el tiempo (en minutos) requerido en este servicio después de la producción de un lote. La empresa dispone de los datos siguientes: Nº defectuosos  Tiempo reparac.

1 23

2 29

3 49

4 64

4 74

5 87

6 96

6 97

7 109

8 119

a) ¿Sería apropiado utilizar un modelo lineal para realizar pronósticos? ¿Por qué? b) ¿Qué porcentaje de la variable predictando es explicado por un modelo de regresión lineal? 5.12 c) Calcular e interpretar el error estándar de estimación. d) Con un margen de error del 5%, ¿qué tiempo se utilizará en la reparación cuando 143.94 ; 164 se tienen 10 artículos defectuosos? e) Hallar un intervalo de confianza del 95% para la verdadera variación que se produce en el tiempo de reparación por cada artículo defectuoso que se 12.90 ; 16.46 incremente. f) Con una confianza del 90%, ¿se puede afirmar que los cambios que se producen en la variable predictando se pueden atribuir a los cambios de la variable predictora? ¿Por qué? 51.-

Una empresa de desarrollo de software establece relacionar sus ventas en función del número de pedidos de los tipos de software que desarrolla (Sistemas Educativos y Automatizaciones Empresariales), para atender 10 proyectos en el presente año. En la siguiente tabla se muestra las ventas (en miles de soles), el número de pedidos de sistemas, el número de pedidos de Aplicaciones Educativas y el número de pedidos de Automatizaciones empresariales. Ventas Nº Pedid. Sistemas Nº pedid. Aplic.Educat. Nº pedid. Automat.Empres. a) b) c) d) e) f) g)

: : : :

440 50 105 75

455 40 140 68

470 510 35 45 110 130 70 64

506 51 125 67

480 55 115 72

460 53 100 70

500 48 103 73

490 38 118 69

Hallar el plano de regresión. Interpretar: b1  y  b 2 ¿Qué tanto explica el plano de regresión hallado la relación entre las variables involucradas? Realizar e interpretar un pronóstico. Hallar un modelo lineal usando la mejor predictora. ¿Influye linealmente la mejor predictora en la variable predictando? Realiza un pronóstico altamente significativo para las ventas promedio. Realiza un pronóstico significativo para las ventas.

Gladys Enríquez Mantilla

259

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 52.-

Una empresa informática tiene un registro de productos de software al cual se les midió el número de errores encontrados (en cientos de módulos) y el número de líneas de código que posee (miles de líneas). Los datos se encuentran resumidos en la tabla siguiente: Nº líneas de código Nº errores encontrados Nº de productos a) b) c) d) e) f) g)

53.-

10 1 10

15 1 7

15 2 6

20 2 5

20 3 4

25 3 3

25 4 1

35 4 1

35 5 2

Si se usa un modelo lineal, ¿serían acertados los pronósticos? ¿Por qué? Hallar el modelo lineal. Interpretar a y b. En promedio, ¿qué tanto se alejan los valores verdaderos con respecto a los valores estimados? ¿Se puede afirmar que las variaciones en el número de errores encontrados son independientes del número de líneas de código? Si el producto tiene 37000 líneas de código, ¿cuántos errores se espera encontrar? Usar un nivel del 10%. ¿Entre qué valores se espera que esté variando el verdadero coeficiente de regresión? Usando el modelo lineal hallado, calcular los errores de estimación.

En una empresa de servicio de Internet busca relacionar las ganancias que obtiene cada computadora con el número de usuarios que ingresan a dicha cabina diariamente. En la tabla representa las ganancias S/. y el número de usuarios. Ganancia Nº de usuarios a) b) c) d) e)

54.-

: : :

: :

100 116

98 96

99 110

102 105

102 99

111 106

97 100

104 109

102 98

96 108

Hallar un modelo que le permita realizar buenos pronósticos. Con una confianza del 99%, realizar e interpretar un pronóstico. ¿Cuánto se espera que sea la ganancia promedio, si el número de usuarios que ingresan a la cabina es 94? Los cambios que se producen en la ganancia, ¿se pueden atribuir a la cantidad de usuarios que ingresan en la cabina? ¿Cuánto se espera que cambie la ganancia, si el número de usuarios se incrementa en uno?

Los datos de la tabla adjunta muestran el tiempo en horas de impresión de trabajos que se han impreso en una impresora láser de marca HP. Se está interesado en estudiar la relación existente entre la variable de interés “tiempo de impresión de un trabajo” y la variable explicativa “número de páginas del trabajo”. Hacer el estudio en base a los datos obtenidos en el muestreo y que son los siguientes:  Tiempo Nº Págs. a) b) c) d) e) f) g) h)

: :

1 0.60

2 0.9

3 1.40

4 1.80

5 2.50

6 3.2

7 3.4

8 4.5

Hallar la recta de regresión considerando el tiempo como variable predictora. Hallar una recta usando el número de páginas como variable explicativa. Realizar una estimación altamente confiable del número de páginas que se imprimirían en 12 horas. Al nivel del 1%, estimar el tiempo de impresión máximo si el número de páginas es 850. ¿Qué se puede afirmar acerca del verdadero coeficiente de regresión? ¿Se puede afirmar que las variaciones en el tiempo de impresión son independientes del número de páginas? ¿Qué porcentaje de la incertidumbre original se ha explicado mediante el modelo lineal? ¿Podemos afirmar que hay una asociación lineal entre ambas variables?

Gladys Enríquez Mantilla

260

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 55.-

El Gerente de Ventas de una compañía desea hallar un modelo que le permita realizar pronósticos confiables de sus ventas semanales, para ello cuenta con la siguiente información correspondiente a doce vendedores. Ventas semanales (en miles de soles) 5 12 4 8 11 4 30 14 6 14 4 5 a) b)

Calificación de desempeño 2 5 1 4 6 5 10 5 4 6 1 1

CI 90 105 88 95 110 98 120 115 92 110 95 90

Hallar el plano de regresión e interpretar b1 , b2 , b3 ¿Qué tan lejos están los puntos del dispersigrama con respecto al plano de regresión? Si usamos la mejor variable predictora, ¿sería útil un modelo lineal? ¿Por qué? ¿Se puede afirmar que los cambios que se producen en la variable predictando se deben a fluctuaciones aleatorias que son independientes de los cambios de la mejor variable predictora? ¿Qué se puede afirmar acerca del verdadero coeficiente de regresión? Si se usa un nivel del 10%. ¿Qué tipo de relación existe entre las ventas y las puntuaciones de la prueba? ¿Por qué?

c) d) e) f) 56.-

Puntuación de la prueba 4 7 3 6 10 9 2 5 9 2 1 3

Un sociólogo asignado a una institución correccional estuvo interesado en estudiar la relación entre inteligencia y delincuencia. Un índice de delincuencia (variando de 0 a 50) fue formulado para medir la gravedad y frecuencia de crímenes cometidos, mientras la inteligencia fue medida por IQ. La tabla muestra el índice de delincuencia (ID) y el IQ para una muestra aleatoria de convictos menores. ID IQ

a) b) c) d) e) f) g)

: :

26.2 110

33.0 89

28.5 102

35.5 85

38 73

30 90

25.25 98

20.3 110

31.9 98

21.1 122

22.7 119

22.1 120

Un modelo lineal, ¿permitirá realizar pronósticos cercanos a la realidad? ¿Por qué? ¿Influye el IQ en el índice de delincuencia? Con una confianza del 90%, ¿cuánto se espera que sea como máximo el verdadero coeficiente de regresión? Si el cociente de inteligencia es 115, ¿cuánto se espera que sea el índice de delincuencia promedio? Obtener una conclusión al nivel del 10%. ¿Se puede concluir que ambas variables están relacionadas linealmente? ¿Cuánto se espera que sea el índice de delincuencia, si el cociente de inteligencia es 108? ¿Qué tan alejados están los valores observados con respecto a los valores reales?

Gladys Enríquez Mantilla

261

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 57.-

El ingreso anual (en miles de soles) disponible y los gastos de consumo de 9 familias, seleccionadas aleatoriamente, en una zona de cierta ciudad han sido en miles de dólares los siguientes: Gasto Ingreso a) b) c) d) e)

58.-

: :

7 8

30 35

20 28

24 25

8 8

11 13

8 7

Un gerente de recursos humanos desea determinar el salario que debe pagar a cierta categoría de obreros. Para determinar dicho salario se realiza un estudio en el que intervienen las variables Salario Mensual ($), Nivel de Producción Anual en la Empresa (en miles de dólares) y Nivel de Especialización media del trabajador (de 0 a 10). El gerente obtiene los siguientes resultados:

a) b) c) d) e)

: : :

123.4 300.5 4.3

135.7 325.9 5.5

115.9 298.6 7.8

100.6 200.9 4.9

98.7 300.4 4.3

150.4 359.8 8.5

124.6 279.6 6.4

110.0 215.6 5.6

Calcular el plano de regresión lineal mínimo cuadrático que explica el salario en función de la producción y del nivel de especialización. ¿Qué salario se debería pagar si el nivel de producción fuese de 315 mil dólares y el nivel medio de especialización de 6.6? Calcular los valores estimados usando el plano de regresión. Hallar los residuos. ¿Qué tanto se alejan los puntos del dispersigrama con respecto al plano de regresión?

Una empresa de ventas por Internet de productos informáticos está interesada en estudiar qué variables influyen en sus costes mensuales. Para ello recogieron los costes de distribución (en miles de dólares), las ventas (en cientos de miles de dólares) y el número de órdenes de compras (en miles) de los últimos 9 meses). Costes Ventas a) b) c) d)

60.-

18 20

¿Se puede concluir que los cambios de la variable predictando se deben a efectos aleatorios? Hallar el alejamiento de los puntos del diagrama de dispersión con respecto al modelo hallado. Calcular los errores de estimación. Si el ingreso anual es 32000, ¿cuánto esperamos que sea como máximo el gasto promedio? Obtener una conclusión altamente significativa. ¿Cuánto se espera que sea como mínimo el gasto de consumo, si se sabe que el ingreso anual es 18000?

Salario ($) Producción Especialización

59.-

12 15

: :

5.30 3.86

7.17 4.46

8.56 5.12

6.37 4.01

7.28 4.57

6.84 4.58

5.25 3.01

7.08 4.84

8.20 5.17

¿Hay una asociación lineal entre ellas? ¿Influyen las ventas en los costes mensuales? Usar un nivel del 1%. ¿Cuánto será como máximo el cambio que se produce en los costes cuando las ventas se incrementen en cien mil dólares? Si las ventas toman el valor 4.35, ¿cuánto se espera que sea el coste promedio mensual? Usar un nivel del 10%

Se realiza un estudio de mercado de un nuevo producto, de acuerdo a las encuestas realizadas se obtienen los siguientes datos sobre la demanda según el precio de venta. Demanda Precio a) b)

: :

110 50

115 52

120 54

125 56

129 58

135 60

136 62

139 64

141 66

147 68

160 70

¿Se puede afirmar que los cambios que se producen en el precio son explicados por las variaciones en la demanda de dicho producto? ¿Existe una relación lineal entre precio y demanda?

Gladys Enríquez Mantilla

262

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 61.-

Se lleva a cabo un control de gastos de mantenimiento para cada una de las cajas registradoras de una cadena de tiendas de comestibles. Se tienen los datos correspondientes a la antigüedad (años) y el gasto de mantenimiento (dólares). Antigüedad Gasto a) b) c)

62.-

: :

6 142

3 90

6 125

4 145

5 162

2 99

1 114

9 165

3 150

Una agencia de viajes desea saber la relación que hay entre las ventas (en miles), el presupuesto destinado a publicidad y las comisiones de los vendedores; para esto presenta los siguientes datos:

a) b) c)

Gastos de Comisiones de Publicidad Vendedores 2005 264 550 15840 2006 384 590 19250 2007 415 680 26013 2008 425 700 16896 2009 543 750 16290 ¿Cuál de las dos variables predictoras es la mejor? Hallar la ecuación del plano de regresión. ¿Qué tanto se alejan los puntos del diagrama de dispersión con respecto al plano de regresión hallado? Ventas

En un grupo de ocho pacientes se miden las cantidades antropométricas peso y edad, obteniéndose los siguientes resultados: Edad Peso a) b) c)

64.-

1 78

Hallar la ecuación de un modelo lineal de regresión. Interpretar a y b. Una caja registradora tiene 8 años de antigüedad, ¿cuál será el gasto promedio de mantenimiento? ¿Qué tanto de los cambios en el gasto de mantenimiento, lo podemos atribuir a las variaciones en la antigüedad de la caja registradora?

Año

63.-

7 231

: :

12 58

8 42

10 51

11 54

7 40

7 39

10 49

14 56

¿Existe una relación lineal importante entre ambas variables? Hallar la recta de regresión del peso en función de la edad. ¿En qué medida, por término medio, varía el peso cada año?

Hay una hipótesis que sugiere que el consumo de un producto dado, expresado en unidades compradas por persona en un año está influido por: el ingreso por persona que trabaja y el tamaño de habitantes de una ciudad. Se cuenta con los siguientes datos: Millones de habitantes por ciudad 0.6 1.4 1.3 0.3 6.9 0.3 4.2 0.6 a) b) c) d)

Ingreso per cápita, en cientos $ por habitante 30 34 17 26 29 18 32 32

Consumo del producto, unidades al año 11 16 9 9 8 7 11 8

Hacer un estudio de regresión o correlación para responder a la suposición. Hallar la ecuación del plano de regresión. ¿En cuánto se alejan los valores verdaderos con respecto a los valores estimados? ¿Qué tanto de los cambios de la variable predictando no se pueden atribuir a la influencia de las dos variables predictoras en forma conjunta?

Gladys Enríquez Mantilla

263

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 65.-

Se piensa que si aumentan el porcentaje de comisión pagada al vendedor de automóviles, aumenta la venta. Para corroborarlo, se realizó un estudio sobre un grupo de concesionarios similares; obteniéndose los siguientes resultados con respecto a las comisiones pagadas a vendedores de autos en un mes (%) y las ganancias netas por venta, en el mismo mes (miles de dólares). Comisión Ganancia a) b) c)

66.-

: 3.6 : 11.2

7.3 20.1

5.0 12.4

5.2 15.3

3.0 9.5

3.1 11.6

3.2 8.5

7.5 27.9

8.3 24.6

Un psicólogo clínico está probando una técnica aversiva para reducir el hábito de fumar que consiste en dejar el cenicero sin limpiar durante todo el día. Acude un sujeto a su consulta y le aplica esta técnica. El psicólogo evalúa el número de cigarrillos fumados al día antes del tratamiento y durante varios días, obteniendo los siguientes resultados:

a) b) c)

: :

0 25

2 15

4 14

6 9

7 4

¿Será apropiado ajustar un modelo lineal? ¿Por qué? ¿Los cambios producidos en la variable predictando, se pueden atribuir a los cambios de la variable predictora? Con una confianza del 90%, ¿qué podemos afirmar acerca del coeficiente de regresión lineal?

Las materias primas empleadas en la producción de una fibra sintética son almacenadas en un lugar en donde no se tiene control de la humedad. La siguiente tabla refleja en porcentajes la humedad relativa del almacén y la humedad observada en las materias primas, durante un estudio que se llevó a cabo: Hum.relativa Hum.observada a) b) c) d)

68.-

5.3 18.4

¿Se puede concluir que existe una relación lineal entre ambas variables? Los cambios producidos en las ganancias, ¿se pueden atribuir a las variaciones en el porcentaje de comisión pagada al vendedor? Si la comisión es 6.5, ¿cuánto se espera que sea la ganancia promedio? Usar un nivel del 10%.

Días Nº cigarrillos

67.-

5.2 14.7

: :

41 1.6

53 13.6

59 19.6

65 25.6

71 31.6

78 33.2

50 14.7

65 21.2

74 28.3

Analizar los datos utilizando un modelo de regresión lineal. Construir un intervalo de confianza para la media de la humedad de las materias primas si la humedad relativa del almacén es igual a 69. ¿Cuánto valdría la humead en las materias primas si se consigue una humedad relativa de 35? Obtener una conclusión altamente significativa. ¿Se puede concluir que ambas variables están relacionadas linealmente?

Una empresa de reparación de cierto tipo de componentes electrónicos pretende estudiar la relación entre el número de unidades defectuosas y el tiempo de reparación (en minutos). Unid.Defect.  Tiempo a) b) c) d) e)

: :

1 23

2 29

3 49

4 64

4 74

5 87

6 96

6 97

7 109

7 109

¿Se puede concluir que los cambios que se producen en el tiempo de reparación se deben a efectos aleatorios? ¿Qué se puede afirmar acerca del verdadero cambio que se produce en la variable predictando cuando las unidades defectuosas se incrementan en una. Para ocho unidades defectuosas, ¿cuánto se espera que sea el tiempo de reparación? ¿Se puede concluir que ambas variables están asociadas linealmente? Calcular los errores de estimación.

Gladys Enríquez Mantilla

264

UNIFÉ

Administración de Negocios Internacionales

Estadística Aplicada a los Negocios 69.-

Se desea analizar el número de errores cometidos por una persona en relación con las horas que lleva desarrollando un trabajo. Nº errores Horas Trabaj. a) b) c) d)

70.-

2 10

4 8

4 6

6 6

6 3

7 4

8 2

6 5

5 8

Se sugiere que el gasto en alimentación por familia, expresado en cientos de dólares por mes, está influenciado directamente por el ingreso familiar mensual en cientos de dólares.

a) b) c)

: :

30 21

34 26

17 5

26 19

29 18

18 7

32 23

32 25

¿Es correcto lo que se afirma? ¿Se puede hablar de una asociación lineal entre gasto en alimentación e ingreso familiar? ¿Cuánto se espera que sea el gasto promedio, si se sabe que el ingreso familiar es 24 cientos de dólares?

En base a una muestra de doce datos se quiere ajustar un modelo de regresión de la variable respuesta, precio en euros por el que se adquirió una impresora láser, respecto a las variables regresoras: número de páginas por minuto que es capaza de imprimir y años de antigüedad de la impresora. Los datos del estudio son los siguientes: Precio Nº págs. Antig. a) b) c)

72.-

1 10

Hallar un modelo cuadrático. ¿Serán acertados los pronósticos que realicemos con este modelo? ¿Por qué? ¿Qué tanto de los cambios en el número de errores queda explicado por un modelo de regresión cuadrático? ¿En cuanto se alejan los valores observados con respecto a los valores estimados?

Ingreso Gasto

71.-

: :

466 6 6

: : :

418 6 4

434 6 2

487 6 0

516 8 6

462 8 4

475 8 2

501 8 0

594 12 6

553 12 4

551 12 2

589 12 0

Hallar el modelo de regresión. ¿Qué tanto de los cambios de Y pueden ser explicados por el modelo de regresión hallado? Realiza e interpreta un pronóstico.

Una empresa fabricante de cereales para el desayuno desea conocer la ecuación que permita predecir las ventas (en miles de euros) en función de los gastos en publicidad infantil en televisión (en miles de euros), el tiempo diario de aparición en televisión (en minutos) y los gastos en publicidad en los periódicos (en miles de euros). Se realiza un estudio en el que se reúnen los datos mensuales correspondientes a los últimos 20 meses. Estos datos aparecen en la siguiente tabla: Ventas Public. TV  Tiempo TV Public.Per. a) b) c) d) e) f)

: : : :

10 1.0 50 0.4

12 1113 1.2 1.3 57 56 0.4 0.5

12 1.4 55 0.5

14 1.5 60 0.4

16 1.7 65 0.4

12 1.8 69 0.6

14 1.3 67 0.5

11 1.4 68 1.1

10 0.9 67 0.3

19 0.8 97 0.5

8 0.9 66 0.6

Hallar el plano de regresión usando las dos mejores predictoras. Hallar los valores estimados. Calcular los errores de estimación. Usando un modelo lineal con la mejor predictora, realiza un pronóstico para las ventas promedio. ¿Se puede concluir que existe una asociación lineal entre las ventas y la mejor predictora? ¿Cuánto se espera que sea como máximo el coeficiente de regresión lineal?

Gladys Enríquez Mantilla

265

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF