2.7 Analisis de Regresion Multiple y Correlacion
October 12, 2022 | Author: Anonymous | Category: N/A
Short Description
Download 2.7 Analisis de Regresion Multiple y Correlacion...
Description
ESTADÍSTICA PARA LA ADMINISTRACIÓN II 2.7 Análisis de Correlación
Bibliografía Anderson, David R., Dennis J. Sweeney y Thomas A. Williams. Estadística para administración y economía. 10a. ed., Cengage Learning Editores, 2008
Capí Ca pítu tulo lo 15 Re Regr gres esió iónn múlt múltip iple le
626
En el capítulo 14 se presentó la regresión lineal simple y se mostró su uso en la obtención de una ecuación de regresión estimada que describe la relación entre dos variables. Recuérdese que la variable que se predice o explica es la variable dependiente y la variable que se usa para predecir o explicar la variable dependiente es la variable independiente. En este capítulo se continúa con el estudio del análisis de regresión considerando, ahora, las situaciones en las que intervienen dos o más variables independientes. Este estudio, al que se le conoce como análisis de regresión múltiple, permite tomar más factores en consideración y obtener estimaciones mejores que las que son posibles con la regresión lineal simple. 15.1
Modelo de regresión múltiple El análisis de regresión múltiple estudia la relación de una variable dependiente con dos o más variables independientes. Para denotar el número de variables independientes se suele usar p.
Modelo de regresión y ecuación de regresión Los conceptos de modelo de regresión y ecuación de regresión vistos en el capítulo previo, son aplicables en el caso de la regresión múltiple. A la ecuación que describe cómo está relacionada la variable dependiente y con las variables independientes x 1, x 2, . . ,. , x p se le conoce como modelo de regresión múltiple. Se supone supone que el modelo modelo de regresión regresión múltip múltiple le toma la la forma sisiguiente MODELO DE REGRESIÓN MÚL MÚLTIPLE TIPLE y
0 1 x 1 2 x 2
. . . p x p
(15.1)
En el modelo de regresión múltiple, 0, 1, 2, . . . , p, son parámetros y el término del error (la letra griega épsilon) es una variable aleatoria. Examinando con atención este modelo se ve que y es una función lineal de x 1, x 2, . . . , x p (la parte 0 1 x 1 2 x 2 . . . p x p) más el tértérmino del error . El término del error corresponde a la variabilidad en y que no puede atribuirse o explicarse al efecto lineal de las p variables independientes. En la sección 15.4 se discutirán los supuestos para el modelo de regresión múltiple y para . Uno de los supuestos es que la media o valor esperado de es cero. Una consecuencia de este supuesto es que la media o valor esperado de y, que se denota E ( y y), es igual a 0 1 x 1 2 x 2 . . . p x p. A la ecuación que describe cómo está está relacionada la media de y con x 1, x 2, . . . , x p se le conoce como ecuación de regresión múltiple.
ECUACIÓN DE REGRESIÓN MÚL MÚLTIPLE TIPLE E ( y)
0 1 x 1 2 x 2
. . . p x p
(15.2)
Ecuación de regresión múltiple estimada Si se conocieran los valores de 0, 1, 2, . . . , p, se podría usar la ecuación (15.2) para calcular la media de las y para valores dados de x 1, x 2, . . . , x p. Desafortudamente, los valores de estos parámetros no suelen conocerse, es necesario estimarlos a partir de datos muestrales. Para calcular los valores de los estadísticos muestrales b1, b2, . . ., b p, que se usan como estimadores esti madores puntuales de los parámetros 0, 1, 2, . . . , p se emplea una muestra aleatoria simple. Con los estadísticos muestrales se obtiene la siguiente ecuación de regresión múltiple estimada.
15.2 15. 2
Método Mét odo de mín mínimo imoss cua cuadra drados dos
627
ECUACIÓN DE REGRESIÓN MÚLTIPLE ESTIMADA y b0 ˆ
b1 x 1
b2 x 2
. . . b p x p
(15.3)
donde b0, b1, b2, . . . , b p son las estimaciones de 0, 1, 2, . . . , p
ˆ
y
valor estimado de la variable dependiente
Este proceso de estimación en la regresión múltiple se muestra en la figura 15.1. 15.2
Método de mínimos cuadrados En el capítulo 14, se usó el método de mínimos cuadrados para obtener la ecuación de regresión estimada que permitía aproximar mejor la relación lineal entre las variables dependiente e independiente. Este método también se usa para obtener la ecuación de regresión múltiple estimada. El criterio en el método de mínimos cuadrados, como ya se dijo, es el siguiente.
CRITERIO DE MÍNIMOS CUADRADOS
min ( yi yi )2
(15.4)
ˆ
FIGURA 15.1
En la regres regresión lineal sim ple, b0 y b1 son los estad í í st st icos muestrales que se usan para est imar los par ámetros 0 y 1. En la regresión múlt i ple, ple, en el proceso proceso de inferencia estad í íst s t ica análogo, b0 , b1 , b2 , ... , , b p denotan los estad í íst s t icos muestrales que se usan para est imar los par ámetros 0 , 1 , 2 , . . . , p.
PROCESO DE ESTIMACIÓN EN LA REGRESIÓN MÚLTIPLE MÚLTIPLE
Modelo de regresión múltiple Datos muestrales Ecuación de regresión múltiple
son parámetros desconocidos
Cálculo de la ecuación de regresión múltiple estimada son las estimaciones de son estadísticos muestrales
Capí Ca pítu tulo lo 15 Re Regr gres esió iónn múlt múltip iple le
628
donde valor observado en la variable dependiente en la observación i yi valor estimado para la variable dependiente en la observación i yi
ˆ
Los valores estimados de la variable dependiente se calculan empleando la ecuación de regresión múltiple estimada y b0 ˆ
b1 x 1
b2 x 2
. . . b p x p
Como indica la expresión (15.4), el método de mínimos cuadrados emplea datos muestrales para obtener los valores de b0, b1, b2, . . ., b p que hacen que la suma de los cuadrados de los residuales [las diferencias entre los valores observados de la variable dependiente ( yi) y los valores estimadoss de la varia timado variable ble dependi dependiente ente ( yi )] sea un un mínimo. mínimo. En el capítulo 14 se dieron las fórmulas para calcular los estimadores b0 y b1 para la ecuación de regresión lineal simple estimada y b0 b1 x empleando el método de mínimos cuadrados. Con conjuntos de datos relativamente pequeños, fue posible usar esas fórmulas para obtener b0 y b1 mediante cálculos manuales. En la regresión múltiple, en cambio, las fórmulas para calcular b0, b1, b2, . . . , b p emplean álgebra de matrices y quedan fuera del alcance de este texto. Por esta razón, en el estudio de la regresión múltiple, se centrará la atención en el uso de los paquetes de software para obtener la ecuación de regresión estimada y algunas otras informa ˆ
ˆ
ciones. Lo importante será la interpretación de los resultados que proporcionan estos paquetes de software y no cómo hacer los cálculos para la regresión múltiple.
Un ejemplo: Butler Trucking Company Para ilustrar el análisis de regresión múltiple, se empleará un problema de la empresa Butler Trucking Company, Company, una empresa que se dedica al transporte de objetos y mercancías en el sur de California. La actividad principal de esta empresa es hacer entregas en su área local. Para mejorar el horario de trabajo, los gerentes deseaban estimar el tiempo total de recorrido diario necesario para hacer las entregas. Al principio, los gerentes creyeron que el tiempo total de recorrido diario estaba estrechamente relacionado con el número de millas recorridas para hacer las entregas. Partiendo de una muestra aleatoria simple de 10 entregas se s e obtuvieron los datos que se presentan en la tabla 15.1 y en el diagrama de dispersión de la figura 15.2. Después de observar el diagrama de dispersión, los gerentes consideraron que para describir la relación entre tiempo total de recorrido ( y yi) y el número de millas recorridas ( x i) podía emplearse el modelo de regresión lineal simple TABLA 15.1
DATOS DA TOS PRELIMINARES DE BUTLER TRUCKING Recorrido
archivo en Butler
CD
1 2 3 4 5 6 7 8 9 10
Millas recorridas
x1
100 50 100 100 50 80 75 65 90 90
y Tiempo de recorrido (h (horas)
9.3 4.8 8.9 6.5 4.2 6.2 7.4 6.0 7.6 6.1
View more...
Comments