Trabajo N° 06 Ejercicios
Short Description
Descripción: capitulo 6...
Description
“Año de la consolidación del Mar de Grau”
UNIVERSIDAD NACIONAL HERMILIO VALDIZÁN FACULTAD DE CIENCIAS ECONÓMICAS E. A. P. ECONOMÍA
TEMA
HETEROSCEDASTICIDAD: ¿QUÉ PASA SI LA VARIANZA DEL ERROR NO ES CONSTANTE?
ASIGNATURA: Econometría II DOCENTE: Castro Céspedes, Júlio RESPONSABLES: Villavicencio Salvador, Rosmeri
HUANUCO - PERU 2016
EJERCICIOS DEL CAPITULO 11 EJERCICIO 11.1. Establezca si las siguientes afirmaciones son verdaderas, falsas o inciertas y comente sus razones brevemente: a) En presencia de heteroscedasticidad, los estimadores de MCO son sesgados e ineficientes. FALSO: Porque en presencia de heteroscedasticidad los estimadores de MCO siguen siendo insesgados y consistentes, pero ya no tienen varianza mínima, es decir, ya no son eficientes. b) Si hay heteroscedasticidad, las pruebas convencionales t y F son inválidas. VERDADERO. Porque dado que Var no es mínima los intervalos de confianza tienden a ser innecesariamente grandes y las pruebas “t” y “F” tienden a ser imprecisas. c) En presencia de heteroscedasticidad, el método de MCO habitual siempre sobreestima los errores estándar de los estimadores. VERDADERO: Porque la característica más sobresaliente de estos resultados es que los MCO, con o sin corrección por heteroscedasticidad, sobreestiman consistentemente
el
verdadero
error
estándar
obtenido
mediante
el
procedimiento MCG, especialmente para valores grandes de α, con lo cual se establece la superioridad de MCG. d) Si los residuales estimados mediante una regresión por MCO exhiben un patrón sistemático, significa que hay heteroscedasticidad en los datos. VERDADERO: Porque si el residuo al cuadrado nos da un valor mayor que cero
o
nos
presenta
heteroscedasticidad.
un
patrón
sistemático
significa
que
existe
e) No hay una prueba general de heteroscedasticidad que no esté basada en algún supuesto acerca de cuál variable está correlacionada con el término de error. FALSO: Porque no existe una prueba que nos señale específicamente que variable explicativa está relacionada con el término de perturbación, sino que más bien nos dan pruebas generales para detectar heteroscedasticidad. f) Si el modelo de regresión está mal especificado (por ejemplo, si se omitió una variable importante), los residuos de MCO mostrarán un patrón claramente distinguible. VERDADERO: Es verdadero porque al omitiruna variable que tiene relevancia teórica en el modelo se va a distinguir claramente un patrón sistemático, ya que los residuos van a presentar un gran peso por la variable omitida. g) Si una regresora con varianza no constante se omite (incorrectamente) de un
modelo,
los
residuos
(MCO)
serán
heteroscedásticos
VERDADERO: Es verdadero porque si se omite una variable que tiene varianza no constante, esta va a seguir presente en el modelo a través del término de perturbación y seguirá siendo heteroscedástica EJERCICIO 11.2. En una regresión de salarios promedio (W, $) sobre el número de empleados (N) de una muestra aleatoria de 30 empresas se obtuvieron los siguientes resultados: * w ^
=7.5 + 0.009N
t = n.a. (16.10)
R2
= 0.90
w ^ /N = 0.008 + 7.8(1/N) t = (14.43) (76.58)
a) ¿Cómo interpreta las dos regresiones?
R2 =0.99
i) Dado un incremento unitario en el número de empleados se estima que los salarios promedio también se incrementará en 0.009 dólares, es decir existe una relación directa entre los salarios promedio y el número de empleados, por tanto si se incrementa el número de empleados también se incrementarán los salarios promedios y viceversa. ii) Como observamos en la segunda regresión podemos darnos cuenta que el autor trata de corregir la heteroscedasticidad dividiendo el modelo para la variable estocástica con lo cual el modelo mejora ya que se obtiene un coeficiente de determinación mayor y las pruebas “t” de significancia individual se incrementan. b) ¿Qué está suponiendo el autor al pasar de la ecuación (1) a la (2)? ¿Estaba preocupado por la heteroscedasticidad? ¿Cómo se sabe? El autor al pasar de la ecuación (1) a la (2) supone que existe heteroscedasticidad y por la misma razón trata de corregir este problema dividiendo la regresión para la variable heteroscedástica a través del método de Mínimos Cuadrados Generalizados que es capaz de producir estimadores que son MELI. c) ¿Puede relacionar las pendientes y los interceptos de los dos modelos? El coeficiente de intersección en Eq. (1) es el coeficiente de la pendiente Eq. (2) y el pendiente coeficiente en Eq. (1) es la intersección en Eq. (2). d) ¿Puede comparar los valores de R2 de los dos modelos? ¿Por qué? NO las variables dependientes en los dos modelos no son lo mismo EJERCICIO 11.3 a) ¿Puede estimar los parámetros de los modelos mediante el método de mínimos cuadrados ordinarios? ¿Por qué? β 1+ β 2 X +¿ V t ¿^ W t ∨¿ √¿ 1
β 1+ β 2 X +¿ V t ¿^ W t ∨¿ √¿ 2 1
RESPUESTA NO estos modelos no son lineales en el parámetro y no se puede ser estimado por MCO. b) Si la respuesta es negativa, ¿puede sugerir un método informal o formal de estimación de los parámetros de tales modelos? (Véase el capítulo 14.) Que están especializados no-lineales procedimientos de cálculo. Discutir este tema en capítulo de modelos de regresión lineal. Informalmente, podemos estimar los parámetros de un proceso de ensayos y error. EJERCICIO 11.4. Aunque los modelos logarítmicos como el de la ecuación (11.6.12) a menudo reducen la heteroscedasticidad, se debe prestar cuidadosa atención a las propiedades del término de perturbación de estos modelos. Por ejemplo, el modelo
Yt =
β 1+ X β1 2 u1
……………………… (1)
Puede escribirse como ln Yi = ln β1 + β2 ln Xi + ln ui …………………. (2) RESPUESTA. a) Si ln ui tiene valor esperado cero, ¿cuál debe ser la distribución de ui? Si expresa este modelo en términos logarítmicos, tendrá ln ui como el término de perturbación en el lado derecho. b) Si E(ui) = 1, ¿será E (ln ui) = 0? ¿Por qué? No. E\\n(ui)] = £ [In(I)] = 0. Pero E [In(iu)] debido a la concavidad propiedad de transformación logarítmica. La expectativa del registro de una variable aleatoria
es menor que el registro de su esperanza a menos que que la variable tiene una variable cero, en cuyos casos son iguales. c) Si E (ln ui) es diferente de cero, ¿qué puede hacer para volverlo cero? Deje que.
por cierto, aviso que no queremos una estimación directa de
β1
EJERCICIO 11.5. ¿ Muestre que β 2 de (11.3.8) también se expresa como.
¿ y var ( β 2 ) dada en (11.3.9) también se expresa como
Donde medias ponderadas
representa las desviaciones en relación con las definidas como
RESPUESTA. Esta es una ecuación de sustituirla definición y la simplificación EJERCICIO 11.6. Con propósitos pedagógicos, Hanushek y Jackson estiman el siguiente modelo:
Ct = β1 + β2PNBt + β3Dt + ui …………………………………. (1)
Donde Ct _ gasto agregado de consumo privado en el año t, PNBt = producto nacional bruto en el año t y Dt =gastos de defensa nacional en el año t, con el objetivo de estudiar el efecto de los gastos de defensa sobre otros gastos en la economía. Los autores postulan que
2
σt
= σ2 (PNBt )2, luego transforman (1)
y estiman.
Ct/PIBt _ β1 (1/PIBt) + β2 + β3 (Dt/PIBt) + ut/PIBt………………… (2) Los resultados empíricos basados en la información de 1946 a 1975 fueron los siguientes (errores estándar entre paréntesis): * ^ C t =26.19
(2.73) Ct/PNBt =
+ 0.6248 PNBt − (0.0060)
0.4398 Dt R 2 = 0.999
(0.0736)
25.92 (1/PNBt) + 0.6246 − 0.4315 (Dt/PNBt)
(2.22)
(0.0068)
R2 =
(0.0597)
0.875 RESPUESTA. a) ¿Qué supuesto hacen los autores sobre la naturaleza de la heteroscedasticidad? ¿Puede justificarlo? La suposición es que la varianza del error es proporcional al cuadrado del PIB. Que se describe en la postulación. Los autores hacen de este supuesto al observarlos dataos a través del tiempo y observar esta relación. b) Compare los resultados de las dos regresiones. ¿La transformación del modelo original mejora los resultados, es decir, reduce los errores estándar estimados? ¿Por qué? Los resultados son esencialmente lo mismo. Aunque los errores estándar de dos de los coeficientes son inferiores es el segundo modelo. Este se puede tomar
como
justificaciones
empíricas
de
la
transformación
de
heterocedasticidad. c) ¿Puede comparar los dos valores de R2? ¿Por qué? (Sugerencia: Examine las variables dependientes.)
NO. El R2 Términos puede no ser directamente comparados. Las variables dependientes en los modelos no son lo mismo.
EJERCICIO 11.7. Consulte las regresiones estimadas (11.6.2) y (11.6.3). Los resultados de la regresión son muy similares. ¿A qué se debe esta conclusión? RESPUESTA. Como se verá en el problema 11.13. La Bartlett prueba demuestra que no existe no era un problema de heterocedasticidad en este conjunto de datos. Por lo tanto, este diagnóstico no es sorprendente. EJERCICIO 11.8. Pruebe que si wi = w, una constante, para cada i,
β ¿2
y
idénticos, así como sus varianzas. RESPUESTA. Sustituyendo Wl = w (11.3.8) obtenemos:
La igualdad de las varianzas se puede demostrar de manera similar. EJERCICIO 11.9 Consulte las fórmulas (11.2.2) y (11.2.3), y suponga que 2
σ t =¿
σ 2 kt
^ β2
son
Donde σ2 es una constante y kt son ponderaciones conocidas, no necesariamente todas iguales. Con este supuesto, muestre que la varianza dada en (11.2.2) se expresa como
El primer término del miembro derecho es la fórmula de la varianza dada en ¿ (11.2.3), es decir, var ( β 2 ) con homoscedasticidad. ¿Qué puede decir sobre
^ la naturaleza de la relación entre var ( β 2 ) con heteroscedasticidad y con homoscedasticidad? (Sugerencia: Examine, en la fórmula anterior, el segundo término del miembro derecho.) ¿Puede derivar alguna conclusión general sobre las relaciones entre (11.2.2) y (11.2.3)? RESPUESTA. En la ecuación. (11.2.2) tenemos:
Sustituir
2
σ1
= σ2k, en la ecuación anterior obtenemos 0
El primer término de la ecuación es la varianza en eq. (11.2.3) por lo tanto
Entonces la varianza heteroscedasticidad dado anteriormente es mayor que 2 > Homoscedasticos varianza. En este caso. La varianza homocesdasticos subestimar la varianza heteroscedasticidad de inflado las estadísticas y F. uno no puede sacar conclusiones generales debido a que su resultado se basa en una forma específica de heterocedasticidad.
Ejercicio 11.10 En el modelo Y i=β 2 X i+ ui ( Nota : No hay intercepto ) u se lesinforma que var (¿¿ i)=σ 2 X 2i +. demuestre que ¿
∑ X 21
¿ ¿ ¿ σ 2 ∑ X 4i ^ var ( β2 ) = ¿ RESPUESTA De anexar de 3A. 3 y 6A. 1, tenemos T.X2 var(w)
∑ X 21
¿ ¿ ¿ σ 2 ∑ X 4i ^ var ( β2 ) = ¿
Dado que var(ui) = obtenemos: X 2i σ 2 X 2i σ 2 ∑ X 4i ∑ ^ var ( β2 ) = = 2 2 ( ∑ X 2i ) ( ∑ X 2i ) Ejercicio 11.11 Con la información de la tabla 11.1. Efectúe la regresión de la remuneración salarial promedio Y sobre la productividad promedio X, y considere el tamaño de la planta laboral como unidad de observación. Interprete sus resultados y vea si están de acuerdo con los presentados en (11.5.3). Los resultados de la regresión ya están en 11.5.3. Si aumenta la productividad media por un dólar, en promedio, la indemnización aumenta en unos 23 centavos.
a) De la regresión anterior, obtenga los residuos
u^i
RESPUESTA Los residuos de esta regresión son el siguiente: -775,6579, -205,0481, 165,8512,…. 199,3785, 183,9356, 54,6657, 150,6239, 112,8410, 113,4100 b) Según la prueba de Park, efectúe la regresión de ln
2 u^i
i sobre ln Xi y
verifique la regresión (11.5.4). RESPUESTA Esta es una cuestión de fácil verificación. c) Según el método de Glejser, efectúe la regresión de |ˆui | sobre Xi y luego la regresión de |ˆu i| sobre √Xi Comente sus resultados. RESPUESTA Los resultados de la regresión son los siguientes: |u^i|=407,3455−0.0203 X t=( 0.6433 ) (−0.3013 ) r 2=0.0128
|u^i|=757.2976−3.07097 √ X i t=( 0.4479 ) (−0.2787 ) r 2=¿
0.0109
Como se demuestran estos resultados, hay pocas pruebas de heterestocidasticidad sobre la base de las pruebas Glejser. d) Encuentre la correlación de orden entre |ˆui| y Xi, y comente sobre la naturaleza de la heteroscedasticidad presente en los datos, si existe. RESPUESTA Si estas es una categoría la absoluta los residuos de bajo a alto valor Y, de la misma forma las cifras de la productividad promedio rango de baja a alto valor y calcular el coeficiente de correlación de Spearman en (11.5.5) se puede observar que este coeficiente es de aproximadamente
-0.5167. Mediante la fórmula dada en t (11.5.6), el valor de t es de aproximadamente .0, 8562. Este valor de t no es estadísticamente significativa: el 5% valor critico de 7 gl es 2.447. En valor absoluto. Po lo tanto, sobre la base de la Rank teste de correlación, no tenemos ningún motivo para esperar heterostacidad. Ejercicio 11.12 La tabla 11.6 presenta información sobre la razón ventas/efectivo en las industrias manufactureras de Estados Unidos, clasificadas por tamaño de activos del establecimiento de 1971-I a 1973-IV. (Información trimestral.) La razón ventas/efectivo puede considerarse una medida de la velocidad del ingreso en el sector empresarial, es decir, el número de veces que circula un dólar. RESPUESTA a) Por cada tamaño de activos, calcule la media y la desviación estándar de la razón ventas/efectivo. b) Grafique el valor de la media frente a la desviación estándar obtenida en a), con el tamaño de activos como unidad de observación.
c) Con un modelo de regresión apropiado, determine si la desviación estándar de la razón se incrementa con el valor de la media. De no ser así, ¿cómo interpreta el resultado? RESPUESTA
Los resultados de la regresión son los siguientes: Sty=0.9910−0.0650 significa t=( 0.3756 ) (−0.1795 ) r 2 =0.0064 Dado que la pendiente del coeficiente no es estadísticamente diferente de cero, no hay ninguna relación sistemáticamente las dos variables, que pueden ser vistos en la figura (a) d) Si hay una relación estadísticamente significativa entre los dos, ¿cómo transformaría
la
información
de
manera
que
no
haya
heteroscedasticidad? RESPUESTA No hay necesidad de ninguna transformación, porque no hay una relación sistemática entre el promedio de ventas o relación de efectivo y la desviación estándar las distintas clases de activos. Ejercicio 11.13. Prueba de homogeneidad de varianza de Bartlett.* Suponga que hay k varianzas muéstrales independientes
s 21 , s22 , … , s 2k con f1, f2,..., fk gl, cada
una proveniente de poblaciones normalmente distribuidas con media μ y varianza 2
σ 2i . Suponga además que deseamos probar la hipótesis nula 2
2
2
H 0=σ 1=σ 2 =…=σ k =σ ; es
decir,
cada
varianza
muestral
es
una
estimación de la misma varianza poblacional σ2. Si la hipótesis nula es verdadera, entonces k
∑ f i s2i ∑ f s 2 1 i S 2= i=1 = f ∑ fi Constituye una estimación de la estimación común (agrupada) de la varianza poblacional σ2, donde fi = (ni − 1), con ni como el número de k
observaciones en el i-ésimo grupo y donde
f =∑ f i i=1
Bartlett demostró que la hipótesis nula se prueba por la razón A/B, distribuida aproximadamente como la distribución χ2 con k − 1 gl, donde. A=f ∈s 2−∑ (f i ∈ s2i ) B=1+
1 3(k −1)
1 1 ( ( f )− f )
∑
1
Aplique la prueba de Bartlett a los datos de la tabla 11.1 y verifique que no se puede rechazar la hipótesis de que las varianzas poblacionales de la remuneración salarial son las mismas para cada tamaño de la planta laboral del establecimiento, en el nivel de significancia de 5%. Nota: fi, los gl para cada varianza maestral, es 9, pues ni para cada muestra (es decir, clase de empleados) es 10. RESPUESTA Utilizando la prueba de Bartlett, el valor %2 s 6.6473, cuyo valor de p es 0.5748. Ejercicio 11.14. Considere el siguiente modelo de regresión a través del origen:
Yi _ βXi + ui, para i = 1, 2 Se tiene que u1 ∼ N (0, σ2) y u2 ∼ N (0, 2σ2), y que son estadísticamente independientes. Si X1 = +1 y X2 = −1, obtenga la estimación por mínimos cuadrados ponderados (MCP) de β y su varianza. Si en esta situación supuso de manera incorrecta que la dos varianzas de los errores son iguales (por ejemplo, iguales a σ2), ¿cuál sería el estimador de MCO de β?, ¿y su varianza? Compare estas estimaciones con las obtenidas por el método de MCP. ¿Qué conclusión general deduce? RESPUESTA Utilizando la formula (11.3.8) sobre la ponderación de los mínimos cuadrados, puede ser demostrando que: ^β= 1 ( 2 Y 1−Y 2 ) y var ( ^β )= 2 σ 2 3 3 Si utilizamos la operación, luego del ejercicio (6.1.6), obtenemos: ^β= ∑
Xi Y i
∑X
2 i
=
Y 1=Y 2 1 = ( Y 1 =Y 2 ) 2 2
Y usando el ejercicio (6.1.7), obtenemos σ var ( ^β)=
2
1 = σ2 ∑X 2 2 i
Al comparar las dos estimaciones, veamos que los mínimos cuadrados ponderados sea un 2/3 y 1/3 a Yx a Y2, mientras que la operación de igual peso a los dos Y observaciones. La variación de la pendiente estimador es muy media ponderada de los mínimos cuadrados que en el Sudan. Ejercicio 11.15. La tabla 11.7 proporciona datos sobre 81 automóviles respecto de su MPG (millas promedio por galón), CF (caballos de fuerza de su motor), VOL (pies cúbicos de su cabina), VM (velocidad máxima en millas por hora) y su PS (peso del vehículo en cientos de lb). a) Considere el siguiente modelo: MPGi = β1 + β2VMi + β3CFi +β4PSi + ui Estime los parámetros de este modelo e interprete los resultados. Desde el punto de vista económico, ¿tiene sentido? RESPUESTA Los resultados de la regresión son las siguientes: MPG i=189.9597−1.2716 Pi + 0.3904 HP i−1,9032 WT i se= ( 22.5287 )( 0.2331) ( 0.0762 ) ( 0.1855 ) t=( 8.4318 ) (−5.4551 ) (−10.2593 ) 2
R =0.8828 Como era de esperar, MPG se relaciona de forma positiva y negativamente a HP relacionadas con la velocidad y el peso. b) ¿Esperaría que la varianza del error en el modelo anterior sea heteroscedástica? ¿Por qué? RESPUESTA Ya que se trata de uno los datos transversales de una diversidad de coches, a priori uno puede esperar la heteroscedasticidad. (Ic) Regresión el cuadrado de los residuos obtenidos a partir del modelo se muestra en (a) en los tres regresores, su cuadrado, y sus términos de
producto, obtenemos un valor de RI 0.3094. Multiplicando este valor por el número de observaciones (=81), obtenemos 25,0646, que bajo la hipótesis nula de que no hay la heteroscedasticidad tiene la distribución Chi Cuadrado con 9 y 1 (3 regresores, 3 al cuadrado los regresores, 3 tres términos de productos). El valor de p de la obtención de un valor de Chi cuadrado de 25,0646 o superior (bajo la hipótesis nula) es 0.0029, que es muy pequeño. Por lo tanto, debemos rechazar la hipótesis nula. Es decir, hay heteroscedasticidad. c) Con la prueba de White determine si la varianza de error es heteroscedástica. RESPUESTA No existe una formula sencilla para determinar la naturaleza exacta de heteroscedasticidad el presente caso. Tal vez se podría hacer algunas suposiciones sencillas y probar diferentes transformaciones. Por ejemplo, si se considera que el culpable variable es HP, y si consideramos que la varianza del error es proporcional al cuadrado de HP, podríamos dividir a través de Hp y ver qué sucede. Por supuesto, cualquier otra regresor es un posible candidato para la transformación. d) Obtenga los errores estándar de White consistentes con la heteroscedasticidad, así como los valores t, y compare los resultados con los obtenidos mediante MCO. RESPUESTA Variable dependiente: MGP Métodos Cuadrados. Muestra: 181 Incluyo observaciones: 81 Blanco heteroscedasticidad – consistent errores estándar y covarianza
Cuando se compara los resultados con los resultados de los MOC, usted encontraras que los valores de los coeficientes estimados son los mismos, pero sus variaciones y errores estándar son diferentes. Como
puede ver, el error estándar de la pendiente estimada todos los coeficientes es mayores en el blanco. Procedimiento, por lo tanto, son los más bajos, lo que sugiere que la operación había subestimado los errores estándar. Todo esto podría ser debido a la heteroscedasticidad. e) Si se establece heteroscedasticidad, ¿cómo puede transformar los datos de manera que en los datos transformados la varianza del error sea homoscedástica? Muestre los cálculos necesarios. RESPUESTA No existe una formula sencilla para determinar la naturaleza exacta de heteroscedasticidad el presente caso. Tal vez se podría hacer algunas suposiciones sencillas y probar diferentes transformaciones. Por ejemplo, si se considera que el culpable variable es HP, y si consideramos que la varianza del error es proporcional al cuadrado de HP, podríamos dividir a través de Hp y ver qué sucede. Por supuesto, cualquier otra regresor es un posible candidato para la transformación. Ejercicio 11.16. Gasto alimentario en India. En la tabla 2.8 se proporcionaron datos sobre el gasto en alimentos y el gasto total de 55 familias de India. a) Haga la regresión del gasto alimentario sobre el gasto total y examine los residuos obtenidos en dicha regresión. RESPUESTA: Los resultados de la regresión son los siguientes: Variable dependiente: FOODEXP
b) Grafique los residuos obtenidos en el inciso a) contra el gasto total y verifique si existe algún patrón sistemático RESPUESTA:
Parece que como el gasto total aumente el valor absoluto de las desviaciones también aumento, quizás forma no lineal. c) Si la gráfica del inciso b) sugiere heteroscedasticidad, aplique las pruebas de Park, Glejser y White para determinar si la sensación respecto de la heteroscedasticidad observada en b) se sustenta con estas pruebas. RESPUESTA: (IC) PRUEBA PARQUE.
Habida cuenta de que la estimación pendiente coeficiente es significativo, el parque confirma la heteroscedasticidad. PRUEBA GLEJSER
De la pendiente estimada coeficiente es estadísticamente significativo, GLEJER prueba también sugiere la heteroscedasticidad. TEST DE WHITE
Si se multiplican los r – squared valor por 55, y la hipótesis nula es que no hay heteroscedasticidad, el producto resultante de 7,3745 sigue la distribución Chi Cuadrado con 2gl y el valor de p de tal valor de Chi Cuadrado es aproximadamente 0.025, que es pequeño. Asi pues, al igual que en el Parque Glejer y pruebas, el test de White sugiere también la heteroscedasticidad. d) Obtenga
los
errores
estándar
de
White
consistentes
con
la
heteroscedasticidad y compárelos con los errores estándar de MCO. Decida si vale la pena corregir este ejemplo a causa de la heteroscedasticidad. RESPUESTA: La heteroscedasticidad de resultados corregidos son las siguientes:
En comparación con los resultados de la regresión OLS en (a), no hay mucha diferencia en el error estándar de la pendiente, aunque el coeficiente error estándar de la ordenada ha disminuido. Si esta diferencia vale la pena molestarse, es difícil de decir. Pero, a menos que se nos vaya a través de este ejercicio, no sabemos cómo grande o pequeño es la diferencia entre el blanco y la operación de los procedimientos. Ejercicio 11.17. Repita el ejercicio 11.16, pero en esta ocasión efectúe la regresión del logaritmo del gasto alimentario sobre el logaritmo del gasto total. Si observa heteroscedasticidad en el modelo lineal del ejercicio 11.16 pero
no en el modelo log-lineal, ¿a qué conclusión llega? Muestre todos los cálculos necesarios. RESPUESTA Los resultados de la regresión son las siguientes:
El parque, Glejser y blanco del test aplicado a los residuos obtenidos de la regresión doble registró no mostro evidencia de heteroscedasticidad. Este ejemplo muestra que transformación logarítmica a menudo pueden reducir la heteroscedasticidad. Por lo tanto, la forma funcional en el que un modelo de regresión se expresa puede ser crucial para determinar si existe o no la heteroscedasticidad. Ejercicio 11.18. Un atajo de la prueba de White. Como mencionamos en el texto, la prueba de White consume grados de libertad si existen varias regresoras y se introducen todas las regresoras, sus términos cuadrados y sus productos cruzados. Por consiguiente, en vez de estimar las regresiones como la (11.5.22), ¿por qué no simplemente efectúa la siguiente regresión? 2 2 u^1=∝1 +∝2 Y^i +∝2 Y^i +∝ v 1
Donde Yˆi son los valores estimados Y (es decir, la regresada) de cualquier modelo que se calcule. Después de todo, Yˆi es tan sólo el promedio ponderado de las regresoras, donde los coeficientes estimados de la regresión sirven como ponderaciones. Obtenga el valor R2 de la regresión anterior y utilice (11.5.22) para probar la hipótesis de que no existe heteroscedasticidad. Aplique la prueba anterior al ejemplo de gasto alimentario del ejercicio 11.6. RESPUESTA El cuadrado de los residuos de la regresión de gasto en alimentos sobre el importe total de los gastos fueron los primeros obtenidos, denota por Ri 2, a
continuación se ha perdido en el pronóstico y previsión al cuadrado valor obtenido a partir de la regresión de gasto en alimentos sobre el gasto total. Los resultados fueron los siguientes:
Multiplicando el anterior R2 por 55, obtenemos 7,3745. Bajo la hipótesis nula de que no hay la heteroscedasticidad, este valor se ajusta a la distribución Chi cuadrado con 2gl. El valor de p de la obtención de un valor del Chi Cuadrado de en la medida de lo 7,3745 o mayor es de unos 0.025, que es bastante pequeña. Po lo tanto la conclusión es que la varianza del error es heteroscedasticidad. Se puede demostrar que si el procedimiento anterior se aplica al cuadrado de los criterios obtenidos de la regresión del logaritmo del gasto en alimento sobre el registro de los gastos totales, no hay evidencia de heteroscedasticidad. Ejercicio 11.19. Reconsidere el ejemplo sobre I y D de la sección 11.7. Repita ese ejemplo con las ganancias como la regresora. A priori, ¿esperaría que los resultados fuesen diferentes de los que utilizan las ventas como regresoras?, ¿por qué? RESPUESTA No hay ninguna razón para creer que los resultados serán diferentes porque las ganancias y las ventas están altamente correlacionados, como puede verse enla siguiente regresión de ganancias de las ventas.
Ejercicio 11.20.
La tabla 11.8 proporciona datos sobre la mediana de los salarios de catedráticos en estadística que laboraron en centros universitarios de investigación de Estados Unidos durante el año académico 2007. a) Grafique la mediana de los salarios respecto de los rangos de años (como medida de los años de experiencia). Para propósitos de la gráfica, suponga que la mediana de los salarios está referida al punto medio del rango de años correspondiente. Por consiguiente, el salario de $124 578 del rango 4-5 está referido a 4.5 años del rango correspondiente, y así sucesivamente. Para el último grupo, suponga que el rango es 31-33. RESPUESTA:
Tal como se muestra en esta figura, con aumentos de sueldo promedio años de graduación, pero no lineal. b) Considere los siguientes modelos de regresión:
Donde Y = mediana del salario, X = año en el rango (medido como el punto medio del intervalo), y u y v son los términos de error. ¿Puede justificar por qué el modelo (2) sería preferible al modelo (1)? A partir de estos datos, estime los modelos. RESPUESTA: De la cifra indicada en (a) parece que modelo (2) puede ser más apropiado, que se corresponde también con la teoría económica del capital humano. Los resultados de los modelos lineales cuadrática son los siguientes
c) Si observa heteroscedasticidad en el modelo (1) pero no en el modelo (2), ¿a qué conclusiones llega? Muestre los cálculos necesarios. RESPUESTA:
La heteroscedasticidad de White prueba aplicada al modelo (1) se demostró que no había evidencia de heteroscedasticidad. El valor de nR2 de la regresion auxiliar del cuadrado de los residuos es 11,4108 con un valor de p de 0.0033, lo cual sugiere una fuerte heteroscedasticidad. Cuando el mismo se aplicó la prueba con el modelo (2), n R 2 fue 7.6494, con ap valor de 0.0538, lo que sugiere que no hay heteroscedasticidad al nivel del 5%. Pero este valor es tan cerca del nivel del 5% que uno podría sospechar la heteroscedasticidad leve en el modelo, aunque la posibilidad de error en la especificación no puede descartarse. d) Si observa heteroscedasticidad en el modelo (2), ¿cómo puede transformar los datos de manera que en el modelo transformado no existiera heteroscedasticidad? RESPUESTA: Suponiendo que la varianza del error es proporcional al cuadrado de la experiencia, no hemos dividido modelo (1) a través de X y obtener los siguientes resultados:
El modelo se sometio a prueba la heterocedasticidad de White, no hubo pruebas de heterocedasticidad. Ejercicio 11.21. Tiene la siguiente información: SCR1 basado en las primeras 30 observaciones = 55, gl =25 SCR2 basado en las últimas 30 observaciones = 140, gl = 25 Realice la prueba de heteroscedasticidad de Goldfeld-Quandt en el nivel de significancia de 5%. RESPUESTA: La estadística de prueba,
El 5% críticos de F de 25gl en el numerador y en el denominador es de 1.97, dado que el valor estimado de 2,5454 supera este valor crítico, rechazar la hipótesis nula de homocedasticidad. Ejercicio 11.22. La tabla 11.9 presenta información acerca de los precios de acciones (Y) y los precios al consumidor (X) expresados en cambios porcentuales anuales para un corte transversal de 20 países. a) Grafique los datos en un diagrama de dispersión. RESULTADO: El grafico es la siguiente.
b) Efectúe la regresión de Y sobre X y examine los residuos de esta regresión. ¿Qué observa? RESULTADO: Los resultados de la regresión son los siguientes: Variable
coeficiente
est. Error
t-statistic
prob.
C
4,610280
1,084906
4,249478
0,0005
X
0,757433
0,149941
5,051559
0,0001
R-cuadrado.
0,583380
Los residuos de esta regresión cuando se trazan con X mostro la siguiente imagen.
Un residual que pertenece a chile, domina el otro residuo c) Como los datos de Chile parecen atípicos, repita la regresión en b) sin la información sobre Chile. Ahora examine los residuos de esta regresión. ¿Qué observa? RESULTADO: No incluye la observación de chile, los resultados de la regresión fueron los siguientes: Variable
coeficiente
est. Error
t-statistic
prob
R-cuadrado = 0,009262 Como se puede ver en (a) el pendiente coeficiente fue muy significativa, pero en esta regresión no lo es. Ver como solo un punto extremo, un caso atípico, ya que puede distorsionar los resultados de la regresión. El cuadrado de los residuos de esta regresión cuando se traza contra X mostro el siguiente gráfico.
d)
Si, con base en los resultados de b), concluye que hubo heteroscedasticidad en la varianza del error, pero con base en los resultados de c) modifica este resultado, ¿qué conclusiones generales obtiene? RESULTADO: Comparando los gráficos residuales en las letras (b) y (c), vemos que una vez Chile se retire de los datos existe poca relación entre Y y X por lo tanto, cualquier aspecto de la heteroscedasticidad es falsa.
View more...
Comments