Practica Empirca Stata Jorge Salgado

March 26, 2017 | Author: research90 | Category: N/A
Share Embed Donate


Short Description

Download Practica Empirca Stata Jorge Salgado...

Description

Práctica Empírica: Sistema de Ecuaciones de Demanda y Precios en el Mercado Español de Transporte Aéreo

Jorge Salgado 15 de diciembre de 2011

1.- Elementos iníciales: Preparación del paquete informático y de la base de datos: Se parte por actualizar a Stata 10 instalado en Ubuntu 11.10 (distribución Oneric): update query Busca las actualizaciones más recientes y las compara con la actual. update all  Actualiza todas las librerías disponibles . update swap  Se completa la actualización y se reinicia el software. Una vez reiniciado Stata, se importa la base de datos, inicialmente en .xls a un archivo .csv utilizando Excel. Posteriormente, se abre y se carga en STATA.

list dist pibc pop pax turc pr  Crea una lista de observaciones de las variables seleccionadas. Jorge Salgado Sistema de Ecuaciones STATA

Página

Se visualiza la información, se elabora un resumen estadístico general y posteriormente se hace una síntesis descriptiva en consideración de la naturaleza discreta o continua de las variables.

1

cd /home/jorge/Desktop/prac  Se define al directorio de trabajo. insheet using pracsv.csv  El documento convertido a un archivo con extensión .csv es importado a STATA xtset index year Se indica al software que ordene la base de datos de acuerdo al tipo de rutas y de acuerdo al periodo de tiempo.

Tabla No. 1 Ejecución del comando list

summarize  Resume todas las variables de la muestra (alternativamente sum).

Tabla No. 2 Ejecución del comando summarize

sum pr pax pop pibc dist turc hha  Presenta un resumen estadístico de las variables continuas sum modal if modal>0  Resume a la variable de competencia intermodal, imponiendo una condición que permite recoger su naturaleza binaria sum hub if hub>0  Resume a la variable de rutas que tienen como origen al aeropuerto de Madrid (hub primario de Iberia) identificadas como una dummy.

Página

2

sum compet if compet>0  Resume a la variable de rutas que tienen más de un competidor.

Jorge Salgado Sistema de Ecuaciones STATA

Tabla No. 3 Ejecución del comando sum para variables continuas y discretas

Las tablas dos y tres muestran que el precio medio de las rutas incluidas en la muestra es de 188.90 euros, la ruta de menor valor tiene un precio promedio de 49.85 euros mientras la de mayor 756.19. Es relevante la magnitud de la desviación estándar del total de número de pasajeros transportados por ruta, que muestra un valor de 329757.7 mayor al de la media de 248892.7 podría constituir un indicativo sobre la heterogeneidad en la demanda rutas. Los resultados del valor medio del índice de Hirchman-Herfindalh, sobre la concentración de cuotas de las aerolíneas en términos del total de salidas en el aeropuerto, se orientan en una dirección cercana, la diferencia entre el índice más alto es de 0.5 con un valor máximo de 0.755. La variable de turistas per cápita da pautas sobre el comportamiento asimétrico del sector turístico entre las ciudades de la muestra, la desviación estándar muestra un valor de 3.43 mayor a la media de 2.57, la diferencia entre la ciudad de mayor turismo per cápita y la de menor es de 11.23. Los momentos estadísticos de la población en las ciudades de origen y destino podría reflejar las asimetrías en la concentración de población en las ciudades de la muestra, la desviación estándar tiene un valor de 831171.1 mientras la media de 2´999308 individuos, en cada ciudad. El producto per cápita medio de la muestra es de 21971.35 euros y la desviación de 3162.145, no obstante, existe una amplia brecha entre la ciudad de menor producto per cápita y la de mayor, alrededor de 15.000 euros, lo cual brinda señales sobre la polarización de las actividades productivas. Las variables discretas sobre la competencia intermodal, la que representa a las rutas que parten del Hub de Madrid y el de las rutas que no son un monopolio, representan en su conjunto cerca del 50% de las observaciones para los tres casos.

Jorge Salgado Sistema de Ecuaciones STATA

Página

corre pax pr pop pibc dist turc hha modal hub compet |t| 0.000 0.033 0.000 0.000 0.008 0.940 0.000 0.000 0.000

= = = = =

893 147.94 0.0000 0.4634 .89049

[95% Conf. Interval] 1.206123 .0503655 .3762664 .1930839 -.3152811 -.0334276 .2080444 -.0035561 -20.15937

1.518557 1.196162 .477508 .473653 -.0479857 .0361038 .4501732 -.0024397 -8.655881

. . mfx, dyex Elasticities after regress y = Fitted values (predict) = 11.776655 variable

dy/ex

lpop lpibc lturc hub modal time ver pr

20.24516 6.224227 .0442904 .1482052 -.0813587 .0060042 .1647387 -.5669864

Std. Err. 1.18283 2.91506 .00268 .03178 .0305 .07948 .03088 .05379

z 17.12 2.14 16.55 4.66 -2.67 0.08 5.34 -10.54

P>|z|

[

95% C.I.

]

0.000 0.033 0.000 0.000 0.008 0.940 0.000 0.000

17.9269 22.5635 .510809 11.9376 .039046 .049535 .085924 .210486 -.141141 -.021576 -.14978 .161789 .104222 .225256 -.672416 -.461557

X 14.8606 9.9865 .103752 .444569 .447928 4.48712 .50056 189.13

.

Además, se puede controlar por auto correlación espacial:

Página

11

regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(index)  Se corrige a la ecuación de autocorrelación espacial incorporando al comando cluster(index) mfx, dyex  Obtiene las elasticidades de la regresión anterior.

Jorge Salgado Sistema de Ecuaciones STATA

Tabla No. 10 Estimación de la ecuación de demanda controlando la heterocedasticidad y por autocorrelación espacial- elasticidades . regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(index) Linear regression

Number of obs = F( 8, 55) = Prob > F = R-squared = Root MSE =

893 37.52 0.0000 0.4634 .89049

(Std. Err. adjusted for 56 clusters in index)

lpax

Coef.

lpop lpibc lturc hub modal time ver pr _cons

1.36234 .6232639 .4268872 .3333684 -.1816334 .0013381 .3291088 -.0029979 -14.40763

Robust Std. Err. .2981303 .9721379 .0939501 .2638478 .2452839 .0433749 .0399359 .0006106 9.832324

t 4.57 0.64 4.54 1.26 -0.74 0.03 8.24 -4.91 -1.47

P>|t| 0.000 0.524 0.000 0.212 0.462 0.976 0.000 0.000 0.149

[95% Conf. Interval] .7648739 -1.324944 .238607 -.1953944 -.6731932 -.0855872 .2490754 -.0042216 -34.11204

1.959807 2.571472 .6151674 .8621313 .3099265 .0882634 .4091422 -.0017742 5.29679

. . mfx, dyex Elasticities after regress y = Fitted values (predict) = 11.776655 variable

dy/ex

lpop lpibc lturc hub modal time ver pr

20.24516 6.224227 .0442904 .1482052 -.0813587 .0060042 .1647387 -.5669864

Std. Err. 4.43039 9.70826 .00975 .1173 .10987 .19463 .01999 .11549

z 4.57 0.64 4.54 1.26 -0.74 0.03 8.24 -4.91

P>|z|

[

95% C.I.

]

0.000 0.521 0.000 0.206 0.459 0.975 0.000 0.000

11.5618 28.9286 -12.8036 25.2521 .025186 .063395 -.081696 .378106 -.296699 .133982 -.375461 .387469 .125558 .203919 -.793336 -.340637

X 14.8606 9.9865 .103752 .444569 .447928 4.48712 .50056 189.13

Y por auto correlación temporal:

Página

12

regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(year)  Se corrige a la ecuación de autocorrelación temporal incorporando al comando cluster(year) mfx, dyex  Obtiene las elasticidades de la regresión anterior.

Jorge Salgado Sistema de Ecuaciones STATA

Tabla No. 11 Estimación de la ecuación de demanda controlando la heterocedasticidad y por autocorrelación temporal - elasticidades . regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(year) Linear regression

Number of obs = F( 8, 15) = Prob > F = R-squared = Root MSE =

893 596.66 0.0000 0.4634 .89049

(Std. Err. adjusted for 16 clusters in year)

lpax

Coef.

lpop lpibc lturc hub modal time ver pr _cons

1.36234 .6232639 .4268872 .3333684 -.1816334 .0013381 .3291088 -.0029979 -14.40763

Robust Std. Err. .043495 .1980714 .0158338 .0257171 .04268 .0146962 .0394933 .0002342 2.057017

t 31.32 3.15 26.96 12.96 -4.26 0.09 8.33 -12.80 -7.00

P>|t| 0.000 0.007 0.000 0.000 0.001 0.929 0.000 0.000 0.000

[95% Conf. Interval] 1.269633 .2010847 .3931383 .2785538 -.2726036 -.0299862 .2449309 -.0034971 -18.79205

1.455048 1.045443 .4606361 .3881831 -.0906631 .0326624 .4132867 -.0024987 -10.0232

. . mfx, dyex Elasticities after regress y = Fitted values (predict) = 11.776655 variable

dy/ex

lpop lpibc lturc hub modal time ver pr

20.24516 6.224227 .0442904 .1482052 -.0813587 .0060042 .1647387 -.5669864

Std. Err. .64636 1.97804 .00164 .01143 .01912 .06594 .01977 .0443

z 31.32 3.15 26.96 12.96 -4.26 0.09 8.33 -12.80

P>|z|

[

95% C.I.

]

0.000 0.002 0.000 0.000 0.000 0.927 0.000 0.000

18.9783 21.512 2.34734 10.1011 .041071 .04751 .125797 .170614 -.118829 -.043889 -.123243 .135252 .125993 .203485 -.653805 -.480168

X 14.8606 9.9865 .103752 .444569 .447928 4.48712 .50056 189.13

Como algunas de las variables son endógenas entonces se lleva a cabo una estimación por variables instrumentales, que trate de eliminar el sesgo de la estimación. ssc install ivreg2, replace  Se instala al paquete ivreg2, una actualización de ivreg( instrumental variable regression)

mfx,dyex se obtienen las elasticidades Jorge Salgado Sistema de Ecuaciones STATA

Página

ivreg2 lpax lpop lpibc lturc hub modal time ver (pr = dist), ffirst robust  ivreg2 estima mediante variables instrumentales, el comando ffirst añade la estimación de la primera etapa del proceso de Mínimos Cuadrados de Variables Instrumentales. La regresión en primera fase puede ser un soporte para decidir si un instrumento es débil o no. Las variables entre paréntesis señalan a la variable explicativa que adolece de endogeneidad en este caso pr y al intrumento dist.

13

ssc install ranktest  Se instala al paquete ranktest elaborado por Kleibergen-Paap (2006). Es una del rango de una matriz necesaria para alguno de los estadísticos de ivreg2.

Tabla No. 12 Estimación de la ecuación de demanda mediante variables instrumentales (primera etapa) . ivreg2 lpax lpop lpibc lturc hub modal time ver (pr = dist), ffirst robust

Summary results for first-stage regressions

Variable pr

| F( |

(Underid) (Weak id) 1, 884) P-val | AP Chi-sq( 1) P-val | AP F( 1, 884) 259.42 0.0000 | 262.06 0.0000 | 259.42

NB: first-stage test statistics heteroskedasticity-robust Stock-Yogo weak ID test critical values for single endogenous regressor: 10% maximal IV size 16.38 15% maximal IV size 8.96 20% maximal IV size 6.66 25% maximal IV size 5.53 Source: Stock-Yogo (2005). Reproduced by permission. NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors. Underidentification test Ho: matrix of reduced form coefficients has rank=K1-1 (underidentified) Ha: matrix has rank=K1 (identified) Kleibergen-Paap rk LM statistic Chi-sq(1)=110.71 P-val=0.0000 Weak identification test Ho: equation is weakly identified Cragg-Donald Wald F statistic Kleibergen-Paap Wald rk F statistic

319.60 259.42

Stock-Yogo weak ID test critical values for K1=1 and L1=1: 10% maximal IV size 16.38 15% maximal IV size 8.96 20% maximal IV size 6.66 25% maximal IV size 5.53 Source: Stock-Yogo (2005). Reproduced by permission. NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors. Weak-instrument-robust inference Tests of joint significance of endogenous regressors B1 in main equation Ho: B1=0 and orthogonality conditions are valid Anderson-Rubin Wald test F(1,884)= 6.59 P-val=0.0104 Anderson-Rubin Wald test Chi-sq(1)= 6.65 P-val=0.0099 Stock-Wright LM S statistic Chi-sq(1)= 6.30 P-val=0.0121 NB: Underidentification, weak identification and weak-identification-robust test statistics heteroskedasticity-robust of of of of of

observations regressors endogenous regressors instruments excluded instruments

N K K1 L L1

= = = = =

893 9 1 9 1

Página

14

Number Number Number Number Number

Jorge Salgado Sistema de Ecuaciones STATA

Tabla No. 13 Estimación de la ecuación de demanda mediante variables instrumentales (segunda etapa) IV (2SLS) estimation

Estimates efficient for homoskedasticity only Statistics robust to heteroskedasticity

Total (centered) SS Total (uncentered) SS Residual SS

= = =

lpax

Coef.

pr lpop lpibc lturc hub modal time ver _cons

-.0012041 1.352827 .738519 .4321223 .3226453 -.0713689 .0053752 .2257611 -15.76805

Number of obs F( 8, 884) Prob > F Centered R2 Uncentered R2 Root MSE

1306.417958 125156.2234 723.8024896

Robust Std. Err. .0004536 .0819122 .3042889 .0266112 .0739099 .0782404 .0180041 .0646387 3.048208

z -2.65 16.52 2.43 16.24 4.37 -0.91 0.30 3.49 -5.17

P>|z| 0.008 0.000 0.015 0.000 0.000 0.362 0.765 0.000 0.000

= = = = = =

893 135.88 0.0000 0.4460 0.9942 .9003

[95% Conf. Interval] -.002093 1.192282 .1421237 .3799653 .1777846 -.2247172 -.0299121 .0990716 -21.74243

-.0003151 1.513372 1.334914 .4842793 .4675061 .0819795 .0406626 .3524506 -9.793676

Underidentification test (Kleibergen-Paap rk LM statistic): Chi-sq(1) P-val =

110.713 0.0000

319.604 Weak identification test (Cragg-Donald Wald F statistic): (Kleibergen-Paap rk Wald F statistic): 259.419 Stock-Yogo weak ID test critical values: 10% maximal IV size 16.38 15% maximal IV size 8.96 20% maximal IV size 6.66 25% maximal IV size 5.53 Source: Stock-Yogo (2005). Reproduced by permission. NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors. Hansen J statistic (overidentification test of all instruments): 0.000 (equation exactly identified) Instrumented: pr Included instruments: lpop lpibc lturc hub modal time ver Excluded instruments: dist

. . mfx,dyex Elasticities after ivreg2 y = Linear prediction (predict) = 11.776655 dy/ex

pr lpop lpibc lturc hub modal time ver

-.227728 20.10379 7.375222 .0448335 .1434381 -.0319681 .0241192 .113007

Std. Err. .08578 1.21726 3.03878 .00276 .03286 .03505 .08079 .03236

z -2.65 16.52 2.43 16.24 4.37 -0.91 0.30 3.49

P>|z|

[

95% C.I.

]

0.008 0.000 0.015 0.000 0.000 0.362 0.765 0.000

-.395858 -.059598 17.718 22.4896 1.41932 13.3311 .039422 .050245 .079037 .207839 -.100657 .036721 -.134219 .182458 .049591 .176423

X 189.13 14.8606 9.9865 .103752 .444569 .447928 4.48712 .50056

Página

15

variable

Jorge Salgado Sistema de Ecuaciones STATA

En la Tabla No. 12 se reportan los resultados de la primera estimación del proceso en dos etapas. Se parte por recordar que la variable de precios (pr) adolece de endogeneidad como se distingue en las ecuaciones (1) y (2). Los instrumentos se obtienen de la ecuación de precios (2). Se emplea a la variable de distancia entre las ciudades de origen y de destino (dist). La prueba F indica que el instrumento es significativo al 1% de significación, de acuerdo a Bound, Jaeger y Baker (1995), cuando solo se tiene una variable explicativa con endogeneidad y en consideración de que esta prueba F, es no estándar, el resultado puede ser altamente informativo. No obstante, siguiendo a Staiger y Stock (1997) quienes mostraron, que los instrumentos pueden ser débiles incluso si las pruebas t y F de la primera etapa son representativos. Se consideran a los estadísticos de Cragg y Donald fundamentado en los valores críticos de Stock y Yogo, y a la prueba de Anderson ambos en el marco de ivreg2. Stock y Yogo (2005), concentran su preocupación en comprender si el sesgo del estimador de variables instrumentales, que resulta por el uso de instrumentos débiles puede ser grande e incluso mayor que el de MCO. Si el valor del estadístico que sigue una distribución F(en este caso el de Cragg y Donald wald o el estadístico de Kleinbergen-Paap) es mayor que el de los valores críticos, se rechaza la hipótesis nula de debilidad de los instrumentos, que es el escenario de la estimación de la Tabla No. 12. A pesar de ello, para Cameron y Trivedi(2009), en el caso de un regresor con endogeneidad los valores críticos solo son válidos si se tiene al menos tres instrumentos. Los estadísticos de las pruebas de Anderson-Rubin de parámetros estructurales y el de StockWright LM rechazan la hipótesis nula, por lo tanto los regresores endógenos son relevantes. Por otra parte, las pruebas de sobreidentifación no son de interés ya que existe un instrumento para un regresor endógeno, el sistema está perfectamente identificado como se intuye del estadístico de Hansen. En cuanto a los coeficientes de las explicativas, en las dos estimaciones por MCO y mediante IV los resultados cualitativos son los mismos, no obstante, la significación de las regresores varía. El coeficiente de la variable de precios, que es instrumentalizada en la estimación de dos etapas, muestra una relación negativa con el logaritmo del número de pasajeros, que es un resultado esperado, un mayor precio reduciría la demanda de viajes. Sin embargo, en la primera estimación el coeficiente muestra un valor mucho más elevado que en la segunda, como resultado de la incorporación de una variable explicativa endógena.

Jorge Salgado Sistema de Ecuaciones STATA

Página

La variable de hub, parecería tener una relación positiva con el logaritmo del número de pasajeros en la estimación por MCO y en la de VI. La variable de modal, que pretende capturar el efecto de la competencia de otros modos de transporte tiene una relación negativa y significativa en la estimación por MCO, mientras en la estimación en dos etapas es no

16

La variable de población muestra una relación positiva con el número de pasajeros en ambos casos MCO y VI. Un espacio poblacional más denso implica mayor tráfico aéreo. La del ingreso per cápita en la estimación por mínimos cuadrados ordinarios presenta una relación positiva y estadísticamente significativa de forma similar en la de variables instrumentales, además es consecuente con los resultados esperados, espacios con mayor actividad económica tendrán más tránsito de pasajeros. De la misma forma, la variable de turismo por habitante implicaría un mayor flujo de pasajeros, en ambas estimaciones.

significativa incluyo al 10% del valor crítico. La variable de tendencia temporal parece no ser significativa por MCO y IV. La variable de identificación de cambio climático para incidir de forma positiva en el número de pasajeros, es decir que el tráfico se incrementa en verano en las dos estimaciones. Este resultado es consistente con el contraste de medias presentado en la Tabla No. 5.

3.- Estimación de la ecuación de precios (se supone que

= 0).

Si se supone que todas las variables explicativas de la ecuación de precios son exógenas: regress pr dist pax compet cap_barcelona cap_madrid ver, robust Estimación de la ecuación de precios por Mínimos Cuadrados Ordinarios, controlando la existencia de heterocedasticidad con el comando Robust. mfx, eyex  Obtiene las elasticidades de la regresión anterior. Tabla No. 14 Estimación de la ecuación de precios por Mínimos Cuadrados Ordinarios controlando la heterocedasticidad – elasticidades . regress pr dist pax compet cap_barcelona cap_madrid ver, robust Linear regression

Number of obs F( 6, 889) Prob > F R-squared Root MSE

pr

Coef.

dist pax compet cap_barcelona cap_madrid ver _cons

.1156128 -.0000177 -47.24226 -20.7868 5.418685 56.04074 128.396

Robust Std. Err.

t

.0059981 5.78e-06 5.893934 7.442551 7.596215 5.244611 5.961887

19.27 -3.06 -8.02 -2.79 0.71 10.69 21.54

P>|t| 0.000 0.002 0.000 0.005 0.476 0.000 0.000

= = = = =

896 101.64 0.0000 0.4503 73.735

[95% Conf. Interval] .1038407 -.0000291 -58.80991 -35.39382 -9.48992 45.74748 116.695

.1273849 -6.36e-06 -35.67461 -6.179781 20.32729 66.33401 140.097

. . mfx, eyex Elasticities after regress y = Fitted values (predict) = 188.89095 ey/ex

dist pax compet cap_ba~a cap_ma~d ver

.3935115 -.0233423 -.1471032 -.0619012 .0107576 .1483415

Std. Err. .01925 .00759 .01773 .02233 .01508 .01342

z 20.44 -3.08 -8.30 -2.77 0.71 11.05

P>|z|

[

95% C.I.

]

0.000 0.002 0.000 0.006 0.476 0.000

.355785 .431238 -.038211 -.008474 -.181845 -.112362 -.105674 -.018129 -.018799 .040314 .122037 .174646

X 642.929 248893 .58817 .5625 .375 .5

Página

17

variable

Jorge Salgado Sistema de Ecuaciones STATA

Además, la ecuación de precios se puede controlar por auto correlación espacial: regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(index)  Se corrige a la ecuación de autocorrelación espacial incorporando al comando cluster(index) mfx, dyex  Se obtiene las elasticidades de la regresión anterior.

Tabla No. 15 Estimación de la ecuación de precios por Mínimos Cuadrados Ordinarios controlando la heterocedasticidad y por la autocorrelación espacial - elasticidades . regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(year) Linear regression

Number of obs = F( 6, 15) = Prob > F = R-squared = Root MSE =

896 70.38 0.0000 0.4503 73.735

(Std. Err. adjusted for 16 clusters in year)

pr

Coef.

dist pax compet cap_barcelona cap_madrid ver _cons

.1156128 -.0000177 -47.24226 -20.7868 5.418685 56.04074 128.396

Robust Std. Err.

t

.0127681 6.60e-06 8.58294 10.51622 8.914063 7.759806 11.02889

9.05 -2.69 -5.50 -1.98 0.61 7.22 11.64

P>|t| 0.000 0.017 0.000 0.067 0.552 0.000 0.000

[95% Conf. Interval] .0883983 -.0000318 -65.53636 -43.20158 -13.58119 39.50111 104.8885

.1428273 -3.65e-06 -28.94816 1.627984 24.41856 72.58038 151.9035

. . mfx, dyex Elasticities after regress y = Fitted values (predict) = 188.89095 variable

dy/ex

dist pax compet cap_ba~a cap_ma~d ver

74.33075 -4.409148 -27.78646 -11.69257 2.032007 28.02037

Std. Err. 8.20896 1.64202 5.04822 5.91537 3.34277 3.8799

z 9.05 -2.69 -5.50 -1.98 0.61 7.22

P>|z|

[

95% C.I.

]

0.000 0.007 0.000 0.048 0.543 0.000

58.2415 90.42 -7.62745 -1.19085 -37.6808 -17.8921 -23.2865 -.09866 -4.51971 8.58372 20.4159 35.6248

X 642.929 248893 .58817 .5625 .375 .5

Jorge Salgado Sistema de Ecuaciones STATA

Página

regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(year)  Se corrige a la ecuación de autocorrelación temporal incorporando al comando cluster(index)

18

También puede controlarse por auto correlación temporal:

mfx, dyex  Obtiene las elasticidades de la regresión anterior.

Tabla No. 16 Estimación de la ecuación de precios por Mínimos Cuadrados Ordinarios controlando la heterocedasticidad y por la autocorrelación temporal - elasticidades . regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(year) Linear regression

Number of obs = F( 6, 15) = Prob > F = R-squared = Root MSE =

896 70.38 0.0000 0.4503 73.735

(Std. Err. adjusted for 16 clusters in year)

pr

Coef.

dist pax compet cap_barcelona cap_madrid ver _cons

.1156128 -.0000177 -47.24226 -20.7868 5.418685 56.04074 128.396

Robust Std. Err.

t

.0127681 6.60e-06 8.58294 10.51622 8.914063 7.759806 11.02889

9.05 -2.69 -5.50 -1.98 0.61 7.22 11.64

P>|t| 0.000 0.017 0.000 0.067 0.552 0.000 0.000

[95% Conf. Interval] .0883983 -.0000318 -65.53636 -43.20158 -13.58119 39.50111 104.8885

.1428273 -3.65e-06 -28.94816 1.627984 24.41856 72.58038 151.9035

. . mfx, dyex Elasticities after regress y = Fitted values (predict) = 188.89095 variable

dy/ex

dist pax compet cap_ba~a cap_ma~d ver

74.33075 -4.409148 -27.78646 -11.69257 2.032007 28.02037

Std. Err. 8.20896 1.64202 5.04822 5.91537 3.34277 3.8799

z 9.05 -2.69 -5.50 -1.98 0.61 7.22

P>|z|

[

95% C.I.

]

0.000 0.007 0.000 0.048 0.543 0.000

58.2415 90.42 -7.62745 -1.19085 -37.6808 -17.8921 -23.2865 -.09866 -4.51971 8.58372 20.4159 35.6248

X 642.929 248893 .58817 .5625 .375 .5

mfx,dyex Obtiene las elasticidades de la regresión anterior.

Jorge Salgado Sistema de Ecuaciones STATA

Página

ivreg2 pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid ver, ffirst robust  ivreg2 estima mediante variables instrumentales, el comando ffirst añade la estimación de la primera etapa del proceso de Mínimos Cuadrados de Variables Instrumentales. La regresión en primera fase puede ser un soporte para decidir si un instrumento es débil o no. Las variables entre paréntesis señalan en el lado izquierdo a la variables explicativas que adolecen de endogeneidad en este pax y compent los instrumentos al lado derecho son pop pibc turc hub modal hha.

19

Como algunas de las variables son endógenas entonces se lleva a cabo una estimación por variables instrumentales.

Tabla No. 17 Estimación de la ecuación de precios mediante variables instrumentales (primera fase). . ivreg2 pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap

Summary results for first-stage regressions

Variable pax compet

| F( | |

(Underid) (Weak id) 6, 882) P-val | AP Chi-sq( 5) P-val | AP F( 5, 882) 57.24 0.0000 | 251.80 0.0000 | 49.74 85.18 0.0000 | 627.70 0.0000 | 123.99

NB: first-stage test statistics heteroskedasticity-robust Stock-Yogo weak ID test critical values for single endogenous regressor: 5% maximal IV relative bias 19.28 10% maximal IV relative bias 10.83 20% maximal IV relative bias 6.77 30% maximal IV relative bias 5.25 10% maximal IV size 26.87 15% maximal IV size 15.09 20% maximal IV size 10.98 25% maximal IV size 8.84 Source: Stock-Yogo (2005). Reproduced by permission. NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors. Underidentification test Ho: matrix of reduced form coefficients has rank=K1-1 (underidentified) Ha: matrix has rank=K1 (identified) Kleibergen-Paap rk LM statistic Chi-sq(5)=47.57 P-val=0.0000 Weak identification test Ho: equation is weakly identified Cragg-Donald Wald F statistic Kleibergen-Paap Wald rk F statistic

12.07 11.13

Stock-Yogo weak ID test critical values for K1=2 and L1=6: 5% maximal IV relative bias 15.72 10% maximal IV relative bias 9.48 20% maximal IV relative bias 6.08 30% maximal IV relative bias 4.78 10% maximal IV size 21.68 15% maximal IV size 12.33 20% maximal IV size 9.10 25% maximal IV size 7.42 Source: Stock-Yogo (2005). Reproduced by permission. NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors. Weak-instrument-robust inference Tests of joint significance of endogenous regressors B1 in main equation Ho: B1=0 and orthogonality conditions are valid Anderson-Rubin Wald test F(6,882)= 19.37 P-val=0.0000 Anderson-Rubin Wald test Chi-sq(6)= 117.65 P-val=0.0000 Stock-Wright LM S statistic Chi-sq(6)= 87.88 P-val=0.0000 NB: Underidentification, weak identification and weak-identification-robust test statistics heteroskedasticity-robust of of of of of

observations regressors endogenous regressors instruments excluded instruments

N K K1 L L1

= = = = =

893 7 2 11 6

Página

20

Number Number Number Number Number

Jorge Salgado Sistema de Ecuaciones STATA

Tabla No. 18 Estimación de la ecuación de precios mediante variables instrumentales (segunda fase). IV (2SLS) estimation

Estimates efficient for homoskedasticity only Statistics robust to heteroskedasticity

Total (centered) SS Total (uncentered) SS Residual SS

= = =

pr

Coef.

pax compet dist cap_barcelona cap_madrid ver _cons

-.000025 -55.83475 .1176725 -19.45758 6.859253 56.50067 132.4735

Number of obs F( 6, 886) Prob > F Centered R2 Uncentered R2 Root MSE

8777775.386 40720620.03 4858915.932

Robust Std. Err.

z

.0000174 12.96561 .0062029 7.590536 7.488238 5.169861 6.365917

-1.43 -4.31 18.97 -2.56 0.92 10.93 20.81

P>|z| 0.152 0.000 0.000 0.010 0.360 0.000 0.000

= = = = = =

893 96.46 0.0000 0.4465 0.8807 73.76

[95% Conf. Interval] -.0000592 -81.24688 .1055151 -34.33476 -7.817424 46.36792 119.9965

Underidentification test (Kleibergen-Paap rk LM statistic): Chi-sq(5) P-val =

9.19e-06 -30.42262 .1298298 -4.580407 21.53593 66.63341 144.9504 47.573 0.0000

Weak identification test (Cragg-Donald Wald F statistic): 12.073 (Kleibergen-Paap rk Wald F statistic): 11.129 Stock-Yogo weak ID test critical values: 5% maximal IV relative bias 15.72 10% maximal IV relative bias 9.48 20% maximal IV relative bias 6.08 30% maximal IV relative bias 4.78 10% maximal IV size 21.68 15% maximal IV size 12.33 20% maximal IV size 9.10 25% maximal IV size 7.42 Source: Stock-Yogo (2005). Reproduced by permission. NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors. Hansen J statistic (overidentification test of all instruments): Chi-sq(4) P-val =

45.117 0.0000

Instrumented: pax compet Included instruments: dist cap_barcelona cap_madrid ver Excluded instruments: pop pibc turc hub modal hha

. . mfx, eyex Elasticities after ivreg2 y = Linear prediction (predict) = 189.13028 variable

ey/ex

pax compet dist cap_ba~a cap_ma~d ver

-.0328448 -.1732301 .4002972 -.0577184 .0135241 .149537

Std. Err. .02293 .03985 .01992 .02267 .01476 .01323

z -1.43 -4.35 20.10 -2.55 0.92 11.30

P>|z|

[

95% C.I.

]

0.152 0.000 0.000 0.011 0.360 0.000

-.077784 .012094 -.251326 -.095134 .361262 .439333 -.102143 -.013293 -.015411 .042459 .123603 .175471

X 248553 .586786 643.382 .56103 .3729 .50056

Página

21

.

Jorge Salgado Sistema de Ecuaciones STATA

Se obtienen las elasticidades de las variables de la ecuación de precios y la elasticidad precio de la demanda, evaluadas con respecto a la media muestral. ,

=

=

=

,

,





,

_



=

,,





=

,



_

= −(0.000025) ∗



=

=

= (0.1176725) ∗



=



=

=

=

=

= (56.50067) ∗



_

248892.7 = −0.0328448 188.8909

= −(55.83475) ∗



_

642.9286 = 0.4002972 188.8909



_

_

0.5881696 = −0.1732301 188.8909

0.5 = 0.149537 188.8909 = −(19.45758) ∗

= −(6.859253) ∗

0.5625 = −0.0577184 188.8909

0.375 = 0.0135241 188.8909

Las anteriores coinciden con las expuestas en la Tabla No.18 y que se pueden obtener a partir del comando mfx, dyex. La elasticidad precio de la demanda por otra parte iguala: =

= −0.012041 ∗ 188.8909 = −2.274435

En la Tabla No. 17 se reportan los resultados de la primera estimación del proceso en dos etapas para la ecuación de precios. Se parte por recordar que las variables de número total de pasajeros transportados por las aerolíneas (pax) y la variable sobre las características de la competencia (compet) son endógenas como se distingue de las ecuaciones (1) y (2). Los instrumentos empleados son la población de las ciudades que son origen y destino (pop) la renta per cápita (pibc), el turismo per cápita (turc), la variable que tienen como origen Madrid el hub de Iberia (hub), la posibilidad de competencia intermodal (modal) y el promedio del Índice de Hirschman-Herfindalh(hha).

Jorge Salgado Sistema de Ecuaciones STATA

Página

Se opta entonces por analizar los resultados de las pruebas de instrumentos débiles explorados en la estimación de la ecuación de demanda y que están incorporados en el paquete de ivreg2. Se considera inicialmente a los valores críticos propuestos por Stock y Yogo (2005), contrastados con los estadísticos de Kleibergen-Paap wald y de Cragg-Donald wald. Para el primer caso, el estadístico de Kleinbergen-Paap wald, que es una generalización de la prueba de correlación de rango de Anderson, sugiere que los instrumentos pueden no ser los mejores para la estimación. No obstante, la prueba de Kleinbergen-Paap LM de sobreidentificación rechaza la hipótesis nula al 95% de nivel confianza. La prueba de CraggDonald no rechaza la hipótesis nula de debilidad de los instrumentos al estándar del 5%. Cabe mencionar que Baum, Schaffer y Stillman(2007) han advertido sobre la pérdida de confianza de este estadístico en los escenarios en donde los errores son heterocedásticos.

22

La prueba F indica que los instrumentos son significativos, no obstante, Bound, Jaeger y Baker (1995), señalan que en el marco de incluir más de una variable endógena en la estimación de dos etapas la prueba F es poco fiable, debido a que es una distribución no estándar.

Los estadísticos de las pruebas de Anderson-Rubin de parámetros estructurales y el de StockWright LM rechazan la hipótesis nula, por lo tanto los regresores endógenos son relevantes. Por otra parte, la prueba de Hansen de sobreidentifación rechaza la hipótesis nula de sobreidentificación. En cuanto a los coeficientes de las explicativas de la ecuación de precios, en las dos estimaciones los resultados cualitativos son los mismos, no obstante, la significación de los regresores varía de forma relevante. El coeficiente de la variable de pasajeros, que es instrumentalizada en la estimación de dos etapas, muestra una relación negativa con el nivel de precios, que es un resultado esperado. Sin embargo, es no significativa por VI. En la primera estimación por MCO el coeficiente muestra de forma similar una relación negativa aunque con una t negativa. La variable de competencia en las rutas muestra una relación negativa con el número de pasajeros en ambos casos MCO y V, podría intuirse que rutas con más competencia intramodal tienes precios menores. La variable de distancia presenta una relación positiva y estadísticamente significativa de forma similar en la de variables instrumentales, además es consecuente con los resultados esperados mayores distancias implican mayores costos y consecuentemente mayores precios. Asimismo, la variable de identificación entre verano e invierno incide de forma positiva en los precios en las dos estimaciones. Finalmente, la variable que captura los efectos de la ampliación en el aeropuerto de Barcelona se relaciona de forma negativa y significativa con el nivel precios de las rutas, mientras la ampliación del aeropuerto de Madrid es no significativa en ambas relaciones aunque conserva una relación positiva.

4. Estimación mediante la técnica de datos de panel (se supone que

= 0).

Inicialmente se comprueba si las variables dependientes siguen un proceso no-estacionario (raíz unitaria). El contraste de Dickey-Fuller para un panel de datos es una alternativa. Para el contraste en Stata se emplea al paquete levinlin, que debe ser previamente instalado. ssc install levinlin  Se instala al paquete levinlin levinlin pax,lag(1)  El comando levinlin prueba la existencia de raíces unitarias de orden 1 para la variable pax

Página

23

levinlin pr,lag(1)  El comando levinlin prueba la existencia de raíces unitarias de orden 1 para la variable pr

Jorge Salgado Sistema de Ecuaciones STATA

Tabla No. 19 Pruebas de raíces unitarias para pax y pr . levinlin pax,lag(1) Levin-Lin-Chu test for pax

Deterministics chosen: constant

Pooled ADF test, N,T = (56,16) Augmented by 1 lags (average)

Obs = 784 Truncation: 7 lags

coefficient -0.31991

t-value -9.888

t-star 2.31712

P > t 0.9898

. levinlin pr,lag(1) Levin-Lin-Chu test for pr

Deterministics chosen: constant

Pooled ADF test, N,T = (56,16) Augmented by 1 lags (average)

Obs = 784 Truncation: 7 lags

coefficient -0.87111

t-value -17.568

t-star -4.87203

P > t 0.0000

La hipótesis nula del test de Levin y Lin plantea la no existencia de raíces unitarias, en el primer caso la hipótesis nula no se rechaza mientras en el segundo se rechaza por lo tanto existiría evidencia de autocorrelación en la variable de precios. Además se comprueba si los términos de error no están auto correlacionados, mediante el contraste propuesto por Wooldridge. Antes de hacer la prueba debe instalarse al paquete st0039.pkg net install st0039 o alternativamente findit xtserial package installation -------------------------------------------------------------------------------------------------------package name: st0039.pkg from: http://www.stata-journal.com/software/sj3-2/

xtserial lpax lpop lpibc lturc hub modal time ver pr  El comando xtserial elabora la prueba de Wooldridge para la ecuación de demanda

Página

24

xtserial pr dist pax compet cap_barcelona cap_madrid ver  El comando xtserial elabora la prueba de Wooldridge para la ecuación de precios.

Jorge Salgado Sistema de Ecuaciones STATA

Tabla No. 20 Pruebas de errores correlacionados . xtserial lpax lpop lpibc lturc hub modal time ver pr Wooldridge test for autocorrelation in panel data H0: no first-order autocorrelation F( 1, 55) = 0.002 Prob > F = 0.9628

. xtserial pr dist pax compet cap_barcelona cap_madrid ver Wooldridge test for autocorrelation in panel data H0: no first-order autocorrelation F( 1, 55) = 6.239 Prob > F = 0.0155

La hipótesis nula del test de Wooldridge plantea la no existencia de autocorrelación de primer orden para la variable de pasajeros los resultados sugieren que no se rechaza la hipótesis nula mientas en el segundo caso para la variable de precios se rechaza la hipótesis nula, por lo tanto existiría autocorrelación, que debería ser considerada en la modelización del panel de datos. Se elabora el contraste de Hausman en relación a la condición E[Xit’αi] = 0. Con el comando para el caso de la demanda: xtreg lpax lpop lpibc lturc hub modal time ver pr,fe  El comando xtreg estima datos de panel o longitudinales, al final de la especificación se añade los efectos individuales incorporados en este caso fijos (Fixed Effects, FE).

est store fixed Guarda los resultados de los efectos fijos

xtreg lpax lpop lpibc lturc hub modal time ver pr,re El comando xtreg estima datos de panel o longitudinales, al final de la especificación se añade los efectos individuales incorporados en este caso aleatorios (Random Effects, RE).

Página

25

hausman fixed  Elabora la prueba de Hausman.

Jorge Salgado Sistema de Ecuaciones STATA

Tabla No. 20 Estimación de la ecuación de demanda por efectos fijos, aleatorios y test de Hausman . xtreg lpax lpop lpibc lturc hub modal time ver pr,fe note: hub omitted because of collinearity note: modal omitted because of collinearity Fixed-effects (within) regression Group variable: index

Number of obs Number of groups

= =

893 56

R-sq:

Obs per group: min = avg = max =

13 15.9 16

within = 0.3526 between = 0.0610 overall = 0.0024

corr(u_i, Xb)

F(6,831) Prob > F

= -0.2793

lpax

Coef.

lpop lpibc lturc hub modal time ver pr _cons

-.3330704 1.631179 -.1059834 0 0 .0064141 .1898421 -.0005012 .4184767

sigma_u sigma_e rho

1.2352909 .28291241 .95016172

F test that all u_i=0:

Std. Err. .3207328 .4075967 .0876775 (omitted) (omitted) .0199288 .0208268 .0001435 6.223458

t

= =

P>|t|

75.44 0.0000

[95% Conf. Interval]

-1.04 4.00 -1.21

0.299 0.000 0.227

-.962612 .8311392 -.2780788

.2964712 2.431219 .0661121

0.32 9.12 -3.49 0.07

0.748 0.000 0.001 0.946

-.0327026 .1489628 -.0007828 -11.79707

.0455308 .2307214 -.0002196 12.63402

(fraction of variance due to u_i) F(55, 831) =

147.57

Prob > F = 0.0000

. . . . est store fixed . . . . xtreg lpax lpop lpibc lturc hub modal time ver pr,re Random-effects GLS regression Group variable: index

Number of obs Number of groups

= =

893 56

R-sq:

Obs per group: min = avg = max =

13 15.9 16

within = 0.3456 between = 0.3120 overall = 0.3112

corr(u_i, X)

Wald chi2(8) Prob > chi2

= 0 (assumed)

lpax

Coef.

lpop lpibc lturc hub modal time ver pr _cons

.2968109 1.394162 .0994031 .7570021 -.4722376 .0033995 .1901518 -.0005373 -6.700523

Std. Err. .2511979 .3923389 .068599 .2769343 .2768291 .0189329 .0211056 .000145 5.210845

z

P>|z|

sigma_u sigma_e rho

.8604355 .28291241 .90243718

(fraction of variance due to u_i)

1.18 3.55 1.45 2.73 -1.71 0.18 9.01 -3.71 -1.29

0.237 0.000 0.147 0.006 0.088 0.858 0.000 0.000 0.198

= =

459.01 0.0000

[95% Conf. Interval] -.1955279 .6251915 -.0350486 .2142208 -1.014813 -.0337083 .1487856 -.0008215 -16.91359

.7891497 2.163132 .2338547 1.299783 .0703374 .0405074 .2315181 -.0002531 3.512547

. . . . hausman fixed Coefficients (b) (B) fixed . lpop lpibc lturc time ver pr

-.3330704 1.631179 -.1059834 .0064141 .1898421 -.0005012

.2968109 1.394162 .0994031 .0033995 .1901518 -.0005373

(b-B) Difference -.6298813 .2370177 -.2053864 .0030146 -.0003098 .0000361

sqrt(diag(V_b-V_B)) S.E. .199422 .1104773 .0546033 .006221 . .

b = consistent under Ho and Ha; obtained from xtreg B = inconsistent under Ha, efficient under Ho; obtained from xtreg Test:

Ho:

difference in coefficients not systematic chi2(6) = (b-B)'[(V_b-V_B)^(-1)](b-B) = 23.51 Prob>chi2 = 0.0006 (V_b-V_B is not positive definite)

Para el caso de los precios se elabora un ejercicio similar: xtreg pr dist pax compet cap_barcelona cap_madrid ver, fe  xtreg estima datos de panel o longitudinales, acompañado de fe, desarrolla una estimación de efectos fijos,

hausman fixed Elabora la prueba de Hausman. Jorge Salgado Sistema de Ecuaciones STATA

Página

xtreg pr dist pax compet cap_barcelona cap_madrid ver, re  Estimación por efectos aletorios.

26

est store fixed  Guarda los resultados de los efectos fijos

Tabla No. 21 Estimación de la ecuación de precios por efectos fijos, aleatorios y test te Hausman . xtreg pr dist pax compet cap_barcelona cap_madrid ver, fe note: dist omitted because of collinearity Fixed-effects (within) regression Group variable: index

Number of obs Number of groups

= =

896 56

R-sq:

Obs per group: min = avg = max =

16 16.0 16

within = 0.2095 between = 0.0282 overall = 0.1218

corr(u_i, Xb)

F(5,835) Prob > F

= -0.0740

pr

Coef.

dist pax compet cap_barcelona cap_madrid ver _cons

0 -.0000273 -36.20357 -21.74991 4.195499 56.26341 199.5156

sigma_u sigma_e rho

66.595802 67.820209 .49089168

F test that all u_i=0:

Std. Err. (omitted) .0000396 8.471779 6.579232 6.601476 4.835929 9.469172

t

P>|t|

-0.69 -4.27 -3.31 0.64 11.63 21.07

0.490 0.000 0.001 0.525 0.000 0.000

= =

44.26 0.0000

[95% Conf. Interval]

-.000105 -52.83206 -34.66368 -8.761938 46.77141 180.9295

.0000503 -19.57509 -8.836133 17.15293 65.75542 218.1018

(fraction of variance due to u_i) F(55, 835) =

15.09

Prob > F = 0.0000

. . est store fixed

. xtreg pr dist pax compet cap_barcelona cap_madrid ver, re Random-effects GLS regression Group variable: index

Number of obs Number of groups

= =

896 56

R-sq:

Obs per group: min = avg = max =

16 16.0 16

within = 0.2092 between = 0.7468 overall = 0.4497

corr(u_i, X)

Wald chi2(6) Prob > chi2

= 0 (assumed)

pr

Coef.

dist pax compet cap_barcelona cap_madrid ver _cons

.1143365 -.000022 -41.01625 -21.37205 4.702178 56.1245 127.1852

Std. Err. .009278 .0000141 7.307769 6.405578 6.515327 4.627047 8.794905

z

P>|z|

sigma_u sigma_e rho

29.823538 67.820209 .16204036

(fraction of variance due to u_i)

12.32 -1.56 -5.61 -3.34 0.72 12.13 14.46

0.000 0.119 0.000 0.001 0.470 0.000 0.000

= =

377.29 0.0000

[95% Conf. Interval] .096152 -.0000498 -55.33921 -33.92675 -8.067627 47.05566 109.9475

.1325209 5.70e-06 -26.69328 -8.817344 17.47198 65.19335 144.4229

. . . . hausman fixed Note: the rank of the differenced variance matrix (4) does not equal the number of coefficients being tested (5); be sure this is what you expect, or there may be problems computing the test. Examine the output of your estimators for anything unexpected and possibly consider scaling your variables so that the coefficients are on a similar scale. Coefficients (b) (B) fixed . pax compet cap_barcel~a cap_madrid ver

-.0000273 -36.20357 -21.74991 4.195499 56.26341

-.000022 -41.01625 -21.37205 4.702178 56.1245

(b-B) Difference -5.29e-06 4.812676 -.3778613 -.5066794 .1389144

sqrt(diag(V_b-V_B)) S.E. .0000369 4.285739 1.501617 1.063014 1.405934

b = consistent under Ho and Ha; obtained from xtreg B = inconsistent under Ha, efficient under Ho; obtained from xtreg Test:

Ho:

difference in coefficients not systematic

Jorge Salgado Sistema de Ecuaciones STATA

Página

El test de Hausman prueba la hipótesis nula que las coeficientes estimados por el estimador eficiente de efectos aleatorios son los mismos que los obtenidos por el estimador consistente

27

chi2(4) = (b-B)'[(V_b-V_B)^(-1)](b-B) = 1.28 Prob>chi2 = 0.8653

de efectos fijos. Si se obtiene un p-valor significativo habría evidencia que respaldaría la utilización de efectos fijos. Para la estimación de los parámetros de los regresores de la ecuación de demanda la prueba de Hausman sugiere la utilización de efectos fijos, mientas en el segundo caso, en la estimación de la ecuación de precios, podría estimarse por la incorporación de efectos individuales aleatorios en el término de error. De acuerdo a Green (1998), los efectos fijos son adecuados cuando hay certeza de que las diferencias entre las observaciones de corte transversal se pueden modelizar como un cambio en el parámetro de la función de regresión de un individuo a otro. Este contexto es común en el caso de los modelos que contemplan a todos los individuos de la población, o cuando el tamaño de la muestra es suficientemente extenso. Alternativamente puede suceder que los términos constantes específicos de cada unidad muestral, en lugar de fijos, vengan distribuidos aleatoriamente entre las unidades de corte transversal. Por ejemplo en una muestra de 500 individuos que pretenden representar a una población de un millón de agentes. Por otra parte, una restricción adicional para la utilización de efectos fijos radica en que los supuestos de partida del estimador eficiente son altamente restrictivos. Recordando los supuestos para los términos aleatorios = [ ] = 0, [ ] = , [ ] = , = , = 0 si ≠ o ≠ y finalmente , = 0 si ≠ . Por lo tanto, 0 para cado ≠ , el efecto individual no podrá estar correlacionado con ninguna de las otras variables explicativas. En este, caso la ecuación de precios cuya mejor estimación debería emplear a los efectos aleatorios, podría requerir la utilización de variables instrumentales de acuerdo a la propuesta de Hausman y Taylor(1981). Po lo tanto, inicialmente se plantea un modelo de efectos aleatorios considerado a todas las variables explicativas como exógenas. Posteriormente, se relajan los supuestos de la estimación básica y se considera la existencia de autocorrelación temporal y heterocedasticidad.

xtreg pr dist pax compet cap_barcelona cap_madrid ver, re  Estima la regresión con efectos aleatorios( random effects, re) con los supuestos básicos y más restrictivos. xtregar pr dist pax compet cap_barcelona cap_madrid ver, re lbi  Estima la regresión con efectos aleatorios( random effects, re) considerando autocorrelación (añadiendo ar al comando xtreg).

Página

28

xtgls pr dist pax compet cap_barcelona cap_madrid ver, panels(heteroskedastic) corr(ar1)  Estima la regresión con efectos aleatorios considerando heterocedasticidad y autocorrelación.

Jorge Salgado Sistema de Ecuaciones STATA

Tabla No. 21 Distintas estimaciones de efectos aleatorios para la ecuación de precios con explicativas exógenas. . xtreg pr dist pax compet cap_barcelona cap_madrid ver, re Random-effects GLS regression Group variable: index

Number of obs Number of groups

= =

896 56

R-sq:

Obs per group: min = avg = max =

16 16.0 16

within = 0.2092 between = 0.7468 overall = 0.4497

corr(u_i, X)

Wald chi2(6) Prob > chi2

= 0 (assumed)

pr

Coef.

Std. Err.

z

dist pax compet cap_barcelona cap_madrid ver _cons

.1143365 -.000022 -41.01625 -21.37205 4.702178 56.1245 127.1852

.009278 .0000141 7.307769 6.405578 6.515327 4.627047 8.794905

sigma_u sigma_e rho

29.823538 67.820209 .16204036

(fraction of variance due to u_i)

12.32 -1.56 -5.61 -3.34 0.72 12.13 14.46

P>|z| 0.000 0.119 0.000 0.001 0.470 0.000 0.000

= =

377.29 0.0000

[95% Conf. Interval] .096152 -.0000498 -55.33921 -33.92675 -8.067627 47.05566 109.9475

.1325209 5.70e-06 -26.69328 -8.817344 17.47198 65.19335 144.4229

. . . . xtregar pr dist pax compet cap_barcelona cap_madrid ver, re lbi RE GLS regression with AR(1) disturbances Group variable: index

Number of obs Number of groups

= =

896 56

R-sq:

Obs per group: min = avg = max =

16 16.0 16

within = 0.2092 between = 0.7465 overall = 0.4496

corr(u_i, Xb)

Wald chi2(7) Prob > chi2

= 0 (assumed)

pr

Coef.

dist pax compet cap_barcelona cap_madrid ver _cons

.1150628 -.0000206 -40.82922 -22.07281 5.497542 56.01292 126.398

rho_ar sigma_u sigma_e rho_fov theta

-.05941782 24.822024 68.261837 .11678449 .45428127

Std. Err. .0089942 .0000139 7.459282 6.728212 6.831119 4.441825 8.612567

z 12.79 -1.49 -5.47 -3.28 0.80 12.61 14.68

P>|z| 0.000 0.137 0.000 0.001 0.421 0.000 0.000

= =

396.67 0.0000

[95% Conf. Interval] .0974344 -.0000478 -55.44915 -35.25987 -7.891204 47.3071 109.5177

.1326912 6.57e-06 -26.2093 -8.885757 18.88629 64.71873 143.2784

(estimated autocorrelation coefficient)

(fraction of variance due to u_i)

modified Bhargava et al. Durbin-Watson = 2.1134949 Baltagi-Wu LBI = 2.2316188 . . . . xtgls pr dist pax compet cap_barcelona cap_madrid ver, panels(heteroskedastic) corr(ar1) Cross-sectional time-series FGLS regression

Estimated covariances = Estimated autocorrelations = Estimated coefficients =

pr

Coef.

dist pax compet cap_barcelona cap_madrid ver _cons

.1086578 -.000011 -39.99735 -27.16754 8.158505 41.54536 127.4984

56 1 7

Std. Err. .0059911 5.53e-06 5.31374 5.556928 5.635425 3.272664 5.693613

. .

Jorge Salgado Sistema de Ecuaciones STATA

(0.1406)

Number of obs Number of groups Time periods Wald chi2(6) Prob > chi2

z 18.14 -2.00 -7.53 -4.89 1.45 12.69 22.39

P>|z| 0.000 0.046 0.000 0.000 0.148 0.000 0.000

= = = = =

896 56 16 646.95 0.0000

[95% Conf. Interval] .0969154 -.0000219 -50.41209 -38.05892 -2.886725 35.13105 116.3391

.1204002 -2.04e-07 -29.58261 -16.27616 19.20373 47.95966 138.6577

29

generalized least squares heteroskedastic common AR(1) coefficient for all panels

Página

Coefficients: Panels: Correlation:

Ahora se supone un modelo de efectos aleatorios (αi es un término de error aleatorio) con variables explicativas endógenas en la ecuación de precios: xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid ver, re  Se instrumentaliza a las variables pax compet que potencialmente están correlacionadas con el término de error. Los instrumentos son: pop pibc turc hub modal hha.

Tabla No. 21 Distintas estimaciones de efectos aleatorios para la ecuación de precios con variables explicativas endógenas . xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid ver, re G2SLS random-effects IV regression Group variable: index

Number of obs Number of groups

= =

893 56

R-sq:

Obs per group: min = avg = max =

13 15.9 16

within = 0.1973 between = 0.7412 overall = 0.4402

corr(u_i, X)

Wald chi2(6) Prob > chi2

= 0 (assumed)

pr

Coef.

pax compet dist cap_barcelona cap_madrid ver _cons

-4.05e-06 -73.09293 .1210661 -18.15336 8.225267 56.02831 134.074

.0000295 18.5542 .0094564 6.647768 6.847352 4.777263 9.070743

sigma_u sigma_e rho

29.740445 73.627506 .14027334

(fraction of variance due to u_i)

Instrumented: Instruments:

Std. Err.

z -0.14 -3.94 12.80 -2.73 1.20 11.73 14.78

P>|z| 0.891 0.000 0.000 0.006 0.230 0.000 0.000

= =

373.91 0.0000

[95% Conf. Interval] -.0000619 -109.4585 .102532 -31.18274 -5.195296 46.66505 116.2956

.0000538 -36.72736 .1396003 -5.123971 21.64583 65.39157 151.8523

pax compet dist cap_barcelona cap_madrid ver pop pibc turc hub modal hha

Ahora se pueden corregir los problemas de autocorrelación, incorporando el retardo de la endógena como variable explicativa, con el comando: by index: gen lag1 = pr[_n-1] by index: gen lag2 = pr[_n-2]

Página

30

xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid ver lag2, re

Jorge Salgado Sistema de Ecuaciones STATA

Tabla No. 21 Estimación de la ecuación de precios con efectos aleatorios variables instrumentales y correcciones de autocorrelación. . by index: gen lag1 = pr[_n-1] lag1 already defined r(110); . . by index: gen lag2 = pr[_n-2] lag2 already defined r(110); . . . . xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid ver lag2, re G2SLS random-effects IV regression Group variable: index

Number of obs Number of groups

= =

781 56

R-sq:

Obs per group: min = avg = max =

11 13.9 14

within = 0.2005 between = 0.8423 overall = 0.4792

corr(u_i, X)

pr

Coef.

pax compet dist cap_barcelona cap_madrid ver lag2 _cons

-.0000214 -37.95219 .0811723 -18.58112 11.01696 40.77706 .2863245 95.57695

sigma_u sigma_e rho

0 99.33363 0

Instrumented: Instruments:

Wald chi2(7) Prob > chi2

= 0 (assumed)

Std. Err. .000019 14.90916 .0079511 7.380812 7.090676 5.73865 .038641 8.737974

z -1.13 -2.55 10.21 -2.52 1.55 7.11 7.41 10.94

P>|z| 0.260 0.011 0.000 0.012 0.120 0.000 0.000 0.000

= =

692.89 0.0000

[95% Conf. Interval] -.0000588 -67.1736 .0655883 -33.04724 -2.880514 29.52951 .2105896 78.45084

.0000159 -8.730774 .0967562 -4.114991 24.91442 52.02461 .3620594 112.7031

(fraction of variance due to u_i)

pax compet dist cap_barcelona cap_madrid ver lag2 pop pibc turc hub modal hha

Página

31

De acuerdo a las pruebas de Levin y Lin, Wooldridge y Hausman. Para la ecuación de demanda es conveniente una modelización por efectos fijos. Además, se recuerda que la muestra contiene un amplio número de cortes, las 56 rutas aéreas al interior de España, por lo que una estimación por efectos fijos podría ser adecuada. En el caso de la ecuación de precios con efectos aleatorios variables instrumentales y correcciones de autocorrelación, cuyos resultados se presentan en la Tabla No. 21, podría resultar la mejor estimación. En consideración de los resultados de las pruebas de autocorrelación, heterocedasticidad y de Hausman, las cuales sugirieron la existencia de autocorrelación, endogenidad y consideraron a los efectos aleatorios preferibles ante efectos individuales fijos. Asimismo, los estadísticos de bondad del ajuste y minimización de los errores se comportan mejor en este último modelo frente a los anteriores. Cabe considerar además la naturaleza de los cortes y las series de la ecuación de precios que se fundamente ampliamente en promedios de la población total de viajes al interior de España.

Jorge Salgado Sistema de Ecuaciones STATA

Bibliografía: Baum, C. (2006), An Introduction to Modern Econometrics Using Stata, Stata Press. Baum, C., Schaffer, M., Stillman, S. (2007), Enhanced routines for instrumental variables/generalized method of moments estimation and testing, The Stata Journal, 7, Number 4, pp. 465–506. Cameron, C. y Trivedi, P. (2005), Microeconometrics Methods and Applications, Cambridge University Press. Cameron C., Trivedi P. (2009), Microeconometrics Using Stata, A Stata Press Publication

Página

32

Greene W. (2003), Econometric Analysis, Prentice Hal.

Jorge Salgado Sistema de Ecuaciones STATA

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF