Econometria_1

May 21, 2018 | Author: ChileMotores Rodolfo Martinez Ariztia | Category: Econometrics, Regression Analysis, Linear Regression, Coefficient Of Determination, Statistics
Share Embed Donate


Short Description

Download Econometria_1...

Description

INTRODUCCION A LA ECONOMETRIA 1.1 ¿Que ¿Que es es la Econom Econometr etría? ía?

Antes de comenzar a estudiar la econometría como área de estudio es preciso comprender que es lo que se entiende por econometría y los inicios de la misma. En pocas palabras, la econometría consiste en la aplicación estadística matemática a la información económica para dar soporte empírico a los modelos construidos por la economía y de ese modo obtener resultados significativos. Por tanto, es plausible señalar que la econometría nos sirve s irve para: (a)Pro (a)Probar bar teor teoría ías s econ económ ómic icas, as, vale vale deci decir, r, se busc busca a exam examin inar ar las las relaci relacione ones s que existe existen n entre entre distin distintas tas variab variables les explic explicati ativas vas y vari variab able les s expl explic icad adas as.. Verb Verbig igra raci cia, a, un fenó fenóme meno no econ económ ómic ico o relevante generará teorías para explicar sus causas.

(b)P (b)Pro rono nost stic icar ar la econ econom omía ía,, los los econo conome metr tris ista tas s al iden identi tifi fica carr rela relaci cion ones es entr entre e varia variabl bles es en el tiem tiempo po,, pued pueden en pred predec ecir ir con con diversos grados de exactitud los valores probables de éstas.

(c)Diseñar políticas, se recomienda mediante estudios las políticas exactas para obtener resultados deseables en la economía.

Ahora bien, es muy frecuente vincular la econometría con la economía como una relación relación unívoca y simbiótic simbiótica a porque porque la economía abastece abastece y otorga a la econometría material para investigar, y la segunda devuelve investigaciones y proyecciones que son empleadas por la economía, lo que no quiere decir, que se necesitan mutuamente para existir, pero sí  está están n alta altame ment nte e corr correl elac acio iona nadas das.. De hech hecho, o, es posi posibl ble e enco encont ntra rarr conc concep epto tos s como omo micr microe oeco cono nom metrí etría a y macro acroec econ onom omet etrí ría a como omo subgrupos dentro de la econometría, siendo la primera la encargada o enfoca enfocada da en cuesti cuestione ones s propia propias s de la micro microeco econom nomía ía (i.e., (i.e., ponien poniendo do

énfa énfasi sis s en las las rela relaci cion ones es de ingr ingres esos os y gast gastos os,, la func funció ión n de Cobb Cobb-Douglas, ahorro y gasto, etc.) y la segunda en cuestiones propias de la macroe macroecon conomí omía a vista vista desde desde la econom econometr etría ía aplica aplicada da (i.e., (i.e., utiliz utilizando ando modelos de series temporales, analizando regresiones espurias, series estacionarias, etc.).

Sin embargo, tanto las categorías de aplicaciones mencionadas, como las vinculaciones efectuadas con la economía no son excluyentes ya que la econ econom omet etrí ría a se pue puede util utiliizar zar para para real realiizar estud studio ios s que que no necesariamente sean económicos. De este modo, es posible encontrar estudios sobre la delincuencia, la salud, el comportamiento sexual, deportes, los negocios, las finanzas, ventas, etc.1 En definitiva, la econometría no es una herramienta con la que que sólo sólo teng tengam amos os que que trab trabaj ajar ar con con índi índice ces s econ económ ómic icos os y seri series es temporales, sino que es una herramienta que nos sirve para analizar distintos ámbitos que posteriormente se pueden utilizar no sólo para form formar ar pol política ticas s públ públiicas cas por por un gobi gobie erno, rno, tam tambié bién es dabl dable e la evaluación de las políticas públicas con distintas ecuaciones para dichos fines. Asimismo, es posible realizar estimaciones de ventas para algún negocio, proyectar las mismas ventas, explicar algunas relaciones que satis satisfa faga gan n al empr empres esari ario o para para inno innovar var en la prod produc ucci ción ón del del algú algún n producto, etc. Por lo tanto, la utilización de la econometría tanto en el sector público como en el sector privado (si se desea analizar desde diferentes esferas por las regulaciones que puedan existir), por un lado, se transforma en un bagaje de alternativas para mejorar los índices de gobernabilidad y por el otro, otorga una ventaja para los negocios y aument aumentar ar las ventas ventas.. Por ejempl ejemplo, o, para crear polític políticas as adecuadas adecuadas el gobi gobier erno no prec precis isa a cono conoce cerr la infl influe uenc ncia ia de cier cierta tas s vari variab able les s en la conducta de los ciudadanos. En el caso de la delincuencia es posible formular políticas que busquen disminuir los índices de delincuencia si se encuentra que estos aumentan (o disminuyen) por variables como la educ educac ació ión, n, el dese desemp mple leo o u otras otras vari variabl ables es que que no son son únic únicam amen ente te económicas. Luego, con la misma herramienta dentro de su gama de opciones se podrá evaluar el impacto de las políticas públicas que se hayan hayan impl implem emen enta tado do (en (en este este caso caso en el área área de la deli delinc ncue uenc ncia ia). ). Análogamente, si se desea utilizar en el ámbito de los negocios, se 1

Si el alumno alumno se intere interesa sa por las diversas diversas áreas de invest investiga igació ción, n, podrá podrá encont encontrar rar en la bibliografía complementaria una serie de documentos de investigación sobre diversos temas.

podría establecer una relación entre el salario de los ejecutivos de una empresa y las ventas junto con el rendimiento de las acciones de la empresa. Especificación que podría generar una nueva estrategia en ventas, si los ejecutivos lo encontraran pertinente. Y al igual que en el caso caso de la delinc delincuen uencia cia,, los ejecut ejecutivo ivos s podría podrían n establ establece ecerr un nuevo nuevo mode modelo lo para para anal analiz izar ar el impa impact cto o de la estr estrat ateg egia ia que que se hubi hubies ese e formulado, o se podrían encontrar errores en las regresiones. En suma suma,, un punt punto o rele releva vant nte e para para trab trabaj ajar ar con con la econ econom omet etrí ría a es desprenderse del paradigma sobre el área ocupación de la misma, es decir, decir, dejar de pensar en la relación de la econometr econometría ía con la economía economía como una relación absoluta. Si bien las distintas áreas de estudios que fuer fueron on menc mencio iona nada das, s, son son cono conoci cida das s como como econ econom omía ía del del crim crimen en,, economía del deporte o economía de la salud, sus nombres solamente expresan una analogía con los supuestos básicos de la economía en relaci relación ón al compor comportam tamien iento to del hombre hombre,, es decir, decir, el supues supuesto to de la racio raciona nali lida dad d del del homb hombre re que que busc busca a siem siempr pre e más más a meno menos, s, pero pero no implica otra cosa. De esa manera, el investigador cuenta con un abanico de oportunidades para proyectos, ya que lo que busca la econometría en esencia es la utilización de modelos empíricos para rechazar (o aceptar) una hipótesis teórica, pensando evidentemente en que la dificultad está en la construcción del modelo como también en la recolección de datos suficientes para realizar una regresión. Por último, es menester señala que la econometría se ha transformado en un poderoso aliado, pero no implica ser una disciplina mesiánica que sirva para explicar y comprender todas las relaciones que intentemos realizar; además como se verá, la econometría no se supone como un determinismo, de ahí la importancia de la estadística. 1.2 Metodología de la Econometría Econometría

Para ara ilustrar los pasos que se sig siguen al elabo aborar un modelo econométrico que tenga consecuencias prácticas, utilizaremos los casos de la economía de la delincuencia y economía de las finanzas como ejemplos guías: 1.- Planteamiento de la teoría o hipótesis: Se esboza una teoría que impli implique que la utiliz utilizaci ación ón de variab variables les que busque busquen n encont encontrar rar una explic explicaci ación ón hacia hacia algún algún fenóme fenómeno no o compor comportam tamien iento to partic particula ularr del individuo. Por ejemplo, según Becker (1969) las personas se transforman

en potenciales delincuentes al analizar el costo-beneficio de su contexto, tomando por consideración en el vector de beneficios los ingresos que recibiría por concepto de hurto (o robo), el placer (adrenalina o factores incuantificables), prestigio, y el tiempo (analizado desde el punto de vist vista a del del cost costo o de opo oportun rtuniidad, dad, es deci decir, r, cuant uanto o dej dejo de ganar anar trabaja trabajando ndo legal legalme mente nte si comien comienzo zo a delinq delinquir uir). ). Mient Mientras ras que en el vector o grupo de costos, el sujeto tiene como variables el número de policías en las calles, la probabilidad de ser detenido, la cantidad de años en la cárcel en caso de ser detenido, y variables sicológicas como la conciencia, moral o ser denostado por sus pares2. Sin duda duda que que es posible añadir un mayor número de variables o factores que puedan afec afectar tar la deci decisi sión ón para para deli delinq nqui uirr en la teor teoría ía pres presen enta tada da,, pero pero se considera innecesario indicar más. Un punto que se debe debatir en rela relaci ción ón a la teor teoría ía plan plante tead ada a es que que los los deli delinc ncue uent ntes es (a priori priori)) no realizan cálculos de costo-beneficio cuando deciden delinquir, sino que los los real realiz izan an al esta estarr infl influe uenc ncia iado dos s por por una una seri serie e de fact factor ores es soci sociooeco económ nómicos icos y soci socioo-de dem mográ ográfi fico cos. s. Por lo tant tanto, o, una una vez vez que que el investigador haya delineado distintas tesis y antítesis y con ellas haya logr lograd ado o compl omple ement mentar ar algu alguna nas s teorí eorías as,, pode podem mos deci decirr que que el invest investiga igador dor está está en posició posición n de especi especific ficar ar un modelo modelo que busque busque respa respald ldar ar su teor teoría ía.. Del Del mism mismo o modo modo si pens pensam amos os en algu alguna na otra otra relación, podemos llegar a similares conclusiones, es decir, podemos postular en el área de negocios que las ventas están en función de la publicidad que se haga del producto en el mercado como también de los ingr ingres esos os per per cápi cápita ta de sus sus cons consum umid idor ores es (lue (luego go de un estu estudi dio o de mercado), podemos pensar en que las ventas pueden estar influenciadas de manera autorregresiva, o sea, por su valor rezagado, o por valores rezagados de variables cuantitativas. También es posible pen pensar sar en añad añadiir vari variab able les s dum dummy o cual cualiitati tativa vas s que que indi ndiquen quen categorías según el mes del año o el trimestre. Sin embargo, tal como en la delincuencia hay factores que no podemos determinar o que no se están vinculando de manera 2.- Especificación del modelo matemático:

  Y = β1 + β2X donde: 2

Para mayor interés sobre la economía de la delincuencia, se sugiere revisar la bibliografía complementaria.

  Y = Variable dependiente, explicada, endógena X = Variable independiente, explicativa, exógena β1 = Intersección o Intercepto β2 =Pendiente

Esta relación puede escribirse como una función: y = f (X1, X2) En el caso de la delincuencia, es decir, en la economía de la delincuencia, podríamos expresar la siguiente función: y = f (X1, X2, X3, X4, X5, X6) ó si se desea, de una forma más precisa ID = f (MJH, Det, Des, DI, NP, Esc) La función muestra una relación entre ID = índice de la delincuencia (tasa de delincuencia) con MJH = tasa mujeres jefas de hogar; Det = detenciones; Des = tasa de desempleo; DI = distribución del ingreso; NP = número de policías (contingente) y Esc = tasa de escolaridad. Mientras que en el ejemplo de negocios podríamos expresarlo como sigue: y = f (X1, X2, X3, X4) o también como: Ve = f (INPC, Pub, Ver, Pre) Dond Donde e la func funció ión n mues muestr tra a una una rela relaci ción ón entr entre e Ve = Vent Ventas as (de (de un empresa) con INPC = Ingreso per cápita de los consumidores; Pub = publicidad; ver = ventas rezagadas; Pre = precios de los productos. ¿Es posible explicar de una forma determinista el índice de delincuencia o las las vent ventas as de un empre mpresa sa? ? O dich dicho o de otra otra mane manera ra ¿se ¿se pued pueden en expl explic icar ar en func funció ión n de esas esas vari variab able les s expl explic icat ativ ivas as las vari variab able les s

regres regresadas adas exhaus exhaustiv tivame amente nte? ? Se puede puede pensar pensar que existe existen n muchas muchas variables que no son medibles y que son del orden socio-mental y que pueden guardar relación con las ventas o con la delincuencia, por ello es que se especifica un modelo econométrico. 3.- Es 3.Espe pecif cifica icació ción n de dell mo mode delo lo ec econ onom omét étri rico co:: la especific especificación ación matemática es de interés limitado para el econometrista, porque como se habrá leído, se supone que existe una relación relación exacta o determinista entre las variables endógena y exógena. Sin embargo, las relaciones entre las variables son inexactas. Para dar cabida a relaciones inexactas entre variables, el econometrista modificará la función matemática o determinística y escribirá el modelo de la siguiente manera:

  Y = β1 + β2X +µ

(1.1

En el caso de (1.1), se puede apreciar µ, que es conocido como el térm términ ino o de pert pertur urbac bació ión n o de erro error. r. Dich Dicho o térm términ ino o es una una vari variabl able e aleatoria o estocástica (i.e., que se pueden cometer errores) que tiene propiedades probabilísticas definidas. Para la comprensión del alumno, se entenderá µ como un término que puede representar todos aquellos factores que afectan a alguna variable endó endóge gena, na, pero pero que que no son son consi conside dera rada das s en el mode modelo lo de mane manera ra explícita. Considerando nuestra relación matemática en relación al índice de delincuencia, ahora podemos expresarlo del siguiente modo:

 Yrt = β1 + β2X2rt + β3δ3rt + β4ώ4rt + µrt

(1.2

Sean:  Y: La tasa de denuncias por robo (o índice de delincuencia) X: Un vector de variables sociodemográficas (e.g., mujeres jefas de hogar) δ: Un vector de variables socioeconómicas (e.g., tasa desempleo, distribución ingreso) ώ: Variable relacionado con los costos de delinquir (e.g., cantidad de policías,) Lo que se puede apreciar en (1.2) es que se ha agregado el término de perturbación estocástico puesto que como se mencionó anteriormente existen variables que pueden afectar el comportamiento delictivo de una

persona y que no son medibles (variables de orden sicológica), o bien no se pueden recopilar por dificultad o simplemente no se ha pensado que puede tener alguna vinculación. Asimismo, para reunir las variables que se deseen utilizar el modelo expresa una simplificación al emplearse vect vector ores es que que incl incluy uyen en toda todas s las las vari variab able les s que que comp compar arte ten n cier cierta tas s caract caracterí erísti sticas. cas. El alumno alumno debe debe aprecia apreciarr que no se están están utili utilizan zando do variables dummy o cualitativas y que podrían ser agregadas (e.g., se podría agregar el estado civil, religión, etc.). Por último, como se verá más adelante, en cuanto a las variables explicativas: cantidad no implica cali alidad, dad, vale ale deci decir, r, no por por agre agrega garr más vari variab ablles a un mode odelo econométrico éste será más preciso o más apreciado. En relación al caso de las ventas la especificación econométrica es similar. 4.- Obte Obtenci nción ón de inf inform ormació ación: n: Es evid eviden ente te que que para para esti estima marr el mode modelo lo econ econom omét étri rico co nece necesi sita tamo mos s obte obtene nerr datos datos.. Esta Esta etap etapa a que que algunas veces es despreciada porque se considera y se supone que la reco recole lecc cció ión n de info inform rmac ació ión n es fáci fácill y segu segura ra,, es una una parte parte medu medula larr dentro de la elaboración del modelo. ¿Qué pasa si no puedo encontrar los datos de alguna variable que se consideró importante para explicar algún fenómeno? En el tema de la delincuencia, verbigracia en Chile no existen datos acerca de la tasa (o índice) de delincuencia, por lo que se utiliza frecuentemente en investigaciones la tasa de denuncias (que es un dato ato negr negro) o).. Por consi onsigu guiient ente, a menudo nudo este ste paso aso pued puede e tran transf sfor orma mars rse e en una una limi limita tant nte e para para el mode modelo lo y tamb tambié ién n en algo algo engorroso por el tiempo que se necesita para recopilar información. 5.- Estimación del modelo econométrico: una vez se han recopilado los datos, se calculan y encuentran los estimadores o parámetros. En el caso caso estudi estudiado ado,, sería sería el esti estimar mar β1 y β2 de la ecuación (1.1) . Así, conociendo los parámetros es posible conocer cuánto influye la variación de X sobre Y. Por ejemplo, si formulamo amos una relaci ación sob sobre delincuencia:

 Yi = β1 + β2Esc + β3Det + β4MJH + µi  Y lo que se estima es:

 Yi = β1 + -1.84Esc + β30.020 + β467.91 + µi

(1.3

La estim estimaci ación ón (1.3) (1.3) nos permi permite te reali realizar zar alguna algunas s afirma afirmacio ciones nes sobre sobre como algunas variables X escogidas afectan el comportamiento de Y.

6.- Prueba de hipótesis: suponiendo que el modelo ajustado es una aproxi aproximac mación ión razonab razonable le de la realida realidad, d, se desarro desarrolla llan n criter criterios ios para encontrar si los valores estimados obtenidos en la ecuación concuerdan con las expectativas de la teoría. Tal confirmación o refutación de las teorías económicas con base en evidencia muestral está basada en lo cono conoci cido do como como infe infere renc ncia ia esta estadí díst stic ica a o prue prueba ba de hipó hipóte tesi sis. s. Pu Punt nto o crucia cruciall ya que se analiza analiza si las variabl variables es y el modelo modelo const construi ruido do es significante o no. 7.- Proyección: Si el modelo confirma la hipótesis o la teoría, se puede util utiliz izar ar para para pred predec ecir ir o proy proyec ecta tarr el valo valorr futu futuro ro de la vari variab able le en cues cuesti tión ón.. Es de gran gran inte interé rés s para para algu alguno nos s cent centro ros s de inve invest stig igaci ación ón pronosticar algún fenómeno en particular, por lo que etapa nos permite pronosticar o bien la media o un valor individual. 8.- Fines del modelo: Uso del modelo con fines políticos, es decir, fines de control para poder realizar políticas públicas por un gobierno o la elección de políticas económicas. Si nuestro modelo es significante y podemos generar proyecciones, es plausible entonces utilizarlo con fines de elaboración de política pública3. Ahora bien, es posible resumir esta metodología de 8 pasos en sólo 4, a saber:

A) Espe Especi cifi fica carr B) Esti Estima maci ción ón C) Infe Infere renc ncia ia D) Proyec Proyecció ción n

1.3 Referencias

Bibliografía utilizada

3

Esta Esta meto metodo dolo logí gía a no repr repres esen enta ta un modo modo ni tamp tampoc oco o es una una guía guía para para real realiz izar ar una una investigación académica, simplemente menciona los pasos básicos a seguir para “correr” un modelo y evaluar su impacto.

1. Gujarati, Gujarati, Damodar. Damodar. (2004) (2004) “Econometría “Econometría”, ”, Editorial Editorial McGraw-Hill, McGraw-Hill, México México D.F. 2. Schmidt, Schmidt, Stephen. (2005) (2005) “Econometr “Econometría”, ía”, Editorial Editorial McGraw-Hil McGraw-Hill, l, México D.F. D.F. 3. Salv Salvat ator ore, e, D. y Reag Reagle le,, D. (200 (2004) 4) “Est “Estad adís ísti tica ca y econ econom omet etrí ría” a”,, Edit Editor oria iall McGraw-Hill, Madrid.

4. Wool Wooldr drid idge, ge, Jeff Jeffre rey. y. (200 (2005) 5) “Int “Intro roduc ducci ción ón a la Econ Econom omet etrí ría” a”,, Edito Editori rial al  Thompson, Madrid.

Bibliografía complementaria Economía del Crimen 1. Beck Becker er,, Gary Gary.. (196 (1968) 8),, “Cri “Crime me and and Pu Puni nishm shmen ent: t: An Econ Econom omic ic Appro Approac ach”, h”,   Jou Journ rnal al of Poli Politi tica call Econ Econom omy, y, Vol. Vol. 76, 76, 169169-21 217. 7. http://www.ww.unimagdeburg.de/bizecon/material/becker.1968.pdf  2. Beyer, H. H. y Vergara, Vergara, R. (2006) (2006) “Delincuenc “Delincuencia ia en Chile: Chile: Determinantes Determinantes y rol rol de las Políticas Políticas Públicas”. Públicas”. Concurso de Políticas Políticas Públicas Públicas de la Dirección Dirección de Asuntos Públicos de la Pontificia Universidad Católica de Chile. Agosto 2006. http://www.subdere.gov.cl/1510/articles-69857_recurso_1.pdf  3. Núñez, Núñez, J., J. Rivera Rivera,, O. Molina, Molina, y X. Villavic Villavicenc encio io (2003). (2003). “Determi “Determinan nantes tes Socioeconómicos y Demográficos del Crimen en Chile. Evidencia desde un Panel de Datos de las Regiones Regiones de Chile.”Estud Chile.”Estudios ios de Economía Economía 30: 55-85. 55-85. http://www.econ.uchile.cl/public/Archivos/pub/001898cb-526c-41c7-a3591844809fa80c.pdf  4. Levitt, Levitt, Stephen. Stephen. (2004), (2004), “Understan “Understanding ding Why Crime Crime Fell in the the 1990s: 1990s: Four Factors That Explain the Decline and Six That Do Not.” Journal of Economic Perspectives, Vol. 18 N. 1, pp. 163-90. http://pricetheory.uchicago.edu/levitt/Papers/LevittUnderstandingWhyCrime 2004.pdf 

Economía del Deporte 1. Szymanski, Szymanski, Stefan. Stefan. (2006) (2006) “Competit “Competitive ive Balance Balance in Sports Leagues Leagues and the Paradox of Power”. International Association of sports Economists. Working paper Series. Vol. nº 18.

http://www.holycross.edu/departments/economics/RePEc/spe/Szymanski_Pa radox.pdf  2. Garc Garcia ia,, P. y Szym Szyman ansk ski, i, S. (200 (2006) 6) “G “Goa oal! l! Prof Profit it maxi maximi miza zati tion on and and Win Win Maximi Maximizat zation ion in Footba Football ll leagues leagues”. ”. Interna Internatio tional nal Associat Association ion of Sports Sports Economists. Working paper Series. Vol. nº 26. http://www.holycross.edu/departments/economics/RePEc/spe/GarciaSzyman ski_Goal.pdf 

3. Szymanski, Szymanski, Stefan. Stefan. (2006) (2006) “On the Edge Edge of Your Seat: Seat: Demand for for Football Football on Televisión Televisión and the Urcertainty Urcertainty of Outcome Outcome Hypothesis”. Hypothesis”. International International Asso Associ ciat atio ion n of Sport Sports s Econ Econom omis ists ts.. Worki Working ng Paper Paper Seri Series es.. Vol. Vol. nº 31. 31. http://www.holycross.edu/departments/economics/RePEc/spe/Szymanskietal_Initiative.pdf 

4. Andr Andref eff, f, Wlad Wladim imir ir.. (200 (2006) 6) “New “New Pers Perspe pect ctiv ives es in Spor Sports ts Econ Econom omic ics: s: A European View”. International Association of sports Economists. Working paper Series. Vol. nº 05. http://www.holycross.edu/departments/economics/RePEc/spe/Andreff_NewP erspectives.pdf 

Economía de la Salud 1. Powe Powell ll,, Lisa Lisa.. (200 (2009) 9) “Fas “Fastt Food Food Cost Costs s and and Adole Adolesc scen entt Body Body Mass Mass Index Index:: Evidence Evidence from Panel Data”. Data”. Journal Journal of Health Economics. Economics. Vol. Vol. 28 N. 5, pp. 963-970. (restringido) 2. Chen Chen,, Y. y Li, Li, H (200 (2009) 9) “Mothe “Mother’ r’s s Educa Educati tion on and and Chil Child d Heal Health th:: Is there there a Nurturing Nurturing Effect?”. Effect?”. Journal of Health Health Economics. Economics. Vol. 28 N. 2, pp. 413-426. 413-426. (restringido)

3. Mosc Moscon one, e, F., F., Knapp, Knapp, M, O. Tose Tosett tti. i. (200 (2007) 7) “M “Men enta tall Healt Health h Expe Expedi ditur ture e in England: England: A Spatial Spatial Panel Panel Approach”. Approach”. Journal Journal of Health Health Economics. Economics. Vol. Vol. 26 N. 4, pp. 842-864. (restringido)

4. Chicaíza, Chicaíza, L, García, García, M, J. Lozano. Lozano. (2008) (2008) ”Bringing ”Bringing institutions institutions into into the health Eco Economi nomic cs”. s”. Un Univ iver ersi sida dad d Naciona ionall de Colo Colom mbia bia. Doc Documen umento tos s FCE. FCE. http://www.fce.unal.edu.co/publicaciones/media/docs/DocChicaiza %20_EACP1.pdf 

Economía de las Finanzas 1. Qi, Y., Roth, Roth, L, J. Wald. Wald. (2010) (2010) “Politic “Political al Rights and and the Cost of of Debt”. Journal Journal of Financial Economics. Vol. 95 N. 2, pp. p p. 202-226. (restringido) 2. Hale, G. y Santos, Santos, J. (2009) (2009) “Do Banks Price Price Their Informat Informational ional Monopoly Monopoly?”. ?”.  Journal of Financial Economics. Vol. 93 N. 2, pp. 185-206. (restringido)

“Para poder descargar documentos de investigación (como los restringidos) en revistas electrónicas, deberá contactarse con su Secretaría de Estudios para ”

2.-

ANA NAL LISIS DE DE RE REGRE RES SION

2.1 Introducción

El anál anális isis is de regr regres esió ión n trata trata del del estu estudi dio o de la depe depend nden enci cia a de la variable dependiente, respecto a una o más variables ( las llamadas variabl variables es explic explicati ativas vas o exógen exógenas) as),, con el propós propósito ito de estima estimarr y/o predecir la media o valor poblacional de la variable dependiente, Y. •

Relaciones Estadísticas v/s Relaciones determinísticas: En el análisis de regr regres esió ión n nos nos inte intere resa sa lo que que se cono conoce ce como como depe depend nden enci cia a esta estadí díst stic ica a entr entre e las las vari variab able les, s, pero pero no la rela relaci ción ón func funcio iona nall o determinística propia de la física.

En las relaciones estadísticas entre variables tratamos esencialmente con variables aleatorias o estocásticas, o sea, variables que tienen distribuciones de probabilidad.

Por ejemplo, consideremos la dependencia del ejemplo que hemos señalado anteriormente en el capítulo anterior, a saber, el índice de denuncias (en relación a la delincuencia obviamente). Analizando la dependencia del índice de denuncias respecto de variables como el ingres ingreso, o, mujere mujeres s jefas jefas de hogar, hogar, desempl desempleo, eo, educaci educación, ón, miedo miedo o vari variab able les s prox proxy y o no cuant cuantif ific icab able les; s; es posibl posible e dist distin ingu guir ir una una

dependencia de naturaleza estocástica. ¿Por qué? Debido a que las variables variables explicativas explicativas no nos permiten predecir predecir de manera manera exacta exacta el índice de denuncias dada la existencia existencia de los errores involucrados en la medición de estas variables y en rezón de otra serie de factores (otras variables no consideradas o no incluidas en el modelo) que afectan colectivamente el índice de denuncias de delincuencia, pero que dada su naturaleza son difíciles de identificar individualmente.





Regresión v/s causalidad: una relación estadística sin importar que tan fuerte fuerte y sugest sugestiva iva sea, sea, nunca nunca podrá podrá establ establece ecerr una conexi conexión ón causal, esto es, una relación de causa-efecto. Para mayor claridad, una relación estadística no puede por si misma implicar en forma lógica una causalidad.

Regresión v/s correlación: es frecuente cometer un error con estos conc concep epto tos s pues puesto to que que gene general ralme ment nte e se pien piensa sa que que desc descri ribe ben n lo mismo, sin embargo, son conceptos muy distintos. El análisis de correlación tiene como objetivo medir la fuerza o grado de asociación entre variables (2 variables). Por ejemplo, se puede hablar de correlación entre el hábito de fumar y el cáncer al pulmón, las altas calificaciones en el colegio y las altas calificaciones en la universidad. En cambio, en la regresión se trata de estimar o predecir el valor promedio de una variable sobre la base de valores fijos de otras otras variables variables.. Como Como se podrá observar observar,, la diferenc diferencia ia sustancia sustanciall entre ambos conceptos radica en la simetría de las variables, ya que en la correl correlaci ación ón las variabl variables es son simétr simétrica icas, s, vale vale decir, decir, no hay dife difere renc ncia ias s entr entre e expl explic icat ativ iva a y expl explic icad ada. a. Por Por otro otro lado lado,, en la regresión las variables son asimétricas, la variable endógena Y es aleatoria y la variable explicativa X tiene valores fijos.



Avanza Avanzando ndo paulati paulatinam nament ente e en el estudi estudio o de la econom econometr etría, ía, el lector se podrá encontrar con distintos tipos de datos sobre los que que se trab trabaj aja a y con con los los que que se form formul ulan an dive divers rsos os mode modelo los s econométricos. Así, es posible mencionar 3 tipos de datos:

a) Datos de corte transversal, se denotan con el subíndice i (e.g.,

Xi ).

Tabla 2.1 Estudi tudian ante te

1 2 3 4 5 6 7 8 9 10 11 12

Calif lificac icaciió n 100 70 65 40 90 20 85 72 48 67 59 35

Horas de estudio 16 15 16 10 13 8 14 13 9 12 10 8

b) Datos de serie de tiempo, se escriben con el subíndice t  (e.g.,

Xt ).

Tabla 2.2 Año

1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992

Tasa renuncia 1.3 1.2 1.4 1.4 1.5 1.9 2.6 2.3 2.5 2.7 2.1 1.8 2.2

Tasa de desempleo 6.2 7.8 5.8 5.7 5.0 4.0 3.2 3.6 3.3 3.3 5.6 6.8 5.6

c) Datos de panel (unión de datos de corte transversal y de serie

de tiempo), al ser la unión de los tipos anteriores, estos datos se expresan como it (e.g., Xit2.3 ) REGION RM REGION VIII Tabla Año Año

1990 1992 1994 1996 1998 2000 2003 2006 Año

1990 1992 1994 1996 1998 2000 2003

Tasa de denuncias 658.5 775.6 926.6 1051.3 1027.4 1333.6 2027.4 2223.2 REGION VII

Tasa de denuncias 284.6 300.2 354.3 425.0 572.0 769.3 1823.2

Detencion es 8546 10578 12259 14635 18279 26851 55723 44402 Detencion es 987 1021 1174 1452 1901 2534 3189

1990 1992 1994 1996 1998 2000 2003 2006

Tasa de denuncias 321.8 401.2 438.8 506.7 619.6 764.7 1246.6 1778.1

Detencion es 2120 2841 3485 4253 5470 7117 14326 9733

REGION V

Año

1990 1992 1994 1996 1998 2000 2003 2006

Tasa de denuncias 453.4 581.2 602.3 780.9 833.2 1046.6 1720.7 2102 4

Detencion es 2102 2950 2903 3722 4454 7818 12212 10787

2.2 Ideas básicas sobre sobre regresión regresión

Como se ha descrito anteriormente, el análisis de regresión se relaciona esencialmente con la estimación de la media (de la población) o valor prom promed edio io de la varia variabl ble e depe depend ndie ient nte. e. No obst obstant ante, e, es posi posibl ble e que que leyendo esa breve descripción no sea posible comprender, por tanto, para verlo más claramente se toma el ejemplo de una población de 60 familias que se dividen en 10 grupos de ingresos (de 80 a 260) y se anal analiiza cómo cómo camb cambia ia su gast gasto o en cons consum umo o dado dado su ingre ngreso so.. La información se resume en la siguiente tabla: Tabla 2.4

X  Y

Gasto consumo familiar semanal Y

80

100

120

140

160 180

55

65

79

80

102 110

60

70

84

93

107 115

65

74

90

95

110 120

70

80

94

103

116 130

75

85

98

108

118 135

325

88 462

445

65

77

89

de

Total E (Y/X), medias condicionales de Y

113 125 140 115 707 678 750

101

113 125

20 0 12 0 13 6 14 0 14 4 14 5 68 5 13 7

220 240 260 135 137 150 137 145 152 140 155 175 152 165 178 157 175 180 160 189 185 162 191 104 966 121 3 1 149 161 173

De este ste modo odo, es posi posibl ble e visl vislum umbr brar ar 10 val valores ores fijo fijos s de X y los los correspondientes valores de Y para cada uno de los valores X. A pesar de la variabilidad del gasto en consumo para cada grupo de ingreso, en  promedio el consumo semanal se incrementa en la misma medida que el ingreso. El siguiente gráfico muestra el promedio de cada grupo:

Gasto de consum

20

E 15

10

50

80

100 120

140 160 180 200

Ingreso Semanal

A esto estos s valo valore res s medi medios os los los cono conoce cemo mos s como como los los valor valores es espe esperad rados os cond condic icio iona nale les s en vist vista a de que que depe depend nden en de los los valo valore res s dado dados s a la variable X. Se anota en forma simbólica como E (Y/X). Así, saber el nivel de ingr ingres eso o nos nos perm permit ite e pred predec ecir ir mejo mejorr el valor valor medi medio o del del gast gasto o de consumo que si no supiéramos esa información. 2.2.1

Concepto de Función de Regresión Poblacional (FRP)

En el ejemplo dado cada media condicional E (Y/Xi) es función de Xi, donde Xi es un valor dado de X. E (Y/Xi) = f (Xi) poblacional

función de regresión

Esta función denota únicamente que el valor esperado de la distribución de Y dada Xi está relacionada funcionalmente con Xi. Es decir, nos dice cómo la media media o respuesta respuesta promedi promedio o de Y varía con X. Ahora bien, bien, es importante recalcar que la forma funcional de la FRP dependerá del

estudio que se esté efectuando. Por tanto, si se supone que la relación entre X e Y es lineal se tiene la siguiente función lineal: E (Y/Xi) = β1 + β2Xi Donde β1 y β2 parámetros no conocidos pero fijos que se denominan coef coefic icie ient ntes es de regr regres esió ión. n. A β1 se le cono conoce ce como como el inte interc rcep epto to o intersección de la función en Y, mientras que β2 es conocido como la pendiente de regresión. 2.2.2Linealidad

Para el estudio de la econometría podemos hablar de linealidad tanto en las variables como en los parámetros. Para las variables: una función de regresión E (Y/Xi) = β1 + β2Xi2 no es una función lineal porque la variable explicativa X aparece elevada a una potencia. Lo lógico sobre linealidad en las variables sería esperar una regresión E (Y/Xi) = β1 + β2Xi. En los parámetros: cuando la esperanza condicional de Y, E (Y/Xi) es una función función lineal lineal en los parámetr parámetros, os, los βi (y no en las Xi). En cuanto a la variable explicativa, ésta puede ser lineal o no serlo, dependerá de la especificación de investigador o lo que postule la teoría. Por ejemplo, el modelo: β1 + β2Xi3, es un modelo de regresión lineal (en los parámetros). En definitiva, a lo largo de la econometría, el término de regresión lineal siempre significará una regresión que es lineal en los parámetros, los β i (vale decir, los parámetros elevados a la potencia de uno). Especificación estocástica

Se puede expresar la desviación de Yi individual alrededor de su valor esperado: µi = Yi - E (Y/Xi)

(2.

 Yi = E (Y/Xi) + µi

(2.

Donde en (2.1), la desviación µ i es una variable aleatoria que toma valores positivos o negativos. Se conoce como perturbación estocástica o término de error estocástico.

Entonces, aludiendo al ejemplo del ingreso y el gasto semanal de una familia, se puede decir lo siguiente: 1) E (Y/X i), representa simplemente la media del gasto de consumo de todas las familias con el mismo nivel de ingreso. Este es el componente determinístico, y 2) Mientras que µ i, que es el componente aleatorio. Se puede decir que la perturbación estocá estocásti stica ca repres represent enta a todas todas las variab variables les omitid omitidas as o ignora ignoradas das que puedan afectar a Y, pero que no están (o pueden no estar) incluidas en el modelo.  Yi = E (Y/Xi) + µi

(2.

 Yi = β1 + β2Xi + µi

Si se aplica valor esperado a (2.3): E (Y/Xi) = E [E (Y/X i)] + E (µi /Xi) E (Y/Xi) = E (Y/Xi) + E (µi /Xi) E (µi /Xi) = 0

(2.

2.2.4Sobre la perturbación estocástica

¿Por qué no se introducen ciertas variables (no incluidas) en el modelo? ¿Por qué no se desarrolla un modelo con muchas variables que intenten explicar algún fenómeno interesante? La respuesta a estas preguntas tiene directa relación con el término de perturbación estocástica. El error estocástico puede englobar las siguientes s iguientes situaciones: 1º Vagu Vagued edad ad de la teor teoría ía:: Es posi posibl ble e que que el inve invest stig igad ador or igno ignore re la existencia de variables que afectan el comportamiento de Y, también puede suceder que no esté seguro sobre la variación que puede tener Y con la inclusión de una variable. En este sentido, podemos hablar de problemas de la teoría que no dejan bien especificado la relación entre X e Y (ver paso 1 en metodología de la econometría). econometría). 2º No se disp dispo one de infor nform mació ación n cuant uantiitati tativa va de las las vari variab able les s explicativas: Se puede dar el caso en que el investigador no logre reunir los datos suficientes para satisfacer lo postulado en la teoría, por lo que tendrá que dejar variables de lado, que pasarán a formar parte del error estocástico (ver paso 4 en metodología de la econometría). econometría).

3º Aleatoriedad en el comportamiento de las personas: No se puede conoce conocerr determ determiní inísti sticam cament ente e el compor comportam tamien iento to de algún algún sujeto sujeto en rela relaci ción ón a algu alguna na acti activi vida dad, d, es por por esa esa razó razón n que que el térm términ ino o de perturbación estocástica incluye todas aquellas variables insospechadas e impensadas. En general, es difícil reflejar perfectamente la realidad a través de un modelo. No se le puede pedir a un Banco Central que reduzca la oferta de dinero en un 20%, manteniendo todos los demás factores constantes y ver qué sucede después. Siempre va a existir un acervo de variables aleatorias que van a afectar la variable endógena o fenómeno que se inte intent nta a expl explic icar ar.. Asim Asimis ismo mo,, es dabl dable e que que no se pued pueda a medi medirr Y con con exactitud y se manipulen variables proxy. Así, como muestra la ecuación (2.1), (2.1), el proces proceso o estim estimado adorr no se ajusta ajustará rá perfec perfectam tament ente, e, tendie tendiendo ndo algunos puntos con valores mayores que Y, como también habrá otros puntos con valores más bajos. 2.3 Estimación Estimación:: función función de regresión regresión muestra muestrall (FRM)

Conc Concre retam tamen ente te la tare tarea a de la FRM FRM consi consist ste e en estima estimarr la FRP con información muestral (por la dificultad de contar con alguna población o la imposibilidad misma de medirla). Debido a fluctuaciones muestrales pueden ser consideradas en el mejor de los casos sólo como una aproximación de la verdadera regresión poblacional (RP). La FRM se denota del siguiente modo:

i

=

 Yi =

1

+

1

+

Xi

2

2

Xi +

i

Por tanto, el objetivo principal es estimar la FRP:

Es posible notar , símb símbol olo o que que se cono conoce ce como residuo muestral, muestral, conce nceptua ptuallmente nte es anál análog ogo o a µi y puede puede ser considerado un

 Yi =

 Yi = β1 + β2Xi + µi

+

1

Xi +

2

i

En base en la FRM:

 Yi = (2.5) (2.6) (2.7

1

+

-

i

i

= Yi -

i

i

= Yi -

 Yi =

i

1

Xi +

2

+

i

Xi

2

Muestra que los residuos son simplemente las dif diferen erenc cias ias entre ntre los los valores observados de y los valores estimados de

Como se quiere obtener una regresión muestral lo más cercana posible de la real, se busca que la suma de los residuos sea la menor posible. posible. Min = ∑ i = ∑ ( Y  Yi -

)

i

Pero al realizar esta sumatoria se le está dando el mismo peso a todos los errores. Además algunos pueden ser negativos y otros positivos, provocando que la suma sea muy pequeña incluso si existe una gran dispersión de los errores en torno al valor observado. Recordar: El residual no es lo mismo que el término de perturbación estocástico, el residual viene a ser la distancia entre el punto de datos y la línea estimada, el término de error es la distancia entre el punto de datos y la línea verdadera. Nunca conoceremos el valor del término de error porque tampoco tampoco conocem conocemos os β1 y β2, el intercepto y la pendiente. En general una línea estimada será mejor si produce residuales más pequeños, significará que está más cerca de los datos y que tenderá a la líne línea a verd verdad ader era. a. Por Por tant tanto, o, lo que que busc buscam amos os es esco escoge gerr la líne línea a estimada que produce los residuales más pequeños. 2.3.1Estimación: Criterio de Mínimos cuadrados

El princi principio pio de mínim mínimos os cuadrad cuadrados os consis consiste te en selecc seleccion ionara ara la línea línea estimada, escogiendo una pendiente y un intercepto (en el caso de una X), que tiene la suma más pequeña posible de los residuos cuadrados. Para ello, recordemos la ecuación (2.7) y elevarla al cuadrado: ∑

i



i

2

 Yi = ∑ ( Y

2

= ∑ ( Y  Yi -

)2

i

Xi)2

+

1

(2.8)

2

Para calcular los estimadores derivando (2.8): (a) (∑

 Yi = - 2 ∑( Y

2 i

)

1

1

y

, diferenciamos parcialmente

2

Xi) = -2 ∑

-

2

i

1

(b) (∑

2 i

)

 Yi = - 2 ∑( Y

1

-

Xi)Xi = -2 ∑ iXi

2

2

Igualando a cero estas ecuaciones, se obtiene: (a) - 2 ∑ (Yi -

1

(b) - 2 ∑(Yi -

(a) (b)

1

∑ (Yi ∑ (Yi -

-

-

Xi) = 0

/

-2

Xi)Xi = 0

/

-2

2

1

1

2

-

-

Xi) = 0

2

Xi)Xi = 0

2

Aplicando método de los momentos: (a)

n-1

(b)

n-1

 Yi -

i

( Yi -

1

-

Xi) = 0

2

1

-

Xi) = 0

2

Reordenando (a): ∑ Y =

∑X =

;

n

-

1

-

Xi = 0

2

n

Por consiguiente: = 1

1

+

2

-

2

=

(2.9

Ahora, aplicando (a) sobre (b) y dejando n-1: [ Yi - ( -

2

)-

 Y i i - Xi +

2

Xi -

i

 Yi - ) = ( Y

2

2 i

i

( Y  Yi - ) =

2

i

i

 Yi - ) = ( Y

2

Xi - )2

i

i

4



2

 Yi - ) = - )( Y

2

Xi ] = 0

2

Xi2 = 0

2

-

2

i

(Xi - )

Xi - )2

= ∑xiyi

(2.1

∑xi2  También se tiene por arreglo:



2

= n ∑ XY - ∑X∑Y  n ∑X2 - (∑X)2

(2.1

Estos estimadores se conocen como estimadores de Mínimos cuadrados y presentan algunas propiedades numéricas: i) Los estimadores MCO están expresados en términos de las

cantidades observables 4

Recordar que a ∑x se conoce como x en desvío, y representa la sumatoria de los X i menos su promedio. Sucede lo mismo para ∑y.

ii) Son estimadores puntuales, proporcionan un solo valor del

parámetro poblacional5. Precisión de los estimadores

Si nos detenemos a observar las ecuaciones (2.9) y (2.10), notaremos que que los los míni mínimo mos s cuad cuadra rado dos s esti estima mado dos s son son func funció ión n de los los dato datos s muestrales, en consecuencia, son variables aleatorias que sus valores cambiarán en función de cada muestra, es decir, puesto que es probable que los datos cambien entre una muestra y otra, los valores estimados cambiarán. Por consiguiente, lo que se requiere es alguna medida de confia confiabil bilida idad d o precis precisión ión de los estim estimador adores es β1 y β2. Dich Dicho o de otra otra manera, se quiere saber algo sobre la variabilidad muestral de estos estimadores. En estadística, la precisión de un valor estimado es medida por su varianza, o su error estándar (standard error : se) que son las raíces cuadradas de las varianzas. Las Las varianzas y los errores errores estándar de los parámetros estimados dados en (2.9) y (2.10) o (2.11) pueden obtenerse de la siguiente manera: Var (β2) = 1 * σ2 ∑xi2 Var (β2) = σ2

(2.1 2 i

∑x ee (β2) = σ ∑xi2

ee (β2) = Var(β2)

(2.1

(2.1 6

Var(β1) = ∑X * σ 2

2

n∑xi2

ee (β1) = ∑X2 * σ2

ee(β1) = Var(β 1)

(2.1

n∑xi2

Las Las nota notaci cion ones es Var Var y ee sign signif ific ican an,, vari varian anza za y erro errore res s está estánd ndar ar respectivamente, y donde σ2 es la varianza homocedástica del término de perturbación estocástica. Una vez conocida la σ2 (valor constante), todos los valores son fáciles de calcular. No obstante, σ2 es la varianza 5 6

Para mayor información, véase Damodar Gujarati, 2004. La varianza precisa el uso de la sumatoria de los valores totales y los valores en desvíos de (2.1 X.

poblacional, es decir que no la conocemos, por esa razón es que la misma σ2 es estimada mediante la fórmula: 2

= ∑ i2 (n-k)

Donde 2 es el estimado ador de MCO de la verdade adera σ2 aunque desconocida y donde la expresión (n-k) es conocida como el número de grados de libertad (g de l), también es posible apreciar que ∑ i2 = SRC. Al ordenar la varianza homocedástica para el caso de la regresión lineal, podemos expresarla como:

(2.1

2

= SRC (n-2)

2.4 Bondad de Ajuste

Se denota por R2 y dice que proporción de la variación en la variable depe depend ndie ient nte e está está sien siendo do expl explic icad ada a por por la varia variabl ble e expl explic icat ativ iva. a. Se encuentra entre 0 y 1. Entre más cercano a 1, mejor será el R2. Para encontrar la bondad de ajuste, sabemos que: ∑ (Yi - ) = ∑ ( ∑ yi = ∑ + ∑

i

- )+∑

(2.18

i

i

Elevando (2.18) al cuadrado7: ∑ (Yi - )2 = ∑ ( ∑ yi2 = ∑

2

+∑

i

- )2 + ∑

i

2

2 i

Las magnitudes de (2.19) se definen como: STC = SEC + SRC donde: 7

STC = Suma total de cuadrados

Como podrá notar, en (2.12) se muestra Y en desvíos.

(2.19

SEC = Suma explicada de cuadrados SRC = Suma residual de cuadrados De este modo, se puede demostrar que la variación total en la variable depe depend ndie ient nte e (y) (y) pued puede e ser ser expr expres esada ada en térm términ inos os de la vari variac ació ión n explicada y la variación no explicada. Se define como coeficiente de determinación R2:

(2.20

R2 = SEC STC

=

∑(

i

- )2

∑ (Yi - )2

De manera análoga: R2 = 1 - SRC = 1 - ∑ i2 STC ∑ (Yi - )2

(2.21

El R2 o la cantidad de R2 que que se cono conoce ce como como el coef coefic icie ient nte e de determinación, indica el porcentaje de la variación total de la variable dependiente que es explicada por la variable independiente y por lo tant anto es una medida de la bondad del aju ajuste ste de los modelos econométricos. Dicho de otra manera, mide la proporción o el porcentaje de la variación total en Y explicada por el modelo de regresión. Por ejemplo, se si le presenta la siguiente regresión lineal simple: Salarioi = β1 + β2Educacióni + µi La regresión intenta analizar la relación entre salario y educación en una empresa, es decir, se esperaría que una persona (Xi) con un mayor nivel de educació educación n dentro dentro de la empresa empresa debiese debiese obtener obtener un mejor mejor salario. salario. Luego Luego de utiliz utilizar ar un paquet paquete e estadí estadísti stico co se obtien obtienen en los siguie siguiente ntes s resultados: Salarioi = 7.85 + 3.15 Educacióni + µi (0.0012) (0.039) R2 = 0.85 ¿Qué se puede decir al respecto de este modelo? La respu respues esta ta es sucin sucinta ta,, el mode modelo lo prese present nta a un alto alto coef coefic icie ient nte e de determinación lo que indica que la variable explicativa explica de buena

forma la variación de la variable dependiente. Si el coeficiente fuese menor que 0.4, el modelo dejar de ser regular/bueno. Para entender la bondad de ajuste de una forma más precisa, Ballentine desarrolló una novedosa forma de enseñar la proporción en que Y es explicada por X. Este método gráfico es conocido como los diagramas de Ballentine.

(a)

(b)

(c) (d)

Es posible apreciar las distintas proporciones en que X explica a Y, en el (a), R2 = 0, mientras que en el lado contrario, la imagen (d) muestra un R2 = 1. Es impo import rtan ante te sabe saberr prop propie ieda dade des s sust sustan anci cial ales es sobr sobre e el coeficiente de determinación o la bondad del ajuste del modelo: 1º El coeficiente es una cantidad no negativa, por tanto, si el cálculo de R2 entrega resultados negativos es porque algún error se ha cometido, ya sea en los números calculados anteriormente o en la fórmula. 2º Sus límites son 0

r

1. Un R2 de 1 significa un ajuste perfecto, es

decir, i = Yi para cada i. Un R2 de 0 significa que no hay relación alguna entre la variable explicativa X e Y.

2.5 Modelo Modelo Clásico Clásico de Regres Regresión ión Lineal Lineal (MCRL) (MCRL) o Modelo Econométrico

1º El modelo de regresión es lineal en los parámetros:  Yi = β1 + β2Xi + µi 2º Los valores de X son fijos en muestreo repetido. Más técnicamente X se supone no estocástica (ver (ver ejemplo sobre ingresos y gasto semanal por familia). familia). 3º El valor medio de la perturbación µi es igual a cero. Esto es, el valor de la media condicional de µi es cero: E (µi/Xi) = 0 El alumno puede evaluar este punto revisando la ecuación (2.4).

4º Homocedasticidad: dado el valor de X, la varianza de µ i, es la misma para todas las observaciones. Es decir, las varianzas condicionales de µi son idénticas, simbólicamente: s imbólicamente: Var (µi/Xi) = E [µi – E (µi)/Xi]2 Var (µi/Xi) = E (µi2/Xi) Var (µi/Xi) = σ2

E (µi2) = σ2

(2.2

Se establece que la varianza µi para cada Xi es algún número positivo constante igual a σ2. A contrario sensu, existen situaciones situaciones en la la que la varianza es dispersa o heterocedástica8. Var (µi/Xi) = σi2 El subíndice indica que la varianza ya no es constante para cada observación.

8

Véase el capítulo 6



autocorrelación entre las perturbaciones. Dados dos valores

cualesquiera de X, sean Xi y X j (donde i cero:

j), la correlación entre µi y µ j es

Cov (µi , µ j/ Xi , X j) = E {[ µ i – E (µi)]/ Xi} {[ µ j – E (µ j)]/ X j} Cov (µi , µ j/ Xi , X j) = E (µi/ Xi) (µ j/ X j) Cov (µi , µ j/ Xi , X j) = 0 6º El modelo tiene que estar correctamente especificado, esto implica que no existan errores con la inclusión de variables o la exclusión de variables por lo engorroso del proceso o por experimentar. Asimismo, supone una correcta especificación funcional del modelo. 7º No hay multicolinealidad perfecta, es decir, no hay relaciones lineales entre las variables explicativas9.

2.6 Propied Propiedade ades s de los esti estimad madore ores s MCO

Si se supone que  µi sigue la distribución normal, los estimadores MCO tienen las propiedades que se mencionan a continuación: a) Son Insesgados: un est estim imad ador or

es no se sesgad sgado o si su su val valor esperado es igual a β, el valor verdadero del parámetro que se esti stima. De lo contrario el pará arámetro será sesgado. Por consiguien consiguiente, te, el parámetro parámetro es insesgado insesgado si E ( ) = β.

b)  Tienen Varianza Mínima. Es decir, son estimadores Eficientes. c) Son consistentes. A medida que el tamañ amaño o de la muestra

aumenta aumenta indefinida indefinidamente mente,, los estimadore estimadores s convergen convergen hacia hacia sus verdaderos valores poblacionales. Es decir, si conforme la muestra de dato datos s crec crece e arbi arbitr trar aria iame ment nte, e, la dife difere renc ncia ia entr entre e el valo valorr estimado y el valor verdadero de β disminuye también arbitrariamente. De no ser así, los estimadores son inconsistentes véase el apéndice). ( véase

9

Ibíd.

2.7

Ejercicios resueltos y propuestos

Ejercicios Resueltos: 1. Calc Calcul ular ar los los parám parámet etro ros s para para pode poderr esta establ blec ecer er la ecua ecuaci ción ón de la

regresión entre el Maíz (variable Y) y el Fertilizante (variable X): Tabla

 Y i

Xi

 Y i - ) ( Y 

(Xi - )

40 44 46 48 52 58 60 68 74 80 ∑ Y i = 570 = 57

6 10 12 14 16 18 22 24 26 32 ∑Xi = 180 = 18

-17 -13 -11 -9 -5 1 3 11 17 23 ∑y i i = 0

-12 -8 -6 -4 -2 0 4 6 8 14 ∑ x i = 0

 x iy i i  204 104 66 36 10 0 12 66 136 322 ∑ x iy i i  = 956

 x i2 144 64 36 16 4 0 16 36 64 196 2 ∑ x i = 576

Paso 1.- Se debe calcular lo que esté en rojo, es decir, calcular los valo valore res s de las las vari variab able les s en desv desvío íos s (y post poster erio iorm rmen ente te las otra otras s col columna umnas) s) por por lo que que es nece ecesari sario o calc calcul ular ar en pri primer lugar ugar los promedios tanto de la variable explicativa como explicada. Paso 2.- Se debe calcular β2, para ello tenemos: 2

= ∑ x iy i i  ∑ x i2

2

= 956 576

1.66

Recordando que: 2

= N ∑ XY - ∑X∑Y N ∑X2 - (∑X)2

Se obtiene: 10 * 11216 – 570 * 180

=

9560

1.66

10 *3816 - 32400

5760

Paso 3.- Luego, reemplazando en:

= - 2 – 29.88 = 27.12 1

1

= 57 – (1.66) (1.66) * (18) = 57

Paso 4.- Entonces, se obtiene la siguiente regresión estimada:

= 27.12 – 1.66X i + µi 2. ¿Cuál es es la función función de expectativa expectativa condicio condicional nal o función función de regresión regresión poblacional? Nos dice como la media o el promedio de la sub-población de Y responde a una variación de los valores fijos de la variables explicativas. 3. ¿Cuál ¿Cuál es la difere diferenci ncia a entre entre la FRP y la FRM? FRM? ¿se trata de distint distintos os nombres para la misma función? La diferencia entre la función de regresión poblacional y la muestral es muy importante, el segundo es un estimador del primero, en la mayoría de las situaciones nos encontramos con una muestra de observaciones obteni obtenida da desde desde la poblac población ión y el invest investiga igador dor intent intenta a aprende aprenderr algo algo acerca de la población a partir de la muestra obtenida. 4. ¿Qué papel desempeña el término error estocástico µi en el análisis

de regr regres esió ión? n? ¿Cuá ¿Cuáll es la dife difere renc ncia ia entr entre e el térm términ ino o de erro errorr estocástico y el error residual? Un modelo de regresión nunca va a poder ser un completo reflejo de la realidad, es decir, no puede describir la realidad en su magnitud. 5. ¿Qué se quiere quiere dar a entender entender como como un modelo de regresi regresión ón lineal? lineal?

Un modelo que es lineal es los parámetros, puede ser o no ser lineal en las variables. Se debe comprender que cuando hablamos de linealidad

en econ econom ome etría tría,, parámetros.

siem siempr pre e

se

estar stará á

haci hacien endo do

refe refere renc ncia ia

a

los

6. Determíne Determínese se si los siguientes siguientes modelos modelos son lineale lineales s en los parámetros, parámetros, o en las variables, o en ambos ¿Cuáles de estos modelos son de regresión lineal?

Modelo a)  Yi = β1 + β2

Tipo descriptivo +

µi

Recíproco

b)  Yi = β1 + β2 ln Xi + µi

Semilogarítmico

c) ln Yi = β1 + β2Xi + µi

Semilogarítmico inverso

d) ln Yi = ln β1 + β2 ln Xi + µi

Logarítmico o doble

logarítmico e) ln Yi = β1 - β2

+

µi

Logarítmico recíproco

Para Para resp respon onde derr a esta esta preg pregun unta ta,, es nece necesa sari rio o reco record rdar ar lo que que se compre comprende nde por regres regresión ión lineal lineal.. Cuando Cuando se habla habla de linea linealid lidad ad nos referimos a los parámetros y no a las variables explicativas o explicadas. Por tanto, tanto, entre entre los modelo modelos s presen presentad tados os es posibl posible e señalar señalar que los modelos (a), (b), (c) y (e) son modelos de regresión lineal. Mientras que el modelo modelo de la letra letra (d) no es lineal. lineal. Sin embargo embargo si hacemos hacemos que α = ln β1, entonces el modelo también es lineal. 7. Los siguiente siguientes, s, ¡son modelos modelos de regresión regresión lineal? lineal? ¿Por ¿Por qué razón? razón?

a)  Yi = eβ1 + β2Xiµi b)  Yi =

1

1 + eβ1 + β2Xi + µi c) ln Yi = β1 + β2

+

µi

d)  Yi = β1 + (0.75 – β1)e

– β2(Xi -2)

+ µi

e)  Yi = β1 + β23Xi + µi

En (a) tomando el logaritmo natural, encontramos ln Yi = β 1 + β 2Xi + µ i, donde el modelo se transforma a una regresión lineal. En el caso (b), la transformación se conoce como una transformación logit, moldeando el modelo (b) en un modelo de regresión lineal: ln [(1 - Yi)/ Yi] = β1 + β2Xi + µi En relación al modelo presentado en (c) es posible vislumbrar que se trat trata a de un mode odelo de regr regres esió ión n line lineal al ya que que es line lineal al en los parámetros (no es lineal en los parámetros). En cambio, el modelo (d) es un modelo de regresión no lineal (en los parámetros). Lo mismo sucede con el modelo (e), es decir, es un modelo no lineal ya que la pendiente está elevada a una potencia.

8. ¿Qué se entiende por un modelo de regresión intrínsecamente lineal?

Si en el ejercicio 6d), β 2 valiera 0.8, ¿sería un modelo de regresión lineal o no lineal?

Un modelo que puede ser  lineal en los parámetros es llamado como modelo de regresión intrínsecamente lineal. Un caso de estos tipos de modelos es el (a) del ejercicio anterior, donde utilizando un poco de matemática se logra satisfacer la linealidad en los parámetros. Si en el modelo (d) del ejercicio anterior, la pendiente β 2 fuera 0.8, el modelo se conv conver erttirí iría en una una regr regre esión sión line lineal al,, dado dado que que e-0.8(X-2) pued puede e ser ser desarrollado fácilmente. 9. Se dispone de los siguientes datos anuales desde 1963 a 1972 sobre

la cantidad de dinero Mt , y la renta nacional de un país Yt, en millones de unidades monetarias que se resume en:

∑Mt2 = 147.18

∑Mt = 37.2 295.95 ∑Yt = 75.5 a)

∑M Y t t= ∑Yt2= 597.03

Espe Especi cifi fiqu que e un mode modelo lo line lineal al que que repre represe sent nte e la teor teoría ía de que que la cantidad de dinero determina la renta nacional del país.

Se nos solicita que se especifiquemos un modelo en donde la cantidad de dine dinero ro dete determ rmin ina a la rent renta a nacio naciona nall del del país, país, por por tant tanto o pode podemo mos s identificar la variable explicada y la explicativa:  Yt = f (Mt) Es decir, postulamos que la renta nacional está en función de la cantidad de dinero, entonces, econométricamente: econométricamente:  Yt = 1 + 2Mt + µt b) Calc Calcul ule e las las esti estima maci cion ones es de los los parám parámet etro ros s a part partir ir de la mues muestr tra a inic inicia ial. l. ¿Cuá ¿Cuáll es la inte interp rpre reta taci ción ón del del térm términ ino o const constant ante e y de la pendiente de la recta de regresión? En este caso, lo primero que debemos hacer es observar el enunciado y notar que n =10, lo que nos permite calcular los promedios de las variables, esto es: = 75.5/10 = 7.55 = 37.2/10 = 3.72 Analiz Anal izan ando do los los dato datos s que que nos nos son son entr entreg egad ados os,, se debe debe empl emplea earr la fórmula (2.11) para calcular la pendiente de la regresión: 2

2

= 10 * 295,95 - 37,2 * 75,5 10 * 147,18 - (37,2) 2 = 1.714

Ahora procedemos a calcular el intercepto, recordando (2.9): 1

= 7.55 – (1.714* 3.72)

1

= 1.18

Entonces, la regresión la podemos expresar como:  Yt = 1.18 + 1.714M t + µt c) Calc alcule la suma de cuadr adrados explicada, ada, SCE, y la suma de cuadrados residual, SCR, de la regresión. Recordemos que STC = SEC + SRC Siendo STC: STC = ∑yi2 = ∑ (Yi - )2

∑Y2 – n( )2

Entonces, reemplazando los datos: STC = 597.03 - [10 * (7.55)2] STC = 597.03 – [570.025] STC = 27.005

Siendo SEC: SEC = ∑

i

2

= ∑ ( i - )2

2 2

*∑xi2

Por tanto: SEC = (1,714) 2 * [147,18 – (10 * (3,72) 2] SEC = 2,9377 * [8,8] SEC = 25,85

Luego, si ordenamos SRC = STC – SEC, tenemos: SRC = 27.005 – 25.85 SRC = 1.155

d) Calc Calcul ule e el R2 de la regresión. Interprete su significado. R2 = SEC STC R2 = 1 – SRC STC

R2 = 25.85 = 0.957 27.005 R2 = 1 - 1.155 = 0.957 27.005

2 2

*∑X2 - n( )2

e) Calcule Calcule e intérprete intérprete los los errores errores estándar de los los parámetros parámetros En primera instancia necesitamos calcular la varianza homocedástica de µ: 2

=∑ 2 (n-k)

2

=1.155/(10-2) = 0.144



2

= SRC

Reemplazando en (2.17) y (2.18) Var ( 1) = 147.18 * 0.144 10 * 8.8 Var ( 1) = 0.24084 ee ( 1) = 0.49075 Var ( 2) = 0.144 8.8 Var ( 2) = 0.01636 ee ( 2) = 0.12792

10. Los siguientes datos corresponden a una estimación de los Ingresos

por ventas de una empresa empresa (Y) y el el Número de vendedores (X), para para el período Enero 2004 a Diciembre 2004. Ambos expresados en miles de pesos. 2

= 80. 3764 ∑ X i2 = 471 ∑Xi = 69

∑X Y i i = 3541 ∑Yi = 561

a) Calcular Calcular la ecuaci ecuación ón estimada estimada del del modelo modelo Por Por ecua ecuaci ción ón esti estima mada da ente entend ndem emos os calc calcul ular ar los los esti estima mado dore res s de la regresión que en este caso, al tener una variable explicativa, tenemos que calcular solamente dos parámetros. Lo primero que debemos hacer es calc alcular la pendiente, sin embarg argo nos falta el número de

observac observacion iones. es. Si se observ observa a deteni detenidam dament ente e el enunci enunciado ado,, se podrá podrá apre aprec ciar iar que que se ent entrega rega (n = 12). Un Una a vez vez con todos odos los los datos atos suficientes, reemplazamos en (2.11): 2

= 12 * 3541 – 69 * 561 12 * 471 - (69) 2

2

= 4.245

Para calcular el intercepto se requiere contar con los promedios de las variables: = 561/12 = 46.75 = 69/12 = 5.75 Con la estimación de la pendiente y los promedios reemplazamos en (2.9): 1

= 46.75 – (4.245 * 5.75)

1

= 22.35

b) Calcule Calcule el coeficient coeficiente e de determinació determinación. n. Interprete Interprete Recordando que: 2

= SRC (n-k)

 Y se cuenta con obtiene:

y

2

R2 = 1 - SRC STC

= 80.3764 y [(n-k) = (12 -2 = 10)], por lo que se

SRC = 80.3764 * 10 10 SRC = 803.764 En cuanto a STC, no tenemos ∑Yi2 , por lo que no es posible calcularla, pero si contamos con ∑Xi2, lo que nos permite calc alcular SEC y posteriormente nos permitirá calcular STC. Sea:

SEC =

2 2

*∑X2 - n( )2

SEC = (4.245) 2 * [471 – 12(5.75) 2] SEC = 18.020 * 74.25 SEC = 1337.985 De esta, manera podemos calcular STC: STC = SEC + SRC STC = 1337.985 + 803.764 STC = 2141.749 2141.749 Por consiguiente, tenemos la oportunidad de emplear las dos fórmulas de R2: R2 = 1337.985 2141.749

= 0.62 = 62 %

Este coeficiente de determinación nos está diciendo que la variable X expl explic ica a en un 62% 62% la vari variac ació ión n de la vari variab able le Y, lo que que pode podemo mos s denominar como un ajuste regular.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF