Contraste-Multicolinealidad

Share Embed Donate


Short Description

se realiza una simpre inspeccion teorica de como detectar y corregir el problema de multicolinealidad de una manera teor...

Description

“Un análisis Matemático” Por: Jeferson Ruiz ([email protected]) Deybi Morales (mora [email protected] [email protected]) om)

El modelo lineal general es un instrumento estadístico muy eficaz y de uso amplio. Sin embargo, como en todas las aplicaciones estadísticas, la eficacia del método depende de que se cumplan las hipótesis básicas en cada aplicación concreta (J. Johnston) No es frecuente que los datos disponibles para estimar un modelo de regresión se adapten exactamente a la teoría que subyace al modelo. Hasta en la encuesta más minuciosamente diseñada surgirán problemas. Los más habituales son: Las variables medidas están tan correlacionadas unas con otras que no es posible analizar con precisión los efectos individuales de cada una de ellas. En la muestra faltan algunos datos. La información contenida en los datos originales se desconoce porque los datos disponibles se han obtenido a partir de medidas de los datos originales o con algún otro método de agregación de datos. Los datos medidos no corresponden a las variables del modelo, bien porque la medición ha sido imprecisa, o bien porque las variables del modelo, por su naturaleza, no son medibles. Todos estos factores causan problemas al estimar e interpretar los modelos de regresión [general] (W. Greene). El objetivo principal de este documento es dar a conocer una manera de detectar el problema de la Multicolinealidad y su respectivo tratamiento. Palabras claves (Multicolinealidad, regresión, a nálisis, contraste, estadístico). Clasificación (Teoría Econométrica)

Al plantear un modelo de correlación y regresión simple en su forma estocástica:

        Es evidente que el investigador realice un contraste de hipótesis sobre el coeficiente de regresión parcial para la confiabilidad del modelo. De igual manera, el investigador aplicado, realiza un intervalo de confianza sobre dicho coeficiente y, de esta manera, estimar el rango puntual del parámetro. Matemáticamente planteamos la hipótesis:

    ̂)     ̂( Como afirma Gujarati “Si el valor del–verdadero β es especificado bajo la hiptesis nula, el valor t tico de prueba”

Y bajo el supuesto de normalidad, utilizamos el estadístico de prueba:

El cual sigue una distribución t con n

2 g de l.

de la ecuación (2) puede ser calculado fácilmente a partir de la muestra disponible y, por consiguiente, puede servir como un estadís También, a partir de este estadístico de prueba, realizamos afirmaciones sobre los intervalos de confianza de la siguiente forma: Universidad Centroamericana UCA Departamento de Economía Aplicada

Trusted by over 1 million members

Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.

Trusted by over 1 million members

Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.

“Un análisis Matemático” Por: Jeferson Ruiz ([email protected]) Deybi Morales (mora [email protected] [email protected]) om)

rrt⁄ t t t ⁄    –⁄

 ⁄

Donde el valor t en el centro de esta desigualdad, es el valor t dado por la ecuación (2) y donde es el valor de la variable t obtenida de la distribución t para el nivel de significancia de yn 2 g de l. Sustituyendo (2) en (3) se obtiene:

 ̂)  ⁄  cuacin  t⁄  ̂( [̂  ⁄ (̂)    ̂  ⁄ ̂]        – α ̂⁄ (̂)       

Al reorganizar obtenemos:

Que la ecuación (5) nos proporciona un intervalo de confianza para forma compacta se escribe:

al 100(1

) %, que en su

Cuya regla de decisión sería: no rechazar si el valor de t se encuentra en el área crítica y, aceptar si el valor de se te encuentra en la región de aceptación. Con estos estadísticos clásicos de prueba, normalmente, el investigador novato quedaría satisfecho, más aún, cuando observa que su coeficiente de correlación es alto. Si pudiéramos definir alto, quizá, arriba de 85%, no es un mal nivel de correlación. Lamentablemente, el investigador novato muchas veces desconoce o no sabe, que existe un contraste de hipótesis sobre el coeficiente de correlación poblacional. Aunque tampoco podemos obviar que hay quienes lo conocen y no lo practican. Pero aquí no queremos juzgar a nadie, simplemente dar a conocer y aprender. Aunque desde el punto de vista meramente estadístico, resultaría interesante realizar un modelo de probabilidad de quienes usan o no el estadístico de prueba citado más arriba. Desgraciadamente no es este el objetivo que perseguimos en este documento, ya que bien merecería un capítulo aparte. Volviendo al caso, normalmente, un coeficiente de correlación siempre es distinto de cero ( ) con lo que se concluye la existencia de una relación lineal entre X e Y. Recordemos que esta conclusión se basa en el número de observaciones, o sea, estamos interesados en la población completa de los valores de X e Y, para así, tener una estimación más puntual. No obstante, en el trabajo empírico aplicado, normalmente se desconoce el tamaño de la muestra exacta. Esto hace posible que, debido al error de muestreo nuestra muestra pueda ser engañosa y, aunque nuestros datos muestrales sugieran una relación fuertemente positiva, puede no existir tal relación a nivel poblacional. Por tanto, es importante estudiar la posibilidad que a pesar de la relación entre X e Y que sugiere la muestra, no exista tal relación. Para ello realizamos un contraste de hipótesis sobre el coeficiente de correlación poblacional:





    

Donde la letra griega (rho) es el coeficiente de correlación poblacional cuando este es cero. Aunque en la mayoría de los análisis el coeficiente de correlación muestral, muestra no ser cero, se realiza el contraste de hipótesis para determinar si es significativamente diferente de cero. Esta

Trusted by over 1 million members

Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.

“Un análisis Matemático” Por: Jeferson Ruiz ([email protected]) Deybi Morales (mora [email protected] [email protected]) om) Donde Sr es el error típico de la distribución muestral de r, y simboliza que, si se tomaran varias muestras de diferentes tamaños se obtendrían diferentes valores de r (Allen Webster 1996). Y r es igual al coeficiente de correlación múltiple que, se obtiene:

  √    Se elige el nivel de conf ianza que el investigador crea conveniente, 9%α por ejemplo, para    

contrastar la hipótesis , tal elección nos permite encontrar el valor crítico de t en la tabla t. este valor crítico de t se compara con la t calculada mediante la fórmula (7) a partir de nuestros datos muestrales. La regla de decisión sería: rechazar la si el valor de t está por debajo del valor o, por encima del valor calculado en la tabla t. En este caso la interpretación sería: si el se puede estar seguro al 95% de confianza que hay una relación positiva entre X e Y. (Interprete lo contrario)

n Webster, en su libro “stadística aplicada

Según Alle

para Administración y Economía (1996

”,

Aunque el señor Webster no define puntualmente un valor predeterminado de correlación que señale la aparición de multicolinealidad. Sin embargo, el señor Webster considera un un valor Por tanto va a plantear el uso de una prueba t para determinar si el nivel de correlación entre difiere significativamente de cero. Por lo que procederá a realizar un contraste de hipótesis de que la correlación entre es cero, a nivel poblacional:

 9    



              

Donde es el coeficiente de correlación poblacional entre en la introducción de este documento, planteamos:

. Utilizando la técnica estudiada

Donde

     Nuevamente se pone α  %, %, %Lat críticaes |||,             La regla de decisión sería: no r echazar si Rechazar si: O sea, si

i

se rechaza la hipótesis nula de que no existe correlación entre

   

Otra alternativa, según Webster, de detectar colinealidad, es comparar los coeficientes de determinación entre la variable dependiente y cada una de las variables independientes.

Trusted by over 1 million members

Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.

“Un análisis Matemático” Por: Jeferson Ruiz ([email protected]) Deybi Morales (mora [email protected] [email protected]) om)

|  ||    Donde

Ortogonalidad entre los regresores (ausencia de colinealidad).

   

y T es el tamaño de la muestra.

Mientras que Belsley (et al.) plantean:

  

Donde y son los autovalores máximos y mínimos mínimos de la matriz de correlaciones entre entre las variables explicativas y a partir de los valores que tome esta medida puede concluirse el grado de colinealidad existente en el modelo, según el siguiente criterio:

Cinco son las medidas pertinentes que plantea el profesor J. Bernardo Pena Trapero (et al.) para la corrección de Multicolinealidad: 1. 2. 3. 4. 5.

Suprimir variables. Utilización de información adicional. Utilización de primeras diferencias. Empleo de coeficientes o ratios entre las variables. Aumentar el tamaño de la muestra.

Bernardo J. Pena (et al.) Cien ejercicios de Econometría. Ediciones Pirámide. Barcelona España. Gujarati. D; Econometría básica. 4ta Ed. (2004) Greene. W; Análisis Econométrico. 3ra Ed. En español. Prentice Hall (1999) Madrid E spaña. Johnston. J; Métodos de Econometría. 3ra Ed. En español. VICENS-VIVES (1975) España. Webster. A; Estadística aplicada para administración y economía (1996) IRWIN. Madrid.

i

t crítico

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF