Apontamentos das Aulas (2-¦ teste)

August 29, 2017 | Author: Patricia Miranda | Category: Heteroscedasticity, Linear Regression, Estimator, Experiment, Statistical Inference
Share Embed Donate


Short Description

Download Apontamentos das Aulas (2-¦ teste)...

Description

MÉTODOS ECONOMÉTRICOS E DE PREVISÃO APONTAMENTOS DAS AULAS [2º TESTE]

LICENCIATURA EM GESTÃO FACULDADE DE ECONOMIA DO PORTO

1 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

2 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

O MODELO DE REGRESSÃO LINEAR MÚLTIPLA O que na prática se constata é a necessidade de explicarmos um determinado fenómeno através não de um, mas de vários factores. Neste sentido, vamos agora considerar mais do que uma variável explicativa, pois a variável explicada Y depende de várias variáveis explicativas. Do modelo de regressão linear simples (MRLS):

Passamos então para o modelo de regressão linear múltipla (MRLM): [Função Regressão da População] Naturalmente,

é o valor observado da variável dependente para a i-ésima observação;

Xji é o valor observado da variável explicativa Xj para a i-ésima observação; e ui é o termo de perturbação aleatório para a i-ésima observação. Finalmente, independente e

é o termo

é o coeficiente de regressão associado à variável explicativa Xj.

Esta é a forma analítica de apresentarmos a função regressão da população (FRP). No entanto, poderemos representá-la de uma forma mais compacta recorrendo à notação matricial1.

Notar que esta formulação matricial representa o caso geral quando temos o MRLM com termo independente. Tal como no caso do MRLC, a estimação do vector

por OLS parte da condição de

minimização da soma dos quadrados dos resíduos (SQR). Ora, sendo

, temos

que a soma dos quadrados dos resíduos ∑ ei2 é dada pela seguinte notação matricial:

1

Quando as variáveis estão a negrito estão a representar a respectiva matriz.

3 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Assim, para minimizar ∑ ei2, obtemos a seguinte fórmula2 para os estimadores de OLS:

É importante agora saber exprimir, na forma matricial, aqueles elementos:

A soma dos quadrados totais (SQT), ∑ Yi2, é dada pela seguinte matriz:

Notar ainda que para se poder obter estimativas para os coeficientes de regressão é necessário que se verifique [H5] no âmbito do MRLM isto significa que a característica da matriz das variáveis explicativas seja inferior às n observações da amostra. Ou seja:

Além de [H5] ter que se verificar, para se poder estimar os coeficientes de regressão do modelo exige-se ainda que não se verifique qualquer tipo de combinação linear entre variáveis explicativas. Perante a existência de co-linearidade entre colunas da matriz X

2

É fundamental perceber que esta fórmula apenas é valida quando existe

.

4 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

torna-se impossível estimar a coluna

. Tal pode ser comprovado através da estimação

dos seguintes modelos no E-Views (com os dados do ficheiro “Andy”): Modelo 1: Y c X XX √ Modelo 4: Y c X P X+P x

Modelo 2: Y c X P XP √ Modelo 5: Y c X P X+P x

Modelo 3: Y c X ln(X) √

CASOS PARTICULARES Depois de termos introduzido o MRLM de uma forma genérica, o próximo passo é debruçarmo-nos sobre 4 casos particulares. 1)

[MRLM sem termo independente]

Neste caso a matriz X não terá a primeira coluna, porque este modelo não tem termo independente:

Deste modo, a expressão que permite estimar a coluna

vem dada por:

Nesta situação, onde não existe termo independente, sabemos que ∑ ei2 ≠ 0, pelo que SQT ≠ SQE + SQR 2)

R2

[0,1].

[MRLS]

Este é o caso particular em que a variável dependente é explicada apenas por uma variável, pelo que a matriz X apresenta apenas 2 colunas (uma delas para o termo independente e a outra para a variável Xi.

5 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Deste modo, a expressão que permite estimar a coluna

vem dada por:

Exemplo: Estimar este modelo no E-Views (dados do ficheiro “andy”)

3)

4)

[MRLS sem variáveis explicativas/só com termo independente]

[MRLS sem termo independente]

Tal como no 2º caso, não existindo termo independente, sabemos que ∑ ei2 ≠ 0, pelo que SQT ≠ SQE + SQR

R2

[0,1].

Após a apresentação destes 4 casos particulares, o próximo passo será focar medidas como a estimativa da variância dos termos de perturbação e a estimativa da variância dos coeficientes de regressão, e ainda o coeficiente de determinação R2.

6 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

[NOTA: as covariâncias entre os termos de perturbação podem ser facilmente encontradas através do E-Views: estimation output/covariance matrix.]

Exemplo: estimar o modelo Y c X P (dados do ficheiro “Andy”) e confirmar as seguintes medidas: ;

Exemplo: no mesmo exemplo anterior, calcular:

SQE =

SQR = 178,943 SQT = SQE + SQR

[Resolver o exercício do slide 16]

;

.

7 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

TESTES DE HIPÓTESES CONJUNTAS SOBRE OS COEFICIENTES: TESTE F No âmbito do MRLS, fazíamos testes para apenas um coeficiente de regressão. Agora, no MRLM, os testes de hipóteses poderão envolver mais do que um coeficiente de regressão, e podem envolver mais do que uma restrição. 1. Teste de significância global da regressão3 (TSG) Modelo: H0:

(a regressão não é globalmente significativa)

H1:

(a regressão é globalmente significativa)

2. Teste de melhoria do ajustamento pela introdução de uma ou mais variáveis explicativas adicionais (TMA) Por exemplo, TMA pela introdução das variáveis explicativas X3 e X4: H0:

(não existe melhoria do ajustamento) M=2

H1:

(existe melhoria do ajustamento)

No caso de, por exemplo, um TMA pela introdução de X3: H0:

(não existe melhoria do ajustamento) M=1

H1:

0 (existe melhoria do ajustamento)

Notar que, neste último exemplo, o TMA é equivalente a um TSI.

3. Teste sobre combinações lineares de coeficientes de regressão Modelo: de regressão é igual à unidade.

. Por exemplo, testar se a soma dos coeficientes

H0: M=1

H1: 3

Só pode ser feito para modelos com termo independente.

8 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Devemos agora perceber que o teste F é um teste de hipóteses que envolve a estimação de 2 modelos: o modelo restrito e o modelo não restrito. A estatística de F é dada pela seguinte expressão4:

O valor de F crítico é calculado no E-Views pela introdução do comando: QFDIST (1-α, m, n – ku).

Regra de decisão:

No âmbito dos testes F torna-se importante saber escrever a expressão tanto do modelo restrito (R), como do modelo não restrito (U). Para efeitos de exemplificação, utilizamos os 3 testes anteriormente apresentados. No caso do teste 1, temos:

No caso do teste 2, temos:

No caso do teste 3, temos:

4

Quando os modelos R e U têm a mesma variável dependente, podemos utilizar uma fórmula alternativa para determinar a estatística de F:

9 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Resolução do Exercício 4 (1) Estimação dos modelos no E-Views; (2) Testar a significância global (TSG) no modelo

Modelo Restrito: Sob H0,

No E-Views, para obter automaticamente a estatística de F: aceder ao modelo não restrito/view/coeficient diagnostics/wald test/c(2)=0, c(3)=0, c(4)=0.

No caso do TSG, e só neste caso, temos no E-Views o valor da estatística de F em “F-Statistic” e o valor do p-value em “Prob (FStatistic)”.

Podemos concluir, com um nível de significância de 5%, e com base na informação estatística disponível, pela significância global da regressão. Assim, conclui-se que as variáveis explicativas conjuntamente se relacionam linearmente, de forma estatisticamente significativa com a variável dependente.

(3) Testar a significância global para o MRLS: Neste caso, TSG = TSI

10 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Sob H0,

Ou, pelo procedimento do TSI:

Como Fc = 3,972 < 46,9279 então rejeitamos H0 para um nível de significância de 5%.

(4) Testar a melhoria do ajustamento pela introdução de Ai e Ai2

R:

Sob

Como Pode-se concluir, para um nível de significância de 5%, e com base na informação estatística disponível, pela significância da melhoria do ajustamento pela introdução das variáveis explicativas Ai e Ai2, ou seja, pode concluir-se que o ajustamento 3 é melhor que o ajustamento 1.

11 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

(5) Testar se existe combinação linear de coeficientes (α2 + α3 = 1)

U: R:

Sob

Como Fc = 7 (ou P-value = 0), para um nível de significância de 5% e perante a 5

informação estatística disponível, podemos concluir que

(6) Testar se existe combinação linear de coeficientes ( 3+ 3.8

P-value = 0,3365 > 0,05, logo não se rejeita

5

Nota: também rejeitariamos H0 se tivéssemos definido

4=

1).

(para um nível de significância de 5%).

12 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

(7) Testar:

U: R:

.

Fobs = 40,93799 P-value = 0 < 5%, logo rejeita-se

(8) TSI da varíavel

para um nível de significância de 5%.

no modelo 2.

No caso do TSI, podemos aplicar tanto o teste F ou calcular o tobs (é indiferente)6.

(9) Interpretação das estimativas do modelo 4 =109,7190 – é o valor estimado de Si quando as restantes variáveis explicativas são nulas. =

- 7,64. Estima-se que um aumento dos preços em 1USD, numa determinada

cidade, induz uma diminuição das vendas em 7,64 milhares de USD, ceteris paribus.

6

P-value F = P-value t.

13 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Não podemos interpretar individualmente

e

porque não são combinação linear.

Então, temos que os interpretar no seu conjunto. . Estima-se que uma variação na publicidade em 1 milhar de USD induz uma variação estimada nas vendas de

milhares de

USD, dependendo assim do nível de despesas em publicidade, ceteris paribus.

14 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

VARIÁVEIS BINÁRIAS (DUMMY) Existe uma série de factores que explicam o comportamento das variáveis dependentes que não são quantificáveis. Por exemplo, a raça, o género, a educação ou a religião são factores de índole qualitativa que influenciam uma determinada variável dependente. Assim, as variáveis dummy são variáveis explicativas de uma natureza qualitativa e permitem incluir factores como estes na equação da regressão da população. Serão, doravante, descritas pela notação Di, em que:

Quando a variável dummy assume o valor 0 é designado por categoria base. Havendo mais do que uma variável dummy, a categoria base é aquela em que todos os Di = 0. Iremos analisar as variáveis dummy através do exemplo dos salários em função do género (carregar os dados «salários»). Iremos acompanhar o exemplo dos salários recorrendo ao exercício 5. Modelo: Onde

,

corresponde ao salário mensal do trabalhador i de uma dada empresa; e

assume o valor 1 se esse trabalhador for do sexo masculino e assume o valor 0 se esse trabalhador for do sexo feminino. Nesse caso, para interpretarmos os parâmetros da regressão não podemos recorrer às derivadas, porque a variável dummy é uma variável discreta. Recorremos então aos valores esperados:

– corresponde ao salário médio mensal de uma mulher, em

(1) EUR. (2)

- corresponde ao salário médio mensal de um homem, em EUR.

Fazendo a diferença (2) – (1) obtemos

, que representa a diferença entre os salários

médios, em EUR, de um homem e de uma mulher. Face ao exposto, é frequente calcular-se um teste para verificar se existe discriminação salarial quanto ao género. Então para testar se existe discriminação:

15 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Naturalmente, se se

> 0, então existe discriminação salarial a favor do sexo masculino;

< 0, existe discriminação salarial a favor do sexo feminino.

Sabendo que a variável dummy assume apenas o valor 1 ou o valor 0, como podemos representar graficamente este problema? Assumindo

Y

1

Podemos facilmente constatar que e que também definir a variável dummy do seguinte modo:

D1

. Sendo assim, podemos

Di = Utilizando os dados «salários» podemos calcular algumas estatísticas descritivas:

16 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO 7

Vamos agora estimar o modelo acima exposto, com os dados «salários»: = 337,2543 – Estima-se que o salário médio mensal das mulheres é de 337,2543€. = 337,2543 + 213,46 = 550,7143 – Estima-se que o salário médio mensal dos homens seja de 550,7143€. = 213,46 – Estima-se que a diferença entre o salário médio mensal de um homem e de uma mulher seja de 213,46€. Testar a hipótese de existir discriminação salarial com base no género. Como a questão não diz a favor de quem é a discriminação, fazemos um TSI:

Como p-value = 0 < 5%, então (para um nível de significância de 5%) face à informação estatística disponível conclui-se pela existência de discriminação salarial com base no género. Vamos prosseguir a nossa análise de variáveis dummy introduzindo 2 novos modelos a este exercício: (A2)

Ou seja, temos agora que

7

= 1,

Nas estatísticas descritivas de Y vamos a “Sample” e colocamos como condição «D=1» para considerar apenas os homens.

17 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Questão: será que podemos estimar um modelo que considere estas duas variáveis dummy em simultâneo? (Ex:

). Como já foi dito na

secção anterior:

. Vimos também que para esta fórmula dos

estimadores de OLS ser válida, era condição obrigatória verificar-se que existia a matriz inversa

, i.e.,

. Neste caso, temos k=3 e n=2, logo existe

combinação linear e a matriz

é indefinida. Assim, a regra seguinte é fundamental:

Se tivermos 2 atributos (ex: masculino ou feminino), só podemos utilizar no modelo uma variável dummy ou, se usarmos 2 variáveis dummys temos que construir o modelo sem termo independente.

Por conseguinte, é muito importante perceber que apesar do modelo A3 não ter termo independente, é possível calcularmos e interpretarmos o coeficiente de determinação R2 (apesar de na matéria para o primeiro teste termos dito que este coeficiente de determinação apenas fazia sentido interpretar em modelos com termo independente). Com efeito, neste caso: ∑ ei 1

Sem estimar os novos modelos no E-Views, obter as estimativas do modelo A2 e A3: Sabemos que

= 1,

Então, substituindo esta expressão no modelo A1, temos: , Se compararmos esta expressão com A2 retiramos que:

e assim obtemos

as estimativas para o modelo A2. Quanto ao modelo A3, podemos chegar às estimativas dos seus parâmetros através do cálculo dos valores esperados:

18 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Testes da existência de discriminação salarial com base no género: Modelo A2

Modelo A3

p-value = 0 < 5%

p-value = 0 < 5%

Rejeita-se

(

Rejeita-se

(

Os modelos com variáveis dummy em que apenas contemplam uma variável explicativa são designados de modelos de análise da variância. Os modelos com variáveis dummy e que contemplem mais do que uma variável explicativa são designados de modelos de análise de covariância. Até agora apresentamos o tipo de modelo com variáveis dummy mais simples, sem qualquer variável explicativa. Iremos, de seguida, abordar casos particulares de modelos com variáveis dummy, constatando que existe um conjunto de modelos possíveis de serem construídos.

CASOS PARTICULARES 1. MRLM com uma variável explicativa quantitativa e uma variável dummy na forma aditiva.

Que tipo de interpretações podemos fazer deste modelo? Sob a hipótese clássica [H1]: E(ui) = 0:

19 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Constatamos então que

mede a diferença entre os salários médios do homem e

da mulher com o mesmo número de anos de experiência, i.e., mantendo tudo o mais constante (neste caso, mantendo X constante). Então, graficamente: Y

X

Temos, portanto, 2 rectas com o mesmo declive mas com diferentes ordenadas na origem. Este modelo pressupõe que a eventual discriminação salarial se mantém constante com o número de anos de experiência profissional, na medida em que no gráfico anterior a distância entre a recta azul (salário médio mensal estimado dos homens) e a recta vermelha (salário médio mensal estimado das mulheres) é sempre constante e dada por

.

Estimar o modelo:

Interpretação das estimativas: - Estima-se que o salário médio de um trabalhador do sexo feminino sem experiência profissional seja de – Estima-se que o salário médio mensal de um trabalhador do sexo masculino sem experiência profissional seja de - Estima-se que, para o mesmo número de anos de experiência profissional (mantendo X constante), a diferença entre o salário médio mensal de um homem e de uma mulher seja de 229,3482€.

20 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

- Para trabalhadores do mesmo sexo (mantendo Di constante), estima-se que o salário médio mensal aumente em 12,837€ por cada ano adicional de experiência profissional.

2. MRLM com uma variável explicativa quantitativa e uma variável dummy na forma multiplicativa

Ora, que tipo de interpretação poderá agora fazer-se a este modelo? Sob [H1]: E(ui) = 0:

Como poderemos reparar graficamente, o diferencial entre o salário dos homens e dasmulheres depende, neste modelo, do número de anos de experiência. Y

X

Neste modelo em particular, temos rectas com a mesma ordenada na origem mas com diferentes declives. Admitindo que , este modelo postula que a diferença entre os salários médios dos trabalhadores do sexo masculino e do sexo feminino tende a agravar-se (favoravelmente para os do sexo masculino) com o número de anos de experiência. O modelo diz também que não há discriminação salarial pelo género para indivíduos sem experiência profissional.

21 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Como formular o teste de existência de discriminação salarial quanto ao género?

Trata-se de um TSI à variável

Estimação do modelo:

Interpretação das estimativas: : Estima-se que o salário médio mensal de um trabalhador (homem ou mulher), sem experiência profissional, seja de aproximadamente 335,485 €. Como interpretar as estimativas dos betas? O efeito de X sobre Y vai agora depender do caso em que se trata de uma mulher ou de um homem: : Caso das mulheres

A interpretação a dar a estas estimativas é, então, a seguinte: a influência de um ano adicional de experiência no salário do trabalhador é, neste modelo, diferente consoante o género do trabalhador. Assim, no caso de uma mulher, estima-se que o salário mensal aumente aproximadamente 2€ com mais um ano de experiência. No caso de um homem, estima-se que esse ano adicional de experiência trará 2,189€ + 17,4€ de salário adicional. Relativamente à diferença salarial: : estima-se que entre 2 trabalhadores de sexo diferente, se tiverem um ano de experiência, o salário médio mensal do homem seria superior ao de uma mulher em 17,40782€; mas se tivessem 3 anos de experiência (ambos), então essa diferença seria multiplicada por um factor 3 (ou seja, a diferença salarial acentua-se quanto maior forem os anos de experiência em causa, tal como facilmente concluimos na análise gráfica anterior). Testar a existência de discriminação salarial a favor dos homens:

22 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Sob H0,

Como a estatística de t pertence à região crítica, rejeita-se a hipótese nula para Conclui-se, portanto, que para um nivel de significância de 5%, e face à informação estatística disponível, existe discriminação salarial a favor dos trabalhadores do sexo masculino.

3. MRLM com uma variável explicativa quantitativa e uma variável dummy na forma aditiva e na forma multiplicativa8:

Assumindo [H1]: E(ui) = 0:

8

Aqui devemos ter em atenção que no se tivéssemos mais uma variável explicativa, por exemplo Z i, deveríamos formular o modelo do seguinte modo:

23 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Como podemos comprovar pela representação gráfica anterior, este modelo corresponde à situação em que a estimação das duas rectas não obedece a qualquer tipo de restrição quanto à igualdade dos declives ou das ordenadas na origem – é, portanto, o modelo mais flexível. Como formular o teste da existência de discriminação salarial quanto ao género: Trata-se de um TMA pela introdução de e

Estimação e interpretação do modelo:

Estima-se que, para trabalhadores sem experiência profissional ( ), e de género diferente, os do sexo feminino têm um salário médio mensal de 235€, enquanto os do sexo masculino é de 403€. – Estima-se que a diferença entre o salário médio mensal entre o sexo masculino e o sexo feminino (ambos sem experiência profissional, i.e., , seja de aproximadamente 168€. No que respeita à interpretação a dar aos betas, i.e., ao efeito de X sobre Y, tal como no modelo anterior, irá depender da situação em que se trate de mulher ou de homem: (no caso de mulher:

no caso de homem:

)

Assim, estima-se que por cada ano adicional de experiência profissional, o salário médio mensal aumenta aproximadamente 9€; se for um homem esse aumento será de aproximadamente 15€. – É a diferença estimada entre o acréscimo do salário mensal (de um homem e de uma mulher com o mesmo número de anos de experiência), por cada ano adicional de experiência. Imaginemos agora que temos o objectivo de estimar este modelo separadamente, ou seja, estimar o modelo apenas com observações de elementos do sexo feminino e estimar outro modelo apenas com observações de elementos do sexo masculino. No primeiro caso, fazemos quick/estimate equation/y c x; if Di = 0. No segundo caso fazemos quick/estimate equation/y c x; if Di = 1. Uma nota adicional para referir que,

24 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

nesta situação, como temos amostras diferentes, SQT, SQR e R2 são diferentes. De facto, SQR = SQRF + SQRM . Testar a existência de discriminação salarial:

U: R: Sob H0,

Como

rejeita-se a hipótese nula, para um nível de significância de 5%.

Exemplo Prático da aula Vamos supor que pretendíamos explicar os salários em função da região geográfica. Poderíamos, para tal, criar as seguintes variáveis dummy:

Podemos agora construir um modelo que contemple 2 destas variáveis explicativas, ou então com estas 3 variáveis mas sem termo independente. Optando pela primeira opção, temos o seguinte modelo:

25 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

(categoria base)

Se fizermos Sul – Norte = (diferença salarial da região sul face à região norte). E, da mesma forma, fazendo Centro – Norte = (diferença salarial da região centro face à região do norte). Algumas relações que podemos retirar deste modelo:

Ora, como dissemos anteriormente, uma outra opção para explicar os salários em função das 3 regiões geográficas seria incorporar no ajustamento as 3 variáveis dummy, mas sem termo independente:

Neste caso, apesar de não termos termo independente, podemos calcular e interpretar com significado o coeficiente de determinação R2, já que ∑ = 0. Por outro lado, também se verificar que a equação da regressão da amostra passa pelo ponto médio de cada variável explicativa:

Resolução do Exercício 6 (1) Algumas estatísticas descritivas: : em 12 semanas apenas se verificou cupão, de entre um total de 124 semanas. : em 33 das 124 semanas apenas se verificou exposição privilegiada. : em 7 das 124 semanas verificou-se, simultaneamente, cupão e exposição privilegiada. : 72 é o número de semanas em que não se verificou nenhum dos fenómenos anteriores (é a categoria base).

26 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

(2) Estimar os modelos: Modelo A: quick/estimate equation/S c P C Modelo B: quick/estimate equation/S c P C D DC Exemplo da representação matricial para o modelo A:

(3) Teste de significância global No modelo A:

,

Como

, rejeita-se

para

Então, para um nível de significância de 5%, e face à informação estatística disponível, conclui-se pela significância global da regressão, i.e., que as variáveis explicativas conjuntamente se relacionam de forma linear e de forma estatisticamente significativa com a variável dependente. No modelo B:

Sob H0,

27 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

rejeita-se a hipótese nula, para . Como

(4) Teste de significância individual do preço (modelo B)

Como o p-value = 0,9554 > 5%, então rejeita-se a hipótese nula para . Isto é, para este nível de significância, e com base na informação estatística disponível, conclui-se que a variável preço não é estatisticamente significativa.

(5) a) Para se testar a hipótese de o acréscimo nas vendas numa semana em que há simultaneamente exposição privilegiada e oferta de um cupão ser igual ao que ocorre se houver apenas exposição privilegiada, teremos que recorrer ao modelo B, pois é o que tem em consideração a variável DCt:

Sob [H1]: E(ut) = 0,

U:

t

28 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Podemos concluir, com um nível de significância de 5%, e com base na informação estatística disponível, que o acréscimo nas vendas de uma semana quando há exposição privilegiada e oferta de cupão em simultâneo, é diferente de uma semana em que apenas existe exposição privilegiada. b) Para se testar a hipótese de o acréscimo nas vendas numa semana em que há simultaneamente exposição privilegiada e oferta de um cupão ser igual ao que ocorre se houver apenas oferta de cupão, seguimos a metodologia da questão anterior, obtendo agora o seguinte teste:

Podemos assim concluir, com um nível de significância de 5%, e com base na informação estatística disponível, que o acréscimo nas vendas de uma semana quando há exposição privilegiada e oferta de cupão em simultâneo, é diferente de uma semana em que apenas existe oferta de cupão.

(6) Será que o ajustamento B é preferível ao ajustamento A? Claramente, esta questão conduz-nos a um teste de melhoria de ajustamento pela introdução das variáveis e .

29 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

U: modelo (B) R: modelo (A)

Para um nivel de significância de 1%, e face à informação estatística disponivel, o ajustamento B é preferível ao ajustamento A.

30 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

VIOLAÇÃO DAS HIPÓTESES CLÁSSICAS Na matéria leccionada para o 1º teste, aprendemos que subjacente ao modelo de regressão linear clássico estava um conjunto de hipóteses clássicas:

Nesta secção levantam-se essencialmente 4 grandes questões: - Será possível verificar (testar) se estas hipóteses são válidas? - Que factores podem dar origem à violação destas hipóteses? - Quais as consequências de estimarmos modelos com o método OLS quando estas hipóteses não se verificam? - Como proceder quando as hipóteses clássicas falham?

1. HIPÓTESE [H0]: O MODELO ESTÁ CORRECTAMENTE ESPECIFICADO Sempre que não se verifica a hipótese [H0], diz-se que estamos perante erros de especificação. Esta hipótese clássica poderá ser violada em 5 casos distintos: i) Omissão de variáveis explicativas relevantes; ii) Inclusão de variáveis explicativas irrelevantes; iii) A forma funcional é incorrecta; iv) Os parâmetros do modelo (coeficientes de regressão) não são constantes.

31 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO Quanto à primeira situação – omitem-se variáveis explicativas relevantes – podemos dar o seguinte exemplo. Suponhamos que o verdadeiro modelo (desconhecido) contempla 5 variáveis explicativas, mas o modelo que acabamos por estimar apenas considerada 4 dessas variáveis (i.e., uma dessas variáveis, apesar de relevante para explicar a variável dependente, não foi considerada no ajustamento). Ora, quando esta situação acontece, os estimadores de OLS dos coeficientes das outras variáveis explicativas serão: - Não cêntricos e não consistentes se a variável omitida e as variáveis incluídas no modelo forem correlacionadas; - Cêntricos mas não consistentes se a variável omitida e as variáveis incluídas no modelo não forem correlacionadas. Em qualquer destas situações, temos que o estimador de OLS do termo independente é não cêntrico. Também, em qualquer caso, a inferência estatística será totalmente inválida com base nos dados que tivermos. Relativamente à segunda situação – inclusão de variáveis explicativas irrelevantes – tem-se que os estimadores de OLS dos coeficientes associados às variáveis explicativas se mantêm a centricidade e a consistência, mas não têm variância mínima (excepto se a variável irrelevante não tiver qualquer tipo de correlação com as demais variáveis explicativas). Naturalmente, e tal como na situação anterior, a inferência estatística não é válida. Quanto à terceira situação que pode gerar a violação da hipótese [H0] – forma funcional incorrecta – esta é uma situação que ocorre quando assumimos, na construção do modelo, que a variável dependente depende linearmente das variáveis explicativas (quando, na verdade, a relação pode ser quadrática, cúbica, exponencial, etc). Notar que, ao usarmos uma forma funcional linear - quando ela é na realidade quadrática – os estimadores de OLS serão enviesados e inconsistentes dos coeficientes de regressão e, no limite, poderão retirar totalmente o sentido atribuído às interpretações das estimativas obtidas. Finalmente, o 4º tipo de erro que origina a violação de [H0] é assumir que os coeficientes de regressão são constantes para o período, quando efectivamente assim não é. A consequência desta situação é exactamente igual à anterior, a assunção de forma funcional incorrecta. No seguimento do que foi esclarecido, iremos agora apresentar 2 testes que permitirão verificar a ocorrência do tipo de erro iii) e do tipo de erro iv).

Forma funcional correcta ou incorrecta? – O teste RESET A operacionalização do teste RESET é a seguinte: 1. Estimar um determinado modelo original: valores estimados da variável dependente Y.

, obtendo os

2. Estimar uma regressão auxiliar cuja variável dependente é exactamente a mesma do modelo original, , sem termo independente, as mesmas variáveis explicativas do modelo original, e

32 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO ainda um conjunto de P-1 novas variáveis explicativas que correspondem a potência de ordem 2 a P dos valores estimados de Y obtidos no passo 1:

3. Procedemos ao teste de melhoria do ajustamento pela introdução das novas P-1 variáveis explicativas: (a forma funcional linear é adequada; modelo correctamente especificado) (a forma funcional é inadequada; modelo incorrectamente especificado) 4. Se o valor observado da estatística de teste exceder o valor crítico, rejeita-se a hipótese nula (ou se o p-value for inferior ao nível de significância adoptado). Entretanto, devemos saber que o E-Views executa automaticamente o teste RESET. No modelo original/view/stability tests/Ramsey Reset test/ordem máxima da potência das variáveis explicativas incluídas na regressão auxiliar – 1 por defeito. Após executar o comando, o EViews exibe o resultado da estimação do modelo auxiliar e o valor do p-value para o teste RESET – Prob. F(m, T-K).

Aplicação do teste RESET no exercício 6 – modelo A.

Assumimos P=3. Modelo original (restrito):

Estimamos este modelo e vamos a information output/proc/make residual series – guardamos como e. Depois, e sabendo que

, criamos a variável Sest = S – e.

Em seguida, estimamos a regressão auxiliar dada por .

Wald test: c(4) = c(5)

33 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

No E-Views: modelo original/view/stability diagnostics/ramsey reset test/P-1=2.

Aplicação do teste RESET no exercício 4 – modelo B. Assumimos P=2. Modelo original: Estimamos este modelo e guardamos a série de resíduos a ele associada como e. Em seguida, e sabendo que , criamos a variável: Sest = S – e. Estimamos a regressão auxiliar

p-value: 0,386 > Para um nível de significância de 5%, e com base na informação estatística disponível, conclui-se que o modelo está correctamente especificado – a forma funcional do modelo original é a adequada. No E-Views: modelo original/view/stability diagnostics/ramsey reset test/P-1=1.

Os coeficientes de regressão são ou não constantes? – O teste CHOW9

9

Ou teste de permanência de estrutura dos coeficientes de regressão.

34 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

A operacionalização do teste CHOW é a seguinte: 1. Dividir a amostra em 2 sub-amostras de acordo com informação prévia quanto a factos extraordinários que possam provocar as diferenças nos coeficientes de regressão (séries temporais) ou características particulares de um sub-grupo de indivíduos (dados seccionais)10. 2. Estimar 3 modelos com as mesmas variáveis: - O primeiro e o segundo devem ser estimados cada um com as sub-amostras respectivas; - O terceiro modelo é estimado com a amostra completa E apura-se, para os 3 modelos, a soma dos quadrados dos resíduos. 3. O teste é formulado da seguinte forma: (existe permanência de estrutura dos coeficientes de regressão) (não existe permanência de estrutura dos coeficientes de regressão) Onde:

Seguindo o procedimento habitual, quando a estatística do teste CHOW for superior ao FC, rejeita-se a hipótese nula para o nível de significância adoptado.

10

No caso de séries temporais a representação gráfica das séries pode sugerir o ponto adequado de partições da amostra.

35 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Aplicação do teste CHOW ao ficheiro „salários‟ Utilizamos o MRLS para este caso. (existe permanência de estrutura dos coeficientes de regressão) (não existe permanência de estrutura dos coeficientes de regressão)

Como

, rejeita-se

para

Podemos então concluir, com um nível de significância de 5%, e com base na informação estatística disponível, pela diferença do comportamento da variável salário para indivíduos do sexo masculino relativamente a indivíduos do sexo feminino, i.e., verifica-se alteração de estrutura dos coeficientes de regressão. E sendo assim, não deveríamos ter estimado este modelo com as 90 observações, já que estamos a violar a primeira hipótese clássica, nomeadamente o facto de os coeficientes de regressão terem que ser constantes para todos os elementos da amostra. Notar que poderemos também executar este teste CHOW automaticamente no E-Views: workfile/proc/sort current page/sort key:d1/ascending. Depois, se formos à informação contida na variável d1 percebemos que a “quebra” na amostra ocorre ao 41º elemento. Assim, vamos depois ao modelo estimado/view/stability diagnostics/chow breakpoint test/breakpoint date: 41. É depois aberta 1 janela com a informação da estatística do e ainda o valor do p-value.

Alternativa ao teste CHOW – O teste GUJARATI Tal como o teste anterior, o teste GUJARATI tem por base a divisão da amostra em duas sub-amostras. Neste caso, o teste é executado através da utilização de uma variável dummy:

36 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Estimam-se depois os seguintes modelos: - Modelo restrito:

- Modelo não restrito:

(existe permanência de estrutura dos coeficientes de regressão) (não existe permanência de estrutura dos coeficientes de regressão) Claramente, este teste resume-se a um teste de melhoria de ajustamento (TMA) pela introdução das variáveis . A vantagem deste teste GUJARATI é que, detectando que não existe permanência de estrutura dos coeficientes de regressão, é possível detectar (testar) onde é que a alteração da estrutura ocorreu. [Utilizar o exemplo dos salários e verificar que o Fobs é exactamente igual ao

.]

2. HIPÓTESE [H1]: E(u) = 0 As consequências da violação de [H1] variam consoante o valor esperado do termo de perturbação é diferente de zero e variável na amostra ou se é diferente de zero mas constante para as várias observações. Neste sentido, no caso do modelo com termo independente: - Se , então as propriedades dos estimadores dos coeficientes associados às variáveis explicativas do modelo mantêm-se, mas não as do estimador do termo independente. Ou seja, todos os estimadores continuam a ser estimadores cêntricos e consistentes, à excepção de , que será um estimador enviesado e inconsistente; - Se , então os estimadores de todos os coeficientes de regressão serão enviesados e inconsistentes.

37 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

3. HIPÓTESE [H2]: Como já estudamos anteriormente, o modelo clássico de regressão linear impõe que as variâncias dos termos de perturbação sejam iguais para todos os elementos observados – a hipótese de homoscedasticidade. Quando esta hipótese é violada estamos na presença de heteroscedasticidade, tendo então . Devemos desde já notar que será apenas a variância dos termos de perturbação que será alterada na matriz das variâncias e covariâncias, i.e., as covariâncias entre termos de perturbação permanecerão nulas, já que a hipótese [H3] continua a verificar-se. Temos então que: Em Homoscedasticidade

Em Heteroscedasticidade

No caso de heteroscedasticidade, e procedendo a mera manipulação matemática temos a seguinte igualdade:

Uma questão que se coloca é a de saber quais as fontes de heteroscedasticidade. (1) Em primeiro lugar, a experiência empírica diz que é mais frequente tal problema ocorrer em dados seccionais do que em dados temporais (embora também nestes possa ocorrer). Facilmente se apontarão exemplos de heteroscedasticidade em dados seccionais. Um caso típico é quando, por exemplo, se desenvolve um modelo que explique o consumo em função de vários niveis de rendimento. No caso de termos uma grande heterogeneidade de famílias é possível que isso cause heteroscedasticidade. De facto, a dispersão em torno da média do consumo tende a ser maior quanto maior o nivel de rendimento, já que as famílias com baixos rendimentos têm menor flexibilidade no consumo, estando sujeitas de grosso modo a bens essenciais; já as famílias de rendimentos elevados tenderão a apresentar maior flexibilidade na aplicação do rendimento no consumo. De forma semelhante, se pensarmos no exemplo dos salários em função do número de anos de experiência profissional, quanto maior for esse grau de formaçao maior será a variabilidade dos salários e, portanto, estaremos também perante

38 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

heteroscedasticidade. Um outro exemplo que seja fonte de heteroscedasticidade é a dimensão das empresas: quanto maior a dimensão da empresa, maior será a variabilidade dos seus investimentos, por exemplo. (2) Uma segunda fonte de heteroscedasticidade é a manipulação de dados. A utilização de dados agrupados ou agregados é também uma possível fonte de heteroscedasticidade. Por exemplo, imaginemos que queremos estudar o comportamento das vendas em função da despesa publicitária.:

Pretendiamos saber o comportamento para as 6 empresas. Contudo, o instituto de estatística diz-nos que não nos pode fornecer, apenas nos dandos os dados agregados. Por exemplo: Sectores de Actividade Sector I: Sector II: Sector III:

Número de empresas 1 2 3

O instituto fornece a seguinte informação:

Perante esta situação teriamos que recorrer a 1 modelo transformado tal como:

Quando assim é pode-se comprovar que a variância de cada termo de perturbação será diferente:

39 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

E assim, com heteroscedasticidade, temos: Ou seja, se o número de empresas fosse igual para cada sector, então já teríamos homoscedasticidade.

Apontadas as várias fontes de heteroscedasticidade, quais são as principais consequências de fazermos 1 análise com heteroscedasticidade? 1 – Os estimadores dos coeficientes de regressão acabam por manter a centricidade e a consistência; 2 – Os estimadores dos coeficientes de regressão não apresentam variância mínima na classe dos estimadores lineares e cêntricos (i.e., não são BLUE – o teorema de GaussMarkov já não se aplica); 3- A inferência estatística conduzida da forma habitual não é válida.

MÉTODOS DE DETECÇÃO DE HETEROSCEDASTICIDADE Os métodos de detecção de heteroscedasticidade baseiam-se na análise dos resíduos de estimação por OLS. Notar antes de mais que oss resíduos de estimação não são termos de perturbação (a heteroscedasticidade refere-se às variâncias dos termos de perturbação, não dos resíduos). Os resíduos podem ser tomados como proxy dos termos de perturbação (principalmente em grandes amostras) porque os estimadores de OLS mantêm a consistência na presença de heteroscedasticidade. MÉTODOS INFORMAIS Os métodos informais não são mais do que uma inspecção visual dos resíduos de estimação por OLS.

Homoscedasticidade

40 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Exemplos de Heteroscedasticidade:

MÉTODOS FORMAIS Existe Heteroscedasticidade? – O Teste de White Modelo Exemplo: Passo 1: Estimar o modelo original por OLS e obter a série de resíduos estimados, . Passo 2: Estimar uma regressão auxiliar, em que a variável explicada é o quadrado dos resíduos de estimação e inclui (à excepção de eventuais redundâncias): i) Termo independente; ii) Todas as variáveis explicativas do modelo original; iii) Os quadrados das variáveis explicativas do modelo original; iv) Os produtos cruzados das variáveis explicativas do modelo original. Assim, teremos para o nosso exemplo a seguinte regressão auxiliar:

Passo 3: Obter o coeficiente de determinação R2 da regressão auxiliar. Passo4: Proceder ao seguinte teste:

ou nº de variáveis explicativas da regressão auxiliar. Nº de restrições de

41 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Depois, seguindo o procedimento habitual, se

Aplicação do teste de White aos dados do ficheiro “Andy” Estimamos o modelo:

Obtemos a série de resíduos e gravamos com o nome “resid”. Depois estimamos a regressão auxiliar: estimate equation/resid^2 c price advert price^2 advert^2 price*advert Obtemos

Como então não se pode dizer, para um nível de significância de 5%, e com base na amostra diponível, conclui-se pela não existência de heteroscedasticidade dos termos de perturbação do modelo original. Nota: O E-Views executa automaticamente o teste de White. Bastará para tal fazer: modelo original/view/residual diagnostics/heteroscedasticity tests/White. Podiamos aqui ver que prob. Chi-Square(5) = p-value.

Aplicação do teste de White a um modelo com variáveis dummy (modelo E, ex. 5)

Para construirmos a regressão auxiliar temos que saber que variáveis explicativas vamos utilizar e tomar em consideração que algumas variáveis são redundantes:

Só vamos considerar as variáveis assinaladas porque as restantes são redundantes. Obtemos em seguida a série dos resíduos e gravamos a série.

42 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Estimamos a regressão auxiliar:

Como heteroscedasticidade.

, ou seja concluimos

pela existência de

MÉTODOS DE ESTIMAÇÃO SOB HETEROSCEDASTICIDADE Admite-se que no modelo em análise o único problema é o da desigual variância dos termos de perturbação, i.e., as restantes hipóteses clássicas são verificadas. Temos então:

, ou

.

A: Supondo que são conhecidas as variâncias das perturbações são conhecidas (i.e., a matriz Ω é conhecida) – Hipótese pouco realista. Se a matriz Ω é conhecida, podemos estimar o modelo através de 2 métodos diferentes (conduzem a resultados idênticos). 1. Método de Mínimos Quadrados Generalizados (GLS) sobre o Modelo Original (MO) Este método de estimação é apropriado porque , logo trata-se de 1 estimador BLUE. No E-Views: quick/estimate equation/modelo original/options/type: variance/weight series: colocamos a parte variável do padrão de heterostecedasticidade. 2. Método OLS sobre o Modelo Transformado (MT) A ideia desta solução é transformar o MO de forma a repor a hipótese de homoscedasticidade. Desta forma, os termos de perturbação do MT verificam todas as hipóteses clássicas e a aplicação do método OLS a esse MT permitirá obter estimadores de com as propriedades habituais.

43 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Modelo Original (exemplo):

A transformação é obtida através da divisão por

. O Modelo Transformado é então:

Então, o que iremos agora provar é que o termo de perturbação do MT, dado por , verifica as hipóteses clássicas: o [H1]: o [H2]: o [H3]:

É de notar que a transformação operada na passagem do MO para o MT não afecta qualquer outra hipótese clássica e repõe a hipótese de homoscedasticidade. Assim, verificadas no MT as hipóteses clássicas, pode naturalmente aplicar-se o método OLS sobre o MT, e portanto o estimador é BLUE. Note-se também que o MT permite estimar os coeficientes de regressão do MO porque os 2 modelos têm exactamente os mesmos coeficientes de regressão Em suma, as alterações no MT são as seguintes: -

deixa de ser a variável dependente e esta passa a ser

- Deixa de existir termo independente; - Em geral, temos k variáveis explicativas

, …,

que são diferentes das

variáveis explicativas do MO; - Reposição da hipótese de homoscedasticidade. Uma nota final para atendermos ao facto de que a interpretação das estimativas é realizada usando as estimativas obtidas no MT mas com a respectiva e adequada correspondência com o MO.

44 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

B: Supondo desconhecidas as variâncias dos termos de perturbação (i.e., a matriz é desconhecida). Na prática, na generalidade das situações, o padrão de heteroscedasticidade que nos vinha sendo dado pela matriz Ω é desconhecido, e haverá que operar com uma matriz Ω estimada ou encontrar uma outra solução, tal como o procedimento de White que veremos mais à frente. B1)

é um estimador consistente de Ω.

1. Método EGLS sobre o MO11

é

é

2. Método OLS sobre o Modelo Transformado (MT) A ideia consiste em dividir ambos os membros da equação por o MT.

e estimar por OLS

Exemplo: MO: Para transformarmos este modelo, dividimos então cada membro da equação por

,

obtendo: MT:

B2) Não é possível estimar Ω Este é o caso típico em que não se dispõe de conhecimento razoável sobre o padrão de heteroscedasticidade e se está perante a impossibilidade de se encontrar um estimador consistente de Ω.

11

Reparar que a única coisa que muda face ao método GLS, anteriormente exposto, é que se passa a considerar o estimador da matriz Ω em vez da própria matriz Ω.

45 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Confrontado com esta situação, White propôs um estimador consistente da matriz de variâncias e covariâncias dos estimadores de OLS dos coeficientes de regressão, i.e., um estimador consistente de e embora não resolvendo o problema de heteroscedasticidade, repõe a validade da inferência estatística em amostras de grande dimensão. O Procedimento de White Parte-se do reconhecimento de que, presença de heteroscedasticidade, os estimadores OLS de mantêm a centricidade e a consistência, mas a inferência estatística perde a sua validade. O procedimento de White não resolve o referido problema, mas repõe a validade da inferência estatística. Basicamente, o que este procedimento faz é estimar por OLS o MO, sendo agora a matriz de estimada por12:

Depois,

a estatística de teste é agora dada por:

Assim, quando se proceder à inferência estatística, podemos utilizar o método OLS. Contudo, teremos sempre que tornar o modelo original consistente com a existência de heteroscedasticidade. Para tal, executamos o comando no E-Views: no modelo estimado/estimate/options/coefficient covariance matrix – white.

12

Recordar que, como vimos no inicio da matéria, quando há verificação de todas as hipóteses clássicas,

a variância dos estimadores de OLS é dada simplesmente por:

.

46 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Resolução do Exercício 7 Modelo: Estimar o modelo.

QUESTÃO 1 TSI:

Sob

e

desconhecido,

Como p-value = 0,0030 é inferior à estatística observada, então para um nível de significância de 5% e com base na informação estatística disponível, concluímos pela significância individual da área do terreno para explicar o preço de venda de cada habitação.

QUESTÃO 2 Será que os termos de perturbação do modelo são heteroscedásticos? Se forem, então podemos desde já dizer que não poderíamos ter estimado o modelo como o fizemos na questão 1, nem ter procedido à inferência estatística que fizemos.

47 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Podemos recorrer então ao método formal para testar se existe ou não heteroscedasticidade; falamos portanto no teste de White. Teste de White: tests/white:

modelo

original/view/residual

diagnostics/heteroskedasticity

Teríamos então que recorrer à regressão auxiliar:

Sob

,

Para um nível de significância de 5%, e face à informação estatística disponível, os termos de perturbação são heteroscedásticos. Assim, não poderíamos ter resolvido a questão 1 da forma que fizemos.

48 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

QUESTÃO 3 As estimativas obtidas pelo procedimento de White, robustas à presença de heteroscedasticidade, podem ser determinadas executando o comando: no modelo estimado/estimate/options/coef.covariance matrix – white:

QUESTÃO 4 Testar novamente a significância individual da variável AT faz todo o sentido porque, como já se referiu, o TSI que foi feito na primeira questão não tem validade, pois estávamos na presença de heteroscedasticidade e não utilizamos 1 modelo consistente com este problema. Então, o teste que agora se fará terá em conta a estatística de White (que assimptoticamente pode ser aproximada à distribuição normal) e não a estatística observada da distribuição T de Student. TSI:

Sob

49 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Assim, para um nível de signifcância de 5% e face à informação estatística disponível, conclui-se que a variável AT não é estatisticamente significativa para explicar o preço de uma habitação. Note-se que também pelo p-value = 0,0955 (inferior ao nível de significância) chegamos à mesma conclusão.

QUESTÃO 5 O que agora estamos a admitir é que se conhece o padrão de heteroscedasticidade. Como vimos nas aulas, uma hipótese era estimar o modelo por GLS. No entanto, o que aqui se pede é aplicar o método OLS sobre o MT (i.e., a outra alternativa quando se conhece o padrão de heteroscedasticidade). Padrão de heteroscedasticidade: ( . Ora, seguindo o procedimento de transformação do modelo original, vamos dividir os membros da sua equação pelo factor

Assim, o termo de perturbação

.

já verifica todas as hipóteses clássicas e,

portanto, está reposta a hipótese de homoscedasticidade. Podemos, com este MT, proceder à inferência estatística sem qualquer problema. Este MT está corrigido da heteroscedasticidade, ao contrário do modelo com o procedimento de White, que apenas valida a inferência estatística. Estimação do MT:

50 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

QUESTÃO 6 A ideia é testar se existe ou não heteroscedasticidade no MT. Como se trata do MT (por definição corrigido de heteroscedasticidade) o que se pretende é confirmar o que foi postulado na questão anterior. Teste de White: modelo transformado/view/residual diagnostics/heteroskedasticity tests/white:

Sob

,

Em vez de compararmos com o valor crítico, podemos ver que p-value = 0,5892 (inferior ao nível de significância de 5%). Assim, para um nível de significância de 5%, e com base na informação estatística disponível, concluímos que os termos de perturbação do MT são homocedásticos.

51 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

QUESTÃO 7

QUESTÃO 8 Pretende-se que se proceda ao teste RESET, o que mais não é do que o teste que se faz para se saber se a forma funcional do modelo é ou não a correcta – viola ou não a hipótese [H0]? Assumindo P=1, temos a seguinte regressão auxiliar:

Sob

52 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Modelo 2/view/stability diagnostics/ramset RESET/P=2-1

Então, com m nível de significância de 5%, e face à informação estatística disponível, concluímos que o modelo 2 está correctamente especificiado.

QUESTÃO 9 Teste de White: Modelo 2/view/residual diagnostics/heteroskedasticity tests/White Regressão Auxiliar:

Sob

,

QUESTÃO 10 TSG:

53 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

logo para este nível de significância e com base na informação estatística disponível, conclui-se que a regressão é globalmente significativa.

QUESTÃO 11 Pretende-se saber a área de habitação influencia ou não significativamente o preço da habitação (no modelo 2). Será, portanto, necessário realizarmos um TMA pela introdução das variáveis e .

Assim, para um nível de significância de 5%, e com base na informação estatística disponível, podemos dizer que o modelo 2 é preferível ao modelo restrito que não inclui aquelas 2 variáveis.

QUESTÃO 12 Nesta questão coloca-se em causa a permanência de estrutura dos coeficientes de regressão, pelo que teremos que proceder ao teste Chow. O primeiro passo é ver qual a disposição dos dados desta variável dummy e, eventualmente ordená-los. Assim fazemos, nomeadamente executando o comando workfile/proc/sort current page/sort key/col ascending. Detectamos que a alteração ocorre em n=28.

,

54 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Sob

,

(View/Stability diagnostics/Chow Breakpoint Test/28)

4. HIPÓTESE [H3]: AUTO – CORRELAÇÃO A hipótese de ausência de auto-correlação (AC) estabelece que é nula a covariância entre perturbações aleatórias, ou seja:

Então, existirá AC das perturbações aleatórias quando houver pelo menos 2 perturbações distintas cuja covariância seja diferente de 0, ou seja:

Quando isto acontece, então sabemos que pelo menos alguns dos elementos da matriz Ω não são nulos:

Portanto, já não poderemos dizer que a matriz é uma matriz escalar, pois agora apenas sabemos que é uma matriz simétrica e definida positiva. Os elementos fora da diagonal principal representam os coeficientes de correlação linear entre as perturbações aleatórias.

Quais as possíveis fontes de AC? - Erros de especificação. Trata-se de situações em que existe omissão de variáveis explicativas relevantes e a escolha inadequada da forma funcional. Contudo, esta é a falsa AC, porque o modelo é que está mal especificado. - Manipulação de dados; - AC propriamente dita – é neste tipo de AC que nos vamos focar. A AC ocorre mais frequentemente, embora não exclusivamente, nas amostras de natureza temporal ou cronológica. Por exemplo, observações do mesmo indivíduo em

55 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

momentos ou períodos sucessivos são muitas vezes influenciadas por factores que exibem alguma persistência ao longo do tempo. A dependência do passado é, portanto, uma manifestação de AC. E quais são então as consequências de AC ao nível das propriedades dos estimadores de OLS? Tal como na presença de heteroscedasticidade, os estimadores de OLS são cêntricos e consistentes, mas não são de variância mínima (não são BLUE). Podemos continuar a estimar o modelo pelo método de OLS, no entanto a inferência estatística não é válida. A inferência estatística não é válida porque a variância dos estimadores de OLS é agora dada por: e não por Vamos então ter que conhecer um pouco mais os processos aleatórios, de modo a podermos utilizar padrões de AC, e assim ultrapassar o problema de não conhecermos a matriz .

PADRÕES/PROCESSOS DE AUTO-CORRELAÇÃO 1. O termo de perturbação todas as hipóteses clássicas).

(i.e., o termo de perturbação verifica

o o o

2. Processos Auto-Regressivos de ordem p: AR (p)

Mais concretamente, iremos focar o nosso estudo nos processos auto-regressivos de primeira ordem:

3. Processos de Médias Móveis de ordem q: MA(q)

56 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

4. Processos Auto-Regressivos e de Médias Móveis:

Iremos focar o nosso estudo apenas nos processos AR(1), em que a variável é definida segundo a sua própria expressão reportada a um instante precedente mais uma inovação no próprio período:

Dissemos atrás que essa inovação

cumpria as hipóteses clássicas:

o o o Quando o termo de perturbação segue um processo AR(1), então o seu valor actual pode escrever-se como uma combinação linear das realizações passadas, isto é:

Ou seja, apercebemo-nos de que o processo AR(1) tem memória infinita, já que a perturbação do período corrente é uma soma ponderada das inovações passadas e da inovação presente, sendo os pesos das inovações passadas cada vez menores quanto mais longínquo for o passo. Se assim é, podemos então chegar ao nosso objectivo de desvendar a matriz correspondente a um termo de perturbação que segue um processo do tipo AR(1):

Por outras palavras, quando um termo de perturbação segue um processo AR(1), a matriz de variâncias e covariâncias tem apenas 2 parâmetros: e . Por outro lado, conhecendo a matriz das variâncias e covariâncias do termo de perturbação, podemos apresentar as propriedades estatísticas destes processos AR(1):

57 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

MÉTODOS DE DETECÇÃO DE AC

MÉTODOS INFORMAIS Estes métodos informais consistem em procedimentos meramente sugestivos, mas não conclusivos, da presença de AC. Basicamente consistem em procedimentos de inspecção gráfica dos resíduos de estimação por OLS do modelo em estudo, já que os resíduos de estimação “imitam” o comportamento dos termos de perturbação. Uma vez que o modelo tem termo independente, serão nulas a soma e a média dos resíduos. Portanto, haverá resíduos de sinal positivo e de sinal negativo. Na ausência de problemas de AC, será de esperar que resíduos de um e de outro sinal se sucedam de forma casual, sem qualquer padrão aparente. Havendo AC, será de esperar a verificação de um de dois padrões: i) AC positiva (caso mais frequente em economia). É frequente em situações de AC positiva encontrarem-se longas sequências de valores do mesmo sinal. ii) AC negativa (caso menos frequente em economia). É a tendência para a alternância do sinal de resíduos consecutivos. Alguns gráficos ilustrativos:

Figura 1: Ausência de AC

58 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Figura 2: AC Positiva

Figura 3: AC Negativa

MÉTODOS FORMAIS Existe Auto-Correlação dos termos de perturbação? – O Teste de Durbin-Watson (DW) Algo fundamental que deve ser desde já apreendido é que o teste DW só pode ser aplicado se se verificar todo 1 conjunto de condições, a saber: 1- Detecção de AC que sejam geradas por processos AR(1). Caso se estejam perante processos como MA, AR(2), etc. o teste pode falhar. 2- O modelo contém termo independente; 3- As variáveis explicativas não são aleatórias.

59 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

4 – Na amostra não existam hiatos (falhas) na sequência das observações. A amostra deve consistir em observações respeitantes a períodos consecutivos, sem quebras ou interrupções que retirem comparabilidade às sucessivas diferenças. Destas 4 condições, sempre que nos coloquem em causa a aplicabilidade do teste DW, se nada nos for dito, assumimos a primeira condição, i.e., que a eventual AC é gerada por processos AR(1).

Operacionalização do teste DW: Passo 1: Estimar por OLS o modelo em estudo e obter os respectivos resíduos de estimação.

Passo 2: Calcular a estatística de teste:

Ora, sabendo que DW depende do estimador de , sendo que -1 < < 1, então também estará dentro do intervalo [-1;1]. E assim, podemos saber quais são os limites inferiores e superiores da estatística de DW:

Atentemos agora no seguinte gráfico, que traduz uma relação fundamental entre a estatística de DW e o estimador do coeficiente de correlação dos termos de perturbação.

60 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Se a estimativa do coeficiente de correlação for negativa – o que sugere a presença de AC negativa - então DW pertence ao intervalo [2,4]. Se a estimativa do coeficiente de correlação for positiva – o que sugere presença de AC positiva – então DW pertence ao intervalo [0,2]. No caso em que a estimativa do coeficiente de correlação é nula, então a situação sugere a ausência de AC (e DW é aproximadamente igual a 2). Perante esta relação, deve ficar bem claro que: - Quando DW < 2, então testamos a existência de AC positiva; - Quando DW > 2, então testamos a existência de AC negativa.

Passo 3: Com recursos às tabelas, obter os valores do limite inferior d L e do limite superior dU, do intervalo que contém o valor crítico da estatística de teste. Para determinar nas tabelas estes limites, temos que recorrer aos valores de T (número de períodos observados, K´=K-1, e o nível de significância .

Passo 4: (i) Testar a existência de AC positiva de primeira ordem do tipo AR(1), quando DW < 2

Regra de decisão: - Se DW < dL: rejeitar positiva.

, em favor de

e concluir pela existência de AC

- Se dL < DW < dU: indeterminada e o teste é inconclusivo; - Se DW > dU: não rejeitar

e concluir pela inexistência de AC do tipo AR(1)

(ii) Testar a existência de AC negativa de primeira ordem do tipo AR(1), quando DW > 2

Regra de decisão: - Se DW < 4 – dU: não rejeitar

e concluir pela inexistência de AC do tipo AR(1).

61 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

- Se 4 – dU < DW < 4 – dL: indeterminada e o teste é inconclusivo; - Se DW > 4 – dL: rejeitar negativa.

em favor de

:

e concluir pela existência de AC

Aplicação Prática do Teste DW - Modelo: As condições de aplicabilidade dos testes DW são verificadas, pois assume-se que a eventual existência de AC é gerada por processos AR(1); o modelo tem termo independente; a variável explicativa não é aleatória; assume-se que não existem falhas na sequência das observações da amostra em análise. Como a estatística DW está contida no intervalo [2,4] então testamos AC negativa. Nota: Qual o valor de ? Sabendo que

Depois, pesquisamos nas tabelas DW os valores T=24; K´=2-1=1;

tal que:

Como DW = 2,99 > 4 – dL = 2,727, então rejeitamos para e assim concluimos pela existência de AC negativa dos termos de perturbação deste modelo.

- Modelo: As condições de aplicabilidade do teste DW são verificadas, tal como se enunciou para o caso anterior. Como a estatística observada de DW está contida no intervalo [0,2] então iremos testar AC positiva.

Com recurso às tabelas e atendendo aos valores T=24; K=4-1=3;

, retiramos que:

62 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Como DW = 1,99 > dU = 1.656, então conclui-se para este nível de significância, e com base na informação estatística disponível, que não existe AC do tipo AR(1) dos termos de perturbação deste modelo.

Existe Auto-Correlação dos termos de perturbação? – O Teste de Breusch-Godfrey Vimos anteriormente que o teste DW exige todo um conjunto de condições de aplicabilidade. Iremos aqui destacar uma dessas limitações, nomeadamente o facto do teste DW apenas permitir testar a existência de AC que seguem um processo AR (1), i.e., entre duas realizações sucessivas de . Face a esta situação, o teste de Breusch-Godfrey permite testar a existência de AC de qualquer ordem p, nomeadamente, permite testar a hipótese de seguir um processo AR(p), isto é:

Operacionalização do teste de Breusch-Godfrey: Modelo Exemplo:

Passo 1: Estimar por OLS este modelo original e obter a série de resíduos.

Passo 2: Estimar por OLS a seguinte regressão auxiliar:

Passo 3: Formular as hipóteses de teste:

Passo 4: Calcular a estatística de teste:

63 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Depois, seguindo o procedimento habitual, se o valor observado da estatística de teste exceder o valor crítico, rejeita-se , o que constitui evidência estatística da existência de AC nos termos de perturbação. Finalmente, refira-se que o E-Views executa automaticamente este teste de BreuschGodfrey: modelo original/view/residual diagnostics/serial correlation LM test/lags to include: p = p – 1.

MÉTODOS DE ESTIMAÇÃO NA PRESENÇA DE AUTO-CORRELAÇÃO Havendo auto-correlação entre os termos de perturbação, então a inferência estatística é inválida, logo existe a necessidade de encontrarmos formas que permitam estimar o modelo em estudo e proceder à inferência estatística. A) A matriz Ω é conhecida, i.e., o valor de é conhecido, pois já vimos anteriormente que a matriz Ω dependia agora apenas deste parâmetro, quando a AC é gerada por processos AR(1). A solução será transformar o modelo original num modelo em que os termos de perturbação não sejam auto-correlacionados. E, estando esse MT corrido de AC, poderá ser depois perfeitamente estimado pelo método OLS e pode-se fazer inferência estatística. A transformação é feita através do método das diferenças generalizadas de primeira ordem. O método das diferenças generalizadas de primeira ordem é aplicado do seguinte modo: Partindo de um modelo original:

Sabendo que

:

Então, escreve-se o modelo para o período t-1 e multiplica-se pelo parâmetro

:

Fazendo (1) – (2):

Assim, esta transformação assegura que o novo termo de perturbação verifique as hipóteses clássicas, pelo que o modelo está corrigido de AC, podendo ser estimado por OLS e podendo ser feita inferência estatística.

64 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Entretanto, existem 3 aspectos importantes a destacar após fazermos a estimação do modelo assim transformado: 1 – Perdemos uma observação; 2 – A estimativa do termo independente dada pelo E-Views refere-se a e não a Assim, para se determinar o valor de , temos que calcular a seguinte expressão:

.

3 – A estimativa do desvio padrão do termo de perturbação dada pelo E-Views [S.E. of Regression] refere-se a e não a , como pretendemos. Então, para determinarmos o valor de , temos que calcular a seguinte expressão:

B) A matriz Ω é desconhecida, pelo que na prática.

é também desconhecido – o que acontece

Não sendo conhecido o coeficiente de correlação entre as observações do termo de perturbação, , o que se faz na prática é recorrer-se a estimadores consistentes de , para que os estimadores de OLS sejam assimptoticamente BLUE

Obtendo-se uma estimativa para , o que se faz é substituir esse valor no MT anterior (obtido pelo método das primeiras diferenças generalizadas) para se chegar a um modelo corrigido de AC. Que métodos existem para se obter consistente: i)

? Existem 3 vias para estimar

de forma

;

ii) Método de Cochrane-Orcutt: este método consiste em estimar por OLS o modelo original, obtendo a série de resíduos e estimando em seguida a seguinte equação:

65 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

iii) Método NLS: é um método que determina directamente todos os coeficientes de regressão do modelo original, não sendo necessária qualquer substituição da estimativa de no MT pelas primeiras diferenças generalizadas. Executa-se o seguinte comando no E-Views: estimate equation/y c x AR(1) No entanto, será sempre necessário ter em conta que:

C) O valor de

AR(1) =

é desconhecido e não é possível estimá-lo consistentemente

Poderemos aceitar as estimativas de OLS dos coeficientes de regressão, uma vez que os respectivos estimadores mantêm a centricidade e a consistência na presença de autocorrelação). Utilizar-se-á um estimador consistente da matriz de variâncias e covariâncias dos termos de perturbação que reponha a validade da inferência estatística – estimador de Newey-West. Notar que o estimador de Newey-West repõe a validade da inferência estatística tanto para o caso de AC como no caso de Heteroscedasticidade, pelo que no que a este último caso diz respeito, tanto é possível recorrer ao procedimento de White como ao procedimento de Newey-West. [Newey-West é um procedimento que repõe a validade da inferência estatística para todos os casos] No E-Views: modelo original/equation estimation/options/coefficient covariance matrix/HAC (Newey West).

Resolução do Exercício 8 Modelo: QUESTÃO 1

66 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Para analisar o comportamento da série dos resíduos de estimação ao longo do tempo, temos que criar uma variável T (de tempo) e depois construir um gráfico com a série de resíduos ao longo do tempo. Seja T = trend(2004M12).

Este comportamento da série dos resíduos nada nos permite concluir em termos de AC.

QUESTÃO 2 Em primeiro lugar, deve-se referir que se verificam as condições de aplicabilidade do teste (pressuposto: eventual AC é gerada por processo do tipo AR(1)). Estatística de DW = 1,276 < 2, pelo que iremos testar a existência de AC positiva.

Para T=40; K´=3-1=2; nível de significância de 5%, temos:

Como DW < , então, para um nível de significância de %, e com base na informação estatística disponível, conclui-se que existe AC positiva dos termos de perturbação do modelo.

QUESTÃO 3 Assume-se agora que Ou seja, temos:

.

67 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Regressão auxiliar:

=7,185575 ] Então, para um nível de significância de 5%, e face à informação estatística disponível, conclui-se pela existência de AC dos termos de perturbação do modelo original. Nota: No E-Views: modelo original/view/residual diagnostics/serial correlation LM test/lags to include: p=2

QUESTÃO 4 a) Neste caso sabemos que

.

Recorrendo ao método das primeiras diferenças generalizadas:

Sabendo que

:

Então, escreve-se o modelo para o período t-1 e multiplica-se pelo parâmetro :

68 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Fazendo (1) – (2): [Nota:

b) Supõe-se agora que não se conhece a correlação dos termos de perturbação. b.1) A partir do valor da estatística de DW:

Substituindo agora o valor de

Interpretação das estimativas? estima-se que quando a carga fiscal aumente em 1%, o preço do combustível aumente em cerca de 0,89%, ceteris paribus. como não faz sentido interpretar logaritmos, calculamos a exponencial de , isto é, 0,8. E assim, estima-se que o preço do combustível seria de 0,8€/litro, quando a carga fiscal é de 1€/litro e quando o preço do petróleo é de 1€/barril. NOTA: Se quiséssemos verificar se neste modelo transformado existia AC, não poderíamos recorrer ao teste DW, porque existem variáveis explicativas aleatórias (usamos valores estimados da correlação dos termos de perturbação), pelo que apenas poderíamos recorrer ao teste de BG.

b.2) Este método consiste em estimar por OLS o modelo original, obtendo a série de resíduos e estimando em seguida a seguinte equação:

69 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Estimando este modelo no E-Views retiramos que: modelo transformado:

. Substituindo no

b.3) Método NLS: [não é necessário substituir o valor da estimativa de este método dá directamente as estimativas dos coeficientes de regressão.

no MT pois

QUESTÃO 5 O que podemos dizer é que existe alguma disparidade nas estimações dos parâmetros. De facto, quanto maior for a amostra, mais próximos estarão os parâmetros – neste caso, como temos apenas 40 observações, percebe-se porque existe essa disparidade.

QUESTÃO 6 O procedimento de Newey-West torna válida a inferência estatística tanto no caso de heterocedasticidade como de homocedasticidade. No E-Views: modelo original/equation estimation/options/coefficient covariance matrix/HAC (Newey West).

70 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

TSI: log(FISC)

Sob

Como a estatística observada pertence à região crítica, para o nível de significância de 5%, e com base na informação estatística disponível, concluímos que a variável log(FISC) é estatisticamente significativa para explicar log(COMB).

71 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

MODELOS DE SÉRIES TEMPORAIS E PREVISÃO Os modelos de séries temporais modelizam e permitem prever o comportamento de uma variável a partir da informação contida nos valores passados dessa própria variável. Distinguem-se, portanto, dos modelos estruturais, que procuram explicar o comportamento de uma variável a partir de valores contemporâneos ou passados de outras variáveis (explicativas). Ao contrário dos modelos estruturais, os modelos de séries temporais são a-teóricos, i.e., não têm como base um modelo teórico sobre o comportamento da variável dependente. Qual a utilidade destes modelos? - São úteis quando as variáveis que explicam o comportamento da variável de interesse não são observáveis; - São úteis quando as variáveis que explicam o comportamento da variável de interesse são observadas com menor frequência do que naquela variável; - São úteis para fazer previsão para fora do período da amostra.

Conceito de Estacionaridade: uma série diz-se estacionária se tem média, variância e covariâncias constantes. Tipologia das séries temporais estacionárias: 1) Ruído Branco (White Noise) 2) Não Ruído Branco: i) AR; ii) MA; iii) ARMA

Uma série temporal identificada como um ruído branco é um processo sem estrutura discernível, isto é: o o o

72 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Uma variável segue um processo auto-regressivo AR(p) se o seu valor corrente depende apenas dos valores que a variável assumiu no passado (nos períodos passados) e de uma perturbação aleatória de espectro branco:

Estes processos AR têm memória infinita. O valor actual dos depende de todos os seus valores passados. A influência do passado decresce, portanto, com a distância que o separa do presente. Exemplo para o caso AR(1):

Uma variável segue um processo de média móvel, MA(q), se o seu valor corrente depende apenas dos valores correntes e passados de uma perturbação aleatória de espectro branco:

Um processo de médias móveis é uma combinação linear de termos de perturbação, como se pode constatar. Os processos de médias móveis têm memória finita, que se estende por um número de períodos igual ao da ordem do processo. Assim, para um processo MA(1), está correlacionado com mas com mais nenhum outro. Exemplo para o caso MA(1):

Os processos ARMA (p, q) são uma combinação de um processo AR(p) com um processo MA(q). segue um processo ARMA(p, q) se o seu valor corrente depende linearmente dos seus próprios valores passados bem como de uma combinação do valor corrente e dos valores passados de uma variável aleatória de espectro branco: ,

IDENTIFICAÇÃO DO PROCESSO O nosso objectivo será então saber identificar o processo que melhor capta as características da série temporal, e assim prever comportamentos futuros adequadamente. Para tal, vamos ter que atender a critérios de informação disponibilizados pelo E-Views: Akakie, Schwarz e Hannan-Quinn. São critérios de selecção de processos que atendem a duas das suas características (a soma dos quadrados dos resíduos e o número de

73 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

parâmetros). Neste sentido, o modelo que melhor descreve a série temporal será aquele que minimiza a SQR e o número de parâmetros do modelo. Portanto, o objectivo será escolher o modelo com o menor valor possível do critério de informação.

RESOLUÇÃO DO EXERCÍCIO 9 QUESTÃO 1: Havendo suspeita que os modelos ARMA (p, q) podem caracterizar o comportamento da série dos preços de habitação, iremos seleccionar de entre os vários modelos disponíveis até (p=2, q=2) aquele que melhor se adequa aos dados disponíveis. O critério que iremos escolher será, por exemplo, o critério de Akaike. Seja

.

Eis todas as situações possíveis:

Depois, estimamos cada um destes modelos no E-Views, de modo a obter a seguinte tabela: q\p

0

1

2

0

3.116024

3.064508

2.950966

1

3.086352

2.985245

2.961237

2

2.972583

2.965257

2.968493

O menor valor possível, que minimiza o critério Akaike, é o processo ARMA(2,0) = AR(2).

74 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

QUESTÃO 2 Antes de procedermos à previsão para estes 3 modelos alternativos, refira-se que se por ventura o modelo escolhido para se fazer previsão tivesse sido um ruído branco, então:

a) Supondo que 13

Ora, para fazermos previsão temos que trabalhar com o modelo ajustado, i.e., o modelo estimado. No entanto, algo muito importante tem de ser chamado à atenção, devido a uma particularidade dos modelos auto-regressivos, AR. É que, para estes modelos, da forma como estimamos na alínea anterior, nós não obtemos mas sim . [Nota: os restantes parâmetros estimados são os correctos]. Então, para obtermos o valor de temos que calcular:

Entretanto, podemos estimar os modelos AR de uma forma que o E-Views nos indica correctamente todos os valores dos parâmetros, inclusive de . Então, nesta alínea a), para estimar o modelo:

Executamos o comando: estimate equation/Y c Y(-1) Y(-2)

13

Notar que sempre que se diz que um termo de perturbação segue as hipóteses clássicas (HC) significa que se verificam as seguintes condições: 1. 2. 3.

75 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Obtemos então o ajustamento:

Tendo este modelo ajustado, podemos então fazer previsão para meses futuros. Devemos, para tal, ter em conta que o último período da amostra é 2007M05, ou seja, o período t. Previsão para 2007M06:

Previsão para 2007M07:

Temos que usar a estimativa porque já não dispomos deste dado.

Previsão para 2007M08:

Seguindo a mesma lógica: Previsão para 2007M09: 0.709014 Previsão para 2007M10: 0.713014 Previsão para 2007M11: 0.683794 Previsão para 2007M12: 0.680076 Devemos saber que o E-Views faz previsões automaticamente, e devemos prever também desta forma para confirmar se aqueles cálculos estão correctos. O procedimento é o seguinte: Sem seleccionarmos nenhuma informação: workfile/proc/structure size current page/frequency: Start Date: colocamos o primeiro período de previsão: neste caso 2007M06 End Date: colocamos o último período de previsão: neste caso 2007M12

76 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Em seguida vamos ao modelo que estimamos para podermos fazer as previsões/proc/forecast: forecast sample:2007M06 2007M12. [forecast name = previsão] Finalmente, em workfile foi criada a variável “previsão” com os valores da previsão que pretendíamos.

b) Supondo agora que

,

Executamos o comando: estimate equation/Y c MA(1) MA(2)

Previsão para 2007M06:

Previsão para 2007M07:

Seguindo a mesma lógia, obtemos: Previsão para 2007M08: 0.635992 Previsão para 2007M09: 0.635992 Previsão para 2007M10: 0.635992 Previsão para 2007M11: 0.635992 Previsão para 2007M12: 0.635992

Um bom previsor do resíduo de estimação é zero porque a soma dos resíduos de estimação é zero.

Como se pode constatar, estes processos de médias móveis têm memória finita, assumindo a partir de certo período o mesmo valor (que é o valor de )

c) Supondo agora que

Executamos o comando: estimate equation/ Y c Y(-1) Y(-2) MA(1) MA(2)

77 MÉTODOS ECONOMÉTRICOS E DE PREVISÃO

Obtemos o seguinte ajustamento:

Previsão para 2007M06: Da mesma forma, fazemos a previsão para os restantes meses (confirmar sempre pelo comando automático do E-Views).

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF