respostas gujarati.pdf
Short Description
Download respostas gujarati.pdf...
Description
Manual de Soluções • Econometria Básica • Gujarati
CAPÍTULO 1 A NATUREZA DA ANÁLISE DE REGRESSÃO
1.1 (a) A seguir temos a tabela com as taxas de inflação (%) calculadas ano sobre ano com início em 1974, pois não há dados anteriores a 1973. CANADÁ
FRANÇA
ALEMANHA
ITÁLIA
JAPÃO
10,78431 10,84071 7,584830 7,792208 8,950086 9,320695 9,971098 12,48357 10,86449 5,795574 4,282869 4,106972 4,128440 4,317181 4,054054 4,951299 4,795050 5,608856 1,537386 1,789401 0,202840 2,159244 1,585205 1,625488
13,58382 11,70483 9,567198 9,563410 9,108159 10,60870 13,67925 13,27801 11,96581 9,487459 7,669323 5,827937 2,534965 3,239557 2,725021 3,456592 3,341103 3,157895 2,405248 2,135231 1,602787 1,783265 2,021563 1,188904
6,847134 5,961252 4,360056 3,638814 2,730819 4,050633 5,474453 6,343714 5,314534 3,295572 2,392822 2,044791 –0,095420 0,191022 1,334604 2,728128 2,747253 3,654189 4,987102 4,504505 2,742947 1,830664 1,498127 1,697417
19,41748 17,07317 16,66667 19,34524 12,46883 15,52106 21,30518 19,30380 16,31300 14,93729 10,61508 8,609865 6,110652 4,591440 4,985119 6,591070 6,117021 6,390977 5,300353 4,250559 3,916309 5,369128 3,870652 1,745283
23,17328 11,69492 9,559939 8,171745 4,225352 3,685504 7,701422 4,840484 2,938090 1,732926 2,304609 1,958864 0,672430 0,000000 0,763359 2,367424 3,052729 3,231589 1,652174 1,283148 0,760135 –0,167645 0,167926 1,676446
(b)
REINO UNIDO 0,157706 0,244582 0,164179 0,158120 0,083026 0,134583 0,178679 0,119745 0,085324 0,046122 0,050100 0,060115 0,034203 0,041775 0,049290 0,077229 0,095344 0,058704 0,036966 0,015980 0,024803 0,033648 0,024557 0,031215
Estados Unidos 0,110360 0,091278 0,057621 0,065026 0,075908 0,113497 0,134986 0,103155 0,061606 0,032124 0,043173 0,035611 0,018587 0,036496 0,041373 0,048183 0,054032 0,042081 0,030103 0,029936 0,025606 0,028340 0,029528 0,022945
Manual de Soluções • Econometria Básica • Gujarati Legenda: PC = Canadá PF = França PG = Alemanha PI = Itália PJ = Japão PUK = Reino Unido PUS = Estados Unidos
(c) Pelo gráfico, pode–se ver que, com o passar dos anos, houve, em geral, diminuição da taxa de inflação de todos os países. (d) Pode–se usar o desvio-padrão como medida de flutuação das taxas. Para Canadá, França, Alemanha, Itália, Japão, Reino Unido e Estados Unidos os valores do desviopadrão são respectivamente 0,036, 0,044, 0,018, 0,062, 0,051 e 0,032. Encontramos, assim, a maior flutuação nas taxas da Itália, e a menor, nas da Alemanha.
1.2 (a) A seguir está o gráfico com a representação das taxas de inflação dos seis países em relação à dos Estados Unidos.
(b) O gráfico mostra que há correlação positiva entre as taxas de inflação dos seis países e a dos Estados Unidos. (c) Lembre–se de que correlação não implica causalidade. Talvez seja necessário consultar um livro de macroeconomia internacional para saber se há uma relação causal entre a taxa de inflação dos Estados Unidos e as dos outros países.
Manual de Soluções • Econometria Básica • Gujarati
1.3 (a) Para melhor visualização do gráfico, representamos o logaritmo da taxa de câmbio no eixo vertical e o tempo no eixo horizontal.
Como se vê, as taxas de câmbio apresentam considerável flutuação. Em 1977, por exemplo, um dólar americano valia 268 ienes, mas somente 94 ienes em 1995. (b) O cenário é, novamente, variado. Entre 1977 e 1995, por exemplo, o dólar americano se depreciou em relação ao iene, e daí começou a se apreciar. O panorama é semelhante em relação às outras moedas.
1.4 O gráfico da oferta de moeda M1, nos Estados Unidos, de janeiro de 1951 a setembro de 1999, é o seguinte:
À medida que o PIB cresce ao longo do tempo, faz–se naturalmente necessário ampliar a oferta de moeda para financiar o aumento da produção.
Manual de Soluções • Econometria Básica • Gujarati
1.5 Algumas das variáveis pertinentes seriam: (1) salários ou ganhos nas atividades criminosas; (2) salários ou ganhos por hora em atividades lícitas; (3) probabilidade de ser apanhado; (4) probabilidade de condenação; (5) sentença esperada após a condenação. Repare que não deve ser fácil conseguir dados sobre ganhos em atividades ilegais. Mesmo assim, consulte o artigo de Gary Becker citado no livrotexto.
1.6 Um fator essencial nessa análise seria a taxa de participação na força de trabalho (TPFT) de pessoas na faixa etária dos 65 aos 69 anos. Um aumento dessa taxa, se constatado após a entrada em vigência da nova lei, seria forte indício de que a lei anterior restringira artificialmente a participação desses cidadãos no mercado. Também seria interessante descobrir que tipos de empregos esses trabalhadores conseguem e quanto ganham. Os dados sobre PFT são coletados pelo Departamento do Trabalho (Estados Unidos).
1.7 (a), (b) & (c) De acordo com o gráfico, parece haver uma relação positiva, embora não muito forte, entre as duas variáveis, indicando que pode valer a pena anunciar. Do contrário, más notícias para a indústria da publicidade.
Vertical = Impressões Horizontal = Desppub
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 2 ANÁLISE DE REGRESSÃO COM DUAS VARIÁVEIS: ALGUMAS IDÉIAS BÁSICAS 2.1 A função informa como varia a resposta média das subpopulações de Y com os valores dados da(s) variável(is) explanatória(s). 2.2 A distinção entre as funções de regressão amostral e populacional é importante, pois aquela é um estimador desta. Na maioria dos casos, o que temos é uma amostra de observações da qual tentamos extrair informações sobre a população a que ela se refere. 2.3 Um modelo de regressão não é, de forma alguma, uma descrição absolutamente fiel da realidade. Assim, é certo que haverá diferenças entre o valor real do regressando e seus valores estimados pelo modelo escolhido. Tal diferença é simplesmente o termo de erro estocástico, cujas diversas formas são discutidas no texto. O resíduo é a contrapartida amostral do termo de erro estocástico. 2.4 Embora seja certo que podemos usar o valor médio, o desvio-padrão e outras medidas sumárias para descrever o comportamento do regressando, estamos em geral interessados em saber se há alguma força causal que o afeta. Se houver, poderemos fazer um melhor prognóstico do seu valor médio com a análise de regressão. Também não podemos esquecer que os modelos econométricos são quase sempre desenvolvidos para testar uma ou mais teorias econômicas. 2.5 É um modelo linear nos parâmetros, mas que pode ou não ser linear nas variáveis. 2.6 Os modelos (a), (b), (c) e (e) são modelos de regressão lineares (nos parâmetros). O modelo (d) também será linear se fizermos α = lnβ1. 2.7 (a) Aplicando o logaritmo natural, obtemos lnYi modelo de regressão linear.
=
β1+ β2 Xi + ui, que assim é um
(b) A seguinte transformação, conhecida como logit, faz deste um modelo de regressão linear: ln[(1-Yi)/Yi] = β1+ β2 Xi + ui. (c) Modelo de regressão linear. (d) Modelo de regressão não-linear. (e) Modelo de regressão não-linear, pois β2 está elevado ao cubo.
Manual de Soluções • Econometria Básica • Gujarati 2.8 Um modelo de regressão intrinsecamente linear é aquele que se pode fazer linear nos parâmetros, como o modelo em 2.7 (a). Se β2 na Questão 2.7 (d) fosse 0,8, esse −0,8( X − 2)
i pode ser facilmente calculado. seria um modelo de regressão linear, já que e 2.9 Todos são modelos de regressão intrinsecamente lineares, como demonstramos a seguir:
(a) A transformação (1/Yi) = β1+ β2 Xi converte o modelo em linear. (b) Escrever o modelo como (Xi/Yi) = β1+ β2 Xi converte-o em linear. (c) A transformação ln[(1-Yi)/Yi] = –β1–β2 Xi converte o modelo em linear. 2.10 O gráfico de dispersão indica que, em média, os salários nos países que exportam mais exibem maior crescimento real do que naqueles que exportam menos. É por isso que muitos países em desenvolvimento seguem uma política de crescimento voltada para a exportação. A linha de regressão traçada no gráfico é amostral, pois se baseia numa amostra de 50 países em desenvolvimento. 2.11 De acordo com o conhecidíssimo modelo de comércio de Heckscher-Ohlin, os países têm tendência a exportar mercadorias que, para serem produzidas, utilizem intensivamente seus fatores de produção mais abundantes. Em outras palavras, este modelo enfatiza a relação entre dotação de fatores e vantagem comparativa. 2.12 O gráfico de dispersão mostra que quanto mais alto o salário mínimo, mais baixo é o PNB per capita, indicando, portanto, que a legislação relativa à remuneração mínima pode não ser boa para os países em desenvolvimento, mas há controvérsia quanto a esse assunto. O resultado desse tipo de legislação pode depender do efeito que causa nos empregos, da natureza da indústria do local onde é imposta e da intensidade com que o governo a impõe. 2.13 É uma FRA porque se baseia numa amostra de 15 anos de observações. Os pontos dispersos em torno da linha de regressão são de dados reais. A diferença entre as despesas em consumo reais e as estimadas pela linha representa o resíduo (amostral). Além do PIB, fatores como riqueza, taxa de juros etc. podem afetar as despesas em consumo.
Manual de Soluções • Econometria Básica • Gujarati 2.14 (a) O gráfico de dispersão é o seguinte:
Vertical = TPFTCH Horizontal = TDCH A relação positiva entre as duas variáveis parece surpreendente porque se esperaria, a priori, que fossem negativamente relacionadas. Mas a hipótese do efeito do trabalhador adicional da Economia do Trabalho sugere que quando o desemprego aumenta, a força de trabalho secundária pode ingressar no mercado de trabalho para garantir alguma renda familiar. (b) Segue o gráfico de dispersão:
Manual de Soluções • Econometria Básica • Gujarati VERTICAL = TPFTCM HORIZONTAL = TDCM Parece que temos aqui em ação a hipótese do efeito desalento da Economia do Trabalho: o desemprego desestimula as mulheres a participarem da força de trabalho por não acreditarem que haja oportunidades de emprego. (c) A representação gráfica da TPFTCH em relação aos GHM82 mostra o seguinte:
VERTICAL = TPFTCH HORIZONTAL = GHM82 E representação gráfica correspondente para as mulheres é:
VERTICAL = TPFTCM HORIZONTAL = GHM82
Manual de Soluções • Econometria Básica • Gujarati Há uma relação assimétrica entre as duas variáveis para homens e mulheres. Os homens respondem positivamente a salários maiores, ao passo que as mulheres respondem negativamente, o que parece desconcertante. Pode ser que ganhos maiores resultantes de salários mais altos para os homens induzam as mulheres a se retirarem da força de trabalho, algo que pode acontecer com os casais. Mas é preciso ter cuidado, pois aqui estamos trabalhando com regressões simples de apenas duas variáveis. As conclusões anteriores podem mudar quando estudarmos análise de regressão múltipla. 2.15 (a) O gráfico de dispersão e a linha de regressão ficam assim:
Vertical = DESPALIM Horizontal = DESPTOT (b) Na média, à medida que crescem as despesas totais também crescem as despesas com alimentação. Mas há uma flutuação maior entre as duas depois que as despesas totais passam de Rs. 2000. (c) Não esperaríamos que as despesas com alimentação crescessem indefinidamente de forma linear (isto é, como uma linha reta). Satisfeitas as necessidades básicas das pessoas, elas gastarão menos em alimentação à medida que sua renda aumentar. Quer dizer, consumidores com renda mais alta fazem despesas mais discricionárias. Há sinais disso no gráfico de dispersão mostrado em (a): as despesas com alimentação mostram mais flutuação no nível de renda acima de Rs. 2000.
Manual de Soluções • Econometria Básica • Gujarati 2.16 (a) A representação gráfica da pontuação de homens e mulheres em aptidão verbal é a seguinte:
MALEVERB =VERBH FEMVERB = VERBM E a representação correspondente da pontuação de homens e mulheres em matemática é a seguinte:
MALEMATH = MATH FEMMATH = MATM (b) Ao longo dos anos, a pontuação de homens e mulheres em aptidão verbal mostra uma tendência descendente, enquanto depois de atingir o nível mais baixo em 1980, os cálculos mostram uma tendência ascendente, com variações ano a ano, é claro. (c) Pode-se elaborar um modelo de regressão simples, fazendo a regressão da pontuação em matemática contra a de aptidão verbal para ambos os sexos.
Manual de Soluções • Econometria Básica • Gujarati (d) O gráfico é o seguinte:
VERTICAL = VERBM HORIZONTAL = VERBH O gráfico mostra que as duas pontuações evoluíram na mesma direção ao longo do tempo.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 3 MODELO DE REGRESSÃO DE DUAS VARIÁVEIS: O PROBLEMA DA ESTIMAÇÃO
3.1 (1) Yi = β1+ β2Xi + ui, logo, E(Yi|Xi) = E[(β1+ β2Xi + ui)|Xi] E(Yi|Xi) = β1+ β2Xi + E(ui|Xi), visto que β1e β2 são constantes e X é não-estocástico. E(Yi|Xi) = β1+ β2Xi, já que E(ui|Xi) = 0, por premissa. (2) Dado que cov(uiuj)=0 para todo i,j (i≠j), então cov(YiYj) = E{[Yi - E(Yi)] [Yj - E(Yj)]} cov(YiYj) = E(uiuj), dos resultados em (1) cov(YiYj) = E(ui)E(uj), porque é premissa que os termos de erro não estão correlacionados, cov(YiYj) = 0, já que o valor médio de ui é zero, por premissa. (3) Dado que var(ui|Xi) = σ2, var(Yi|Xi) = E[Yi - E(Yi)]2 = E(ui2) = var(ui|Xi) = σ2, por premissa.
3.2
Logo, βˆ2 =
∑x y ∑x i
i
2 i
Yi
Xi
yi
xi
xi yi
xi 2
4
1
–3
–3
9
9
5
4
–2
0
0
0
7
5
0
1
0
1
12
6
5
2
10
4
soma
28
16
0
0
19
14
Nota:
Y = 7 e X = 4.
=
19 = 1,357; βˆ1 = Y − βˆ2 X = 1,572. 14
Manual de Soluções • Econometria Básica • Gujarati
3.3 A FRP é: Yi = β1+ β2Xi + ui. Situação 1: β1 = 0, β2 = 1, e E(ui) = 0, resultando E(Yi|Xi) = Xi Situação 2: β1 = 1, β2 = 0, e E(ui) = (Xi –1), o que dá E(Yi|Xi) = Xi, o mesmo resultado da situação 1. Logo, sem a premissa E(ui) = 0, não se pode estimar os parâmetros porque, como acabamos de demonstrar, a mesma distribuição condicional de Y é obtida, embora os valores presumidos dos parâmetros sejam bem diferentes nas duas situações.
3.4 Impondo a primeira restrição, obtemos:
∑ uˆ = ∑ (Y − βˆ − βˆ X ) = 0 , equação que, simplificada, dá a primeira equação i
i
1
2
i
normal. Impondo a segunda restrição, obtemos:
∑ uˆ X = ∑ ⎡⎣(Y − βˆ − βˆ X ) X ⎤⎦ = 0 , equação que, simplificada, dá a segunda equação i
i
i
1
2
i
i
normal. A primeira restrição corresponde à premissa de que E(ui|Xi) = 0. A segunda restrição corresponde à premissa de que não há correlação entre o termo de erro populacional e a variável explanatória Xi, isto é, cov(uiXi)=0.
3.5 Da desigualdade de Cauchy-Schwarz temos que
∑ (x y ) ∑x ∑y
E ( XY ) 2 ≤ 1. E ( X 2 ) E (Y 2 )
2
Ora, r = 2
i
2 i
i
2 i
≤ 1 , por analogia com a desigualdade de Cauchy–Schwarz, o que
também é verdadeiro para quadrado.
3.6 Observe que
β yx = ∑
ρ 2 , o coeficiente de correlação populacional elevado ao
xi yi
∑x
2 i
e que
β xy = ∑
xi yi
∑y
2 i
. Multiplicando as duas equações,
obtemos a expressão para r2, o coeficiente de correlação amostral elevado ao quadrado.
Manual de Soluções • Econometria Básica • Gujarati
3.7 Mesmo que βˆ yx ⋅ βˆxy = 1 , ainda faria diferença (pela causalidade e teoria) se fosse feita a regressão de Y contra X ou de X contra Y, pois o que é igual a um é somente o produto das duas, e isso não implica que βˆ yx = βˆxy .
3.8 As médias das duas variáveis são iguais a: Y = X =
e a correlação entre os dois rankings é: r =
∑x y ∑x ∑y i
2 i
n +1 , 2
i
2 i
,
(1) em que as letras minúsculas, como sempre, indicam desvio dos valores médios. Como os rankings são permutações dos n primeiros números naturais, então:
∑ xi2 = ∑ X i2 −
(∑ X i ) 2 n
=
n(n + 1)(2n + 1) n(n − 1) 2 n(n 2 − 1) − = 12 6 4
n(n 2 − 1) e, analogamente, ∑ y = , então 12 2 i
∑d
2
= ∑ ( X i − Yi ) 2 = ∑ ( X i2 + Yi 2 − 2 X iYi ) =
n(n + 1)(2n + 1) ∑ d − . ∑ X iYi = 6 2
2n(n + 1)(2n + 1) − 2∑ X iYi , logo 6
2
Como
(2)
X Y ∑ x y = ∑ X Y − ∑ n∑ i
i
i
i i
i
, usando (2), obtemos:
n(n + 1)(2n + 1) ∑ d n(n + 1) 2 n(n 2 − 1) ∑ d . − − = − 2 3 2 4 12 2
2
(3)
Agora, basta substituir as equações anteriores na equação (1) para obter a resposta.
Manual de Soluções • Econometria Básica • Gujarati
3.9 (a) βˆ1 = Y − βˆ2 X i e αˆ1 = Y − βˆ2 x [Observação: xi = ( X i − X ) ].
αˆ1 = Y
, já que
var ( βˆ1 ) =
∑X n∑ x
2 i 2 i
∑x
i
σ
2
= 0.
e var (αˆ1 ) =
∑x n∑ x
2 i 2 i
σ2
σ = 2
.
n
Logo, nem as estimativas nem as variâncias dos estimadores são iguais. (b) βˆ2 =
∑x y ∑x i
e αˆ1 =
i
2 i
∑x y ∑x i
i
, já que
2 i
É fácil verificar que var ( βˆ2 ) = var (αˆ 2 ) =
xi = ( X i − X )
σ2
∑x
2 i
.
Ou seja, as estimativas e as variâncias dos dois estimadores são idênticas. (c) Pode ser mais fácil usar o modelo II com números X grandes, embora com os rápidos computadores atuais isso não seja mais um problema.
∑x =∑y
= 0 , ou seja, a soma dos desvios em relação ao valor médio é sempre zero, x e y também são iguais a zero ( x = y = 0 ). Assim, βˆ1 = y − βˆ2 x = 0 . O 3.10 Como
i
i
fato relevante aqui é que se tanto Y quanto X forem expressas como desvios em relação às respectivas médias, a linha de regressão passará pela origem.
βˆ2 = ∑
( xi − x )( yi − y )
∑ ( xi − x )
2
=
∑x y i
xi2
i
, já que as médias das duas variáveis são iguais a
zero. Esta é a Equação (3.1.6) do livro-texto.
3.11 Sejam Z i = aX i + b e Wi = cYi + d , que, em formato de desvios, tornam–se
zi = axi e wi = cyi . Por definição, r2 =
∑z w ∑z ∑w i
2 i
i
2 i
ac ∑ xi yi
=
ac
∑ xi2 ∑ yi2
= r1 na Equação
(3.5.13) do texto.
3.12 (a) Verdadeira. Na Questão 3.11, façamos a e c iguais a -1 e b e d iguais a 0. (b) Falsa. Consultando novamente a Questão 3.11, veremos que será negativo.
Manual de Soluções • Econometria Básica • Gujarati
(c)
Verdadeira.
rxy = ryx > 0 ,
Como
Sx e
S y (os
respectivamente) são ambos positivos, e ryx =
β yx
desvios-padrão
de
X
e
Y
Sy Sx e rxy = β xy , então β xy e β yx Sx Sy
têm de ser positivos.
3.13 Sejam Z=X1+X2 e W=X2+X3. Em formato de desvios, podemos escrevê–las como z=x1+x2 e w=x2+x3. Por definição, a correlação entre Z e W é:
rzw =
∑z w ∑z ∑w i
i
2 i
2 i
∑ ( x + x )( x + x ) ∑ (x + x ) ∑ (x + x )
=
1
2
2
3
2
1
2
2
2
=
3
∑x (∑ x + ∑ x )(∑ x + ∑ x 2 2
2 1
2 2
2 2
2 3
,
porque
X1, X2 e X3 não são correlacionadas. (Nota: por conveniência, omitimos o subscrito de observação).
rzw =
σ2 (2σ 2 + 2σ 2
1 2 , em que σ é a variância comum. 2
=
O coeficiente não é zero porque os pares combinados são correlacionados, ainda que as variáveis X1, X2 e X3 não sejam individualmente correlacionadas. Como acabamos de demonstrar,
∑ zw = σ
2
, denotando que a covariância entre z e w
é uma constante diferente de zero. 3.14 Os resíduos e os valores ajustados de Y não mudarão. Sejam Yi = β1 + β 2 X i + ui e
Yi = α1 + α 2 Z i + ui , em que Z=2X. Empregando o formato de desvios, sabemos que
βˆ2 = ∑ 2
xy
x
αˆ 2 = ∑
, omitido o subscrito de observação.
zi yi
∑z
2 i
=
βˆ1 = Y − βˆ2 X
2∑ xi yi 4∑ x
2 i
=
1 ˆ β2 2
; αˆ1 = Y − αˆ 2 Z = βˆ1 (Nota: Z = 2 X )
Ou seja, o intercepto não é afetado. Em conseqüência, os valores ajustados de Y e os resíduos mantêm–se os mesmos ainda que Xi seja multiplicado por 2. A análise é análoga para o caso de uma constante ser somada a Xi.
Manual de Soluções • Econometria Básica • Gujarati
3.15 Por definição, ryyˆ = 2
∑ (βˆ x ) ∑y
ryy2ˆ =
2 i 2 i
2
=
(∑ yi yˆi ) 2 [∑ ( yˆi + uˆi )( yˆi )]2 = = (∑ yi2 )(∑ yˆi2 ) (∑ yi2 )(∑ yˆi2 )
βˆ22 ∑ xi2
∑y
2 i
∑ yˆ ∑y
2 i 2 i
, já que
∑ yˆ uˆ
i i
= 0.
= r 2 , aplicando a Equação (3.5.6) do texto.
3.16 (a) Falsa. A covariância pode assumir qualquer valor, e este depende das unidades de medida. O coeficiente de correlação, por outro lado, não tem unidades, é uma grandeza adimensional. (b) Falsa. Veja a Figura 3.11(h) no texto. Lembre–se de que o coeficiente de correlação é uma medida de relação linear entre duas variáveis. Daí, como mostra a Figura 3.11(h), há uma relação perfeita entre Y e X, mas ela não é linear. (c) Verdadeira. Em formato de desvios, temos yi = yˆ i + uˆi . Então é óbvio que se fizermos uma regressão de yi contra yˆi , o coeficiente angular será 1, e o intercepto será 0. Mas uma prova formal pode ser feita como segue: se fizermos uma regressão de yi contra yˆi , obteremos o coeficiente angular, digamos, αˆ , sob a forma
αˆ = ∑
yi yˆi βˆ ∑ xi yi βˆ 2 = 2 = 2 = 1 , porque yˆi = βˆ xi e 2 2 ˆ ˆ y x β ∑ ∑ i βˆ
∑x y i
i
= βˆ ∑ xi2 para o modelo de
duas variáveis. O intercepto nesta regressão é zero.
3.17 Escreva a regressão amostral assim: Yi = βˆ1 + uˆi . Pelo princípio dos mínimos quadrados, temos de minimizar: ao
único
parâmetro
∑ uˆ = ∑ (Y − βˆ )
conhecido
2 i
i
e
iguale
1
o
2
. Derive essa equação em relação resultado
a
zero
para
obter:
2 i
d (uˆ ) = 2∑ (Yi − βˆ1 )( − 1) = 0 , que simplificada dá βˆ1 = Y , ou seja, a média amostral. E d β1 sabemos que a variância da média amostral é e
σ2
a variância de Y. A SQR é
σ y2 n
, em que n é o tamanho da amostra
∑ (Yi − Y )2 = ∑ yi2 e σˆ 2 =
SQR ∑ yi2 . Vale a pena = (n − 1) (n − 1)
acrescentar a variável X ao modelo se ela reduzir σˆ significativamente, o que acontecerá se ela tiver qualquer influência sobre Y. Resumindo, o que pretendemos nos modelos de regressão é que as variáveis explanatórias possam dar um prognóstico 2
Manual de Soluções • Econometria Básica • Gujarati de Y melhor do que simplesmente seu valor médio. Em verdade, podemos ver isso formalmente. Recorde que para o modelo de duas variáveis obtido da Equação (3.5.2):SQR=STQ–SQE =
∑ y − ∑ yˆ = ∑ y 2 i
2 i
2 i
− βˆ22 ∑ xi2 . Logo, se βˆ2 for diferente de
zero, a SQR do modelo que tenha no mínimo um regressor será menor do que a do modelo sem regressor. É claro que se houver mais regressores no modelo e seus coeficientes angulares forem diferentes de zero, a SQR será muito menor do que no modelo sem regressor.
Problemas
3.18 Tirando a diferença entre os dois rankings, obtemos:
d
–2
1
–1
3
0
–1
–1
–2
1
2
d2
4
1
1
9
0
1
1
4
1
4
∑d2=26.
Assim,
o
rs = 1 −
2
6∑ d 2
n(n − 1)
= 1−
coeficiente
de
correlação
de
rankings
de
Spearman
é
6(26) = 0,842 . Há, portanto, um alto grau de correlação entre 10(102 − 1)
as posições dos estudantes nas provas de meio e de final de período: quanto mais alta ela for na primeira, mais alta será na segunda. 3.19 (a) O valor de –4,318 para o coeficiente angular indica que durante o período 1980–1994 a taxa de câmbio (marco/US$) baixou cerca de 4,32 unidades para cada unidade de aumento no preço relativo, em média. Isto é, o dólar americano depreciou, porque 1 dólar comprava menos marcos alemães. O valor de 6,682 para o intercepto, interpretado literalmente, significa que se a relação de preços relativos fosse zero, um dólar valeria 6,682 marcos alemães. Essa interpretação, é claro, não é economicamente significativa. (b) O valor negativo do coeficiente angular faz muito sentido econômico porque se os preços nos Estados Unidos subirem mais rapidamente do que os da Alemanha, os consumidores internos passarão a comprar mercadorias alemãs, aumentando assim a demanda pelo marco alemão, o que levará à sua apreciação. Esta é a essência da teoria da paridade do poder de compra (PPC), ou lei do preço único. (c) Acreditamos que, nesse caso, o coeficiente angular seria positivo, pois quanto maior fosse o IPC alemão em relação ao IPC americano, maior seria a taxa de inflação relativa na Alemanha, o que levaria à apreciação do dólar americano. Temos, outra vez, a essência da PPC.
Manual de Soluções • Econometria Básica • Gujarati
3.20 (a) Os gráficos de dispersão são os seguintes:
VERTICAL = REMSEMP HORIZONTAL = PRODSEMP
Vertical = REMSENA Horizontal = PRODSENA
Manual de Soluções • Econometria Básica • Gujarati (b) Os dois gráficos mostram que há uma relação positiva entre remuneração e produção, o que não é surpresa, considerando a teoria da produtividade marginal da Economia do Trabalho. (c) Os gráficos anteriores demonstram que a relação entre remuneração e produção, embora seja positiva, não é linear. É possível, portanto, que não se consiga um bom ajuste entre os dados e um modelo de regressão linear. Mas se, como de praxe, fizermos esse ajuste, teremos os seguintes resultados, nos quais SEMP é setor empresarial; SENA, setor empresarial não-agrícola; PROD, produção por hora; e REM, remuneração real por hora. REMSEMP = –109,3833 + 2,0039 PRODSEMP ep = (9,7119) (0,1176)
r2 = 0,8868
REMSENA = –123,6000 + 2,1386 PRODSENA ep = (11,0198) (0,1312)
r2 = 0,8777
Como esperado, a relação entre as duas é positiva. Surpreendentemente, o valor de r2 é bem alto. 3.21 Dados originais: Dados revisados:
∑ Yi
∑ Xi
∑ Xi Yi
∑ X i2
∑ Yi2
1110
1700
205500
322000
132100
1110
1680
204200
315400
133300
Portanto, o coeficiente de correlação corrigido é 0,9688. 3.22 (a) Se representarmos estas variáveis em relação ao tempo, veremos que, em geral, subiram. Há, no caso do ouro, considerável volatilidade de preço. (b) Se a hipótese fosse verdadeira, seria de se esperar que β 2 ≥ 1 . (c) Preço do ourot = –186,183 + 1,842 IPCt ep = (125,403) (1,125)
r2 = 0,150
NYSEt = –102,060 + 2,129 IPCt ep = (23,767) (0,230) r2 = 0,868 Parece que o mercado de ações é melhor garantia contra a inflação do que o ouro. Como veremos no Capítulo 5, o coeficiente angular da equação do preço do ouro não é estatisticamente significativo.
Manual de Soluções • Econometria Básica • Gujarati 3.23 (a) Segue o gráfico, em que PIBN e PIBR são, respectivamente, PIB nominal e PIB real.
NGDP = PIBN RGDP = PIBR (b) PIBNt = –986,3317 + 201,9772 tempo ep = (1907,715) + 128,7820 PIBRt = 1907,715 + 128,7820 tempo ep = (45,1329) (1,9666)
r2 = 0,9277 r2 = 0,9914
(c) Nesse caso, o coeficiente angular informa a taxa de variação do PIB por intervalo de tempo. (d) A diferença entre os dois representa a inflação ao longo do tempo. (e) Como indicam o gráfico e os resultados da regressão, o PIB nominal tem crescido mais rápido que o PIB real, sugerindo que a inflação tem subido com o passar do tempo. 3.24 Este é simples e direto. 3.25 (a) Veja o gráfico do Exercício 2.16(d). (b) Seguem os resultados da regressão, em que Y é a pontuação das mulheres em aptidão verbal e X, a dos homens:
Yˆt = -198,126 + 1,436 X t ep = (25,211)
(0,057)
r2 = 0,966.
Manual de Soluções • Econometria Básica • Gujarati (c) Como ressaltamos no texto, uma relação estatística, por mais forte que seja, não determina causalidade, a qual tem de ser estabelecida a priori. Neste caso, não há razão para suspeitar de relação causal entre as duas variáveis. 3.26 Os resultados da regressão são:
Yˆt = -189,057 + 1,285 X t ep = (40,927)
(0,082)
r2 = 0,918.
3.27 Este é para ser feito em sala de aula.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 4 A PREMISSA DA NORMALIDADE: MODELO NORMAL DE REGRESSÃO LINEAR CLÁSSICO (MNRLC) Exercícios do Apêndice 4A. 4.1 Dado que o coeficiente de correlação entre Y1 e Y2, ρ, é igual a zero, a função de densidade de probabilidade normal bivariada (de duas variáveis) fica reduzida a:
⎡ 1 ⎛ Y − μ ⎞2 1 ⎛ Y − μ ⎞2 ⎤ 1 2 2 f (Y1 , Y2 ) = exp ⎢ − ⎜ 1 ⎟ − ⎜ ⎟ ⎥ 2πσ 1σ 2 ⎢⎣ 2 ⎝ σ 1 ⎠ 2 ⎝ σ 2 ⎠ ⎥⎦ ⎧⎪ 1 ⎡ 1 ⎛ Y − μ ⎞ 2 ⎤ ⎫⎪ ⎧⎪ 1 ⎡ 1 ⎛ Y − μ ⎞ 2 ⎤ ⎫⎪ 1 1 2 =⎨ exp ⎢ − ⎜ exp ⎢ − ⎜ 2 ⎟ ⎥⎬ ⎨ ⎟ ⎥ ⎬ = f (Y1 ) f (Y2 ) , em que 2 σ 2 σ σ 2 π σ 2 π ⎢⎣ ⎢⎣ 1 2 ⎝ ⎠ ⎦⎥ ⎪⎭ ⎪⎩ 2 ⎝ ⎠ ⎥⎦ ⎪⎭ ⎪⎩ 1 f (Y1 ) e f (Y2 ) são as funções de densidade de probabilidade normal univariadas (de 1
uma variável). Então, quando ρ for zero,
f (Y1 , Y2 ) = f (Y1 ) f (Y2 ) , o que é a condição
para independência estatística. Portanto, no caso normal bivariado, a correlação zero implica independência estatística. 4.2 Para assegurar que os estimadores de máxima verossimilhança maximizem a função de verossimilhança, as derivadas segundas da Equação (5) do Apêndice 4A têm de ser menores que zero, o que garantirá que a SQR seja minimizada.
∂ 2 ln LF n =− 2 1 INCLINAÇÃO > 1; SLOPE < 1 INCLINAÇÃO SQRSR, a menos que as restrições sejam válidas, caso em que os dois termos serão iguais. Relembrando que R = 1 − 2
SQRSR SQRR SQR 2 ≥ RR2 = 1 − , temos RSR = 1 − . SQT SQT SQT
Manual de Soluções • Econometria Básica • Gujarati Repare que quer usemos a regressão com restrições quer aquela sem restrições, a n
SQT permanece a mesma, já que é simplesmente igual a
∑ (Y − Y ) . i
2
1
8.5 (a) Seja β* = (β2 + β3 – 1) o coeficiente de log K. Teste a hipótese nula de que β* = 0 com o teste t habitual. Se houver mesmo retornos de escala constantes, o valor t será pequeno. (b) Se definirmos que a relação produção/capital, medida da produtividade do capital, é (Y/K), e que a relação mão-de-obra/capital é (L/K), o coeficiente angular dessa regressão dará a variação média percentual da produtividade do capital para um percentual de variação da relação mão-de-obra/capital. (c) Embora a análise seja simétrica, se assumirmos que há retornos de escala constantes, então o coeficiente angular dará a variação média percentual da produtividade da mão-de-obra (Y/L) para um percentual de variação da relação capital/mão-de-obra (K/L). O que distingue os países desenvolvidos daqueles em desenvolvimento é a elevada relação capital/mão-de-obra existente nas economias dos primeiros.
8.6 Comece escrevendo assim a Equação (8.5.11):
F=
(n − k ) R 2 , que pode ser (k − 1)(1 − R 2 )
(k − 1) R2 = . Daí, com algumas manipulações algébricas, obtemos: (n − k ) (1 − R 2 ) F (k − 1) R2 = , que é o resultado que queríamos. F (k − 1) + (n − k )
reescrita:
F
Para a regressão (8.2.1), n = 64 e k = 3. Portanto, aproximadamente. (Nota: Use gl 60 em vez de 62). Levando esses valores à fórmula anterior de
F0,05(2,62) R²,
=
3,15,
obtemos:
2(3,15) 6,30 R2 = = = 0, 0936 . 2(3,15) + 61 67,3 Este é o valor crítico de R² no nível de significância de 5%. Como o valor observado de R² de 0,07077 em (8.2.1) excede em muito o valor crítico, rejeitamos a hipótese nula de que o verdadeiro R² é zero. 8.7 Como a Equação (2) é uma forma com restrições da Equação (1), podemos calcular primeiro a relação F dada na Equação (8.5.18):
F=
2 2 ( Rnovo − Rvelho ) /1 (0,9776 − 0,9388) = = 27, 033 . 2 (1 − Rnovo )(n − k ) (1 − 0,9776) /17
Agora, lembre-se de que
F1,17 = t172 . Ou seja, 27, 033 = t172 , que dá t = 27, 033 = 5,1993 .
Sob a hipótese nula de que o coeficiente angular verdadeiro da variável tendência seja
Manual de Soluções • Econometria Básica • Gujarati zero, obtemos:
t=
βˆ3 , ep ( βˆ3 )
daí ep ( βˆ3 ) =
βˆ3 t
=
23,195 = 4, 461 , que, devido aos erros de 5,1993
arredondamento, é aproximadamente igual a 4,2750. 8.8
Uma
forma
alternativa
de = ui ,
escrever que
o
primeiro podemos
modelo é reescrever:
ln Yi − ln X 2i = α1 + α 2 ln X 2i + α 3 ln X 3i ln Yi = α1 + (1 + α 2 ) ln X 2i + α 3 ln X 3i = ui . O modelo anterior e o segundo, com os
coeficientes β, são agora, no que tange às observações, os mesmos, com as seguintes relações entre os coeficientes α e β:
βˆ2 = (1 + α 2 ) ; βˆ3 = αˆ 3
e
βˆ1 = αˆ1 .
Os erros-padrão dos coeficientes β estimados podem, portanto, ser facilmente obtidos por meio daqueles dos coeficientes α estimados, já conhecidos. 8.9 A melhor maneira de entender esse termo é encontrar as taxas de variação de Y (despesas pessoais de consumo) em relação a X2 a X3, que são:
δY = β2 + β4 X 3 δ X2
e
δY = β3 + β 4 X 2 . δ X3
Como vemos, a variação média das despesas pessoais de consumo em relação à renda pessoal depende não só desta, mas também do nível de riqueza pessoal. Analogamente, a variação média das despesas pessoais de consumo em relação ao nível de riqueza pessoal depende não só deste, mas também da renda pessoal. Ou seja, as variáveis renda pessoal e riqueza interagem. Podemos contornar isso introduzindo essas variáveis na regressão em formato interativo, ou multiplicativo, além do formato aditivo. A variável DPC só será independente da variável riqueza quando β4 for igual a zero. 8.10 Relembrando as relações entre as distribuições t e F, sabemos pela primeira equação que: F1,(n – k) = t2 n- k. Portanto, F = (-4,728)² = 22,3540. Pela Equação (8.5.11) do texto, temos
F=
(n − k ) R 2 (n − 2)(0, 6149) = = 22,3540 . 2 (k − 1)(1 − R ) (1)(0,3851)
Resolvendo essa equação para n, obtemos n ≈ 16. Nota: Na primeira equação, k = 2 e R² = 0,6149. 8.11
1
1. Improvável, a não ser para o caso de colinearidade muito alta. 2. Provável. Casos como esse ocorrem freqüentemente no trabalho prático. 3. Provável. Essa seria, em verdade, uma situação ideal. 4. Provável. O modelo de regressão é inútil nessa situação. 5. Poderia ocorrer no caso de a significância de um coeficiente ser insuficiente para compensar a insignificância do outro 1 . 6. Improvável.
Para uma discussão mais extensa deste assunto, consulte A Dictionary of Econometrics, de Adrian C. Darnell, Editora Edward Elgar, Reino Unido, 1994, pp. 394-395.
Manual de Soluções • Econometria Básica • Gujarati 8.12 Consulte os resultados da regressão do Exercício 7.21. (a) Usando a TJCP como taxa de juros, as elasticidades renda real e taxa de juros são, respectivamente, 0,5243 e -0,0255. Usando a TJLP, as elasticidades correspondentes são 0,4946 e -0,0516. (b) Individualmente, a elasticidade renda é significativa em ambos os casos, mas as elasticidades taxa de juros, não. (c) Usando a versão R² do teste F dado na Equação (8.5.11), os valores F são 21,5429 (aplicando a TJCP) e 21,3078 (aplicando a TJLP). Os valores p desses F são quase zero em ambos os casos, levando à rejeição da hipótese de que a renda real e a taxa de juros não têm, coletivamente, impacto na demanda por moeda. (d) Nesse caso, a hipótese nula é que o coeficiente de elasticidade de renda é um. Para testá-la, usaremos o teste t como segue:
(0,5243 − 1) = −3, 2920 ; 0,1445 (0, 4946 − 1) - com a TJLP como variável taxa de juros, t = = −1,8816 . 0, 2686 - com a TJCP como variável taxa de juros, t =
Com 19 observações e dois regressores, temos gl 16. Como a expectativa é de que o coeficiente de elasticidade renda seja positivo, podemos aplicar um teste unicaudal. O valor t crítico unicaudal para gl 16 a 5% é 1,746. Podemos, nesse nível de significância, rejeitar a hipótese nula de que a elasticidade renda é igual a um. Ela é, na verdade, menor que um. 8.13 (a) A elasticidade é -1,34, significativamente diferente de zero, pois o valor t sob a hipótese nula de que o coeficiente de elasticidade verdadeiro é igual a zero é
t=
−1, 43 = 4, 4687 . 0,32
O valor p de se obter tal t é extremamente baixo. O coeficiente não é, entretanto, diferente de um porque, sob a hipótese nula de que a elasticidade verdadeira é igual a 1, temos t =
−1,34 − 1 = −1, 0625 , que não é estatisticamente significativo. 0,32
(b) A elasticidade renda, embora positiva, não é estatisticamente diferente de zero, pois o valor t sob a hipótese nula é menor que 1. (c) Aplicando a fórmula (7.8.4), obtemos
R 2 = 1 − (1 − R 2 )
n −1 n−k
2
Já que neste caso temos R =0,27, n = 46 e k = 3, basta substituir esses dados na equação e verificar que R² = 0,3026, aproximadamente.
Manual de Soluções • Econometria Básica • Gujarati 8.14 (a) A expectativa, a priori, é de que o salário e as outras variáveis explanatórias sejam positivamente relacionados, e são mesmo. O coeficiente parcial de 0,280 significa que, ceteris paribus, a elasticidade do salário do CEO é de 0,28%. O coeficiente 0,0174 significa que, ceteris paribus, se a taxa de retorno sobre o patrimônio subir um ponto percentual (atenção, não é o mesmo que 1%), o salário do CEO sobe cerca de 1,07%. Analogamente, também ceteris paribus, se a taxa de retorno sobre as ações da empresa subir um ponto percentual, o salário do CEO sobe cerca de 0,024%. (b) Sob a hipótese nula individual, ou separada, de que cada um dos coeficientes populacionais verdadeiros é igual a zero, podemos obter os valores t simplesmente dividindo cada coeficiente estimado pelo seu erro-padrão. Esses t para os quatro coeficientes dados no modelo são, respectivamente, 13,5, 8, 4,25 e 0,44. Como a amostra é bastante grande, podemos ver, aplicando a regra prática 2-t, que os três primeiros coeficientes são, em termos estatísticos, muito significativos individualmente, e o último é insignificante. (c) Para testar a significância geral, isto é, todos os coeficientes angulares são iguais a zero, aplique o teste F dado em (8.5.11):
F=
R 2 /(k − 1) 0, 283 / 3 = = 27, 02 2 (1 − R ) /(n − k ) 0, 717 / 205
Esse valor, sob a hipótese nula, tem a distribuição F com respectivamente, 3 e 205 gl no numerador e denominador. O valor p de se obter tal F é extremamente pequeno, levando à rejeição da hipótese nula. (d) Como a variável dependente está em forma logarítmica, e roe e ros em forma linear, os coeficientes dessas variáveis fornecem semi-elasticidades, isto é, a taxa de crescimento da variável dependente em relação à variação de uma unidade (em valor absoluto) do regressor. 8.15 Aplicando a Equação (3.5.8), podemos verificar que: r12 = 0,9989; r13 = 0,9885 e r12 = 0,9839, e com as fórmulas dadas na Seção 7.11, que: r12.3 = 0,9705; r13.2 = 0,678 e r23.1 = -0,4930. Utilizando o teste Fischer dado no exercício, averiguamos que:
t12.3 =
r12.3 15 − 1 − 2 2 1 − r12.3
= 13,590 .
Procedendo exatamente da mesma forma, encontramos t13.2 = 3, 20 e t23.1 = 1,963 . Todos esses valores t são estatisticamente significativos no nível de 5%. 8.16 (a) Os logaritmos dos índices dos preços reais e das taxas de juros no ano anterior explicam cerca de 79% da variação no logaritmo do estoque de tratores, um tipo de capital. Como este é um modelo duplo-log, os dois coeficientes angulares são elasticidades (parciais) preço, cujos sinais são os esperados a priori. (b) Cada coeficiente angular parcial é individualmente significativo no nível de 5% e significativamente diferente de um.
Manual de Soluções • Econometria Básica • Gujarati (c) Da Equação (8.5.12) do texto, obtemos
F=
0, 793 / 2 R 2 /(k − 1) = 53, 63 . = 2 (1 − R ) /(n − k ) 0, 207 / 28
Para n = 31 e k = 3, verificamos que esse valor F é muito significativo. (d) Veja o item (a). (e) Aplique o teste F dado em (c). 8.17 (a) Ceteris paribus, um aumento de uma libra esterlina nos preços do produto final no ano corrente leva a um aumento médio de 0,34 libras esterlinas nos salários e ordenados por empregado. Analogamente, um aumento de uma libra esterlina nos preços do produto final no ano anterior leva a um aumento de cerca de 0,004 libras esterlinas nos salários e ordenados por empregado. Mantendo-se todos os outros fatores constantes, um aumento de um ponto percentual na taxa de desemprego leva a um decréscimo de 2,56 libras esterlinas nos salários e ordenados por empregado, em média. Os três regressores explicaram cerca de 87% da variação do regressando. (b) Se dividirmos os coeficientes estimados pelos seus erros-padrão, obteremos os valores t sob a hipótese nula de que os valores dos coeficientes populacionais verdadeiros são zero. Os t estimados para os três coeficientes angulares são 4,55, 0,055 e -3,89, respectivamente. O primeiro e o terceiro são estatisticamente significativos, mas o segundo, não. (c) Como estudaremos no capítulo sobre modelos de defasagem distribuída, esta variável é incluída para medir o efeito da defasagem, se houver, dos preços do produto final um ano antes. (d) Como o valor t desse coeficiente não é significativo, a variável pode ser excluída, desde que isso não represente o erro de especificação de omissão de uma variável importante. Veremos mais sobre isso no capítulo sobre especificação do modelo. (e) Use a seguinte fórmula (padrão) de elasticidade:
∂W U U = −2,56 em que as ∂U W W
barras sobre as variáveis denotam seus valores médios em toda a amostra. 8.18 (a) Ceteris paribus, um aumento de um ponto percentual na taxa de vagas abertas leva a um aumento médio de 5,29 libras esterlinas nos salários e ordenados por empregado. Um aumento de 1 libra no PIB por pessoa leva a um decréscimo de cerca de 0,12 libra nos salários e ordenados por empregado. Um aumento de 1 libra nos preços das importações no ano corrente e no anterior leva a um aumento médio de 0,05 libra nos salários e ordenados por empregado. (b) assim como no exercício anterior, sob a hipótese nula zero, os valores t estimados para as quatro variáveis explanatórias são, respectivamente, 6,51, -1,04, 2,45 e 2,42, e todos, exceto o segundo, são estatisticamente significativos.
Manual de Soluções • Econometria Básica • Gujarati (c) Seria de se esperar, a priori, que uma produtividade per capita mais elevada levasse a salários e ordenados maiores. Mas este não é o caso no exemplo em questão, porque o coeficiente estimado, em termos estatísticos, não é significativamente diferente de zero, já que seu valor t é só -1. (d) Seu objetivo é contornar o efeito nos salários e ordenados da defasagem distribuída dos preços das importações do ano corrente e do anterior. Se esses preços sobem, espera-se que o custo de vida também suba e, conseqüentemente, salários e ordenados. (e) A variável X pode ser retirada do modelo – desde que, é claro, não haja erro de especificação -- porque tem o sinal errado, e seu valor t é baixo. (f) Use o seguinte teste F:
F=
R 2 /(k − 1) 0,934 / 4 = = 49,53 , um valor muito 2 (1 − R ) /(n − k ) 0, 66 /14
significativo. Para 4 graus de liberdade (gl) no numerador e 14 no denominador, o valor F é 5,04 no nível de significância de 1%.
8.19 O teste estatístico para a elasticidade renda é t =
0, 4515 − 1 = −22, 2065 , valor 0, 0247
muito significativo que refuta a hipótese de que a elasticidade verdadeira é 1. Para a elasticidade preço, o teste estatístico é t =
−0,3772 − (−1) = −9,808 , valor 0, 0635
também significativo que nos leva a concluir que a elasticidade preço verdadeira é diferente de -1. 8.20 A hipótese nula é que β2 = - β3, ou seja, β2 + β3 = 0. Aplicando o teste estatístico dado na Equação (8.6.5) do texto, obtemos
t=
0, 4515 + ( −0,3772)
(0, 0247) 2 + (0, 0635) 2 − 2( −0, 0014)
= 0,859 , valor que não é significativo no nível
de, digamos, 5%. Não há, então, nenhuma razão para rejeitarmos a hipótese nula. 8.21 (a) A elasticidade preço próprio é -1,274. (b) Pelo teste t, obtemos t =
1, 274 − 0 = 2, 4174 . 0,527
O valor p de se obter tal t estatístico sob a hipótese nula é cerca de 0,034, que é baixo. Rejeitamos, então, a hipótese de que a elasticidade preço verdadeira é zero. (c) Usando mais uma vez a fórmula-padrão, temos t =
−1, 274 − (−1) = −0,5199 , valor 0,527
que não é estatisticamente significativo, levando-nos, portanto, a não rejeitar a hipótese de que a elasticidade preço verdadeira é um.
Manual de Soluções • Econometria Básica • Gujarati (d) Embora nenhuma das duas variáveis seja estatisticamente significativa, espera-se que ambas tenham sinal positivo. (e) Talvez a amostra seja pequena demais para detectarmos a significância estatística dos preços dos cravos ou da renda na demanda por rosas. Além disso, os gastos com rosas devem ser uma parte tão pequena da renda total que não se nota nela seu impacto. 8.22 (a) Os coeficientes de X2 e X3 são estatisticamente significativos, mas os de X4 X5 não o são. (b) Sim. Aplicando o teste F, obtemos F =
e
0, 656 / 4 = 12,392 , valor que a 5% (1 − 0, 656) / 26
para 4 e 26 gl é 2,74. Rejeitamos, pois, H0. (c) Usando o modelo semilogarítimico, obtemos: log(prospecções) = 2,53203 – 0,0127 tempo valor t = (38,3766) (-3,3514)
r² = 0,2792.
Portanto, a taxa de crescimento instantânea é -1,27%, assim como a taxa de crescimento composta correspondente. (Tome o antilogaritmo de -0,0127, que vale 0,9873, subtraia dele 1 e multiplique por 100). [N] Nota: Para valores pequenos de r, ln(1+r) ≈ r. 8.23 (a) Consulte os resultados da regressão dada no Exercício 7.18. Espera-se, a priori, que todos os coeficientes angulares sejam positivos, o que é verdade, exceto para a variável vendas militares dos Estados Unidos. O valor R² é bem alto, mas o modelo parece, em geral, satisfatório. (b) Podemos usar a versão R² da tabela ANOVA (8.5) do texto. Fonte da variação Devido à regressão Devido resíduos STQ
aos
SQ 0,978 (
gl
∑y
87,782 (
2 i
)
∑y
2 i
1071,975
Sob a hipótese nula habitual, a razão F é F =
)
MSQ
4
0,978∑ yi2
22
4 0, 022∑ yi2 15
23
0,978 / 4 = 166,33 , valor obviamente 0, 022 /15
muito significativo, levando à rejeição da hipótese nula de que todos os coeficientes angulares são simultaneamente iguais a zero. Em outras palavras, as quatro variáveis têm, em conjunto, impacto significativo nos gastos com defesa.
Manual de Soluções • Econometria Básica • Gujarati 8.24 (a) Essa função permite que os produtos marginais de mão-de-obra e capital subam antes de acabarem caindo e leva em conta a elasticidade variável de substituição, ao contrário da função de produção Cobb-Douglas normal, que não leva isso em conta e em que os produtos marginais caem desde o início. (b) Se β4 = β5 = 0, então e0 = 1. Este é o modelo-padrão. (c) Pode-se usar o teste F dos mínimos quadrados restritos. (d) Os resultados são os seguintes: Variável dependente: LOG(PIB) Amostra: 1955 1974 Observações incluídas: 20 Variável Coeficiente C -11,70601 LOG(MÃO-DE-OBRA) 1,410377 LOG(CAPITAL) 0,942699 MÃO-DE-OBRA -9,06E-05 CAPITAL -3,54E-07 R-quadrado 0,999042 R-quadrado ajustado
0,998787
E.P. da regressão Soma quad resíduos Verossimilhança Log Estat Durbin-Watson
0,013289 0,002649 60,91475 1,065992
Erro-padrão Estatística-t 2,876300 -4,069814 0,590731 2,387512 0,194542 4,845735 4,35E-05 -2,082179 4,15E-07 -0,853032 Variável dependente média Desvio-padrão da variável dependente Critério info Akaike Critério Schwarz Estatística-F Probabilidade (Estatística-F)
Probabilidade 0,0010 0,0306 0,0002 0,0549 0,4071 12,22605 0,381497 -5,591475 -5,342542 3911,007 0,000000
Esses cálculos mostram que os resultados são mistos, pois enquanto o coeficiente de mão-de-obra é estatisticamente significativo, o de capital não o é. Compare esses resultados com os do Exemplo 8.3 do livro-texto, obtidos com a função de produção Cobb-Douglas normal. 8.25 (a) Sim. O índice do preço do combustível é negativo e estatisticamente significativo no nível de 1%. (b) A perda de produtividade foi de 6,48% [(-0,1081)(60%)]. (c) A taxa de crescimento tendencial da produtividade foi de 0,45%. (d) Em média, para a amostra, um aumento de 1% na relação mão-de-obra/capital leva a um aumento de 0,71% na produtividade. (e) Veja a Questão 8.11. Se cada coeficiente individual for estatisticamente significativo, então é improvável que R² = 0. No caso em tela,
F=
0,98 / 3 = 1928,37 , valor muito significativo, de forma que se pode rejeitar a (1 − 0,98) /118
hipótese de que R² é zero.
Manual de Soluções • Econometria Básica • Gujarati 8.26 (a) Segundo o software Eviews 3 os resultados são os seguintes:
Variável dependente: Y Amostra: 1968 1983 Observações incluídas: 16 Variável C X2 X3 X4 X5 X6 R-quadrado
Coeficiente 5962,656 4,883663 2,363956 -819,1287 12,01048 -851,3927 0,822750
R-quadrado ajustado
0,734125
E.P. da regressão Soma quad resíduos Verossimilhança Log Estat Durbin-Watson
627,6005 3938824 -122,0134 2,484497
Erro–padrão Estatística-t 2507,724 2,377716 2,512542 1,943714 0,843559 2,802361 187,7072 -4,363863 147,0496 0,081676 292,1447 -2,914284 Variável dependente média Desvio-padrão da variável dependente Critério info Akaike Critério Schwarz Estatística-F Probabilidade (Estatística-F)
Probabilidade 0,0388 0,0806 0,0187 0,0014 0,9365 0,0155 7543,125 1217,152 16,00168 16,29140 9,283507 0,001615
(b) Seria esperado que β2, β3 e β6 fossem positivos e β4 e β5, negativos. (c) β2, β3 e β4 estão de acordo com as expectativas, mas os outros, não. (d) De acordo com os resultados da regressão, X3, X4 e X6 são significativos no nível de 5%, e X2 no nível de 10%, mas X5 é estatisticamente insignificante. (e) Aplicamos a metodologia dos mínimos quadrados restritos discutida no capítulo. 2 Regressando Y contra X2, X3 e X4 somente, obtemos RR = 0,6012. Incluindo todos os regressores, como se vê em (a), temos RSR = 0,8227. Portanto, aplicando a Equação 2
(8.7.10), obtemos F =
(0,8227 − 0, 6012) / 2 = 6, 25 . (1 − 0,8227) /10
Para gl 2 e 10 no numerador e denominador, respectivamente, o valor F crítico a 5% é 4,10. Rejeitamos, portanto, a hipótese de que as variáveis X5 e X6 não se encaixam no modelo. 8.27 (a) Como ambos são modelos log-lineares, os coeficientes angulares estimados representam a elasticidade (parcial) da variável dependente em relação ao regressor sob observação. Por exemplo, o coeficiente 0,94 na Equação (3) significa que se a produção em kWh aumenta 1%, em média, o custo total de produção sobe em 0,94%. Analogamente, na Equação (4), se o preço da mão-de-obra em relação ao preço do combustível sobe 1%, em média, o custo relativo de produção sobe 0,51%.
Manual de Soluções • Econometria Básica • Gujarati (b)
Use
a
estatística
F
como
segue:
( SQRR − SQRSR ) / NR (0,364 − 0,336) /1 = = 1, 012 , em que NR é o número de F= (1 − SQRSR ) / n − k (1 − 0,336) / 24
restrições. Esse F não é significativo. No nível de 5%, e para gl 1 e 24 no numerador e denominador, respectivamente, o valor F crítico é 4,26. Logo, não rejeitamos a hipótese nula de que a soma das elasticidades preço é igual a um. Nota: Não use a versão R² do teste F dado em (8.7.10) do texto, pois as variáveis dependentes nas Equações (3) e (4) não são as mesmas.
8.28 (a) Não. O
γ3
estimado é significativamente diferente de zero, pois seu valor t é
5,3. (b) Sim, já que ela lança luz sobre a validade da teoria. Além disso, é estatisticamente significativa, como observado em (a). (c) Não. O retorno parece alto demais para letras do tesouro dos Estados Unidos. (d) Não. Novamente, parece muito alto. (e) Uma pesquisa na literatura recente sobre CAPM indica que o modelo pode não ser adequado a todas as situações. 8.29 Discutiremos apenas os resultados baseados na TJCP, pois os baseados na TJLP são análogos. O modelo em (a) do Exercício 7.21 é o modelo irrestrito e aquele em (b), o restrito. Como as variáveis dependentes são diferentes nos dois, usaremos o teste F dado na Equação (8.7.9) do texto. As SQR com e sem restrições valem, respectivamente, 0,0772 e 0,0463. Repare que aplicamos apenas uma restrição, a de que o coeficiente de Y no primeiro modelo é um.
F=
(0, 0772 − 0, 0463) /1 = 10, 69 . (0, 0463) /(19 − 3)
Para gl 1 e 16, numerador e denominador, respectivamente, o valor F crítico a 5% é 4,49. Então, rejeitamos o modelo restrito e concluímos que a elasticidade verdadeira renda é menor que um. 8.30 Precisamos saber a covariância entre os dois estimadores dos coeficientes angulares para usar o teste t dado em (8.7.4) do texto. A partir dos dados fornecidos,
Manual de Soluções • Econometria Básica • Gujarati
cov( βˆ2 , βˆ3 ) = −0,3319 . Aplicando (8.7.4) aos dados do México, (0,3397 + 0,8460 − 1) = 1,94 . obtemos: t = 0, 0345 + 0, 0087 + 2(−0, 0173) podemos mostrar que
Pela tabela t, vemos que o valor t bicaudal a 5% é 2,12. Assim, nesse nível de significância, não rejeitamos a hipótese de retornos constantes de escala, muito embora numericamente a soma dos dois coeficientes (1,19) seja maior que um. 8.31(a) A priori, deveríamos esperar uma relação positiva entre MI (mortalidade infantil) e TFT (taxa de fertilidade total), pois quanto maior o número de filhos de uma mulher, maior a probabilidade de aumento da mortalidade devido à saúde e outros fatores. (b) Os coeficientes de PNBpc não são muito diferentes, mas o de TAF é. Podemos usar o teste t para saber se a diferença é real. Suponha que usemos a Equação (1) e que, por hipótese, o coeficiente verdadeiro de PNBpc seja -1,7680. Podemos agora aplicar o
−2, 2316 − (−1, 7680) −0, 4636 = − 2, 2086 , valor que é maior que 2 0, 2099 0, 2099
seguinte teste: t =
em termos absolutos, levando à rejeição da hipótese de que o coeficiente verdadeiro é igual a -1,7680. Repare que usamos aqui a regra prática 2-t, uma vez que o número de observações é razoavelmente alto. (c) Podemos encarar o modelo (1) como a versão com restrições do modelo (2) e podemos, então, usar a versão R² do teste F dado em (8.7.10) do texto, pois as variáveis dos dois modelos são as mesmas. A estatística F resultante é a seguinte:
F=
(0, 07474 − 0, 7077) /1 0, 0397 = = 9, 4523 (1 − 0, 7474) /(64 − 4) 0, 0042
Sob as premissas normais, esse valor tem a distribuição F com 1 e 60 gl no numerador e denominador, respectivamente. O F crítico para esses gl a 1% é 7,08. Como o F calculado excede esse valor crítico, podemos rejeitar o modelo restrito (1) e concluir que a variável TFT deve ser mantida. (d) Relembre que
F1,k = tk2 . Portanto, extraindo a raiz quadrada (positiva) do valor F
dado em (c), temos
t = 9, 4523 = 3, 0744 .
Logo, sob a hipótese nula de que o valor verdadeiro do coeficiente de TFT no modelo (2) é zero, podemos obter o erro-padrão do coeficiente TFT estimado dividindo-o pelo valor t: ep =
12,8686 = 4,1857 . 3, 0744
8.32 (a) O coeficiente angular do modelo I nos informa que para cada incremento de uma unidade nos gastos com publicidade, temos, em média, um aumento de 0,363 unidades nas impressões retidas. A taxa (média) de crescimento das impressões no modelo II depende do nível de gastos com publicidade. Tirando a derivada de Y em relação a X, obtemos
dY = 1, 0847 − 0, 008 X , um indicativo de que as impressões dX
Manual de Soluções • Econometria Básica • Gujarati retidas aumentam a uma taxa decrescente conforme aumentam os gastos com publicidade. (b) & (c) Podemos encarar o modelo I como a versão condensada, ou restrita, do modelo II e, por isso, aplicar a técnica dos mínimos quadrados restritos para escolher entre os dois. Como a variável dependente é a mesma em ambos, podemos usar a versão R² do teste F dado em (8.7.10). Seguem os resultados:
F=
(0,53 − 0, 424) /1 0,106 = = 4, 0613 , valor que, sob as premissas normais do teste (1 − 0,53) /18 0, 0261
F, segue a distribuição F com 1 e 18 gl no numerador e denominador, respectivamente, com valor F crítico de 4,41 no nível de 5% e 3,01 no nível de 10%. O valor p é 0,0591 a cerca de 6%, próximo dos 5%. Parece que devemos manter no modelo a variável X². (d) Há retornos decrescentes nos gastos com publicidade, conforme observado em (b). Se o coeficiente do termo X² fosse positivo, os retornos com tais gastos teriam sido crescentes. Igualando a derivada em (b) a zero, temos 1,0847 = 0,008X, logo X = 135,58, valor em que a taxa de crescimento de Y em relação a X é zero. Como X é medido em milhões de dólares, pode-se dizer que no nível de gastos da ordem de 136 milhões de dólares não há mais nenhum ganho nas impressões retidas, medidas em milhões. 8.33 (a) Aplicando os dados da regressão (7.9.4) no teste t (8.7.4), obtemos:
t=
(1, 4988 + 0, 4899 − 1) (0,5398) + (0,1020) − 2(0, 03843) 2
2
=
0,9887 = 2, 0849 . 0, 4742
Como 15 é o tamanho da amostra, temos gl 12. O valor t anterior é significativo no nível de 5%, indicando que talvez tenha havido retornos de escala crescentes no setor agrícola taiwanês. (b) Impondo a restrição de constantes retornos de escala, os resultados da regressão são os seguintes:
⎛ Y ⎞ ⎛ X3 ⎞ ln ⎜ ⎟ = 1, 7086 + 0, 6129 ln ⎜ ⎟ ⎝ X2 ⎠ ⎝ X2 ⎠ ep = (0,4159)
(0,0933)
R² = 0,7685
SQR = 0,0915.
A SQR sem restrições, SQRSR, pela regressão (7.9.4) é 0,0672 e a SQR com restrições, SQRR, pela regressão em (b), é 0,0915. Com o teste F dado em (8.7.9), obtemos
F=
(0, 0915 − 0, 0672) /1 = 4,3393 . Sob as premissas habituais do teste F, esse valor (0, 0672) /12
tem distribuição F com 1gl no numerador e 12 gl no denominador. O valor p de se obter um F de 4,34 ou maior é de 0,0593 ou cerca de 6%, próximo do nível de significância de 5%. Parece, novamente, que houve retornos de escala crescentes no setor agrícola taiwanês.
Manual de Soluções • Econometria Básica • Gujarati Observe que a pequena diferença nos níveis de significância de t e F deve-se a erros de arredondamento. Repare também que, como as variáveis dependentes são diferentes nos modelos com e sem restrições, não podemos usar versão R² do teste F. 8.34 Seguindo exatamente os mesmos procedimentos mostrados na Seção 8.8 do texto, aqui vão as várias somas dos quadrados dos resíduos: SQR1 = 1953,639 (1970–1982) SQR2 = 9616,213 (1983–1995) SQRR = 23248,30 (1970–1995), que é a SQR com restrições. A SQRSR = (1953,639+9616,213) = 11569,852. Com o teste F, obtemos F =
( SQRR − SQRSR ) / k (11678, 448) / 2 = = 11,1032 . ( SQRSR ) /( n1 + n2 − 2k ) (11569,852) / 22
O valor p de se obter um valor F de 11 ou mais é cerca de 0,0005, uma probabilidade mesmo muito pequena. Embora a conclusão geral deste exercício e do exemplo visto na Seção 8.8 do texto seja a mesma, isto é, que houve uma variação estatisticamente significativa na regressão poupança-renda, a resposta depende do ponto de quebra escolhido para dividir a amostra, como vemos pelos valores F.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 9 MODELOS DE REGRESSÃO COM VARIÁVEIS BINÁRIAS 9.1 (a) Se o intercepto estiver presente no modelo, inclua 11 variáveis binárias. Caso contrário, inclua 12. (b) Se o intercepto não estiver no modelo (isto é, regressão pela origem), introduza seis variáveis binárias. Caso contrário, introduza apenas cinco. 9.2 (a) De acordo com a teoria econômica, espera-se que os coeficientes de X2 e X5 sejam positivos, e os de X3, X8 e X9, negativos. O de X4 pode ser positivo ou negativo, dependendo da idade da esposa e do número de filhos. Uma variável binária interativa para idade e filhos com menos de 6 anos ou entre 6 e 13 anos talvez esclareça melhor a relação entre idade e horas de trabalho desejadas. (b) Mantendo-se todos os outros fatores constantes, espera-se que a variável horas de trabalho desejadas seja maior que o valor do intercepto (comum) de 1286 horas, mas esse coeficiente tem sinal negativo, e como não é estatisticamente significativo, pouco se pode dizer sobre o impacto de X6 em Y (média). Quanto a X7, espera-se que seu coeficiente seja positivo, e é mesmo. Além disso, é estatisticamente significativo, pois o valor t é bem alto. (c) Isso talvez se deva às colinearidades entre a idade e a escolaridade e entre estas e o número de filhos. Repare também que o modelo não inclui os anos de estudo completados pelo marido. 9.3 (a) Espera-se que a relação entre as duas variáveis seja negativa porque se a taxa de desemprego for alta, indicando excesso de oferta de mão-de-obra no mercado de trabalho, é menos provável que os empregadores anunciem vagas em aberto. (b) Ela é 3,8998 (=2,7491+1,1507). Como o coeficiente da variável binária é estatisticamente significativo, a taxa de desemprego é estatisticamente maior no período após o quarto trimestre de 1966 do que era antes dele. (c) Como o coeficiente diferencial da variável binária é quase significativo no nível de 5%, podemos dizer que os coeficientes angulares da função de regressão são diferentes nos dois períodos. (d) É muito provável que sim. O governo, ao tornar os benefícios-desemprego mais generosos, reduz o custo de oportunidade de se permanecer desempregado. 9.4 Os resultados mostram que o preço médio por barril em 1974 estava US$5,22 mais alto do que nos outros anos da amostra, mas o coeficiente angular, US$0,30, é o mesmo em todo o período. O gráfico se assemelha ao da Figura 9.3 b do texto com a linha de regressão para 1974 iniciando no ponto 5,22 do eixo vertical e para os outros anos passando pela origem, mas ambas com o mesmo coeficiente angular de 0,30.
Manual de Soluções • Econometria Básica • Gujarati 9.5 (a) Homens: E (Yi ) = (α1 + α 2 ) + β X i . Mulheres: E (Yi ) = α1 + β X i . Mantendo X constante, o salário médio dos homens é diferente por
α2 .
(b) Homens: E (Yi ) = (α1 + 2α 2 ) + β X i . Mulheres: E (Yi ) = (α1 + α 2 ) + β X i . Mantendo X constante, o salário médio dos homens também neste caso é diferente por
α2 .
(c) Homens: E (Yi ) = (α1 − α 2 ) + β X i . Mulheres: E (Yi ) = (α1 + α 2 ) + β X i . Mantendo X constante, a diferença entre o salário médio das mulheres e dos homens é 2α 2 . Como a escala da variável binária é arbitrária, a escolha não afetará a resposta, pois nenhum método apresenta vantagens sobre o outro. 9.6 Conforme o Capítulo 8, podemos usar o seguinte teste t:
t=
( βˆ2 − βˆ3 ) − ( β 2 − β3 ) . ep( βˆ − βˆ ) 2
Mas sob a hipótese nula de que equação
passa
a
β 2 = β3 ,
ser
3
o segundo termo do numerador dessa
zero.
Repare
também
que
ep( βˆ2 − βˆ3 ) = [var( βˆ2 ) + var( βˆ3 ) − 2 cov( βˆ2 , βˆ3 )] . Pode-se mostrar, para o nosso exemplo, que ep( βˆ − βˆ ) = 84,8392. 2
3
Portanto, a estatística anterior torna-se t =
245,3750 − 347, 6250 = −1, 2055 , valor que 84,8392
não é significativo e leva à conclusão de que os coeficientes de D2 e D3, embora sejam ambos em termos estatísticos significativamente diferentes do intercepto do primeiro trimestre, não o são um do outro. Exatamente pelas mesmas razões, para testar a hipótese de que os coeficientes de D2 e D4 são iguais, obtemos t =
245,3750 − (−62,1250) = 3, 6245 , valor estatisticamente 84,8392
significativo, indicando que os coeficientes de D2 e D4 são diferentes. A resposta à última parte da pergunta é, em geral, não. Em termos lógicos, se A for diferente de B e também for diferente de C, isso não implica necessariamente que B e C sejam diferentes. Pode-se, é claro, aplicar o teste t para responder a essa pergunta numericamente. 9.7 (a) & (b) Os erros-padrão dos coeficientes da regressão (9.5.6) podem ser obtidos diretamente de (9.5.4). Mas para obter os erros-padrão dos coeficientes em (9.5.7), teremos de achar os de (αˆ1 + αˆ 2 ) e os de
( βˆ1 + βˆ2 ) por meio da conhecida fórmula
estatística para o erro-padrão da soma ou diferença de dois ou mais coeficientes, que está na dica do Exercício 9.6. Para aplicá-la, precisamos das covariâncias dos termos envolvidos na soma e diferença dos coeficientes, sem as quais não poderemos calcular os erros-padrão. Para o nosso exemplo, var (αˆ1 ) = 406,6205; var (αˆ 2 ) = 1094,443;
Manual de Soluções • Econometria Básica • Gujarati var ( βˆ1 ) = 0,00021; var ( βˆ2 ) = 0,000255; cov (αˆ1 , αˆ 2 ) = –406,6205 e cov ( βˆ1 , βˆ2 ) = – 0,00021. Portanto: ep (αˆ1 + αˆ 2 ) =
[406, 6205 + 1094, 443 − 2(406, 6205)] = 26, 2263 e
ep ( βˆ1 + βˆ2 ) =
[0, 00021 + 0, 000255 − 2(0, 00021)] = 0, 0067 .
Nota: Esses ep são um tanto diferentes daqueles informados em (8.8.2a) devido a erros de arredondamento e aproximação. 9.8 (a) Desprezando por enquanto as variáveis binárias, cada coeficiente angular estimado representa uma elasticidade, pois essa regressão é duplo-log. Então, se X2 (número total de agências do banco) subir em média 1%, as horas trabalhadas pelos auditores do FDIC sobem cerca de 0,22%, refletindo talvez alguma economia de escala. Deve-se interpretar da mesma forma os outros coeficientes das variáveis X logarítmicas que, a priori, espera-se que sejam positivos, e são mesmo. (b) & (c) Como o regressando está em forma logarítmica, temos de interpretar os coeficientes das variáveis binárias de acordo com a sugestão de Halvorsen e Palmquist. Tire o antilogaritimo de cada coeficiente estimado ligado a uma variável binária e subtraia-lhe um. Multiplique o resultado por 100, o que dará a variação percentual do regressando quando a variável binária for do estado zero para o estado um. Considere, por exemplo, o coeficiente de D4, que é –0,2572. Tirando seu antilogaritmo, achamos 0,7732; subtraindo-lhe um e multiplicando o resultado por 100, obteremos -22,68%. Então, se a auditoria for realizada em conjunto com o órgão estadual competente, as horas trabalhadas pelos auditores da FDIC caem cerca de 23%. Deve-se interpretar da mesma forma os outros coeficientes das variáveis binárias. 9.9 (a) & (c) Ceteris paribus, se a taxa de inflação esperada subir um ponto percentual, espera-se que a taxa de juros das letras do Tesouro dos Estados Unidos (TL) caia cerca de 0,13 ponto percentual, o que, em termos econômicos, não faz sentido. Contudo, o coeficiente da TL não é estatisticamente significativo, pois seu valor t é só –1,34. Se a taxa de desemprego subir um ponto percentual, espera-se que a taxa média da TL caia 0,71 ponto percentual. Esse coeficiente é estatisticamente significativo, pois seu valor t é –4,24. Além disso, faz sentido em termos econômicos, pois uma taxa de desemprego mais alta significa que a economia está em queda, e o Fed, para revigorá-la, provavelmente reduziria a taxa da TL. Se a variação na base monetária subir uma unidade, em média, espera-se que a taxa da TL caia, pois um aumento nessa base leva, por meio do efeito multiplicador, a um aumento na oferta de moeda, que terá o efeito de reduzir a taxa de juros, ceteris paribus. O valor defasado de Y é positivo, estatisticamente significativo e leva em conta a dinâmica da variação, assunto que será discutido no capítulo sobre modelos de defasagem distribuída. (b) No final de 1979, o então diretor do Federal Reserve System (o Banco Central dos Estados Unidos), Paul Volker, mudou a política monetária – cuja meta era a taxa de juros e passou a ser a base monetária – com o objetivo de reduzir a (comparativamente) alta taxa de inflação que havia então na economia dos Estados Unidos. Com o aperto da base monetária, que levou a aumentos na taxa da TL, a taxa de inflação acabou caindo consideravelmente. A propósito, repare que o coeficiente da variável binária é estatisticamente significativo.
Manual de Soluções • Econometria Básica • Gujarati 9.10 Escreva assim o modelo: Yi = α1 + α 2 D + β1 X i + β 2 ( X i − X *) D + ui , em que D=1, quando Xi>X* e D=0, se Xi X * ) = (α1 + α 2 ) + ( β1 + β 2 )( X i − X * ) Então, quando Xi excede X*, o intercepto varia por α2 e o coeficiente angular por β2. 9.11 (a) Essa designação das variáveis binárias presume uma diferença constante (proporcional): a escala da loja de rede é 10 vezes a daquela de descontos, e a da loja de conveniência é 10 vezes a de rede (ou 100 vezes a da loja de descontos). Isto é, obviamente, arbitrário. (b) Como esperado, os refrigerantes de marca são mais caros do que aqueles sem marca. Os resultados também indicam que recipientes menores são mais caros que os maiores, também como esperado. O modelo explica cerca de 60% da variação do preço dos refrigerantes. (c) A variável binária tem os valores mais elevados atribuídos aos menores recipientes. 9.12 (a) O coeficiente da variável renda em formato logarítmico é uma semielasticidade, ou seja, representa a variação absoluta da expectativa de vida para uma variação percentual na renda. (b) Esse coeficiente mostra que é provável que a expectativa média de vida aumente 0,0939 anos se a renda per capita aumentar 1%, ceteris paribus. (Veja o Capítulo 6 sobre o modelo lin-log). (c) Esse regressor foi incluído para contornar o efeito sobre a expectativa de vida dos aumentos crescentes da renda per capita acima do valor limite de US$1097. O regressor também informa o número de anos adicionais que se pode esperar viver quando a renda passa de US$1097. O valor do coeficiente estimado não é, entretanto, estatisticamente significativo, pois seu valor p é de 0,1618. (d) A equação da regressão para os países cuja renda per capita está abaixo do nível de 1097 dólares americanos é –2,40+9,39 lnXi , e para os países cuja renda está acima desse nível é –2,40+(9,39–3,36) lnXi + (3,36)(7) = 21,12 + 6,03 lnXi. Embora numericamente as duas regressões pareçam diferentes, não o são estatisticamente, pois o coeficiente do último termo da equação é zero em termos estatísticos. Se considerarmos países mais ricos aqueles com renda per capita maior que US$1097, parece não haver entre estes e os outros mais pobres nenhuma diferença estatística perceptível na expectativa de vida. 9.13 (a) & (b) β1 dá o valor esperado de Y para as 20 primeiras observações e β2 dá a variação do valor esperado de Y para as 30 observações seguintes, sendo (β1 + β2 ) o valor esperado real de Y para as últimas 30 observações.
Manual de Soluções • Econometria Básica • Gujarati (c) Pela conhecida fórmula para achar a soma ou a diferença de duas ou mais variáveis aleatórias (veja Apêndice A do texto) pode-se demonstrar que
var( βˆ1 + βˆ2 ) = var( βˆ1 ) + var( βˆ2 ) + 2cov( βˆ1 , βˆ2 ) .
Para
obter
os
valores
numéricos,
aplicamos as fórmulas dados no Capítulo 3 para o modelo de duas variáveis. Temos, então:
var( βˆ ) = 1
∑D n∑ ( D − D ) 2 i
σ2 = 2
i
1 ⎛ 30 ⎞ ˆ ⎜ ⎟ 300 = 15 e var( β 2 ) = 50 ⎝ 12 ⎠
σ2
∑ ( D − D)
=
2
i
300 = 25 . 12
Isso nos informa que a covariância entre os dois estimadores é 15. Juntando esses números todos, temos Nota: Verifique que
var( βˆ1 + βˆ2 ) = 10 .
∑ ( D − D)
2
i
= 12 .
9.14 (a) A relação esperada entre as duas variáveis é negativa. (b). Sim, confirmam. (c) & (d) Nos estados em que não havia leis de direito ao trabalho, a média de empregados que pertenciam a sindicatos era de 19,8%. Por outro lado, nos estados com essas leis, essa média era 9,39 pontos percentuais menor, aproximadamente, com um total real de sindicalizados de 10,42%.
9.15 Pelas fórmulas dos MQO dadas no Capítulo 3, temos
βˆ2 = ∑
( Di − D)Yi
∑ ( D − D)
2
i
(1) É fácil verificar que D =
∑D
i
n
=
n n n2 . ( Di − D ) = 1 , se D = 1 e − 2 , se D = 0. n n n
O denominador da Equação (1) pode ser escrito como segue: n1 n2 nn ⎛ −n ⎞ ⎛n ⎞ 2 2 ( ) ( ) ( Di − D ) 2 = n1 ⎜ 2 ⎟ + n2 ⎜ 1 ⎟ = 1 2 . D − D = D − D + ∑ i ∑ ∑ i n ⎝ n ⎠ ⎝n⎠ i =1 i =1 2
2
E
o
seu
numerador como: n1
n2
i =1
i =1
∑ ( Di − D)Yi = ∑ ( Di − D)Yi + ∑ ( Di − D)Yi = − intercepto é dado por
9.16 (a) 2,4%.
βˆ1 + Y − βˆ2 D
n2 n1
n1
∑ Yi + i =1
1 n2
n2
∑Y = Y i =1
i
2
− Y1 = Ycs − Ysg , e o
que, depois das substituições fica βˆ1 = Ysg .
Manual de Soluções • Econometria Básica • Gujarati (b) Como tanto o intercepto diferencial quanto os coeficientes angulares são muito significativos, os níveis e as taxas de crescimento da população são diferentes nos dois períodos. Essa taxa para o período anterior a 1978 é de 1,5% e para o posterior, 2,6%(= 1,5%+1,1%). Problemas 2 9.17 Fazendo a regressão separadamente para os dois períodos, encontramos σˆ1 = 2 0,00768 (gl = 30) para o primeiro e σˆ 2 = 0,03638 (gl = 17) para o segundo. Então,
sob a premissa de que as variâncias das populações respectivas são as mesmas, e de acordo com a Equação (8.8.8), a relação a seguir está de acordo com a distribuição F:
F=
σˆ 22 F . σˆ 22 ( n − k ),( n − k ) 1
2
No nosso exemplo, k = 2, n1 = 32 e n2 = 19. Levando esses valores à expressão anterior, obtemos F = 4,7369. O valor p de se obter um F de 4,7369 ou maior é de 0,00001, muito pequeno. A conclusão é que as variâncias nos dois subperíodos não são iguais. 9.18 A variável dependente nos modelos (9.7.3) e (9.7.4) é a mesma, então podemos usar a versão R² do teste F dado na Equação (8.7.10). No caso em tela, obtemos o R² 2 2 restrito ( RR ) de (9.7.3), que vale 0,5318, e o irrestrito ( RSR ) vale 0,7298 e é dado por (9.7.4). No exemplo, n = 2, k = 5 e m = 1. Lançando esses valores na Equação (8.7.10), obtemos F =
(0, 7298 − 0,5318) /1 = 19,8 , que tem a distribuição F com 1 e 27 (1 − 0, 7298) /(32 − 5)
gl respectivamente no numerador e denominador. Com essa distribuição, o valor p de se obter um F de 19,8 ou maior é praticamente zero. Concluímos daí que não é valida a restrição imposta pelo modelo (9.7.3) de excluir a variável X. Ou melhor, a variável X, despesas com bens duráveis, deve – definitivamente – ser incluída no modelo. 9.19 Neste caso, a variável binária Z toma o valor 2 quando D = 0 e o valor 5 quando D = 1. Com esses valores, obtemos os seguintes resultados para a regressão: Variável dependente: POUPANÇA Método: Mínimos quadrados Amostra: 1970 1995 Observações incluídas: 26 Variável Coeficiente C -100,6363 RENDA 0,123978 Z 50,82618 Z*RENDA -0,021823 R-quadrado 0,881944 R-quadrado ajustado 0,865846
Erro-padrão Estatística-t 37,88404 -2,656429 0,024574 5,045035 11,02746 4,609058 0,005327 -4,096340 Variável dependente média Desvio-padrão da variável
Probabilidade 0,0144 0,0000 0,0001 0,0005 162,0885 63,20446
Manual de Soluções • Econometria Básica • Gujarati dependente E.P. da regressão 23,14996 Critério info Akaike Soma quad resíduos 11790,25 Critério Schwarz Verossimilhança Log -116,4125 Estatística-F Estat Durbin-Watson 1,648454 Probabilidade (Estatística-F)
9,262501 9,456055 54,78413 0,000000
Temos de ter cuidado ao comparar esses resultados àqueles dados em (9.5.4), (9.5.5) e (9.5.6), pois a variável Z toma o valor 2 quando D = 0 e 5 quando D = 1. Para obter as regressões poupança-renda comparáveis a (9.5.5), em que o valor original da variável binária era zero, e (9.5.6), em que esse valor era 1, atribua à variável Z o valor 2, no primeiro caso, e 5 no segundo, onde quer que ela apareça, como a seguir: Regressão poupança-renda 1970–1981 Poupança = [-100,6363+2(50,826180)]+[0,123978–2(0,02182)]renda = 1,0161+0,0803 renda, resultado que é o mesmo obtido em (9.5.5), descontados os erros de arredondamento. Regressão poupança-renda 1982–1995 Poupança = [-100,6363+5(50,826180)]+[0,123978–5(0,02182)]renda= 153,4947+0,0148 renda, resultado que é o mesmo obtido em (9.5.6). A lição neste exercício é que a escolha dos valores numéricos para as variáveis binárias é essencialmente arbitrária. 9.20 Como seria de se esperar, o sinal do coeficiente da variável binária na regressão (9.5.4) vai se tornar negativo (–152,4768) e o do coeficiente de (DtXt), positivo. O termo do intercepto será agora 153,4973, e o coeficiente da variável renda, 0,0148. Todas essas mudanças são lógicas. 9.21 (a) Como a variável binária está em formato logarítmico, e o logaritmo de zero não existe, redefinido-a como 1 e 10 será possível obter logaritmos. (b) Os resultados da regressão são os seguintes, com os valores t entre parênteses: ln(poupança)t = –0,1589+0,6695 lnrendat +(–0,00029)lnDt t = (–0,2074) (6,2362) (–0,00505) R² = 0,8780. Para todos os propósitos práticos, os dois termos de intercepto são iguais, pois o coeficiente da variável binária não é estatisticamente significativo. A interpretação do valor –0,1589 do coeficiente de intercepto é que ele representa o valor do logaritmo da poupança quando todos os regressores tomam o valor zero. Se tirarmos o antilogaritmo desse valor, obtemos 0,8531 (bilhões de dólares), número que, é claro, não tem muito significado econômico. Pode ser interessante comparar esses resultados com os seguintes, que levam em conta o efeito de interação: ln(poupança)t = –2,0048+0,9288 lnrendat +2,3278lnDt –0,2985lnDt* rendat t = (–2,6528) (8,7596) (3,9696) (–3,9820) R² = 0,9291.
Manual de Soluções • Econometria Básica • Gujarati Temos agora um quadro completamente diferente, pois tanto o intercepto quanto o coeficiente angular diferenciais binários são significativos. Para o período 1982 a 1995, a propensão marginal a poupar (PMP) é 0,6303, enquanto para o período anterior é 0,9288. E por sinal, o termo de intercepto para o primeiro período é negativo, mas positivo para o segundo. Veja só como erros de especificação podem mudar os resultados, como demonstrado nos cálculos anteriores. 9.22 (a) Apresentamos os resultados para os três eletrodomésticos em forma de tabela, como segue: Eletrodoméstico Lavadora de louças t
Intercepto
D2
D3
D4
R²
748,2500
8,25
42,875
49,875
0,0219
(13,824)
(0,10)
(0,56)
(0,65)
Trituradores
887,00 (18,8066)
-77,50 (-1,16)
-55,50 (-0,83)
11,12 (0,16)
1225,625
-45,25
1,00
106,875
(33,2219)
(0,8673)
(0,01)
(-2,05)
t Lavadora roupas
de t
0,0810 0,169
(b) Os “coeficientes angulares” são, de fato, interceptos diferenciais, sendo o primeiro trimestre o de referência. Somente a variável binária do quarto trimestre para máquinas de lavar roupas é significativamente diferente da do primeiro em termos estatísticos, indicando que só para essas máquinas há algum tipo de sazonalidade. Isso contrasta com os resultados para geladeiras dados em (9.7.3) em que havia sazonalidade no segundo e terceiro trimestres, mas não no quarto. (c) Não há necessidade de dessazonalizar os dados porque não há sazonalidade estatística visível para as vendas de lavadoras de pratos e trituradores de lixo. Quanto às lavadoras de roupas, os resíduos da regressão representarão uma série temporal dessazonalizada. 9.23 Seguem os resultados da regressão fornecidos pelo software Eviews 3. Nas tabelas seguintes, D1, D2 e D3 são as variáveis binárias para o segundo, terceiro e quarto trimestres. PRAT, TRIT e ROUP representam, respectivamente, as vendas de lavadoras de pratos, trituradores de lixo e lavadoras de roupas em milhares de unidades, e DUR representa despesas em bens duráveis em bilhões de dólares. Nem todas as estatísticas das tabelas já foram discutidas, mas serão ao longo do livro à medida que avançarmos.
Manual de Soluções • Econometria Básica • Gujarati Variável dependente: PRAT Método: Mínimos quadrados Amostra: 1978:1 1985:4 Observações incluídas: 32 Erro-padrão Estatística-t Variável Coeficiente C 106,8419 168,8010 0,632946 D1 5,840220 62,14176 0,093982 24,14839 62,32067 0,387486 D2 29,81285 62,34750 0,478172 D3 DUR 2,322680 0,590194 3,935452 R-quadrado 0,378492 Variável dependente média Desvio-padrão da variável R-quadrado ajustado 0,286416 dependente E.P. da regressão 124,2775 Critério info Akaike Soma quad resíduos 417012,1 Critério Schwarz Verossimilhança Log -197,0082 Estatística-F Estat Durbin-Watson 0,183078 Probabilidade (Estatística-F) Variável dependente: TRIT Método: Mínimos quadrados Amostra: 1978:1 1985:4 Observações incluídas: 32 Variável Coeficiente C 56,40125 D1 -80,62057 -79,75024 D2 -14,85471 D3 DUR 3,007781 R-quadrado 0,820847 R-quadrado ajustado
0,794306
E.P. da regressão Soma quad resíduos Verossimilhança Log Estat Durbin-Watson
59,98346 97146,41 -173,6979 0,733166
Variável dependente: ROUP Método: Mínimos quadrados Amostra: 1978:1 1985:4 Observações incluídas: 32 Variável Coeficiente C 741,0680 D1 -4707049 -13,14717 D2
Erro-padrão Estatística–t 81,47305 0,692269 29,99319 -2,687963 30,07954 -2,651312 30,09249 -0,493635 0,284862 10,55875 Variável dependente média Desvio-padrão da variável dependente Critério info Akaike Critério Schwarz Estatística-F Probabilidade (Estatística-F)
Erro-padrão 107,2523 39,48345 39,59713
Estatística-t 6,909578 -1,192157 -0,332023
Probabilidade 0,5321 0,9258 0,7014 0,6364 0,0005 773,5000 147,1194 12,62551 12,85453 4,110677 0,009944
Probabilidade 0,4947 0,0122 0,0133 0,6256 0,0000 856,5312 132,2576 11,16862 11,39764 30,92730 0,000000
Probabilidade 0,0000 0,2436 0,7424
Manual de Soluções • Econometria Básica • Gujarati -122,0311 39,61418 -3,080491 1,754688 0,374996 4,679221 0,541230 Variável dependente média Desvio-padrão da variável R-quadrado ajustado 0,473264 dependente E.P. da regressão 78,96307 Critério info Akaike Soma quad resíduos 168349,5 Critério Schwarz Verossimilhança Log -182,4950 Estatística-F Estat Durbin-Watson 0,926092 Probabilidade (Estatística-F) D3 DUR R-quadrado
0,0047 0,0001 1187,844 108,7996 11,71844 11,94746 7,963248 0,000224
(b) A inclusão de gastos com bens duráveis na equação para as máquinas de lavar pratos não muda o resultado no que tange à sazonalidade, que não existe nos dados (comparados aos do primeiro trimestre). Os resultados para os trituradores de lixo são consideravelmente diferentes, pois que há sazonalidade pronunciada nos segundo e terceiro trimestres. Para as máquinas de lavar roupas, os resultados são qualitativamente os mesmos. Observe, entretanto, que o coeficiente de gastos com bens duráveis é estatisticamente significativo em todas as regressões. (c) A inclusão das variáveis binárias no modelo de regressão remove a sazonalidade, se houver, não só da venda dos vários eletrodomésticos, mas também dos gastos com bens duráveis, a la teorema de Frisch-Waugh mencionado no capítulo do livro-texto. 9.24 (a) & (b) Este é um trabalho para ser feito individualmente pelos alunos. Nos Estados Unidos, as eleições presidenciais de 2000 ocorreram em sete de novembro. Se você tivesse usado seu modelo, sua previsão do resultado teria sido correta? (c) Os resultados desse modelo são os seguintes: Variável dependente: V Método: Mínimos quadrados Amostra: 1 21 Observações incluídas: 21 Variável Coeficiente C 0,505678 I -0,019753 VB 0,055755 G*I 0,009625 P 0,000155 N -0,004637 R-quadrado 0,788321 R-quadrado ajustado
0,717762
E.P. da regressão Soma quad resíduos Verossimilhança Log Estat Durbin-Watson
0,039879 0,023855 41,39511 2,229997
Erro-padrão Estatística-t 0,026324 19,21007 0,016347 -1,208325 0,019637 2,839255 0,001706 5,642862 0,002804 0,055370 0,003293 -1,407866 Variável dependente média Desvio-padrão da variável dependente Critério info Akaike Critério Schwarz Estatística-F Probabilidade (Estatística-F)
Probabilidade 0,0000 0,2456 0,0124 0,0000 0,9566 0,1796 0,490690 0,075065 -3,370963 -3,072528 11,17242 0,000125
Talvez G possa ser incluído no modelo como regressor, embora os autores não o tenham feito.
Manual de Soluções • Econometria Básica • Gujarati 9.25 Os resultados do Eviews 3 para a regressão são os seguintes: Variável dependente: SALH Método: Mínimos quadrados Amostra: 1 528 Observações incluídas: 528 Variável Coeficiente C -0,261014 GÊNERO -2,360657 RAÇA -1,732729 GÊNERO*RAÇA 2,128986 ESCOLARIDADE 0,802807 R-quadrado 0,203263 R-quadrado ajustado
0,197169
E.P. da regressão Soma quad resíduos Verossimilhança Log Estat Durbin-Watson
4,609140 11110,70 -1553,493 1,873724
Erro-padrão Estatística-t 1,106956 -0,235794 0,430203 -5,487303 0,794716 -2,180314 1,222109 1,742059 0,081014 9,909478 Variável dependente média Desvio-padrão da variável dependente Critério info Akaike Critério Schwarz Estatística-F Probabilidade (Estatística-F)
Probabilidade 0,8137 0,0000 0,0297 0,0821 0,0000 9,047538 5,144082 5,903384 5,943811 33,35678 0,000000
Como mostram os resultados, a variável binária interativa gênero-raça é estatisticamente significativa no nível de 8%. Se considerarmos que esse valor p é suficientemente baixo, essa variável é significativa, e os resultados dados em (9.6.4) têm de ser reinterpretados. Em relação só ao gênero – repare que a variável binária do gênero é 1 para as mulheres –, o seu salário médio por hora é cerca de US$2,36 mais baixo em comparação ao dos homens. Da mesma forma, o salário médio por hora dos não-brancos e não-hispânicos é US$1,73 mais baixo. Mas esses resultados precisam ser modificados para levar em consideração a variável binária gênero-raça. Por exemplo, se mantivermos raça constante, o salário médio por hora das mulheres passa a ser só US$0,2317 (= -2,3606 + 2,1289) mais baixo. Analogamente, se mantivermos gênero constante, o salário médio por hora dos trabalhadores nãobrancos e não-hispânicos passa a ser US$0,3962 (= -1,7327 + 2,1289) mais alto. Podemos ver, desse modo, como a variável binária interativa (ou multiplicativa) atenua ou exagera o efeito das aditivas. 9.26 Os resultados do Eviews 3 para a regressão são os seguintes: Variável dependente: SALH Método: Mínimos quadrados Amostra: 1 528 Observações incluídas: 528 Variável Coeficiente C 9,067519 ECIVIL 0,713991 REGIÃO -2,540727 ECIVIL*REGIÃO 1,323573
Erro-padrão 0,446115 0,551188 0,826694 1,020982
Estatística-t 20,32552 1,295367 -3,073359 1,296373
Probabilidade 0,0000 0,1958 0,0022 0,1954
Manual de Soluções • Econometria Básica • Gujarati R-quadrado 0,035309 Variável dependente média Desvio-padrão da variável R-quadrado ajustado 0,029786 dependente E.P. da regressão 5,066893 Critério info Akaike Soma quad resíduos 13452,87 Critério Schwarz Verossimilhança Log -1603,992 Estatística-F Estat Durbin-Watson 1,860478 Probabilidade (Estatística-F)
9,047538 5,144082 6,090880 6,123221 6,392958 0,000293
Os resultados indicam que não parece haver muita interação entre o estado civil e a região, pois a variável binária multiplicativa – com valor p de cerca de 20% – não é significativa. Não há, aparentemente, necessidade de incluir essa variável binária, e os resultados dados em (9.3.1) são, portanto, confiáveis.
9.27
βˆ1
dará o valor médio das primeiras 40 observações, e
observações seguintes. A variância de
βˆ1
é 100/40 e a de
( βˆ1 + βˆ2 ) o das 60
( βˆ1 + βˆ2 ) é 100/60. Lembre-
se de que se X for uma variável aleatória com média E(X) e var= σ x , então a média 2
amostral X tem o mesmo valor esperado, mas sua variância é igual a é o tamanho da amostra.
σ x2 n
, em que n
9.28 (a) Os resultados do Eviews 3 para a regressão são os seguintes: Variável dependente: ln (POUPANÇA) Método: Mínimos quadrados Amostra: 1970 1995 Observações incluídas: 26 Variável Coeficiente C 3,677198 RENDA 0,000709 VB 1,3971 VB*RENDA -0,0006 R-quadrado 0,933254 Estatística-F 102,5363 Estat Durbin-Watson 1,612107
Erro-padrão Estatística-t 0,108486 33,89569 7,80E-05 9,084319 0,1779 7,8500 8,60E-05 -7,4361 Soma quad resíduos
Probabilidade 0,0000 0,0000 0,0000 0,0000 0,341255
O modelo (9.5.4) é linear, ao passo que este é um modelo log-linear. Assim, os coeficientes angulares do regressor devem ser interpretados como semi-elasticidades. Qualitativamente, ambos os modelos fornecem resultados similares, mas como o regressando dos dois é diferente, não podemos comparar diretamente os R². (b) Como mencionado no texto, se tirarmos o antilogaritmo do coeficiente 3,6772 da variável binária, o que obtemos é a poupança mediana no período 1970–1981, mantendo constantes todos os outros fatores. Esse antilog vale 39,5355, então, se a
Manual de Soluções • Econometria Básica • Gujarati renda for zero, essa poupança será de 40 bilhões de dólares, aproximadamente. Mais uma vez, um número que deve ser interpretado com prudência. Se agora tirarmos o antilogaritmo de (3,6772+1,3971), que vale 159,8602, número que, em bilhões de dólares, representa a poupança mediana no período 1982–1995, mantendo constante a variável renda. Outro número que deve ser interpretado com prudência. (c) Regressando o log de Y (poupança) contra X (renda), as variâncias dos erros 2 2 estimados nos dois períodos são σˆ = 0,0122 (gl=10) e σˆ = 0,0182 (gl = 12). Sob a hipótese nula de que as variâncias das duas populações são iguais, temos
F=
0, 0182 = 1, 4918 , valor que, para gl 10 e 12 respectivamente no numerador e 0, 0122
denominador, não é significativo sequer no nível de 25%. Concluímos, então, que são iguais as variâncias dos erros. Repare que no modelo original discutido no livro regressamos Y (não ln Y) contra X. Portanto, se havia heterocedasticidade nesse modelo e não no log-lin, pode ser que a transformação logarítmica seja mais adequada.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 10 MULTICOLINEARIDADE: O QUE ACONTECE SE OS REGRESSORES SÃO CORRELACIONADOS?
10.1 Se Xk é uma combinação linear perfeita das variáveis explanatórias restantes, então existem (k-1) equações com k incógnitas. Com mais incógnitas do que equações, soluções únicas (ou singulares) não são possíveis. 10.2 (a) Não. A variável X3i é uma combinação linear exata de X2i, pois X3i = 2X2i – 1. (b) Reescrevendo a equação, obtemos:
Yi = β1 + β 2 X 2i + β3 (2 X 2i − 1) + ui = ( β1 − β 3 ) + ( β 2 + 2β 3 ) X 2i + ui = α1 + α 2 X 2i + ui , em que α1 = ( β1 − β3 ) e α 2 = ( β 2 + 2β 2 ) . Podemos, portanto, estimar α1 e α2 singularmente, mas não os β originais, pois só temos duas equações para resolver três incógnitas. 10.3 (a) Embora os valores numéricos do intercepto e dos coeficientes angulares de PNBpc e TAF tenham mudado, os seus sinais são os mesmos. Além disso, essas variáveis continuam sendo estatisticamente significativas. As mudanças devem ser devidas à inclusão da variável TFT, indicando que pode haver alguma colinearidade entre os regressores. (b) Como o valor t do coeficiente de TFT é muito significativo (o valor p é só 0,0032), essa variável, aparentemente, se encaixa no modelo. O sinal positivo desse coeficiente também faz sentido porque quanto mais filhos tiver uma mulher, maiores são as chances de aumentar a mortalidade infantil. (c) Esta é uma daquelas ocorrências “felizes” em que, apesar da possível colinearidade, os coeficientes individuais são, assim mesmo, estatisticamente significativos. 10.4 A relação pode ser reescrita assim:
λ λ2 X 2i − 3 X 3i = β12.3 X 2i + β13.2 X 3i λ1 λ1 λ λ X 2i = − 1 X 1i − 3 X 3i = β 21.3 X 1i + β 23.1 X 3i λ2 λ2 λ λ X 3i = − 1 X 1i − 2 X 2i = β 31.2 X 1i + β 32.1 X 2i λ3 λ3 X 1i = −
Portanto,
Manual de Soluções • Econometria Básica • Gujarati
λ λ r12.3 = ( βˆ12.3 )( βˆ21.3 ) = (− 2 )(− 1 ) = ±1 λ1
λ2
λ λ r13.2 = ( βˆ13.2 )( βˆ31.2 ) = (− 3 )(− 1 ) = ±1 λ1
λ3
λ λ r23.1 = ( βˆ23.1 )( βˆ32.1 ) = (− 3 )(− 2 ) = ±1 λ2
λ3
Daí, 2 2 2 2 R1.23 = r122 + (1 − r122 ) r13.2 = 1 . Analogamente, R2.13 = R3.12 = 1.
O grau de multicolinearidade é perfeito. 10.5 (a) Sim. Dados de séries temporais econômicas tendem a evoluir na mesma direção, como acontece com as variáveis defasadas de renda neste caso. (b) Como vimos sucintamente no Capítulo 10 e mais a fundo no Capítulo 17, a transformação de primeira diferença pode minorar o problema. 10.6 Quando a variável riqueza é excluída do modelo, ocorre erro de especificação, e o coeficiente da variável renda fica tendencioso. O que se observa, então, na equação (10.6.4) é uma estimativa tendenciosa do coeficiente de renda. A natureza do viés é a seguinte: Dado que
Yi = β1 + β 2 X 2i + β3 X 3i + ui , vem que b12 = βˆ2 + βˆ3b32 , em que b12 é o
coeficiente angular na regressão de Y contra X2, e b32 na de X3 contra X2. De acordo com os dados informados, temos que
βˆ2 =
0,9415; βˆ3 = -0,0424; b32 = 10,191 e b12 = 0,5091. Portanto, o viés em b12 é
( βˆ3 )(b32 ) = (–0,0424) (10,191) = –0,4321. 10.7 Como dissemos na Questão 10.5, as variáveis em Economia são muitas vezes influenciadas por fatores tais como ciclos econômicos e tendências. Espera-se, portanto, colinearidade na análise de regressão com variáveis como PIB e oferta de moeda. 10.8 (a) Sim, porque o coeficiente de correlação entre X2 e X3 é zero. Conseqüentemente, os termos do produto cartesiano anulam-se nas fórmulas para os coeficientes β (Equações 7.4.7 e 7.4.8), que ficam assim iguais àquelas para os coeficientes α e γ (Equação 3.1.8). (b) Será uma combinação, como demonstramos a seguir:
Manual de Soluções • Econometria Básica • Gujarati
βˆ1 = Y − βˆ2 X 2 − βˆ3 X αˆ1 = Y − αˆ 2 X 2 = Y − βˆ2 X 2 γˆ1 = Y − γˆ3 X 3 = Y − βˆ3 X 3 Logo, βˆ1 = αˆ1 + γˆ1 − Y . (c) Não, pelas seguintes razões:
var( βˆ2 ) = var(αˆ 2 ) =
∑x
σˆ 2
2 2i
σˆ
2 1
∑x
2 2i
(1 − r ) 2 23
=
σˆ 2
∑x
2 2i
(Nota: r23 = 0 ) 2
(veja a Equação 3.3.1)
2 Repare que σˆ =
∑ uˆ
2 i
n−3
≠ σˆ12 =
∑ uˆ
2 i
n−2
.
10.9 (a) O coeficiente de correlação entre trabalho e capital é relativamente alto e aproximadamente igual a 0,698. (b) Não. Apesar da correlação entre as duas variáveis, os coeficientes da regressão são estatisticamente significativos no nível de 5%. Excluir uma variável nessas condições acarretaria viés de especificação. (c) Se for excluída a variável trabalho, o coeficiente do capital será tendencioso. O viés pode ser calculado como no Exercício 10.6 e vale ( βˆ2 )(b23 ) = (1,4988)(0,1319) = 0,1975. 10.10 (a) Não, porque a multicolinearidade diz respeito à associação linear entre variáveis, e nesse caso ela é não-linear. (b) Não há razão para excluí-las. São teórica e estatisticamente significativas neste exemplo. (c) Se uma das variáveis for excluída, haverá viés de especificação que aparecerá nos coeficientes das variáveis remanescentes. 10.11 Não. Variáveis devem ser incluídas com fundamento teórico, e não apenas para aumentar a SQE ou o R². Além disso, se as variáveis estiverem correlacionadas, sua inclusão ou exclusão alterará os valores dos outros coeficientes. 10.12 (a) Falsa. Se existir relação linear exata entre variáveis, não poderemos sequer estimar os coeficientes ou seus erros-padrão. (b) Falsa. Deve-se conseguir obter um ou mais valores t significativos.
Manual de Soluções • Econometria Básica • Gujarati (c) Falsa. Conforme observado no texto (veja a Equação 7.5.6), a variância de um estimador de MQO é dada pela fórmula var( βˆ j ) =
σ2 ⎛
1 ⎞ ⎟ , e dela se pode ⎜ ∑ x 2j ⎜⎝ 1 − R 2j ⎟⎠
2
deduzir que um R j elevado pode ser contrabalançado por um baixo
∑x
2 j
σ2
ou um alto
.
(d) Incerta. Se houver somente dois regressores no modelo, um alto coeficiente de correlação entre pares de variáveis pode indicar multicolinearidade. Se um ou mais regressores entrarem de forma não-linear, as correlações entre pares podem levar a respostas enganosas. (e) Incerta. Não há mal nenhum se a colinearidade observada persistir nos valores das amostras futuras. Mas se esse não for o caso ou se o objetivo for uma estimação precisa, então a multicolinearidade pode ser um problema. (f) Falsa. Veja a resposta (c). (g) Falsa. FIV e TOL fornecem a mesma informação. (h) Falsa. Normalmente se obtêm R² elevados em modelos com muita correlação entre os regressores. (i) Verdadeira. Como se pode ver pela fórmula dada em (c), se a variabilidade de X3 2
for pequena, R j tenderá a ser pequeno e no caso extremo de não haver variabilidade em X3,
∑x
2 3i
será igual a zero, caso em que a variância de β3 estimado será infinita.
10.13 (a) Reportando-nos à Equação (7.11.15), vemos que se todos os r² forem zero, R² será zero, ipso facto. (b) Não será explicada pelo modelo nenhuma variação do regressando se este não tiver correlação com nenhum dos regressores. 10.14 (a) Se todas as correlações de ordem zero, ou simples, forem iguais a r, a Equação (7.11.5) se reduz a
2r 2 (1 − r ) 2r 2 R = = . (1 − r 2 ) 1+ r 2
(b) Pela Equação (7.11.1), pode-se ver, por exemplo, que
r12.3 =
r (1 − r ) r = . 2 1− r 1+ r
Manual de Soluções • Econometria Básica • Gujarati 10.15 (a) Se houver multicolinearidade perfeita, (X’X) passa a ser uma matriz singular e, portanto, não pode ser invertida. Conseqüentemente, os coeficientes e seus erros-padrão são indefinidos. (b) Pode-se testar isso examinado o determinante de (X’X). Se for zero, existe colinearidade perfeita. 10.16 (a) Como no caso de colinearidade perfeita a matriz (X’X) não pode ser invertida, a de variância-covariância é indefinida. (b) Se a colinearidade é alta, a matriz de variância-covariância é definida, mas as variâncias (dadas pelos elementos da diagonal principal) tenderão a ser muito grandes conforme o determinante de (X’X) for se aproximando de zero e à medida que a colinearidade for crescendo. 10.17 (a) Se o determinante de R for zero, existirá colinearidade perfeita. (b) Se o determinante for pequeno, a colinearidade será menos que perfeita. (c) Se o determinante for 1, as variáveis serão ortogonais (veja o Exercício 10.18). 10.18 (a) Só haverá elementos na diagonal principal. (b) Obtenha a matriz (X’X), sua inversa e (X’y). (c) Não haverá elementos fora da diagonal, isto é, elementos de covariância. (d) Não. Como todos os regressores são ortogonais, todos os termos de covariância (isto é, produto cruzado) serão zero. 10.19 (a) Como o terceiro regressor (Mt – Mt-1) é uma combinação linear de Mt e Mt-1 , poderá haver um problema de colinearidade. (b) Se reespecificarmos o modelo assim:
GNPt = β1 + ( β 2 + β 4 ) M t + ( β3 − β 4 ) M t −1 + ui = β1 + α1M t + α 2 − M t −1 + ui ,
poderemos
estimar singularmente β1, α1 e α2, mas não β2, β3 e β4. (c) Todos os parâmetros poderiam ser estimados singularmente, pois não haveria mais colinearidade perfeita. (d) A resposta é a mesma de (c).
10.20 Recorde que
r = 2 23
(∑ x2i x3i ) 2
(∑ x22i )(∑ x32i )
.
Logo, (
∑x
Manual de Soluções • Econometria Básica • Gujarati
x ) = r (∑ x22i )(∑ x32i ) .
2 i 3i
2
2 23
Substitua essa expressão nos denominadores das Equações (7.4.7) e (7.4.8) e simplifique. 10.21 Quando existe colinearidade perfeita, r23 = 1. Portanto, os denominadores em (7.4.12) e (7.4.15) serão zero, e, conseqüentemente, indefinidas as variâncias.
10.22 Como ep ( βˆ2 + βˆ3 ) =
[var( βˆ2 ) + var( βˆ3 ) + 2 cov( βˆ2 , βˆ3 ) , e tendo em vista que os
valores de covariância são dados, verificar o que se pede é mera questão de substituílos na equação. 10.23 (a) Ceteris paribus, a variância do coeficiente estimado de β k diminui à medida que
σ k2 cresce, o que permitirá uma estimação mais precisa de βˆk .
(b) A variância é indefinida quando a colinearidade é perfeita. (c) Verdadeiro. Conforme aumenta R², diminui (1-R²), o que reduzirá a variância do coeficiente estimado. 10.24 (a) Dados o relativamente alto R² de 0,97, o valor F significativo e o (economicamente falando) insignificante e impropriamente sinalizado coeficiente de log K, pode ser que haja colinearidade no modelo. (b) A priori, espera-se que o impacto do capital sobre a produção seja positivo, o que não ocorre nesse caso devido provavelmente à colinearidade nos regressores. (c) É uma função de produção tipo Cobb-Douglas, pois podemos escrever o modelo β β β dado como Y = β1 K 2 L 3 e 4 t . (d) Em média, ao longo do período estudado, um incremento de 1% no índice de uso real de mão-de-obra leva a um aumento de 0,91% do índice de produto real. No modelo, a variável t representa o tempo, que com freqüência é tomado como variável instrumental para mudança tecnológica. O coeficiente de 0,47 indica que ao longo do período estudado, a taxa de crescimento do produto real (como medida pelo índice de produto) foi de 4,7%, em média. (e) Implicitamente, a equação assume que há retornos de escala constantes, ou seja, ( β 2 + β3 ) = 1 . Uma eventual vantagem da transformação pode ser a redução do problema da colinearidade. (f) Dado que o coeficiente da relação capital/mão-de-obra é estatisticamente insignificante, o problema da colinearidade, ao que tudo indica, não foi resolvido.
Manual de Soluções • Econometria Básica • Gujarati (g) Como mencionado em (e), o autor está tentando saber se há retornos de escala constantes. O teste F visto no Capítulo 8 poderia ser utilizado para descobrirmos se a restrição é válida. Mas como as variáveis dependentes são diferentes nos dois modelos, precisamos das somas dos quadrados dos resíduos restritas e irrestritas para usar a versão R² desse teste. (h) De acordo com (g), os valores de R² não são comparáveis. Para torná-los comparáveis, poderíamos adotar os procedimentos vistos no Capítulo 7. 10.25 (a), (b), (c) & (d) Em essência, todas essas opiniões nos dizem que a multicolinearidade é, muito freqüentemente, um problema de deficiência de dados. Problemas 10.26 (a) Os resultados da regressão do modelo modificado são:
Yˆi = 20,995 + 0,710Zi ep = (6,341) t = (3,311)
(0,066) (10,771)
r² = 0,906
βˆ3 = (0,75)(0,710) = 0,532. Portanto, βˆ4 = (0,625)(0,710) = 0,444. (b) A variável Z pode ser interpretada como uma média ponderada dos diferentes tipos de renda. 10.27 (a) Os resultados do Eviews 3 para a regressão são os seguintes: Variável dependente: LIMPORTA Método: Mínimos quadrados Data: 11/11/2000 Hora: 10:16 Amostra: 1970 1998 Observações incluídas: 29 Variável Coeficiente C 1,975260 LPIB 1,043167 LIPC 0,446142 R-quadrado 0,982318 R-quadrado ajustado
0,980958
E.P. da regressão Soma quad resíduos Verossimilhança Log Estat Durbin-Watson
0,124862 0,405356 20,76993 0,461405
Erro-padrão Estatística-t 0,782070 2,525683 0,405783 2,570749 0,569840 0,782925 Variável dependente média Desvio-padrão da variável dependente Critério info Akaike Critério Schwarz Estatística-F Probabilidade (Estatística-F)
Probabilidade 0,0180 0,0162 0,4407 12,49048 0,904848 -1,225512 -1,084068 722,2174 0,000000
(b) A julgar pelo alto R² e pelo valor t insignificante do coeficiente de ln IPC, é provável que haja multicolinearidade nos dados.
Manual de Soluções • Econometria Básica • Gujarati (c) Seguem os resultados das regressões: Variável dependente: LIMPORTA Método: Mínimos quadrados Data: 11/11/2000 Hora: 10:21 Amostra: 1970 1998 Observações incluídas: 29 Variável Coeficiente C 1,407426 LPIB 1,359628 R-quadrado 0,981901
Erro-padrão 0,290493 0,035525
Estatística-t 4,844960 38,27295
Probabilidade 0,0000 0,0000
Erro-padrão 0,250312 0,055221
Estatística-t 15,57499 34,50388
Probabilidade 0,0000 0,0000
Erro-padrão 0,1080 0,0238
Estatística-t 17,0680 58,6972
Probabilidade 0,0000 0,0000
Variável dependente: LIMPORTA Método: Mínimos quadrados Amostra: 1970 1998 Observações incluídas: 29 Variável C LIPC R-quadrado
Coeficiente 3,898610 1,905351 0,977824
Variável dependente: LPIB Método: Mínimos quadrados Amostra: 1970 1998 Observações incluídas: 29 Variável C LIPC R-quadrado
Coeficiente 1,8437 1,3988 0,9922
A regressão auxiliar de LPIB contra LIPC mostra que há alta correlação entre as duas variáveis, indicando a possibilidade de haver problemas de colinearidade com os dados. (d) No caso, a melhor solução seria expressar as importações e o PIB em termos reais dividindo-os pelo IPC, conforme observado no capítulo do livro-texto. Os resultados do Eviews 3 são os seguintes: Variável dependente: LOG(IMPORTA / IPC) Método: Mínimos quadrados Data: 11/11/2000 Hora: 10:26
Manual de Soluções • Econometria Básica • Gujarati Amostra: 1970 1998 Observações incluídas: 29 Erro-padrão Estatística-t Variável Coeficiente C 0,106099 0,494911 0,214380 LOG(PIB/IPC) 2,162167 0,135693 15,93429 R-quadrado 0,903881
Probabilidade 0,8319 0,0000
10.28 (a) Como há cinco variáveis explanatórias, haverá cinco regressões auxiliares. Por economia de espaço, apresentamos a seguir somente os valores R² obtidos com essas regressões: Variável dependente X2 X3 X4 X5 X6
R² 0,9846 0,9482 0,9872 0,9889 0,9927
(b) Como os R² estão uniformemente altos em todas as regressões auxiliares, parece que há um problema de multicolinearidade com os dados. (c) É provável que haja na equação excesso de variáveis para substitutos da carne de frango. Poderíamos usar como regressores apenas o preço composto dos substitutos, o da carne de frango e a renda disponível, o que já foi feito no Exercício 7.19. (d) Criar uma variável de preço relativo, digamos, o preço da carne bovina dividido pelo da suína, poderia amenizar o problema da colinearidade. 10.29 (a) & (c) Pelo exame dos coeficientes de correlação entre as possíveis variáveis explanatórias, observamos uma correlação muito alta entre o IPC geral e o IPC de carros novos (0,997), e entre este e a RPD (0,991). Os outros são relativamente altos, mas podem permanecer no modelo por razões teóricas. A RPD também está estreitamente ligada ao nível de emprego, e a correlação entre as duas é 0,972. Podemos, portanto, excluir o IPC geral e a RPD e estimar o seguinte modelo: Variável dependente: LY Método: Mínimos quadrados Amostra: 1971 1986 Observações incluídas: 16 Variável C LX2 LX5 LX6 R-quadrado
Coeficiente -22,10374 -1,037839 -0,294929 3,243886 0,684855
Erro-padrão Estatística-t 8,373593 -2,639696 0,330227 -3,142805 0,073704 -4,001514 0,872231 3,719068 Variável dependente média
Probabilidade 0,0216 0,0085 0,0018 0,0029 9,204273
Manual de Soluções • Econometria Básica • Gujarati Desvio-padrão da variável R-quadrado ajustado 0,606069 dependente E.P. da regressão 0,075053 Critério info Akaike Soma quad resíduos 0,067595 Critério Schwarz Verossimilhança Log 21,03144 Estatística-F Estat Durbin-Watson 1,309678 Probabilidade (Estatística-F)
0,119580 -2,128930 -1,935783 8,692569 0,002454
Nota: Nesta tabela, a letra L significa “logaritmo de”. Ao que tudo indica, não há problemas de colinearidade nesse modelo. (b) Incluindo todas as variáveis X, obtemos os seguintes resultados: Variável dependente: LOG(Y) Método: Mínimos quadrados Amostra: 1971 1986 Observações incluídas: 16 Variável C LOG(X2) LOG(X3) LOG(X4) LOG(X5) LOG(X6) R-quadrado
Coeficiente 3,254859 1,790153 -4,108518 2,127199 -0,030448 0,277792 0,854803
R-quadrado ajustado
0,782205
E.P. da regressão Soma quad resíduos Verossimilhança Log Estat Durbin-Watson
0,055806 0,031143 27,23099 1,793020
Erro-padrão Estatística-t 19,11656 0,170264 0,873240 2,050012 1,599678 -2,568341 1,257839 1,691154 0,121848 -0,249884 2,036975 0,136375 Variável dependente média Desvio-padrão da variável dependente Critério info Akaike Critério Schwarz Estatística-F Probabilidade (Estatística-F)
Probabilidade 0,8682 0,0675 0,0280 0,1217 0,8077 0,8942 9,204273 0,119580 -2,653874 -2,364153 11,77442 0,000624
Como suspeitávamos, são evidentes os problemas de colinearidade desse modelo. 10.30 Vamos, primeiro, apresentar a matriz de correlação dos regressores: TAXA GE
TAXA 1,000000 0,571693
GE 0,571693 1,000000
GMO
0,058992
NEIN ATIVOS IDADE
0,701787 0,778932 0,044173
Dependentes
0,601358 0,881271
0,040994 0,234426 0,274094 0,015300 0,692881 0,549108
Escolaridade
GMO 0,058992 0,040994 1,000000
NEIN 0,701787 0,234426
ATIVOS 0,778932 0,274094
0,359094
0,359094 0,292243 0,775494 0,050212 -
Dependentes -0,60135 -0,69288
0,292243
IDADE 0,044173 0,015300 0,775494
1,000000 0,987510 0,502432
0,987510 1,000000 0,417086
0,502432 0,417086 1,000000
-0,52083 -0,51355 -0,04836
0,520832 0,539173
0,513552 0,630899
0,048360 -
1,000000
0,05021
-0,60257
Manual de Soluções • Econometria Básica • Gujarati 0,298555
0,331067
Nota: Nesta tabela, considere a última linha como a última coluna. Como mostra a tabela, as correlações aos pares, ou simples, variam desde valores muito baixos (-0,0409 entre GM e GMO, por exemplo) a valores comparativamente altos (0,8812 entre Escolaridade e Taxa, por exemplo). (a) Regressando a variável Horas contra todos os regressores, obtemos os seguintes resultados: Variável dependente: HORAS Método: Mínimos quadrados Amostra: 1 35 Observações incluídas: 35 Variável C TAXA GE GMO NEIN ATIVOS IDADE Dependentes Escolaridade R-quadrado
Coeficiente 1904,578 -93,75255 0,000225 -0,214966 0,157208 0,015572 -0,348636 20,72803 37,32563 0,825555
R-quadrado ajustado
0,771879
E.P. da regressão Soma quad resíduos Verossimilhança Log Estat Durbin-Watson
30,62279 24381,63 -164,2220 1,779824
Erro-padrão Estatística-t 251,9333 7,559849 47,14500 -1,988600 0,038255 0,005894 0,097939 -2,194896 0,516406 0,304427 0,025405 0,612970 3,722331 -0,093661 16,88047 1,227930 22,66520 1,646826 Variável dependente média Desvio-padrão da variável dependente Critério info Akaike Critério Schwarz Estatística-F Probabilidade (Estatística-F)
Probabilidade 0,0000 0,0574 0,9953 0,0373 0,7632 0,5452 0,9261 0,2305 0,1116 2137,086 64,11542 9,898400 10,29835 15,38050 0,000000
A interpretação é simples e direta. Então, ceteris paribus, se os salários médios por hora (TAXA) subirem um dólar, em média, o número médio de horas trabalhadas durante o ano (HORAS) cai cerca de 93 horas. (c) Por economia de espaço, calcularemos FIV e TOL somente da taxa do regressor. Regressando TAXA contra todos os outros regressores, obtemos um valor R² de 0,9416. Pela Equação (7.5.6) podemos verificar que o FIV para esse regressor é cerca de 2224, e o inverso desse número é a TOL, que vale 0,00045. (d) Nem todas as variáveis do modelo são necessárias. Uma ou mais podem ser excluídas aplicando os testes de diagnóstico apresentados no livro, ou podemos usar uma combinação linear delas. (e) Embora os resultados sejam variados, talvez haja alguma evidência de que valha a pena experimentar o imposto de renda negativo.
Manual de Soluções • Econometria Básica • Gujarati 10.31 Este é para ser feito em aula. 10.32 Os resultados do Eviews para a regressão são os seguintes: Variável dependente: Y Método: Mínimos quadrados Amostra: 1947 1961 Observações incluídas: 15 Variável Coeficiente C -3017441 X1 -20,51082 X2 -0,027334 X3 -1,952293 X4 -0,958239 X5 0,051340 X6 1585,156 R-quadrado 0,9955 R-quadrado ajustado 0,9921 E.P. da regressão 295,6219 Soma quad resíduos 699138,2 Estatística-F 295,7710 Estat Durbin-Watson 2,492491
Erro-padrão 939728,1 87,09740 0,033175 0,476701 0,216227 0,233968 482,6832
Estatística-t -3,210973 -0,235493 -0,823945 -4,095429 -4,431634 0,219430 3,284049
Probabilidade 0,0124 0,8197 0,4338 0,0035 0,0022 0,8318 0,0111
Comparando esses resultados com os da Seção 10.10, vemos que a exclusão de uma única observação pode alterar as magnitudes e/ou os sinais de alguns dos coeficientes, o que fundamenta o argumento apresentado no texto de que, em casos de alta colinearidade, pequenas mudanças nos dados podem levar a diferenças consideráveis nos resultados.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 11 HETEROCEDASTICIDADE: O QUE ACONTECE SE A VARIÂNCIA DO ERRO NÃO É CONSTANTE?
11.1 (a) Falsa. Os estimadores não são tendenciosos, mas ineficientes. (b) Verdadeira. Veja a Seção 11.4. (c) Falsa. Tipicamente, mas nem sempre, a variância será superestimada. Veja a Seção 11.4 e o Exercício 11.9. (d) Falsa. Além da heterocedasticidade, tal padrão autocorrelação, erros de especificação de modelo etc. (e) Verdadeira. Como os
pode
ser
resultado
de
σ i2 verdadeiros não são diretamente observados, algum
pressuposto a respeito da natureza da heterocedasticidade é inevitável. (f) Verdadeira. Veja a resposta (d). (g) Falsa. Heterocedasticidade tem a ver com a variância do termo de erro ui, não com a variância do regressor. 11.2 (a) A Equação (1) mostra que à medida que N aumenta 1 unidade, em média, W aumenta 0,009 dólares. Se multiplicarmos toda a segunda equação por N, veremos que os resultados serão bem parecidos com os da primeira. (b) Aparentemente, o autor estava preocupado com a heterocedasticidade, pois dividiu a equação original por N, o que equivale a pressupor que a variância do erro é proporcional ao quadrado de N. Ele está, portanto, aplicando mínimos quadrados ponderados para estimar a Equação (2). (c) O coeficiente do intercepto da Equação (1) é o coeficiente angular na Equação (2) e vice-versa. (d) Não. As variáveis dependentes não são iguais nos dois modelos. 11.3 (a) Não. Estes modelos não são lineares nos parâmetros e não podem ser estimados por MQO. (b) Para estimar modelos não-lineares há procedimentos específicos que veremos no capítulo sobre modelos de regressão não-lineares. Podemos, informalmente, estimar os parâmetros por tentativa e erro. 11.4 (a) Veja o Exercício 7.14 e a Seção 6.9.
Manual de Soluções • Econometria Básica • Gujarati (b) Não. E[ln(ui)] = E[ln(1)] = 0. Mas E[ln(ui)] < lnE(ui) devido à propriedade de concavidade da transformação logarítmica. A expectativa do logaritmo de uma variável aleatória é menor do que o logaritmo de sua expectativa, e essas expectativas só serão iguais se a variância da variável for zero. (c) Seja Yi = ln β1 + β 2 ln X i + ln ui = α + β 2 ln X i + ui , em que ui = [ln ui − E (ln ui )] e *
α = [ln β1 + E (ln ui )] .
*
Mas E (ui ) = E[ln ui − E (ln ui )] = 0 . A propósito, repare que não *
conseguimos uma estimativa direta de
β1 .
11.5 A resolução deste exercício é só uma questão de substituir termos definidos e simplificar. 11.6 (a) A pressuposição é que a variância do erro é proporcional ao quadrado do PNB, conforme postulado no enunciado. Os autores observaram essa relação examinando os dados ao longo do tempo. (b) Os resultados são essencialmente os mesmos, embora os erros-padrão para dois dos coeficientes sejam menores no segundo modelo. Podemos tomar isso como justificativa empírica da transformação para heterocedasticidade. (c) Não. Os termos R² não podem ser comparados porque as variáveis dependentes não são as mesmas nos dois modelos. 11.7 Como veremos no Problema 11.13, o teste Bartlett mostra que não há problema de heterocedasticidade neste conjunto de dados. Essa descoberta não é, portanto, nenhuma surpresa. Veja também o Problema 11.11. 11.8 Substituindo wi = w na Equação (11.3.8), obtemos:
β 2* =
(nw)( w∑ X iYi ) − ( w∑ X i )( w∑ Yi ) (nw)( w∑ X i2 ) − ( w∑ X i )2
=
n∑ X iYi − (∑ X i )(∑ Yi ) n∑ X i2 − (∑ X i 2 )
= βˆ2 .
Pode-se mostrar analogamente a igualdade das variâncias.
11.9 Pela Equação (11.2.2), temos
var( βˆ2 ) =
σ ∑ xi ki σ = equação, vem var( βˆ2 ) = 2 2 (∑ xi ) ∑ xi2 2
2
2
∑x σ (∑ x )
∑x k ∑x
2 i i 2 i
2 i
2 i 2 2 i
.
. Substituindo
σ i2 = σ 2 ki nessa
Manual de Soluções • Econometria Básica • Gujarati O primeiro termo à direita é a variância mostrada na Equação (11.2.3). Portanto, se
∑x k ∑x
2 i i 2 i
> 1 , então a variância heterocedástica dada anteriormente é maior que a
homocedástica, que nesse caso subestimará a heterocedástica levando a estatísticas t e F inflacionadas. Não podemos tirar conclusões gerais porque o resultado se baseia num tipo específico de heterocedasticidade. 11.10 Conforme os Apêndices 3A.3 e 6A.1, temos que Dado que var(ui ) = σ X 2
2 i ,
obtemos var( βˆ2 ) =
∑X σ (∑ X 2 i
2
var( βˆ2 ) =
X i2
2 2 i
)
=
∑ X var(u ) . (∑ X )
σ 2 ∑ X i4 (∑ X i2 ) 2
2 i
i
2 2 i
.
Problemas 11.11 Os resultados da regressão já foram dados em (11.5.3). Se a produtividade média subir um dólar, a remuneração média aumenta cerca de 23 centavos. (a) Os resíduos da regressão são: -775,6579; -205,0481; 165,8512; 183,9356; 199,3785; 54,6657; 112,8410; 150,6239; 113,4100. (b) Essa verificação é simples e direta. (c) Os resultados das regressões são:
uˆi = 407,3455 – 0,0203Xi t = (0,6433)
(-0,3013)
r² = 0,0128
uˆi = 575,2976 – 3,7097 X i t = (0,4479)
(-0,2787)
r² = 0,0109
Esses resultados mostram que, com base nos testes de Glejser, os indícios de heterocedasticidade são pequenos. (d) Se classificarmos os valores absolutos dos resíduos e os números da produtividade média em ordem ascendente e calcularmos o coeficiente de correlação por ordem de Spearman conforme (11.5.5), observaremos que vale -0,5167. Aplicando a fórmula t dada em (11.5.6), obtemos t = -0,8562, que não é estatisticamente significativo, pois seu valor crítico absoluto no nível de 5% com 7 gl é 2,447. Portanto, com base no teste de correlação por ordem, não há motivos para esperarmos heterocedasticidade. Em suma, todos os testes anteriores sugerem que não há o problema da heterocedasticidade.
Manual de Soluções • Econometria Básica • Gujarati 11.12 (a) e (b)
VERTICAL = VMÉDIO HORIZONTAL = DESVIO PADRÃO VMÉDIO (c) Seguem os resultados da regressão:
EPˆi = 0,9910 – 0,0650VMÉDIOi t = (0,3756) (-0,1795)
r² = 0,0064.
Não há relação sistemática entre as duas variáveis porque o coeficiente angular não é estatisticamente diferente de zero, o que pode ser visto pelo gráfico em (a). (d) Não há necessidade de transformação nenhuma, pois não existe relação sistemática entre a média da razão vendas/dinheiro em caixa e seu desvio-padrão nos vários níveis de ativos. 11.13 Aplicando o teste de Bartlett, χ é 6,6473, cujo valor p é 0,5748. Não rejeitamos, portanto, a hipótese nula de que as variâncias são iguais. 2
11.14 Aplicando a Fórmula (11.3.8) para mínimos quadrados ponderados, podemos
2 2 σ . Se usarmos MQO, obtemos então 3 ∑ X iYi = Y1 − Y2 = 1 (Y − Y ) . E aplicando (6.1.7), da Equação (6.1.6) o seguinte: βˆ = 1 2 2 2 ∑ X i2 demonstrar que
1 3
βˆ * = (2Y1 − Y2 )
temos que var( βˆ ) =
σ2
e var( βˆ ) =
1 = σ2. ∑X 2 2 i
*
Manual de Soluções • Econometria Básica • Gujarati Comparando as duas estimativas, vemos que a de mínimos quadrados ponderados atribui peso de 2/3 a Y1 e 1/3 a Y2, ao passo que a de MQO atribui igual peso às duas observações Y. A variância do estimador do coeficiente angular é maior em MQP do que em MQO. 11.15 (a) Os resultados da regressão são os seguintes:
ˆ = 189,9597 – 1,2716VMi + 0,3904HPi – 1,9032PVi MPG i ep = (22,5287) t = (8,4318)
(0,2331) (-5,4551)
(0,0762) (5,1207)
(0,1855) (-10,2593)
R² = 0,8828.
Conforme as expectativas, MPG é positivamente relacionada a HP e negativamente a VM e PV. (b) A priori, é de se esperar heterocedasticidade transversal abrangendo veículos diversos.
porque são dados em corte
(c) Regressando os quadrados dos resíduos do modelo em (a) contra os três regressores, seus quadrados e seus produtos cruzados, obtemos um R² de 0,3094, que multiplicado pelo número de observações (81), dará 25,0646, valor com distribuição qui-quadrado com 9 gl (3 regressores, 3 quadrados de regressores e 3 produtos cruzados) sob a hipótese nula de que não há heterocedasticidade. O valor p de se obter um valor qui-quadrado de 25,0646 ou maior é, sob essa hipótese, 0,0029, que é muito pequeno. Temos, portanto, de rejeitar a hipótese nula, ou seja, há heterocedasticidade. (d) Os resultados baseados nos procedimentos de White são os seguintes: Variável dependente: MPG Método: Mínimos quadrados Amostra: 1 81 Observações incluídas: 81 Variável Coeficiente C 189,9597 VM -1,271697 HP 0,390433 PV -1,903273 R-quadrado 0,882864 Durbin-Watson 1,0237
Erro-padrão 33,90605 0,336039 0,108781 0,285077
Estatística-t 5,602531 -3,784375 3,589180 -6,676352
Probabilidade 0,0000 0,0003 0,0006 0,0000
Comparando esses resultados com os obtidos com MQO, descobriremos que os valores dos coeficientes estimados são iguais, mas suas variâncias e erros-padrão são diferentes. Estes, como vemos, são mais altos nos procedimentos de White porque os |t| são menores, indicando que os erros-padrão estão subestimados nos resultados obtidos com MQO. Tudo isso pode ser atribuível à heterocedasticidade. (e) Não existe uma fórmula simples para determinar a natureza exata heterocedasticidade neste caso. Podemos, talvez, partir de alguns pressupostos
da
Manual de Soluções • Econometria Básica • Gujarati simples e tentar diferentes transformações. Se, por exemplo, acharmos que a variável “culpada” é HP e que a variância do erro é proporcional a HP², podemos dividir a equação por HP e ver o que acontece. Naturalmente, qualquer outro regressor é um candidato tão bom quanto esse para a transformação. 11.16 Seguem os resultados da regressão: Variável dependente: DESPALIM Variável Coeficiente C 94,20878 DESPTOT 0,436809 R-quadrado 0,369824
Erro-padrão 50,85635 0,078323
Estatística-t 1,852449 5,577047
O gráfico dos resíduos dessa regressão é:
(b) A representação gráfica dos resíduos (R1) contra a despesa total é:
Probabilidade 0,0695 0,0000
Manual de Soluções • Econometria Básica • Gujarati EIXO VERTICAL = R1 HORIZONTAL = DESPTOT Ao que tudo indica, conforme crescem as despesas totais, também crescem – talvez de forma não-linear – os valores absolutos dos resíduos. (c) Segue o teste de Park: Variável dependente: LOG(RESQ) Variável Coeficiente C -16,86288 LOG(DESPTOT) 3,703235 R-quadrado 0,097018
Erro-padrão 10,00140 1,551873
Estatística-t -1,686053 2,386300
Probabilidade 0,0977 0,0206
Esse teste confirma a heterocedasticidade, pois o coeficiente angular é significativo. Agora, o teste de Glejser: Variável dependente:
uˆi Valor absoluto dos resíduos
Variável C DESPTOT R-quadrado
Coeficiente -32,21965 0,130709 0,135158
Erro-padrão 29,48998 0,045417
Estatística-t -1,092563 2,877997
Probabilidade 0,2795 0,0058
Como o coeficiente angular estimado é estatisticamente significativo, esse teste também sugere homocedasticidade. Finalmente, o teste de White: Variável dependente: uˆi
2
Variável C DESPTOT DESPTOT QUADRADO R-quadrado
Coeficiente 13044,00 -53,12260 0,059795 0,134082
Erro-padrão 21156,58 71,48347 0,058860
Estatística-t 0,616546 -0,743145 1,015887
Probabilidade 0,5402 0,4607 0,3144
Se a hipótese nula é de que não há heterocedasticidade, e multiplicarmos o Rquadrado por 55, o produto resultante de 7,3745 segue a distribuição qui-quadrado com gl 2, e o valor p de tal distribuição é pequeno e aproximadamente igual a 0,025. Portanto, assim como os testes de Park e Glejser, o de White também indica heterocedasticidade. (d) O resultados para heterocedasticidade corrigida de White são os seguintes: Variável dependente: DESPALIM Variável Coeficiente C 94,20878 DESPTOT 0,436809 R-quadrado 0,369824
Erro-padrão 43,26305 0,074254
Estatística-t 2,177581 5,882597
Probabilidade 0,0339 0,0000
Manual de Soluções • Econometria Básica • Gujarati Comparados com os resultados da regressão MQO dados em (a), não há nestes muita diferença no erro-padrão do coeficiente angular, embora o do intercepto tenha diminuído. É difícil afirmar se vale ou não a pena preocuparmo-nos com essa diferença de resultados entre o método MQO os procedimentos de White, mas sua magnitude só pode ser avaliada se fizermos as regressões e as compararmos. 11.17 Seguem os resultados da regressão: Variável LOG(DESPALIM) Variável C LOG(DESPTOT) R-quadrado
dependente: Coeficiente 1,154332 0,736326 0,412469
Erro-padrão 0,777959 0,120713
Estatística-t 1,483795 6,099834
Probabilidade 0,1438 0,0000
Os testes de Park, Glejser e White aplicados aos resíduos obtidos pela regressão duplolog não mostraram sinais de heterocedasticidade. Este exemplo mostra que a transformação logarítmica pode amiúde reduzir a heterocedasticidade. Por isso, a forma funcional do modelo de regressão pode ser fator crítico para decidir se há ou não heterocedasticidade. 11.18 Primeiro, foram obtidos os quadrados dos resíduos da regressão de despesas 2 com alimentação contra despesas totais, e denominados R1 . Depois, estes foram regressados contra a previsão e seu quadrado obtidos da mesma regressão. Os resultados são os seguintes: Variável dependente: R1
2
Variável C PREVDESPALIM PREVDESPALIM^2 R-quadrado
Coeficiente 27282,63 -180,6629 0,313387 0,134082
Erro-padrão 39204,59 221,5542 0,308486
Estatística-t 0,695904 -0,815434 1,015887
Probabilidade 0,4896 0,4185 0,3144
Multiplicando o R² anterior por 55, obtemos 7,3745. Sob a hipótese nula de que não há heterocedasticidade, esse valor segue a distribuição qui-quadrado com 2 gl. O valor p de se obter tal, ou maior, valor qui-quadrado é pequeno e aproximadamente igual a 0,025. A conclusão é, portanto, que a variância do erro é heterocedástica. Pode-se mostrar que não haveria sinais de heterocedasticidade se o procedimento anterior fosse aplicado aos quadrados dos resíduos obtidos pela regressão do logaritmo de despesas com alimentação contra o logaritmo de despesas totais. 11.19 Não havia, a priori, razões para crer que os resultados seriam diferentes, pois, como se vê pela regressão abaixo de lucros contra vendas, existe alta correlação entre essas variáveis.
Manual de Soluções • Econometria Básica • Gujarati
Variável dependente: LUCROS Variável Coeficiente C -338,5385 VENDAS 0,100713 R-quadrado 0,845936
Erro-padrão 1105,311 0,011097
Estatística-t -0,306283 9,075346
Probabilidade 0,7636 0,0000
11.20 (a)
SALÁRIOS MEDIANOS EM RELAÇÃO A ANOS DE EXPERIÊNCIA O gráfico mostra que o salário mediano aumenta com os anos no posto, mas não de forma linear. (b) Pelo gráfico anterior, o modelo (2), que inclusive se encaixa na teoria econômica do capital humano, seria o mais apropriado. Os resultados dos ajustes aos dois modelos, linear e quadrático, são os seguintes: Variável C X R-quadrado
Coeficiente 73586,80 949,5621 0,593535
Erro-padrão 3944,584 217,9417
Estatística-t 18,65515 4,356954
Probabilidade 0,0000 0,0008
Variável C X X^2 R-quadrado
Coeficiente 66356,18 2285,920 -40,07090 0,693747
Erro-padrão 5100,501 702,5469 20,22169
Estatística-t 13,00974 3,253761 -1,981580
Probabilidade 0,0000 0,0069 0,0709
(c) O teste de White aplicado ao modelo (1) mostrou que havia pronunciada heterocedasticidade, pois, pela regressão auxiliar dos quadrados dos resíduos, o valor
Manual de Soluções • Econometria Básica • Gujarati de n.R² foi de 11,4108 com valor p de 0,0033. Quando aplicado ao modelo (2), o mesmo teste apresentou n.R² de 7,6494 com valor p de 0,0538, indicando que não havia heterocedasticidade no nível de 5%. Mas o valor está tão próximo desse nível que se pode suspeitar que haja ligeira heterocedasticidade no modelo, embora não se possa descartar a possibilidade de erro de especificação. (d) Presumindo que a variância do erro seja proporcional ao quadrado de anos de experiência, dividimos o modelo (1) todo por X e obtivemos os seguintes resultados: Variável C 1/X R-quadrado
Coeficiente 1403,809 68292,06 0,999767
Erro-padrão 154,6360 289,4419
Estatística-t 9,078151 235,9439
Probabilidade 0,0000 0,0000
Quando submetido ao teste de White, esse modelo não mostrou indícios de heterocedasticidade.
11.21 A estatística λ(=F) calculada é:
λ=
SQR1 / gl 140 / 25 = = 2,5454 . SQR2 / gl 55 / 25
O F crítico a 5% para 25 gl no numerador e no denominador é 1,97. Como o valor estimado de 2,5454 excede esse valor crítico, rejeitamos a hipótese nula de heterocedasticidade. 11.22 A seguir temos o gráfico:
(b) Os resultados da regressão são: Variável C X R-quadrado
Coeficiente 4,610282 0,757433 0,586380
Erro-padrão 1,084906 0,149941
Estatística-t 4,249478 5,051559
Probabilidade 0,0005 0,0001
Manual de Soluções • Econometria Básica • Gujarati Representados graficamente em relação a X, os resíduos dessa regressão mostram o seguinte quadro:
O resíduo relativo ao Chile predomina sobre os outros. (c) Excluindo os resultados do Chile, os resultados da regressão são os seguintes: Variável C X// R-quadrado
Coeficiente 6,738082 0,221484 0,009262
Erro-padrão 2,384860 0,555568
Estatística-t 2,825358 0,398663
Probabilidade 0,0117 0,6951
Como vemos, o coeficiente angular em (a) era muito significativo, mas não o é nesta regressão. Observe como um único ponto com valor extremo, um outlier 1 , (ou dado discrepante) pode deturpar os resultados da regressão. O gráfico apresentado pelos resíduos dos quadrados dessa regressão em relação a X é o seguinte:
1
Esse termo estatístico é normalmente usado no Brasil, e denomina uma observação que é muito diferente das outras da amostra.
Manual de Soluções • Econometria Básica • Gujarati
(d) Ao comparar os gráficos residuais em (b) e (c), vemos que a relação entre Y e X ficou pequena depois que foram excluídos dos dados os resultados do Chile. Portanto, qualquer indício de heterocedasticidade é espúrio.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 12 AUTOCORRELAÇÃO: O QUE ACONTECE SE OS TERMOS DE ERRO SÃO CORRELACIONADOS?
12.1 (a) Falsa. Os estimadores não são tendenciosos, mas são ineficientes. (b) Verdadeira. Ainda conservamos as outras premissas do MRLC. (c) Falsa. A pressuposição é de que
ρ = +1 .
(d) Verdadeira. Para comparar os R², o regressando tem de ser o mesmo nos dois modelos. (e) Verdadeira. Pode também implicar erros de especificação. (f) Verdadeira. Pois o erro da previsão envolve σ², que não é corretamente estimado pela fórmula habitual de MQO. (g) Verdadeira. Veja a resposta (e). (h) Falsa. Só pode ser feito com a estatística g de Berenblut-Webb, embora usemos as tabelas Durbin-Watson para testar a hipótese de que ρ = 1 . (i) Verdadeira. Escreva o modelo como Yt =
β1 + β 2 X t + β 3t + β 4t 2 + ui .
Tire a primeira
diferença dessa equação e verifique. 12.2 Para n = 50, k’ = 4 e α = 5%, os valores d críticos são: dL = 1,38 dU = 1,72
4 – dL = 2,62 4 – dU = 2,28
(a) Autocorrelação positiva. (b) Inconclusivo. (c) Inconclusivo. (d) Autocorrelação negativa. 12.3 (a) Há correlação serial no modelo A, mas não no B. (b) A autocorrelação pode ser devida a erro de especificação do modelo A porque este exclui o termo quadrático de tendência. (c) Precisaríamos de conhecimento prévio da forma funcional provável.
Manual de Soluções • Econometria Básica • Gujarati 12.4 (a) Calcule a razão de Von Neumann (V-N), sua média e sua variância. Com a tabela de distribuição normal, determine a quantas unidades de desvio-padrão a razão está do valor médio calculado. Escolha um nível de confiança e execute um teste de intervalo de confiança.
⎛ n ⎞ ⎟d . ⎝ n −1 ⎠
(b) V-N = ⎜
⎛ n ⎞ ⎛ n ⎞ ⎟ e 4⎜ ⎟ . Daí, se n for suficientemente grande, a razão ⎝ n −1 ⎠ ⎝ n −1 ⎠
(c) Os limites são 2 ⎜
V-N, assim como o d Durbin-Watson, estarão entre 0 e 4. (d) Os resíduos MQO são estimativas consistentes dos termos de erro verdadeiros. Portanto, a premissa de normalidade deve ser válida para grandes amostras. (e) Dado que n = 100, a média e a variância da razão V-N serão 2,02 e 0,04, respectivamente. Com esses valores, o intervalo
2, 02 ± 3( 0, 04) = (1,4203 , 2,6197),
cobre cerca de 99,7% da área sob a curva normal. Como o valor dado de 2,88 não está nesse intervalo, podemos concluir que há autocorrelação neste caso. 12.5 Sim, há evidência de autocorrelação com 3 ou 14 carreiras, positiva no primeiro caso e negativa no segundo. 12.6 Dividindo o numerador e o denominador por n², obtemos:
⎛ ⎛ d ⎞ k2 ⎜ ⎜1 − ⎟ + 2 2⎠ n ρˆ = ⎜ ⎝ k2 ⎜ − 1 ⎜ n2 ⎝
⎞ ⎟ ⎟. ⎟ ⎟ ⎠
n → ∞ , tanto o segundo termo do numerador quanto o d denominador tendem a zero. Conseqüentemente, ρˆ ≈ 1 − . 2 Para um dado k, quando
12.7 (a) A principal vantagem é a simplicidade, mas com ele também podemos tratar de problemas em que há mais de um mínimo local fazendo um ajuste fino do procedimento de varredura. (b) Isso é questão de tentativa e erro e ajuste fino da varredura. 12.8 (a) Isso é questão de verificação. (b) O procedimento de C-O não garante o mínimo global. Por isso, Davidson e Mackinnon argumentam que só é aconselhável aplicá-lo “depois que uma varredura preliminar tenha confirmado a existência de somente um mínimo local ou determinado aproximadamente onde está localizado o mínimo global” .
Manual de Soluções • Econometria Básica • Gujarati 12.9 O ρ estimado pela Equação (3) do procedimento C-O do exercício anterior é 0,9142, não muito diferente dos ρ subjacentes às Equações (12.9.16) e (12.9.17), que são, respectivamente, 0,8919 e 0,9610. Portanto, não veremos muita diferença nos resultados da regressão aplicando o procedimento C-O em duas etapas. 12.10 (a) Os resultados da regressão são os seguintes:
Variável dependente: Y Amostra (ajustada): 1960 1998 Observações incluídas: 39 após ajuste dos pontos extremos Variável C X X(-1) Y(-1) R-quadrado
Coeficiente 4,445970 0,601715 -0,554695 0,907369 0,995363
Pelo coeficiente Yt −1 , vemos que
ρˆ =
Erro-padrão 1,865601 0,144098 0,162254 0,057311
Estatística-t 2,383131 4,175736 -3,418688 15,83237
Probabilidade 0,0227 0,0002 0,0016 0,0000
0,9073, valor não muito diferente do obtido com
o procedimento C-O de duas etapas ou com o iterativo. Logo, concluímos que os resultados obtidos com o ρ estimado pelo procedimento em duas etapas de DurbinWatson não diferem muito daqueles alcançados pelos métodos C-O. (b) Esse assunto é parte do tópico sobre modelos de regressão não-lineares (nos parâmetros). 12.11 (a) O gráfico mostra que é provável que haja viés de especificação devido a erro de especificação do formato funcional. (b) Inclua [log(produção)]² como um regressor adicional. É provável que assim se recupere a natureza quadrática da relação entre custos e produção. 12.12 (a) Há muitas razões para a existência de um dado discrepante (outlier). Pode ser simplesmente uma observação diferente das demais, ou resultado de erros de medida, ou ainda devido a levantamento de amostras deficiente. (b) A observação não deve ser descartada a menos que haja alguma razão plausível para crermos que está errada (por exemplo, medida incorretamente, registrada com erro etc.). (c) Não. O dado discrepante pode predominar na SQR.
Manual de Soluções • Econometria Básica • Gujarati 12.13 Veja a resposta da Questão 12.3. 12.14 E (ε t ) = E (ut − ρ ut −1 ) = 0
(
)
var(ε t ) = E ⎡⎣( ut − ρ ut −1 )( ut − ρ ut −1 ) ⎤⎦ = 1 + ρ 2 σ 2 , devido à independência dos termos u.
cov ( ε t , ε t −1 ) = − ρσ . Mais uma vez, observe que os termos u são independentes. 2
Portanto, embora os u não estejam correlacionados, os ε estão. 12.15 Como o modelo inclui como regressor a variável dependente defasada, o d de Durbin-Watson não é o teste estatístico adequado. Deve ser usada neste caso a estatística h de Durbin dada na Questão 12.36. 12.16 Dado que se trata do esquema AR(1), seguem as respostas. (a) O método da primeira diferença é adequado quando ρ estiver próximo de 1. (b) Se ρ for cerca de –1, a regressão das médias móveis é apropriada. (c) A transformação de Theil-Nagar é adequada quando a primeira e a segunda diferenças dos regressores forem pequenas comparadas aos limites das próprias variáveis. (d) O procedimento C-O é adequado quando a SQR converge. (e) Veja a resposta da Questão 12.7. (f) Se o valor do ρ estimado pelo coeficiente da variável defasada Y for mais ou menos o mesmo que o estimado pela divisão do coeficiente da variável defasada X pelo coeficiente da variável X (preste atenção aos sinais dos coeficientes). 12.17 Transforme o modelo como segue:
(Yt − ρ1Yt −1 − ρ2Yt −2 ) = β1 (1 − ρ1 − ρ2 ) + β 2 ( X t − ρ1Yt −1 − ρ2Yt −2 ) + ε t .
Se os valores de ρ forem conhecidos, podemos estimar os dados assim. Se não, estime primeiro o modelo original por MQO e obtenha os resíduos uˆt . Faça, então, a seguinte regressão: uˆt = ρˆ1uˆt −1 + ρˆ 2uˆt −1 + vt , em que vt é um termo de erro. Use os ρ estimados por essa regressão e faça a transformação dos dados como sugerido no início. Se a amostra for razoavelmente grande, esses valores de ρ darão estimativas consistentes de seus congêneres da população.
∑ ( x − ρ x ) ⎡⎣(1 − ρ ) x y ⎤⎦ − ∑ ( x − ρ x )( y − ρ y ) ⎡⎣(1 − ρ ) x C= ∑ ( x − ρ x ) ⎡⎣(1 − ρ ) x + ∑ ( x − ρ x ) ⎤⎦ 2
12.18
t
2
t −1
1 1 2
t
t −1
os somatórios são de t = 2 a t = n.
t −1
t
2
2 1
t
t −1
2
t
t −1
2
2 1
⎤ ⎦ , todos
Manual de Soluções • Econometria Básica • Gujarati 12.19 Comecemos com (12.9.6), que, em formato de desvio, pode ser escrita
yt* = β 2* xt* + ( ε t − ε ) .
βˆ2* =
∑y x ∑x
* * t t *2 t
=
Aplicando
a
fórmula-padrão
dos
MQO,
obtemos
∑ ( y − ρ y )( x − ρ x ) . ∑(x − ρx ) t −1
t
t −1
t
2
t −1
t
Repare que a primeira observação foi omitida em virtude do processo de diferenciação. 12.20 Há nesta seqüência 22 sinais positivos, 11 negativos e 14 carreiras. Usando a aproximação normal dada no texto, podemos ver que o número esperado de carreiras é 18,83 e sua variância é 0,4955. O intervalo de confiança de 95% é, portanto, 18,83 ± 1, 96(0, 7039) , ou seja, de 17,45 a 18,83. Como o número observado de 14 carreiras está abaixo do limite inferior, concluímos que a seqüência observada não é aleatória. n
12.21 A fórmula seria d12 =
∑ (uˆ
t
− uˆt −12 ) 2
13
n
∑u
.
2 t
1
12.22 Conforme mencionado no texto, se houver um intercepto na regressão de primeira diferença, significa que havia na regressão original um termo de tendência linear. Dado que as variáveis mão-de-obra e capital estão determinadas, poderíamos interpretar que o intercepto fornece a taxa de crescimento da produção em virtude de mudança tecnológica, se presumirmos que tempo ou tendência são variáveis instrumentais para essa mudança. 12.23 Quando d é muito pequeno, ρˆ ≈ 1 −
d ≈ 1 . Neste caso, a equação da diferença 2
generalizada se reduz à regressão na forma de primeira diferença. 12.24 Se r = 0, a Equação (12.4.1) se reduz a:
⎛
E (σˆ 2 ) =
2 ⎞ ⎟ 2 ⎝ 1− ρ ⎠ = σ ⎛ n − 2 ⎞ . ⎜ ⎟ n−2 n − 2 ⎝ 1− ρ ⎠
σ 2 ⎜n−
(a) Se ρ for positivo, mas menor que 1, então E (σˆ ) ainda será tendencioso pois que subestimará o verdadeiro σ². 2
(b) Se ρ for negativo, mas maior que –1, E (σˆ ) também será tendencioso, mas superestimará o verdadeiro σ². 2
(c) O viés só será razoavelmente pequeno quando ρ estiver próximo de zero.
Manual de Soluções • Econometria Básica • Gujarati 12.25 (a) Como vemos pelos resultados gerados por computador, o único resíduo estatisticamente significativo é o da defasagem 1. É possível, naturalmente, que os outros cinco resíduos defasados não sejam significativos devido à colinearidade. (b) Como o coeficiente AR(1) de 0,8149 não é, em termos estatísticos, significativamente diferente de um, a transformação de primeiras diferenças pode ser adequada. Problemas 12.26 (a) A regressão estimada é a seguinte:
ln Cˆt = –1,500 + 0,468 lnIt + 0,279 lnLt + – 0,005 lnHt = 0,441 lnAt ep = (1,003) (0,166) t = (-1,496) (2,817)
(0,115) (2,436)
(0,143) (-0,036)
(0,107) (4,415)
R² = 0,936; R = 0,926; F = 91,543; d = 0,955. 2
Como vemos, os coeficientes individuais de I, L e A são estatisticamente significativos, e seu impacto sobre C é importante do ponto de vista econômico. (b) Se fizermos o gráfico dos resíduos e dos resíduos padronizados, veremos que é possível que indique autocorrelação. (c) Os resultados da regressão dados em (a) mostram que a estatística d é 0,955. Ora, para n = 30, k’ = 4 e α = 5%, o limite inferior de d é 1,138. Como o d calculado está abaixo desse limite crítico, existe evidência de autocorrelação positiva de primeira ordem. (d) Para o teste das carreiras, n = 30, n1 = 17, n2 = 13 e R = 9. Pelas tabelas de Swed e Eisenhart, os valores inferiores e superiores das carreiras a 5% são 10 e 22. Como o R observado é 9 e está abaixo do limite inferior, parece que há autocorrelação positiva nos dados, reforçando o resultado baseado no teste d em (c). (e) Talvez possamos usar o teste de Breusch-Godfrey apresentado no texto. 12.27 Seguem os resultados da regressão:
Yˆt = 246,240 + 15,182 Xt ep = (5,849) t = (42,104)
(0,643) (23,603)
r² = 0,977; d = 0,4148. (a) De acordo com esses resultados, d = 0,4148.
Manual de Soluções • Econometria Básica • Gujarati (b) Sim. Para n = 15, k’ = 1 e α = 0,05, dL = 1,077. Como o d calculado é menor que dL, existe evidência de autocorrelação positiva de primeira ordem. (c) (i) A estatística de Thiel-Nagar (veja a Questão 12.6) para n = 15 e k = 2 é ρˆ = 0,8251. (ii) O procedimento de Durbin em duas etapas pode não ser adequado a esse caso devido à alta colinearidade entre as variáveis explanatórias atuais e as defasadas. (iii) O método C-O fornece uma estimativa de 0,6691 para ρ (convergindo no nível de 0,005 após 3 iterações). (d) Usando a estimativa de ρ de Thiel-Nagar de 0,8251, transformamos os dados assim: [Yt – (0,8251)Yt-1] e [Xt – (0,8251)Xt-1]. Com os dados transformados, os resultados da regressão são os seguintes:
Yˆt * = 32,052 + 19,404 X t* (Nota: * indica variável transformada). ep = (4,925) t = (6,508)
(2,038) (9,522)
r² = 0,883; d = 1,923. Repare que essa regressão não corrige a perda da primeira observação da forma sugerida por Prais-Winsten. (e) Embora o valor d de 1,923 provavelmente indique que não há autocorrelação, não está claro se a estatística de Durbin-Wartson é adequada ao caso porque sugeriria um modelo AR(2) para a regressão original. Poderíamos, portanto, usar um teste nãoparamétrico, tal como o das carreiras, para testar correlação serial na regressão anterior. Para ela, n = 14, n1 = 8, n2 = 6 e R = 10. Pela tabela de Swed-Eisenhart, os valores críticos são 3 e 12. Como o valor observado das carreiras é 10 e está entre esses limites, podemos concluir que não há autocorrelação. 12.28 (a) Os resultados da regressão para o procedimento C-O de duas etapas são:
Yˆi * = –1,214 + 0,398 ln I t* + 0,336 ln L*t + – 0,055 ln H t* = 0,456 ln At* ep = (1,137) (0,247) (0,121) (0,147) (0,162) t = (-1,067) (1,610) (2,766) (-0,378) (2,818) R² = 0,951; F = 89,476; d = 1,488. (Nota: Os asteriscos indicam variáveis transformadas). O coeficiente de lnIt agora é insignificante, enquanto os coeficientes de lnL e lnA, embora com os valores numéricos bem alterados, ainda são significativos. Com base no teste das carreiras, também nesta regressão não parece haver autocorrelação: n = 29, n1 = 15, n2 = 14, R = 11 e valores críticos de 10 e 22 a 5%. (b) O ρ estimado pelo método C-O de duas etapas é 0,524, enquanto o estimado pela estatística d (veja a Questão 12.26) é: ρ = 1 – d / 2 = 1 – 0,955 / 2 = 0,5225. Assim, ambos os métodos dão essencialmente a mesma estimativa.
Manual de Soluções • Econometria Básica • Gujarati 12.29 Os resultados da regressão linear do custo total são:
Yˆi = 166,4667 + 19,933 Xt ep = (19,021) t = (8,752)
(3,066) (6,502)
r² = 0,841; d = 0,716. Para n = 10, k’ = 1 e α = 0,05, dL = 0,879. Como o d calculado está abaixo desse valor, “parece” haver autocorrelação, que pode, no entanto, ser mais aparente que real. De acordo com o mencionado no Capítulo 7, a função custo total poderia ser mais adequadamente especificada como polinomial do terceiro grau. Por isso, a correlação observada na regressão deve-se a erro de especificação do modelo. 12.30 Os resultados da regressão em forma de nível já foram dados na Questão 7.21. Eles mostram que o valor d é bem baixo e igual a 0,2187, indicando que o termo de erro é correlacionado. Podemos, com esse d, calcular ρ como segue: ρˆ = 1 – d / 2 = 0,8906, valor possivelmente próximo de 1 o bastante para tentarmos a transformação de primeira diferença, cujos resultados são os seguintes: Variável dependente: DLOG(RM2) Variável DLOG(RPIB) DLOG(TJLP) R-quadrado Estatística DurbinWatson d
Coeficiente 0,6086 -0,1354 0,5461
Erro-padrão 0,1665 0,0427
Estatística-t 3,6551 -3,168
Probabilidade 0,0021 0,0060
0,3832
A letra “D” é o comando do Eviews para tomar as primeiras diferenças. Observe também que não há intercepto nesse modelo. Por quê? Os resultados dessa regressão são interessantes comparados aos originais no Problema 7.21. Enquanto antes a elasticidade da TJLP era estatisticamente insignificante, agora é muito significativa. Ao mesmo tempo, a elasticidade da renda aumentou de 0,4946 para 0,6086 e também é muito significativa. Talvez a diferença nos resultados tenha a ver com a natureza da série temporal envolvida, a qual é bem possível que não seja estacionária. Não temos ainda as ferramentas para tratar dessa questão, mas as teremos quando estudarmos o tópico da econometria das séries temporais mais adiante no texto. 12.31 Como os valores de X já estão arrumados em ordem crescente, o valor d é igual ao calculado com o método sugerido por Thiel. Para a justificativa desse procedimento, consulte Thiel. 12.32 No Problema 11.22 temos os resultados de duas regressões. Os da primeira levam a um valor d estimado de 2,6072, o qual indicaria que não há autocorrelação. Mas essa indicação é suspeita, pois há uma observação excepcional relativa ao Chile, que, excluída do modelo, levou aos resultados da segunda regressão, que mostram
Manual de Soluções • Econometria Básica • Gujarati não haver relação entre as duas variáveis e exibem um d estimado de 2,6199. Não existe mesmo autocorrelação nesses dados. Estudaremos no Capítulo 13 o papel das observações anormais (ou excepcionais), chamadas dados discrepantes (outliers), alavancagem etc. 12.33 Segue um conjunto de dados gerados segundo o esquema sugerido: ut 09,464 10,544 11,944 10,427 09,316 08,681 07,525 08,070 07,504 05,797 (a)
Xt 1 2 3 4 5 6 7 8 9 10
Yt 12,964 14,544 16,444 15,427 14,816 14,681 14,025 15,070 15,004 13,797
Yˆt = 14,694 + 0,003 Xt ep = (0,688) t = (21,354)
(0,111) (-0,027)
r² = 0,000; d = 1,296. (b) Os resultados individuais variarão à medida que ut varia. (c) Mais uma vez, os resultados individuais variarão. 12.34 (a) Os resultados da regressão de estoque (Y) contra vendas (X), ambas as variáveis em milhões de dólares, são:
Yˆt = 1668,154 + 1,554 Xt ep = (1806,696) (0,007) t = (0,910) (-222,832) r² = 0,999; d = 1,374. (b) (i) Para n = 42 e k’ = 1, o dL a 5% é 1,46. Como esse valor está acima do d observado de 1,374, existe evidência de autocorrelação positiva de primeira ordem. (ii) Podemos obter uma estimativa de ρ pelo valor d de 1,374: ρˆ = 1 – d / 2 = 0,3218. Com esse dado, obtemos: z =
( n ) ( 0,3218) = 2, 027 , valor significativo no nível de
5%, indicando que há autocorrelação. (c) Considerando os resultados em (b), não parece provável que o ρ verdadeiro seja um. Mas se, assim mesmo, aplicarmos mecanicamente o teste, obteremos os seguintes resultados:
Manual de Soluções • Econometria Básica • Gujarati
g=
MQOeqprimeirasdiferenças MQOeqformadenível
=
2,93 × 109 = 1,320 . 2, 22 × 109
Para 41 observações, k’ = 1 e α = 0,05, dL = 1,45. Como o g observado está abaixo desse valor, não rejeitamos a hipótese nula de que o verdadeiro ρ = 1. Mas lembre-se do aviso dado anteriormente. (d) A estatística do teste de Breusch-Godfrey é significativa para 3 defasagens (p de 0,03), 4 defasagens (p de 0,04) e 7 defasagens (p de 0,07), embora nenhum coeficiente defasado individual seja zero. Em prol da parcimônia, devemos escolher 3 defasagens. (e) Se usarmos só o esquema AR de primeira ordem e aplicarmos o p de 0,3218 que obtivemos em (b), podemos fazer a transformação [Yt – (0,3128)Yt-1] e [Xt – (0,3128)Xt-1] e rodar com ela a regressão. Se preferirmos usar um esquema AR(3), teremos de fazer as transformações [Yt – p1Yt-1 – p2Yt-2 – p3Yt-1] e outra análoga para Xt.. Teremos de obter os três valores de p pelo procedimento de Breusch-Godfrey. (f) Os resultados do modelo log-linear são os seguintes: Variável C LOG(VENDAS) R-quadrado Estatística DurbinWatson d
Coeficiente 0,507409 0,995128 0,999324
Erro-padrão 0,048561 0,004091
Estatística-t 10,44886 243,2302
Probabilidade 0,0000 0,0000
1,2077
Os resultados desse modelo são qualitativamente os mesmos do linear, à exceção de que neste a estatística Breusch-Godfrey é significativa somente na primeira defasagem. (g) Veja a discussão no Capítulo 6 e na Seção 8.11 do livro-texto. 12.35 (a) Seguem os resultados da regressão: Variável C INFLAÇÃO R-quadrado Estatística DurbinWatson
Coeficiente 23,98694 -4,375620
Erro-padrão 5,235037 1,022227
Estatística–t 4,582000 -4,280479
Probabilidade 0,0001 0,0002
Erro-padrão 8,111369 1,293445 1,082101
Estatística-t 0,435415 3,048693 -2,309789
Probabilidade 0,6670 0,0054 0,0294
2,076724
(b) A regressão é a seguinte: Variável C CRESCIMENTO INFLAÇÃO
Coeficiente 3,531812 3,943315 -2,499426
Manual de Soluções • Econometria Básica • Gujarati 0,572374 Durbin1,8965
R-quadrado Estatística Watson d
(c) A afirmação de Fama está correta, e, para vermos isso melhor, faremos a regressão de inflação atual contra crescimento da produção como segue: Variável C CRESCIMENTO R-quadrado Estatística DurbinWatson
Erro-padrão 0,788408 0,192818
Coeficiente 6,326759 -0,679792 0,323439
Estatística-t 8,024730 -3,525570
Probabilidade 0,0000 0,0016
0,538786
(d) Os valores d estão em torno de 2 em ambas as regressões, indicando que provavelmente não há autocorrelação de primeira ordem. Esse resultado não é de surpreender porque as variáveis nas duas regressões estão em forma de crescimento, o que significa que a primeira diferença está implícita, e esta em geral reduz a autocorrelação. 12.36 Os resultados da regressão são: Variável C X Y(-1) R-quadrado Estatística DurbinWatson d
Coeficiente 8,176797 0,124403 0,801918 0,993815
Erro-padrão 1,723142 0,040598 0,055007
Estatística-t 4,745284 3,064274 14,57853
Probabilidade 0,0000 0,0041 0,0000
1,5005
Esses resultados indicam que o índice de remuneração real depende não só do índice de produção, mas também do índice de remuneração real predominante no período principal. (b) Aplicando a estatística h, temos:
h = ρˆ
n
( )
1 − n ⎡ var βˆ3 ⎤ ⎣ ⎦
= (0, 2497)
40 = 1, 6835 , em que o ρ estimado foi 1 − 40(0, 003)
( ) é igual ao quadrado do erro-padrão de Y
obtido pelo valor d dado em (a) e var βˆ3
t-1,
também dado em (a). Se presumirmos que a amostra de 40 observações é razoavelmente grande, então o h calculado anteriormente segue a distribuição normal padrão. Ora, como o valor do Z (isto é, variável normal padrão) crítico a 5% é 1,96, e o h que calculamos é menor que esse valor, podemos concluir que não há autocorrelação neste exemplo.
Manual de Soluções • Econometria Básica • Gujarati 12.37 Seguem os resultados da regressão baseados no procedimento Maddala examinado no livro-texto, em que ISTAR é a variável renda transformada, NDUM é a variável binária transformada e PROD é o produto das duas. Variável C ISTAR NDUM PROD R-quadrado Estatística DurbinWatson d
Coeficiente -4,041785 0,086407 67,37838 -0,067809 0,551249
Erro-padrão 23,34284 0,031605 35,50361 0,036959
Estatística-t -0,173149 2,733972 1,897789 -1,834690
Probabilidade 0,8642 0,0124 0,0716 0,0808
2,203363
Se compararmos esses resultados com os da Equação (9.5.4), veremos que o coeficiente da variável renda e o seu coeficiente angular diferencial são quase iguais. Devido à transformação dos dados, não podemos comparar diretamente os coeficientes de intercepto e a variável binária (NDUM).
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 13 MODELAGEM ECONOMÉTRICA: ESPECIFICAÇÃO DO MODELO E DIAGNÓSTICOS 13.1 Como o modelo está aparentemente fundamentado na teoria econômica, parece estar bem especificado. No entanto, a forte correlação existente entre as variáveis preço poderia levar a problemas decorrentes da multicolinearidade. A escolha da forma funcional é uma questão empírica.
13.2 Em formato de desvio, o modelo verdadeiro pode ser escrito Agora, αˆ1 = Logo,
∑ y x = ∑ ⎡⎣ β x + ( u − u )⎤⎦ x ∑x ∑x 1 i
i i 2 i
i
i
2 i
yi = β1 xi + (ui − u ) .
.
E (αˆ1 ) = β1 , pela aplicação das várias propriedades de ui e xi. Ou seja, mesmo
que incluamos o intercepto desnecessário no segundo modelo, o coeficiente angular permanecerá não-tendencioso, conforme reza a teoria. As variâncias dos dois estimadores são:
σ u2 ˆ e var(αˆ1 ) = var( β1 ) = 2 X ∑ i
σ v2
∑(X − X )
2
, que não são iguais.
13.3 Sabemos que:
βˆ1 = ∑
∑ X (α + α X + v ) = α ∑ X ∑X ∑X ∑X α ∑X +α . Portanto, E ( βˆ ) = ∑X X iYi 2 i
=
i
0
1 2 i
0
1
i
i
0
2 i
i
+ α1 +
∑v X ∑X i
2 i
i
.
i
2 i
1
Neste caso, o estimador do coeficiente angular no modelo incorreto fornece um estimador tendencioso do verdadeiro coeficiente angular. As variâncias são como no Exercício 13.2. 13.4 (a) Recordemos a seguinte fórmula do Capítulo 7:
R2 =
r122 + r132 − 2r12 r13r23 . 1 − r232
Como X3 é irrelevante, r13 =0, e a fórmula se reduz a
R2 =
r122 . Então, tipicamente, 1 − r232
a inclusão de X3 aumentará o valor de R². Se, no entanto, r23 for zero, o R² não será alterado. (b) Sim, pelas razões apresentadas no texto, são não-tendenciosas. (c) As variâncias de βˆ2 nos dois modelos são:
Manual de Soluções • Econometria Básica • Gujarati
σ2 var βˆ2 = u 2 , para o modelo verdadeiro; e var βˆ2 = ∑ xi
incorreto.
∑x
σ v2
2 i
(1 − r232 )
, para o modelo
Logo, as variâncias não são iguais. 13.5 (a) Conforme vimos no texto, a omissão de uma variável relevante levará à estimação tendenciosa. Daí, E ( βˆ1 ) ≠ α1 e E ( βˆ2 ) ≠ α 2 . As derivações com álgebra escalar conduzem a expressões pesadas, difíceis de lidar. Por outro lado, podem ser facilmente realizadas com álgebra matricial. Mas se quiser prosseguir, estime os parâmetros do modelo ”incorreto” e então coloque o modelo verdadeiro nos parâmetros estimados, tome as expectativas e descubra se os valores esperados dos parâmetros do modelo incorretamente especificado são iguais aos seus valores verdadeiros. Se não forem, então há viés. (b) Se L2 for uma variável irrelevante, então as estimativas permanecerão nãotendenciosas, com o senão de terem variâncias maiores devido à presença da variável “incômoda” L2.
13.6 Se a variância menor de
αˆ 2
mais do que compensa pelo viés, devemos escolher
esse estimador baseados no critério EQM (erro quadrático médio). O objetivo deste exercício é registrar que às vezes um estimador tendencioso pode ser escolhido em virtude de sua menor variância. Tudo depende, naturalmente, do propósito da pesquisa. 13.7 Pela Equação (13.5.3), aplicando MQO, temos:
βˆ = ∑
xi yi
∑x
2 i
=
∑ x Y = ∑ x (α + β X ∑x ∑x i i 2 i
i
i 2 i
+ ui + ε i )
=β+
∑xu +∑xε ∑x i i
i i
2 i
.
Tomando as expectativas da expressão anterior em ambos os lados, e observando as propriedades de xi, ui e ε, vemos que β não é tendencioso. 13.8 (a) Com os subscritos de observação omitidos por conveniência, para a Equação (2), resultamos de MQO:
∑ xy = ∑ [ y + (u − u )][ x − (v − v )] . ∑x ∑ [ x + (v − v )] ∑y x . E para a Equação (1) βˆ = ∑x *
βˆ =
2
*
*
2
* * *2
Manual de Soluções • Econometria Básica • Gujarati Substituindo isso na expressão anterior, simplificando e achando o limite quando
n → ∞ , chegamos à expressão p lim( βˆ ) =
β σ2 1 + v2 σx
, que mostra que βˆ é tendencioso.
*
(b) Não, como se pode observar pela expressão precedente. Em outras palavras, βˆ não é um estimador consistente. 13.9 (a) O método e os resultados são os mesmos da Questão 13.8. (b) Há várias medidas corretivas apresentadas na literatura avançada.
13.10 O modelo correto é
Yi = β1 + β 2 X 2i + β3 X 3i + ui .
Mas se dele omitirmos X3, regressarmos Y somente contra X2 e depois regressarmos os resíduos dessa regressão contra X3 e obtivermos seu coeficiente, digamos, αˆ3 , este então será tendencioso e também estimador inconsistente do verdadeiro
β3 . Para uma
prova formal, consulte “Diagnostic Tests as Residual Analysis”, de A. R. Pagan e A. D. Hall, Econometric Reviews, Vol. 2, 1983, pp. 159-218.
13.11 (a) (b)
βˆ1( verdadeiro ) = βˆ1 + 5βˆ2
βˆ1( verdadeiro ) = βˆ1
e
e
βˆ2( verdadeiro ) = βˆ2 .
βˆ2( verdadeiro ) = 3βˆ2 .
(c) O coeficiente do intercepto será não-tendencioso, mas o coeficiente angular será tendencioso e inconsistente.
13.12 Para a Equação (13.3.2), temos
αˆ1 = Y − αˆ 2 X 2 . Portanto, aplicando (13.3.3)
E (αˆ1 ) = Y − ( β 2 + β 32b32 ) X 2 = ( β1 + β 2 X 2 + β 3 X 3 ) − ( β 2 + β 3b32 ) X 2 = β1 + β 3 ( X 3 − b32 X 2 ) .
13.13 Leamer aborda o problema econometria teórica versus economia aplicada de uma forma um tanto quanto cética. Ele essencialmente sustenta que os teóricos examinam o campo e identificam áreas problemáticas quando põem em prática a teoria. Algumas delas são autocorrelação, heterocedasticidade, multicolinearidade e especificação de modelos. Dos profissionais espera-se, então, que discutam como seus resultados podem ser influenciados por essas áreas identificadas pelos teóricos. 13.14 A afirmação de Thiel diz respeito às estratégias de regressão, justamente o título do capítulo de onde vem essa citação. Ele se refere ao pensar com cautela sobre os testes de hipóteses e fundamenta isso no fato de que os referidos testes de regressão surgem de processos de tomada de decisão dinâmicos em que cada decisão
Manual de Soluções • Econometria Básica • Gujarati sucessiva depende das informações disponíveis no momento em que deve ser tomada. Para uma discussão mais extensa, leia o capítulo correspondente do livro de Thiel. 13.15 Blaugh pode estar certo. Pesquisadores por vezes “impõem” a um conjunto de dados um modelo que tenham desenvolvido sem avaliar criticamente a sua aplicabilidade àqueles dados. Sempre que surge uma nova técnica econométrica, eles encantam-se por ela e começam a aplicá-la indiscriminadamente. Por exemplo, quando os modelos de expectativas racionais se tornaram o grito da moda, houve quem os aplicasse a todo tipo de economia sem lestudar suas estruturas. 13.16 Para ilustrar o pensamento de Blaugh, recordemos que ao testar hipóteses, se o teste estatístico (o t, por exemplo) não for significativo, não afirmamos que aceitamos a hipótese nula, mas que não a rejeitamos. A razão para isso é a possibilidade de que com base em outro conjunto de dados possamos rejeitar a mesma hipótese nula. Assim, ao não a rejeitarmos, apenas afirmamos que a amostra disponível não nos dá nenhum motivo para rejeitá-la. 13.17 Pode-se fazer objeção à estipulação de que a afirmação “são as variações na oferta monetária que determinam as variações no PNB (nominal)” seja forte demais com base no modelo St. Louis. Dois dos cinco coeficientes para a taxa de crescimento dos gastos do governo em termos de pleno, ou alto, emprego são estatisticamente significativos no nível de 95%. E por sinal, dois dos coeficientes da taxa de crescimento da oferta de moeda não são estatisticamente diferentes de zero. Além disso, deve haver colinearidade no modelo entre a taxa de crescimento da oferta de moeda e a taxa de crescimento dos gastos do governo em termos de pleno emprego. Seria interessante reproduzir o modelo St. Louis com dados mais recentes. Acabou a primazia da oferta de moeda M1, que está sendo substituída pela da M2.
13.18 Pode-se mostrar que (Dica:
E (αˆ1 ) = β 4 + 4β3 e E (αˆ 2 ) = β 2 + 7 β 4 .
X = 0 em virtude dos valores tomados por X.
13.19 Suprimindo o subscrito de observação i por conveniência, como Yˆ = βˆ1 + βˆ2 X i , vem que Yˆ = βˆ1 + 2 βˆ1βˆ2 X + βˆ2 X . 2
Se
2
2
substituirmos
(
o
2
último
Y = αˆ1 + αˆ 2 X + αˆ 3 βˆ + 2 βˆ1 βˆ2 X + βˆ X 2 1
2 2
valor
2
) = (αˆ
1
na
+ αˆ 3 βˆ
2 1
equação
) + (αˆ
2
)
RESET,
(
+ 2αˆ 3 βˆ1βˆ2 X + αˆ 3 βˆ
obteremos:
2 2
)X
2
= λ1 + λ2 X + λ3 X 2 , que é o resultado solicitado, em que os λ são uma mistura dos coeficientes originais. 13.20 (a) Verdadeira. Veja a Figura 13.4. (b) Verdadeira. Veja a Figura 13.4.
Manual de Soluções • Econometria Básica • Gujarati (c) Verdadeira. Veja a Figura 13.4. (d) Verdadeira. O termo linear e o quadrático são necessários numa equação do segundo grau. (e) Verdadeira. O primeiro modelo em formato de desvio é No segundo modelo, espera-se que
α1
yi = β 2 x2i + β3 x3i + (ui − u ) .
seja zero (Por quê?). Portanto, os dois modelos
são basicamente iguais, de forma que a linha (plano) de regressão estimada é a mesma.
13.21 (a) A Equação (1) é o modelo irrestrito, e a (2), o restrito. Aplicando o teste F restrito que vimos no Capítulo 8, podemos testar se a restrição (que a variável X6 não se encaixa no modelo) é valida. Os R² irrestrito e restrito são, respectivamente, 0,9803 e 0,9801. Daí, obtemos:
( R − R ) NR = ( 0,9803 − 0,9801) 1 = 0, 2206 . F= (1 − R ) ( n − k ) (1 − 0,9803) 23 − 4 2 SR
2 R
2 SR
Como esse valor não é significativo, o modelo restrito (2) é aceitável. Não há, então, necessidade de fazer aqui um teste RESET explícito. O mesmo se aplica ao teste ML. (b) No caso em tela, a variável ln X6 não é estatisticamente significativa, mas é bem possível que possa vir a sê-lo em outra amostra. (c) Não. O fundamento para incluir variáveis explanatórias num modelo é a teoria econômica sólida, não estatísticas t ou F. 13.22 (a) Esse seria um caso de inclusão de variáveis desnecessárias. (b) Os estimadores seriam não-tendenciosos e consistentes, mas suas variâncias seriam, no entanto, grandes. 13.23 Os resultados da regressão de Y contra X, ambas incorretamente medidas, são:
Yˆi = 28,302 + 0,584Xi ep = (12,677) (0,071)
r² = 0,895.
Resultados que estão próximos daqueles com os dados corretos, mas os coeficientes refletem o viés esperado. 13.24 (a) Viés de omissão de variável. (b) Conforme vimos no texto, βˆ2 será tendencioso e também inconsistente.
Manual de Soluções • Econometria Básica • Gujarati (c) Os resultados do modelo ampliado são:
⎛V ⎞ ⎛ 1⎞ ln ⎜ ⎟ = -3,385 + 2,126lnW + 1,505 ln ⎜ 1 + ⎟ ⎝ E⎠ ⎝L⎠ t = (-0,534) (1,229)
(0,471)
R² = 0,895; F = 67,91; d = 2,362. Para comparação, os resultados do modelo original CES são:
⎛V ⎞ ln ⎜ ⎟ = -0,472 + 1,340W ⎝L⎠ t = (-0,352) (3,022) R² = 0,413; d = 1,826. Como vemos, os resultados do modelo ampliado são insatisfatórios, pois nenhum dos coeficientes angulares é estatisticamente significativo, denotando que a variável adicional é supérflua, que há graves erros de medida nas elasticidades calculadas, que existe colinearidade nos dois regressores ou que todos esses fatores estão presentes. 13.25 Este exercício é para ser feito em aula, pois o resultado real dependerá da amostra que estiver à mão. 13.26 Como não se pode derivar do modelo B o A e vice-versa, o teste J deve ser mais adequado. O teste F aninhado, no entanto, pode ser usado para comparar o modelo irrestrito do Problema 8.26 com os modelos restritos A e B, conforme os resultados a seguir.
Comparação com o modelo A:
( R − R ) NR = ( 0,823 − 0, 601) 2 = 6, 271, em F= (1 − R ) ( n − k ) (1 − 0,823) (16 − 6 ) 2 SR
2 R
2 SR
que o R² irrestrito é o do modelo do Problema 8.26 e o restrito é o do modelo A. Como o F estimado é significativo no nível de 5%, rejeitamos o modelo A como correto. Comparação com o modelo B: F =
( 0,823 − 0,189 ) 2 = 17,910 , (1 − 0,823) (16 − 6 )
em que os valores
0,823 e 0,189 são os R² do modelo do Problema 8.26 e o do modelo B, respectivamente. Novamente, o F é significativo no nível de 5%, indicando que o modelo B também não é o correto. 13.27 Neste caso temos as seguintes etapas: B 1. Estimar o modelo B e dele obter os valores estimados de Y, Yˆi .
Manual de Soluções • Econometria Básica • Gujarati B 2. Acrescentar Yˆi ao modelo A como variável explanatória adicional, estimar a
regressão resultante e testar a hipótese de que o coeficiente dessa variável nesta regressão não é estatisticamente significativo. Se a hipótese for rejeitada, é provável que o modelo A não seja o correto. 3. Repetir as etapas 1 e 2 trocando os papéis de A e B. A seguir estão os resultados das regressões, sem o subscrito de observação t, omitido por conveniência.
Yˆ = 6042,059 + 1,226X3 – 820,010X4 – 1115,888 X6 + 1,213 Yˆ B t = (1,8480)
(0,831)
(-3,658)
(03,908)
(2,184)
R² = 0,722; F = 7,138. O valor p do coeficiente Yˆ é 5,15%, que não é significativo se nos prendermos ao nível de 5%, indicando que o modelo A é o “correto”. B
Yˆ = – 8944,403 + 3,177X2 + 108,217X5 + 572,812 X6 + 1,210 Yˆ A t=
(– 3,016)
(1,921)
(1,070)
(2,293)
(5,960)
R² = 0,808; F = 11,583. O coeficiente da variável Yˆ é significativonao nível de 0,0001. Com base nesses resultados, parece que o modelo A é o “correto”. A
13.28 (a) A diferença entre os modelos (1) e (2) no Exercício 7.19 é que há no segundo uma variável explanatória adicional. Se o modelo (2) for o correto, estimar o (1) constituiria viés de variável omitida. Pode-se fazer o teste RESET de Ramsey apresentado no livro. Aplicando a estatística F, cujo valor é 1,474, não rejeitamos a hipótese de que o modelo (2) é o que está corretamente especificado. (b) Com base no teste de Ramsey, descobriremos que o modelo (5) está corretamente especificado. 13.29 Há algumas possibilidades, mas só consideraremos uma, a saber, o teste J de Davidson-MacKinnon, cujas etapas são as seguintes.
Yf A . B 2. Estimar o modelo B e obter dele os valores previstos, Yf . B 3. Executar novamente o modelo A incluindo a variável Yf . Se o coeficiente 1. Estimar o modelo A e obter dele os valores previstos,
dessa variável for estatisticamente significativo, escolha o modelo B. 4. Executar novamente o modelo B incluindo a variável
Yf A . Se o coeficiente
dessa variável for estatisticamente significativo, escolha o modelo A.
Manual de Soluções • Econometria Básica • Gujarati 5. Se
Yf B no modelo A e Yf
A
no modelo B forem ambos estatisticamente
significativos, então os dois modelos são aceitáveis. Se executarmos esses passos, chegaremos à conclusão de que ambos são modelos aceitáveis. Entretanto, se introduzirmos a taxa de juros, é bem possível que um seja preferível ao outro. A seguir temos os resultados das regressões sem a variável taxa de juros, em que Y é a poupança e X a renda.
Yˆt = – 39,2316 + 0,3616Xt – 0,3801Xt-1 + 1,1188 Yf B t = (–1,7725)
(3,8804)
(–3,9028)
(4,2355)
R² = 0,8965; d = 1,8193.
Yˆt = – 43,4574 – 0,0269Xt + 0,5864Yt-1 + 1,1430 Yf t = (–1,8294)
(–2,1177)
(4,2355)
A
(3,9027)
R² = 0,8965. O d de Durbin-Watson para o segundo modelo é 1,8193, mas não pode ser usado nele para testar correlação serial devido à presença de regressando defasado. Como vemos, ambos os modelos são aceitáveis com base no teste J. Por que será que o coeficiente da variável renda no segundo modelo é negativo? 13.30 Os resultados da regressão de poupança contra renda são os seguintes: Período
Intercepto
Coef. angular
R²
1970– 1981
1,0161
0,0803
0,9021
(0,873)
(9,6015)
9,7255
0,00591
(0,8999)
(12,2197)
50,2516
0,0444
(3,6396)
(7,6745)
62,4226
0,0376
(4,8917)
(8,8938)
1970– 1985 1970– 1990 1970– 1995
0,9142
0,7561
0,7672
Como vemos, há bastante flutuação nos interceptos e coeficientes angulares estimados, talvez trazendo à tona a questão da estabilidade da relação poupançarenda ao longo dos diferentes períodos.
Manual de Soluções • Econometria Básica • Gujarati 13.31
Aplicando
os
dados
( 23248,30 − 1785, 032 ) 14 = 8,5885 . F= (1785, 032 ) 10
na
Equação
(13.10.1),
obtemos:
Aqui, n1 = 12 e n2 = 14. Esse F é muito significativo estatisticamente (valor p = 0,0008), levando à conclusão de que a relação poupança-renda não foi estável ao longo do período observado. 13.32 Vejamos o efeito da exclusão de X6 no coeficiente da variável mantida lnX2. De acordo com a equação dada no enunciado, vem que E
( βˆ ) = β 2
2
+ β 6b62 . No modelo
verdadeiro (1), os valores de β2 e β6 são, respectivamente, 0,4813 e –0,0610. Pode-se mostrar que o valor de b62 é 0,4875. Daí, obtemos:
( )
E βˆ2 = 0,4812 – (0,0610) (0,4875) = 0,4515. Ou seja, o viés é –0,0297. Dito de outra forma, com a exclusão de X6 o coeficiente de β2 foi subestimado em aproximadamente -0,03. Aplique esse procedimento para encontrar o viés no coeficiente de lnX3.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 14 MODELOS DE REGRESSÃO NÃO-LINEARES 14.1 Se um modelo de regressão parece não-linear nos parâmetros, mas pode ser linearizado nos parâmetros com as transformações adequadas, então ele é basicamente, ou intrinsecamente, um modelo de regressão linear. Mas se não houver jeito de torná-lo linear nos parâmetros, então se trata de um modelo de regressão intrinsecamente não-linear. Exemplos disso já foram dados nos Exercícios 2.6, 2.7 e 2.9. 14.2 Se o termo de erro for incluído de modo aditivo, o modelo Cobb-Douglas (C-D) torna-se um modelo de regressão intrinsecamente não-linear. Se for incluído de modo multiplicativo, o modelo torna-se linear nos parâmetros de inclinação, mas não no intercepto. Mas as propriedades do termo de erro nesse modelo dependem de como ele é incluído de modo multiplicativo, se conforme (14.1.2) ou (14.1.3). A diferença tem implicações diversas para estimação e inferência. Tradicionalmente, tem sido incluído conforme (14.1.2). Para determinar qual forma é adequada em cada caso, podemos aplicar o teste J ou um similar. Se estimarmos o modelo C-D com ambos os termos de erro aditivo e multiplicativo, também podemos examinar os resíduos estimados dessas duas especificações e descobrir se os termos de erro estão normalmente distribuídos ou se há correlação serial etc. 14.3 Na estimação por MQO podemos obter soluções explícitas, ou analíticas, para os parâmetros desconhecidos. Nas estimações por MQNL não há como conseguir isso, e as estimativas obtêm-se por um procedimento iterativo. 14.4 Primeiro, escreva a equação assim: ui = Y − β110
β2 t γ +t
. Vamos, agora, minimizar:
2
β2 t ⎛ ⎞ γ +t u Y β 10 = − ⎜ ∑ ∑ ⎜ i 1 ⎟⎟ . ⎝ ⎠ 2 i
Há três incógnitas nessa expressão: β1, β2 e γ. Logo, temos de diferenciar a equação em relação a cada uma das incógnitas, igualar a zero as expressões resultantes e resolvê-las simultaneamente. Como imaginamos, as expressões resultantes são nãolineares e não podemos obter soluções explícitas. Daí, teremos de recorrer a um dos métodos de estimação não-linear vistos no livro. Para os alunos arrojados, aí vão as três derivadas:
Manual de Soluções • Econometria Básica • Gujarati
∂ ∑ ui2
β2 t β2 t ⎡⎛ ⎞⎛ γ +t = 2∑ ⎢⎜ Yi − β110 γ + t ⎟ ⎜ −10 ⎟ ⎢⎣⎜⎝ ⎠⎝
∂ ∑ ui2
β2 t β2 t ⎡⎛ ⎞⎛ γ +t γ +t = 2∑ ⎢⎜ Yi − β110 ⎟ ⎜ − β110 ⎟ ⎢⎣⎝⎜ ⎠⎝
⎞ ⎛ t ⎞⎤ ⎟⎜ ⎟⎥ ⎠ ⎝ γ + t ⎠ ⎥⎦
∂ ∑ ui2
β2 t β2 t ⎡⎛ ⎞⎛ γ +t γ +t = 2∑ ⎢⎜ Yi − β110 ⎟ ⎜ − β110 ⎜ ⎟ ⎢⎣⎝ ⎠⎝
⎞ ⎛ β 2t ⎞ ⎤ ⎥ ⎟⎜ 2 ⎟ ⎠ ⎝ (γ + t ) ⎠ ⎥⎦
∂β1
∂β 2 ∂γ
⎞⎤ ⎟⎥ ⎠ ⎥⎦
Iguale essas expressões a zero para obter as equações normais, as quais têm de ser resolvidas iterativamente. 14.5 (a) Verdadeira. Veja a discussão na Seção 14.5. (b) Verdadeira. Veja a discussão na Seção 14.5. 14.6 Consulte a Seção 14A.3 no Apêndice 14A. Usando só as primeiras derivadas, podemos generalizar a Equação (2) para mais de duas incógnitas. Para usar essa fórmula, precisamos da derivada da função CES em relação às incógnitas A, β e δ. As expressões dessas derivadas são pesadas, difíceis de lidar. O aluno mais arrojado pode encontrá-las no livro de Judge, et alli 1 .
14.7 (a) Neste caso,
dy = β 2 . Esse modelo indica que Y cresce a uma taxa β 2 , positiva dt
ou negativa, dependendo do sinal, mas constante ao longo do tempo. (b)
1 dY = β 2 , indicando que a mudança relativa em Y é uma constante igual a β 2 . Y dt
Multiplicando isso por 100, teremos a variação percentual, ou taxa de crescimento.
β1 , de 1 + β2 t → ∞ , Y = β1 , que é o
(c) O modelo logístico de crescimento tem forma de S. Quando t = 0, Y = forma que este é o valor inicial de Y. Da mesma forma, quando valor limite de crescimento de Y. Daí vem que
β2 > 0 .
(d) Assim como a curva logística de crescimento, a curva Gompertz de crescimento também tem forma de S, mas não é simétrica em torno do seu ponto de inflexão, que é dado por
1
Y=
β1 e
= 0,368β1 . Para obter o ponto de inflexão, faça
d 2Y = 0 . Além dt 2
Veja George G. Judge, R. Carter Hill, William Griffiths, Helmut Lutkepohl e Tsoung-Chao Lee, Introduction to the Theory and Practice of Econometrics, 2ª edição, John Wiley & Sons, New York, 1988, p. 514
Manual de Soluções • Econometria Básica • Gujarati disso, repare que
dY dt = β3 ( ln β1 − ln Y ) , que significa que a taxa de crescimento Y
relativa em Y está linearmente relacionada ao logaritmo de Y.
A curva Gompertz de crescimento tem sido utilizada para estudar o crescimento da população e de animais. Problemas 14.8 Nos modelos seguintes, Y = população e t = tempo. Modelo linear
Yˆt = 221,7242 + 0,1389t t = (109,2408) (44,4368); r² = 0,8178. Modelo log-lin
Y = 5,3170 + 0,0098t ln t t =(8739,399)(285,9826); r² = 0,9996. Modelo logístico
Yˆt =
1432, 739 ; R² = 0,9997. 1 + 1, 7986e −0,01117 t
Repare que as razões t de β1, β2 e β3 estimados são, respectivamente 2,8209, 4,3618 e –14,0658. Modelo Gompertz
{
}
Yˆt = 1440, 733exp 1,9606e0,0054t ; R² = 0,9995. Repare que as razões t de β1, β2 e β3 estimados são, respectivamente 2,7921, 5,4893 e 5,4197. Deixamos para o leitor a interpretação desses resultados em vista da discussão teórica desses modelos no Exercício 14.7. 14.9 Função de produção Cobb-Douglas com erro aditivo PIB = 0,5292(mão-de-obra)0,1810 (capital)0,8827; R² = 0,9942. Nota: Repare que as razões t dos três coeficientes são, respectivamente 1,9511, 1,2814 e 12,4658. Função de produção Cobb-Douglas com erro multiplicativo
Manual de Soluções • Econometria Básica • Gujarati lnPIBt = –1.6524 + 0,3397 lnmão-de-obra +0,8459 lncapital t = (–2,7258) (1,82950) (9,0624) R² = 0,9950. Como vemos, qualitativamente os resultados das duas especificações diferem na elasticidade produção/mão-de-obra, maior no modelo multiplicativo. A significância marginal desse coeficiente também é muito maior neste do que no aditivo. Mas tenha em mente que os resultados do modelo de termo de erro aditivo (isto é, modelo de regressão não-linear) não podem ser comparados diretamente com os do outro. Além disso, as razões t estimadas devem ser interpretadas no contexto de grandes amostras para o modelo não-linear.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 15 MODELOS DE ESCOLHA QUALITATIVA
15.1 Os resultados da regressão baseados na exclusão das 12 observações são:
X 1 Yˆi = 1, 246 + 0,120 i wi wi t = (–10,332)
(17,454)
E os resultados baseados na manutenção das 12 observações depois de feitos os ajustes sugeridos são:
X 1 Yˆi = −0, 635 + 0, 0820 i wi wi t = (–12,576)
(26,305)
A diferença entre os dois modelos é perceptível. Não esqueça que a regressão revisada baseia-se nas 40 observações, enquanto a original baseia-se somente em 28. Talvez os resultados do modelo revisado sejam preferíveis porque incluem todas as observações. Repare também na mudança das razões t estimadas. 15.2 Esses dados produzirão um ajuste perfeito, pois todos os valores de X acima de 16 correspondem a Y = 1 e todos aqueles inferiores a 16 correspondem a Y = 0. Portanto, uma infinidade de curvas se ajustaria a esses dados. O método de máxima verossimilhança pode falhar em situações assim, e, por isso, as estimativas MV fornecidas no enunciado são de valor questionável. 15.3 Reportando-nos ao modelo original, verificamos que os resultados são de um modelo de probabilidade linear e que a unidade para renda disponível X1 é milhares de dólares. (a) Dentre os regressores, somente as variáveis X1, X13 e X16 são estatisticamente significativas no nível de 5% e têm os sinais corretos. O valor baixo de R² não deve preocupar, pois essa medida não deve ser adequada ao modelo em questão. (b) Como esse coeficiente não é estatisticamente significativo, não podemos atribuir grande significado a essa variável. (c) Os termos ao quadrado são utilizados para contornar as taxas de variação dessas variáveis. Os sinais não têm sentido prático, uma vez que nenhum dos dois coeficientes é estatisticamente significativo. (d) A probabilidade é 0,6431. (e) A probabilidade é 0,6936.
Manual de Soluções • Econometria Básica • Gujarati 15.4 Como a medida convencional do R² não é especialmente útil em modelos com regressando dicotômico, não há muito sentido em testar sua significância como o teste F visto no Capítulo 8. Medidas alternativas da qualidade do ajustamento são abordadas no texto e nas referências (veja também o Exercício 15.13). 15.5 As probabilidades estimadas nos vários níveis de renda são: 0,2458; 0,2761; 0,3086; 0,3611; 0,3981; 0,4950; 0,5923; 0,6828; 0,7614 e 0,8254. Representandoas contra a renda, obteremos quase uma linha reta com inclinação crescente, conforme o gráfico abaixo.
VERTICAL = PROB HORIZONTAL = RENDA 15.6 Recordemos que I i = β1 + β 2 X i . Portanto, a variável normal padronizada é
Ii = Daí,
X i − μx
σx
β1 = −
=−
μx σx
μx ⎛ 1 ⎞ +⎜ ⎟ X . σx ⎝σx ⎠ i
e
β2 =
1
σx
.
15.7 (a) O logaritmo das chances de uma taxa de homicídios mais alta está positivamente relacionado ao número de habitantes e à taxa de crescimento populacional, mas negativamente relacionado à taxa de alfabetização. O coeficiente de 0,0014 ligado a Pi deve ser interpretado como segue: tome seu antilogaritmo, subtraia-lhe 1 e multiplique o resultado por 100. Assim, antilog(0,0014) = 1,0014, subtraindo-lhe 1 e multiplicando o resultado por 100, temos 0,14%, o que quer dizer que se o número de habitantes aumentar uma unidade (no caso, mil), as chances de uma taxa de homicídios mais alta crescem 0,14%. Os outros coeficientes devem ser interpretados de forma análoga. (b) Individualmente, os coeficientes de C e R são estatisticamente significativos no nível de 5% ou melhor.
Manual de Soluções • Econometria Básica • Gujarati (c) Seguindo as etapas dadas em (a), o efeito do aumento de uma unidade na taxa de alfabetização é uma redução de cerca de 49,93% nas chances de uma taxa de homicídios mais alta. (d) As chances subirão 5,77%. [N] Nota: Se tomarmos os valores nominais dos coeficientes dos regressores, teremos a variação percentual aproximada das chances de uma taxa de homicídios mais alta, mas, para sermos precisos, temos de seguir o procedimento descrito em (a). 15.8 Os coeficientes estimados diferem pouco. A diferença principal está nos errospadrão estimados. A Equação (15.7.3) corrige a heterocedasticidade, ao passo que a (15.7.3) não o faz. 15.9 (a) Repare que nesse modelo o logaritmo da razão das chances é uma função do logaritmo da renda, o que faz dele um duplo log. Daí, se a renda aumenta 1%, em média, o log das chances favoráveis a possuir um carro cresce cerca de 34,8%. (b) Tirando o antilogaritmo da equação estimada, obtemos
Pi = 0, 0625 X 0,3475 , em (1 − Pi )
que X é a renda. Note que tirando o logaritmo dessa expressão voltamos à equação dada no enunciado. A partir da equação anterior, tiramos a expressão para a probabilidade de possuir um carro:
Pi =
0, 0625 X 0,3475 . 1 + 0, 0625 X 0,3475
(c) A probabilidade é
Pi =
0, 0625(20000)0,3475 ≈ 0, 66 . 1 + 0, 0625(20000)0,3475
Ou seja, é de aproximadamente 66%. Seguindo esse mesmo procedimento, podemos verificar que para o nível de renda de 25.000, essa probabilidade é de cerca de 68%. De acordo com a nota de rodapé número 19 do livro-texto, também verificamos que a variação da probabilidade do nível de renda de 20.000 para o de 25.000 é bem pequena. (d) Vemos pelos resultados que os coeficientes são individualmente muito significativos, assim como também o é o valor χ², medida da qualidade de ajustamento. 15.10 Conforme o Apêndice A, para uma distribuição Bernoulli o valor médio é P, e a variância, P(1-P). 15.11 (a) Embora os resultados não sejam uniformes, os coeficientes logit, em algumas situações, são, em valores absolutos, mais baixos para os alunos negros do que para todos os alunos, mas há casos em que a diferença pode não ser
Manual de Soluções • Econometria Básica • Gujarati estatisticamente significativa. As variáveis, no entanto, têm os sinais esperados na maioria das vezes. (b) Na maioria dos casos, sim. (c) Como vemos, tomando todos os alunos, os coeficientes são todos estatisticamente muito significativos, o que não é o caso para os estudantes negros. A significância geral do modelo pode ser julgada pelos valores χ², muito significativos para todos, inclusive os negros. Esse valor mede a qualidade de ajustamento do modelo comparando os valores previstos por ele com os valores reais. Veja o Exercício 15.13 sobre esse tema. 15.12 (a) Para tornar homocedástico o termo de erro, o peso deve ser o inverso do erro-padrão de termo de distúrbio estocástico ui. Nesse caso, o peso é wi =
Ni fi Pi (1 − Pi )
.
(b) Os pesos e os dados transformados são os seguintes: Probabilidade 0,20 0,24 0,30 0,35 0,45 0,51 0,60 0,66 0,75 0,80
Peso (wi) 0,075 0,086 0,114 0,140 0,415 1,991 0,243 0,168 0,102 0,095
I* = Iwi -11,157 -8,113 -4,571 -2,708 -0,289 0,015 1,029 2,388 6,557 8,820
Xi* = Xiwi 79,690 92,717 87,896 92,636 36,181 10,044 102,856 179,124 342,509 420,000
(c) Os resultados pelos mínimos quadrados ponderados são:
I i* = −1, 086 + 0, 049 X i* ep =
(0,031)
(0,001)
Vê-se que os resultados pelos mínimos quadrados não-ponderados e ponderados não são muito diferentes, embora para estes últimos os erros-padrão sejam relativamente menores, como era de se esperar. 15.13 Nesse caso, o teste estatístico χ² é 2,3449, com valor p de 0,97. Portanto, não rejeitamos a hipótese nula de que não há diferença estatística entre os valores estimados da probabilidade e os reais. 15.14 Seguem os resultados do modelo logit ponderado probabilidade de morte como função do logaritmo da dosagem.
que
expressam
a
Manual de Soluções • Econometria Básica • Gujarati
Lˆi = –4,837 + 7,058lnXi ep = (0,434) (0,599) t = (–11,141) (11,782); χ² = 1,4069. Esses resultados revelam que os coeficientes estimados são muito significativos. O valor p do χ² observado é 0,7039, indicando que não há diferença estatística entre os valores da probabilidade estimados e os reais. Ou seja, o modelo ajustado é bastante bom. 15.15 (a) Seguem os resultados pelo MPL, com Y = 1 se o candidato for admitido; se não, Y = 0.
Yˆi = –2,867 + 0,003Qi + 0,002Vi t = (–3,442) (2,976)
(3,441)
(b) Embora os resultados estatísticos pareçam aceitáveis, o MPL não é um modelo satisfatório devido aos problemas analisados no texto, tais como ausência de normalidade do termo de erro, heterocedasticidade etc. 15.16 (a) O modelo logit estimado é:
Yˆi = –2,085 + 0,136Xi t = (–143,597) (151,621). (b) O modelo probit estimado é:
Iˆi = 3,722 + 0,083Xi t =(316,543) (115,524). (c) O valor logit estimado correspondente ao desconto de 17 centavos é 1,2548, do qual tiramos que a probabilidade estimada é de aproximadamente 56%, quase igual à do modelo probit.
⎛ 0, 70 ⎞ ⎟ = −2, 085 + 0,136 X i . Resolvendo essa ⎝ 1 − 0, 70 ⎠
(d) O que precisamos achar é ln ⎜
expressão, teremos o valor de X, que é 21,56 centavos. 15.17 (a) Como o coeficiente do estado civil é estatisticamente insignificante para ambos os períodos, não há muito a dizer sobre a importância dessa variável, mas seu sinal é positivo tanto em 1977 quanto em 1989, e isso faz sentido sob o aspecto econômico. (b) O coeficiente negativo estimado para a variável minoria está provavelmente refletindo algum efeito da variável renda, e indica que as minorias têm rendas mais baixas e menor necessidade de contas bancárias.
Manual de Soluções • Econometria Básica • Gujarati (c) Essa variável também reflete o efeito da variável renda, indicando que à medida que cresce o número de filhos, é possível que a família disponha de menos dinheiro para depositar em contas correntes ou de poupança. (d) A estatística χ² é uma medida da qualidade de ajustamento do modelo que, nesse caso, é boa, pois a previsão de quem teria ou não uma conta corrente foi feita com acerto de 91% em 1977 e 90% em 1989. 15.18 (a) Os resultados do MPL ponderado são:
Yˆi = 0,184 + 0,874Xi t = 1,373)
(5,042).
(b) Dado que X = 48, o verdadeiro E(Y|X=0,48) = 0,440, e o estimado E(Y|X) = 0,603. (c) Com os dados, podemos confirmar assim a resposta dos autores: P(Y*|X=0,48) = –0,969 + 2,764(0,48) = 0,3579. A probabilidade é 0,6398, validando o resultado dos autores. (d) P(Y*|X=0,79) = –0,969 + 2,764(0,79) = 1,2145. A probabilidade é 0,8878. A variação prevista é 24,80, que está de acordo com os resultados dos autores.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 16 MODELOS DE REGRESSÃO COM DADOS EM PAINEL
16.1 Nos dados em corte transversal, coletam-se informações sobre várias microunidades no mesmo ponto no tempo. Presume-se, em geral, que tais dados são de amostras aleatórias. Nos dados em séries temporais, obtemos informações sobre uma dada microunidade, ou unidade individual, ao longo de um período de tempo. Os dados em painel combinam características dos dois tipos anteriores, pois dados sobre várias microunidades são obtidos por vários períodos de tempo. 16.2 Num modelo de efeitos fixos (MEF), admitimos que cada microunidade seja representada pelo seu próprio intercepto, que permanece o mesmo ao longo do tempo. Podemos levar em consideração o tempo e o espaço por meio da inclusão de variáveis binárias de corte transversal e de tempo. 16.3 No modelo de correção de erros (MCE), ao contrário do MEF, presumimos que o intercepto de uma microunidade é uma extração aleatória com média e variância determinadas. Trata-se de um modelo econômico, visto que não se introduzem N variáveis binárias distintas de intercepto para N unidades de corte transversal. Conforme informado no texto, se o termo de erro e os regressores não estiverem correlacionados, é possível que o MCE seja adequado, mas se estiverem, o MEF talvez seja apropriado. 16.4 São todos sinônimos. 16.5 A resposta está na Seção 16.1. Resumidamente, combinando as dimensões espaço e tempo, podemos estudar muitos aspectos de um problema de uma forma que não seria viável fazer somente com os dados em corte transversal ou em séries temporais. Dois exemplos importantes dos dados em painel são o Estudo em Painel da Dinâmica de Renda e o Levantamento de Renda e Participação em Programas. Acompanhando as mesmas unidades em corte transversal ao longo do tempo, podemos estudar a dinâmica das variações. 16.6 O novo termo de erro será wit = ε i + vt + uit , com as pressuposições de que
ε i N (0, σ ε2 ) , vt N (0, σ v2 )
e uit N (0, σ u ) . Além disso, presumimos que: 2
E (ε i vt ) = E (ε i uit ) = E (vt uit ) = 0 E (ε iε j ) = 0(i ≠ j ); E (vt vs ) = 0(t ≠ s ) E (uit uis ) = E (uit u jt ) = E ( wit , w js ) = 0;(i ≠ j; t ≠ s)
Manual de Soluções • Econometria Básica • Gujarati
var( wit ) = σ 2 = σ ε2 + σ v2 + σ u2 , isto é, wit
Conseqüentemente,
é homocedástico. O
coeficiente de correlação entre wit e w jt (i ≠ j) , ou seja, entre os erros das duas unidades
diferentes
cov( wit , w jt ) ⎡⎣ var( wit ) var( w jt ) ⎤⎦
de
=
corte
transversal
num
dado
ponto
no
tempo,
é
σ ;(i ≠ j ) . σ ε + σ + σ u2 2
2 v 2 v
E o coeficiente de correlação entre wit e w jt (t ≠ s) ,ou seja, entre os erros de uma determinada unidade de corte transversal em dois pontos diferentes no tempo, é
cov( wit , wis )
[ var( wit ) var( wis )]
=
σ ε2 ;(t ≠ s ) . σ ε2 + σ v2 + σ u2
16.7 Temos neste caso N = 50 unidades de corte transversal e T = 2 séries temporais de dados. Consulte a observação número 2 na Seção 16.5. Como não podemos considerar os 50 estados da união como uma extração aleatória, é possível que o MEF seja mais apropriado. 16.8 São –245,7924, –84,22, 93,8774 e –59,2258 para a GE, GM, USS e Westinghouse, respectivamente. Comparados com os da GE, os interceptos (isto é, efeitos fixos) das outras empresas são estatisticamente diferentes, como se vê pela regressão (16.1.5). 16.9 Os resultados não são substancialmente diferentes no que tange aos coeficientes das variáveis X. Os interceptos não são iguais, o que era de se esperar devido às diferenças nas premissas subjacentes aos dois modelos. 16.10 (a) Em conjunto, os resultados fazem sentido do ponto de vista econômico. Por exemplo, o logaritmo dos ganhos é menor neste ano se no anterior o indivíduo esteve desempregado, e o mesmo acontece se suas condições de saúde foram precárias naquele ano. (b) Qualitativamente, os dois modelos dão resultados similares. (c) Como temos 3774 observações, temos graus de liberdade suficientes para estimar um modelo de efeitos fixos. Mas como os dois modelos geralmente dão resultados análogos, podemos optar por qualquer um. Formalmente, podemos aplicar o teste Hausman para decidir entre os dois.
Manual de Soluções • Econometria Básica • Gujarati Problemas 16.11 (a) Coef. R² d angular 1990 3118,484 -22,4984 0,0834 1,98 (3,5718) (-2,0894) 1991 3149,356 -23,3485 0,0972 1,9 (3,8837) (-2,2742) Nota: Os valores entre parênteses são as razões t. Ano
Intercepto
(b) Os resultados da regressão combinada são os seguintes: Ovos = 3132,258 – 22,8952 Preço t = (5,3281) (–3,1173)
r² = 0,0902; d = 2,0037.
As pressuposições feitas neste caso são que os interceptos, os coeficientes angulares e as variâncias de erro são iguais nos dois períodos de tempo. (c) Fazendo D = 0 para 1990 e D = 1 para 1991, os resultados da regressão são: Ovos = 3153,082 – 34,6977D – 22,9403 Preço t = (5,0767) (–0,1087) (–3,1027)
R² = 0,0903; d = 2,0047.
Como vemos, o coeficiente da variável binária para 1991 não é estatisticamente significativo, indicando que são estatisticamente iguais os interceptos dos dois períodos de tempo. (d) Se fizermos isso, teremos de usar 49 variáveis binárias, o que consumirá muitos de graus de liberdade. Consulte também a segunda observação na Seção 16.5. (e) Não, pelo mesmo motivo de (d). (f) Não é possível, nesse caso, estimar o MCE, porque para isso seria necessário que o número de unidades de corte transversal fosse maior que o número de coeficientes a serem estimados. Se tentarmos fazê-lo usando, por exemplo, o Eviews, o software responderá com essa afirmação. 16.12 Aí vão os dados necessários: Ano SRQ gl 1990 1,24E+08 48 1991 1,22E+08 48 Combinada 2,46E+08 98 Nota: 1,24E+08 significa 124.000.000 etc.
Manual de Soluções • Econometria Básica • Gujarati Se aplicarmos o teste de Chow, descobriremos que podemos rejeitar a hipótese nula de que as variâncias de erro dos dois períodos são diferentes, indicando que os dados podem ser combinados. 16.13 (a) A seguir, temos os resultados da regressão em forma de tabela, com as razões t entre parênteses. Empresa GE GM US Steel Westinghouse Combinada
Intercepto -9,9563 (-0,3173) -149,4667 (-1,4137) -50,0780 (-0,3413) -0,5804 (-0,0724) -63,3041
F-1 0,0265 (1,7057) 0,1192 (4,6192) 0,1714 (2,3254) 0,0530 (3,3776) 0,1101
C-1 0,1516 (5,9015) 0,3715 (10,0270) 0,4087 (2,8208) 0,0916 (1,6334) 0,3034
R² 0,7053
SQR 13217
d 1,07
0,9214
143118
0,93
0,4810
154988
0,92
0,7450
1796
1,42
0,7565
1560690
0,22
(b) Teste de Chow: A soma das SQR das quatro empresas é 313092. Aplicando o teste conforme o Capítulo 8, obtemos F =
(1560690 − 313092) 3 415866 = = 9, 032 , valor 313092 (80 − 12) 46043
muito significativo, levando à rejeição da hipótese nula de que as quatro variâncias de erro são iguais. (c) Em vista do teste de Chow, parece que não se deve combinar os dados neste caso. Mas isso não invalida a utilidade da técnica de combinação, que foi evidente no nosso exemplo dos ovos no Problema 16.11. 16.14 (a) A priori, seria de se esperar uma relação inversa entre as duas variáveis porque se o desemprego for alto, haverá menos pressão por aumentos de salários, presumindo que os outros fatores se mantenham constantes. (b) & (c) A seguir temos os resultados da regressão em forma de tabela, com as razões t entre parênteses. País Canadá
Coef. angular -0,7294 (0,2946)
R²
SQR
d
0,0048
5372
0,0088
156,4412
-9,1186
0,4248
7856
0,3591
(6,6952)
(3,6463)
152,4665
-9,6686
0,5420
3375
0,4910
(10,9253)
(4,6159)
Intercepto 85,8286 (3,8706)
Reino Unido
Estados Unidos
Manual de Soluções • Econometria Básica • Gujarati Combinada 132,3895 -6,3409 0,3365 1941 0,2440 ((13,4746) 5,4242) (d) Esses resultados e os de (e) foram obtidos com o Eviews. Variável dependente: COM? Método: Mínimos quadrados combinados Amostra: 1980 1999 Observações incluídas: 20 Número de cortes transversais: 3 Total observações (equilibradas) em painel: 60 Variável Coeficiente DESEMPREGO? -6,7307 Efeitos fixos CAN--C 138,7603 RU--C 134,5800 EUA--C 133,3699 R-quadrado Estatística Watson
0,3462 Durbin-
Erro-padrão 1,4553
Soma resíduos
quad
Estatística-t -4,6247
19123,6604
0,2674
(e) Variável dependente: COM? Método: MQG (componentes variância)
de
Amostra: 1980 1999 Observações incluídas: 20 Número de cortes transversais: 3 Total observações (equilibradas) em painel: 60 Variável Coeficiente C 131,3202 DESEMPREGO? -6,2098 Efeitos aleatórios CAN--C 0,8264 RU--C -1,7597 EUA--C 0,9333 R-quadrado
0,3312
Erro-padrão 8,8974 1,0664
Soma resíduos
quad
Estatística-t 14,7592 -5,8231
19561,0217
Manual de Soluções • Econometria Básica • Gujarati Estatística Durbin0,2358 Watson (f) Os resultados dos dois modelos são semelhantes. Podemos, portanto, escolher qualquer um deles.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 17 MODELOS ECONOMÉTRICOS DINÂMICOS: MODELOS AUTO-REGRESSIVOS E COM DEFASAGENS DISTRIBUÍDAS
17.1 (a) Falsa. Modelos econométricos são dinâmicos se descrevem a trajetória no tempo da variável dependente em relação a seus valores passados. Os que utilizam dados em cortes transversais não são dinâmicos, a menos que sejam usados modelos de regressão em painel com valores do regressando defasados. (b) Verdadeira. O modelo Koyck presume que todos os coeficientes de defasagem distribuída têm o mesmo sinal. (c) Falsa. Os estimadores são tendenciosos e também inconsistentes. (d) Verdadeira. Para demonstração, veja o texto de Johnston citado na nota de rodapé número 30 do livro-texto. (e) Falsa. O método gera estimativas consistentes, embora sejam tendenciosas aquelas obtidas com pequenas amostras. (f) Verdadeira. Em tais situações, aplique a estatística h de Durbin. Para calculá-la, no entanto, pode-se usar a estatística d de Durbin. (g) Falsa. É válido para grandes amostras, estritamente falando. (h) Verdadeira. O teste de Granger é uma medida de precedência e conteúdo da informação, mas por si só não indica causalidade, no sentido trivial da palavra. 17.2 Use as Equações (17.7.1), (17.6.2) e (17.5.2).
Yt* = β 0 + β1 X t* + ut
(1)
Yt − Yt −1 = δ (Yt * − Yt −1 )
(2)
X t* − X t*−1 = γ ( X t − X t*−1 )
(3)
Reescreva a Equação (2) assim: Yt = δ Yt + (1 − δ )Yt −1 *
Reescreva a Equação (3) assim: X t = *
γ
Xt 1 − (1 − γ ) L em que L é o operador de defasagem, tal que LX t = X t −1 .
(4) (5)
Substitua a Equação (1) na Equação (4) para obter:
Yt = δβ 0 + δβ1 X t* + δ ut + (1 − δ )Yt −1 Substitua a Equação (5) na (6) para obter:
(6)
Manual de Soluções • Econometria Básica • Gujarati
⎡ ⎤ γ Yt = δβ 0 + δβ1 ⎢ X t ⎥ + (1 − δ )Yt −1 + δ ut ⎣1 − (1 − γ ) L ⎦
(7)
Simplificando a Equação (7), temos:
Yt = α1 + α 2 X t + α 3Yt −1 + α 4Yt − 2 → (17.7.2), em que os α são combinações (nãolineares) dos diversos parâmetros da Equação (7).
{
[
]} , já que E (ut ) = 0 . ⎡⎣Yt −1 − E (Yt −1 ) ⎤⎦ = ut −1 .
17.3 cov ⎡⎣Yt −1 , ( ut − λ ut −1 ) ⎤⎦ = E ⎡⎣Yt −1 − E (Yt −1 ) ⎤⎦ ut − λ ut −1
cov ⎡⎣Yt −1 , ( ut − λ ut −1 ) ⎤⎦ = E ⎡⎣( ut −1 )( ut − λ ut −1 ) ⎤⎦ , já que
2 cov ⎡⎣Yt −1 , ( ut − λut −1 ) ⎤⎦ = −λ E ⎡( ut −1 ) ⎤ , já que não há correlação serial. ⎦ ⎣ 2 cov ⎡⎣Yt −1 , ( ut − λ ut −1 ) ⎤⎦ = −λσ , como queríamos demonstrar.
17.4 Os valores para P* são, respectivamente, 100, 105, 115, 135 e 160. 17.5 (a) Os valores estimados de Y, que são função linear da variável não-estocástica X, não são assintoticamente correlacionas com v, o termo de erro da população. (b) Pode diminuir a gravidade do problema da colinearidade. 17.6 (a) A defasagem mediana é o tempo para se completar metade da fração de ajustamento. No caso do modelo de Koyck, resolva a expressão a seguir para encontrá-la:
(
)
β 0 1 − λ t (1 − λ ) 1 resposta no período t 1 = = , que simplificada dá λ t = . Portanto, resposta de longo prazo 2 β 0 (1 − λ ) 2 −2 ln 2 ⎛1⎞ , que é a resposta solicitada. t ln λ = ln ⎜ ⎟ = − ln 2 . Logo, t = ln λ ⎝2⎠ (b) λ 0,2 0,4 0,6 0,8
ln λ 1,6094 0,9163 0,5108 0,2231
ln2
Defasagem mediana
0,6932
0,4307
0,6932
0,7565
0,6932
1,3569
0,6932
3,1063
Manual de Soluções • Econometria Básica • Gujarati 17.7 (a) Como
β k = β 0 λ k ; 0 < λ < 1; k = 0,1, 2... , a defasagem mediana é:
∞
∑ kβ
k
0 k
∑β
k
β 0 ∑ k λ k λ (1 − λ 2 ) λ = = = k β0 ∑ λ 1 (1 − λ ) 1 − λ
.
0
(b) Se λ for muito grande, a velocidade do ajustamento será lenta. 17.8 Aplique a fórmula
∑ kβ ∑β
k
que, com os dados da Tabela 17.1 torna-se
k
11,316 = 10,986 ≈ 10,959 . 1, 03 17.9 (a) Seguindo o procedimento adotado no Exercício 17.2, podemos escrever a equação para M t como segue: M t = α +
β1 (1 − γ 1 ) β (1 − γ 2 ) Yt + 2 Rt + ut , 1 − γ 1L 1− γ 2L
que pode ser
reescrita assim:
M t = β0 + β1 (1 − γ 1 ) Yt − β1λ2 (1 − γ 1 ) Yt −1 + β 2 (1 − γ 2 ) Rt M t = − β 2γ 1 (1 − γ 2 ) Rt −1 + ( γ 1 + γ 2 ) M t −1 − ( γ 1γ 2 ) M t − 2 + ⎡⎣ut − ( γ 1 + γ 2 ) ut −1 + ( γ 1γ 2 ) ut − 2 ⎤⎦ , que
β0
é uma combinação de
α , γ1
e
γ2.
Observe que se
γ1 = γ 2 = γ ,
em
o modelo pode
ser ainda mais simplificado. (b) O modelo que acabamos de desenvolver é muito não-linear nos parâmetros e tem de ser estimado com o emprego de alguma das técnicas iterativas não-lineares examinadas no Capítulo 14. 17.10 A Equação (17.7.2) apresenta o mesmo problema de estimação que o modelo de Koyck e o das expectativas adaptativas, pois são auto-regressivos com estruturas de erro similares. Trata-se de um modelo de regressão intrinsecamente não-linear, exigindo, portanto, técnicas não-lineares de estimação. 17.11 Conforme explanado por Griliches, como o modelo de correlação serial inclui valores defasados dos regressores, o que não acontece nos de Koyck e de ajustamento parcial, é possível que ele seja apropriado – mesmo que se assemelhe a estes últimos – em situações em que estejamos transformando um modelo para nos vermos livres da correlação serial de primeira ordem.
Manual de Soluções • Econometria Básica • Gujarati 17.12 (a) Sim, o modelo de Koyck pode, nesse caso, ser estimado com os MQO. (b) Haverá um viés de amostra finita devido ao regressando defasado, mas as estimativas serão consistentes. Pode-se achar a demonstração disso nas páginas 408 a 411 do livro Principles of Econometrics, de Henry Thiel, publicado por John Wiley & Sons, New York, 1971. (c) A pressuposição de que ρ e λ sejam iguais é plausível, pois os valores de ambos situam-se, por premissa, entre 0 e 1. 17.13 De forma análoga aos modelos de Koyck, Alt, Tinbergen e outros, essa é uma abordagem ad hoc e tem pouca sustentação teórica. O modelo pressupõe que a importância dos valores passados declina continuamente desde o início, o que pode ser uma pressuposição razoável em alguns casos. Pela utilização da média ponderada das variáveis explanatórias atuais e passadas, esse modelo triangular anula os problemas de multicolinearidade que possam existir em outros. 17.14 (a) Em média, ao longo do período estudado, a variação do nível de emprego está positivamente relacionada à produção e negativamente ao nível de emprego no período anterior e ao tempo. Os sinais negativos no coeficiente da variável tempo e na variável tempo ao quadrado indicam que a variação no nível de emprego vem declinando ao longo do período, mas mais rapidamente. Repare que o coeficiente de tempo não é significativo no nível de 5%, mas o de tempo ao quadrado o é. (b) É 0,297. (c) Para obter a curva de demanda de longo prazo, divida a de curto prazo por δ e exclua o termo defasado do nível de emprego, o que resultará na função 47,879 + 0,579Qt + 0,094t + 0,002t². (d) O teste estatístico apropriado é o h de Durbin. Dado que n = 44 e d = 1,37, obtemos:
n 44 ⎛ d⎞ ⎛ 1 ⎞ h = ⎜1 − ⎟ = ⎜1 − d ⎟ = 2, 414 . ⎝ 2 ⎠ 1 − n var(coef de Et -1 ) ⎝ 2 ⎠ 1 − 44(0, 001089) Já que o h segue assintoticamente a distribuição normal, seu valor crítico a 5% é 1,96. Pressupondo que a amostra de 44 observações seja razoavelmente grande, podemos concluir que há nos dados evidência de autocorrelação positiva de primeira ordem. 17.15 (a) É (1 - 0,0864) = 0,136. (b) A elasticidade preço de curto prazo é –0,218, e a de longo prazo é (–0,218/0,136) = –1,602. (c) A elasticidade juro de curto prazo é –0,855, e a de longo prazo é (–0,855/0,136) = –6,287.
Manual de Soluções • Econometria Básica • Gujarati (d) A taxa de ajustamento de 0,136 é relativamente baixa, e isso pode ser por causa do tipo de tecnologia desse mercado. Lembre-se de que tratores são bens duráveis com vida útil razoavelmente longa. 17.16 O termo defasado representa as influências combinadas de todos os valores defasados do(s) regressor(es) do modelo, como vimos ao explorar a abordagem de Koyck. 17.17 O grau do polinômio deve ser pelo menos um a mais do que os pontos de inflexão da série temporal observada representada graficamente ao longo do tempo. Assim, use um polinômio de 4º grau para o primeiro gráfico no canto superior esquerdo, um de 2º grau para o do canto superior direito, um de 6º grau para o do canto inferior esquerdo e outro de 2º grau para o do canto inferior direito.
17.18 (a) var( βˆi ) =
2
p
j =0
j< p
∑ i 2 j var(αˆ j ) + 2∑ i j + p cov(αˆ j , αˆ p ) .
Segue uma expressão análoga, a não ser por um termo adicional. (b) Não é necessariamente assim, porque, como visto em (a), as variâncias das estimativas de βi envolvem tanto as variâncias como as covariâncias dos coeficientes estimados α, e estas últimas podem ser negativas.
17.19 Dado que β i = α 0 + α 1i + α 2 i , se β 0 = 0 → α 0 = 0 e quando β 4 = 0 → α 0 + 4α1 + 16α 2 = 0 → α1 = −4α 2 . Portanto, o modelo transformado é:
(
4
)
Yt = α + ∑ ( β i X i ) + ut = α + ∑ α 0 + α1i + α 2i 2 X t − i + ut = α + α 2 ⎡⎣ −4∑ iX t − i + ∑ i 2 X t − i ⎤⎦ + ut . i =0
17.20 Yt = α +
k
∑β X i =0
i
k/2
t −i
+ ut = α + ∑ i β X t −i + i =0
∑
⎛k ⎞ i =⎜ +1⎟ ⎝2 ⎠
( k − i ) β X t − i + ut
Yt = α + β ⎡⎣ ∑ iX t −i + ∑ ( k − i ) X t −i ⎤⎦ + ut = α + β Z t + ut . 17.21 No caso, n = 19 e d = 2,54. Embora a amostra não seja muito grande, vamos fazer o teste h a título de ilustração:
Manual de Soluções • Econometria Básica • Gujarati
⎛ ⎝
h = ⎜1 −
d⎞ n 19 ⎛ 2, 54 ⎞ = ⎜1 − = −1, 3773 , valor que ⎟ ⎟ 2 ⎠ 1 − ( n) var(coeficiente de PFt -1 ) ⎝ 2 ⎠ 1 − 19(0, 0142)
não é significativo no nível de 5%. Não há, portanto, evidência de correlação serial positiva de primeira ordem, não esquecendo que nossa amostra pode não ser suficientemente grande para aceitarmos esse resultado. Problemas 17.22 Empregando o modelo de ajustamento de estoques ou de ajustamento parcial (MAP), a função de gastos no curto prazo pode ser escrita da seguinte forma, em que Y são os gastos em novas instalações e equipamentos e X as vendas (veja Equação 17.6.5) :
Yt = δβ 0 + δβ1 X t + (1 − δ ) X t −1 + ut
(1).
De acordo com os dados, seguem os resultados da regressão:
Yˆt = –15,104 + 0,629Xt + 0,272Yt-1 t = (–3,194)
(6,433)
(2)
(2,365)
R² = 0,987; F = 690,056; d = 1,519. Pelo coeficiente do valor de Y defasado, encontramos que δ = 0,728. A função de gastos no longo prazo é
Yˆt* = 20,738 + 0,864 Xt , obtida dividindo (2) por
0,728 e excluindo o termo Y defasado. Temos de empregar a estatística h para ver se há correlação no problema. Aplicando a devida fórmula, pode-se constatar que h = 1,364, valor que, assintoticamente, não é significativo no nível de 5%. Então, também assintoticamente, não há correlação serial nos dados. 17.23 Aplicando a mesma notação usada no Exercício 17.22, a função de gastos no curto prazo é:
ln Yt = ln δβ 0 + δβ1 ln X t + (1 − δ )Yt −1 + ut
(1)
Os resultados da regressão são: ln Yˆt
= –1,078 + 0,905 lnXt + 0,260 lnYt-1 t = (–5,854)
(8,131)
(2,962)
R² = 0,994; F = 1425,219; d = 1,479. Daí, achamos δ = 0,740.
(2)
Manual de Soluções • Econometria Básica • Gujarati A função de gastos no longo prazo é ln Yˆt
*
= 0,376 + 1,222 ln Xt
A estatística h para este problema é 1,34. Assintoticamente, portanto, rejeitamos a hipótese de que existe correlação positiva de primeira ordem no termo de erro. Ambos os modelos dão resultados análogos, sendo a vantagem do logarítmico que os seus coeficientes angulares estimados fornecem estimativas diretas dos coeficientes de elasticidade, ao passo que os do linear apenas medem a taxa de variação. 17.24 Os resultados estatísticos são os mesmos do Problema 17.22. No entanto, como este é um modelo de expectativas adaptativas, a interpretação é diferente. O δ estimado é agora interpretado como a fração com que as expectativas de investimentos em instalações e equipamentos são revistas a cada período. A estrutura de erro da população também é diferente, conforme observado no texto. 17.25 Neste caso, empregamos uma combinação dos modelos de expectativas adaptativas e MAP. Segue a equação, em que vt = ⎡⎣δ ut + δ (1 − γ ) ut −1 ⎤⎦ :
Yt = β 0δγ + β1δγ X t + ⎡⎣(1 − δ ) + (1 − γ ) ⎤⎦ Yt −1 + ⎡⎣(1 − δ ) + (1 − γ ) ⎤⎦ Yt − 2 + vt , que, por conveniência, escrevemos Yt = α 0 + α1 X t + α 2Yt −1 + α 3Yt − 2 + vt . Com base nos dados, seguem os resultados da regressão:
Yˆt = –19,7701 + 0,715Xt + 0,565Yt-1 – 0,409Yt-2 t = (–4,467)
(8,323)
(4,250)
(–3,460)
R² = 0,992; F = 5653,234; d = 1,367. Os coeficientes estimados são todos estatisticamente significativos, mas como são combinações não-lineares dos originais, fica difícil obter suas estimativas diretas. Teoricamente, devemos estimar esse modelo empregando os métodos não-lineares apresentados no Capítulo 14, os quais darão estimativas diretas dos diversos parâmetros que serão então comparados àqueles obtidos nos Problemas 17.22, 17.23 e 17.24. 17.26 Hipótese nula H0: as vendas não causam, no sentido de Granger, os investimentos em instalações e equipamentos. Seguem os resultados do teste de Granger: Nº de defasagens 2 3
Estatística F 17,394 5,687
4
3,309
0,0628
5
2,379
0,1606
6
1,307
0,4463
Valor p
Conclusão
0,0001 0,0117
rejeitar H0 rejeitar H0 não rejeitar H0 não rejeitar H0 não rejeitar H0
Manual de Soluções • Econometria Básica • Gujarati Hipótese nula H0: os investimentos em instalações e equipamentos não causam, no sentido de Granger, as vendas. Seguem os resultados do teste de Granger: Nº de defasagens 2 3 4 5
Estatística F 22,865 13,009 7,346 5,867
6
3,053
Valor p
Conclusão
0,0001 0,0004 0,0065 0,0262
rejeitar H0 rejeitar H0 rejeitar H0 rejeitar H0 não rejeitar H0
0,1939
Como se vê por esses resultados, o teste de causalidade de Granger é sensível ao número de termos defasados incluídos no modelo. Até três defasagens, a causalidade é bilateral, até cinco, de investimento para vendas, e até 6, nenhuma das duas variáveis causa a outra. 17.27 Um modelo elucidativo que se ajustou neste caso foi um polinomial de segundo grau com quatro defasagens. Empregando o formato da Equação (17.13.15) e fazendo Y representar os investimentos e X as vendas, os resultados da regressão são:
Yˆt = –35,4923 + 0,8910Xt + 0,3255Xt-1 – 0,0312Xt-2 –0,1792Xt-3 – 0,1183 Xt-4 t = (–4,3321)
(5,1042)
(3,6176)
(–0,2530)
(–2,1109)
(–0,6562).
Exortamos o leitor a experimentar outras combinações de defasagens e polinômios de outros graus. Pode-se aplicar o critério de informação de Akaike para fazer a escolha entre os modelos concorrentes. 17.28 Obtivemos os seguintes resultados com o software Eviews 4. COEFICIENTE Intercepto
Xt Xt-1 Xt-2 Xt-3 Xt-4
NER 23,3844 (2,3578) 0,3188 (3,5791) 0,4414 (3,9542) 0,3677 (5,4213) 0,0976 (2,1948) -0,3686 (1,6678)
FER
BER
-36,0936
-5,9303
(-4,6740)
(-0,8799)
0,8712 (5,5205) 0,3515 (10,4464) 0,0045 (0,0993) -0,1697 (-2,2065) -0,1712
0,1215 (19,9423) 0,1945 (19,9423) 0,2188 (19,9423) 0,1945 (19,9423) 0,1215
(-2,7730)
(19,9423)
Manual de Soluções • Econometria Básica • Gujarati Nota: NER, FER e BER denotam restrição near-end, far-end e nos dois extremos, respectivamente. Os números entre parênteses são as razões t. Nota-se que a aplicação de restrições aos coeficientes dos modelos leva a resultados muito diferentes. Repare na interessante descoberta de que a imposição de restrições nos dois extremos gerou erros-padrão e razões t idênticas. É melhor não impor restrição nenhuma, a menos que haja a priori uma expectativa consistente. Naturalmente, o que ainda é preciso saber em cada caso é o número de termos defasados e o grau do polinômio. 17.29 (a) Direção da causalidade Y→X2 X2→Y
Número de defasagens 2 2
F
Probabilidade
0,0695 2,8771
0,9329 0,0705 *
Y→X2 X2→Y
3 3
0,1338 2,4892
0,9392 0,0793 *
Y→X2 X2→Y
4 0,1407 0,9655 4 1,8239 0,1533 * Significativo no nível de 10%
A seta indica a direção da causalidade, e a hipótese nula em cada caso é de que a variável à esquerda da seta causa a variável à direita. Parece que nessas situações o investimento em equipamento de processamento de informações não causa vendas, no sentido de Granger. Mas há evidência inconcludente de que as vendas causem o investimento. Experimente outras defasagens e verifique se essa conclusão se altera. (b) Os resultados da causalidade entre investimento e taxa de juros são interessantes porque não há relação causal entre as duas até cinco defasagens; na sexta, a taxa de juros causa investimento, mas não vice-versa; e na sétima e oitava defasagens não há correlação causal entre as duas. É difícil justificar intuitivamente esses resultados. (c) Na forma linear não havia efeito de defasagem distribuída discernível de vendas sobre o investimento. No modelo log-linear com 4 defasagens, polinômio do segundo grau e impondo restrição near-end temos os seguintes resultados: ln Yˆt
= –15,1508 + 0,2008lnX2t + 0,3288lnX2(t-1) + 0,3841lnX2(t-2) + 0,3665lnX2(t-3) +
0,2762ln X2(t-4) t = (–73,2185) (2,1921).
(3,8962)
(5,0794)
(9,6896)
(15,0782)
Se representarmos graficamente os coeficientes dos diversos termos lnX2, veremos que eles aumentam até a segunda defasagem e depois declinam, apresentando uma curva em forma de U invertido. 17.30 (a) & (b) Pode-se mostrar, mediante a aplicação do teste de causalidade de Granger, que há causalidade bilateral entre as duas variáveis até quatro defasagens,
Manual de Soluções • Econometria Básica • Gujarati mas, além daí, não há causalidade unilateral ou bilateral. Por exemplo, na defasagem 3 achamos: produtividade → remuneração, F = 3,84, (valor p = 0,0314) remuneração → produtividade, F = 3,97, (valor p = 0,0284), e na defasagem 4: produtividade → remuneração, F = 2,27, (valor p = 0,0888) remuneração → produtividade, F = 3,26, (valor p = 0,0265). (c) Poderíamos, por exemplo, regressar a remuneração contra a produtividade e a taxa de desemprego para ver o efeito (parcial) desta última, deduzido o efeito da segunda. Seguem os resultados da regressão, em que Y é a remuneração, a produtividade é X2, e a taxa de desemprego é X3:
Yˆt = 26,7834 + 0,6907X2t + 0,6680X3t t = (12,8468) (33,2341) (2,7053) R² = 0,9694; d = 0,2427. Todos os coeficientes estimados parecem estatisticamente significativos. É possível que o sinal positivo da variável taxa de desemprego contrarie a intuição, a não ser que se possa alegar que altas taxas de desemprego incrementem a produtividade, a qual, por sua vez, levaria a maior remuneração. Como a estatística d é muito baixa no caso em tela, é possível que haja neste modelo autocorrelação ou viés de especificação, ou ambos. 17.31 Só para dar uma amostra do teste de Sims, regressamos Y (investimento em novas instalações e equipamentos) contra X (vendas) com duas defasagens e dois lead terms X, obtendo os seguintes resultados:
Yˆt = –2,6549 + 1,4421Xt-1 – 0,4043Xt-2 + 0,3290Xt+1 –0,5576Xt+2 t = (–0,4039)
(7,1142)
(–2,0425)
(1,6786)
(–3,0060).
R² = 0,9912; d = 3,0561. Os resultados lançam dúvidas de que as vendas causem investimentos, pois parece que o lead term Xt+2 é estatisticamente significativo. O leitor deve experimentar outras estruturas com termos defasados e lead terms para ver se essa conclusão se mantém.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 18 MODELOS DE EQUAÇÕES SIMULTÂNEAS 18.1 A demanda por dentistas seria uma função do preço do tratamento dentário, da renda da população de pacientes, da disponibilidade de seguro-saúde odontológico, do nível de escolaridade da população que necessita de cuidados odontológicos, do tamanho da família etc. A oferta de dentistas seria uma função do preço do tratamento dentário, do custo da conscientização da necessidade desse tratamento, do tamanho da população que necessita dele, do número de escolas de odontologia, das exigências legais para o exercício da profissão etc. Neste exemplo, as variáveis endógenas são a demanda por dentistas, a oferta de dentistas e o preço do tratamento dentário. As demais variáveis devem ser consideradas exógenas. 18.2 Brunner e Meltzer usaram variáveis tais como taxa de juros, a real riqueza do Estado, a razão entre a renda corrente e a permanente etc. Tiegen usou a renda, a taxa de juros de curto prazo, o estoque de capital defasado etc. Na literatura, há controvérsia sobre qual das duas taxas de juros – a de curto ou a de longo prazo – representa adequadamente o custo de oportunidade do capital. 18.3 (a) Em forma de desvio (dos valores médios), podemos expressar como segue as funções demanda e oferta:
qtd = α1 pt + (u1t + u1 ) = α1 pt + u1t*
(1)
q = β1 pt + (u2t + u2 ) = β1 pt + u
(2)
s t
De (1), obtemos: αˆ1
* 2t
∑ q p = ∑ ⎡⎣(α p ) + u = ∑p ∑p t
1
t
* 1t
t
2 t
2 t
⎤⎦ p ∑ pt u1*t . = αˆ1 + ∑ pt2
(3)
Em equilíbrio, (1) = (2). Logo, depois das simplificações, temos:
u2*t − u1*t pt = α1 − β1 (4)
∑ pu
* t 1t
∑ (u =
u ∑p =∑ 2 t
* 2t
)
− u1*t u1*t
α1 − β1
*2 2t
∑u =
u − ∑ u1*2t
* * 2 t 1t
α1 − β1
+ ∑ u1*2t − 2∑ u2*t u1t*
(α1 − β1 )
2
Substituindo em (3) essas expressões e simplificando, obtemos:
(5) (6)
Manual de Soluções • Econometria Básica • Gujarati
αˆ1 = α1 +
∑u u − ∑u ∑ u + ∑ u − 2∑ u *2 2t
* * 2 t 1t *2 1t
*2 1t
* * 2 t 1t
u
(α1 − β1 )
(7)
Como u1 e u2 não são correlacionados, ao tirar o limite de probabilidade (plim), obtemos o seguinte:
p lim αˆ1 = α1 − (α1 − β1 )
σ u2*1 σ u2*1 + σ u2*2
(8)
Como geralmente o último termo em (8) é diferente de zero, consistente de
αˆ1
não é estimador
α1 .
(b) Se α1 = β1, então a probabilidade anterior é igual a α1. 18.4 Igualando as Equações (18.2.13) e (18.2.18), obtemos:
π 0 + π 1r = λ0 + λ1M + λ2 r Logo, rt =
(λ0 − π 0 ) λ1 + M (π 1 − λ2 ) (π 1 − λ2 )
(1) (2)
Substituindo (2) na equação IS, temos:
Yt =
π 0 (π 1 − λ2 ) + π 1 (λ0 − π 0 ) π 1λ1 + M (π 1 − λ2 ) (π 1 − λ2 )
.
18.5 (a) As variáveis Y (renda real per capita) e L (base monetária real per capita) refletem a abordagem de preferência pela liquidez. A variável I (taxa de inflação esperada) reflete a teoria de Fischer. As variáveis NIS (variável de novas emissões) e E (retornos de ações esperadas em fins de períodos, representados pelos quocientes esperados dos preços das ações) introduzem elementos de fluxo. A variável Rbt-1 (rendimento dos títulos de dívida defasados) leva em conta um efeito de defasagem distribuída. São todas discutidas no artigo de Oudet. (b) & (c) As variáveis endógenas são Rbt e Rst. Rbt-1 é uma variável predeterminada (endógena defasada). Não há termo Rst defasado no modelo. Todas as outras variáveis são predeterminadas (exógenas). 18.6 (a) Todas as variáveis Y são endógenas, e todas as X são exógenas. (b) Sim, todas as equações podem ser estimadas pelos MQO. Entretanto, como se trata de sistema de equações simultâneas, pode ser que os estimadores MQO sejam tendenciosos e também inconsistentes.
Manual de Soluções • Econometria Básica • Gujarati 18.7 (a) Aparentemente, Bass não está interessado em desenvolver um modelo geral de demanda e oferta, mas em estudar a relação entre despesas com publicidade e vendas de cigarros. (b) Se X2 fosse tratada como endógena, precisaríamos de uma equação para explicála. 18.8 (a) As variáveis endógenas são Y, C, Q e I. As predeterminadas, P, R, Yt-1, Ct-1 e Qt-1, sendo as duas primeiras exógenas e as demais endógenas defasadas. (c) É possível que essa variável explique a inflação. 18.9 (a) Não existe nesse exemplo um sistema de equações simultâneas, pois nenhuma das variáveis dependentes das equações é usada como regressor em outra equação. Os estimadores serão não-tendenciosos e consistentes. Problemas 18.10 Seguem os resultados da regressão:
DCP t = –142,1826 + 0,6889PIBt t = (–5,3883)
(156,2434)
r² = 0,9988; d = 1,2019. 18.11 Os resultados são:
Iˆt = –289,0339 + 66,8100PIB t = (–4,3262)
(17,5783)
r² = 0,9169; d = 0,3851. 18.12 Os resultados da regressão são os seguintes:
Iˆt = 588,1915 + 1,5007(Y – Yt-1) t = (7,1598)
(4,0243)
r² = 0,3749; d = 0,5245.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 19 O PROBLEMA DA IDENTIFICAÇÃO 19.1 Aplicando as definições de M, m, K e k, e fazendo R igual ao número de variáveis excluídas (tanto endógenas como predeterminadas) de uma equação dada, então, pela Definição 19.1, R = ( M − m) + ( K − k ) ≥ ( M − 1) . Subtraindo (M – m) de cada lado, temos
( K − k ) ≥ m −1 , que é a Definição 19.2.
19.2 Os coeficientes estruturais são:
β 0 = π 3 − β1π 0 π β1 = 4 π1 ππ β2 = π 5 − 2 4 π1
α 0 = π 3 − α1π 0 π α1 = 5 π2 ππ α2 = π 4 − 1 5 π2
19.3 (a) As equações na forma reduzida são:
Yt = π 0 + π 1 I t + wt
(1)
Ct = π 2 + π 3 I t + wt
(2)
Para este sistema, M = 2(C,Y) e K = 1(I). A condição de ordem aplicada a (2) mostra que ela é exatamente identificada. A identidade renda é, por definição, identificada. (b) Seguem as equações na forma reduzida:
W&t = π 0 + π 1UN t + π 2 M& t + wt P& = π + π UN + π R& + π M& t
4
5
t
6
t
7
(1) t
(2)
Para este sistema, M = 2(W& , P& ) e K = 3(UN , R& , M& ) . Pela condição de ordem, a equação (1) é superidentificada, mas a (2) é exatamente identificada. (c) Este problema se destina a mostrar o caráter tedioso do desenvolvimento de equações na forma reduzida. Deixamos para o leitor a solução. 19.4 Veja o Exercício 19.3. O teste de condição de posto dá o mesmo resultado. 19.5 A razão pela qual a equação da oferta é superidentificada é que a da demanda contém duas variáveis predeterminadas, I e R. Se contivesse só uma, a equação da
Manual de Soluções • Econometria Básica • Gujarati oferta seria exatamente identificada, o que, conseqüentemente, também ocorreria se α2 = 0 ou α3 = 0. 19.6 (a) Para este sistema, M = 2(Y1,Y2) e K = 2(X1,X2). Pela condição de ordem, Y1 e Y2 são ambas exatamente identificadas. (b) Neste caso Y1 é identificada, mas Y2, não. 19.7 (a) A partir dos Sistemas (19.2.12) e (19.2.22), pode-se demonstrar o seguinte:
⎡ ⎤ πˆ πˆ βˆ10 = ⎢πˆ 20 − 22 πˆ10 ⎥ = −3; βˆ12 = 22 = 1, 25 πˆ12 πˆ12 ⎣ ⎦ ⎡
βˆ20 = ⎢πˆ 20 − ⎣
⎡
γˆ11 = ⎢πˆ 21 − ⎣
πˆ 21 ⎤ πˆ πˆ10 ⎥ = −6; βˆ21 = 21 = 2 πˆ11 ⎦ πˆ11
⎡ πˆ11πˆ 21 ⎤ πˆ πˆ ⎤ = 2, 25; γˆ12 = ⎢πˆ 22 − 12 21 ⎥ = −6 ⎥ πˆ11 ⎦ πˆ11 ⎦ ⎣
(b) Precisamos do erro-padrão lo, pois, como vemos por (a),
γˆ11
γˆ11
para testar essa hipótese, mas não é fácil estimá-
é função não-linear dos coeficientes πˆ .
19.8 (a) Neste exemplo, Y1 não é identificada, mas Y2 é. Como o sistema é análogo ao
πˆ formado por (19.2.12) e (19.2.13), temos que βˆ21 = 3 = 1, 5; βˆ20 = (πˆ 2 − βˆ21πˆ 0 ) = −4 . Os πˆ1
outros coeficientes estruturais não podem ser identificados. (b) Neste caso, tantoY1 quanto Y2 são identificadas. 19.9 Neste sistema M = 4 e K = 5, e todas as equações são superidentificadas. 19.10 Neste caso, M = 4 e K = 4. Pela condição de ordem, Y1 e Y2 não são identificadas, mas Y3 e Y4 são exatamente identificadas. 19.11 Neste caso, M = 5 e K = 4. Pela condição de ordem, Y1, Y2 e Y5 são exatamente identificadas, Y3 não é identificada e Y4 é superidentificada. Para mostrar como funciona a condição de posto, considere a primeira equação, que exclui as variáveis Y3, Y5, X2 e X3. Para que ela seja identificada, deve haver no mínimo um determinante 4 x 4 diferente de zero dos coeficientes das variáveis dela excluídas, mas incluídas nas demais equações. Um determinante assim é:
Manual de Soluções • Econometria Básica • Gujarati
β 23
0
1
β35
0 0
0 1
γ 22 γ 23 0 λ33 ≠0 0 γ 43 γ 52 γ 53
Dessa forma, a primeira equação também é identificada pela condição de posto. Aplique procedimento análogo para as outras equações. 19.12 Neste modelo, M = 4 e K = 2. Pela condição de ordem, a equação para C é identificada, e aquelas para I e T são superidentificadas. Tratando r como exógeno, temos M = 4 e K = 3. Pela condição de ordem, agora as equações para C, I e T são todas superidentificadas. 19.13 Pela Equação (19.1.2), a forma reduzida para renda é Yt = π 0 + π 1 I t + ut . Os resultados pelos MQO são:
Yˆt = 10,0000 + 5,0000It t = (8,458)
(12,503)
R² = 0,897. Pela Equação (19.1.4), a forma reduzida para consumo é Ct = π 2 + π 3 I t + wt . Os resultados pelos MQO são: Cˆ t = 10,0000 + 4,0000It t = (8,458)
(10,002)
r² = 0,848. Para este modelo, M = 2 e K = 1. Pela condição de ordem, a função consumo é exatamente identificada. As estimativas dos coeficientes estruturais são
βˆ0 =
πˆ 0 πˆ = 2; βˆ1 = 3 = 0,8 . πˆ1 πˆ 2
19.14 Veja o Exercício 19.1. Pela Equação (19.3.1) com a Definição 19.2, K − k ≥ m − 1 . Somando k aos dois lados, obtemos K ≥ m + k − 1 . 19.15 As equações na forma reduzida são:
⎛Y Pt = π 1 + π 2 ⎜ t ⎝ Nt
⎞ ⎟ + π 3 Ft + π 4Wt + π 5Ct −1 + π 6Tt −1 + π 7 Pt −1 + vt ⎠
Manual de Soluções • Econometria Básica • Gujarati
⎛Y Qt = π 8 + π 9 ⎜ t ⎝ Nt
⎞ ⎟ + π 10 Ft + π 11Wt −1 + π 12Ct −1 + π 13Tt −1 + π 14 Pt −1 + wt ⎠
(b) Nesse caso, M = 2 e K = 7. Pela condição de ordem, ambas as equações são superidentificadas. 19.16 (a) & (b) Aqui temos M = 2 e K = 2. Pela condição de ordem, a função demanda não é identificada, e a função oferta é superidentificada. (c) As equações na forma reduzida são:
Yt = π 0 + π 1 Rt + π 2 Pt + vt M t = π 3 + π 4 Rt + π 5 Pt + wt (d) Para aplicar o teste de simultaneidade à função oferta, faça o seguinte: (1) estime a forma reduzida para Yt e obtenha os resíduos vˆt ; (2) regresse Mt contra Yt e vˆt ; (3) a hipótese nula é de que não há simultaneidade, ou seja, o coeficiente vˆt de (2) não é estatisticamente significativo. Os resultados disso são os seguintes: Variável dependente: M2 Método: Mínimos quadrados Amostra: 1970 1999 Observações incluídas: 30 Variável Coeficiente C 2021,6072 Y 0,7650 -0,1608
vˆt R² =
0,9872
Erro-padrão
Estatística-t
113,5850
-17,7981
0,0186
40,9533
0,0422
-3,8094 d=
0,5221
Como o coeficiente do termo de resíduos é muito significativo estatisticamente, rejeite a hipótese nula de que não há simultaneidade. (e) Empregamos aqui o teste de exogeneidade apresentado no texto. Estimamos a seguinte regressão:
M t = β1 + β 2Yt + β 3Yˆt + ut , em que Yˆt é obtido da regressão da forma reduzida dada em (c) para Y. Se o β3 estimado for estatisticamente diferente de zero, rejeite a hipótese nula de que Yt é exógena.
Manual de Soluções • Econometria Básica • Gujarati Variável dependente: M2 Método: Mínimos quadrados
Variável C Yt Yˆ t
R² =
Coeficiente 2295,7898 0,3292
Erro-padrão
Estatística-t
78,9873
-29,0652
0,06825
4,82384
0,4791
0,0695
0,9928
6,8929 d=
0,5946
Como mostram os resultados, o coeficiente de Yˆt é estatisticamente significativo, levando à conclusão de que Y não é exógena.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 20 MÉTODOS DE EQUAÇÕES SIMULTÂNEAS 20.1 (a) Falsa. Os MQO podem ser utilizados em sistemas recursivos. (b) Verdadeira. Se uma equação não for identificada, nenhum método fornecerá estimativas dos parâmetros estruturais. (c) Verdadeira. (d) Falsa. Em um sistema de equações simultâneas há variáveis endógenas assim como exógenas, e por vezes não estamos certos em qual dessas categorias se enquadra uma variável. O que nos permite verificar isso é o teste de exogeneidade. (e) Verdadeira. Veja o Apêndice 20A.1 a respeito dos MQI e a nota de rodapé número 14 do Capítulo 20 a respeito dos MQ2E. (f) Verdadeira. Somente regressões individuais têm valores R². (g) Falsa. O método dos MQ2E pode ser modificado para dar conta de erros autocorrelacionados. (h) Verdadeira. Veja a Seção 20.4. 20.2 O método MQ2E propõe-se a fornecer estimativas únicas dos parâmetros de uma equação estrutural superidentificada, o que não é possível com o método MQI. Mas se uma equação for exatamente identificada, as estimativas fornecidas pelos dois métodos serão iguais. 20.3 (a) As três equações na forma reduzida são:
Yt = π 0 + π 1Yt −1 + π 2Gt + v1t Ct = π 3 + π 4Yt −1 + π 5Gt + v2t I t = π 6 + π 7Yt −1 + π 8Gt + v3t Para esse sistema, M = 3 e K = 2. Pela condição de ordem, a equação para C é superidentificada , e aquela para I é exatamente identificada. (b) Empregue o método dos MQ2E para estimar a função superidentificada consumo e o método MQI para a função investimento. 20.4 Se o valor de R² for alto no primeiro estágio do método MQ2E, quer dizer que os valores estimados das variáveis endógenas estão muito próximos dos reais. Portanto, é menos provável que estes estejam correlacionados com o termo de erro estocástico nas equações estruturais originais. Se, no entanto, o valor de R² da regressão do primeiro estágio for baixo, as estimativas MQ2E serão praticamente inexpressivas
Manual de Soluções • Econometria Básica • Gujarati porque os Y originais da regressão do segundo estágio estarão sendo substituídos pelos Y estimados pela regressão do primeiro estágio, que representarão essencialmente os distúrbios nessas regressões. Em outras palavras, os valores Y estimados serão variáveis instrumentais muito deficientes para os valores Y reais. No sistema de resultados mostrado neste exercício, os valores estimados das variáveis endógenas estão próximos dos valores reais. Os valores MQ2E não são insignificantes porque em grandes amostras fornecem estimativas consistentes dos coeficientes estruturais. 20.5 (a) Escrevendo os sistemas em notação matricial, obtemos:
⎡1 −α ⎢1 −1 ⎢ ⎢⎣1 0
⎡ ⎤ ⎢ ln A ⎥ − β ⎤ ⎡ ln Q ⎤ ⎢ ⎥ W ⎥ ⎢ ⎥ ⎢ 0 ln L = ln − ln β ⎥ , que pode ser escrito como Ay = x. ⎥⎢ ⎥ ⎢ P ⎥ −1 ⎥⎦ ⎢⎣ ln K ⎥⎦ ⎢ ⎥ R ⎢ ln − ln α ⎥ ⎣ P ⎦
Ora, se (α + β) = 1, pode-se mostrar que o determinante de A, |A|, é zero, o que quer dizer que a matriz A não pode ser invertida. Não há, portanto, solução. (b) Mesmo que (α + β) ≠ 1, não há um problema de identificação. Já que W/P e R/P são conhecidos, podem ser tratados como constantes e absorvidos no termo constante ln A. Conseqüentemente, qualquer combinação linear das Equações (2) e (3) será indistinguível da Equação (1). (c) Há diversas possibilidades. Por exemplo, podemos incluir uma ou mais variáveis exógenas às Equações (2) ou (3), certificando-nos de que teoricamente tais variáveis não apareçam na função produção (1). Outra opção seria introduzir mecanismo de defasagem distribuída nas relações marginais de produção, o que levaria à inclusão do estoque de capital do último período na relação marginal de produtividade para a função capital. 20.6 (a) A função demanda é não-identificada. (b) A função oferta é superidentificada. (c) Pode-se empregar o método dos MQ2E para estimar os parâmetros da função superidentificada oferta. (d) Ambas as funções são, agora, superidentificadas. Use, então, os MQ2E. 20.7 As equações na forma reduzida são:
Manual de Soluções • Econometria Básica • Gujarati
Yt = π 0 + π 1 I t + vt Ct = π 2 + π 3 I t + wt Com base nos dados fornecidos, as estimativas pelos MQO dessas regressões na forma reduzida são as seguintes:
Yˆt = 1831,8580 + 4,6722It t = (7,6427)
(17,5784)
(1-a)
r² = 0,9169; d = 0,3287.
Cˆ t = 1130,843 + 3,2059I t = (6,5225)
(16,6752)
(2-a)
r² = 0,9085; d = 0,3751. As estimativas pelos MQI das equações estruturais originais são:
βˆ1 =
πˆ 3 3, 2059 = = 0, 6862 πˆ1 4, 6722
βˆ0 = πˆ 0 (1 − βˆ1 ) = 574,8370 Para comparação, os resultados da regressão pelos MQO de C contra Y são os seguintes:
Cˆ t = –142,1826 + 0,6889Yt t = (–5,3883)
(156,2434)
r² = 0,9988; d = 1,2019. Como vemos, as estimativas da propensão marginal a consumir (PMC) pelos MQI é 0,6862 e pelos MQO é 0,6889, uma diferença que pode não ser estatisticamente significativa, mas talvez o seja em termos práticos. No primeiro caso, o multiplicador,
M=
1 1 − MPC
, é 3,1565 e no segundo (MQO), é 3,2144. Seja como for, já que as
estimativas pelos MQO são tendenciosas e inconsistentes na presença de simultaneidade, é bom ter em mente esse fato ao compará-las às estimativas pelos MQI. Problemas 20.8 (a) Para justificar esse modelo pode-se usar o IS-LM de macroeconomia. (b) Pela condição de ordem, a equação da taxa de juros não é identificada, mas a da renda é exatamente identificada.
Manual de Soluções • Econometria Básica • Gujarati (c) Neste exemplo, a variável exógena é M. Usando os dados fornecidos na Tabela 20.2, obtemos os seguintes resultados pelos MQI:
Yˆt = 2834,488 + 1,2392Mt t = (32,0163)
(37,3812)
r² = 0,9803; d = 0,3074. Deixamos para o leitor, a título de exercício, a tarefa de descobrir os coeficientes estruturais originais, a saber, α0 e α1. 20.9 (a) Pela condição de ordem, a equação da taxa de juros não é identificada, e a da renda é superidentificada. (b) Podemos empregar neste caso os MQ2E. Usando M e Yt-1 como instrumentais, seguem os resultados da regressão fornecidos pelo Eviews 4, em que R é a taxa de juros a seis meses das letras do tesouro dos Estados Unidos:
Yˆt = 16977,06 – 1627,870Rt t = (3,0842)
(–2,0350)
Observe que não apresentamos o valor de R² pelas razões vistas no Capítulo 20 do livro-texto. 20.10 As duas equações são, neste caso, exatamente identificadas. Podemos usar os MQI ou os MQ2E para estimar os parâmetros, mas ambos fornecerão resultados idênticos devido às razões apresentadas no Capítulo 20. Aí vão as estimativas pelos MQO das equações na forma reduzida (FR). Observe que na FR somente as variáveis exógenas (I e M) aparecem do lado direito da equação.
Rˆt = 8,7056 + 0,00049Mt – 0,00084It-1 t = (6,0589)
(–05192)
(–0,2281)
R² = 0,1172.
Yˆt = 2421,074 + 0,8944Mt + 1,4585It-1 t = (32,7247)
(18,3144)
(7,6607)
R² = 0,9938. Deixamos para o leitor a tarefa de descobrir os parâmetros estruturais originais pelos coeficientes da forma reduzida. 20.11 Agora as equações para R e Y não são identificadas, ao passo que a do investimento é exatamente identificada.
Manual de Soluções • Econometria Básica • Gujarati (b) Primeiro, achamos a forma reduzida para a função investimento. Já que só há uma variável exógena, M, regressamos I contra M , obtendo os seguintes resultados:
Iˆt = 283,4482 + 0,2364Mt t = (5,6424)
(12,5681)
r² = 0,8494. Deixamos para o leitor a tarefa de estimar as regressões na forma reduzida para R e Y e descobrir os coeficientes da função investimento. 20.12 Se seguirmos o procedimento descrito no Apêndice 20A.2, devemos encontrar os erros-padrão mostrados em (20.5.3), os quais foram diretamente obtidos do pacote de software Eviews 4. 20.13 (a) Como a oferta é uma função do preço no período anterior, o sistema é recursivo. Não há, assim, problemas de simultaneidade. (b) As equações podem ser estimadas empregando os MQO individualmente. (c) Seguem os resultados das regressões:
Função demanda:
Qˆ td = 69,512 + 0,201Pt + 0,001Xt t = (7,393)
(1,782)
(1,586)
R² = 0,501. Como os coeficientes dos dois regressores não são individualmente significativos sob o aspecto estatístico, não há muito a dizer sobre essa função demanda. Repare que o coeficiente de preço é positivo, contrariando as expectativas prévias.
ˆ = 66,287 + 0,330Pt-1 Função oferta: Q t s
t = (8,288)
(4,579)
r² = 0,525. Como esperado, o coeficiente da variável defasada preço é positivo e também estatisticamente significativo. 20.14 Deixamos este exercício para ser feito em aula.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 21 ECONOMETRIA DE SÉRIES TEMPORAIS: ALGUNS CONCEITOS BÁSICOS 21.1 Diz-se que um processo estocástico é fracamente estacionário quando sua média e variância são constantes ao longo do tempo e o valor da covariância entre dois períodos de tempo depende somente da distância ou defasagem entre esses períodos e não do próprio tempo em que é calculada. 21.2 Se uma série temporal tem de ser diferenciada d vezes antes de se tornar estacionária, então é integrada de ordem d e designada por I(d). Na sua forma nãodiferenciada, tal série temporal é não-estacionária. 21.3 Em termos gerais, a expressão raiz unitária significa que uma suposta série temporal é não-estacionária. Tecnicamente falando, o termo se refere à raiz do polinômio no operador de defasagem. 21.4 É preciso diferenciá-la três vezes. 21.5 O Dickey-Fuller (DF) é um teste estatístico que pode ser empregado para determinar se uma série temporal é estacionária. O Dickey-Fuller Aumentado (DFA) é análogo ao DF, mas leva em consideração a possível correlação nos termos de erro. 21.6 Os testes EG e EGA são procedimentos estatísticos que podem ser empregados para determinar se duas séries temporais são co-integradas. 21.7 Diz-se que duas variáveis são co-integradas se existir entre elas uma relação estável no longo prazo, mesmo que ambas sejam individualmente não-estacionárias. Nesse caso, a regressão de uma dessas variáveis contra a outra não é espúria. 21.8 Os testes de raiz unitária são realizados em séries temporais individuais. A cointegração lida com a relação entre as variáveis de um grupo em que (incondicionalmente) cada uma tem uma raiz unitária. 21.9 Se uma variável não-estacionária for regressada contra outra variável também não-estacionária, é possível que a regressão resultante passe nos testes estatísticos habituais (valor R² alto, razões t significativas etc.) mesmo que, a priori, tal relação entre as duas não seja esperada, especialmente se elas não forem co-integradas. Se, no entanto, as duas variáveis forem co-integradas, mesmo que sejam individualmente não-estacionárias, então é possível que tal regressão não seja espúria. 21.10 Veja a resposta à pergunta anterior.
Manual de Soluções • Econometria Básica • Gujarati 21.11 Quase todas as séries temporais econômicas apresentam tendências que, se forem perfeitamente previsíveis, são chamadas determinísticas, caso contrário, são chamadas estocásticas. Uma série temporal não-estacionária exibe, em geral, uma tendência estocástica. 21.12 Se uma série temporal apresenta uma tendência determinística, os resíduos de sua regressão contra a variável de tendência representam o que se chama de processo estacionário em tendência. Se uma série temporal é não-estacionária, mas, após tirarmos sua primeira diferença (ou superiores) ela se torna estacionária, chamamos tal série de processo estacionário em diferenças. 21.13 O passeio aleatório é um exemplo de processo não-estacionário. Se uma variável segue um modelo de passeio aleatório, quer dizer que o seu valor hoje é igual ao seu valor no período anterior mais um choque aleatório (termo de erro). Pode não ser possível, em tais situações, prever a evolução ao longo do tempo de uma variável assim. Preços de ações ou taxas de câmbio são exemplos típicos do passeio aleatório. 21.14 Isso é verdade. A demonstração está no Capítulo 21 do livro-texto. 21.15 A co-integração implica uma relação de longo prazo, ou equilíbrio, entre duas (ou mais) variáveis. No curto prazo pode, no entanto, haver desequilíbrio entre elas. O mecanismo de correção de erro (MCE) restaura o equilíbrio no longo prazo entre as variáveis. Problemas 21.16 (a) Os correlogramas para todas essas séries temporais assemelham-se muitíssimo ao do PIB dos Estados Unidos apresentado na Figura 21.8 do texto, e indicam que elas não são estacionárias. 21.17 Os resultados das regressões são os seguintes: ΔDCPt = 93,392 + 0,799t – 0,044DCPt-1 τ = (1,678) (1,360) (–1,376)* R² = 0,022. * Em valor absoluto, esse valor tau é menor que o crítico, indicando que há uma raiz unitária na série temporal DCP, ou seja, que ela não é estacionária. ΔRPDt = 326,633 + 2,875t – 0,0157RPDt-1 (–2,588)* τ = (2,755) (2,531) R² = 0,076.
Manual de Soluções • Econometria Básica • Gujarati * Esse valor tau não é estatisticamente significativo, indicando que há uma raiz unitária na série temporal RPD, ou seja, que ela não é estacionária. ΔLucrost = 6,522 + 0,084t – 0,069Lucrost-1 τ = (2,514) (1,142) (–1,715)* R² = 0,037. * Esse valor tau não é estatisticamente significativo, indicando que há uma raiz unitária nesta série temporal. Dividendost = 0,565 + 0,113t – 0,063Dividendost-1 τ = (1,515) (3,138) (–2,640)* R² = 0,148. * Esse valor tau não é significativo, indicando que a série temporal Dividendos não é estacionária. Vemos, então, que todas essas séries temporais são não-estacionárias. Os resultados do teste Dickey-Fuller tanto sem a tendência quanto sem esta e sem o intercepto não alteraram a conclusão. 21.18 Se os termos de erro no modelo apresentarem correlação serial, então o teste DFA é o mais adequado. As estatísticas τ para os coeficientes apropriados nas três séries são, pelas regressões DFA, as seguintes: DCP Lucros Dividendos
-1,605 -2,297 -3,158
Os valores tau críticos continuam os mesmos do Problema 21.17, e, mais uma vez, chegamos à mesma conclusão, ou seja, as três séries temporais são não-estacionárias. 21.19 (a) Provavelmente sim, pois as duas séries temporais são, individualmente, não estacionárias. (b) A regressão pelos MQO de dividendos contra lucros apresentou os seguintes resultados: Variável C LUCROS R² =
Coeficiente -13,3114 0,6281 0,6231
Erro-padrão 7,3626 0,0526 d=
Estatística-t -1,8079 11,9253 0,0712
Quando os resíduos dessa regressão foram submetidos aos testes de raiz unitária sem termo constante, com termo constante e com este e mais a tendência, os resultados mostraram que eles não eram estacionários, levando, então, à conclusão de que
Manual de Soluções • Econometria Básica • Gujarati dividendos e lucros não são séries co-integradas. Assim sendo, mantém-se a conclusão do item (a). (c) Não há muito sentido neste exercício, pois não existe relação de longo prazo entre as duas séries. (d) Ambas apresentam tendências estocásticas, confirmadas pelos testes de raiz unitária das duas séries. (e) Se dividendos e lucros forem co-integrados, não importa qual deles é o regressando ou o regressor. Naturalmente, esse problema pode ser resolvido pela teoria financeira. 21.20 Os correlogramas das primeiras diferenças de RDP, Lucros e Dividendos são todos similares ao da Figura 21.9 do livro-texto. Na forma de primeiras diferenças, essas séries temporais são todas estacionárias, o que pode ser confirmado pelo teste DFA. As estatísticas τ para os coeficientes apropriados nas quatro séries são, pelas regressões DFA, as seguintes: DCP RDP Lucros Dividendos
-4,852 -6,856 -5,517 -6,305
Em valor absoluto, todos esses tau excedem os valores críticos, confirmando que as primeiras diferenças dessas séries temporais são mesmo estacionárias. 21.21 Teoricamente, não deveria haver um intercepto nesse modelo. Mas se houvesse no original um termo de tendência, então um intercepto poderia ser incluído na regressão e o seu coeficiente indicaria o coeficiente da variável de tendência. Isso, naturalmente, presumindo que a tendência não seja estocástica, mas determinística. Para verificar isso, regressamos primeiro dividendos contra lucros e a variável de tendência, com os seguintes resultados: Variável dependente: DIVIDENDOS Variável Coeficiente C 11,8978 LUCROS -0,1096 Tendência 1,6472 R quadrado 0,9668
Erro-padrão 2,3538 0,02939 0,0554
Estatística-t 5,05457 -3,7293 29,7008
Mas devemos desconfiar dessa regressão, pois ela presume que há uma tendência determinística quando sabemos que a série temporal dividendos tem tendência estocástica. Regressando agora as primeiras diferenças de dividendos contra as de lucros e o intercepto, chegamos aos seguintes resultados:
Manual de Soluções • Econometria Básica • Gujarati Variável C ΔLUCROS R quadrado
Coeficiente 1,3502 -0,0238 0,0152
Erro-padrão 0,1953 0,02080
Estatística-t 6,9112 -1,1470
Nessa regressão, o coeficiente angular não é significativo, mas o intercepto é, e seu valor de 1,3502 é teoricamente igual ao coeficiente da variável tendência na equação anterior. Os dois valores não são idênticos devido a erros de arredondamento e também ao fato de que a tendência não é determinística na série dividendos. Este exercício mostra que devemos ser muito cuidadosos ao incluir a variável de tendência numa regressão de série temporal, a menos que estejamos certos de que ela é de fato determinística. Sempre se pode, naturalmente, empregar os testes DF e DFA para determinar se a tendência é estocástica ou determinística. 21.22 Da regressão da primeira diferença dada no exercício anterior podemos obter os resíduos ( uˆt ) e submetê-los aos testes de raiz unitária. Regressamos Δuˆt contra seu próprio valor defasado, sem intercepto, com intercepto e com este e mais a tendência. A hipótese nula, em todos os casos, era de que esses resíduos não são estacionários, ou seja, eles têm uma raiz unitária. Os valores τ Dickey-Fuller para as três opções foram -3,9592, -3,9367 e -3,9726. Tal hipótese foi rejeitada em todos os casos no nível de 5% ou melhor (isto é, valor p menor que 5%). Em outras palavras, embora as séries dividendos e lucros não sejam co-integradas, elas o são na forma da primeira diferença. 21.23 (a) Como | τ | é menor que o valor | τ | crítico, parece que a série temporal de novas construções é não-estacionária. Há nela, portanto, uma raiz unitária. (b) Habitualmente, um valor t absoluto tal como 2,35 ou maior seria significativo no nível de 5%, mas devido à situação da raiz unitária o valor real de | t | neste caso é 2,95 e não 2,35. Este exemplo mostra por que devemos ser cuidadosos ao empregar indiscriminadamente a estatística t. (c) Como o | τ | de ΔXt-1 é muito maior que o valor crítico correspondente, concluímos que não há uma segunda raiz unitária na série temporal de novas construções. 21.24 Deixamos este para o leitor resolver. 21.25 (a) & (b)
Manual de Soluções • Econometria Básica • Gujarati
Y exibe uma tendência linear, ao passo que X representa uma tendência quadrática. A seguir está o gráfico dos valores reais e ajustados de Y:
Residual = Resíduos Actual = Reais Fitted = Ajustados Poderíamos, com base nos resultados fornecidos no enunciado, achar que esta é uma “boa” regressão, pois tem um alto R² e razões t significativas, mas acontece que é uma relação completamente espúria porque estamos regressando uma variável de tendência linear (Y) contra uma de tendência quadrática (X). Pode-se inferir que há algo de errado com esse modelo pelo valor muito baixo da estatística d de DurbinWatson. A intenção deste exercício é prevenir contra a distorção na interpretação dos resultados da regressão de duas variáveis com tendência determinística e trajetórias temporais divergentes.
Manual de Soluções • Econometria Básica • Gujarati 21.26 (a) A regressão (1) mostra que a elasticidade de M1 em relação ao PIB é de aproximadamente 1,60, que parece estatisticamente significativo, já que o valor t desse coeficiente é muito alto. Mas observando o valor d suspeitamos de que haja correlação nos termos de erro ou de que a regressão seja espúria. (b) Ainda há relação positiva entre as duas variáveis na forma de primeira diferença, mas agora o coeficiente de elasticidade caiu muitíssimo. Sim, os valores d possivelmente sugerem que não há problema de correlação serial, mas a queda significativa do coeficiente de elasticidade indica que o problema pode ser de ausência de co-integração entre as variáveis. (c) & (d) Parece, pela regressão (3), que as duas variáveis são co-integradas, pois o valor τ crítico a 5% é 1,9495 e o estimado é mais negativo que isso. Contudo, o τ crítico a 1% é 2,6227, sugerindo que elas não são co-integradas. Se levarmos em conta o intercepto e este e mais a tendência na Equação (3), então o teste DF mostrará que as variáveis não são co-integradas. (e) A Equação (2) fornece a relação no curto prazo entre os logaritmos de M1 e o PIB. Essa equação leva em conta o mecanismo de correção de erro (MCE), que tenta restaurar o equilíbrio caso as variáveis se desviem da sua trajetória no longo prazo. O termo de erro nessa regressão não é, entretanto, estatisticamente significativo no nível de 5%. Como os resultados dos testes de co-integração são um tanto quanto variados, conforme vimos em (c) e (d), é difícil saber se os resultados da regressão apresentados em (1) são ou não espúrios. 21.27 (a) & (b) O gráfico temporal do IPC dos Estados Unidos assemelha-se muitíssimo à Figura 21.12 do livro-texto, a qual mostra claramente que há, em geral, uma tendência para cima no IPC. Não vale a pena, portanto, levar em consideração as regressões (1) e (2). Observe que o coeficiente do IPC defasado é positivo em ambos os casos, e para estacionariedade é necessário que esse valor seja negativo. Por conseguinte, unitária indicam valores do IPC significativo) são
a equação mais significativa é a regressão (3). Os testes DF de raiz que a série temporal IPC é estacionária em tendência. Ou seja, os em torno do seu valor de tendência (que é estatisticamente estacionários.
(c) Temos de usar o teste F porque a Equação (1) omite duas variáveis. Empregando a versão R² desse teste, o R² da regressão (1) é o restrito e vale 0,0304, e o da regressão (3) é o irrestrito e vale 0,4483. Daí vem que
F=
(0, 4483 − 0, 0304) 2 (1 − 0, 4483) 37
= 14, 0234 .
Consultando os valores F de Dickey-Fuller na Tabela D.7 do Apêndice D, vemos que o aqui observado é muito significativo (Nota: Não há na tabela o valor para 40 observações, mas interpolando os valores lá fornecidos, chega-se a essa conclusão). Daí deduz-se que as restrições impostas pela regressão (1) são inválidas. Mais explicitamente, é a regressão (3) que parece válida.
Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 22 ECONOMETRIA DE SÉRIES TEMPORAIS: PREVISÃO
22.1 Como visto na seção 22.1, há, de modo geral, cinco métodos de previsão econômica: (1) suavizamento exponencial; (2) modelos de regressão com uma única equação; (3) modelos de regressão com equações simultâneas; (4) modelos autoregressivos integrados de médias móveis (ARIMA); e (5) auto-regressões vetoriais (VAR). 22.2 A previsão econômica por equações simultâneas (ES) baseia-se num sistema de equações (composto por, no mínimo, duas variáveis, mas freqüentemente muitas mais) que, apoiado numa teoria econômica, explica alguns fenômenos econômicos. O método Box-Jenkins (B-J) tem por fundamento a análise das propriedades estocásticas de uma única série temporal. Ao contrário da previsão por ES que se baseia em k regressores, a análise B-J apóia-se em valores passados (defasados) da única variável sob investigação. A análise B-J é freqüentemente descrita como ateórica porque não se origina de nenhuma teoria econômica. 22.3 As principais etapas da metodologia B-J são: (1) identificação; (2) estimação; (3) verificação de diagnóstico; e (4) previsão. 22.4 Como o método Box-Jenkins presume explicitamente que a série temporal subjacente é estacionária, se for aplicado a uma série temporal não-estacionária os resultados serão absolutamente duvidosos. Imagine fazer a previsão de uma variável de passeio aleatório! 22.5 A abordagem B-J à previsão baseia-se na análise das propriedades probabilísticas de uma única série temporal sem o embasamento de qualquer teoria econômica subjacente. A abordagem VAR se baseia em um sistema simultâneo em que todas as variáveis são consideradas endógenas. Segundo a VAR, o valor de uma variável é expresso como uma função linear dos valores defasados dessa variável e de todas as outras incluídas no modelo. 22.6 É ateórica porque usa menos informação prévia que os modelos ES. Nestes, a inclusão ou exclusão de determinadas variáveis desempenha papel crucial na identificação do modelo. 22.7 Como observado no Exercício 22.1, há cinco métodos de previsão, cada qual com seus pontos fracos e fortes. Não existe um único que seja adequado a todas as situações. 22.8 Precisamos de defasagens com o comprimento certo para captar a dinâmica do sistema que estiver sendo modelado. Por outro lado, quanto mais defasagens usarmos, maior será o número de parâmetros que têm de ser estimados, e, por isso, menos serão os graus de liberdade. Há, portanto, um compromisso entre ter um número suficiente de defasagens e ter suficientes graus de liberdade. Este é o ponto fraco de VAR. Pode-se, naturalmente, empregar os critérios de informação de Akaike ou de Schwarz para escolher o comprimento da defasagem.
1
Manual de Soluções • Econometria Básica • Gujarati 22.9 Veja as respostas dos Exercícios 22.2 e 22.6. 22.10 Os dois procedimentos são, operacionalmente, similares. A diferença está no propósito da pesquisa. No teste de causalidade de Granger, objetivamos verificar a conexão causal entre duas ou mais variáveis. Na VAR, nosso objetivo é desenvolver um modelo originariamente com finalidade de previsão. Observe que esses procedimentos não devem ser empregados a menos que as variáveis subjacentes sejam estacionárias ou co-integradas. Problemas 22.11 As etapas envolvidas são as seguintes: (1) Verifique se a série é estacionária. Já vimos que a série RPD não é estacionária, mas suas primeiras diferenças são. (2) Verifique a função de autocorrelação (ACF) e a função de autocorrelação parcial (PACF) da primeira diferença da série RPD para decidir qual deve ser o modelo ARMA apropriado. Repare que a série RPD já é a primeira diferença. (3) Uma vez escolhido o modelo ARMA adequado, a próxima tarefa é estimá-lo e examinar seus resíduos. Se forem ruídos brancos, não será necessário refinar mais o modelo, mas se não forem, iniciamos o processo de busca, ou iterativo, mais uma vez. Um exame das funções ACF e PACF não revela nenhuma disposição ordenada. O pico na defasagem 5 parece algo pronunciado, visto que está muito próximo do limite superior de confiança de 95%. Pode-se, então, como experiência, ajustar um modelo autoregressivo usando o intercepto e cinco defasagens. Não há, entretanto, necessidade de incluir todas as cinco defasagens, já que são muito pequenas as correlações até a defasagem 4. Assim, introduzimos só o intercepto e a quinta defasagem como regressores. Os resultados, em que RPD* representa as primeiras diferenças de RPD, são os seguintes:
RPDt* = 22,2768 – 0,2423 RPDt*−5 t = (5,9678)
(–2,1963)
r² = 0,0568; d = 2,11. Os resíduos dessa regressão parecem ruído branco, de forma que não há necessidade de refinar o modelo. Pode-se, é claro, incluir um componente MA e tentar reestimar o modelo. Deixamos isso como exercício. 22.12 Guie-se pelo Exercício 22.11 e experimente o modelo ARIMA (0,1,14). 22.13 Guie-se pelo Exercício 22.11 e experimente o modelo ARIMA (8,1,8). 22.14 Guie-se pelo Exercício 22.11 e experimente o modelo ARIMA (2,1,0).
2
Manual de Soluções • Econometria Básica • Gujarati 22.15 De acordo com o critério de Schwarz, escolha o modelo cujo valor da estatística Schwarz seja menor. O mesmo se aplica ao critério (concorrente) de Akaike. Assim, ao comparar um modelo VAR com 8 defasagens a outro também VAR com 10 defasagens, escolha aquele que apresentar o menor valor da estatística Schwarz. 22.16 Determinou-se, com base no critério de Schwarz, que um modelo VAR com duas defasagens de RPD e DCP seria suficiente. Seguem os resultados, com as razões t entre parênteses: Variáveis explanatórias Intercepto DCPt-1 DCPt-2 RPDt-1 RPDt-2 R²
Variáveis dependentes DCP RPD 14,655 60,944 (0,878) (2,582) 1,106 0,623 (8,756) (3,489) -0,102 -0,400 (-0,707) (-2,120) 0,069 0,682 (0,806) (5,630) -0,072 0,099 (-0,877) (0,850) 0,998 0,997
Fundamentados nesse modelo, os valores reais e previstos das duas variáveis para o período de 1991:1 a 1991:4 são os seguintes: Trimestre 1991:1 1991:2 1991:3 1991:4
RPD real 3241,1 3252,4 3271,2 3271,1
RPD prevista 3262,062 3277,870 3295,359 3313,034
DCP real 3514,8 3537,4 3539,9 3547,5
DCP prevista 3532,343 3550,343 3569,230 3588,260
22.17 Deixamos para o leitor a tarefa de executar as etapas práticas com três defasagens. 22.18 Consulte, por exemplo, o Eviews 4 para uma discussão da análise de resposta a impulso, assim como das etapas práticas envolvidas. 22.19 Veja a resposta do exercício anterior. 22.20 Embora o modelo não tenha sido testado especificamente para causalidade, podemos obter alguma informação sobre ela por meio da estatística F informada. No caso da variável x, os únicos valores significativos são os seus próprios defasados. No da y, parece que além dos seus próprios valores defasados, também são importantes os defasados de x. Talvez haja causalidade de x para y. Para a variável z, parece que além dos seus próprios valores defasados, também são importantes os defasados de y, o que indica que há certa causalidade de y para z.
3
Manual de Soluções • Econometria Básica • Gujarati 22.21 Para que o método VAR possa ser empregado, todas as variáveis incluídas no modelo têm de ser conjuntamente estacionárias. É possível que os autores tenham percebido que as três variáveis eram não-estacionárias em forma de nível, e uma das maneiras de se conseguir a estacionariedade é a forma de variação percentual. 22.22 Em forma de nível, M1 é não-estacionária de acordo com o teste DF em suas várias formas, e o mesmo se aplica a R. Para vermos se são integradas, regressamos M1 contra R e obtivemos os seguintes resultados:
1t = 36622,11 – 744,4635Rt M t = (19,2627)
(–4,7581)
r² = 0,3997; d = 0,2346. Os resíduos dessa regressão foram submetidos à análise de raiz unitária. Com a aplicação do teste DF em suas diversas formas, concluímos que essas duas séries temporais não são co-integradas. 22.23 (a) Os resultados da regressão são os seguintes: Variável C LOG(PIB) LOG(R) R quadrado
Coeficiente -7,8618 1,4254 -0,0780 0,9316
Erro-padrão 1,2807 0,0962 0,0302 Estat d DurbinWatson
Estatística-t -6,1385 14,8173 -2,5822 0,3476
Os coeficientes angulares representam elasticidades (parciais), pois este é um modelo duplo-log. As elasticidades renda e taxa de juros são, respectivamente, 1,4254 e – 0,0780, ambas estatisticamente significativas. Mas repare que o baixo valor DurbinWatson indica a possibilidade de correlação serial, o que levanta dúvidas a respeito dos valores t calculados. (b) Para verificarmos se há efeito ARCH, obtivemos os resíduos (uˆt ) da regressão dada em (a) e fizemos a seguinte regressão:
uˆt2 = 0,00064 + 0,3442 uˆt2−1 t = (3,1173)
(2,9206)
r² = 0,2054; d = 2,11. Experimentamos um modelo ARCH(2), mas os resultados não foram significativos. Parece que há efeito ARCH neste exemplo. 22.24 O modelo dado no enunciado é a versão restrita daquele da Equação (22.11.4) Podemos, portanto, empregar o teste F restrito do Capítulo 8. Os R² irrestrito e o restrito são, respectivamente, 0,2153 e 0,1397. Daí segue que F =
(0, 2153 − 0,1397) 2 (1 − 0, 2153) (649 − 4)
= 31, 5 ,
4
Manual de Soluções • Econometria Básica • Gujarati valor muito significativo, indicando que se deve preferir o modelo da Equação (22.11.4) ao dado no enunciado deste exercício.
5
View more...
Comments