Econometria I

Aula 31

Ricardo Gouveia-Mendes


Licenciatura em Economia
2.º Semestre 2023-24

Heteroscedasticidade: Consequências e Soluções

Natureza e Efeitos da Heteroscedasticidade

  • Heteroscedasticidade: \(\mathrm{Var}(u_i|X) = \sigma^2_i = \sigma^2 h(X_i)\)
  • Consequências sobre os estimadores OLS:
    • Não afeta centricidade e consistência
    • Deixam de ser eficientes
    • Deixam de ter uma distribuição Normal
      • Fórmula habitual da variância dos estimadores é incorreta
      • Não é possível fazer inferência
  • Soluções:
    • Método dos Mínimos Quadrados Robustos
    • Método dos Mínimos Quadrados Ponderados

Método dos Mínimos Quadrados Robustos

  • Como os estimadores continuam a ser centrados, só temos que nos preocupar com a precisão, recordando que: \[ \mathrm{Var}(\boldsymbol{\hat{\beta}}|\mathrm{X}) = (\mathrm{X}'\mathrm{X})^{-1}\mathrm{X}' \,\mathrm{Var}(\boldsymbol{u}|\mathrm{X})\, \mathrm{X}(\mathrm{X}'\mathrm{X})^{-1} \]
  • Com Homoscedasticidade: \[ \mathrm{Var}(\boldsymbol{u}|\mathrm{X}) = \sigma^2 \begin{bmatrix} 1 & 0 & \dots & 0 \\ 0 & 1 & \dots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & 1 \end{bmatrix} = \sigma^2 \mathrm{I} \quad \Rightarrow \quad \mathrm{Var}(\boldsymbol{\hat{\beta}}|\mathrm{X}) = \sigma^2 (\mathrm{X}'\mathrm{X})^{-1} \]

Método dos Mínimos Quadrados Robustos

  • E o estimador para \(\sigma^2\): \(\hat{\sigma}^2 = SQR/(N-p) = \boldsymbol{\hat{u}}'\boldsymbol{\hat{u}} / (N-p)\)
  • Mas com Heteroscedasticidade:

\[ \begin{align} \mathrm{Var}(\boldsymbol{u}|\mathrm{X})\equiv \Omega &= \begin{bmatrix} \sigma^2_1 & 0 & \dots & 0 \\ 0 & \sigma^2_2 & \dots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & \sigma^2_N \end{bmatrix} \\ & \\ \mathrm{Var}(\boldsymbol{\hat{\beta}}|\mathrm{X}) &= (\mathrm{X}'\mathrm{X})^{-1}\mathrm{X}' \,\Omega\, \mathrm{X}(\mathrm{X}'\mathrm{X})^{-1} \end{align} \]

\[ \hat{\Omega} = \begin{bmatrix} \hat{u}^2_1 & 0 & \dots & 0 \\ 0 & \hat{u}^2_2 & \dots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & \hat{u}^2_N \end{bmatrix} \]

Método dos Mínimos Quadrados Robustos

Propriedades

  • Centricidade
  • Consistência
  • Não eficientes
  • Distribuição Normal assimptótica
    • Fórmula da variância apenas válida assimptoticamente
    • Inferência apenas válida assimptoticamente

Método dos Mínimos Quadrados Ponderados

  • Exige um pressuposto sobre \(h(\cdot)\) em \(\mathrm{Var}(u_i|X_i)=\sigma^2 h(X_i)\)
  • Consiste em estimar por OLS um modelo transformado, em que cada variável é dividida por \(\sqrt{h(X_i)}\) \[ \begin{gather} Y^*_i = \beta_0\, X^*_{0i} + \beta_1\, X^*_{1i} + \dots + \beta_k\, X^*_{ki} + u^*_i \\ Y^*_i = \frac{Y_i}{\sqrt{h(X_i)}}, \quad X^*_{0i} = \frac{1}{\sqrt{h(X_i)}}, \\ X^*_{1i} = \frac{X_{1i}}{\sqrt{h(X_i)}}, \quad \dots, \quad X^*_{ki} = \frac{X_{ki}}{\sqrt{h(X_i)}}, \quad \end{gather} \]
  • A transformação torna o modelo homoscedástico

Método dos Mínimos Quadrados Ponderados

Propriedades

  • Centricidade
  • Consistência
  • Eficiência
  • Distribuição Normal
  • A interpretação dos \(\beta\) é feita em função do modelo original
  • Apesar do seu potencial é pouco usado

Exercícios

Exercício 8.1

Considere um modelo linear para explicar o consumo mensal de cerveja:

\[ cerveja = \beta_0 + \beta_1 rend + \beta_2 preco + \beta_3 educ + \beta_4 fem + u \] \[ \mathbb{E}(u|rend,preco,educ,fem) = 0 \] \[ \mathrm{Var}(u|rend,preco,educ,fem) = \sigma^2 rend^2 \]

Escreva a equação transformada que tenha um erro homoscedástico.

\[ \frac{cerveja}{rend} = \beta_0 \frac{1}{rend} + \beta_2 \frac{preco}{rend} + \beta_3 \frac{educ}{rend} + \beta_4 \frac{fem}{rend} + \frac{u}{rend} \]

Exercício 8.2 🖥️

Use os dados em PRECASA.DTA para este exercício.

  1. Estime o modelo \(preco=\beta_0 + \beta_1 lote + \beta_2 area + \beta_3 quartos + u\), calculando os erros padrão usuais e os robustos à heteroscedasticidade. Discuta quaisquer diferenças importantes entre eles.

regress preco lote area quartos



Call:
lm(formula = preco ~ lote + area + quartos, data = df)

Residuals:
     Min       1Q   Median       3Q      Max 
-120.457  -38.372   -6.185   32.223  208.807 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -21.726448  29.479635  -0.737  0.46318    
lote          0.022236   0.006914   3.216  0.00184 ** 
area          1.322524   0.142645   9.271 1.69e-14 ***
quartos      13.786398   9.015998   1.529  0.13000    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 59.84 on 84 degrees of freedom
Multiple R-squared:  0.6722,    Adjusted R-squared:  0.6605 
F-statistic: 57.43 on 3 and 84 DF,  p-value: < 2.2e-16

regress preco lote area quartos, robust



t test of coefficients:

              Estimate Std. Error t value  Pr(>|t|)    
(Intercept) -21.726448  36.302861 -0.5985   0.55113    
lote          0.022236   0.013199  1.6848   0.09575 .  
area          1.322524   0.186734  7.0824 4.014e-10 ***
quartos      13.786398   8.305044  1.6600   0.10064    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  • Os desvios-padrão robustos são maiores
  • A variável \(lote\) deixa de ser significativa

Exercício 8.2 🖥️

  1. Repita a) para o modelo \[ \ln(preco) = \beta_0 + \beta_1 \ln(lote) + \beta_2 \ln(area) + \beta_3 quartos + u \]

Call:
lm(formula = preco ~ I(log(lote)) + I(log(area)) + quartos, data = df)

Residuals:
     Min       1Q   Median       3Q      Max 
-109.270  -38.209   -4.924   23.890  217.590 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  -1347.87     141.53  -9.524 5.24e-15 ***
I(log(lote))    61.47      12.30   4.998 3.12e-06 ***
I(log(area))   225.44      29.87   7.547 4.87e-11 ***
quartos         19.23       8.85   2.172   0.0326 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 59.3 on 84 degrees of freedom
Multiple R-squared:  0.6782,    Adjusted R-squared:  0.6667 
F-statistic:    59 on 3 and 84 DF,  p-value: < 2.2e-16

t test of coefficients:

               Estimate Std. Error t value  Pr(>|t|)    
(Intercept)  -1347.8685   201.8352 -6.6781 2.463e-09 ***
I(log(lote))    61.4686    18.7275  3.2823  0.001502 ** 
I(log(area))   225.4347    33.4889  6.7316 1.940e-09 ***
quartos         19.2266     7.8263  2.4567  0.016082 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  • As diferenças entre os desvios-padrão são menos significativas
  • Não há diferenças quanto à significância das variáveis

Exercício 8.2 🖥️

  1. O que é que este exemplo sugere sobre a heteroscedasticidade e a transformação usada na variável dependente?


A heteroscedasticidade no modelo logarítmico deverá ser menos importante, pois a diferença entre os desvios-padrão dos mínimos quadrados e dos mínimos quadrados robustos é menos importante