Econometria I

Aula 30

Ricardo Gouveia-Mendes


Licenciatura em Economia
2.º Semestre 2023-24

Testes para a Mudança Estrutural

Testes de Chow

Princípios

  • Por vezes a nossa análise exige averiguar se há modificações na relação entre as variáveis entre submostras da amostra
  • Se os resultados da estimação forem diferentes entre duas subamostras diz-se haver uma quebra de estrutura ou mudança estrutural
  • O teste para detetar mudanças estruturais é o teste de Chow, que tem duas versões: a original e a flexível

Testes de Chow

Versão original

\[ Y = \beta_0 + \beta_1 X_1 +\dots +\beta_k X_k + u \]

  1. Estimar o modelo com a amostra inteira e guardar a \(SQR\)
  2. Estimar o modelo com a subamostra do grupo 1 e guardar a \(SQR_1\)
  3. Estimar o modelo com a subamostra do grupo 2 e guardar a \(SQR_2\)
  4. Realizar o teste:

\[ H_0: \text{ Não existe quebra de estrutura} \qquad H_1: \text{ Existe quebra de estrutura} \]

\[ F = \frac{SQR - (SQR_1 + SQR_2)}{SQR_1 + SQR_2}\frac{N-2p}{p} \sim F^p_{N-2p} \]

Testes de Chow

Versão flexível

  1. Usar uma variável binária \(D\) para identificar os indivíduos de cada grupo (\(D=1\) para o grupo 1 e \(D=0\) para o grupo 2)
  2. Estimar o modelo incluindo variáveis de interação com \(D\) para todas as variáveis explicativas \[ Y = \beta_0 + \beta_1 X_1 +\dots +\beta_k X_k \textcolor{red}{+ \gamma_0 D + \gamma_1 D\, X_1 +\dots +\gamma_k D\, X_k} + u \]
  3. Realizar o teste: \[ H_0: \gamma_0 = \dots = \gamma_k = 0 \qquad H_1:\text{ Não } H_0 \text{. Existe quebra de estrutura} \]

\[ F = \frac{R^2 - R^2_{O}}{1 - R^2}\frac{N-2p}{k} \sim F^p_{N-2p} \qquad LM = N\times R^2_{\hat{v}} \,\dot\sim\, \chi^2_{p} \]

Exercícios

Exercício 7.3 🖥️

Os dados em SONO.DTA referem-se ao modelo: \[ sono = \beta_0 + \beta_1 trab + \beta_2 educ + \beta_3 idade + \beta_4 idade^2 + \beta_5 filpeq + u \] com \(filpeq = 1\) se tem filhos pequenos, e \(masc = 1\) se é do sexo masculino.

  1. Estime a equação separadamente para homens e mulheres. Há diferenças substanciais?

Homens


Call:
lm(formula = sono ~ trab + educ + idade + I(idade^2) + filpeq, 
    data = df_m)

Residuals:
     Min       1Q   Median       3Q      Max 
-1793.96  -216.05     7.93   244.57  1141.21 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) 3648.20826  310.03933  11.767  < 2e-16 ***
trab          -0.18212    0.02449  -7.438 6.45e-13 ***
educ         -13.05238    7.41422  -1.760   0.0791 .  
idade          7.15659   14.32037   0.500   0.6175    
I(idade^2)    -0.04477    0.16841  -0.266   0.7905    
filpeq        60.38021   59.02278   1.023   0.3069    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 402.3 on 394 degrees of freedom
Multiple R-squared:  0.1562,    Adjusted R-squared:  0.1455 
F-statistic: 14.59 on 5 and 394 DF,  p-value: 3.952e-13

Exercício 7.3 🖥️

Mulheres


Call:
lm(formula = sono ~ trab + educ + idade + I(idade^2) + filpeq, 
    data = df_w)

Residuals:
     Min       1Q   Median       3Q      Max 
-2485.02  -244.18     7.24   270.64  1376.91 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) 4238.72933  384.89226  11.013  < 2e-16 ***
trab          -0.13995    0.02766  -5.060 7.33e-07 ***
educ         -10.20514    9.58885  -1.064    0.288    
idade        -30.35657   18.53091  -1.638    0.102    
I(idade^2)     0.36794    0.22334   1.647    0.101    
filpeq      -118.28256   93.18757  -1.269    0.205    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 437 on 300 degrees of freedom
Multiple R-squared:  0.09768,   Adjusted R-squared:  0.08264 
F-statistic: 6.495 on 5 and 300 DF,  p-value: 9.42e-06

Logo, existem algumas diferenças ao nível do sinal dos coeficientes (\(idade\), \(idade^2\), \(filpeq\)), que podem ou não ser significativas.

Exercício 7.3 🖥️

  1. Estime o modelo

\[ \begin{align} sono = &\beta_0 + \beta_1 trab + \beta_2 educ + \beta_3 idade + \beta_4 idade^2 + \beta_5 filpeq +\\ &+\gamma_0 masc + \gamma_1 masc\, trab + \gamma_2 masc\, educ +\\ &+ \gamma_3 masc\, idade + \gamma_4 masc\, idade^2 + \gamma_5 masc\, filpeq + v \end{align} \] e compare os resultados obtidos com os da alínea anterior.


Call:
lm(formula = sono ~ trab + educ + idade + I(idade^2) + filpeq + 
    masc + I(masc * trab) + I(masc * educ) + I(masc * idade) + 
    I(masc * idade^2) + I(masc * filpeq), data = df)

Residuals:
     Min       1Q   Median       3Q      Max 
-2485.02  -226.74     7.93   257.77  1376.91 

Coefficients:
                    Estimate Std. Error t value Pr(>|t|)    
(Intercept)       4238.72933  367.85193  11.523  < 2e-16 ***
trab                -0.13995    0.02643  -5.294 1.61e-07 ***
educ               -10.20514    9.16432  -1.114   0.2658    
idade              -30.35657   17.71049  -1.714   0.0870 .  
I(idade^2)           0.36794    0.21345   1.724   0.0852 .  
filpeq            -118.28256   89.06187  -1.328   0.1846    
masc              -590.52107  488.79159  -1.208   0.2274    
I(masc * trab)      -0.04217    0.03667  -1.150   0.2506    
I(masc * educ)      -2.84724   11.96795  -0.238   0.8120    
I(masc * idade)     37.51316   23.12332   1.622   0.1052    
I(masc * idade^2)   -0.41271    0.27591  -1.496   0.1352    
I(masc * filpeq)   178.66277  108.10510   1.653   0.0988 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 417.6 on 694 degrees of freedom
Multiple R-squared:  0.1306,    Adjusted R-squared:  0.1168 
F-statistic: 9.479 on 11 and 694 DF,  p-value: 4.947e-16

As metodologias são equivalentes.

Exercício 7.3 🖥️

  1. Faça o teste de Chow para a igualdade dos parâmetros nas equações para ambos os sexos de duas maneiras diferentes (nível de significância: 10%).


Versão original

\[ H_0: \beta_0^H=\beta_0^M, \dots, \beta_5^H=\beta_5^M \qquad H_1: \text{ Não }H_o \] \[ F=\frac{SQR - (SQR_H + SQR_M)}{SQR_H + SQR_M}\frac{N-2p}{p} = 2.1164 \quad > 1.7826 = F^{6}_{694} \]

Exercício 7.3 🖥️


Versão flexível

\[ H_0: \gamma_0=\gamma_1= \dots =\gamma_5=0 \qquad H_1: \text{ Não }H_o \] \[ F=\frac{R^2 - R^2_O}{1-R^2}\frac{N-2p}{p} = 2.1164 \quad > 1.7826 = F^{6}_{694} \]

Logo, rejeita-se \(H_0\). Há evidência de diferenças significativas na explicação do sono dos homens e das mulheres.

Exercício 7.3 🖥️

  1. Permita agora diferenças no termo independente para homens e mulheres, e teste se os termos de interação que envolvem \(masc\) são conjuntamente significativos.


\[ H_0: \gamma_1= \dots =\gamma_5=0 \qquad H_1: \text{ Não }H_o \]

  • Neste caso, só podemos usar a versão flexível do teste
  • Para determinar o \(R^2\) do modelo restrito temos que o estimar

Exercício 7.3 🖥️




Call:
lm(formula = sono ~ trab + educ + idade + I(idade^2) + filpeq + 
    masc, data = df)

Residuals:
     Min       1Q   Median       3Q      Max 
-2378.00  -243.29     6.73   259.24  1350.19 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) 3840.85207  239.41393  16.043   <2e-16 ***
trab          -0.16342    0.01816  -8.997   <2e-16 ***
educ         -11.71327    5.87195  -1.995   0.0465 *  
idade         -8.69740   11.32909  -0.768   0.4429    
I(idade^2)     0.12844    0.13467   0.954   0.3405    
filpeq        -0.02280   50.27641   0.000   0.9996    
masc          87.75455   34.66794   2.531   0.0116 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 418 on 699 degrees of freedom
Multiple R-squared:  0.1228,    Adjusted R-squared:  0.1152 
F-statistic:  16.3 on 6 and 699 DF,  p-value: < 2.2e-16

Exercício 7.3 🖥️



\[ H_0: \gamma_1= \dots =\gamma_5=0 \qquad H_1: \text{ Não }H_o \] \[ F=\frac{R^2 - R^2_*}{1-R^2}\frac{N-2p}{q} = 1.2723 \quad > 1.8556 = F^{5}_{694} \]

Exercício 7.3 🖥️

  1. Dados os resultados de c) e d), qual seria o seu modelo final?



\[ sono = \beta_0 + \beta_1 trab + \beta_2 educ + \beta_3 idade + \beta_4 idade^2 + \beta_5 filpeq + \gamma_0 masc + u \]

Exercício 7.3 🖥️

  1. Use o modelo escolhido em e) para prever quanto dorme em média por noite uma mulher de 30 anos, com o 12.º ano de escolaridade, que trabalha 8 horas por dia (de 2.ª a 6.ª) e tem 2 filhos pequenos. Comente.


Por substituição direta no modelo estimado, concluímos que uma mulher de 30 anos, com o 12.º ano de escolaridade, que trabalha 8 horas por dia (de 2.ª a 6.ª) e tem 2 filhos pequenos dorme, em média, 3162.706 min por semana ou 451.8151 min por noite, o que é equivalente 52.7118 horas por semana ou 7.5303 horas por noite.