Econometria I

Aula 29

Ricardo Gouveia-Mendes


Licenciatura em Economia
2.º Semestre 2023-24

Variáveis Explicativas Qualitativas

Variáveis Explicativas Binárias

Introdução

  • Até aqui usámos sempre como regressores variáveis quantitativas
    (ex.: rendimento, idade, peso)
  • Mas pode haver interesse em usar também variáveis qualitativas
    (ex.: região, sexo, religião)
  • A informação qualitativa é sempre introduzida no modelo usando variáveis binárias (dummy ou dummies)
  • Trata-se de variáveis que só podem assumir dois valores: 0 e 1

Variáveis Explicativas Binárias

Exemplo

  • Imaginemos que queremos estudar os determinantes do valor do salário \[ salario = \beta_0 + \beta_1 masc + \beta_2 fem + \beta_3 norte + \beta_4 centro + \beta_5 sul + u \]
  • Será que conseguimos estimar o modelo? 🤔 Não. Multicolineariedade:
    • \(masc+fem=1\)
    • \(norte+centro+sul=1\)
  • Haverá solução? 🤔 Sim! Eliminar alguma das variáveis em cada conjunto: \[ salario = \beta_0 + \beta_1 masc + \beta_2 norte + \beta_3 centro + u \]

Variáveis Explicativas Binárias

Interpretação dos Parâmetros

  • Com variáveis qualitativas, os parâmetros mudam de significado
  • Passam a representar a diferença média no valor da variável dependente entre grupos de indivíduos: o grupo da variável associada ao parâmetro e o grupo associado à variável omitida
  • No exemplo anterior:
    • Se \(masc=1\) (homem): \(\widehat{salario} = \hat{\beta}_0 + \hat{\beta}_1\)
    • Se \(masc=0\) (mulher): \(\widehat{salario} = \hat{\beta}_0\)

Variáveis de Interação

Introdução

  • A informação qualitativa pode ainda ser usada na construção de variáveis de interação
  • Trata-se do produto de uma variável binária por outra variável explicativa (quantitativa ou binária)
  • Permitem analisar o a diferença no efeito de uma variável quantitativa por grupos ou o efeito de um grupo formado com vários critérios qualitativos

Variáveis de Interação

Exemplo

\[ salario = \beta_0 + \beta_1 masc + \beta_2 educ + \beta_3 (masc \times educ) + u \]

  • Podemos analisar efeito da educação por grupos:
    • Homem (\(masc=1\)): \(\widehat{salario} = \hat{\beta}_0 + \hat{\beta}_1 + \left(\hat{\beta}_2 + \hat{\beta}_3\right) educ\)
    • Mulher (\(masc=0\)): \(\widehat{salario} = \hat{\beta}_0 + \hat{\beta}_2 educ\)
  • \(\beta_0\): valor médio do salário de uma mulher sem escolaridade
  • \(\beta_1\): diferença no valor médio do salário entre um homem e uma mulher sem escolaridade

Variáveis de Interação

Exemplo

\[ salario = \beta_0 + \beta_1 masc + \beta_2 educ + \beta_3 (masc \times educ) + u \]

  • Podemos analisar efeito da educação por grupos:
    • Homem (\(masc=1\)): \(\widehat{salario} = \hat{\beta}_0 + \hat{\beta}_1 + \left(\hat{\beta}_2 + \hat{\beta}_3\right) educ\)
    • Mulher (\(masc=0\)): \(\widehat{salario} = \hat{\beta}_0 + \hat{\beta}_2 educ\)
  • \(\beta_2\): efeito de um ano adicional de escolaridade no valor médio do salário de uma mulher
  • \(\beta_3\): diferença no efeito de um ano adicional de escolaridade no valor médio do salário entre um homem e uma mulher

Exercícios

Exercício 7.1

Pretende-se estudar as diferenças ao nível do salário (\(salario\)) mensal entre quatro grupos de indivíduos: homens licenciados (\(HL\)), mulheres licenciadas (\(ML\)), homens não licenciados (\(HNL\)) e mulheres não licenciadas (\(MNL\)). A partir de uma mostra de 498 observações, obteve-se o seguinte modelo estimado:

\[ \widehat{\ln(salario)} = \underset{(0.100)}{0.321} + \underset{(0.055)}{0.213} HL + \underset{(0.058)}{0.148} ML - \underset{(0.054)}{0.110} MNL - \underset{(0.070)}{0.079} casado + \underset{(0.006)}{0.027} exper \]

onde \(HL\), \(ML\) e \(MNL\) são variáveis dummy que indicam se o indivíduo pertence ao grupo referido (=1) ou não (=0), \(casado\) é outra variável dummy que indica se o indivíduo é casado (=1) ou não (=0) e \(exper\) representa o número de anos de experiência profissional.

Exercício 7.1

\[ \widehat{\ln(salario)} = \underset{(0.100)}{0.321} + \underset{(0.055)}{0.213} HL + \underset{(0.058)}{0.148} ML - \underset{(0.054)}{0.110} MNL - \underset{(0.070)}{0.079} casado + \underset{(0.006)}{0.027} exper \]

  1. Interprete os coeficientes estimados.
  • \(\hat{\beta}_1=0.213\): o salário de um homem licenciado é 21.3% superior ao de um homem não licenciado
  • \(\hat{\beta}_2=0.148\): o salário de uma mulher licenciada é 14.8% superior ao de um homem não licenciado
  • \(\hat{\beta}_3=-0.110\): o salário de uma mulher não licenciado é 11.0% inferior ao de um homem não licenciado

Exercício 7.1

\[ \widehat{\ln(salario)} = \underset{(0.100)}{0.321} + \underset{(0.055)}{0.213} HL + \underset{(0.058)}{0.148} ML - \underset{(0.054)}{0.110} MNL - \underset{(0.070)}{0.079} casado + \underset{(0.006)}{0.027} exper \]

  1. Interprete os coeficientes estimados.
  • \(\hat{\beta}_4=-0.079\): o salário de um indivíduo casado é 7.9% inferior ao de um indivíduo solteiro
  • \(\hat{\beta}_5=0.027\): por cada ano de experiência adicional, o salário aumenta 2.7%
  • \(\hat{\beta}_0=0.321\): logaritmo do salário de um homem não licenciado, solteiro, ao iniciar a vida profissional

Exercício 7.1

  1. Indique como poderia testar se existe discriminação sexual no mercado dos trabalhadores licenciados.

Através do seguinte teste \(t\):

\[ \begin{align} H_0: \quad &\beta_1=\beta_2 \Leftrightarrow \\ &\beta_1-\beta_2\equiv \theta =0 \\ H_1: \quad &\text{ Não }H_0 \end{align} \] \[ t=\frac{\hat{\theta}}{\hat{\sigma}_{\hat{\theta}}} \]

Mas não dispomos de dados para estimar \(\hat{\sigma}_{\hat{\theta}}\).

  1. Usando um nível de significância de 5%, verifique se existe discriminação sexual no mercado dos trabalhadores não licenciados.

\[ \begin{align} H_0: \quad &\beta_3 = 0 \\ H_1: \quad &\beta_3 \neq 0 \end{align} \] \[ \begin{align} t=\frac{\hat{\beta}_3}{\hat{\sigma}_{\hat{\beta}_3}} &= \left| \frac{-0.110}{0.054} \right| =\\ &= 2.037 > 1.96 = t^{0.025}_{498-6} \end{align} \]

Rejeita-se \(H_0\). Há evidência de discriminação sexual no mercado dos trabalhadores não licenciados.

Exercício 7.1

  1. Comente a seguinte afirmação: “Um trabalhador do sexo masculino, casado, com o 12.º ano de escolaridade ganha significativamente menos que um trabalhador do mesmo sexo e com a mesma experiência, solteiro, com a 4.ª classe”.
  • Recordemos o modelo: \[ \widehat{\ln(salario)} = \underset{(0.100)}{0.321} + \underset{(0.055)}{0.213} HL + \underset{(0.058)}{0.148} ML - \underset{(0.054)}{0.110} MNL - \underset{(0.070)}{0.079} casado + \underset{(0.006)}{0.027} exper \]
  • Pretendemos testar se o efeito da variável \(casado\) é significativamente menor que zero

Exercício 7.1



\[ \begin{align} H_0: \quad &\beta_4 \geq 0 \\ H_1: \quad &\beta_4 < 0 \end{align} \] \[ \begin{align} t=\frac{\hat{\beta}_4}{\hat{\sigma}_{\hat{\beta}_4}} &= \frac{-0.079}{0.070} = -1.1286 > -1.645 = t^{0.05}_{498-6} \end{align} \]

Não se rejeita \(H_0\). Não há evidência de que a afirmação seja verdadeira.