Desigualdades de gênero e raça no mercado de trabalho
Por: YdecRupolo • 18/10/2018 • 4.285 Palavras (18 Páginas) • 286 Visualizações
...
A pesquisa quantitativa utiliza “instrumentos específicos, capazes de estabelecer relações e causas, levando em conta as quantidades” (GIL, 2002, p.68). Portanto, este trabalho pode ser classificado como quantitativo, pois a partir de uma base de dados será aplicado um modelo de regressão linear múltipla para comparar os rendimentos médios entre homens e mulheres, brancos e pretos; bem como verificar a influência de algumas variáveis sobre o objeto analisado.
A coleta de dados foi realizada nas tabelas do Retrato das Desigualdades de Gênero e Raça disponibilizadas pelo Instituto de Pesquisa Econômica Aplicada (IPEA), com o intuito de apresentar as estatísticas descritivas que possam compor um retrato atual da situação de brasileiros e brasileiras sob a perspectiva das desigualdades de gênero e raça. Além disso, como variáveis explicativas foram escolhidas a escolaridade (E), a taxa de desocupação (TD) e o Produto Interno Bruto (PIB).
Dessa forma, como o problema envolve mais de uma variável deve-se utilizar o modelo de regressão linear múltipla que permite trabalhar com um número maior de variáveis explicativas simultaneamente.
Corrar, Theóphilo e Bergmann (2010) sugerem que, a princípio, se considere a situação de existência de uma relação linear entre cada uma das variáveis explicativas e a variável independente. Assim, para as três variáveis explicativas e i observações, o Modelo de Regressão Linear Múltipla (RLM) é expresso pela seguinte equação:
lnRit = A1 + β1lnEit + β2lnPIBit + β3lnTDit + uit
Em que: A = intercepto de Y;
Ln = logaritmo neperiano
βi = coeficiente angulares;
U = erro aleatório em Y para a observação i;
Além disso, como na Regressão Linear Simples, estimam-se os coeficientes populacionais βi (i=1, 2,..., k) a partir dos valores de bi, utilizando o Método dos Mínimos Quadrados, segundo Corrar, Theóphilo e Bergmann (2010). Cada coeficiente, βi, representa a variação provocada no Rendimento pelo aumento de uma unidade de uma das variáveis explicativas, consideradas constantes todas as outras variáveis independentes.
Para Almeida (2014), observar a significância dos resultados significa definir as somas de quadrados e a partir destes resultados construírem o quadro da análise de variância da regressão, usada para calcular a estatística F, e verificar a validade do modelo estimado.
Segundo Moraes (2010), através da estatística F pode-se testar as hipóteses, ou seja, definimos o teste F para verificar realmente se existe uma relação linear entre o Rendimento e uma ou mais variáveis independentes (escolaridade, produto interno bruto e a taxa de desocupação).
- Ho = as variáveis não explicam -lnRit
- Ha = as variáveis explicam -lnRit
Já o teste t, de acordo com Almeida (2014), deve ser utilizado para medir a significância das variáveis do modelo, ou seja, através deste teste se pode aferir quanto à existência de alguma variável significativa no modelo. Depois de realizado o teste de hipótese, se Tcalculado for maior que Ttabelado, rejeita-se Ho e conclui-se que, ao nível α de significância, a variável é importante para explicar a regressão linear. Caso contrário, a variável não influencia no modelo de RLM.
Segundo Corrar, Theóphilo e Bergmann (2010, p. 114),
é recomendado que na regressão múltipla se utilize o coeficiente de determinação ajustado (R²ajustado) em vez do coeficiente R². Isso porque, quando uma variável explicativa é adicionada ao modelo, o coeficiente de determinação R² tem seu valor majorado, ou pelo menos mantido, mesmo que essa variável não seja estatisticamente significativa. O coeficiente de determinação ajustado compensa os efeitos desses aumentos indevidos no valor do coeficiente R².
A fórmula do coeficiente R²ajustado é a seguinte:
R²ajustado = [pic 2]
Em que: n = número de observações;
k = número de coeficientes da equação de regressão.
Para verificar se existe regressão linear entre as variáveis do modelo é necessário que seja feito um teste de hipóteses, através do teste F, que é:
Fteste = [pic 3]
Utilizado para testar as hipóteses a seguir:
- Ho = as variáveis não explicam -lnRit
- Ha = as variáveis explicam -lnRit
De acordo com Almeida (2014), caso o Fcalculado seja maior que o Ftabelado, onde F tem distribuição F de Snedecor com p-1 e n-p graus de liberdade, deve-se rejeitar Ho e afirmar, ao nível α de significância, com pelo menos um βj ≠ 0, que existe regressão linear entre as variáveis do modelo.
Para auxiliar na aplicação do modelo de Regressão Linear Múltipla será utilizado o software STATA 14.0 Statistics/Data Analysis Special Edition.
- RESULTADOS E DISCUSSÕES
- ANÁLISE AO NÍVEL NACIONAL
A tabela a seguir mostra-se os resultados da estimativa para explicar variações no rendimento médio masculino no âmbito do país em geral.
Tabela 1: Resultados do modelo de rendimento médio em relação ao Brasil
Variáveis
Coeficientes estimados
Rendimento Masculinoit
Escolaridadeit
-2.39
0.84
Taxa de Desocupaçãoit
-0.22
0.11
PIBit
0.59
0.21
Constante
4.79
0.44
Nº Obs.
R²
...