Trabalho econometria
Por: Jose.Nascimento • 4/5/2018 • 4.252 Palavras (18 Páginas) • 309 Visualizações
...
a. Qual a importância desse quadro para sua análise?
Este quadro serve para organizar, resumir e descrever as variáveis quantitativas, de forma que seja possível observar se há alguma coisa estranha nas informações da base de dados. Com isso, podemos levantar as primeiras hipóteses a serem testadas a respeito da população e ter, ao invés de uma base de dados enorme, um resumo com as suas principais características de posição e dispersão.
b. Existe alguma coisa estranha nas informações deste quadro?
Três pontos chamam a atenção nas estatísticas descritivas: os mínimos para as variáveis “bolsafamilia”, “partido” e “urbanizacao”.
O valor mínimo de para a variável “bolsafamilia” é pouco provável, porém possível para dois casos extremos, que é o caso de realmente o município possuir apenas uma família no perfil para o programa ou no caso em que a cobertura desse programa no município ser incompleta.
Para o mínimo da variável “partido” o valor é extremamente baixo e, se confirmado isso, é provável que haja um controle extremamente grande de um partido sobre uma cidade, o que, em tese, não é muito desejável, por que ou os eleitores votam nesses candidatos ou simplesmente não votam o que no final das contas iria elegê-los também.
A urbanização mínima indica que em determinada/s cidade/s não há domicílios na área urbana, fato a ser constatado, nesse caso a cidade não teria percentualmente nenhuma casa na zona urbana? Esse e os outros resultados acima estão passíveis de serem questionados.
c. Teria sentido pedir o mesmo quadro para as variáveis qualitativas da base de dados?
Não teria sentido pedir o mesmo quadro para as variáveis qualitativas da base de dados, pois, por definição, elas são variáveis que não podem ser utilizadas para cálculos, o que impediria o cálculo de todas as informações do quadro solicitado. (O GRETL até faria os cálculos, dado a base de dados ter sido ajustada atribuindo-se valores numéricos para os nomes das variáveis, porém não faria sentido analisar as informações da estatística descritiva aqui solicitada).
2. Trace um histograma das variáveis Matrícula, candidatas e urbanizacao. Teste se estas variáveis seguem uma distribuição normal.
Histograma da variável “matricula”
[pic 1]
Dado ser “um teste comparativamente simples para estudar a forma da função de densidade de probabilidade de uma variável aleatória” (GUJARATI, 2006, p. 150), utilizarei do gráfico de probabilidade normal. Como podemos ver no gráfico acima, a variável Matricula segue uma distribuição normal, dado o ajuste a curva da distribuição normal.
Histograma da variável “candidatas”
[pic 2]
Se compararmos o histograma da variável “candidatas”, percebemos que ela também segue a distribuição normal, apesar de estar ligeiramente mais fora da curva de normalidade se comparada a variável matrícula.
Histograma da variável “urbanizacao”
[pic 3]
A variável “urbanizacao” também segue distribuição normal, dado estar visualmente dentro da cursa de normalidade.
3. Obtenha a média das variáveis da porcentagem de candidatas e Matrícula para cada região do país.
Utilizando a restrição baseada em critérios, criando variáveis dummies para a variável “região” foi obtida as médias condicionais das variáveis “candidatas” e “matricula” para cada uma das regiões brasileiras, conforme tabela abaixo:
Médias condicionais por região
Região
Média Condicional da variável “Candidatas” (%).
Média Condicional da variável “matricula”
Norte
32,051
113779
Norte
32,362
113779
Sudeste
32,866
113779
Sul
32,411
113779
Centro-Oeste
32,170
113779
4. Trace gráficos de dispersão entre a porcentagem de candidatos do sexo feminino e as variáveis de idade média dos candidatos, a taxa de urbanização, a porcentagem de partidos de esquerda e a porcentagem de partidos de direita. Use a taxa de candidatos sempre no eixo Y. Dica: no Gretl, use a opção de Gráficos Múltiplos.
Dispersão entre as variáveis “candidatas” e “urbanizacao”/ “idade_candi” / “esquerda” / “direita”
[pic 4]
a. Com base nestes resultados, trace hipóteses sobre a relação entre a participação feminina nas eleições e as variáveis analisadas nos gráficos.
Dos gráficos de dispersão acima não é possível verificar graficamente se há uma relação e qual o sentido desta com a variável “candidatas”. É possível que haja relação significativa a ser constatada futuramente no MQO, porém com coeficientes pequenos.
PARTE 3: ESTIMAÇÕES PRELIMINARES
1. Usando a porcentagem de candidatos do sexo feminino disputando uma vaga de vereador nos municípios como variável dependente, estime os seguintes modelos e comente os resultados (interpretar coeficientes, significância, R , etc).
a. Candidatas = f(matricula, idade_candi)
Modelo 1: MQO, usando as observações 1-3500
Variável dependente: candidatas
Coeficiente
Erro Padrão
...