Centro Federal de Educação Tecnológica Celso Suckow da Fonseca
Por: Ednelso245 • 1/6/2018 • 1.010 Palavras (5 Páginas) • 346 Visualizações
...
> modelo
> summary(modelo)
Call:
lm(formula = hmediaanual ~ desemprego + partime + autoemprego)
Residuals:
Min 1Q Median 3Q Max
-201.11 -75.02 -27.63 93.12 188.25
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1871.654 123.137 15.200 1.73e-13 ***
desemprego -22.255 9.780 -2.276 0.032499 *
partime -15.374 3.575 -4.301 0.000266 ***
autoemprego 16.322 3.267 4.995 4.72e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 117.7 on 23 degrees of freedom
Multiple R-squared: 0.7249, Adjusted R-squared: 0.689
F-statistic: 20.2 on 3 and 23 DF, p-value: 1.223e-06
Com 5% de nível de significância, o p_valor é muito alto na maioria dos casos. Não rejeitamos H0, logo a maioria dos coeficientes podem ser 0, exceto o desemprego. Concluindo que nosso parâmetro significativo é o “desemprego”, podemos dizer que quando nossa variável Xi1 aumenta em uma unidade, nosso Y diminuirá em 22,255.
d. Utilizando a ANOVA
> anova(modelo)
Analysis of Variance Table
Response: hmediaanual
Df Sum Sq Mean Sq F value Pr(>F)
desemprego 1 25099 25099 1.8127 0.1913
partime 1 468507 468507 33.8361 6.303e-06 ***
autoemprego 1 345529 345529 24.9545 4.717e-05 ***
Residuals 23 318467 13846
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Mais uma vez, a variável “desemprego” é a maior.
e. Pelo intervalo de confiança:
> confint(modelo)
2.5 % 97.5 %
(Intercept) 1616.924939 2126.383391
desemprego -42.486331 -2.024569
partime -22.768837 -7.978813
autoemprego 9.563072 23.081463
Os intervalos dos outros parâmetros não estão incluindo o 0, isso indica que em algum momento, esses parâmetros assumem o valor 0.
f. Intervalo de confiança para a resposta média:
> xo
> predict(modelo,xo,interval = "confidence")
fit lwr upr
1 1560.387 1477.299 1643.474
g. Previsão de novas observações:
> predict(modelo,xo,interval = "prediction")
fit lwr upr
1 1560.387 1303.177 1817.597
Nosso intervalo de previsão é mais largo que o intervalo de confiança para a resposta média
h. Verificação de adequação ao modelo:
> qqnorm(residuals(modelo),xlab = "",ylab = "resíduos",main="Gráfico de probabilidade normal dos resíduos")
> qqline(residuals(modelo),col="red")
[pic 2]
Podemos notar que o modelo não segue uma normal.
i. Histograma
> hist(residuals(modelo),main="Histograma",ylab="Densidade",xlab = "Resíduos")
[pic 3]
Pelo histograma também é fácil verificar que os resíduos não seguem uma normal.
j. Dispersão dos resíduos
> plot(fitted.values(modelo),residuals(modelo),ylab="Resíduos",xlab="Valores Ajustados da
+ Resistência", pch=20,col=2,main="Resíduos xValores Ajustados")
> abline(0,0,lty=3)
[pic 4]
Pelo gráfico, notamos que há um aumento na dispersão dos resíduos.
k. Resíduos x Ordem
> plot(residuals(modelo), pch=8, type="b",
+ col="red", main="Resíduos x
+ Ordem",ylab="Resíduos",xlab="Ordem
+ das observações")
[pic 5]
Vemos que os resíduos não seguem nenhum padrão e apresentam aleatoriedade.
l. Observações influentes
> plot(cooks.distance(modelo))
> max(cooks.distance(modelo))
[1] 0.5497627
[pic 6]
m. Resumindo os gráficos:
> par(mfrow=c(2,2))
> qqnorm(residuals(modelo),datax=T,pch=20,main="Gráfico de
+
...