A Inferência Estatística
Por: Hugo.bassi • 31/10/2018 • 1.237 Palavras (5 Páginas) • 249 Visualizações
...
da i-ésima classe. Quanto mais dados tivermos em cada classe, mais alto deve ser o retângulo.Com essa convenção, a área total do histograma será igual a um.
Ramo-e-folhas
Um procedimento alternativo para resumir um conjunto de valores, com o objetivo de seobter uma idéia da forma de sua distribuição, é o ramo-e-folhas. Uma vantagem deste diagramasobre o histograma é que não perdemos (ou perdemos pouca) informação sobre os dados em si.
Não existe uma regra fixa para construir o ramo-e-folhas, mas a idéia básica é dividir cada observação em duas partes: a primeira (o ramo) é colocada à esquerda de uma linha vertical, a segunda (a folha) é colocada à direita.
A escolha do número de linhas do ramo-e-folhas é equivalente à escolha do número de classes de um histograma. Um número pequeno de linhas (ou de classes) enfatiza a parte M da relação (1.1), enquanto um número grande de linhas (ou de classes) enfatiza a parte R.
CAP 3- medidas-resumo
Medidas de posição
Muitas vezes, queremos resumir ainda mais estes dados, apresentando um ou alguns valores que sejam representativos da série toda. Quando usamos um só valor,obtemos uma redução drástica dos dados. Usualmente, emprega-se uma das seguintes medidas de posição (ou localização) central: média, mediana ou moda.
A Moda é definida como a realização mais freqüente do conjunto de valores observados
A mediana é a realização que ocupa a posição central da série de observações, quandoestão ordenadas em ordem crescente.
A média aritmética é a soma das observações dividida pelo número delas.
A media so pode ser calculada para variáveis quantitativas
-Formulas de media- pg
Medidas de dispersão
medidas que sumarizem a variabilidade de um con- junto de observações e que nos permita, por exemplo, comparar conjuntos diferentes devalores, como os dados acima, segundo algum critério estabelecido.Um critério freqüentemente usado para tal fim é aquele que mede a dispersão dosdados em torno de sua média, e duas medidas são as mais usadas: desvio médio e variância.O princípio básico é analisar os desvios das observações em relação à média dessasobservações
o desvio padrão , que é definido como a raiz quadrada positiva da variância.
Ambas as medidas de dispersão (dm e dp) indicam em média qual será o “erro” (desvio)cometido ao tentar substituir cada observação pela medida resumo do conjunto de dados(no caso, a média)
Tanto a variância como o desvio médio são medidas de dispersão calculadas em rela-ção à média das observações. Assim como a média, a variância (ou o desvio padrão) é umaboa medida se a distribuição dos dados for aproximadamente normal. O desvio médio émais resistente que o desvio padrão, no sentido a ser estudado na seção seguinte.Poderíamos considerar uma medida que seja calculada em relação à mediana. O desvioabsoluto mediano é um exemplo e é mais resistente que o desvio padrão
Quantis empíricos
Tanto a média como o desvio padrão podem não ser medidas adequadas para represen-tar um conjunto de dados, pois:(a) são afetados, de forma exagerada, por valores extremos;(b) apenas com estes dois valores não temos idéia da simetria ou assimetria da distribuição dos dados.Para contornar esses fatos, outras medidas têm de ser consideradas.Vimos que a mediana é um valor que deixa metade dos dados abaixo dela e meta de acima. De modo geral, podemos definir uma medida, chamada quantil de ordem p ou p-quantil, indicada por q(p), onde p é uma proporção qualquer,0 < p < 1, tal que 100p% das observações sejam menores do que q(p).
-nomes de alguns quantis-
Se os dados estiverem agrupados em classes, podemos obter os quantios empíricos usando o histograma
uma medida de dispersão alternativa ao desvio padrão é a distância interquartil,definida como a diferença entre o terceiro e primeiro quartis
Dizemos que uma medida de localização ou dispersão é resistente quando forpouco afetada por mudanças de uma pequena porção dos dados. A mediana é umamedida resistente, ao passo que a média não o é.O desvio padrão também não é uma medida resistente
Box Plots
Pg 65
...