Teste t de Student
Por: kamys17 • 25/2/2018 • 3.726 Palavras (15 Páginas) • 419 Visualizações
...
Perceba que, na distribuição t de Student, valores muito baixos ou muito altos tem menor probabilidade de ocorrer, indicando que é menos provável que a média de uma amostra apresente valores muito distantes da média da população.
O formato da distribuição t de Student depende do número de graus de liberdade. Quanto maior o número de graus de liberdade, mais "concentrada" é a distribuição. Para valores muito grandes de graus de liberdade, a distribuição t de Student se aproxima da distribuição normal.
O Teste t consiste em formular uma hipótese nula e consequentemente uma hipótese alternativa, calcular o valor de [pic 10]conforme a fórmula apropriada (abaixo) e aplicá-lo à função densidade de probabilidade da distribuição t de Student medindo o tamanho da área abaixo dessa função para valores maiores ou iguais a [pic 11]. Essa área representa a probabilidade da média dessa(s) amostra(s) em questão ter(em) apresentado o(s) valor(es) observado(s) ou algo mais extremo. Se a probabilidade desse resultado ter ocorrido for muito pequena, podemos concluir que o resultado observado é estatisticamente relevante. Essa probabilidade também é chamada de p-valor ou valor p. Consequentemente, o nível de confiança [pic 12]é igual a 1 - p-valor.
Normalmente é usado um "ponto de corte" para o p-valor ou para o nível de confiança para definir se a hipótese nula deve ser rejeitada ou não. Se o p-valor for menor que esse "ponto de corte", a hipótese nula é rejeitada. Caso contrário, a hipótese nula não é rejeitada.
É comum que sejam usados os "pontos de corte" para p-valor 0,1%, 0,5%, 1%, 2% ou 5%, fazendo com que os níveis de confiança sejam, respectivamente, 99,9%, 99,5%, 99%, 98% ou 95%. Caso seja usado o p-valor 5% como "ponto de corte" e a área abaixo da função densidade de probabilidade da distribuição t de Student seja menor do que 5%, pode-se afirmar que a hipótese nula é rejeitada com nível de confiança de 95%.
Note que não rejeitar a hipótese nula não é a mesma coisa que afirmar que a hipótese alternativa é válida com o mesmo nível de confiança. Isso seria uma interpretação incorreta do teste.
Unicaudal vs. Bicaudal[editar | editar código-fonte]
Dependendo da definição da hipótese nula, deve ser usado uma ou duas caudas da distribuição t de Student na avaliação do teste. Por exemplo, se a hipótese nula for [pic 13]e a hipótese alternativa [pic 14], o teste deve ser feito somente para valores maiores do que [pic 15]e, portanto, ao consultar a função densidade de probabilidade da distribuição t de Student, deve-se considerar somente a área superior a [pic 16], ou seja, somente uma das "caudas" da distribuição.
Por outro lado, se a hipótese nula for [pic 17]e, consequentemente, a hipótese alternativa [pic 18], teríamos que avaliar ao mesmo tempo a possibilidade de [pic 19]e de [pic 20]. Para isso, ao consultar a função densidade de probabilidade da distribuição t de Student , devem ser consideradas as áreas abaixo da curva para valores superiores a [pic 21]e inferiores a [pic 22], ou seja, as duas "caudas" da distribuição. Como a distribuição é simétrica, os tamanhos dessas áreas são iguais.
Teste t para média de uma amostra[editar | editar código-fonte]
O teste t para média de uma amostra consiste em medir a probabilidade da média da amostra em questão ter apresentado o valor observado [pic 23]ou algo mais extremo, dada a média da população [pic 24].
Para fazer isso, estipulamos, por exemplo, que a hipótese nula é [pic 25]e que, por consequência, a hipótese alternativa é [pic 26]. Usamos a seguinte fórmula para o cálculo da estatística t:
[pic 27]
, onde:
- [pic 28]: Média da amostra;
- [pic 29]: Valor fixo usado para comparação com a média da amostra;
- [pic 30]: Desvio padrão amostral;
- [pic 31]: Tamanho da amostra.
Quanto maior [pic 32], mais confiança temos ao rejeitar a hipótese nula, ou seja, mais certeza temos ao afirmar que [pic 33]não é verdadeiro.
Note que, na fórmula acima, quanto maior [pic 34], maior será [pic 35]. Ou seja, quanto maior a distância dos valores observados ao valor que estamos comparando, mais certeza teremos em afirmar que eles são diferentes. Do mesmo modo, [pic 36]aumenta quando o tamanho da amostra [pic 37]é maior ou quando o desvio padrão [pic 38]é menor. Teoricamente, o desvio padrão a ser usado deveria ser o da população (normalmente identificado com o símbolo [pic 39]), mas em muitos casos práticos esse valor é desconhecido, sendo necessário aproximá-lo pelo desvio padrão amostral [pic 40]:
[pic 41]
Exemplo prático[editar | editar código-fonte]
Determinado carro consegue percorrer 15 km a cada litro de combustível gasto em uma estrada plana e de boas condições, mas essa distância pode variar devido a diversos fatores. Digamos que a distância percorrida por litro de combustível tenha uma distribuição normal com média 15 km e desvio padrão de 2 km.
Suponhamos que seja feita uma modificação no motor desse carro com o objetivo de aumentar a distância percorrida por litro de combustível. Depois da modificação, foram realizados 10 testes. Nesses testes, a média das distâncias percorridas por litro de combustível foi de 16,6 km.
A princípio, como 16,6 km é uma distância superior a 15 km, parece que a modificação no motor aumentou a distância percorrida por litro de combustível. Mas, para comprovar esse efeito de forma estatística, definimos a hipótese nula [pic 42]e calculamos o valor de [pic 43].
Neste caso, temos:
[pic 44]
[pic 45]
[pic 46]
[pic 47]
Assim,
[pic 48]
Conforme a função de densidade de probabilidade da distribuição t de Student com 9 (10-1) graus de liberdade, existe 1,61% de probabilidade de valores superiores a 2,53 terem sido obtidos caso a distância percorrida por litro de combustível
...