CORRELAÇÃO DE POSTOS
Por: YdecRupolo • 20/10/2018 • 1.728 Palavras (7 Páginas) • 363 Visualizações
...
[pic 9]
Substitua o “n” pelo número de pares de dados que você calcula para obter a resposta.
[pic 10]
Caso queira, utilize a fórmula padrão do coeficiente de correlação:
[pic 11]
10. Interprete o resultado. Ele pode variar entre -1 e 1.
Próximo a -1 – Correlação negativa.
Próximo a 0 – Correlação não linear.
Próximo a 1 – Correlação positiva.
Depois de calcular o Coeficiente de Correlação de Postos de Spearman, você pode determinar se a correlação entre as variáveis é significante. Você pode fazer essa determinação desempenhando um teste de hipótese para o coeficiente de correlação da população ρs. As hipóteses nula e alternativa para esse teste são as seguintes:
Ho: ρs = 0 (Não há correlação entre as variáveis)
Há: ρs # 0 (Há uma correlação significante entre as variáveis).
Os valores críticos para o Coeficiente de Correlação de Postos de Spearman estão listados na tabela 10 do Apêndice B, a qual lista os valores críticos para níveis selecionados de significância e para tamanhos de amostras de 30 ou menores. O teste estatístico para o teste de hipótese é o Coeficiente de Correlação de Postos de Spearman rs.
MÉTODO 2 DE 3: NO EXCEL
1. Crie novas colunas com as classificações das colunas existentes. Por exemplo, se os dados estão na coluna A2:A11, use a fórmula”=RANK(A2.A$2:A$11)”. Copiando e colando em todas as linhas e colunas.
2. Caso haja algum valor repetido, faça como explicado nos passos 3 e 4 do primeiro método.
3. Em uma nova célula, faça a correlação entre as duas colunas de classificação com algo como “=CORREL(C2:C11,D2:D11)”. Neste caso, C e D podem corresponder às colunas de classificação. A célula de correção possuirá a classificação da Correlação de Spearman.
MÉTODO 3 DE 3: UTILIZANDO O R
1. Baixe o R, caso não o tenha (Veja em R-Project).
2. Salve os seus dados em um arquivo CSV com os dados que deseja correlacionar nas duas primeiras colunas. Normalmente, isso pode ser feito no menu “Salvar como”.
3. Abra o editor do R. Se estiver no terminal, basta executar o R. Caso esteja na área de trabalho, clique na logo “R”.
4. Digite os comandos:
d
Dicas
A maioria dos dados devem conter pelo menos 5 (cinco) pares de dados para identificar uma tendência (foram usadas 3 (três) no exemplo para torná-lo fácil de demonstrar).
Avisos
O Coeficiente de Correlação de Postos de Spearman só identificará a força da correlação onde os dados aumentam ou diminuem de forma constante. Se houver um gráfico de dispersão dos dados de qualquer outra classificação de tendência de Spearman, não será “dado” uma representação exata de suas correlações.
Esta fórmula é baseada na pressuposição de que não há empates. Quando houver como no exemplo 1, deve ser usada a definição: o coeficiente de correlação do momento do produto com base nas fileiras.
Uma fórmula que é relativamente fácil de usar é:
o ρ é dado por:
[pic 12]
Onde:
- = posto de Xi dentre os valores de X, a diferença entre cada posto de valor correspondente de X e Y ou posto de Yi nos valores de Y, é a diferença entre os postos de uma entrada de informação emparelhada;
n = o número dos pares dos valores (Xi , Yi), isto é, o número de entradas de informações emparelhadas;
n Para amostras maiores que 20 (vinte) observações, podemos utilizar a seguinte aproximação para d distribuição t.
[pic 13]
EXEMPLO
Neste exemplo, usaremos os dados brutos da tabela abaixo para calcular a correlação entre o QI de uma pessoa com o número de horas de televisão assistidas por semana.
QI, [pic 14]
Horas de TV por semana, [pic 15]
106
7
86
0
100
27
101
50
99
28
103
29
97
20
113
12
112
6
110
17
Primeiro, precisamos achar o valor do termo [pic 16]. Para fazer isto executamos os seguintes passos:
1. Ordene os dados pela primeira coluna ([pic 17]). Crie uma nova coluna [pic 18] e escreva nela os valores dos postos 1,2,3,...n.
2. Em seguida, ordene os dados pela segunda coluna ([pic 19]). Crie uma quarta coluna [pic 20] e analogamente coloque os valores dos postos 1, 2, 3,...n.
3. Crie uma quinta coluna [pic 21] para conter as diferenças entre as duas colunas de postos ([pic 22] e [pic 23]).
4. Crie uma última coluna [pic 24] para conter os valores da coluna [pic 25] ao quadrado.
IQ, [pic 26]
Horas
...