Le coefficient de Spearman, également appelé rhô ou r(s), évalue l’association entre deux variables mesurées dans une échelle ordinale. Tout comme le coefficient de Kendall, ce test statistique est réalisé à partir des rangs contrairement au coefficient de corrélation de Pearson qui se fait sur les valeurs.
En revanche son interprétation est la même. Sa valeur est comprise entre -1 et 1 : une valeur nulle indique que les deux classements n’ont rien à voir l’un par rapport à l’autre contrairement à une valeur proche de 1 qui montre une forte liaison. Si le coeffcient tend vers -1, la liaison est également forte mais avec une variation inverse. Sa formule est d’ailleurs issue du coefficient de Pearson mais appliquée aux rangs :
où n représente le nombre total d’observations et d correspond à la différence entre les rangs pour chaque observation.
De manière pratique, il s’agit d’ordonner les deux variables par ordre croissant en conservant le même sens et de leur affecter un rang (on le réalise variable après variable). Dans le cas de rangs ex-aequo, on attribue le rang moyen obtenu par les valeurs correspondantes (ex : pour le 4ème et 5ème rang, on donne 4,5). En revanche, si le nombre d’ex-aequo dépasse 10%, il semble que le coefficient de Spearman soit moins performant que son confrère de Kendall. Ensuite, on calcule la différence entre les deux rangs pour chaque observation puis sa valeur au carré et on termine par faire la somme de ces carrés.
On peut alors appliquer la formule mais il reste à le tester afin de savoir à partir de quelles valeurs on peut considérer qu’il existe un lien d’indépendance ou non.
Pour cela on procède donc à un test non paramétrique : pour que la valeur observée (calculée) de rhô soit significative il faut qu’elle soit supérieure à la valeur théorique de rhô lue dans la table de Spearman selon le nombre d’observations et le risque d’erreur choisi.
A partir de 10 observations, on peut approximer les valeurs de la table en utilisant la loi de Student à n-2 degré de liberté.