Conditions pour différences significatives
Grand nombre de bilans évoquent une hétérogénéité des profils et par là même, la présence d’un trouble dys. Même en cours de psychologie, les professionnels intervenants insistent sur la nécessité d’homogénéité des notes aux épreuves et aux indices pour fournir un QIT, l’absence d’homogénéité étant le signe d’une pathologie. D’ailleurs, lorsque l’on demande aux psychologues praticiens quel est l’écart moyen observé au sein des épreuves, ils répondent 3 ou 4 (Grégoire, 2019). Mais qu’en est-il réellement lorsque l’on regarde les données d’étalonnage ?
Au niveau de la différence entre les épreuves :
WAIS IV | WISC IV | WISC V | |
Moyenne des différences observées entre les 10 épreuves | 6,9 | 7,5 | 6,9 |
Écart-type | 2,2 | 2,3 | 2,2 |
Médiane | 7 | 7 | 7 |
Écart des notes observé dans < 10% de l’échantillon | 11 | 12 | 11 |
Écart des notes observé dans < 5% de l’échantillon | 12 | 13 | 12 |
Écart des notes observé dans < 1% de l’échantillon | 14 | 15 | 14 |
Source : Labouret et Grégoire, 2018.
Ceci signifie qu’en moyenne, au sein de l’échantillon d’étalonnage, l’écart entre les notes des différentes épreuves était de 7 points. Cet écart est donc la norme. On est donc bien loin des 3 points supposés, voire imaginés.
Au niveau de la différence entre les indices :
WAIS IV | WISC IV | WISC V | |
Moyenne des différences observées entre les indices | 21,7 | 24,3 | 24,2 |
Écart-type | 10,2 | 10,9 | 9,9 |
Médiane | 20 | 23 | 23 |
Écart des notes observé dans < 10% de l’échantillon | 37 | 40 | 39 |
Écart des indices observé dans < 5% de l’échantillon | 40 | 45 | 43 |
Écart des indices observé dans < 1% de l’échantillon | 51 | 53 | 51 |
Source : Labouret et Grégoire, 2018.
Donc, l’écart moyen entre les indices est d’une 20aine de points.
Plus précisément, dans le WISC V, 52,8% de la population d’étalonnage avaient un écart de 23 points ou plus entre les 5 indices. En d’autres termes, plus de la moitié des enfants qui ont servi de référence pour étalonner le test avaient plus de 23 points d’écart. Une telle différence est donc banale et n’a pas a priori un caractère pathologique.
De plus, lorsque l’on analyse les différences significatives, il faut aussi tenir compte de l’erreur de mesure dont nous avons déjà parlée. Ces erreurs de mesure sont différentes d’une épreuve à l’autre. Voici les erreurs types de mesure de la différence des 7 épreuves du WISC V avec leur propre moyenne pour un seuil critique de significativité de 0,05, soit 95% de chance que cette différence soit due à l’erreur de mesure.
Épreuves qui entrent dans le QIT | Si la différence entre l’épreuve en question et la moyenne des 7 épreuves est supérieure à cette erreur de mesure, on peut commencer à envisager que cette différence est significative |
Similitudes – Moyenne des 7 épreuves (M) | 3,44 |
Vocabulaire – M | 3,42 |
Cubes – M | 3,16 |
Matrices – M | 2,96 |
Balances – M | 2,20 |
Mémoire des chiffres – M | 3,31 |
Code – M | 3,18 |
Source : Grégoire, 2019.
Ceci signifie par exemple que Similitudes devra s’écarter de 3,44 points de la moyenne des 7 notes pour être considérée comme s’écartant significativement de l’ensemble des notes et représenter ainsi une force ou une faiblesse personnelle. En deçà, la différence peut être raisonnablement attribuée à l’erreur type de mesure.
Par ailleurs, au sein de l’échantillon d’étalonnage, la différence moyenne observée entre les différentes notes et leur moyenne était le plus faible pour Similitudes (1,49 points avec un maximum de 6,29 points) et le plus élevé pour Code (2,03 points avec un maximum de 9,86 points). On en conclut que Code est l’épreuve qui peut s’écarter le plus de la moyenne des notes d’un individu. Ceci revêt une importance capitale car un enfant peut se voir attribuer le diagnostic de dyspraxie parce que Code s’écarte de sa moyenne pour des raisons de perfectionnisme par exemple qui le ralentit et qu’il est sensible à la pression du chronomètre sur Cubes (où la différence avec la moyenne des 7 notes est en moyenne de 1,64 points avec un maximum de 8 points). Dans ce cas, l’accompagnement à réaliser tiendra plus de l’ordre du travail sur les émotions que des aménagements liés à des troubles visuo-spatiaux qui engendrera une fixation sur cette étiquette avec abandon d’évolution et impuissance apprise.
Nombre de différences significatives signifiant pathologie
Tout ceci provenait de la différence entre une épreuve et les autres et entre l’ensemble des épreuves. Maintenant, voyons si une différence qui se révèle bien significative est signe de pathologie. Là encore, l’étalonnage nous apprend qu’avoir 1 ou même 2 épreuves qui s’écartent significativement de la moyenne est tout à fait banal. D’ailleurs plus d’un tiers des sujets possède une note qui s’écarte significativement des autres, près de 20% ont deux notes :
Nombre d’épreuves qui s’écartent significativement de leur moyenne | En pourcentage | En pourcentage cumulé (en additionnant tous les pourcentages pour obtenir 100% de l’échantillon) |
0 | 38,9 % | 100% |
1 | 34,6% | 61,1% |
2 | 19,5% | 26,5% |
3 | 5,1% | 7,0% |
4 | 1,7% | 1,9% |
> | 0,1% | 0,1% |
Source : Grégoire, 2019.
Donc, seulement 38,9% de l’échantillon n’a aucune note qui dépasse significativement de sa moyenne ; ce qui fait peu pour considérer le reste comme a-normal, ce qui est un non-sens statique. En fait, pour remettre en cause le QIT, il faudrait que 3 notes s’écartent significativement de la moyenne. En deçà, cela est classique. Toutefois, il faut aussi tenir de la taille de cette différence et de sa direction. En effet, plus la différence sera importante, plus elle sera moins due à une erreur de mesure et sera d’autant plus le signe d’une réelle différence. Par ailleurs, si la différence est positive et constitue donc une force, il est ridicule de l’interpréter comme un problème. En revanche, si la différence est grande et négative, elle a plus de chance d’être interprétée en terme de déficit.
Enfin, toutes les différences ne se valent pas. Si elles concernent l’ICV, elles affaiblissent davantage la valeur prédictive du QIT que les différences sur l’IVS par exemple.
De la même manière qu’avec les épreuves, les différences entre les indices sont fréquentes. Il y a d’abord des erreurs type de mesure liées à chaque indice en deçà desquelles la différence avec la moyenne des indices a de forte chance d’ être due à cette erreur de mesure.
Indices | Si la différence entre l’indice en question et la moyenne des 5 indices principaux est supérieure à cette erreur de mesure, on peut commencer à envisager que cette différence est significative |
ICV – Moyenne des 5 indices (M) | 11,89 |
IVS – M | 10,20 |
IRF – M | 9,64 |
IMT – M | 11,26 |
IVT – M | 12,03 |
Source : Grégoire, 2019.
De la même manière que pour les épreuves, un indice qui s’écarte significativement de la moyenne ne signifie pas forcément pathologie, car cela est extrêmement fréquent dans la population d’étalonnage.
Nombre d’indices qui s’écartent significativement de leur moyenne | En pourcentage | En pourcentage cumulé (en additionnant tous les pourcentages pour obtenir 100% de l’échantillon) |
0 | 34,8% | 100% |
1 | 27,6% | 65,2% |
2 | 29,6% | 37,6% |
3 | 6,7% | 8% |
4 | 1,2% | 1,3% |
5 | 0,1% | 0,1% |
Source : Grégoire, 2019.
Il faut aussi tenir compte du niveau atteint par l’enfant. Ainsi, une différence de 20 points pour un enfant dont l’ensemble de ses indices est dans la moyenne (100) avec un indice qui dénote à 80 n’aura pas la même valeur pour un enfant dont la majorité des indices tournent autour de 140 avec un indice à 120. Dans le premier cas, l’enfant a des performances faibles dans un domaine alors que dans le deuxième cas, il obtient toujours des performances élevées.
Peut-être un dernier point à apporter sur l’hétérogénéité et l’hétérogénéité concernant les hauts QI. Labouret et Grégoire (2018) ont analysé que plus le QIT augmentait, plus les écarts entre les scores étaient amplifiés. Cela provient d’un phénomène statistique connu qu’est la régression vers la moyenne . Comme le QIT est éloigné de la moyenne, la valeur moyenne d’une autre variable, ici un indice, qui est partiellement déterminée par le QIT, sera moins éloignée de sa propre moyenne du fait de l’influence d’autres facteurs et de l’erreur de mesure aléatoire. Les graphiques ci-dessous sont des simulations pour différents niveaux de QI >100. On observe que plus le QIT augmente, plus l’IMT et l’IVT sont plus faibles de l’ICV et de l’IRP/IVS/IRF, et ce, jusqu’à un certain niveau, inhérent à l’effet plafond de l’échelle.
A retenir
La différence moyenne observée entre les épreuves du WISC 5 est de 7 points. Ceci signifie qu’une hétérogénéité au sein de l’ensemble du test est donc tout à fait normale. Pour les indices, la différence observée est en moyenne de 23 points. Il faut ensuite regarder si la différence au sein des épreuves ou au sein des indices est significative et non due à des erreurs de mesure déjà connues. Par la suite, ce n’est pas parce qu’une épreuve ou un indice s’écarte significativement de sa moyenne qu’il y a pathologie car cela est tout à fait banal dans l’échantillon. Pour pouvoir parler de pathologie, il faut au moins 3 épreuves ou 3 indices qui s’écartent significativement de leur propre moyenne. |
Sources
Grégoire J. (2019) . L'examen clinique de l'intelligence de l'enfant. Fondements et pratique du WISC-V. Editions Mardaga.
Labouret G., Grégoire J. (2018). La disparition intra-individuelle et le profil des scores dans les QI élevés. A.N.A.E., 154, p 271-279.