Hétérogénéité ?

Conditions pour différences significatives

Grand nombre de bilans évoquent une hétérogénéité des profils et par là même, la présence d’un trouble dys. Même en cours de psychologie, les professionnels intervenants insistent sur la nécessité d’homogénéité des notes aux épreuves et aux indices pour fournir un QIT, l’absence d’homogénéité étant le signe d’une pathologie. D’ailleurs, lorsque l’on demande aux psychologues praticiens quel est l’écart moyen observé au sein des épreuves, ils répondent 3 ou 4 (Grégoire, 2019). Mais qu’en est-il réellement lorsque l’on regarde les données d’étalonnage ? 

Au niveau de la différence entre les épreuves :


WAIS IVWISC IVWISC V
Moyenne des différences observées
entre les 10 épreuves 
6,97,56,9
Écart-type 2,22,32,2
Médiane 777
Écart des notes observé dans
< 10% de l’échantillon 
111211
Écart des notes observé dans
< 5% de l’échantillon 
121312
Écart des notes observé dans
< 1% de l’échantillon 
141514

Source : Labouret et Grégoire, 2018.

Ceci signifie qu’en moyenne, au sein de l’échantillon d’étalonnage, l’écart entre les notes des différentes épreuves était de 7 points.  Cet écart est donc la norme. On est donc bien loin des 3 points supposés, voire imaginés.

Au niveau de la différence entre les indices :

WAIS IV WISC IVWISC V
Moyenne des différences observées
entre les indices 
21,724,324,2
Écart-type 10,210,99,9
Médiane  202323
Écart des notes observé dans
< 10% de l’échantillon 
374039
Écart des indices observé
dans < 5% de l’échantillon 
404543
Écart des indices observé dans
< 1% de l’échantillon 
515351

Source : Labouret et Grégoire, 2018.

Donc, l’écart moyen entre les indices est d’une 20aine de points.

Plus précisément, dans le WISC V, 52,8% de la population d’étalonnage avaient un écart de 23 points ou plus entre les 5 indices. En d’autres termes, plus de la moitié des enfants qui ont servi de référence pour étalonner le test avaient plus de 23 points d’écart. Une telle différence est donc banale et n’a pas a priori un caractère pathologique

De plus, lorsque l’on analyse les différences significatives, il faut aussi tenir compte de l’erreur de mesure dont nous avons déjà parlée. Ces erreurs de mesure sont différentes d’une épreuve à l’autre. Voici les erreurs types de mesure de la différence des 7 épreuves du WISC V avec leur propre moyenne pour un seuil critique de significativité de 0,05, soit 95% de chance que cette différence soit due à l’erreur de mesure. 

Épreuves qui entrent dans le QITSi la différence entre l’épreuve en question
et la moyenne des 7 épreuves est supérieure
à cette erreur de mesure, on peut commencer
à envisager que cette différence est significative
Similitudes – Moyenne des
7 épreuves (M)
3,44
Vocabulaire – M3,42
Cubes – M3,16
Matrices – M2,96
Balances – M2,20
Mémoire des chiffres – M3,31
Code – M3,18

Source : Grégoire, 2019.

Ceci signifie par exemple que Similitudes devra s’écarter de 3,44 points de la moyenne des 7 notes pour être considérée comme s’écartant significativement de l’ensemble des notes et représenter ainsi une force ou une faiblesse personnelle. En deçà, la différence peut être raisonnablement attribuée à l’erreur type de mesure. 

Par ailleurs, au sein de l’échantillon d’étalonnage, la différence moyenne observée entre les différentes notes et leur moyenne était le plus faible pour Similitudes (1,49 points avec un maximum de 6,29 points) et le plus élevé pour Code (2,03 points avec un maximum de 9,86 points). On en conclut que Code est l’épreuve qui peut s’écarter le plus de la moyenne des notes d’un individu. Ceci revêt une importance capitale car un enfant peut se voir attribuer le diagnostic de dyspraxie parce que Code s’écarte de sa moyenne pour des raisons de perfectionnisme par exemple qui le ralentit et qu’il est sensible à la pression du chronomètre sur Cubes (où la différence avec la moyenne des 7 notes est en moyenne de 1,64 points avec un maximum de 8 points). Dans ce cas, l’accompagnement à réaliser tiendra plus de l’ordre du travail sur les émotions que des aménagements liés à des troubles visuo-spatiaux qui engendrera une fixation sur cette étiquette avec abandon d’évolution et impuissance apprise. 

Nombre de différences significatives signifiant pathologie

Tout ceci provenait de la différence entre une épreuve et les autres et entre l’ensemble des épreuves. Maintenant, voyons si une différence qui se révèle bien significative est signe de pathologie. Là encore, l’étalonnage nous apprend qu’avoir 1 ou même 2 épreuves qui s’écartent significativement de la moyenne est tout à fait banal. D’ailleurs plus d’un tiers des sujets possède une note qui s’écarte significativement des autres, près de 20% ont deux notes :

Nombre d’épreuves
qui s’écartent
significativement
de leur moyenne 
En pourcentage En pourcentage cumulé
(en additionnant tous les pourcentages
pour obtenir 100% de l’échantillon) 
038,9 %100%
134,6%61,1%
219,5%26,5%
35,1%7,0%
41,7%1,9%
>0,1%0,1%

Source : Grégoire, 2019.

Donc, seulement 38,9% de l’échantillon n’a aucune note qui dépasse significativement de sa moyenne ; ce qui fait peu pour considérer le reste comme a-normal, ce qui est un non-sens statique. En fait, pour remettre en cause le QIT, il faudrait que 3 notes s’écartent significativement de la moyenne. En deçà, cela est classique. Toutefois, il faut aussi tenir de la taille de cette différence et de sa direction. En effet, plus la différence sera importante, plus elle sera moins due à une erreur de mesure et sera d’autant plus le signe d’une réelle différence. Par ailleurs, si la différence est positive et constitue donc une force, il est ridicule de l’interpréter comme un problème. En revanche, si la différence est grande et négative, elle a plus de chance d’être interprétée en terme de déficit

Enfin, toutes les différences ne se valent pas. Si elles concernent l’ICV, elles affaiblissent davantage la valeur prédictive du QIT que les différences sur l’IVS par exemple. 

De la même manière qu’avec les épreuves, les différences entre les indices sont fréquentes. Il y a d’abord des erreurs type de mesure liées à chaque indice en deçà desquelles la différence avec la moyenne des indices a de forte chance d’ être due à cette erreur de mesure. 

Indices Si la différence entre l’indice en question
et la moyenne des 5 indices principaux
est supérieure à cette erreur de mesure,
on peut commencer à envisager que
cette différence est significative
ICV – Moyenne des
5 indices (M)
11,89
IVS – M10,20
IRF – M9,64
IMT – M11,26
IVT – M12,03

Source : Grégoire, 2019.

De la même manière que pour les épreuves, un indice qui s’écarte significativement de la moyenne ne signifie pas forcément pathologie, car cela est extrêmement fréquent dans la population d’étalonnage. 

Nombre d’indices
qui s’écartent
significativement
de leur moyenne 
En pourcentage En pourcentage cumulé
(en additionnant tous les
pourcentages pour obtenir
100% de l’échantillon) 
034,8%100%
127,6%65,2%
229,6%37,6%
36,7%8%
41,2%1,3%
50,1%0,1%

Source : Grégoire, 2019.

Il faut aussi tenir compte du niveau atteint par l’enfant. Ainsi, une différence de 20 points pour un enfant dont l’ensemble de ses indices est dans la moyenne (100) avec un indice qui dénote à 80 n’aura pas la même valeur pour un enfant dont la majorité des indices tournent autour de 140 avec un indice à 120. Dans le premier cas, l’enfant a des performances faibles dans un domaine alors que dans le deuxième cas, il obtient toujours des performances élevées. 

Peut-être un dernier point à apporter sur l’hétérogénéité et l’hétérogénéité concernant les hauts QI. Labouret et Grégoire (2018) ont analysé que plus le QIT augmentait, plus les écarts entre les scores étaient amplifiés. Cela provient d’un phénomène statistique connu qu’est la régression vers la moyenne . Comme le QIT est éloigné de la moyenne, la valeur moyenne d’une autre variable, ici un indice, qui est partiellement déterminée par le QIT, sera moins éloignée de sa propre moyenne du fait de l’influence d’autres facteurs et de l’erreur de mesure aléatoire. Les graphiques ci-dessous sont des simulations pour différents niveaux de QI >100. On observe que plus le QIT augmente, plus l’IMT et l’IVT sont plus faibles de l’ICV et de l’IRP/IVS/IRF, et ce, jusqu’à un certain niveau, inhérent à l’effet plafond de l’échelle. 

Indices moyens obtenus par simulation pour plusieurs QIT.
Le coefficient de corrélation de chaque indice avec le QIT est indiqué en abscisse sous chaque indice.
(Source : Labouret et Grégoire, 2018)


A retenir 

La différence moyenne observée entre les épreuves du WISC 5 est de 7 points. Ceci signifie qu’une hétérogénéité au sein de l’ensemble du test est donc tout à fait normale. Pour les indices, la différence observée est en moyenne de 23 points.
Il faut ensuite regarder si la différence au sein des épreuves ou au sein des indices est significative et non due à des erreurs de mesure déjà connues.
Par la suite, ce n’est pas parce qu’une épreuve ou un indice s’écarte significativement de sa moyenne qu’il y a pathologie car cela est tout à fait banal dans l’échantillon. Pour pouvoir parler de pathologie, il faut au moins 3 épreuves ou 3 indices qui s’écartent significativement de leur propre moyenne.

Sources

Grégoire J. (2019) . L'examen clinique de l'intelligence de l'enfant. Fondements et pratique du WISC-V. Editions Mardaga.

Labouret G., Grégoire J. (2018). La disparition intra-individuelle et le profil des scores dans les QI élevés. A.N.A.E., 154, p 271-279.

%d blogueurs aiment cette page :