224 Larivee et Gagne
tants de reussite scolaire. tant au primaire qu’au secondaire (Ceci, 1996; Larivee, Parent Sc Gagne, 1990). Pourtant, personne ne songerait a accuser les enseignants de construire des examens qui penalisent systematiquement les eleves de milicu defavorise. On s’interrogera plutót sur les causes possibles de ces ecarts dans le milieu scolaire ou familial. En definitive, le dogme egalitariste est fondamentalement antiscien-tifique, car il « presume la question resolue, ce qui exclut toute possibilite d’investigation scientifique. (...) Par consćquent, il demeurera toujours impos-sible de confirmer ou dinfirmer rhypothćse selon laquelle les groupcs different vraiment sur ce trait » (Jensen, 1980, p. 370). Quoi qu’il en soit, on se rap-pellera que les tests de QI ont d*abord ete construits pour identifier les enfants qui ne parvcnaient pas a suivre le curriculum scolaire; par consequcnt, il va de soi que lesdits tests fassent ressortir des differences entre les individus et entre les groupes. C’est Labsen-ce de differences qui les rendrait suspects au plan psy-chometrique.
Lerreur de standardisation. La deuxieme conception erronee s’appuic sur Pa priori suivant : selon ses te-nants, un test standardise aupres d’une population donnee est ipso facto inapplicable a une autre population. Comme dans le premier cas, les defenseurs de cette position refusent de soumcttre leur conviction a toute verificadon empirique alors meme que celle-ci ne presente aucune difficulte. Par excmple, des etudes transculturelles ont revele que certains groupes ethniques, notamment d’origine asiatique, presentent des scores plus eleves que les Euro-Americains aux sous-tests des echelles de Weschsler mesurant les habi-letes visuo-spatiales (Lynn Sc Hamson, 1987; Lynn, Hamson Sc Bingham, 1987). Les Matrices de Raven fournissent un autre exemple. Construites en Angleterre par des psychologues anglais, elles furent standardisees a partir d’echantillons anglais et, par la suitę, validees dans une douzaine dc cultures a travers le monde. Or, les Inuits du Grand Nord canadien et les Asiatiques amćricains rćussisscnt ces tests aussi bien que les Anglais (Jensen Sc Wang, 1993; Lynn, Pagliari Sc Chan. 1988). Bref, la generalisation d’un test a diverses populations peut aisement faire 1’objet de verifications empiriques. Autrement dit, tout juge-ment a priori de non-transferabilite culturelle est anti-scientifiquc.
Lerreur culturaliste. La troisieme erreur s’apparente a la precedente, mais elle vise specifiquement les items dun test de QI. Elle fait appel au concept de sa-turation culturelle des items d’un test, c’est-a-dire a la specificite plus ou moins etendue de l'un ou Lautre item en regard de Lunivers culturel d’un groupe social ou ethnique donnę. Par exemple, des questions de connaissance sur Lhistoire du Quebec francopho ne seraient moins familieres aux anglophones de 1’Ouest canadien et inversement. Bien entendu, plus un item accuse un haut degre de specificite culturelle, plus la probabilite est elevee qu’il defavorise les repon-dants d’une autre culture. Cette probabilite demande tout de meme une verification empirique. En fait, ce type d’erreur ne reside pas tant dans la possibilite que certains items ou sous-tests puissent penaliser les per-sonnes etrangeres a la culture cible que dans la con-viction qu’une simple inspection, surtout celle d’un « expert » en matiere de culture et d’ethnie, permet de les reperer. Nous vcrrons plus loin a quel point ces jugcments d‘experts rćsistcnt mai a des analyses em-piriques. Ajoutons que la presence de differences in-terculturelles quant a la reussite de certains items cul-turellement plus satures ne produit pas automatique-ment des biais. Adherer a cette croyance sans prendre soin d’en verifier le bien-fonde serait retomber dans 1'erreur egalitariste.
Im irraie naturę dun biais. Tout test vise d’abord a mesurer de faęon fiable des differences individuelles pour etablir un diagnostic ou predire des comporte-menLs dans la vic quotidienne : succes scolaire, performance au travail, probabilite de delinquance, inten-site d’un syndrome clinique, etc. Tant qu’un test con-ceme des differences indiriduelles, le concept de biais ne s’applique pas : on ne peut debusquer le biais d’une interpretation qui vise Peter, Amhed ou Serge. Le concept de biais suppose en effet qu’une erreur systematique dans finterpretation des scores a un test defavorise les membres d’un certain groupe par rap-port a d’autres groupes. C’est d’ailleurs la definition que proposent les fameux « Standards »» ; * Le terme biais dans les tests et dans l’evaluation refere a des composantes non pertinentes a la constmction mcn-tale entrainant des scores systematiquement superieurs ou inferieurs pour des groupes identifi-ables de candidats » (OCCOPPQ, 2003, p. 93). Techniquement parlant, le terme « biais » doit etre pris dans son sens statistique, c’est-a-dire pour designer Lerreur systematique plutót quc Lerreur aleatoire.
Notons au passage la malheureuse ambiguite qui entoure le verbe discriminer. L'usage courant lui attribue un sens pejoratif, soit « de separer un groupe des autres en le traitant plus mai ►* (Robert, 1995, p. 655). Selon le Dictionnaire etymologique et histońque du franęais (Dauzat, Dubois Sc iMiitcrand, 1993), le terme » discriminant »* designait en 1877 un point de separa-tion, d’ou Lutilisation du verbe discriminer pour « dis-tinguer les choses les unes des autres avec precision,