|
Un regard scientifique sur nos méthodes d’évaluation
Mise à jour le jeudi 30 novembre 2006
Par: Alain Haché
Puisque les examens arrivent bientôt, le moment est opportun d’aborder le thème des évaluations.
Un scénario classique : vous allez consulter la feuille affichant les notes finales du cours. En parcourant la liste, le coeur battant, vous espérez au moins avoir un B. Mais votre note finale est 79,7 %; vous avez manqué votre objectif de 1,3 %. Votre amie, par contre, s’est méritée un B, tout juste. Vous expliquez au professeur que vous devez maintenir une bonne moyenne pour conserver votre bourse. Mais rien à faire, on vous explique que les notes ont déjà été ajustées à la hausse et que le barème est tel que convenu.
Déçu, vous retournez chez-vous en songeant à votre note, à ce qu’elle ne tient pas compte du fait que vous aviez fait tous vos devoirs sans aide (contrairement à votre amie), que vous aviez du apprendre des notions additionnelles qui vous manquaient, que vous aviez fait beaucoup de progrès au cours du semestre, que vous étiez grippé à l’examen intra, et que vous aviez deux gros examens finals la même journée. Tous ces détails sont oubliés, et il ne vous reste qu’un B-. Puis vous pensez à l’université, cette merveilleuse machine instruisant des milliers d’étudiants, mais qui, en même temps, agit comme une sorte de trou noir engloutissant une quantité faramineuse d’information pour ensuite fournir une lettre ou une moyenne pondérée. Peu importe qui vous êtes, vous avez été réduit en un chiffre qui, entre autres, déterminera si vous pourrez poursuivre vos études. Comme un bloc de viande aplati en saucisse, vous avez été transformé en un objet à une dimension. Cette pensée vous frustre un peu, mais en vous installant devant la télé pour regarder Acadieman, vous vous dites qu’il y en a qui l’ont bien pire que vous, et vous passez à autre chose.
Avant de poursuivre, permettez-moi d’inscrire la question dans un contexte plus général, car elle touche pratiquement tous les aspects de la société. Ce que nous traitons ici est le concept de perte d’information et de ses implications. Même si l’exemple de la note finale montre bien que quelque chose se perd quand on fait une réduction, on a souvent tendance à surestimer la quantité d’information contenue dans un chiffre (ou un mot, ou un énoncé), comme si toute la réalité y était contenue. Pourtant, il y a des cas où l’on se méfie du chiffre unique, comme en achetant une voiture, par exemple. Peu de gens se fient uniquement au nombre d’étoile qu’on accorde à un certain modèle, et avec raison. C’est seulement en regardant aux détails, au confort, et surtout après un test de route qu’on peut prendre une décision éclairée.
Le sceptique dira «Oui mais une cote peut tout de même être basée sur une évaluation détaillée qui inclue plusieurs facettes ». C’est vrai, mais en combinant tous les scores, les détails sont perdus. Si j’additionne les chiffres de mon numéro de téléphone et je vous passe le total, comment feriez-vous pour m’appeler? (Exemple fourni par un collègue. Merci Normand.) On ne peut pas « unidimensionnaliser » l’information sans l’appauvrir. On pourrait résumer avec ces deux règles presque scientifiques : 1) Un chiffre, une lettre ou une donnée ne peut représenter qu’une seule mesure ou quantité 2) Une donnée est la plus petite quantité d’information que l’on puisse avoir sur quelque chose
Une « mesure »peut prendre plusieurs formes, y comprisun ou plusieurs examens, une grille d’évaluation, un barème, etc. Quant à l’information fournie par la note, elle ne nous dit rien de plus que la performance par rapport au système d’évaluation choisi. Si cette note peut-être calculée avec une précision infinie, le système d’évaluation, lui, reste presque entièrement arbitraire. L’évaluateur peut bien se laver les mains après avoir appliqué à perfection la grille d’évaluation, mais changez le poids accordé aux critères et le résultat changera. Quel système de critères est le meilleur?
Revenons à notre problématique 79,7 %. Non seulement c’est une quantité limitée d’information sur un travail de semestre, mais elle est aussi trop précise. Prenez dix professeurs d’égale compétence, faites-leur évaluer la même classe, et dix fois vous obtiendrez des notes individuelles (et relatives) différentes. C’est que chaque professeur jugera chaque type d’erreur avec une sévérité différente. En fait, il a été démontré que l’on ne peut pas évaluer quelqu’un avec une précision meilleure que 5 à 10 %. En d’autres mots, le dernier ‘7’ de votre note pourrait aussi bien représenter le nombre de bonbons bleus dans votre boîte de Smarties.
Mais n’allez pas croire que la situation est particulière à l’Université de Moncton. Je ne prétends pas non plus avoir la clé d’un système idéal et parfait. Mais si l’on est conscient de la nature et des limites d’une l’évaluation, ce sera déjà ça. On arrêtera de penser qu’un D+ veut dire qu’on est forcément moins bon que quelqu’un qui a eu C-. En étant conscient des limites d’une quantité réduite d’information, on pourra voir l’erreur de certaines généralisations dans la vie courante, comme quand on conclue que l’économie va bien parce que l’indice Dow Jones monte, que les gens sont heureux quand le taux de suicide diminue, ou qu’ils sont en meilleure santé lorsque l’espérance de vie augmente.
Pour que nos évaluations reflètent mieux la performance des étudiants, il faudrait donner de multiples cotes à chaque cours. Mais on se frappe vite au mur des réalités pratiques. Évaluer davantage requiert plus de travail et un système différent sur lequel on s’entend. Sans compter que dans le monde extérieur, il y en aura toujours qui voudront, pour simplifier leurs décisions, que nos étudiants soient mesurés comme des saucisses.
|