Les Pratiques Pedagogiques Efficaces

April 1, 2017 | Author: looping79 | Category: N/A
Share Embed Donate


Short Description

Download Les Pratiques Pedagogiques Efficaces...

Description

LES PRATIQUES PÉDAGOGIQUES EFFICACES Mewtow, 21 juillet 2014

Table des matières 1 Introduction

5

2 Comprendre et mémoriser

7

2.1 Du bon usage des exemples

. . . . . . . . . . . . . . . . . . . . . . . . . . .

7

2.1.1 Exemples, contre-exemples, et variation . . . . . . . . . . . . . . . . . .

7

2.1.2 Concepts concrets versus abstraits . . . . . . . . . . . . . . . . . . . . .

9

2.2 Faire des liens

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2.1 Comprendre : une forme de mémorisation comme une autre . . . . . . . . 10 2.2.2 Connaissances antérieures : la matière première . . . . . . . . . . . . . . 13 2.2.3 Catégoriser pour mieux comprendre

. . . . . . . . . . . . . . . . . . . . 15

2.2.4 Advances organisers . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3 Tu dois désapprendre tout ce que tu as appris ! . . . . . . . . . . . . . . . . . . 18 2.3.1 Conceptions

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3.2 Changement conceptuel

. . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3.3 Implications pédagogiques . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.4 Transfert d’apprentissage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.4.1 Transfert lointain . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.4.2 Transfert proche

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3 Les portes d’entrée de la mémoire

25

3.1 On est assez limités, quand même ! . . . . . . . . . . . . . . . . . . . . . . . . 25 3.1.1 Charge cognitive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.1.2 Diminuer la charge cognitive . . . . . . . . . . . . . . . . . . . . . . . . 26 3.2 Exercices et exemples : comment rendre la pratique efficace ?

. . . . . . . . . . 31

3.2.1 Exercices goal-free . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.2.2 Exemples travaillés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.3 Supports pédagogiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.3.1 Texte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.3.2 Images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.3.3 Animations et vidéos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4 Mémorisation et méthodes de révision

43

4.1 Répétition et mémorisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.1.1 Apprentissage massé versus distribué

. . . . . . . . . . . . . . . . . . . 43

4.1.2 Répétition de maintien . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.1.3 Répétition de rappel

. . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.2 Elaboration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.2.1 Générer

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.2.2 Organiser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3

1 Introduction Quelle méthode pédagogique utiliser pour rendre un cours facile à comprendre et à mémoriser ? Beaucoup de réponses ont étés formulées. La première méthode pédagogique inventée n’est autre que la pédagogie traditionnelle, celle à laquelle vous avez normalement eu droit quand vous étiez à l’école. Dans cette vision, si l’élève ne mémorise ou ne comprend pas, c’est qu’il n’a pas été assez attentif, ou n’a pas assez travaillé. Avec cette pédagogie, un chapitre de cours est abordée avec un cours magistral, suivi d’une phase d’exercice et de devoirs (souvent nombreux). Transmettre du savoir est le leitmotiv de ces professeurs. Cette idée de l’éducation comme transmission considère que l’instruction consiste à faire acquérir des connaissances et à les faire mémoriser le plus possible. Rien de mal en soit, au contraire : on verra que c’est une très bonne chose. Simplement, les moyens mis en œuvre par les professeurs traditionalistes sont à remettre en question. Dans les années 1920, la découverte de l’apprentissage par conditionnement a remis en cause cette vision de l’apprentissage. Diverses pédagogies se sont basées sur l’apprentissage par conditionnement, afin de faciliter les apprentissages. Ces méthodes considèrent les élèves comme de simples boites noires, sur laquelle des techniques de conditionnement permettent de consolider et renforcer des comportements. Dit comme cela, les méthodes béhavioristes semblent relativement barbares, mais il n’en est rien, rassurez-vous. Cette vision de l’enseignement a été remise en cause dans les années 1930/40, avec l’avènement des premiers travaux scientifiques sur le sujet. Ces travaux sont ceux de Piaget, un scientifique qui a étudié le développement de l’intelligence et de la pensée chez l’enfant. Leur application à la pédagogie a donné naissance à un grand nombre de méthodes dites piagétiennes. L’évolution de ces méthodes a donné naissance aux pédagogies actives. Dans ces pédagogies actives, l’enfant doit redécouvrir par lui-même ce qu’il faut apprendre : on apprend en faisant, par séries d’essais et d’erreurs, par tâtonnements expérimentaux, par des projets, des mises en activités, etc. Nombreux sont les professeurs qui considèrent que ces pédagogies actives sont à fuir comme la peste. On verra dans ce document qu’ils ont malheureusement raison sur le principe. Cela ne signifiera toutefois pas que les traditionalistes ont raison, loin de là. Dans les années 1970, B. Rosenshine, un psychologue a adapté une méthode béhavioriste, le direct instruction, à partir d’observations dans les classes. Il créa une nouvelle méthode pédagogique : la pédagogie explicite. Celle-ci incorpore les techniques de la pédagogie béhavioriste, avec quelques ajouts provenant les théories psychologiques sur le fonctionnement de la mémoire. Depuis, les confirmations expérimentales sont arrivées : la pédagogie explicite est clairement supérieure à toutes les autres approches, aussi bien actives que traditionnelles. C’est aussi dans ces années 1970/1980 que la théorie de l’assimilation a fait son apparition. Cette théorie, crée par Ausubel, a été crée sur la base de travaux sur le fonctionnement de la

5

1 Introduction

mémoire. Cette théorie suivait les traces des théories de Piaget, mais sans pour autant être une pédagogie active. Cette théorie n’a malheureusement pas eu le succès qu’elle méritait. Par la suite, d’autres théories ont fait leur apparition : la théorie de la charge cognitive, ainsi que les travaux de Sweller et de ses collègues, ont notamment une utilité assez impressionnante. Avec le temps, d’autres théories pédagogiques ont vu le jour. De nombreux travaux en sciences de l’éducation ont vu le jour, qu’il s’agisse de travaux anglo-saxons ou français (plus rares). D’autres travaux plus récents ont une utilité pédagogique dans certains apprentissages spécifiques : on peut citer les travaux de Rémi Brissiaud sur l’acquisition de la numération. Les théories modernes de l’apprentissage se basent maintenant sur des bases scientifiques solides. Les neurosciences et la psychologie cognitive forment le socle de base de ces théories, et elles donnent des conseils judicieux aux enseignants. Ces théories mettent l’accent sur le fonctionnement de la mémoire, ainsi que sur certaines de nos capacités cognitives. Dans ce tutoriel, nous allons voir comment un élève apprend, et les conseils pédagogiques que nous allons en tirer. Nous allons beaucoup parler du fonctionnement de la mémoire et de la cognition, afin d’en tirer parti le plus possible.

6

2 Comprendre et mémoriser 2.1 Du bon usage des exemples 2.1.1 Exemples, contre-exemples, et variation On est tenté de croire que donner une définition et quelques explications suffit. Mais dans la réalité, il n’en est rien : les catégories ne sont donc pas représentées dans notre cerveau sous la forme d’une définition. En effet, quand on vous voulez savoir à quelle catégorie appartient un objet, vous n’allez pas vérifier la présence de chaque propriété : ce genre de chose ne peut se faire que consciemment, et utilise votre attention. Or, cela ne permet pas une catégorisation rapide, qui est monnaie courante dans de nombreuses situations. Et cette catégorisation rapide est clairement importante dans diverses situations. C’est notamment le cas en mathématiques ou en physique. Ces deux domaines sont bourrés d’exercices dans lesquels on doit reconnaitre une catégorie de problème bien précise, et appliquer la méthode qui va bien : reconnaitre qu’on peut utiliser le théorème de Thalès pour résoudre un problème, reconnaitre une situation qui se résout avec une addition, reconnaitre une équation différentielle, etc. Et ce genre de chose permet d’expliquer la plus ou moins grande facilité à résoudre des exercices de mathématique ou de physique chez de nombreux élèves : un élève qui reconnait tout de suite la catégorie de problème qui se cache derrière un exercice sait directement comment le résoudre, alors qu’un élève qui ne le fait pas devra réfléchir pour trouver la solution. Pour en donner un autre exemple, on peut citer la fameuse étude de Chi et al. (1981). Leur étude a montré que les étudiants en physique ont tendance à baser les problèmes sur des détails présents dans l’énoncé : coefficients numérique, vocabulaire utilisé, présence de plans inclinés, etc. En comparaison, les professeurs ont tendance à penser en fonction de principes abstraits qui permettent de résoudre les exercices : la loi de conservation de l’énergie, la quantité de mouvement, etc. Au fur et à mesure que les étudiants progressent dans leurs études, il classent de plus en plus ces exercices en fonction des principes abstraits. Mais comment faire pour que cette catégorisation soit la plus rapide possible ? Pour cela, il faut que notre cerveau mémorise des catégories autrement que via une simple définition. #### Exemples Si l’élève a vu peu d’exemples de la catégorie, le cerveau représentera cette catégorie comme un simple ensemble d’exemples, qui contient les exemplaires déjà rencontrés. Il n’y a aucune abstraction, aucune forme de conceptualisation, rien… Pour vérifier qu’un objet perçu appartient à une catégorie, l’objet en question est comparé à tous les exemplaires de la catégorie : si un exemplaire ressemble globalement à l’objet perçu, le cerveau suppose que l’objet appartient à la catégorie.

7

2 Comprendre et mémoriser

En conséquence, donner des exemples est primordial : c’est la première étape vers la formation de concept. Et ce, peu importe que la catégorie soit concrète ou abstraite. Mais si on s’arrête là, l’élève saura juste reconnaitre des situations familières, mais sans plus : c’est un premier essai qu’il faut transformer. #### Features Mais cette représentation des catégories n’est pas figée. Plus on devient familier avec la catégorie, plus le cerveau dégage des régularités à partir des exemples. Il remarque que certaines propriétés reviennent souvent dans les exemples, et en déduit qu’il s’agit de propriétés importantes. Plus un objet possède ces propriétés, plus il aura de chance d’être considéré comme un membre de la catégorie. Généralement, les propriétés sont des propriétés sensorielles, qui provient de la vision, de l’audition, ou des autres sens. D’autres de ces propriétés sont des propriétés liées aux actions que peuvent faire les objets : on sait si tel objet peut flotter, si tel animal peut nager, etc. Mais le cerveau peut aussi gérer les propriétés abstraites, non liées aux sens. Certaines de ces propriétés sont des points communs, que tous les membres de la catégorie possèdent. Il s’agit de caractéristiques essentielles. D’autres sont plus des propriétés fréquentes chez les membres de la catégorie, mais qui ne sont pas vraiment des points communs. ##### Effet de variation Il est possible de faire évoluer une liste d’exemples en catégories en ajoutant des exemples relativement variés. Par variés, on veut dire que les propriétés communes à ces exemples doivent être limitées au minimum : seules les propriétés vraiment déterminantes, spécifiques à la catégorie sont communes entre tous les exemples. Le but est que l’élève dégage les points communs des différents exemples : des propriétés ne doivent pas être prises pour des points communs de la catégorie alors qu’elle n’en sont pas. En effet, il arrive fréquemment que les élèves classent les problèmes qu’ils doivent résoudre en utilisant les mauvaises propriétés. Pour donner un exemple, les élèves de primaire ont souvent des difficultés pour résoudre des problèmes de ce genre : Simone a 25 billes, elle a 5 billes de plus que Pierre : combien Pierre a de billes ? Dans ce cas, les élèves de primaire utilisent une stratégie assez simple : ils entendent “plus” dans l’énoncé, donc ils additionnent 25 avec 5 et répondent 30… Cette stratégie fonctionne dans des cas spécifiques, mais qui échoue dans des cas un peu différents. L’efficacité de cette variation a été vérifiée par John Bransford et ses collègues, en 1979, en comparant deux groupes d’élèves. Un premier groupe recevait des exemples similaires, et l’autre des exemples très différents. Dans un test ultérieur, portant sur un contexte d’utilisation jamais vu auparavant lors des exemples, les chercheurs ont vérifié quel était le pourcentage de réussite : 84% dans le second groupe contre 64% dans le premier. Conséquence : le professeur doit varier les exemples pour permettre à un élève d’abstraire progressivement les points communs entre divers exemples, et ne pas rester bloqué sur des caractéristiques de surface. ##### Contre-exemples On peut aussi utiliser des contre-exemples : cela permet à l’élève de ne pas confondre des propriétés spécifiques de certaines exemples avec des propriétés partagées par tous les membres de la catégorie. Ainsi, si on donne un contre-exemple qui contient des points communs de la catégorie, on peut rapidement en déduire que ceux-ci ne sont pas des conditions nécessaires et suffisantes : ces points communs seuls ne sont pas suffisants pour ranger l’objet dans la catégorie enseignée. #### Prototypes Mais ce mécanisme à base de sélection de propriétés ne marche pas pour les concepts abstraits, ou certains concepts concrets. Pour eux, tout se passe comme si le cerveau effectuait une moyenne de tous les exemples connus de la catégorie : les catégories

8

2.1 Du bon usage des exemples

sont représentées par un objet idéal qui définit à quoi doit ressembler un objet de la catégorie, le prototype. Lorsqu’on veut savoir si un autre objet appartient à cette catégorie, celui-ci est comparé au prototype : plus celui-ci est proche, plus on considérera que l’objet appartient à la catégorie. Pour donner un exemple, on peut citer l’expérience de Lupyan (2012), dans laquelle un premier groupe de sujets devait dessiner un triangle, et le second une figure à trois cotés. Le triangle était isocèle dans 91% des cas pour le premier groupe, comparé à 50% pour le groupe “trois cotés”. La propriété “isocèle” est un bon exemple de ces propriétés non-nécessaires, mais qui sont très fréquentes chez les membres connus de la catégorie. Pour générer ces prototypes, là encore, l’usage d’exemples donne de bons résultats. #### Récapitulatif L’ensemble des conseils donnés plus haut peut être utilisée en utilisant une stratégie bien précise, crée par Alessi et Trollop (2001). Cette stratégie se base sur le fait que certaines exemples ou contre-exemples sont assez peu évidents, tandis que d’autres sont plus ambigus. Celle-ci progresse encore une fois par étapes : – donner des exemples simples, qui contiennent un maximum de points communs ; – donner des contre-exemples simples, qui contiennent un points communs ; – donner des exemples difficiles à classer, avec peu de points communs ; – donner des contre-exemples difficiles à classer, avec peu de points communs.

2.1.2 Concepts concrets versus abstraits Apprendre un concept consiste donc à donner la liste de ses points communs, en premier lieu : il suffit de donner une définition de la catégorie. Mais l’extraction de ces points communs peut se faire de deux manières : soit en partant de l’abstrait pour déduire un concept plus concret, ou inversement. #### Concret et abstrait La première méthode consiste à dériver un concept à partir d’un concept plus général, en ajoutant des propriétés. Cette approche est inductive par principe, et va des catégories les plus concrètes au catégories plus générales. La seconde méthode consiste à abstraire une catégorie à partir de catégories moins générales. Elle utilise fatalement des exemples, et cherche à montrer à l’élève les similitudes de ceux-ci. Cette approche est déductive par principe, et va des catégories les plus générales au catégories plus concrètes. #### Niveaux d’abstraction Savoir quelle méthode utiliser dépend en réalité du nombre de propriétés de l’objet à apprendre. Généralement, on divise les catégories en trois grands niveaux d’abstractions : – un niveau super-ordonné, très abstrait ; – un niveau basique, à mi-chemin entre abstrait et concret ; – un niveau supra-ordonné, dont les objets sont très concrets. Les catégories basiques sont celles dont les membres partagent peu de propriétés. Commencer par ce niveau est donc la voix royale : les définitions seront plus courtes, et plus simples. Les catégories du niveau le plus bas peuvent être dérivées à partir des catégories du niveau de base en ajoutant quelques détails. Par contre, les objets abstraits n’ont pas beaucoup de points communs, et ne peuvent pas être définis par des ensembles de propriétés partagées. Tenter de définir ces catégories risque donc d’être compliqué : on doit partir des catégories de base pour abstraire ces catégories.

9

2 Comprendre et mémoriser

2.2 Faire des liens 2.2.1 Comprendre : une forme de mémorisation comme une autre Nos concepts sont des connaissances comme les autres : celle-ci sont stockées dans notre mémoire. Quand je dis mémoire, il faut préciser que la mémoire n’est pas unique, et qu’elle est composée de plusieurs sous-mémoire distinctes. L’une d’entre elle est spécialement dédiée au stockage de nos connaissances : c’est la mémoire sémantique. #### Des connaissances bien reliées La mémoire sémantique est intégralement constituée d’un réseau d’informations, reliées entre elles par des relations : un mot sera associé au concept qui lui correspond, plusieurs idées seront reliées entre elles par un lien logique, etc. L’ensemble des faits que l’on connait consiste simplement en un ensemble de liens qui relient des concepts entre eux. Les concepts sont donc la matière première du savoir, la base sur laquelle on construit les faits. Contrairement à ce que l’on peut penser, les concepts et abstractions précédent les faits. L’ensemble des relations et des concepts présents dans notre mémoire forme ce qu’on appelle un réseau sémantique.

La recherche de l’information à rappeler se fait en parcourant ce réseau d’interconnexions de proche en proche, ce qui est relativement rapide. Ces associations sont autant de routes qui permettent d’accéder à l’information, et donc de s’en rappeler quand le besoin s’en fait sentir. Pour détailler un petit peu plus, le processus de rappel consiste à activer les catégories en mémoire : plus l’activation est forte, plus la probabilité de rappel est grande. Cette activation va se propager dans le réseau sémantique à travers les relations, ce qui peut potentiellement déclencher le rappel des informations voisines. A certains endroits, un concept reçoit de l’activation en provenance de plusieurs relations, ce qui fait qu’il peut être rappelé encore plus facilement. C’est ce qui explique que donner un indice facilite le rappel d’une information que l’on croyait avoir oubliée : l’activation de l’indice se propage jusqu’à la connaissance à rappeler. D’ailleurs, tout mécanisme de rappel, aussi subtil soit-il, fait intervenir des indices. La simple perception d’un mot ou d’une image va activer sa représentation en mémoire, qui servira d’indice, de point de départ pour l’activation. Ces points de départ d’ailleurs sont appelés des indices de récupération. Ce mécanisme est tellement efficace que Proust a écrit un livre rien qu’à partir de la perception d’une seule odeur, c’est vous dire ! #### L’impact de la

10

2.2 Faire des liens

compréhension sur l’apprentissage Le résultat est que l’organisation de la mémoire d’un élève a une grande influence sur ses résultats scolaires : c’est ce qui permettra à l’élève de mémoriser facilement, ou d’éviter d’oublier ce qu’il sait. Si la quantité d’informations mémorisée est cruciale, leur interconnexion l’est tout autant : de bons résultats scolaires ne proviennent pas seulement de l’accumulation d’une liste isolée de faits. Comme le dit Develay : « Le sens vient des liens construits entre les savoirs et non pas de leur empilement. […] apprendre, ce n’est pas amasser, mais c’est relier des notions pour en construire d’autres plus abstraites (1996, cité par Tardif, 1998 : 47) ». Si un concept n’est pas relié à d’autres informations, il sera totalement isolé dans la mémoire sémantique, et ne pourra être être rappelé, faute d’être accessible : l’élève n’aura pas appris. L’oubli peut donc venir d’une mémorisation mal faite, qui ne permet pas aux indices de récupération de fonctionner de manière optimale. Par contre, plus un concept a un grand nombre de voisins dans ce réseau associatif, plus il peut être rappelé facilement : chacun des voisins peut servir de voie d’accès. Pour être mémorisée, les informations à apprendre vont doivent donc se connecter à des connaissances déjà présentes en mémoire sémantique : apprendre, c’est créer des associations et des relations. Ce mécanisme d’association a souvent lieu inconsciemment, et de nombreuses associations se créent sans que l’on en prenne conscience. Pour donner un exemple, essayez d’apprendre par cœur ces deux suites de lettres : Liste 1 : – XRZ – KSZ – MPL – NES – JOZ – MPO – NRS – SZE Liste 2 : – MAE – POR – RES – PLU – RIS – ZAR – TAM – XES La deuxième liste est bien plus facile à apprendre, parce que les suites de lettres ressemblent à des morceaux de mots, à des suites de lettres courantes dans notre langue. De plus, le fait que ces suites de lettres soient prononçables aide à créer des associations inconscientes avec des sons déjà connus. Cet exemple montre que ce mécanisme d’association peut s’effectuer sur du matériel qui n’a pas vraiment de sens, et qui doit être appris par cœur.

11

2 Comprendre et mémoriser

On peut reproduire ce genre d’expérience non pas avec des pseudo-mots, mais avec des dessins. Pour les expériences sur des dessins, on présentait des dessins sans signification aux sujets. Un premier groupe se faisait poser des questions sur les couleurs du dessin, et l’autre devait inventer une signification pour ce dessin. Le second groupe passait devant, avec un taux de rappel double. Il existe diverses techniques pour faciliter la création de connections et de relations logiques dans la mémoire de l’élève. Cela passe par la création de progressions organisées suivant des critères assez précis, ou par une modification du plan ou des explications d’un cours. Par exemple, diverses études ont montré que les élèves qui révisent leurs leçons par cœur ont des résultats scolaires nettement moins bons que leurs camarades qui préfèrent reformuler, résumer ou synthétiser leurs leçons. Et oui, je suis désolé pour vous si vos méthodes de révisions favorites reposent sur le par cœur et la simple relecture de vos cours, mais va falloir changer de méthode… Dans les grandes lignes, il existe deux grands moyens pour créer des associations : – soit par apprentissage par cœur ; – soit en reliant le matériel à apprendre avec des connaissances antérieures. ##### Assimilation Relier le matériel à apprendre à des connaissances antérieures implique souvent du matériel qui a un sens : celles-ci sont destinées à la mémoire sémantique. Dès que l’on souhaite apprendre des concepts, des catégories, des faits, etc ; on ne fait que créer des associations avec des connaissances en mémoire à long terme. Avec l’assimilation, les liens sont souvent des relations logiques, qui relient deux informations sur un critère qui a du sens. Ces relations permettent : – de classer les informations, en les reliant à une catégorie ; – de relier des informations qui se ressemblent, ou qui sont totalement opposées ; – de relier deux objets via des liens logiques, qui relient deux informations sur un critère qui a du sens. Les relations qui permettent de classer les informations, de les relier à une catégorie sont des relations catégorielles. On peut notamment citer :

– les relations d’inclusion : tel concept est un sous-ensemble d’un concept plus général, ou un sur-ensemble d’un concept plus concret ; – les relations d’appartenance : tel exemple est un membre d’une catégorie ; – les relations descriptives : tous les membres d’une catégorie possèdent telle ou telle propriété. On peut aussi ajouter des relations de ressemblance et d’opposition. Les relations de ressemblances vont relier des informations qui se ressemblent. Par exemple : – liquide sera relié avec fluide ; – vomitif sera relié avec dégoutant ; – simple sera relié avec facile ; – etc. Les relations d’opposition vont relier des informations qui s’opposent. Par exemple : – chaud sera relié à froid ; – dur sera relié avec mou ;

12

2.2 Faire des liens

– etc. A coté, on trouve les associations logiques, qui relient deux objets via des liens logiques. Les plus importantes sont les associations de causalité qui relient une cause à son effet, et naissent quand on explique le pourquoi des choses. Le processus qui se cache derrière l’assimilation est donc l’encodage sémantique : deux informations sont reliées parce qu’elles ont un lien logique ou catégoriel entre elles. ##### Apprentissage par cœur A coté de ces relations, on trouve des associations, qui naissent quand deux informations sont souvent présentées en même temps. Ces associations nous permettent d’apprendre des informations qui n’ont pas de sens : listes de chiffres, listes de lettres, etc. Cet apprentissage par co-occurence s’appelle l’encodage spécifique. Ces associations naissent à force de répétition, et se forment essentiellement par apprentissage par cœur. Les expériences ont clairement montré que la répétition par cœur sert uniquement à maintenir le matériel à apprendre en mémoire de travail plus longtemps, permettant ainsi de créer quelques associations résiduelles. Par exemple, essayez de réciter l’alphabet à l’envers : vous aurez nettement plus de mal qu’en le récitant dans l’ordre. C’est du au fait que l’on a appris l’alphabet dans l’ordre, en commençant par la première lettre A. Dans ces conditions, les associations qui se sont crées ont relié des mots proches, présents en même temps dans la mémoire de travail. Ce mécanisme est cependant nettement moins efficace que l’encodage sémantique : là où l’encodage sémantique crée un grand nombre d’associations, l’encodage spécifique donne naissance à un très faible nombre d’associations. La conséquence est que l’apprentissage par cœur est nettement plus fragile : le matériel appris par cœur est relativement isolé et est difficilement accessible. Cela permet aussi d’expliquer pourquoi les connaissances comprises semblent plus facilement réutilisables dans des situations non-familières que les informations apprises par cœur : voir à ce sujet l’étude nommée Rote memorization, understanding, and transfer : an extension of Katona’s card-trick experiments, ou l’étude de Hilgard, Ernest R., Irvine et Whipple (1953).

2.2.2 Connaissances antérieures : la matière première L’ensemble des connaissances antérieures, ainsi que des associations qui les relient est aujourd’hui appelé la mémoire sémantique. Et son contenu est déterminant pour l’apprentissage. Avec ce que l’on vient de voir, il est facile de déduire que l’apprentissage est un processus cumulatif dans lequel le savoir appelle le savoir : plus on sait de choses, plus on pourra facilement relier de nouvelles informations à des connaissances antérieures. Apprendre de nouvelles définitions, ou de nouveaux concepts est ainsi plus facile dans un domaine familier. Là où un novice aura du mal à apprendre des définitions ou des connaissances de base, l’expert pourra facilement retenir de nouvelles informations en les reliant facilement à ce qu’il sait déjà. Une grande partie des mauvais résultats des élèves proviendrait d’ailleurs d’une mémoire sémantique trop pauvre, qui empêcherait à l’élève d’associer efficacement de nouvelles informations à des concepts déjà connus. Ce fait est bien illustré par les études d’Alain Lieury, qui montrent que la corrélation entre moyenne scolaire et connaissances encyclopédiques en classe

13

2 Comprendre et mémoriser

de 5ème est de 0.72. La corrélation est la même avec le taux de redoublement 4 ans plus tard, ce qui est plus élevé que les corrélations avec les tests de QI ou de raisonnement (0.50). Cette importance des connaissances antérieures nous dit donc qu’apprendre beaucoup de choses permet de donner une bonne base aux apprentissage futurs[2][3]. Le professeur doit donc donner un cours magistral bien rempli, fournir des explications complémentaires, multiplier les anecdotes, voir chaque notion dans le détail au lieu de survoler, etc. #### Pré-requis Si toute nouvelle notion doit être associée à des connaissances antérieures, encore faut-il que ces notions préalables soient là. Il est donc évident que chaque explication ou chaque notion a des pré-requis, nécessaires pour la compréhension. Pour éviter de construire sur des fondations qui ne sont pas là, le professeur doit impérativement faire en sorte de construire ses progressions pour éviter de faire référence à des pré-requis non abordés. Et c’est parfois plus facile à dire qu’à faire, avec certains programmes scolaires. #### Rappels Ceci dit, il ne faut pas croire que les élèves vont relier automatiquement ce que l’on souhaite leur apprendre avec leurs connaissances antérieures : nombreux sont ceux qui, même s’ils disposent des connaissances requises, ne les utilisent pas en situation d’apprentissage. Il faut dire que créer des associations entre deux concepts demande souvent (pas toujours) d’avoir ces deux concepts dans la mémoire de travail. Si les connaissances antérieures ne sont pas suffisamment activées, elles ne pourront pas facilement être évoquées, rappelée : elles auront du mal à passer en mémoire de travail quand ce sera nécessaire. Pour éviter ce genre de situation, il est nécessaire d’ activer les connaissances antérieures par des rappels, histoire que les élèves comprennent que les notions rappelées ont de liens avec ce qui va suivre. Ces rappels sont aussi utiles pour les élèves qui ont oublié ou qui n’ont pas réussis à mémoriser les pré-requis : pour associer à des connaissances antérieures, encore faut-il que celles-ci soient présentes en mémoire. Ces rappels sont malheureusement trop souvent négligés par les professeurs traditionalistes. Or, dans l’idéal, ces rappels doivent être systématiques : on doit y avoir droit à chaque cours. Cette technique donne de bons résultats d’après les méta-analyses faites sur le sujet[4]. Un bon cours commence donc fatalement par des rappels de pré-requis. #### Explications La première étape de l’apprentissage consiste simplement à apprendre des catégories et concepts relativement génériques, qui seront utilisés comme base des apprentissages futurs. Pur cela, il suffit d’utiliser les conseils données dans le chapitre précédents, afin d’enseigner ces catégories de manière optimale. Évidemment, cette phase d’apprentissage des concepts est suivie d’une phase durant laquelle le vocabulaire est introduit : il faut bien nommer les concepts en question pour pouvoir les réutiliser plus facilement pas la suite. Les concepts nommés peuvent ainsi être étiquetés par des noms, ces noms pouvant faire référence à un concept directement. Assimiler des faits est l’étape suivante de l’apprentissage. Les faits en question sont simplement des ensembles composés de connections entre plusieurs catégories ou faits pré-existants. Il va de soit que les faits sont donc des informations qui ne doivent pas précéder l’apprentissage des concepts et catégories, mais les suivre. La forme la plus élaborée d’assimilation consiste à extraire de nouvelles informations à partir de connaissances antérieures. En clair, cela consiste à déduire ou expliquer des concepts, des faits, ou des relations à partir de ce qui est déjà connu. Ces explications mettent souvent l’accent sur les relations de cause à effet, et permettent donc de créer des associations de causalité, des associations qui naissent quand on explique pourquoi les choses sont ce qu’elles sont, d’où

14

2.2 Faire des liens

sortent les faits appris dans le cours, quelles sont les raisons et les principes physiques derrière les choses, comment les déduire à partir de principes de base, etc. Les explications qui élaborent le plus possible sont à opposer aux explications typiques des professeurs traditionalistes : ces dernières sont très descriptives, admettent beaucoup, et n’expliquent pas le pourquoi les choses. En effet, faire des liens est une nécessité, trop souvent négligée par les professeurs traditionalistes, pour qui le processus de mémorisation et la compréhension sont considérés comme séparés. Ceux-ci considèrent qu’il faut mémoriser des faits avant de les comprendre, et cela donne des cours qui admettent beaucoup, qui sont descriptifs, « académiques ».

2.2.3 Catégoriser pour mieux comprendre Organiser le plan d’un cours est une tâche qui peut sembler assez peu technique. Il ne semble pas y avoir de règles spécifiques qui permettent de créer un bon plan de cours. Toutefois, on vient de voir que la progression devait faire attention aux pré-requis des notions abordées : les pré-requis d’une notion doivent précéder celle-ci. #### Catégoriser Mais il existe une seconde recommandation, qui consiste à organiser son pan autour d’une hiérarchie de catégorie. Le but est de classer le matériel à apprendre, de l’organiser en suivant des critères de classification précis. Prenons un exemple particulièrement stupide, pour introduire le concept : essayez de deviner laquelle des deux listes suivante fonctionne le mieux. Liste 1 : – vache – cheval – poney – poulain – cochon – rat – souris – lézard Liste 2 : – vache – cochon – poulain – souris – cheval – lézard – poney – rat Les expériences en laboratoire nous disent que la première est nettement plus facile à mémoriser, d’environ 80%. L’astuce, c’est que les mots de la première liste sont classés par catégories : cela permet la création d’associations catégorielles lors de la mémorisation. Techniquement, plus le matériel à apprendre est organisé autour d’une structure cognitive, meilleur est son rappel et sa compréhension : comprendre, c’est classer.

15

2 Comprendre et mémoriser

Et ce genre de chose fonctionne pour tout type de matériel, et pas seulement pour des listes de mots : on peut appliquer ce principe pour concevoir la progression d’un cours. Toute création de plan ou de progression doit tenir compte de cette organisation hiérarchique, et doit tenter de la respecter au maximum. Dans le pire des cas, le professeur peut donner directement cette taxonomie aux élèves, sous la forme de schémas. Pour comprendre comment organiser le matériel sur ce genre de principe, nous allons devoir regarder comment les concepts sont classés dans la mémoire. #### Structures cognitives Selon la théorie d’Ausubel, les concepts sont classés dans des hiérarchies de catégories, spécifiques à un domaine. L’ensemble forme une hiérarchie basée sur des relations d’inclusion : une catégorie est reliée à une autre si elle est une sous-catégorie ou une sur-catégorie. Une telle hiérarchie, une fois construite en mémoire sémantique, est appelée une structure cognitive.

On peut voir le tout comme un système de poupées russes : les catégories plus spécifiques sont incluses, emboitées dans les catégories plus générales du niveau supérieur de la hiérarchie. Cette organisation hiérarchique différencie progressivement les concepts vus du général vers le concret. Assimiler consiste simplement à arrimer les nouvelles connaissances au bon endroit dans cette hiérarchie : il faut arrimer chaque nouveau concept à des catégories qui ne soient ni trop générales ni trop spécifiques. Choisir l’endroit où placer un nouveau concept dans cette structure est la base de la création d’un plan ou d’une progression : cela demande de convenablement classer chaque concept, de le catégoriser. #### Déduction contre induction D’après la théorie d’Ausubel, il existe deux manières pour assimiler une telle hiérarchie. La première méthode consiste

16

2.2 Faire des liens

à commencer tout en haut, et à redescendre progressivement : on commence par aborder les concepts les plus généraux, avant de progressivement passer aux détails et aux concepts plus concrets. Cette méthode demande de différencier progressivement des concepts généraux en concepts plus concrets : elle demande d’aborder un concept général avant de montrer les différences entre sous-concepts associés. C’est la technique de la différentiation progressive. Une autre méthode possible consiste à partir du bas, et à remonter progressivement : on part alors des concepts les plus concrets, et on tente d’abstraire des concepts plus généraux. Cette méthode demande de montrer des similarités entre concepts pour en abstraire un concept plus général. C’est la méthode de la réconciliation-intégration.

2.2.4 Advances organisers Pour faciliter relier de nouvelles informations aux connaissances antérieures, Ausubel a inventé ce que l’on appelle des advances organisers. L’idée de ces advances organisers est d’introduire le cours par une sorte de petite introduction, introduction qui donnerait des informations clés. Pour former un advance organiser, ces informations doivent : – permettre de mieux organiser les nouvelles informations ; – servir d’indice de structuration pour les prochaines notions ; – et servir de liant pour la suite du cours. #### Expositives advances organisers Le premier type d’advances organisers s’utilise pour introduire des domaines ou concepts totalement nouveaux, et qui sont difficiles à associer à une structure cognitive pré-existante. Le principe est simplement d’enseigner le concept le plus haut de la structure cognitive en premier. Cela consiste à introduire le contexte du domaine, à introduire les concepts les plus abstraits et généraux en premier. Il s’agit le plus souvent d’une idée relativement générale. Ces idées générales sur lesquels on peut ancrer de nouveaux concepts facilement, et permettent de voir l’unité, la cohérence d’un domaine particulier : ils permettent de structure la structure cognitive autour d’un concept central, situé tout en haut de la hiérarchie. Ce sont souvent des concepts reliés à beaucoup de voisins, contrairement aux détails qui sont plus isolés : ceux-ci sont donc plus accessibles. Conséquence : structurer les informations autour d’une idée générale permet de favoriser le rappel, et donc la mémorisation. L’influence des idées générales sur la mémoire et la compréhension peut se montrer avec quelques expériences sur l’effet intégrateur du titre. Dans celle-ci, l’expérimentateur constitua trois groupes de sujets, qui devaient tous lire un même texte compliqué : un des groupes de sujets connaissait le titre après avoir lu le texte, tandis que l’autre avait accès au titre avant la lecture. Le groupe qui avait eu accès au titre avant le texte réussissait mieux que l’autre groupe. Cela vient du fait que le titre donne l’idée générale du texte, idée sur laquelle les informations du texte vont venir s’associer progressivement. Le fait que le titre doit être placé avant le texte pour avoir un effet le montre : il n’y a pas beaucoup d’associations retardées, à rebours. On peut s’inspirer de cette expérience en trouvant quelque chose qui soit à un cours magistral ce que le titre est à un texte. Ce quelque chose, ce sont des idées générales, sur laquelle viendront s’agglomérer des “détails”. Ces informations générales données en début de cours sont appelées des expositives advances organisers.

17

2 Comprendre et mémoriser

Pour donner un exemple d’expositives advance organiser, on peut prendre celui que j’ai utilisé pour introduire ce cours : Apprendre, c’est avant tout une question de mémoire : si un élève ne retient pas ce qui a été vu en classe, il n’apprend pas. A ce petit jeu, les recherches sur la mémoire permettent de donner des conseils directement applicables en classe Ces expositives advances organisers donnent de bons résultats d’après les méta-analyses faites sur le sujet[7]. La littérature sur les expositives advances organisers est relativement fournie, et s’en inspirer serait une bonne chose pour nombre d’enseignants. #### Comparative advance organiser Quand l’élève est relativement familier, et possède suffisamment de connaissances antérieures, une autre forme d’advance organiser peut être utilisée : le comparative advance organiser. Celui-ci est simplement un concept déjà connu avec lequel on va comparer le concept à apprendre. Ce processus de comparaison peut prendre la forme d’une analogie, d’une métaphore, ou d’une comparaison plus classique. L’analogie (et sa cousine, la métaphore) est un processus mental qui permet de relier une situation cible et une relation source. Ces deux situations sont représentées mentalement par des ensembles d’éléments reliés entre eux par des relations. Pour faire une analogie parfaite, les éléments des deux situations doivent être connectés de la même manière dans les deux situations : si deux éléments d’une situation source sont reliés entre eux, alors les deux éléments correspondant dans la situation cible doivent aussi être connectés entre eux par une relation similaire. Les deux problèmes ont donc la même structure, que l’on peut représenter sous la forme de cases reliées entre elles d’une manière bien précise. D’après la structure mapping theory, l’analogie consiste à : – mettre en correspondance chaque élément de la situation cible avec un élément de la situation source (et réciproquement) ; – mettre en correspondance chaque relation de la situation cible avec une relation de la situation source, en gardant la même structure. Toutefois, cette mise en correspondance n’est jamais parfaite : certains éléments ne peuvent pas être mis en correspondance, par exemple. De même, la structure des deux situations n’est pas forcément identique, ce qui n’empêche que les deux structures sont partiellement analogues. Dans ces conditions, il est important d’expliciter les différences entre situation cible et source : leur structure peut ne pas être la même, sans compter que certaines éléments peuvent ne pas avoir de ressemblances. Sans cela, les élèves vont croire que les deux situations ont la même structure, et vont mal transférer : en pensant que la structure de la situation cible est identique à celle de la source, ils vont faire des déductions erronées. Ces erreurs peuvent donner lieu à des transferts négatifs, qui auront tendance à faire comprendre la situation cible de travers.

2.3 Tu dois désapprendre tout ce que tu as appris ! 2.3.1 Conceptions L’erreur a une place spéciale en pédagogie, et nombreux sont les livres écrits sur le sujet. En effet, il est très fréquent que des connaissances antérieures inadaptées perdurent dans le temps et ne s’oublient pas. Dans la littérature anglaise, ces connaissances antérieures inadaptées sont appelés des mis-conceptions, alors que les auteurs français parlent de conceptions. ####

18

2.3 Tu dois désapprendre tout ce que tu as appris !

Types de conceptions Ces conceptions peuvent être classées en plusieurs types. ##### Erreurs de compréhension Ces conceptions peuvent être de simples erreurs de compréhension. D’autres conceptions sont des généralisations abusives d’apprentissages antérieurs, des analogies boiteuses : on réutilise une notion ressemblante au matériel présenté alors que l’on ne devrait pas. L’exemple le plus classique : les faux amis en anglais ! Demandez ce que veut dire actually en anglais à un élève qui ne connait pas ce mot : il vous répondra “actuellement”, alors que actually veut dire “en fait”. Là encore, le professeur peut prendre les devants et concevoir son cours de manière à éviter ces erreurs. ##### Connaissances naïves Mais certaines causes d’erreurs sont nettement plus subtiles, et proviennent du vécu même de l’élève. Et ces erreurs ont une grande importance en pédagogie. Ce chapitre se propose de voir plus en détail ce que sont ces erreurs, et quoi faire pour les corriger. Les conceptions dues au vécu de l’élève sont des idées reçues, des connaissances naïves, tirées de l’expérience. Ces connaissances intuitives naissent spontanément, par observation de l’environnement ou lors d’un apprentissage. Généralement, quand un élève arrive à l’école, il a derrière lui plusieurs années durant lesquelles il s’est construit des modèles implicites du monde, sur les quantités, le poids et la chute des corps, les nombres, etc. En clair : ces conceptions naissent d’un apprentissage par découverte “naturel”, dans lequel l’enfant apprend seul comment se comporte l’environnement qui l’entoure. Comme quoi, la théorie constructiviste elle-même dit explicitement que laisser un élève construire son savoir, par découverte autonome, est une bonne manière de lui faire générer des conceptions qui parasiteront sa mémoire et son intelligence. Pour donner un exemple, je vais citer une expérience faite par Laurence Viennot : celle-ci a interrogé des élèves de terminale S, de DEUG (oui, l’étude date…), et de maitrise, en leur posant la question suivante : Quand on lance une balle en l’air, quelle forces s’appliquent quand celle-ci monte et descend, frottements mis à part ? Au final, 55% des élèves de terminale et 33% des étudiants de DEUG pensaient qu’il y avait deux forces : ils utilisaient un modèle de force naïf, qui relie fortement la force à la vitesse. En réalité, il n’y a qu’une seule force : la pesanteur…Pourtant, ces étudiants connaissaient la définition technique d’une force et savaient l’utiliser dans des exercices académiques. Mais dans la situation de l’interrogation, c’était la conception qui était la plus automatisée et prenait le dessus. Autre exemple, un peu plus complexe : le courant électrique est souvent mal compris. Par exemple, si vous posez la question suivante aux élèves : “on branche une dizaine d’ampoules en série, et une autre dizaine en parallèle : quel est le montage qui éclaire le mieux ?”, les élèves répondront souvent que ce sera le montage série : les élèves pensent que le courant ne se séparera pas en deux (ce qui arrive avec les bifurcations dans le montage parallèle), ce qui est faux. Le problème dans ce cas précis, provient de la conception du courant électrique, considérè comme un ensemble matériel produit par la pile à débit constant. Et on trouve un grand nombre de conceptions du genre, dans l’enseignement. Pour l’exemple de la physique :

19

2 Comprendre et mémoriser

– un kilo de plomb est plus lourd qu’un kilo de plume (confusion poids densité), – si une fusée spatiale qui voyage dans le vide coupe ses moteurs, la fusée va freiner (mauvaise compréhension du principe d’inertie), – les corps tombent dans le vide à une vitesse qui dépend de leur poids, – les lasers sont faits d’ondes sonores, – les électrons sont plus grands que les atomes, – le Soleil tourne autour de la Terre (pour les plus jeunes), – le jour et la nuit sont causés par la rotation de la Terre autour du Soleil (pour les moins jeunes), – l’espace a un haut et bas absolu : ceux qui sont au pole nord devraient tomber vers le pole sud s’il n’y avait pas le sol sous leur pied, – les quatre saisons proviennent de l’éloignement de la terre par rapport au soleil, – etc. Pour ce qui est des mathématiques : – une division entre deux nombres donne un résultat plus petit que le dividende, – une multiplication donne toujours un résultat plus grand que le multiplieur et multiplicande, – etc. En biologie, aussi : – le sexe de l’enfant est déterminé par les gènes de la mère, – les premiers humains ont cohabité avec les dinosaures, – etc. On trouve des misconceptions pour l’enseignement des équations, d’autres pour l’enseignement des équations stœchiométriques, etc. En conséquence, il vaut mieux connaitre ces conceptions pour les corriger, et prendre les devants. Si vous voulez vous renseigner sur le sujet, tapez dans Google : “misconceptions” , suivi du nom anglais du concept que vous souhaitez aborder. Vous verrez que de nombreux documents sont disponibles sur le net. #### Ça sert à quoi de le savoir ? Certaines de ces conceptions sont récurrentes, présentes chez un grand nombre d’élèves. Par exemple, n’importe quel élève assez jeune croit que les corps tombent dans le vide à une vitesse qui dépend de leur poids (alors qu’en fait, tous les corps tombent à la même vitesse dans le vide). De nombreuses recherches en didactiques cherchent à identifier les erreurs de compréhensions courantes. Il faut dire que si le professeur connaît les conceptions les plus courantes, il peut prendre les devants. Sauf que corriger ces erreurs est nettement moins facile que prévu !

2.3.2 Changement conceptuel Les situations où les connaissances antérieurs vont venir perturber l’apprentissage de nouvelles informations sont appelées des interférences. Les pédagogies constructivistes donnent de nombreuses recommandations pour résoudre ces interférences le plus efficacement possible. Par exemple, les méthodes Piagétiennes ont clairement fait la preuve de leur efficacité de ce point de vue : de nombreuses études, résumées dans les méta-analyses de Hattie ont clairement montré que ces méthodes sont d’une grande utilité pour les premiers apprentissages en mathématique (sens du nombre, calcul, mathématiques élémentaires, etc).

20

2.3 Tu dois désapprendre tout ce que tu as appris !

Le processus de résolution de ces interférence est appelé l’accommodation. Et celui-ci ne survient pas tout seul : il ne suffit pas de corriger l’erreur pour que la situation soit réglée. En effet, ce mécanisme d’accommodation fait intervenir l’oubli. #### Interférences Au tout début de l’apprentissage, les connaissances antérieures empêchent la mémorisation de nouvelles idées : l’élève a du mal à assimiler de nouvelles informations, ce qui ralentit l’apprentissage. On parle d’interférence pro-active. Cette interférence peut empêcher la correction de faire son œuvre. Par la suite, cette interférence pro-active se fait de plus en plus faible, et l’effet inverse se produit : des connaissances récentes ont tendance à favoriser l’oubli d’anciennes informations. On parle alors d’interférence rétro-active. A ce moment, les connaissances inadaptées s’oublient progressivement et sont progressivement remplacées par leur correction. Ces interférences ont souvent lieu entre informations assez semblables, que l’on peut confondre : l’interférence est très faible entre informations très différentes ou très ressemblantes. On peut éviter ce genre d’interférence en explicitant les différences entre concepts semblables, montrer en quoi ils différent. Cela demande d’utiliser correctement les relations d’opposition et de ressemblances. Insister sur les différences est notamment très important lors de l’usage d’analogie ou lors de l’apprentissage de concepts ressemblants. Pour comprendre l’origine de l’interférence, il faut faire un petit détour du coté du fonctionnement de la mémoire. Pour rappel, celle-ci est composée d’un réseau d’informations, qui sont activées pour être rappelées. #### Causes de l’interférence Les conceptions ne s’effacent pas du cerveau, même après correction, et gardent leur place dans la mémoire sémantique. Dans ce réseau, la correction et l’erreur sont accessibles à partir des mêmes indices de récupération et entrent en compétition pour le rappel. A partir de là, le cerveau va devoir faire un choix pour décider quelle est l’information qu’il va choisir, ce choix pouvant être plus ou moins pertinent. Et généralement, c’est l’information la plus consolidée en mémoire sémantique qui ressort : la correction passe derrière. Cela a été plus ou moins montré dans l’étude de Andrew Shtulman et Joshua, publiée dans le journal cognition. Dans leur étude, 200 sujets devaient dire si des affirmations étaient vraies ou fausses le plus rapidement possible, et les temps de réaction étant mesurés. Parmi ces affirmations, certaines étaient conçues de manière à évoquer des conceptions : les temps de réaction et le taux d’erreur étaient plus élevés pour les affirmations qui évoquaient des conceptions. Cet effet d’interférence est de confirmé par des observations d’imagerie cérébrale. Dans une étude[1], les chercheurs analysaient le cerveau de novices et d’experts en électricité. Ces deux groupes devaient résoudre deux types d’exercices : certains étaient conçus de manière à forcer l’utilisation d’une conception, et les autres non. Cette étude montre que chez le novice, les informations incohérentes avec la conception sont d’abord interprétées par le cerveau comme des erreurs et sont passés sous le tapis. Par contre, les zones du cerveau qui s’activaient chez les experts sont celles qui servent à empêcher le rappel d’une connaissance depuis la mémoire à long terme. En clair, la conception était encore présente dans le cerveau des experts, mais le cerveau se chargeait d’en empêcher le rappel et l’utilisation.

2.3.3 Implications pédagogiques Première déduction : il faut absolument éviter l’apparition d’erreurs et de conceptions, et faire en sorte que les connaissances des élèves soient les plus fiables possibles : toute connaissance

21

2 Comprendre et mémoriser

apprise ne doit pas interférer avec des apprentissage ultérieurs. Ce qui est appris doit être fiable dès le départ et ne doit pas être remis en cause dans les apprentissages ultérieurs (même plusieurs années après). Les pédagogies actives sont toutes une véritable catastrophe de ce point de vue : les élèves procèdent par séries d’essais et d’erreurs, chaque erreur étant mémorisée. La progression est donc très lente, les élèves assimilant des connaissances boiteuses, des erreurs de compréhension et des erreurs procédurales par paquets. Une autre solution à ce petit problème pourrait être de corriger au plus vite des erreurs et misconceptions : il ne faut pas laisser l’erreur s’installer. Pour cela, le professeur doit se réserver une période de feedback, qui permet aux élèves d’identifier leurs erreurs de compréhension et de les corriger. Dans cette phase, le professeur va tester les élèves avec des questions de compréhension, voire par une série d’interrogations écrites. La solution privilégiée est l’utilisation massive d’interrogation écrites fréquentes. Pour corriger les conceptions, la recherche recommande d’utiliser une stratégie assez spécifique, composée de quatre étapes : – expliciter la conception aux élèves, la faire émerger ; – donner des exemples où cette conception est mise en défaut ; – donner la correction, et aborder la connaissances qui doit remplacer cette conception ; – montrer en quoi cette connaissance permet de résoudre les problèmes abordés dans la seconde étape. Une dernière stratégie de correction a déjà fait ses preuves : l’analogie. En effet, si un nouveau concept est mal compris à cause d’une conception quelconque, on peut faire une analogie entre ce nouveau concept et une situation déjà connue (qui n’a pas de conception). Dans cette situation, cela permet ainsi à l’élève de bien voir que ce qu’on souhaite lui apprendre est cohérent avec ce qu’il sait déjà, et donc que c’est la conception qui pose problème.

2.4 Transfert d’apprentissage 2.4.1 Transfert lointain Pour ce qui est des transferts entre domaines différents, cela semble douteux. De manière générale, il n’existe pas de transferts lointains, dans lesquels un apprentissage dans un domaine influence des apprentissages dans un autre domaine très différent. Les expériences sur le sujet nous disent clairement qu’il n’existe pas de compétences générales : toute pensée se base sur des connaissances spécialisées. La rigueur, la logique, la concentration, l’abstraction, la capacité à résoudre des problèmes, la capacité à lire un texte, etc : il y a de bonnes chances que ces compétences n’existent pas. Ou alors, ces compétences ne sont pas vraiment ce que l’on croit. #### Expériences Les études faites sur l’apprentissage de la programmation[1][2] montrent que celui qui apprend à programmer apprend juste à programmer, et n’acquiert pas de méthodes de résolution de problèmes, de capacité à raisonner ou à abstraire, ni quoique ce soit d’autre. Même chose pour le latin[3][4], qui, contrairement aux idées reçues, ne permet pas de favoriser la mémoire, ou de structurer l’esprit.

22

2.4 Transfert d’apprentissage

Différents programmes éducatifs ont ainsi tenté d’enseigner le raisonnement en mettant fortement l’accent sur la logique mathématique, avec ses implications, modus tollens, etc. Malheureusement, les résultats de ces programmes furent décevants : les élèves n’avaient pas vraiment appris à mieux raisonner, et les améliorations étaient au mieux marginales. Ces expériences ne furent pas les seules tentatives pour entrainer des élèves ou des adultes à mieux raisonner. Mais les résultats concernant ce genre d’entrainement sont clairs : cela ne permet pas d’acquérir des compétences de raisonnement transférables dans des situations différentes de celles abordées lors de l’apprentissage. Ceux qui pensent qu’un entrainement spécifique au raisonnement pourrait permettre d’entrainer une capacité générale à raisonner font fausse route. Et des études dans le genre, on en a des tonnes. #### Pourquoi si peu de transferts lointains ? Pourquoi il y a-t-il aussi peut de transferts lointains ? Il y aurait bien une raison : quand on réfléchit, pense, ou raisonne, on utilise diverses stratégies de raisonnement ou de résolution de problème. Il existe bien des stratégies de raisonnement ou de résolution de problème générales, applicables dans des classes très générales de problèmes ou de raisonnements. Mais manque de chance, ces stratégies ne s’apprennent pas vraiment : n’importe quel être humain sait déjà les utiliser naturellement, sans qu’on aie besoin de les lui apprendre. On ne peut pas vraiment entrainer ces stratégies générales pour les rendre plus efficaces ou les appliquer plus facilement. Si l’on regarde ce qui se passe chez les experts dans un domaine ou sous-domaine, on remarque que le transfert se base sur des stratégies et connaissances apprises, spécifiques à un domaine ou une classe de problèmes. On rentre dans le cas du transfert spécifique, dans un domaine, voire sous-domaine.

2.4.2 Transfert proche Lorsqu’une connaissance spécifique est réutilisée pour comprendre une situation dans un même domaine ou un domaine voisin, on parle de transfert proche. #### Connaissances transférables De manière générale, les connaissances qui se transfèrent ne sont pas des détails ou des informations qui ont peu de sens : ce sont des connaissances abstraites, des principes, des idées, des informations générales. Pour en donner un exemple, on peut citer la fameuse étude de Chi et al. (1981). Leur étude a montré que les étudiants en physique ont tendance à baser les exercices sur la base de détails présents dans l’énoncé : coefficients numérique, vocabulaire utilisé, présence de plans inclinés, etc. En comparaison, les professeurs ont tendance à les classer en fonction d’idées générales et de principes abstraits : loi de conservation de l’énergie, etc. Au fur et à mesure que les étudiants progressent dans leurs études, il classent de plus en plus ces exercices en fonction des caractéristiques générales. ##### Transfert catégoriel Le premier exemple de transfert de ce type se base sur le transfert de catégories : quand on reconnait qu’un élément d’un problème appartient à une catégorie déjà connue, on peut transférer les informations reliées à cette catégorie et les attribuer à l’élément en question. En conséquence, plus on dispose de catégories et de concepts bien formés dans notre mémoire sémantique, mieux c’est. Varier les exemples travaillés et les exercices permet ainsi de créer des connaissances génériques, facilement réutilisables dans de nombreuses situations. C’est ce que l’on nomme l’effet de variabilité. ##### Transfert par analogie Autre forme de transfert : le transfert par analogie : on repère des ressemblances entre une situation source et une situation cible, ce qui

23

2 Comprendre et mémoriser

permet d’élaborer une analogie entre ces deux situations. Ce mécanisme de transfert par analogie est utilisé inconsciemment chez les experts : ceux-ci résolvent tout nouveau problème par analogie avec des problèmes déjà connus. #### Accessibilité en mémoire Si les connaissances et stratégies sont une base du transfert, les posséder ne suffit pas : il faut s’en rappeler au moment voulu. Pour transférer des informations acquise avec une situation source dans une situation cible, l’information doit être accessible à partir des indices de récupérations présents dans la situation cible. C’est ce qu’on observe chez de nombreux experts : leur mémoire sémantique est configurée de manière à accéder le plus rapidement possible aux informations pertinentes pour résoudre le problème donné, ou effectuer la tache demandée. Leurs réseaux sémantiques sont particulièrement bien élaborés, contiennent beaucoup de connaissances, beaucoup d’associations, et celles-ci sont particulièrement pertinentes. A ce petit jeu, apprendre par cœur donne évidemment de moins bons résultats que la compréhension[5] : comprendre est une des première base du transfert.

24

3 Les portes d’entrée de la mémoire 3.1 On est assez limités, quand même ! 3.1.1 Charge cognitive Plus une information à apprendre est composée d’un grand nombre de sous-éléments qui interagissent entre eux, plus elle aura tendance à saturer la mémoire de travail. Le nombre d’éléments présents en mémoire de travail s’appelle la charge cognitive : plus elle est élevée, moins la tache ou le concept abordé est facile. Pour prendre un exemple, un calcul compliqué demande toujours de maintenir temporairement trop de résultats temporaires. Pour vous en rendre compte, essayez avec 4565 * 891 : votre mémoire de travail ne peut pas stocker tous les résultats temporaires nécessaires pour mener à bien ce calcul. Les performances en calcul mental peuvent s’expliquer partiellement par la gestion de la charge cognitive. Par exemple, le calcul de 45 * 37 sera très facile pour quelqu’un qui a mémorisé toutes les tables jusqu’à celle de 100, et qui connait des raccourcis de calcul. Les spécialistes en calcul mental ont tous mémorisé un grand nombre de résultats spécifiques qu’ils peuvent réutiliser au besoin sans avoir besoin de les recalculer. Et cela joue aussi sur l’acquisition du calcul mental chez les élèves de primaire ou les écoliers : leurs performances en calcul mental dépendent fortement de la mémorisation d’un grand nombre de faits mathématiques fortement reliés entre eux. De plus, les informations à mémoriser ne sont pas les seules à utiliser la capacité de la mémoire à court terme : les relations que ces informations entretiennent entre elles vont aussi prendre de la place. Par exemple essayez de dire si la phrase suivante est vraie ou fausse : – Le grand-père des frères de mon père est-il le fils du frère de mon grand-père ? Difficile, non ? C’est parce le nombre d’éléments et de relations qu’il entretiennent est supérieur à ce que peut supporter la mémoire de travail. Or, la mémoire de travail est utilisée pour comprendre ce que raconte un professeur, un texte, etc. Lors de cette compréhension, les informations à apprendre sont maintenues en mémoire de travail, afin d’être associées et reliées à des connaissances antérieures, et de faire des déductions. Plus il y a de place en mémoire de travail, plus l’élève peut faire de connections et d’inférences. En conséquence, si une tache d’apprentissage sature la mémoire de travail, l’apprentissage se passe mal, voire n’a pas lieu. Par exemple, comprendre la transitivité (A -> B -> C) demande de maintenir en mémoire de travail A, B, C, et les relations A->B, et B->C. Les enfants de 4 à 6 ans ont du mal dans cette situation parce que leur mémoire de travail est la moitié de celle des adultes. D’ailleurs, de

25

3 Les portes d’entrée de la mémoire

nombreuses expériences ont reliées l’évolution de la pensée chez l’enfant avec la capacité de la mémoire de travail[1]. Ces dernières années, quelques études ont montré que la réussite scolaire est fortement corrélée à la capacité de la mémoire de travail : cette dernière est un bon indicateur de la réussite scolaire ultérieure pour les enfants de 5 ans[2]. De même, il existe une forte corrélation entre faible capacité de la mémoire de travail et échec scolaire[3]. Les pédagogies actuelles ne tiennent pas en compte la mémoire de travail : suivant le cours ou le professeur, on peut obtenir du très bon, ou du très mauvais. Les pédagogies actives, dans lesquelles l’élève doit réfléchir de manière autonome, sont une catastrophe de ce point de vue, ce qui explique que les études sur le sujet montrent clairement qu’elles ont des résultats assez mauvais[4]. Ces constatations récentes remettent sur le devant de la scène une ancienne théorie pédagogique : la théorie de la charge cognitive. Crée par Sweller dans les années 1970, cette théorie a reçue de nombreuses vérifications expérimentales. Assez mal connue en France, cette théorie commence à avoir une grande influence dans les pays anglo-saxons.

3.1.2 Diminuer la charge cognitive La théorie de la charge cognitive nous dit qu’il existe différents types de charge cognitive : – tout apprentissage possède une charge cognitive minimale, composée des éléments indispensables pour comprendre le matériel à apprendre : la charge intrinsèque ; – a coté, on trouve une charge superflue, inutile pour l’apprentissage : la charge extrinsèque. On peut intuitivement diminuer la charge extrinsèque en allant à l’essentiel et en éliminant les informations superflues. Une expérience faite par Richard Mayer permet d’illustrer ce phéno-

mène. L’expérience a comparé deux versions d’un texte scientifique, dont l’une était expurgée des informations quantitatives : cette dernière était nettement mieux retenue et comprise. La charge intrinsèque est relativement difficile à manipuler. Mais contrairement à ce que l’on pourrait penser, ce n’est pas impossible. Et la théorie de la charge cognitive fournit quelques conseils à ce sujet. #### Segmentation Première solution : segmenter les explications. Pour résumer, le plan du cours et des explications doivent être découpées en petites unités notionnelles, chacune de ces unité devant respecter les limitations de la mémoire de travail, qui tourne autour de 3 à 4 informations, mémorisée durant 20 secondes maximum. Concrètement, comment découper les explications pour tenir compte de la charge cognitive ? Pour cela, j’ai une technique, qui demande toutefois d’écrire le cours sur papier ou sur ordinateur : – lors de la rédaction, il faut découper le texte du cours en paragraphe de 4/5 lignes (parfois moins) ; – chaque paragraphe doit être centré autour d’une seule et unique idée bien précise ; – les phrases dans ce paragraphe doivent s’enchainer, chaque phrase poursuivant l’idée de la phrase précédente ; – les paragraphes doivent s’enchainer, chaque paragraphe devant suivre l’autre dans un ordre logique. En utilisant ce découpage en paragraphes cohérents très courts, on devrait obtenir un découpage suffisant.

26

3.1 On est assez limités, quand même !

Cette technique de segmentation s’applique aussi pour enseigner les procédures de résolution de problèmes : on peut décomposer les procédures en petites unités procédurales pour mieux gérer la charge cognitive. Par exemple, il vaut mieux segmenter une procédures en 8 sousprocédures très simples qu’en 2 sous-procédures complexes. Par exemple, regardons l’apprentissage de la multiplication. Les cours actuels abordent celle-ci d’un seul bloc : d’abord on apprend les tables, et ensuite on apprend à multiplier deux nombres entre eux. Il n’y a pas d’étapes intermédiaires. Un professeur doit chercher à découper l’algorithme de multiplication en sous-étapes qu’il combinera ensemble : – Il commencera avec les tables de multiplication. – Puis il expliquera comment multiplier un nombre par une puissance de dix. – Puis il utilisera les deux étapes précédentes pour obtenir l’algorithme qui permet de multiplier un nombre à un chiffre par un autre nombre à plusieurs chiffres. – Puis il réutilisera les deux étapes précédentes pour indiquer comment calculer un produit partiel. – Et enfin, il terminera avec l’étape de multiplication proprement dite : calculer plusieurs produits partiels, et les additionner. #### Séparation théorie/pratique Une autre solution consiste à séparer l’apprentissage des connaissances théoriques et l’acquisition des règles de production (comment faire). Ainsi, les explications du cours doivent être coupées en deux grandes parties : – la partie théorique transmet des connaissances théoriques, abstraites, pourtant sur des idées générales, des principes, des idées ; – la partie pratique aborde les informations nécessaires pour résoudre des problèmes, à travers des exercices ou exemples. Ce conseil vient du fait que les connaissances qui portent sur les connaissances théoriques ont souvent une forte charge cognitive : voir ces connaissances en même temps que les connaissances liées aux procédures risque de faire saturer la mémoire de travail. Diverses expériences faites par Sweller et ses collègues, ont montré que cette séparation augmentait la compréhension et la mémorisation. #### Isolated/interacting element effect Cependant, il existe un autre principe pédagogique recommandé par la théorie de la charge cognitive, qui permet de créer des progressions et explications nettement plus simple à comprendre. Là encore, le but est de diminuer la charge intrinsèque du matériel à apprendre. Cette recommandation se base sur le fait que les limites de la mémoire à court terme semblent s’évanouir quand on est face à une situation familière. Par exemple, les experts dans un domaine peuvent retenir de grande quantités d’informations et traiter celle-ci plus facilement, mais cette capacité est limitée à leur domaine d’expertise. Par exemple, quand on présente une configuration de jeu à un joueur d’échec expert, il a tendance à mémoriser 4 à 5 fois plus de pièces qu’un novice. Mais cela ne vaut que pour des configurations familières : devant une configuration aléatoire, très peu courante dans le jeu, l’expert en échec tombe au même niveau que le novice. Cette constatation a été vérifiée dans une grande quantité de domaines différents, comme l’expertise médicale, la programmation, la conception de circuits électronique, ou l’expertise mathématique. ##### Chunking Cela vient du fait que les experts ont tendance à faire des regroupements : ils perçoivent des motifs qui permettent de regrouper plusieurs éléments en une seule entité dans la mémoire à court terme. Toute information prise comme un tout en mémoire à court terme est appelée des chunks. Ce mécanisme de regroupement a toutefois des limites : il ne fonctionne que quand le regroupement forme une entité déjà présente en mémoire à long terme. Ce mécanisme de chunking

27

3 Les portes d’entrée de la mémoire

fonctionne uniquement parce que toute connaissance présente en mémoire à long terme, est prise comme un tout en mémoire de travail. C’est ce qui explique qu’il est plus facile d’apprendre une liste de vrais mots que de faux mots. Par exemple, mémorisez les suites de mots suivantes : – shampoing, voiture, champ, bal, lance-roquette – rata, scronno, munu, carrac, shullp On voit bien avec cet exemple que les mots sont traités un tout, tandis que des concaténations de syllabes peu familières ne le sont pas. Comme autre exemple, essayez de vous souvenir de ces deux phrases, mot pour mot : – le chasseur a tué un lapin, et a fini par le manger – lapin le a chasseur tué un, fini a et par manger le Plus dur pour la seconde, non ? Pourtant, les deux comportent les mêmes mots. Simplement, le fait d’assembler les mots dans une phrase a permit au processus de regroupement de fonctionner : la phrase est traitée comme un tout, contrairement à la liste de mots. Ce concept de chunk a ensuite été observé dans d’autres situations, qui montrent que ces chunks peuvent parfois avoir un sens plus ou moins caché. Dans les faits, n’importe quel assemblage de connaissances familière, déjà présente dans notre mémoire, est un chunk. On peut se représenter ces chunks par des ensembles de cases, chaque case représentant un élément de l’objet ou du système. Fait intéressant, un tel chunk a une organisation plus ou moins hiérarchique : chaque cases peut contenir des des chunks plus élémentaires, qui sont eux-mêmes potentiellement constitués de sous-chunks, et ainsi de suite. Pour donner un exemple, on peut prendre les recherches d’Egan and Schwartz (1979) sur la mémorisation d’un circuit électronique . Tandis que les novices se rappelaient de chaque pièce indépendamment, les experts regroupaient résistances, condensateurs, et bobines dans un souscircuit qui correspond à un amplificateur de tension ou de courant. Je ne vous cache pas que l’on peut en déduire quelques conseils pour l’enseignement de l’électronique… Ces regroupements peuvent non seulement rassembler plusieurs informations, mais ils vont aussi encapsuler les liens logiques entre ces informations : les relations logiques et les associations d’idées qui relient les différents éléments du chunk font partie du chunk. Ces chunks évolués sont simplement des portions activées de la mémoire sémantique : tout ensemble d’informations qui est activé en mémoire par le mécanisme de rappel constitue un tel chunk. Ces chunks sont simplement un ensemble d’informations reliées entre elles dans la mémoire sémantique : les informations du chunk sont fortement reliées entre elles, mais ne sont presque pas connectées avec des informations situées hors du chunk (ou alors, ces liaisons sont faibles). Ces liens peuvent alors être utilisés dans des taches de raisonnement ou de déduction sans utiliser de mémoire de travail supplémentaire : ces liens sont déjà mémorisés et sont récupérés tels quels, sans avoir besoin d’utiliser de la puissance de calcul en mémoire de travail. Cela facilite compréhension, réflexion, raisonnement, et résolution de problèmes. Par exemple, un chimiste qui reconnait une fonction Amine ou Carboxyle dans une molécule saura immédiatement en déduire un grand nombre d’informations : les réactions chimiques possible avec telle ou telle molécule, par exemple. Ces fonctions Amine ou Carboxyle sont réellement des chunks comme les autres dans notre cerveau.

28

3.1 On est assez limités, quand même !

Dans le cas de la résolution de problème, ces regroupements permettent de catégoriser des problèmes, sous-problèmes, ou étapes de problèmes. Qui plus est, ces regroupements sont attachés à une procédure ou stratégie qui indique le meilleur coup à jouer pour arriver jusqu’à la solution : ces procédures ou stratégies permettent de passer à l’étape suivante ou de résoudre totalement le problème. On nomme ces entités des schémas. On peut citer l’exemple des joueurs d’échec auxquels on demande de mémoriser une configuration de jeu : les novices ne se rappellent que de 3 à 4 pièces, tandis que les experts regroupent les pièces en blocs de 3 à 5 pièces. Mieux : ces chunks permettent de catégoriser des ensembles de pièces suivant leur sens stratégique, chaque bloc étant associé au meilleur coup à jouer qui correspond à cette situation. ##### Lien avec la compétence et les résultats scolaires Dans tout les domaines, experts et novices (bons et mauvais élèves, dans notre cas) sont limités à se rappeler et traiter le même nombre d’éléments simultanés en mémoire de travail : là où un novice remplira sa mémoire de travail avec des chunks simples, l’expert rassemblera ces chunks simples en un seul chunk très complexe. Un novice ne dispose pas de motifs ou de catégories familières qu’il peut utiliser pour regrouper de grandes quantités d’informations, et doit se débrouiller avec des informations élémentaires qu’il doit traiter individuellement. Dans ces conditions, la mémoire de travail surcharge. Comme le dit Mislevy : « […] comparés aux novices, les experts dominent plus de faits et établissent plus d’interconnexions ou de relations entre eux. Ces interconnexions permettent de surmonter les limitations de la mémoire à court terme. Alors que le novice ne peut travailler qu’avec au maximum sept éléments simples, l’expert travaille avec sept constellations incarnant une multitude de relations entre de nombreux éléments ». Et on observe des phénomènes similaires dans des domaines très divers, comme la programmation, la conception de circuits électroniques, etc. D’après les expériences, toutes les différences entre experts et novices dans un domaine proviennent uniquement de la mémorisation d’un grand nombre de chunks spécifiques à ce domaine. Tout le challenge d’un professeur est de faire en sorte que l’élève acquière ces motifs, ces chunks, dans un ordre qui permette à ces chunks de diminuer la charge cognitive des apprentissage ultérieurs. Apprendre à résoudre des problèmes, c’est donc acquérir ces chunks qui permettent de résoudre des problèmes spécifiques. ##### Isolated/element Effect Le fait que certains chunks sont des regroupements de sous-chunks plus élémentaires a des implications pédagogiques assez intéressantes. Ainsi, pour enseigner des ensembles d’informations très complexe, il vaut mieux commencer par enseigner d’abord les chunks les plus élémentaires, avant de les rassembler progressivement. Cela donne des progressions qui sont découpées en petites unités notionnelles, qui sont assemblées progressivement pour former des concepts de plus en plus complexes : le résultat est le plus souvent une progression qui va du « simple » au « complexe », avec une granularité très fine. Par exemple, il vaut mieux apprendre toutes les correspondances du type Cu = cuivre, Fe = Fer, etc du tableau périodique avant d’aborder les équations de réaction chimique, plutôt que d’intégrer des explications sur ces correspondances dans des explications sur ces équations. Commencer par les atomes, poursuivre par les liaisons chimiques, et assembler le tout pour fabriquer des fonctions, elles-mêmes assemblées pour donner des molécules complexes (suceres, alccols, etc). Dans le même genre, un cours de neurosciences devrait commencer par aborder les notions anatomiques et décrire les aires cérébrales qui seront utilisées dans les explications ultérieures.

29

3 Les portes d’entrée de la mémoire

Ce genre de chose est très utile lors de l’apprentissage de concepts composés d’un grand nombre de composants/sous-concepts interagissant entre eux. Dans ce cas, la théorie de la charge cognitive recommande d’aborder chacun des composants indépendamment, avant de montrer comment ceux-ci interagissent ensemble. En faisant cela, la charge cognitive sera répartie dans le temps, améliorant l’apprentissage : on parle d’Isolated element effect. Premier exemple : les démonstrations qui utilisent des lemmes. Dans certains de mes cours d’université, les professeurs commençaient la démonstration du théorème, et l’interrompait au fil de l’eau pour démontrer les lemmes dont ils avaient besoin. Au lieu de faire cela, ils auraient du démontrer les lemmes avant de commencer la démonstration. Autre exemple : si vous voulez expliquer le fonctionnement du circuit anatomique du réflexe du genou, il est préférable de décrire ce circuit, en voyant chacun de ses composant indépendamment, avant de montrer comment ce circuit fonctionne lors de l’exécution du réflexe. Autre exemple : vous voulez enseigner comment fonctionne un processeur simple. Celui-ci contient plusieurs composants bien précis : une unité de calcul, un séquenceur, des registres, etc. Certains professeurs commencent directement leur cours par montrer comment une instruction s’exécute sur ce processeur : ils abordent chaque composant au fil de l’eau, quand ils en ont besoin. L’utilisation de l’isolated element effect recommanderait de voir indépendamment chaque composant du processeur un par un, avant de montrer le déroulement de l’exécution d’une instruction avec cet ensemble de composants. Attention toutefois : si il faut voir chaque sous-concept indépendamment, il ne faut pas négliger le fait que donner une vision d’ensemble du concept final est nécessaire. Il faut notamment montrer comment le concept de base se décompose en composants, en sous-éléments. Donner des indications générales sur le rôle de chaque élément, ainsi que des informations structurelles, avant de voir chacun des éléments à fond est une chose à ne pas négliger. #### Automatisation Il est parfois possible d’automatiser certains processus de façon à ce qu’ils utilisent très peu de mémoire de travail. Par automatisme, on veut dire : procédures qui ne prennent presque pas d’attention lorsqu’on les applique. Fait intéressant, ces automatismes auraient une mémoire dédiée, localisée dans des zones du cerveau totalement différentes de celles utilisées pour la mémoire sémantique. Cette mémoire n’est donc pas une mémoire dédiée aux connaissances, mais s’exprime dans la performance, la rapidité. La mémoire implicite, et l’automatisation qui va avec, n’est pas très intéressante pour la pédagogie de manière générale : et seuls certains enseignements spécifiques doivent la prendre en compte. En effet, la mémoire implicite gère les conditionnements de Pavlov, ainsi que quelques formes limitées d’automatismes. ##### Exemples d’automatismes Par exemple, un professeur de sport (c’est bien un professeur, quoi qu’on en dise…) va inculquer des automatismes moteurs à ses élèves, et leur faire acquérir des mouvements spécifiques (positions de karaté, méthode de service au badminton, etc). Comme autre exemple, on peut citer les divers automatismes perceptifs. L’apprentissage de la lecture en est un bon exemple : reconnaitre des mots déjà connus est en effet un véritable automatisme. Les expériences sur montrent clairement que la lecture s’automatise progressivement : l’élève devient capable de reconnaitre les mots de plus en plus vite. Plus l’élève apprend à lire, plus il lit sans gaspiller son attention. Les ressources attentionnelles libérées peuvent alors servir à mieux comprendre le texte lu : plus un enfant sait déchiffrer vite et bien, plus il sera capable de comprendre le texte qu’il lit.

30

3.2 Exercices et exemples : comment rendre la pratique efficace ?

On trouve aussi des automatismes cognitifs, qui consistent en l’application de règles, de procédures. Ainsi, toutes les stratégies, méthodes et procédures sont mémorisées dans la mémoire implicite. Il peut s’agir de règles de grammaire, les algorithmes l’addition ou de multiplication, les méthodes de calcul mental, etc. Un exemple d’automatisme cognitif est l’apprentissage des règles de grammaire et de la syntaxe d’une langue. En effet, quand vous parlez ou écrivez vous appliquez ces règles quasiment sans y penser. Cela joue un rôle important dans l’apprentissage d’une langue étrangère. Les études d’imagerie cérébrales le montrent clairement : là où les novices utilisent les zones du cerveau dédiées à la mémoire explicite pour appliquer des règles de grammaire, les bilingues experts ou natifs utilisent des zones du cerveau dédiées aux automatismes. De même, il est difficile de progresser en mathématiques si on ne s’est pas suffisamment entrainé et que l’on n’a pas acquis certaines bases, comme le calcul, les méthodes de résolution d’équation, etc. ##### Acquisition des automatismes Au tout début de l’apprentissage d’un automatisme, l’automatisme est d’abord mémorisé en mémoire à long terme explicite, et est appliqué consciemment avec l’aide de la mémoire de travail. Puis, progressivement, les apprentissages implicites montrent une amélioration de leur performance avec la pratique : on devient de plus en plus rapide à force de répétition. En clair : il n’y a pas le choix : la répétition est la seule manière d’apprendre à lire, écrire, compter, calculer, ou parler anglais. C’est triste, mais il n’y a pas le choix. Lors de cet apprentissage par répétition et par pratique, le retour sur performance a son importance : le sujet apprend plus vite quand il arrive à se souvenir de ses erreurs passées. Cela a été montré par des expériences sur des patients avec des lésions cérébrales très spécifiques : ces patients ne pouvaient pas mémoriser leurs erreurs, ce qui fait qu’ils avaient du mal à ne pas les reproduire, ce qui ralentissait l’acquisition de la séquence motrice.

3.2 Exercices et exemples : comment rendre la pratique efficace ? 3.2.1 Exercices goal-free Le format des exercices a une grande influence sur la façon dont l’élève va le résoudre. Prendre en compte le format des exercices peut permettre à l’élève d’acquérir plus facilement des automatismes ou de progresser plus rapidement. Pour comprendre pourquoi, il va falloir faire un peu de théorie. #### Méthodes de résolution de problèmes et de raisonnement Pour résoudre un problème, l’élève dispose de plusieurs stratégies de résolution de problème. Outre la méthode par essais et erreurs aléatoires, l’élève dispose de deux stratégies : le Hill climbing, et la Means-end analysis. ##### Hill climbing Avec le Hill climbing, l’élève va partir des données du problème pour progressivement se rapprocher de la solution : il va planifier la suite d’étapes en partant des données du problème. A chaque application d’un opérateur (à chaque étape), l’élève vérifie s’il s’est approché de la solution : si c’est le cas, il continue à partir de l’étape obtenue, et revient en arrière sinon. Cette stratégie est facilement applicable pour les élèves qui ont acquis suffisamment de schémas ou qui peuvent raisonner par analogie, mais elle est très difficile à appliquer pour les élèves qui

31

3 Les portes d’entrée de la mémoire

sont au premier stade. ##### Means-end analysis Les élèves au premier stade ont tendance à utiliser une autre stratégies de résolution de problème : la Means-end analysis. Avec celle-ci, l’élève va partir du but demandé, pour poursuivre à rebours vers les données du problème. Lors de ce parcours à rebours, chaque étape va créer un nouveau sous-problème à résoudre, sous-problème qui sera résolu avec la même méthode, et ainsi de suite : le problème est résolu quand on atteint un sous-problème qui peut être résolu en appliquant un opérateur sur les données du problème. Prenons l’exemple suivant : y = x + 6, x = z + 3, et z = 6. Trouvez la valeur de y. Un novice va se focaliser sur le but : trouver la valeur de y. Il va d’abord lire y = x + 6. Il va alors chercher à résoudre le sous-problème : trouver x. Il va ensuite lire x = z + 3. Il va alors chercher à résoudre le sous-problème : trouver z. Enfin, il va lire z = 6, et il va rembobiner le tout. Le problème, c’est que cette means-end analysis sature rapidement la mémoire de travail, contrairement au Hill climbing : dans ces conditions, la mémorisation des exemples et la formation de schémas s’effectue mal, voire n’a pas lieu. #### Goal-free effect Pour que le novice ne puisse utiliser la means-end analysis, la théorie de la charge cognitive recommande de modifier le format des exercices : c’est ce qu’on appelle le Goal-free effect. Les exercices donnés à l’élève ne doivent pas donner un but précis : à la place, les exercices doivent demander à l’élève de déduire tout ce qu’ils peuvent à partir des données contenues dans l’énoncé. Par exemple, l’exercice suivant : y = x + 6, x = z + 3, et z = 6. Trouvez la valeur de z. doit être modifié en : y = x + 6, x = z + 3, et z = 6. Trouvez le maximum de valeurs. Autre exemple, l’exercice suivant : Une particule a une vitesse de 2 mètres par seconde à un instant t. Elle accélère de 5 mètres par secondes carrés durant 25 secondes. Calculez la distance parcourue à l’instant t + 5 minutes. Doit être reformulé comme ceci : Une particule a une vitesse de 2 mètres par seconde à un instant t. Elle accélère de 5 mètres par secondes carrés durant 25 secondes. Trouvez un maximum de valeurs. Résoudre de tels exemples permet à l’élève d’atteindre plus rapidement le second ou le troisième stade. Évidemment, cet effet a été validé expérimentalement.

32

3.2 Exercices et exemples : comment rendre la pratique efficace ?

Des expériences [5] ont comparé deux groupes d’élèves de même niveau qui recevaient des exercices de géométrie : un groupe avait un énoncé sans but, et l’autre un exercice conventionnel. On entrainait les deux groupes d’élèves, chacun avec un type bien précis d’exercice, et on comparait les résultats avec des exercices conventionnels tout ce qu’il y a de plus normaux. D’autres expériences complémentaires[6] ont été faites, encore une fois sur des exercices de géométrie, montrant encore l’efficacité de cette stratégie. D’autres études[7] ont testé l’efficacité de cette technique sur des exercices de physique. La différence était en faveur du groupe sans but dans tous les cas.

3.2.2 Exemples travaillés Il existe aussi une autre solution pour diminuer la charge cognitive lors de la résolution de problèmes. Comme je l’ai dit plus haut, commencer directement par résoudre des exercices ou des problèmes en début d’apprentissage impose une forte charge cognitive à l’élève : celui-ci n’a pas de chunk qui lui permettent de réfléchir efficacement. #### Worked exemple effect En comparaison, écouter le professeur résoudre des exemples mobilise moins la mémoire de travail, comparé à une résolution d’exercices autonome. Une méthode alternative consiste donc à faire présenter des exemples de problèmes résolus à l’élève, que l’on appelle des exemples travaillés. Ces exemples travaillés sont des exemples d’exercices que le professeur résout devant les élèves : durant ces exemples, le professeur pense à haute voix, montre explicitement comment il résout le problème, montre bien quelles sont les étapes de résolution et comment il les enchaîne, il explicite ses raisonnements, etc. Expérimentalement, ces exemples travaillés sont systématiquement plus efficace que de passer directement aux exercices : on parle d’effet des exemples travaillés. Cet effet est valable pour de nombreux domaines, qu’il s’agisse de domaines scientifiques (mathématiques, informatique, physique), de l’apprentissage d’une seconde langue, de l’apprentissage de la musique, l’apprentissage de la littérature anglaise, etc. Le domaine le plus étudié lors de la création de la théorie de la charge cognitive fût toutefois les mathématiques. Dans les années 1985 et 1987, Sweller and Cooper ont testé l’efficacité des exemples travaillés dans l’apprentissage de manipulations algébriques : les élèves devaient apprendre à simplifier et à résoudre des équations. La première catégorie de groupes d’élèves passait directement aux exercices après le cours, tandis que l’autre avait droit à une phase de pratique guidée : la pratique guidée a augmenté de manière significative les résultats des élèves. Seul problème : pour obtenir les résultats, les élèves étaient interrogés sur des problèmes qui étaient très similaires aux problèmes vus en exemple. Cette expérience ne permettait pas de prouver que les élèves peuvent transférer les informations acquises dans les exemples dans des exercices différents. Pour vérifier si de tels phénomènes de transferts ont bien lieu, les mêmes auteurs ont effectué une autre expérience, dans les années 1987, qui cherchait à évaluer l’apparition de possibles phénomènes de transferts. Cette étude a montré que ces effets ont bien lieu. Par la suite, une étude faite par Carroll (1994), a reproduit des résultats similaires : l’usage d’exemples travaillés donne de bons résultats sur des étudiants faibles ou avec des difficultés lors de l’apprentissage mathématiques.

33

3 Les portes d’entrée de la mémoire

Une autre étude de Pillay (1994) a vérifié la présence de cet effet des exemples travaillés sur l’apprentissage de rotations mentales en 2D et en 3D. Un certain Paas (1992) a ensuite validé cet effet sur des problèmes de statistique. Ce même auteur a aussi validé cet effet pour des exercices de géométrie avec une autre étude avec son collègue van Merriënboer, en 1994. Cependant, d’autres domaines sont aussi concernés par l’effet des exemples travaillés. Par exemple, Owens et Sweller (2008) semblent avoir validé l’approche des exemples travaillés pour l’apprentissage de la musique. D’autres études ont portées sur l’apprentissage d’un second langage (Diao and Sweller - 2007). Autre exemple : dans une étude faite par Rourke et Sweller, en 2009, l’effet des exemples travaillé a été validé pour des apprentissage artistiques. Dans cette étude, les sujets devaient apprendre à reconnaitre le style de peintres modernistes. Dans une autre étude, faite par Kyun, Kalyuga, et Chandler (2010), cet effet fût observé pour des apprentissages relevant de l’apprentissage de la littérature anglaise, et notamment sur les réponses à des questions de compréhension et d’interprétation de textes littéraires. #### Problem completion effect Certaines expériences ont évaluée l’efficacité des exemples partiellement travaillés dans lesquels le professeur résout partiellement les exercices présentés et laisse les élèves finir. Expérimentalement, on peut constater que cela donne de bons résultats sur pas mal d’élèves. C’est ce qu’on appelle le problem completion effect. Cet effet a notamment été étudié par Van Merriënboer (1990), pour l’apprentissage de la programmation informatique. Dans son étude, il a comparé deux classes : une qui recevait un enseignement dans lequel les élèves devaient créer eux-mêmes des morceaux de programmes, et une autre qui devait modifier et étendre des programmes existants. Après une période de dix leçons, les deux classes étaient invitées à créer des programmes dans leur intégralité. Le groupe à base d’exemples partiellement travaillés avait les meilleurs résultats. Ces résultats ont été reproduits dans une étude faite par Van Merriënboer et de Croock (1992). Dans cette étude, les élèves étaient encore répartis en deux groupes : un dans lequel les élèves devaient créer totalement des programmes, et un autre dans lequel les élèves devaient terminer des programmes partiellement écrits et remplir les blancs. #### Expertise reversal effect Ces expériences ont étés répétées de nombreuses fois, pour vérifier quelque chose : quand ces exemples travaillés deviennent inutile ? Il apparait qu’au bout d’un certain temps, les exemples travaillés ont de moins en moins d’effets positifs. Mais il semblerait que ce ne soit pas le temps qui soit la variable pertinente, mais la quantité de connaissances antérieures de l’élève : si l’élève a acquis suffisamment de chunks de résolution de problèmes, de nouveaux exemples travaillés ne font que répéter des chunks déjà connus et vont donc agir comme une sorte de redondance. Cela arrive après une dizaine d’exemples travaillés, voire un peu plus (15/20). Les premières expériences sur le sujet furent des études qui comparaient la performance de deux groupes de sujets dans la durée : celle-ci regardaient comment les élèves évoluaient durant de longues durées, suivant qu’ils aie droit ou non à des exemples travaillés. Dans une de leur étude datée de 2001, Kalyuga, Chandler, Tuovinen, et quelques collègues, ont vérifié si la quantité de connaissances antérieures jouait sur l’efficacité des exemples travaillés. Dans leur première expérience, les élèves devaient apprendre à programmer des équipements

34

3.2 Exercices et exemples : comment rendre la pratique efficace ?

industriels : au final, les exemples travaillés devenaient de moins en moins efficaces, et finissaient par devenir nettement moins efficaces que les élèves d’un groupe contrôle qui n’avait pas d’exemples travaillés. Dans une expérience additionnelle, citée dans la même étude et reproduite plus tard[9], les mêmes expérimentateurs ont reproduit cet effet sur un groupe de sujets qui apprenait à créer des équations booléennes de circuits à base de relais (ça date, je sais…). La comparaison avec le groupe contrôle était claire : quand l’élève a acquis suffisamment de connaissances et mémorisé suffisamment d’exemples antérieurs, l’effet des exemples travaillé diminue. D’autres expériences sont basées sur une simple constitution de quatre groupes : ceux-ci sont séparés en deux groupes d’élèves performants et non-performants, qui reçoivent chacun soit des exemples travaillés, soit une pratique autonome à base d’exercice. Les études de ce type sont : – les études faites par Kalyuga et Sweller en 2004, sur les compétences en algèbre ; – les études de Pawley, Ayres, Cooper, and Sweller (2005), sur l’apprentissage de la littérature anglaise ; – et les études de Lee and Kalyuga (2011) sur l’apprentissage du chinois en Pinyin. Les expériences faites par Sweller et ses collègues ont clairement montré que les exemples travaillés ne sont utiles que pour des élèves qui ont peu de connaissances antérieures dans un domaine, ceux qui ont beaucoup de connaissances antérieures bénéficiant plus d’exercices et de pratique autonome. C’est ce qu’on appelle l’expertise reversal effect. #### Guidance fading effect On peut combiner les trois effets précédents pour organiser la phase d’exemples travaillés : après la présentation d’exemples totalement travaillés, le professeur poursuit par des exemples partiellement travaillés, avant de laisser les étudiants résoudre les exercice euxmêmes. La transition doit se faire de la manière la plus douce possible : lors de l’usage d’exemples partiellement travaillés, le nombre d’étapes que les élèves doivent réaliser pour résoudre totalement l’exercice doit graduellement augmenter à chaque exercice. En utilisant cette organisation les résultats sont meilleurs : c’est le Guidance fading effect. Cependant, cette tactique peut s’appliquer de deux manières, qui dit comment effectuer des exemples partiellement travaillés. Dans le premier cas, le professeur commence par résoudre les exemples travaillés devant les élèves, et il leur demande de les terminer à partir d’un certain point. Au fur et à mesure des exemples, le professeur s’arrête de plus en plus tôt, jusqu’à ce qu’il n’y aie plus d’étapes à enlever. Dans la seconde tactique, les élèves doivent commencer par résoudre le début de l’exercice, et le professeur termine les exercices à partir d’un certain stade. Au fil du temps, le professeur est repoussé de plus en plus vers la toute fin de l’exercice, et ne doit plus résoudre que les toutes dernières étapes de l’exemple travaillé. L’étude de Renkl, Atkinson, Maier, and Staley, datée de 2002, a montré que les deux stratégies ne sont pas égales. La tactique qui consiste à laisser les élèves résoudre la fin de l’exercice donne de meilleurs résultats. En tout cas, les deux stratégies font mieux que l’usage d’une rupture brutale entre exemples travaillés et exercices. De plus, un autre paramètre doit être pris en compte dans ces exemples travaillés : ceuxci doivent avoir une faible charge cognitive. Concrètement, cela signifie qu’il faut segmenter

35

3 Les portes d’entrée de la mémoire

l’exemple en petites étapes assez simples, chacune de ces étapes devant tenir dans la mémoire de travail. Cette segmentation est assez facile à obtenir si l’on a bien pris la peine de segmenter les procédures à enseigner.

3.3 Supports pédagogiques 3.3.1 Texte De nombreuses expériences ont cherché à savoir si le texte était plus facile à comprendre et à mémoriser que l’oral. Ces expériences ont étés faites : – sur des collégiens (Lieury, Badoul, Belzic, 1996) ; – sur des adolescents (Gunter, Furhnam, Gietson, 1984 ) – sur des adultes (Furhnam, Gunter, 1987 ; et aussi Bells Perfetti, 1994). Dans tous les cas, le texte écrit est nettement mieux mémorisé que l’oral. C’est ce que l’on appelle l’effet de supériorité de l’écrit. Cependant, l’effet n’a lieu que pour des textes relativement longs. En effet, le texte passe par le canal visuel, alors que l’oral passe par la mémoire de travail verbale. Pour des textes courts, la plus grande capacité de la mémoire de travail verbale favorise l’oral. Mais pour des textes longs, le texte permet de relire plusieurs fois ou de relire les portions de texte mal comprises : pour des textes qui surchargent la mémoire de travail verbale, cela avantage clairement le texte. #### Cohérence du texte Le texte est un support pédagogique fortement utilisé dans en classe : apprendre à diminuer sa charge cognitive est donc une nécessité. Un premier moyen pour éviter la surcharge de la mémoire de travail est de segmenter le texte à lire en petites unités que l’on peut comprendre indépendamment. Le premier facteur qui influe sur cette segmentation est la longueur de la phrase : mieux vaut des phrases courtes que des phrases longues. Le choix des textes à donner aux enfants doit donc tenir compte de la faible capacité de leur mémoire de travail, qui est presque moitié moindre comparée aux adultes. De même, la structuration des paragraphes joue sur la facilité à comprendre un texte : on parle d’effet de cohérence local. Avec une bonne cohérence locale, chaque paragraphe est centré autour d’une seule et unique idée bien précise. De plus, les phrases de ce paragraphe s’enchaînent en suivant une progression logique : chaque phrase doit poursuivre ce qui a été dit dans la phrase précédente, pas plus. Avec un texte qui a peu de cohérence locale, le lecteur doit maintenir ces idées provenant de paragraphes ou de phrases éloignés en mémoire de travail : cette mauvaise segmentation fait donc saturer la mémoire de travail. #### Redondance Éliminer le superflu permet de rendre une explication plus facile à comprendre. Ainsi, il vaut mieux supprimer la redondance pour améliorer les performances d’apprentissage : on parle d’effet de redondance. Par exemple, présenter un texte à la fois sous forme écrite et orale sur un écran d’ordinateur pourrait réduire les performances d’apprentissage. #### Liens hypertexte L’usage des liens hyper-texte est à utiliser avec précaution. En effet, de nombreuses expériences ont clairement montré qu’un abus de liens hypertexte peut rendre la navigation relativement labyrinthique : l’usager a alors de sérieuses difficultés à se souvenir de l’endroit où il est sur le site, et ne sait donc plus vraiment se repérer dans celui-ci.

36

3.3 Supports pédagogiques

Cela arrive quand des liens hyper-texte sont imbriqués : un lien renvoie vers une page qui a un hyper-lien, et ainsi de suite. Si la profondeur est trop grande, l’usager aura de grandes chances de se perdre. On appelle cela l’effet de désorientation. Mais dans le cas d’un site bien construit, l’usage de liens hypertexte permet de diminuer la quantité d’informations présentes sur la page, et permet de déplacer les détails dans des sections annexes. En somme, les liens hyper-texte sont à utiliser avec parcimonie, dans le but de cacher/déplacer les détails et d’alléger le texte.

3.3.2 Images Une idée reçue courante, surtout chez les enseignants, est que certains élèves visuels, d’autres auditifs, et d’autres tactiles. Mais, quel que soit l’élève, le visuel est mieux mémorisé que ce qui est verbal ou auditif[8][9]. On parle d’effet de supériorité de l’image sur le mot : un bon schéma vaut mieux qu’un bon discours. En conséquence, l’ajout d’informations visuelles dans un cours aide les élèves. Cela peut passer par l’utilisation de schémas au tableau, de dessins, de diagrammes, de projections de diaporama, ou d’autres techniques du genre. Par exemple, Kourilslcy et Wittrock ont montré dans leur étude de 1987, ont montré qu’ajouter des graphiques pour illustrer les relations entre concepts abstraits améliorait les performances en compréhension et rappel d’un cours d’économie. Néanmoins, les expériences de Mayer ont prouvé qu’il y a des conditions pour utiliser efficacement ces images : – le texte couplé avec les images doit être explicatif ; – les illustrations doivent aussi être explicatives ; – cela ne marche qu’en début d’apprentissage : des élèves novices profitent de la présence d’images, mais pas les élèves qui ont de bonnes connaissances antérieures sur le sujet à apprendre ; – les images ne permettent que d’améliorer la compréhension de quelque chose : elle ne permettent pas de faciliter la mémorisation pure et simple de faits. #### Éliminer le superflu Là encore, éliminer le superflu dans une image permet d’améliorer sa mémorisation ou sa compréhension. Ainsi, il vaut mieux supprimer la redondance. Par exemple, un texte qui décrit le contenu d’une image, sans ajouter d’information supplémentaire a de bonnes chances d’être inutile, voire nuisible pour la mémorisation. #### Effet d’attention divisée De nombreux documents contiennent des informations qui doivent être traitées ensemble pour comprendre le document. Le split attention effect nous dit qu’éloigner ces informations mène à des performances inférieures. Dans ces conditions, l’élève devra rassembler les informations à traiter simultanément : cela demande un effort mental, et augmente donc la charge cognitive. Par exemple, de nombreux schémas ont des légendes écrites : pour comprendre le schéma, on doit relier chaque élément de l’image à la portion de la légende qui correspond. En pratique, il vaut mieux éviter de faire des légendes en dessous des schémas : les élèves comprennent mieux quand le texte est intégré aux schémas, et placé immédiatement à coté du dessin correspondant[10]. Par exemple, cette image du cortex cérébral est clairement mauvaise : A la place, il faudrait plutôt utiliser cette image : On pourrait aussi mentionner l’exemple des cartes géographiques ou géologiques[11], ou des schémas électriques ou électroniques[12]. #### Effet de modalité Présenter des

37

3 Les portes d’entrée de la mémoire

38

3.3 Supports pédagogiques

39

3 Les portes d’entrée de la mémoire

images avec un commentaire audio est plus efficace que de présenter les images avec du texte[1][2][3][4][5][6][7]. C’est parce que texte et images entrent en concurrence pour l’utilisation du canal visuel. C’est ce que l’on appelle l’effet de modalité, ou effet de concurrence à court terme. Les premières études sur le sujet furent celles de Mousavi et al. (1995) sur du matériel géométrique. Elles ont été suivies par TindallFord et al. (1997), qui ont reproduit ces résultats lors de l’apprentissage d’ingénierie électrique. Cependant, il faut prendre en l’effet de supériorité de l’écrit : le texte oral doit être court.

3.3.3 Animations et vidéos La théorie de la charge cognitive donne des recommandations spécifiques pour l’utilisation d’animations : il est préférable de les éviter, et de les remplacer par des suites de dessins statiques. Il faut bien se rendre compte d’une chose : les images ne sont pas mémorisées à l’identique. La mémoire n’est un pas un appareil photographique qui enregistrerait des images au pixel près : les images sont stockées sous un autre format, qui stocke plus précisément les portions importantes de l’image et conserve de manière dégradée voire nulle les informations peu pertinentes. L’attention sélective est responsable de cet effet : notre œil ne peut voir précisément que sur une portion très limitée du champ de vision, la vision étant totalement floue en dehors de cette zone.

Pour voir une image en entier, notre œil doit donc bouger sans cesse, pour balayer une portion plus ou moins importante de l’image : de telles saccades oculaires sont fréquentes, et nous n’en avons souvent pas conscience. Ces saccades oculaires durent environ 250 millisecondes, avec des variations suivant la personne. C’est la mémoire à court terme qui se charge de combiner les résultats des différentes prises de vue effectuées par l’œil en une image plus ou moins partielle. Or, la mémoire de travail a son propre rythme de travail : elle peut conserver un nombre limité d’informations durant 30 secondes. Ainsi, le temps de traitement de l’image joue fortement sur sa mémorisation. Le Transient information effect stipule que si on va plus vite que la mémoire de travail, de nouvelles informations vont venir remplacer les anciennes alors que les précédentes n’ont pas pu être traitées convenablement. En conséquence, seule une partie des informations est mémorisée, et l’apprentissage se passe mal. Or, une animation est un document dans lesquelles les informations sont fournies à un rythme relativement rapide : le transient information effect fonctionne à plein tube. Pour éviter cela, il vaut mieux recourir à des suites de dessins statiques. De plus, il vaut mieux faire en sorte que l’élève puisse choisir de passer d’un dessin à un autre de son propre chef,

40

3.3 Supports pédagogiques

histoire qu’il puisse aller à son rythme, et bien prendre son temps pour mémoriser et analyser les images qui lui sont présentées.

41

4 Mémorisation et méthodes de révision 4.1 Répétition et mémorisation 4.1.1 Apprentissage massé versus distribué Pour beaucoup de professeurs, les devoirs sont une occasion de revoir ce qui a été vu la journée en classe. Cette répétition mène souvent au sur-apprentissage, qui consiste à continuer à réviser une fois que le matériel à apprendre est totalement su. Des pédagogies plus récentes, comme la pédagogie explicite, reprennent cette vision des devoirs. Expérimentalement, ce sur-apprentissage a été évalué de nombreuses fois, mais sur des durées très courtes. Mais ces études n’évaluaient pas l’efficacité à long terme du sur-apprentissage. Les rares études sur le long terme ont clairement montré que les effets s’estompent très rapidement après quelques semaines. Par exemple, une étude nommée “The Effect of Overlearning on Long-Term Retention” a demandé à des étudiants de sur-apprendre des faits géographiques et des définitions de mots : les effets s’estompaient en quelques semaines. Le principal problème avec ce sur-apprentissage, c’est qu’il mène obligatoirement à des révisions massées, sans interruptions. Cet apprentissage massé est à contraster avec l’apprentissage distribué, qui consiste à séparer les révisions par de nombreuses pauses assez longues entre chaque répétition. Et expérimentalement, l’apprentissage distribué démonte littéralement l’apprentissage massé, quelque soit le matériel à apprendre[2]. Les études sur le sujet ont aussi montré que cet effet vaut pour une large gamme de matériel : les faits ne sont pas les seuls concernés. Cela marche aussi pour la révision de cours magistraux, l’apprentissage par cœur, l’acquisition de procédures, etc. Un élève aura donc tout intérêt à répartir ses devoirs sur la semaine de façon à en faire un petit peu à chaque fois. De même, les professeurs gagnent à étaler les devoirs et distribuer les révisions : un bon professeur donne fréquemment des devoirs, mais en donne peu à chaque fois. De ce point de vue, les statistiques montrent clairement qu’il y a du chemin à faire : les élèves ont souvent tendance à utiliser l’apprentissage massé et les révisions basées sur la répétition de maintien. De plus, les chercheurs recommandent aussi l’usage d’une micro-distribution, à savoir faire des pauses de quelques minutes entre chaque exercice : faire de longues pauses tout les deux-trois exercices aidera fortement l’élève. Cette distribution peut aussi passer par l’utilisation de rappels réguliers. Ces rappels sont malheureusement trop souvent négligés par les professeurs traditionalistes. Or, dans l’idéal, ces

43

4 Mémorisation et méthodes de révision

rappels doivent être systématiques. Cette technique donne de bons résultats d’après les métaanalyses faites sur le sujet[3]. L’intervalle de temps idéal entre deux répétitions n’est pas encore connu avec certitude. Les chercheurs recommandent toutefois des intervalles très longs, de plusieurs jours. Des intervalles de 4 à 5 jours donneraient de bonnes performances.

4.1.2 Répétition de maintien Toutes les formes de répétition ne se valent pas. Le courant traditionaliste utilise surtout la répétition de maintien, qui consiste à revoir le matériel à apprendre à l’identique : le fameux par cœur, les révisions de cours, etc. #### Relire ses cours Dans certains cas, cette répétition de maintien a des effets positifs. Par exemple, quand on relit plusieurs fois un texte, on a tendance à relever de nouvelles associations logiques à chaque répétition, ce qui augmente la compréhension du cours ou du texte relu. Évidemment, il arrive un moment où relire ne permet plus de créer de nouvelles associations. Au-delà de 2 à 4 relectures, il ne sert plus à rien de relire son cours. #### Le par cœur Le par cœur est une autre forme de répétition de maintien. Celui-ci a tendance à saturer la mémoire à court terme assez rapidement. Par exemple, une liste de 50 mots saturera facilement la mémoire de travail. Mais il y a moyen de diminuer ce problème. Je rappelle que la mémoire de travail est séparée en plusieurs sous-systèmes : un système visuel, un système verbal, et un système généraliste. Or, le système verbal a une capacité qui est supérieure aux deux autres systèmes : l’utiliser lors de l’apprentissage par cœur permet de diminuer la surcharge de la mémoire de travail. Pour cela, il faut répéter verbalement le matériel à apprendre. Des expériences ont testé la suppression de la répétition à haute voix, et le bilan est relativement clair : le fait de prononcer les mots à haute voix donne un surplus de mémorisation, comparé à la lecture silencieuse. Cela rappelle un peu l’éducation perroquet d’avant 1968, et c’est encore la meilleure méthode pour mémoriser des listes de mots. Cette vocalisation des mots lus peut aussi se faire silencieusement, les mots étant prononcés dans notre tête : on parle de subvocalisation. Celle-ci permet d’améliorer les performances de mémorisation et de compréhension du matériel lu[4]. Cette subvocalisation des mots peut aussi servir pour répéter mentalement des mots, ou du matériel verbal : l’élève va répéter mentalement chaque mot à apprendre plusieurs fois dans sa tête avant de passer au suivant. On parle alors d’auto-répétition. Encore une fois, l’autorépétition à haute voix permet d’augmenter les performances de mémorisation. Connaitre ce genre de chose est utile pour apprendre ses listes de verbes irréguliers ou toute autre liste de mots.

4.1.3 Répétition de rappel Mais il existe une alternative à la répétition de maintien : la répétition de rappel. Expérimentalement, augmenter le nombre de rappels est plus efficace que la répétition de maintien. Pour donner un exemple, je vais prendre une expérience effectuée par des chercheurs de l’université de St Louis, aux USA. Ils ont demandé à trois groupes d’élèves de mémoriser une liste

44

4.2 Elaboration

de 50 mots. Le premier devait bachoter durant 8 séances, le second devait bachoter durant 6 séances et se faire tester dans deux autres, et le troisième groupe devait bachoter durant 4 séances et se faire tester durant 4 séances. Une semaine plus tard, plus un groupe s’était fait tester, meilleurs étaient ses résultats. Autre expérience, réalisée par Roediger & Karpicke. On demande à des étudiants de lire des textes scientifiques relativement courts. Le premier groupe devait lire le texte 4 fois, le second groupe lisait le texte trois fois et se faisait tester une fois, tandis que le troisième groupe avait droit à une seule lecture et trois interrogations. Une semaine plus tard, les trois groupes étaient testés : plus un groupe avait été testé, mieux c’était : le troisième groupe réussissait même à rappeler 50 de mots en plus que le premier groupe. #### Application générale Quelques études récentes semblent montrer que s’auto-tester ou se faire tester par un pair est plus efficace que relire ses cours. C’est ainsi : si vous allez travailler chez un ami, essayez de vous poser des questions à tour de rôle. Mais la meilleure méthode consiste à utiliser la technique du canard en plastique : on prend un objet quelconque (typiquement, un canard en plastique), et on fait comme s’il s’agissait d’un humain à qui on souhaiterait expliquer son cours. Le meilleur moyen et donc de prendre la place du professeur, et de faire comme l’on souhaitait enseigner le cours que l’on a reçu, ou les procédures de résolution de problème acquises. Évidemment, cet effet n’a aucune influence si on ne se rappelle pas du matériel à apprendre. Cette technique semble mal se marier avec la distribution des apprentissages : il vaut mieux se rappeler de quelque chose le plus vite possible si on veut s’en rappeler. Mais on peut résoudre ce léger problème en augmentant progressivement le temps entre deux répétitions : on commence avec un intervalle très court entre deux répétitions, et on allonge progressivement cet intervalle. De plus, pour avoir un effet optimal, il vaut mieux que les questions posées aient un niveau de difficulté moyen à faible : avec des questions trop dures, le nombre de rappels serait trop faible pour avoir un effet significatif. #### Flashcards La répétition de rappel peut aussi s’implémenter avec des flashcards, des cartes sur lesquelles on marque une question d’un coté de la carte, et la réponse à mémoriser de l’autre coté. Le but est, à chaque lecture de la carte, de regarder la question, de tenter d’y répondre sans aide, avant de retourner la carte pour voir si la réponse donnée est correcte. Cette forme de répétition de rappel est très efficace pour mémoriser des dates, des formules de mathématique ou de physique, des listes de vocabulaire, etc.

4.2 Elaboration 4.2.1 Générer Les formes les plus basiques de répétition d’élaboration se basent sur l’effet de génération : générer soit-même le matériel à apprendre permet de ré-organiser les connaissances en mémoire, de créer plus d’associations, et permet donc de mieux mémoriser. Si l’on fait en sorte que le traitement effectué sur le matériel à apprendre crée autant d’associations que la simple présentation du matériel, l’effet de génération disparait. Ainsi, si on compare un groupe qui mémorise une liste de mots avec des moyens mnémotechniques, et un groupe qui généré lui-même les mots, on ne trouve pas de différences. Les expériences d’imagerie cérébrales ont d’ailleurs montré que l’activité du cortex pré-frontal, impliqué dans la mémoire de travail et la création d’associations avec les connaissances anté-

45

4 Mémorisation et méthodes de révision

rieures, était un peu plus intense dans les taches de génération que dans les taches de réception passive. En clair : le cerveau a tendance à traiter mentalement le matériel de manière active, favorisant une mémorisation élaborée. #### Révisions On peut utiliser cet effet en demandant aux élèves de : – répondre à des questions de compréhension ; – réaliser un exposé ; – réaliser des résumés du cours ; – créer une carte mentale du cours ; – etc. On peut aussi appliquer ce conseil aux langues étrangères : une fois que les élèves ont appris suffisamment de vocabulaire, mieux vaut les faire parler que de leur faire lire des textes. Par exemple, visualiser mentalement le concept à apprendre donne quelques résultats. De nombreux procédés mnémotechniques de l’antiquité se basaient sur ce principe : la méthode des lieux en est un bon exemple. Malheureusement, cette imagerie demande de l’entraînement, et ne s’applique que pour une quantité limitée de matériel. Cette imagerie mentale a été testée expérimentalement, et semble fonctionner : – certaines études ont tenté d’évaluer cette technique pour l’apprentissage de la géométrie et de l’arithmétique ; – l’étude de Leutner, Leopold, and Sumfleth (2009) a clairement montré que cette visualisation mentale permettait de diminuer la charge cognitive lors de l’apprentissage, comparé à la création manuelle de dessins ; – l’étude de Leutner et al. (2009) a aussi montré que cette imagerie mentale a des effets positifs pour la compréhensio ; – l’étude de Leahy and Sweller (2004) a montré que demander à des étudiants d’imaginer les contours d’une carte leur permettait de mieux mémoriser celle-ci, comparé à un groupe qui étudiait la carte. Comme autre exemple, créer des résumés du cours demande de sélectionner les informations du cours et de les traiter, ce qui permet de créer des associations. De plus, cela permet d’extraire les idées générales du cours, ce qui permet une réorganisation efficace du matériel en mémoire. Cependant, créer efficacement des résumés demande d’utiliser quelques stratégies, qui ne sont pas forcément bien connues des élèves. Mais pour les élèves bons en synthèse, cette technique est à utiliser dès que possible. Autre méthode : pour chaque fait présent dans le cours, tenter d’en donner une explication. Cette technique qui consiste à poser des questions du style « pourquoi », pour chaque fait du cours, aurait une efficacité qui ne serait pas négligeable[1]. Dernière méthode : demander à l’élève de ré-expliquer le cours avec ses propres mots. Celui-ci doit donc tenter de prendre la place du professeur, et de faire comme s’il souhaitait enseigner le cours qu’il a reçu. Pour cela, on peut notamment utiliser la technique du canard en plastique : on prend un objet quelconque (typiquement, un canard en plastique), et on fait comme s’il s’agissait d’un humain à qui on souhaiterait ré-expliquer son cours. #### Prise de notes Cet effet de génération a aussi des effets sur la prise de notes. Lors d’un cours magistral, au lieu d’écrire ce que raconte le professeur, il vaut mieux sélectionner ce que l’on va noter, en prenant en compte les idées générales du discours du professeur, et d’autres paramètres[2]. Les chercheurs ont aussi pu constater que l’effet sur la mémoire et la compréhension des cartes mentales est maximal si l’élève crée lui-même la carte mentale à apprendre. En somme, les

46

4.2 Elaboration

cartes mentales sont de très bon outils de prise de notes. La recherche est très claire là-dessus : ça fonctionne, et les professeurs ne devraient pas s’en priver[3]. #### Conditions d’application Dans tous les exemples précédents, l’élève doit générer quelque chose : une image mentale, un résumé, une carte mentale, une explication, etc. Les expériences ont à évalué cet effet de génération sur beaucoup de formes de matériel : images, résolution de problèmes arithmétique, génération des mots-clés d’un paragraphe, etc. Cependant, on ne trouve pas d’effet de génération si le matériel à générer n’est pas familier. Par exemple, les mots peuvent donner lieu à un effet de génération, mais pas les suites de syllabes sans signification, comme les pseudo-mots (bragab, chmorglub, etc). Cela vient du fait que générer quelque chose ne part pas de rien : cela demande d’assembler des informations de base dans la mémoire de travail. Si les connaissances antérieures ne sont pas là, c’est peine perdue. Et c’est sans compter la facilité de génération : plus cette génération est facile, plus on mémorise.

4.2.2 Organiser Une solution pour faciliter le rappel ultérieur des informations est d’associer les éléments du matériel à rappeler avec des indices. Or, ces indices de récupération vont prendre de la place en mémoire de travail. Si le nombre d’indices de récupération est trop élevé, la mémoire de travail surcharger. #### Chunking Pour éviter cela, on peut regrouper plusieurs indices dans une seule entité en utilisant la technique du chunking. Historiquement, le premier scientifique a avoir découvert cela était Miller, celui qui a découvert que la mémoire à court terme pouvait retenir 7 +- 2 chunks. Son expérience était simple : il devait retenir un maximum de chiffres binaires, présentés les uns après les autres. Pour information, le binaire est un système d’écriture des nombres qui n’utilise que deux chiffres : 0 et 1. Dans son expérience, il devait retenir une suite de 0 et de 1, dans ce genre : 1011110011010101100000. En travaillant sur des chiffres isolés, il arrivait à retenir 7 chiffres. Mais il eu l’idée d’utiliser des groupements de deux, trois, ou quatre chiffres binaires. Il eu l’idée d’interpréter chacun de ces groupe comme un nombre écrit en décimal. Il lui suffisait d’apprendre la correspondance entre groupes de chiffres et nombres, et de l’utiliser pour mémoriser les chiffres. – 0 = 0000 – 1 = 0001 – 2 = 0010 – 3 = 0011 – 4 = 0100 – 5 = 0101 – 6 = 0110 – … On peut regrouper des informations sur la base de critères catégoriels, ou de toute autre critère qui donne un sens au regroupement. Ce groupe servira ainsi d’indice, qui permettra de récupérer les éléments indépendamment les uns des autres.

47

4 Mémorisation et méthodes de révision

Pour gérer la mémoire de travail au mieux, on doit donc trouver un compromis idéal entre nombre de regroupements, et taille des groupes. Des groupes trop gros saturent la mémoire de travail avec un trop grand nombre d’éléments, tandis qu’un trop grand nombre de groupes va saturer la mémoire de travail d’indices. Idéalement, la taille d’un groupe, doit être inférieur à la capacité de la mémoire de travail : environ 4 ou 5. #### Hiérarchies On peut aller encore plus loin en regroupant les regroupements. Idéalement, on peut poursuivre ainsi de suite jusqu’à ce que l’on aie rassemblé toutes les informations dans un seul groupe, un seul chunk. On obtient ainsi une hiérarchie, qui respecte certaines contraintes. Cette hiérarchie est ce que l’on appelle une structure de récupération. ##### Expériences Expérimentalement, cette organisation hiérarchique permet d’obtenir un meilleur rappel que d’autres formes d’organisation. D’ailleurs, si l’on regarde comment sont organisées les informations dans la mémoire des experts dans un domaine, on s’aperçoit que ces informations sont souvent organisées de manière hiérarchique. Prenons un exemple : l’expérience de Bousfield (1953). Dans cet expérience, il était demandé à des élèves de mémoriser une liste de 60 mots. Ces 60 mots appartenaient à 4 catégories différentes : animaux, profession, légumes, et vêtement. Les mots sont présentés aléatoirement aux sujets. Seulement, au fil des essais, on s’aperçoit que les sujets ont tendance à regrouper les mots dans leurs réponses. Au final, après un grand nombre d’essais, ils rappellent les mots catégorie par catégorie. Et ce regroupement est fortement corrélé à un taux de rappel de plus en plus élevé. Prenons un autre exemple : Clark, Lesgold et Winzenz (1969) ont fait apprendre des listes de mots à deux groupes de sujets. Le premier avait une liste de mots organisée hiérarchiquement, et l’autre une liste complètement désorganisée. Le bilan est très clair : les membres du groupe hiérarchique ont rappelés 3 fois plus de mots que les autres. Wittrock and Carter (1975) ont montré que des élèves du secondaire qui organisaient eux-même une table de minéraux en hiérarchie avaient de meilleures performances que des élèves qui ne faisaient que recopier et relire la liste de minéraux. Par contre, relier une hiérarchie crée par le professeur donnait de meilleurs résultats que générer soit-même la hiérarchie. D’autres expériences sur des listes de mots sont arrivées aux même résultats : classer les informations dans une hiérarchie permet de faciliter fortement le rappel et l’apprentissage, d’un facteur pouvant aller de 3 à 5. ##### Explication Dans toutes les expériences faites sur le sujet, les expérimentateurs ont remarqué que lors du rappel d’une hiérarchie, le rappel d’un concept était suivi du rappel des sous-concepts situés juste en-dessous dans l’arbre dans 90% des cas. En clair, les élèves partaient de du haut de la hiérarchie et parcouraient celle-ci de proche en proche. Lors du parcours de la hiérarchie, les indices parcourus lors de la recherche de l’information sont aussi conservés en mémoire de travail : ils servent à se repérer dans la hiérarchie. La somme d’indices parcourus + taille du groupe en cours de visite ne doit donc pas dépasser la capacité de la mémoire de travail. ##### Application Il est donc conseillé de créer des hiérarchies pour mieux mémoriser. Mais comment faire ? Voici quelques exemples, qui vous permettront de mieux comprendre comment organiser le matériel à apprendre autour d’un plan de récupération. Ces exemples vont aborder le cas de matériel simple, souvent destiné à être appris par cœur. Par exemple, essayez de deviner laquelle de ces deux listes fonctionne le mieux : Liste 1 : – vache

48

4.2 Elaboration

– cheval – poney – poulain – cochon – rat – souris – lézard Liste 2 : – vache – cochon – poulain – souris – cheval – lézard – poney – rat C’est évidemment la première, vu que les mots sont regroupés par catégorie. Le fait d’indiquer explicitement les catégories permet d’améliorer encore la mémorisation. Liste 1 : – vache – cheval – poney – poulain – alligator – crocodile – caïman – lézard Liste 2 : équidés : – vache – cheval – poney – poulain reptiles : – alligator – crocodile – caïman – lézard De plus, si on montre un petit dessin montrant la hiérarchie des catégories, le rappel de la liste de mots est clairement meilleur comparé à une liste de mot convenablement triée.

49

4 Mémorisation et méthodes de révision

On peut donner un premier exemple, avec des groupements en catégories un peu plus subtils : l’apprentissage de cartes. Les départements sont un bon exemple : les catégories sont alors les régions. Ainsi, au lieu d’utiliser une liste dans ce genre : – 01 = Ain ; – 02 = Aisne ; – 03 = Allier ; – etc ; Vous devriez utiliser une liste dans ce genre : Départements du nord-pas-de-calais : – 59 = Nord ; – 62 = Pas-de-calais. Départements d’île-de-France : – 75 = Paris ; – 77 = Seine-et-Marne ; – etc. On peut aussi appliquer cette technique à l’apprentissage de dates, en histoire, à condition d’utiliser les nœuds qui conviennent. Les nœuds les plus élevés dans la hiérarchie seraient du style : Moyen-age, antiquité, etc. Quand aux nœuds un peu plus bas, ils seraient du style : règne de Louis 16, règne de Louis 14, etc. Cela peut aussi s’appliquer facilement à l’apprentissage de listes de vocabulaire, comme des listes de verbes irréguliers, des listes de mots d’une langue étrangère, etc. #### Mnémoniques Les procédés mnémotechniques sont aussi de bons moyens pour créer des regroupements. Ces procédés sont malheureusement trop peu utilisés lors des révisions (je tiens d’ailleurs à signaler qu’il existe un wikibooks sur le sujet). Évidemment, ces procédés sont utiles pour une gamme très limitée de matériel, et sont donc une stratégie très particulière, qui a tout de même son utilité.

50

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF