Morphologie et lexicologie


Le lexique dans la tête

Les bases physiologiques

Dans ce qui suit, nous allons nous concentrer sur les aspects lexicaux du langage. Ce faisant, nous laisserons provisoirement de côté les autres dimensions comme les sons et la structure des phrases. En ce qui concerne le lexique, on sait que le langage est localisé surtout (mais non pas exclusivement) dans deux régions du cerveau: l'aire de Broca et l'aire de Wernicke, comme l'illustre l'image suivante:

Le cerveau

bleu = aire de Broca; vert = aire de Wernicke

On a pu distinguer le rôle des deux régions en étudiant les effets sur le langage provoqués sur les blessures aux deux régions. En gros, une blessure à l'aire de Broca provoque des difficultés d'accès lexical lors de la production du langage, tandis que les dommages à l'aire de Wernicke provoquent un langage souvent fluide, mais sans signification évidente.

Les dimensions du lexique mental

Dans un contexte de communication, un être humain doit pouvoir, en temps réel, choisir et prononcer une série de mots appropriés. De façon analogue, pour comprendre le langage, il faut pouvoir, toujours en temps réel, associer une série de sons à une signification. On peut résumer cette tâche au moyen de l'image suivante:

La boucle de la communication

Si on considère que la vitesse moyenne de la production de la langue parlée se situe entre 130 et 180 mots par minute, cela veut dire qu'un être humain dans un contexte de communication doit pouvoir trouver entre deux et trois mots par seconde. Ces mots doivent être retrouvés dans un vocabulaire relativement important. Illustrons l'ampleur de la tâche par la petite expérience suivante: selon le lexique français dans Lexique 3, il y a en français 26,806 formes adjectivales distinctes, sans parler des différences de sens, et 48,287 formes nominales distinctes, sans parler des différences de sens. Lorsqu'on combine les deux listes, on se rend compte que cela donne 1,294,381,322 suites possibles ADJ + N, sans compter les différences de sens.

Supposons maintenant qu'un être humain doit trouver un adjectif dans cette liste, et qu'il faut parcourir la liste en ordre alphabétique pour trouver la forme. À une vitesse de 10 mots par seconde, notre locuteur mettrait 7.5 heures à parcourir la liste des adjectifs, 13.4 heures à parcourir la liste des noms, et environ 4 ans à parcourir la liste de toutes les combinaisons ADJ + N. Il est évident que les êtres humains ne fonctionnent pas ainsi! La question se pose alors: comment fait-on pour trouver les mots pour parler et pour comprendre les mots qu'on entend?

L'importance de l'ordre

Dans la réalité, le langage se manifeste en ordre linéaire. On prononce les phrases un mot à la fois, où le mot m[1] précède le mot m[2], qui précède le mot m[3] et ainsi de suite. Les êtres humains sont capables d'utiliser cette propriété à plusieurs niveaux. Ainsi, il existe un certain nombre de séquences habituelles que nous avons appris comme liste, comme les jours de la semaine, l'alphabet, les chiffres, etc. On peut constater l'importance de l'ordre en comparant la vitesse de production quand on produit ces listes à partir du début et à partir de la fin. La plupart des locuteurs peuvent ainsi enchaîner les lettres de l'alphabet dans l'ordre a, b, c... assez rapidement, mais auront beaucoup plus de peine à les prononcer à partir de z.

Cette tendance linéaire se manifeste à plusieurs niveaux. Ainsi, si on présente à un sujet le début d'un mot à l'écrit, une lettre à la fois, la plupart des locuteurs n'auront pas besoin de toutes les lettres pour reconnaître la plupart des mots. Ainsi, devant la lettre initiale c, on est déjà en route. Si par la suite on voit ch, un certain nombre de mots vont se présenter à l'esprit, et arrivé à la séquence chai, il est probable que la plupart des locuteurs auront choisi le mot chaise.

La même tendance se manifeste au niveau des suites de mots. D'abord, il y en a qui sont dèjà figées, comme s'il vous plaît, à tout à l'heure, au revoir. D'autres feront partie d'une classe de possibilités plus ou moins grande. Ainsi, devant la séquence Ferme la..., la liste des possibilités devient plus petite. On peut même penser qu'une bonne partie de nos productions linguistiques sont formées ainsi.

L'ordre dans la compréhension

Ce facteur de différenciation linéaire se retrouve également au moment de choisir les mots, comme l'illustre l'expérience suivante. Les chercheurs Dahan, Swingley, Tannenhaus et Magnusen, dans un article publié en 2000 dans la revue Journal of Memory and Language, numéro 42, p. 465–480 intitulé Linguistic Gender and Spoken-Word Recognition in French décrivent une expérience où des sujets se trouvent devant un écran sur lequel se trouve une série d'images et de formes géométriques. Ils portent un instrument qui permet de mesurer la direction de leur regard. Nous reproduisons un exemple de l'écran ici:

bouteille

Dans une première expérience, les sujets entendaient des phrases en français comme Cliquez sur bouton. Ils avaient alors à trouver l'image d'un bouton sur l'écran et à cliquer sur l'image avec une souris. Si on regarde l'image ci-dessus, on constate qu'il y a deux mots qui commencent par les sons /bu/ (bouton et bouteille). Quand ils ont entendu la syllabe /bu/, les sujets avaient tendance à regarder surtout les mots bouton et bouteille plutôt que les autres images comme sac et chien. Cela semble indiquer que déjà, le début d'un mot amène le locuteur à faire un tri dans la liste des mots possibles.

Ce qui est même plus intéressant, c'est le résultat d'une deuxième expérience. Cette fois-ci, l'instruction donnée aux sujets comprenait un article (p.ex. Cliquez sur la bouteille). Dans ce genre de circonstances, une fois prononcé l'article avec son genre, p.ex., une, on a constaté que les locuteurs avaient tendance à regarder surtout l'image qui correspondait au genre de l'article. Ainsi, entendant un, on regardait surtout le bouton, et entendant une, la bouteille.

Ensemble, ces deux expériences montrent le rôle important joué par les attentes. Il semblerait que les locuteurs se préparent pour ce qui va venir selon ce qu'ils viennent d'entendre. Très souvent, cette approche s'avère utile et efficace. Mais il est possible d'amener les sujets à se tromper. C'est ce qui arrive dans le cas des phrases labyrinthines.

Les phrases labyrinthines

Nous venons de voir que les sujets semblent faire des prévisions sur la base de ce qu'ils viennent d'entendre. Or, cette stratégie s'avère parfois trompeuse. Voyons-en un exemple. Lisez la phrase suivante:

La belle la ferme.

Est-ce une phrase en français? Beaucoup de locuteurs diraient que non. C'est qu'ils analysent la séquence de la façon suivante:

La belle la ferme.
DET ADJ DET N

Une telle attribution des parties du discours fonctionne le plus souvent dans le sens où belle dans la séquence La belle est souvent un adjectif, comme dans le cas de La belle maison.... Mais parfois, moins souvent, belle peut fonctionner comme nom, comme dans le cas de La belle et la bête. Le locuteur qui a choisi le statut adjectival a donc choisi une fausse route et entre dans le labyrinthe des mauvaises possibilités. De façon analogue, on voit la souvent comme un article, même si cela peut fonctionner comme pronom, et on voit souvent porte comme un nom, même si cela peut fonctionner comme verbe. En effet, la séquence La belle la ferme est bien une phrase possible, avec l'analyse:

La belle la ferme.
DET N PRON V

La mémoire

Le plus souvent, quand on écoute une phrase, nous portons notre attention au sens qu'il faut extraire des mots qu'on entend. Nous venons de voir quelques stratégies utilisées pour faciliter l'identification des mots. Par contre, puisque la plupart des phrases sont composées de plus d'un mot, et la plupart des conversations de plus d'une phrase, une autre dimension doit être considérée: celle de la mémoire.

On distingue habituellement deux sortes de mémoire: la mémoire à court terme et la mémoire à long terme. La mémoire à court terme fonctionne surtout pour garder une trace temporaire de la séquence qu'on vient d'entendre. Sa capacité est relativement limitée. Ainsi, il est difficile de retenir tous les mots d'une série de phrases. En fait, il semblerait que la capacité de la mémoire à court terme serait entre 5 et 9 unités. Dans le cas de la langue parlée, la séquence de sons qu'on entend est divisée en mots ou en groupements figés de mots. Le plus souvent, une fois qu'on a extrait le sens de ces mots ou séquences, ils disparaissent de notre mémoire à court terme. On peut les garder plus longtemps, mais surtout en les répétant. On parle alors d'une boucle phonologique. Si quelque chose attire notre attention durant cette répétition, le contenu de la boucle phonologique a tendance à se vider.

Par contre, une fois extrait le sens d'une phrase, ce sens peut se déplacer dans notre mémoire à long terme. Dans ce cas-là, ce sens plus abstrait peut rester accessible pendant des heures ou même des années. Par contre, les mots particuliers risquent d'avoir disparu, à moins qu'un facteur accessoire les rende particulièrement saillant. On peut tester ce phénomène en demandant à un sujet de raconter une conversation qu'il a eu quelques heures ou quelques jours auparavant. Le sujet retiendra le sens de la conversation, mais probablement pas les mots utilisés.

Toutefois, malgré le fait que nous oublions les mots particuliers entendus ou lus dans un contexte particulier, il semblerait que nous gardons une trace d'au moins la fréquence relative des mots. Ainsi, si on demande à un sujet de juger si marteau et plus fréquent que scie, ou si rouge est plus fréquent que vert, la plupart sauront le faire. On peut utiliser ce fait en demandant à un sujet de penser à une couleur et à un outil sans vous le dire. La plupart penseront à marteau et à rouge. Vous pourrez alors donner l'impression d'être télépathique en produisant la séquence avant votre sujet!

Le lexique et la production

Si au lieu de comprendre une phrase, on est appelé à en faire une, le défi change. On doit alors, à partir d'un sens, trouver dans sa mémoire une série de mots susceptibles de porter ce sens. Mais comment éviter le temps calculé au début du chapitre? Comment les mots sont-ils stockés en mémoire? Un indice est fourni par le phénomène où on cherche un mot sans le trouver. On dit alors que le mot se trouve sur le bout de la langue, et on parle alors du phénomène bout de la langue. Pour déclencher cet état, on peut chercher une information comme les comédiens qui ont joué dans un film, les pays du monde, etc. On constatera alors que devant les cas où un mot ne vient pas à l'esprit, on a parfois l'impression d'en voir le squelette. Ainsi, on peut avoir l'impression que le mot a deux syllabes, qu'il commence par le son /t/, qu'il se termine en s. Toutes ces impressions indiquent qu'effectivement les mots semblent être stockés par leur structure phonologique, entre autres choses. Puisqu'il existe plusieurs mots ayant presque la même structure phonologique, on peut parler d'une cohorte autour de chaque mot.

Une fois trouvés les mots pour faire une phrase, le locuteur doit ensuite les aligner dans une phrase. C'est alors qu'on découvre une autre facette du stockage. La linguiste Victoria Fromkin a établi un corpus de lapsus (dans sa terminologie, 'slips of the tongue'). L'étude des lapsus met en valeur un certain nombre de phénomènes de stockage. Par exemple, elle a relevé les exemples suivants en anglais:

Si on les examine, on constate deux phénomènes. D'abord, la transposition des consonnes initiales dans le premier cas vient confirmer ce que nous avons déjà vu en ce qui concerne le statut privilégié de la position initiale des mots. Le deuxième exemple est même plus complexe, car il montre une séparation entre d'une part le mot choisi (innings et run), et d'autre part les terminaisons (-s et zéro). C'est comme si le locuteur choisissait les mots d'un côté et ajoutait les flexions dans une opération distincte. Nous y reviendrons dans un chapitre à venir.

L'étude des lapsus est assez complexe. Pour quelques indices de recherche, on peut consulter une page de L. Zwicky.

En somme

Les exemples précédents illustrent la complexité du stockage dans le domaine lexical. Loin d'être un simple sac de mots, ou une simple liste, le vocabulaire semble prendre la forme d'un complexe réseau dont les éléments sont reliés par plusieurs relations distinctes dans plusieurs dimensions.
© 2014, Greg Lessard
Département d'Études françaises, Queen's University, Canada
Courriel: greg.lessard@queensu.ca
Notes sur la distribution