Quand nous percevons des objets qui apparaissent fréquemment ensemble, nous les groupons mentalement pour pouvoir les traiter plus facilement. Cela s'appelle un chunk. Il est important de connaître à quel moment de tels chunks sont créés, notamment pour comprendre comment les bébés isolent les mots dans d'un flux de syllabes. Des chercheurs** de l'Université de Grenoble ont conçu un modèle qui simule la création de chunks, en utilisant un principe de théorie de l'information qui permet de calculer la taille de codage de l'information.

Ce modèle implémente l'idée que parmi tous les regroupements possibles d'objets que nous pouvons effectuer, nous avons tendance à choisir les plus simples, c'est-à-dire ceux qui peuvent être codés de la manière la plus efficace. Le modèle considère qu'un chunk est créé dès lors que le coût de sa création est compensé par un gain lors du recodage de l'information. Par exemple, si les syllabes "cho", "co" et "la" apparaissent souvent dans cet ordre, la création d'un chunk permet de simplifier, au niveau des tailles de codage, les énoncés perçus.
Ce modèle a été testé sur une tâche dans laquelle les participants doivent déplacer avec la souris des symboles apparaissant sur un écran. Comme cette tâche se révèle vite fastidieuse, ils ont aussi la possibilité de créer des groupes de symboles, comme dans un logiciel de dessin, ce qui permet un glisser-déposer global, plus rapide, y compris pour les futurs ensembles identiques de symboles. Ces symboles apparaissent avec différentes probabilités d'association. Au bout d'un certain temps, les participants repèrent certains groupes et décident de perdre un peu de temps à les créer pour en gagner par la suite.
Le modèle prédit remarquablement bien les groupes créés, ainsi que le moment où ils le sont par les participants. Il a également été testé sur une tâche visant à étudier la formation des mots à partir d'un flux de syllabes, en utilisant un mini langage artificiel.

 

Référence :
Robinet, V., Lemaire, B., Gordon, M.B. (2011). MDLChunker: a MDL-based Cognitive Model of Inductive Learning. Cognitive Science 35(7), 1352-1389.

**Vivien ROBINET travaille à l'UMR Espace-Dev de l'IRD, à l'université des Antilles et de la Guyane. Benoît LEMAIRE travaille au Laboratoire de Psychologie et NeuroCognition (LPNC, CNRS, UMR 5105) de l'Université de Grenoble. Mirta GORDON travaille au Laboratoire d'Informatique de Grenoble (LIG, CNRS, UMR 5217) de l'Université de Grenoble.