Enregistrement des vocalisations des jeunes enfants : lorsque le big data bénéficie de la collaboration des citoyens

L'enregistrement des vocalisations des jeunes enfants à l’aide d’enregistreurs portables est une méthode prometteuse pour évaluer le développement du langage. Mais l'annotation précise et rapide d’un nombre élevé d’enregistrements aussi longs reste un défi. Dans une étude publiée le 8 juin dans la revue scientifique Journal of Speech, Language, and Hearing Research, une équipe de chercheuses du Laboratoire de Sciences Cognitives et Psycholinguistique à l’ENS-PSL et de l’Université de Purdue ont évalué dans quelle mesure les annotations d'enregistrements des vocalisations de jeunes enfants par des scientifiques citoyens s'alignent avec celles recueillies en laboratoire. Les résultats montrent que les annotations des citoyens volontaires sont d’aussi bonne qualité que celles effectuées en laboratoire. La contribution citoyenne permettrait donc de surmonter ce défi.

Les retards de langage précoces pouvant avoir des conséquences négatives sur l'alphabétisation, le comportement, les interactions sociales et les résultats scolaires des enfants jusqu'à l'âge adulte, les interventions précoces ont été décrites comme un meilleur investissement sociétal que les interventions tardives. Mais comment pouvons-nous déterminer rapidement et précisément quels enfants sont à risque ?

Les progrès réalisés dans le domaine des technologies portables ont ouvert de nouvelles voies dans l'étude du développement du langage des nourrissons et des jeunes enfants. En effet, les enregistreurs portables permettent de recueillir des données dans l'environnement naturel de l'enfant sur une période longue, et à grande échelle, ce qui peut être particulièrement utile lorsqu’il s’agit notamment de récolter les vocalisations des enfants qui ne parlent pas beaucoup. L'un des inconvénients de la collecte d'enregistrements aussi longs est lié à la quantité importante de données : dans une journée, chaque enfant peut être enregistré pendant plus de 10 heures. L'écoute des enregistrements prend non seulement beaucoup de temps, mais soulève également de nombreux problèmes éthiques et juridiques. Cet article révèle qu’avec des méthodes et des protections appropriées, les scientifiques citoyens (volontaires non professionnels participant à des tâches scientifiques simples) peuvent contribuer à trier ces données et fournir des indices fiables du développement vocal de chaque enfant.

Dans cette étude, plus de 11 000 tronçons audio contenant des vocalisations d'enfants ont été extraits des enregistrements de dix enfants diagnostiqués avec le syndrome d'Angelman - un syndrome neurogénétique rare caractérisé par de graves troubles du langage - et de dix nourrissons à faible risque.

Pour pouvoir partager les enregistrements audio en toute sécurité sur le web avec des scientifiques citoyens, les enregistrements ont été découpés en morceaux d'une demi-seconde chacun, de telle sorte qu'aucune information sensible (par exemple les signes d’identification) ne puisse être diffusée. Les scientifiques citoyens ont été invités à participer aux travaux de recherche de l’équipe sur la plateforme de science citoyenne Zooniverse qui permet à qui le souhaite de prendre part à des recherches dans des domaines variés.

En quelques mois seulement, plus de 1 000 personnes ont fourni plus de 150 000 annotations ! Les annotateurs de Zooniverse ont classé chaque clip audio dans l'une des cinq catégories qui, ensemble, permettent d'évaluer la maturité des capacités vocales d'un enfant. Ces catégories comprenaient les syllabes "canoniques" (consonnes-voyelles, comme "bababa"), les syllabes "non canoniques" (voyelles seules/consonnes seules, comme "aaaaaah" ou "mmmm"), les "pleurs", les "rires" et le "bric-à-brac" (tout autre son ou bruit de fond qui aurait pu se glisser dans l'enregistrement).

L’équipe de chercheuses a également annoté ces clips en laboratoire en utilisant des méthodes de référence dans le but d’évaluer dans quelle mesure les annotations des scientifiques citoyens s'alignent sur celles recueillies en laboratoire. L'équipe s'est concentrée sur quelques mesures spécifiques des vocalisations globales des enfants. Des corrélations très élevées ont été trouvées entre les proportions estimées à partir des données annotées par le laboratoire et les données annotées par les scientifiques citoyens sur Zooniverse.

Ces résultats sont particulièrement intéressants alors que l’utilisation des enregistreurs portables pour récolter des données est devenue courante. Le recours au "Crowdsourcing" (production participative) peut ouvrir la voie à la création de grands ensembles de données de très bonne qualité qui rendent compte avec une grande précision de toute la diversité de la vie des enfants. Dans un projet à venir intitulé "Who’s talking how ?", l’équipe de recherche va d’ailleurs en étendre l’usage aux vocalisations des personnes qui entourent les enfants.

whos talking how — *"Who's talking how ?" project*

Cette prochaine étude permettra de décrire l'utilisation du langage dans beaucoup plus de langues et de cultures qu'il n'a été possible de le faire jusqu'à présent à l'aide d'annotations en laboratoire.

Bibliographie :
Chiara Semenzin, Lisa Hamrick, Amanda Seidl, Bridgette L. Kelleher, and Alejandrina Cristia (2021). Describing Vocalizations in Young Children:A Big Data Approach Through CitizenScience Annotation. Journal of Speech, Language, and Hearing Research

POUR EN SAVOIR PLUS

Communiqué du CNRS

Equipe "Acquisition du langage à travers différentes cultures"

Présentation des travaux d’Alejandrina Cristia sur l’acquisition du langage à travers les cultures (vidéo)

Article "Alejandrina Cristia, lauréate d'un financement ERC Consolidator pour son projet sur les effets de l'expérience dans l'acquisition précoce des langues "

Enregistrement des vocalisations des jeunes enfants : lorsque le big data bénéficie de la collaboration des citoyens

Enregistrement des vocalisations des jeunes enfants : lorsque le big data bénéficie de la collaboration des citoyens

Isidora Stojanovic, François Recanati et Emmanuel Dupoux ont obtenu un financement ERC

Human Auditory Ecology workshop. Foundations of a new interdisciplinary field

Prix Jean Nicod 24 - Christopher Peacocke "Understanding music"