Financement
Mis à jour
29 septembre 2022
IJN
ESC

BUNKA, un moteur d'exploration des données utilisant l'intelligence collective et l'intelligence artificielle

BUNKA ("culture" en japonais) est un projet d’architecture logicielle portant principalement sur un moteur de recherche de nouvelle génération basé sur la recherche récente en sciences cognitives (intelligence collective et ergonomie cognitive) et en sciences computationnelles (traitement automatique du langage et apprentissage machine). BUNKA est lauréat du programme de pré-maturation du CNRS et du programme “IA et Sciences humaines et sociales” de l’institut PRAIRIE


 

Bunka

Ce projet est porté par l’équipe Computational Cultural Sciences  de l’Institut Jean Nicod et plus particulièrement par Charles de Dampierre - doctorant en sciences sociales computationnelles et ingénieur de recherche au Médialab de Sciences Po, Nicolas Baumard - directeur de recherche CNRS, spécialiste des sciences sociales cognitives, et Andrei Mogoutov - physicien affilié au Médialab de Sciences Po, spécialiste d'analyses de données hétérogènes.

BUNKA est directement issu de la recherche de l’équipe Computational Cultural Sciences dont les travaux visent à cartographier et quantifier la distribution des représentations culturelles (croyances, opinions, préférences, etc.) - ce que Dan Sperber a appelé l’épidémiologie des représentations - à l’aide des outils de traitement automatique du langage et apprentissage machine. 

Ces cartographies, d’abord produites pour la recherche en sciences sociales, peuvent en réalité être d’une grande aide pour tout un chacun. Ce que pensent les autres d’un événement ou d’un contenu culturel, l’intelligence collective, est crucial dans la recherche d’information. 

L’avènement du Web participatif ou Web 2.0 (Twitter, Reddit, Wikipedia, etc.) a considérablement augmenté la quantité d’intelligence collective au travers des revues, avis, critiques et opinions postés en ligne. Cependant, cette intelligence collective est encore sous-exploitée, notamment pour des raisons techniques, parce que la taille des données est massive, et parce que ces données sont extrêmement hétérogènes.

BUNKA développe une nouvelle façon d’organiser l’intelligence collective à l’aide des avancées récentes en sciences computationnelles (Traitement Automatique du Langage et Apprentissage Machine). Plus précisément, des algorithmes de “plongement” (“embedding”) sont utilisés pour projeter des données dans un espace abstrait en fonction de règles (similarité sémantique, similarité topologiques, dimension en commun, etc.). 

La seconde idée force sur laquelle repose BUNKA est que la visualisation est indispensable à la découvrabilité. Pour améliorer l'autonomie, la diversité, la transparence, la sérendipité, il faut disposer de l'ensemble des options, et de leurs relations entre elles. Autrement dit, pour chaque requête, chaque contenu, il faut disposer d'une carte de la toile. L'équipe agrége donc les revues, avis, critiques, opinions postées sur la toile par les utilisateurs·trices, et crée des cartes et des représentations contextuelles qui, pour chaque requête à propos d'une œuvre ou d'un thème, donnent à voir l'ensemble des contenus culturels associés, ainsi que l'opinions, la popularité et leurs relations entre ces contenus. Muni·e de l'ensemble des options visibles sur la carte, et en particulier des options minoritaires et moins visibles, l'utilisateur·trice peut ainsi s'affranchir des algorithmes de recherche, et explorer par lui/elle-même les thèmes et les dimensions qui l'intéressent.

In fine, BUNKA est un "moteur d'exploration" : un outil qui donne non pas un seul résultat, comme un moteur de recherche, mais un ensemble d'information qui permet à l'utilisateur·trice d'explorer par lui/elle-même, de manière autonome et transparente.

POUR ALLER PLUS LOIN

https://www.bunka.ai