Baye Lahad Mbacke

2025 - CNRS (LS2N, UMR 6004), u. de Nantes

Formé au traitement automatique des langues naturelles (TALN) et à l'apprentissage automatique à Nantes Université, je m'intéresse particulièrement aux méthodes de compréhension automatique des langues et à leurs applications concrètes. Mon parcours académique a débuté par une licence en mathématiques-informatique à l'université Cheikh Anta Diop de Dakar (Sénégal), poursuivie par L3 en Informatique à l'université de Strasbourg, avant d'intégrer le Master ATAL à Nantes, ce dernier m'ayant permis de me spécialiser en TALN. Mes expériences au sein de Ouest-France et du LS2N (Laboratoire des sciences du numérique de Nantes) m'ont permis d'acquérir une expérience pratique en recherche et extraction d'information.
Ma thèse vise à développer des outils permettant de faciliter la mise en relation entre les acteurs des ICC et leur public à travers l'automatisation du traitement de données culturelles.

Extraction et structuration automatique frugale d’événements culturels

La thèse s’inscrit dans le domaine du traitement automatique des langues naturelles (TALN), et plus précisément de l’extraction d’information, appliquée à la structuration de données culturelles issues des sites Web d’acteurs culturels. Ces derniers peinent à diffuser efficacement leur programmation, faute de format normalisé et de moyens automatisés. Le projet vise à extraire automatiquement, de manière frugale et fiable, les informations pertinentes décrivant des évènements culturels (titres, dates, lieux…) depuis des pages Web hétérogènes. La thèse emploiera une approche multimodale pour développer des méthodes automatiques exploitant à la fois le contenu de ces pages et leur structure, et capable de traiter de grandes quantités de données.
L’évaluation portera sur la pertinence, la complétude, la robustesse, l’autonomie et le coût des solutions. Le projet est réalisé en partenariat avec la plateforme ideactiv, qui fournira données, outils et expertise. L’objectif est de rendre les outils d’IA utiles, accessibles et fiables pour les ICC, tout en renforçant leur rayonnement culturel et économique.

Direction de thèse

Richard Dufour est professeur à l’université de Nantes. Ses travaux de recherche portent sur le traitement automatique des langues (TAL), en particulier via des approches d’apprentissage automatique. Il a auparavant obtenu un doctorat de Le Mans Université sur la thématique de la transcription automatique de la parole spontanée, puis a été maître de conférences à Avignon Université. Ses recherches récentes s’orientent principalement vers les domaines biomédical et juridique. Il travaille notamment sur la modélisation du langage, les modèles génératifs de texte, la reconnaissance d'entités nommées, ainsi que sur la génération de données synthétiques.
Il coordonne actuellement le projet ANR MALADES (2023–2027), qui vise à développer des modèles de langue de grande taille (LLMs) souverains pour le domaine médical français.

Thomas Chenevier est le fondateur d'ideactiv, plateforme utilisant l'intelligence artificielle pour faciliter le partage des données d'événements culturels entre les acteurs culturels, les médias et les collectivités.
Avant de fonder ideactiv, après une formation initiale scientifique, il a occupé des fonctions managériales, juridiques et techniques dans la fonction publique française et européenne et dans des entreprises technologiques.

Vincent Labatut a obtenu son doctorat en informatique de l’université Paul Sabatier—Toulouse III en 2003, pour un travail effectué dans le domaine des neurosciences computationnelles.
Après avoir participé à la création d’une start-up fournissant une solution de stockage de données en ligne, il a été recruté par l’Université Galatasaray à Istanbul (Turquie) en 2005 puis par Avignon Université en 2014, où il est actuellement maître de conférences HDR.
Son activité de recherche se déroule au LIA (Laboratoire Informatique d’Avignon) dans les domaines de la fouille de graphes, du traitement automatique des langues naturelles et de la recherche d’information.
Il est particulièrement intéressé par les questions interdisciplinaires mêlant informatique et SHS, ce qui l’a amené à prendre la direction de la FR Agorantic en 2023.

This site is registered on wpml.org as a development site.