INTRODUCTION ET PARCOURS
Peux-tu te présenter en quelques mots ?
Issu d’un parcours d’ingénieur (MP/Ecole Polytechnique/UC Berkeley), j’ai suivi un M2 en statistiques à la Sorbonne Université avant de commencer ma thèse au Département de Mathématiques Appliquées (DMA) à l’Ecole Normale Supérieure rue d’Ulm, sous la direction d’Eddie Aamari (DMA) et Frédéric Chazal (INRIA)
Qu’est-ce qui t’a amené à t’intéresser à l’intelligence artificielle ?
Après mon diplôme de UC Berkeley, j’ai eu l’occasion de travailler pendant 4 ans au sein de deux entreprises spécialisées dans la reconnaissance vocale, à l’époque où l’intelligence artificielle prenait une place de plus en plus importante au sein de l’industrie. Initialement issu d’une formation de traitement du signal, j’ai naturellement été amené à travailler avec les réseaux de neurones, et c’est en creusant les aspects théoriques au cours de mes projets que j’ai pris la décision de me lancer pleinement dans la recherche en IA.
Comment décrirais-tu ton sujet de thèse à quelqu’un en dehors du domaine ?
L’objectif de ma thèse est d’étudier les réseaux de neurones à l’aide de l’analyse topologique des données, un outil qui permet de capturer la “forme” des données, et comprendre comment ils réussissent à transformer des entrées complexes en des objets plus simples, ouvrant la voie à une meilleure interprétabilité des méthodes basées sur ces réseaux.
LE COEUR DU PROJET
Quel est l’objectif principal de ta recherche ?
Des résultats expérimentaux tendent à montrer que les réseaux de neurones simplifient la topologie du jeu de données d’entraînement. Nous souhaitons approfondir l’étude en utilisant l’analyse topologique des données (TDA) afin de quantifier ce phénomène et ouvrir la voie à une nouvelle forme de design et diagnostic des réseaux de neurones, et offrir un angle de vue différent sur les surprenantes performances de ces modèles.
Quelles méthodes ou approches utilises-tu ?
Cette thèse comporte une forte composante expérimentale, de par sa nature exploratoire. De nombreuses expériences sur des problèmes simples sont menées afin de dégager des tendances pertinentes au regard de la TDA. En parallèle, une analyse théorique est menée sur des modèles de machine learning plus standards, s’appuyant sur les résultats et méthodes d’analyse existants, les adaptant aux théorèmes statistiques issus de la TDA.
Pourquoi ce sujet te semble-t-il important pour l’IA de demain ?
Ce sujet s’inscrit dans une volonté de comprendre comment les spécificités des jeux de données et des architectures de réseaux de neurones interagissent pour fournir des résultats aussi performants même avec des petites tailles, ouvrant la voie à un développement efficace et parcimonie de l’IA.
COLLABORATION ET ÉCOSYSTÈME
Avec quelles structures, laboratoires ou partenaires travailles-tu ?
Je suis au DMA de l’ENS Ulm et travaille également en collaboration avec le Laboratoire de Mathématiques d’Orsay, ainsi que des équipes de l’INRIA.
En quoi le soutien du DIM AI4IDF a-t-il été un levier pour ton projet ?
Ce projet à été construit de toutes pièces en collaboration avec mes directeurs de thèse, ne répondant pas à une offre spécifique. Cette grande liberté dans le choix de la direction a notamment été permise grâce au soutien du DIM AI4IDF.
Comment vois-tu les collaborations entre les différents clusters et domaines de recherche ?
La TDA s’intéresse à la structure spécifique des jeux de données, même dans des situations où le nombre est restreint. Ainsi, l’analyse gagne à exploiter les données spécifiques des différents domaines tout en essayant de proposer des méthodes d’analyse permettant d’améliorer leur robustesse tout en prenant en considération des contraintes de taille sur les modèles.
IMPACT ET SOCIÉTÉ
Selon toi, quelles sont les implications éthiques ou sociétales de ta recherche ?
Le projet de recherche vise à apporter une contribution dans le développement d’une IA parcimonieuse, peu gourmande et ciblée, limitant ainsi l’impact énergétique.
Comment vois-tu le rôle de l’IA dans les grands défis contemporains ?
L’IA possède un potentiel formidable dans l’analyse de données à grande échelle, et je pense que d’ici quelques années il aura infusé l’essentiel des secteurs industriels, économiques mais aussi politiques. Ainsi il est crucial d’œuvrer pour un développement équitable et accessible à tous de cette technologie.
VISION ET INSPIRATION
Une découverte ou un concept scientifique qui t’inspire ?
Le concept d'émergence se caractérise par l’apparition de propriétés macroscopiques d’un système composé d’une multitude d'éléments obéissant à des règles simples, ces propriétés n’étant pas explicables par l’analyse élémentaire des parties qui le composent. Ce concept est d’autant plus fascinant qu’il est omniprésent dans la nature, depuis les organismes biologiques composés de cellules aux étoiles composées d’hydrogène.
Un conseil pour les futurs doctorants qui voudraient se lancer dans la recherche ?
Je pense qu’il est particulièrement important de garder du recul sur l’objet de recherche afin de ne pas se perdre dans la technicité. Un esprit curieux et une bonne rigueur sont essentiels afin de garantir cet équilibre.
Si tu pouvais résumer ton approche de la recherche en une phrase ?
Approfondir sa compréhension des sujets via l’expérimentation et la réflexion libre pour faire naître des idées neuves.
Propos recueillis par Khaled Benaida