Samia Bouzefrane : “L’intelligence artificielle ouvre de nouvelles perspectives pour comprendre, préserver et transmettre le patrimoine”

Open link

https://ai4chief.roc.cnam.fr/

Date

19 May 2026

Samia Bouzefrane : “L’intelligence artificielle ouvre de nouvelles perspectives pour comprendre, préserver et transmettre le patrimoine”

Ouverture

Nous sommes heureux d’avoir pu soutenir le Symposium AI4CHIEF, évènement qui a montré très clairement le rôle joué par l’IA dans le maintien et la transmission des cultures profondes. Pouvez-vous nous dire comment vous avez imaginé cet évènement, notamment en collaboration avec M. Youakim Badr, de l’Université de Pennsylvanie.

J’ai accueilli le Professeur Youakim Badr au Cnam en septembre 2024 en tant que chercheur invité pour une durée de trois mois. À cette occasion, il a découvert non seulement mes travaux en cybersécurité, mais également mon engagement en faveur de la langue kabyle, notamment à travers le développement d’outils numériques dédiés à la revitalisation de ma langue maternelle. Fort de mon expérience dans l’organisation de conférences internationales au Cnam, je lui ai proposé l’idée d’un événement consacré à l’usage de l’intelligence artificielle pour la préservation et la revitalisation des langues autochtones. Youakim a alors suggéré d’élargir cette initiative à la valorisation plus globale du patrimoine de ces peuples.

Mais il faut savoir que cet événement que je tenais personnellement à organiser est la conséquence de tout un vécu. En effet, avant d’aller à l’école, je ne parlais que ma langue maternelle le Kabyle, une langue orale parlée dans le nord de l’Afrique du Nord depuis des millénaires. A l’école, je découvre d’autres langues : le Français, l’Arabe et l’Anglais et longtemps je me demandais pourquoi je ne peux pas écrire dans ma langue, la langue dans laquelle je rêve lorsque je dors. Arrivée à l’université de Tizi-Ouzou dans les années 1980, je découvre des cours de Kabyle que je suis même si ces cours étaient dispensés discrètement car la langue était bannie par l’Etat algérien.

Quelle fût ma joie le jour où j’ai écrit quelques mots en transcription latine de ma langue maternelle. J’ai pris conscience que dans ces langues orales qui n’ont pas eu les moyens de se développer, on ne pouvait pas parler de science car la terminologie associée n’existait pas. J’ai alors fait un dictionnaire d’informatique pour le Kabyle/Berbère (première édition en 1996 publiée chez l’éditeur l’Harmattan et la 4ème édition est accessible gratuitement sur HAL depuis avril 2026). Ces dernières années, j’ai pris conscience de la fraction numérique que subissent ces langues autochtones, j’ai alors commencé à travailler sur le développement des outils informatiques pour la revitalisation de la langue kabyle. Cette prise de conscience a donné lieu à cette conférence avec l’objectif de préserver, promouvoir, sauver les langues et le patrimoine des peuples autochtones. L’IA ne suffira pas mais elle contribue amplement à cet objectif.

« Les travaux abordent aussi les enjeux critiques et éthiques de l’IA. Certaines équipes ont analysé les biais des modèles de langage, les risques d’injustice épistémique dans des systèmes automatisés (par exemple pour l’asile), ou encore les effets des algorithmes sur les dynamiques sociales et politiques. Ils soulignent l’importance de transparence, d’équité et de gouvernance responsable. »

AI4CHIEF propose une articulation originale entre IA, patrimoine culturel et savoirs autochtones. Quelle est la vision fondatrice de ce symposium ?

Notre objectif dans ce symposium est la mise en lumière de travaux de recherche qui convergent vers une vision de l’IA plus inclusive, contextuelle et éthique, qui valorise la collaboration avec les communautés concernées, la diversité linguistique et culturelle, et une utilisation responsable des technologies.

En quoi l’IA transforme-t-elle aujourd’hui les approches de préservation, d’analyse et de transmission des patrimoines culturels (notamment ceux historiquement marginalisés) ?

Nous pouvons résumer ici les thématiques présentées dans ce symposium et qui illustrent très bien comment l’IA intervient dans des contextes marqués par la rareté des données, notamment pour les langues peu dotées, le patrimoine culturel et les communautés autochtones.

Une première famille de travaux s’est concentrée sur les langues à faibles ressources. Les chercheurs proposent des approches hybrides combinant méthodes symboliques et modèles neuronaux pour normaliser des textes anciens (comme le tibétain), traduire la parole ou le texte (kurde central, araméen, odia), et développer des outils comme l’OCR (pour le kabyle) ou des modèles multilingues adaptés. Ces travaux montrent que des stratégies comme l’augmentation de données, l’utilisation de modèles au niveau des caractères ou des octets, et l’implication humaine permettent d’améliorer les performances malgré le manque de ressources.

Un deuxième axe a porté sur la revitalisation linguistique et culturelle, toujours dans les contextes autochtones. Plusieurs contributions mettent en avant des systèmes d’IA conçus avec et pour les communautés, intégrant gouvernance locale et bases de connaissances culturellement encadrées. L’objectif est de préserver les langues, faciliter l’accès aux savoirs et soutenir leur transmission, tout en respectant les principes de souveraineté des données et les cadres culturels.

Les travaux abordent aussi les enjeux critiques et éthiques de l’IA. Certaines équipes ont analysé les biais des modèles de langage, les risques d’injustice épistémique dans des systèmes automatisés (par exemple pour l’asile), ou encore les effets des algorithmes sur les dynamiques sociales et politiques. Ils soulignent l’importance de transparence, d’équité et de gouvernance responsable.

Dans le domaine du patrimoine culturel, les chercheurs proposent des approches innovantes pour générer des récits, reconstruire des œuvres musicales disparues ou modéliser les significations culturelles de manière relationnelle. L’IA est envisagée non comme un simple outil de production, mais comme un support à l’interprétation, à la transmission et à la co-construction des savoirs.

Enfin, plusieurs contributions examinent le rôle de l’IA dans les enjeux environnementaux et climatiques pour les communautés autochtones. Elles mettent en avant des approches participatives, intégrant savoirs traditionnels et données scientifiques, ainsi que des outils éducatifs ou décisionnels adaptés à des contextes locaux et contraints. L’accent est mis sur une IA au service de la résilience, de l’autonomie et de la justice environnementale.

Comment éviter que les modèles d’IA reproduisent des biais culturels ou invisibilisent certains savoirs, et quelles pistes de recherche concrètes ont été mises en discussion lors de AI4CHIEF ?

Je peux citer le travail réalisé par un collègue du Cnam qui propose un cadre multi-modèles pour analyser de manière systématique les biais présents dans les sorties des grands modèles de langage. L’approche s’appuie sur un ensemble de métriques spécifiques, telles que la polarité de genre, la toxicité, le sentiment, le regard et les associations stéréotypées. Elle intègre des modèles adaptés, notamment pour la détection de la toxicité et l’analyse de sentiment, et introduit de nouvelles mesures, comme une analyse avancée de la polarité de genre et un score d’association stéréotypée.

Les résultats montrent que les biais systémiques sont largement similaires d’un modèle à l’autre et permettent d’établir une hiérarchie des biais selon les catégories. Le cadre facilite également la comparaison entre modèles sur différentes dimensions et met en évidence des phénomènes de surcorrection, où les modèles tentent de compenser certains biais mais créent ainsi de nouvelles distorsions.

Votre symposium s’inscrit à l’intersection du traitement du langage (NLP) et des usages éducatifs et culturels de l’IA. Comment ces deux dimensions dialoguent-elles concrètement dans les travaux présentés ?

Ce symposium a réuni des chercheurs issus de diverses disciplines, notamment des informaticiens et des linguistes. Nous avons constaté que certains travaux présentés mobilisaient également d’autres acteurs, au-delà de ces deux domaines, tels que des professionnels de l’éducation, en particulier des enseignants, ainsi que les communautés autochtones directement concernées. Ces dernières jouent un rôle essentiel, en tant que bénéficiaires des outils développés et parties prenantes indispensables à la réussite des projets.

AI4CHIEF réunit chercheurs en IA, spécialistes des humanités numériques, acteurs du patrimoine et communautés. Qu’apporte cette hybridation disciplinaire à la production de connaissances ?

L’IA s’applique à de nombreux domaines, mais les compétences techniques des informaticiens ne suffisent pas à elles seules pour en maîtriser les usages. Il est donc essentiel de collaborer avec des chercheurs d’autres disciplines. Cette interdisciplinarité permet de produire des connaissances réellement adaptées aux besoins des communautés concernées.

« Cette trajectoire a conduit à une convergence progressive entre mes convictions personnelles et mes activités de recherche. À partir de cette expérience, j’ai choisi d’explorer l’application de l’IA à la revitalisation des langues peu dotées, en prenant le kabyle comme cas d’étude, avec l’espoir de pouvoir prochainement obtenir un financement de thèse sur cette thématique. »

Au-delà des avancées scientifiques, quels impacts concrets attendez-vous pour les institutions culturelles, les communautés concernées et les politiques publiques ?

Les chercheurs démontrent, à travers leurs travaux, la faisabilité d’approches scientifiques mobilisant des technologies comme l’IA au service du bien-être de populations souvent marginalisées ou opprimées. Toutefois, le passage à un déploiement à grande échelle de ces solutions numériques nécessite des financements importants et une réelle volonté politique, que seules les institutions culturelles et gouvernementales peuvent impulser. Cette prise de conscience doit être globale, en particulier dans les pays où les peuples autochtones sont encore réprimés et où la fracture numérique continue de s’aggraver.

Vos recherches portent notamment sur l’IA, la sécurité des systèmes et les modèles pour des contextes complexes. Comment ces travaux ont nourri la conception scientifique de AI4CHIEF ?

Mon engagement pour la promotion de la culture kabyle et la préservation de la langue remonte au début des années 1990, lorsque j’ai réalisé la première version d’un dictionnaire informatique français–anglais–kabyle (la quatrième édition est disponible sur HAL depuis avril 2026 : https://hal.science/hal-05576417v1).

Ce combat identitaire, centré sur la défense de la communauté kabyle, est longtemps resté distinct de mon activité professionnelle principalement orientée vers la cybersécurité. L’introduction de l’intelligence artificielle dans mes recherches a progressivement rapproché ces deux dimensions, à travers plusieurs travaux :

Le projet ANR GNADIS sur la détection d’attaques à l’aide de méthodes GNN dans les systèmes cyber-physiques, en tant que coordinatrice, la direction d’une thèse sur l’utilisation de techniques d’IA pour la maintenance prédictive d’équipements militaires, l’utilisation de techniques d’IA dans le projet ANR BeeCare (en tant que coordinatrice du projet) pour l’optimisation de l’alimentation des abeilles afin de lutter contre le Varroa destructor, ainsi que mon intérêt pour la sécurité des grands modèles de langage (LLM).

Cette trajectoire a conduit à une convergence progressive entre mes convictions personnelles et mes activités de recherche. À partir de cette expérience, j’ai choisi d’explorer l’application de l’IA à la revitalisation des langues peu dotées, en prenant le kabyle comme cas d’étude, avec l’espoir de pouvoir prochainement obtenir un financement de thèse sur cette thématique.

Pour répondre à votre question, j’organise des conférences au Cnam depuis 2010. Toutefois, la conférence AI4CHIEF occupe une place particulière : c’est la seule qui fait pleinement converger mon engagement scientifique et mon engagement identitaire et culturel, en associant intelligence artificielle et préservation du patrimoine linguistique et culturel.

« Pour cette première édition, les travaux sur la revitalisation des langues autochtones à l’aide de l’IA ont porté sur plusieurs langues, parmi lesquelles le nheengatu (Amazonie, Rio Negro), l’araméen (Syrie et Irak), l’anishinaabemowin (Manitoba, États-Unis), le kanien’kéha (Canada), le kabyle (Kabylie), le kurde (nord de l’Irak et ouest de l’Iran), le tibétain historique (Tibet), le shikomori (Comores/Mayotte) et l’odia (État d’Odisha, Inde). »

Le symposium réunit des partenaires académiques internationaux, notamment aux États-Unis. Quel rôle joue cette dimension globale dans la structuration du champ « IA & patrimoine culturel » ?

Ce symposium a réuni une cinquantaine de chercheurs spécialisés dans l’IA appliquée au patrimoine des peuples autochtones, venus de tous les continents : Europe, Asie, Amérique latine, Amérique du Nord, Proche-Orient et Afrique. Les participants représentaient notamment les États-Unis, le Canada, la France, le Royaume-Uni, l’Indonésie, le Brésil, la Malaisie, le Maroc, les Émirats arabes unis, l’Inde, la Kabylie mais aussi d’autres pays et régions du monde.

Pour cette première édition, les travaux sur la revitalisation des langues autochtones à l’aide de l’IA ont porté sur plusieurs langues, parmi lesquelles le nheengatu (Amazonie, Rio Negro), l’araméen (Syrie et Irak), l’anishinaabemowin (Manitoba, États-Unis), le kanien’kéha (Canada), le kabyle (Kabylie), le kurde (nord de l’Irak et ouest de l’Iran), le tibétain historique (Tibet), le shikomori (Comores/Mayotte) et l’odia (État d’Odisha, Inde).

Ce symposium offre une vision plus précise de l’état de la recherche à l’échelle mondiale dans ce domaine, tout en mettant en lumière les défis scientifiques et financiers auxquels ces chercheurs sont confrontés dans leurs travaux, à la fois scientifiques et humains. Le développement de collaborations entre équipes issues de laboratoires variés, ainsi que l’identification de sources de financement, contribueront à mieux structurer ces efforts et à en renforcer l’impact. Toutefois, cela reste conditionné à une prise de conscience et à un engagement accru des États du monde en faveur de l’accompagnement de ces communautés autochtones sur plusieurs plans dont le volet numérique.

« Nous avons notamment eu le plaisir d’écouter le Dr Mélanie Jouitteau (chercheuse au CNRS), qui a présenté ses projets de science collaborative dans des contextes minorisés, ainsi que ses travaux sur la revitalisation des langues par le numérique, notamment à travers son expérience du breton. »

Comment AI4CHIEF contribue-t-il à renforcer les interactions entre les acteurs de l’IA en Île-de-France ?

AI4CHIEF a mis en évidence la richesse des travaux menés en France et la présence de nombreux chercheurs compétents dans ce domaine. Nous avons notamment eu le plaisir d’écouter le Dr Mélanie Jouitteau (chercheuse au CNRS), qui a présenté ses projets de science collaborative dans des contextes minorisés, ainsi que ses travaux sur la revitalisation des langues par le numérique, notamment à travers son expérience du breton. Le Dr Nasredine Semmar (chercheur au CEA) a, quant à lui, partagé un panorama des avancées récentes et des tendances émergentes dans la littérature sur les grands modèles de langage multilingues (MLLM).

D’autres contributions, notamment celles de l’Université du Mans, ont porté sur les langues peu dotées, illustrées par des travaux sur le kurde, ainsi que sur des approches innovantes proposant un système d’apprentissage « frugal » basé sur l’IA générative, conçu comme un expert virtuel au service de communautés autochtones vulnérables au changement climatique. L’équipe que je représente au Cnam a également présenté ses travaux sur le développement d’un modèle de langage (LLM) pour la langue kabyle.

Ce symposium a ainsi permis de favoriser les rencontres entre chercheurs travaillant en France, avec la perspective de poursuivre les échanges afin d’identifier des pistes de collaboration.

« Ce symposium m’a permis de réaliser que ce combat dépasse largement un cadre individuel : il concerne des milliers de communautés, et nous ne sommes pas isolés. »

Quel type d’échanges ont globalement été partagés sur ces deux jours : partage de résultats, co-construction, débats éthiques, émergence de projets ?

Que ce soit au niveau national ou international, de nombreux échanges ont porté sur les idées à développer entre chercheurs, le partage d’expériences et la compréhension des spécificités propres aux communautés étudiées. Certaines de ces communautés n’ayant pas accès à Internet, des chercheurs ont par exemple installé des infrastructures locales, parfois alimentées par des panneaux solaires pour qu’ils puissent interagir avec ces communautés. D’autres chercheurs ont développé des outils pour accompagner ces communautés dans la transcription de leur langue restée principalement orale. D’autres encore ont centré leurs recherches sur le traitement de la parole, en raison du caractère essentiellement oral de ces langues. Dans l’ensemble, les approches développées se révèlent souvent transférables et réutilisables dans d’autres contextes.

Quelles suites envisagez-vous après le symposium : collaborations, projets de recherche, structuration de communauté ou initiatives internationales ?

J’ai toujours été sensible aux enjeux liés aux peuples autochtones, en raison de mon propre engagement pour la langue kabyle. Depuis 2022, je travaille pour le développement d’outils informatiques et d’approches basées sur l’IA pour la numérisation de cette langue. Ce symposium m’a permis de réaliser que ce combat dépasse largement un cadre individuel : il concerne des milliers de communautés, et nous ne sommes pas isolés.

Les chercheurs présents partagent une véritable solidarité, car, malgré des contextes différents, les défis sont souvent similaires. Les échanges ont été nombreux et ont fait émerger une volonté commune de collaboration, notamment en explorant des programmes internationaux susceptibles de soutenir ces initiatives. Concernant le kabyle, j’ai pu établir des contacts avec plusieurs chercheurs prêts à collaborer et à partager leur expérience.

« La visibilité apportée par le DIM AI4IDF et la diffusion de l’appel à participation par SCAI ont permis à l’équipe du secrétariat de la décennie internationale des langues autochtones de l’UNESCO de prendre connaissance de notre événement et de nous proposer de collaborer avec eux pour l’organisation de l’édition 2027 du symposium AI4CHIEF. »

En quoi le soutien du DIM AI4IDF est-il structurant pour la réalisation et l’ambition scientifique de cet événement ?

Le soutien du DIM AI4IDF, de SCAI, de DataIA, ainsi que celui de l’ECE et du Cnam, a joué un rôle déterminant. Il a permis de faciliter l’organisation de ce symposium en prenant en charge une partie des coûts liés à l’événement. Par ailleurs, la visibilité apportée par le DIM AI4IDF et la diffusion de l’appel à participation par SCAI ont permis à l’équipe du secrétariat de la décennie internationale des langues autochtones de l’UNESCO de prendre connaissance de notre événement et de nous proposer de collaborer avec eux pour l’organisation de l’édition 2027 du symposium AI4CHIEF.

Si vous deviez adresser un message aux chercheurs et acteurs de l’IA hésitant encore à s’engager dans ces enjeux culturels et sociétaux, quel serait-il ?

Selon l’UNESCO, il existe plus de 7 000 langues autochtones, dont la grande majorité est aujourd’hui menacée, face à une domination numérique d’une douzaine de langues majeures. Sans actions concrètes, ces langues — et les cultures qu’elles portent — risquent de disparaître.

Au-delà de notre rôle de chercheurs, chacun parle une langue, possède une culture et appartient à une communauté. Il est donc essentiel que les chercheurs, mais surtout que les États, prennent la mesure de cet enjeu et soutiennent financièrement des initiatives de promotion, de préservation et de revitalisation. Or, un constat persiste : ces populations, souvent marginalisées ou opprimées, sont jugées peu « rentables », ce qui limite les investissements dans ces domaines.

De nombreux chercheurs internationaux ont d’ailleurs exprimé leurs difficultés à financer leur participation à notre symposium. Certains n’avaient pas les moyens de régler les frais d’inscription ; avec Youakim Badr, nous avons choisi de les en exonérer. D’autres ont même pris en charge leur mission sur leurs propres fonds.

Investir dans ces recherches et dans le développement de plateformes numériques dédiées à ces communautés revient à préserver une part essentielle de l’humanité. Il est crucial que les États et les institutions prennent pleinement conscience de cette responsabilité et s’engagent pleinement avant que cela ne soit trop tard.

Interview réalisée par Khaled Benaida