De la donnée à l’intelligence artificielle : comment la DipSO s’est approprié les compétences interdisciplinaires de l’IA 

En 2025, la direction a fait de la montée en compétences IA un fil conducteur entre différents projets. Un travail collaboratif autour de preuves de concept a permis aux participants de se perfectionner dans l’acquisition, le traitement et la gestion des données. Leurs compétences en sémantique, structuration et modélisation de l’information ont été renforcées. De plus celles en matière d’IA, machine‑learning, deep‑learning (réseaux de neurones, Large Language Model, LLM), techniques de génération augmentée par récupération (RAG) et leurs applications au traitement automatique du langage ont été développées. La collaboration avec la direction des Systèmes d'information, Diagonal et des experts externes a favorisé le dialogue inter‑disciplinaire, et les bonnes pratiques autour de la souveraineté, de la traçabilité et de la sécurité des données. Le travail sur des prototypes de chatbots a permis de développer des compétences en  prompt‑engineering, la conception d’interfaces conversationnelles, la validation de réponses et la vérification de cohérence. Dans le domaine de la recherche documentaire, les agents DipSO ont gagné en capacité à interroger des bases bibliographiques en langage naturel, à reformuler les requêtes et à synthétiser les résultats, tout en évaluant pertinence et fiabilité. Une expérimentation pédagogique a ajouté des compétences en conception de parcours de formation assistés par IA, en création de quiz automatisés et en évaluation des apprenants. Au final, chaque contributeur a acquis les réflexes d’une utilisation responsable des assistants IA : il combine désormais compétences techniques pointues, sens aigu de la gouvernance des données et aptitude à travailler de façon transversale au sein d’INRAE.

Contexte et enjeux

En 2025, la DipSO a placé le développement des compétences en intelligence artificielle au cœur de son plan d’action, avec l’objectif d’enrichir et développer les compétences sur l’IA au sein d’INRAE. Cette ambition s’est traduite par la mise en place d’un ensemble de projets exploratoires, la création d’infrastructures communes et la diffusion de bonnes pratiques, afin de soutenir les missions de recherche, d’innovation et d’appui aux politiques publiques de l’Institut.

Résultats

Des projets exploratoires et leurs contributions à la montée en compétence  

Pour monter en compétence sur l’IA, la DipSO a privilégié la collaboration autour de projets d’intérêt pour ses missions. Le domaine de l’IA est vaste et les compétences nécessaires pour le maîtriser nombreuses : 

  • acquisition, traitement et gestion des données,
  • sémantique, structuration et modélisation des informations,
  • réseaux de neurones, machine learning,
  • traitement automatique de la langue et les modèles de langue.

Ces compétences nécessaires sont souvent détenues par des personnes différentes, dont certaines sont au cœur de celles des membres de la DipSO.

Des partenariats au sein d’INRAE avec la direction des Systèmes d'information (DSI) et Diagonal ont été formalisés, et des travaux collaboratifs impliquant des prestataires experts en LLM ont été menés autour de deux projets exploratoires, les projets « des Données aux Connaissances » (DaC) et « Portefeuille thématique » (PFT). 

Le projet DaC : « des Données aux Connaissances » 

Le projet DAC mené en collaboration avec une société de service experte en LLM a permis d’explorer ces nouvelles technologies sur une des activités cœurs de la DipSO qu’est l’exploitation de la bibliographie. Il s’agissait de constituer un prototype de système d’information capable de répondre à des requêtes complexes portant sur l’expertise interne de l’institut. Le dispositif repose sur une base de connaissances en graphe alimentée par des données extraites de la bibliographie, des bases de données vectorielles et une combinaison de modèle LLM (agents IA), offrant un accès en langage naturel à des informations stratégiques pour la rédaction de rapports d’évaluation, la recherche de collaborations ou l’identification d’experts.  Il permet de répondre à des questions telles que : « Qui travaille sur la séquestration du carbone dans les sols ? » ou encore « Quels sont les experts de la transition agro‑écologique ? ».

Pour cela, la DipSO a utilisé un environnement d’expérimentation complet : clusters GPU, stockage vectoriel, bases de données graphe et un ensemble d’outils : extraction de texte, annotation sémantique, génération augmentée par récupération – RAG. Ce socle technique a permis à l’équipe projet de tester rapidement différentes solutions en mesure de répondre au besoin, tout en se familiarisant avec des technologies de pointe. L’enrichissement des compétences a concerné l’intégration de données hétérogènes, l’exploitation d’un LLM génératif pour la synthèse de réponses, la construction de bases de données graphes, la mise en place de bases de données vectorielles et le déploiement de solutions RAG agentic.

Le projet « Portefeuille thématique » (PFT)  

Le projet PFT, mené avec Diagonal, la DSI et un prestataire, a pour ambition de créer un méta‑système d’information (« méta‑SI ») qui agrège les données de systèmes existants à INRAE (SI Partenariat, SI RH, SI Bibliographie…) pour répondre à des besoins de pilotage scientifique. L’architecture en trois niveaux : mise en qualité, réconciliation et rapprochement, validation et IA générative, offre une vision à 360 degrés des projets, des moyens internes et externes associés à chaque thématique stratégique INRAE 2030.

Le travail réalisé a permis de travailler en particulier sur l’usage de l’IA avec les ressources sémantique développé à la DipSO pour le nettoyage, l’enrichissement et la réconciliation des jeux de données multiples, et l’utilisation d’IA générative pour la production de rapports.

POC chatbot.inrae (Num4Sci)  

En collaboration avec la DSI et quelques départements de recherche, la DipSO a contribué à la conception du prototype de chatbot souverain INRAE qui est testé depuis novembre 2025. Le POC explore différents cas d’usage : aide à la rédaction, synthèse de documents ou de texte, recherche d’information dans un ensemble de documents, et traduction. Une étude des benchmarks des grands modèles de langage (LLM) a été mené pour identifier les meilleures performances en termes pertinence, rapidité et de conformité aux exigences de souveraineté des données.  

Tests d’IA pour la recherche bibliographique (pôle ACDC de la DipSO)  

Une étude menée par la DipSO impliquant une quarantaine de scientifiques de l’Institut, couvrant des domaines scientifiques variés, a testé trois assistants de recherche fondés sur l’IA : Scopus AI, Web of Science Research Assistant et Opscidia. Ces outils permettent d’interroger des bases de données bibliographiques en langage naturel, en français comme en anglais, ce qui facilite grandement la formulation des requêtes pour des non‑spécialistes de la recherche documentaire. Ils peuvent proposer également des reformulations automatiques des questions, aidant à préciser un besoin d’information parfois mal défini au départ. Grâce au classement sémantique des références, les articles sont ordonnés non seulement par mots‑clés, mais aussi par proximité de sens avec la problématique de recherche.

Le test montre que le principal apport réside dans la génération de synthèses à partir des résumés jugés les plus pertinents, offrant une première vision structurée de l’état de l’art sans avoir à lire immédiatement tous les textes. Ces outils fonctionnent en générant des équations de recherche qui peuvent l’être aussi par des IA généralistes.

L’usage de ces outils a conduit à développer des compétences en prompt engineering par les participants, notamment dans l’art de formuler et reformuler les requêtes pour améliorer la qualité des résultats. Il a également permis d’apprendre à interpréter les propositions de l’IA, à repérer les biais et à vérifier la cohérence des synthèses. Enfin, ces tests ont nécessité et consolidé des compétences d’évaluation de pertinence, à la fois pour comparer les performances entre outils IA et pour sélectionner, au sein des résultats, les articles réellement utiles pour un projet scientifique donné.

ChatBots pédagogiques  

L’intégration de l’IA dans des projets de formation est en train de profondément transformer la manière de concevoir et d’animer les dispositifs pédagogiques. La DipSO a voulu explorer ces nouvelles modalités en collaborant au développement d’un « assistant IA tuteur » destiné aux formateurs internes INRAE et la mise en test d’un nouveau chatbot « Fondamentaux de la Science Ouverte ». 

Le projet « assistant IA tuteur » a bénéficié d’un écosystème de recherche et d’innovation autour de l’éducation ouverte et de l’IA grâce aux collaborations autour de ce projet entre DipSO, FTLV INRAE,  la chaire UNESCO RelIA, l’École de Design Nantes‑Atlantique, l’Université Paris Nanterre et Le Bahut. L’assistant tuteur accompagne les formateurs pas à pas dans la construction de séquences de formation. Cet assistant rappelle les fondamentaux de l’ingénierie pédagogique, aide à structurer objectifs, activités et évaluations, puis vérifie automatiquement la cohérence des étapes de déroulement. Il permet aux formateurs de gagner du temps sur les tâches répétitives tout en sécurisant la qualité des scénarios pédagogiques.

Un nouveau prototype de chatbot « Fondamentaux de la Science Ouverte » construit et testé par la DipSO, illustre une autre facette des apports de l’IA pour la formation. Dédié aux participants du module OSCAR, il joue à la fois le rôle de guide pédagogique, de FAQ et d’accompagnateur interactif. Grâce à un moteur de recherche augmenté par génération (RAG) branché sur le module, il est capable de fournir des réponses précises et contextualisées tout en renvoyant aux contenus de référence. Les quiz, mini‑jeux et retours personnalisés renforcent l’engagement, transforment un support statique en expérience interactive et favorisent l’auto‑évaluation. La mise en place de ce dispositif a permis d’acquérir des compétences en conception de chatbots éducatifs, en implémentation de RAG pour des documents PDF et en développement de quiz automatisés et d’évaluations adaptatives, indispensables pour articuler IA et efficacité pédagogique. Sa mise en production est à l’étude.

Ces expérimentations ont permis de développer des compétences clés en IA générative appliquée à la pédagogie, en apprenant à exploiter les modèles pour proposer des activités, reformuler des consignes ou générer des supports. Elles ont également renforcé le design de contenus éducatifs générés ou augmentés par IA. Les possibilités d’interaction entre textes, quiz, et mini‑jeux permet la conception d’environnements plus engageants pour les apprenants.

IA générative et bonnes pratiques  

La DipSO a contribué à rédiger le « Guide du bon usage des assistants à base d’intelligences artificielles génératives » rassemblant cas d’usages, outils et  principes de souveraineté, de traçabilité, de sécurité des données et d’éthique. Les contributeurs se sont d’abord familiarisés avec les cadres réglementaires actuels, ce qui a renforcé leur maîtrise des exigences légales. La collaboration entre spécialistes de l’IA, de la donnée, experts en cybersécurité, juristes et éthiciens a favorisé le dialogue interdisciplinaire et l’apprentissage mutuel. L’étude des impacts environnementaux, sociétaux et éthiques a fait émerger une sensibilité accrue aux biais algorithmiques et aux risques environnementaux. Au final, la participation à ce projet a transformé chaque contributeur en « champion » de la bonne utilisation responsable des assistants IA au quotidien, une montée en compétences qui se traduit aujourd’hui par une adoption plus fluide des outils IA et par une culture de vigilance qui se partage au sein d’INRAE.

Conclusion  

L’année 2025 a permis à la DipSO de poser les bases d’un écosystème IA souverain, partagé et performant : infrastructures techniques robustes, prototypes fonctionnels (DAC, PFT, chatbots), outils d’aide à la recherche et à la formation, ainsi qu’une dynamique de montée en compétences structurée et transversale. Ces acquis constituent le socle indispensable pour soutenir les ambitions d’INRAE 2030 en matière de recherche, d’innovation et d’appui aux politiques publiques.

Valorisation

Guide du bon usage des assistants à base d’intelligences artificielles génératives

Sommaire  
Introduction
Recommandations générales
Focus Responsabilité sociétale et environnementale et IAG
Focus relatif à l’usage de données à caractère personnel
Synthèse des solutions recommandées suivant la sensibilité des données
Cas d’usage à INRAE
Ressources bibliographiques
Ressources libres pour se former
Pour aller encore plus loin

Voir en ligne 

Couverture du guide du bon usage des assistants à base d'intelligences artificielles génératives publié par INRAE en novembre 2025

 

 

Vous avez une question ?

Contactez-nous