Les avancées du plan d'actions « Science Ouverte » INRAE (2021-2024)

Les 10 actions phares de la science ouverte à INRAE


Le plan d’actions « Science Ouverte » (SO) INRAE vise à ouvrir les processus de recherche et les résultats à la société, accompagner l’évolution des pratiques de recherche et comprendre l’impact de l’ouverture. Dix actions phares sont mises en avant mais l’ensemble du plan inclut 54 actions à réaliser sur la période 2021-2024. L'analyse de l'ensemble montre une dynamique soutenue : 35 ont atteint l’objectif fixé en 2020, 16 présentent des avancées et seulement 3 ont des résultats insuffisants. L’année 2025, avec la mise à jour d’INRAE 2030 est l’opportunité de réviser les actions et leurs objectifs 2026-2030.

Ouverture du processus de recherche et des résultats à tous les acteurs des la société

Le taux de publications INRAE en libre accès est en progression régulière, atteignant 85 % en 2022, avec l’objectif de 100 % à l’horizon 2030. L’appui aux chercheurs pour la stratégie de publication, les guides et formations, et la reconnaissance des bonnes pratiques de science ouverte dans les évaluations individuelles contribuent à rendre ce taux d’ouverture supérieur de 20 % à la moyenne nationale.

Plus de 3 000 jeux de données sont publiés dans la collection INRAE de Recherche Data Gouv, plusieurs sont réutilisés dans le cadre de hackathons.

La FORGE facilitera la publication du catalogue des codes et logiciels INRAE en lien avec le catalogue national des codes et logiciels soutenu par le ministère de l’Enseignement supérieur et de la Recherche (MESR).

Le soutien à des plateformes innovantes d’édition scientifique (ex : Peer Community Journal, Open U Journals avec l’université de Bordeaux), et la veille active sur l’édition permettent de proposer des modes alternatifs de publication à nos scientifiques tout en respectant des standards de qualité et en facilitant la diffusion des articles. La perspective de bâtir une plateforme commune de publications scientifiques avec l’université de Bordeaux se réduit au paiement d’une prestation de services pour la publication de nos revues de transfert. D’autres collaborations seront recherchées pour nos revues scientifiques.

Le site web public « Science Ouverte » en ligne depuis 2023 facilite l’accès  aux productions de l’Institut. En matière de partage de connaissances, l’accent a été mis sur le soutien à des initiatives de scientifiques pour créer des portails thématiques comme celui sur le changement climatique. L’usage des IA génératives de type ChatBot pour rendre accessibles des contenus scientifiques produits au sein de l’Institut est une piste de travail qui offre des perspectives intéressantes pour la diffusion des savoirs.

Le prix des sciences et recherches participatives organisé par INRAE depuis 2021 met en lumière des projets lauréats portés par des équipes issues d’établissements d’enseignement ou de recherche français. Il contribue à la reconnaissance de l’implication de citoyens dans la recherche et de la valeur ajoutée de ce type de projet pour l’acquisition de nouvelles connaissances.

La coordination des acteurs de la médiation scientifique au sein de l’Institut et l’accompagnement en développement sur les questions vives contribuent également à un renforcement de la relation science-société, de même que la montée en puissance des partenariats avec les associations d’envergure nationale dans les domaines d’INRAE. 

Transformation des pratiques de recherche

Participation au développement des infrastructures numériques et développement des nouveaux services pour la science ouverte

Les infrastructures numériques sont vues comme des dispositifs qui facilitent les collaborations et contribuent à une recherche plus cumulative par une diffusion accélérée favorisant la réutilisation des résultats.

La mise en place de la plateforme nationale de données « Recherche Data Gouv » pour l’ouverture et le partage des données de recherche produites en France, a été une avancée majeure. Conçue à partir des développements de Data INRAE et ouverte en juillet 2022 à tout l’écosystème de l’Enseignement supérieur et de la recherche (ESR), la plateforme est aujourd’hui portée par une unité mixte de service en charge de son développement, et qui repose sur un partenariat avec les universités de Lorraine, Louis Pasteur, Grenoble et Strasbourg. C’est un dispositif clé au cœur de l’infrastructure Recherche Data Gouv qui prépare son dossier d’inscription sur la feuille de route nationale des infrastructures de recherche (IR) en 2025. Dans le cadre des orientations stratégiques de l’Institut INRAE 2030, l’objectif à cinq ans est de faire reconnaître la plateforme comme entrepôt de confiance « souverain » avec une certification qui la confortera dans le paysage de l’ESR français et européen. L’intelligence artificielle (IA) sera utilisée pour faciliter l’accès aux jeux de données, d’une part en enrichissant leur description au moment du dépôt par les scientifiques, d’autre part dans les fonctions de recherche utilisées par les internautes pour trouver des données. L’organisation de collections de jeux de données pour l’apprentissage des IA, analogue à ce que propose le Machine learning repository de l’université d’Irvine est une autre action à conduire.

Le soutien d’INRAE au développement des services du Centre pour la communication scientifique directe (CCSD) se poursuit. Ainsi, dans le cadre de l’équipex+ HALiance coordonné par le CCSD, le lien entre HAL et la plateforme de données est effectif ainsi que celui avec Software Heritage pour les codes. Le lien entre publications, données, codes, contribue à la reproductibilité des résultats. En interne, la réorganisation de l’équipe Centr’HAL  pour une meilleure modération et gestion des dépôts permet un processus de publication plus rapide. 

L’ouverture de la FORGE logicielle institutionnelle contribue à améliorer les pratiques de développement et de partage des codes informatiques. 

Faciliter l’accès à l’information, mieux exploiter les contenus, améliorer la qualité des métadonnées sont des axes de développement techniques qui seront poursuivis en utilisant l’IA. Il faut également consolider les modèles économiques, les ressources humaines et la gouvernance de tous ces dispositifs.

Développement des compétences et des bonnes pratiques 

Les neuf modules de la formation OSCAR couvrent toutes les dimensions de la science ouverte. Cette formation e-learning est à suivre en auto-formation, à son rythme et à la carte. Les modules sont conçus et ouverts au fil de l’eau : l’initiation à la science ouverte, les formations à l’ouverture des publications, aux données FAIR ont été enrichis par une mise avant des questions d’intégrité dans un contexte de science ouverte. Le module sur l’ouverture des codes, algorithmes et logiciels, ainsi que celui sur l’éducation ouverte seront prochainement disponibles ; celui sur l’innovation dans un contexte de science ouverte et de partenariats multi-acteurs est en cours de conception. L’ensemble des modules créés seront en outre enrichis par des focus sur les questions de la RSE, l’éthique et la déontologie. Les modules sur les fondamentaux de la science ouverte, les sciences et recherches participatives, la gestion et le partage des données, les publications ouvertes et l’intégrité et science ouverte sont déjà disponibles sur la plateforme de e-formation de l’Institut et sont aussi accessibles à tout public via la plateforme Callisto.

La formation Papirus pour les doctorants, les classes virtuelles (Open Class) et les ateliers pratiques sur les data papers complètent l’offre de formation proposée.

Outre la formation, plusieurs guides de bonnes pratiques ont été publiés, notamment pour publier, faire du web scraping, utiliser l’IA… Ces guides sont régulièrement mis à jour et enrichis sur d’autres sujets.

Suivre les pratiques et mieux appréhender l’impact de l’ouverture

Le baromètre national de la science ouverte aide à analyser la mise en œuvre de la politique nationale de science ouverte du MESR et celle de l’Institut. Tant le taux de publication INRAE en libre accès, que le pourcentage de publications donnant accès à des données ou codes sont supérieurs à la moyenne nationale. 

L’analyse d’impact de l’ouverture est néanmoins difficile à appréhender. Pour les publications, une étude du pôle ASTRA non diffusée montre que les citations des articles publiés nativement en libre accès dans des revues sont plus cités que les articles des revues sous abonnement, à l’exception des articles des revues des éditeurs dits « douteux » qui sont moins cités que la moyenne. 

Les publications « gold » (en rouge) à l’exception de celles qui sont publiées chez MDPI et Frontiers (en bleu) ont un taux de citation (CNCI) supérieur aux publications sous abonnements (en violet).  À partir de 2019, les publications chez MDPI et Frontiers sont moins citées que la moyenne.

Pour les données et les codes, la réutilisation est appréhendée avec les citations dans les publications ainsi que le nombre de téléchargements. Mais ces téléchargements, en application du cadre légal, se font sans que l’internaute soit authentifié. Le suivi d’autres modalités d’accès via API ou dispositif pour encourager la création de valeur, comme des hackathons ou des challenges Kaggle, devrait être expérimenté. La collaboration avec des acteurs externes à l’Institut (privés ou publics) pour mieux cerner leurs attentes est également une piste de travail.
L’ouverture des productions scientifiques et des processus de recherche est souvent vu comme un levier de l’innovation. Ce sujet reste à travailler pour mieux analyser l’impact de l’ouverture sur les processus d’innovation, en particulier dans un contexte multi-acteurs et territorialisé.

L’analyse de l’impact sociétal de la recherche par la méthode ASIRPA, développée par INRAE, permet d’évaluer les effets des projets dans cinq dimensions : économique, sociale, environnementale, politique et en matière de circulation des connaissances. Deux cas d’étude représentatifs de démarches de sciences et recherches participatives (SRP) ont été analysés avec cette méthode : le projet VitiREPERE, en viticulture agroécologique, et le projet Pacage Lacustre, en gestion halieutique dans les lacs alpins. Ils montrent pourquoi certains résultats n’auraient pu être atteints sans l’inclusion des acteurs non académiques à toutes les étapes de la recherche, pour trouver des solutions aux problématiques en prenant en compte les aspects économiques ou environnementaux. Ces projets ont aussi généré des impacts sociaux (revalorisation des savoirs d’usage, structuration de collectifs durables) et ont favorisé une circulation directe des connaissances, sans intermédiation, réduisant le délai moyen d’appropriation et de réinvestissement dans les territoires. L’analyse de l’impact de la médiation scientifique dépasse nécessairement la simple mesure de la transmission de connaissances pour s’intéresser à la création d’un espace de dialogue entre science et société. Elle vise à clarifier la relation du public à la science, en mesurant le développement de l’esprit critique, l’effectivité de la compréhension des démarches scientifiques, et, in fine, l’appropriation des savoirs. Si des actions demeurent nécessaires pour objectiver l’impact des projets dans ces différentes dimensions, des initiatives phares de l’Institut ont été mises en lumière dans le cadre de la valorisation et de l’accompagnement des médiateurs mis en place depuis 2022, à l’image de Tous Chercheurs, Des Plantes et des Hommes ou Biodiversité dans mon établissement, qui permettent aux participants, notamment les jeunes, de s’approprier les démarches de la recherche en menant eux-mêmes des enquêtes ou des expérimentations. En les plaçant en situation de questionnement, d’analyse critique et de confrontation aux incertitudes, ces dispositifs peuvent favoriser le développement de l’esprit critique et une compréhension active de la science telle qu’elle se fait.

Conclusion

Le plan d’actions « Science Ouverte » INRAE a permis des avancées significatives sur tous les objectifs fixés en 2020 pour accompagner l’évolution des pratiques de recherche, ouvrir les résultats et les processus et comprendre les impacts de l’ouverture.

Les actions qui sont esquissées dans ce document pour les cinq prochaines années, s’inscrivent globalement dans la continuité des précédentes. Dans le cadrage et la priorisation des nouvelles actions, il faut intégrer différentes problématiques comme celles de la souveraineté numérique et des enjeux RSE, l’accompagnement des dynamiques d’innovation participative multi-acteurs et territorialisées, le développement de l’intelligence artificielle avec ses opportunités et ses risques et le besoin d’adaptation continue des organisations.