La science ouverte en questions
Vous trouverez dans cette FAQ toutes les informations utiles et réponses aux questions fréquemment posées sur la science ouverte et sa mise en œuvre à INRAE.
-
La science ouverte ou Open Science est un mouvement qui vise à partager les connaissances et productions scientifiques, non seulement avec l’ensemble de la communauté scientifique, mais aussi avec tous les acteurs de la société. Elle inclut la possibilité d’ouvrir le processus de recherche à des non-scientifiques (sciences et recherches participatives).
Avec la transformation numérique, rendre accessibles, réutilisables et appropriables les productions numériques scientifiques (research data objects : publications, données, logiciels…) par des tiers est devenu un enjeu majeur, à la fois pour :
- développer de nouveaux champs de connaissances (exploitation du Big Data, nouvelles approches pluri et transdisciplinaires…
- « sécuriser » les modalités de l’ouverture (ouvrir tout ce que l’on peut, fermer uniquement ce que l'on doit, pratiques intègres et éthiques, respect des normes et modalités techniques liées aux principes FAIR, développement d’e-infrastructures dédiées…),
- renforcer le lien avec les utilisateurs et partenaires de nos recherches en développant des dynamiques de coconstruction (sciences et recherches participatives, innovation ouverte…).
-
L’open data est pensé comme le levier d’une nouvelle forme de valorisation économique des données publiques, en permettant leur mise à disposition gratuite auprès des opérateurs socio-économiques pour favoriser l’innovation et l’émergence de nouveaux services, au bénéfice des citoyens notamment. Cependant, ce régime d’accès facilité et gratuit n’éteint pas pour autant les possibilités de protection et de valorisation des données et autres produits de la recherche.
Il n’y a pas d’obligation systématique de tout ouvrir. Et ce n’est généralement pas du « tout ou rien » : on peut décider d’ouvrir rapidement une partie seulement des données, définir un horizon temporel pour une autre partie et verrouiller totalement une autre.
La DipSO et la direction du Partenariat et du Transfert pour l'Innovation (DPTI) ont rédigé une fiche qui donne des repères sur le statut et les enjeux des données en lien avec le partenariat et l'innovation, dans un contexte de science ouverte.
-
Il n'y a pas de réponse générique à cette question complexe qui doit se traiter au cas par cas, en lien avec la stratégie scientifique définie au sein de l'unité de recherche. Suivant les sujets traités et les productions à venir, la question de « À qui s'adresse-t-on et pourquoi ? » (en plus de la communauté scientifique) doit être pensée le plus en amont possible. Par exemple, il pourrait être décidé, en lien avec les partenaires concernés, et/ou les cibles visées, d'ouvrir certaines données ou autres éléments et d'en protéger d'autres, suivant des modalités et une temporalité à définir, dans le cadre de contrats ou de conventions si besoin.
Le premier niveau conseil peut être prodigué par les chargés de partenariats et d'innovation, ensuite les directions d'appui à la recherche concernées sont là pour vous conseiller (DipSO et DPTI).
-
La gouvernance des données, c’est à la fois l’expression d’une volonté de se mettre en capacité de saisir les opportunités pour la science et de maîtriser les risques potentiels liés à l’ouverture.
Le texte « Gouvernance des données » décrit comment prendre en compte ces problématiques car
on ouvre tout ce que l’on peut et on protège tout ce que l’on doit.
Sur le plan opérationnel, elle repose à la fois sur un dispositif humain et un ensemble de services aux chercheurs pour aider aux choix stratégiques de collecte, traitement, stockage, ouverture, valorisation économique, protection des données dans le respect et en cohérence avec la stratégie scientifique des collectifs concernés.
Le dispositif « humain » comprend :
- un administrateur des données nommé pour porter spécifiquement cette question,
- une cellule nationale pilotée par l’administrateur des données et qui mobilise différents acteurs (PRADA, RSSI, FSD, DPO, DipSO, DISC...),
- une définition des responsabilités à l’échelle de l’unité et des départements avec la mise en place d’un réseau de référents données et référents stratégiques ainsi qu'un programme d’accompagnement.
> Pour toute interrogation contacter AdministrateurDonnees@inrae.fr
Des services aux chercheurs
La DipSO est en soutien opérationnel grâce à ses services et son programme de formation (module Gestion et partage des données de la formation Oscar et programme des Open Class).
Ces actions se situent dans le cadre du plan Données pour la science 2022-2024.
La DipSO fait également le lien vers des services assurés par d’autres acteurs en interne ou à l’externe.
Pour en savoir plus, consulter la page « Gouvernance des données »
-
Les risques liés à l'ouverture des données sont multiples et d’ordres très différents. On notera par exemple :
- le risque de « pillage scientifique » en cas d’ouverture trop rapide de données non valorisées antérieurement,
- les contraintes liées aux partenariats avec des tiers (co-propriété, termes des contrats),
- le risque de vol pur et simple de données sensibles par des personnes malveillantes,
- le risque de mauvaise interprétation/exploitation/non-réutilisabilité/non-reproductibilité en cas de non-respect des normes,
- le risque de contrefaçons ou de propagation de résultats non validés (intégrité scientifique),
- le risque de propagation de fake news en cas de non-maîtrise des processus de médiation scientifique, de communication vers des non-scientifiques, etc.
On notera à ce sujet l’importance de publier sur des plateformes qui permettent de « prendre date » (pré-registration) – en s’assurant au préalable de la « qualité de la plateforme » du point de vue des bonnes pratiques de science ouverte (par exemple, se référer aux critères d’éligibilité définis par le Comité pour la science ouverte qui accompagne le Plan national science ouverte porté par le ministère en charge de la recherche).
Il est donc important d’informer et de former sur ces risques, de proposer et de mettre en place des dispositifs d’accompagnement et des outils pour limiter ces risques. L’idée est de permettre aux scientifiques en charge d’effectuer les arbitrages de pouvoir effectuer ceux-ci en toute connaissance de cause. Coordonner et fluidifier l’accès à l’information utile, produite par de nombreux acteurs, pour aider à opérer les choix est le premier niveau de réponse à cette question complexe.
Pour en savoir plus, consulter la page « Partager, publier des données et des codes »
-
« Un identifiant pérenne est une chaîne de caractères alphanumériques qui désigne une ressource indépendamment de son emplacement et garantit un lien stable à la ressource en ligne, en faisant correspondre en permanence l’identité de la ressource à sa localisation sur le web » (source : Loterre).
L'utilisation d'identifiants pérennes se justifie chaque fois qu'il est nécessaire d'identifier de façon fiable une personne, une institution ou un objet. Ils permettent également de faire des liens entre les ressources, entre les publications et les données par exemple. L'utilisation d'identifiants pérennes fait partir des obligations auxquelles doivent répondre les projets financés par la Commission européenne.
Le DOI (Digital object identifier = identifiant numérique d’objet) est un identifiant pérenne et unique, qui permet de référencer, citer et fournir un lien stable vers un objet scientifique et sa description. L'attribution d'un DOI INRAE concerne tout objet, numérique ou non, dont un des contributeurs est affilié à INRAE, et qui a vocation à être publié et cité. Un DOI peut être attribué même si l’accès à l’objet est restreint.
Le DOI étant un identifiant unique il ne convient pas de demander un DOI si l’objet concerné dispose déjà d’un DOI, même si celui-ci n’est pas attribué par INRAE.
Pour en savoir plus, consulter la page « Gestion des données et des codes »
-
Selon l’OCDE (2007)1,
Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche.
Nous considérerons ici – comme font certains organismes de recherche – une définition élargie, qui considère que les codes sources font partie des données de de la recherche.
1. OCDE, Organisation de coopération et de développement économiques, 2007, Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics, 18 p
Pour en savoir plus, consulter la page « Les données et le numérique scientifiques »
-
L’objectif des principes FAIR est de favoriser la découverte, l’accès, l’interopérabilité et la réutilisation des données partagées. Chaque principe FAIR se décline en un ensemble de caractéristiques que doivent présenter les données et les métadonnées pour faciliter leur découverte et leur utilisation par les hommes mais aussi par les machines.
De nombreux documents pour accompagner leur mise en œuvre à INRAE ont été produits à destination des chercheurs. Ils sont disponibles sur ce site en consultant la page « Produire des données FAIR ».
Pour accompagner leur prise en main et aller plus loin, un soutien s'effectue également via des modules de formation en ligne (Open Class, OSCAR) et la mise en place des réseaux métiers autour des données et du numérique scientifique.
Des informations pratiques, spécifiques aux plans de gestion des données (PGD) sont également disponibles sur ce site en consultant la page « Gérer des données et des codes ».
Pour en savoir plus, consulter la page « Les données et le numérique scientifiques »
-
Les questions juridiques sont traitées en partenariat avec la direction des affaires juridiques (DAJ). Les questions complexes liées à l'ouverture des données peuvent être instruites pas la cellule gouvernance coordonnée par l'administrateur des données.
Par ailleurs, les questions de sécurité liées au partage des données sont traitées dans le cadre de la gouvernance des données (contacter l'administrateur des données de l'Institut) et du plan Données pour la Science 2022-2024.Selon la nature et la sensibilité des données, certaines questions sont co-instruites par la correspondante informatique et libertés (CIL-DPO) INRAE, notamment dans les cas de données personnelles, ou par la cellule responsable de la sécurité des services informatiques (RSSI) lorsque l’hébergement des données questionne leur ouverture.
Pour compléter l'information sur le sujet :
- Consulter le site intranet sur les données personnelles
- Consulter le site intranet sur la cybersécurité
Pour en savoir plus, consulter la page « La gouvernance des données »
-
La mention copyright vient des pratiques anglo-saxonnes en matière de droit d’auteur. Elle vise à informer que les contenus sont protégés par le droit d’auteur et à permettre à l’utilisateur d’évaluer la date à laquelle l’œuvre tombera dans le domaine public.
Mais elle n’est ni obligatoire ni une condition de reconnaissance des droits d’auteurs (elle ne renforce en aucun cas une protection par le droit de la propriété intellectuelle). L’intérêt d’avoir une mention copyright, s’il y a déjà une licence libre associée, est donc plus d’améliorer la visibilité, la mise en avant du titulaire de la licence (par exemple le nom du titulaire d’un logiciel est souvent rappelé lors de l’écran de chargement), ou prévenir toute mauvaise compréhension (par exemple que certains utilisateurs pensent que le logiciel est une création anonyme et libre de tout droit).
Pour les logiciels développés à INRAE, il est en revanche important d’indiquer dans le contrat de licence qu’INRAE est le titulaire des droits pour rendre le contrat opposable au licencié (puisqu’un contrat est un engagement vis-à-vis d’une personne identifiée) mais aussi pour des raisons pratiques (être crédité par l’utilisateur ou éventuellement lui permettre de nous contacter).
Mais en dehors du contrat de licence, il n’y a pas d’obligation ni de forme particulière pour faire apparaitre ce genre de mention. C’est donc plus le « pourquoi » qui va en guider la forme :
► S'il n'y a pas de motivation particulière, on peut s’inspirer des pratiques habituelles du métier ou du secteur donné (comme par exemple indiquer la mention dans les entêtes des fichiers ou alors sur la plateforme de développement telle que Github)
► Si le but est que l’utilisateur associe le logiciel au nom du créateur, ce genre de mention peut apparaitre dans l’écran de chargement et sur le site de téléchargement (Github…)
► Si le but est de garder une idée claire des licences des différents fichiers qui composent un logiciel, voire de faciliter le développement d’un logiciel par une communauté, l’indication d’une mention copyright et de la licence en entête du fichier peut permettre de contrôler plus facilement que le composant a été développé par INRAE afin de s’assurer qu’il soit compatible avec les licences des autres composants du logiciel et avec la licence sous laquelle on souhaite le distribuer. Certains logiciels d’audit de code (FOSSology) permettent par exemple de scanner les entêtes des fichiers d’un logiciel pour identifier les licences des différents composants du logiciel.
-
Quel support choisir ? Quelle stratégie de publication entre Open Access onéreux et éditeurs à buts lucratifs ? Quelle aide au choix ?
Le choix des supports de publication, comme l’ensemble de la stratégie de publication, est une décision qui appartient aux scientifiques. Or, il peut être difficile de comprendre le paysage très évolutif.
La DipSO agit à différents niveaux :
- formations/informations sur l’Open Access : programme « Open Class » et module de formation Oscar Publications ouvertes pour aider à comprendre et choisir ;
- encouragement à retenir les droits sur les publications (conformément au plan S). Ne pas oublier que les frais de publication peuvent être imputés sur les projets ;
- considération des preprints comme une publication « à part entière » qui peut être mentionnée dans un dossier d’évaluation. Il faut toutefois qu’il y ait du reviewing.
-
INRAE soutient la bibliodiversité via différentes initiatives telles que Peer Community in (PCI).
Dans ce cadre, la DipSO s'implique dans des dynamiques françaises et européennes de diversification des supports alternatifs de publication scientifique et contribue, via les instances de politique nationale (Comité pour la science ouverte) à faire du lobbying en Europe.
Au niveau européen, la Commission a mis en place une plateforme de publication (Open Research Europe) pour que les résultats issus des projets européens puissent être publiés sans frais pour les chercheurs. La DipSO est membre du scientific advisory board de la plateforme.
Pour en savoir plus, consulter la page « Les initiatives éditoriales soutenues par INRAE »
-
INRAE accompagne l'évolution des revues existantes, le développement de nouveaux modèles de publication type Peer Community In et peut potentiellement s'impliquer dans de nouvelles revues en Open Access. La décision est avant tout scientifique, ensuite la DipSO est en soutien à la mise en œuvre opérationnelle (dont l’animation des métiers de l'édition).
-
Les coûts des publications (APC, Article Processing Charges ou frais de traitement des articles) sont une véritable problématique surtout dans le contexte actuel où plusieurs systèmes cohabitent dont « payer pour lire » et « payer pour publier ».
La DipSO agit dans différentes directions :
- maîtrise des coûts d’abonnement (mutualisation et négociation collectives) ;
- suivi des dépenses de frais de publication APC (a posteriori) ;
- négociation de rabais sur les frais de publications avec certains publishers, la prochaine étape étant une « négociation nationale pour les APC » ;
- investissement dans des plateformes de publication « gratuit pour publier et pour lire », en prenant en compte le coût à supporter (ressources humaines) et le modèle économique de ces plateformes pour qu'elle soient pérennes au-delà des projets qui leur permettent de démarrer.
Par ailleurs, la stratégie de publication appartient aux scientifiques. La DipSO peut conseiller, fournir des informations sur les (bonnes) pratiques des publishers en Open Access (dont éthique-déontologie-intégrité). La base Noria intègre ce type d'information et peut aider à élaborer des stratégies de publication..
-
👉 La DipSO anime un réseau de référents SRP issus des départements scientifiques. Un premier contact avec le ou la référente de votre département pourrait déjà vous donner des idées et de bons retours !
👉 De nouvelles ressources sont en cours de réflexion et de création. En attendant, nous vous conseillons de feuilleter le numéro spécial de NOV'AE dédié aux sciences et recherches participatives, paru en 2022. Vous y trouverez des retours d'expériences de 6 projets de SRP, contrastés en termes de thématiques ou de niveaux d'implication des participants non académiques, ainsi que des retours d'expériences sur les applicatifs de collecte de données ou encore des réflexions sur la posture du chercheur dans des projets participatifs avec des acteurs clefs du territoire. Le numéro spécial de Sciences Eaux et Territoires sur les démarches participatives plus spécifiquement appliquées à la gestion de l'eau, paru en 2021, apporte plusieurs éclairages sur les méthodes et outils développés pour la participation.
-
Les questions que vous vous posez sont précieuses pour nous ! Elles guideront le contenu de cette FAQ et des ressources que nous mettrons en ligne en priorité.