Menu
facebook twitter
 
.
Jeudi 9 août 2018 à 14h57
Thoai Ngo

Directeur du programme "Poverty, Gender, and Youth" (PGY) au Population Council. Il dirige également le Centre Council’s Girl Innovation, Research, and Learning (GIRL).
 

 
 
 
« Lire la version originale en anglais »
 

Faire des données ouvertes une réalité

Faire des données ouvertes une réalité
©Project Syndicate 

NEW YORK – La notion de données ouvertes est à présent le courant de pensée majoritaire. Pourtant en dépit des avantages de grande envergure du partage libre des données, il reste encore beaucoup de chemin à faire avant que cela ne devienne une pratique courante.

 

Ces cinq dernières années, les principaux bailleurs de fonds privés et publics de la recherche -notamment la Fondation Bill & Melinda Gates, le Wellcome Trust, le National Institutes of Health (NIH) et la NASA- ont institué des politiques de partage des données et des administrations municipalesfédérales et nationales des États-Unis ont promu des portails de données ouvertes. Les éditeurs universitaires ont également adopté les données ouvertes et les différents journaux savants ont établi des politiques qui encouragent, s'attendent à ou même exigent de partager des données.

Mais la pratique réelle de partage des données stagne. Dans le rapport de 2017 de Figshare sur les données ouvertes, 60% des 2.300 chercheurs interrogés ont déclaré avoir partagé leurs données "fréquemment ou parfois", mais seulement 20-30% les ont partagées "fréquemment." Une autre étude récente sur 1.200 chercheurs a trouvé que "moins de 15% des chercheurs partagent des données dans un référentiel de données." L'ouverture des données n'est certainement pas le défaut dans mon domaine, les sciences sociales.

Clairement, l'approche dominante visant à préférer les données ouvertes -si vous l'exigez, ils partageront, pour paraphraser Field of Dreams -ne fonctionne pas. Pour provoquer le changement, les chercheurs eux-mêmes doivent adopter le partage des données. Pour ce faire, nous avons besoin de bonnes informations et de bonnes incitations. En bref, il nous faut davantage de carottes, plutôt que seulement des bâtons.

Mais ne vous y trompez pas : une exigence de partage des données est essentiellement un bâton. Il en va de même de la copie, l'autre argument le plus généralement cité en faveur du partage de données. Naturellement, la copie des études est cruciale et la science est actuellement infestée par une crise de la reproductibilité. Mais dans un sondage de 2016, effectué sur 4.600 chercheurs, seulement 31% de chercheurs ayant partagé des données ont déclaré avoir été motivés par "la transparence et la réutilisation."

Les principales raisons pour lesquelles les chercheurs hésitent à partager leurs données, selon le même sondage, concernent des questions de propriété intellectuelle ou de confidentialité, les craintes des fausses interprétations ou les abus sur leurs travaux, ou les craintes que leur recherche soit réutilisée. Étant donné le modèle "publier ou mourir" qui définit les carrières universitaires et l'environnement de financement concurrentiel pour tous les scientifiques, les individus bénéficient davantage du fait de "détenir" les données sur lesquelles se fondent leurs publications, plutôt que du partage de leur travail.

Il est temps de faire évoluer la conversation culturelle relative au partage des données, depuis le point de vue de ce que les chercheurs risquent de "perdre", vers ce qu'ils risquent de gagner -à commencer par la reconnaissance. Bonne nouvelle : les journaux de données où les chercheurs peuvent publier leurs ensembles de données gagnent déjà du terrain. Le nombre de citations dans trois des plus grandes revues en libre accès (Data in BriefBiodiversity Data Journal et Scientific Data) ont connu une hausse de trois en 2012 à 1.028 en 2016.

Une autre "carotte" est que le partage de données maximise le retour sur investissement pour le chercheur et le donateur. Actuellement, les registres d'étude et les portails de données disparates compliquent la tâche du chercheur individuel, qui rassemble des données dans le but d'être publié dans un journal à fort impact, pour trouver des projets similaires. Cela augmente le risque que le temps de recherche et les dollars des donataires soient gaspillés dans un travail qui empiète directement sur celui de quelqu'un d'autre. Le partage de données pourrait résoudre ce problème.

De même, pour une évaluation randomisée en Zambie sur laquelle j'ai travaillé, mes collègues et moi-même avons rassemblé des données sur approximativement 2.500 adolescents et jeunes adultes. Pour répondre aux exigences de notre donateur, nous éditons des résultats sur environ 10% de ces données dans des journaux passés en revue par des pairs, mais nous manquons du financement nécessaire pour analyser l'ensemble de données plus en profondeur (un problème fréquent pour les chercheurs). Cependant si nos données inutilisées étaient disponibles et ouvertes à tous, nous pourrions attirer de nouveaux collaborateurs pour retourner vers ce projet -et produire potentiellement des analyses plus fortes.

L'utilisation de données existantes et ouvertes à tous facilite l'accès interdisciplinaire des chercheurs et aide à la formulation de genres de questions et d'ordres du jour de recherches novateurs, qui ont bien plus de chances de conduire à des découvertes révolutionnaires. Non content de contribuer à l'accélération du progrès, la collaboration soutenue par le partage des données stimule la capacité à s'assurer un financement nécessaire, parce que les donateurs sont attirés par les travaux interdisciplinaires et innovants.

Pourtant, pour tirer le meilleur parti du partage des données, les donateurs devraient également changer de mentalité et investir davantage dans la collecte et la gestion de données de qualité durant la réalisation du projet et soutenir le financement lors de la curation et l'analyse continue des ensembles de données. Il faut accorder aux chercheurs du temps et des ressources proportionnées pour qu'ils puissent tirer le meilleur des données qu'ils rassemblent, afin de les laisser discerner les histoires plus profondes que les preuves leur indiquent.

Un autre impact positif du partage de données est qu'il soutient les futurs chercheurs, qui peuvent utiliser les données que nous avons rassemblées, par exemple pour une thèse. Tôt dans ma carrière en tant que chercheur au NIH, j'ai eu la chance d'avoir accès aux multiples ensembles de données internes des chercheurs du NIH et de l'Université Johns Hopkins, où j'ai passé deux ans à diriger des analyses secondaires selon divers paramètres. En me fondant sur des travaux antérieurs, j'ai été en mesure de publier un certain nombre d'articles qui ont fait avancer ma carrière de chercheur.

Au-delà de meilleures incitations pour les chercheurs et les donateurs, une évolution fondamentale dans la culture de la science est nécessaire pour accélérer le progrès scientifique et plusieurs initiatives prometteuses sont en cours.

Par exemple, le Center for Open Science favorise l'ouverture, l'intégrité et la reproductibilité de la recherche académique. La Berkeley Initiative for Transparency in the Social Sciences  fournit  des données ouvertes et une formation en recherche transparente, afin de renforcer l'intégrité de la recherche et des preuves utilisées dans l'élaboration de la politique. Le prix Cochrane-REWARD entend maximiser l'utilisation du financement de la recherche, où un montant estimé à environ 170 milliards de dollars est gaspillé tous les ans.

Tandis que ces initiatives franchissent certains obstacles sur la voie des données ouvertes, davantage d'efforts sont nécessaires pour s'assurer que les chercheurs disposent de l'élément moteur dans le partage des données. Le Girl Innovation, Research, and Learning Center, un centre mondial de recherche pour adolescents au Population Council que je dirige, construit le plus grand Adolescent Data Hub, un portail mondial unique où les chercheurs, les organismes et d'autres intervenants peuvent partager et accéder à des données quantitatives de haute qualité sur plus d'un million d'individus.

Nous croyons que les données ouvertes accélèrent la transparence des recherches et des solutions novatrices qui ont un impact significatif sur les vies de la vaste génération d'adolescents - 1,2 milliard de personnes. Et nous croyons qu'alors que les pratiques des données ouvertes deviennent plus répandues, les bénéfices du partage et de la collaboration qu'elles permettent vont se prolonger bien au-delà de leur rang actuel.

© Project Syndicate 1995–2018
.
.
.
.
Ajouter un commentaire
.
.

Votre commentaire

 

Il vous reste  caractères.
Code de sécurité
Rafraîchir

Accéder à la charte des commentaires »
.
.

Quoi de neuf?

.
.
.

Quoi de neuf?

.
.
.

- Médias 24 présente -

Le guide immobilier de Casablanca - Rabat

Le prix de vente du neuf et de l’occasion, quartier par quartier, appartements, villas, terrains

Guide offert par
.
.
.
.
.
.
 
Abonnez vous à nos newsletters et alertes
.
TOUT LE FIL
Close