Topological acceleration (en | fr) A propos de ce blog | La courbure négative moyenne | inhomog@ADS arXiv ADS

blogs archives
en:
Exzuberant
In the dark
Trenches of discovery
Kipac
fr:
Café sciences
Luminet
Libération

Mon, 01 Jul 2019

La science reproduisible : le problème de l'évolution des logiciels

Pourquoi publier un article scientifique si un lecteur-ice expert-e est obligé-e de faire un tel effort pour reproduire les résultats qu'il ou elle est effectivement découragée de le faire ?

Dans le contexte du logiciel libre et des repositoires git, il est en principe possible de donner au lecteur-ice la possibilité de reproduire toutes les figures et tables d'un article de recherche avec seulement quelques lignes de commandes en shell, voire reproduire l'article de recherche en entier lui-même, ce qu'essaie de faire Mohammad Akhlagi. Akhlagi présente son approche ainsi que celles de plusieurs autres, surtout entre 2012 et 2018, dans un billet de blog.

Son approche de « tout télécharger » a pourtant certains bémols. En principe, elle permet à une reproduction parfaite des calculs, mais dans la pratique, elle risque d'être lourde en ressources de téléchargement et de cpu, il y a des risques de sécurité en utilisant les versions de bibliothèques désuets, ça pourrait être difficile en pratique après plusieurs années à cause de l'enfer des dépendences entre logiciels, et sur le long terme, il n'est pas si évident que la reproduisibilité exacte serait toujours faisable.

C'est pourquoi dans 1902.09064, j'ai opté pour l'approche « préférer les bibliothèques indigènes », c.a.d., préférer les bibliothèques gérées par le système d'exploitation de type GNU/Linux, où une communauté ouverte, comme Debian, gèrent systematiquement les bogues, les mises au jour, la documentation, l'assurance qualité, et la distribution des logiciels. Les désavantage est qu'en principe, la reproduisibilité est moins exacte, mais l'avantage est dans l'efficacité en ressources (téléchargement, compilation), la sécurité des logiciels et du système d'exploitation, l'efficacité (relative) de la gestion des dépendances entre logiciels, et dans la pratique, cette approche pourrait, peut-être, être suffisante pour tracer les bogues et les erreurs scientifiques dans les logiciels de recherche.

en | lien permanent | RSS | trackback: ping-moi (expérimental)

Commentaires : Veuillez publier votre commentaire sur un serveur du Fediverse et m'envoyez un ping dans le message : @boud@framapiaf.org.

2020/07
2019/07
2019/04
2016/08
2016/02
2016/01
home :: reproducibility


licence du contenu : CC-BY | outils de blog : GNU/Linux, emacs, perl, blosxom