From 5c98bfb51a1c272fc715d9af3ed97050385d8bda Mon Sep 17 00:00:00 2001 From: 57ddaac15ab76d1b1db01438dbac1880 <57ddaac15ab76d1b1db01438dbac1880@app-learninglab.inria.fr> Date: Mon, 29 Nov 2021 22:31:34 +0000 Subject: [PATCH] Update Journal-de-bord.md --- Journal-de-bord.md | 53 +++++++++++++++++++++++++++++++++++++++++++++- 1 file changed, 52 insertions(+), 1 deletion(-) diff --git a/Journal-de-bord.md b/Journal-de-bord.md index 76dd91c..b88aae7 100644 --- a/Journal-de-bord.md +++ b/Journal-de-bord.md @@ -63,4 +63,55 @@ Choix de parcours : Jupyter ## Vérification et inspection avec Jupyter - Prétraitement des données pour adapter aux conventions des logiciels et pour faciliter notre analyse. - +----------------------------------------------- Le 29/11/2021 --------------------------------------------------- + +# Module 4: Vers une étude reproductile: La réalité de terrain + +## Les réponses de quiz 14 + + 1- L'interview avec le neurophysiologiste Isael Llano. + 2- Les métadonnées désignent les informations (données) sur les données. + 3- En français le nombre 21 se dit « vingt-et-un ». En allemand, on dit « einundzwanzig » (littéralement « un-et-vingt »): + - le français est gros-boutiste et l'allmand est petite boutiste. + 4- Le format FITS n'est pas un format destiné à stocker des résultats d’ajustement de modèle (fit en anglais). + 5- Le format **FITS** permet : + - De stocker données et métadonnées. + - De stocker des données de nature variée. + 6- Le format **HDF5** est hiérarchique. + 7- Les (grosses) données peuvent être archivées et distribuées sur : + - Figshare. + - Zenodo. + +## Les réponses de quiz 15 + + 1- les limitations et les inconvénients d’un document computationnel (notebook): + - Lorsque le code est long, il devient défficile d'avoir une vue d'ensemble + - Les intéractions entres les différents languages peuvent etre hasardeuses car elles sont peu explicite + - Il n'est pas bien adapté à des calculs longs ou impliquant de gros volumes de données + - La sauvegarde des résultats intermédiaires ou la poursuite d'un calcul après une interruption son des processus géneralement manuels, ce qui est source d'erreur + 2- Les avantages d’un workflow: + - Il permet de mieux structurer son code et de proposer une représentation graphique et haut niveau + - Il se passe d'effets de bord, ce qui diminue les risques d'erreur + - Il permet d'exploiter plus facilement une machine parallèle + 3- Que peut-il se passer en terme de reproductibilité lorsque vous ne préservez pas l’environnement logiciel d’un calcul ? + - Vous pouver ne pas arriver à réexécuter votre calcul + - Vos collègues peuvent ne pas arriver à réexécuter votre calcul + - Le résultat des calculs peut changer + 4- Comment préserver l’environnement logiciel d’un calcul effectué à l’aide du langage Python ou R? + - En utilisant un outil qui capture automatiquement l'ensemble des fichiers et de bibliothèques accédées lorss du calcul + - En travallant dans un conteneur docker du début à la fin + 5- Mettre à disposition l’environnement logiciel (sous forme binaire avec une image docker par exemple) d’un calcul permet à une tierce personne de : + - Réexécuté ce calcul + 6- Le plate-forme **HAL ou ArHiV** est utilisé pour archiver et mettre à disposition un article de recherche + 7- Les plates-formes **Figshae** et **Zenodo* sont rutilisés pour archiver et mettre à disposition des données + 8- Les plate-formes **Github ou Gitlab** **Software Heritage** sont utilisés pour archiver et mettre à disposition du code + +## Les réponses de quiz 16 + + 1- Les caractéristiques de l’arithmétique à virgule flottante qui rendent la reproductibilité difficile: + - Les compilateurs peuvent changer l'ordre des opérations + - En calcul parallèle, l'ordre des opérations peut varier exécution à l'autre + 2- Les précautions qui augmentent la reproductibilité des nombres pseudo-aléatoires: + - Définire la graine dans le code d'application + - Noter les numéros de vérsion du générateur + -- 2.18.1