- Prétraitement des données pour adapter aux conventions des logiciels et pour faciliter notre analyse.
- Prétraitement des données pour adapter aux conventions des logiciels et pour faciliter notre analyse.
----------------------------------------------- Le 29/11/2021 ---------------------------------------------------
# Module 4: Vers une étude reproductile: La réalité de terrain
## Les réponses de quiz 14
1- L'interview avec le neurophysiologiste Isael Llano.
2- Les métadonnées désignent les informations (données) sur les données.
3- En français le nombre 21 se dit « vingt-et-un ». En allemand, on dit « einundzwanzig » (littéralement « un-et-vingt »):
- le français est gros-boutiste et l'allmand est petite boutiste.
4- Le format FITS n'est pas un format destiné à stocker des résultats d’ajustement de modèle (fit en anglais).
5- Le format **FITS** permet :
- De stocker données et métadonnées.
- De stocker des données de nature variée.
6- Le format **HDF5** est hiérarchique.
7- Les (grosses) données peuvent être archivées et distribuées sur :
- Figshare.
- Zenodo.
## Les réponses de quiz 15
1- les limitations et les inconvénients d’un document computationnel (notebook):
- Lorsque le code est long, il devient défficile d'avoir une vue d'ensemble
- Les intéractions entres les différents languages peuvent etre hasardeuses car elles sont peu explicite
- Il n'est pas bien adapté à des calculs longs ou impliquant de gros volumes de données
- La sauvegarde des résultats intermédiaires ou la poursuite d'un calcul après une interruption son des processus géneralement manuels, ce qui est source d'erreur
2- Les avantages d’un workflow:
- Il permet de mieux structurer son code et de proposer une représentation graphique et haut niveau
- Il se passe d'effets de bord, ce qui diminue les risques d'erreur
- Il permet d'exploiter plus facilement une machine parallèle
3- Que peut-il se passer en terme de reproductibilité lorsque vous ne préservez pas l’environnement logiciel d’un calcul ?
- Vous pouver ne pas arriver à réexécuter votre calcul
- Vos collègues peuvent ne pas arriver à réexécuter votre calcul
- Le résultat des calculs peut changer
4- Comment préserver l’environnement logiciel d’un calcul effectué à l’aide du langage Python ou R?
- En utilisant un outil qui capture automatiquement l'ensemble des fichiers et de bibliothèques accédées lorss du calcul
- En travallant dans un conteneur docker du début à la fin
5- Mettre à disposition l’environnement logiciel (sous forme binaire avec une image docker par exemple) d’un calcul permet à une tierce personne de :
- Réexécuté ce calcul
6- Le plate-forme **HAL ou ArHiV** est utilisé pour archiver et mettre à disposition un article de recherche
7- Les plates-formes **Figshae** et **Zenodo* sont rutilisés pour archiver et mettre à disposition des données
8- Les plate-formes **Github ou Gitlab****Software Heritage** sont utilisés pour archiver et mettre à disposition du code
## Les réponses de quiz 16
1- Les caractéristiques de l’arithmétique à virgule flottante qui rendent la reproductibilité difficile:
- Les compilateurs peuvent changer l'ordre des opérations
- En calcul parallèle, l'ordre des opérations peut varier exécution à l'autre
2- Les précautions qui augmentent la reproductibilité des nombres pseudo-aléatoires: