-------------------------------------------- Le 17/03/2021 ----------------------------------- Notre cours est proposé sous la forme d'un MOOC. Il est composé par quatre modules qui combinent des vedios de cours, des quizz et des exercices pour la mise en pratique des méthodes présentées. # Module 1: Cahier de notes, cahier de laboratoire Lecture + Ecoute des védios du module 1 du MOOC + Réponse au quizz + Exercices (L'introduction et poson le décord ont été étudier avant le début de ce journal) ## Exercices **Exercice 01-1 : Gitlab Recherche/Search** 1. Quels sont les deux fichiers contenant la chaîne de caractères "LE MOOC RECHERCHE REPRODUCTIBLE C'EST GENIAL" ? **Réponse :** -module1/exo1/aebef6b0a5.txt -module1/exo1/f683bbad4b.txt **Exercice 01-1 : Gitlab Historique** 1. Quel est le numéro du commit ? **Réponse :** - 505c4e26 2. Quel est l'auteur du commit ? **Réponse :** - Arnaud Legrand ---------------------------------------------- Le 23/03/2021 ------------------------------------------------ # Module 2: La vitrine et l'envers du décor Lecture + Ecoute des vidéos du module 2 du MOOC + Réponse au quizz + Exercices (2.1, 2.2, 2.3, 2.4) Choix de parcours : Jupyter - Utilisation le notebook - savoir comment écrire le grand titre "à propos de pi" - savoir comment écrire les formules mathématiques - savoir commentécrire et exécuter le code qui affiche la valeur de $\pi$ - savoir comment écrire le code de la méthode de Buffon qui affiche 3.1289111389236548 pour python - savoir comment écrire le code qui affiche le diagramme final - Savoir faire un calcul simple - Calcule de la moyenne, le min, le max, la médiane, et l'écart-type des données - Réalisation d'un affichage graphique ----------------------------------------------- Le 22/11/2021 --------------------------------------------------- # Module 3: La main à la pâte Toujours avec jupyter ## Importer les données avec jupyter - Il faut lire les données directement de la source dans le documment computationnel; - Il faut s'occuper les données manquantes. ## Vérification et inspection avec Jupyter - Prétraitement des données pour adapter aux conventions des logiciels et pour faciliter notre analyse. ----------------------------------------------- Le 29/11/2021 --------------------------------------------------- # Module 4: Vers une étude reproductile: La réalité de terrain ## Les réponses de quiz 14 1- L'interview avec le neurophysiologiste Isael Llano. 2- Les métadonnées désignent les informations (données) sur les données. 3- En français le nombre 21 se dit « vingt-et-un ». En allemand, on dit « einundzwanzig » (littéralement « un-et-vingt »): - le français est gros-boutiste et l'allmand est petite boutiste. 4- Le format FITS n'est pas un format destiné à stocker des résultats d’ajustement de modèle (fit en anglais). 5- Le format **FITS** permet : - De stocker données et métadonnées. - De stocker des données de nature variée. 6- Le format **HDF5** est hiérarchique. 7- Les (grosses) données peuvent être archivées et distribuées sur : - Figshare. - Zenodo. ## Les réponses de quiz 15 1- les limitations et les inconvénients d’un document computationnel (notebook): - Lorsque le code est long, il devient défficile d'avoir une vue d'ensemble - Les intéractions entres les différents languages peuvent etre hasardeuses car elles sont peu explicite - Il n'est pas bien adapté à des calculs longs ou impliquant de gros volumes de données - La sauvegarde des résultats intermédiaires ou la poursuite d'un calcul après une interruption son des processus géneralement manuels, ce qui est source d'erreur 2- Les avantages d’un workflow: - Il permet de mieux structurer son code et de proposer une représentation graphique et haut niveau - Il se passe d'effets de bord, ce qui diminue les risques d'erreur - Il permet d'exploiter plus facilement une machine parallèle 3- Que peut-il se passer en terme de reproductibilité lorsque vous ne préservez pas l’environnement logiciel d’un calcul ? - Vous pouver ne pas arriver à réexécuter votre calcul - Vos collègues peuvent ne pas arriver à réexécuter votre calcul - Le résultat des calculs peut changer 4- Comment préserver l’environnement logiciel d’un calcul effectué à l’aide du langage Python ou R? - En utilisant un outil qui capture automatiquement l'ensemble des fichiers et de bibliothèques accédées lorss du calcul - En travallant dans un conteneur docker du début à la fin 5- Mettre à disposition l’environnement logiciel (sous forme binaire avec une image docker par exemple) d’un calcul permet à une tierce personne de : - Réexécuté ce calcul 6- Le plate-forme **HAL ou ArHiV** est utilisé pour archiver et mettre à disposition un article de recherche 7- Les plates-formes **Figshae** et **Zenodo* sont rutilisés pour archiver et mettre à disposition des données 8- Les plate-formes **Github ou Gitlab** **Software Heritage** sont utilisés pour archiver et mettre à disposition du code ## Les réponses de quiz 16 1- Les caractéristiques de l’arithmétique à virgule flottante qui rendent la reproductibilité difficile: - Les compilateurs peuvent changer l'ordre des opérations - En calcul parallèle, l'ordre des opérations peut varier exécution à l'autre 2- Les précautions qui augmentent la reproductibilité des nombres pseudo-aléatoires: - Définire la graine dans le code d'application - Noter les numéros de vérsion du générateur