# Journal de bord du Mooc / Mooc's logbook # Daily data I find interesting As I consider myself a "big sleeper", I choose to record the data of when I sleep and for how long each day (Taken with the 24-hour notation). I've already done it in the past to check some tendencies (mean time, naps, etc.) but I might be able to have better conclusions now. Please note that we have to take into consideration that the hour at which I fall asleep isn't the same as when I go to bed and try to sleep. I will try to track my sleep quality (Rested, Quite rested, Not very rested, Not at all), time and frequency with different criteria such as how I wake up (Natural, Alarm clock, External cause) and if I use or not my stuffed sloth. - October 18: - I got to bed at around 1:00 alone with my stuffed sloth and woke up at 9:00 (alarm clock). I feel rested. - I did a nap from 16:15 to 17:15 (natural) alone with my stuffed sloth. I feel ready to work again after this. - October 19: - Got to bed at 1:28 alone with my stuffed sloth. Woke up at 6:30 (alarm clock), I do not feel very rested. - I did a nap from 18:45 to 20:27 (natural, because I missed my alarm clock) alone with my stuffed sloth. I feel rested because I was exhausted before the nap. - October 20: - I got to bed at 1:10 alone with my stuffed sloth and woke up at 7:30 (alarm clock). I feel quite rested. # Notes (Peuvent contenir des imprécisions) ## Module 1 ### Module 1.2 tablettes d'argile tablette de cire et stylet. permet d'effacer volumen (il faut dérouler pour lire + tout écrit collé) => codex (qui a enfin des éléments orgaanisationnels) parchemin après embargo qui a empêché d'avoir les papyrus Eusèbe qui numérote les passages des évangiles pour avoir des références croisées Chine : Leishu qui regroupent des références (Confucius etc.). Plus gros manuscrit en nb de caractères avant Wikipédia en anglais post it Notes sur support informatique Avantage fiche/bout de papier : reclassée à tout moment ou collée pour des ouvrages de synthèse Mots clés qu'on peut retrouver avec 1e lettre + 1e voyelle (similaire à un annuaire téléphonique) ### Module 1.3 Fichiers texte à privilégier pour la retrocompatibilité. Markup language pour avoir du format et rendre le texte lisible. Le markdown est bien pour ça car même dans l'éditeur de texte on comprend tout (j'utiliser d'ailleurs ce format pour ce fichier, sous gedit). Il y en a aussi d'autres comme wikitexte. ### Module 1.4 Gestion de version. On peut facilement voir les différences et ça a fait ses preuves. C'est également possible de modifier plusieurs fichiers en même temps, aspect synchrone dans les modifs. Sauvegarde centralisée qu'on peut accéder dans un projet collaboratif en + de l'avoir en local, donc moins de chance d'avoir des soucis. ### Module 1.5 Etiquetage des fichiers et indexation pour mieux rechercher dans plusieurs fichiers. Nous utilisons DocFetcher. Pour éviter l'abondance de résultats, on peut utiliser les commentaires Markdown pour stocker les étiquettes. ## Module 2 ### Module 2.1 Exemple d'études dont les résultats ont été controversés. Je connaissais déjà la première histoire (notamment grace à [la vidéo de ScienceEtonnante](https://youtu.be/yeX_Zs7zztY?si=OUk__7fL6lGyh3-c)) et des politiques du monde entier se basaient de cette statistique erronnée, par "mégarde" d'après les auteurs (bizarrement cela arrangeait la conclusion). Deuxième exemple sur l'IRM où le bruit n'était pas assez pris en considération. Autre exemple sur un bug dans un logiciel, mais au final c'est surtout la méthodologie à revoir. Dernier exemple en cristallographie : Reprise d'un code qui était incorrect et qui a ainsi engendré un souci au niveau de l'analyse. ### Module 2.2 Différents critères à propos de pourquoi c'est difficile de tout faire proprement : - Manque d'informations (expliciter ses sources, données, choix) => Cahier de laboratoire peut aider - Mauvaise utilisation de l'ordinateur (tableur alors que ce n'est pas forcèment adapté à cause de macro et formatage automatique) + de logiciels dont on ne sait pas si le contenu est correct - Manque de riqueur / organisation (backup, historique, etc.) - Dimension culturelle et sociale (éthique des données etc.) - Rendre public ou non (on peut trouver des erreurs ou voir les faiblesses dans notre étude, d'autres peuvent réutiliser notre code ou données, il y a des données sensibles (mais on peut utiliser de l'anonymisation crypto)). Outils à éviter et alternatives 1. Eviter suite Microsoft, privilégier les formats texte 2. Eviter les logiciels propriétaires comme matlab et privilégier Scilab, R, Python 3. Utiliser des clouds qui garantissent la pérennité (GitHub, GitLab) 4. Outils "intuitifs" qui ne permettent pas de voir ce qu'il se passe derrière le rideau ### Module 2.3 Principes du document computationnel : - Inspecter ce qui a été fait (comprendre choix etc.) - Refaire (reproduire, utiliser les mêmes données, etc.) La vitrine est lue par le lecture, mais s'il veut en savoir plus il doit avoir accès au code qui génère les graphiques, données, etc. ### Module 2.5 Pour préparer un document à publier, on doit pouvoir générer le PDF et cacher les cellules non nécessaires à la compréhension globale. Il faut bien configurer et convaincre les co-auteurs (qui n'aiment pas qu'on change leurs habitudes !). On peut mieux s'assurer de la qualité de ce qu'on produit puisqu'on travaille à plusieurs. Il faut bien faire attention à la pérennité de ce que l'on produit. "Sites compagnons" qui permettent de partager via des outils d'archivage si on ne veut/peut pas passer par GitHub et GitLab. Grace au document computationnel, on voit comment s'articule la recherche avec transparence et on peut mieux réutiliser les travaux. ### Module 2.6 Comparaison des trois outils proposés : - Pour un cours/tuto : Un notebook Jupyter est idéal car facile à prendre en main et document dynamique - Journal perso : Org-mode permet de classer et étiquetter très efficacement les notes, exemples, etc. - Cahier de laboratoire : Org-mode est aussi adapté, ici pour plusieurs auteurs. - Un article reproductible : Exemple avec Org-mode, plus complexe mais plus puissant et plus permissif. Jupyter est le plus compliqué pour générer un article. Le plus important, c'est de collecter l'info, l'organiser et la rendre exploitable et la rendre disponible.