@@ -82,9 +82,36 @@ Journal de bord MOOC RR - Victor Elhomsy
## 2. Pourquoi est-ce difficile ?
- Manque d'information : sources et données, choix (protocoles, hypothèses, données écartées, ...) -> __Cahier de labo__
- Ordinateur, erreurs de calcul : trop simple d'utilisation, tableurs (programmation, manipulaation de données), pile logicielle (boite noire), bugs
- Ordinateur, erreurs de calcul : trop simple d'utilisation, tableurs (programmation, manipulation de données), pile logicielle (boite noire), bugs
- Manque de rigueur et d'organisation : backup, historique, contrôle qualité
- Dimension culturelle et sociale : personne n'exige/n'inspecte les données et les choix, cacher les faiblesses
- Volonté d'éviter les outils propriétaires
## 3. Le document computationnel : principe
- Objectif essentiel : permettre un max de transparence (explications, code, résultats au même endroit)
- Sciences modernes : données presque que numériques -> analyse, visualisations (longue navette entre les deux) -> Publication (après les galères : partie immergée)
- Notebook Jupyter : console Python en interne. On choisit les zones à afficher dans le document final
## 4. Prise en main de Jupyter
- Pour réinitialiser l'état du notebook (effacer la mémoire des variables) : "Kernel" > "Restart and run all"
- Aide : raccourcis clavier
- "%matplotlib inline" : insérer la figure matplotlib directement dans le document
- "%lsmagic" : autres commandes pratiques comme ça (interagir avec d'autres langages)
- Partage du document : directement commitable via gitlab, ou exportable au format HTML par ex
- "View > Cell toolbar > Hide code" : masquer certaines cellules (fragments de code, sorties, ...) : tout est disponiblae, mais pas visible à l'export
## 5. Travailler avec les autres
- Produire un PDF direct : difficulté : environnement parfaitement configuré, compatibilité entre différents environnements
- Partager : Rpubs, Dropbox : facile mais pas pérenne (hébergé sur Amazon)
- Git : tout est disponible !
- Sites compagnons : services d'hébergement, archives ouvertes (HAL : soutenu par l'Etat) : déposer document principal et annexes
## 6. Analyse comparée des trois outils
- Type de documents : Jupyter facile et dynamique
- Emacs/orgmode pour un journal (seul à rédiger, chronologique, étiquettes puissantes, mélange texte/code), ou un cahier de labo (sémantique, étiquettes pour les auteurs), un article (export LaTeX facile)
- Rédiger un article : difficile dans Jupyter, courant en Rstudio et org-mode
- Reporting : rendre compte régulièrement de notre activité :
- Réfléchir avec du recul, énoncer clairemet les problèmes