# Module 2 - Document Computationnel présenter travaux + accéder ensemble des calculs - Jupyter - R Studio - OrgMode (basé sur Emacs) ## Exemple travaux controversés - Economie, lien dette-croissance, initialement non publication des détails de calculs -> adjustements douteux - IRM: problème liés aux analyses statistiques: potientiellement milliers d'études invalides, données non re-vérifiables car non conservés (trop volumineuses) - Structures protéines: retraction, découverte erreur de programmation (inversion colonnes) dans code analyse => Problèmes de réproduction, même dans journaux préstigieux Parfois manque rigueur ou transparence ## Difficultés de la reproduction scientifique - manque informations (données, procédures, choix) -> expliciter dans cahier laboratoire - ordinateur = source d'erreurs (logiciels trop complexes ou non transparent) - sauvegarde / organisation des données - article ~= version simplifiée Importance d'utiliser les bons logiciels, ouvert pour faciliter la lecture plus tard Sauvegarder les données ## Document Computationnel Principe Permet transparence -> chemin arrière depuis publication: comprendre, vérifier, ... Schéma classique science: données -> analyse/visualisation En pratique, enchainement de petits blocs: explication/texte, code, résultats -> exportable en format bien présenté ## Tavailler avec d'autres personnes Partager -> utiliser Gitlab/Github, dépôt résultat final ou alors attention garder historique propre -> sites fournit par l'éditeur -> archives ouvertes ## Analyse comparée des outils - Jupyter & RStudio -> simple mais utilisation limitée - OrgMode -> beaucoup plus puissant, mais donc plus complexe Tous permettent de mettre en place une méthodologie orientée recherche reproductible