# Module 2 - Document Computationnel

présenter travaux + accéder ensemble des calculs

- Jupyter
- R Studio
- OrgMode (basé sur Emacs)

## Exemple travaux controversés

- Economie, lien dette-croissance, initialement non publication des détails de calculs -> adjustements douteux
- IRM: problème liés aux analyses statistiques: potientiellement milliers d'études invalides, données non re-vérifiables car non conservés (trop volumineuses)
- Structures protéines: retraction, découverte erreur de programmation (inversion colonnes) dans code analyse

=> Problèmes de réproduction, même dans journaux préstigieux
Parfois manque rigueur ou transparence

## Difficultés de la reproduction scientifique

- manque informations (données, procédures, choix) -> expliciter dans cahier laboratoire
- ordinateur = source d'erreurs (logiciels trop complexes ou non transparent)
- sauvegarde / organisation des données
- article ~= version simplifiée

Importance d'utiliser les bons logiciels, ouvert pour faciliter la lecture plus tard

Sauvegarder les données

## Document Computationnel Principe

Permet transparence -> chemin arrière depuis publication: comprendre, vérifier, ...

Schéma classique science: données -> analyse/visualisation

En pratique, enchainement de petits blocs: explication/texte, code, résultats -> exportable en format bien présenté

## Tavailler avec d'autres personnes

Partager -> utiliser Gitlab/Github, dépôt résultat final ou alors attention garder historique propre
    -> sites fournit par l'éditeur
    -> archives ouvertes

## Analyse comparée des outils

- Jupyter & RStudio -> simple mais utilisation limitée
- OrgMode -> beaucoup plus puissant, mais donc plus complexe

Tous permettent de mettre en place une méthodologie orientée recherche reproductible