@@ -122,10 +122,10 @@ Sur une image : on peut avoir acces aux métadonnées. On peut ajouter un comme
...
@@ -122,10 +122,10 @@ Sur une image : on peut avoir acces aux métadonnées. On peut ajouter un comme
# MODULE 2: LA VITRINE ET L'ENVERS DU DECOR/ LE DOCUMENT COMPUTATIONNEL
# MODULE 2: LA VITRINE ET L'ENVERS DU DECOR/ LE DOCUMENT COMPUTATIONNEL
##Pourquoi reproductibilité est difficiles?
##Pourquoi reproductibilité est difficile?
Les principales causes de l'impossibilité de retrouver les travaux de recherche:
Les principales causes de l'impossibilité de retrouver les travaux de recherche:
- Manque d'information importante: source des données, expliciter les choix (protocole experimental, quelles données concservées/écartées, quelle procédure statistiques et quelles hypothèses sous-jacentes).
- Manque d'information importante: source des données, expliciter les choix (protocole experimental, quelles données conservées/écartées, quelle procédure statistiques et quelles hypothèses sous-jacentes).
Cahier de laboratoire: essentiel.
Cahier de laboratoire: essentiel.
...
@@ -148,6 +148,39 @@ Cas de données sensibles (ex: données médicales, info sur les enfants...): il
...
@@ -148,6 +148,39 @@ Cas de données sensibles (ex: données médicales, info sur les enfants...): il
Adoption de format texte et de logiciel en code ouvert (R, phyton) permet d'assurer (csv, markdown,...). Eviter de stocker les données sur une seule plateforme. Attention aux plateforme de sauvegarde (confidentialité, business plan).
Adoption de format texte et de logiciel en code ouvert (R, phyton) permet d'assurer (csv, markdown,...). Eviter de stocker les données sur une seule plateforme. Attention aux plateforme de sauvegarde (confidentialité, business plan).
## Le document computationnel
La science moderne: 1) Les données 2) la visualisation statistique/échanges/analyses 3) Publication
Outil qui permet au lecteur de verifier que les calculs sont corrects, de compendre pourquoi, de réutiliser les travaux.
Document compuationnel: Un article au format pdf avec titre, texte, un peu de code, des résultats numériques.
Derriere se document se cache un notebook jupyter, document dynamique sur lequel on peut interagir.
Texte au format markdown + zones de code, code executable (console python sous jacente), puis on peut transofrmer en markdown, puis en pdf ou autre.
Dans le document final, on peut choisir de cacher ou pas le code/les resultats.
On peut partager le document computationnel et/ou le document final.
Meme principe: 1 seul doc (explication.code.resultat); session et export.
Différences: Jupyter et Rstudio utilisent du markdown, orgmode du format org
Jupyter permet d'utiliser plusieurs languages mais pas dans un meme notebook: julia, python, R, ruby
Rstudio: que R, on peut utiliser Python mais pas top.
Interopérabilité meilleure pour org: mais plus difficile de maitriser org mode.
Markdown peut poser parfois problemen pour certains style pdf, alors qu'avec org mode on peut ecrire directement en lateX.
Module sur Rstudio: explication de l'utilisation de Rmarkdown et possibilité de créer des pdf, html et doc.
On peut aussi faire du R et du latex en meme temps: Rsweave; et du Rhtml pour faire de l'html et du R.
Possibilité aussi d'introduire du code python dans un Rmarkdown, mais les morceaux de codes s'exécutent indépendemment (donc pas très pratique pour détailler une procédure par exemple))