# MOOC Recherche Reproductible > Autrice : Flavie B. > > Modifié le : 2025/08/29. ## Préambule - Posons le décor Introduction sur la crise de la reproductibilité, définition des notions de reproductibilité et de transparence. Interviews et synthèses très intéressantes pour éclairer et questionner les pratiques dans différents domaines. __Références utiles (pour moi) :__ - [Article d'Alexandre Hocquet sur reproductibilité](https://theconversation.com/reproduire-un-resultat-scientifique-plus-facile-a-dire-qua-faire-129848) - [Article de Caroline Muller sur Zotero](https://consciences.hypotheses.org/1184) ## Module 1 - Cahier de notes, cahier de laboratoire > Suivi la semaine du 2025/08/18. Présentation de divers formats et approches de la prise de notes, qui couvrent plusieurs périodes historiques et plusieurs domaines de la recherche. Réflexion sur l'organisation de ces notes au moyen d'outils (numériques mais pas que) pour ne pas finir noyé·e. S'entraîner à l'utilisation de Markdown et git. __Contenu :__ - [x] Vidéos de présentation/cours - [x] Entretiens - [x] Tutoriels - [x] Fiches supplémentaires - [x] Exercices __Liens vers les exercices réalisés :__ [Exercice](module1/exo2) __Références utiles (pour moi) :__ - [Tuto Markdown](https://www.jdbonjour.ch/cours/markdown-pandoc/) [depuis le cours] - [Remarkable tool](https://remarkableapp.github.io/) [depuis le cours] - [Climatological Database for the World's Ocean, 1750-1850](https://loc.maps.arcgis.com/apps/instant/interactivelegend/index.html?appid=b55d3c2ebb4b4b25a48f28cb9309cbd8¢er=-2.601;49.6589&level=7) [depuis le cours] - [Reliable Knowledge, John Ziman](https://archive.org/details/reliableknowledg00john/) [depuis le forum] ## Module 2 - La vitrine et l'envers du décor : le document computationnel > Suivi la semaine du 2025/08/25. Causes d'échec de reproduction des analyses : 1. Manque d'information, problème d'accès aux données 2. Erreurs de calcul ou de méthodologie stat 3. Manque de rigueur scientifique et technique (qui en général conduit aux deux autres). D'où l'importance de la transparence : expliciter augmente les chances de trouver les erreurs et de les corriger. Un outil permettant d'améliorer la transparence et la tracabilité est présenté ici : le document computationnel. Je connais très bien python et Jupyter, mais encore plus R et Rstudio (je suis plus à l'aise avec Rstudio que Jupyter). Je choisis donc de suivre le parcours Jupyter dans un premier temps, mais je compte aussi suivre le parcours org-mode plus tard. __Contenu :__ - [x] Vidéos de présentation/cours - [x] Tutos - [x] Exercices __Tips jupyter :__ `Ctrl + Enter` pour exécuter la cellule; `Alt + Enter` pour exécuter la cellule et créer une nouvelle cellule en dessous; `Esc + A` pour créer une nouvelle cellule au-dessus, `Esc + B` en dessous; `Esc + M` pour transformer une cellule en Markdown, `Esc + Y` pour la transformer en code. Pour personnaliser l'export jupyter notebook : ``` jupyter nbconvert --to mypackage.MyExporter notebook.ipynb ``` **Note pour l'exercice 4** Apparemment suivre des consignes n'est pas mon fort, je n'ai pas noté de données quotidiennes dans mon journal de bord... Pour pouvoir faire l'exercice 4 je récupère donc les données de température pour une même ville via le site data.gouv.fr : [Données climatologiques quotidiennes](https://meteo.data.gouv.fr/datasets/donnees-climatologiques-de-base-quotidiennes/). Fichier "Q_06_latest-2024-2025_RR-T-Vent.csv" téléchargé le 2025/08/26. Etapes de l'analyse : 1. Préparer/filtrer les données avec un script R. Pour perdre moins de temps je filtre les données en utilisant un script R ([prep_data.R](module2/exo4/prep_data.R)), afin de ne garder que les données pour Nice du mois d'août, entre 2025/08/01 et 2025/08/25, pour les colonnes suivantes ``` NUM_POSTE = Numéro de la station météo NOM_USUEL = Nom de la station météo AAAAMMJJ = Date de la mesure au format année mois jour RR = Quantité de précipitations sur 24h (en mm) TN = Température minimale ce jour (en °C) TX = Température maximale ce jour (en °C) TM = Température moyenne ce jour (en °C) ``` J'exporte les données filtrées en format csv, pour servir de données d'entrée à charger depuis mon document computationnel. 2. Faire les analyses dans un document computationnel. J'importe les données depuis le document computationnel ([exercice.ipynb](module2/exo4/exercice.ipynb)), je corrige quelques formats, puis je suis enfin prête à réaliser des statistiques de base et quelques visualisations. __Liens vers les exercices réalisés :__ - [Exo 1](module2/exo1/toy_notebook_fr.ipynb) - [Exo 2](module2/exo2/exercice.ipynb) - [Exo 3](module2/exo3/exercice.ipynb) - [Exo 4](module2/exo4/exercice.ipynb) - [Exo 5 sans correction](module2/exo5/exo5_fr.ipynb) __Références utiles (pour moi) :__ - [Critiques article Reinhart-Rogoff sur dette](https://en.wikipedia.org/wiki/Growth_in_a_Time_of_Debt) - [Défaut dans méthode stat IRMf](https://www.pnas.org/doi/10.1073/pnas.1602413113) & [Blog sur cet article et ses suites](https://www.cogneurosociety.org/debunking-the-myth-that-fmri-studies-are-invalid/) - [Problèmes de reproductibilité en science avec recours aux ordinateurs](https://theconversation.com/how-computers-broke-science-and-what-we-can-do-to-fix-it-49938) ## Module 3 - La main à la pâte : une analyse réplicable > Suivi la semaine du 2025/08/25. S'entraîner à réaliser une analyse réplicable à l'aide d'un document computationnel. __Contenu :__ - [x] Vidéo de cours - [x] Etude de cas - [ ] Exercices __Liens vers les exercices réalisés :__ - [Exo 1](module3/exo1/analyse-syndrome-grippal.ipynb) - [Exo 2](module3/exo2/exercice.ipynb) **Exercice 3 - évalué par les pairs** Choix du sujet : Sujet 3 - L'épidémie de choléra à Londres en 1854. Représentation de données géographiques.