diff --git a/journal/module 3 - analyse replicable.md b/journal/module 3 - analyse replicable.md index af870f7180650b60cca00821c140fd64793f4e4f..5345d39b4f303ff41611fa94f7f0dcd2e46f631f 100644 --- a/journal/module 3 - analyse replicable.md +++ b/journal/module 3 - analyse replicable.md @@ -1,3 +1,35 @@ # Module 3 - Analyse Réplicable +## Intro +Analyse traditionelle: résultats -> résumé méthodologique + discussion + +Analyse réplicable: on remplace résumé par code complet + explication choix + +- Plus facile à vérifier +- Plus faciler à étendre pour répondre à de nouvelles questions +- Facile a rééxecuter avec de nouvelles données + +## Étude de cas: incidence de syndromes grippaux + +Réseau sentinelles -> médecins généralistes, surveillance de maladies + +Ne pas supprimer/modifier des données à la main (ex: supprimer un ligne CSV, même si elle est vide/invalide) +-> Modifier la ligne dans le code + +## Importer les données + +Bibliothèques: +- pandas: import données +- matplotlib: affichage graphiques +- isoweek: gérer dates format ISO + +1ère étape: préface contenant librairies + +Import en utilisant URL, `skiprows=1` pour ignorer 1ère ligne de commentaire + +Trouver ligne vide: `data[data.isnull().any(axis=1)]`, puis suppression `data.dropna().copy()` + +## Vérification et inspection + +Première étape vérification données: possibles erreurs dans données ou introduites par nous-même