# Module 3 - Analyse Réplicable ## Intro Analyse traditionelle: résultats -> résumé méthodologique + discussion Analyse réplicable: on remplace résumé par code complet + explication choix - Plus facile à vérifier - Plus faciler à étendre pour répondre à de nouvelles questions - Facile a rééxecuter avec de nouvelles données ## Étude de cas: incidence de syndromes grippaux Réseau sentinelles -> médecins généralistes, surveillance de maladies Ne pas supprimer/modifier des données à la main (ex: supprimer un ligne CSV, même si elle est vide/invalide) -> Modifier la ligne dans le code ## Importer les données Bibliothèques: - pandas: import données - matplotlib: affichage graphiques - isoweek: gérer dates format ISO 1ère étape: préface contenant librairies Import en utilisant URL, `skiprows=1` pour ignorer 1ère ligne de commentaire Trouver ligne vide: `data[data.isnull().any(axis=1)]`, puis suppression `data.dropna().copy()` ## Vérification et inspection Première étape vérification données: possibles erreurs dans données ou introduites par nous-même Etapes: - conversion date en format ISO vers format pandas - tri par date Verifications: - est ce que les périodes sont bien directement adjacentes ? Inspections visuelle en utilisant représentation graphique /!\ Documenter chaque anamolie, chaque traitement de données non trivial ## Question et réponses : analyse de données Analyse réplicable contient: - exposer toutes les étapes, - expliquer tous les choix