diff --git a/journal/Notes_on_module_3.md b/journal/Notes_on_module_3.md index cb8ef091408ee7adc9efa3f13b337df5c43f8525..f2b81a500f19ba3172a44fb59cfff3ba315e275a 100644 --- a/journal/Notes_on_module_3.md +++ b/journal/Notes_on_module_3.md @@ -31,4 +31,18 @@ Préparation des données pour l'analyse. Principale étape : préparation des dates. Points clés de cette séquence : - prétraitement des données afin d'adapter aux conventions des logiciels et de faciliter l'analyse -- vérification par inspection visuelle et code de validation \ No newline at end of file +- vérification par inspection visuelle et code de validation + +# Questions et réponses avec R studio + +Poser des questions aux données et obtenir des réponses. +1. Années des épidémies les plus fortes ? +2. Fréquence d'épidémies faibles, moyennes, et fortes ? + +Pour cela, il faut effectuer une sommation sur l'année. +L'année est définie du 1er août de l'année précédente au 1er août de l'année considérée, pour éviter de se trouver au beau milieu d'un pic. + +Points clés de ce module : +- une analyse réplicable doit contenir toutes les étapes de traitement des données sous une forme éxécutable +- il est important d'expliquer tous les choix qui peuvent influencer les résultats +- cela nécessite d'exposer beaucoup de détails techniques, parce que c'est là qu'on fait le plus d'erreur \ No newline at end of file