diff --git a/journal/notes_module_3.md b/journal/notes_module_3.md index 4cf94f93793c41a7b673d3d045584c09572d57fe..2f134c88ae1f5c4619e36ea8fbbced728263faa7 100644 --- a/journal/notes_module_3.md +++ b/journal/notes_module_3.md @@ -48,3 +48,27 @@ On parle de "pré-traitement" des données, ici en particulier de conversion (dans des formats plus catholiques), en vue de pouvoir afficher. "La" vérification ici, c'est la validation des écarts de semaine (+l'inspection visuelle). + +## passer les données à la question + +Si on veut analyser par année, on a un pb con : +les années ne contiennent pas un nombre entier de semaine ^^ + +1. pour chaque année, trouver la semaine qui contient le 1er août +2. sommer les incidences à partir de cette semaine, afin de construire notre repr° annuelle + +(vu qu'il y a moins d'incidence en été, ça minimise le biais) + +Au fait, la première question qu'on se pose, c'est : quelles sont les plus +grandes années d'épidémie ? + +Bref. +Voir leur version finale pour se galvaniser. +(Version qui me rassure sur le "bug" de l'an 1984. +Ils le résolvent aussi.) + +Morale : il faut présenter toutes les étapes de traitement sous forme éxécutable, +expliquer ses choix (donc exposer du détail technique) car c'est à ce niveau +qu'on fait le plus d'erreurs. + +