@@ -138,8 +138,80 @@ Les pics d'incidence semblent avoir lieu au mois d'avril chaque année, alors qu
## Analyse de l'incidence
### Modification de la période de référence
Étant donné que le pic de l'épidémie semble se situer au mois d'avril, à cheval entre deux années civiles, nous définissons la période de référence entre deux minima de l'incidence, du 1er septembre de l'année $N$ au 1er septembre de l'année $N+1$.
Nous mettons l'année $N+1$ comme étiquette sur cette année décalée, car le pic de l'épidémie est toujours au début de l'année $N+1$. Comme l'incidence de la varicelle est très faible en été, cette modification ne risque pas de fausser nos conclusions.
```{r}
pic_annuel = function(annee) {
debut = paste0(annee-1,"-08-01")
fin = paste0(annee,"-08-01")
semaines = data$date > debut & data$date <= fin
sum(data$inc[semaines], na.rm=TRUE)
}
```
```{r}
varicelle <- varicelle %>%
# extraire l'année "civile" pour chaque ligne
mutate(annee_civile = as.numeric(format(iso_week, format = "%Y"))) %>%
group_by(annee_civile) %>%
# si la date est avant le 1er septembre, année précédente, sinon année en cours
mutate(annee_ref = ifelse(iso_week < as.POSIXct(paste0(annee_civile, "-09-01"), format = "%Y-%m-%d"),
annee_civile - 1, annee_civile)) %>%
ungroup()
```
On peut regarder le résultat en extrayant quelques données autour du 1er septembre 2005.