Les données de l'incidence de la varicelle sont disponibles du site Web du [Réseau Sentinelles](http://www.sentiweb.fr/).
Celles-ci sont disponibles au format CSV. Chaque ligne du fichier correspond à une semaine de la période demandée (les premières données datent de l'année 1991, les dernières sont celles d'une semaine récente).
Celles-ci sont disponibles au format CSV. Chaque ligne du fichier correspond à une semaine de la période demandée (les premières données datent de la fin de l'année 1990, les dernières sont celles d'une semaine récente).
L'URL du fichier est la suivante :
```{r}
...
...
@@ -26,9 +26,11 @@ Chargement des librairies utilisées dans cette étude :
library(tidyverse) # Manipulation de données, graphiques, ...
library(knitr)
library(kableExtra)
library(parsedate)
```
## Téléchargement des données
Nous téléchargeons le fichier de données en local (si celui-ci n'existe pas). Ceci afin de nous prémunir contre un éventuel problème de connexion à ce fichier.
...
...
@@ -76,3 +78,68 @@ Il semble que le fichier soit complet.
## Formattage des données
### Transformation des données "date"
Le format des dates est particulier dans ce fichier : il est sous une forme numérique 'aaaass' , où 'a' et 's' représentent l'année et la semaine de la mesure respectivement (selon la norme ISO 8601).
```{r}
head(varicelle$week)
tail(varicelle$week)
```
La librairie `parsedate` permet de gérer ce type de format, en modifiant légérement la valeur de la date sous la forme 'aaaa-Wss'.
```{r}
varicelle <- varicelle %>%
# ajout du caractère "W" à la valeur de date, puis extraction en format "date"