Nous allons charger les données de la source. Mais a cause d"une éventuelle non pérrenité du lien,nous allons aussi publier les données de l'analyse dans le même emplacement
Nous allons vérifier si l'écart entre les données sont effectivement d'une semaine.Pour cela nous allons ordonner les données pour qu'ils partent des plus anciennes dates aux plus nouvelles.
Maintenant a l'étape de l'état de vérification des données
Ceci est un document R markdown que vous pouvez aisément exporter au format HTML, PDF, et MS Word. Pour plus de détails sur R Markdown consultez <http://rmarkdown.rstudio.com>.
```{r}
all(diff(data_source$Date) == 7)
```
Toutes nos données sont cohérentes. Donc nous allons passer a une visualisation de nos données
Nous allons définir comme début de chaque période annuelle le 1er septembre et nous allons compter les incidences annuelles
```{r}
pic_annuelle <- function(annee) {
debut = paste0(annee-1,'-09-01')
fin = paste0(annee,'-09-01')
Lorsque vous cliquerez sur le bouton **Knit** ce document sera compilé afin de ré-exécuter le code R et d'inclure les résultats dans un document final. Comme nous vous l'avons montré dans la vidéo, on inclue du code R de la façon suivante:
inc = data_source$Date > debut & data_source$Date <= fin
inc = sum(data_source$inc[inc])
}
```{r cars}
summary(cars)
```
```
Cette fonction définit sera appliqué a chaque année. Malheureusement comme le début de notre période annuelle commence le 1er septembre,l'année 1990 servira uniquement a définir la période annuelle de 1991
Et on peut aussi aisément inclure des figures. Par exemple:
```{r}
annee = 1991:2024
inc = sapply(annee,pic_annuelle)
```
Nous allons définir la série qui contient les incidences annuelles de chaque année
Enfin, un histogramme montre bien que les épidémies fortes, qui touchent environ 10% de la population française, sont assez rares: il y en eu trois au cours des 35 dernières années.
Vous remarquerez le paramètre `echo = FALSE` qui indique que le code ne doit pas apparaître dans la version finale du document. Nous vous recommandons dans le cadre de ce MOOC de ne pas utiliser ce paramètre car l'objectif est que vos analyses de données soient parfaitement transparentes pour être reproductibles.
Comme les résultats ne sont pas stockés dans les fichiers Rmd, pour faciliter la relecture de vos analyses par d'autres personnes, vous aurez donc intérêt à générer un HTML ou un PDF et à le commiter.
Maintenant, à vous de jouer! Vous pouvez effacer toutes ces informations et les remplacer par votre document computationnel.