diff --git a/module3/exo1/analyse-syndrome-grippal.Rmd b/module3/exo1/analyse-syndrome-grippal.Rmd index 771e78faac371f23c921f7f7aecc87f2100e9059..a946fee6240f2274931d7d5d81a53233a32c41ed 100644 --- a/module3/exo1/analyse-syndrome-grippal.Rmd +++ b/module3/exo1/analyse-syndrome-grippal.Rmd @@ -24,6 +24,12 @@ knitr::opts_chunk$set(echo = TRUE) Les données de l'incidence du syndrome grippal sont disponibles du site Web du [Réseau Sentinelles](http://www.sentiweb.fr/). Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet, qui commence en 1984 et se termine avec une semaine récente. L'URL est: ```{r} data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv" + +data_file = "Incidence_grippe.csv" + +if (!file.exists(data_file)) { + download.file(data_url, data_file, method="auto") +} ``` Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json): @@ -44,7 +50,7 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https:// La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`. ### Téléchargement ```{r} -data = read.csv(data_url, skip=1) +data = read.csv(data_file, skip=1, na.strings = "-") ``` Regardons ce que nous avons obtenu: