diff --git a/module3/exo1/analyse-syndrome-grippal.Rmd b/module3/exo1/analyse-syndrome-grippal.Rmd index 771e78faac371f23c921f7f7aecc87f2100e9059..bd108db3ce95da89fef9a17905257e43a4ffd27d 100644 --- a/module3/exo1/analyse-syndrome-grippal.Rmd +++ b/module3/exo1/analyse-syndrome-grippal.Rmd @@ -23,7 +23,7 @@ knitr::opts_chunk$set(echo = TRUE) Les données de l'incidence du syndrome grippal sont disponibles du site Web du [Réseau Sentinelles](http://www.sentiweb.fr/). Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet, qui commence en 1984 et se termine avec une semaine récente. L'URL est: ```{r} -data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv" +#data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv" ``` Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json): @@ -44,7 +44,8 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https:// La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`. ### Téléchargement ```{r} -data = read.csv(data_url, skip=1) +data = read.csv(file = "C:/Users/Anjélica/Documents/mooc-rr/module3/exo1/incidence-PAY-3.csv", skip=1)#ignore la 1ère ligne qui est un commentaire + ``` Regardons ce que nous avons obtenu: @@ -56,7 +57,7 @@ tail(data) Y a-t-il des points manquants dans nos données ? ```{r} na_records = apply(data, 1, function (x) any(is.na(x))) -data[na_records,] +data[na_records,]#permet de voir les données manquantes ``` Les deux colonnes qui nous intéressent sont `week` et `inc`. Vérifions leurs classes: