Commit 613a4348 authored by Anjélica Leconte's avatar Anjélica Leconte

modif du fichier pour ouvrir les data en local

parent 03baf4ea
...@@ -23,7 +23,7 @@ knitr::opts_chunk$set(echo = TRUE) ...@@ -23,7 +23,7 @@ knitr::opts_chunk$set(echo = TRUE)
Les données de l'incidence du syndrome grippal sont disponibles du site Web du [Réseau Sentinelles](http://www.sentiweb.fr/). Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet, qui commence en 1984 et se termine avec une semaine récente. L'URL est: Les données de l'incidence du syndrome grippal sont disponibles du site Web du [Réseau Sentinelles](http://www.sentiweb.fr/). Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet, qui commence en 1984 et se termine avec une semaine récente. L'URL est:
```{r} ```{r}
data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv" #data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv"
``` ```
Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json): Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json):
...@@ -44,7 +44,8 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https:// ...@@ -44,7 +44,8 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://
La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`. La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`.
### Téléchargement ### Téléchargement
```{r} ```{r}
data = read.csv(data_url, skip=1) data = read.csv(file = "C:/Users/Anjélica/Documents/mooc-rr/module3/exo1/incidence-PAY-3.csv", skip=1)#ignore la 1ère ligne qui est un commentaire
``` ```
Regardons ce que nous avons obtenu: Regardons ce que nous avons obtenu:
...@@ -56,7 +57,7 @@ tail(data) ...@@ -56,7 +57,7 @@ tail(data)
Y a-t-il des points manquants dans nos données ? Y a-t-il des points manquants dans nos données ?
```{r} ```{r}
na_records = apply(data, 1, function (x) any(is.na(x))) na_records = apply(data, 1, function (x) any(is.na(x)))
data[na_records,] data[na_records,]#permet de voir les données manquantes
``` ```
Les deux colonnes qui nous intéressent sont `week` et `inc`. Vérifions leurs classes: Les deux colonnes qui nous intéressent sont `week` et `inc`. Vérifions leurs classes:
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment