From 472944359a544ab885bc9a2dbb50263a468d1e7e Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Julien=20Qu=C3=A9non?= Date: Tue, 18 May 2021 15:01:56 +0200 Subject: [PATCH] =?UTF-8?q?Cr=C3=A9ation=20copie=20locale=20du=20dataset?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- module3/exo1/analyse-syndrome-grippal.Rmd | 19 ++++++++++++++++--- 1 file changed, 16 insertions(+), 3 deletions(-) diff --git a/module3/exo1/analyse-syndrome-grippal.Rmd b/module3/exo1/analyse-syndrome-grippal.Rmd index 771e78f..87ea8a8 100644 --- a/module3/exo1/analyse-syndrome-grippal.Rmd +++ b/module3/exo1/analyse-syndrome-grippal.Rmd @@ -26,6 +26,19 @@ Les données de l'incidence du syndrome grippal sont disponibles du site Web du data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv" ``` +On effectue une copie locale (appelée `data_local`des données, accessibles depuis l'adresse `data_url`: +```{r} +data_local = "data_syndrome_grippal.csv" +``` +Une fois cette copie locale réalisée, on ne veut plus avoir à télécharger le fichier à chaque exécution du script, car on pourrait rencontrer des problèmes (écrasement des données et/ou url invalide). +Pour éviter cela, on vérifie si la copie locale existe (est non vide). Si oui,on n'a rien à faire et si non, on a besoin de télécharger les données. On utilise pour cela la fonction `!file.exists` (qui vérifie que le [fichier n'existe pas](https://statisticsglobe.com/check-existence-of-local-file-in-r)) +```{r} +if (!file.exists(data_local)){ # si le fichier data_local n'existe PAS + download.file(data_url, data_local, method = "auto") # alors on le télécharge à l'adresse data_url et on le stocke dans data_local +} +``` + + Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json): | Nom de colonne | Libellé de colonne | @@ -41,11 +54,11 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https:// | `geo_insee` | Code de la zone géographique concernée (Code INSEE) http://www.insee.fr/fr/methodes/nomenclatures/cog/ | | `geo_name` | Libellé de la zone géographique (ce libellé peut être modifié sans préavis) | -La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`. -### Téléchargement +### Lecture des données ```{r} -data = read.csv(data_url, skip=1) +data = read.csv(data_local, skip = 1) ``` +La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`. Regardons ce que nous avons obtenu: ```{r} -- 2.18.1