diff --git a/module3/exo1/analyse-syndrome-grippal.Rmd b/module3/exo1/analyse-syndrome-grippal.Rmd index c14f755038b6f218a9f4edc5051797a5bf42a712..4fd1269cb802fca8458dd38f4f402ae97c949997 100644 --- a/module3/exo1/analyse-syndrome-grippal.Rmd +++ b/module3/exo1/analyse-syndrome-grippal.Rmd @@ -26,6 +26,18 @@ Les données de l'incidence du syndrome grippal sont disponibles du site Web du data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv" ``` +Pour nous protéger contre une éventuelle disparition ou modification du serveur du Réseau Sentinelles, nous faisons une copie locale de ce jeux de données que nous préservons avec notre analyse. Il est inutile et même risquée de télécharger les données à chaque exécution, car dans le cas d'une panne nous pourrions remplacer nos données par un fichier défectueux. Pour cette raison, nous téléchargeons les données seulement si la copie locale n'existe pas. + + +```{r} +data_file = "syndrome-grippal.csv" #téléchargement dans fichier local +if (!file.exists(data_file)) { # après verification que ce fichier n'existe pas déjà + download.file(data_url, data_file, method="auto") +} + +``` + + Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json): | Nom de colonne | Libellé de colonne | @@ -42,18 +54,13 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https:// | `geo_name` | Libellé de la zone géographique (ce libellé peut être modifié sans préavis) | La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`. -### Téléchargement -```{r} -data = read.csv(data_url, skip=1) -``` -### Dépôt dans fichier local +### Lecture + ```{r} -setwd("D:/Utilisateurs/Christine/Documents/maison/travail/MOOC_reproductibilite/mooc-rr/module3") -write.table(data, "data.csv") +data = read.csv(data_file, skip=1) ``` - Regardons ce que nous avons obtenu: ```{r} head(data)