Commit 516d0843 authored by Pauline Hardouin's avatar Pauline Hardouin

commit

parent e1437320
......@@ -2,11 +2,11 @@
title: "Analyse de l'incidence du syndrôme grippal"
author: "Konrad Hinsen"
output:
pdf_document:
toc: true
html_document:
toc: true
theme: journal
pdf_document:
toc: true
documentclass: article
classoption: a4paper
header-includes:
......@@ -26,6 +26,18 @@ Les données de l'incidence du syndrome grippal sont disponibles du site Web du
data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv"
```
## Démarche
Dans l'analyse de l'incidence du syndrôme grippal que nous avons montrée dans les vidéos, les données sont téléchargées du serveur du Réseau Sentinelles chaque fois que le document computationnel est exécuté. Ceci a deux inconvénients pratiques : il faut une connexion Internet et le temps de téléchargement peut être important. Mais il y a surtout un inconvénient méthodologique : rien ne garantit que l'URL utilisée reste toujours valable, ni que les données retournées seront toujours les mêmes. Le Réseau Sentinelles pourrait, par exemple, décider de changer le format des données, ou supprimer les données les plus anciennes.
Pour toutes ces raisons, il est préférable de faire d'abord une copie des données, puis utiliser cette copie dans le document computationnel. Pour la traçabilité, le document computationnel doit néanmoins contenir l'URL d'origine. Un lecteur peut ainsi télécharger les données de nouveau et comparer avec la version utilisée dans le calcul. Quand on publie le document computationnel, on publie également la copie des données, après avoir vérifié qu'on a bien le droit de les diffuser (ce que nous avons fait pour ce cours).
Votre tâche est de modifier le document computationnel que nous vous fournissons avec l'analyse de l'incidence du syndrôme grippal de telle façon qu'il utilise une copie locale des données. Remplacez la lecture des données de l'URL par deux étapes :
1. Si le fichier local n'existe pas, téléchargez les données et déposez-les dans le fichier local.
2. Lisez le fichier CSV local.
##Explications de la structure du jeu de données
Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json):
| Nom de colonne | Libellé de colonne |
......@@ -42,11 +54,22 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://
| `geo_name` | Libellé de la zone géographique (ce libellé peut être modifié sans préavis) |
La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`.
### Téléchargement
## Télécharger le fichier en local
```{r}
data_file = "incidence-PAY-3.csv"
if (!file.exists(data_file)) {
download.file(data_url, data_file, method="auto")
}
```
## Lecture du fichier téléchargé
```{r}
data = read.csv(data_url, skip=1)
data = read.csv(data_file, skip=1)
head(data)
```
Regardons ce que nous avons obtenu:
```{r}
head(data)
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment