Dans l'analyse de l'incidence du syndrôme grippal que nous avons montrée dans les vidéos, les données sont téléchargées du serveur du Réseau Sentinelles chaque fois que le document computationnel est exécuté. Ceci a deux inconvénients pratiques : il faut une connexion Internet et le temps de téléchargement peut être important. Mais il y a surtout un inconvénient méthodologique : rien ne garantit que l'URL utilisée reste toujours valable, ni que les données retournées seront toujours les mêmes. Le Réseau Sentinelles pourrait, par exemple, décider de changer le format des données, ou supprimer les données les plus anciennes.
Pour toutes ces raisons, il est préférable de faire d'abord une copie des données, puis utiliser cette copie dans le document computationnel. Pour la traçabilité, le document computationnel doit néanmoins contenir l'URL d'origine. Un lecteur peut ainsi télécharger les données de nouveau et comparer avec la version utilisée dans le calcul. Quand on publie le document computationnel, on publie également la copie des données, après avoir vérifié qu'on a bien le droit de les diffuser (ce que nous avons fait pour ce cours).
Votre tâche est de modifier le document computationnel que nous vous fournissons avec l'analyse de l'incidence du syndrôme grippal de telle façon qu'il utilise une copie locale des données. Remplacez la lecture des données de l'URL par deux étapes :
1. Si le fichier local n'existe pas, téléchargez les données et déposez-les dans le fichier local.
2. Lisez le fichier CSV local.
##Explications de la structure du jeu de données
Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json):
Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json):
| Nom de colonne | Libellé de colonne |
| Nom de colonne | Libellé de colonne |
...
@@ -42,11 +54,22 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://
...
@@ -42,11 +54,22 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://
| `geo_name` | Libellé de la zone géographique (ce libellé peut être modifié sans préavis) |
| `geo_name` | Libellé de la zone géographique (ce libellé peut être modifié sans préavis) |
La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`.
La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`.