From f9dbe29ba9f1ff83d223d51b29b5114d55075c12 Mon Sep 17 00:00:00 2001 From: a8ae2bdb61eb282f5aff31e52a1e529f Date: Mon, 25 Jan 2021 08:23:26 +0000 Subject: [PATCH] Third Update analyse-syndrome-grippal.org --- module3/exo1/analyse-syndrome-grippal.org | 10 ++++------ 1 file changed, 4 insertions(+), 6 deletions(-) diff --git a/module3/exo1/analyse-syndrome-grippal.org b/module3/exo1/analyse-syndrome-grippal.org index 6c203e8..f84758f 100644 --- a/module3/exo1/analyse-syndrome-grippal.org +++ b/module3/exo1/analyse-syndrome-grippal.org @@ -67,7 +67,7 @@ L'indication d'une semaine calendaire en format [[https://en.wikipedia.org/wiki/ Pour nous protéger contre une éventuelle disparition ou modification du serveur du Réseau Sentinelles, nous faisons une copie locale de ce jeux de données que nous préservons avec notre analyse. Il est inutile et même risquée de télécharger les données à chaque exécution, car dans le cas d'une panne nous pourrions remplacer nos données par un fichier défectueux. Pour cette raison, nous téléchargeons les données seulement si la copie locale n'existe pas. #+BEGIN_SRC python :results output :var data_url=data-url -data_file="syndrome-grippal.csv" +data_file = "syndrome-grippal.csv" import os import urllib.request @@ -75,12 +75,10 @@ if not os.path.exists(data_file): urllib.request.urlretrieve(data_url, data_file) #+END_SRC -Nous commençons le traitement par l'extraction des données qui nous intéressent. D'abord nous découpons le contenu du fichier en lignes, dont nous jetons la première aui ne contient qu'un commentaire. Les autres lignes sont découpées en colonnes. +Nous commençons le traitement par l'extraction des données qui nous intéressent. D'abord nous découpons le contenu du fichier en lignes, dont nous jetons la première qui ne contient qu'un commentaire. Les autres lignes sont découpées en colonnes. #+BEGIN_SRC python :results silent :var data_url=data-url -from urllib.request import urlopen - -data = urlopen(data_url).read() +data = urlopen(data_file,'rb').read() lines = data.decode('latin-1').strip().split('\n') data_lines = lines[1:] table = [line.split(',') for line in data_lines] @@ -201,7 +199,7 @@ pic_annuel = function(annee) { } #+END_SRC -Nous devons aussi faire attention aux premières et dernières années de notre jeux de données. Les données commencent en octobre 1984, ce qui ne permet pas de quantifier complètement le pic attribué à l'année 1985. Nous le supprimons donc de notre analyse. Pour la même raison, nous arrêtons en 2018. Nous devons attendre les données pour juillet 2019 avant d'augmenter la dernière année à 2019. +Nous devons aussi faire attention aux premières et dernières années de notre jeux de données. Les données commencent en octobre 1984, ce qui ne permet pas de quantifier complètement le pic attribué à l'année 1985. Nous le supprimons donc de notre analyse. Par contre, les données se terminent après le 1er août 2018 (pour une exécution après cette date bien sûr), ce qui nous permet d'inclure cette année dans l'analyse. #+BEGIN_SRC R :results silent annees <- 1986:2018 #+END_SRC -- 2.18.1