diff --git a/module3/exo1/analyse-syndrome-grippal.org b/module3/exo1/analyse-syndrome-grippal.org index 1720b70df3a93009c79592b68d1dcf57a53f6341..8883e6371f59411254f06dea083dfbc21ce75bc6 100644 --- a/module3/exo1/analyse-syndrome-grippal.org +++ b/module3/exo1/analyse-syndrome-grippal.org @@ -64,12 +64,19 @@ Voici l'explication des colonnes donnée sur [[https://ns.sentiweb.fr/incidence/ L'indication d'une semaine calendaire en format [[https://en.wikipedia.org/wiki/ISO_8601][ISO-8601]] est populaire en Europe, mais peu utilisée aux Etats-Unis. Ceci explique peut-être que peu de logiciels savent gérer ce format. Le langage Python le fait depuis la version 3.6. Nous utilisons donc ce langage pour la préparation de nos données, ce qui a l'avantage de ne nécessiter aucune bibliothèque supplémentaire. (Note: nous expliquerons dans le module 4 pourquoi il est avantageux pour la réproductibilité de se limiter à un minimum de bibliothèques.) ** Téléchargement +Si les données ne sont pas téléchargés on les télécharge Après avoir téléchargé les données, nous commençons par l'extraction des données qui nous intéressent. D'abord nous découpons le contenu du fichier en lignes, dont nous jetons la première qui ne contient qu'un commentaire. Les autres lignes sont découpées en colonnes. #+BEGIN_SRC python :results silent :var data_url=data-url +import os from urllib.request import urlopen - -data = urlopen(data_url).read() +if os.path.isfile("sentinel.csv"): + with open("sentinel.csv") as rfile: + data = rfile.read() +else: + data = urlopen(data_url).read() + with open("sentinel.csv", "w+) as rfile: + rfile.write(data) lines = data.decode('latin-1').strip().split('\n') data_lines = lines[1:] table = [line.split(',') for line in data_lines]