#+TITLE: Module 3 - exercice 2
#+AUTHOR: Votre nom
#+DATE: La date du jour
#+LANGUAGE: fr
# #+PROPERTY: header-args :eval never-export
#+HTML_HEAD:
#+HTML_HEAD:
#+HTML_HEAD:
#+HTML_HEAD:
#+HTML_HEAD:
#+HTML_HEAD:
* Import des données, vérification, préparation
** Import et vérification rapide
Les données au format csv sont téléchargées depuis l'adresse :
http://www.sentiweb.fr/datasets/incidence-PAY-7.csv
#+begin_src python :results output :session :exports both
from urllib.request import urlretrieve
import os
if os.path.isfile("incidence-PAY-7.csv"):
print("Chargement du fichier local")
else:
urlretrieve("http://www.sentiweb.fr/datasets/incidence-PAY-7.csv", "incidence-PAY-7.csv")
data = open("incidence-PAY-7.csv", encoding="iso-8859-1").read()
lines = data.strip().split('\n')
data_lines = lines[1:]
table = [line.split(',') for line in data_lines]
#+end_src
#+RESULTS:
: Chargement du fichier local
Vérification visuelle des premières lignes.
#+begin_src python :results value :session :exports both
table[:5]
#+end_src
#+RESULTS:
| week | indicator | inc | inc_low | inc_up | inc100 | inc100_low | inc100_up | geo_insee | geo_name |
| 202016 | 7 | 803 | 83 | 1523 | 1 | 0 | 2 | FR | France |
| 202015 | 7 | 1918 | 675 | 3161 | 3 | 1 | 5 | FR | France |
| 202014 | 7 | 3879 | 2227 | 5531 | 6 | 3 | 9 | FR | France |
| 202013 | 7 | 7326 | 5236 | 9416 | 11 | 8 | 14 | FR | France |
Ok à première vue. Vérifions l'intégrité du jeu de données (lignes
manquantes ou entrées erronnées).