Commit 85f556d8 authored by paul BEZIAU's avatar paul BEZIAU

module 3, exercice 1, proposition 1

parent 57b98229
......@@ -46,6 +46,10 @@ Les données de l'incidence du syndrome grippal sont disponibles du site Web du
#+NAME: data-url
http://www.sentiweb.fr/datasets/incidence-PAY-3.csv
Le fichier a été archivé dans le fichier suivant :
#+NAME: data-filename
./incidence-PAY-3.csv
Voici l'explication des colonnes donnée sur [[https://ns.sentiweb.fr/incidence/csv-schema-v1.json][le site d'origine:]]
| Nom de colonne | Libellé de colonne |
......@@ -75,11 +79,26 @@ data_lines = lines[1:]
table = [line.split(',') for line in data_lines]
#+END_SRC
Ici, pour utiliser directement le fichier ./incidence-PAY-3.csv
#+begin_src python :results silent :var data_filename=data-filename :session
data = open(data_filename, encoding='latin-1').read()
lines = data.strip().split('\n')
data_lines = lines[1:]
table = [line.split(',') for line in data_lines]
#+end_src
Regardons ce que nous avons obtenu:
#+BEGIN_SRC python :results value
#+BEGIN_SRC python :results value :session
table[:5]
#+END_SRC
#+RESULTS:
| week | indicator | inc | inc_low | inc_up | inc100 | inc100_low | inc100_up | geo_insee | geo_name |
| 202148 | 3 | 52042 | 44792 | 59292 | 79 | 68 | 90 | FR | France |
| 202147 | 3 | 37023 | 31703 | 42343 | 56 | 48 | 64 | FR | France |
| 202146 | 3 | 30059 | 25302 | 34816 | 46 | 39 | 53 | FR | France |
| 202145 | 3 | 20364 | 16564 | 24164 | 31 | 25 | 37 | FR | France |
** Recherche de données manquantes
Il y a malheureusement beaucoup de façon d'indiquer l'absence d'un point de données. Nous testons ici seulement pour la présence de champs vides. Il faudrait aussi rechercher des valeurs non-numériques dans les colonnes à priori numériques. Nous ne le faisons pas ici, mais une vérification ultérieure capterait des telles anomalies.
......
This diff is collapsed.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment