Il y a malheureusement beaucoup de façon d'indiquer l'absence d'un point de données. Nous testons ici seulement pour la présence de champs vides. Il faudrait aussi rechercher des valeurs non-numériques dans les colonnes à priori numériques. Nous ne le faisons pas ici, mais une vérification ultérieure capterait des telles anomalies.
Il y a malheureusement beaucoup de façon d'indiquer l'absence d'un point de données. Nous testons ici seulement pour la présence de champs vides. Il faudrait aussi rechercher des valeurs non-numériques dans les colonnes à priori numériques. Nous ne le faisons pas ici, mais une vérification ultérieure capterait des telles anomalies.
Il y a deux colonnes qui nous intéressent: la première (~"week"~) et la troisième (~"inc"~). Nous vérifions leurs noms dans l'en-tête, que nous effaçons par la suite. Enfin, nous créons un tableau avec les deux colonnes pour le traitement suivant.
Il y a deux colonnes qui nous intéressent: la première (~"week"~) et la troisième (~"inc"~). Nous vérifions leurs noms dans l'en-tête, que nous effaçons par la suite. Enfin, nous créons un tableau avec les deux colonnes pour le traitement suivant.
#+BEGIN_SRC python :results silent
#+BEGIN_SRC python :results silent
...
@@ -101,7 +111,7 @@ week = [row[0] for row in valid_table]
...
@@ -101,7 +111,7 @@ week = [row[0] for row in valid_table]
assert week[0] == 'week'
assert week[0] == 'week'
del week[0]
del week[0]
inc = [row[2] for row in valid_table]
inc = [row[2] for row in valid_table]
assert inc[0] == 'inc
assert inc[0] == 'inc'
del inc[0]
del inc[0]
data = list(zip(week, inc))
data = list(zip(week, inc))
#+END_SRC
#+END_SRC
...
@@ -111,6 +121,21 @@ Regardons les premières et les dernières lignes. Nous insérons ~None~ pour in
...
@@ -111,6 +121,21 @@ Regardons les premières et les dernières lignes. Nous insérons ~None~ pour in
Il est toujours prudent de vérifier si les données semblent crédibles. Nous savons que les semaines sont données par six chiffres (quatre pour l'année et deux pour la semaine), et que les incidences sont des nombres entiers positifs.
Il est toujours prudent de vérifier si les données semblent crédibles. Nous savons que les semaines sont données par six chiffres (quatre pour l'année et deux pour la semaine), et que les incidences sont des nombres entiers positifs.
#+BEGIN_SRC python :results output
#+BEGIN_SRC python :results output
...
@@ -121,6 +146,8 @@ for week, inc in data:
...
@@ -121,6 +146,8 @@ for week, inc in data:
print("Valeur suspecte dans la colonne 'inc': ", (week, inc))
print("Valeur suspecte dans la colonne 'inc': ", (week, inc))
#+END_SRC
#+END_SRC
#+RESULTS:
Pas de problème !
Pas de problème !
** Conversions
** Conversions
...
@@ -140,6 +167,21 @@ str_data = [(str(date), str(inc)) for date, inc in converted_data]
...
@@ -140,6 +167,21 @@ str_data = [(str(date), str(inc)) for date, inc in converted_data]