Commit 6ca812f5 authored by François Févotte's avatar François Févotte

Exercice 02-4 - Améliorer son journal de bord

parent 7319b0c5
#+TITLE: Votre titre #+TITLE: Quelques chiffres autour de l'épidémie de Covid-19
#+AUTHOR: Votre nom #+AUTHOR: François Févotte
#+DATE: La date du jour # #+DATE: La date du jour
#+LANGUAGE: fr #+LANGUAGE: fr
# #+PROPERTY: header-args :eval never-export
#+HTML_HEAD: <link rel="stylesheet" type="text/css" href="http://www.pirilampo.org/styles/readtheorg/css/htmlize.css"/> #+HTML_HEAD: <link rel="stylesheet" type="text/css" href="http://www.pirilampo.org/styles/readtheorg/css/htmlize.css"/>
#+HTML_HEAD: <link rel="stylesheet" type="text/css" href="http://www.pirilampo.org/styles/readtheorg/css/readtheorg.css"/> #+HTML_HEAD: <link rel="stylesheet" type="text/css" href="http://www.pirilampo.org/styles/readtheorg/css/readtheorg.css"/>
...@@ -11,83 +10,114 @@ ...@@ -11,83 +10,114 @@
#+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/lib/js/jquery.stickytableheaders.js"></script> #+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/lib/js/jquery.stickytableheaders.js"></script>
#+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/readtheorg/js/readtheorg.js"></script> #+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/readtheorg/js/readtheorg.js"></script>
* Quelques explications
Ceci est un document org-mode avec quelques exemples de code * Récupération des données
python. Une fois ouvert dans emacs, ce document peut aisément être
exporté au format HTML, PDF, et Office. Pour plus de détails sur
org-mode vous pouvez consulter https://orgmode.org/guide/.
Lorsque vous utiliserez le raccourci =C-c C-e h o=, ce document sera On prend les données distribuées par [[https://ourworldindata.org][Our World In Data]], elles-mêmes issues de
compilé en html. Tout le code contenu sera ré-exécuté, les résultats l'[[https://www.ecdc.europa.eu/][ECDC]] :
récupérés et inclus dans un document final. Si vous ne souhaitez pas
ré-exécuter tout le code à chaque fois, il vous suffit de supprimer
le # et l'espace qui sont devant le ~#+PROPERTY:~ au début de ce
document.
Comme nous vous l'avons montré dans la vidéo, on inclue du code #+BEGIN_SRC python :results none :session :exports none
python de la façon suivante (et on l'exécute en faisant ~C-c C-c~): import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
plt.style.use('seaborn')
#+END_SRC
#+begin_src python :results output :exports both #+BEGIN_SRC python :results value :session :exports both
print("Hello world!") url = "https://covid.ourworldindata.org/data/ecdc/full_data.csv"
#+end_src data_raw = pd.read_csv(url, index_col='date')
data_raw.tail(3)
#+END_SRC
#+RESULTS: #+RESULTS:
: Hello world! : location new_cases new_deaths total_cases total_deaths
: date
: 2020-04-04 Zimbabwe 1 0 9 1
: 2020-04-05 Zimbabwe 0 0 9 1
: 2020-04-06 Zimbabwe 0 0 9 1
Voici la même chose, mais avec une session python, donc une * Evolution comparée de l'épidémie dans quelques pays
persistance d'un bloc à l'autre (et on l'exécute toujours en faisant
~C-c C-c~). Je préfère fonder l'analyse sur le nombre de décès, qui me semble plus fiable et
#+begin_src python :results output :session :exports both comparable d'un pays à l'autre que, par exemple, le nombre de cas dépistés. Afin
import numpy de recaler l'axe temporel, on positionne $t=0$ au moment où le nombre total de
x=numpy.linspace(-15,15) morts dépasse 100.
print(x)
#+end_src #+BEGIN_SRC python :results value :exports both :session
# Parameters
column = "total_deaths"
threshold = 100
countries = ["France", "Italy", "Spain", "Belgium", "Germany", "Switzerland"]
total = {}
for country in countries:
total[country] = data_raw.query(f"location == '{country}' & {column} > {threshold}")
daily[countries[0]].head(3)
#+END_SRC
#+RESULTS:
: location new_cases new_deaths total_cases total_deaths
: date
: 2020-03-14 France 785 18 3661 79
: 2020-03-16 France 924 36 5423 127
: 2020-03-17 France 1210 21 6633 148
#+BEGIN_SRC python :session :results output file :exports results :var pltfile="total.png"
plt.figure(figsize=(10,5))
for country in total.keys():
x = total[country]['total_deaths']
plt.plot(numpy.arange(len(x)), x, label=country, linewidth=3)
plt.xlabel(f"Number of days since {column} > {threshold}")
plt.yscale("log")
plt.legend(fontsize='x-large')
plt.tight_layout()
plt.savefig(pltfile)
plt.close()
print(pltfile)
#+END_SRC
#+RESULTS:
[[file:total.png]]
* Vers un passage du pic ?
On s'intéresse ici à l'atteinte d'un pic du nombre de décès quotidiens liés à
Covid-19. Là encore, l'axe temporel est recalé afin de permettre une
comparaison entre pays : $t=0$ est positionné au moment où le nombre quotidien
de morts dépasse 15.
#+BEGIN_SRC python :session :results value :exports both
threshold = 15
daily = {}
for country in countries:
daily[country] = data_raw.query(f"location == '{country}' & new_deaths > {threshold}")
daily[countries[0]].head(3)
#+END_SRC
#+RESULTS: #+RESULTS:
#+begin_example : location new_cases new_deaths total_cases total_deaths
[-15. -14.3877551 -13.7755102 -13.16326531 -12.55102041 : date
-11.93877551 -11.32653061 -10.71428571 -10.10204082 -9.48979592 : 2020-03-14 France 785 18 3661 79
-8.87755102 -8.26530612 -7.65306122 -7.04081633 -6.42857143 : 2020-03-16 France 924 36 5423 127
-5.81632653 -5.20408163 -4.59183673 -3.97959184 -3.36734694 : 2020-03-17 France 1210 21 6633 148
-2.75510204 -2.14285714 -1.53061224 -0.91836735 -0.30612245
0.30612245 0.91836735 1.53061224 2.14285714 2.75510204 #+BEGIN_SRC python :session :results output file :exports results :var pltfile="daily.png"
3.36734694 3.97959184 4.59183673 5.20408163 5.81632653 plt.figure(figsize=(10,5))
6.42857143 7.04081633 7.65306122 8.26530612 8.87755102 for country in daily.keys():
9.48979592 10.10204082 10.71428571 11.32653061 11.93877551 x = daily[country]['new_deaths']
12.55102041 13.16326531 13.7755102 14.3877551 15. ] plt.plot(numpy.arange(len(x)), x, label=country, linewidth=3)
#+end_example plt.xlabel(f"Number of days since daily deaths > {threshold}")
plt.yscale("log")
Et enfin, voici un exemple de sortie graphique: plt.legend(fontsize='x-large')
#+begin_src python :results output file :session :var matplot_lib_filename="./cosxsx.png" :exports results plt.tight_layout()
import matplotlib.pyplot as plt plt.savefig(pltfile)
plt.close()
plt.figure(figsize=(10,5)) print(pltfile)
plt.plot(x,numpy.cos(x)/x) #+END_SRC
plt.tight_layout()
plt.savefig(matplot_lib_filename)
print(matplot_lib_filename)
#+end_src
#+RESULTS: #+RESULTS:
[[file:./cosxsx.png]] [[file:daily.png]]
Vous remarquerez le paramètre ~:exports results~ qui indique que le code
ne doit pas apparaître dans la version finale du document. Nous vous
recommandons dans le cadre de ce MOOC de ne pas changer ce paramètre
(indiquer ~both~) car l'objectif est que vos analyses de données soient
parfaitement transparentes pour être reproductibles.
Attention, la figure ainsi générée n'est pas stockée dans le document
org. C'est un fichier ordinaire, ici nommé ~cosxsx.png~. N'oubliez pas
de le committer si vous voulez que votre analyse soit lisible et
compréhensible sur GitLab.
Enfin, n'oubliez pas que nous vous fournissons dans les ressources de
ce MOOC une configuration avec un certain nombre de raccourcis
claviers permettant de créer rapidement les blocs de code python (en
faisant ~<p~, ~<P~ ou ~<PP~ suivi de ~Tab~).
Maintenant, à vous de jouer! Vous pouvez effacer toutes ces
informations et les remplacer par votre document computationnel.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment