diff --git a/module2/exo4/daily.png b/module2/exo4/daily.png new file mode 100644 index 0000000000000000000000000000000000000000..4759aa84b5e7356db2c50e4a073019fd4ff8d52a Binary files /dev/null and b/module2/exo4/daily.png differ diff --git a/module2/exo4/exercice_python_fr.org b/module2/exo4/exercice_python_fr.org index c7157ba42216cf2e1d291112bb351ce48811115c..d8a6ecd206facac8582fec3737d8e1eca0e9125c 100644 --- a/module2/exo4/exercice_python_fr.org +++ b/module2/exo4/exercice_python_fr.org @@ -1,8 +1,7 @@ -#+TITLE: Votre titre -#+AUTHOR: Votre nom -#+DATE: La date du jour +#+TITLE: Quelques chiffres autour de l'épidémie de Covid-19 +#+AUTHOR: François Févotte +# #+DATE: La date du jour #+LANGUAGE: fr -# #+PROPERTY: header-args :eval never-export #+HTML_HEAD: #+HTML_HEAD: @@ -11,83 +10,114 @@ #+HTML_HEAD: #+HTML_HEAD: -* Quelques explications -Ceci est un document org-mode avec quelques exemples de code -python. Une fois ouvert dans emacs, ce document peut aisément être -exporté au format HTML, PDF, et Office. Pour plus de détails sur -org-mode vous pouvez consulter https://orgmode.org/guide/. +* Récupération des données -Lorsque vous utiliserez le raccourci =C-c C-e h o=, ce document sera -compilé en html. Tout le code contenu sera ré-exécuté, les résultats -récupérés et inclus dans un document final. Si vous ne souhaitez pas -ré-exécuter tout le code à chaque fois, il vous suffit de supprimer -le # et l'espace qui sont devant le ~#+PROPERTY:~ au début de ce -document. +On prend les données distribuées par [[https://ourworldindata.org][Our World In Data]], elles-mêmes issues de +l'[[https://www.ecdc.europa.eu/][ECDC]] : -Comme nous vous l'avons montré dans la vidéo, on inclue du code -python de la façon suivante (et on l'exécute en faisant ~C-c C-c~): +#+BEGIN_SRC python :results none :session :exports none + import numpy as np + import matplotlib.pyplot as plt + import pandas as pd + plt.style.use('seaborn') +#+END_SRC -#+begin_src python :results output :exports both -print("Hello world!") -#+end_src +#+BEGIN_SRC python :results value :session :exports both + url = "https://covid.ourworldindata.org/data/ecdc/full_data.csv" + data_raw = pd.read_csv(url, index_col='date') + data_raw.tail(3) +#+END_SRC #+RESULTS: -: Hello world! +: location new_cases new_deaths total_cases total_deaths +: date +: 2020-04-04 Zimbabwe 1 0 9 1 +: 2020-04-05 Zimbabwe 0 0 9 1 +: 2020-04-06 Zimbabwe 0 0 9 1 -Voici la même chose, mais avec une session python, donc une -persistance d'un bloc à l'autre (et on l'exécute toujours en faisant -~C-c C-c~). -#+begin_src python :results output :session :exports both -import numpy -x=numpy.linspace(-15,15) -print(x) -#+end_src +* Evolution comparée de l'épidémie dans quelques pays + +Je préfère fonder l'analyse sur le nombre de décès, qui me semble plus fiable et +comparable d'un pays à l'autre que, par exemple, le nombre de cas dépistés. Afin +de recaler l'axe temporel, on positionne $t=0$ au moment où le nombre total de +morts dépasse 100. + +#+BEGIN_SRC python :results value :exports both :session + # Parameters + column = "total_deaths" + threshold = 100 + countries = ["France", "Italy", "Spain", "Belgium", "Germany", "Switzerland"] + + total = {} + for country in countries: + total[country] = data_raw.query(f"location == '{country}' & {column} > {threshold}") + + daily[countries[0]].head(3) +#+END_SRC + +#+RESULTS: +: location new_cases new_deaths total_cases total_deaths +: date +: 2020-03-14 France 785 18 3661 79 +: 2020-03-16 France 924 36 5423 127 +: 2020-03-17 France 1210 21 6633 148 + +#+BEGIN_SRC python :session :results output file :exports results :var pltfile="total.png" + plt.figure(figsize=(10,5)) + for country in total.keys(): + x = total[country]['total_deaths'] + plt.plot(numpy.arange(len(x)), x, label=country, linewidth=3) + plt.xlabel(f"Number of days since {column} > {threshold}") + plt.yscale("log") + plt.legend(fontsize='x-large') + plt.tight_layout() + plt.savefig(pltfile) + plt.close() + print(pltfile) +#+END_SRC + +#+RESULTS: +[[file:total.png]] + + +* Vers un passage du pic ? + +On s'intéresse ici à l'atteinte d'un pic du nombre de décès quotidiens liés à +Covid-19. Là encore, l'axe temporel est recalé afin de permettre une +comparaison entre pays : $t=0$ est positionné au moment où le nombre quotidien +de morts dépasse 15. + +#+BEGIN_SRC python :session :results value :exports both + threshold = 15 + + daily = {} + for country in countries: + daily[country] = data_raw.query(f"location == '{country}' & new_deaths > {threshold}") + + daily[countries[0]].head(3) +#+END_SRC #+RESULTS: -#+begin_example -[-15. -14.3877551 -13.7755102 -13.16326531 -12.55102041 - -11.93877551 -11.32653061 -10.71428571 -10.10204082 -9.48979592 - -8.87755102 -8.26530612 -7.65306122 -7.04081633 -6.42857143 - -5.81632653 -5.20408163 -4.59183673 -3.97959184 -3.36734694 - -2.75510204 -2.14285714 -1.53061224 -0.91836735 -0.30612245 - 0.30612245 0.91836735 1.53061224 2.14285714 2.75510204 - 3.36734694 3.97959184 4.59183673 5.20408163 5.81632653 - 6.42857143 7.04081633 7.65306122 8.26530612 8.87755102 - 9.48979592 10.10204082 10.71428571 11.32653061 11.93877551 - 12.55102041 13.16326531 13.7755102 14.3877551 15. ] -#+end_example - -Et enfin, voici un exemple de sortie graphique: -#+begin_src python :results output file :session :var matplot_lib_filename="./cosxsx.png" :exports results -import matplotlib.pyplot as plt - -plt.figure(figsize=(10,5)) -plt.plot(x,numpy.cos(x)/x) -plt.tight_layout() - -plt.savefig(matplot_lib_filename) -print(matplot_lib_filename) -#+end_src +: location new_cases new_deaths total_cases total_deaths +: date +: 2020-03-14 France 785 18 3661 79 +: 2020-03-16 France 924 36 5423 127 +: 2020-03-17 France 1210 21 6633 148 + +#+BEGIN_SRC python :session :results output file :exports results :var pltfile="daily.png" + plt.figure(figsize=(10,5)) + for country in daily.keys(): + x = daily[country]['new_deaths'] + plt.plot(numpy.arange(len(x)), x, label=country, linewidth=3) + plt.xlabel(f"Number of days since daily deaths > {threshold}") + plt.yscale("log") + plt.legend(fontsize='x-large') + plt.tight_layout() + plt.savefig(pltfile) + plt.close() + print(pltfile) +#+END_SRC #+RESULTS: -[[file:./cosxsx.png]] - -Vous remarquerez le paramètre ~:exports results~ qui indique que le code -ne doit pas apparaître dans la version finale du document. Nous vous -recommandons dans le cadre de ce MOOC de ne pas changer ce paramètre -(indiquer ~both~) car l'objectif est que vos analyses de données soient -parfaitement transparentes pour être reproductibles. - -Attention, la figure ainsi générée n'est pas stockée dans le document -org. C'est un fichier ordinaire, ici nommé ~cosxsx.png~. N'oubliez pas -de le committer si vous voulez que votre analyse soit lisible et -compréhensible sur GitLab. - -Enfin, n'oubliez pas que nous vous fournissons dans les ressources de -ce MOOC une configuration avec un certain nombre de raccourcis -claviers permettant de créer rapidement les blocs de code python (en -faisant ~