diff --git a/module3/exo3/exercice_python_fr.org b/module3/exo3/exercice_python_fr.org index c7157ba42216cf2e1d291112bb351ce48811115c..847277aecbc6a70379a9f41ac0f7d6ed0f07611c 100644 --- a/module3/exo3/exercice_python_fr.org +++ b/module3/exo3/exercice_python_fr.org @@ -1,93 +1,120 @@ -#+TITLE: Votre titre -#+AUTHOR: Votre nom -#+DATE: La date du jour -#+LANGUAGE: fr -# #+PROPERTY: header-args :eval never-export - -#+HTML_HEAD: -#+HTML_HEAD: -#+HTML_HEAD: -#+HTML_HEAD: -#+HTML_HEAD: -#+HTML_HEAD: - -* Quelques explications - -Ceci est un document org-mode avec quelques exemples de code -python. Une fois ouvert dans emacs, ce document peut aisément être -exporté au format HTML, PDF, et Office. Pour plus de détails sur -org-mode vous pouvez consulter https://orgmode.org/guide/. - -Lorsque vous utiliserez le raccourci =C-c C-e h o=, ce document sera -compilé en html. Tout le code contenu sera ré-exécuté, les résultats -récupérés et inclus dans un document final. Si vous ne souhaitez pas -ré-exécuter tout le code à chaque fois, il vous suffit de supprimer -le # et l'espace qui sont devant le ~#+PROPERTY:~ au début de ce -document. - -Comme nous vous l'avons montré dans la vidéo, on inclue du code -python de la façon suivante (et on l'exécute en faisant ~C-c C-c~): - -#+begin_src python :results output :exports both -print("Hello world!") +#+TITLE: Autour du SARS-CoV-2 (Covid-19) + +* Telechargement des donnees + +Telechargement des données localement si elle n'existent pas deja. + +Address ou trouver les donnees : +#+NAME: url_emacs +- https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv + +Nom du .csv local : +#+NAME: csv_file_emacs +- data.csv + +#+begin_src python :results silent :session :export both :var url=url_emacs csv_file=csv_file_emacs +import urllib.request +from os import path + +if not path.exists(csv_file[0]): + urllib.request.urlretrieve(url[0], csv_file[0]) #+end_src -#+RESULTS: -: Hello world! - -Voici la même chose, mais avec une session python, donc une -persistance d'un bloc à l'autre (et on l'exécute toujours en faisant -~C-c C-c~). -#+begin_src python :results output :session :exports both -import numpy -x=numpy.linspace(-15,15) -print(x) +* Traitement des donnees + +** Creation de la table de donnees +Pays retenus: +#+NAME: countries_emacs +- Belgium +- China +- France +- Germany +- Iran +- Italy +- Japan +- Korea, South +- Netherlands +- Portugal +- Spain +- United Kingdom +- US + +Creation de la table de donnees. On retire les colonnes latitute et +longitude et on transforme les strings en entiers. + +#+begin_src python :results silent :session :exports both +import pandas as pd + +df = pd.read_csv("data.csv") +df.drop(["Lat", "Long"], axis=1, inplace=True) +df.iloc[:, 3:] = data.iloc[:, 3:].apply(pd.to_numeric) #+end_src -#+RESULTS: -#+begin_example -[-15. -14.3877551 -13.7755102 -13.16326531 -12.55102041 - -11.93877551 -11.32653061 -10.71428571 -10.10204082 -9.48979592 - -8.87755102 -8.26530612 -7.65306122 -7.04081633 -6.42857143 - -5.81632653 -5.20408163 -4.59183673 -3.97959184 -3.36734694 - -2.75510204 -2.14285714 -1.53061224 -0.91836735 -0.30612245 - 0.30612245 0.91836735 1.53061224 2.14285714 2.75510204 - 3.36734694 3.97959184 4.59183673 5.20408163 5.81632653 - 6.42857143 7.04081633 7.65306122 8.26530612 8.87755102 - 9.48979592 10.10204082 10.71428571 11.32653061 11.93877551 - 12.55102041 13.16326531 13.7755102 14.3877551 15. ] -#+end_example - -Et enfin, voici un exemple de sortie graphique: -#+begin_src python :results output file :session :var matplot_lib_filename="./cosxsx.png" :exports results +On cree une nouvelle ligne de donnees regroupant toutes les regions de +Chine sauf Hong Kong + +#+begin_src python :results silent :session :exports both +china_regions = df.loc[(df["Country/Region"] == "China") & + (df["Province/State"] != "Hong Kong" )] +china_regions = china_regions.sum(axis=0) +china_regions["Province/State"] = "All but Honk Kong" +china_regions["Country/Region"] = "China" +#+end_src + +On retire les donnees non desirees, i.e, les pays n'étant pas dans +ceux retenus (definis precedemment), les colonies et les provinces de +Chine sauf Hong Kong. +#+begin_src python :results silent :session :exports both :var countries=countries_emacs +indexNames = df[(~df["Country/Region"].isin(countries)) | + ((df["Country/Region"] == "China") & (df["Province/State"] != "Hong Kong")) | + ((df["Country/Region"].isin([c for c in countries if c !="China"])) & (~df["Province/State"].isnull())) + ].index +df.drop(indexNames , inplace=True) +#+end_src + +On remet dans la table de donnees les regions de Chine regroupees (a +l'exception d'Hong Kong) + +#+begin_src python :results silent :session :exports both +df = df.append(china_regions, ignore_index=True) +#+end_src + +** Affichage des donnees (echelle lineaire) + +Affichage de la table de donnees avec une echelle lineaire + +Nom du plot lineaire : +#+NAME: plot_linear_emacs +- plot-linear.png + +#+begin_src python :results value file :session :export both :var plot_linear=plot_linear_emacs import matplotlib.pyplot as plt -plt.figure(figsize=(10,5)) -plt.plot(x,numpy.cos(x)/x) -plt.tight_layout() +for i in range(len(df)): + df.iloc[i]["1/22/20":].plot() -plt.savefig(matplot_lib_filename) -print(matplot_lib_filename) +plt.legend(df["Country/Region"]) +plt.savefig(plot_linear[0]) +plot_linear[0] #+end_src #+RESULTS: -[[file:./cosxsx.png]] - -Vous remarquerez le paramètre ~:exports results~ qui indique que le code -ne doit pas apparaître dans la version finale du document. Nous vous -recommandons dans le cadre de ce MOOC de ne pas changer ce paramètre -(indiquer ~both~) car l'objectif est que vos analyses de données soient -parfaitement transparentes pour être reproductibles. - -Attention, la figure ainsi générée n'est pas stockée dans le document -org. C'est un fichier ordinaire, ici nommé ~cosxsx.png~. N'oubliez pas -de le committer si vous voulez que votre analyse soit lisible et -compréhensible sur GitLab. - -Enfin, n'oubliez pas que nous vous fournissons dans les ressources de -ce MOOC une configuration avec un certain nombre de raccourcis -claviers permettant de créer rapidement les blocs de code python (en -faisant ~