Update exercice_python_fr.org

parent c90e9b84
#+TITLE: Votre titre #+TITLE: Autour du SARS-CoV-2 (Covid-19)
#+AUTHOR: Votre nom
#+DATE: La date du jour * Telechargement des donnees
#+LANGUAGE: fr
# #+PROPERTY: header-args :eval never-export Telechargement des données localement si elle n'existent pas deja.
#+HTML_HEAD: <link rel="stylesheet" type="text/css" href="http://www.pirilampo.org/styles/readtheorg/css/htmlize.css"/> Address ou trouver les donnees :
#+HTML_HEAD: <link rel="stylesheet" type="text/css" href="http://www.pirilampo.org/styles/readtheorg/css/readtheorg.css"/> #+NAME: url_emacs
#+HTML_HEAD: <script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.3/jquery.min.js"></script> - https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv
#+HTML_HEAD: <script src="https://maxcdn.bootstrapcdn.com/bootstrap/3.3.4/js/bootstrap.min.js"></script>
#+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/lib/js/jquery.stickytableheaders.js"></script> Nom du .csv local :
#+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/readtheorg/js/readtheorg.js"></script> #+NAME: csv_file_emacs
- data.csv
* Quelques explications
#+begin_src python :results silent :session :export both :var url=url_emacs csv_file=csv_file_emacs
Ceci est un document org-mode avec quelques exemples de code import urllib.request
python. Une fois ouvert dans emacs, ce document peut aisément être from os import path
exporté au format HTML, PDF, et Office. Pour plus de détails sur
org-mode vous pouvez consulter https://orgmode.org/guide/. if not path.exists(csv_file[0]):
urllib.request.urlretrieve(url[0], csv_file[0])
Lorsque vous utiliserez le raccourci =C-c C-e h o=, ce document sera
compilé en html. Tout le code contenu sera ré-exécuté, les résultats
récupérés et inclus dans un document final. Si vous ne souhaitez pas
ré-exécuter tout le code à chaque fois, il vous suffit de supprimer
le # et l'espace qui sont devant le ~#+PROPERTY:~ au début de ce
document.
Comme nous vous l'avons montré dans la vidéo, on inclue du code
python de la façon suivante (et on l'exécute en faisant ~C-c C-c~):
#+begin_src python :results output :exports both
print("Hello world!")
#+end_src #+end_src
#+RESULTS: * Traitement des donnees
: Hello world!
** Creation de la table de donnees
Voici la même chose, mais avec une session python, donc une Pays retenus:
persistance d'un bloc à l'autre (et on l'exécute toujours en faisant #+NAME: countries_emacs
~C-c C-c~). - Belgium
#+begin_src python :results output :session :exports both - China
import numpy - France
x=numpy.linspace(-15,15) - Germany
print(x) - Iran
- Italy
- Japan
- Korea, South
- Netherlands
- Portugal
- Spain
- United Kingdom
- US
Creation de la table de donnees. On retire les colonnes latitute et
longitude et on transforme les strings en entiers.
#+begin_src python :results silent :session :exports both
import pandas as pd
df = pd.read_csv("data.csv")
df.drop(["Lat", "Long"], axis=1, inplace=True)
df.iloc[:, 3:] = data.iloc[:, 3:].apply(pd.to_numeric)
#+end_src #+end_src
#+RESULTS: On cree une nouvelle ligne de donnees regroupant toutes les regions de
#+begin_example Chine sauf Hong Kong
[-15. -14.3877551 -13.7755102 -13.16326531 -12.55102041
-11.93877551 -11.32653061 -10.71428571 -10.10204082 -9.48979592 #+begin_src python :results silent :session :exports both
-8.87755102 -8.26530612 -7.65306122 -7.04081633 -6.42857143 china_regions = df.loc[(df["Country/Region"] == "China") &
-5.81632653 -5.20408163 -4.59183673 -3.97959184 -3.36734694 (df["Province/State"] != "Hong Kong" )]
-2.75510204 -2.14285714 -1.53061224 -0.91836735 -0.30612245 china_regions = china_regions.sum(axis=0)
0.30612245 0.91836735 1.53061224 2.14285714 2.75510204 china_regions["Province/State"] = "All but Honk Kong"
3.36734694 3.97959184 4.59183673 5.20408163 5.81632653 china_regions["Country/Region"] = "China"
6.42857143 7.04081633 7.65306122 8.26530612 8.87755102 #+end_src
9.48979592 10.10204082 10.71428571 11.32653061 11.93877551
12.55102041 13.16326531 13.7755102 14.3877551 15. ] On retire les donnees non desirees, i.e, les pays n'étant pas dans
#+end_example ceux retenus (definis precedemment), les colonies et les provinces de
Chine sauf Hong Kong.
Et enfin, voici un exemple de sortie graphique: #+begin_src python :results silent :session :exports both :var countries=countries_emacs
#+begin_src python :results output file :session :var matplot_lib_filename="./cosxsx.png" :exports results indexNames = df[(~df["Country/Region"].isin(countries)) |
((df["Country/Region"] == "China") & (df["Province/State"] != "Hong Kong")) |
((df["Country/Region"].isin([c for c in countries if c !="China"])) & (~df["Province/State"].isnull()))
].index
df.drop(indexNames , inplace=True)
#+end_src
On remet dans la table de donnees les regions de Chine regroupees (a
l'exception d'Hong Kong)
#+begin_src python :results silent :session :exports both
df = df.append(china_regions, ignore_index=True)
#+end_src
** Affichage des donnees (echelle lineaire)
Affichage de la table de donnees avec une echelle lineaire
Nom du plot lineaire :
#+NAME: plot_linear_emacs
- plot-linear.png
#+begin_src python :results value file :session :export both :var plot_linear=plot_linear_emacs
import matplotlib.pyplot as plt import matplotlib.pyplot as plt
plt.figure(figsize=(10,5)) for i in range(len(df)):
plt.plot(x,numpy.cos(x)/x) df.iloc[i]["1/22/20":].plot()
plt.tight_layout()
plt.savefig(matplot_lib_filename) plt.legend(df["Country/Region"])
print(matplot_lib_filename) plt.savefig(plot_linear[0])
plot_linear[0]
#+end_src #+end_src
#+RESULTS: #+RESULTS:
[[file:./cosxsx.png]] [[file:plot-linear.png]]
Vous remarquerez le paramètre ~:exports results~ qui indique que le code ** Affichage des donnees (echelle logarithmique)
ne doit pas apparaître dans la version finale du document. Nous vous
recommandons dans le cadre de ce MOOC de ne pas changer ce paramètre Affichage de la table de donnees avec une echelle logarithmique
(indiquer ~both~) car l'objectif est que vos analyses de données soient
parfaitement transparentes pour être reproductibles. Nom du plot logarithmique :
#+NAME: plot_log_emacs
Attention, la figure ainsi générée n'est pas stockée dans le document - plot-log.png
org. C'est un fichier ordinaire, ici nommé ~cosxsx.png~. N'oubliez pas
de le committer si vous voulez que votre analyse soit lisible et #+begin_src python :results value file :session :export both :var plot_log=plot_log_emacs
compréhensible sur GitLab. plt.yscale("log")
plt.savefig(plot_log[0])
Enfin, n'oubliez pas que nous vous fournissons dans les ressources de plot_log[0]
ce MOOC une configuration avec un certain nombre de raccourcis #+end_src
claviers permettant de créer rapidement les blocs de code python (en
faisant ~<p~, ~<P~ ou ~<PP~ suivi de ~Tab~). #+RESULTS:
[[file:plot-log.png]]
Maintenant, à vous de jouer! Vous pouvez effacer toutes ces
informations et les remplacer par votre document computationnel.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment