Commit 8d751acb authored by Émile Jetzer's avatar Émile Jetzer 🎱

Exo. 2: fait trop vite, manque des étapes de l'analyse, dont le repérage des...

Exo. 2: fait trop vite, manque des étapes de l'analyse, dont le repérage des maxs et mins dans l'année.
parent 89143663
This diff is collapsed.
This diff is collapsed.
This diff is collapsed.
#+TITLE: Votre titre #+TITLE: Incidence annuelle de la varicelle
#+AUTHOR: Votre nom #+AUTHOR: Émile Jetzer
#+DATE: La date du jour #+DATE: 2020-05-18
#+LANGUAGE: fr #+LANGUAGE: fr
# #+PROPERTY: header-args :eval never-export # #+PROPERTY: header-args :eval never-export
...@@ -11,83 +11,127 @@ ...@@ -11,83 +11,127 @@
#+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/lib/js/jquery.stickytableheaders.js"></script> #+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/lib/js/jquery.stickytableheaders.js"></script>
#+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/readtheorg/js/readtheorg.js"></script> #+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/readtheorg/js/readtheorg.js"></script>
* Quelques explications * Incidence annuelle de la varicelle
Ceci est un document org-mode avec quelques exemples de code ** Obtention des données
python. Une fois ouvert dans emacs, ce document peut aisément être
exporté au format HTML, PDF, et Office. Pour plus de détails sur
org-mode vous pouvez consulter https://orgmode.org/guide/.
Lorsque vous utiliserez le raccourci =C-c C-e h o=, ce document sera #+NAME: fichier_loin
compilé en html. Tout le code contenu sera ré-exécuté, les résultats https://www.sentiweb.fr/datasets/incidence-PAY-7.csv
récupérés et inclus dans un document final. Si vous ne souhaitez pas
ré-exécuter tout le code à chaque fois, il vous suffit de supprimer
le # et l'espace qui sont devant le ~#+PROPERTY:~ au début de ce
document.
Comme nous vous l'avons montré dans la vidéo, on inclue du code #+NAME: fichier_local
python de la façon suivante (et on l'exécute en faisant ~C-c C-c~): donnees.csv
#+begin_src python :results output :exports both #+BEGIN_SRC python :session "Python" :results output :var local=fichier_local loin=fichier_loin :exports none
print("Hello world!") import pandas as pd
#+end_src from urllib.request import urlopen
from pathlib import Path
fichier_local = Path(local)
# Pour enlever le fichier local au besoin
# fichier_local.unlink()
if not fichier_local.exists():
print('Le fichier n\'existe pas...')
t = urlopen(loin)
print('Télécharger...')
with fichier_local.open('w') as f:
f.write(t.read().decode('latin-1'))
print('Téléchargé.')
else:
print('Le fichier local existait déjà.')
assert fichier_local.exists()
#+END_SRC
#+RESULTS: #+RESULTS:
: Hello world! : Le fichier local existait déjà.
:
:
#+BEGIN_SRC python :session "Python" :results value :var local=fichier_local
df = pd.read_csv(local, header=1, usecols=['week', 'inc'], skiprows=0)
df.head()
#+END_SRC
#+RESULTS:
: week inc
: 0 202019 319
: 1 202018 849
: 2 202017 272
: 3 202016 758
: 4 202015 1918
** Préparer les données
#+BEGIN_SRC python :session "Python" :results silent
def année(semaine):
return int(str(semaine)[:4])
assert année('202019')
#+END_SRC
#+BEGIN_SRC python :session "Python" :results output
df.loc[:, 'annee'] = df.week.apply(année)
résumé = df.loc[:, ['annee', 'inc']].groupby('annee').sum()
# S'assurer de compter des années complètes
nbr_semaines = df.groupby('annee').size()
résumé = résumé.loc[nbr_semaines > 50, :]
Voici la même chose, mais avec une session python, donc une print(résumé)
persistance d'un bloc à l'autre (et on l'exécute toujours en faisant #+END_SRC
~C-c C-c~).
#+begin_src python :results output :session :exports both
import numpy
x=numpy.linspace(-15,15)
print(x)
#+end_src
#+RESULTS: #+RESULTS:
#+begin_example #+begin_example
[-15. -14.3877551 -13.7755102 -13.16326531 -12.55102041 inc
-11.93877551 -11.32653061 -10.71428571 -10.10204082 -9.48979592 annee
-8.87755102 -8.26530612 -7.65306122 -7.04081633 -6.42857143 1991 656000
-5.81632653 -5.20408163 -4.59183673 -3.97959184 -3.36734694 1992 843500
-2.75510204 -2.14285714 -1.53061224 -0.91836735 -0.30612245 1993 593435
0.30612245 0.91836735 1.53061224 2.14285714 2.75510204 1994 660418
3.36734694 3.97959184 4.59183673 5.20408163 5.81632653 1995 654598
6.42857143 7.04081633 7.65306122 8.26530612 8.87755102 1996 632212
9.48979592 10.10204082 10.71428571 11.32653061 11.93877551 1997 624302
12.55102041 13.16326531 13.7755102 14.3877551 15. ] 1998 785055
1999 646022
2000 646617
2001 563415
2002 589547
2003 678928
2004 850765
2005 654446
2006 557905
2007 778119
2008 738993
2009 875937
2010 766478
2011 642034
2012 676971
2013 658318
2014 648607
2015 649742
2016 730003
2017 556580
2018 561400
2019 540874
>>> >>>
#+end_example #+end_example
Et enfin, voici un exemple de sortie graphique: ** Obtenir la pire et la meilleure années
#+begin_src python :results output file :session :var matplot_lib_filename="./cosxsx.png" :exports results
import matplotlib.pyplot as plt
plt.figure(figsize=(10,5)) #+BEGIN_SRC python :session "Python" :results output
plt.plot(x,numpy.cos(x)/x) pire_année = résumé.idxmax()
plt.tight_layout() meilleure_année = résumé.idxmin()
plt.savefig(matplot_lib_filename) print('Pire année:', pire_année)
print(matplot_lib_filename) print('Meilleure année:', meilleure_année)
#+end_src #+END_SRC
#+RESULTS: #+RESULTS:
[[file:./cosxsx.png]] : Pire année: inc 2009
: dtype: int64
Vous remarquerez le paramètre ~:exports results~ qui indique que le code : Meilleure année: inc 2019
ne doit pas apparaître dans la version finale du document. Nous vous : dtype: int64
recommandons dans le cadre de ce MOOC de ne pas changer ce paramètre : >>>
(indiquer ~both~) car l'objectif est que vos analyses de données soient
parfaitement transparentes pour être reproductibles.
Attention, la figure ainsi générée n'est pas stockée dans le document
org. C'est un fichier ordinaire, ici nommé ~cosxsx.png~. N'oubliez pas
de le committer si vous voulez que votre analyse soit lisible et
compréhensible sur GitLab.
Enfin, n'oubliez pas que nous vous fournissons dans les ressources de
ce MOOC une configuration avec un certain nombre de raccourcis
claviers permettant de créer rapidement les blocs de code python (en
faisant ~<p~, ~<P~ ou ~<PP~ suivi de ~Tab~).
Maintenant, à vous de jouer! Vous pouvez effacer toutes ces
informations et les remplacer par votre document computationnel.
#+TITLE: Votre titre
#+AUTHOR: Votre nom
#+DATE: La date du jour
#+LANGUAGE: fr
# #+PROPERTY: header-args :eval never-export
#+HTML_HEAD: <link rel="stylesheet" type="text/css" href="http://www.pirilampo.org/styles/readtheorg/css/htmlize.css"/>
#+HTML_HEAD: <link rel="stylesheet" type="text/css" href="http://www.pirilampo.org/styles/readtheorg/css/readtheorg.css"/>
#+HTML_HEAD: <script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.3/jquery.min.js"></script>
#+HTML_HEAD: <script src="https://maxcdn.bootstrapcdn.com/bootstrap/3.3.4/js/bootstrap.min.js"></script>
#+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/lib/js/jquery.stickytableheaders.js"></script>
#+HTML_HEAD: <script type="text/javascript" src="http://www.pirilampo.org/styles/readtheorg/js/readtheorg.js"></script>
* Quelques explications
Ceci est un document org-mode avec quelques exemples de code
python. Une fois ouvert dans emacs, ce document peut aisément être
exporté au format HTML, PDF, et Office. Pour plus de détails sur
org-mode vous pouvez consulter https://orgmode.org/guide/.
Lorsque vous utiliserez le raccourci =C-c C-e h o=, ce document sera
compilé en html. Tout le code contenu sera ré-exécuté, les résultats
récupérés et inclus dans un document final. Si vous ne souhaitez pas
ré-exécuter tout le code à chaque fois, il vous suffit de supprimer
le # et l'espace qui sont devant le ~#+PROPERTY:~ au début de ce
document.
Comme nous vous l'avons montré dans la vidéo, on inclue du code
python de la façon suivante (et on l'exécute en faisant ~C-c C-c~):
#+begin_src python :results output :exports both
print("Hello world!")
#+end_src
#+RESULTS:
: Hello world!
Voici la même chose, mais avec une session python, donc une
persistance d'un bloc à l'autre (et on l'exécute toujours en faisant
~C-c C-c~).
#+begin_src python :results output :session :exports both
import numpy
x=numpy.linspace(-15,15)
print(x)
#+end_src
#+RESULTS:
#+begin_example
[-15. -14.3877551 -13.7755102 -13.16326531 -12.55102041
-11.93877551 -11.32653061 -10.71428571 -10.10204082 -9.48979592
-8.87755102 -8.26530612 -7.65306122 -7.04081633 -6.42857143
-5.81632653 -5.20408163 -4.59183673 -3.97959184 -3.36734694
-2.75510204 -2.14285714 -1.53061224 -0.91836735 -0.30612245
0.30612245 0.91836735 1.53061224 2.14285714 2.75510204
3.36734694 3.97959184 4.59183673 5.20408163 5.81632653
6.42857143 7.04081633 7.65306122 8.26530612 8.87755102
9.48979592 10.10204082 10.71428571 11.32653061 11.93877551
12.55102041 13.16326531 13.7755102 14.3877551 15. ]
#+end_example
Et enfin, voici un exemple de sortie graphique:
#+begin_src python :results output file :session :var matplot_lib_filename="./cosxsx.png" :exports results
import matplotlib.pyplot as plt
plt.figure(figsize=(10,5))
plt.plot(x,numpy.cos(x)/x)
plt.tight_layout()
plt.savefig(matplot_lib_filename)
print(matplot_lib_filename)
#+end_src
#+RESULTS:
[[file:./cosxsx.png]]
Vous remarquerez le paramètre ~:exports results~ qui indique que le code
ne doit pas apparaître dans la version finale du document. Nous vous
recommandons dans le cadre de ce MOOC de ne pas changer ce paramètre
(indiquer ~both~) car l'objectif est que vos analyses de données soient
parfaitement transparentes pour être reproductibles.
Attention, la figure ainsi générée n'est pas stockée dans le document
org. C'est un fichier ordinaire, ici nommé ~cosxsx.png~. N'oubliez pas
de le committer si vous voulez que votre analyse soit lisible et
compréhensible sur GitLab.
Enfin, n'oubliez pas que nous vous fournissons dans les ressources de
ce MOOC une configuration avec un certain nombre de raccourcis
claviers permettant de créer rapidement les blocs de code python (en
faisant ~<p~, ~<P~ ou ~<PP~ suivi de ~Tab~).
Maintenant, à vous de jouer! Vous pouvez effacer toutes ces
informations et les remplacer par votre document computationnel.
This diff is collapsed.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment