Commit 0b524ce9 authored by Emile Siboulet's avatar Emile Siboulet

fonctionnement

parent 370df9fa
This source diff could not be displayed because it is too large. You can view the blob instead.
This diff is collapsed.
......@@ -52,9 +52,6 @@ Les différentes expressions régulières permettent le découpage du texte comm
import re # librarie standard d'analyse regex
texte = texte.replace(" ", "@") # Pour remplacer les tabulation par des @ pour simplifier le parçage
f = open("data2.md", "w")
f.write(texte)
f.close()
reScene = re.compile(r'\#\#\#[^\.]+([^\#]+)')
reReplique = re.compile(r'@([^\.^\,^\*]+)(\.| \*[^\.]+)([^\@]+)')
reMot = re.compile(r'\w+')
......@@ -75,6 +72,8 @@ print(Scenes[16][3]) # vérification visuel des données
#+RESULTS:
: ('HARPAGON', ['voilà', 'un', 'compliment', 'bien', 'impertinent', 'quelle', 'belle', 'confession', 'à', 'lui', 'faire'])
* Étude statistique
Il ne reste plus qu'à compter les différents mots pour avoir le résultat attendu.
#+begin_src python :results output :session :exports both
......@@ -108,6 +107,8 @@ print('\nListe des scenes :', ListeScenes)
: Liste des scenes : ['Scene 0', 'Scene 1', 'Scene 2', 'Scene 3', 'Scene 4', 'Scene 5', 'Scene 6', 'Scene 7', 'Scene 8', 'Scene 9', 'Scene 10', 'Scene 11', 'Scene 12', 'Scene 13', 'Scene 14', 'Scene 15', 'Scene 16', 'Scene 17', 'Scene 18', 'Scene 19', 'Scene 20', 'Scene 21', 'Scene 22', 'Scene 23', 'Scene 24', 'Scene 25', 'Scene 26', 'Scene 27', 'Scene 28', 'Scene 29', 'Scene 30', 'Scene 31']
Nous allons maintenant placer ces différentes informations dans un tableau pandas
* Export graphique des résultats
#+begin_src python :results output :session :exports both
import pandas as pd
df = pd.DataFrame(columns=ListePersonnages, index=ListeScenes).fillna(0)
......@@ -158,7 +159,7 @@ Scene 31 0 114 0 90 0 23
Nous allons maintenant afficher les différents résultats avec MatPlotLib
#+begin_src python :session
#+begin_src python :results output :session :exports both
import matplotlib.pyplot as plt
import numpy as np
......@@ -176,6 +177,7 @@ plt.savefig("fig.svg")
#+end_src
#+RESULTS:
: None
Ce qui nous donne le graphique suivant. Il représente le nombre de mot en fonction de la scène des différents personnages
[[file:./fig.svg]]
This diff is collapsed.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment