@@ -91,14 +91,14 @@ Quelle est l'année avec l'épidémie la plus faible ?
# Etude de l'Avare de Molière
Ouvre l'URL et lit le contenu en tant que fichier texte
```
```python
withurllib.request.urlopen(url)asresponse:
# Lit les données depuis l'URL
```
Parcourt chaque partie du texte
```
```python
forpartieinparties_texte:
lignes=partie.strip().splitlines()# Divise la partie en lignes
compteur_occurrences=0# Compteur d'occurrences pour cette partie
...
...
@@ -106,7 +106,7 @@ for partie in parties_texte:
et c'est la même chose pour les lignes
Pour récupérer le contenu d'un fichier texte via une URL on peut utiliser la fonction suivante:
```
```python
defget_text_from_url(url):
response=requests.get(url)
ifresponse.status_code==200:
...
...
@@ -137,7 +137,7 @@ Ensuite on attribu à l'url que l'on traite le nom plus simple url
Puis on lit en fichier txt, et on utilise io pour extraire les données du texte que l'on nomme donc texte.
```
```python
%matplotlib inline
import numpy as np
...
...
@@ -167,7 +167,7 @@ Dans un premiers temps on definit tous les Noms que l'on va aller chercher dans
```
```python
mot_a_chercher = "HARPAGON."
#mot_a_chercher = "VALÈRE."
#mot_a_chercher = "ÉLISE."
...
...
@@ -184,7 +184,7 @@ mot_a_chercher = "HARPAGON."
```
```
```python
#Compteur pour stocker le nombre d'occurrences du mot
compteurs_occurrences = []
...
...
@@ -192,7 +192,7 @@ compteurs_occurrences = []
On créer un compteur qui va nous permettre de stocker les différents nombres d'occurences.
```
```python
#Ouvre l'URL et lit le contenu en tant que fichier texte
with urllib.request.urlopen(url) as response:
...
...
@@ -204,7 +204,7 @@ Ici on ouvre le fichier et on lit le contenu puis on le divise grâce à l'encod
```
```python
#Parcourt chaque partie du texte
for partie in parties_texte:
lignes = partie.strip().splitlines() # Divise la partie en lignes
...
...
@@ -235,7 +235,7 @@ C'est un peu long mais on a pas trouver d'autres moyens (ça peut être optimis
```
```python
personnages=["HARPAGON", "VALÈRE", "ÉLISE", "CLÉANTE", "LA FLÈCHE", "MARIANE", "ANSELME", "FROSINE", "MAÎTRE SIMON", "MAÎTRE JACQUES", "BRINDAVOINE", "LA MERLUCHE", "LE COMMISSAIRE"]
partie1=[0,8,8,0,0,0,0,0,0,0,0,0,0]
partie2=[0,0,9,10,0,0,0,0,0,0,0,0,0]
...
...
@@ -281,7 +281,7 @@ Pour savoir comment marche la fonction qui trace les camenberts aller voir: [fon
```
```python
%matplotlib notebook
...
...
@@ -291,7 +291,7 @@ plt.gcf().subplots_adjust(left = 0.2, bottom = 0.2, right = 0.9, top = 0.9, wspa
Pour tracer les camenberts relatifs à toutes les parties du texte on utilise des boucle pour ce faciliter la tache, et on décide de regrouper ces camenbert par 8 (les 8 lignes en dessous de la boucles) dans une figure et donc d'avoir au total 4 (les 4 boucles) figures (car on a 32 parties), dans la boucle on associe un graphique camenbert à chacune des parties.
Sur ces camenberts j'ai choisit d'afficher le pourcentages de paroles de chaque l'occuteur de la scène, cela ce fait avec les paramètre de la fonction .pie; labels=personnages donne les noms et autopct = lambda x: str(round(x, 2)) + '%' donne le pourcentage de parole.
```
```python
foriinrange(2):
forjinrange(4):
axs[i,j].set_title(f'Scène {i * 4 + j + 1}')
...
...
@@ -396,7 +396,7 @@ On veut maintenant afficher les résultat brut du nombre d'ocurrence par personn
La technique suivante n'est pas optimiser mais fonctionne, pour sélectionner le nombre de prise de parole d'un personnage en particulier on décommente (on enlève # devant le nom du perso) la ligne qui lui est associé. Dans l'exemple ci-dessous on va afficher les prises de parole de Valère.
```
```python
#mot_a_chercher = "HARPAGON."
mot_a_chercher = "VALÈRE."
#mot_a_chercher = "ÉLISE."
...
...
@@ -416,7 +416,7 @@ On définit une fonction qui récupère le texte via l'url définit précédemen
```
```python
#Fonction pour récupérer le contenu du fichier texte à partir d'une URL
def get_text_from_url(url):
response = requests.get(url)
...
...
@@ -429,7 +429,7 @@ def get_text_from_url(url):
Ensuite on récupere les données du texte par cette ligne.
```
```python
#Récupère le contenu du fichier texte à partir de l'URL
Enfin on defini la fonction qui va nous afficher le nombres de prise de parole, on définit les ligne en utiliasnt .lower().splitlines() qui découpe le texte en ligne, puis on fais la somme de chaque occurences trouvée avec la fonction sum() (qui fait la somme des itérables), puis on affiche enfin le résultat par par la commande print() qui affiche sur la console ce qu'on lui demande. Dans notre cas ce sera "Le nom Valère apparait seul X fois dans l'oeuvre"
```
```python
#Vérifie combien de fois le mot apparaît seul sur une ligne dans le texte (en ignorant la casse)
iftext_content:
...
...
@@ -464,7 +464,7 @@ Pour afficher cela j'utilise ensuite matplotlib.pyplot: