# Analyse des dialogues dans _L'Avare_ de Molière

In [1]:
%matplotlib inline
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
import xml

Le texte de _l'Avare_ est disponible sur le site de [l'Observatoire de la vie littéraire (OBVIL)](http://obvil.sorbonne-universite.site/obvil/presentation).
Pour cette analyse, nous prenons la [version XML/TEI](http://dramacode.github.io/moliere/moliere_avare.xml).

In [2]:
data_url = "http://dramacode.github.io/moliere/moliere_avare.xml"
data_file = "moliere_avare.xml"

import os
import urllib.request
if not os.path.exists(data_file):
    urllib.request.urlretrieve(data_url, data_file)

In [3]:
import xml.etree.ElementTree as ET
tree = ET.parse(data_file)
root = tree.getroot()
print(root.tag, root.attrib)

{http://www.tei-c.org/ns/1.0}TEI {'{http://www.w3.org/XML/1998/namespace}lang': 'fr'}


In [4]:
ET.register_namespace('ns', 'http://www.tei-c.org/ns/1.0')

Dictionnaire des rôles avec identifiants et noms en langage courant :

In [5]:
roles = {element.get('{http://www.w3.org/XML/1998/namespace}id'): element.text
         for element in root.iter("{http://www.tei-c.org/ns/1.0}role")}
print(roles)

{'harpagon': 'Harpagon', 'cleante': 'Cléante', 'elise': 'Élise', 'valere': 'Valère', 'mariane': 'Mariane', 'anselme': 'Anselme', 'frosine': 'Frosine', 'maitre-simon': 'Maitre Simon', 'maitre-jacques': 'Maitre Jacques', 'la-fleche': 'La Flèche', 'dame-claude': 'Dame Claude', 'brindavoine': 'Brindavoine', 'la-merluche': 'La Merluche', 'commissaire': 'Le commissaire'}


In [6]:
#print(ET.tostring(root, encoding="unicode", method="text")) # Affichage du document en mode texte
#print(root.findall("."))
for child in root:
    print("tag :", child.tag, " attributes :", child.attrib)

tag : {http://www.tei-c.org/ns/1.0}teiHeader  attributes : {}
tag : {http://www.tei-c.org/ns/1.0}text  attributes : {}


Liste des personnages par scène, à partir des _indications de scène_ :

In [7]:
#for scene in root.findall(".//{http://www.tei-c.org/ns/1.0}div2"):
#    for st in scene.find("./{http://www.tei-c.org/ns/1.0}stage"):
#        print(st.text)
for scene in root.findall(".//{http://www.tei-c.org/ns/1.0}div2"):
#    for st in scene.find("./{http://www.tei-c.org/ns/1.0}stage"):
    print(scene.get('{http://www.w3.org/XML/1998/namespace}id'), scene[1].text)

I01 Valère, Élise
I02 Cléante, Élise
I03 Harpagon, La Flèche
I04 Élise, Cléante, Harpagon
I05 Valère, Harpagon, Élise
II01 Cléante, La Flèche
II02 Maître Simon, Harpagon, Cléante, La Flèche
II03 Frosine, Harpagon
II04 La Flèche, Frosine
II05 Harpagon, Frosine
III01 Harpagon, Cléante, Élise, Valère, Dame Claude, Maître Jacques, Brindavoine, La Merluche
III02 Maître Jacques, Valère
III03 Frosine, Mariane, Maître Jacques
III04 Mariane, Frosine
III05 Harpagon, Frosine, Mariane
III06 Élise, Harpagon, Mariane, Frosine
III07 Cléante, Harpagon, Élise, Mariane, Frosine
III08 Harpagon, Mariane, Frosine, Cléante, Brindavoine, Élise
III09 Harpagon, Mariane, Cléante, Élise, Frosine, La Merluche
IV01 Cléante, Mariane, Élise, Frosine
IV02 Harpagon, Cléante, Mariane, Élise, Frosine
IV03 Harpagon, Cléante
IV04 Maître Jacques, Harpagon, Cléante
IV05 Cléante, Harpagon
IV06 La Flèche, Cléante
IV07 
            
V01 Harpagon, Le Commissaire, son Clerc
V02 Maître Jacques, Harpagon, Le Commissaire, son Clerc

Liste des rôles dans chaque scène, à partir des _prises de parole_ :

In [8]:
roles_par_scenes ={scene.get('{http://www.w3.org/XML/1998/namespace}id'):
               {sp.get('who') for sp in scene.findall("./{http://www.tei-c.org/ns/1.0}sp")}
               for sp in scene.findall("./{http://www.tei-c.org/ns/1.0}sp")
               for scene in root.findall(".//{http://www.tei-c.org/ns/1.0}div2")}
print(roles_par_scenes)
#for scene in root.findall(".//{http://www.tei-c.org/ns/1.0}div2"):
#    liste_roles = {sp.get('who') for sp in scene.findall("./{http://www.tei-c.org/ns/1.0}sp")}
#    print(scene.get('{http://www.w3.org/XML/1998/namespace}id'), liste_roles)

{'I01': {'valere', 'elise'}, 'I02': {'cleante', 'elise'}, 'I03': {'la-fleche', 'harpagon'}, 'I04': {'cleante', 'elise', 'harpagon'}, 'I05': {'valere', 'elise', 'harpagon'}, 'II01': {'cleante', 'la-fleche'}, 'II02': {'cleante', 'maitre-simon', 'la-fleche', 'harpagon'}, 'II03': {'frosine', 'harpagon'}, 'II04': {'frosine', 'la-fleche'}, 'II05': {'frosine', 'harpagon'}, 'III01': {'brindavoine', 'cleante', 'la-merluche', 'harpagon', 'maitre-jacques', 'valere', 'elise'}, 'III02': {'maitre-jacques', 'valere'}, 'III03': {'frosine', 'maitre-jacques'}, 'III04': {'frosine', 'mariane'}, 'III05': {'frosine', 'harpagon'}, 'III06': {'frosine', 'mariane', 'elise', 'harpagon'}, 'III07': {'frosine', 'cleante', 'harpagon', 'valere', 'mariane'}, 'III08': {'brindavoine', 'harpagon'}, 'III09': {'la-merluche', 'cleante', 'valere', 'harpagon'}, 'IV01': {'frosine', 'cleante', 'mariane', 'elise'}, 'IV02': {'cleante', 'elise', 'harpagon'}, 'IV03': {'cleante', 'harpagon'}, 'IV04': {'cleante', 'maitre-jacques', 'h

In [9]:
for element in root.iter("{http://www.tei-c.org/ns/1.0}div1"):
    print(element[0].text)

Acte Premier
Acte II
Acte III 
Acte IV
Acte V


In [10]:
for element in root.iter("{http://www.tei-c.org/ns/1.0}div2"):
    print(element.attrib)

{'type': 'scene', 'n': '1', '{http://www.w3.org/XML/1998/namespace}id': 'I01'}
{'type': 'scene', 'n': '2', '{http://www.w3.org/XML/1998/namespace}id': 'I02'}
{'type': 'scene', 'n': '3', '{http://www.w3.org/XML/1998/namespace}id': 'I03'}
{'type': 'scene', 'n': '4', '{http://www.w3.org/XML/1998/namespace}id': 'I04'}
{'type': 'scene', 'n': '5', '{http://www.w3.org/XML/1998/namespace}id': 'I05'}
{'type': 'scene', 'n': '1', '{http://www.w3.org/XML/1998/namespace}id': 'II01'}
{'type': 'scene', 'n': '2', '{http://www.w3.org/XML/1998/namespace}id': 'II02'}
{'type': 'scene', 'n': '3', '{http://www.w3.org/XML/1998/namespace}id': 'II03'}
{'type': 'scene', 'n': '4', '{http://www.w3.org/XML/1998/namespace}id': 'II04'}
{'type': 'scene', 'n': '5', '{http://www.w3.org/XML/1998/namespace}id': 'II05'}
{'type': 'scene', 'n': '1', '{http://www.w3.org/XML/1998/namespace}id': 'III01'}
{'type': 'scene', 'n': '2', '{http://www.w3.org/XML/1998/namespace}id': 'III02'}
{'type': 'scene', 'n': '3', '{http://www.w3

Fonction permettant de compter le nombre de mots dans une phrase, en écartant tous les séparateurs (ponctuation, saut à la ligne, tirets, etc.).

In [11]:
def compte_mots(texte):
    SEPARATEURS = """\n\t .?!,;:-_'"()[]{}+*/=<>"""
    nbMots = 0
    sepAvant = True
    for c in texte:
        if c in SEPARATEURS:
            sepAvant = True
        else:
            if sepAvant == True:
                nbMots += 1
            sepAvant = False
    return nbMots

In [12]:
for sentence in root.iter("{http://www.tei-c.org/ns/1.0}s"):
    if sentence.text:
        print(sentence.text, len(sentence.text.split()), compte_mots(sentence.text))

Hé quoi, charmante Élise, vous devenez mélancolique, après les obligeantes assurances que vous avez eu la bonté de me donner de votre foi ? 24 23
Je vous vois soupirer, hélas, au milieu de ma joie ! 11 10
Est-ce du regret, dites-moi, de m'avoir fait heureux ? et vous repentez-vous de cet engagement où mes feux ont pu vous contraindre ?  23 25
Non, Valère, je ne puis pas me repentir de tout ce que je fais pour vous.  16 16
Je m'y sens entraîner par une trop douce puissance, et je n'ai pas même la force de souhaiter que les choses ne fussent pas.  24 26
Mais, à vous dire vrai, le succès me donne de l'inquiétude ; et je crains fort de vous aimer un peu plus que je ne devrais.  26 26
Hé que pouvez-vous craindre, Élise, dans les bontés que vous avez pour moi ? 14 14
Hélas ! cent choses à la fois : L'emportement d'un Père ; les reproches d'une Famille ; les censures du monde ; mais plus que tout, Valère, le changement de votre cœur ; et cette froideur criminelle dont ceux de votre Sexe payen

Ce que je viens de dire.  6 6
Non.  1 1
Si fait, si fait.  4 4
Pardonnez-moi.  1 2
Je vois bien que vous en avez ouï quelques mots.  10 10
C'est que je m'entretenais en moi-même de la peine qu'il y a aujourd'hui à trouver de l'argent ; et je disais, qu'il est bienheureux qui peut avoir dix mille écus chez soi.  32 38
Nous feignions à vous aborder, de peur de vous interrompre.  10 10
Je suis bien aise de vous dire cela, afin que vous n'alliez pas prendre les choses de travers, et vous imaginer que je dise que c'est moi qui ai dix mille écus.  32 34
Nous n'entrons point dans vos affaires.  6 7
Plût à Dieu que je les eusse dix mille écus !  11 10
Je ne crois pas… 4 4
Ce serait une bonne affaire pour moi.  7 7
Ce sont des choses… 4 4
J'en aurais bon besoin.  4 5
Je pense que… 3 3
Cela m'accommoderait fort.  3 4
Vous êtes… 2 2
Et je ne me plaindrais pas, comme je fais, que le temps est misérable.  14 14
Mon Dieu, mon Père, vous n'avez pas lieu de vous plaindre ; et l'on sait que vous avez a

Voilà qui décide tout, cela s'entend.  6 7
Il y a des gens qui pourraient vous dire qu'en de telles occasions l'inclination d'une Fille est une chose sans doute où l'on doit avoir de l'égard ; et que cette grande inégalité d'âge, d'humeur, et de sentiments, rend un mariage sujet à des accidents très fâcheux.  47 53
Sans dot.  2 2
Ah ! il n'y a pas de réplique à cela. 10 10
On le sait bien. 4 4
Qui diantre peut aller là contre ?  7 6
Ce n'est pas qu'il n'y ait quantité de Pères qui aimeraient mieux ménager la satisfaction de leurs Filles, que l'argent qu'ils pourraient donner ; qui ne les voudraient point sacrifier à l'intérêt, et chercheraient plus que toute autre chose, à mettre dans un mariage cette douce conformité qui sans cesse y maintient l'honneur, la tranquillité, et la joie ; et que… 61 66
Sans dot.  2 2
Il est vrai. 3 3
Cela ferme la bouche à tout,  6 6
Le moyen de résister à une raison comme celle-là ?  10 10
Ouais. Il me semble que j'entends un Chien qui aboie.  10 11
N'est

Monsieur est la Personne qui veut vous emprunter les quinze mille livres dont je vous ai parlé.  17 17
Comment, pendard, c'est toi qui t'abandonnes à ces coupables extrémités ?  11 12
Comment, mon Père, c'est vous qui vous portez à ces honteuses actions ?  13 13
C'est toi qui te veux ruiner par des emprunts si condamnables ?  12 12
C'est vous qui cherchez à vous enrichir par des usures si criminelles ?  13 13
Oses-tu bien, après cela, paraître devant moi ?  8 8
Osez-vous bien, après cela, vous présenter aux yeux du monde ?  11 11
N'as-tu point de honte, dis-moi, d'en venir à ces débauches-là ? de te précipiter dans des dépenses effroyables ? et de faire une honteuse dissipation du bien que tes Parents t'ont amassé avec tant de sueurs ?  37 40
Ne rougissez-vous point, de déshonorer votre condition, par les commerces que vous faites ? de sacrifier gloire et réputation, au désir insatiable d'entasser écu sur écu ? et de renchérir, en fait d'intérêts, sur les plus infâmes subtilités qu'aie

Elle ?  2 1
Oui, elle.  2 2
Je voudrais que vous l'eussiez entendue parler là-dessus.  8 10
Elle ne peut souffrir du tout la vue d'un jeune Homme ; mais elle n'est point plus ravie, dit-elle, que lorsqu'elle peut voir un beau Vieillard avec une barbe majestueuse.  30 33
Les plus vieux sont pour elle les plus charmants, et je vous avertis de n'aller pas vous faire plus jeune que vous êtes.  23 24
Elle veut tout au moins qu'on soit sexagénaire ; et il n'y a pas quatre mois encore, qu'étant prête d'être mariée, elle rompit tout net le mariage, sur ce que son Amant fit voir qu'il n'avait que cinquante-six ans, et qu'il ne prit point de lunettes pour signer le contrat.  50 57
Sur cela seulement ?  4 3
Oui.  1 1
Elle dit que ce n'est pas contentement pour elle que cinquante-six ans ; et surtout, elle est pour les nez qui portent des lunettes.  24 25
Certes, tu me dis là une chose toute nouvelle.  9 9
Cela va plus loin qu'on ne vous peut dire.  9 10
On lui voit dans sa Chambre quelques Tablea

L'un dit que vous faites imprimer des Almanachs particuliers, où vous faites doubler les Quatre-temps, et les vigiles, afin de profiter des jeûnes, où vous obligez votre monde.  28 30
L'autre, que vous avez toujours une querelle toute prête à faire à vos valets dans le temps des Étrennes, ou de leur sortie d'avec vous, pour vous trouver une raison de ne leur donner rien.  35 37
Celui-là conte qu'une fois vous fîtes assigner le Chat d'un de vos Voisins, pour vous avoir mangé un reste d'un gigot de Mouton.  23 27
Celui-ci, que l'on vous surprit une nuit, en venant dérober vous-même l'avoine de vos Chevaux ; et que votre cocher, qui était celui d'avant moi, vous donna dans l'obscurité je ne sais combien de coups de bâton dont vous ne voulûtes rien dire.  43 48
Enfin voulez-vous que je vous dise, on ne saurait aller nulle part où l'on ne vous entende accommoder de toutes pièces. 21 23
Vous êtes la fable et la risée de tout le monde, et jamais on ne parle de vous, que sous les noms d'avare,

Elle a raison. 3 3
À sot compliment, il faut une réponse de même.  9 9
Je vous demande pardon, ma Belle, de l'impertinence de mon Fils.  11 12
C'est un jeune sot, qui ne sait pas encore la conséquence des paroles qu'il dit.  15 17
Je vous promets que ce qu'il m'a dit ne m'a point du tout offensée ; au contraire, il m'a fait plaisir de m'expliquer ainsi ses véritables sentiments.  27 31
J'aime de lui un aveu de la sorte ; et s'il avait parlé d'autre façon, je l'en estimerais bien moins.  20 23
C'est beaucoup de bonté à vous, de vouloir ainsi excuser ses fautes.  12 13
Le temps le rendra plus sage, et vous verrez qu'il changera de sentiments.  13 14
Non, mon Père, je ne suis point capable d'en changer ; et je prie instamment Madame de le croire.  19 19
Mais voyez quelle extravagance !  5 4
Il continue encore plus fort.  5 5
Voulez-vous que je trahisse mon cœur ?  7 7
Encore ?  2 1
Avez-vous envie de changer de discours ?  7 7
Hé bien, puisque vous voulez que je parle d'autre façon ; souf

Ô çà, intérêt de Belle-Mère à part, que te semble à toi de cette Personne ?  16 16
Ce qui m'en semble ?  5 5
Oui, de son air, de sa taille, de sa beauté, de son esprit ?  14 13
Là, là.  2 2
Mais encore ?  3 2
À vous en parler franchement, je ne l'ai pas trouvée ici ce que je l'avais crue.  16 18
Son air est de franche Coquette ; sa taille est assez gauche, sa beauté très médiocre, et son esprit des plus communs.  22 21
Ne croyez pas que ce soit, mon Père, pour vous en dégoûter ; car Belle-Mère pour Belle-Mère, j'aime autant celle-là qu'une autre.  22 26
Tu lui disais tantôt pourtant… 5 5
Je lui ai dit quelques douceurs en votre nom, mais c'était pour vous plaire.  14 15
Si bien donc que tu n'aurais pas d'inclination pour elle ?  11 12
Moi ? point du tout.  5 4
J'en suis fâché : car cela rompt une pensée qui m'était venue dans l'esprit.  14 16
J'ai fait, en la voyant ici, réflexion sur mon âge ; et j'ai songé qu'on pourra trouver à redire, de me voir marier à une si jeune Personne.  28 

Euh ? que dites-vous ?  5 4
Ce n'est personne. 3 4
Il faut, qui que ce soit qui ait fait le coup, qu'avec beaucoup de soin on ait épié l'heure ; et l'on a choisi justement le temps que je parlais à mon traître de Fils.  35 37
Sortons.  1 1
Je veux aller quérir la justice, et faire donner la Question à toute la Maison ; à Servantes, à Valets, à Fils, à Fille, et à moi aussi.  28 27
Que de gens assemblés !  5 4
Je ne jette mes regards sur personne, qui ne me donne des soupçons, et tout me semble mon voleur.  19 19
Eh ! de quoi est-ce qu'on parle là ? de celui qui m'a dérobé ? 15 15
Quel bruit fait-on là-haut ? est-ce mon voleur qui y est ?  12 13
De grâce, si l'on sait des nouvelles de mon voleur, je supplie que l'on m'en dise.  16 19
N'est-il point caché là parmi vous ?  7 8
Ils me regardent tous, et se mettent à rire.  9 9
Vous verrez qu'ils ont part, sans doute, au vol que l'on m'a fait.  13 16
Allons vite, des Commissaires, des Archers, des Prévôts, des Juges, des Gênes, des Potences

Mais je veux ravoir mon affaire, et que tu me confesses en quel endroit tu me l'as enlevée.  18 19
Moi ? je ne l'ai point enlevée, et elle est encore chez vous.  13 13
Ô ma chère Cassette !  5 4
Elle n'est point sortie de ma maison ?  8 8
Non, Monsieur. 2 2
Hé, dis-moi donc un peu ; Tu n'y as point touché ?  12 12
Moi, y toucher ?  4 3
Ah ! vous lui faites tort, aussi bien qu'à moi ; et c'est d'une ardeur toute pure et respectueuse, que j'ai brûlé pour elle.  24 26
Brûlé pour ma cassette !  5 4
J'aimerais mieux mourir que de lui avoir fait paraître aucune pensée offensante.  12 13
Elle est trop sage et trop honnête pour cela. 9 9
Ma Cassette trop honnête !  5 4
Tous mes désirs se sont bornés à jouir de sa vue ; et rien de criminel n'a profané la passion que ses beaux yeux m'ont inspirée.  26 27
Les beaux yeux de ma Cassette !  7 6
Il parle d'elle, comme un Amant d'une Maîtresse.  8 10
Dame Claude, Monsieur, sait la vérité de cette aventure, et elle vous peut rendre témoignage… 15 15
Qu

Le Ciel, mes Enfants, ne me redonne point à vous, pour être contraire à vos vœux.  16 16
Seigneur Harpagon, vous jugez bien que le choix d'une jeune personne tombera sur le Fils plutôt que sur le Père.  20 21
Allons, ne vous faites point dire ce qu'il n'est pas nécessaire d'entendre, et consentez ainsi que moi à ce double hyménée.  21 24
Il faut, pour me donner conseil, que je voie ma cassette.  11 11
Vous la verrez saine et entière.  6 6
Je n'ai point d'argent à donner en mariage à mes Enfants.  11 13
Hé bien, j'en ai pour eux, que cela ne vous inquiète point.  12 13
Vous obligerez-vous à faire tous les frais de ces deux Mariages ?  12 12
Oui, je m'y oblige. 4 5
Êtes-vous satisfait ?  3 3
Oui, pourvu que pour les Noces vous me fassiez faire un habit.  12 12
D'accord.  1 2
Allons jouir de l'allégresse que cet heureux jour nous présente.  10 11
Holà, Messieurs, holà. 3 3
Tout doucement, s'il vous plaît. 5 6
Qui me payera mes écritures ?  6 5
Nous n'avons que faire de vos écritures.  7 8

In [29]:
for acte in root.iter("{http://www.tei-c.org/ns/1.0}div1"):
    numeroActe = acte.get('n')
    for scene in acte.iter("{http://www.tei-c.org/ns/1.0}div2"):
        numeroScene = scene.get('n')
        for paroles in scene.iter("{http://www.tei-c.org/ns/1.0}sp"):
            role = paroles.get('who')
            nbMots = 0
            for phrase in paroles.iter("{http://www.tei-c.org/ns/1.0}s"):
                nbMots += compte_mots(phrase.text)
            print("Acte {}, Scène {}, Rôle : {}, nombre de mots : {}".format(numeroActe, numeroScene, role, nbMots))

Acte 1, Scène 1, Rôle : valere, nombre de mots : 58
Acte 1, Scène 1, Rôle : elise, nombre de mots : 68
Acte 1, Scène 1, Rôle : valere, nombre de mots : 14
Acte 1, Scène 1, Rôle : elise, nombre de mots : 51
Acte 1, Scène 1, Rôle : valere, nombre de mots : 45
Acte 1, Scène 1, Rôle : elise, nombre de mots : 26
Acte 1, Scène 1, Rôle : valere, nombre de mots : 70
Acte 1, Scène 1, Rôle : elise, nombre de mots : 63
Acte 1, Scène 1, Rôle : valere, nombre de mots : 4
Acte 1, Scène 1, Rôle : elise, nombre de mots : 224
Acte 1, Scène 1, Rôle : valere, nombre de mots : 138
Acte 1, Scène 1, Rôle : elise, nombre de mots : 22
Acte 1, Scène 1, Rôle : valere, nombre de mots : 215
Acte 1, Scène 1, Rôle : elise, nombre de mots : 24
Acte 1, Scène 1, Rôle : valere, nombre de mots : 86
Acte 1, Scène 1, Rôle : elise, nombre de mots : 13
Acte 1, Scène 2, Rôle : cleante, nombre de mots : 24
Acte 1, Scène 2, Rôle : elise, nombre de mots : 14
Acte 1, Scène 2, Rôle : cleante, nombre de mots : 11
Acte 1, Scène 2, 

TypeError: 'NoneType' object is not iterable

In [23]:
for acte in root.iter("{http://www.tei-c.org/ns/1.0}div1"):
    print(acte.get('type'))

act
act
act
act
act


In [24]:
root.findall("[@type]")

[]