# Sujet 5 : Analyse des dialogues dans l'Avare de Molière
__Prérequis__ : analyse de texte, éventuellement techniques de présentation graphique
L’Observatoire de la vie littéraire ([OBVIL](http://obvil.sorbonne-universite.site/obvil/presentation)) entend développer toutes les ressources offertes par les applications informatiques pour examiner aussi bien la littérature française du passé que la plus contemporaine. Dans le cadre du [projet Molière](http://obvil.sorbonne-universite.site/projets/projet-moliere), des pièces de cet auteur dont l'Avare ont été numérisées et sont accessibles librement dans différents formats utilisables par un programme informatique (pour l'Avare : [TEI](http://dramacode.github.io/moliere/moliere_avare.xml), [epub](http://dramacode.github.io/epub/moliere_avare.epub), [kindle](kindle/moliere_avare.mobi), [markdown](http://dramacode.github.io/markdown/moliere_avare.txt), [txt iramuteq](http://dramacode.github.io/iramuteq/moliere_avare.txt), [Texte dit/Paroles](naked/moliere_avare.txt), [TXM](http://dramacode.github.io/txm/moliere_avare.xml), [html complet avec table des matières](http://dramacode.github.io/html/moliere_avare.html), [fragment html](http://dramacode.github.io/article/moliere_avare.html)).
Grâce à ces numérisations, il est maintenant possible d'écrire des programmes pour répondre à des questions sur le texte, construire des graphes pour mieux comprendre . Nous vous proposons dans ce sujet de reproduire une étude réalisée par l'OBVIL sur l'étude des dialogues.
__Votre mission si vous l'acceptez__ :
1. Classez les personnages selon la quantité de parole grâce à une analyse syntaxique du texte (scènes / répliques / Mots). En particulier, quel est celui qui parle le plus ? Quel est celui qui ne parle pas du tout ? Atteion, les noms des personnages ne sont pas forcément homogènes (casse et accents par exemple).
2. Réalisez un graphique qui montrera le nombre de mots que chaque acteur prononce dans chaque scène. Chaque ligne représente une scene, et sa longueur est proporionnelle au nombre de mots prononcés. Vous pouvez aussi réaliser un graphique avec des lignes de longueurs égales, mais dont la hauteur représente le nombre de mots prononcés en total. La largeur de chaque rectangle indique alors le pourcentage de la scène qu’un acteur occupe. Pour cela, vous pouvez vous inspirer de l'[étude de l'Avare de Molière réalisée par l'OBVIL](https://obvil.sorbonne-universite.fr/corpus/moliere/moliere_avare)(graphe de gauche).
3. Facultatif : Construisez un graphe d’interlocution pour nous aider à visualiser qui parle à qui et combien de fois. Pour cela, vous pouvez vous inspirer de l'[étude de l'Avare de Molière réalisée par l'OBVIL](https://obvil.sorbonne-universite.fr/corpus/moliere/moliere_avare)(graphe de droite).