diff --git a/Journal_de_bord_fichier.md b/Journal_de_bord_fichier.md index 0e6596859f37b18d25fe3fe2ad3fa91df959a371..c9b34b90028bed5976d3f68ee0806e617ce8ce5a 100644 --- a/Journal_de_bord_fichier.md +++ b/Journal_de_bord_fichier.md @@ -131,14 +131,18 @@ Conclusion: L'année où la varicelle a fait le plus de contaminations est l'ann ## Exo1: Écrire un document computationnel Il fallait choisir un des sujets dans la liste faire une analyse des données associées sous forme d'un document computationnel. + J'ai choisi le Sujet 5 : Analyse des dialogues dans l'Avare de Molière. Pour ce sujet, il fallait: - Classer les personnages selon la quantité de parole grâce à une analyse syntaxique du texte (scènes / répliques / mots). En particulier, quel est celui qui parle le plus ? Quel est celui qui ne parle pas du tout ? - Réaliser un graphique qui montrera le nombre de mots que chaque acteur prononce dans chaque scène en s'inspirant de l'étude de l'Avare de Molière réalisée par l'OBVIL. J'ai d'abord importé le texte et séparé toutes les scènes et toutes les lignes. + Pour savoir combien de fois un personnage prenait la parole, il fallait chercher combien de fois son nom apparaissait seul sur une ligne (annonce du nom du personnage avant qu'il parle), sinon ça marche pas car ils peuvent dire le nom de quelqu'un sans que cette personne ne parle. + J'ai noté ce nombre (le nombre de fois où le personnage intervient dans la scène) pour chaque scène et pour chaque personnage dans des tableaux. + Comme il y a 32 scènes et 13 personnages (14 mais yen a un qui parle pas), cela donne quelque chose comme ça: @@ -150,6 +154,8 @@ Comme il y a 32 scènes et 13 personnages (14 mais yen a un qui parle pas), cela | ... 32 | ... | ... | ... | ... | Les 0 signifient que les personnages ne parlent pas de toute la scène. + Maintenant on doit tracer les diagrammes pour chaque scène. + Pour cela, j'ai choisi de faire des graphiques en camembert.