Add lines to download data and open text file

parent a0b129c7
......@@ -7,12 +7,70 @@
"# Sujet 5 : Analyse des dialogues dans l'Avare de Molière"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"__Rappel du contexte du sujet__ :\n",
"\n",
"L’Observatoire de la vie littéraire ([OBVIL](http://obvil.sorbonne-universite.site/obvil/presentation)) promeut une approche de l'analyse des textes littéraires fondée sur le numérique. \n",
"Dans le cadre du [Projet Molière](http://obvil.sorbonne-universite.site/projets/projet-moliere), des pièces de cet auteur ont été numérisées et sont accessibles librement dans différents formats utilisables par un programme informatique. \n",
"\n",
"Grâce à ces numérisations, il est possible d'écrire des programmes pour réaliser des analyses syntaxiques et sémantiques. Ce sujet se propose de reproduire une étude réalisée par l'OBVIL sur les dialogues de l'Avare de Molière.\n",
"\n",
"__Rappel des objectifs de ce sujet__ :\n",
"\n",
"1. Classez les personnages selon la quantité de parole grâce à une analyse syntaxique du texte (scènes / répliques / mots). En particulier, quel est celui qui parle le plus ? Quel est celui qui ne parle pas du tout ? Attention, les noms des personnages ne sont pas forcément homogènes (casse et accents par exemple).\n",
"2. Réalisez un graphique qui montrera le nombre de mots que chaque acteur prononce dans chaque scène. Pour cela, vous pouvez vous inspirer de l'[étude de l'Avare de Molière réalisée par l'OBVIL](https://obvil.sorbonne-universite.fr/corpus/moliere/moliere_avare) (graphe de gauche). Dans ce graphique, les lignes sont de longueur égale et la hauteur représente le nombre de mots prononcés au total dans la scène. La largeur de chaque rectangle indique le pourcentage de la scène qu’un acteur occupe. \n",
"3. Facultatif : Construisez un graphe d’interlocution permettant de visualiser les échanges entre les personnages. Pour cela, vous pouvez vous inspirer de l'[étude de l'Avare de Molière réalisée par l'OBVIL](https://obvil.sorbonne-universite.fr/corpus/moliere/moliere_avare) (graphe de droite).\n",
"4. Déposer votre résultat dans FUN\n",
"\n",
"La version numérisée que l'on se propose d'utiliser est le fichier texte au format markdown disponible ici [moliere_avare](http://dramacode.github.io/markdown/moliere_avare.txt)."
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [],
"source": [
"data_url = \"http://dramacode.github.io/markdown/moliere_avare.txt\""
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
"source": [
"# from os import path as pth\n",
"import requests\n",
"\n",
"local_filename = \"moliere_avare.md\"\n",
"# Si le fichier csv des données d'incidence existe en local\n",
"# il n'est pas nécessaire de le télécharger par l'URL\n",
"if not pth.exists(local_filename):\n",
" # Si le fichier n'existe pas en local dans le dossier courant\n",
" # nous téléchargons les données et les écrivons\n",
" # dans un fichier en local\n",
" # Téléchargement des données\n",
" response = requests.get(data_url)\n",
" # Ecriture des données téléchargées dans le fichier local\n",
" with open(local_filename, \"wb\") as f:\n",
" f.write(response.content)\n",
" \n",
"# On ouvre le fichier local en lecture 'r' pour en faire l'analyse\n",
"avare_file = open(local_filename,'r')\n",
"print(avare_file)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Notes pour plus tard: lien stack overflow vers code de customisation de graphes de la bibliothèque python networkx\n",
"https://stackoverflow.com/questions/25639169/networkx-change-color-width-according-to-edge-attributes-inconsistent-result"
]
}
],
"metadata": {
......
This source diff could not be displayed because it is too large. You can view the blob instead.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment