diff --git a/module3/exo1/analyse-syndrome-grippal.ipynb b/module3/exo1/analyse-syndrome-grippal.ipynb index ba9b86da8f2a6edafff5ae0303762adccc24461a..63d6e8e98eb1f26671b5950dc1298e64e53a2a7b 100644 --- a/module3/exo1/analyse-syndrome-grippal.ipynb +++ b/module3/exo1/analyse-syndrome-grippal.ipynb @@ -39,53 +39,32 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "Voici l'explication des colonnes données [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json):\n", - "\n", - "| Nom de colonne | Libellé de colonne |\n", - "|----------------|-----------------------------------------------------------------------------------------------------------------------------------|\n", - "| week | Semaine calendaire (ISO 8601) |\n", - "| indicator | Code de l'indicateur de surveillance |\n", - "| inc | Estimation de l'incidence de consultations en nombre de cas |\n", - "| inc_low | Estimation de la borne inférieure de l'IC95% du nombre de cas de consultation |\n", - "| inc_up | Estimation de la borne supérieure de l'IC95% du nombre de cas de consultation |\n", - "| inc100 | Estimation du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |\n", - "| inc100_low | Estimation de la borne inférieure de l'IC95% du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |\n", - "| inc100_up | Estimation de la borne supérieure de l'IC95% du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |\n", - "| geo_insee | Code de la zone géographique concernée (Code INSEE) http://www.insee.fr/fr/methodes/nomenclatures/cog/ |\n", - "| geo_name | Libellé de la zone géographique (ce libellé peut être modifié sans préavis) |\n", - "\n", - "La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skiprows=1`." - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Afin d'éviter de télécharger les données depuis l'URL donnée précédemment à chaque exécution on récupère les données en local. C'est ce fichier local dont le nom est dans la variable `data_local_file` que l'on utilisera." + "Afin d'éviter de télécharger les données depuis l'URL donnée précédemment à chaque exécution et pour nous prémunir d'une modification ou disparition des données on les récupère en local. C'est ce fichier local dont le nom est dans la variable `data_file` que l'on utilisera." ] }, { "cell_type": "code", - "execution_count": 17, + "execution_count": 3, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ - "Les données sont déjà présentes en local.\n" + "Les données n'existent pas en local, on les télécharges.\n", + "Fichier récupéré.\n" ] } ], "source": [ - "import os\n", - "data_local_file = \"incidence.csv\"\n", + "data_file = \"syndrome-grippal.csv\"\n", "\n", - "if not os.access(data_local_file, os.R_OK):\n", + "import os\n", + "if not os.access(data_file, os.R_OK):\n", " import urllib.request\n", " print(\"Les données n'existent pas en local, on les télécharges.\")\n", - " urllib.request.urlretrieve(data_url, data_local_file)\n", - " if os.access(data_local_file, os.R_OK):\n", + " urllib.request.urlretrieve(data_url, data_file)\n", + " if os.access(data_file, os.R_OK):\n", " print(\"Fichier récupéré.\")\n", " else:\n", " raise Exception(\"Le fichier n'a pas pu être récupéré !\")\n", @@ -93,6 +72,28 @@ " print(\"Les données sont déjà présentes en local.\")" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Voici l'explication des colonnes données [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json):\n", + "\n", + "| Nom de colonne | Libellé de colonne |\n", + "|----------------|-----------------------------------------------------------------------------------------------------------------------------------|\n", + "| week | Semaine calendaire (ISO 8601) |\n", + "| indicator | Code de l'indicateur de surveillance |\n", + "| inc | Estimation de l'incidence de consultations en nombre de cas |\n", + "| inc_low | Estimation de la borne inférieure de l'IC95% du nombre de cas de consultation |\n", + "| inc_up | Estimation de la borne supérieure de l'IC95% du nombre de cas de consultation |\n", + "| inc100 | Estimation du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |\n", + "| inc100_low | Estimation de la borne inférieure de l'IC95% du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |\n", + "| inc100_up | Estimation de la borne supérieure de l'IC95% du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |\n", + "| geo_insee | Code de la zone géographique concernée (Code INSEE) http://www.insee.fr/fr/methodes/nomenclatures/cog/ |\n", + "| geo_name | Libellé de la zone géographique (ce libellé peut être modifié sans préavis) |\n", + "\n", + "La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skiprows=1`." + ] + }, { "cell_type": "code", "execution_count": 4, @@ -1066,7 +1067,7 @@ } ], "source": [ - "raw_data = pd.read_csv(data_local_file, skiprows=1)\n", + "raw_data = pd.read_csv(data_file, skiprows=1)\n", "raw_data" ] }, @@ -2243,7 +2244,7 @@ { "data": { "text/plain": [ - "" + "" ] }, "execution_count": 10, @@ -2282,7 +2283,7 @@ { "data": { "text/plain": [ - "" + "" ] }, "execution_count": 11, @@ -2386,7 +2387,7 @@ { "data": { "text/plain": [ - "" + "" ] }, "execution_count": 14, @@ -2487,7 +2488,7 @@ { "data": { "text/plain": [ - "" + "" ] }, "execution_count": 16, diff --git a/module3/exo1/incidence.csv b/module3/exo1/syndrome-grippal.csv similarity index 100% rename from module3/exo1/incidence.csv rename to module3/exo1/syndrome-grippal.csv