no commit message

parent 11628ba9
......@@ -36,21 +36,19 @@
]
},
{
"cell_type": "code",
"execution_count": null,
"cell_type": "markdown",
"metadata": {},
"outputs": [],
"source": [
"Pour nous protéger contre une éventuelle disparition ou modification du serveur du Réseau Sentinelles, nous faisons une copie locale de ce jeux de données que nous préservons avec notre analyse. Il est inutile et même risquée de télécharger les données à chaque exécution, car dans le cas d'une panne nous pourrions remplacer nos données par un fichier défectueux. Pour cette raison, nous téléchargeons les données seulement si la copie locale n'existe pas."
]
},
{
"cell_type": "code",
"execution_count": null,
"execution_count": 17,
"metadata": {},
"outputs": [],
"source": [
"data_file = \"incidence-PAY-3.csv\"\n",
"data_file = \"syndrome-grippal.csv\"\n",
"\n",
"import os\n",
"import urllib.request\n",
......@@ -58,31 +56,9 @@
" urllib.request.urlretrieve(data_url, data_file)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Voici l'explication des colonnes données [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json):\n",
"\n",
"| Nom de colonne | Libellé de colonne |\n",
"|----------------|-----------------------------------------------------------------------------------------------------------------------------------|\n",
"| week | Semaine calendaire (ISO 8601) |\n",
"| indicator | Code de l'indicateur de surveillance |\n",
"| inc | Estimation de l'incidence de consultations en nombre de cas |\n",
"| inc_low | Estimation de la borne inférieure de l'IC95% du nombre de cas de consultation |\n",
"| inc_up | Estimation de la borne supérieure de l'IC95% du nombre de cas de consultation |\n",
"| inc100 | Estimation du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |\n",
"| inc100_low | Estimation de la borne inférieure de l'IC95% du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |\n",
"| inc100_up | Estimation de la borne supérieure de l'IC95% du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |\n",
"| geo_insee | Code de la zone géographique concernée (Code INSEE) http://www.insee.fr/fr/methodes/nomenclatures/cog/ |\n",
"| geo_name | Libellé de la zone géographique (ce libellé peut être modifié sans préavis) |\n",
"\n",
"La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skiprows=1`."
]
},
{
"cell_type": "code",
"execution_count": 3,
"execution_count": 18,
"metadata": {},
"outputs": [
{
......@@ -1047,13 +1023,13 @@
"[1957 rows x 10 columns]"
]
},
"execution_count": 3,
"execution_count": 18,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"raw_data = pd.read_csv(data_url, skiprows=1)\n",
"raw_data = pd.read_csv(data_file, skiprows=1)\n",
"raw_data"
]
},
......
This diff is collapsed.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment