"Les données de l'incidence du syndrome grippal sont disponibles du site Web du Réseau Sentinelles. Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet."
"Les données du nombres de cas de Covid-19 sont compilés par le  et sont disponibles sur GitHub. Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à un pays et s'il est composé de plusieurs provinces ou territoires, chaque territoires est sur une ligne distincte. Les colonnes correspondent aux nombres de cas cumulés chaque jour de Covid-19 à partir du 22 janvier 2020."
]
]
},
},
{
{
...
@@ -38,6 +38,33 @@
...
@@ -38,6 +38,33 @@
"raw_data = pd.read_csv(data_url, skiprows=0)"
"raw_data = pd.read_csv(data_url, skiprows=0)"
]
]
},
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Nous nous proposons de traiter les cas des pays suivant :\n",
" - Belgique\n",
" - Allemagne\n",
" - Iran\n",
" - Italie\n",
" - Japon\n",
" - Corée du Sud\n",
" - Portugal\n",
" - US\n",
" - Chine (à l'exeption de Hong Kong)\n",
" - France (à l'exeption des territoires et départements d'outre-mer)\n",
" - Royaume Unis (à l'exception des colonies)\n",
" - Pays-Bas (à l'exception des colonies)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Pour plus de simplicité pour le traitement de ces données, nous isolons dans des dataframes les nombres de cas pour chaque pays.\n",
"Ainsi nous avons 12 dataframes avec en première ligne le nom du pays et les autres sont composées de la date et du nombre de cas cumulés."
]
},
{
{
"cell_type": "code",
"cell_type": "code",
"execution_count": 3,
"execution_count": 3,
...
@@ -67,6 +94,15 @@
...
@@ -67,6 +94,15 @@
"Netherlands = temp[temp.isnull().any(axis=1)]"
"Netherlands = temp[temp.isnull().any(axis=1)]"
]
]
},
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Premièrement nous récupérons la liste de toutes les dates grâce à la transposé d'une dataframe. Ensuite nous transformons les dates du format \"mm/jj/aa\" au format \"jj-mm-aa\" pour plus de simplicité. \n",
"\n",
"Dans un second temps nous arrangeons les données en transposant et en supprimant les lignes inutiles comme le nom des provinces/états, la lattitude et longitude. Et nous changeons l'index pour que ce soit maintenant les dates."
]
},
{
{
"cell_type": "code",
"cell_type": "code",
"execution_count": 4,
"execution_count": 4,
...
@@ -95,6 +131,13 @@
...
@@ -95,6 +131,13 @@
" return df1"
" return df1"
]
]
},
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Nous arrongeons ici les données en modifiant le nom du pays pour y rajouter \"en\" ou \"au\" pour l'automatisation des plots par la suite."
"Maintenant que nous avons les données arrangées à notre convenance, nous traçons, pour chaque pays, 2 graphes. Le premier a en abscisse la date et en ordonnée le nombre de cas cumulés de Covid en échelle linéaire. Le second a en abscisse la date et en ordonnée le nombre de cas cumulés de Covid en échelle logarithmique."
]
},
{
{
"cell_type": "code",
"cell_type": "code",
"execution_count": 6,
"execution_count": 6,
"metadata": {},
"metadata": {},
"outputs": [
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"/opt/conda/lib/python3.6/site-packages/matplotlib/cbook/deprecation.py:107: MatplotlibDeprecationWarning: Passing one of 'on', 'true', 'off', 'false' as a boolean is deprecated; use an actual boolean (True/False) instead.\n",