{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Sujet 7 : Autour du SARS-CoV-2 (Covid-19)\n", "\n", "## Objectifs\n", "\n", "Le but est ici de reproduire des graphes semblables à ceux du [South China Morning Post (SCMP)](https://www.scmp.com/), sur la page The Coronavirus Pandemic et qui montrent pour différents pays le nombre cumulé (c'est-à-dire le nombre total de cas depuis le début de l'épidémie) de personnes atteintes de la maladie à coronavirus 2019.\n", "\n", "1. Télécharger les données depuis le site et vérifier leur intégrité;\n", "\n", "2. Afficher un graphe montrant l’évolution du nombre de cas cumulé au cours du temps pour les pays suivants : la Belgique (Belgium), la Chine - toutes les provinces sauf Hong-Kong (China), Hong Kong (China, Hong-Kong), la France métropolitaine (France), l’Allemagne (Germany), l’Iran (Iran), l’Italie (Italy), le Japon (Japan), la Corée du Sud (Korea, South), la Hollande sans les colonies (Netherlands), le Portugal (Portugal), l’Espagne (Spain), le Royaume-Unis sans les colonies (United Kingdom), les États-Unis (US);\n", "\n", "3. Afficher un graphe avec la date en abscisse et le nombre cumulé de cas à cette date en ordonnée. Deux versions de ce graphe seront proposées, une avec une échelle linéaire et une avec une échelle logarithmique.\n", "\n", "## Première partie : récupération et nettoyage des données \n", "\n", "On déclare les librairies qui seront utilisées ici, puis on importe les données : \n" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ " %matplotlib inline\n", "import matplotlib.pyplot as plt\n", "import pandas as pd\n", "import isoweek\n", "import math" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | Province/State | \n", "Country/Region | \n", "Lat | \n", "Long | \n", "1/22/20 | \n", "1/23/20 | \n", "1/24/20 | \n", "1/25/20 | \n", "1/26/20 | \n", "1/27/20 | \n", "... | \n", "4/23/20 | \n", "4/24/20 | \n", "4/25/20 | \n", "4/26/20 | \n", "4/27/20 | \n", "4/28/20 | \n", "4/29/20 | \n", "4/30/20 | \n", "5/1/20 | \n", "5/2/20 | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "NaN | \n", "Afghanistan | \n", "33.000000 | \n", "65.000000 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "1279 | \n", "1351 | \n", "1463 | \n", "1531 | \n", "1703 | \n", "1828 | \n", "1939 | \n", "2171 | \n", "2335 | \n", "2469 | \n", "
1 | \n", "NaN | \n", "Albania | \n", "41.153300 | \n", "20.168300 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "663 | \n", "678 | \n", "712 | \n", "726 | \n", "736 | \n", "750 | \n", "766 | \n", "773 | \n", "782 | \n", "789 | \n", "
2 | \n", "NaN | \n", "Algeria | \n", "28.033900 | \n", "1.659600 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "3007 | \n", "3127 | \n", "3256 | \n", "3382 | \n", "3517 | \n", "3649 | \n", "3848 | \n", "4006 | \n", "4154 | \n", "4295 | \n", "
3 | \n", "NaN | \n", "Andorra | \n", "42.506300 | \n", "1.521800 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "723 | \n", "731 | \n", "738 | \n", "738 | \n", "743 | \n", "743 | \n", "743 | \n", "745 | \n", "745 | \n", "747 | \n", "
4 | \n", "NaN | \n", "Angola | \n", "-11.202700 | \n", "17.873900 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "25 | \n", "25 | \n", "25 | \n", "26 | \n", "27 | \n", "27 | \n", "27 | \n", "27 | \n", "30 | \n", "35 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
261 | \n", "NaN | \n", "Western Sahara | \n", "24.215500 | \n", "-12.885800 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "6 | \n", "6 | \n", "6 | \n", "6 | \n", "6 | \n", "6 | \n", "6 | \n", "6 | \n", "6 | \n", "6 | \n", "
262 | \n", "NaN | \n", "Sao Tome and Principe | \n", "0.186360 | \n", "6.613081 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "4 | \n", "4 | \n", "4 | \n", "4 | \n", "4 | \n", "8 | \n", "8 | \n", "14 | \n", "16 | \n", "16 | \n", "
263 | \n", "NaN | \n", "Yemen | \n", "15.552727 | \n", "48.516388 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "1 | \n", "1 | \n", "1 | \n", "1 | \n", "1 | \n", "1 | \n", "6 | \n", "6 | \n", "7 | \n", "10 | \n", "
264 | \n", "NaN | \n", "Comoros | \n", "-11.645500 | \n", "43.333300 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "1 | \n", "3 | \n", "
265 | \n", "NaN | \n", "Tajikistan | \n", "38.861034 | \n", "71.276093 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "15 | \n", "15 | \n", "76 | \n", "
266 rows × 106 columns
\n", "\n", " | Country/Region | \n", "Lat | \n", "Long | \n", "1/22/20 | \n", "1/23/20 | \n", "1/24/20 | \n", "1/25/20 | \n", "1/26/20 | \n", "1/27/20 | \n", "1/28/20 | \n", "... | \n", "4/23/20 | \n", "4/24/20 | \n", "4/25/20 | \n", "4/26/20 | \n", "4/27/20 | \n", "4/28/20 | \n", "4/29/20 | \n", "4/30/20 | \n", "5/1/20 | \n", "5/2/20 | \n", "
---|
0 rows × 105 columns
\n", "\n", " | Lat | \n", "Long | \n", "1/22/20 | \n", "1/23/20 | \n", "1/24/20 | \n", "1/25/20 | \n", "1/26/20 | \n", "1/27/20 | \n", "1/28/20 | \n", "1/29/20 | \n", "... | \n", "4/23/20 | \n", "4/24/20 | \n", "4/25/20 | \n", "4/26/20 | \n", "4/27/20 | \n", "4/28/20 | \n", "4/29/20 | \n", "4/30/20 | \n", "5/1/20 | \n", "5/2/20 | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Country/Region | \n", "\n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " |
China | \n", "1061.0367 | \n", "3570.2197 | \n", "548 | \n", "641 | \n", "918 | \n", "1401 | \n", "2067 | \n", "2869 | \n", "5501 | \n", "6077 | \n", "... | \n", "82849 | \n", "82864 | \n", "82872 | \n", "82875 | \n", "82881 | \n", "82903 | \n", "82907 | \n", "82919 | \n", "82920 | \n", "82920 | \n", "
1 rows × 104 columns
\n", "Country/Region | \n", "Belgium | \n", "Hong Kong | \n", "France | \n", "Germany | \n", "Iran | \n", "Italy | \n", "Japan | \n", "Netherlands | \n", "Portugal | \n", "Spain | \n", "United Kingdom | \n", "US | \n", "China | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2020-01-22 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "2 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "548 | \n", "
2020-01-23 | \n", "0 | \n", "2 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "2 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "641 | \n", "
2020-01-24 | \n", "0 | \n", "2 | \n", "2 | \n", "0 | \n", "0 | \n", "0 | \n", "2 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "2 | \n", "918 | \n", "
2020-01-25 | \n", "0 | \n", "5 | \n", "3 | \n", "0 | \n", "0 | \n", "0 | \n", "2 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "2 | \n", "1401 | \n", "
2020-01-26 | \n", "0 | \n", "8 | \n", "3 | \n", "0 | \n", "0 | \n", "0 | \n", "4 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "5 | \n", "2067 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
2020-04-28 | \n", "47334 | \n", "1037 | \n", "167605 | \n", "159912 | \n", "92584 | \n", "201505 | \n", "13736 | \n", "38416 | \n", "24322 | \n", "210773 | \n", "161145 | \n", "1012582 | \n", "82903 | \n", "
2020-04-29 | \n", "47859 | \n", "1037 | \n", "165093 | \n", "161539 | \n", "93657 | \n", "203591 | \n", "13895 | \n", "38802 | \n", "24505 | \n", "212917 | \n", "165221 | \n", "1039909 | \n", "82907 | \n", "
2020-04-30 | \n", "48519 | \n", "1037 | \n", "165764 | \n", "163009 | \n", "94640 | \n", "205463 | \n", "14088 | \n", "39316 | \n", "25045 | \n", "213435 | \n", "171253 | \n", "1069424 | \n", "82919 | \n", "
2020-05-01 | \n", "49032 | \n", "1039 | \n", "165764 | \n", "164077 | \n", "95646 | \n", "207428 | \n", "14305 | \n", "39791 | \n", "25351 | \n", "213435 | \n", "177454 | \n", "1103461 | \n", "82920 | \n", "
2020-05-02 | \n", "49517 | \n", "1039 | \n", "166976 | \n", "164967 | \n", "96448 | \n", "209328 | \n", "14571 | \n", "40236 | \n", "25190 | \n", "216582 | \n", "182260 | \n", "1132539 | \n", "82920 | \n", "
102 rows × 13 columns
\n", "