# Autour du SARS-CoV-2 (Covid-19)

Le but est ici de reproduire des graphes semblables à ceux du [South China Morning Post](https://www.scmp.com/) (SCMP), sur la page [The Coronavirus Pandemic](https://www.scmp.com/coronavirus?src=homepage_covid_widget) et qui montrent pour différents pays le nombre cumulé (c’est-à-dire le nombre total de cas depuis le début de l’épidémie) de personnes atteintes de la [maladie à coronavirus 2019](https://fr.wikipedia.org/wiki/Maladie_%C3%A0_coronavirus_2019).

Les données que nous utiliserons dans un premier temps sont compilées par le [Johns Hopkins University Center for Systems Science and Engineering (JHU CSSE)](https://systems.jhu.edu/) et sont mises à disposition sur [GitHub](https://github.com/CSSEGISandData/COVID-19). C'est plus particulièrement sur les données `time_series_covid19_confirmed_global.csv` (des suites chronologiques au format csv) disponibles [ici](https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv) que nous allons nous concentrer.

## Téléchargement des données

Les données relevées sont stockées dans un fichier. Celles-ci sont à la date du 22 juin 2021.

In [1]:
data_file = "time_series_covid19_confirmed_global.csv"
data_url = "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"

import os
import urllib.request
if not os.path.exists(data_file):
    urllib.request.urlretrieve(data_url, data_file)
data_file

'time_series_covid19_confirmed_global.csv'

In [6]:
%matplotlib inline
import matplotlib.pyplot as plt
import pandas as pd

raw_data = pd.read_csv(data_file, sep=',')
raw_data[raw_data['Country/Region'] == 'France']

Unnamed: 0,Province/State,Country/Region,Lat,Long,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,...,6/12/21,6/13/21,6/14/21,6/15/21,6/16/21,6/17/21,6/18/21,6/19/21,6/20/21,6/21/21
119,French Guiana,France,3.9339,-53.1258,0,0,0,0,0,0,...,25506,25506,25506,25788,25950,26143,26143,26143,26143,26450
120,French Polynesia,France,-17.6797,149.4068,0,0,0,0,0,0,...,18930,18930,18939,18947,18952,18957,18963,18963,18963,18972
121,Guadeloupe,France,16.265,-61.551,0,0,0,0,0,0,...,17108,17288,17288,17288,17288,17288,17288,17288,17288,17427
122,Martinique,France,14.6415,-61.0242,0,0,0,0,0,0,...,12060,12130,12130,12130,12130,12130,12130,12130,12130,12199
123,Mayotte,France,-12.8275,45.166244,0,0,0,0,0,0,...,19373,19373,19378,19378,19378,19378,19389,19389,19389,19389
124,New Caledonia,France,-20.904305,165.618042,0,0,0,0,0,0,...,128,128,128,128,128,128,128,128,129,129
125,Reunion,France,-21.1151,55.5364,0,0,0,0,0,0,...,27235,27235,27235,27235,28441,28441,28441,28441,28441,28441
126,Saint Barthelemy,France,17.9,-62.8333,0,0,0,0,0,0,...,1005,1005,1005,1005,1005,1005,1005,1005,1005,1005
127,Saint Pierre and Miquelon,France,46.8852,-56.3159,0,0,0,0,0,0,...,25,25,25,25,26,26,26,26,26,26
128,St Martin,France,18.0708,-63.0501,0,0,0,0,0,0,...,2040,2040,2040,2040,2040,2133,2133,2133,2133,2133


On s'intéressera ici spécifiquement aux données de la **Belgique**, la **Chine** (en traitant **Hong-Kong** à part), la **France métroploitaine**, l'**Allemagne**, l'**Iran**, l'**Italie**, le **Japon**, la **Corée du Sud**, les **Pays-Bas** (*hors colonies*), le **Portugal**, l'**Espagne**, le **Royaume-Uni** (*hors colonies*) et les **États-Unis**.

[//]: # "Initialement, il est demandé de tenir compte également de la **Chine** (en traitant **Hong-Kong** à part). Cependant, et comme on peut le voir juste au dessus, le format utilisé pour le fichier `.csv` traite chacune des 34 provinces chinoises à part, avec aucune donnée générale sur la Chine. Plusieurs choix s'offrent à nous : reconstituer une ligne *globale* pour ce pays en mélangeant **toutes** ses provinces, faire la même chose en gardant de côté **Hong-Kong** pour coller à la consigne ou se simplifier la vie en mettant de côté les données chinoises."

[//]: # "Je choisis cette dernière options pour plusieurs raisons. La première, et plus évidente, est la facilité : je ne pense pas parvenir à mélanger toutes les provinces de la Chine efficacement/élégamment, et suis presque certain d'effectuer une erreur en m'y frottant. Par ailleurs, on remarque en lisant l'énoncé de cet exercice :"

[//]: # "> Les données de la Chine apparaissent par province et nous avons séparé Hong-Kong, non pour prendre parti dans les différences entre cette province et l’état chinois, mais parce que c’est ainsi qu’apparaissent les données sur le site du SCMP."

[//]: # "Ce qui laisse penser que cette difficulté n'est pas initialement prévue, et que la consigne initiale est tournée de manière à ne pas devoir réaliser de fusion de lignes. Pour toutes ces raisons, laisser de côté les données pour la **Chine** me semble à la fois bien plus judicieux en terme de temps, mais aussi plus proche de l'intention initiale de la consigne."

In [3]:
selectedCountries = ['Belgium', 'France', 'China', 'Germany', 'Iran', 'Italy',
                    'Japan', 'Korea,South', 'Netherlands', 'Portugal', 'Spain',
                    'United Kingdom', 'US']

data = raw_data[raw_data['Country/Region'].isin(selectedCountries)]

Pour tous les pays - sauf la Chine - les données hors provinces/colonies présentent `NaN` dans leur colonne `Province/State`. On peut donc récupérer d'une part toutes les données chinoises, et d'autre part les données des autres pays.

In [4]:
dataChina = data[data['Country/Region'] == 'China']
dataChina

Unnamed: 0,Province/State,Country/Region,Lat,Long,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,...,6/12/21,6/13/21,6/14/21,6/15/21,6/16/21,6/17/21,6/18/21,6/19/21,6/20/21,6/21/21
58,Anhui,China,31.8257,117.2264,1,9,15,39,60,70,...,1004,1004,1004,1004,1004,1004,1004,1004,1004,1004
59,Beijing,China,40.1824,116.4142,14,22,36,41,68,80,...,1069,1070,1071,1071,1072,1072,1073,1073,1075,1075
60,Chongqing,China,30.0572,107.874,6,9,27,57,75,110,...,598,598,598,598,598,598,598,598,598,598
61,Fujian,China,26.0789,117.9874,1,5,10,18,35,59,...,637,637,638,638,641,646,650,651,652,659
62,Gansu,China,35.7518,104.2861,0,2,2,4,7,14,...,194,194,194,194,194,194,194,194,194,194
63,Guangdong,China,23.3417,113.4244,26,32,53,78,111,151,...,2618,2625,2635,2650,2657,2666,2680,2692,2699,2706
64,Guangxi,China,23.8298,108.7881,2,5,23,23,36,46,...,275,275,275,275,275,275,275,275,275,275
65,Guizhou,China,26.8154,106.8748,1,3,3,4,5,7,...,147,147,147,147,147,147,147,147,147,147
66,Hainan,China,19.1959,109.7453,4,5,8,19,22,33,...,188,188,188,188,188,188,188,188,188,188
67,Hebei,China,39.549,116.1306,1,1,2,8,13,18,...,1317,1317,1317,1317,1317,1317,1317,1317,1317,1317


In [7]:
dataOther = data[data['Province/State'] != data['Province/State']]
dataOther

Unnamed: 0,Province/State,Country/Region,Lat,Long,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,...,6/12/21,6/13/21,6/14/21,6/15/21,6/16/21,6/17/21,6/18/21,6/19/21,6/20/21,6/21/21
23,,Belgium,50.8333,4.469936,0,0,0,0,0,0,...,1075765,1076338,1076579,1077087,1077758,1078251,1078251,1079084,1079415,1079640
130,,France,46.2276,2.2137,0,0,2,3,3,3,...,5675604,5678209,5678893,5681846,5683536,5685387,5688557,5691181,5692996,5692968
134,,Germany,51.165691,10.451526,0,0,0,0,0,1,...,3722295,3723295,3724168,3725328,3726767,3727668,3728601,3729597,3730126,3730619
149,,Iran,32.427908,53.688046,0,0,0,0,0,0,...,3020522,3028717,3039432,3049648,3060135,3070426,3080526,3086974,3095135,3105620
153,,Italy,41.87194,12.56738,0,0,0,0,0,0,...,4243482,4244872,4245779,4247032,4248432,4249755,4250902,4252095,4252976,4253460
155,,Japan,36.204824,138.252924,2,2,2,2,4,4,...,774240,775624,776565,777979,779696,781241,782877,784384,785702,786566
197,,Netherlands,52.1326,5.2913,0,0,0,0,0,0,...,1671703,1672744,1673596,1674628,1675644,1676708,1677596,1678282,1678983,1679542
214,,Portugal,39.3999,-8.2245,0,0,0,0,0,0,...,856740,857447,858072,859045,860395,861628,862926,864109,865050,865806
237,,Spain,40.463667,-3.74922,0,0,0,0,0,0,...,3733600,3733600,3741767,3745199,3749031,3753228,3757442,3757442,3757442,3764651
253,,US,40.0,-100.0,1,1,2,2,5,5,...,33457228,33462003,33474734,33486038,33498468,33508867,33529475,33537995,33541887,33554275
