Quelques chiffres autour de l'épidémie de Covid-19

Table des matières

1 Identification du système

date "+%Y-%m-%d"
2020-04-19

uname -a
Linux aluminium 4.14.0-3-amd64 #1 SMP Debian 4.14.17-1 (2018-02-14) x86_64 GNU/Linux

import sys
sys.version
3.7.3rc1 (default, Mar 13 2019, 11:01:15)
[GCC 8.3.0]

2 Récupération des données

On prend les données distribuées par Our World In Data, elles-mêmes issues de l'ECDC :

url = "https://covid.ourworldindata.org/data/ecdc/full_data.csv"
data_raw = pd.read_csv(url, index_col='date')
data_raw.tail(3)
            location  new_cases  new_deaths  total_cases  total_deaths
date
2020-04-16  Zimbabwe          6           0           23             3
2020-04-17  Zimbabwe          1           0           24             3
2020-04-18  Zimbabwe          0           0           24             3

3 Evolution comparée de l'épidémie dans quelques pays

Je préfère fonder l'analyse sur le nombre de décès, qui me semble plus fiable et comparable d'un pays à l'autre que, par exemple, le nombre de cas dépistés. Afin de recaler l'axe temporel, on positionne \(t=0\) au moment où le nombre total de morts dépasse 100.

La logique est la suivante : on considère le nombre \(n^c\) (de décès ou de cas) dans un pays \(c\). On suppose que l'évolution de \(n^c\) en fonction du temps \(t\) suit une loi de croissance exponentielle (au moins dans une phase initiale). On s'attend ainsi à avoir une expression du type : \[ n^c(t) = n^c_0 \, e^{\lambda^c \left(t-t^c_0\right)}. \] Dans cette expression, la valeur initiale \(n^c_0 = n^c(t^c_0)\) est liée à la taille de la population considérée. La constante de temps \(\lambda^c\) en revanche, n'a pas vraiment de raison de l'être : elle reflète simplement le rythme auquel l'épidémie se propage.

Si l'on se donne un seuil \(\tau\) unique, on peut fixer pour chaque pays l'instant initial \(t^c_0\) de sorte que \[ n^c(t^c_0) = \tau. \] En effectuant un recalage de l'instant initial, c'est à dire en effectuant le changement de variable temporelle \(\tilde{t}^c=t-t^c_0\), on obtient \[ n^c(\tilde{t}^c) = \tau \, e^{\lambda^c\,\tilde{t}^c}, \] ce qui signifie que tous les pays deviennent comparables, indépendamment de leur taille : on s'est ramené à comparer les constantes de temps \(\lambda^c\) entre elles.

En pratique, on prend \[ t^c_0 = \min \left\{t ; n^c(t) > \tau \right\}. \]

# Parameters
column    = "total_deaths"
threshold = 100
countries = ["Italy", "Spain", "France", "United Kingdom", "Germany", "Switzerland"]

total = {}
for country in countries:
    total[country] = data_raw.query(f"location == '{country}' & {column} > {threshold}")

total[countries[2]]
           location  new_cases  new_deaths  total_cases  total_deaths
date
2020-03-16   France        924          36         5423           127
2020-03-17   France       1210          21         6633           148
2020-03-18   France       1097          27         7730           175
2020-03-19   France       1404          69         9134           244
2020-03-20   France       1861         128        10995           372
2020-03-21   France       1617          78        12612           450
2020-03-22   France       1847         112        14459           562
2020-03-23   France       1559         112        16018           674
2020-03-24   France       3838         186        19856           860
2020-03-25   France       2446         240        22302          1100
2020-03-26   France       2931         231        25233          1331
2020-03-27   France       3922         365        29155          1696
2020-03-28   France       3809         299        32964          1995
2020-03-29   France       4611         319        37575          2314
2020-03-30   France       2599         292        40174          2606
2020-03-31   France       4376         418        44550          3024
2020-04-01   France       7578         499        52128          3523
2020-04-02   France       4861         509        56989          4032
2020-04-03   France       2116         471        59105          4503
2020-04-04   France       5233        2004        64338          6507
2020-04-05   France       4267        1053        68605          7560
2020-04-06   France       1873         518        70478          8078
2020-04-07   France       3912         833        74390          8911
2020-04-08   France       3777        1417        78167         10328
2020-04-09   France       3881         541        82048         10869
2020-04-10   France       4286        1341        86334         12210
2020-04-11   France       4342         987        90676         13197
2020-04-12   France       3114         635        93790         13832
2020-04-13   France       1613         561        95403         14393
2020-04-14   France       2673         574        98076         14967
2020-04-15   France       5497         762       103573         15729
2020-04-16   France       2633        1438       106206         17167
2020-04-17   France       2641         753       108847         17920
2020-04-18   France        405         761       109252         18681

total.png

4 Vers un passage du pic ?

On s'intéresse ici à l'atteinte d'un pic du nombre de décès quotidiens liés à Covid-19. Là encore, l'axe temporel est recalé afin de permettre une comparaison entre pays : \(t=0\) est positionné au moment où le nombre quotidien de morts dépasse 15.

threshold = 15

daily = {}
for country in countries:
    daily[country] = data_raw.query(f"location == '{country}' & new_deaths > {threshold}")

daily[countries[2]]
           location  new_cases  new_deaths  total_cases  total_deaths
date
2020-03-14   France        785          18         3661            79
2020-03-16   France        924          36         5423           127
2020-03-17   France       1210          21         6633           148
2020-03-18   France       1097          27         7730           175
2020-03-19   France       1404          69         9134           244
2020-03-20   France       1861         128        10995           372
2020-03-21   France       1617          78        12612           450
2020-03-22   France       1847         112        14459           562
2020-03-23   France       1559         112        16018           674
2020-03-24   France       3838         186        19856           860
2020-03-25   France       2446         240        22302          1100
2020-03-26   France       2931         231        25233          1331
2020-03-27   France       3922         365        29155          1696
2020-03-28   France       3809         299        32964          1995
2020-03-29   France       4611         319        37575          2314
2020-03-30   France       2599         292        40174          2606
2020-03-31   France       4376         418        44550          3024
2020-04-01   France       7578         499        52128          3523
2020-04-02   France       4861         509        56989          4032
2020-04-03   France       2116         471        59105          4503
2020-04-04   France       5233        2004        64338          6507
2020-04-05   France       4267        1053        68605          7560
2020-04-06   France       1873         518        70478          8078
2020-04-07   France       3912         833        74390          8911
2020-04-08   France       3777        1417        78167         10328
2020-04-09   France       3881         541        82048         10869
2020-04-10   France       4286        1341        86334         12210
2020-04-11   France       4342         987        90676         13197
2020-04-12   France       3114         635        93790         13832
2020-04-13   France       1613         561        95403         14393
2020-04-14   France       2673         574        98076         14967
2020-04-15   France       5497         762       103573         15729
2020-04-16   France       2633        1438       106206         17167
2020-04-17   France       2641         753       108847         17920
2020-04-18   France        405         761       109252         18681

Le pic observé pour la France au 04/04 (jour 20 sur le graphique) correspond à la prise en compte instantanée de tous les décès en EHPAD, dont le décompte est disponible à partir du 01/02 (cf. données du gouvernement)

daily.png

Auteur: François Févotte

Created: 2020-04-19 Sun 00:28

Validate