"## Seconde partie : formattage du dataset pour l'affichage du graphe par pays\n",
"\n",
"Pour formater le dataset, nous allons créer une fonction faisant office de filtre : si le pays est défini dans le tableau (qui représente tous les pays demandés dans l'énoncé) alors on le garde dans le dataset; sinon on le retire. Certains pays devant être affichés sans leurs colonies, le filtre le prendra en compte et retirera les lignes ou le champ *Province/State* est défini.\n",
"\n",
...
...
@@ -941,7 +941,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"## Troisième partie : affichage\n",
"## Troisième partie : affichage du graphe par pays\n",
"\n",
"Nos données sont prêtes : on les affiche en utilisant la fonction plot() fournie par matplotlib :"
]
...
...
@@ -954,7 +954,7 @@
{
"data": {
"text/plain": [
"<matplotlib.axes._subplots.AxesSubplot at 0x7f8248a8d518>"
"<matplotlib.axes._subplots.AxesSubplot at 0x7fec29c81668>"
]
},
"execution_count": 6,
...
...
@@ -978,6 +978,15 @@
"new_data.plot()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Quatrième partie : formattage des données pour les graphes cumulés sur le temps\n",
"\n",
"Pour ces graphes, on a juste à sommer toutes les lignes et se débarasser des données inutiles, puis formatter les champs temps string en datetime :"
]
},
{
"cell_type": "code",
"execution_count": 7,
...
...
@@ -986,16 +995,60 @@
{
"data": {
"text/plain": [
"<matplotlib.axes._subplots.AxesSubplot at 0x7f82429378d0>"
"2020-01-22 555\n",
"2020-01-23 654\n",
"2020-01-24 941\n",
"2020-01-25 1434\n",
"2020-01-26 2118\n",
" ... \n",
"2020-04-28 3097190\n",
"2020-04-29 3172287\n",
"2020-04-30 3256853\n",
"2020-05-01 3343777\n",
"2020-05-02 3427343\n",
"Length: 102, dtype: object"
]
},
"execution_count": 7,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"cumul_data = raw_data.copy()\n",
"cumul_data = cumul_data.sum()\n",
"cumul_data = cumul_data[3:]\n",
"cumul_data.index = [pd.to_datetime(datetext) for datetext in cumul_data.index]\n",
"cumul_data"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Cinquième partie : affichage des graphes montrant le nombre de contaminations cumulées dans le temps\n",
"\n",
"Maintenant, on affiche le plot sous format linéaire et logarithmique : "
]
},
{
"cell_type": "code",
"execution_count": 8,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"<matplotlib.axes._subplots.AxesSubplot at 0x7fec23ac7ba8>"
"Si l'on devait faire une petite analyse de ces graphes, on voit que le nombre de contaminations va à la hausse ... néanmoins, la courbe n'est pas exponentielle mais droite. Les mesures de confinement sont efficaces pour empêcher les contaminations."