Update Readme.md

parent dc672903
...@@ -176,7 +176,7 @@ Dans votre cas vous allez donner le lien ``https://www.scmp.com/`` à ``South Ch ...@@ -176,7 +176,7 @@ Dans votre cas vous allez donner le lien ``https://www.scmp.com/`` à ``South Ch
#### 3. Exploitation des données #### 3. Exploitation des données
Vous allez maintenant traiter les données que vous avez récupérées via le lien ``https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv``. Vous allez maintenant traiter les données que vous avez récupérées via le lien ``https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv``.
Votre but est d'extraire les données du nombre de personne ayant eu le Covid 19 depuis le début de l'épidémie en fonction de la date et du pays parmis les pays que nous avons selectionnés. Votre but est d'extraire les données du nombre de personne ayant eu le Covid 19 depuis le début de l'épidémie en fonction de la date et du pays parmis les pays que vous avez selectionnés.
Afin d'avoir exactement les mêmes données daté du 14/10/2022, enregitrez les données données suivantes : [ici](https://app-learninglab.inria.fr/moocrr/jupyter/user/f3525de4a1a18e7596f7a06bd19c9fc1/edit/work/module3/exo3/Donn%C3%A9es%20Covid%2019.csv), dans un document .csv nommé "Données Covid 19.csv" dans le même dossier que votre document computationnel. Afin d'avoir exactement les mêmes données daté du 14/10/2022, enregitrez les données données suivantes : [ici](https://app-learninglab.inria.fr/moocrr/jupyter/user/f3525de4a1a18e7596f7a06bd19c9fc1/edit/work/module3/exo3/Donn%C3%A9es%20Covid%2019.csv), dans un document .csv nommé "Données Covid 19.csv" dans le même dossier que votre document computationnel.
...@@ -185,7 +185,7 @@ Les différentes anotations en markdown dans cette partie n'étant pas une néce ...@@ -185,7 +185,7 @@ Les différentes anotations en markdown dans cette partie n'étant pas une néce
MARKDOWN : "## Exploitation des données" MARKDOWN : "## Exploitation des données"
MARKDOWN : "Afin de pouvoir traité ces données en python, il est nécessaire d'importer les bibliothèques python suivantes." MARKDOWN : "Afin de pouvoir traité ces données en python, il est nécessaire d'importer les bibliothèques python suivantes."
L'avantage de python est de pouvoir utiliser des bibliothèques contenant des fonctions déjà programmées. Nous avons utilisé les bibliothèques ``matplotlib.pyplot``, ``pandas`` et ``isoweek``. Pour cela, écrivez le code suivant : L'avantage de python est de pouvoir utiliser des bibliothèques contenant des fonctions déjà programmées. Vous allez utiliser les bibliothèques ``matplotlib.pyplot``, ``pandas`` et ``isoweek``. Pour cela, écrivez le code suivant :
``` ```
%matplotlib inline %matplotlib inline
...@@ -197,7 +197,7 @@ import isoweek ...@@ -197,7 +197,7 @@ import isoweek
MARKDOWN : "Pour ne pas avoir de problème de modification de données entre temps j'enregistre les données localement. Ces données n'évolueront donc pas ce qui évitera des problèmes par la suite. En revanche, la date la plus récentes est le 14/10/2022, date de la sauvegarde local." MARKDOWN : "Pour ne pas avoir de problème de modification de données entre temps j'enregistre les données localement. Ces données n'évolueront donc pas ce qui évitera des problèmes par la suite. En revanche, la date la plus récentes est le 14/10/2022, date de la sauvegarde local."
Nous pouvons maintenant ouvrir nos données à l'aide de la fonction ``pd.read_csv()``. Pour cela écrivez le code suivant : Vous pouvez maintenant ouvrir vos données à l'aide de la fonction ``pd.read_csv()``. Pour cela écrivez le code suivant :
``` ```
# data_url = "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv" # data_url = "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
...@@ -213,7 +213,7 @@ MARKDOWN : "Une fois nos données disponibles, je vais chercher les lignes des p ...@@ -213,7 +213,7 @@ MARKDOWN : "Une fois nos données disponibles, je vais chercher les lignes des p
Pour avoir le `.loc()` écrire ``<code>.loc()</code>`` Pour avoir le `.loc()` écrire ``<code>.loc()</code>``
Nous pouvons maintenant extraire les données pour chaque pays. Pour cela, il faut tout d'abord les localiser avec la fonction `.loc()` en écrivant le code suivant : Vous pouvez maintenant extraire les données pour chaque pays. Pour cela, il faut tout d'abord les localiser avec la fonction `.loc()` en écrivant le code suivant :
``` ```
Row_Belgium = data.loc[data['Country/Region'] == 'Belgium'] Row_Belgium = data.loc[data['Country/Region'] == 'Belgium']
...@@ -281,7 +281,7 @@ selected_data = selected_data.rename(columns={'index': 'Date'}) ...@@ -281,7 +281,7 @@ selected_data = selected_data.rename(columns={'index': 'Date'})
MARKDOWN : "Un fois nos données regroupées dans le DataFrame `selected_data`, je vais alors pouvoir les tracer avec la fonction `.plot()` de la bibliothèque Pandas." MARKDOWN : "Un fois nos données regroupées dans le DataFrame `selected_data`, je vais alors pouvoir les tracer avec la fonction `.plot()` de la bibliothèque Pandas."
Nos données étant stockées dans la dataframe nommée "frame", il ne reste plus qu'à tracer les données de chaque pays en fonction de la date. Pour cela utilisé le code suivant : Vos données étant stockées dans la dataframe nommée "frame", il ne reste plus qu'à tracer les données de chaque pays en fonction de la date. Pour cela utilisez le code suivant :
``` ```
colors = ['black', colors = ['black',
...@@ -322,8 +322,8 @@ plt.xticks([0,345,710,996], ...@@ -322,8 +322,8 @@ plt.xticks([0,345,710,996],
plt.grid(which='both', linestyle='--') plt.grid(which='both', linestyle='--')
``` ```
A REVOIR : Pour les détails sur le code n'hésité pas à consulter les documentations de ``matplotlib.pyplot`` [ici](https://matplotlib.org/), ``pandas`` [ici](https://pandas.pydata.org) et de ``isoweek`` [ici](https://pypi.org/project/isoweek/)
N'hésitez pas a chercher la signification de chaque ligne sur internet.
MARKDOWN : "Nous avons donc un graphique représentant le nombre de cas de Covid-19 en fonction de la date et du pays. Nous allons maintenant refaire ce graphique avec toutes les données de chaque pays selectionné cumulées." MARKDOWN : "Nous avons donc un graphique représentant le nombre de cas de Covid-19 en fonction de la date et du pays. Nous allons maintenant refaire ce graphique avec toutes les données de chaque pays selectionné cumulées."
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment