Update Readme.md

parent 09c06baa
...@@ -92,10 +92,9 @@ import pandas as pd ...@@ -92,10 +92,9 @@ import pandas as pd
data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv" data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv"
local_file = pathlib.Path("data/incidence_grippal.csv") local_file = pathlib.Path("data/incidence_grippal.csv")
#### Créer le dossier 'data' si nécessaire #### Faut changer par :
local_file.parent.mkdir(parents=True, exist_ok=True) local_file.parent.mkdir(parents=True, exist_ok=True)
#### Télécharger si la copie locale n'existe pas encore
if not local_file.exists(): if not local_file.exists():
print("Téléchargement du fichier depuis le Réseau Sentinelles…") print("Téléchargement du fichier depuis le Réseau Sentinelles…")
response = requests.get(data_url, timeout=30) response = requests.get(data_url, timeout=30)
...@@ -105,7 +104,6 @@ if not local_file.exists(): ...@@ -105,7 +104,6 @@ if not local_file.exists():
else: else:
print(f"✅ Données locales déjà présentes : {local_file}") print(f"✅ Données locales déjà présentes : {local_file}")
#### Lecture du fichier CSV local
raw_data = pd.read_csv(local_file, skiprows=1) raw_data = pd.read_csv(local_file, skiprows=1)
...@@ -114,24 +112,17 @@ raw_data = pd.read_csv(local_file, skiprows=1) ...@@ -114,24 +112,17 @@ raw_data = pd.read_csv(local_file, skiprows=1)
Avant de tracer les courbes, il faut : Avant de tracer les courbes, il faut :
- Supprimer les espaces éventuels dans les noms de colonnes. - Supprimer les espaces éventuels dans les noms de colonnes.
- Convertir la colonne 'inc' en données numériques. - Convertir la colonne 'inc' en données numériques.
- Vérifier que la colonne 'inc' contient bien des données valides. - Vérifier que la colonne 'inc' contient bien des données valides.
#### Étape 1 : Supprimer les espaces autour des noms de colonnes
sorted_data.columns = sorted_data.columns.str.strip() sorted_data.columns = sorted_data.columns.str.strip()
#### Étape 2 : Convertir la colonne 'inc' en type numérique
sorted_data['inc'] = pd.to_numeric(sorted_data['inc'], errors='coerce') sorted_data['inc'] = pd.to_numeric(sorted_data['inc'], errors='coerce')
#### Étape 3 : Vérifier les données
print("Valeurs manquantes dans 'inc' :", sorted_data['inc'].isnull().sum()) print("Valeurs manquantes dans 'inc' :", sorted_data['inc'].isnull().sum())
print("Valeurs valides dans 'inc' :", sorted_data['inc'].notnull().sum()) print("Valeurs valides dans 'inc' :", sorted_data['inc'].notnull().sum())
#### Étape 4 : Tracer la courbe
sorted_data['inc'].plot() sorted_data['inc'].plot()
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment