diff --git a/journal/Readme.md b/journal/Readme.md index e37b3e942ffd87fbfe56c626e981ac1f9e7fdeeb..f68a90f6f58aa30c70ac6dc6408fda02ce46c810 100644 --- a/journal/Readme.md +++ b/journal/Readme.md @@ -92,10 +92,9 @@ import pandas as pd data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv" local_file = pathlib.Path("data/incidence_grippal.csv") -#### Créer le dossier 'data' si nécessaire +#### Faut changer par : local_file.parent.mkdir(parents=True, exist_ok=True) -#### Télécharger si la copie locale n'existe pas encore if not local_file.exists(): print("Téléchargement du fichier depuis le Réseau Sentinelles…") response = requests.get(data_url, timeout=30) @@ -105,7 +104,6 @@ if not local_file.exists(): else: print(f"✅ Données locales déjà présentes : {local_file}") -#### Lecture du fichier CSV local raw_data = pd.read_csv(local_file, skiprows=1) @@ -114,24 +112,17 @@ raw_data = pd.read_csv(local_file, skiprows=1) Avant de tracer les courbes, il faut : - Supprimer les espaces éventuels dans les noms de colonnes. - - Convertir la colonne 'inc' en données numériques. - - Vérifier que la colonne 'inc' contient bien des données valides. - -#### Étape 1 : Supprimer les espaces autour des noms de colonnes sorted_data.columns = sorted_data.columns.str.strip() -#### Étape 2 : Convertir la colonne 'inc' en type numérique sorted_data['inc'] = pd.to_numeric(sorted_data['inc'], errors='coerce') -#### Étape 3 : Vérifier les données print("Valeurs manquantes dans 'inc' :", sorted_data['inc'].isnull().sum()) print("Valeurs valides dans 'inc' :", sorted_data['inc'].notnull().sum()) -#### Étape 4 : Tracer la courbe sorted_data['inc'].plot()