diff --git a/module3/exo3/exercice.ipynb b/module3/exo3/exercice.ipynb index 174d495abf12a9866d2a2b7957cfdf45d366cd5b..9a86eadac4a830b4388606a170969a59f25c1c6f 100644 --- a/module3/exo3/exercice.ipynb +++ b/module3/exo3/exercice.ipynb @@ -66,7 +66,8 @@ "outputs": [], "source": [ "df = pd.read_csv('weekly_in_situ_co2_mlo.csv', header=44, names=['week', 'concentration'])\n", - "# Ici header=44 permet de sauter les premières lignes du csv qui ne contiennent pas de données" + "# Ici header=44 permet de sauter les premières \n", + "# lignes du csv qui ne contiennent pas de données" ] }, { @@ -482,10 +483,14 @@ }, "outputs": [], "source": [ - "df['year'] = df['week'].apply(lambda x:x.year) # on ajoute une colonne \"year\" qui correspond à l'année de la date \n", - "df['month'] = df['week'].apply(lambda x:x.month) # on ajoute une colonne \"month\" qui correspond au mois de la date\n", - "df_november = df[df[\"month\"] == 11] # on ne conserve dans un premier temps que les dates de novembre\n", - "df_first_november = df_november.drop_duplicates(subset=\"year\", keep='first') # on ne garde ensuite que la première semaine de novembre" + "df['year'] = df['week'].apply(lambda x:x.year) \n", + "# on ajoute une colonne \"year\" qui correspond à l'année de la date \n", + "df['month'] = df['week'].apply(lambda x:x.month) \n", + "# on ajoute une colonne \"month\" qui correspond au mois de la date\n", + "df_november = df[df[\"month\"] == 11] \n", + "# on ne conserve dans un premier temps que les dates de novembre\n", + "df_first_november = df_november.drop_duplicates(subset=\"year\", keep='first') \n", + "# on ne garde ensuite que la première semaine de novembre" ] }, { @@ -632,9 +637,12 @@ } ], "source": [ - "coef_reg = np.polyfit(np.arange(len(df_first_november['concentration'])), df_first_november['concentration'], 1) # on obtient les coefficients de la régression\n", + "coef_reg = np.polyfit(np.arange(len(df_first_november['concentration'])), \n", + " df_first_november['concentration'], 1) \n", + "# on obtient les coefficients de la régression\n", "print(coef_reg)\n", - "poly1d_fn = np.poly1d(coef_reg) # poly1d_fn est une fonction qui permet de faire une nouvelle prédiction avec les coefficients obtenus." + "poly1d_fn = np.poly1d(coef_reg) \n", + "# poly1d_fn est une fonction qui permet de faire une nouvelle prédiction avec les coefficients obtenus." ] }, { @@ -646,7 +654,8 @@ }, "outputs": [], "source": [ - "df_filtered = df_first_november[['week', 'concentration']] # on ne conserve que les colonnes week et concentration" + "df_filtered = df_first_november[['week', 'concentration']] \n", + "# on ne conserve que les colonnes week et concentration" ] }, { @@ -746,7 +755,9 @@ }, "outputs": [], "source": [ - "df_future = pd.DataFrame({'week':[datetime.datetime(2023, 11, 4), datetime.datetime(2024, 11, 2), datetime.datetime(2025, 11, 1)], \n", + "df_future = pd.DataFrame({'week':[datetime.datetime(2023, 11, 4), \n", + " datetime.datetime(2024, 11, 2), \n", + " datetime.datetime(2025, 11, 1)], \n", " \"concentration\":[None, None, None]})" ] }, @@ -828,7 +839,8 @@ }, "outputs": [], "source": [ - "df_concat = pd.concat([df_filtered, df_future]) # on concatène les dates actuelles avec les dates futures" + "df_concat = pd.concat([df_filtered, df_future]) \n", + "# on concatène les dates actuelles avec les dates futures" ] }, { @@ -923,7 +935,8 @@ }, "outputs": [], "source": [ - "df_concat[\"predictions\"] = poly1d_fn(np.arange(len(df_concat))) # on effectue les prédictions pour toutes les dates" + "df_concat[\"predictions\"] = poly1d_fn(np.arange(len(df_concat))) \n", + "# on effectue les prédictions pour toutes les dates" ] }, {