module3/exo3/exercice.ipynb

parent c588a7a1
...@@ -2235,6 +2235,14 @@ ...@@ -2235,6 +2235,14 @@
"print(data.columns)" "print(data.columns)"
] ]
}, },
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Objectif: regrouper et analyser les émissions de dioxyde de carbone (CO2) en fonction des années.\n",
"On commence par extraire les années uniques à partir d'un ensemble de données, puis somme les émissions de CO2 pour chaque année. Les résultats sont ensuite stockés dans une série pandas pour une analyse ultérieure. Enfin, le code génère un graphique de dispersion pour visualiser l'évolution des émissions annuelles de CO2 au fil du temps. Cette approche permet de mettre en évidence les tendances et les variations annuelles des émissions de CO2, facilitant ainsi une compréhension plus approfondie de l'impact environnemental sur une période donnée."
]
},
{ {
"cell_type": "code", "cell_type": "code",
"execution_count": 61, "execution_count": 61,
...@@ -2276,7 +2284,6 @@ ...@@ -2276,7 +2284,6 @@
} }
], ],
"source": [ "source": [
"#question1\n",
"# Grouper par année (Yr) et sommer les valeurs de CO2\n", "# Grouper par année (Yr) et sommer les valeurs de CO2\n",
"annees = data[' Yr'].unique() # Obtenir la liste des années uniques\n", "annees = data[' Yr'].unique() # Obtenir la liste des années uniques\n",
"\n", "\n",
...@@ -2410,62 +2417,76 @@ ...@@ -2410,62 +2417,76 @@
"plt.show()" "plt.show()"
] ]
}, },
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On réalise une analyse des données de concentration de CO2 en utilisant des techniques de traitement de séries chronologiques. On commence par extraire les données d'année et de concentration de CO2, puis appliquer la transformation de Fourier pour identifier les composantes périodiques. Les fréquences principales sont détectées pour caractériser ces oscillations. Pour modéliser la tendance à long terme, une régression linéaire est employée, et ses paramètres sont estimés. L'extrapolation de cette tendance est effectuée jusqu'en 2023 à l'aide du modèle. Le résultat est illustré dans deux graphiques : le premier expose la concentration de CO2 avec ses oscillations périodiques, tandis que le second dépeint la contribution lente avec une extrapolation jusqu'en 2023. Cette analyse permet de visualiser les tendances périodiques et à long terme dans les données de CO2, offrant un aperçu utile pour des analyses et des prévisions futures."
]
},
{ {
"cell_type": "code", "cell_type": "code",
"execution_count": 26, "execution_count": 45,
"metadata": {}, "metadata": {},
"outputs": [ "outputs": [
{ {
"ename": "ValueError", "data": {
"evalue": "to assemble mappings requires at least that [year, month, day] be specified: [month,year] is missing", "image/png": "\n",
"output_type": "error", "text/plain": [
"traceback": [ "<Figure size 1080x432 with 2 Axes>"
"\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", ]
"\u001b[0;31mValueError\u001b[0m Traceback (most recent call last)", },
"\u001b[0;32m<ipython-input-26-803ed48c5d4a>\u001b[0m in \u001b[0;36m<module>\u001b[0;34m\u001b[0m\n\u001b[1;32m 3\u001b[0m \u001b[0mdata\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mdata\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0massign\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mJr\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 4\u001b[0m \u001b[0;31m# Créez une colonne de date en combinant Year et Month\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m----> 5\u001b[0;31m \u001b[0mdata\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m'Date'\u001b[0m\u001b[0;34m]\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mpd\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mto_datetime\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mdata\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m' Yr'\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m' Mn'\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m'Jr'\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0massign\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mday\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 6\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 7\u001b[0m \u001b[0;31m# Supprimez les colonnes Year et Month si nécessaire\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "metadata": {
"\u001b[0;32m/opt/conda/lib/python3.6/site-packages/pandas/core/tools/datetimes.py\u001b[0m in \u001b[0;36mto_datetime\u001b[0;34m(arg, errors, dayfirst, yearfirst, utc, box, format, exact, unit, infer_datetime_format, origin)\u001b[0m\n\u001b[1;32m 374\u001b[0m \u001b[0mresult\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mSeries\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mvalues\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mindex\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0marg\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mindex\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mname\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0marg\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mname\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 375\u001b[0m \u001b[0;32melif\u001b[0m \u001b[0misinstance\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0marg\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m(\u001b[0m\u001b[0mABCDataFrame\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mMutableMapping\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 376\u001b[0;31m \u001b[0mresult\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0m_assemble_from_unit_mappings\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0marg\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0merrors\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0merrors\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 377\u001b[0m \u001b[0;32melif\u001b[0m \u001b[0misinstance\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0marg\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mABCIndexClass\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 378\u001b[0m \u001b[0mresult\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0m_convert_listlike\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0marg\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mbox\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mformat\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mname\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0marg\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mname\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "needs_background": "light"
"\u001b[0;32m/opt/conda/lib/python3.6/site-packages/pandas/core/tools/datetimes.py\u001b[0m in \u001b[0;36m_assemble_from_unit_mappings\u001b[0;34m(arg, errors)\u001b[0m\n\u001b[1;32m 453\u001b[0m raise ValueError(\"to assemble mappings requires at least that \"\n\u001b[1;32m 454\u001b[0m \u001b[0;34m\"[year, month, day] be specified: [{required}] \"\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 455\u001b[0;31m \"is missing\".format(required=','.join(req)))\n\u001b[0m\u001b[1;32m 456\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 457\u001b[0m \u001b[0;31m# keys we don't recognize\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", },
"\u001b[0;31mValueError\u001b[0m: to assemble mappings requires at least that [year, month, day] be specified: [month,year] is missing" "output_type": "display_data"
]
} }
], ],
"source": [ "source": [
"#question2\n", "from numpy.fft import fft\n",
"from statsmodels.tsa.seasonal import seasonal_decompose\n", "from scipy.signal import find_peaks\n",
"data = data.assign(Jr=1)\n", "from scipy.optimize import curve_fit\n",
"# Créez une colonne de date en combinant Year et Month\n", "import matplotlib.pyplot as plt\n",
"data['Date'] = pd.to_datetime(data[[' Yr', ' Mn', 'Jr']].assign(day=1))\n", "# Extraire la colonne des dates et de CO2\n",
"dates = year\n",
"co2_data = yearly_CO2.astype(float).values\n",
"#co2_data = np.pad(co2_data, (0, 2), 'constant', constant_values=(0, 0))\n",
"\n", "\n",
"# Supprimez les colonnes Year et Month si nécessaire\n", "# Appliquer la transformation de Fourier aux données pour identifier l'oscillation périodique\n",
"data = data.drop([' Yr', ' Mn', 'Jr'], axis=1)\n", "co2_fft = fft(co2_data)\n",
"frequencies = np.fft.fftfreq(len(co2_data))\n",
"amplitudes = np.abs(co2_fft)\n",
"\n", "\n",
"# Assurez-vous que 'Date' est un objet DateTime pour définir la fréquence\n", "# Trouver les fréquences principales (les périodes des oscillations)\n",
"data['Date'] = pd.to_datetime(data['Date'])\n", "peaks, _ = find_peaks(amplitudes)\n",
"periods = 1 / frequencies[peaks]\n",
"\n", "\n",
"# Décomposez les données en tendance, saisonnalité et résidus en spécifiant la fréquence\n", "# Créer un modèle simple pour la contribution lente: une régression linéaire\n",
"decomposition = seasonal_decompose(data[' CO2'], model='additive', freq=12) # Ici, 'freq=12' indique une fréquence mensuelle\n", "def linear_model(x, a, b):\n",
" return a * x + b\n",
"\n", "\n",
"# Extraire la tendance, la saisonnalité et les résidus\n", "# Adapter le modèle aux données pour estimer les paramètres a et b\n",
"tendance = decomposition.trend\n", "popt, _ = curve_fit(linear_model, np.arange(len(co2_data)), co2_data)\n",
"saisonnalite = decomposition.seasonal\n",
"residus = decomposition.resid\n",
"\n", "\n",
"# Créer un graphique pour visualiser l'oscillation périodique\n",
"plt.figure(figsize=(15, 6))\n",
"plt.subplot(2, 1, 1)\n",
"plt.plot(dates, co2_data)\n",
"plt.title('Concentration de CO2 avec Oscillation Périodique')\n",
"\n", "\n",
"# Extrapoler la tendance lente jusqu'à 2025\n",
"years = np.arange(1958, 2024)\n",
"extrapolated_data = linear_model(len(co2_data)+ years - 1958, *popt)\n",
"\n", "\n",
"# Tracer les composantes\n", "# Créer un graphique pour visualiser la contribution lente et l'extrapolation\n",
"plt.figure(figsize=(12, 6))\n", "plt.subplot(2, 1, 2)\n",
"plt.subplot(411)\n", "plt.plot(dates, co2_data, label='Données originales')\n",
"plt.plot(data[' Yr'], data[' CO2'], label='Données originales')\n", "plt.plot(dates, extrapolated_data, label='Extrapolation', linestyle='--', color='red')\n",
"plt.legend()\n", "plt.title('Contribution Lente et Extrapolation jusqu\\'à 2025')\n",
"plt.subplot(412)\n", "plt.xlabel('Année')\n",
"plt.plot(data[' Yr'], tendance, label='Tendance')\n", "plt.ylabel('Concentration de CO2')\n",
"plt.legend()\n",
"plt.subplot(413)\n",
"plt.plot(data[' Yr'], saisonnalite, label='Saisonnalité')\n",
"plt.legend()\n",
"plt.subplot(414)\n",
"plt.plot(data[' Yr'], residus, label='Résidus')\n",
"plt.legend()\n", "plt.legend()\n",
"\n",
"plt.tight_layout()\n", "plt.tight_layout()\n",
"plt.show()" "plt.show()"
] ]
...@@ -2475,28 +2496,7 @@ ...@@ -2475,28 +2496,7 @@
"execution_count": null, "execution_count": null,
"metadata": {}, "metadata": {},
"outputs": [], "outputs": [],
"source": [ "source": []
"#question3\n",
"from sklearn.linear_model import LinearRegression\n",
"\n",
"# Créer un modèle de régression linéaire\n",
"regression = LinearRegression()\n",
"\n",
"# Ajuster le modèle aux données de tendance\n",
"regression.fit(data['Date'].values.reshape(-1, 1), data['CO2'])\n",
"\n",
"# Obtenir les paramètres du modèle\n",
"pente = regression.coef_\n",
"intercept = regression.intercept_\n",
"\n",
"# Extrapoler les valeurs jusqu'en 2025\n",
"annee_2025 = 2025\n",
"co2_2025 = regression.predict([[annee_2025]])[0]\n",
"\n",
"# Afficher les résultats\n",
"print(f\"Équation de la régression linéaire : CO2 = {pente[0]} * Année + {intercept}\")\n",
"print(f\"Concentration de CO2 estimée pour 2025 : {co2_2025} ppm\")\n"
]
} }
], ],
"metadata": { "metadata": {
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment