{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "from scipy.optimize import curve_fit\n", "import numpy as np\n", "import isoweek " ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "data_url = \"https://scrippsco2.ucsd.edu/assets/data/atmospheric/stations/in_situ_co2/monthly/monthly_in_situ_co2_mlo.csv\"\n", "data = \"monthly_in_situ_co2_mlo.csv\"\n", "# Vérifier si le fichier local existe, et s'il n'existe pas, le télécharger depuis l'URL\n", "import os\n", "import urllib.request\n", "\n", "# Vérifier si le fichier local n'existe pas\n", "if not os.path.exists(data):\n", " # Télécharger les données depuis l'URL et les enregistrer dans le fichier local\n", " urllib.request.urlretrieve(data_url, data)\n", " " ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Index([' Yr', ' Mn', ' Date', ' Date', ' CO2', 'seasonally',\n", " ' fit', ' seasonally', ' CO2', ' seasonally', ' Sta'],\n", " dtype='object')\n" ] } ], "source": [ " # Lire les données depuis le fichier local CSV en sautant la première ligne (commentaire)\n", "raw_data = pd.read_csv(data, skiprows=57)\n", "\n", "# Afficher les données brutes\n", "raw_data\n", " # Sélectionner les lignes contenant au moins une valeur manquante (NaN)\n", "raw_data[raw_data.isnull().any(axis=1)]\n", " # Supprimer les lignes contenant des valeurs manquantes (NaN) à partir des données brutes\n", "data = raw_data.dropna().copy()\n", "\n", "# Afficher les données nettoyées (sans valeurs manquantes) et en créer une copie\n", "data\n", "data = data.dropna(subset=[' CO2'])\n", "print(data.columns)" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "/opt/conda/lib/python3.6/site-packages/ipykernel_launcher.py:13: SettingWithCopyWarning: \n", "A value is trying to be set on a copy of a slice from a DataFrame.\n", "Try using .loc[row_indexer,col_indexer] = value instead\n", "\n", "See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy\n", " del sys.path[0]\n" ] }, { "data": { "text/plain": [ "" ] }, "execution_count": 6, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "# Grouper par année (Yr) et sommer les valeurs de CO2\n", "annees = data[' Yr'].unique() # Obtenir la liste des années uniques\n", "\n", "# Initialiser les listes pour stocker les années et les émissions de CO2 annuelles\n", "year = [] # Liste des années\n", "yearly_CO2 = [] # Liste des émissions annuelles de CO2\n", "\n", "for annee in annees:\n", " # Filtrer les données pour l'année spécifique\n", " donnees_annee = data[data[' Yr'] == annee]\n", " \n", " # Somme des émissions de CO2 pour l'année spécifique\n", " donnees_annee[' CO2'] = donnees_annee[' CO2'].astype(float)\n", " somme_co2_annee = donnees_annee[' CO2'].sum()\n", " \n", " # Ajouter l'année et la somme des émissions à leurs listes respectives\n", " year.append(annee)\n", " yearly_CO2.append(somme_co2_annee)\n", "\n", "# Créer une série pandas avec les données annuelles et les années comme index\n", "yearly_CO2 = pd.Series(data=yearly_CO2, index=year)\n", "# Tracer un graphique de dispersion des données d'incidence annuelle avec un style en étoile\n", "yearly_CO2.plot(style='*')" ] }, { "cell_type": "code", "execution_count": 44, "metadata": {}, "outputs": [ { "ename": "SyntaxError", "evalue": "invalid syntax (, line 16)", "output_type": "error", "traceback": [ "\u001b[0;36m File \u001b[0;32m\"\"\u001b[0;36m, line \u001b[0;32m16\u001b[0m\n\u001b[0;31m if response.status_code == 200:\u001b[0m\n\u001b[0m ^\u001b[0m\n\u001b[0;31mSyntaxError\u001b[0m\u001b[0;31m:\u001b[0m invalid syntax\n" ] } ], "source": [ "#Séparez ces deux phénomènes. Caractérisez l'oscillation périodique. Proposez un modèle simple de la contribution lente, estimez ses paramètres et tentez une extrapolation jusqu'à 2025 (dans le but de pouvoir valider le modèle par des observations futures).\n", "import requests\n", "import certifi\n", "from bs4 import BeautifulSoup\n", "import pandas as pd\n", "import numpy as np\n", "import matplotlib.pyplot as plt\n", "from scipy.optimize import curve_fit\n", "\n", "# URL de la page avec les données de CO2\n", "url = \"https://scrippsco2.ucsd.edu/data/atmospheric_co2/primary_mlo_co2_record.html\"\n", "\n", "# Envoyer une requête GET pour récupérer la page web avec vérification SSL\n", "response = requests.get(url, verify=False\n", "# Vérifier que la requête s'est bien déroulée\n", "if response.status_code == 200:\n", " # Parser le contenu HTML de la page en utilisant html5lib\n", " soup = BeautifulSoup(response.content, \"html5lib\")\n", "\n", " # Trouver la table qui contient les données de CO2 (l'élément correspondant)\n", " table = soup.find(\"table\")\n", "\n", " # Utiliser Pandas pour extraire les données tabulaires\n", " data = pd.read_html(str(table))[0]\n", "\n", " # Les données contiennent probablement des colonnes de date et de CO2. Vous pouvez les renommer.\n", " data.columns = [\"Date\", \"CO2\"]\n", "\n", " # Convertir la colonne de date en objets datetime\n", " data[\"Date\"] = pd.to_datetime(data[\"Date\"])\n", "\n", " # Tracer les données\n", " plt.figure(figsize=(12, 6))\n", " plt.plot(data[\"Date\"], data[\"CO2\"])\n", " plt.title(\"Concentration de CO2 dans l'atmosphère au Mauna Loa Observatory\")\n", " plt.xlabel(\"Date\")\n", " plt.ylabel(\"Concentration de CO2 (ppm)\")\n", "\n", " # Définition d'une fonction pour le modèle de la contribution lente (par exemple, une fonction linéaire)\n", " def slow_contrib(x, a, b):\n", " return a * x + b\n", "\n", " # Ajustement du modèle aux données\n", " popt, _ = curve_fit(slow_contrib, data.index, data[\"CO2\"])\n", " a, b = popt\n", "\n", " # Extrapolation jusqu'en 2025\n", " future_dates = pd.date_range(start=data[\"Date\"].min(), end=pd.to_datetime(\"2025-01-01\"))\n", " future_indices = np.arange(len(data), len(data) + len(future_dates))\n", " future_co2 = slow_contrib(future_indices, a, b)\n", "\n", " # Tracer l'extrapolation\n", " plt.plot(future_dates, future_co2, label=\"Extrapolation jusqu'en 2025\")\n", " plt.legend()\n", "\n", " # Afficher le graphique\n", " plt.grid(True)\n", " plt.show()\n", "else:\n", " print(\"La requête a échoué. Code de statut :\", response.status_code)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.4" } }, "nbformat": 4, "nbformat_minor": 2 }