In [7]:
# Analyse des données de CO₂ de l'observatoire Mauna Loa
%matplotlib inline
import matplotlib.pyplot as plt
import pandas as pd

# URL des données de concentration de CO₂ en format CSV depuis le site de Scripps CO₂ Program
data_url = "https://scrippsco2.ucsd.edu/assets/data/atmospheric/stations/in_situ_co2/monthly/monthly_in_situ_co2_mlo.csv"

# Chargement des données et ignorer les lignes de commentaires en début de fichier
# (Lignes de commentaires de 0 à 56 incluses, donc on saute les 57 premières lignes)
raw_data = pd.read_csv(data_url, sep=';', skiprows=57)

# Affichage des premières lignes du jeu de données pour comprendre sa structure
raw_data.head()

# Vérification des valeurs manquantes
print("Valeurs manquantes :")
print(raw_data.isnull().sum())

# Suppression des lignes avec des valeurs manquantes
data = raw_data.dropna()

# Conversion de l'année et du mois en un format de date standard pour faciliter l'analyse chronologique
raw_data['date'] = pd.to_datetime(raw_data[['2008', '12']].assign(day=1))

# Tracé de la concentration de CO₂ au fil du temps
plt.figure(figsize=(12, 6))
plt.plot(data['date'], data['average'], label='Concentration moyenne de CO₂ (ppm)', color='black')
plt.xlabel('Année')
plt.ylabel('Concentration de CO₂ (ppm)')
plt.title('Concentration mensuelle moyenne de CO₂ à Mauna Loa (1958 - présent)')
plt.legend()
plt.show()

# Analyse des tendances avec une moyenne annuelle glissante pour observer la tendance à long terme
data['yearly_avg'] = data['average'].rolling(window=12).mean()

plt.figure(figsize=(12, 6))
plt.plot(data['date'], data['average'], label='CO₂ mensuel', color='grey')
plt.plot(data['date'], data['yearly_avg'], label='Moyenne annuelle glissante', color='blue')
plt.xlabel('Année')
plt.ylabel('Concentration de CO₂ (ppm)')
plt.title('Tendance de la concentration de CO₂ à Mauna Loa')
plt.legend()
plt.show()

# Étude de l'incidence annuelle
# Extraction de l'année pour faciliter le regroupement annuel
data['year'] = data['date'].dt.year

# Calcul de la concentration annuelle moyenne
yearly_co2 = data.groupby('year')['average'].mean()

# Visualisation de l'évolution annuelle
plt.figure(figsize=(12, 6))
yearly_co2.plot(style='*', color='green')
plt.xlabel("Année")
plt.ylabel("Concentration annuelle moyenne de CO₂ (ppm)")
plt.title("Évolution de la concentration annuelle moyenne de CO₂ à Mauna Loa")
plt.show()

# Distribution des concentrations annuelles de CO₂ pour évaluer les années avec les concentrations les plus élevées
df_yearly_co2 = yearly_co2.sort_values().reset_index()
df_yearly_co2.columns = ['Année', 'Concentration moyenne de CO₂ (ppm)']
df_yearly_co2

# Histogramme de la distribution annuelle de CO₂
yearly_co2.hist(xrot=20, color='skyblue')
plt.xlabel("Concentration annuelle moyenne de CO₂ (ppm)")
plt.ylabel("Nombre d'années")
plt.title("Distribution de la concentration annuelle moyenne de CO₂ à Mauna Loa")
plt.show()


Valeurs manquantes :
 from Dec 2022 through Feb 2023    0
dtype: int64


KeyError: "['2008' '12'] not in index"