Les données de *la concentration du CO2 dans l'atmosphère* sont disponibles sur le site web du [Scripps CO2 Program](https://scrippsco2.ucsd.edu/data/atmospheric_co2/primary_mlo_co2_record.html), un site très intéressant comme on devrait en voir plus souvent de nos jours, sauf qu'il est américain. Mais je parle pas chinois donc j'avais pas trop le choix et je crois qu'en 1958, les chinois avaient autre chose à faire que de parler de CO2. Ils n'ont d'ailleurs toujours eu rien à foutre depuis.
Les données de *la concentration du CO2 dans l'atmosphère* sont disponibles sur le site web du [Scripps CO2 Program](https://scrippsco2.ucsd.edu/data/atmospheric_co2/primary_mlo_co2_record.html), un site très intéressant comme on devrait en voir plus souvent de nos jours, sauf qu'il est américain.
Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet, qui commence en 1991 et se termine avec une semaine récente.
Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet, qui commence en 1991 et se termine avec une semaine récente.
...
@@ -22,7 +24,6 @@ library(timeSeries)
...
@@ -22,7 +24,6 @@ library(timeSeries)
library(parsedate)
library(parsedate)
if (!file.exists("monthly_in_situ_co2_mlo.csv")) download.file("https://scrippsco2.ucsd.edu/assets/data/atmospheric/stations/in_situ_co2/monthly/monthly_in_situ_co2_mlo.csv", "monthly_in_situ_co2_mlo.csv", method="auto")
if (!file.exists("monthly_in_situ_co2_mlo.csv")) download.file("https://scrippsco2.ucsd.edu/assets/data/atmospheric/stations/in_situ_co2/monthly/monthly_in_situ_co2_mlo.csv", "monthly_in_situ_co2_mlo.csv", method="auto")
Bon ok c'est un peu mieux, moins confusant c'est déjà ça. Les 2 premières lignes sont suspectes. Voyons s'il ya en a d'autres. POour ça, faisons un petit graph :
Bon ok c'est un peu mieux, moins confusant c'est déjà ça. Les 2 premières lignes sont suspectes. Voyons s'il ya en a d'autres. Pour ça, faisons un petit graph :
```{r}
```{r}
plot(data_clean$DateExcel,data_clean$`CO2[ppm]`)
plot(data_clean$DateExcel,data_clean$`CO2[ppm]`)
```
```
...
@@ -72,10 +73,10 @@ head(data_clean2)
...
@@ -72,10 +73,10 @@ head(data_clean2)
plot(data_clean2$dateStd,data_clean2$`CO2[ppm]`)
plot(data_clean2$dateStd,data_clean2$`CO2[ppm]`)
```
```
On va pouvoir passer aux stats maintenant je pense, sauf si vous en avez déjà marre mais ça serait dommage d'arrêter en si bon chemin. Cette étude est vraiment pleine de suspens...
On va pouvoir passer aux stats maintenant. Cette étude est vraiment pleine de suspens...
## Modèle statistique
## Visualisation des oscillations périodiques et tendance
Regardons de plus près l'évolution de la série en focalisant sur des années, par exemple de 1980 à 1985:
Regardons de plus près l'évolution de la série en focalisant sur des années, par exemple de 1980 à 1985:
```{r}
```{r}
...
@@ -84,7 +85,7 @@ Regardons de plus près l'évolution de la série en focalisant sur des années,
...
@@ -84,7 +85,7 @@ Regardons de plus près l'évolution de la série en focalisant sur des années,
Nous observons bien une saisonalité de période annuelle. On ne va que s'intéresser dans la suite de cette étude aux données brutes c'est à dire le champ "*CO2(pm)*" car je ne sais pas trop à quoi correpond le reste des champs. Pour isoler la partie tendance, nous allons utiliser une technique simple de moyenne mobile. C'est un estimateur non-paramétrique de la tendance, au sens ou nous ne supposons pas de structure a-priori de cette tendance (par ex. linéaire ou polynomiale). On aurait aussi pu utiliser un lisasge par noyaux mais bon.
Nous observons bien une saisonalité de période annuelle. On ne va que s'intéresser dans la suite de cette étude aux données brutes c'est à dire le champ "*CO2(pm)*" car je ne sais pas trop à quoi correpond le reste des champs. Pour isoler la partie tendance, nous allons utiliser une technique simple de moyenne mobile. C'est un estimateur non-paramétrique de la tendance, au sens ou nous ne supposons pas de structure a-priori de cette tendance (par ex. linéaire ou polynomiale). On aurait aussi pu utiliser un lissage par noyaux mais bon restons sur des choses basiques.