Update exercice_fr.Rmd

ec9994b2 · d7227cde42eb97d8aac791d907b6bbae · 63df71af · ec9994b2
Commit ec9994b2 authored Aug 21, 2024 by d7227cde42eb97d8aac791d907b6bbae
Hide whitespace changes
Inline Side-by-side

Showing with 41 additions and 19 deletions

exercice_fr.Rmd module2/exo4/exercice_fr.Rmd +41 -19

No files found.
--- a/module2/exo4/exercice_fr.Rmd
+++ b/module2/exo4/exercice_fr.Rmd
 ---
-title: "Votre titre"
+title: "Exemple de journal"
-author: "Votre nom"
+author: "Nathan Drogue"
-date: "La date du jour"
+date: '21 août 2024'
 output: html_document
 ---
 ```{r setup, include=FALSE}
 knitr::opts_chunk$set(echo = TRUE)
 ```
-## Quelques explications
+## Données d'entrée
+Je n'ai actuellement pas de données particulièrement intéressantes à analyser. J'ai donc fait appel aux données météo France pour le département 63 comme base pour cet exercice. Elle peuvent être retrouvée [ici](https://www.data.gouv.fr/fr/datasets/r/d834495a-86d7-40e5-b663-db0b6cc34d84).
-Ceci est un document R markdown que vous pouvez aisément exporter au format HTML, PDF, et MS Word. Pour plus de détails sur R Markdown consultez <http://rmarkdown.rstudio.com>.
-Lorsque vous cliquerez sur le bouton **Knit** ce document sera compilé afin de ré-exécuter le code R et d'inclure les résultats dans un document final. Comme nous vous l'avons montré dans la vidéo, on inclue du code R de la façon suivante:
+Voici un aperçu du jeu de données source :
+```{r data, prompt=F, warning=F}
-```{r cars}
+library(data.table)
-summary(cars)
+raw_data <- data.table::fread("./Q_63_1871-1949_RR-T-Vent.csv")
+head(raw_data)
 ```
-Et on peut aussi aisément inclure des figures. Par exemple:
+## Température moyenne
+Je m'intéresse en particulier à confronter la pluviométrie et l'altitude de ces différents sites. En plus, il faut que j'effectue une conversion sur la colonne temps qui n'est pas très lisible, et je ne veux que les données du XXème siècle et après...
-```{r pressure, echo=FALSE}
+```{r temp, prompt=F, warning=F}
-plot(pressure)
+library(dplyr)
+rr_20eme <- raw_data %>%
+  dplyr::select(NOM_USUEL, AAAAMMJJ, RR, ALTI) %>%
+  dplyr::mutate(JOUR = as.Date.character(AAAAMMJJ, format = "%Y%m%d")) %>%
+  dplyr::select(-AAAAMMJJ) %>%
+  dplyr::filter(year(JOUR)>="1900")
+head(rr_20eme)
 ```
-Vous remarquerez le paramètre `echo = FALSE` qui indique que le code ne doit pas apparaître dans la version finale du document. Nous vous recommandons dans le cadre de ce MOOC de ne pas utiliser ce paramètre car l'objectif est que vos analyses de données soient parfaitement transparentes pour être reproductibles. 
+Maintenant, j'aimerai savoir toutes les villes qui sont à ma disposition, ainsi que leurs cumul moyennes respectives par année.
+```{r temp, prompt=F, warning=F}
-Comme les résultats ne sont pas stockés dans les fichiers Rmd, pour faciliter la relecture de vos analyses par d'autres personnes, vous aurez donc intérêt à générer un HTML ou un PDF et à le commiter.
+print(unique(rr_20eme$NOM_USUEL))
+rr_grouped <- rr_20eme %>%
+  dplyr::mutate(ANNEE = year(JOUR)) %>% 
+  dplyr::group_by(NOM_USUEL, ANNEE) %>%
+  dplyr::summarise(RR_YCUM = sum(RR, na.rm = T),
+                   ALTI = unique(ALTI))
+head(rr_grouped)
+```
-Maintenant, à vous de jouer! Vous pouvez effacer toutes ces informations et les remplacer par votre document computationnel.
+Très bien, essayons maintenant de voir s'il pourrait exister un lien de corrélation entre l'altitude d'un site et la pluviométrie qu'il a reçu.
+```{r corr, warning=F, prompt=F}
+library(tidyverse)
+ggplot(rr_grouped) +
+  aes(x = ALTI, y = RR_YCUM, color = ANNEE) +
+  geom_point(alpha = .45) +
+  geom_smooth(method = "lm") +
+  scale_color_gradient(low="blue", high="red")
+  labs(x = "Altitude", y = "Pluviométrie annuelle cumulée")
+```
+Bon, il va falloir que je retravaille ça... En plus la répartition temporelle est très hétérogène.
\ No newline at end of file