diff --git a/module3/exo2/exercice_fr.Rmd b/module3/exo2/exercice_fr.Rmd index 7eece5e296bb586e88166aa8a263ca75b44c2b9e..0e1aabff63549969d20b1eb832ee098685438266 100644 --- a/module3/exo2/exercice_fr.Rmd +++ b/module3/exo2/exercice_fr.Rmd @@ -31,3 +31,59 @@ Vous remarquerez le paramètre `echo = FALSE` qui indique que le code ne doit pa Comme les résultats ne sont pas stockés dans les fichiers Rmd, pour faciliter la relecture de vos analyses par d'autres personnes, vous aurez donc intérêt à générer un HTML ou un PDF et à le commiter. Maintenant, à vous de jouer! Vous pouvez effacer toutes ces informations et les remplacer par votre document computationnel. + +```{r} +#data = read.csv(data_url, skip=1, na.strings=c("-")) +setwd("C:/Users/c.boyer/Documents/MOOC2") +data <- read.csv2("inc-3-PAY-ds2.csv") +``` +```{r} +na_records <- apply(data, 1, function (x) any(is.na(x))) +data[na_records,] +``` +```{r} +class(data$week) +class(data$inc) + +``` + +```{r} +library(parsedate) +convert_week = function(w) { + ws = paste(w) + iso = paste0(substring(ws, 1, 4), "-W", substring(ws, 5, 6)) + as.character(parse_iso_8601(iso)) +} + +data$date = as.Date(convert_week(data$week)) +class(data$date) +``` +```{r} +#Les points sont dans l'ordre chronologique inverse, il est donc utile de les trier: + +data = data[order(data$date),] +#C'est l'occasion pour faire une vérification: nos dates doivent être séparées d'exactement #sept jours: + +all(diff(data$date) == 7) +``` +```{r} +pic_annuel = function(annee) { + debut = paste0(annee-1,"-09-01") + fin = paste0(annee,"-09-01") + semaines = data$date > debut & data$date <= fin + sum(data$inc[semaines], na.rm=TRUE) + } +``` +```{r} +annees = 2017:2025 +``` + +```{r} +inc_annuelle = data.frame(annee = annees, + incidence = sapply(annees, pic_annuel)) +head(inc_annuelle) +``` + +```{r} +plot(inc_annuelle, type="p", xlab="Année", ylab="Incidence annuelle") +```