diff --git a/module3/varicelle.Rmd b/module3/varicelle.Rmd new file mode 100644 index 0000000000000000000000000000000000000000..17bc6de3cd8a3cb7784ec65f23f2d534d3b8978e --- /dev/null +++ b/module3/varicelle.Rmd @@ -0,0 +1,94 @@ +--- +title: "Varicelle" +author: "Jerome E. Dauvergne" +date: "2025-04-28" +output: html_document +--- + +```{r setup, include=FALSE} +knitr::opts_chunk$set(echo = TRUE) +``` + +# Préparation des données + +Chargement du fichier depuis le réseau Sentinelle + +```{r} +data = read.csv("module3/inc-7-PAY.csv", skip = 1) +``` + +Regardons : +```{r} +head(data) +tail(data) +``` + +Données manquantes sur inc ? +```{r} +is.na(data$inc) +``` +Non + +## Conversion des formats de date +```{r} +library(parsedate) + +convert_week = function(w) { + ws = paste(w) + iso = paste0(substring(ws, 1, 4), "-W", substring(ws, 5, 6)) + as.character(parse_iso_8601(iso)) +} +``` + +Appliquons cette formule en créant une nouvelle variable date +```{r} +data$date = as.Date(convert_week(data$week)) +``` +Verifions qu'elle soit bien au format date +```{r} +class(data$date) +``` +Reordonnons le fichier dans l'ordre chronologique +```{r} +data <- data[order(data$date),] +``` +Toutes les dates ont-elles bien 7 jours d'écart ? +```{r} +all(diff(data$date) == 7) +``` +Oui ! + +## Inspection +```{r} +plot(data$date, data$inc, type="l", xlab="Date", ylab="Incidence hebdomadaire") +``` + +# Question 1 - Année avec la plus forte épidémie - incidence annuelle +Création d'une fonction pour calculer cette incidence annuelle +```{r} +pic_annuel = function(annee) { + debut = paste0(annee-1,"-01-01") + fin = paste0(annee,"-01-01") + semaines = data$date > debut & data$date <= fin + sum(data$inc[semaines], na.rm=TRUE) + } + +``` + +Appliquons là aux données +```{r} +annees = 1990:2025 +inc_annuelle = data.frame(annee = annees, + incidence = sapply(annees, pic_annuel)) +head(inc_annuelle) + +``` +## Inspection visuelle +```{r} +plot(inc_annuelle, type="p", xlab="Année", ylab="Incidence annuelle") +``` +Année avec incidence la plus haute +```{r} +inc_annuelle$annee[max(inc_annuelle$incidence)] +``` +