--- title: "Votre titre" author: "Votre nom" date: "La date du jour" output: html_document --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE) ``` ###On commence par récupérer les données sur le site de la veille sanitaire ```{r} data_url = "https://www.sentiweb.fr/datasets/incidence-PAY-7.csv" ``` #Ensuite on importe les données, on le note "temp" car temporaire, le définitif étant le fichier local ```{r} datatemp <- read.csv(data_url) ``` #On constate que la fonction read.csv ne fonctionne pas bien dans ce cas ```{r} datatemp <- read.csv(data_url, skip = 1) ``` # C'est mieux avec l'argument skip !! ## On en fait ensuite une copie locale qu'on va ré-importer ensuite # copie locale ```{r} write.csv(datatemp, "datatemp.csv") ``` #ré-import ```{r} data <- read.csv("datatemp.csv") ``` #on inspecte les donnees et on constate : 1. une colonne est apparue en début de fichier 2. les données de dates nécessitent une transformation # 1. on supprime donc la colonne inutile: ```{r} data <- data[,-1] ``` # 2. on s'occupe de mettre les bons formats de date ```{r} # chargement du package library(parsedate) # création de la fonction convert_week = function(w) { ws = paste(w) iso = paste0(substring(ws, 1, 4), "-W", substring(ws, 5, 6)) as.character(parse_iso_8601(iso)) } # on applique la fonction au dataset data$date = as.Date(convert_week(data$week)) #on vérifie str(data$date) # et on remet dans l'ordre chronologique les dates data<- data[order(data$date),] #on vérifie str(data$date) ``` ### On va commencer à regarder nos données ! ```{r} plot(x=data$date, y=data$inc, type = 'l') ``` On constate déjà qu'il y a une certaine périodicité dans les données, probablement une incidence peut-être hivernale ? Nous allons tracer seulement une partie des données pour s'en rendre compte ```{r} plot(x=tail(data$date, 200), y=tail(data$inc,200), type = 'l') ``` Effectivement il semble y avoir une périodicité annuelle avec une augmentation de l'incidence lors du premier semestre avec un pic qui semble hivernal. Nous allons donc découper de façon à avoir l'incidence annuelle ! ### Incidence annuelle ```{r} # on crée la fonction qui permet d'avoir le pic annuel en calculant de septembre à septembre pic_annuel = function(annee) { debut = paste0(annee-1,"-09-01") fin = paste0(annee,"-09-01") semaines = data$date > debut & data$date <= fin sum(data$inc[semaines], na.rm=TRUE) } # on choisit les années qui vont bien car le recueil commence en 1990 annees <- 1991:2020 # et ensuite on effectue le calcul inc_annuelle = data.frame(annee = annees, incidence = sapply(annees, pic_annuel)) head(inc_annuelle) ```