From 46d783f7f9dc47bbc0ec755128273b4673c42929 Mon Sep 17 00:00:00 2001 From: Val Date: Wed, 24 May 2023 12:34:16 +0200 Subject: [PATCH] correction --- module3/Md3.Rmd | 126 ++++++++++++++++++++++ module3/exo1/analyse-syndrome-grippal.Rmd | 6 +- module3/exo2/exercice_fr.Rmd | 110 +++++++++++++++++-- 3 files changed, 230 insertions(+), 12 deletions(-) create mode 100644 module3/Md3.Rmd diff --git a/module3/Md3.Rmd b/module3/Md3.Rmd new file mode 100644 index 0000000..ce9a59d --- /dev/null +++ b/module3/Md3.Rmd @@ -0,0 +1,126 @@ +--- +title: "Analyse de l'incidence du syndrôme grippal" +author: "John" +date: "2023-05-24" +output: html_document +--- + +```{r setup, include=FALSE} +knitr::opts_chunk$set(echo = TRUE) +``` + +```{r} +url_data="https://www.sentiweb.fr/datasets/incidence-PAY-3.csv" +data=read.csv(url_data,skip=1) +head(data) +``` +On va retirer les datas post-2020 pour éviter la perturbation covid + +```{r} +data<-data[data$week<202001,] +head(data) +``` + +On enlève la/les lignes vides +```{r} +lignes_na<-apply(data,1,function(x) any(is.na(x))) +data_na<-data[lignes_na,] +data_nona<-data[-lignes_na,] +nrow(data_nona) +nrow(data) + +``` +On check le format des colonnes +```{r} +head(data_nona) +``` +Loading parsedate, configuring function +```{r} +library(parsedate) +date=199501 +ws=as.character(date) +iso= paste0(substring(ws,1,4),"-W",substring(ws,5,6)) +parse_iso_8601(iso) + +convert_week= function(date){ + ws=as.character(date) + iso= paste0(substring(ws,1,4),"-W",substring(ws,5,6)) + output=as.Date(parse_iso_8601(iso)) + return(output) +} +``` + +```{r} +data$date=convert_week(data$week) +head(data) +class(data$date) + +``` +triage des données dans l'ordere chrono + +```{r} +data<-data[order(data$date),] +head(data) +``` +test pour la chronologie +```{r} +all(diff(data$date)==7) +``` +représentation visuelle + +```{r} +with(data,plot(date,inc,type="l")) +``` +```{r} +with(tail(data,250),plot(date,inc,type="l")) +``` + +```{r} +annee=1990 +debut=paste0(annee-1,"-08-01") +fin=paste0(annee,"-08-01") +semaines=data$date > debut & data$date <= fin +sum(data$inc[semaines],na.rm=TRUE) +``` +généralisation + +```{r} +pic_annuel=function(annee) { +debut=paste0(annee-1,"-08-01") +fin=paste0(annee,"-08-01") +semaines=data$date > debut & data$date <= fin +output=sum(data$inc[semaines],na.rm=TRUE) +return(output) +} +``` + +rvm 1985 + +```{r} +annees=1986:2017 +icd_annuelle = data.frame(annee=annees,icd=sapply(annees,pic_annuel)) +head(icd_annuelle) +``` +représentation graphique +```{r} +plot(icd_annuelle,type="p") +``` +max + +```{r} +head(icd_annuelle[order(-icd_annuelle$icd),]) +``` + +représentation graphique +```{r} +hist(icd_annuelle$icd,breaks=10) +``` + + + + + + + + + diff --git a/module3/exo1/analyse-syndrome-grippal.Rmd b/module3/exo1/analyse-syndrome-grippal.Rmd index bfb34b1..1d03d2a 100644 --- a/module3/exo1/analyse-syndrome-grippal.Rmd +++ b/module3/exo1/analyse-syndrome-grippal.Rmd @@ -24,7 +24,11 @@ knitr::opts_chunk$set(echo = TRUE) Passer la variable en TRUE pour un chargement par téléchargement ```{r} -download_opt=FALSE + data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv" + data_file="C:/Users/Valentin/Downloads/incidence-PAY-3.csv" #Replace by data path + download_opt==FALSE + if (!file.exists(data_file)) { + download.file(data_url, data_file, method="auto")} ``` diff --git a/module3/exo2/exercice_fr.Rmd b/module3/exo2/exercice_fr.Rmd index 7eece5e..7fd92b7 100644 --- a/module3/exo2/exercice_fr.Rmd +++ b/module3/exo2/exercice_fr.Rmd @@ -10,24 +10,112 @@ output: html_document knitr::opts_chunk$set(echo = TRUE) ``` -## Quelques explications +```{r} +url_data="https://www.sentiweb.fr/datasets/incidence-PAY-7.csv" +data=read.csv(url_data,skip=1) +head(data) +``` +On va retirer les datas post-2020 pour éviter la perturbation covid + +```{r} +#data<-data[data$week<202001,] +head(data) +``` + +On enlève la/les lignes vides +```{r} +lignes_na<-apply(data,1,function(x) any(is.na(x))) +data_na<-data[lignes_na,] +data_nona<-data[-lignes_na,] +nrow(data_nona) +nrow(data) + +``` +On check le format des colonnes +```{r} +head(data_nona) +``` +Loading parsedate, configuring function +```{r} +library(parsedate) +date=199501 +ws=as.character(date) +iso= paste0(substring(ws,1,4),"-W",substring(ws,5,6)) +parse_iso_8601(iso) + +convert_week= function(date){ + ws=as.character(date) + iso= paste0(substring(ws,1,4),"-W",substring(ws,5,6)) + output=as.Date(parse_iso_8601(iso)) + return(output) +} +``` + +```{r} +data$date=convert_week(data$week) +head(data) +class(data$date) + +``` +triage des données dans l'ordere chrono -Ceci est un document R markdown que vous pouvez aisément exporter au format HTML, PDF, et MS Word. Pour plus de détails sur R Markdown consultez . +```{r} +data<-data[order(data$date),] +head(data) +``` +test pour la chronologie +```{r} +all(diff(data$date)==7) +``` +représentation visuelle -Lorsque vous cliquerez sur le bouton **Knit** ce document sera compilé afin de ré-exécuter le code R et d'inclure les résultats dans un document final. Comme nous vous l'avons montré dans la vidéo, on inclue du code R de la façon suivante: +```{r} +with(data,plot(date,inc,type="l")) +``` +```{r} +with(tail(data,250),plot(date,inc,type="l")) +``` -```{r cars} -summary(cars) +```{r} +annee=1990 +debut=paste0(annee-1,"-08-01") +fin=paste0(annee,"-08-01") +semaines=data$date > debut & data$date <= fin +sum(data$inc[semaines],na.rm=TRUE) ``` +généralisation -Et on peut aussi aisément inclure des figures. Par exemple: +```{r} +pic_annuel=function(annee) { +debut=paste0(annee-1,"-09-01") +fin=paste0(annee,"-09-01") +semaines=data$date > debut & data$date <= fin +output=sum(data$inc[semaines],na.rm=TRUE) +return(output) +} +``` -```{r pressure, echo=FALSE} -plot(pressure) +rvm 1985 + +```{r} +annees=1992:2022 +icd_annuelle = data.frame(annee=annees,icd=sapply(annees,pic_annuel)) +head(icd_annuelle) +``` +représentation graphique +```{r} +plot(icd_annuelle,type="p") ``` +max -Vous remarquerez le paramètre `echo = FALSE` qui indique que le code ne doit pas apparaître dans la version finale du document. Nous vous recommandons dans le cadre de ce MOOC de ne pas utiliser ce paramètre car l'objectif est que vos analyses de données soient parfaitement transparentes pour être reproductibles. +```{r} +head(icd_annuelle[order(-icd_annuelle$icd),]) +tail(icd_annuelle[order(-icd_annuelle$icd),]) -Comme les résultats ne sont pas stockés dans les fichiers Rmd, pour faciliter la relecture de vos analyses par d'autres personnes, vous aurez donc intérêt à générer un HTML ou un PDF et à le commiter. +``` + +représentation graphique +```{r} +hist(icd_annuelle$icd,breaks=10) +``` -Maintenant, à vous de jouer! Vous pouvez effacer toutes ces informations et les remplacer par votre document computationnel. -- 2.18.1