Commit 46d783f7 authored by Val's avatar Val

correction

parent 4ad35689
---
title: "Analyse de l'incidence du syndrôme grippal"
author: "John"
date: "2023-05-24"
output: html_document
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```
```{r}
url_data="https://www.sentiweb.fr/datasets/incidence-PAY-3.csv"
data=read.csv(url_data,skip=1)
head(data)
```
On va retirer les datas post-2020 pour éviter la perturbation covid
```{r}
data<-data[data$week<202001,]
head(data)
```
On enlève la/les lignes vides
```{r}
lignes_na<-apply(data,1,function(x) any(is.na(x)))
data_na<-data[lignes_na,]
data_nona<-data[-lignes_na,]
nrow(data_nona)
nrow(data)
```
On check le format des colonnes
```{r}
head(data_nona)
```
Loading parsedate, configuring function
```{r}
library(parsedate)
date=199501
ws=as.character(date)
iso= paste0(substring(ws,1,4),"-W",substring(ws,5,6))
parse_iso_8601(iso)
convert_week= function(date){
ws=as.character(date)
iso= paste0(substring(ws,1,4),"-W",substring(ws,5,6))
output=as.Date(parse_iso_8601(iso))
return(output)
}
```
```{r}
data$date=convert_week(data$week)
head(data)
class(data$date)
```
triage des données dans l'ordere chrono
```{r}
data<-data[order(data$date),]
head(data)
```
test pour la chronologie
```{r}
all(diff(data$date)==7)
```
représentation visuelle
```{r}
with(data,plot(date,inc,type="l"))
```
```{r}
with(tail(data,250),plot(date,inc,type="l"))
```
```{r}
annee=1990
debut=paste0(annee-1,"-08-01")
fin=paste0(annee,"-08-01")
semaines=data$date > debut & data$date <= fin
sum(data$inc[semaines],na.rm=TRUE)
```
généralisation
```{r}
pic_annuel=function(annee) {
debut=paste0(annee-1,"-08-01")
fin=paste0(annee,"-08-01")
semaines=data$date > debut & data$date <= fin
output=sum(data$inc[semaines],na.rm=TRUE)
return(output)
}
```
rvm 1985
```{r}
annees=1986:2017
icd_annuelle = data.frame(annee=annees,icd=sapply(annees,pic_annuel))
head(icd_annuelle)
```
représentation graphique
```{r}
plot(icd_annuelle,type="p")
```
max
```{r}
head(icd_annuelle[order(-icd_annuelle$icd),])
```
représentation graphique
```{r}
hist(icd_annuelle$icd,breaks=10)
```
...@@ -24,7 +24,11 @@ knitr::opts_chunk$set(echo = TRUE) ...@@ -24,7 +24,11 @@ knitr::opts_chunk$set(echo = TRUE)
Passer la variable en TRUE pour un chargement par téléchargement Passer la variable en TRUE pour un chargement par téléchargement
```{r} ```{r}
download_opt=FALSE data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv"
data_file="C:/Users/Valentin/Downloads/incidence-PAY-3.csv" #Replace by data path
download_opt==FALSE
if (!file.exists(data_file)) {
download.file(data_url, data_file, method="auto")}
``` ```
......
...@@ -10,24 +10,112 @@ output: html_document ...@@ -10,24 +10,112 @@ output: html_document
knitr::opts_chunk$set(echo = TRUE) knitr::opts_chunk$set(echo = TRUE)
``` ```
## Quelques explications ```{r}
url_data="https://www.sentiweb.fr/datasets/incidence-PAY-7.csv"
data=read.csv(url_data,skip=1)
head(data)
```
On va retirer les datas post-2020 pour éviter la perturbation covid
```{r}
#data<-data[data$week<202001,]
head(data)
```
On enlève la/les lignes vides
```{r}
lignes_na<-apply(data,1,function(x) any(is.na(x)))
data_na<-data[lignes_na,]
data_nona<-data[-lignes_na,]
nrow(data_nona)
nrow(data)
```
On check le format des colonnes
```{r}
head(data_nona)
```
Loading parsedate, configuring function
```{r}
library(parsedate)
date=199501
ws=as.character(date)
iso= paste0(substring(ws,1,4),"-W",substring(ws,5,6))
parse_iso_8601(iso)
convert_week= function(date){
ws=as.character(date)
iso= paste0(substring(ws,1,4),"-W",substring(ws,5,6))
output=as.Date(parse_iso_8601(iso))
return(output)
}
```
```{r}
data$date=convert_week(data$week)
head(data)
class(data$date)
```
triage des données dans l'ordere chrono
Ceci est un document R markdown que vous pouvez aisément exporter au format HTML, PDF, et MS Word. Pour plus de détails sur R Markdown consultez <http://rmarkdown.rstudio.com>. ```{r}
data<-data[order(data$date),]
head(data)
```
test pour la chronologie
```{r}
all(diff(data$date)==7)
```
représentation visuelle
Lorsque vous cliquerez sur le bouton **Knit** ce document sera compilé afin de ré-exécuter le code R et d'inclure les résultats dans un document final. Comme nous vous l'avons montré dans la vidéo, on inclue du code R de la façon suivante: ```{r}
with(data,plot(date,inc,type="l"))
```
```{r}
with(tail(data,250),plot(date,inc,type="l"))
```
```{r cars} ```{r}
summary(cars) annee=1990
debut=paste0(annee-1,"-08-01")
fin=paste0(annee,"-08-01")
semaines=data$date > debut & data$date <= fin
sum(data$inc[semaines],na.rm=TRUE)
``` ```
généralisation
Et on peut aussi aisément inclure des figures. Par exemple: ```{r}
pic_annuel=function(annee) {
debut=paste0(annee-1,"-09-01")
fin=paste0(annee,"-09-01")
semaines=data$date > debut & data$date <= fin
output=sum(data$inc[semaines],na.rm=TRUE)
return(output)
}
```
```{r pressure, echo=FALSE} rvm 1985
plot(pressure)
```{r}
annees=1992:2022
icd_annuelle = data.frame(annee=annees,icd=sapply(annees,pic_annuel))
head(icd_annuelle)
```
représentation graphique
```{r}
plot(icd_annuelle,type="p")
``` ```
max
Vous remarquerez le paramètre `echo = FALSE` qui indique que le code ne doit pas apparaître dans la version finale du document. Nous vous recommandons dans le cadre de ce MOOC de ne pas utiliser ce paramètre car l'objectif est que vos analyses de données soient parfaitement transparentes pour être reproductibles. ```{r}
head(icd_annuelle[order(-icd_annuelle$icd),])
tail(icd_annuelle[order(-icd_annuelle$icd),])
Comme les résultats ne sont pas stockés dans les fichiers Rmd, pour faciliter la relecture de vos analyses par d'autres personnes, vous aurez donc intérêt à générer un HTML ou un PDF et à le commiter. ```
représentation graphique
```{r}
hist(icd_annuelle$icd,breaks=10)
```
Maintenant, à vous de jouer! Vous pouvez effacer toutes ces informations et les remplacer par votre document computationnel.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment