Commit fe1f3357 authored by Clair Ch's avatar Clair Ch

partie question et réponses (calcul incidence annuel)

parent a5b14daf
...@@ -88,3 +88,64 @@ with(tail(data,200),plot(date,inc,type="l")) ...@@ -88,3 +88,64 @@ with(tail(data,200),plot(date,inc,type="l"))
``` ```
on voit un pic en début d'année (hiver) on voit un pic en début d'année (hiver)
# questions et réponses
Les questions que l'on se pose :
1. dans quelle année y avait-il les épidémies les plus fortes ?
2. quelle est la fréquence d'épidémies faibles, moyennes, et fortes ?
On veut regarder les données par années, mais conserver le pic d'épidémie (qui chevauche une année civile) : on prendra les données du 1er août d'une année au 1er août de l'année d'après
## Incidence annuelle
### Calcul
Étant donné que le pic de l'épidémie se situe en hiver, à cheval entre deux années civiles, nous définissons la période de référence entre deux minima de l'incidence, du 1er août de l'année $N$ au 1er août de l'année $N+1$. Nous mettons l'année $N+1$ comme étiquette sur cette année décalée, car le pic de l'épidémie est toujours au début de l'année $N+1$. Comme l'incidence de syndrome grippal est très faible en été, cette modification ne risque pas de fausser nos conclusions.
L'argument `na.rm=True` dans la sommation précise qu'il faut supprimer les points manquants. Ce choix est raisonnable car il n'y a qu'un seul point manquant, dont l'impact ne peut pas être très fort.
```{r}
pic_annuel<-function(annee){
debut<-paste0(annee-1, "-08-01")
fin<-paste0(annee,"-08-01")
semaines<-data$date>debut & data$date<fin
sum(data$inc[semaines], na.rm=TRUE)
}
```
on ne tient pas compte de la première année (1985) car on a les données que à partir d'octobre 1984, on n'aura donc pas le pic correct de 1985. pour la dernière année 2020, on l'enlève aussi puisqu'on a a les données que jusqu'en mars
```{r}
annees<-1986:2019
```
nouveau tableau avec les incidences par année
```{r}
incidence_annuelle<-data.frame(annee=annees,incidence=sapply(annees,pic_annuel))
```
```{r}
head(incidence_annuelle)
```
### Inspection
```{r}
plot(incidence_annuelle,type="p")
```
### Identification des épidémies les plus fortes
trier les données par incidence :
```{r}
incidence_annuelle[order(-incidence_annuelle$incidence),]
```
les années où il y a eu le plus d'incidence sont 1989, 1990 et 1986
Enfin, un histogramme montre bien que les épidémies fortes, qui touchent environ 10% de la population française, sont assez rares: il y en eu trois au cours des 35 dernières années.
```{r}
hist(incidence_annuelle$incidence, breaks=10, xlab="Incidence annuelle", ylab="Nb d'observations",main="")
```
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment