From fc921776da23b6f238e38489921d780928f82e5c Mon Sep 17 00:00:00 2001 From: 0c76b30d2cee7d0f3e64d789c053a183 <0c76b30d2cee7d0f3e64d789c053a183@app-learninglab.inria.fr> Date: Wed, 16 Jun 2021 19:46:08 +0000 Subject: [PATCH] Update analyse-syndrome-grippal_fr.Rmd --- module3/exo1/analyse-syndrome-grippal.Rmd | 32 ++++------------------- 1 file changed, 5 insertions(+), 27 deletions(-) diff --git a/module3/exo1/analyse-syndrome-grippal.Rmd b/module3/exo1/analyse-syndrome-grippal.Rmd index 7369b4e..5adec51 100644 --- a/module3/exo1/analyse-syndrome-grippal.Rmd +++ b/module3/exo1/analyse-syndrome-grippal.Rmd @@ -1,18 +1,8 @@ --- title: "Analyse de l'incidence du syndrôme grippal" -author: "Konrad Hinsen" +author: "Benhamouche Sofiane" output: pdf_document: - toc: true - html_document: - toc: true - theme: journal -documentclass: article -classoption: a4paper -header-includes: -- \usepackage[french]{babel} -- \usepackage[upright]{fourier} -- \hypersetup{colorlinks=true,pagebackref=true} --- ```{r setup, include=FALSE} @@ -56,13 +46,13 @@ head(data) tail(data) ``` -Y a-t-il des points manquants dans nos données ? +les points manquants ```{r} na_records = apply(data, 1, function (x) any(is.na(x))) data[na_records,] ``` -Les deux colonnes qui nous intéressent sont `week` et `inc`. Vérifions leurs classes: +Les colonnes q `week` et `inc` ```{r} class(data$week) class(data$inc) @@ -87,7 +77,6 @@ convert_week = function(w) { } ``` -Nous appliquons cette fonction à tous les points, créant une nouvelle colonne `date` dans notre jeu de données: ```{r} data$date = as.Date(convert_week(data$week)) ``` @@ -123,8 +112,7 @@ with(tail(data, 200), plot(date, inc, type="l", xlab="Date", ylab="Incidence heb ### Calcul -Étant donné que le pic de l'épidémie se situe en hiver, à cheval entre deux années civiles, nous définissons la période de référence entre deux minima de l'incidence, du 1er août de l'année $N$ au 1er août de l'année $N+1$. Nous mettons l'année $N+1$ comme étiquette sur cette année décalée, car le pic de l'épidémie est toujours au début de l'année $N+1$. Comme l'incidence de syndrome grippal est très faible en été, cette modification ne risque pas de fausser nos conclusions. -L'argument `na.rm=True` dans la sommation précise qu'il faut supprimer les points manquants. Ce choix est raisonnable car il n'y a qu'un seul point manquant, dont l'impact ne peut pas être très fort. +Étant donné que le pic de l'épidémie se situe en hiver, à cheval entre deux années civiles, ```{r} pic_annuel = function(annee) { debut = paste0(annee-1,"-08-01") @@ -146,21 +134,11 @@ inc_annuelle = data.frame(annee = annees, head(inc_annuelle) ``` -### Inspection +##Inspection Voici les incidences annuelles en graphique: ```{r} plot(inc_annuelle, type="p", xlab="Année", ylab="Incidence annuelle") ``` -### Identification des épidémies les plus fortes - -Une liste triée par ordre décroissant d'incidence annuelle permet de plus facilement repérer les valeurs les plus élevées: -```{r} -head(inc_annuelle[order(-inc_annuelle$incidence),]) -``` - -Enfin, un histogramme montre bien que les épidémies fortes, qui touchent environ 10% de la population française, sont assez rares: il y en eu trois au cours des 35 dernières années. -```{r} -hist(inc_annuelle$incidence, breaks=10, xlab="Incidence annuelle", ylab="Nb d'observations", main="") ``` -- 2.18.1