Update analyse-syndrome-grippal.Rmd

parent 20f43861
--- ---
title: "Analyse de l'incidence du syndrôme grippal" title: "Analyse incidence grippal modifié"
author: "Konrad Hinsen" author: "Hugo Benard"
date: "21/01/2021"
output: output:
pdf_document: pdf_document:
toc: true toc: true
...@@ -14,6 +15,8 @@ header-includes: ...@@ -14,6 +15,8 @@ header-includes:
- \usepackage[upright]{fourier} - \usepackage[upright]{fourier}
- \hypersetup{colorlinks=true,pagebackref=true} - \hypersetup{colorlinks=true,pagebackref=true}
--- ---
---
```{r setup, include=FALSE} ```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE) knitr::opts_chunk$set(echo = TRUE)
...@@ -21,30 +24,11 @@ knitr::opts_chunk$set(echo = TRUE) ...@@ -21,30 +24,11 @@ knitr::opts_chunk$set(echo = TRUE)
## Préparation des données ## Préparation des données
Les données de l'incidence du syndrome grippal sont disponibles du site Web du [Réseau Sentinelles](http://www.sentiweb.fr/). Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet, qui commence en 1984 et se termine avec une semaine récente. L'URL est:
```{r}
data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv"
```
Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json):
| Nom de colonne | Libellé de colonne |
|----------------+-----------------------------------------------------------------------------------------------------------------------------------|
| `week` | Semaine calendaire (ISO 8601) |
| `indicator` | Code de l'indicateur de surveillance |
| `inc` | Estimation de l'incidence de consultations en nombre de cas |
| `inc_low` | Estimation de la borne inférieure de l'IC95% du nombre de cas de consultation |
| `inc_up` | Estimation de la borne supérieure de l'IC95% du nombre de cas de consultation |
| `inc100` | Estimation du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |
| `inc100_low` | Estimation de la borne inférieure de l'IC95% du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |
| `inc100_up` | Estimation de la borne supérieure de l'IC95% du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |
| `geo_insee` | Code de la zone géographique concernée (Code INSEE) http://www.insee.fr/fr/methodes/nomenclatures/cog/ |
| `geo_name` | Libellé de la zone géographique (ce libellé peut être modifié sans préavis) |
La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`.
### Téléchargement
```{r} ```{r}
data = read.csv(data_url, skip=1) setwd("C:/Users/Hugo/Documents/Ecole/Césure/MOOC/Recherche reproductible/Fichier R")
data <- read.csv(file="incidence-PAY-3.csv", ";",sep="\t", header=T,skip=1)
#avec les bons séparateurs et en enlevant la première ligne
``` ```
Regardons ce que nous avons obtenu: Regardons ce que nous avons obtenu:
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment