Commit 3219d43d authored by Erick's avatar Erick

données en local

parent b31dcc40
......@@ -21,9 +21,10 @@ knitr::opts_chunk$set(echo = TRUE)
## Préparation des données
Les données de l'incidence du syndrome grippal sont disponibles du site Web du [Réseau Sentinelles](http://www.sentiweb.fr/). Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet, qui commence en 1984 et se termine avec une semaine récente. L'URL est:
Les données de l'incidence du syndrome grippal sont disponibles du site Web du [Réseau Sentinelles](http://www.sentiweb.fr/). Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet, qui commence en 1984 et se termine avec une semaine récente. L'URL est donné ci-dessous mais pour pouvoir rendre l'analyse plus durable nous téléchargeons une copie de la base en local dans le même dossier que ce docuement computationnel:
```{r}
data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv"
#data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv"
data_local = "./inc-3-PAY.csv"
```
Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json):
......@@ -44,7 +45,7 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://
La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`.
### Téléchargement
```{r}
data = read.csv(data_url, skip=1, na.strings=c("-"))
data = read.csv(data_local, skip=1, na.strings=c("-"))
```
Regardons ce que nous avons obtenu:
......@@ -161,48 +162,3 @@ Enfin, un histogramme montre bien que les épidémies fortes, qui touchent envir
```{r}
hist(inc_annuelle$incidence, breaks=10, xlab="Incidence annuelle", ylab="Nb d'observations", main="")
```
#### Vérificiation et inspection des données
###### Création de la fonction de converstion des dates
```{r}
convert_week = function(date) {
ws = paste(date)
iso = paste0(substring(ws, 1, 4), "-W", substring(ws, 5, 6))
as.character(parse_iso_8601(iso))
}
```
###### Application de la fonction
```{r}
data$date = as.Date(sapply(data$week, convert_week))
class(data$date)
```
###### Vérification de l'écart entre les dates
```{r}
all(diff(data$date2) == 7)
```
###### Regrouper par campagne
```{r}
findruns <- function(x,k) {
n <- length(x)
runs <- NULL
for (i in 1:(n-k+1)) {
if (all(x[i:(i+k-1)]==1)) runs <- c(runs,i)
}
return(runs)
}
y <- c (1,0,0,1,1,1,0,1,1)
findruns (y, 3)
findruns (y, 2)
findruns (y, 1)
```
###### examen de la distribution
```{r}
hist(inc_annuelle$incidence, breaks=20)
```
This diff is collapsed.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment