Commit 96431cc8 authored by KomlaviA's avatar KomlaviA

Practice commits

parent 4d0b112c
...@@ -27,4 +27,8 @@ plot(data, type='l', col = "blue", ...@@ -27,4 +27,8 @@ plot(data, type='l', col = "blue",
```{r} ```{r}
hist(data, breaks = 12, col = "blue", border = "pink") hist(data, breaks = 12, col = "blue", border = "pink")
``` ```
# Exportation des données en csv
```{r}
write.csv(data, "C:/Users/amouzou_k/Formations/RechercheRepro_MOOC/mooc-rr/module2/exo4/data.csv", row.names=FALSE)
```
...@@ -36,7 +36,7 @@ température (en Farenheit) et la pression (en psi), et enfin le ...@@ -36,7 +36,7 @@ température (en Farenheit) et la pression (en psi), et enfin le
nombre de dysfonctionnements relevés. nombre de dysfonctionnements relevés.
# Inspection graphique des données # Inspection graphique des données
Les vols où aucun incident n'est relevé n'apportant aucun information Les vols où aucun incident n'est relevé n'apportant aucune information
sur l'influence de la température ou de la pression sur les sur l'influence de la température ou de la pression sur les
dysfonctionnements, nous nous concentrons sur les expériences où au dysfonctionnements, nous nous concentrons sur les expériences où au
moins un joint a été défectueux. moins un joint a été défectueux.
......
...@@ -26,6 +26,14 @@ Les données de l'incidence du syndrome grippal sont disponibles du site Web du ...@@ -26,6 +26,14 @@ Les données de l'incidence du syndrome grippal sont disponibles du site Web du
data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv" data_url = "http://www.sentiweb.fr/datasets/incidence-PAY-3.csv"
``` ```
```{r}
data_file = "syndrome-grippal.csv"
if (!file.exists(data_file)) {
download.file(data_url, data_file, method="auto")
}
```
Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json): Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json):
| Nom de colonne | Libellé de colonne | | Nom de colonne | Libellé de colonne |
...@@ -42,9 +50,9 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https:// ...@@ -42,9 +50,9 @@ Voici l'explication des colonnes donnée sur le [sur le site d'origine](https://
| `geo_name` | Libellé de la zone géographique (ce libellé peut être modifié sans préavis) | | `geo_name` | Libellé de la zone géographique (ce libellé peut être modifié sans préavis) |
La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`. La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skip=1`.
### Téléchargement ### Lecture
```{r} ```{r}
data = read.csv(data_url, skip=1) data = read.csv(data_file, skip=1)
``` ```
Regardons ce que nous avons obtenu: Regardons ce que nous avons obtenu:
...@@ -64,7 +72,13 @@ Les deux colonnes qui nous intéressent sont `week` et `inc`. Vérifions leurs c ...@@ -64,7 +72,13 @@ Les deux colonnes qui nous intéressent sont `week` et `inc`. Vérifions leurs c
class(data$week) class(data$week)
class(data$inc) class(data$inc)
``` ```
Ce sont des entiers, tout va bien ! Ce sont des entiers, tout va bien !
Au cas où on serait en présence d'un autre type de données comme les données comme le type facteur, il faut faire :
```{r}
# Lire les données tout en indiquant à R de considérer les tirets par exemple comme une donnée manquante.
# data = read.csv(data_url, skip = 1, na.strings = "-")
```
### Conversion des numéros de semaine ### Conversion des numéros de semaine
...@@ -98,6 +112,10 @@ Les points sont dans l'ordre chronologique inverse, il est donc utile de les tri ...@@ -98,6 +112,10 @@ Les points sont dans l'ordre chronologique inverse, il est donc utile de les tri
```{r} ```{r}
data = data[order(data$date),] data = data[order(data$date),]
``` ```
```{r}
head(data)
```
C'est l'occasion pour faire une vérification: nos dates doivent être séparées d'exactement sept jours: C'est l'occasion pour faire une vérification: nos dates doivent être séparées d'exactement sept jours:
```{r} ```{r}
...@@ -133,7 +151,7 @@ pic_annuel = function(annee) { ...@@ -133,7 +151,7 @@ pic_annuel = function(annee) {
Nous devons aussi faire attention aux premières et dernières années de notre jeux de données. Les données commencent en octobre 1984, ce qui ne permet pas de quantifier complètement le pic attribué à 1985. Nous l'enlevons donc de notre analyse. Par contre, pour une exécution en octobre 2018, les données se terminent après le 1er août 2018, ce qui nous permet d'inclure cette année. Nous devons aussi faire attention aux premières et dernières années de notre jeux de données. Les données commencent en octobre 1984, ce qui ne permet pas de quantifier complètement le pic attribué à 1985. Nous l'enlevons donc de notre analyse. Par contre, pour une exécution en octobre 2018, les données se terminent après le 1er août 2018, ce qui nous permet d'inclure cette année.
```{r} ```{r}
annees = 1986:2018 annees = 1986:2023
``` ```
Nous créons un nouveau jeu de données pour l'incidence annuelle, en applicant la fonction `pic_annuel` à chaque année: Nous créons un nouveau jeu de données pour l'incidence annuelle, en applicant la fonction `pic_annuel` à chaque année:
......
This diff is collapsed.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment