Ceci est un document R markdown que vous pouvez aisément exporter au format HTML, PDF, et MS Word. Pour plus de détails sur R Markdown consultez <http://rmarkdown.rstudio.com>.
Les données que nous utiliserons dans un premier temps sont compilées par le Johns Hopkins University Center for Systems Science and Engineering (JHU CSSE). L'URL est:
Lorsque vous cliquerez sur le bouton **Knit** ce document sera compilé afin de ré-exécuter le code R et d'inclure les résultats dans un document final. Comme nous vous l'avons montré dans la vidéo, on inclue du code R de la façon suivante:
Le jeu de données est le suivant :
```{r cars}
summary(cars)
```{r}
data<-data_url
head(data)
tail(data)
```
Y a-t-il des points manquants dans nos données ?
```{r}
na_records = apply(data, 1, function (x) any(is.na(x)))
data[na_records,]
```
Les pays qui nous intéressent sont la Belgique (Belgium), la Chine - toute les provinces sauf Honk-Kong (China), Hong Kong (China, Hong-Kong), la France métropolitaine (France), l’Allemagne (Germany), l’Iran (Iran), l’Italie (Italy), le Japon (Japan), la Corée du Sud (Korea, South), la Hollande sans les colonies (Netherlands), le Portugal (Portugal), l’Espagne (Spain), le Royaume-Unis sans les colonies (United Kingdom), les États-Unis (US).
Et on peut aussi aisément inclure des figures. Par exemple:
Vous remarquerez le paramètre `echo = FALSE` qui indique que le code ne doit pas apparaître dans la version finale du document. Nous vous recommandons dans le cadre de ce MOOC de ne pas utiliser ce paramètre car l'objectif est que vos analyses de données soient parfaitement transparentes pour être reproductibles.
### Transformation
À la suite de la précédente manipulation, nous supprimons la variable Province.State qui ne nous est plus utile pour la suite de l'analyse :
```{r}
data.CR<-data.CR[,-c(1)]
```
Les variables sur les latitudes et les longitudes ne nous intéressent pas pour la suite du traitement des données.
```{r}
data.CR<-data.CR[,-c(2,3)]
```
Pour faciliter le traitement suivant, nous agrégeons les provinces de la Chine (hors Hong Kong) ensemble :
Comme les résultats ne sont pas stockés dans les fichiers Rmd, pour faciliter la relecture de vos analyses par d'autres personnes, vous aurez donc intérêt à générer un HTML ou un PDF et à le commiter.
### Inspection
Maintenant, à vous de jouer! Vous pouvez effacer toutes ces informations et les remplacer par votre document computationnel.
Nous regardons notre nouveau jeu de données :
```{r}
head(data.CR)
View(data.CR)
```
Nous vérifions la nature de nos variables :
```{r}
str(data.CR)
```
### Transformation
Pour réaliser un graphique, nous allons devoirs mettre les colonnes en lignes successives de la manière suivante :