--- title: "Exercice 4 : utilisation du journal de bord" author: "Nardou Xavier date: "24/03/2020" output: html_document --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE) ``` Je me base sur les données de dates, températures et nombre de personnes croisées durant ma balade consignées dans mon journal du 18 au 24 Mars (monjournal.csv). ### Je vais essayer de savoir si il y a un lien entre la température et le nombre de personnes que je croise. Je pense que je vais utiliser des tests non paramétriques car mes données ne sont sûrement pas normales, mais on peut tester quand même : ```{r} monjournal<-read.csv("monjournal.csv", header=T, dec=".", sep=";") attach(monjournal) shapiro.test(Temperature) shapiro.test(Nbr) ``` **Mes effectifs sont faibles mais bon** ... Shapiro me dis que mes deux distributions suivent la loi normale, je vais le croire et utiliser un **test de corrélation de Pearson** pour voir sqi il y a un lien entre mes deux variables. ```{r} cor(Temperature,Nbr, method="pearson") ``` Bon, il semble qu'il y ait une bonne corrélation entre le nombre de personnes que je croise et la température extérieure. ### Je vais maintenant représenter la relation entre les deux variables *Avec une représentation graphique simple* ```{r} library(ggplot2) ggplot(monjournal, aes(x=Temperature, y=Nbr)) + labs(x="Temperature", y="Nombre de personnes croisées durant ma balade")+ geom_point(size=2)+ theme_classic()+ geom_smooth(method=lm, se=FALSE) ``` Avec le peu de données que j'ai, on ne peut pas en déduire grand chose, mais il semble qu'il y ait quand même plus de personnes dehors lorsqu'il fait plus chaud en extérieur. Cette découverte va faire l'effet d'une bombe dans le monde scientifique.