Commit 06721c27 authored by Marc Oudart's avatar Marc Oudart

Suite exo 4 module 2

parent 877349e3
...@@ -2,7 +2,9 @@ ...@@ -2,7 +2,9 @@
title: "Exo4 module 2" title: "Exo4 module 2"
author: "Marc" author: "Marc"
date: "07/04/2020" date: "07/04/2020"
output: html_document output:
html_document: default
pdf_document: default
--- ---
```{r setup, include=FALSE} ```{r setup, include=FALSE}
...@@ -90,17 +92,13 @@ sd_appels_recus<-c(sd(df$Appels_recus[df$add=="avant"]), sd(df$Appels_recus[df$a ...@@ -90,17 +92,13 @@ sd_appels_recus<-c(sd(df$Appels_recus[df$add=="avant"]), sd(df$Appels_recus[df$a
sd_duree_appel<-c(sd(df$Duree_appel[df$add=="avant"]), sd(df$Duree_appel[df$add=="après"])) sd_duree_appel<-c(sd(df$Duree_appel[df$add=="avant"]), sd(df$Duree_appel[df$add=="après"]))
sd_messages_recus<-c(sd(df$Messages_recus[df$add=="avant"]), sd(df$Messages_recus[df$add=="après"])) sd_messages_recus<-c(sd(df$Messages_recus[df$add=="avant"]), sd(df$Messages_recus[df$add=="après"]))
sd_messages_envoyes<-c(sd(df$Messages_envoyes[df$add=="avant"]), sd(df$Messages_envoyes[df$add=="après"])) sd_messages_envoyes<-c(sd(df$Messages_envoyes[df$add=="avant"]), sd(df$Messages_envoyes[df$add=="après"]))
sd_appels_emis
sd_appels_recus
sd_messages_recus
sd_messages_envoyes
``` ```
Maintenant on va pouvoir plotter les moyennes de tous les paramètres avant et après (inclus) le 17 mars 2020. Maintenant on va pouvoir plotter les moyennes de tous les paramètres avant et après (inclus) le 17 mars 2020.
Le mieux c'est d'utiliser ggplot. Le mieux c'est d'utiliser ggplot.
```{r} ```{r}
install.packages(ggplot) #install.packages("ggplot2")
library(ggplot2) library(ggplot2)
a<-data.frame(m_appels_emis, sd_appels_emis, c("aa", "ap")) a<-data.frame(m_appels_emis, sd_appels_emis, c("aa", "ap"))
ggplot(a, aes(x = a$c..aa....ap.., y = m_appels_emis))+ ggplot(a, aes(x = a$c..aa....ap.., y = m_appels_emis))+
...@@ -158,6 +156,23 @@ wilcox.test(df$Duree_appel[df$add=="avant"],df$Duree_appel[df$add=="après"]) ...@@ -158,6 +156,23 @@ wilcox.test(df$Duree_appel[df$add=="avant"],df$Duree_appel[df$add=="après"])
``` ```
Ah ben en fait la durée des appels a significativement augmentée après le 17 mars 2020. Je ne suis pas super fort en statistiques donc j'espère que c'est correct. Aussi, 21 échantillons par groupe c'est pas mal pour un test non paramétrique. Ah ben en fait la durée des appels a significativement augmentée après le 17 mars 2020. Je ne suis pas super fort en statistiques donc j'espère que c'est correct. Aussi, 21 échantillons par groupe c'est pas mal pour un test non paramétrique.
Du coup on va essayer de mettre une étoile sur le plot (ce qui n'est pas compris dans les fonctions ggplot).
Pour cela on va donc tester le code d'un ami disponible sur [Github](https://github.com/EvenStar69/significativity.bar).
```{r}
#install.packages("devtools")
library(devtools)
#Besoin de Rtools 3.5
#install_github("EvenStar69/significativity.bar/significativity.bar")
library(significativity.bar)
```
```{r}
gg<- ggplot(c, aes(x = c..aa....ap.., y = as.numeric(m_duree_appel)))+
geom_bar(stat = "identity")+
geom_errorbar(ymin = m_duree_appel-sd_duree_appel, ymax = m_duree_appel+sd_duree_appel)+
ylim(-500,5000)+
labs(title="Duree appel")
```
### Taux de réponses ### Taux de réponses
......
This diff is collapsed.
This diff is collapsed.
This diff is collapsed.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment