--- title: "Exercice_pairs_Sujet_4" author: "Vivien Gaujoux" date: "4/20/2020" output: pdf_document: default html_document: default --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE) ``` # Exercice évalué par les pairs ## Importation et tri des données ```{r} library(tidyverse) ``` ```{r} liglab2 <- read_table("http://mescal.imag.fr/membres/arnaud.legrand/teaching/2014/RICM4_EP_ping/liglab2.log.gz", col_names = FALSE) liglab2 ``` ```{r} names(liglab2)[names(liglab2) == "X1"] <- "date" liglab2<-separate(liglab2, X2, sep = " ", extra = "merge", into = c("taille", "a_virer")) liglab2<-separate(liglab2, a_virer, sep = "time=", extra = "merge", into = c("a_virer", "time")) liglab2$a_virer <- NULL ``` ```{r} liglab2$time = substr(liglab2$time,1,nchar(liglab2$time)-3) liglab2$date = substr(liglab2$date,2,nchar(liglab2$date)-1) liglab2$time <- as.numeric(as.character(liglab2$time)) liglab2$taille <- as.numeric(as.character(liglab2$taille)) lignes_na = apply(liglab2, 1, function(x) any(is.na(x))) ``` ```{r} lignes_na = apply(liglab2, 1, function(x) any(is.na(x))) liglab2[lignes_na,] liglab2 <- liglab2 %>% drop_na("time") liglab2 ``` ## 1) Représentation graphique : ```{r} ggplot(liglab2) + geom_point(aes(x = date, y = time, color = taille)) + scale_color_gradient(low = 'gray', high = 'gray0') ``` Il semble que la taille des messages ne soit pas la seule en cause dans le temps de transmission. ## 2) Représentation graphique : temps de transmission en fonction de la taille des messages ```{r} with(liglab2, plot(taille, time, type = "p")) ``` On peut voir la rupture à partir de 1500 octets environ. ```{r} donnees_low <- subset(liglab2, taille <= 1500) donnees_high <-subset(liglab2, taille > 1500) donnees_high ``` ## 3) Régression linéaire : ```{r} high_time.lm <- lm(time~taille, data = donnees_high) summary(high_time.lm) ``` ```{r} plot(high_time.lm) ``` ```{r} low_time.lm <- lm(time~taille, data = donnees_low) summary(low_time.lm) ``` ```{r} plot(low_time.lm) ``` La valeur $\alpha$\ et donc la latence des données de taille élevée est de 4.920748 et la valeur $\beta$\ est de 0.002779. La valeur $\alpha$\ et donc la latence des données de taille basse est de 3.124 et la valeur $\beta$\ est de 0.0006248. Ces valeurs indiquent une capacité respectivement de 1/0.002779 et 1/0.0006248, soit 359.84 pour les données de taille élevée et 1600.051 pour les données de taille basse.