library(readr)
## Warning: le package 'readr' a été compilé avec la version R 4.3.2
library(dplyr)
## Warning: le package 'dplyr' a été compilé avec la version R 4.3.2
## 
## Attachement du package : 'dplyr'
## Les objets suivants sont masqués depuis 'package:stats':
## 
##     filter, lag
## Les objets suivants sont masqués depuis 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
## Warning: le package 'ggplot2' a été compilé avec la version R 4.3.2

Chargement des données

liglab2<-read_log("liglab2.log")
## 
## ── Column specification ────────────────────────────────────────────────────────
## cols(
##   X1 = col_double(),
##   X2 = col_double(),
##   X3 = col_character(),
##   X4 = col_character(),
##   X5 = col_character(),
##   X6 = col_character(),
##   X7 = col_character(),
##   X8 = col_character(),
##   X9 = col_character(),
##   X10 = col_character()
## )
## Warning: 377 parsing failures.
## row col   expected    actual          file
##  13  -- 10 columns 8 columns 'liglab2.log'
## 117  -- 10 columns 8 columns 'liglab2.log'
## 315  -- 10 columns 8 columns 'liglab2.log'
## 509  -- 10 columns 8 columns 'liglab2.log'
## 591  -- 10 columns 8 columns 'liglab2.log'
## ... ... .......... ......... .............
## See problems(...) for more details.
liglab2<-liglab2 %>% 
  select(X1,X2,X9) %>% 
  rename(Date=X1, Taille=X2, Temps=X9) %>% 
  mutate(Temps=as.numeric(substring(Temps,6))) %>% 
  filter(!Temps==is.na(Temps))

stackoverflow<-read_log("stackoverflow.log")
## 
## ── Column specification ────────────────────────────────────────────────────────
## cols(
##   X1 = col_double(),
##   X2 = col_double(),
##   X3 = col_character(),
##   X4 = col_character(),
##   X5 = col_character(),
##   X6 = col_character(),
##   X7 = col_character(),
##   X8 = col_character(),
##   X9 = col_character(),
##   X10 = col_character()
## )
## Warning: 63 parsing failures.
## row col   expected    actual                file
##  57  -- 10 columns 8 columns 'stackoverflow.log'
## 137  -- 10 columns 8 columns 'stackoverflow.log'
## 332  -- 10 columns 8 columns 'stackoverflow.log'
## 380  -- 10 columns 8 columns 'stackoverflow.log'
## 415  -- 10 columns 8 columns 'stackoverflow.log'
## ... ... .......... ......... ...................
## See problems(...) for more details.
stackoverflow<-stackoverflow%>% 
  select(X1,X2,X9) %>% 
  rename(Date=X1, Taille=X2, Temps=X9) %>% 
  mutate(Temps=as.numeric(substring(Temps,6))) %>% 
  filter(!Temps==is.na(Temps))

liglab2

Evolution du temps de transmission au cours du temps

ggplot(liglab2,aes(x=Date,y=Temps, col=Taille)) +
  geom_point()

On remarque effectivement que la taille du fichier à un impact sur le temps d’envoi, notamment pour les fichier de plus de plus de 1250 bytes. Cependant, lorsque le temps d’envoi est inférieur à 25ms, la relation est moins évidente.

Temps de transmission en fonction de la taille des messages

ggplot(liglab2,aes(x=Taille,y=Temps)) +
  geom_point()

Il semblerait qu’il y ait une rupture à partie de 1480 bites.

Régression linéaire

Avant 1480 bytes

liglab2_petit<-liglab2 %>% 
  filter(Taille<=1480)
mod1=lm(Temps~Taille,liglab2_petit)
par(mfrow=c(2,2))
plot(mod1)

summary(mod1)
## 
## Call:
## lm(formula = Temps ~ Taille, data = liglab2_petit)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
##  -2.475  -2.247  -2.189  -2.088 272.489 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 3.276e+00  7.231e-02  45.301  < 2e-16 ***
## Taille      3.263e-04  8.497e-05   3.841 0.000123 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.432 on 32665 degrees of freedom
## Multiple R-squared:  0.0004514,  Adjusted R-squared:  0.0004208 
## F-statistic: 14.75 on 1 and 32665 DF,  p-value: 0.000123

L= 3.2756742

1/C=3.2631595^{-4}

C= 3064.5146169

Après 1480 bytes

liglab2_grand<-liglab2 %>% 
  filter(Taille>1480)
mod1=lm(Temps~Taille,liglab2_grand)
par(mfrow=c(2,2))
plot(mod1)

summary(mod1)
## 
## Call:
## lm(formula = Temps ~ Taille, data = liglab2_grand)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
##  -8.276  -7.729  -7.354  -6.999 177.215 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept) 5.289833   2.244269   2.357   0.0184 *
## Taille      0.002579   0.001281   2.012   0.0442 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.74 on 11367 degrees of freedom
## Multiple R-squared:  0.0003562,  Adjusted R-squared:  0.0002682 
## F-statistic:  4.05 on 1 and 11367 DF,  p-value: 0.0442

L= 5.2898326

1/C=0.0025789

C= 387.7603998

stackoverflow

Evolution du temps de transmission au cours du temps

ggplot(stackoverflow,aes(x=Date,y=Temps, col=Taille)) +
  geom_point()

On remarque effectivement que la taille du fichier à un impact sur le temps d’envoi, notamment pour les fichier de plus de plus de 1250 bytes. Cependant, lorsque le temps d’envoi est inférieur à 135ms, la relation est moins évidente.

Temps de transmission en fonction de la taille des messages

ggplot(stackoverflow,aes(x=Taille,y=Temps)) +
  geom_point()

Il semblerait qu’il y ait une rupture à partie de 1480 bites.

Régression linéaire

Avant 1480 bytes

stackoverflow_petit<-stackoverflow %>% 
  filter(Taille<=1480)
mod1=lm(Temps~Taille,stackoverflow_petit)
par(mfrow=c(2,2))
plot(mod1)

summary(mod1)
## 
## Call:
## lm(formula = Temps ~ Taille, data = stackoverflow_petit)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -3.264 -2.276 -2.255 -2.232 36.766 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1.132e+02  1.655e-01 684.253   <2e-16 ***
## Taille      4.521e-05  1.938e-04   0.233    0.816    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.818 on 5013 degrees of freedom
## Multiple R-squared:  1.085e-05,  Adjusted R-squared:  -0.0001886 
## F-statistic: 0.05442 on 1 and 5013 DF,  p-value: 0.8156

La régression est moins concluante (p-value importante).

L= 113.2275097

1/C=4.5209941^{-5}

C= 2.2119029^{4}

Après 1480 bytes

stackoverflow_grand<-stackoverflow %>% 
  filter(Taille>1480)
mod1=lm(Temps~Taille,stackoverflow_grand)
par(mfrow=c(2,2))
plot(mod1)

summary(mod1)
## 
## Call:
## lm(formula = Temps ~ Taille, data = stackoverflow_grand)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -6.382 -5.113 -4.789 -4.468 45.721 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 120.053588   3.188867  37.648   <2e-16 ***
## Taille       -0.001803   0.001827  -0.987    0.324    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11.88 on 1807 degrees of freedom
## Multiple R-squared:  0.0005387,  Adjusted R-squared:  -1.444e-05 
## F-statistic: 0.9739 on 1 and 1807 DF,  p-value: 0.3238

La régression est moins concluante (p-value importante).

L= 120.0535883

1/C=-0.0018029

C= -554.6631212