library(readr)
## Warning: le package 'readr' a été compilé avec la version R 4.3.2
library(dplyr)
## Warning: le package 'dplyr' a été compilé avec la version R 4.3.2
##
## Attachement du package : 'dplyr'
## Les objets suivants sont masqués depuis 'package:stats':
##
## filter, lag
## Les objets suivants sont masqués depuis 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
## Warning: le package 'ggplot2' a été compilé avec la version R 4.3.2
liglab2<-read_log("liglab2.log")
##
## ── Column specification ────────────────────────────────────────────────────────
## cols(
## X1 = col_double(),
## X2 = col_double(),
## X3 = col_character(),
## X4 = col_character(),
## X5 = col_character(),
## X6 = col_character(),
## X7 = col_character(),
## X8 = col_character(),
## X9 = col_character(),
## X10 = col_character()
## )
## Warning: 377 parsing failures.
## row col expected actual file
## 13 -- 10 columns 8 columns 'liglab2.log'
## 117 -- 10 columns 8 columns 'liglab2.log'
## 315 -- 10 columns 8 columns 'liglab2.log'
## 509 -- 10 columns 8 columns 'liglab2.log'
## 591 -- 10 columns 8 columns 'liglab2.log'
## ... ... .......... ......... .............
## See problems(...) for more details.
liglab2<-liglab2 %>%
select(X1,X2,X9) %>%
rename(Date=X1, Taille=X2, Temps=X9) %>%
mutate(Temps=as.numeric(substring(Temps,6))) %>%
filter(!Temps==is.na(Temps))
stackoverflow<-read_log("stackoverflow.log")
##
## ── Column specification ────────────────────────────────────────────────────────
## cols(
## X1 = col_double(),
## X2 = col_double(),
## X3 = col_character(),
## X4 = col_character(),
## X5 = col_character(),
## X6 = col_character(),
## X7 = col_character(),
## X8 = col_character(),
## X9 = col_character(),
## X10 = col_character()
## )
## Warning: 63 parsing failures.
## row col expected actual file
## 57 -- 10 columns 8 columns 'stackoverflow.log'
## 137 -- 10 columns 8 columns 'stackoverflow.log'
## 332 -- 10 columns 8 columns 'stackoverflow.log'
## 380 -- 10 columns 8 columns 'stackoverflow.log'
## 415 -- 10 columns 8 columns 'stackoverflow.log'
## ... ... .......... ......... ...................
## See problems(...) for more details.
stackoverflow<-stackoverflow%>%
select(X1,X2,X9) %>%
rename(Date=X1, Taille=X2, Temps=X9) %>%
mutate(Temps=as.numeric(substring(Temps,6))) %>%
filter(!Temps==is.na(Temps))
ggplot(liglab2,aes(x=Date,y=Temps, col=Taille)) +
geom_point()
On remarque effectivement que la taille du fichier Ă un impact sur le
temps d’envoi, notamment pour les fichier de plus de plus de 1250 bytes.
Cependant, lorsque le temps d’envoi est inférieur à 25ms, la relation
est moins évidente.
ggplot(liglab2,aes(x=Taille,y=Temps)) +
geom_point()
Il semblerait qu’il y ait une rupture à partie de 1480 bites.
liglab2_petit<-liglab2 %>%
filter(Taille<=1480)
mod1=lm(Temps~Taille,liglab2_petit)
par(mfrow=c(2,2))
plot(mod1)
summary(mod1)
##
## Call:
## lm(formula = Temps ~ Taille, data = liglab2_petit)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.475 -2.247 -2.189 -2.088 272.489
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.276e+00 7.231e-02 45.301 < 2e-16 ***
## Taille 3.263e-04 8.497e-05 3.841 0.000123 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 6.432 on 32665 degrees of freedom
## Multiple R-squared: 0.0004514, Adjusted R-squared: 0.0004208
## F-statistic: 14.75 on 1 and 32665 DF, p-value: 0.000123
L= 3.2756742
1/C=3.2631595^{-4}
C= 3064.5146169
liglab2_grand<-liglab2 %>%
filter(Taille>1480)
mod1=lm(Temps~Taille,liglab2_grand)
par(mfrow=c(2,2))
plot(mod1)
summary(mod1)
##
## Call:
## lm(formula = Temps ~ Taille, data = liglab2_grand)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.276 -7.729 -7.354 -6.999 177.215
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.289833 2.244269 2.357 0.0184 *
## Taille 0.002579 0.001281 2.012 0.0442 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 20.74 on 11367 degrees of freedom
## Multiple R-squared: 0.0003562, Adjusted R-squared: 0.0002682
## F-statistic: 4.05 on 1 and 11367 DF, p-value: 0.0442
L= 5.2898326
1/C=0.0025789
C= 387.7603998
ggplot(stackoverflow,aes(x=Date,y=Temps, col=Taille)) +
geom_point()
On remarque effectivement que la taille du fichier Ă un impact sur le
temps d’envoi, notamment pour les fichier de plus de plus de 1250 bytes.
Cependant, lorsque le temps d’envoi est inférieur à 135ms, la relation
est moins évidente.
ggplot(stackoverflow,aes(x=Taille,y=Temps)) +
geom_point()
Il semblerait qu’il y ait une rupture à partie de 1480 bites.
stackoverflow_petit<-stackoverflow %>%
filter(Taille<=1480)
mod1=lm(Temps~Taille,stackoverflow_petit)
par(mfrow=c(2,2))
plot(mod1)
summary(mod1)
##
## Call:
## lm(formula = Temps ~ Taille, data = stackoverflow_petit)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.264 -2.276 -2.255 -2.232 36.766
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.132e+02 1.655e-01 684.253 <2e-16 ***
## Taille 4.521e-05 1.938e-04 0.233 0.816
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.818 on 5013 degrees of freedom
## Multiple R-squared: 1.085e-05, Adjusted R-squared: -0.0001886
## F-statistic: 0.05442 on 1 and 5013 DF, p-value: 0.8156
La régression est moins concluante (p-value importante).
L= 113.2275097
1/C=4.5209941^{-5}
C= 2.2119029^{4}
stackoverflow_grand<-stackoverflow %>%
filter(Taille>1480)
mod1=lm(Temps~Taille,stackoverflow_grand)
par(mfrow=c(2,2))
plot(mod1)
summary(mod1)
##
## Call:
## lm(formula = Temps ~ Taille, data = stackoverflow_grand)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.382 -5.113 -4.789 -4.468 45.721
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 120.053588 3.188867 37.648 <2e-16 ***
## Taille -0.001803 0.001827 -0.987 0.324
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 11.88 on 1807 degrees of freedom
## Multiple R-squared: 0.0005387, Adjusted R-squared: -1.444e-05
## F-statistic: 0.9739 on 1 and 1807 DF, p-value: 0.3238
La régression est moins concluante (p-value importante).
L= 120.0535883
1/C=-0.0018029
C= -554.6631212