diff --git a/module3/exo3/JuliaErbrech.html b/module3/exo3/JuliaErbrech.html new file mode 100644 index 0000000000000000000000000000000000000000..393231b6d6ae600ddc5cb1e7bd87a4605e06dd82 --- /dev/null +++ b/module3/exo3/JuliaErbrech.html @@ -0,0 +1,655 @@ + + + + +
+ + + + + + + + + + +library(readr)
+## Warning: le package 'readr' a été compilé avec la version R 4.3.2
+library(dplyr)
+## Warning: le package 'dplyr' a été compilé avec la version R 4.3.2
+##
+## Attachement du package : 'dplyr'
+## Les objets suivants sont masqués depuis 'package:stats':
+##
+## filter, lag
+## Les objets suivants sont masqués depuis 'package:base':
+##
+## intersect, setdiff, setequal, union
+library(ggplot2)
+## Warning: le package 'ggplot2' a été compilé avec la version R 4.3.2
+liglab2<-read_log("liglab2.log")
+##
+## ── Column specification ────────────────────────────────────────────────────────
+## cols(
+## X1 = col_double(),
+## X2 = col_double(),
+## X3 = col_character(),
+## X4 = col_character(),
+## X5 = col_character(),
+## X6 = col_character(),
+## X7 = col_character(),
+## X8 = col_character(),
+## X9 = col_character(),
+## X10 = col_character()
+## )
+## Warning: 377 parsing failures.
+## row col expected actual file
+## 13 -- 10 columns 8 columns 'liglab2.log'
+## 117 -- 10 columns 8 columns 'liglab2.log'
+## 315 -- 10 columns 8 columns 'liglab2.log'
+## 509 -- 10 columns 8 columns 'liglab2.log'
+## 591 -- 10 columns 8 columns 'liglab2.log'
+## ... ... .......... ......... .............
+## See problems(...) for more details.
+liglab2<-liglab2 %>%
+ select(X1,X2,X9) %>%
+ rename(Date=X1, Taille=X2, Temps=X9) %>%
+ mutate(Temps=as.numeric(substring(Temps,6))) %>%
+ filter(!Temps==is.na(Temps))
+
+stackoverflow<-read_log("stackoverflow.log")
+##
+## ── Column specification ────────────────────────────────────────────────────────
+## cols(
+## X1 = col_double(),
+## X2 = col_double(),
+## X3 = col_character(),
+## X4 = col_character(),
+## X5 = col_character(),
+## X6 = col_character(),
+## X7 = col_character(),
+## X8 = col_character(),
+## X9 = col_character(),
+## X10 = col_character()
+## )
+## Warning: 63 parsing failures.
+## row col expected actual file
+## 57 -- 10 columns 8 columns 'stackoverflow.log'
+## 137 -- 10 columns 8 columns 'stackoverflow.log'
+## 332 -- 10 columns 8 columns 'stackoverflow.log'
+## 380 -- 10 columns 8 columns 'stackoverflow.log'
+## 415 -- 10 columns 8 columns 'stackoverflow.log'
+## ... ... .......... ......... ...................
+## See problems(...) for more details.
+stackoverflow<-stackoverflow%>%
+ select(X1,X2,X9) %>%
+ rename(Date=X1, Taille=X2, Temps=X9) %>%
+ mutate(Temps=as.numeric(substring(Temps,6))) %>%
+ filter(!Temps==is.na(Temps))
+ggplot(liglab2,aes(x=Date,y=Temps, col=Taille)) +
+ geom_point()
+
+On remarque effectivement que la taille du fichier Ă un impact sur le
+temps d’envoi, notamment pour les fichier de plus de plus de 1250 bytes.
+Cependant, lorsque le temps d’envoi est inférieur à 25ms, la relation
+est moins évidente.
ggplot(liglab2,aes(x=Taille,y=Temps)) +
+ geom_point()
+
+Il semblerait qu’il y ait une rupture à partie de 1480 bites.
liglab2_petit<-liglab2 %>%
+ filter(Taille<=1480)
+mod1=lm(Temps~Taille,liglab2_petit)
+par(mfrow=c(2,2))
+plot(mod1)
+summary(mod1)
+##
+## Call:
+## lm(formula = Temps ~ Taille, data = liglab2_petit)
+##
+## Residuals:
+## Min 1Q Median 3Q Max
+## -2.475 -2.247 -2.189 -2.088 272.489
+##
+## Coefficients:
+## Estimate Std. Error t value Pr(>|t|)
+## (Intercept) 3.276e+00 7.231e-02 45.301 < 2e-16 ***
+## Taille 3.263e-04 8.497e-05 3.841 0.000123 ***
+## ---
+## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
+##
+## Residual standard error: 6.432 on 32665 degrees of freedom
+## Multiple R-squared: 0.0004514, Adjusted R-squared: 0.0004208
+## F-statistic: 14.75 on 1 and 32665 DF, p-value: 0.000123
+L= 3.2756742
+1/C=3.2631595^{-4}
+C= 3064.5146169
+liglab2_grand<-liglab2 %>%
+ filter(Taille>1480)
+mod1=lm(Temps~Taille,liglab2_grand)
+par(mfrow=c(2,2))
+plot(mod1)
+summary(mod1)
+##
+## Call:
+## lm(formula = Temps ~ Taille, data = liglab2_grand)
+##
+## Residuals:
+## Min 1Q Median 3Q Max
+## -8.276 -7.729 -7.354 -6.999 177.215
+##
+## Coefficients:
+## Estimate Std. Error t value Pr(>|t|)
+## (Intercept) 5.289833 2.244269 2.357 0.0184 *
+## Taille 0.002579 0.001281 2.012 0.0442 *
+## ---
+## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
+##
+## Residual standard error: 20.74 on 11367 degrees of freedom
+## Multiple R-squared: 0.0003562, Adjusted R-squared: 0.0002682
+## F-statistic: 4.05 on 1 and 11367 DF, p-value: 0.0442
+L= 5.2898326
+1/C=0.0025789
+C= 387.7603998
+ggplot(stackoverflow,aes(x=Date,y=Temps, col=Taille)) +
+ geom_point()
+
+On remarque effectivement que la taille du fichier Ă un impact sur le
+temps d’envoi, notamment pour les fichier de plus de plus de 1250 bytes.
+Cependant, lorsque le temps d’envoi est inférieur à 135ms, la relation
+est moins évidente.
ggplot(stackoverflow,aes(x=Taille,y=Temps)) +
+ geom_point()
+
+Il semblerait qu’il y ait une rupture à partie de 1480 bites.
stackoverflow_petit<-stackoverflow %>%
+ filter(Taille<=1480)
+mod1=lm(Temps~Taille,stackoverflow_petit)
+par(mfrow=c(2,2))
+plot(mod1)
+summary(mod1)
+##
+## Call:
+## lm(formula = Temps ~ Taille, data = stackoverflow_petit)
+##
+## Residuals:
+## Min 1Q Median 3Q Max
+## -3.264 -2.276 -2.255 -2.232 36.766
+##
+## Coefficients:
+## Estimate Std. Error t value Pr(>|t|)
+## (Intercept) 1.132e+02 1.655e-01 684.253 <2e-16 ***
+## Taille 4.521e-05 1.938e-04 0.233 0.816
+## ---
+## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
+##
+## Residual standard error: 5.818 on 5013 degrees of freedom
+## Multiple R-squared: 1.085e-05, Adjusted R-squared: -0.0001886
+## F-statistic: 0.05442 on 1 and 5013 DF, p-value: 0.8156
+La régression est moins concluante (p-value importante).
+L= 113.2275097
+1/C=4.5209941^{-5}
+C= 2.2119029^{4}
+stackoverflow_grand<-stackoverflow %>%
+ filter(Taille>1480)
+mod1=lm(Temps~Taille,stackoverflow_grand)
+par(mfrow=c(2,2))
+plot(mod1)
+summary(mod1)
+##
+## Call:
+## lm(formula = Temps ~ Taille, data = stackoverflow_grand)
+##
+## Residuals:
+## Min 1Q Median 3Q Max
+## -6.382 -5.113 -4.789 -4.468 45.721
+##
+## Coefficients:
+## Estimate Std. Error t value Pr(>|t|)
+## (Intercept) 120.053588 3.188867 37.648 <2e-16 ***
+## Taille -0.001803 0.001827 -0.987 0.324
+## ---
+## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
+##
+## Residual standard error: 11.88 on 1807 degrees of freedom
+## Multiple R-squared: 0.0005387, Adjusted R-squared: -1.444e-05
+## F-statistic: 0.9739 on 1 and 1807 DF, p-value: 0.3238
+La régression est moins concluante (p-value importante).
+L= 120.0535883
+1/C=-0.0018029
+C= -554.6631212
+