diff --git a/module2/exo5/exo5_fr.Rmd b/module2/exo5/exo5_fr.Rmd index 479d7823321976e2d925d00ea599e205bfbd8cc7..cf9151de42ea99717abee8046605cffa7eea7a33 100644 --- a/module2/exo5/exo5_fr.Rmd +++ b/module2/exo5/exo5_fr.Rmd @@ -122,3 +122,53 @@ fiasco, l'analyse précédente comporte (au moins) un petit problème... Saurez-vous le trouver ? Vous êtes libre de modifier cette analyse et de regarder ce jeu de données sous tous les angles afin d'expliquer ce qui ne va pas. + + +# Analyse critique +## Chargement des données +```{r import data, echo=FALSE} +data.full = read.csv("module2/exo5/shuttle.csv",header=T) +data.full +data.sub = data.full[data.full$Malfunction>0,] +data.sub +``` + +## Représentation des données +On ne modifie pas le jeu de données et on n'ignore pas les lignes, même si elles ont des valeurs de pression identiques +```{r plot data T & P, echo=FALSE} +plot(data=data.full, Malfunction/Count ~ Temperature, ylim=c(0,1)) +plot(data=data.full, Malfunction/Count ~ Pressure, ylim = c(0,1)) +``` + +## Estimation de l'influence de la température et de la pression +On effectue une régression logistique qui tient compte des effets possibles de la température et de la pression +```{r glm T & P} +glm_temp_press = glm(data=data.full, Malfunction/Count ~ Temperature + Pressure, weights=Count, + family=binomial(link='logit')) +summary(glm_temp_press) +par(mfrow = c(2,2)) +plot(glm_temp_press) +par(mfrow = c(1,1)) + +glm_temp_press_data_sub = glm(data=data.sub, Malfunction/Count ~ Temperature + Pressure, weights=Count, + family=binomial(link='logit')) +summary(glm_temp_press_data_sub) +par(mfrow = c(2,2)) +plot(glm_temp_press) +par(mfrow = c(1,1)) +``` +On observe cette fois-ci un effet de la température, significatif à 5% (p-value = 0,03), quel que soit le jeu de données (complet = `data.full` ou partiel = `data.sub`, c'est à dire sans les occurence de dysfonctionnement) + +# Estimation de la probabilité de dysfonctionnant des joints toriques +La température prévue le jour du décollage est de 31°F. +Essayons d'estimer la probabilité de dysfonctionnement des joints toriques à cette température à partir du nouveau modèle que nous venons de construire `glm_temp_press`: + +```{r} +# shuttle=shuttle[shuttle$r!=0,] +tempv = seq(from=30, to=90, by = .5) +pressv = seq(from=50, to=290, by = 2) +rmv <- predict(glm_temp_press,list(Temperature=tempv, Pressure = pressv),type="response") +plot(tempv,rmv,type="l",ylim=c(0,1)) +points(data=data.full, Malfunction/Count ~ Temperature) +``` +Il semble qu'à des températures plus basses que celles pour lesquelles on a des données \ No newline at end of file