diff --git a/module2/exo5/exo5_fr.Rmd b/module2/exo5/exo5_fr.Rmd index 479d7823321976e2d925d00ea599e205bfbd8cc7..f156a0464b99b60b3d020a7aced46b31c045bc0e 100644 --- a/module2/exo5/exo5_fr.Rmd +++ b/module2/exo5/exo5_fr.Rmd @@ -29,6 +29,10 @@ Nous commençons donc par charger ces données: data = read.csv("shuttle.csv",header=T) data ``` +```{r} + +``` + Le jeu de données nous indique la date de l'essai, le nombre de joints toriques mesurés (il y en a 6 sur le lançeur principal), la @@ -42,8 +46,8 @@ dysfonctionnements, nous nous concentrons sur les expériences où au moins un joint a été défectueux. ```{r} -data = data[data$Malfunction>0,] -data +data2 = data[data$Malfunction>0,] +data2 ``` Très bien, nous avons une variabilité de température importante mais @@ -52,7 +56,7 @@ simplifier l'analyse. Comment la fréquence d'échecs varie-t-elle avec la température ? ```{r} -plot(data=data, Malfunction/Count ~ Temperature, ylim=c(0,1)) +plot(data=data, Malfunction/Count ~ Temperature + Pressure, ylim=c(0,1)) ``` À première vue, ce n'est pas flagrant mais bon, essayons quand même @@ -70,9 +74,12 @@ $p=p(t)$. Pour relier $p(t)$ à $t$, on va donc effectuer une régression logistique. ```{r} -logistic_reg = glm(data=data, Malfunction/Count ~ Temperature, weights=Count, +logistic_reg = glm(data=data, Malfunction/Count ~ Temperature + Pressure, weights=Count, family=binomial(link='logit')) summary(logistic_reg) + +logistic_reg2 = glm(data=data2, Malfunction/Count ~ Temperature, weights=Count, + family=binomial(link='logit')) ``` L'estimateur le plus probable du paramètre de température est 0.001416 @@ -80,6 +87,15 @@ et l'erreur standard de cet estimateur est de 0.049, autrement dit on ne peut pas distinguer d'impact particulier et il faut prendre nos estimations avec des pincettes. +#test logit avec Pressure et Temperature + +```{r} +logistic_reg = glm(data=data2, Malfunction/Count ~ Temperature , weights=Count, + family=binomial(link='logit')) +summary(logistic_reg2) +``` + + # Estimation de la probabilité de dysfonctionnant des joints toriques La température prévue le jour du décollage est de 31°F. Essayons d'estimer la probabilité de dysfonctionnement des joints toriques à @@ -88,7 +104,7 @@ cette température à partir du modèle que nous venons de construire: ```{r} # shuttle=shuttle[shuttle$r!=0,] tempv = seq(from=30, to=90, by = .5) -rmv <- predict(logistic_reg,list(Temperature=tempv),type="response") +rmv <- predict(logistic_reg2,list(Temperature=tempv),type="response") plot(tempv,rmv,type="l",ylim=c(0,1)) points(data=data, Malfunction/Count ~ Temperature) ``` @@ -99,6 +115,13 @@ joints toriques. Elle sera d'environ 0.2, comme dans les essais précédents où nous il y a eu défaillance d'au moins un joint. Revenons à l'ensemble des données initiales pour estimer la probabilité de défaillance d'un joint: +```{r} +tempv = seq(from=30, to=90, by = .5) +rmv <- predict(logistic_reg2,list(Temperature=tempv),type="response") +plot(tempv,rmv,type="l",ylim=c(0,1)) +points(data=data, Malfunction/Count ~ Temperature) +``` + ```{r} data_full = read.csv("shuttle.csv",header=T)