diff --git a/module2/exo2/exercice_R_fr.org b/module2/exo2/exercice_R_fr.org index 1bb8f61f1d11b486ceb724afcdd14d11e5329545..506a0788dd09e11a4f28ebe3cbb089c3d109f4b6 100644 --- a/module2/exo2/exercice_R_fr.org +++ b/module2/exo2/exercice_R_fr.org @@ -1,6 +1,6 @@ -#+TITLE: Votre titre -#+AUTHOR: Votre nom -#+DATE: La date du jour +#+TITLE: Analyse de données simples +#+AUTHOR: Dorian Goepp +#+DATE: 2022-10-25 #+LANGUAGE: fr # #+PROPERTY: header-args :eval never-export @@ -82,3 +82,18 @@ faisant ~ Les joints peuvent défaillir en même temps s'ils sont le produit d'une +même série de production, ce qui limite le réalisme de l'hypothèse +d'indépendance des probabilités de défaut d'un joint. + #+begin_src R :results output :session *R* :exports both logistic_reg = glm(data=data, Malfunction/Count ~ Temperature, weights=Count, family=binomial(link='logit')) @@ -156,6 +188,50 @@ et l'erreur standard de cet estimateur est de 0.049, autrement dit on ne peut pas distinguer d'impact particulier et il faut prendre nos estimations avec des pincettes. +** Refaisons l'analyse avec toutes les données + +De même que dans la section précédente, prenons en compte les +événements sans défaut de joint. + +#+begin_src R :results output :session *R* :exports both +logistic_reg_full = glm(data=original_data, Malfunction/Count ~ Temperature, weights=Count, + family=binomial(link='logit')) +summary(logistic_reg) +#+end_src + +#+RESULTS: +#+begin_example + +Call: +glm(formula = Malfunction/Count ~ Temperature, family = binomial(link = "logit"), + data = data, weights = Count) + +Deviance Residuals: + 2 9 10 11 14 21 23 +-0.3015 -0.2836 -0.2919 -0.3015 0.6891 0.6560 -0.2850 + +Coefficients: + Estimate Std. Error z value Pr(>|z|) +(Intercept) -1.389528 3.195752 -0.435 0.664 +Temperature 0.001416 0.049773 0.028 0.977 + +(Dispersion parameter for binomial family taken to be 1) + + Null deviance: 1.3347 on 6 degrees of freedom +Residual deviance: 1.3339 on 5 degrees of freedom +AIC: 18.894 + +Number of Fisher Scoring iterations: 4 +#+end_example + +Cette fois-ci, avec la même erreur standard, on obtient un coefficient +bien supérieur, donc une corrélation bien plus forte entre la +température et les défaillances. + +Je ne suis pas cappable d'évaluer la signification de ces résultats, +n'ayant pas eu le temps d'étudier la régression logistique. J'admets +donc, pour pouvoir continuer, que l'incertitude n'est pas trop élevée. + * Estimation de la probabilité de dysfonctionnant des joints toriques La température prévue le jour du décollage est de 31°F. Essayons d'estimer la probabilité de dysfonctionnement des joints toriques à @@ -185,6 +261,7 @@ sum(data_full$Malfunction)/sum(data_full$Count) #+end_src #+RESULTS: +: : [1] 0.06521739 Cette probabilité est donc d'environ $p=0.065$, sachant qu'il existe @@ -205,3 +282,27 @@ problème... Saurez-vous le trouver ? Vous êtes libre de modifier cette analyse et de regarder ce jeu de données sous tous les angles afin d'expliquer ce qui ne va pas. +** En prenant en compte les situations sans défaillance + +#+begin_src R :results output graphics :file "proba_estimate_all.png" :exports both :width 600 :height 400 :session *R* +# shuttle=shuttle[shuttle$r!=0,] +tempv = seq(from=30, to=90, by = .5) +rmv <- predict(logistic_reg_full, list(Temperature=tempv), type="response") +plot(tempv, rmv, type="l", ylim=c(0, 1)) +points(data=data, Malfunction/Count ~ Temperature) +#+end_src + +#+RESULTS: + +Et maintenant la probabilité de défaillance d'un joint: + +#+begin_src R :results output :session *R* :exports both +rmv[1] +#+end_src + +#+RESULTS: +: 1 +: 0.834373 + +The probability is here far too high to consider taking off, admitting +that the pressure for the takeoff day was 200 PSI. diff --git a/module2/exo5/proba_estimate_all.png b/module2/exo5/proba_estimate_all.png new file mode 100644 index 0000000000000000000000000000000000000000..883a552e6f0371d89bd70c2a7d652e0c50ccf833 Binary files /dev/null and b/module2/exo5/proba_estimate_all.png differ