<h2id="org176bdc5"><spanclass="section-number-2">2.</span> Inspection graphique des données</h2>
<divclass="outline-text-2"id="text-2">
<p>
À première vue, ni l'information de pression ni la date nous apporteront des réponses sur la fréquence des incidents. On va donc chercher à filtrer les colonnes restantes en fusionnant les doublons pour la température.
Contrairement à l'analyse précédente où les températures sans incidents n'étaient pas incluses, on voit ici une augemntation un peu plus nette de la fréquence des incidents à mesure que la température.
</p>
<p>
On peut procéder à une estimation de l'impact de la température \(t\) sur la probabilité de dysfonctionnements d'un joint.
<h2id="org48f8c73"><spanclass="section-number-2">3.</span> Estimation de l'influence de la température</h2>
<divclass="outline-text-2"id="text-3">
<p>
Supposons que chacun des 6 joints toriques est endommagé avec la même probabilité et indépendamment des autres et que cette probabilité ne dépend que de la température. Si on note \(p(t)\) cette probabilité, le nombre de joints \(D\) dysfonctionnant lorsque l'on effectue le vol à température \(t\) suit une loi binomiale de paramètre \(n=6\) et \(p=p(t)\). Pour relier \(p(t)\) à \(t\), on va donc effectuer une régression logistique.
</p>
<divclass="org-src-container">
<preclass="src src-python"><spanstyle="color: #b877db;">import</span> statsmodels.api <spanstyle="color: #b877db;">as</span> sm
L'estimateur le plus probable du paramètre de température est -0.1458 donc on peut s'attendre à une correlation négative entre la température et la propabilité de dysfonctionnement. L'erreur standard reste plutôt élevée mais le pseudo-R² reste bas, on peut avoir une certaine confiance en nos prédictions.
Contrairement à l'analyze précédente, on voit que la température a bien un effet considérable sur la probabilité de dysfonctionnement des joins toriques. Ainsi à 31°F, notre modèle prédit qu'un joint torique à plus de 90% de chances de dysfonctionner.
La probabilité qu'un joint défaille à cette température est de \(p=0.913\). Sachant qu'il existe un joint primaire un joint secondaire sur chacune des trois parties du lançeur, la probabilité de défaillance des deux joints d'un lançeur est de \(p^2 \approx 0.833569\). La probabilité de défaillance d'un des lançeur est donc de \(1-(1-p^2)^3 \approx 99.5%\). La catastrophe était certaine.
Le jeu de données nous indique la date de l'essai, le nombre de joints
Le jeu de données nous indique la date de l'essai, le nombre de joints
...
@@ -74,29 +74,35 @@ température (en Fahrenheit) et la pression (en psi), et enfin le
...
@@ -74,29 +74,35 @@ température (en Fahrenheit) et la pression (en psi), et enfin le
nombre de dysfonctionnements relevés.
nombre de dysfonctionnements relevés.
* Inspection graphique des données
* Inspection graphique des données
Les vols où aucun incident n'est relevé n'apportant aucune information
sur l'influence de la température ou de la pression sur les
À première vue, ni l'information de pression ni la date nous apporteront des réponses sur la fréquence des incidents. On va donc chercher à filtrer les colonnes restantes en fusionnant les doublons pour la température.
dysfonctionnements, nous nous concentrons sur les expériences où au
moins un joint a été défectueux.
#+begin_src python :results value :session *python* :exports both
#+begin_src python :results value :session *python* :exports both
À première vue, ce n'est pas flagrant mais bon, essayons quand même
Contrairement à l'analyse précédente où les températures sans incidents n'étaient pas incluses, on voit ici une augemntation un peu plus nette de la fréquence des incidents à mesure que la température.
d'estimer l'impact de la température $t$ sur la probabilité de
dysfonctionnements d'un joint.
On peut procéder à une estimation de l'impact de la température $t$ sur la probabilité de dysfonctionnements d'un joint.
* Estimation de l'influence de la température
* Estimation de l'influence de la température
Supposons que chacun des 6 joints toriques est endommagé avec la même
Supposons que chacun des 6 joints toriques est endommagé avec la même probabilité et indépendamment des autres et que cette probabilité ne dépend que de la température. Si on note $p(t)$ cette probabilité, le nombre de joints $D$ dysfonctionnant lorsque l'on effectue le vol à température $t$ suit une loi binomiale de paramètre $n=6$ et $p=p(t)$. Pour relier $p(t)$ à $t$, on va donc effectuer une régression logistique.
probabilité et indépendamment des autres et que cette probabilité ne
dépend que de la température. Si on note $p(t)$ cette probabilité, le
nombre de joints $D$ dysfonctionnant lorsque l'on effectue le vol à
température $t$ suit une loi binomiale de paramètre $n=6$ et
$p=p(t)$. Pour relier $p(t)$ à $t$, on va donc effectuer une
régression logistique.
#+begin_src python :results value :session *python* :exports both
#+begin_src python :results value :session *python* :exports both
L'estimateur le plus probable du paramètre de température est 0.0014
L'estimateur le plus probable du paramètre de température est -0.1458 donc on peut s'attendre à une correlation négative entre la température et la propabilité de dysfonctionnement. L'erreur standard reste plutôt élevée mais le pseudo-R² reste bas, on peut avoir une certaine confiance en nos prédictions.
et l'erreur standard de cet estimateur est de 0.122, autrement dit on
ne peut pas distinguer d'impact particulier et il faut prendre nos
estimations avec des pincettes.
* Estimation de la probabilité de dysfonctionnant des joints toriques
* Estimation de la probabilité de dysfonctionnant des joints toriques
La température prévue le jour du décollage est de 31°F. Essayons
La température prévue le jour du décollage est de 31°F. Essayons
...
@@ -187,36 +184,16 @@ print(matplot_lib_filename)
...
@@ -187,36 +184,16 @@ print(matplot_lib_filename)
#+RESULTS:
#+RESULTS:
[[file:proba_estimate_python.png]]
[[file:proba_estimate_python.png]]
Comme on pouvait s'attendre au vu des données initiales, la
Contrairement à l'analyze précédente, on voit que la température a bien un effet considérable sur la probabilité de dysfonctionnement des joins toriques. Ainsi à 31°F, notre modèle prédit qu'un joint torique à plus de 90% de chances de dysfonctionner.
température n'a pas d'impact notable sur la probabilité d'échec des
joints toriques. Elle sera d'environ 0.2, comme dans les essais
précédents où nous il y a eu défaillance d'au moins un joint. Revenons
à l'ensemble des données initiales pour estimer la probabilité de
défaillance d'un joint:
#+begin_src python :results output :session *python* :exports both
#+begin_src python :results value :session *python* :exports both
Cette probabilité est donc d'environ $p=0.065$, sachant qu'il existe
: 1 30.5 1 0.918258
un joint primaire un joint secondaire sur chacune des trois parties du
: 2 31.0 1 0.912615
lançeur, la probabilité de défaillance des deux joints d'un lançeur
est de $p^2 \approx 0.00425$. La probabilité de défaillance d'un des
lançeur est donc de $1-(1-p^2)^3 \approx 1.2%$. Ça serait vraiment
pas de chance... Tout est sous contrôle, le décollage peut donc avoir
lieu demain comme prévu.
Seulement, le lendemain, la navette Challenger explosera et emportera
avec elle ses sept membres d'équipages. L'opinion publique est
fortement touchée et lors de l'enquête qui suivra, la fiabilité des
joints toriques sera directement mise en cause. Au delà des problèmes
de communication interne à la NASA qui sont pour beaucoup dans ce
fiasco, l'analyse précédente comporte (au moins) un petit
problème... Saurez-vous le trouver ? Vous êtes libre de modifier cette
analyse et de regarder ce jeu de données sous tous les angles afin
d'expliquer ce qui ne va pas.
La probabilité qu'un joint défaille à cette température est de $p=0.913$. Sachant qu'il existe un joint primaire un joint secondaire sur chacune des trois parties du lançeur, la probabilité de défaillance des deux joints d'un lançeur est de $p^2 \approx 0.833569$. La probabilité de défaillance d'un des lançeur est donc de $1-(1-p^2)^3 \approx 99.5%$. La catastrophe était certaine.