Commit 25a572b4 authored by David Rei's avatar David Rei

insertion modifs + commentaires

parent 832ded1d
...@@ -27,6 +27,7 @@ Nous commençons donc par charger ces données: ...@@ -27,6 +27,7 @@ Nous commençons donc par charger ces données:
```{r} ```{r}
data = read.csv("shuttle.csv",header=T) data = read.csv("shuttle.csv",header=T)
data2 = read.csv("shuttle.csv",header=T)
data data
``` ```
...@@ -44,6 +45,9 @@ moins un joint a été défectueux. ...@@ -44,6 +45,9 @@ moins un joint a été défectueux.
```{r} ```{r}
data = data[data$Malfunction>0,] data = data[data$Malfunction>0,]
data data
data2 = data2[data2$Malfunction<1,]
data2
``` ```
Très bien, nous avons une variabilité de température importante mais Très bien, nous avons une variabilité de température importante mais
...@@ -53,6 +57,8 @@ simplifier l'analyse. ...@@ -53,6 +57,8 @@ simplifier l'analyse.
Comment la fréquence d'échecs varie-t-elle avec la température ? Comment la fréquence d'échecs varie-t-elle avec la température ?
```{r} ```{r}
plot(data=data, Malfunction/Count ~ Temperature, ylim=c(0,1)) plot(data=data, Malfunction/Count ~ Temperature, ylim=c(0,1))
plot(data=data, Pressure ~ Temperature, ylim=c(0,200))
plot(data=data2, Pressure ~ Temperature, ylim=c(0,200), xlim=c(60, 85))
``` ```
À première vue, ce n'est pas flagrant mais bon, essayons quand même À première vue, ce n'est pas flagrant mais bon, essayons quand même
...@@ -122,3 +128,27 @@ fiasco, l'analyse précédente comporte (au moins) un petit ...@@ -122,3 +128,27 @@ fiasco, l'analyse précédente comporte (au moins) un petit
problème... Saurez-vous le trouver ? Vous êtes libre de modifier cette problème... Saurez-vous le trouver ? Vous êtes libre de modifier cette
analyse et de regarder ce jeu de données sous tous les angles afin analyse et de regarder ce jeu de données sous tous les angles afin
d'expliquer ce qui ne va pas. d'expliquer ce qui ne va pas.
## Modifications / remarques
1. Jeu de données
Dans le jeu de données, le problème majeur vient des paramètres des tests : température et pression. Une hypothèse faite dans l'analyse est que les dysfonctionnements ne surviennent qu'à "haute" pression (200 psi), mais l'intervalle de températures ne correspond pas. Il aurait fallu avoir autant de tests aux mêmes températures / pressions à chaque fois.
Le dysfonctionnement repéré à P = 50 psi survient à T = 70°F, et on considère d'office que la pression n'est pas responsable. Première erreur.
Ensuite, l'intervalle de temps des tests est de 5 ans. Il aurait été pratique, ou rassurant, d'être certain que les matériaux utilisés, ou la conception des pièces, soient identiques à travers cette période (même si, considérant le domaine, je suppose que c'est le cas). Idem sur la fiabilité de la fabrication des pièces, ce sont des informations qui sont produites par les constructeurs, en particulier à ce niveau de criticité.
2. L'inspection graphique des données
L'hypothèse formulée d'entrée est, je pense, erronée. En effet, l'inspection des données des joints n'ayant pas eu de dysfonctionnement peut nous renseigner sur les circonstances où "tout se passe bien", afin de délimiter le périmètre / le modèle "hors catastrophe". Si ensuite, dans notre analyse du domaine "catastrophe", il y a recouvrement des domaines (overlap), alors c'est d'autant plus facile de détecter qu'il y a une erreur.
Là, on se cache un oeil, volontairement.
Rien qu'au niveau de l'inspection, j'ai dédoublé les graphes. En particulier, j'ai plotté en fonction de la température et de la pression pour les deux sous sets de données : avec et sans dysfonctionnement.
Graphiquement, c'est visible : il y a bien un problème, et cela concerne bien la température, mais à des niveaux spécifiques : les basses températures, inférieures à 70°F. Si on prend T = 70°F comme seuil, on se rend compte que les défaillances sont nettement plus nombreuses lorsqu'on est en dessous que lorsqu'on est au dessus, indépendamment de la pression (quoique les tests à pression P = 200 psi soient plus nombreux, voir point 1.).
L'influence de la pression ne doit pas rester à côté non plus : à "haute" température, pour T > 65°F, quelle que soit la pression, pas de défaillance. Par contre, la quasi totalité des défaillances se produisirent à haute pression, pour T < 65°F. Il y a donc un "trou" dans les données : il manque des tests à basse pression (P < 200), basse température (T < 65°F) pour compléter l'analyse et les hypothèses faites.
3. L'estimation de l'influence de la température
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment