Commit a43b8374 authored by Hugo Botton's avatar Hugo Botton

Exo 5 - Detecter le pblm

parent 7731b238
......@@ -42,10 +42,23 @@ dysfonctionnements, nous nous concentrons sur les expériences où au
moins un joint a été défectueux.
```{r}
data = data[data$Malfunction>0,]
#data = data[data$Malfunction>0,]
data
```
Il ne faut pas enlever les observations où il n'y a pas eu de problème sinon nous introduisons un biais de sélection dans le modèle.
```{r}
table(data$Malfunction)
plot(density(data$Temperature[data$Malfunction==0]),xlim=c(40,90))
lines(density(data$Temperature[data$Malfunction>0]),col="red")
```
Nous observons sur ces graphiques que la température est plus fréquemment basse en présence de problème (rouge) que lorsqu'il n'y en a pas (noir)
On enlève donc de l'analyse les cas ou il faisait plus chaud et il n'y a pas eu de problème, ce qui fait disparaitre la relation entre temperature et risque de problème.
Très bien, nous avons une variabilité de température importante mais
la pression est quasiment toujours égale à 200, ce qui devrait
simplifier l'analyse.
......@@ -53,6 +66,11 @@ simplifier l'analyse.
Comment la fréquence d'échecs varie-t-elle avec la température ?
```{r}
plot(data=data, Malfunction/Count ~ Temperature, ylim=c(0,1))
# summary(data$Malfunction[data$Temperature <= 67] /data$Count[data$Temperature <= 67])
# summary(data$Malfunction[data$Temperature > 75] /data$Count[data$Temperature > 75])
# summary(data$Malfunction[data$Temperature > 75] /data$Count[data$Temperature > 75])
# summary(data$Malfunction[data$Temperature > 75] /data$Count[data$Temperature > 75])
```
À première vue, ce n'est pas flagrant mais bon, essayons quand même
......@@ -75,6 +93,8 @@ logistic_reg = glm(data=data, Malfunction/Count ~ Temperature, weights=Count,
summary(logistic_reg)
```
Cette fois on obtient un coefficient statistiquement significatif qui indique une relation négative entre la température et le risque d'accident : plus il fait froid, plus les risques d'accident sont faibles.
L'estimateur le plus probable du paramètre de température est 0.001416
et l'erreur standard de cet estimateur est de 0.049, autrement dit on
ne peut pas distinguer d'impact particulier et il faut prendre nos
......
This source diff could not be displayed because it is too large. You can view the blob instead.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment