Update exo5_fr.Rmd

parent 8b3a93dc
...@@ -29,22 +29,55 @@ Nous commençons donc par charger ces données: ...@@ -29,22 +29,55 @@ Nous commençons donc par charger ces données:
data = read.csv("shuttle.csv",header=T) data = read.csv("shuttle.csv",header=T)
data data
``` ```
```{r}
# =========================
# Correction de l'analyse
# =========================
# ERREUR HISTORIQUE :
# Les analyses initiales filtraient les vols avec Malfunction > 0,
# supprimant ainsi les vols sans incident (zéros), ce qui biaise
# totalement l'estimation d'une probabilité.
# On conserve donc TOUS les vols.
# Création d'une variable binaire correcte :
# 1 = au moins un joint défaillant, 0 = aucun incident
data$incident <- as.integer(data$Malfunction > 0)
# Visualisation correcte : tous les vols
plot(data$Temperature, data$incident, pch = 19,
xlab = "Température (°F)",
ylab = "Incident (0/1)",
main = "Risque de défaillance vs température (tous les vols)")
# Régression logistique correcte
fit_incident <- glm(incident ~ Temperature, data = data, family = binomial())
summary(fit_incident)
# Courbe de probabilité estimée
tgrid <- data.frame(Temperature = seq(min(data$Temperature),
max(data$Temperature),
length.out = 200))
tgrid$p <- predict(fit_incident, newdata = tgrid, type = "response")
plot(data$Temperature, data$incident, pch = 19,
xlab = "Température (°F)",
ylab = "Incident (0/1)",
main = "Probabilité estimée d'incident selon la température")
lines(tgrid$Temperature, tgrid$p, lwd = 2)
Le jeu de données nous indique la date de l'essai, le nombre de joints Le jeu de données nous indique la date de l'essai, le nombre de joints
toriques mesurés (il y en a 6 sur le lançeur principal), la toriques mesurés (il y en a 6 sur le lançeur principal), la
température (en Farenheit) et la pression (en psi), et enfin le température (en Farenheit) et la pression (en psi), et enfin le
nombre de dysfonctionnements relevés. nombre de dysfonctionnements relevés.
# Inspection graphique des données # Inspection graphique des données
Les vols où aucun incident n'est relevé n'apportant aucun information Les sans incident (Malfunction = 0) sont essentiels : ils indiquent à quelles
sur l'influence de la température ou de la pression sur les températures *aucun* problème n’est observé. Les exclure biaise l’analyse et
dysfonctionnements, nous nous concentrons sur les expériences où au conduit à sous-estimer le risque aux basses températures.
moins un joint a été défectueux.
```{r}
data = data[data$Malfunction>0,]
data
```
Très bien, nous avons une variabilité de température importante mais Très bien, nous avons une variabilité de température importante mais
la pression est quasiment toujours égale à 200, ce qui devrait la pression est quasiment toujours égale à 200, ce qui devrait
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment