Réponse à l'exercice "Autour du paradoxe de Simpson"

parent d13a82e4
...@@ -80,11 +80,20 @@ tab_exo1$ICdown=tab_exo1$Taux_mortalite-1.96*sqrt(tab_exo1$Taux_mortalite* ...@@ -80,11 +80,20 @@ tab_exo1$ICdown=tab_exo1$Taux_mortalite-1.96*sqrt(tab_exo1$Taux_mortalite*
(1-tab_exo1$Taux_mortalite)/tab_exo1$Number_smoker) (1-tab_exo1$Taux_mortalite)/tab_exo1$Number_smoker)
tab_exo1$ICup=tab_exo1$Taux_mortalite+1.96*sqrt(tab_exo1$Taux_mortalite* tab_exo1$ICup=tab_exo1$Taux_mortalite+1.96*sqrt(tab_exo1$Taux_mortalite*
(1-tab_exo1$Taux_mortalite)/tab_exo1$Number_smoker) (1-tab_exo1$Taux_mortalite)/tab_exo1$Number_smoker)
tab_exo1 library(knitr)
kable(tab_exo1)
``` ```
On a donc un taux de mortalité pour les fumeuses de 0.24 avec un IC [0.20;0.27] On a donc un taux de mortalité pour les fumeuses de 0.24 avec un IC [0.20;0.27]
et pour les non fumeuse 0.31 avec un IC [0.28;0.35] et pour les non fumeuse 0.31 avec un IC [0.28;0.35]
```{r,, fig.height=9, fig.width=14}
library(ggplot2)
library(ggthemes)
ggplot(tab_exo1, aes(x=Smoker, y=Taux_mortalite, group=Smoker, color=Smoker)) +
geom_pointrange(aes(ymin=ICdown, ymax=ICup),lwd=1.8) +
scale_color_manual(values=c("blue","red"))
```
**En quoi ce résultat est-il surprenant?** **En quoi ce résultat est-il surprenant?**
On a un taux de mortalité plus important pour les femmes non fumeuses. On a un taux de mortalité plus important pour les femmes non fumeuses.
...@@ -95,9 +104,10 @@ Dans la consigne le 34 est pris 2 fois, j'ai fais le choix de ne le prendre que ...@@ -95,9 +104,10 @@ Dans la consigne le 34 est pris 2 fois, j'ai fais le choix de ne le prendre que
- On définit les différentes classes d'âge - On définit les différentes classes d'âge
```{r} ```{r}
data$classe_age=NA data$classe_age=NA
data$classe_age[data$Age>=18 & data$Age<35]="1" data$classe_age[data$Age>=18 & data$Age<35]="18-34"
data$classe_age[data$Age>=35 & data$Age<64]="2" data$classe_age[data$Age>=35 & data$Age<54]="35-54"
data$classe_age[data$Age>=65 ]="3" data$classe_age[data$Age>=55 & data$Age<64]="55-64"
data$classe_age[data$Age>=65 ]="65 et +"
data$classe_age=as.factor(data$classe_age) data$classe_age=as.factor(data$classe_age)
levels(data$classe_age) levels(data$classe_age)
``` ```
...@@ -138,7 +148,7 @@ kable(tab_exo2) ...@@ -138,7 +148,7 @@ kable(tab_exo2)
``` ```
**Vous pourrez proposer une représentation graphique de ces données et calculer des intervalles de confiance si vous le souhaitez.** **Vous pourrez proposer une représentation graphique de ces données et calculer des intervalles de confiance si vous le souhaitez.**
```{r} ```{r,, fig.height=9, fig.width=14}
boxplot(Taux_mortalite ~ Smoker*Class_Age, data=tab_exo2) boxplot(Taux_mortalite ~ Smoker*Class_Age, data=tab_exo2)
``` ```
...@@ -147,11 +157,20 @@ tab_exo2$ICdown=tab_exo2$Taux_mortalite-1.96*sqrt(tab_exo2$Taux_mortalite* ...@@ -147,11 +157,20 @@ tab_exo2$ICdown=tab_exo2$Taux_mortalite-1.96*sqrt(tab_exo2$Taux_mortalite*
(1-tab_exo2$Taux_mortalite)/tab_exo2$Number_smoker_classage) (1-tab_exo2$Taux_mortalite)/tab_exo2$Number_smoker_classage)
tab_exo2$ICup=tab_exo2$Taux_mortalite+1.96*sqrt(tab_exo2$Taux_mortalite* tab_exo2$ICup=tab_exo2$Taux_mortalite+1.96*sqrt(tab_exo2$Taux_mortalite*
(1-tab_exo2$Taux_mortalite)/tab_exo2$Number_smoker_classage) (1-tab_exo2$Taux_mortalite)/tab_exo2$Number_smoker_classage)
tab_exo2 library(knitr)
kable(tab_exo2)
``` ```
**En quoi ce résultat est-il surprenant?** **En quoi ce résultat est-il surprenant?**
Dans ce cas là, on voit que l'on a un plus fort taux de mortalité pour les femmes fumeuses dans la classe d'âge 2 et une tendance similaire pour les femmes de la classe d'âge 1. Dans ce cas là, on voit que l'on a une tendance à plus fort taux de mortalité pour les femmes fumeuses dans la classe d'âge 2 et une tendance similaire pour les femmes de la classe d'âge 1.Cependant les interval de confiance sont chevauchant
```{r,, fig.height=9, fig.width=14}
tab_exo2$age_smoker=as.factor(paste(tab_exo2$Class_Age,tab_exo2$Smoker, sep="_"))
library(ggplot2)
library(ggthemes)
ggplot(tab_exo2, aes(x=age_smoker, y=Taux_mortalite, group=Smoker, color=Smoker)) +
geom_pointrange(aes(ymin=ICdown, ymax=ICup),lwd=1.8) +
scale_color_manual(values=c("blue","red"))
```
**Arrivez-vous à expliquer ce paradoxe? De même, vous pourrez proposer une représentation graphique de ces données pour étayer vos explications.** **Arrivez-vous à expliquer ce paradoxe? De même, vous pourrez proposer une représentation graphique de ces données pour étayer vos explications.**
On peut voir qu'il y a beaucoup plus de femmes de la classe d'âge 3 dans les non fumeuses, donc une mortalité qui semble plus importante pour les non fumeuse car cette classe d'âge et celle ou il y a un plus fort taux de mortalité On peut voir qu'il y a beaucoup plus de femmes de la classe d'âge 3 dans les non fumeuses, donc une mortalité qui semble plus importante pour les non fumeuse car cette classe d'âge et celle ou il y a un plus fort taux de mortalité
...@@ -214,7 +233,7 @@ legend("bottomright",bty="n", legend=c("Fumeuse","Non fumeuse"), ...@@ -214,7 +233,7 @@ legend("bottomright",bty="n", legend=c("Fumeuse","Non fumeuse"),
**Ces régressions vous permettent-elles de conclure sur la nocivité du tabagisme ?** **Ces régressions vous permettent-elles de conclure sur la nocivité du tabagisme ?**
Non, on voit que d'une manière générale la probabilité de mourir augmente avec l'âge, mais on trouve de faibles différences entre les courbes des fumeuses et des non fumeuses, avec des intervals de confiance trés chevauchant hormis dans la tranche d'âge autour de 40 ans. Non, on voit que d'une manière générale la probabilité de mourir augmente avec l'âge, mais on trouve de faibles différences entre les courbes des fumeuses et des non fumeuses, avec des intervals de confiance trés chevauchant bien qu'il y ait une tendance à ce que les femmes dans la tranche d'âge autour de 40 ans qui sont fumeuses aient un taux de mortalité légèrement supérieur aux femmes non fumeuses
Pour confirmer cela on peut faire une sélection de modèle sur le critère AICc, en comparant le modèle avec l'effet smoker et celui sans: Pour confirmer cela on peut faire une sélection de modèle sur le critère AICc, en comparant le modèle avec l'effet smoker et celui sans:
```{r} ```{r}
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment