diff --git a/module3/exo3/exercice_fr.Rmd b/module3/exo3/exercice_fr.Rmd index 7fce89bce83f5f5f5882872478e52e271e016426..0549592be4ae12988015d66e97ec09913061ce73 100644 --- a/module3/exo3/exercice_fr.Rmd +++ b/module3/exo3/exercice_fr.Rmd @@ -80,11 +80,20 @@ tab_exo1$ICdown=tab_exo1$Taux_mortalite-1.96*sqrt(tab_exo1$Taux_mortalite* (1-tab_exo1$Taux_mortalite)/tab_exo1$Number_smoker) tab_exo1$ICup=tab_exo1$Taux_mortalite+1.96*sqrt(tab_exo1$Taux_mortalite* (1-tab_exo1$Taux_mortalite)/tab_exo1$Number_smoker) -tab_exo1 +library(knitr) +kable(tab_exo1) ``` On a donc un taux de mortalité pour les fumeuses de 0.24 avec un IC [0.20;0.27] et pour les non fumeuse 0.31 avec un IC [0.28;0.35] +```{r,, fig.height=9, fig.width=14} +library(ggplot2) +library(ggthemes) +ggplot(tab_exo1, aes(x=Smoker, y=Taux_mortalite, group=Smoker, color=Smoker)) + +geom_pointrange(aes(ymin=ICdown, ymax=ICup),lwd=1.8) + + scale_color_manual(values=c("blue","red")) +``` + **En quoi ce résultat est-il surprenant?** On a un taux de mortalité plus important pour les femmes non fumeuses. @@ -95,9 +104,10 @@ Dans la consigne le 34 est pris 2 fois, j'ai fais le choix de ne le prendre que - On définit les différentes classes d'âge ```{r} data$classe_age=NA -data$classe_age[data$Age>=18 & data$Age<35]="1" -data$classe_age[data$Age>=35 & data$Age<64]="2" -data$classe_age[data$Age>=65 ]="3" +data$classe_age[data$Age>=18 & data$Age<35]="18-34" +data$classe_age[data$Age>=35 & data$Age<54]="35-54" +data$classe_age[data$Age>=55 & data$Age<64]="55-64" +data$classe_age[data$Age>=65 ]="65 et +" data$classe_age=as.factor(data$classe_age) levels(data$classe_age) ``` @@ -138,7 +148,7 @@ kable(tab_exo2) ``` **Vous pourrez proposer une représentation graphique de ces données et calculer des intervalles de confiance si vous le souhaitez.** -```{r} +```{r,, fig.height=9, fig.width=14} boxplot(Taux_mortalite ~ Smoker*Class_Age, data=tab_exo2) ``` @@ -147,11 +157,20 @@ tab_exo2$ICdown=tab_exo2$Taux_mortalite-1.96*sqrt(tab_exo2$Taux_mortalite* (1-tab_exo2$Taux_mortalite)/tab_exo2$Number_smoker_classage) tab_exo2$ICup=tab_exo2$Taux_mortalite+1.96*sqrt(tab_exo2$Taux_mortalite* (1-tab_exo2$Taux_mortalite)/tab_exo2$Number_smoker_classage) -tab_exo2 +library(knitr) +kable(tab_exo2) ``` **En quoi ce résultat est-il surprenant?** -Dans ce cas là, on voit que l'on a un plus fort taux de mortalité pour les femmes fumeuses dans la classe d'âge 2 et une tendance similaire pour les femmes de la classe d'âge 1. +Dans ce cas là, on voit que l'on a une tendance à plus fort taux de mortalité pour les femmes fumeuses dans la classe d'âge 2 et une tendance similaire pour les femmes de la classe d'âge 1.Cependant les interval de confiance sont chevauchant +```{r,, fig.height=9, fig.width=14} +tab_exo2$age_smoker=as.factor(paste(tab_exo2$Class_Age,tab_exo2$Smoker, sep="_")) +library(ggplot2) +library(ggthemes) +ggplot(tab_exo2, aes(x=age_smoker, y=Taux_mortalite, group=Smoker, color=Smoker)) + +geom_pointrange(aes(ymin=ICdown, ymax=ICup),lwd=1.8) + + scale_color_manual(values=c("blue","red")) +``` **Arrivez-vous à expliquer ce paradoxe? De même, vous pourrez proposer une représentation graphique de ces données pour étayer vos explications.** On peut voir qu'il y a beaucoup plus de femmes de la classe d'âge 3 dans les non fumeuses, donc une mortalité qui semble plus importante pour les non fumeuse car cette classe d'âge et celle ou il y a un plus fort taux de mortalité @@ -214,7 +233,7 @@ legend("bottomright",bty="n", legend=c("Fumeuse","Non fumeuse"), **Ces régressions vous permettent-elles de conclure sur la nocivité du tabagisme ?** -Non, on voit que d'une manière générale la probabilité de mourir augmente avec l'âge, mais on trouve de faibles différences entre les courbes des fumeuses et des non fumeuses, avec des intervals de confiance trés chevauchant hormis dans la tranche d'âge autour de 40 ans. +Non, on voit que d'une manière générale la probabilité de mourir augmente avec l'âge, mais on trouve de faibles différences entre les courbes des fumeuses et des non fumeuses, avec des intervals de confiance trés chevauchant bien qu'il y ait une tendance à ce que les femmes dans la tranche d'âge autour de 40 ans qui sont fumeuses aient un taux de mortalité légèrement supérieur aux femmes non fumeuses Pour confirmer cela on peut faire une sélection de modèle sur le critère AICc, en comparant le modèle avec l'effet smoker et celui sans: ```{r}