+
+Comme fait précédemment, nous allons maintenant réduire les
+échantillons selon si les personnes sont vivantes ou non lors du second sondage :
+
+
+
smokers_18_34_alive <- subset(smokers_18_34, smokers_18_34$Status == "Alive")
+smokers_34_54_alive <- subset(smokers_34_54, smokers_34_54$Status == "Alive")
+smokers_54_64_alive <- subset(smokers_54_64, smokers_54_64$Status == "Alive")
+smokers_65_alive <- subset(smokers_65, smokers_65$Status == "Alive")
+
+head(smokers_18_34_alive)
+head(smokers_34_54_alive)
+head(smokers_54_64_alive)
+head(smokers_65_alive)
+
+
+
+
+Smoker Status Age
+1 Yes Alive 21.0
+2 Yes Alive 19.3
+9 Yes Alive 24.8
+11 Yes Alive 30.0
+38 Yes Alive 29.5
+50 Yes Alive 22.1
+Smoker Status Age
+10 Yes Alive 49.5
+13 Yes Alive 49.2
+22 Yes Alive 38.3
+31 Yes Alive 34.6
+32 Yes Alive 51.9
+33 Yes Alive 49.9
+Smoker Status Age
+27 Yes Alive 59.2
+61 Yes Alive 58.1
+84 Yes Alive 58.3
+91 Yes Alive 56.1
+136 Yes Alive 63.6
+178 Yes Alive 56.8
+Smoker Status Age
+5 Yes Alive 81.4
+20 Yes Alive 65.7
+255 Yes Alive 72.1
+525 Yes Alive 74.1
+873 Yes Alive 71.5
+966 Yes Alive 73.8
+
+
+
+
smokers_18_34_dead <- subset(smokers_18_34, smokers_18_34$Status == "Dead")
+smokers_34_54_dead <- subset(smokers_34_54, smokers_34_54$Status == "Dead")
+smokers_54_64_dead <- subset(smokers_54_64, smokers_54_64$Status == "Dead")
+smokers_65_dead <- subset(smokers_65, smokers_65$Status == "Dead")
+
+head(smokers_18_34_dead)
+head(smokers_34_54_dead)
+head(smokers_54_64_dead)
+head(smokers_65_dead)
+
+
+
+
+Smoker Status Age
+39 Yes Dead 33.0
+828 Yes Dead 22.6
+973 Yes Dead 28.3
+1017 Yes Dead 32.6
+1115 Yes Dead 31.3
+Smoker Status Age
+47 Yes Dead 44.3
+64 Yes Dead 36.3
+88 Yes Dead 53.6
+133 Yes Dead 35.7
+140 Yes Dead 40.8
+172 Yes Dead 48.4
+Smoker Status Age
+8 Yes Dead 57.5
+24 Yes Dead 62.3
+98 Yes Dead 55.5
+102 Yes Dead 61.0
+110 Yes Dead 62.8
+123 Yes Dead 63.8
+Smoker Status Age
+65 Yes Dead 80.7
+113 Yes Dead 66.5
+130 Yes Dead 87.8
+137 Yes Dead 71.7
+191 Yes Dead 78.3
+200 Yes Dead 68.4
+
+
+
+Les résultats semblent bon.
+
+
+
+Nous allons faire de même pour les ensembles des non-fumeuses:
+
+
+
not_smokers_18_34_alive <- subset(not_smokers_18_34, not_smokers_18_34$Status == "Alive")
+not_smokers_34_54_alive <- subset(not_smokers_34_54, not_smokers_34_54$Status == "Alive")
+not_smokers_54_64_alive <- subset(not_smokers_54_64, not_smokers_54_64$Status == "Alive")
+not_smokers_65_alive <- subset(not_smokers_65, not_smokers_65$Status == "Alive")
+
+head(not_smokers_18_34_alive)
+head(not_smokers_34_54_alive)
+head(not_smokers_54_64_alive)
+head(not_smokers_65_alive)
+
+
+
+
+Smoker Status Age
+7 No Alive 23.8
+16 No Alive 25.1
+18 No Alive 27.1
+23 No Alive 33.4
+25 No Alive 18.0
+28 No Alive 25.8
+Smoker Status Age
+4 No Alive 47.1
+6 No Alive 36.8
+17 No Alive 43.5
+52 No Alive 45.0
+58 No Alive 51.2
+60 No Alive 41.9
+Smoker Status Age
+14 No Alive 58.4
+19 No Alive 58.3
+26 No Alive 56.2
+35 No Alive 56.9
+74 No Alive 62.4
+75 No Alive 62.5
+Smoker Status Age
+51 No Alive 82.8
+109 No Alive 83.7
+139 No Alive 82.0
+160 No Alive 67.2
+173 No Alive 82.7
+188 No Alive 78.2
+
+
+
+
not_smokers_18_34_dead <- subset(not_smokers_18_34, not_smokers_18_34$Status == "Dead")
+not_smokers_34_54_dead <- subset(not_smokers_34_54, not_smokers_34_54$Status == "Dead")
+not_smokers_54_64_dead <- subset(not_smokers_54_64, not_smokers_54_64$Status == "Dead")
+not_smokers_65_dead <- subset(not_smokers_65, not_smokers_65$Status == "Dead")
+
+head(not_smokers_18_34_dead)
+head(not_smokers_34_54_dead)
+head(not_smokers_54_64_dead)
+head(not_smokers_65_dead)
+
+
+
+
+Smoker Status Age
+147 No Dead 26.3
+516 No Dead 25.3
+565 No Dead 29.8
+628 No Dead 29.3
+675 No Dead 20.2
+1256 No Dead 28.5
+Smoker Status Age
+29 No Dead 36.9
+215 No Dead 35.2
+299 No Dead 52.4
+309 No Dead 47.9
+344 No Dead 47.0
+608 No Dead 47.2
+Smoker Status Age
+3 No Dead 57.5
+15 No Dead 60.6
+71 No Dead 58.1
+86 No Dead 55.9
+135 No Dead 62.3
+150 No Dead 58.3
+Smoker Status Age
+12 No Dead 66.0
+21 No Dead 73.2
+42 No Dead 69.7
+44 No Dead 75.8
+46 No Dead 83.0
+53 No Dead 73.3
+
+
+
+Les résultats restent satisfaisants.
+
+
+
+Regardons maintanant tout ça sur des graphiques :
+
+
+
+Pour les 18-34 ans :
+
+
+
x_age_92 = c(nrow(smokers_18_34_alive),nrow(smokers_18_34_dead))
+type_age_92 = c("Fumeuses 18-34 vivantes", "Fumeuses 18-34 mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes fumeuses de 18-34 ans vivantes/mortes 20 ans plus tard")
+
+
+
+
+
+
+
+
x_age_92 = c(nrow(not_smokers_18_34_alive),nrow(not_smokers_18_34_dead))
+type_age_92 = c("Non-fumeuses 18-34 vivantes", "Non-fumeuses 18-34 mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes non-fumeuses de 18-34 ans vivantes/mortes 20 ans plus tard")
+
+
+
+
+
+
+
+
x_age_92 = c(nrow(smokers_18_34_alive),nrow(smokers_18_34_dead),nrow(not_smokers_18_34_alive),nrow(not_smokers_18_34_dead))
+type_age_92 = c("Fumeuses 18-34 vivantes", "Fumeuses 18-34 mortes","Non-fumeuses 18-34 vivantes", "Non-fumeuses 18-34 mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes fumeuses et non-fumeuses de 18-34 ans vivantes/mortes 20 ans plus tard")
+
+
+
+
+
+
+
+L'effectif de femmes mortes entre celles fumeuses et non-fumeuses Ã
+l'air d'être équivalent. On a en revanche un plus grand effectif de
+femmes non-fumeuses vivantes. Rappelons-nous que dans les ensembles de
+départ (1972-1974), nous avions également un plus grand effectif de
+non-fumeuses vivantes.
+On peut donc conjecturer que le taux de mortalité sera plus élevé pour
+les fumeuses cette fois.
+
+
+
+Pour les 34-54 ans :
+
+
+
+
x_age_92 = c(nrow(smokers_34_54_alive),nrow(smokers_34_54_dead))
+type_age_92 = c("Fumeuses 34-54 vivantes", "Fumeuses 34-54 mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes fumeuses de 34-54 ans vivantes/mortes 20 ans plus tard ")
+
+
+
+
+
+
+
+
x_age_92 = c(nrow(not_smokers_34_54_alive),nrow(not_smokers_34_54_dead))
+type_age_92 = c("Non-fumeuses 34-54 vivantes", "Non-fumeuses 34-54 mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes non-fumeuses de 34-54 ans vivantes/mortes 20 ans plus tard ")
+
+
+
+
+
+
+
+
x_age_92 = c(nrow(smokers_34_54_alive),nrow(smokers_34_54_dead),nrow(not_smokers_34_54_alive),nrow(not_smokers_34_54_dead))
+type_age_92 = c("Fumeuses 34-54 vivantes", "Fumeuses 34-54 mortes","Non-fumeuses 34-54 vivantes", "Non-fumeuses 34-54 mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes fumeuses et non-fumeuses de 34-54 ans vivantes/mortes 20 ans plus tard ")
+
+
+
+
+
+
+
+Il y a plus de fumeuses mortes que de non-fumeuses mortes, mais il
+reste plus de fumeuses vivantes que de non-fumeuses vivantes. Dans les
+ensembles de départ (1972-1974), il y avait plus de fumeuses vivantes
+que de non-fumeuses vivantes. Nous ne pouvons pas encore nous
+prononcer sur les taux de mortalité.
+
+
+
+Pour les 54-65 ans :
+
+
+
+
x_age_92 = c(nrow(smokers_54_64_alive),nrow(smokers_54_64_dead))
+type_age_92 = c("Fumeuses 54-65 vivantes", "Fumeuses 54-65 mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes fumeuses de 54-64 ans vivantes/mortes 20 ans plus tard")
+
+
+
+
+
+
+
+
x_age_92 = c(nrow(not_smokers_54_64_alive),nrow(not_smokers_54_64_dead))
+type_age_92 = c("Non-fumeuses 54-65 vivantes", "Non-fumeuses 54-65 mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes non-fumeuses de 54-64 ans vivantes/mortes 20 ans plus tard")
+
+
+
+
+
+
+
+
x_age_92 = c(nrow(smokers_54_64_alive),nrow(smokers_54_64_dead),nrow(not_smokers_54_64_alive),nrow(not_smokers_54_64_dead))
+type_age_92 = c("Fumeuses 54-65 vivantes", "Fumeuses 54-65 mortes","Non-fumeuses 54-65 vivantes", "Non-fumeuses 54-65 mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes fumeuses et non-fumeuses de 54-64 ans vivantes/mortes 20 ans plus tard")
+
+
+
+
+
+
+
+Il y a plus de fumeuses mortes que de non-fumeuses mortes, et il y a
+moins de fumeuses vivantes que de non-fumeuses vivantes, sachant que
+dans les ensembles de départ (1972-1974), il y avait plus de non-fumeuses vivantes
+que de fumeuses vivantes.
+On peut donc deviner que le taux de mortalité sera plus élevé pour les fumeuses.
+
+
+
+Pour les plus de 65 ans :
+
+
+
x_age_92 = c(nrow(smokers_65_alive),nrow(smokers_65_dead))
+type_age_92 = c("Fumeuses 65+ vivantes", "Fumeuses 65+ mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes fumeuses de plus de 65 ans vivantes/mortes 20 ans plus tard")
+
+
+
+
+
+
+
+
x_age_92 = c(nrow(not_smokers_65_alive),nrow(not_smokers_65_dead))
+type_age_92 = c("Non-fumeuses 65+ vivantes", "Non-fumeuses 65+ mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes non-fumeuses de plus de 65 ans vivantes/mortes 20 ans plus tard")
+
+
+
+
+
+
+
+
x_age_92 = c(nrow(smokers_65_alive),nrow(smokers_65_dead),nrow(not_smokers_65_alive),nrow(not_smokers_65_dead))
+type_age_92 = c("Fumeuses 65+ vivantes", "Fumeuses 65+ mortes","Non-fumeuses 65+ vivantes", "Non-fumeuses 65+ mortes")
+barplot(x_age_92,names.arg=type_age_92,main="Effectif des femmes fumeuses et non-fumeuses de plus de 65 ans vivantes/mortes 20 ans plus tard")
+
+
+
+
+
+
+
+Il y a bien plus de non-fumeuses mortes que de fumeuses mortes, mais
+il y a plus de non-fumeuses vivantes que de fumeuses
+vivantes. L'ensemble de départ (1972-1974) est encore plus important
+ici puisque l'écart d'effectif entre les fumeuses/non-fumeuses est
+flagrant : environ 150 personnes d'écart, mais nous nous prononcerons
+pas encore sur le taux de mortalité.
+
+