"Les données traitées sont sur [gitlab](https://gitlab.inria.fr/learninglab/mooc-rr/mooc-rr-ressources/-/raw/master/module3/Practical_session/Subject6_smoking.csv?inline=false)"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [],
"source": [
"# On récupère les données grâce au module pandas au format CVS\n",
"D'après les calculs et les histogrammes ci-dessus, on remarque que les femmes qui fument vivent plus longtemps que les femmes qui ne fument pas. On peut conclure que fumer, c'est bon pour la santé."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Prenons en compte des tranches d'âge pour l'étude à savoir 18-34 ans, 34-54 ans, 55-64 ans et plus de 65 ans et mieux comprendre la conclusion précédente."
]
},
{
"cell_type": "code",
"execution_count": 11,
"metadata": {
"hideCode": false
},
"outputs": [],
"source": [
"# On va considérer des tranches d'âges\n",
"def nb_etat_datas_v2(data):\n",
" \n",
" # classe 18 - 34 ans\n",
" s_d_1834 = 0 # smoker and dead\n",
" s_l_1834 = 0 # smoker and alive\n",
" ns_d_1834 = 0 # not smoker and dead\n",
" ns_l_1834 = 0 # not smoker and alive\n",
" \n",
" # classe 34 - 54 ans\n",
" s_d_3454 = 0 # smoker and dead\n",
" s_l_3454 = 0 # smoker and alive\n",
" ns_d_3454 = 0 # not smoker and dead\n",
" ns_l_3454 = 0 # not smoker and alive\n",
" \n",
" # classe 55 - 64 ans\n",
" s_d_5564 = 0 # smoker and dead\n",
" s_l_5564 = 0 # smoker and alive\n",
" ns_d_5564 = 0 # not smoker and dead\n",
" ns_l_5564 = 0 # not smoker and alive\n",
" \n",
" # classe 65 et plus\n",
" s_d_65_p = 0 # smoker and dead\n",
" s_l_65_p = 0 # smoker and alive\n",
" ns_d_65_p = 0 # not smoker and dead\n",
" ns_l_65_p = 0 # not smoker and alive\n",
" \n",
" for st, sm, age in zip(data[\"Status\"], data[\"Smoker\"], data[\"Age\"]):\n",
"On peut remarquer que les femmes ayant plus 65 ans et ne fumant pas possèdent un taux de mortalité élevé par rapport aux autres\n",
"femmes de différentes classes d'âge; et la mortalité chez les fumeuses (hormis la dernière tranche d'âge) est élevée par rapport à celle chez les non fumeuses.\n",
"Voici un graphique illustrant de nouveau le problème posé (le couple bleu/rouge représente une classe d'âge par ordre croissant)"
]
},
{
"cell_type": "code",
"execution_count": 14,
"metadata": {
"hideCode": false
},
"outputs": [],
"source": [
"# On calcule les taux de mortalité pour les différentes classes d'âges en s'inspirant de ce qui a déjà été fait précédemment\n",