"Maintenant, on créer un jeu de données pour afficher les données sous-forme d'un tableau, en y ajoutant de taux de mortalité pour les femmes fumeuses (en divisant le nombre de femmes fumeuses décédées par le nom de femmes fumeuses total) et pour les femmes non-fumeuses."
" sortie = pd.DataFrame(données, index = [\"Fumeuses\", \"Non-fumeuses\"] , columns = [\"Décédées\", \"Vivantes\",\"Total\",\"Taux de mortalité\"])\n",
" return sortie\n",
"\n",
"d1=regroupement(classe1)\n",
"d2=regroupement(classe2)\n",
"d3=regroupement(classe3)\n",
"d4=regroupement(classe4)\n",
"\n",
"concatenation=pd.concat([d1,d2,d3,d4])\n",
"\n",
"plt.bar([\"F18-34\",\"NF18-34\",\"F34-55\",\"NF34-55\",\"F55-65\",\"NF55-65\",\"F+65\",\"NF+65\"],concatenation[\"Taux de mortalité\"])\n",
"concatenation"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"D'après le graphique précédent, on observe que pour la tranche 18-34 ans, le taux de mortalité entre les fumeurs et les non-fumeurs est presque semblable. \n",
"Au contraire, on observe que sur les trois autres tranches d'âge, le taux de mortalité pour les fumeurs est plus élevé que le taux de mortalité des non-fumeurs. \n",
"Ce qui est contraire aux résultats trouvés précédemment pour l'ensemble de la série de données. \n",
"Cela peut s'expliquer par le fait que l'échantillon dans chaque sous-groupe n'est pas le même (le nombre de fumeurs décédés ou vivants, et le nombre de non-fumeurs décédés et vivants n'est pas le même)."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Il m'est impossible d'effectuer une régression logistique."