"On remarque cette fois que, pour chaque classe d'âge, le résultat est attendu où le taux de mortalité est nettement supérieur pour le groupe des fumeuses, sauf pour les plus de 65 ans où les résultats sont sensiblement égaux."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"blabla il y a plus de vieilles non fumeuses, donc plus de morts"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Vérification de l'hypothèse - régression logistique"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Pour commencer on va rajouter les variables de type boolean dans le dataset, pour représenter les variables Status et Smoker."
]
},
{
"cell_type": "code",
"execution_count": 56,
"metadata": {},
"outputs": [
{
"ename": "SyntaxError",
"evalue": "invalid syntax (<ipython-input-56-12aabec9006d>, line 1)",
"output_type": "error",
"traceback": [
"\u001b[0;36m File \u001b[0;32m\"<ipython-input-56-12aabec9006d>\"\u001b[0;36m, line \u001b[0;32m1\u001b[0m\n\u001b[0;31m dead_bool = [(col[i]['Status'] == \"Dead\") for i in 1:len(data)]\u001b[0m\n\u001b[0m ^\u001b[0m\n\u001b[0;31mSyntaxError\u001b[0m\u001b[0;31m:\u001b[0m invalid syntax\n"
]
}
],
"source": [
"dead_bool = [(col[i]['Status'] == \"Dead\") for i in 1:len(data)]"