diff --git a/module3/exo3/exercice.ipynb b/module3/exo3/exercice.ipynb index 520aa14f3ea93d2e57327fe9a6b6ea54e897e55e..8512527dfd9da2bbb6e0720bd783055f1b2820fe 100644 --- a/module3/exo3/exercice.ipynb +++ b/module3/exo3/exercice.ipynb @@ -811,12 +811,53 @@ "On remarque cette fois que, pour chaque classe d'âge, le résultat est attendu où le taux de mortalité est nettement supérieur pour le groupe des fumeuses, sauf pour les plus de 65 ans où les résultats sont sensiblement égaux." ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "blabla il y a plus de vieilles non fumeuses, donc plus de morts" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Vérification de l'hypothèse - régression logistique" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Pour commencer on va rajouter les variables de type boolean dans le dataset, pour représenter les variables Status et Smoker." + ] + }, + { + "cell_type": "code", + "execution_count": 56, + "metadata": {}, + "outputs": [ + { + "ename": "SyntaxError", + "evalue": "invalid syntax (, line 1)", + "output_type": "error", + "traceback": [ + "\u001b[0;36m File \u001b[0;32m\"\"\u001b[0;36m, line \u001b[0;32m1\u001b[0m\n\u001b[0;31m dead_bool = [(col[i]['Status'] == \"Dead\") for i in 1:len(data)]\u001b[0m\n\u001b[0m ^\u001b[0m\n\u001b[0;31mSyntaxError\u001b[0m\u001b[0;31m:\u001b[0m invalid syntax\n" + ] + } + ], + "source": [ + "dead_bool = [(col[i]['Status'] == \"Dead\") for i in 1:len(data)]" + ] + }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], - "source": [] + "source": [ + "data.insert(4, \"Dead?\",data)" + ] } ], "metadata": {