diff --git a/module3/exo2/exerciceTabac.ipynb b/module3/exo2/exerciceTabac.ipynb index 2ff5819fee783c7ab78466639e2e7c6477673705..9b0f94b542ed17aad9fd00a391522120ff777fa1 100644 --- a/module3/exo2/exerciceTabac.ipynb +++ b/module3/exo2/exerciceTabac.ipynb @@ -7,7 +7,39 @@ "hidePrompt": true }, "source": [ - "# titre" + "# Sujet 6 : Autour du Paradoxe de Simpson" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Contexte :" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "En 1972-1974, à Whickham, une ville du nord-est de l'Angleterre, située à environ 6,5 kilomètres au sud-ouest de Newcastle upon Tyne, un sondage d'un sixième des électeurs a été effectué afin d'éclairer des travaux sur les maladies thyroïdiennes et cardiaques (Tunbridge et al. 1977). Une suite de cette étude a été menée vingt ans plus tard (Vanderpump et al. 1995). Certains des résultats avaient trait au tabagisme et cherchaient à savoir si les individus étaient toujours en vie lors de la seconde étude. Par simplicité, nous nous restreindrons aux femmes et parmi celles-ci aux 1314 qui ont été catégorisées comme \"fumant actuellement\" ou \"n'ayant jamais fumé\". Il y avait relativement peu de femmes dans le sondage initial ayant fumé et ayant arrêté depuis (162) et très peu pour lesquelles l'information n'était pas disponible (18). La survie à 20 ans a été déterminée pour l'ensemble des femmes du premier sondage." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### L'étude de ce sujet se fera en 3 étapes :" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "1. Représenter dans un tableau le nombre total de femmes vivantes et décédées sur la période en fonction de leur habitude de tabagisme. Calculer dans chaque groupe (fumeuses / non fumeuses) le taux de mortalité (le rapport entre le nombre de femmes décédées dans un groupe et le nombre total de femmes dans ce groupe). Analyser ce résultat.\n", + "\n", + "2. Reprendre la question 1 (effectifs et taux de mortalité) en rajoutant une nouvelle catégorie liée à la classe d'âge. On considérera les classes suivantes : 18-34 ans, 35-54 ans, 55-64 ans, plus de 65 ans. Analyser le résultat.\n", + "\n", + "3. Etablir une régression logistique en introduisant un variable Death valant 1 ou 0 si la personne est morte ou pas au cours des 20 années entre les 2 sondages. Conclure." ] }, { @@ -535,8 +567,8 @@ "metadata": {}, "source": [ " Création de 2 tableaux à partir du contenu du fichier csv :\n", - " nonFumeuses contient les données des personnes qui ne fument pas (qui ont \"No\" dans la colonne \"Smoker)\n", - " fumeuses contient les données des personnes qui fument (qui ont \"Yes\" dans la colonne \"Smoker\")" + " *nonFumeuses* contient les données des personnes qui ne fument pas (qui ont \"No\" dans la colonne \"Smoker\")\n", + " et *fumeuses* contient les données des personnes qui fument (qui ont \"Yes\" dans la colonne \"Smoker\")" ] }, { @@ -1510,25 +1542,39 @@ "nonFumeuses" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Calcul du nombre **total** de fumeuses (*nbTotalF*) et de non fumeuses (*nbTotalNF*)" + ] + }, { "cell_type": "code", - "execution_count": 7, + "execution_count": 18, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ - "582\n", - "732\n" + "Le nombre total de fumeuses est de : 582\n", + "Le nombre total de non fumeuses est de : 732\n" ] } ], "source": [ "nbTotalF = len(fumeuses.axes[0])\n", "nbTotalNF = len(nonFumeuses.axes[0])\n", - "print(nbTotalF)\n", - "print(nbTotalNF)" + "print(\"Le nombre total de fumeuses est de :\", nbTotalF)\n", + "print(\"Le nombre total de non fumeuses est de :\", nbTotalNF)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Calcul du nombre de **fumeuses décédées** (*nbDecedeesF*)" ] }, { @@ -1552,6 +1598,13 @@ "nbDecedeesF" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Calcul du nombre de **non fumeuses décédées** (*nbDecedeesNF*)" + ] + }, { "cell_type": "code", "execution_count": 9, @@ -1573,6 +1626,13 @@ "nbDecedeesNF" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Calcul du **taux de mortalité** des fumeuses (*tauxMortF*) et des non fumeuses (*tauxMortNF*)" + ] + }, { "cell_type": "code", "execution_count": 10, @@ -1658,7 +1718,7 @@ }, { "cell_type": "code", - "execution_count": 12, + "execution_count": 15, "metadata": {}, "outputs": [ { @@ -1689,11 +1749,18 @@ ] }, { - "cell_type": "code", - "execution_count": null, + "cell_type": "markdown", "metadata": {}, - "outputs": [], - "source": [] + "source": [ + "On obtient des résultats assez surprenants dans le sens où étant donné que l'on nous a souvent répété que fumer est mauvais pour la santé, nous nous attendions à retrouver ce fait dans cette étude." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "# Etape 2" + ] }, { "cell_type": "code",