no commit message

parent e625ca5e
......@@ -7,7 +7,39 @@
"hidePrompt": true
},
"source": [
"# titre"
"# Sujet 6 : Autour du Paradoxe de Simpson"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Contexte :"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"En 1972-1974, à Whickham, une ville du nord-est de l'Angleterre, située à environ 6,5 kilomètres au sud-ouest de Newcastle upon Tyne, un sondage d'un sixième des électeurs a été effectué afin d'éclairer des travaux sur les maladies thyroïdiennes et cardiaques (Tunbridge et al. 1977). Une suite de cette étude a été menée vingt ans plus tard (Vanderpump et al. 1995). Certains des résultats avaient trait au tabagisme et cherchaient à savoir si les individus étaient toujours en vie lors de la seconde étude. Par simplicité, nous nous restreindrons aux femmes et parmi celles-ci aux 1314 qui ont été catégorisées comme \"fumant actuellement\" ou \"n'ayant jamais fumé\". Il y avait relativement peu de femmes dans le sondage initial ayant fumé et ayant arrêté depuis (162) et très peu pour lesquelles l'information n'était pas disponible (18). La survie à 20 ans a été déterminée pour l'ensemble des femmes du premier sondage."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### L'étude de ce sujet se fera en 3 étapes :"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"1. Représenter dans un tableau le nombre total de femmes vivantes et décédées sur la période en fonction de leur habitude de tabagisme. Calculer dans chaque groupe (fumeuses / non fumeuses) le taux de mortalité (le rapport entre le nombre de femmes décédées dans un groupe et le nombre total de femmes dans ce groupe). Analyser ce résultat.\n",
"\n",
"2. Reprendre la question 1 (effectifs et taux de mortalité) en rajoutant une nouvelle catégorie liée à la classe d'âge. On considérera les classes suivantes : 18-34 ans, 35-54 ans, 55-64 ans, plus de 65 ans. Analyser le résultat.\n",
"\n",
"3. Etablir une régression logistique en introduisant un variable Death valant 1 ou 0 si la personne est morte ou pas au cours des 20 années entre les 2 sondages. Conclure."
]
},
{
......@@ -535,8 +567,8 @@
"metadata": {},
"source": [
" Création de 2 tableaux à partir du contenu du fichier csv :\n",
" nonFumeuses contient les données des personnes qui ne fument pas (qui ont \"No\" dans la colonne \"Smoker)\n",
" fumeuses contient les données des personnes qui fument (qui ont \"Yes\" dans la colonne \"Smoker\")"
" *nonFumeuses* contient les données des personnes qui ne fument pas (qui ont \"No\" dans la colonne \"Smoker\")\n",
" et *fumeuses* contient les données des personnes qui fument (qui ont \"Yes\" dans la colonne \"Smoker\")"
]
},
{
......@@ -1510,25 +1542,39 @@
"nonFumeuses"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Calcul du nombre **total** de fumeuses (*nbTotalF*) et de non fumeuses (*nbTotalNF*)"
]
},
{
"cell_type": "code",
"execution_count": 7,
"execution_count": 18,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"582\n",
"732\n"
"Le nombre total de fumeuses est de : 582\n",
"Le nombre total de non fumeuses est de : 732\n"
]
}
],
"source": [
"nbTotalF = len(fumeuses.axes[0])\n",
"nbTotalNF = len(nonFumeuses.axes[0])\n",
"print(nbTotalF)\n",
"print(nbTotalNF)"
"print(\"Le nombre total de fumeuses est de :\", nbTotalF)\n",
"print(\"Le nombre total de non fumeuses est de :\", nbTotalNF)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Calcul du nombre de **fumeuses décédées** (*nbDecedeesF*)"
]
},
{
......@@ -1552,6 +1598,13 @@
"nbDecedeesF"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Calcul du nombre de **non fumeuses décédées** (*nbDecedeesNF*)"
]
},
{
"cell_type": "code",
"execution_count": 9,
......@@ -1573,6 +1626,13 @@
"nbDecedeesNF"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Calcul du **taux de mortalité** des fumeuses (*tauxMortF*) et des non fumeuses (*tauxMortNF*)"
]
},
{
"cell_type": "code",
"execution_count": 10,
......@@ -1658,7 +1718,7 @@
},
{
"cell_type": "code",
"execution_count": 12,
"execution_count": 15,
"metadata": {},
"outputs": [
{
......@@ -1689,11 +1749,18 @@
]
},
{
"cell_type": "code",
"execution_count": null,
"cell_type": "markdown",
"metadata": {},
"outputs": [],
"source": []
"source": [
"On obtient des résultats assez surprenants dans le sens où étant donné que l'on nous a souvent répété que fumer est mauvais pour la santé, nous nous attendions à retrouver ce fait dans cette étude."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Etape 2"
]
},
{
"cell_type": "code",
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment