question 1 done

parent f1313ce6
...@@ -607,6 +607,13 @@ ...@@ -607,6 +607,13 @@
"raw_data[raw_data.isnull().any(axis=1)]" "raw_data[raw_data.isnull().any(axis=1)]"
] ]
}, },
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Effectif et taux de mortalite"
]
},
{ {
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
...@@ -641,7 +648,7 @@ ...@@ -641,7 +648,7 @@
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"Nous représentons ensuite ces données sous la forme d'un tableau. " "D'apres nos calculs, dans l'etude il y avait 582 fumeuses dont 139 sont mortes et 732 non-fumeuses dont 230 sont decedees. Nous représentons ensuite ces données sous la forme d'un tableau."
] ]
}, },
{ {
...@@ -710,40 +717,31 @@ ...@@ -710,40 +717,31 @@
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"A present, nous allons calculer le taux de mortalite dans chacun de ces deux groupes. Pour cela, nous allons determiner le rapport entre le nombre de femmes décédées dans un groupe et le nombre total de femmes dans ce groupe. Dans le groupe des femmes fumeuses, le taux de mortalite est 0,24 tandis que dans le groupe des femmes non fumeuses, le taux de mortalite est 0,31." "A present, nous allons calculer le taux de mortalite dans chacun de ces deux groupes. Pour cela, nous allons determiner le rapport entre le nombre de femmes décédées dans un groupe et le nombre total de femmes dans ce groupe.\n",
"\n",
"Le taux de mortalite chez les fumeuses etait de 24% tandis que celui des non-fumeuses etait de 31%. Nous obtenons un resultat assez surprenant car d'apres ces etudes, les femmes non-fumeuses meurent plus que les femmes qui fument, ce qui est contraire aux campagnes de prevention que l'on peut croiser un peu partout."
] ]
}, },
{ {
"cell_type": "code", "cell_type": "code",
"execution_count": 11, "execution_count": 26,
"metadata": {}, "metadata": {},
"outputs": [ "outputs": [],
{
"name": "stdout",
"output_type": "stream",
"text": [
"Taux de mortalite fumeuses : 0.23883161512027493\n",
"Taux de mortalite non-fumeuses : 0.31420765027322406\n"
]
}
],
"source": [ "source": [
"mortality_rate_smoker = dead_and_smoker/(alive_and_smoker+dead_and_smoker)\n", "mortality_rate_smoker = dead_and_smoker/(alive_and_smoker+dead_and_smoker)\n",
"mortality_rate_non_smoker = dead_and_non_smoker /(alive_and_non_smoker + dead_and_non_smoker)\n", "mortality_rate_non_smoker = dead_and_non_smoker /(alive_and_non_smoker + dead_and_non_smoker)"
"print(\"Taux de mortalite fumeuses :\", mortality_rate_smoker)\n",
"print(\"Taux de mortalite non-fumeuses :\", mortality_rate_non_smoker)"
] ]
}, },
{ {
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"Nous representons les taux de mortalite calcules precedemment dans un diagramme de barres afin d'illustrer visuellement nos resultats." "Nous representons les taux de mortalite calcules precedemment dans un diagramme de barres afin d'illustrer visuellement nos resultats et le fait que, d'apres ces sondages, les femmes qui fument meurent moins que celle qui ne fument pas."
] ]
}, },
{ {
"cell_type": "code", "cell_type": "code",
"execution_count": 15, "execution_count": 9,
"metadata": {}, "metadata": {},
"outputs": [ "outputs": [
{ {
...@@ -752,7 +750,7 @@ ...@@ -752,7 +750,7 @@
"Text(0,0.5,'Mortality Rate')" "Text(0,0.5,'Mortality Rate')"
] ]
}, },
"execution_count": 15, "execution_count": 9,
"metadata": {}, "metadata": {},
"output_type": "execute_result" "output_type": "execute_result"
}, },
...@@ -779,6 +777,87 @@ ...@@ -779,6 +777,87 @@
"plt.ylabel('Mortality Rate')" "plt.ylabel('Mortality Rate')"
] ]
}, },
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Enfin, nous allons estimer le taux de mortalite chez les femmes du au tabagisme a cette epoque sur la population anglaise d'apres les resultats de ces deux etudes. \n",
"\n",
"Pour faire cela, nous allons calculer des intervalles de confiance a 95% pour chaque categorie (fumeuses et non-fumeuses). La formule generale pour calculer un intervalle de\n",
"confiance au niveau de confiance 0,95 est : $ [f-1/\\sqrt{n} ; f+1/\\sqrt{n}]$ si $n\\le30$ et si $nf\\le5$ et $n(1-f)\\le5$ avec $f$ la fréquence observée dans un échantillon de taille $n$. \n",
"\n",
"Dans notre cas, la frequence observee $f$ correspond au taux de mortalite et la taille $n$ de l'echantillon correspond au nombre de femmes ayant repondu aux sondages soit 1314."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Apres avoir verifie que les conditions pour calculer les intervalles de confiance de chacune des deux categories etaient respectees, nous effectuons les calculs.\n",
"\n",
"Pour les fumeuses, l'intervalle de confiance a 95% du taux de mortalite chez les femmes est $[0.21 ; 0.27]$. Pour les non-fumeuses, l'intervalle de confiance a 95% du taux de mortalite chez les femmes est $[0.29 ; 0.34]$. "
]
},
{
"cell_type": "code",
"execution_count": 25,
"metadata": {},
"outputs": [],
"source": [
"import math\n",
"n = 1314\n",
"if (n*mortality_rate_smoker <= 5) and (n*(1-mortality_rate_smoker)<=5):\n",
" confidence_interval_smoker_low = mortality_rate_smoker-(1/math.sqrt(n))\n",
" confidence_interval_smoker_high = mortality_rate_smoker+(1/math.sqrt(n))\n",
"if (n*mortality_rate_non_smoker <= 5) and (n*(1-mortality_rate_non_smoker)<=5):\n",
" confidence_interval_non_smoker_low = mortality_rate_non_smoker-(1/math.sqrt(n))\n",
" confidence_interval_non_smoker_high = mortality_rate_non_smoker+(1/math.sqrt(n))"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Effectif et taux de mortalite par tranches d'age"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Nous allons reprendre les calculs d'effectif et de taux de mortalite calcules precedemment, mais nous allons les categoriser par tranche d'age. Les femmes ayant participe a ces etudes seront reparties dans quatre categories en fonction de leur age : 18-34 ans, 34-54 ans, 55-64 ans, plus de 65 ans."
]
},
{
"cell_type": "code",
"execution_count": 12,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"398 438 236 242\n"
]
}
],
"source": [
"class_18_to_34 = []\n",
"class_34_to_54 = []\n",
"class_55_to_64 = []\n",
"class_over_65 = []\n",
"for i in range(len(raw_data)):\n",
" if raw_data.iloc[i][2] < 34:\n",
" class_18_to_34.append(raw_data.iloc[i])\n",
" elif 34 <= raw_data.iloc[i][2] < 55:\n",
" class_34_to_54.append(raw_data.iloc[i])\n",
" elif 55 <= raw_data.iloc[i][2] < 65 :\n",
" class_55_to_64.append(raw_data.iloc[i])\n",
" else :\n",
" class_over_65.append(raw_data.iloc[i])\n",
"print(len(class_18_to_34),len(class_34_to_54),len(class_55_to_64),len(class_over_65))"
]
},
{ {
"cell_type": "code", "cell_type": "code",
"execution_count": null, "execution_count": null,
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment