"Mon ordinateur m’indique que $\\pi$ vaut *approximativement*"
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"3.141592653589793\n"
]
}
],
"source": [
"from math import *\n",
"print(pi)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## En utilisant la méthode des aiguilles de Buffon\n",
"Mais calculé avec la **méthode** des [aiguilles de Buffon](https://fr.wikipedia.org/wiki/Aiguille_de_Buffon), on obtiendrait comme **approximation** :"
"## Avec un argument \"fréquentiel\" de surface\n",
"Sinon, une méthode plus simple à comprendre et ne faisant pas intervenir d’appel à la fonction sinus se base sur le fait que si $X\\sim U(0, 1)$ alors $P[X^2 + Y^2 =< 1] = \\pi/4$ (voir [méthode de Monte Carlo sur Wikipedia](https://fr.wikipedia.org/wiki/M%C3%A9thode_de_Monte-Carlo#D%C3%A9termination_de_la_valeur_de_%CF%80)). Le code suivant illustre ce fait :\n"
"# Autour du Paradoxe de Simpson \"réalisé par Wahb ZOUHRI\""
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Importation des librairies et des données"
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"%matplotlib inline\n",
"import matplotlib.pyplot as plt\n",
"import pandas as pd\n",
"import numpy as np\n",
"import warnings\n",
"warnings.filterwarnings('ignore')"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Les données sont disponibles dans ce [fichier CSV](https://gitlab.inria.fr/learninglab/mooc-rr/mooc-rr-ressources/blob/master/module3/Practical_session/Subject6_smoking.csv). Vous trouverez sur chaque ligne si la personne fume ou non, si elle est vivante ou décédée au moment de la seconde étude, et son âge lors du premier sondage."
"Calculez dans chaque groupe (fumeuses / non fumeuses) le taux de mortalité (le rapport entre le nombre de femmes décédées dans un groupe et le nombre total de femmes dans ce groupe). "
"plt.xlabel('Taux de Mortalité', fontweight='bold')\n",
"plt.xticks([r + barWidth*1.5 for r in range(len(bars1))], ['Age_1', 'Age_2', 'Age_3', 'Age_4'])\n",
" \n",
"# Create legend & Show graphic\n",
"plt.legend(['Smoker','Non_Smoker'])\n",
"plt.show()\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Remarque:\n",
"\n",
"En tenant compte du paramètre \"AGE\", on constate que le tabagisme augmente le taux de mortalité des femmes. Cependant, nous ne pouvons pas voir cet impact des cigarettes pour les personnes âgées de 65 ans et plus. Cette étude montre que le fait de négliger un paramètre dans une étude peut biaiser l'analyse."