Le sujet que j'ai choisi concerne le paradoxe de Sympson.
Le sujet que j'ai choisi concerne le paradoxe de Simpson.
Il faut d'abord importer les données dans notre document computationnelle. Pour cela, il faut utiliser le lien du fichier csv. Ces données
Il faut d'abord importer les données dans notre document computationnelle. Pour cela, on utilise le lien du fichier csv. Ces données
concernent les femmes de l'étude. Chaque ligne concerne une femme différente. Ainsi, la première colonne indique si elle fume au moment du
concernent les femmes de l'étude. Chaque ligne concerne une femme différente. Ainsi, la première colonne indique si elle fume au moment du
second sondage, la seconde si elle est encore vivante ou non et la dernière, son âge lors du premier sondage.
second sondage, la seconde si elle est encore vivante ou non et la dernière, son âge lors du premier sondage.
...
@@ -46,20 +46,21 @@ second sondage, la seconde si elle est encore vivante ou non et la dernière, so
...
@@ -46,20 +46,21 @@ second sondage, la seconde si elle est encore vivante ou non et la dernière, so
Pour connaître le nombre de femmes décédées et vivantes en fonction de leur habitudes de tabagisme, il faut parcourir le tableau ligne
Pour connaître le nombre de femmes décédées et vivantes en fonction de leur habitudes de tabagisme, il faut parcourir le tableau ligne
par ligne avec une boucle for. On commence d'abord par créer 4 variables de valant 0 et qui compteront le nombres de femmes dans les 4 catégories suivantes :
par ligne avec une boucle for. On commence d'abord par créer quatre variables valant 0 et qui compteront le nombres de femmes dans les 4
fumeuse et encore vivante, fumeuse et décédée, non fumeuse et vivante, non fumeuse et décédée; indépendemment de l'âge.
catégories suivantes : fumeuse et encore vivante, fumeuse et décédée, non fumeuse et vivante, non fumeuse et décédée; indépendemment de l'âge.
Ainsi, lors du parcours ligne par ligne du tableau, on vérfie à chaque fois, à laquelles des 4 critères la femme remplie et on augmente de 1
Ainsi, lors du parcours ligne par ligne du tableau, on vérfie à chaque fois, à laquelle de ces catégorie la femme correspond et on augmente de
la variable associée à ces critères. Une fois l'ensemble du tableau parcouru, on peut vérifier qu'on a pas oublié ou compté 2 fois une ligne
1 la variable associée. Une fois l'ensemble du tableau parcouru, pour vérifier qu'on a pas oublié ou compté deux fois une ligne,
en sommant les 4 variables et vérifier qu'on obtient bien 1314, soit le nombre total de femmes pour le sondage.
on sommant les quatre variables et on vérifie qu'on obtient bien 1314, soit le nombre total de femmes pour le sondage.
De plus, pour mieux visualiser, on représente les 4 valeurs obtenues avec un diagramme en bâton à l'aide de la fonction bar de matplotlib.
De plus, pour mieux visualiser, on représente les quatre valeurs obtenues avec un diagramme en bâton à l'aide de la fonction bar de matplotlib.
Pour chaque bâton, on retrouve en abscisse la catégorie et en ordonnée l'effectif dans cet catégorie.
Pour chaque bâton, on retrouve en abscisse la catégorie et en ordonnée l'effectif dans cette catégorie.
Pour caculer le taux de mortalié chez les fumeuses, on divise le nombre de fumeuses décédées par le nombre total de fumeuses.
Pour caculer le taux de mortalié chez les fumeuses, on divise le nombre de fumeuses décédées par le nombre total de fumeuses.
Pour celui chez les non fumeuses, on divise le nombre de non fumeuses décédéés par le nombre total de non fumeuses.
Pour celui chez les non fumeuses, on divise le nombre de non fumeuses décédées par le nombre total de non fumeuses. On fait de même pour les
fumeuses.
Pour mieux voir ces deux taux, on peux les répresenter avec la fonction bar de matplotlib.
Pour mieux visualiser ces deux taux, on les répresente avec la fonction bar.
L'intervalle de confiance pour un taux est centré sur le taux et sa largeur est le double de l'inverse de la racine carrée du nombre total de
L'intervalle de confiance pour un taux est centré sur le taux et sa largeur est le double de l'inverse de la racine carrée du nombre total de
femmes.
femmes.
...
@@ -73,26 +74,26 @@ On souhaite maintenant prendre en compte l'âge des femmes qui participent au so
...
@@ -73,26 +74,26 @@ On souhaite maintenant prendre en compte l'âge des femmes qui participent au so
Comme précédemment, pour dénombrer le nombre de fumeuses et de non fumeuses selon la classe d'âge, il faut d'abord définir des variables
Comme précédemment, pour dénombrer le nombre de fumeuses et de non fumeuses selon la classe d'âge, il faut d'abord définir des variables
valant 0. Il y a 8 variables étant donnée qu'il y 4 classes d'âges pour les fumeuses et 4 classes d'âges pour les non fumeuses.
valant 0. Il y a huit variables étant donnée qu'il y quatre classes d'âges pour les fumeuses et 4 classes d'âges pour les non fumeuses.
Ensuite, on parcourt chaque ligne du tableau avec une boucle fort et à chaque ligne selon que la femme soit fumeuse est ou non, sa classe
Ensuite, on parcourt chaque ligne du tableau avec une boucle fort et à chaque ligne selon que la femme soit fumeuse est ou non fumeuse, et de
d'âge, on augmente de 1 la variable qui dénombrera l'occurence de ce critère. Comme vérification, on somme le nombre de fumeuse d'un côté
quelle est sa classe d'âge, on augmente de 1 la variable qui dénombrera l'occurence de son critère. Comme vérification, on somme le nombre de
pour l'ensemble des classes d'âges et celui de non fumeuses de l'autre, la somme de ces deux résultats doit donner le nombre total de femmes
fumeuse d'un côté pour l'ensemble des classes d'âge et celui de non fumeuses de l'autre et la somme de ces deux résultats doit donner le
pour le sondage.
nombre total de femmes pour le sondage.
On répresente les effectifs des non fumeuses selon leur classe d'âge sous forme de diagramme en bâton avec la même fonction bar. On fait de
On représente les effectifs des non fumeuses selon leur classe d'âge sous forme de diagramme en bâton avec la fonction bar. On fait de
même avec les fumeuses.
même avec les fumeuses.
Pour préparer le calcul du taux de mortalité, on commence par définir 8 nouvelles variables qui compteront le nombres de femmes fumeuses
Pour préparer le calcul du taux de mortalité, on commence par définir huit nouvelles variables qui compteront le nombres de femmes fumeuses
décédées et de femmes non fumeuses décédées dans chaque classe d'âges. Ensuite, on parcourt le tableau ligne après ligne avec une boucle for
décédées et de femmes non fumeuses décédées dans chaque classe d'âges. Ensuite, on parcourt le tableau ligne après ligne avec une boucle for
en regardant si la femme est décédée, si elle est fumeuse ou non et dans quelle classe d'âge elle est. Puis, on aumente de 1, la variable
en regardant si la femme est décédée, si elle est fumeuse ou non et dans quelle classe d'âge elle est. Puis, on augmmente de 1, la variable
associée aux critères de la femme en considérée. Ensuite, on affiche la valeur des 8 variables.
associée aux critères de la femme considérée. Ensuite, on affiche la valeur des huit variables.
On calcul ensuite le taux de mortalité pour les fumeuses et les non fumeuses dans chaque classe d'âge, soit 8 taux de mortalités. Pour celui
On calcule ensuite le taux de mortalité pour les fumeuses et les non fumeuses dans chaque classe d'âge, soit huit taux de mortalités. Pour
de la première classe d'âge chez les non fumeuses, on fait le rapport du nombre de femmes décédées et non fumeuses dans cette classe avec le
celui de la première classe d'âge chez les non fumeuses, on fait le rapport du nombre de femmes décédées et non fumeuses dans cette classe
nombre total de femmes non fumeuses dans cette catégorie. Le calcul est similaire pour les autres taux.
avec le nombre total de femmes non fumeuses dans cette catégorie. Le calcul est similaire pour les autres taux.
On represente maintenant ces 8 taux avec un digramme en bâton où les effectifs sont en ordonnées et en absisses les fumeuses et les non
On représente ensuite ces huit taux avec un diagramme en bâton où les effectifs sont en ordonnées et en absisses les fumeuses et les non