diff --git a/journldebord-markdown.md b/journldebord-markdown.md index 240dbab4f9a2cfc40f7c1143ee5657a1f4f16cd2..2094ed81743dcd18506bd5e0bb6e53e5973d9fdb 100644 --- a/journldebord-markdown.md +++ b/journldebord-markdown.md @@ -23,21 +23,46 @@ 3. Les avantages d'un workflow. -- Paradoxe de Simpson -1. Utiliser les librairies nécessaires : Pandas, matplotlib. - -2. Importer les data en utilisant la fonction "read" du pandas. - +- Paradoxe de Simpson : +1. Utiliser les librairies : Pandas, matplotlib. +~~~ +%matplotlib inline +import pandas as pd +import matplotlib.pyplot as plt +~~~ +2. Importer les donnees en utilisant la fonction "read" du pandas. +~~~ +donnees = pd.read_csv("https://gitlab.inria.fr/learninglab/mooc-rr/mooc-rr-ressources/-/raw/master/module3/Practical_session/Subject6_smoking.csv?inline=false") +~~~ 3. Afficher les donnees dans un tableau. 4. Chercher les donnees du colonne 1 du tableau (Smoker). - +~~~ +donnees.values[:,0]= str(donnees.values[:,0]) +~~~ 5. Chercher les donnees du colonne 2 du tableau (Status). 6. - Chercher le nombre des fumeuses des donnees du colonne 1 et qui sont mort des donnees du colonne 2. +~~~ +i=0 +y=0 +for j in range(0,1314): + if 'Yes' in donnees.values[j,0]: + y=y+1 + if 'Dead' in donnees.values[j,1]: + i=i+1 +~~~ - Chercher le pourcentage de ce groupe : nombre des fumeuses mortes / nombre des fumeuses. + - +~~~ +(i/y)*100 +~~~ - Afficher ce pourcentage. +~~~ + 23.883161512027492 +~~~ + 7. - Chercher le nombre des non fumeuses des donnees du colonne 1 et qui sont mort des donnees du colonne 2. - Chercher le pourcentage de ce groupe : nombre des non fumeuses mortes / nombre des non fumeuses. - Afficher ce pourcentage. @@ -53,37 +78,37 @@ i=0 y=0 e=0 t=0 -u=0 r=0 +u=0 p=0 o=0 for j in range(0,1314): if int(data.values[j,2])>=18 & int(data.values[j,2])<=34: - if 'No' in data.values[j,0]: + if 'Yes' in data.values[j,0]: y=y+1 if 'Dead' in data.values[j,1]: i=i+1 if int(data.values[j,2])>=35 & int(data.values[j,2])<=54: - if 'No' in data.values[j,0]: + if 'Yes' in data.values[j,0]: e=e+1 if 'Dead' in data.values[j,1]: t=t+1 if int(data.values[j,2])>=55 & int(data.values[j,2])<=64: - if 'No' in data.values[j,0]: + if 'Yes' in data.values[j,0]: r=r+1 if 'Dead' in data.values[j,1]: u=u+1 if int(data.values[j,2])>=65: - if 'No' in data.values[j,0]: + if 'Yes' in data.values[j,0]: o=o+1 if 'Dead' in data.values[j,1]: - p=p+1 + p=p+1 ~~~ ~~~ (i/y)*100,(t/e)*100,(u/r)*100,(p/o)*100 ~~~ ~~~ -(31.420765027322407, 31.420765027322407, 31.420765027322407, 85.49222797927462) +(23.883161512027492, 23.883161512027492, 23.883161512027492, 85.71428571428571) ~~~ 9. De même, On calcule dans cette partie les pourcentages des nombre des non fumeuses morts divisés sur les 4 catégories d'âge de la même façon la partie précédente et on les affiches.