From d4a143c0f31b82b36179aaf57fea98c56e99bd87 Mon Sep 17 00:00:00 2001 From: 7f44fa1d418b758304544a2b0e758b76 <7f44fa1d418b758304544a2b0e758b76@app-learninglab.inria.fr> Date: Mon, 30 Nov 2020 01:55:03 +0000 Subject: [PATCH] Update journldebord-markdown.md --- journldebord-markdown.md | 51 ++++++++++++++++++++++++++++++---------- 1 file changed, 38 insertions(+), 13 deletions(-) diff --git a/journldebord-markdown.md b/journldebord-markdown.md index 240dbab..2094ed8 100644 --- a/journldebord-markdown.md +++ b/journldebord-markdown.md @@ -23,21 +23,46 @@ 3. Les avantages d'un workflow. -- Paradoxe de Simpson -1. Utiliser les librairies nécessaires : Pandas, matplotlib. - -2. Importer les data en utilisant la fonction "read" du pandas. - +- Paradoxe de Simpson : +1. Utiliser les librairies : Pandas, matplotlib. +~~~ +%matplotlib inline +import pandas as pd +import matplotlib.pyplot as plt +~~~ +2. Importer les donnees en utilisant la fonction "read" du pandas. +~~~ +donnees = pd.read_csv("https://gitlab.inria.fr/learninglab/mooc-rr/mooc-rr-ressources/-/raw/master/module3/Practical_session/Subject6_smoking.csv?inline=false") +~~~ 3. Afficher les donnees dans un tableau. 4. Chercher les donnees du colonne 1 du tableau (Smoker). - +~~~ +donnees.values[:,0]= str(donnees.values[:,0]) +~~~ 5. Chercher les donnees du colonne 2 du tableau (Status). 6. - Chercher le nombre des fumeuses des donnees du colonne 1 et qui sont mort des donnees du colonne 2. +~~~ +i=0 +y=0 +for j in range(0,1314): + if 'Yes' in donnees.values[j,0]: + y=y+1 + if 'Dead' in donnees.values[j,1]: + i=i+1 +~~~ - Chercher le pourcentage de ce groupe : nombre des fumeuses mortes / nombre des fumeuses. + - +~~~ +(i/y)*100 +~~~ - Afficher ce pourcentage. +~~~ + 23.883161512027492 +~~~ + 7. - Chercher le nombre des non fumeuses des donnees du colonne 1 et qui sont mort des donnees du colonne 2. - Chercher le pourcentage de ce groupe : nombre des non fumeuses mortes / nombre des non fumeuses. - Afficher ce pourcentage. @@ -53,37 +78,37 @@ i=0 y=0 e=0 t=0 -u=0 r=0 +u=0 p=0 o=0 for j in range(0,1314): if int(data.values[j,2])>=18 & int(data.values[j,2])<=34: - if 'No' in data.values[j,0]: + if 'Yes' in data.values[j,0]: y=y+1 if 'Dead' in data.values[j,1]: i=i+1 if int(data.values[j,2])>=35 & int(data.values[j,2])<=54: - if 'No' in data.values[j,0]: + if 'Yes' in data.values[j,0]: e=e+1 if 'Dead' in data.values[j,1]: t=t+1 if int(data.values[j,2])>=55 & int(data.values[j,2])<=64: - if 'No' in data.values[j,0]: + if 'Yes' in data.values[j,0]: r=r+1 if 'Dead' in data.values[j,1]: u=u+1 if int(data.values[j,2])>=65: - if 'No' in data.values[j,0]: + if 'Yes' in data.values[j,0]: o=o+1 if 'Dead' in data.values[j,1]: - p=p+1 + p=p+1 ~~~ ~~~ (i/y)*100,(t/e)*100,(u/r)*100,(p/o)*100 ~~~ ~~~ -(31.420765027322407, 31.420765027322407, 31.420765027322407, 85.49222797927462) +(23.883161512027492, 23.883161512027492, 23.883161512027492, 85.71428571428571) ~~~ 9. De même, On calcule dans cette partie les pourcentages des nombre des non fumeuses morts divisés sur les 4 catégories d'âge de la même façon la partie précédente et on les affiches. -- 2.18.1