Update journldebord-markdown.md

d4a143c0 · 7f44fa1d418b758304544a2b0e758b76 · f051f7cb · d4a143c0
Commit d4a143c0 authored Nov 30, 2020 by 7f44fa1d418b758304544a2b0e758b76
Hide whitespace changes
Inline Side-by-side

Showing with 38 additions and 13 deletions

journldebord-markdown.md journldebord-markdown.md +38 -13

No files found.
--- a/journldebord-markdown.md
+++ b/journldebord-markdown.md
@@ -23,21 +23,46 @@
 3. Les avantages d'un workflow.  


- Paradoxe de Simpson
-1. Utiliser les librairies nécessaires : Pandas, matplotlib.
-
-2. Importer les data en utilisant la fonction "read" du pandas.
-
+- Paradoxe de Simpson :
+1. Utiliser les librairies : Pandas, matplotlib.
+~~~
+%matplotlib inline
+import pandas as pd
+import matplotlib.pyplot as plt
+~~~
+2. Importer les donnees en utilisant la fonction "read" du pandas.
+~~~
+donnees = pd.read_csv("https://gitlab.inria.fr/learninglab/mooc-rr/mooc-rr-ressources/-/raw/master/module3/Practical_session/Subject6_smoking.csv?inline=false")
+~~~
 3. Afficher les donnees dans un tableau.

 4. Chercher les donnees du colonne 1 du tableau (Smoker).
-
+~~~
+donnees.values[:,0]= str(donnees.values[:,0])
+~~~
 5. Chercher les donnees du colonne 2 du tableau (Status).
 
 6. - Chercher le nombre des fumeuses des donnees du colonne 1 et qui sont mort des donnees du colonne 2.
+~~~
+i=0
+y=0
+for j in range(0,1314):
+    if 'Yes' in donnees.values[j,0]:
+        y=y+1
+        if 'Dead' in donnees.values[j,1]:
+            i=i+1
+~~~
   - Chercher le pourcentage de ce groupe : nombre des fumeuses mortes / nombre des fumeuses.
+   - 
+~~~
+(i/y)*100
+~~~
   - Afficher ce pourcentage.
   
+~~~
+ 23.883161512027492
+~~~
+   
 7. - Chercher le nombre des non fumeuses des donnees du colonne 1 et qui sont mort des donnees du colonne 2.
   - Chercher le pourcentage de ce groupe : nombre des non fumeuses mortes / nombre des non fumeuses.
   - Afficher ce pourcentage.
@@ -53,37 +78,37 @@ i=0
 y=0
 e=0
 t=0
-u=0
 r=0
+u=0
 p=0
 o=0
 for j in range(0,1314):
    if int(data.values[j,2])>=18 & int(data.values[j,2])<=34:
-        if 'No' in data.values[j,0]:
+        if 'Yes' in data.values[j,0]:
            y=y+1
            if 'Dead' in data.values[j,1]:
                i=i+1
    if int(data.values[j,2])>=35 & int(data.values[j,2])<=54:
-        if 'No' in data.values[j,0]:
+        if 'Yes' in data.values[j,0]:
            e=e+1
            if 'Dead' in data.values[j,1]:
                t=t+1
    if int(data.values[j,2])>=55 & int(data.values[j,2])<=64:
-        if 'No' in data.values[j,0]:
+        if 'Yes' in data.values[j,0]:
            r=r+1
            if 'Dead' in data.values[j,1]:
                u=u+1
    if int(data.values[j,2])>=65:
-        if 'No' in data.values[j,0]:
+        if 'Yes' in data.values[j,0]:
            o=o+1
            if 'Dead' in data.values[j,1]:
-                p=p+1  
+                p=p+1 
 ~~~
 ~~~
 (i/y)*100,(t/e)*100,(u/r)*100,(p/o)*100
 ~~~
 ~~~
-(31.420765027322407, 31.420765027322407, 31.420765027322407, 85.49222797927462)
+(23.883161512027492, 23.883161512027492, 23.883161512027492, 85.71428571428571)
 ~~~

 9. De même, On calcule dans cette partie les pourcentages des nombre des non fumeuses morts divisés sur les 4 catégories d'âge de la même façon la partie précédente et on les affiches.