Update journldebord-markdown.md

parent f051f7cb
......@@ -23,21 +23,46 @@
3. Les avantages d'un workflow.
- Paradoxe de Simpson
1. Utiliser les librairies nécessaires : Pandas, matplotlib.
2. Importer les data en utilisant la fonction "read" du pandas.
- Paradoxe de Simpson :
1. Utiliser les librairies : Pandas, matplotlib.
~~~
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
~~~
2. Importer les donnees en utilisant la fonction "read" du pandas.
~~~
donnees = pd.read_csv("https://gitlab.inria.fr/learninglab/mooc-rr/mooc-rr-ressources/-/raw/master/module3/Practical_session/Subject6_smoking.csv?inline=false")
~~~
3. Afficher les donnees dans un tableau.
4. Chercher les donnees du colonne 1 du tableau (Smoker).
~~~
donnees.values[:,0]= str(donnees.values[:,0])
~~~
5. Chercher les donnees du colonne 2 du tableau (Status).
6. - Chercher le nombre des fumeuses des donnees du colonne 1 et qui sont mort des donnees du colonne 2.
~~~
i=0
y=0
for j in range(0,1314):
if 'Yes' in donnees.values[j,0]:
y=y+1
if 'Dead' in donnees.values[j,1]:
i=i+1
~~~
- Chercher le pourcentage de ce groupe : nombre des fumeuses mortes / nombre des fumeuses.
-
~~~
(i/y)*100
~~~
- Afficher ce pourcentage.
~~~
23.883161512027492
~~~
7. - Chercher le nombre des non fumeuses des donnees du colonne 1 et qui sont mort des donnees du colonne 2.
- Chercher le pourcentage de ce groupe : nombre des non fumeuses mortes / nombre des non fumeuses.
- Afficher ce pourcentage.
......@@ -53,37 +78,37 @@ i=0
y=0
e=0
t=0
u=0
r=0
u=0
p=0
o=0
for j in range(0,1314):
if int(data.values[j,2])>=18 & int(data.values[j,2])<=34:
if 'No' in data.values[j,0]:
if 'Yes' in data.values[j,0]:
y=y+1
if 'Dead' in data.values[j,1]:
i=i+1
if int(data.values[j,2])>=35 & int(data.values[j,2])<=54:
if 'No' in data.values[j,0]:
if 'Yes' in data.values[j,0]:
e=e+1
if 'Dead' in data.values[j,1]:
t=t+1
if int(data.values[j,2])>=55 & int(data.values[j,2])<=64:
if 'No' in data.values[j,0]:
if 'Yes' in data.values[j,0]:
r=r+1
if 'Dead' in data.values[j,1]:
u=u+1
if int(data.values[j,2])>=65:
if 'No' in data.values[j,0]:
if 'Yes' in data.values[j,0]:
o=o+1
if 'Dead' in data.values[j,1]:
p=p+1
p=p+1
~~~
~~~
(i/y)*100,(t/e)*100,(u/r)*100,(p/o)*100
~~~
~~~
(31.420765027322407, 31.420765027322407, 31.420765027322407, 85.49222797927462)
(23.883161512027492, 23.883161512027492, 23.883161512027492, 85.71428571428571)
~~~
9. De même, On calcule dans cette partie les pourcentages des nombre des non fumeuses morts divisés sur les 4 catégories d'âge de la même façon la partie précédente et on les affiches.
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment