1. emporter et etudier les donnes dans le notebook.
1. emporter et etudier les donnes dans le notebook.
2. comparer les solutions.
2. comparer les solutions.
- Module 4 : La realite du terrain :
- Module 4 : La realite du terrain :
1. Les inconvénients d'un document computationnel.
1. Les inconvénients d'un document computationnel.
2. Les platformes pour enregister les donnes, l'articles et le code.
2. Les platformes pour enregister les donnees, l'articles et le code.
3. Les avantages d'un workflow.
3. Les avantages d'un workflow.
\ No newline at end of file
- Paradoxe de Simpson
1. Utiliser les librairies nécessaires : Pandas, matplotlib.
2. Importer les data en utilisant la fonction "read" du pandas.
3. Afficher les donnees dans un tableau.
4. Chercher les donnees du colonne 1 du tableau (Smoker).
5. Chercher les donnees du colonne 2 du tableau (Status).
6. - Chercher le nombre des fumeuses des donnees du colonne 1 et qui sont mort des donnees du colonne 2.
- Chercher le pourcentage de ce groupe : nombre des fumeuses mortes / nombre des fumeuses.
- Afficher ce pourcentage.
7. - Chercher le nombre des non fumeuses des donnees du colonne 1 et qui sont mort des donnees du colonne 2.
- Chercher le pourcentage de ce groupe : nombre des non fumeuses mortes / nombre des non fumeuses.
- Afficher ce pourcentage.
8. Dans cette partie le nombre des fumeuses mortes sont divisés sur des 4 catégories selon l'âge. On calcule leurs pourcentages dans les groupes ci-dessous (par exemple: pourcentage des fumeuses mortes qui ont entre 18 ans et 34 ans )et on les affiches.
- Groupe 1 : 18 <= âge <= 34
- Groupe 2 : 35 <= âge <= 54
- Groupe 3 : 55 <= âge <= 64
- Groupe 4 : 65 <= âge
9. De même, On calcule dans cette partie les pourcentages des nombre des non fumeuses morts divisés sur les 4 catégories d'âge de la même façon la partie précédente et on les affiches. ~~~i=0
y=0
e=0
t=0
u=0
r=0
p=0
o=0
for j in range(0,1314):
if int(data.values[j,2])>=18 & int(data.values[j,2])<=34:
if 'No' in data.values[j,0]:
y=y+1
if 'Dead' in data.values[j,1]:
i=i+1
if int(data.values[j,2])>=35 & int(data.values[j,2])<=54:
if 'No' in data.values[j,0]:
e=e+1
if 'Dead' in data.values[j,1]:
t=t+1
if int(data.values[j,2])>=55 & int(data.values[j,2])<=64:
if 'No' in data.values[j,0]:
r=r+1
if 'Dead' in data.values[j,1]:
u=u+1
if int(data.values[j,2])>=65:
if 'No' in data.values[j,0]:
o=o+1
if 'Dead' in data.values[j,1]:
p=p+1 In [25]: (i/y)*100,(t/e)*100,(u/r)*100,(p/o)*100 Out [25]: (31.420765027322407, 31.420765027322407, 31.420765027322407, 85.49222797927462)~~~