# Analyse de données sur le tabagisme chez les femmes dans l'intervalle de 20 ans
### Les données restreint de travaux sur les maladies thyroïdiennes et cardiaques (Tunbridge et al. 1977) et la suite de cette étude a été menée vingt ans plus tard. Certains des résultats avaient trait au tabagisme et cherchaient à savoir si les individus étaient toujours en vie lors de la seconde étude. La survie à 20 ans a été déterminée pour l'ensemble des femmes du premier sondage.
print (" Le taux de mortalité chez les femmmes non fumeuses est de ", taux_non_fumeuse*100, "%")
```
Le taux de mortalité chez les femmmes non fumeuses est de 31.420765027322407 %
```python
names = ['taux de fumeuse', 'taux non fumeuse'] # nom des barres
values = [taux_fumeuse, taux_non_fumeuse]
pl.bar(names, values)
pl.ylim(0,1)
pl.show()
```

***Ce résultat est surprenant dans la mesure où le taux de mortalité de femmes fumeuses est plus faible que celle de non fumeuses.***
### Nous Reprenons la question 1 (effectifs et taux de mortalité) en rajoutant une nouvelle catégorie liée à la classe d'âge. On considérera par exemple les classes suivantes : 18-34 ans, 34-54 ans, 55-64 ans, plus de 65 ans. En quoi ce résultat est-il surprenant ? Arrivez-vous à expliquer ce paradoxe ? De même, vous pourrez proposer une représentation graphique de ces données pour étayer vos explications.
print (" Le nombre de femme fumeuse agées de 64 ans et plus est de ", len (data.loc[femme_fumeuse_filtrage_64,['Smoker']]), 'femmes')
```
Le nombre de femme fumeuse agées de 64 ans et plus est de 49 femmes
***Le nombre de décès parmis les fumeuses de 64 ans et plus***
```python
print (" Le nombre de décès parmis les fumeuses agées de 64 ans et plus est de",len(data.loc[fumeuse_decede_64,['Smoker','Status']]), " femmes")
```
Le nombre de décès parmis les fumeuses agées de 64 ans et plus est de 42 femmes
### Nombre total de femme non fumeuses
```python
print (" Le nombre total de femme non fumeuses agées de 64 ans et plus est de ",len(data.loc[femme_non_fumeuse_filtrage_64,['Smoker']]), "femmes")
```
Le nombre total de femme non fumeuses agées de 64 ans et plus est de 195 femmes
***Nombre de décès de non fumeuse de 64 ans et plus***
```python
print (" Le nombre de décès parmis les non fumeuses agées de 64 ans et plus est de",len(data.loc[non_fumeuse_decede_64,['Smoker','Status']]), " femmes")
```
Le nombre de décès parmis les non fumeuses agées de 64 ans et plus est de 166 femmes
### Calcul de taux de mortalité de fumeuses agées de 64 ans et plus
print (" Le taux de mortalité chez les femmmes non fumeuses agées de 34-54 ans est de ", taux_non_fumeuse_64*100, "%")
```
Le taux de mortalité chez les femmmes non fumeuses agées de 34-54 ans est de 85.12820512820512 %
```python
names = ['taux de fumeuse_64_plus', 'taux non fumeuse_64_plus'] # nom des barres
values = [taux_fumeuse_64, taux_non_fumeuse_64]
pl.bar(names, values)
pl.ylim(0,1)
pl.show()
```

***On remarque le taux sont assez proches au délà de 64 ans***
# Conclusion
De ce paraxode, on comprend que le taux de mortalité est assez complexe pour une étude sur des tranges d'âges différents.
Mais globalement le taux est plus important pour les femmes fumeuses mais étrangement il est faible pour certaines tranges d'âges. Cela s'explique par un nombre cause, telle la durée de l'éffect du tabac sur l'organisme, morbidité des personnes âgées...
L'analyse de données doit tenir compte préablement du facteur de confusion.