"# Analyse des données de tabagisme et de mortalité\n",
"Ce notebook réalise une analyse des données issues d'une étude longitudinale sur le tabagisme et la mortalité chez les femmes, en prenant en compte des classes d'âge et en appliquant une régression logistique."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## 1. Importation des données\n",
"Tout d'abord, nous allons importer les données depuis un fichier CSV. Assurez-vous que votre fichier est bien placé dans le répertoire du notebook."
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"import pandas as pd\n",
"# Charger les données depuis un fichier CSV\n",
"df = pd.read_csv('Subject6_smoking.csv')\n",
"df.head() # Afficher les 5 premières lignes pour vérifier"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## 2. Calcul des effectifs vivants et décédés en fonction du statut de fumeur\n",
"Nous allons maintenant calculer le nombre total de femmes vivantes et décédées en fonction de leur statut de fumeur (fumeuse ou non)."
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [],
"source": [
"# Calcul des effectifs vivants et décédés en fonction du statut de fumeur\n",