"Le document comporte trois colonnes : la première colonne indique leur habitude de tabagisme, la deuxième renseigne si la personne est vivante ou décédée au moment de la seconde étude et enfin, la troisième colonne indique leur âge lors de la première étude"
"Le document comporte trois colonnes : la première colonne indique leur habitude de tabagisme, la deuxième renseigne si la personne est vivante ou décédée au moment de la seconde étude et enfin, la troisième colonne indique leur âge lors de la première étude"
"Pour nous assurer que le jeu de données est complet, nous vérifions qu'il n'y a pas d'informations manquantes conernant l'une des personnes du sondage. Après vérification, il n'y a pas de données manquantes."
]
},
{
"cell_type": "code",
"execution_count": 8,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"<div>\n",
"<style scoped>\n",
" .dataframe tbody tr th:only-of-type {\n",
" vertical-align: middle;\n",
" }\n",
"\n",
" .dataframe tbody tr th {\n",
" vertical-align: top;\n",
" }\n",
"\n",
" .dataframe thead th {\n",
" text-align: right;\n",
" }\n",
"</style>\n",
"<table border=\"1\" class=\"dataframe\">\n",
" <thead>\n",
" <tr style=\"text-align: right;\">\n",
" <th></th>\n",
" <th>Smoker</th>\n",
" <th>Status</th>\n",
" <th>Age</th>\n",
" </tr>\n",
" </thead>\n",
" <tbody>\n",
" </tbody>\n",
"</table>\n",
"</div>"
],
"text/plain": [
"Empty DataFrame\n",
"Columns: [Smoker, Status, Age]\n",
"Index: []"
]
},
"execution_count": 8,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"raw_data[raw_data.isnull().any(axis=1)]"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Nous calculons le nombre total de femmes vivantes et décédées sur la période en fonction de leur habitude de tabagisme"
]
},
{
"cell_type": "code",
"execution_count": 23,
"metadata": {},
"outputs": [],
"source": [
"alive_and_smoker = 0\n",
"alive_and_non_smoker = 0\n",
"dead_and_smoker = 0\n",
"dead_and_non_smoker = 0\n",
"for i in range(len(raw_data)):\n",
" if raw_data.iloc[i][0] == \"Yes\":\n",
" if raw_data.iloc[i][1] == \"Alive\":\n",
" alive_and_smoker += 1\n",
" else :\n",
" dead_and_smoker += 1\n",
" else :\n",
" if raw_data.iloc[i][1] == \"Alive\":\n",
" alive_and_non_smoker += 1\n",
" else :\n",
" dead_and_non_smoker += 1"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Nous représentons ensuite ces données sous la forme d'un tableau. "