{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Sujet 6 : Autour du Paradoxe de Simpson\n", "---\n", "**Prérequis :** calcul de moyennes et de ratios, techniques de présentations graphiques simples, éventuellement régression logistique\n", "\n", "---\n", "\n", "En 1972-1974, à Whickham, une ville du nord-est de l'Angleterre, située à environ 6,5 kilomètres au sud-ouest de Newcastle upon Tyne, un sondage d'un sixième des électeurs a été effectué afin d'éclairer des travaux sur les maladies thyroïdiennes et cardiaques (Tunbridge et al. 1977). Une suite de cette étude a été menée vingt ans plus tard (Vanderpump et al. 1995). Certains des résultats avaient trait au tabagisme et cherchaient à savoir si les individus étaient toujours en vie lors de la seconde étude. Par simplicité, nous nous restreindrons aux femmes et parmi celles-ci aux 1314 qui ont été catégorisées comme \"fumant actuellement\" ou \"n'ayant jamais fumé\". Il y avait relativement peu de femmes dans le sondage initial ayant fumé et ayant arrêté depuis (162) et très peu pour lesquelles l'information n'était pas disponible (18). La survie à 20 ans a été déterminée pour l'ensemble des femmes du premier sondage.\n", "\n", "---\n", "\n", "**Votre mission si vous l'acceptez :**\n", "\n", "1. Représentez dans un tableau le nombre total de femmes vivantes et décédées sur la période en fonction de leur habitude de tabagisme. Calculez dans chaque groupe (fumeuses / non fumeuses) le taux de mortalité (le rapport entre le nombre de femmes décédées dans un groupe et le nombre total de femmes dans ce groupe). Vous pourrez proposer une représentation graphique de ces données et calculer des intervalles de confiance si vous le souhaitez. En quoi ce résultat est-il surprenant ?\n", "2. Reprenez la question 1 (effectifs et taux de mortalité) en rajoutant une nouvelle catégorie liée à la classe d'âge. On considérera par exemple les classes suivantes : 18-34 ans, 34-54 ans, 55-64 ans, plus de 65 ans. En quoi ce résultat est-il surprenant ? Arrivez-vous à expliquer ce paradoxe ? De même, vous pourrez proposer une représentation graphique de ces données pour étayer vos explications.\n", "3. Afin d'éviter un biais induit par des regroupements en tranches d'âges arbitraires et non régulières, il est envisageable d'essayer de réaliser une régression logistique. Si on introduit une variable Death valant 1 ou 0 pour indiquer si l'individu est décédé durant la période de 20 ans, on peut étudier le modèle Death ~ Age pour étudier la probabilité de décès en fonction de l'âge selon que l'on considère le groupe des fumeuses ou des non fumeuses. Ces régressions vous permettent-elles de conclure sur la nocivité du tabagisme ? Vous pourrez proposer une représentation graphique de ces régressions (en n'omettant pas les régions de confiance).\n", "4. Déposez votre étude dans FUN" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "%matplotlib inline\n", "import matplotlib.pyplot as plt\n", "\n", "import os\n", "import urllib.request" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "En suivant la technique apprise dans le precédent exercice, on vérifie si le jeu de données existe déjà sous la forme d'un fichier local .csv et si non, on le télécharge." ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "datas_file = 'simpson_paradox.csv'\n", "datas_url = 'https://gitlab.inria.fr/learninglab/mooc-rr/mooc-rr-ressources/-/raw/master/module3/Practical_session/Subject6_smoking.csv'\n", "\n", "if not os.path.exists(datas_file):\n", " urllib.request.urlretrieve(datas_url, datas_file)" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [], "source": [ "raw_datas = pd.read_csv(datas_file, header=0)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On vérifie l'absence de données nulles par ligne" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
SmokerStatusAge
\n", "
" ], "text/plain": [ "Empty DataFrame\n", "Columns: [Smoker, Status, Age]\n", "Index: []" ] }, "execution_count": 4, "metadata": {}, "output_type": "execute_result" } ], "source": [ "raw_datas[raw_datas.isnull().any(axis=1)]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "---\n", "## Exercice 1\n", "Représentez dans un tableau le nombre total de femmes vivantes et décédées sur la période en fonction de leur habitude de tabagisme. Calculez dans chaque groupe (fumeuses / non fumeuses) le taux de mortalité (le rapport entre le nombre de femmes décédées dans un groupe et le nombre total de femmes dans ce groupe). Vous pourrez proposer une représentation graphique de ces données et calculer des intervalles de confiance si vous le souhaitez. En quoi ce résultat est-il surprenant ?" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "- D'après l'énoncé, il faudrait classer les données selon que les femmes aient été fummeuses, donc on copie la DataFrame `raw_datas` en modifiant son index par la colonne `Smoker`" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [], "source": [ "sorted_datas1 = raw_datas.set_index('Smoker').sort_index()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "- On peut ensuite utiliser la fonction `.loc` pour avoir uniquement les fumeuses (`Yes`) ou les non fumeuses (`No`) et créer deux nouveau objets de type DataFrame `smokers` & `non_smokers`\n", " - le total de lignes étant le nombre total de femmes appartenant à ce groupe et peut être obtenu via la fonction `len`" ] }, { "cell_type": "code", "execution_count": 6, "metadata": { "hideOutput": true }, "outputs": [], "source": [ "smokers = sorted_datas1.loc['Yes']\n", "non_smokers = sorted_datas1.loc['No']" ] }, { "cell_type": "code", "execution_count": 7, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Total fumeuses = 582 / Total non-fumeuses = 732\n" ] } ], "source": [ "smokers_total = len(smokers)\n", "non_smokers_total = len(non_smokers)\n", "print('Total fumeuses = {} / Total non-fumeuses = {}'.format(smokers_total, non_smokers_total))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "- On peut accéder au nombre total de femmes décédées par groupe via `(non_)smokers.loc[smokers['Status'] == 'Dead']`" ] }, { "cell_type": "code", "execution_count": 8, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Fumeuses mortes = 139 / Non-fumeuses mortes = 230\n" ] } ], "source": [ "smokers_dead = len(smokers.loc[smokers['Status'] == 'Dead'])\n", "non_smokers_dead = len(non_smokers.loc[non_smokers['Status'] == 'Dead'])\n", "print('Fumeuses mortes = {} / Non-fumeuses mortes = {}'.format(smokers_dead, non_smokers_dead))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "- On calcule le taux de mortalité par groupe" ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Mortalité chez les femmes fumeuses : 4.19\n", "Mortalité chez les femmes non-fumeuses : 3.18\n" ] } ], "source": [ "smokers_mortality = smokers_total / smokers_dead\n", "non_smokers_mortality = non_smokers_total / non_smokers_dead\n", "print('Mortalité chez les femmes fumeuses : {:.2f}'.format(smokers_mortality))\n", "print('Mortalité chez les femmes non-fumeuses : {:.2f}'.format(non_smokers_mortality))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Enfin on affiche les proportions de femmes vivantes/decédée, on peut choisir différent type de graphiques, j'ai finalement choisit d'utiliser des camemberts car je trouvais cela plus parlant. En effet avec de tels graphiques on pourrait penser que la mortalité chez les non-fumeuses ets plus important que chez les non-fumeuses alors que la moprtalité est effectiveent plus grande chez les fumeuses. Si on choisit de plotter les même séries de données en hisogramme par exemple on a la même illusion visuelle, si on applique la même échelle en y aux trois graphiques, l'illusion est toujours persistante. " ] }, { "cell_type": "code", "execution_count": 24, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 24, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "fig, axes = plt.subplots(nrows=1, ncols=3, sharey=False, figsize=(20, 6))\n", "smokers['Status'].value_counts().plot.pie(title='Fumeuses', ax=axes[0])\n", "non_smokers['Status'].value_counts().plot.pie(title='Non-fumeuses', ax=axes[1])\n", "sorted_datas1['Status'].value_counts().plot.pie(title='Total', ax=axes[2])" ] }, { "cell_type": "code", "execution_count": 26, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 26, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "iVBORw0KGgoAAAANSUhEUgAABIgAAAGFCAYAAACWisi6AAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDIuMi4zLCBodHRwOi8vbWF0cGxvdGxpYi5vcmcvIxREBQAAIABJREFUeJzt3X+8ZXV5H/rP40DAiCjEgSCDQs2YFMxVmwnxSm6uDSpEUWh7aSeJ6aQlId7QRlMTC97eqEmml6apSZqGmxJNM1UrTmIMUxOjZCL56QUHxeiAhLliYGRkRow/b4qCz/1jL8xmOMwcOD/2Pqz3+/U6r7XWd3/X3s+BM/s557PXj+ruAAAAADBej5l1AQAAAADMloAIAAAAYOQERAAAAAAjJyACAAAAGDkBEQAAAMDICYgAAAAARk5ABACMTlWdWFV/XFVfqKr/MOt6ABivqjq6qrqqNsy6FsZNQMRcq6pPVNXfVNUXp76ePOu6AFh+w3v+XVX1uKmxH6qqa1fg5S5O8ukkx3b3q1bg+QFYww76++OrB/1N8v2H2ffcqtqzWrXCchEQsRa8pLuPmfq6c9YFAbBijkjyilV4nacmuam7exVeC4A1ZvrvjyS354F/k7x11vXBShAQseZU1fOqau9BY5+oqucP66+rqt+sqrcMpw58pKqeXlWXVdX+qrqjql44te8TqupNVbWvqj5ZVT9bVeumnustU3NPHQ7/PGLY/sGq+vjwOrdNf5pQVf+8qm6uqr+uqvdU1VOH8aqqXxhq+VxV/UVVPWNl/6sBrBn/PslPVNUTD36gqp5bVR8Y3js/UFXPnXrs2qr6mar6s+E9+b1V9aSFXqCqfiPJliSvHj4Jfn5V/UZV/ezUnAf0mqHP/OTwnv2loW+cWFXvHl7vD6rquKn5z6mqP6+qz1bVh6vqeQc91/Ontr/Wa4bTDN5SVXcP+36gqk4cHjtUv/qmqvqj4b/Np6vq7Y/gvz0Ai1RVj62qXxnek/dW1b+vqiOr6huSvDPJ35k64ugbquqsqrpueJ++c/h74IhZfx8wTUDEo9VLkrw5yXFJPpTkPZn8vJ+c5KeT/OepuduS3Jvkm5I8O8kLk/zQ4V6gJqdA/Mck39Pdj0/y3CQ3Do9dkOQ1Sf5hkvVJ/iTJ24ZdX5jku5I8PckTk/yTJHc/4u8U4NFlV5Jrk/zE9GBVHZ/kdzN53/2GJG9I8rvDL+L3+74k/yzJCUm+7uDnuF93/2CStyb5ueGT4D9YZG3/KMkLMnn/fkmSd2fyXv+kTHrMjw21njzU+rNJjh/qeEdVrV/Ea2xJ8oQkpwzf58uT/M3w2KH61c8keW8mfW9Dkl9e5PcEwCPz+iT/U5JvTfJtSZ6X5NXdfXeSf5Dk41NHHN2d5CtJ/kUmfeF/yaSPHPZvDlhNAiLWgt8ZPkX9bFX9ziL3+ZPufk9335vkNzMJaS7v7q8kuSrJqVX1xOFT2e9J8sru/lJ370/yC0k2L/J1vprkGVX12O7e1927h/EfSfJ/dffNQw3/NsmzhqOIvpLk8Um+JUkNc/Yt8vUAxuCnkvzLgwKVFye5tbvf3N33dvfbknwsk1+w7/dfuvsvu/tvkmxP8qxlruuXu/uu7v5kJsH/dd39oe6+J5NPi589zHtZkt/r7t/r7q929zWZBF8vWsRrfCWTYOibuvu+7r6huz+/iH71lUxOm3tyd/+P7v7T5fqmAVjQ9yd5bXd/urvvyuRDgR94qMndfX13f2B4b/9/k7wxyf+6SrXCogiIWAsu6O4nDl8XLHKfu6bW/ybJp7v7vqntJDkmk1+mj0yy7/4QKpOji0443At095cyOfrn5cP+v1tV3zI8/NQkvzT1nJ9JUklO7u4/TPKfkvxKkruq6sqqOnaR3xfAo153fzTJu5JcOjX85CR/ddDUv8rkyND7fWpq/f/L5H0+VfWrU4f5v2YJpR3cWw7ePmZYf2qSC6c+3Phsku9MctIiXuPNmRz1etVwCsLPVdWROXy/enUmfeb6qtpdVf/8EX6PABxGVVWSb8wD+9LBPengfU4fTku+q6o+n8mHIQueCg2zIiBiLfpSkq+/f2O4/sJiDttfyB1J7knypKkQ6tjuPmOh18qkEXzNcJTSCzL5pf9jSX5t6nl/ZOo5n9jdj+3uPx/2+4/d/W1JzsjkVIWffIT1AzxavTbJD+dvf9m+M5OQZNpTknzycE/U3S+fOsz/3z7EtEO+3z9MdyR580E94HHdffnhXqu7v9Ldr+/u0zM5dfm8JP80h+lX3f2p7v7h7n5yJkexXlFV37SE7wGAhzDc4OBTeWBfmu5JC90A4deSfDDJ07r72Ewue1ErWSc8XAIi1qK/THJ0Vb14+FT13yQ56pE80XBq13uT/IeqOraqHlNVT6uq+w/3vDHJd1XVU6rqCUkuu3/f4eKkLx2uRXRPki8muf8opV9NcllVnTHMfUJVXTisf3tVfcdQ+5eS/I+p/QBI0t17krw9w3V9kvxekqdX1fdV1RFV9U+SnJ7JkUbL4cYkL6qq46vqG5O8cgnP9ZYkL6mqc6pq3XDh6edV1Yap19o8XMx0U5L/7f4dq+rvV9W3Dh9+fD6TU8fuO1y/qqoLp57/rzP540RvAVg5b0vy2uEC1Cck+T8yef9PJkeYnlBVx0zNf3ySz3X3F4e/EX54dcuFwxMQseZ09+eS/Ggm5+1+MpOQZe8hdzq0f5rJxUxvyuSX6t/KcBrAcN2Ityf5iyQ35IF/iDwmyasy+VT7M5mcQ/yjw37vTPLvMjlF4PNJPprJtSOS5NhMPkH460wORb07yc8voX6AR6ufTvK4JBku8HleJu+7d2dyStV53f3pZXqtNyf5cJJPZBLEPOK7gHX3HUnOz+QC1gcyOfrnJ/O3v3f9n0melkkfeH2S/za1+zdm0oc+n+TmJH+Uv/2D4yH7VZJvT3JdVX0xyY4kr+ju2x7p9wDAYf1UJu/HuzMJ/v8syc8Nj304k/fivxpOCz4+yY8n+aHhffpXsoQ+AyulJkfHAQAAADBWjiACAAAAGDkBEQAAAMDICYgAAAAARk5ABAAAADByR8y6gCR50pOe1KeeeuqsywCYSzfccMOnu3v9rOuYJX0CYGF6xIQ+AbCwh9Mn5iIgOvXUU7Nr165ZlwEwl6rqr2Zdw6zpEwAL0yMm9AmAhT2cPuEUMwAAAICRExABAAAAjJyACAAAAGDkBEQAAAAAIycgAgAAABg5AREAAADAyAmIAAAAAEZOQAQAAAAwcgIiAAAAgJETEAEAAACMnIAIAAAAYOQERAAAAAAjJyACYMmq6hNV9ZGqurGqdg1jx1fVNVV167A8bmr+ZVW1p6puqapzZlc5AACQCIgAWD5/v7uf1d2bhu1Lk+zs7o1Jdg7bqarTk2xOckaSc5NcUVXrZlEwAAAwccSsC1grTr30d2ddwqPCJy5/8axLAFbP+UmeN6xvS3Jtkn89jF/V3fckua2q9iQ5M8n7Z1DjstEnloc+ATxa6RPLQ5+AleMIIgCWQyd5b1XdUFUXD2Mndve+JBmWJwzjJye5Y2rfvcPYA1TVxVW1q6p2HThwYAVLBwAAHEEEwHI4q7vvrKoTklxTVR87xNxaYKwfNNB9ZZIrk2TTpk0PehwAAFg+jiACYMm6+85huT/JOzM5ZeyuqjopSYbl/mH63iSnTO2+Icmdq1ctAABwMAERAEtSVY+rqsffv57khUk+mmRHki3DtC1Jrh7WdyTZXFVHVdVpSTYmuX51qwYAAKY5xQyApToxyTurKpn0lf/W3b9fVR9Isr2qLkpye5ILk6S7d1fV9iQ3Jbk3ySXdfd9sSgcAABIBEQBL1N0fT/LMBcbvTnL2Q+yzNcnWFS4NAABYJKeYAQAAAIycgAgAAABg5AREAAAAACMnIAIAAAAYOQERAAAAwMgJiAAAAABGTkAEAAAAMHICIgAAAICRExABAAAAjJyACAAAAGDkBEQAAAAAIycgAgAAABg5AREAAADAyAmIAAAAAEZOQAQAAAAwcgIiAAAAgJETEAEAAACMnIAIAAAAYOQERAAAAAAjJyACAAAAGLlFB0RVta6qPlRV7xq2j6+qa6rq1mF53NTcy6pqT1XdUlXnrEThAAAAACyPh3ME0SuS3Dy1fWmSnd29McnOYTtVdXqSzUnOSHJukiuqat3ylAsAAADAcltUQFRVG5K8OMkbp4bPT7JtWN+W5IKp8au6+57uvi3JniRnLk+5AAAAACy3xR5B9ItJXp3kq1NjJ3b3viQZlicM4ycnuWNq3t5h7AGq6uKq2lVVuw4cOPCwCwcAAABgeRw2IKqq85Ls7+4bFvmctcBYP2ig+8ru3tTdm9avX7/IpwYAAABguR2xiDlnJXlpVb0oydFJjq2qtyS5q6pO6u59VXVSkv3D/L1JTpnaf0OSO5ezaAAAAACWz2GPIOruy7p7Q3efmsnFp/+wu1+WZEeSLcO0LUmuHtZ3JNlcVUdV1WlJNia5ftkrBwAAAGBZLOYIoodyeZLtVXVRktuTXJgk3b27qrYnuSnJvUku6e77llwpAAAAACviYQVE3X1tkmuH9buTnP0Q87Ym2brE2gAAAABYBYu9ixkAAAAAj1ICIgAAAICRExABAAAAjJyACAAAAGDkBEQAAAAAIycgAgAAABg5AREAAADAyAmIAAAAAEZOQAQAAKyoqvrxqtpdVR+tqrdV1dFVdXxVXVNVtw7L46bmX1ZVe6rqlqo6Z5a1A4yFgAgAAFgxVXVykh9Lsqm7n5FkXZLNSS5NsrO7NybZOWynqk4fHj8jyblJrqiqdbOoHWBMBEQAAMBKOyLJY6vqiCRfn+TOJOcn2TY8vi3JBcP6+Umu6u57uvu2JHuSnLnK9QKMjoAIAABYMd39ySQ/n+T2JPuSfK6735vkxO7eN8zZl+SEYZeTk9wx9RR7h7EHqKqLq2pXVe06cODASn4LAKMgIAIAAFbMcG2h85OcluTJSR5XVS871C4LjPWDBrqv7O5N3b1p/fr1y1MswIgJiAAAgJX0/CS3dfeB7v5Kkt9O8twkd1XVSUkyLPcP8/cmOWVq/w2ZnJIGwAoSEAEAACvp9iTPqaqvr6pKcnaSm5PsSLJlmLMlydXD+o4km6vqqKo6LcnGJNevcs0Ao3PErAsAAAAevbr7uqr6rSQfTHJvkg8luTLJMUm2V9VFmYRIFw7zd1fV9iQ3DfMv6e77ZlI8wIgIiAAAgBXV3a9N8tqDhu/J5GiiheZvTbJ1pesC4G85xQwAAABg5AREAAAAACMnIAIAAAAYOQERAAAAwMgJiAAAAABGTkAEAAAAMHICIgAAAICRExABsCyqal1Vfaiq3jVsH19V11TVrcPyuKm5l1XVnqq6parOmV3VAABAIiACYPm8IsnNU9uXJtnZ3RuT7By2U1WnJ9mc5Iwk5ya5oqrWrXKtAADAFAERAEtWVRuSvDjJG6eGz0+ybVjfluSCqfGruvue7r4tyZ4kZ65WrQAAwIMJiABYDr+Y5NVJvjo1dmJ370uSYXnCMH5ykjum5u0dxh6gqi6uql1VtevAgQMrUzUAAJBEQATAElXVeUn2d/cNi91lgbF+0ED3ld29qbs3rV+/fkk1AgAAh3bErAsAYM07K8lLq+pFSY5OcmxVvSXJXVV1Unfvq6qTkuwf5u9NcsrU/huS3LmqFQMAAA/gCCIAlqS7L+vuDd19aiYXn/7D7n5Zkh1JtgzTtiS5eljfkWRzVR1VVacl2Zjk+lUuGwAAmOIIIgBWyuVJtlfVRUluT3JhknT37qranuSmJPcmuaS775tdmQAAgIAIgGXT3dcmuXZYvzvJ2Q8xb2uSratWGAAAcEhOMQMAAAAYOQERAAAAwMgJiAAAAABGTkAEAAAAMHICIgAAAICRExABAAAAjJyACAAAAGDkBEQAAAAAIycgAgAAABg5AREAAADAyAmIAAAAAEZOQAQAAAAwcgIiAAAAgJETEAEAAACMnIAIAAAAYOQERAAAAAAjJyACAAAAGDkBEQAAAMDICYgAAAAARk5ABAAAADByAiIAAACAkRMQAQAAAIycgAgAAABg5AREAAAAACMnIAIAAAAYOQERAAAAwMgJiAAAAABGTkAEAAAAMHKHDYiq6uiqur6qPlxVu6vq9cP48VV1TVXdOiyPm9rnsqraU1W3VNU5K/kNAAAAALA0izmC6J4k393dz0zyrCTnVtVzklyaZGd3b0yyc9hOVZ2eZHOSM5Kcm+SKqlq3EsUDAAAAsHSHDYh64ovD5pHDVyc5P8m2YXxbkguG9fOTXNXd93T3bUn2JDlzWasGAAAAYNks6hpEVbWuqm5Msj/JNd19XZITu3tfkgzLE4bpJye5Y2r3vcPYwc95cVXtqqpdBw4cWMr3AAAAAMASLCog6u77uvtZSTYkObOqnnGI6bXQUyzwnFd296bu3rR+/frFVQsAAADAsntYdzHr7s8muTaTawvdVVUnJcmw3D9M25vklKndNiS5c8mVAgAAALAiFnMXs/VV9cRh/bFJnp/kY0l2JNkyTNuS5OphfUeSzVV1VFWdlmRjkuuXu3AAAAAAlscRi5hzUpJtw53IHpNke3e/q6ren2R7VV2U5PYkFyZJd++uqu1Jbkpyb5JLuvu+lSkfAAAAgKU6bEDU3X+R5NkLjN+d5OyH2Gdrkq1Lrg4AAACAFfewrkEEAAAAwKOPgAgAAABg5AREAAAAACMnIAIAAAAYOQERAACwoqrqiVX1W1X1saq6uar+56o6vqquqapbh+VxU/Mvq6o9VXVLVZ0zy9oBxkJABAAArLRfSvL73f0tSZ6Z5OYklybZ2d0bk+wctlNVpyfZnOSMJOcmuaKq1s2kaoARERABAAArpqqOTfJdSd6UJN395e7+bJLzk2wbpm1LcsGwfn6Sq7r7nu6+LcmeJGeubtUA4yMgAgAAVtLfSXIgyX+pqg9V1Rur6nFJTuzufUkyLE8Y5p+c5I6p/fcOYw9QVRdX1a6q2nXgwIGV/Q4ARkBABAAArKQjkvy9JP93dz87yZcynE72EGqBsX7QQPeV3b2puzetX79+eSoFGDEBEQAAsJL2Jtnb3dcN27+VSWB0V1WdlCTDcv/U/FOm9t+Q5M5VqhVgtAREAADAiunuTyW5o6q+eRg6O8lNSXYk2TKMbUly9bC+I8nmqjqqqk5LsjHJ9atYMsAoHTHrAgAAgEe9f5nkrVX1dUk+nuSfZfJh9faquijJ7UkuTJLu3l1V2zMJke5Nckl33zebsgHGQ0AEAACsqO6+McmmBR46+yHmb02ydUWLAuABnGIGAAAAMHICIgAAAICRExABAAAAjJyACIAlqaqjq+r6qvpwVe2uqtcP48dX1TVVdeuwPG5qn8uqak9V3VJV58yuegAAIBEQAbB09yT57u5+ZpJnJTm3qp6T5NIkO7t7Y5Kdw3aq6vQkm5OckeTcJFdU1bqZVA4AACQREAGwRD3xxWHzyOGrk5yfZNswvi3JBcP6+Umu6u57uvu2JHuSnLmKJQMAAAcREAGwZFW1rqpuTLI/yTXdfV2SE7t7X5IMyxOG6ScnuWNq973D2MHPeXFV7aqqXQcOHFjZbwAAAEZOQATAknX3fd39rCQbkpxZVc84xPRa6CkWeM4ru3tTd29av379cpUKAAAsQEAEwLLp7s8muTaTawvdVVUnJcmw3D9M25vklKndNiS5cxXLBAAADiIgAmBJqmp9VT1xWH9skucn+ViSHUm2DNO2JLl6WN+RZHNVHVVVpyXZmOT61a0aAACYdsSsCwBgzTspybbhTmSPSbK9u99VVe9Psr2qLkpye5ILk6S7d1fV9iQ3Jbk3ySXdfd+MagcAACIgAmCJuvsvkjx7gfG7k5z9EPtsTbJ1hUsDAAAWySlmAAAAACMnIAIAAAAYOQERAAAAwMgJiAAAAABGTkAEAAAAMHICIgAAAICRExABAAAAjJyACAAAAGDkBEQAAAAAIycgAgAAABg5AREAAADAyAmIAAAAAEZOQAQAAAAwcgIiAAAAgJETEAEAAACMnIAIAAAAYOQERAAAAAAjJyACAAAAGDkBEQAAAMDICYgAAAAARk5ABAAAADByAiIAAACAkRMQAQAAAIycgAgAAABg5AREAAAAACMnIAIAAAAYOQERAAAAwMgJiAAAAABGTkAEAAAAMHICIgAAAICRExABAAAAjJyACAAAAGDkBEQAAAAAIycgAgAAABg5AREAAADAyAmIAAAAAEbusAFRVZ1SVe+rqpurandVvWIYP76qrqmqW4flcVP7XFZVe6rqlqo6ZyW/AQAAAACW5ohFzLk3yau6+4NV9fgkN1TVNUl+MMnO7r68qi5NcmmSf11VpyfZnOSMJE9O8gdV9fTuvm9lvgUAAB7gdU+YdQWPDq/73KwrAIBVc9gjiLp7X3d/cFj/QpKbk5yc5Pwk24Zp25JcMKyfn+Sq7r6nu29LsifJmctdOAAAAADL42Fdg6iqTk3y7CTXJTmxu/clkxApyQnDtJOT3DG1295h7ODnuriqdlXVrgMHDjz8ygEAAABYFosOiKrqmCTvSPLK7v78oaYuMNYPGui+srs3dfem9evXL7YMAAAAAJbZogKiqjoyk3Dord3928PwXVV10vD4SUn2D+N7k5wytfuGJHcuT7kAAAAALLfF3MWskrwpyc3d/Yaph3Yk2TKsb0ly9dT45qo6qqpOS7IxyfXLVzIAAAAAy2kxdzE7K8kPJPlIVd04jL0myeVJtlfVRUluT3JhknT37qranuSmTO6Adok7mAEAAADMr8MGRN39p1n4ukJJcvZD7LM1ydYl1AUAAADAKnlYdzEDAAB4uKpqXVV9qKreNWwfX1XXVNWtw/K4qbmXVdWeqrqlqs6ZXdUA4yIgAgAAVtorktw8tX1pkp3dvTHJzmE7VXV6ks1JzkhybpIrqmrdKtcKMEoCIgAAYMVU1YYkL07yxqnh85NsG9a3Jblgavyq7r6nu29LsifJmatVK8CYCYgAAICV9ItJXp3kq1NjJ3b3viQZlicM4ycnuWNq3t5h7EGq6uKq2lVVuw4cOLD8VQOMjIAIAABYEVV1XpL93X3DYndZYKwXmtjdV3b3pu7etH79+kdcIwATi7nNPQAAwCNxVpKXVtWLkhyd5NiqekuSu6rqpO7eV1UnJdk/zN+b5JSp/TckuXNVKwYYKUcQAQAAK6K7L+vuDd19aiYXn/7D7n5Zkh1JtgzTtiS5eljfkWRzVR1VVacl2Zjk+lUuG2CUHEEEAACstsuTbK+qi5LcnuTCJOnu3VW1PclNSe5Nckl33ze7MgHGwxFEACxJVZ1SVe+rqpurandVvWIYP76qrqmqW4flcVP7XFZVe6rqlqo6Z3bVA7Bauvva7j5vWL+7u8/u7o3D8jNT87Z299O6+5u7+92zqxhgXAREACzVvUle1d1/N8lzklxSVacnuTTJzu7emGTnsJ3hsc1JzkhybpIrqmrdTCoHAACSCIgAWKLu3tfdHxzWv5Dk5kxuSXx+km3DtG1JLhjWz09yVXff0923JdmT5MzVrRoAAJgmIAJg2VTVqUmeneS6JCd2975kEiIlOWGYdnKSO6Z22zuMHfxcF1fVrqradeDAgZUsGwAARk9ABMCyqKpjkrwjySu7+/OHmrrAWD9ooPvK7t7U3ZvWr1+/XGUCAAALcBczAJasqo7MJBx6a3f/9jB8V1Wd1N37quqkJPuH8b1JTpnafUOSO1evWgCAkXvdE2ZdwaPD6z436wqWlSOIAFiSqqokb0pyc3e/YeqhHUm2DOtbklw9Nb65qo6qqtOSbExy/WrVCwAAPJgjiABYqrOS/ECSj1TVjcPYa5JcnmR7VV2U5PYkFyZJd++uqu1JbsrkDmiXdPd9q182AABwPwERAEvS3X+aha8rlCRnP8Q+W5NsXbGiAACAh8UpZgAAAAAjJyACAAAAGDkBEQAAAMDICYgAAAAARk5ABAAAADByAiIAAACAkRMQAQAAAIycgAgAAABg5AREAAAAACMnIAIAAAAYOQERAAAAwMgJiAAAAABGTkAEAAAAMHICIgAAAICRExABAAAAjJyACAAAAGDkBEQAAAAAIycgAgAAABg5AREAAADAyAmIAAAAAEbuiFkXADwCr3vCrCt49Hjd52ZdAQAAwMw5gggAAABg5AREAAAAACMnIAIAAAAYOQERAAAAwMgJiAAAAABGTkAEAAAAMHICIgAAAICRExABAAAAjJyACAAAAGDkBEQAAAAAIycgAgAAABg5AREAAADAyAmIAAAAAEZOQAQAAAAwcgIiAAAAgJETEAEAAACMnIAIAAAAYOQERAAAAAAjJyACAAAAGDkBEQAAAMDICYgAAAAARk5ABAAAADByAiIAAACAkTtsQFRVv15V+6vqo1Njx1fVNVV167A8buqxy6pqT1XdUlXnrFThAAAAACyPxRxB9BtJzj1o7NIkO7t7Y5Kdw3aq6vQkm5OcMexzRVWtW7ZqAQAAAFh2hw2IuvuPk3zmoOHzk2wb1rcluWBq/Kruvqe7b0uyJ8mZy1QrAAAAACvgkV6D6MTu3pckw/KEYfzkJHdMzds7jD1IVV1cVbuqateBAwceYRkAAAAALNVyX6S6FhjrhSZ295Xdvam7N61fv36ZywAAAABgsR5pQHRXVZ2UJMNy/zC+N8kpU/M2JLnzkZcHAACsZVV1SlW9r6purqrdVfWKYdyNbwDmyCMNiHYk2TKsb0ly9dT45qo6qqpOS7IxyfVLKxEAAFjD7k3yqu7+u0mek+SS4eY2bnwDMEcWc5v7tyV5f5Jvrqq9VXVRksuTvKCqbk3ygmE73b07yfYkNyX5/SSXdPd9K1U8AAAw37p7X3d/cFj/QpKbM7lOqRvfAMyRIw43obu/9yEeOvsh5m9NsnUpRQGwdlTVryc5L8n+7n7GMHZ8krcnOTXJJ5L84+7+6+Gxy5JclOS+JD/W3e+ZQdkAzEBVnZrk2Umuy0E3vqmq6Rvf/D9Tuy1445uqujjJxUnylKc8ZeWKBhiJ5b5INQDj8xuZnAIwzWkDADxAVR2T5B1JXtndnz/U1AXGHnTjGze9AVheAiIAlqS7/zjJZw7DpvhvAAAJQUlEQVQadtoAAF9TVUdmEg69tbt/exh24xuAOSIgAmAlPOC0gSTTpw3cMTVvwdMGAHj0qKpK8qYkN3f3G6YecuMbgDly2GsQAcAyWtRpA4lrSwA8ipyV5AeSfKSqbhzGXpPJjW62DzfBuT3JhcnkxjdVdf+Nb+6NG98ArAoBEQAr4a6qOmm46OgjOm2gu69McmWSbNq0acEQCYD5191/moU/IEjc+AZgbjjFDICV4LQBAABYQxxBBMCSVNXbkjwvyZOqam+S18ZpAwAAsKYIiABYku7+3od4yGkDAACwRjjFDAAAAGDkBEQAAAAAIycgAgAAABg5AREAAADAyAmIAAAAAEZOQAQAAAAwcgIiAAAAgJETEAEAAACMnIAIAAAAYOQERAAAAAAjJyACAAAAGDkBEQAAAMDICYgAAAAARk5ABAAAADByAiIAAACAkRMQAQAAAIycgAgAAABg5AREAAAAACMnIAIAAAAYOQERAAAAwMgJiAAAAABGTkAEAAAAMHICIgAAAICRExABAAAAjJyACAAAAGDkBEQAAAAAIycgAgAAABg5AREAAADAyAmIAAAAAEZOQAQAAAAwcgIiAAAAgJETEAEAAACMnIAIAAAAYOQERAAAAAAjJyACAAAAGDkBEQAAAMDICYgAAAAARk5ABAAAADByAiIAAACAkRMQAQAAAIycgAgAAABg5AREAAAAACMnIAIAAAAYOQERAAAAwMgJiAAAAABGTkAEAAAAMHICIgAAAICRExABAAAAjJyACAAAAGDkBEQAAAAAIycgAgAAABg5AREAAADAyAmIAAAAAEZuxQKiqjq3qm6pqj1VdelKvQ4Aa48eAcCh6BMAq29FAqKqWpfkV5J8T5LTk3xvVZ2+Eq8FwNqiRwBwKPoEwGys1BFEZybZ090f7+4vJ7kqyfkr9FoArC16BACHok8AzMARK/S8Jye5Y2p7b5LvmJ5QVRcnuXjY/GJV3bJCtYzJk5J8etZFHEr9u1lXwCqb+5/JvL5mXcFiPHXWBSyzw/aIRJ9YIXP/b1KfGJW5/3nUI2ZGn5iduf93qU+Mytz/PD7a+sRKBUQL/VfqB2x0X5nkyhV6/VGqql3dvWnWdcD9/EzyEA7bIxJ9YiX4N8k88fPIIegTM+LfJfPEz+PqW6lTzPYmOWVqe0OSO1fotQBYW/QIAA5FnwCYgZUKiD6QZGNVnVZVX5dkc5IdK/RaAKwtegQAh6JPAMzAipxi1t33VtW/SPKeJOuS/Hp3716J1+IBHGLLvPEzyYPoETPl3yTzxM8jC9InZsq/S+aJn8dVVt0POp0XAAAAgBFZqVPMAAAAAFgjBEQAAAAAIycgAgAAABg5AREAAADAyAmIHgWq6nGzrgGA+aVPAHAo+gSQrNBt7lkdVfXcJG9MckySp1TVM5P8SHf/6GwrY4yq6l8d6vHufsNq1QJM6BPMCz0C5pM+wbzQJ+aDI4jWtl9Ick6Su5Okuz+c5LtmWhFj9vjha1OS/z3JycPXy5OcPsO6YMz0CeaFHgHzSZ9gXugTc8ARRGtcd99RVdND982qFsatu1+fJFX13iR/r7u/MGy/LslvzrA0GDV9gnmgR8D80ieYB/rEfBAQrW13DIeFdlV9XZIfS3LzjGuCpyT58tT2l5OcOptSYPT0CeaNHgHzRZ9g3ugTMyQgWttenuSXMjn0bm+S9ya5ZKYVQfLmJNdX1TuTdJJ/kOS/zrYkGC19gnmjR8B80SeYN/rEDFV3z7oGHqGqWt/dB2ZdBxysqr4tyXcOm3/c3R+aZT0wVvoE80iPgPmhTzCP9InZERCtYVV1a5Lbkrw9yTu6+7MzLgm+pqpOSHL0/dvdffsMy4FR0ieYV3oEzAd9gnmlT8yGu5itYd29Mcm/SXJGkg9W1buq6mUzLouRq6qXTv2y8UfD8t2zrQrGSZ9g3ugRMF/0CeaNPjFbAqI1rruv7+5/leTMJJ9Jsm3GJcHPJHlOkr/s7tOSPD/Jn822JBgvfYI5o0fAnNEnmDP6xAwJiNawqjq2qrZU1buT/HmSfZm8scMsfaW7707ymKp6THe/L8mzZl0UjJE+wRzSI2CO6BPMIX1ihtzFbG37cJLfSfLT3f3+WRcDg89W1TFJ/iTJW6tqf5J7Z1wTjJU+wbzRI2C+6BPMG31ihlykeg2rqmr/A5kzVfW4JH+TyRGK35/kCUneOnwSAKwifYJ5o0fAfNEnmDf6xGwJiNagqvrF7n5lVf33JA/6H9jdL51BWfA1VfXUJBu7+w+q6uuTrOvuL8y6LhgLfYJ5pkfA7OkTzDN9YnacYrY2vXlY/vxMq4AFVNUPJ7k4yfFJnpbk5CS/muTsWdYFI6NPMJf0CJgb+gRzSZ+YLUcQAcuqqm7M5OKG13X3s4exj3T3t862MgBmTY8A4FD0idlyBNEaVFUfyQKHgiapJF/t7meuckkw7Z7u/nJVJUmq6ogs/PMKrBB9gjmmR8Ac0CeYY/rEDAmI1qbzFhirJBuSvGaVa4GD/VFVvSbJY6vqBUl+NMl/n3FNMDb6BPNKj4D5oE8wr/SJGXKK2RpXVc9K8n1J/nGS25K8o7v/02yrYsyq6jFJLkrywkx+0XhPkje6QwbMhj7BPNEjYP7oE8wTfWK2BERrUFU9PcnmJN+b5O4kb0/yE9391JkWBoOqWp8k3X1g1rXAGOkTzDM9AmZPn2Ce6ROz85hZF8Aj8rFMruL+ku7+zu7+5ST3zbgmRq4mXldVn87kZ/SWqjpQVT8169pghPQJ5ooeAXNHn2Cu6BPzQUC0Nv2jJJ9K8r6q+rWqOjuTw+9gll6Z5Kwk397d39Ddxyf5jiRnVdWPz7Y0GB19gnmjR8B80SeYN/rEHHCK2RpWVY9LckEmh4Z+d5JtSd7Z3e+daWGMUlV9KMkLuvvTB42vT/Le+29TCawefYJ5oUfAfNInmBf6xHxwBNEa1t1f6u63dvd5mdxx4MYkl864LMbryIPf0JOvnTt85AzqgdHTJ5gjegTMIX2COaJPzAEB0aNEd3+mu/9zd3/3rGthtL78CB8DVoE+wYzpETDn9AlmTJ+YA04xA5ZFVd2X5EsLPZTk6O6W/AOMlB4BwKHoE/NBQAQAAAAwck4xAwAAABg5AREAAADAyAmIAAAAAEZOQAQAAAAwcv8/u+G+uDzLCVUAAAAASUVORK5CYII=\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "fig, axes = plt.subplots(nrows=1, ncols=3, sharey=False, figsize=(20, 6))\n", "smokers['Status'].value_counts().plot.bar(title='Fumeuses', ax=axes[0])\n", "non_smokers['Status'].value_counts().plot.bar(title='Non-fumeuses', ax=axes[1])\n", "sorted_datas1['Status'].value_counts().plot.bar(title='Total', ax=axes[2])" ] }, { "cell_type": "code", "execution_count": 27, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 27, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "fig, axes = plt.subplots(nrows=1, ncols=3, sharey=True, figsize=(20, 6))\n", "smokers['Status'].value_counts().plot.bar(title='Fumeuses', ax=axes[0])\n", "non_smokers['Status'].value_counts().plot.bar(title='Non-fumeuses', ax=axes[1])\n", "sorted_datas1['Status'].value_counts().plot.bar(title='Total', ax=axes[2])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "---\n", "## Exercice 2\n", "Reprenez la question 1 (effectifs et taux de mortalité) en rajoutant une nouvelle catégorie liée à la classe d'âge. On considérera par exemple les classes suivantes : 18-34 ans, 34-54 ans, 55-64 ans, plus de 65 ans. En quoi ce résultat est-il surprenant ? Arrivez-vous à expliquer ce paradoxe ? De même, vous pourrez proposer une représentation graphique de ces données pour étayer vos explications." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Cette fois-ci, on choisit de s'intéresser à des catégories d'âge arbitraires, ce niveau de classement est introduit après la séparation fumeuses/non-fumeuses." ] }, { "cell_type": "code", "execution_count": 30, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 30, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "fig, axes = plt.subplots(nrows=1, ncols=4, sharey=True, figsize=(15, 5))\n", "smokers.set_index('Age').sort_index().loc[18 : 34]['Status'].value_counts().plot.bar(title='Fumeuses 18-34 ans', ax=axes[0])\n", "smokers.set_index('Age').sort_index().loc[34 : 54]['Status'].value_counts().plot.bar(title='Fumeuses 34-54 ans', ax=axes[1])\n", "smokers.set_index('Age').sort_index().loc[55 : 64]['Status'].value_counts().plot.bar(title='Fumeuses 55-64 ans', ax=axes[2])\n", "smokers.set_index('Age').sort_index().loc[65:]['Status'].value_counts().plot.bar(title='Fumeuses 65+ ans', ax=axes[3])" ] }, { "cell_type": "code", "execution_count": 49, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 49, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "fig, axes = plt.subplots(nrows=1, ncols=4, sharey=True, figsize=(15, 5))\n", "non_smokers.set_index('Age').sort_index().loc[18 : 34]['Status'].value_counts().plot.bar(title='Non-fumeuses 18-34 ans', ax=axes[0])\n", "non_smokers.set_index('Age').sort_index().loc[34 : 54]['Status'].value_counts().plot.bar(title='Fumeuses 34-54 ans', ax=axes[1])\n", "non_smokers.set_index('Age').sort_index().loc[55 : 64]['Status'].value_counts().plot.bar(title='Fumeuses 55-64 ans', ax=axes[2])\n", "non_smokers.set_index('Age').sort_index().loc[65:]['Status'].value_counts().plot.bar(title='Fumeuses 65+ ans', ax=axes[3])" ] }, { "cell_type": "code", "execution_count": 58, "metadata": {}, "outputs": [ { "ename": "ValueError", "evalue": "The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().", "output_type": "error", "traceback": [ "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", "\u001b[0;31mValueError\u001b[0m Traceback (most recent call last)", "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[1;32m 10\u001b[0m \u001b[0;32mif\u001b[0m \u001b[0misinstance\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mi\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mtuple\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 11\u001b[0m \u001b[0;31m#print(non_smokers.set_index('Age').sort_index().loc[i[1][0] : i[1][1]]['Status'])\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m---> 12\u001b[0;31m \u001b[0;32mif\u001b[0m \u001b[0mi\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;36m0\u001b[0m\u001b[0;34m]\u001b[0m \u001b[0;34m<=\u001b[0m \u001b[0mnon_smokers\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mAge\u001b[0m \u001b[0;34m<=\u001b[0m \u001b[0mi\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 13\u001b[0m \u001b[0mprint\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m'yes'\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;32m/opt/conda/lib/python3.6/site-packages/pandas/core/generic.py\u001b[0m in \u001b[0;36m__nonzero__\u001b[0;34m(self)\u001b[0m\n\u001b[1;32m 1119\u001b[0m raise ValueError(\"The truth value of a {0} is ambiguous. \"\n\u001b[1;32m 1120\u001b[0m \u001b[0;34m\"Use a.empty, a.bool(), a.item(), a.any() or a.all().\"\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 1121\u001b[0;31m .format(self.__class__.__name__))\n\u001b[0m\u001b[1;32m 1122\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 1123\u001b[0m \u001b[0m__bool__\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0m__nonzero__\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;31mValueError\u001b[0m: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all()." ] } ], "source": [ "ages = [(18, 34), (34,54), (55,64), 65]\n", "\n", "for i in enumerate(cat):\n", " #print(i[0]) 0\n", " #print(i[1]) (18,34)\n", " #print(i[1][0]) #18\n", " #print(i[1][1]) 34\n", " #isinstance(i[1], tuple)\n", " \n", " if isinstance(i[1], tuple):\n", " #print(non_smokers.set_index('Age').sort_index().loc[i[1][0] : i[1][1]]['Status'])\n", " if i[1][0] <= non_smokers.Age <= i[1][1]:\n", " print('yes')" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Il semble assez clair que l'énoncé cherche à nous faire relever que le taux de mortalité est plus faible chez les fumeuses de 65+ que chez celles de 55-64ans mais on peut assez simplement expliquer ce paradoxe part le fait que le total des femmes fumeuses de 65+ soit beaucoup plus faible" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.4" } }, "nbformat": 4, "nbformat_minor": 2 }