"Même problème qu'avec les données de l'OCDE à part que l'Iran est présent sous le nom \"Iran, Islamic Rep.\".\n",
"\n",
"La solution adopté est d'inclure Hong Kong dans la Chine, omettre l'Iran et la Corée et pour les états-unis on adapte juste le nom à la source des données."
"La solution adopté est d'inclure Hong Kong dans la Chine, omettre l'Iran et la Corée et pour les états-unis on adapte juste le nom à la source des données.\n",
"\n",
"Par ailleurs les DOM/TOM sont inclu dans la population de la France."
]
},
{
"cell_type": "code",
"execution_count": 26,
"metadata": {
"hideCode": true,
"hidePrompt": true
"execution_count": 47,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"-- Netherlands\n",
"La province Aruba est considéré comme un pays dans le fichier de données\n",
"La province Curacao est considéré comme un pays dans le fichier de données\n",
"La province Sint Maarten est considéré comme un pays dans le fichier de données\n",
"-- United Kingdom\n",
"La province Bermuda est considéré comme un pays dans le fichier de données\n",
"La province British Virgin Islands est considéré comme un pays dans le fichier de données\n",
"La province Cayman Islands est considéré comme un pays dans le fichier de données\n",
"La province Channel Islands est considéré comme un pays dans le fichier de données\n",
"La province Gibraltar est considéré comme un pays dans le fichier de données\n",
"La province Isle of Man est considéré comme un pays dans le fichier de données\n",
"La province Turks and Caicos Islands est considéré comme un pays dans le fichier de données\n"
]
},
"outputs": [],
{
"name": "stderr",
"output_type": "stream",
"text": [
"/opt/conda/lib/python3.6/site-packages/ipykernel_launcher.py:4: UserWarning: This pattern has match groups. To actually get the groups, use str.extract.\n",
" after removing the cwd from sys.path.\n"
]
}
],
"source": [
"t = ['a', 'b', 'c']\n",
"t.remove('c')"
"for country in ['Netherlands', 'United Kingdom']:\n",
" print('--', country)\n",
" for state in death_data[death_data['Country/Region'] == country]['Province/State']:\n",
" if type(state) is str and len(population[population['Country Name'].str.contains(state)]) > 0:\n",
" print('La province', state, 'est considéré comme un pays dans le fichier de données')"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {
"hideCode": true,
"hidePrompt": true
},
"outputs": [],
"source": []
"cell_type": "markdown",
"metadata": {},
"source": [
"Les colonnies de la Hollande et du Royaume Uni sont considérées comme des pays."
]
},
{
"cell_type": "code",
"execution_count": null,
"execution_count": 90,
"metadata": {
"hideCode": true,
"hidePrompt": true
},
"outputs": [],
"source": [
"def plot_death_bed(countries):\n",
" data = death_data\n",
" death_bed_data = []\n",
"\n",
"\n",
"plt.figure(figsize=(16,10))\n",
"plt.title(\"Nombre de mort en fonction du nombre de lit d'hopital\")\n",
"plt.xlabel('Nombre de lit (pour 1000 habitants)')\n",
"plt.ylabel('Nombre de mort (pour 1000 habitants)')\n",
"plt.yscale(yscale)\n",
"\n",
"curves = []\n",
"\n",
"for country in countries:\n",
" plt.figure(figsize=(16,10))\n",
" plt.title(\"Nombre de mort en fonction du nombre de lit d'hopital\")\n",
" plt.xlabel('Nombre de lit (pour 1000 habitants)')\n",
" plt.ylabel('Nombre de mort (pour 1000 habitants)')\n",
"Pour les pays demandés par les auteurs du MOOC il y a une forte corrélation négative entre le nombre de lit et le nombre de mort. i.e. plus il y a de lits d'hopital moins il y a de morts."
"En revanche si on regarde l'ensemble des pays on trouve une légère corrélation positive. i.e. plus il y a de lits plus il y a de morts. Néanmoins la pvalue est supérieur à 0.05, elle est donc trop élevée pour rejeter la null hypothesis selon laquelle les deux valeurs ne seraient pas corrélées."