{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Analyse de l'incidence de la varicelle"
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"%matplotlib inline\n",
"import matplotlib.pyplot as plt\n",
"import pandas as pd\n",
"import isoweek\n",
"import os"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Les données de l'incidence du syndrome grippal sont disponibles du site Web du Réseau Sentinelles. Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet, qui commence en 1984 et se termine avec une semaine récente."
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [],
"source": [
"remote_url = \"https://www.sentiweb.fr/datasets/incidence-PAY-7.csv\"\n",
"local_path = r\"\\module3\\exo3\\incidence-PAY-7.csv\"\n",
"if os.path.exists(local_path):\n",
" data_url = local_path\n",
" raw_data = pd.read_csv(local_path, skiprows=1, comment='#')\n",
"else:\n",
" raw_data = pd.read_csv(remote_url, skiprows=1, comment='#')\n",
" data.to_csv(local_path)\n",
" data_url = local_path"
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {
"collapsed": true
},
"outputs": [
{
"data": {
"text/html": [
"
\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" 0 | \n",
" week | \n",
" indicator | \n",
" inc | \n",
" inc_low | \n",
" inc_up | \n",
" inc100 | \n",
" inc100_low | \n",
" inc100_up | \n",
" geo_insee | \n",
" geo_name | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 1 | \n",
" 202335 | \n",
" 7 | \n",
" 943 | \n",
" 0 | \n",
" 1986 | \n",
" 1 | \n",
" 0 | \n",
" 3 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1 | \n",
" 2 | \n",
" 202334 | \n",
" 7 | \n",
" 1179 | \n",
" 11 | \n",
" 2347 | \n",
" 2 | \n",
" 0 | \n",
" 4 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 2 | \n",
" 3 | \n",
" 202333 | \n",
" 7 | \n",
" 3308 | \n",
" 1184 | \n",
" 5432 | \n",
" 5 | \n",
" 2 | \n",
" 8 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 3 | \n",
" 4 | \n",
" 202332 | \n",
" 7 | \n",
" 7996 | \n",
" 1120 | \n",
" 14872 | \n",
" 12 | \n",
" 2 | \n",
" 22 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 4 | \n",
" 5 | \n",
" 202331 | \n",
" 7 | \n",
" 3318 | \n",
" 1398 | \n",
" 5238 | \n",
" 5 | \n",
" 2 | \n",
" 8 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 5 | \n",
" 6 | \n",
" 202330 | \n",
" 7 | \n",
" 5821 | \n",
" 3269 | \n",
" 8373 | \n",
" 9 | \n",
" 5 | \n",
" 13 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 6 | \n",
" 7 | \n",
" 202329 | \n",
" 7 | \n",
" 13558 | \n",
" 8297 | \n",
" 18819 | \n",
" 20 | \n",
" 12 | \n",
" 28 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 7 | \n",
" 8 | \n",
" 202328 | \n",
" 7 | \n",
" 6700 | \n",
" 4043 | \n",
" 9357 | \n",
" 10 | \n",
" 6 | \n",
" 14 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 8 | \n",
" 9 | \n",
" 202327 | \n",
" 7 | \n",
" 7253 | \n",
" 4599 | \n",
" 9907 | \n",
" 11 | \n",
" 7 | \n",
" 15 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 9 | \n",
" 10 | \n",
" 202326 | \n",
" 7 | \n",
" 9192 | \n",
" 6223 | \n",
" 12161 | \n",
" 14 | \n",
" 10 | \n",
" 18 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 10 | \n",
" 11 | \n",
" 202325 | \n",
" 7 | \n",
" 11498 | \n",
" 8257 | \n",
" 14739 | \n",
" 17 | \n",
" 12 | \n",
" 22 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 11 | \n",
" 12 | \n",
" 202324 | \n",
" 7 | \n",
" 11115 | \n",
" 7968 | \n",
" 14262 | \n",
" 17 | \n",
" 12 | \n",
" 22 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 12 | \n",
" 13 | \n",
" 202323 | \n",
" 7 | \n",
" 12563 | \n",
" 6134 | \n",
" 18992 | \n",
" 19 | \n",
" 9 | \n",
" 29 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 13 | \n",
" 14 | \n",
" 202322 | \n",
" 7 | \n",
" 12184 | \n",
" 8125 | \n",
" 16243 | \n",
" 18 | \n",
" 12 | \n",
" 24 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 14 | \n",
" 15 | \n",
" 202321 | \n",
" 7 | \n",
" 11349 | \n",
" 7598 | \n",
" 15100 | \n",
" 17 | \n",
" 11 | \n",
" 23 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 15 | \n",
" 16 | \n",
" 202320 | \n",
" 7 | \n",
" 9000 | \n",
" 4615 | \n",
" 13385 | \n",
" 14 | \n",
" 7 | \n",
" 21 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 16 | \n",
" 17 | \n",
" 202319 | \n",
" 7 | \n",
" 9344 | \n",
" 6091 | \n",
" 12597 | \n",
" 14 | \n",
" 9 | \n",
" 19 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 17 | \n",
" 18 | \n",
" 202318 | \n",
" 7 | \n",
" 10671 | \n",
" 7291 | \n",
" 14051 | \n",
" 16 | \n",
" 11 | \n",
" 21 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 18 | \n",
" 19 | \n",
" 202317 | \n",
" 7 | \n",
" 9184 | \n",
" 6162 | \n",
" 12206 | \n",
" 14 | \n",
" 9 | \n",
" 19 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 19 | \n",
" 20 | \n",
" 202316 | \n",
" 7 | \n",
" 11387 | \n",
" 8014 | \n",
" 14760 | \n",
" 17 | \n",
" 12 | \n",
" 22 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 20 | \n",
" 21 | \n",
" 202315 | \n",
" 7 | \n",
" 14040 | \n",
" 7613 | \n",
" 20467 | \n",
" 21 | \n",
" 11 | \n",
" 31 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 21 | \n",
" 22 | \n",
" 202314 | \n",
" 7 | \n",
" 15247 | \n",
" 11032 | \n",
" 19462 | \n",
" 23 | \n",
" 17 | \n",
" 29 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 22 | \n",
" 23 | \n",
" 202313 | \n",
" 7 | \n",
" 13322 | \n",
" 9700 | \n",
" 16944 | \n",
" 20 | \n",
" 15 | \n",
" 25 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 23 | \n",
" 24 | \n",
" 202312 | \n",
" 7 | \n",
" 10374 | \n",
" 7218 | \n",
" 13530 | \n",
" 16 | \n",
" 11 | \n",
" 21 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 24 | \n",
" 25 | \n",
" 202311 | \n",
" 7 | \n",
" 4919 | \n",
" 2880 | \n",
" 6958 | \n",
" 7 | \n",
" 4 | \n",
" 10 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 25 | \n",
" 26 | \n",
" 202310 | \n",
" 7 | \n",
" 4854 | \n",
" 2731 | \n",
" 6977 | \n",
" 7 | \n",
" 4 | \n",
" 10 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 26 | \n",
" 27 | \n",
" 202309 | \n",
" 7 | \n",
" 7004 | \n",
" 4548 | \n",
" 9460 | \n",
" 11 | \n",
" 7 | \n",
" 15 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 27 | \n",
" 28 | \n",
" 202308 | \n",
" 7 | \n",
" 8175 | \n",
" 5316 | \n",
" 11034 | \n",
" 12 | \n",
" 8 | \n",
" 16 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 28 | \n",
" 29 | \n",
" 202307 | \n",
" 7 | \n",
" 6595 | \n",
" 3782 | \n",
" 9408 | \n",
" 10 | \n",
" 6 | \n",
" 14 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 29 | \n",
" 30 | \n",
" 202306 | \n",
" 7 | \n",
" 9595 | \n",
" 6017 | \n",
" 13173 | \n",
" 14 | \n",
" 9 | \n",
" 19 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
"
\n",
" \n",
" 1679 | \n",
" 1680 | \n",
" 199126 | \n",
" 7 | \n",
" 17608 | \n",
" 11304 | \n",
" 23912 | \n",
" 31 | \n",
" 20 | \n",
" 42 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1680 | \n",
" 1681 | \n",
" 199125 | \n",
" 7 | \n",
" 16169 | \n",
" 10700 | \n",
" 21638 | \n",
" 28 | \n",
" 18 | \n",
" 38 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1681 | \n",
" 1682 | \n",
" 199124 | \n",
" 7 | \n",
" 16171 | \n",
" 10071 | \n",
" 22271 | \n",
" 28 | \n",
" 17 | \n",
" 39 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1682 | \n",
" 1683 | \n",
" 199123 | \n",
" 7 | \n",
" 11947 | \n",
" 7671 | \n",
" 16223 | \n",
" 21 | \n",
" 13 | \n",
" 29 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1683 | \n",
" 1684 | \n",
" 199122 | \n",
" 7 | \n",
" 15452 | \n",
" 9953 | \n",
" 20951 | \n",
" 27 | \n",
" 17 | \n",
" 37 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1684 | \n",
" 1685 | \n",
" 199121 | \n",
" 7 | \n",
" 14903 | \n",
" 8975 | \n",
" 20831 | \n",
" 26 | \n",
" 16 | \n",
" 36 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1685 | \n",
" 1686 | \n",
" 199120 | \n",
" 7 | \n",
" 19053 | \n",
" 12742 | \n",
" 25364 | \n",
" 34 | \n",
" 23 | \n",
" 45 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1686 | \n",
" 1687 | \n",
" 199119 | \n",
" 7 | \n",
" 16739 | \n",
" 11246 | \n",
" 22232 | \n",
" 29 | \n",
" 19 | \n",
" 39 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1687 | \n",
" 1688 | \n",
" 199118 | \n",
" 7 | \n",
" 21385 | \n",
" 13882 | \n",
" 28888 | \n",
" 38 | \n",
" 25 | \n",
" 51 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1688 | \n",
" 1689 | \n",
" 199117 | \n",
" 7 | \n",
" 13462 | \n",
" 8877 | \n",
" 18047 | \n",
" 24 | \n",
" 16 | \n",
" 32 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1689 | \n",
" 1690 | \n",
" 199116 | \n",
" 7 | \n",
" 14857 | \n",
" 10068 | \n",
" 19646 | \n",
" 26 | \n",
" 18 | \n",
" 34 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1690 | \n",
" 1691 | \n",
" 199115 | \n",
" 7 | \n",
" 13975 | \n",
" 9781 | \n",
" 18169 | \n",
" 25 | \n",
" 18 | \n",
" 32 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1691 | \n",
" 1692 | \n",
" 199114 | \n",
" 7 | \n",
" 12265 | \n",
" 7684 | \n",
" 16846 | \n",
" 22 | \n",
" 14 | \n",
" 30 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1692 | \n",
" 1693 | \n",
" 199113 | \n",
" 7 | \n",
" 9567 | \n",
" 6041 | \n",
" 13093 | \n",
" 17 | \n",
" 11 | \n",
" 23 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1693 | \n",
" 1694 | \n",
" 199112 | \n",
" 7 | \n",
" 10864 | \n",
" 7331 | \n",
" 14397 | \n",
" 19 | \n",
" 13 | \n",
" 25 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1694 | \n",
" 1695 | \n",
" 199111 | \n",
" 7 | \n",
" 15574 | \n",
" 11184 | \n",
" 19964 | \n",
" 27 | \n",
" 19 | \n",
" 35 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1695 | \n",
" 1696 | \n",
" 199110 | \n",
" 7 | \n",
" 16643 | \n",
" 11372 | \n",
" 21914 | \n",
" 29 | \n",
" 20 | \n",
" 38 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1696 | \n",
" 1697 | \n",
" 199109 | \n",
" 7 | \n",
" 13741 | \n",
" 8780 | \n",
" 18702 | \n",
" 24 | \n",
" 15 | \n",
" 33 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1697 | \n",
" 1698 | \n",
" 199108 | \n",
" 7 | \n",
" 13289 | \n",
" 8813 | \n",
" 17765 | \n",
" 23 | \n",
" 15 | \n",
" 31 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1698 | \n",
" 1699 | \n",
" 199107 | \n",
" 7 | \n",
" 12337 | \n",
" 8077 | \n",
" 16597 | \n",
" 22 | \n",
" 15 | \n",
" 29 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1699 | \n",
" 1700 | \n",
" 199106 | \n",
" 7 | \n",
" 10877 | \n",
" 7013 | \n",
" 14741 | \n",
" 19 | \n",
" 12 | \n",
" 26 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1700 | \n",
" 1701 | \n",
" 199105 | \n",
" 7 | \n",
" 10442 | \n",
" 6544 | \n",
" 14340 | \n",
" 18 | \n",
" 11 | \n",
" 25 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1701 | \n",
" 1702 | \n",
" 199104 | \n",
" 7 | \n",
" 7913 | \n",
" 4563 | \n",
" 11263 | \n",
" 14 | \n",
" 8 | \n",
" 20 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1702 | \n",
" 1703 | \n",
" 199103 | \n",
" 7 | \n",
" 15387 | \n",
" 10484 | \n",
" 20290 | \n",
" 27 | \n",
" 18 | \n",
" 36 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1703 | \n",
" 1704 | \n",
" 199102 | \n",
" 7 | \n",
" 16277 | \n",
" 11046 | \n",
" 21508 | \n",
" 29 | \n",
" 20 | \n",
" 38 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1704 | \n",
" 1705 | \n",
" 199101 | \n",
" 7 | \n",
" 15565 | \n",
" 10271 | \n",
" 20859 | \n",
" 27 | \n",
" 18 | \n",
" 36 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1705 | \n",
" 1706 | \n",
" 199052 | \n",
" 7 | \n",
" 19375 | \n",
" 13295 | \n",
" 25455 | \n",
" 34 | \n",
" 23 | \n",
" 45 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1706 | \n",
" 1707 | \n",
" 199051 | \n",
" 7 | \n",
" 19080 | \n",
" 13807 | \n",
" 24353 | \n",
" 34 | \n",
" 25 | \n",
" 43 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1707 | \n",
" 1708 | \n",
" 199050 | \n",
" 7 | \n",
" 11079 | \n",
" 6660 | \n",
" 15498 | \n",
" 20 | \n",
" 12 | \n",
" 28 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1708 | \n",
" 1709 | \n",
" 199049 | \n",
" 7 | \n",
" 1143 | \n",
" 0 | \n",
" 2610 | \n",
" 2 | \n",
" 0 | \n",
" 5 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
"
\n",
"
1709 rows × 11 columns
\n",
"
"
],
"text/plain": [
" 0 week indicator inc inc_low inc_up inc100 inc100_low \\\n",
"0 1 202335 7 943 0 1986 1 0 \n",
"1 2 202334 7 1179 11 2347 2 0 \n",
"2 3 202333 7 3308 1184 5432 5 2 \n",
"3 4 202332 7 7996 1120 14872 12 2 \n",
"4 5 202331 7 3318 1398 5238 5 2 \n",
"5 6 202330 7 5821 3269 8373 9 5 \n",
"6 7 202329 7 13558 8297 18819 20 12 \n",
"7 8 202328 7 6700 4043 9357 10 6 \n",
"8 9 202327 7 7253 4599 9907 11 7 \n",
"9 10 202326 7 9192 6223 12161 14 10 \n",
"10 11 202325 7 11498 8257 14739 17 12 \n",
"11 12 202324 7 11115 7968 14262 17 12 \n",
"12 13 202323 7 12563 6134 18992 19 9 \n",
"13 14 202322 7 12184 8125 16243 18 12 \n",
"14 15 202321 7 11349 7598 15100 17 11 \n",
"15 16 202320 7 9000 4615 13385 14 7 \n",
"16 17 202319 7 9344 6091 12597 14 9 \n",
"17 18 202318 7 10671 7291 14051 16 11 \n",
"18 19 202317 7 9184 6162 12206 14 9 \n",
"19 20 202316 7 11387 8014 14760 17 12 \n",
"20 21 202315 7 14040 7613 20467 21 11 \n",
"21 22 202314 7 15247 11032 19462 23 17 \n",
"22 23 202313 7 13322 9700 16944 20 15 \n",
"23 24 202312 7 10374 7218 13530 16 11 \n",
"24 25 202311 7 4919 2880 6958 7 4 \n",
"25 26 202310 7 4854 2731 6977 7 4 \n",
"26 27 202309 7 7004 4548 9460 11 7 \n",
"27 28 202308 7 8175 5316 11034 12 8 \n",
"28 29 202307 7 6595 3782 9408 10 6 \n",
"29 30 202306 7 9595 6017 13173 14 9 \n",
"... ... ... ... ... ... ... ... ... \n",
"1679 1680 199126 7 17608 11304 23912 31 20 \n",
"1680 1681 199125 7 16169 10700 21638 28 18 \n",
"1681 1682 199124 7 16171 10071 22271 28 17 \n",
"1682 1683 199123 7 11947 7671 16223 21 13 \n",
"1683 1684 199122 7 15452 9953 20951 27 17 \n",
"1684 1685 199121 7 14903 8975 20831 26 16 \n",
"1685 1686 199120 7 19053 12742 25364 34 23 \n",
"1686 1687 199119 7 16739 11246 22232 29 19 \n",
"1687 1688 199118 7 21385 13882 28888 38 25 \n",
"1688 1689 199117 7 13462 8877 18047 24 16 \n",
"1689 1690 199116 7 14857 10068 19646 26 18 \n",
"1690 1691 199115 7 13975 9781 18169 25 18 \n",
"1691 1692 199114 7 12265 7684 16846 22 14 \n",
"1692 1693 199113 7 9567 6041 13093 17 11 \n",
"1693 1694 199112 7 10864 7331 14397 19 13 \n",
"1694 1695 199111 7 15574 11184 19964 27 19 \n",
"1695 1696 199110 7 16643 11372 21914 29 20 \n",
"1696 1697 199109 7 13741 8780 18702 24 15 \n",
"1697 1698 199108 7 13289 8813 17765 23 15 \n",
"1698 1699 199107 7 12337 8077 16597 22 15 \n",
"1699 1700 199106 7 10877 7013 14741 19 12 \n",
"1700 1701 199105 7 10442 6544 14340 18 11 \n",
"1701 1702 199104 7 7913 4563 11263 14 8 \n",
"1702 1703 199103 7 15387 10484 20290 27 18 \n",
"1703 1704 199102 7 16277 11046 21508 29 20 \n",
"1704 1705 199101 7 15565 10271 20859 27 18 \n",
"1705 1706 199052 7 19375 13295 25455 34 23 \n",
"1706 1707 199051 7 19080 13807 24353 34 25 \n",
"1707 1708 199050 7 11079 6660 15498 20 12 \n",
"1708 1709 199049 7 1143 0 2610 2 0 \n",
"\n",
" inc100_up geo_insee geo_name \n",
"0 3 FR France \n",
"1 4 FR France \n",
"2 8 FR France \n",
"3 22 FR France \n",
"4 8 FR France \n",
"5 13 FR France \n",
"6 28 FR France \n",
"7 14 FR France \n",
"8 15 FR France \n",
"9 18 FR France \n",
"10 22 FR France \n",
"11 22 FR France \n",
"12 29 FR France \n",
"13 24 FR France \n",
"14 23 FR France \n",
"15 21 FR France \n",
"16 19 FR France \n",
"17 21 FR France \n",
"18 19 FR France \n",
"19 22 FR France \n",
"20 31 FR France \n",
"21 29 FR France \n",
"22 25 FR France \n",
"23 21 FR France \n",
"24 10 FR France \n",
"25 10 FR France \n",
"26 15 FR France \n",
"27 16 FR France \n",
"28 14 FR France \n",
"29 19 FR France \n",
"... ... ... ... \n",
"1679 42 FR France \n",
"1680 38 FR France \n",
"1681 39 FR France \n",
"1682 29 FR France \n",
"1683 37 FR France \n",
"1684 36 FR France \n",
"1685 45 FR France \n",
"1686 39 FR France \n",
"1687 51 FR France \n",
"1688 32 FR France \n",
"1689 34 FR France \n",
"1690 32 FR France \n",
"1691 30 FR France \n",
"1692 23 FR France \n",
"1693 25 FR France \n",
"1694 35 FR France \n",
"1695 38 FR France \n",
"1696 33 FR France \n",
"1697 31 FR France \n",
"1698 29 FR France \n",
"1699 26 FR France \n",
"1700 25 FR France \n",
"1701 20 FR France \n",
"1702 36 FR France \n",
"1703 38 FR France \n",
"1704 36 FR France \n",
"1705 45 FR France \n",
"1706 43 FR France \n",
"1707 28 FR France \n",
"1708 5 FR France \n",
"\n",
"[1709 rows x 11 columns]"
]
},
"execution_count": 3,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"raw_data = raw_data.dropna(axis=1)\n",
"raw_data.head()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"On s'assure qu'il ny a pas de valeurs manquantes"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" 0 | \n",
" week | \n",
" indicator | \n",
" inc | \n",
" inc_low | \n",
" inc_up | \n",
" inc100 | \n",
" inc100_low | \n",
" inc100_up | \n",
" geo_insee | \n",
" geo_name | \n",
"
\n",
" \n",
" \n",
" \n",
"
\n",
"
"
],
"text/plain": [
"Empty DataFrame\n",
"Columns: [0, week, indicator, inc, inc_low, inc_up, inc100, inc100_low, inc100_up, geo_insee, geo_name]\n",
"Index: []"
]
},
"execution_count": 4,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"raw_data[raw_data.isnull().any(axis=1)]"
]
},
{
"cell_type": "code",
"execution_count": 6,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" 0 | \n",
" week | \n",
" indicator | \n",
" inc | \n",
" inc_low | \n",
" inc_up | \n",
" inc100 | \n",
" inc100_low | \n",
" inc100_up | \n",
" geo_insee | \n",
" geo_name | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 1 | \n",
" 202335 | \n",
" 7 | \n",
" 943 | \n",
" 0 | \n",
" 1986 | \n",
" 1 | \n",
" 0 | \n",
" 3 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 1 | \n",
" 2 | \n",
" 202334 | \n",
" 7 | \n",
" 1179 | \n",
" 11 | \n",
" 2347 | \n",
" 2 | \n",
" 0 | \n",
" 4 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 2 | \n",
" 3 | \n",
" 202333 | \n",
" 7 | \n",
" 3308 | \n",
" 1184 | \n",
" 5432 | \n",
" 5 | \n",
" 2 | \n",
" 8 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 3 | \n",
" 4 | \n",
" 202332 | \n",
" 7 | \n",
" 7996 | \n",
" 1120 | \n",
" 14872 | \n",
" 12 | \n",
" 2 | \n",
" 22 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
" 4 | \n",
" 5 | \n",
" 202331 | \n",
" 7 | \n",
" 3318 | \n",
" 1398 | \n",
" 5238 | \n",
" 5 | \n",
" 2 | \n",
" 8 | \n",
" FR | \n",
" France | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" 0 week indicator inc inc_low inc_up inc100 inc100_low inc100_up \\\n",
"0 1 202335 7 943 0 1986 1 0 3 \n",
"1 2 202334 7 1179 11 2347 2 0 4 \n",
"2 3 202333 7 3308 1184 5432 5 2 8 \n",
"3 4 202332 7 7996 1120 14872 12 2 22 \n",
"4 5 202331 7 3318 1398 5238 5 2 8 \n",
"\n",
" geo_insee geo_name \n",
"0 FR France \n",
"1 FR France \n",
"2 FR France \n",
"3 FR France \n",
"4 FR France "
]
},
"execution_count": 6,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"data = raw_data.dropna().copy()\n",
"data.head()"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"def convert_week(year_and_week_int):\n",
" year_and_week_str = str(year_and_week_int)\n",
" year = int(year_and_week_str[:4])\n",
" week = int(year_and_week_str[4:])\n",
" w = isoweek.Week(year, week)\n",
" return pd.Period(w.day(0), 'W')\n",
"\n",
"data['period'] = [convert_week(yw) for yw in data['week']]"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.6.4"
}
},
"nbformat": 4,
"nbformat_minor": 2
}