{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Incidence du syndrome de la varicelle"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [],
   "source": [
    "%matplotlib inline\n",
    "import matplotlib.pyplot as plt\n",
    "import pandas as pd\n",
    "import isoweek"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Les données de l'incidence du syndrome de la varicelle sont disponibles du site Web du [Réseau Sentinelles](http://www.sentiweb.fr/). Nous les récupérons sous forme d'un fichier en format CSV dont chaque ligne correspond à une semaine de la période demandée. Nous téléchargeons toujours le jeu de données complet, qui commence en 1984 et se termine avec une semaine récente."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [],
   "source": [
    "data_url = 'http://www.sentiweb.fr/datasets/incidence-PAY-7.csv'\n",
    "data_file = \"syndrome-varicelle.csv\"\n",
    "\n",
    "import os\n",
    "import urllib.request\n",
    "if not os.path.exists(data_file):\n",
    "    urllib.request.urlretrieve(data_url, data_file)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Dans la cellule précédente, on a vérifié si un fichier local existe.\n",
    "Si ce n'est pas le cas, alors on le télécharge sur le site de Sentinelle."
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Voici l'explication des colonnes données [sur le site d'origine](https://ns.sentiweb.fr/incidence/csv-schema-v1.json):\n",
    "\n",
    "| Nom de colonne | Libellé de colonne                                                                                                                |\n",
    "|----------------|-----------------------------------------------------------------------------------------------------------------------------------|\n",
    "| week           | Semaine calendaire (ISO 8601)                                                                                                     |\n",
    "| indicator      | Code de l'indicateur de surveillance                                                                                              |\n",
    "| inc            | Estimation de l'incidence de consultations en nombre de cas                                                                       |\n",
    "| inc_low        | Estimation de la borne inférieure de l'IC95% du nombre de cas de consultation                                                     |\n",
    "| inc_up         | Estimation de la borne supérieure de l'IC95% du nombre de cas de consultation                                                     |\n",
    "| inc100         | Estimation du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants)                                   |\n",
    "| inc100_low     | Estimation de la borne inférieure de l'IC95% du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |\n",
    "| inc100_up      | Estimation de la borne supérieure de l'IC95% du taux d'incidence du nombre de cas de consultation (en cas pour 100,000 habitants) |\n",
    "| geo_insee      | Code de la zone géographique concernée (Code INSEE) http://www.insee.fr/fr/methodes/nomenclatures/cog/                            |\n",
    "| geo_name       | Libellé de la zone géographique (ce libellé peut être modifié sans préavis)                                                       |\n",
    "\n",
    "La première ligne du fichier CSV est un commentaire, que nous ignorons en précisant `skiprows=1`."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>week</th>\n",
       "      <th>indicator</th>\n",
       "      <th>inc</th>\n",
       "      <th>inc_low</th>\n",
       "      <th>inc_up</th>\n",
       "      <th>inc100</th>\n",
       "      <th>inc100_low</th>\n",
       "      <th>inc100_up</th>\n",
       "      <th>geo_insee</th>\n",
       "      <th>geo_name</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>202151</td>\n",
       "      <td>7</td>\n",
       "      <td>13369</td>\n",
       "      <td>9435</td>\n",
       "      <td>17303</td>\n",
       "      <td>20</td>\n",
       "      <td>14</td>\n",
       "      <td>26</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>202150</td>\n",
       "      <td>7</td>\n",
       "      <td>14128</td>\n",
       "      <td>10312</td>\n",
       "      <td>17944</td>\n",
       "      <td>21</td>\n",
       "      <td>15</td>\n",
       "      <td>27</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>202149</td>\n",
       "      <td>7</td>\n",
       "      <td>13674</td>\n",
       "      <td>10369</td>\n",
       "      <td>16979</td>\n",
       "      <td>21</td>\n",
       "      <td>16</td>\n",
       "      <td>26</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>202148</td>\n",
       "      <td>7</td>\n",
       "      <td>11549</td>\n",
       "      <td>8503</td>\n",
       "      <td>14595</td>\n",
       "      <td>17</td>\n",
       "      <td>12</td>\n",
       "      <td>22</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>202147</td>\n",
       "      <td>7</td>\n",
       "      <td>11419</td>\n",
       "      <td>8376</td>\n",
       "      <td>14462</td>\n",
       "      <td>17</td>\n",
       "      <td>12</td>\n",
       "      <td>22</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5</th>\n",
       "      <td>202146</td>\n",
       "      <td>7</td>\n",
       "      <td>8216</td>\n",
       "      <td>5724</td>\n",
       "      <td>10708</td>\n",
       "      <td>12</td>\n",
       "      <td>8</td>\n",
       "      <td>16</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6</th>\n",
       "      <td>202145</td>\n",
       "      <td>7</td>\n",
       "      <td>8965</td>\n",
       "      <td>6468</td>\n",
       "      <td>11462</td>\n",
       "      <td>14</td>\n",
       "      <td>10</td>\n",
       "      <td>18</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7</th>\n",
       "      <td>202144</td>\n",
       "      <td>7</td>\n",
       "      <td>8736</td>\n",
       "      <td>5636</td>\n",
       "      <td>11836</td>\n",
       "      <td>13</td>\n",
       "      <td>8</td>\n",
       "      <td>18</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8</th>\n",
       "      <td>202143</td>\n",
       "      <td>7</td>\n",
       "      <td>8145</td>\n",
       "      <td>5164</td>\n",
       "      <td>11126</td>\n",
       "      <td>12</td>\n",
       "      <td>7</td>\n",
       "      <td>17</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>9</th>\n",
       "      <td>202142</td>\n",
       "      <td>7</td>\n",
       "      <td>9443</td>\n",
       "      <td>6037</td>\n",
       "      <td>12849</td>\n",
       "      <td>14</td>\n",
       "      <td>9</td>\n",
       "      <td>19</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>10</th>\n",
       "      <td>202141</td>\n",
       "      <td>7</td>\n",
       "      <td>4021</td>\n",
       "      <td>2239</td>\n",
       "      <td>5803</td>\n",
       "      <td>6</td>\n",
       "      <td>3</td>\n",
       "      <td>9</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>11</th>\n",
       "      <td>202140</td>\n",
       "      <td>7</td>\n",
       "      <td>4441</td>\n",
       "      <td>2454</td>\n",
       "      <td>6428</td>\n",
       "      <td>7</td>\n",
       "      <td>4</td>\n",
       "      <td>10</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>12</th>\n",
       "      <td>202139</td>\n",
       "      <td>7</td>\n",
       "      <td>2291</td>\n",
       "      <td>1056</td>\n",
       "      <td>3526</td>\n",
       "      <td>3</td>\n",
       "      <td>1</td>\n",
       "      <td>5</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>13</th>\n",
       "      <td>202138</td>\n",
       "      <td>7</td>\n",
       "      <td>4325</td>\n",
       "      <td>2267</td>\n",
       "      <td>6383</td>\n",
       "      <td>7</td>\n",
       "      <td>4</td>\n",
       "      <td>10</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>14</th>\n",
       "      <td>202137</td>\n",
       "      <td>7</td>\n",
       "      <td>1964</td>\n",
       "      <td>754</td>\n",
       "      <td>3174</td>\n",
       "      <td>3</td>\n",
       "      <td>1</td>\n",
       "      <td>5</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>15</th>\n",
       "      <td>202136</td>\n",
       "      <td>7</td>\n",
       "      <td>3441</td>\n",
       "      <td>1730</td>\n",
       "      <td>5152</td>\n",
       "      <td>5</td>\n",
       "      <td>2</td>\n",
       "      <td>8</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>16</th>\n",
       "      <td>202135</td>\n",
       "      <td>7</td>\n",
       "      <td>2562</td>\n",
       "      <td>1107</td>\n",
       "      <td>4017</td>\n",
       "      <td>4</td>\n",
       "      <td>2</td>\n",
       "      <td>6</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>17</th>\n",
       "      <td>202134</td>\n",
       "      <td>7</td>\n",
       "      <td>1429</td>\n",
       "      <td>378</td>\n",
       "      <td>2480</td>\n",
       "      <td>2</td>\n",
       "      <td>0</td>\n",
       "      <td>4</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>18</th>\n",
       "      <td>202133</td>\n",
       "      <td>7</td>\n",
       "      <td>3829</td>\n",
       "      <td>1830</td>\n",
       "      <td>5828</td>\n",
       "      <td>6</td>\n",
       "      <td>3</td>\n",
       "      <td>9</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19</th>\n",
       "      <td>202132</td>\n",
       "      <td>7</td>\n",
       "      <td>4108</td>\n",
       "      <td>1895</td>\n",
       "      <td>6321</td>\n",
       "      <td>6</td>\n",
       "      <td>3</td>\n",
       "      <td>9</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>20</th>\n",
       "      <td>202131</td>\n",
       "      <td>7</td>\n",
       "      <td>4793</td>\n",
       "      <td>2301</td>\n",
       "      <td>7285</td>\n",
       "      <td>7</td>\n",
       "      <td>3</td>\n",
       "      <td>11</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>21</th>\n",
       "      <td>202130</td>\n",
       "      <td>7</td>\n",
       "      <td>7190</td>\n",
       "      <td>4191</td>\n",
       "      <td>10189</td>\n",
       "      <td>11</td>\n",
       "      <td>6</td>\n",
       "      <td>16</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>22</th>\n",
       "      <td>202129</td>\n",
       "      <td>7</td>\n",
       "      <td>6800</td>\n",
       "      <td>4109</td>\n",
       "      <td>9491</td>\n",
       "      <td>10</td>\n",
       "      <td>6</td>\n",
       "      <td>14</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>23</th>\n",
       "      <td>202128</td>\n",
       "      <td>7</td>\n",
       "      <td>9734</td>\n",
       "      <td>0</td>\n",
       "      <td>21731</td>\n",
       "      <td>15</td>\n",
       "      <td>0</td>\n",
       "      <td>33</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>24</th>\n",
       "      <td>202127</td>\n",
       "      <td>7</td>\n",
       "      <td>9026</td>\n",
       "      <td>4316</td>\n",
       "      <td>13736</td>\n",
       "      <td>14</td>\n",
       "      <td>7</td>\n",
       "      <td>21</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>25</th>\n",
       "      <td>202126</td>\n",
       "      <td>7</td>\n",
       "      <td>7284</td>\n",
       "      <td>4108</td>\n",
       "      <td>10460</td>\n",
       "      <td>11</td>\n",
       "      <td>6</td>\n",
       "      <td>16</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>26</th>\n",
       "      <td>202125</td>\n",
       "      <td>7</td>\n",
       "      <td>9351</td>\n",
       "      <td>6540</td>\n",
       "      <td>12162</td>\n",
       "      <td>14</td>\n",
       "      <td>10</td>\n",
       "      <td>18</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>27</th>\n",
       "      <td>202124</td>\n",
       "      <td>7</td>\n",
       "      <td>12034</td>\n",
       "      <td>8937</td>\n",
       "      <td>15131</td>\n",
       "      <td>18</td>\n",
       "      <td>13</td>\n",
       "      <td>23</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>28</th>\n",
       "      <td>202123</td>\n",
       "      <td>7</td>\n",
       "      <td>9116</td>\n",
       "      <td>6420</td>\n",
       "      <td>11812</td>\n",
       "      <td>14</td>\n",
       "      <td>10</td>\n",
       "      <td>18</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>29</th>\n",
       "      <td>202122</td>\n",
       "      <td>7</td>\n",
       "      <td>4817</td>\n",
       "      <td>2752</td>\n",
       "      <td>6882</td>\n",
       "      <td>7</td>\n",
       "      <td>4</td>\n",
       "      <td>10</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1591</th>\n",
       "      <td>199126</td>\n",
       "      <td>7</td>\n",
       "      <td>17608</td>\n",
       "      <td>11304</td>\n",
       "      <td>23912</td>\n",
       "      <td>31</td>\n",
       "      <td>20</td>\n",
       "      <td>42</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1592</th>\n",
       "      <td>199125</td>\n",
       "      <td>7</td>\n",
       "      <td>16169</td>\n",
       "      <td>10700</td>\n",
       "      <td>21638</td>\n",
       "      <td>28</td>\n",
       "      <td>18</td>\n",
       "      <td>38</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1593</th>\n",
       "      <td>199124</td>\n",
       "      <td>7</td>\n",
       "      <td>16171</td>\n",
       "      <td>10071</td>\n",
       "      <td>22271</td>\n",
       "      <td>28</td>\n",
       "      <td>17</td>\n",
       "      <td>39</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1594</th>\n",
       "      <td>199123</td>\n",
       "      <td>7</td>\n",
       "      <td>11947</td>\n",
       "      <td>7671</td>\n",
       "      <td>16223</td>\n",
       "      <td>21</td>\n",
       "      <td>13</td>\n",
       "      <td>29</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1595</th>\n",
       "      <td>199122</td>\n",
       "      <td>7</td>\n",
       "      <td>15452</td>\n",
       "      <td>9953</td>\n",
       "      <td>20951</td>\n",
       "      <td>27</td>\n",
       "      <td>17</td>\n",
       "      <td>37</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1596</th>\n",
       "      <td>199121</td>\n",
       "      <td>7</td>\n",
       "      <td>14903</td>\n",
       "      <td>8975</td>\n",
       "      <td>20831</td>\n",
       "      <td>26</td>\n",
       "      <td>16</td>\n",
       "      <td>36</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1597</th>\n",
       "      <td>199120</td>\n",
       "      <td>7</td>\n",
       "      <td>19053</td>\n",
       "      <td>12742</td>\n",
       "      <td>25364</td>\n",
       "      <td>34</td>\n",
       "      <td>23</td>\n",
       "      <td>45</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1598</th>\n",
       "      <td>199119</td>\n",
       "      <td>7</td>\n",
       "      <td>16739</td>\n",
       "      <td>11246</td>\n",
       "      <td>22232</td>\n",
       "      <td>29</td>\n",
       "      <td>19</td>\n",
       "      <td>39</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1599</th>\n",
       "      <td>199118</td>\n",
       "      <td>7</td>\n",
       "      <td>21385</td>\n",
       "      <td>13882</td>\n",
       "      <td>28888</td>\n",
       "      <td>38</td>\n",
       "      <td>25</td>\n",
       "      <td>51</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1600</th>\n",
       "      <td>199117</td>\n",
       "      <td>7</td>\n",
       "      <td>13462</td>\n",
       "      <td>8877</td>\n",
       "      <td>18047</td>\n",
       "      <td>24</td>\n",
       "      <td>16</td>\n",
       "      <td>32</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1601</th>\n",
       "      <td>199116</td>\n",
       "      <td>7</td>\n",
       "      <td>14857</td>\n",
       "      <td>10068</td>\n",
       "      <td>19646</td>\n",
       "      <td>26</td>\n",
       "      <td>18</td>\n",
       "      <td>34</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1602</th>\n",
       "      <td>199115</td>\n",
       "      <td>7</td>\n",
       "      <td>13975</td>\n",
       "      <td>9781</td>\n",
       "      <td>18169</td>\n",
       "      <td>25</td>\n",
       "      <td>18</td>\n",
       "      <td>32</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1603</th>\n",
       "      <td>199114</td>\n",
       "      <td>7</td>\n",
       "      <td>12265</td>\n",
       "      <td>7684</td>\n",
       "      <td>16846</td>\n",
       "      <td>22</td>\n",
       "      <td>14</td>\n",
       "      <td>30</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1604</th>\n",
       "      <td>199113</td>\n",
       "      <td>7</td>\n",
       "      <td>9567</td>\n",
       "      <td>6041</td>\n",
       "      <td>13093</td>\n",
       "      <td>17</td>\n",
       "      <td>11</td>\n",
       "      <td>23</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1605</th>\n",
       "      <td>199112</td>\n",
       "      <td>7</td>\n",
       "      <td>10864</td>\n",
       "      <td>7331</td>\n",
       "      <td>14397</td>\n",
       "      <td>19</td>\n",
       "      <td>13</td>\n",
       "      <td>25</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1606</th>\n",
       "      <td>199111</td>\n",
       "      <td>7</td>\n",
       "      <td>15574</td>\n",
       "      <td>11184</td>\n",
       "      <td>19964</td>\n",
       "      <td>27</td>\n",
       "      <td>19</td>\n",
       "      <td>35</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1607</th>\n",
       "      <td>199110</td>\n",
       "      <td>7</td>\n",
       "      <td>16643</td>\n",
       "      <td>11372</td>\n",
       "      <td>21914</td>\n",
       "      <td>29</td>\n",
       "      <td>20</td>\n",
       "      <td>38</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1608</th>\n",
       "      <td>199109</td>\n",
       "      <td>7</td>\n",
       "      <td>13741</td>\n",
       "      <td>8780</td>\n",
       "      <td>18702</td>\n",
       "      <td>24</td>\n",
       "      <td>15</td>\n",
       "      <td>33</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1609</th>\n",
       "      <td>199108</td>\n",
       "      <td>7</td>\n",
       "      <td>13289</td>\n",
       "      <td>8813</td>\n",
       "      <td>17765</td>\n",
       "      <td>23</td>\n",
       "      <td>15</td>\n",
       "      <td>31</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1610</th>\n",
       "      <td>199107</td>\n",
       "      <td>7</td>\n",
       "      <td>12337</td>\n",
       "      <td>8077</td>\n",
       "      <td>16597</td>\n",
       "      <td>22</td>\n",
       "      <td>15</td>\n",
       "      <td>29</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1611</th>\n",
       "      <td>199106</td>\n",
       "      <td>7</td>\n",
       "      <td>10877</td>\n",
       "      <td>7013</td>\n",
       "      <td>14741</td>\n",
       "      <td>19</td>\n",
       "      <td>12</td>\n",
       "      <td>26</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1612</th>\n",
       "      <td>199105</td>\n",
       "      <td>7</td>\n",
       "      <td>10442</td>\n",
       "      <td>6544</td>\n",
       "      <td>14340</td>\n",
       "      <td>18</td>\n",
       "      <td>11</td>\n",
       "      <td>25</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1613</th>\n",
       "      <td>199104</td>\n",
       "      <td>7</td>\n",
       "      <td>7913</td>\n",
       "      <td>4563</td>\n",
       "      <td>11263</td>\n",
       "      <td>14</td>\n",
       "      <td>8</td>\n",
       "      <td>20</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1614</th>\n",
       "      <td>199103</td>\n",
       "      <td>7</td>\n",
       "      <td>15387</td>\n",
       "      <td>10484</td>\n",
       "      <td>20290</td>\n",
       "      <td>27</td>\n",
       "      <td>18</td>\n",
       "      <td>36</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1615</th>\n",
       "      <td>199102</td>\n",
       "      <td>7</td>\n",
       "      <td>16277</td>\n",
       "      <td>11046</td>\n",
       "      <td>21508</td>\n",
       "      <td>29</td>\n",
       "      <td>20</td>\n",
       "      <td>38</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1616</th>\n",
       "      <td>199101</td>\n",
       "      <td>7</td>\n",
       "      <td>15565</td>\n",
       "      <td>10271</td>\n",
       "      <td>20859</td>\n",
       "      <td>27</td>\n",
       "      <td>18</td>\n",
       "      <td>36</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1617</th>\n",
       "      <td>199052</td>\n",
       "      <td>7</td>\n",
       "      <td>19375</td>\n",
       "      <td>13295</td>\n",
       "      <td>25455</td>\n",
       "      <td>34</td>\n",
       "      <td>23</td>\n",
       "      <td>45</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1618</th>\n",
       "      <td>199051</td>\n",
       "      <td>7</td>\n",
       "      <td>19080</td>\n",
       "      <td>13807</td>\n",
       "      <td>24353</td>\n",
       "      <td>34</td>\n",
       "      <td>25</td>\n",
       "      <td>43</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1619</th>\n",
       "      <td>199050</td>\n",
       "      <td>7</td>\n",
       "      <td>11079</td>\n",
       "      <td>6660</td>\n",
       "      <td>15498</td>\n",
       "      <td>20</td>\n",
       "      <td>12</td>\n",
       "      <td>28</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1620</th>\n",
       "      <td>199049</td>\n",
       "      <td>7</td>\n",
       "      <td>1143</td>\n",
       "      <td>0</td>\n",
       "      <td>2610</td>\n",
       "      <td>2</td>\n",
       "      <td>0</td>\n",
       "      <td>5</td>\n",
       "      <td>FR</td>\n",
       "      <td>France</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>1621 rows × 10 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "        week  indicator    inc  inc_low  inc_up  inc100  inc100_low  \\\n",
       "0     202151          7  13369     9435   17303      20          14   \n",
       "1     202150          7  14128    10312   17944      21          15   \n",
       "2     202149          7  13674    10369   16979      21          16   \n",
       "3     202148          7  11549     8503   14595      17          12   \n",
       "4     202147          7  11419     8376   14462      17          12   \n",
       "5     202146          7   8216     5724   10708      12           8   \n",
       "6     202145          7   8965     6468   11462      14          10   \n",
       "7     202144          7   8736     5636   11836      13           8   \n",
       "8     202143          7   8145     5164   11126      12           7   \n",
       "9     202142          7   9443     6037   12849      14           9   \n",
       "10    202141          7   4021     2239    5803       6           3   \n",
       "11    202140          7   4441     2454    6428       7           4   \n",
       "12    202139          7   2291     1056    3526       3           1   \n",
       "13    202138          7   4325     2267    6383       7           4   \n",
       "14    202137          7   1964      754    3174       3           1   \n",
       "15    202136          7   3441     1730    5152       5           2   \n",
       "16    202135          7   2562     1107    4017       4           2   \n",
       "17    202134          7   1429      378    2480       2           0   \n",
       "18    202133          7   3829     1830    5828       6           3   \n",
       "19    202132          7   4108     1895    6321       6           3   \n",
       "20    202131          7   4793     2301    7285       7           3   \n",
       "21    202130          7   7190     4191   10189      11           6   \n",
       "22    202129          7   6800     4109    9491      10           6   \n",
       "23    202128          7   9734        0   21731      15           0   \n",
       "24    202127          7   9026     4316   13736      14           7   \n",
       "25    202126          7   7284     4108   10460      11           6   \n",
       "26    202125          7   9351     6540   12162      14          10   \n",
       "27    202124          7  12034     8937   15131      18          13   \n",
       "28    202123          7   9116     6420   11812      14          10   \n",
       "29    202122          7   4817     2752    6882       7           4   \n",
       "...      ...        ...    ...      ...     ...     ...         ...   \n",
       "1591  199126          7  17608    11304   23912      31          20   \n",
       "1592  199125          7  16169    10700   21638      28          18   \n",
       "1593  199124          7  16171    10071   22271      28          17   \n",
       "1594  199123          7  11947     7671   16223      21          13   \n",
       "1595  199122          7  15452     9953   20951      27          17   \n",
       "1596  199121          7  14903     8975   20831      26          16   \n",
       "1597  199120          7  19053    12742   25364      34          23   \n",
       "1598  199119          7  16739    11246   22232      29          19   \n",
       "1599  199118          7  21385    13882   28888      38          25   \n",
       "1600  199117          7  13462     8877   18047      24          16   \n",
       "1601  199116          7  14857    10068   19646      26          18   \n",
       "1602  199115          7  13975     9781   18169      25          18   \n",
       "1603  199114          7  12265     7684   16846      22          14   \n",
       "1604  199113          7   9567     6041   13093      17          11   \n",
       "1605  199112          7  10864     7331   14397      19          13   \n",
       "1606  199111          7  15574    11184   19964      27          19   \n",
       "1607  199110          7  16643    11372   21914      29          20   \n",
       "1608  199109          7  13741     8780   18702      24          15   \n",
       "1609  199108          7  13289     8813   17765      23          15   \n",
       "1610  199107          7  12337     8077   16597      22          15   \n",
       "1611  199106          7  10877     7013   14741      19          12   \n",
       "1612  199105          7  10442     6544   14340      18          11   \n",
       "1613  199104          7   7913     4563   11263      14           8   \n",
       "1614  199103          7  15387    10484   20290      27          18   \n",
       "1615  199102          7  16277    11046   21508      29          20   \n",
       "1616  199101          7  15565    10271   20859      27          18   \n",
       "1617  199052          7  19375    13295   25455      34          23   \n",
       "1618  199051          7  19080    13807   24353      34          25   \n",
       "1619  199050          7  11079     6660   15498      20          12   \n",
       "1620  199049          7   1143        0    2610       2           0   \n",
       "\n",
       "      inc100_up geo_insee geo_name  \n",
       "0            26        FR   France  \n",
       "1            27        FR   France  \n",
       "2            26        FR   France  \n",
       "3            22        FR   France  \n",
       "4            22        FR   France  \n",
       "5            16        FR   France  \n",
       "6            18        FR   France  \n",
       "7            18        FR   France  \n",
       "8            17        FR   France  \n",
       "9            19        FR   France  \n",
       "10            9        FR   France  \n",
       "11           10        FR   France  \n",
       "12            5        FR   France  \n",
       "13           10        FR   France  \n",
       "14            5        FR   France  \n",
       "15            8        FR   France  \n",
       "16            6        FR   France  \n",
       "17            4        FR   France  \n",
       "18            9        FR   France  \n",
       "19            9        FR   France  \n",
       "20           11        FR   France  \n",
       "21           16        FR   France  \n",
       "22           14        FR   France  \n",
       "23           33        FR   France  \n",
       "24           21        FR   France  \n",
       "25           16        FR   France  \n",
       "26           18        FR   France  \n",
       "27           23        FR   France  \n",
       "28           18        FR   France  \n",
       "29           10        FR   France  \n",
       "...         ...       ...      ...  \n",
       "1591         42        FR   France  \n",
       "1592         38        FR   France  \n",
       "1593         39        FR   France  \n",
       "1594         29        FR   France  \n",
       "1595         37        FR   France  \n",
       "1596         36        FR   France  \n",
       "1597         45        FR   France  \n",
       "1598         39        FR   France  \n",
       "1599         51        FR   France  \n",
       "1600         32        FR   France  \n",
       "1601         34        FR   France  \n",
       "1602         32        FR   France  \n",
       "1603         30        FR   France  \n",
       "1604         23        FR   France  \n",
       "1605         25        FR   France  \n",
       "1606         35        FR   France  \n",
       "1607         38        FR   France  \n",
       "1608         33        FR   France  \n",
       "1609         31        FR   France  \n",
       "1610         29        FR   France  \n",
       "1611         26        FR   France  \n",
       "1612         25        FR   France  \n",
       "1613         20        FR   France  \n",
       "1614         36        FR   France  \n",
       "1615         38        FR   France  \n",
       "1616         36        FR   France  \n",
       "1617         45        FR   France  \n",
       "1618         43        FR   France  \n",
       "1619         28        FR   France  \n",
       "1620          5        FR   France  \n",
       "\n",
       "[1621 rows x 10 columns]"
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "raw_data = pd.read_csv(data_url, skiprows=1)\n",
    "raw_data"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Y a-t-il des points manquants dans ce jeux de données ? Oui, la semaine 19 de l'année 1989 n'a pas de valeurs associées."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>week</th>\n",
       "      <th>indicator</th>\n",
       "      <th>inc</th>\n",
       "      <th>inc_low</th>\n",
       "      <th>inc_up</th>\n",
       "      <th>inc100</th>\n",
       "      <th>inc100_low</th>\n",
       "      <th>inc100_up</th>\n",
       "      <th>geo_insee</th>\n",
       "      <th>geo_name</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "Empty DataFrame\n",
       "Columns: [week, indicator, inc, inc_low, inc_up, inc100, inc100_low, inc100_up, geo_insee, geo_name]\n",
       "Index: []"
      ]
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "raw_data[raw_data.isnull().any(axis=1)]"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Non, donc pas de ligne à éliminer."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [],
   "source": [
    "data = raw_data.copy()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Par flemme de modifier la suite du code, on défini data comme une copie de raw_data (comme ça c'est pas la même zone de mémoire). \n",
    "\n",
    "\n",
    "Nos données utilisent une convention inhabituelle: le numéro de\n",
    "semaine est collé à l'année, donnant l'impression qu'il s'agit\n",
    "de nombre entier. C'est comme ça que Pandas les interprète.\n",
    "  \n",
    "Un deuxième problème est que Pandas ne comprend pas les numéros de\n",
    "semaine.  Il faut lui fournir les dates de début et de fin de\n",
    "semaine. Nous utilisons pour cela la bibliothèque `isoweek`.\n",
    "\n",
    "Comme la conversion des semaines est devenu assez complexe, nous\n",
    "écrivons une petite fonction Python pour cela. Ensuite, nous\n",
    "l'appliquons à tous les points de nos donnés. Les résultats vont\n",
    "dans une nouvelle colonne 'period'."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [],
   "source": [
    "def convert_week(year_and_week_int):\n",
    "    year_and_week_str = str(year_and_week_int)\n",
    "    year = int(year_and_week_str[:4])\n",
    "    week = int(year_and_week_str[4:])\n",
    "    w = isoweek.Week(year, week)\n",
    "    return pd.Period(w.day(0), 'W')\n",
    "\n",
    "data['period'] = [convert_week(yw) for yw in data['week']]"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Il restent deux petites modifications à faire.\n",
    "\n",
    "Premièrement, nous définissons les périodes d'observation\n",
    "comme nouvel index de notre jeux de données. Ceci en fait\n",
    "une suite chronologique, ce qui sera pratique par la suite.\n",
    "\n",
    "Deuxièmement, nous trions les points par période, dans\n",
    "le sens chronologique."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [],
   "source": [
    "sorted_data = data.set_index('period').sort_index()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Nous vérifions la cohérence des données. Entre la fin d'une période et\n",
    "le début de la période qui suit, la différence temporelle doit être\n",
    "zéro, ou au moins très faible. Nous laissons une \"marge d'erreur\"\n",
    "d'une seconde.\n",
    "\n",
    "Ceci s'avère tout à fait juste sauf pour deux périodes consécutives\n",
    "entre lesquelles il manque une semaine.\n",
    "\n",
    "Nous reconnaissons ces dates: c'est la semaine sans observations\n",
    "que nous avions supprimées !"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "periods = sorted_data.index\n",
    "for p1, p2 in zip(periods[:-1], periods[1:]):\n",
    "    delta = p2.to_timestamp() - p1.end_time\n",
    "    if delta > pd.Timedelta('1s'):\n",
    "        print(p1, p2)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Un premier regard sur les données !"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "sorted_data['inc'].plot()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Un zoom sur les dernières années montre mieux la situation des pics en hiver. Le creux des incidences se trouve en été."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "sorted_data['inc'][-300:].plot()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Etude de l'incidence annuelle"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Etant donné que le pic de l'épidémie se situe en hiver, à cheval\n",
    "entre deux années civiles, nous définissons la période de référence\n",
    "entre deux minima de l'incidence, du 1er août de l'année $N$ au\n",
    "1er août de l'année $N+1$.\n",
    "\n",
    "Notre tâche est un peu compliquée par le fait que l'année ne comporte\n",
    "pas un nombre entier de semaines. Nous modifions donc un peu nos périodes\n",
    "de référence: à la place du 1er août de chaque année, nous utilisons le\n",
    "premier jour de la semaine qui contient le 1er août.\n",
    "\n",
    "Comme l'incidence de syndrome grippal est très faible en été, cette\n",
    "modification ne risque pas de fausser nos conclusions.\n",
    "\n",
    "Encore un petit détail: les données commencent an octobre 1984, ce qui\n",
    "rend la première année incomplète. Nous commençons donc l'analyse en 1985."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "first_september_week = [pd.Period(pd.Timestamp(y, 9, 1), 'W')\n",
    "                     for y in range(1991,\n",
    "                                    sorted_data.index[-1].year)]"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "En partant de cette liste des semaines qui contiennent un 1er septembre, nous obtenons nos intervalles d'environ un an comme les périodes entre deux semaines adjacentes dans cette liste. Nous calculons les sommes des incidences hebdomadaires pour toutes ces périodes.\n",
    "\n",
    "On commence en 1991 car c'est la première année complète.\n",
    "\n",
    "Nous vérifions également que ces périodes contiennent entre 51 et 52 semaines, pour nous protéger contre des éventuelles erreurs dans notre code."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "year = []\n",
    "yearly_incidence = []\n",
    "for week1, week2 in zip(first_september_week[:-1],\n",
    "                        first_september_week[1:]):\n",
    "    one_year = sorted_data['inc'][week1:week2-1]\n",
    "    assert abs(len(one_year)-52) < 2\n",
    "    yearly_incidence.append(one_year.sum())\n",
    "    year.append(week2.year)\n",
    "yearly_incidence = pd.Series(data=yearly_incidence, index=year)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Voici les incidences annuelles."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "yearly_incidence.plot(style='*')"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Une liste triée permet de plus facilement répérer les valeurs les plus élevées (à la fin)."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "yearly_incidence.sort_values()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Enfin, un histogramme montre bien que les épidémies fortes, qui touchent environ 10% de la population\n",
    "  française, sont assez rares: il y en eu trois au cours des 35 dernières années."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "yearly_incidence.hist(xrot=20)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.4"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}