"raw_data['period'] = [convert_week(yw) for yw in raw_data['week']]"
"raw_data['period'] = [convert_week(yw) for yw in raw_data['week']]"
]
]
},
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Il restent deux petites modifications à faire.\n",
"Premièrement, nous définissons les périodes d'observation comme nouvel index de notre jeux de données. Ceci en fait une suite chronologique, ce qui sera pratique par la suite.\n",
"Deuxièmement, nous trions les points par période, dans le sens chronologique."
]
},
{
"cell_type": "code",
"execution_count": 25,
"metadata": {},
"outputs": [],
"source": [
"periods = sorted_raw_data.index\n",
"for p1, p2 in zip(periods[:-1], periods[1:]):\n",
" delta = p2.to_timestamp() - p1.end_time\n",
" if delta > pd.Timedelta('1s'):\n",
" print(p1, p2)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Les donnees sont propres.On regarde les donnees"
]
},
{
"cell_type": "code",
"execution_count": 27,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"<matplotlib.axes._subplots.AxesSubplot at 0x7f9afb936828>"
"Etant donné que le pic de l'épidémie se situe en hiver, à cheval entre deux années civiles, nous définissons la période de référence entre deux minima de l'incidence, du 1er septembre de l'année $N$ au 1er septembre de l'année $N+1$.\n",
"Notre tâche est un peu compliquée par le fait que l'année ne comporte pas un nombre entier de semaines. Nous modifions donc un peu nos périodes de référence: à la place du 1er août de chaque année, nous utilisons le premier jour de la semaine qui contient le 1er août.\n",
"Comme l'incidence de syndrome grippal est très faible en été, cette modification ne risque pas de fausser nos conclusions.\n",
"Encore un petit détail: les données commencent an septembre 1991, ce qui rend la première année incomplète. Nous commençons donc l'analyse en 1991."
]
},
{
"cell_type": "code",
"execution_count": 30,
"metadata": {},
"outputs": [
{
"ename": "SyntaxError",
"evalue": "invalid syntax (<ipython-input-30-05d5f1bf4866>, line 3)",
"output_type": "error",
"traceback": [
"\u001b[0;36m File \u001b[0;32m\"<ipython-input-30-05d5f1bf4866>\"\u001b[0;36m, line \u001b[0;32m3\u001b[0m\n\u001b[0;31m sorted_raw_data.index[-1].year)]\u001b[0m\n\u001b[0m ^\u001b[0m\n\u001b[0;31mSyntaxError\u001b[0m\u001b[0;31m:\u001b[0m invalid syntax\n"