{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "## The incidence of chickenpox in France (2016-2024)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "The data on the incidence of chickenpox-like illness are available from the Web site of the [Réseau Sentinelles](http://www.sentiweb.fr/). We download them as a file in CSV format, in which each line corresponds to a week in the observation period. The dataset used is starting in 2016 and ends with 2024." ] }, { "cell_type": "code", "execution_count": 25, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Requirement already satisfied: isoweek in /opt/conda/lib/python3.6/site-packages (1.3.3)\r\n" ] } ], "source": [ "!pip install isoweek" ] }, { "cell_type": "code", "execution_count": 26, "metadata": {}, "outputs": [], "source": [ "%matplotlib inline\n", "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "import os\n", "from isoweek import Week\n", "from datetime import datetime, timedelta" ] }, { "cell_type": "code", "execution_count": 27, "metadata": {}, "outputs": [], "source": [ "data_url = \"https://www.sentiweb.fr/datasets/all/inc-7-RDD-ds2.csv\"\n", "filename = \"inc-7-PAY-ds2.csv\"" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "1. Download -> if there is not a local file already" ] }, { "cell_type": "code", "execution_count": 28, "metadata": {}, "outputs": [], "source": [ "if not os.path.exists(filename):\n", " raw_data = pd.read_csv(data_url, skiprows=1)\n", "else:\n", " raw_data = pd.read_csv(filename)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "2. Remove rows with missing values" ] }, { "cell_type": "code", "execution_count": 30, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
| \n", " | week | \n", "geo_insee | \n", "indicator | \n", "inc | \n", "inc100 | \n", "inc_up | \n", "inc_low | \n", "inc100_up | \n", "inc100_low | \n", "
|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "201601 | \n", "44 | \n", "7 | \n", "574 | \n", "10 | \n", "861 | \n", "287 | \n", "15 | \n", "5 | \n", "
| 1 | \n", "201601 | \n", "75 | \n", "7 | \n", "1513 | \n", "25 | \n", "2099 | \n", "927 | \n", "35 | \n", "15 | \n", "
| 2 | \n", "201601 | \n", "84 | \n", "7 | \n", "2363 | \n", "30 | \n", "2958 | \n", "1768 | \n", "37 | \n", "22 | \n", "
| 3 | \n", "201601 | \n", "27 | \n", "7 | \n", "686 | \n", "24 | \n", "1058 | \n", "314 | \n", "36 | \n", "11 | \n", "
| 4 | \n", "201601 | \n", "53 | \n", "7 | \n", "532 | \n", "16 | \n", "874 | \n", "190 | \n", "26 | \n", "6 | \n", "
| 5 | \n", "201601 | \n", "24 | \n", "7 | \n", "394 | \n", "15 | \n", "625 | \n", "163 | \n", "24 | \n", "6 | \n", "
| 6 | \n", "201601 | \n", "94 | \n", "7 | \n", "38 | \n", "12 | \n", "82 | \n", "0 | \n", "25 | \n", "0 | \n", "
| 7 | \n", "201601 | \n", "11 | \n", "7 | \n", "3030 | \n", "25 | \n", "3788 | \n", "2272 | \n", "31 | \n", "19 | \n", "
| 8 | \n", "201601 | \n", "76 | \n", "7 | \n", "842 | \n", "14 | \n", "1307 | \n", "377 | \n", "22 | \n", "6 | \n", "
| 9 | \n", "201601 | \n", "32 | \n", "7 | \n", "2100 | \n", "34 | \n", "2711 | \n", "1489 | \n", "44 | \n", "24 | \n", "
| 10 | \n", "201601 | \n", "28 | \n", "7 | \n", "418 | \n", "12 | \n", "687 | \n", "149 | \n", "20 | \n", "4 | \n", "
| 11 | \n", "201601 | \n", "52 | \n", "7 | \n", "1029 | \n", "27 | \n", "1577 | \n", "481 | \n", "42 | \n", "13 | \n", "
| 12 | \n", "201601 | \n", "93 | \n", "7 | \n", "1053 | \n", "21 | \n", "1457 | \n", "649 | \n", "29 | \n", "13 | \n", "
| 13 | \n", "201602 | \n", "44 | \n", "7 | \n", "772 | \n", "14 | \n", "1122 | \n", "422 | \n", "20 | \n", "7 | \n", "
| 14 | \n", "201602 | \n", "75 | \n", "7 | \n", "657 | \n", "11 | \n", "1016 | \n", "298 | \n", "17 | \n", "5 | \n", "
| 15 | \n", "201602 | \n", "84 | \n", "7 | \n", "1486 | \n", "19 | \n", "1928 | \n", "1044 | \n", "24 | \n", "13 | \n", "
| 16 | \n", "201602 | \n", "27 | \n", "7 | \n", "442 | \n", "15 | \n", "727 | \n", "157 | \n", "25 | \n", "5 | \n", "
| 17 | \n", "201602 | \n", "53 | \n", "7 | \n", "444 | \n", "13 | \n", "744 | \n", "144 | \n", "22 | \n", "4 | \n", "
| 18 | \n", "201602 | \n", "24 | \n", "7 | \n", "402 | \n", "15 | \n", "627 | \n", "177 | \n", "24 | \n", "7 | \n", "
| 19 | \n", "201602 | \n", "94 | \n", "7 | \n", "12 | \n", "4 | \n", "42 | \n", "0 | \n", "13 | \n", "0 | \n", "
| 20 | \n", "201602 | \n", "11 | \n", "7 | \n", "1745 | \n", "14 | \n", "2317 | \n", "1173 | \n", "19 | \n", "10 | \n", "
| 21 | \n", "201602 | \n", "76 | \n", "7 | \n", "1101 | \n", "19 | \n", "1644 | \n", "558 | \n", "28 | \n", "10 | \n", "
| 22 | \n", "201602 | \n", "32 | \n", "7 | \n", "1249 | \n", "20 | \n", "1720 | \n", "778 | \n", "28 | \n", "13 | \n", "
| 23 | \n", "201602 | \n", "28 | \n", "7 | \n", "1064 | \n", "31 | \n", "1519 | \n", "609 | \n", "44 | \n", "18 | \n", "
| 24 | \n", "201602 | \n", "52 | \n", "7 | \n", "408 | \n", "11 | \n", "708 | \n", "108 | \n", "19 | \n", "3 | \n", "
| 25 | \n", "201602 | \n", "93 | \n", "7 | \n", "1570 | \n", "31 | \n", "2099 | \n", "1041 | \n", "42 | \n", "21 | \n", "
| 26 | \n", "201603 | \n", "44 | \n", "7 | \n", "985 | \n", "17 | \n", "1442 | \n", "528 | \n", "25 | \n", "9 | \n", "
| 27 | \n", "201603 | \n", "75 | \n", "7 | \n", "2070 | \n", "34 | \n", "2769 | \n", "1371 | \n", "46 | \n", "23 | \n", "
| 28 | \n", "201603 | \n", "84 | \n", "7 | \n", "2258 | \n", "28 | \n", "2810 | \n", "1706 | \n", "35 | \n", "21 | \n", "
| 29 | \n", "201603 | \n", "27 | \n", "7 | \n", "1009 | \n", "35 | \n", "1538 | \n", "480 | \n", "53 | \n", "17 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 6379 | \n", "202522 | \n", "32 | \n", "7 | \n", "30 | \n", "0 | \n", "195 | \n", "0 | \n", "3 | \n", "0 | \n", "
| 6380 | \n", "202522 | \n", "28 | \n", "7 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
| 6381 | \n", "202522 | \n", "52 | \n", "7 | \n", "198 | \n", "5 | \n", "528 | \n", "0 | \n", "13 | \n", "0 | \n", "
| 6382 | \n", "202522 | \n", "93 | \n", "7 | \n", "1254 | \n", "24 | \n", "3098 | \n", "0 | \n", "59 | \n", "0 | \n", "
| 6383 | \n", "202523 | \n", "44 | \n", "7 | \n", "413 | \n", "7 | \n", "1090 | \n", "0 | \n", "19 | \n", "0 | \n", "
| 6384 | \n", "202523 | \n", "75 | \n", "7 | \n", "442 | \n", "7 | \n", "1117 | \n", "0 | \n", "18 | \n", "0 | \n", "
| 6385 | \n", "202523 | \n", "84 | \n", "7 | \n", "1148 | \n", "14 | \n", "2156 | \n", "140 | \n", "26 | \n", "2 | \n", "
| 6386 | \n", "202523 | \n", "27 | \n", "7 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
| 6387 | \n", "202523 | \n", "53 | \n", "7 | \n", "143 | \n", "4 | \n", "394 | \n", "0 | \n", "11 | \n", "0 | \n", "
| 6388 | \n", "202523 | \n", "24 | \n", "7 | \n", "272 | \n", "10 | \n", "667 | \n", "0 | \n", "25 | \n", "0 | \n", "
| 6389 | \n", "202523 | \n", "94 | \n", "7 | \n", "37 | \n", "10 | \n", "104 | \n", "0 | \n", "29 | \n", "0 | \n", "
| 6390 | \n", "202523 | \n", "11 | \n", "7 | \n", "905 | \n", "7 | \n", "1763 | \n", "47 | \n", "14 | \n", "0 | \n", "
| 6391 | \n", "202523 | \n", "76 | \n", "7 | \n", "75 | \n", "1 | \n", "435 | \n", "0 | \n", "7 | \n", "0 | \n", "
| 6392 | \n", "202523 | \n", "32 | \n", "7 | \n", "527 | \n", "9 | \n", "1226 | \n", "0 | \n", "20 | \n", "0 | \n", "
| 6393 | \n", "202523 | \n", "28 | \n", "7 | \n", "108 | \n", "3 | \n", "321 | \n", "0 | \n", "9 | \n", "0 | \n", "
| 6394 | \n", "202523 | \n", "52 | \n", "7 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
| 6395 | \n", "202523 | \n", "93 | \n", "7 | \n", "336 | \n", "6 | \n", "1130 | \n", "0 | \n", "22 | \n", "0 | \n", "
| 6396 | \n", "202524 | \n", "44 | \n", "7 | \n", "196 | \n", "3 | \n", "741 | \n", "0 | \n", "13 | \n", "0 | \n", "
| 6397 | \n", "202524 | \n", "75 | \n", "7 | \n", "144 | \n", "2 | \n", "516 | \n", "0 | \n", "8 | \n", "0 | \n", "
| 6398 | \n", "202524 | \n", "84 | \n", "7 | \n", "824 | \n", "10 | \n", "1745 | \n", "0 | \n", "21 | \n", "0 | \n", "
| 6399 | \n", "202524 | \n", "27 | \n", "7 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
| 6400 | \n", "202524 | \n", "53 | \n", "7 | \n", "164 | \n", "5 | \n", "430 | \n", "0 | \n", "12 | \n", "0 | \n", "
| 6401 | \n", "202524 | \n", "24 | \n", "7 | \n", "710 | \n", "27 | \n", "1423 | \n", "0 | \n", "54 | \n", "0 | \n", "
| 6402 | \n", "202524 | \n", "94 | \n", "7 | \n", "28 | \n", "8 | \n", "94 | \n", "0 | \n", "26 | \n", "0 | \n", "
| 6403 | \n", "202524 | \n", "11 | \n", "7 | \n", "913 | \n", "7 | \n", "1946 | \n", "0 | \n", "16 | \n", "0 | \n", "
| 6404 | \n", "202524 | \n", "76 | \n", "7 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
| 6405 | \n", "202524 | \n", "32 | \n", "7 | \n", "146 | \n", "2 | \n", "507 | \n", "0 | \n", "8 | \n", "0 | \n", "
| 6406 | \n", "202524 | \n", "28 | \n", "7 | \n", "140 | \n", "4 | \n", "441 | \n", "0 | \n", "13 | \n", "0 | \n", "
| 6407 | \n", "202524 | \n", "52 | \n", "7 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
| 6408 | \n", "202524 | \n", "93 | \n", "7 | \n", "319 | \n", "6 | \n", "995 | \n", "0 | \n", "19 | \n", "0 | \n", "
6409 rows × 9 columns
\n", "