- Trouvez un bon équilibre pour la partie journal : pas trop long -> perte de temps, pas trop court -> il faut que ça puisse être utile/réutilisable dans le futur.
- Trouvez un bon équilibre pour la partie journal : pas trop long -> perte de temps, pas trop court -> il faut que ça puisse être utile/réutilisable dans le futur.
- Exemple de compte rendu d'activité.
- Exemple de compte rendu d'activité.
* Module 3 : La main à la pâte, une analyse réplicable
** 1. Une analyse réplicable, c'est quoi ?
- Dans le cas d'une analyse traditionnelle, on se focalise sur les résultats obtenus. On présente brièvement la méthodologie adoptée, qui a permis d'obtenir les résultats. Puis l'on fini avec une discussion sur les résultats.
- En constraste, une analyse de donnés répblicable remplace la présentation de la méthodologie par la totatlité du code qui a permis d'obtenir ces résultats, accompagnée d'une explication sur les différents choix effectuées.
- Pourquoi faire une analyse répblicable : facile à refaire si les données changent, facile à modifier, facile à inspecter et vérifier.
** 2. Étude de cas : l'incidence de syndromes grippaux
- Utilisation du site Sentinelles afin d'utiliser des données médicales.
- Année et semaine en format ISO : la première semaine c'est la semaine qui contient le 4 janvier.
- Aucune modification des données brutes à la main, cela rend l'analyse non replicable. Toutes les modification doivent se faire dans du code.
- Format des dates ISO 8601, il y a deux façons différentes de représenter une date, considérons le 8 août 2018 :
1. 2018-08-08 : année, mois, jour du mois
2. 2018-W32-3 : année, semaine et jour de la semaine (mercredi = 3ème jour). La première semaine de l'année est celle qui contient le premier jeudi de l'année.
** 3. Importer les données avec OrgMode / Python+R
- Il faut spécifier l'url de téléchargement dans le document computationel. Avec la "commande" =#+NAME:= on peut attribuer un nom à l'url et la passer dans le code par la suite.
- Petit script qui permet de télécharger les données en utilisant l'url.
- Les données doivent être directement traitées depuis la source sans intervention manuelle.