diff --git a/journal/journal.org b/journal/journal.org index dc1f6bb0d098c386b56d54b7f75f51acbd9fce86..00f51c5871d3660f00645e3579fab30434a6e954 100644 --- a/journal/journal.org +++ b/journal/journal.org @@ -97,4 +97,22 @@ - Trouvez un bon équilibre pour la partie journal : pas trop long -> perte de temps, pas trop court -> il faut que ça puisse être utile/réutilisable dans le futur. - Exemple de compte rendu d'activité. - +* Module 3 : La main à la pâte, une analyse réplicable + +** 1. Une analyse réplicable, c'est quoi ? +- Dans le cas d'une analyse traditionnelle, on se focalise sur les résultats obtenus. On présente brièvement la méthodologie adoptée, qui a permis d'obtenir les résultats. Puis l'on fini avec une discussion sur les résultats. +- En constraste, une analyse de donnés répblicable remplace la présentation de la méthodologie par la totatlité du code qui a permis d'obtenir ces résultats, accompagnée d'une explication sur les différents choix effectuées. +- Pourquoi faire une analyse répblicable : facile à refaire si les données changent, facile à modifier, facile à inspecter et vérifier. + +** 2. Étude de cas : l'incidence de syndromes grippaux +- Utilisation du site Sentinelles afin d'utiliser des données médicales. +- Année et semaine en format ISO : la première semaine c'est la semaine qui contient le 4 janvier. +- Aucune modification des données brutes à la main, cela rend l'analyse non replicable. Toutes les modification doivent se faire dans du code. +- Format des dates ISO 8601, il y a deux façons différentes de représenter une date, considérons le 8 août 2018 : + 1. 2018-08-08 : année, mois, jour du mois + 2. 2018-W32-3 : année, semaine et jour de la semaine (mercredi = 3ème jour). La première semaine de l'année est celle qui contient le premier jeudi de l'année. + +** 3. Importer les données avec OrgMode / Python+R +- Il faut spécifier l'url de téléchargement dans le document computationel. Avec la "commande" =#+NAME:= on peut attribuer un nom à l'url et la passer dans le code par la suite. +- Petit script qui permet de télécharger les données en utilisant l'url. +- Les données doivent être directement traitées depuis la source sans intervention manuelle.