From 0a1c7193a48c8305686e5924b89a71900d57a59f Mon Sep 17 00:00:00 2001 From: MigAP Date: Thu, 29 Oct 2020 14:33:20 +0100 Subject: [PATCH] notes about the third module --- journal/journal.org | 20 +++++++++++++++++++- 1 file changed, 19 insertions(+), 1 deletion(-) diff --git a/journal/journal.org b/journal/journal.org index dc1f6bb..00f51c5 100644 --- a/journal/journal.org +++ b/journal/journal.org @@ -97,4 +97,22 @@ - Trouvez un bon équilibre pour la partie journal : pas trop long -> perte de temps, pas trop court -> il faut que ça puisse être utile/réutilisable dans le futur. - Exemple de compte rendu d'activité. - +* Module 3 : La main à la pâte, une analyse réplicable + +** 1. Une analyse réplicable, c'est quoi ? +- Dans le cas d'une analyse traditionnelle, on se focalise sur les résultats obtenus. On présente brièvement la méthodologie adoptée, qui a permis d'obtenir les résultats. Puis l'on fini avec une discussion sur les résultats. +- En constraste, une analyse de donnés répblicable remplace la présentation de la méthodologie par la totatlité du code qui a permis d'obtenir ces résultats, accompagnée d'une explication sur les différents choix effectuées. +- Pourquoi faire une analyse répblicable : facile à refaire si les données changent, facile à modifier, facile à inspecter et vérifier. + +** 2. Étude de cas : l'incidence de syndromes grippaux +- Utilisation du site Sentinelles afin d'utiliser des données médicales. +- Année et semaine en format ISO : la première semaine c'est la semaine qui contient le 4 janvier. +- Aucune modification des données brutes à la main, cela rend l'analyse non replicable. Toutes les modification doivent se faire dans du code. +- Format des dates ISO 8601, il y a deux façons différentes de représenter une date, considérons le 8 août 2018 : + 1. 2018-08-08 : année, mois, jour du mois + 2. 2018-W32-3 : année, semaine et jour de la semaine (mercredi = 3ème jour). La première semaine de l'année est celle qui contient le premier jeudi de l'année. + +** 3. Importer les données avec OrgMode / Python+R +- Il faut spécifier l'url de téléchargement dans le document computationel. Avec la "commande" =#+NAME:= on peut attribuer un nom à l'url et la passer dans le code par la suite. +- Petit script qui permet de télécharger les données en utilisant l'url. +- Les données doivent être directement traitées depuis la source sans intervention manuelle. -- 2.18.1