diff --git a/journal/Readme.html b/journal/Readme.html new file mode 100644 index 0000000000000000000000000000000000000000..208fc07c00d1ea6586d4dae8386174cd6fb0f7eb --- /dev/null +++ b/journal/Readme.html @@ -0,0 +1,377 @@ + + + + +
+ + + + + + + + +Test MODIF 26/08/24
+FR
+Espace réservé au journal de bord du Mooc ## Module 1 : cahier de notes, cahier de laboratoire
+(base) C:\Users\gwdumont>conda activate mooc-rr-rstudio
+(mooc-rr-rstudio) C:\Users\gwdumont>rstudio
+Les moteurs de recherche de bureau comme :
+la remise en cause fait partie du processus scientifique
+Cas de pb de reproductibilité : manque de rigueur et la transparence
+Objectifs méthodologiques Garder trace afin de : - Inspecter : justifier/comprendre - Refaire : vérifier/corriger/réutiliser
+Dans un document computationnel, on trouve 1. Des commentaires 2. Du code 3. Un aperçu des données 4. Les résultats de calculs 5. Des liens hypertextes 6. Des images
+Un document computationnel permet de
+Production et partage du document final - Knit - pdf, LaTex - html - word/office - Possibilité de faire du LaTex (R Sweave : Rnw) ou du html (R html : Rhtml) directement pour avoir un contrôle parfait. - Partage à peu de frais via rpubs
+TinyTex Yihui Xie, auteur du remarquable package R “bookdown”, a mis au point une version allégée de LaTeX, TinyTex (“A lightweight, cross-platform, portable, and easy-to-maintain LaTeX distribution based on TeX Live”).
+ + +Documentation de la bibliothèque parsedate
+Etude de cas : incidence des syndromes grippaux
+Le site Web du Réseau Sentinelles que nous utilisons dans ce module a subi des modifications importantes après le tournage des vidéos. L’accès aux données ne se passe plus comme montré. Il faut passer par les menus “Surveillance continue” - “Base de données” - “Accès aux données” et cliquer sur l’onglet “Télécharger”, puis choisir les données au format CSV pour la France Métropolitaine. Le format des données téléchargées a aussi légèrement changé, il faut adapter le traitement des données manquantes. Le code que nous montrons dans les vidéos ne fonctionne plus avec les données d’aujourd’hui. Une version mise à jour est disponible ici.
+Attention
+aucune modification de données à la main (la suppression d’une ligne car aucune donnée pourrait passer pour une tentative de fraude)
lire les données à la source
faire attention aux données manquantes : R gère les données manquantes presque automatiquement, c’est seulement lors de la sommation sur une année que nous devons explicitement demander qu’elles soient ignorées. Le format ISO pour les dates : La norme ISO 8601 Le Réseau Sentinelles reprend cette définition du numéro de semaine, mais ne respecte pas la représentation précise prévue par la norme ISO 8601. Au lieu d’écrire la troisième semaine de 1995 comme 1995-W03, il écrit 199503.
pré-traitement des données pour les adapter aux conventions des logiciels : R ne peut pas interpréter le format des données d’origine
inspection visuelle et du code spécifiquement écrit pour la vérification
l’intérêt de la vérifier que la distance entre deux semaines consécutives est de 7 jours est de :
+de mettre en évidence des semaines complètement absentes du jeu de données
de pouvoir identifier une erreur dans la conversion des dates
une analyse réplicable doit contenir toutes les étapes de traitements de données sous forme exécutable
il faut expliquer tous les choix qui peuvent influencer les résultats
il faut exposer des détails techniques, l’accès aux erreurs est nécessaire pour vérification par d’autres lecteurs
EN
+Reserved for the Mooc’s logbook
+