From c8c7c4e6e9a4cb6445ecb32046fc98e253480806 Mon Sep 17 00:00:00 2001 From: 75995e7ce7125775069ce77a503c68c2 <75995e7ce7125775069ce77a503c68c2@app-learninglab.inria.fr> Date: Fri, 12 Feb 2021 17:56:26 +0000 Subject: [PATCH] Beginning of module 2 --- journal/logbook_elhomsy.md | 43 +++++++++++++++++++++++++++++++------- 1 file changed, 35 insertions(+), 8 deletions(-) diff --git a/journal/logbook_elhomsy.md b/journal/logbook_elhomsy.md index 86cd653..fa9c020 100644 --- a/journal/logbook_elhomsy.md +++ b/journal/logbook_elhomsy.md @@ -4,7 +4,7 @@ Journal de bord MOOC RR - Victor Elhomsy # Module 1 : cahier de notes, cahier de laboratoire -## Introduction +## 0. Introduction - Objectifs : - Importance de la traçabilité @@ -14,12 +14,12 @@ Journal de bord MOOC RR - Victor Elhomsy - Prise de notes : Nécessité, historique, outils info (langage de balisage léger), gestion de version (gitlab), étiquettes et indexation - Cahier de notes : infos rangées par chronologie -## Nous utilisons tous des cahiers de notes +## 1. Nous utilisons tous des cahiers de notes - Imposer une structure à nos notes après coup ? - Indexer les notes ? - Les rendre pérennes tout en les faisant évoluer ? -## Aperçu historique de la prise de notes +## 2. Aperçu historique de la prise de notes - Aspect concret : "matérialité" - Aspect organisationnel - Lien entre les deux @@ -27,7 +27,7 @@ Journal de bord MOOC RR - Victor Elhomsy -> Vision occidentale de toutes ces notions (données de sautres civilisations peu disponibles) -> Support numérique : flexibilité, (ré)organisation, structuration, outils d'archivage/indexation -## Du fichier texte au langage de balisage léger +## 3. Du fichier texte au langage de balisage léger - Editeur de texte sous Windows : Notepad++ (libre) - "Traitement de texte" : donne des fichiers non lisibles par un éditeur de texte (.pdf) - Fichiers texte : souvent codés en __UTF-8__ : toujours possible de les lire plus tard, et exploité par les logiciels d'indexation et de gestion de version MAIS pas d'hyperlien et de mise en forme @@ -36,7 +36,7 @@ Journal de bord MOOC RR - Victor Elhomsy - Début des fichiers non textes (ex: pdf) contient du texte : métadonnées, souvent au format XMP - TEI : rend intelligentes les données textuelles par du balisage fort -## Pérennité et évolutivité des notes avec la gestion de version (Gitlab) +## 4. Pérennité et évolutivité des notes avec la gestion de version (Gitlab) - Evolutivité : corriger nos notes, tout en suivant ces corrections - Pérennité : multiplier les copies (numériques) - Pb de corriger en traitement de texte : pas de fichier texte en sortie + sauvegarde séparée de la gestion de versions @@ -55,9 +55,36 @@ Journal de bord MOOC RR - Victor Elhomsy - GitHub : visibilité, grosse commu MAIS pas propriétaire (lois ?) - GitLab : confidentialité pour l'entreprise - Interfaces graphiques : - - Au jour le jour : interfaces qui vont avec notre environnement de travail (JupyterLab pour Python) -> Extensions pour interagir avec Git + - Au jour le jour : interfaces qui vont avec notre environnement de travail (JupyterLab pour Python 3) -> Extensions pour interagir avec Git - Fonctionnalités plus avancées (branches, merge, ...) : GitHub Desktop par ex -## Etiquettes et logiciels d'indexation pour s'y retrouver +## 5. Etiquettes et logiciels d'indexation pour s'y retrouver - Abondance de résultat -> Etiquettes (MarkDown) pour associer un contexte aux mots -- Exiftool : afficher des métadonnées de fichiers non texte + afficher des commentaires/étiquettes que l'on peut rechercher \ No newline at end of file +- Exiftool : afficher des métadonnées de fichiers non texte + afficher des commentaires/étiquettes que l'on peut rechercher + + +12/02/2021 : début module 2 +# Module 2 : La vitrine et l'envers du décors : le document computationnel + +## 0. Introduction +- Objectifs : + - Extension de la traçabilité aux calculs et à ses résultats + - Intégration code/résultats dans rapport technique/article scientifique + - 3 outils pour écrire un document computationnel +- Emacs/Org-mode : puissant sous Linux ou Mac, utile pour combiner plusieurs langages + +## 1. Exemples récents d'études assez discutées +- Economie : erreurs de calcul, traitement de données douteux (exclusion, pondération), statistiques non conventionnelles, calculs font peu de sens => Austérité décidée comme nécessité pendant 3 ans par les politiques +-> Non publication des procédures de calcul et des données + manque de pression médiatique +- IRM : données bruitées, procédure mal calibrée (faiblesses méthodologiques). Données très volumineuses -> Pas archivées. Méhtodes statistiques à améliorer +- Cristallographie : "erreur de programmation" +- __Dans la plupart des controverses : manque de rigueur ET de transparence__ => Blocage de la communauté dans un état erroné + +## 2. Pourquoi est-ce difficile ? +- Manque d'information : sources et données, choix (protocoles, hypothèses, données écartées, ...) -> __Cahier de labo__ +- Ordinateur, erreurs de calcul : trop simple d'utilisation, tableurs (programmation, manipulaation de données), pile logicielle (boite noire), bugs +- Manque de rigueur et d'organisation : backup, historique, contrôle qualité +- Dimension culturelle et sociale : personne n'exige/n'inspecte les données et les choix, cacher les faiblesses +- Volonté d'éviter les outils propriétaires + +## 3. Le document computationnel : principe -- 2.18.1