# Journal ## Introduction ### Méthode qualitative Un *code* (<=> 1 jupyter notebook) d'un **CodeBook** suit la structure ci-dessous : 1. Initial Code Source - litt - theory - quantitative date - sumarry of themes 2. Initial Code Developement - pre-traitements 3. Codebook Developement - code label - descr code label - defs - qual + ex + context 4. Codebook Application - application sur un petit jeu de données - review, txt - application sur dataset 5. Interprétation (Conclusion Il permet de recenser tous les codes appliqués ainsi que les choix et évolutions **Liste des Rubriques** : - intitulé de code - descr des finalitées - critères d'inclusion (sur quelles données on l'utilise) - critères d'exclusion (sur quelles données on ne peut pas l'utiliser) - exemples typique (Cas d'Utilisation - CU :: trivial) - exemples atypique (là où le code est nécessaire) - "close, but no" (cas où l'on serait tenté de l'utiliser mais il ne faut pas) ## Module 1 - Cahier de notes, Cahier de labo ### Cahier de notes #### Généralités Dans *cahier de note / feuille de note*: - identifier la note par date + numéro - réorganiser les notes à la fin de la prise de note Dans *cahier de manip* : - noter les paramètres - noter les résultats Sur pc c'est mieux car on peut faire de la collaboration au travers du partage de fichier et du versioning *Pb de struct?* - indexation - organisation #### Méthode d'indexation Méthode utilisée par *John Locke* pour indexer ces fiches On note les entrées (mots-clefs) en mettant la première lettre du mot suivi de sa première voyelle et en notant le numéro de la page correspondant: - analyse : AA - code : CO - experience : EE ``` A A 127, 38, 24 E I/Y O U B A E I/Y O U ... Z A E I/Y O U ``` #### Structure du document Combiner la *légèreté des fichiers textes* et le *confort de lecture du balisage* ==> Markdown / Pandoc Tutoriel : [https://enacit1.epfl.ch/markdown-pandoc](https://enacit1.epfl.ch/markdown-pandoc) #### Pérennité et évolution des notes Solutions facile à mettre en oeuvre : - ggdoc - docu wiki Solutions un peu plus complexes mais plus puissante : - gitlab - ## Module 2 - Le document computationel Objs : - tracabilité des calculs et résultats - code + résultats dans un doc scientifique - 3 outils possibles : Jupyter / RStudio / Emacs&Org-mode **Rigeur** et **transparence** nécessaire pour permettre la reproductibilitée ### Difficultés cause technique sur la difficulté de la reproductibilité : - sources et données (non disponibles) - choix (sur les données) - ordinateur = sources d'erreurs - tableur - pile logicielle complexe (logiciel proprio) - bug - manque rigeur et organisation - non backup - non histo - pas controle de qual - dimension culturelle et saines - (article : version simplifié du proto) craintes : - on montre nos faiblesses - qqun peut trouver une erreur - qqun peut en tirer avantage - LEGITIMES : données sensibles / ressources limitées solutions : - format texte et non proprio ==> formats textes : markdown, orgmode, csv, hdf5, ... - logiciel et langage libre ==> scilab, R, python - stockage data ==> famadrop, gitlab, github ### Document computionnel On veut la plus grande transparence possible **Chaines de traitement** 1. Données 2. Analyses visualisation (-->1) 3. Publications **Buts** - *inspecter* : justifier/comprendre - *refaire* : vérifier/corriger/réutiliser Jupyter : Code + Texte + Resultats (export en pdf) **Principes** - 1 doc : explication, code, results - session (on garde les vars) - export (pdf + control export)