# Journal de bord du Mooc / Mooc's logbook FR Espace réservé au journal de bord du Mooc EN Reserved for the Mooc's logbook # Mooc Reproductible research - UL *Ce journal est rédigé dans le cadre du MOOC Reproductible research* ## Notes du 03/06 ### Module 1.3 L'introduction au Markdown peut être retrouvés sur ces différents sites : - [Github Docs](https://docs.github.com/en/get-started/writing-on-github/getting-started-with-writing-and-formatting-on-github/basic-writing-and-formatting-syntax) - [Archer Reilly](http://csrgxtu.github.io/2015/03/20/Writing-Mathematic-Fomulars-in-Markdown/) Les différents caractères UTF-8 et leurs codes sont retrouvés sur le site [officiel](http://www.utf8-chartable.de/). Une version allegée de LaTeX esxite : [TinyTex](https://yihui.name/tinytex/) ## Notes du 07/06 ### Module 1.4 On peut faire du versioning et accéder à l'histoire des modifications avec certains logiciels. Le dépot github est une version complète de ce que peut apporter le versioning. On peut donc corriger plusieurs fichiers en même temps, ce qui n'est pas le cas de tous les logiciels (DocuWiki) Git : complexe et puissant. ### Module 1.5 Leibniz : ordonner les informations et les retrouver. Techniques pour indexer tous les types de fichiers numériques ? Motur de recherche de bureau : DocFetcher (facile et fonctionne bien) Il faut utiliser des étiquettes pour retrouver par mots clés. ### Exercices module 1 #### Ex01-1 * Recherche Gitlab : module1/exo1/aebef6b0a5.txt ; module1/exo1/f683bbad4b.txt * Historique GitLab : 505c4e26 ; Arnaud Legrand ### Module 2.1 & 2.2 Il faut avoir de la transparence. Il faut bien justifier ses choix, mettre à disposition ses données et avoir de la rigueur. Il existe beaucoup d'erreurs de calculs et des erreurs statistiques. ### Module 2.3 Il faut garder une trace pour inspecter (justifier et reprendre) puis refaire si besoin. Document computationnel : format dynamique. La console reste vivant tout du long de l'édition. Ce document peut ensuite être exporté dans le format désiré. Chaque zone pourra être masqué ou non. ### Module 2.4 (Jupyter) [Astuces et tips Jupyter](https://www.dataquest.io/blog/jupyter-notebook-tips-tricks-shortcuts/). Il faut tout de même faire attention aux mises à jour du logiciel qui rendent les différentes sources potentiellement obselètes. * Création notebook : File/Open depuis le menu. New-> Notebook: Python3 ; File -> Rename * Import notebook : synchroniser la copie de son jupyter bouton Git pull puis menu FIle -> open. Notebook d'une autre personne : téléchargement sur le répertoir. Open raw () sauvegarder le contenu en JSON. Gestionnaire fichiers Jypter File Open puis Upload. * Executer R / Python dans notebook : package rpy2. Chargement package : %load_ext rp2.ipython , %%R indique à Python et à Jupyter que le langage R doit être utilisé pour évaluer l'ensemble de la cellule. %R est utilisé pour une seule ligne. * Autres langages : d'autres disponibles, libres et non libres. SAS : logiciel de stats propriétaires. Pour l'utiliser avec Jupyter soit Python SASKernel (noyau) soit ackage Python SASPy. Attention propriétaire. * Installation de sasPy : via pip. python -m pip install saspy. Sous windows modification du fichier C:\Program Files\Python\Python37\Lib\site-packages\saspy\sascfg.py * SASKernel : utilise saspy (à installer) puis : python -m pip install sas-kernel Lisibilité notabook : utilisation d'extensions pour améliorer le notebook. * plier déplier code : pip3 install jupyter\_contrib_nbextensions # jupyter ocntrib nbextension install --user # not done yet * Controler visibilité des cellules : sudo pip3 install hide\_code ; sudo jupyter-nbextension install --py hide\_code ; jupyter-nbextension enable --py hide\_code ; jupyter-serverextension enable --py hide\_code * Table des matières : toc(2), extension d'amélioration de navigation et capacité vue d'ensemble Instalation et configuration de Jupyter * Installer miniconda : version légère d'Anaconda. Suite qui inclue Python, Jupyter, R et les packages courants. * LaTeX : générer des pdf. JupyterLab permet d'assembler différent composants dans le navigateur. conda install jupyterlab (lancer : jupyter lab) * Interaction avec GitLab et git : pull/push * Partager un notebook avec autres pers : donner le lien gitlab. Bouton share * Import : Open raw, File -> Open ; Upload ### Module 2.5 Devoir s'organiser pour installer des choses ? Mais changer constamment ? Différents entre RStudio/Orgmode/Jupyter : dépend de la complexité, de ce que l'on veut en faire, du langage etc ### Module 2.6 * Reporting : faire un compte rendu régulier = réflexion, résolution de problème, énonciation de problèmes, progression, tracabilité, continuité des travaux * Logistique : configuration à faire des logiciels. Dépot accessible (pb dde ou vol d'ordinateur). Rendre public votre journal, écrire aussi en anglais si possible. Organisation du compte rendu :résultats / développement / journal FR / conclusion Pour une période de travail : travail fait, ponts blouqants, questions, travaux prévus. Il ne fait pas rééditer, mais fait des (MAJ cf), sauf les TODO pour du DONE. ### Module 2.7 Initier l'environnement : conda activate mooc-rr-jupyter ### Module 3.1 Il faut que ce soit réplicable, le code doit être fourni. Ce qui permet de vérifier plus facilement et modifier. ### Module 3.2 Il faut toujours faire des modifications via du code, pour avoir une trace. Format iso pour les dates. Import de données : elle peut se faire via un url et converti en panda/utilisés sur numpy ### Module 3.4 Il faut vérifier les données, avec un code de vérification, faire une copie pour toute modification et réaliser au besoin une inspection visuelle