Ajout des notes du début du module 2

parent 3d2d0a4d
......@@ -5,6 +5,8 @@
## Du fichier texte au langage de balisage léger
*Mardi 11 mai à 21h (2h)*
EDITEUR DE TEXTE : gedit (linux), notepad (windows)
Les fichiers texte peuvent etre lus par des éditeurs de texte qui sont moins puissants que des traitements de texte, mais sont facilement reproductible et il est possible de les lire même des années plus tard quelque soient les versions </l'éditeurcar sont codés tyiquement en UTF-8 : Universal Character Set Transformation Format-8bits
......@@ -32,6 +34,8 @@ https://enacit.epfl.ch/cours/markdown-pandoc/
A noter : Gitlab permet de taper du markdown et de voir le rendu html, et de stocker plusieurs version du code. Remarkable est aussi un editeur markdown (sur windows et linux)
## Perennité et evolutivité des notes avec la Gestion de versions :
*Jeudi 13 mai à 21h (2h)*
Plateforme Gitlab créée dans le cours.
......@@ -42,6 +46,8 @@ Faire une recherche dans Gitlab :
On se met sur un réperetoire et on fait une recherche du mot que l'on souhaite en haut à gauche : cela affiche tous les repertoires/fichiers/contenu du fichier contenant ce mot.
### Git ; Github, gitlab : l'historique
*Vendredi 14 mai à 19h (1h)*
historique Git : créé pour développer linux : outil open source. N'est pas comme dropbox, car il faut faire des lignes de commandes a chaque fois pour syncroniser, savoir ce qu'on veut syncroniser, comment...
Il y a des interfaces pour ne pas passer par lignes de commandes.
......@@ -74,6 +80,8 @@ Commande : **guit log**: donne accès à l'ensemble des modification de l'histo
***Conclusion : facilite beaucoup le travail collaboratif.***
### Comment met on en place un serveur Guit Lab ? L'ecosysteme Guit.
*Samedi 15 mai à 14h (1h)*
Guit hub et guitlab sont des plateformes d'hébergement des projets collaboratifs, et fournissent des interfaces web d'accès à l'intégralité du contenu des projets et des historiques.
......@@ -96,6 +104,7 @@ Si projet avec données sensibles (confidentialité) : il vaut mieux un guitlab
## Indexation :
*Dimanche 16 mai à 13h (3h)*
Indexation de plusieurs fichiers numériques peuvent être étiquetés (index).
**DocFetcher** est un moteur de recherche de bureau facile d'emploi et fonctionne tres bien.
......@@ -109,6 +118,35 @@ Cela permet d'introduire des series de nombres d'identification sans que cekla n
Sur une image : on peut avoir acces aux métadonnées. On peut ajouter un commentaire avec un mot clef « etiquette1 ».
##Exercice 1
# MODULE 2: LA VITRINE ET L'ENVERS DU DECOR/ LE DOCUMENT COMPUTATIONNEL
##Pourquoi reproductibilité est difficiles?
Les principales causes de l'impossibilité de retrouver les travaux de recherche:
- Manque d'information importante: source des données, expliciter les choix (protocole experimental, quelles données concservées/écartées, quelle procédure statistiques et quelles hypothèses sous-jacentes).
Cahier de laboratoire: essentiel.
- Erreurs de calcul. Erreurs induites par les ordinateurs: 1) logiciels intuitifs (clique bouton) (tableurs sources d'erreurs (passage des numeriques en explosants) et difficile de suivre les traitements par les macros).
Mais programmer soit meme n'est pas evident...
- Manque de rigueur et d'organisation: suppression des comptes informatiques, mauvaise gestions de version, pas de backup, pas d'historique, pas de controle qualité pour les developpements de logiciels (revue de code, intégration continue)
- Probleme culturel: l'article doit être court, données décrites brievement, traitement statistiques brievement exposés. Demande beaucoup de temps de tout classer. Et si cela n'interesse personne. Et si on met tout public: on risque de s'exposer à la critique ou de faire trouver des erreurs.
Probleme de la réutilisation; quelqu'un peut réutiliser le code et les données que l'on a mis beaucoup de temps à mettre en oeuvre.
Il faut changer de facon de penser: il faut montrer ce que l'on fait, qu'on le fait bien, et en donner les limites pour construire sa réputation. Les articles de méthodologie sont de loin les plus cités.
Expliciter permet d'identifier les erreurs et de les corriger.
Sur github, on a un identifiant développeur qui permet d'etre reconnu.
Cas de données sensibles (ex: données médicales, info sur les enfants...): il convient de definir les personnes qui peuvent y avoir accès aux informations; **il existe des techniques cryptographyques assez facile d'acces pour que seules les personnes autorisées aient accès**.
Adoption de format texte et de logiciel en code ouvert (R, phyton) permet d'assurer (csv, markdown,...). Eviter de stocker les données sur une seule plateforme. Attention aux plateforme de sauvegarde (confidentialité, business plan).
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment