Update Readme.md

parent 51f05be4
......@@ -9,6 +9,7 @@ Pense-bête du langage Markdown ([lien Wiki](https://fr.wikipedia.org/wiki/Markd
## 4. Pérennité et évolutivité des notes avec la gestion de version (Gitlab)
## 5. Les étiquettes et les logiciels d'indexation pour s'y retrouver
# Module 2 : La vitrine et l'envers du décor : le document computationnel
## 0. Introduction :
__document computationnel__ = vitrine = la théorie
......@@ -56,8 +57,58 @@ En effet, d’une part, certains travaux peuvent être faux et d’autres justes
D’autre part, si certains articles sont imprécis, il peuvent donner l’impression qu’un résultat est vrai dans un cadre plus général que ce qu’il est vraiment.
Il est alors difficile de vérifier ce qu’il se passe “à l’intersection”.
## 2. Pourquoi est-ce difficile ?
### 2.1. Les raisons
Les raisons rendant un travail de recherche difficilement reproducible sont :
1. Le manque d'informations: comment ont été obtenues les données ? quelles données ont été écartées ? quel protocole et pourquoi? quelle procédure statistique?
2. Les erreurs induites par l'utilisation des ordinateurs (rapidité, simplicité d'utilisation)
- erreur point and click : erreur de manipulation
- tableur : erreurs de programmation et de manipulation de données
- utilisation de nombreux logiciels complexes
- bug
**Il est donc important d'identifier la fiabilité de chacunes de ces briques.** Si l'un des composants par sa nature l'interdit, il faut songer à le remplacer pour le bien fondé de l'étude.
Mais *l'informatique est-elle seule responsable?*
### 2.2. Rigueur et organisation
Le manque de rigueur, technique et d'organisation :
- pas de backup
- pas d'historique
- pas de contrôle qualité
### 2.3. Dimension culturelle et sociale
**Article** = version **simplifiée** et intelligible d'une procédure (de résultats).
Cependant, la *technicité de la recherche* est telle, aujourd'hui, qu'il est impossible de tout décrire dans un article de 6 à 10 pages.
Les données sont souvent résumées en figure finale (multiples transformations et manipulations). Les statistiques pour obtenir ces courbes sont peu décrites.
Il est possible de **tracer** toutes ces informations et de les **rendre disponibles**, ce qui nécessite du temps et les bons outils.
### 2.4. Tout rendre public ?
Risquée ? Rendre public ses faiblesses qui deviendraient évidentes ?
Prendre le risque que quelqu'un trouve une erreur ? Retravaille mes données et publi?
--> Mettre à disposition notre travail est le meilleur moyen pour corriger, améliorer, évoluer et démontrer la **propriété intellectuelle**.
En effet, expliciter augmente les chances de trouver les erreurs et de les éliminer = **TRANSPARENCE**.
Concernant les données sensibles (données cliniques), il existe des outils de *cryptographie*.
### 2.5. Outils à éviter et alternatives
Préferrer les logiciels libres (ancienne version accessible) --> meilleure chance de retrouver les données en cas de perte (backup et historique possibles).
1. Utiliser des formats **textes simples et ouverts** --> possible de les ouvrir avec différents logiciels : **markdown, orgmode, csv** (pour les données).
2. Utiliser les logiciels et langage de programmation **libres** : **R, python**.
3. Ne pas stocker les données sur un hébergeurs où les données peuvent être captives et où la confidentialité n'est pas rééllement respectée : **framadrop, gitlab/github**.
4. Eviter les outils "intuitifs" tels que tableurs --> mauvaise traçabilité. Préférrer **R, python**.
## 3. Le document computationnel : principe
## 4. Prise en main avec l'outil
## 5. Travailler avec les autres
## 6. Analyse comparée des différents outils
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment