diff --git a/journal/Research_and_Reproductibility_mooc_notes.md b/journal/Research_and_Reproductibility_mooc_notes.md index e3c2f507d11d9023f16206ef1526dba969d409da..fe1f4a842076a45c945a03c162ecab554aaa0807 100644 --- a/journal/Research_and_Reproductibility_mooc_notes.md +++ b/journal/Research_and_Reproductibility_mooc_notes.md @@ -35,9 +35,15 @@ Outils : **Aide markdown du mooc:**\ [Md rr-mooc cheat sheet](https://lms.fun-mooc.fr/courses/course-v1:inria+41016+self-paced/courseware/2bfe60a86fed4994b5493a220c38eb69/13f6fd96266746a0bd9d717a12f1f835/4?activate_block_id=block-v1%3Ainria%2B41016%2Bself-paced%2Btype%40vertical%2Bblock%4089c7893cb5aa4644b06569c65945d4d9) -## 2) Difficultés de reproduction des travaux de recherches +## 2) La vitrine et l'envers du décor: le document computationnel -### Manque d'informations +### 2.1) Exemples d'études récentes "discutées" + +RAS + +### 2.2) Difficultés de reproduction des travaux de recherches + +#### Manque d'informations **sources et données** @@ -47,15 +53,17 @@ données non disponibles --> résultats difficiles à vérifier choix non expliqués --> choix suspicieux -### L'ordinateur, source d'erreurs +#### L'ordinateur, source d'erreurs **Logiciel "point&clic"** + Les logiciels "point&clic" qui sont faciles d'utilisation mais dont le détail\ des calculs, des paramètres etc ne sont pas accessibles, où se qui se passe\ derrière est caché. Ces logiciels dont l'usage premier peut être détourné,\ ce qui crée de potentiels postes d'erreurs.\ -**Tableurs** +**Tableurs, erreurs de programmation et de manipulation des données** + Un exemple typique sont les tableurs excel et en particulier ceux, \ utilisant des macros. De plus, pour certaines valeurs, le comportement\ par défaut du logiciel peut les interprêter de mauvaise manière.\ @@ -65,10 +73,47 @@ Par exemple: **Pile logicielle complexe** +logiciels propriétaires ("boîte noire") dont on ne maîtrise pas le contenu et \ +qui applique aveuglément des procédures de calcul et de transformation de \ +données. + **Bugs de programmation** +Erreurs peuvent venir de programmes "maison" + **Manque de rigueur et d'organisation** +1. Pas de Backup + +Stockage ne coûte plus rien, mais cela n'empêche que la sauvegarde des données \ +est souvent mal assurée. + +2. Pas d'historique + +En l'absence de mécanismes de gestion version, il est courant de remplacer par\ +inadvertance d'anciennes données par de nouvelles.\ +--> plus d'accès aux anciennes observations. + +3. Pas de contrôle qualité + +Utilisation de plans d'expériences randomisées ou pré-étude pas systématiques\ +Bonnes pratiques de revue de code, l'intégration continue rarement appliquées + +4. Dimension culturelle et sociale + +Un article est une version simplifié et intelligible des résultats : "publicité"\ +Une description haut-niveau est essentielle (permet de prendre du recul) mais \ +elle est devenue la norme alors que le niveau de technicité de la recherche \ +actuelle est bien trop élevé pour qu'il soit possible de donner dans un doc \ +de 8 à 10 pages toutes les informations permettant de refaire les expériences \ +et analyses. + + * Description du protocole expérimental souvent assez succinte, + * Données généralement trop nombreuses pour être données in extinso.\ +Elles sont souvent résumées au travers de quelques courbes. + * Les traitements statistiques pour parvenir à ces courbes ne sont décrits \ +que brièvement. +