# Entrée du 01/05/2020

<!-- enfer reproductibilité -->

## Travail effectué

* Exercice participatif
* Corrections d'exercices
* Quiz 14 (100%)
* Quiz 15 (100%)
* Quiz 16 (0%)

## Points abordés

* L'enfer des données:
  * Hétérogénéité des données
  * Gros volumes (solution possible: format binaire avec métadonnées et au
  boutisme fixe, tel que FITS et HDF5)
  * Formats
* L'enfer du logiciel:
  * le code complexe: gros document linéaire peut être compliqué à lire,
  solution possible: utiliser un logiciel de workflow
  * les différentes versions d'un logiciel et dépendences, solution: nix <3
  et un conteneur type docker
  * l'épreuve du temps, les logiciels et les librairies évoluent parfois
  sans rétro-compatibilité
* L'enfer du calcul:
  * L'ordre des opération est important (et les flottant ça pue)
  * Les compilo ont tendance à modifier l'ordre des opérations
  (bien noter le compilo utilisé et sa version)
  * Calculs parrallèle dépendent principalement du nombre de processeur
  et de coeur par processeur, ce qui rend compliqué la reproductibilité
  * Le nombres "aléatoires": bien noter la SEED utilisé et les flottants
  ça pue

## Connaissances acquises

* FITS et HDF5 format de fichier binaire potentiellement utilisable pour
la recherche reproductible
* Zenedo et FigShare pour partager les données sous différents formats