# Entrée du 01/05/2020 ## Travail effectué * Exercice participatif * Corrections d'exercices * Quiz 14 (100%) * Quiz 15 (100%) * Quiz 16 (0%) ## Points abordés * L'enfer des données: * Hétérogénéité des données * Gros volumes (solution possible: format binaire avec métadonnées et au boutisme fixe, tel que FITS et HDF5) * Formats * L'enfer du logiciel: * le code complexe: gros document linéaire peut être compliqué à lire, solution possible: utiliser un logiciel de workflow * les différentes versions d'un logiciel et dépendences, solution: nix <3 et un conteneur type docker * l'épreuve du temps, les logiciels et les librairies évoluent parfois sans rétro-compatibilité * L'enfer du calcul: * L'ordre des opération est important (et les flottant ça pue) * Les compilo ont tendance à modifier l'ordre des opérations (bien noter le compilo utilisé et sa version) * Calculs parrallèle dépendent principalement du nombre de processeur et de coeur par processeur, ce qui rend compliqué la reproductibilité * Le nombres "aléatoires": bien noter la SEED utilisé et les flottants ça pue ## Connaissances acquises * FITS et HDF5 format de fichier binaire potentiellement utilisable pour la recherche reproductible * Zenedo et FigShare pour partager les données sous différents formats