@@ -57,3 +57,26 @@ I attempted at some point to have a data analysis "lab book" but a paper version
...
@@ -57,3 +57,26 @@ I attempted at some point to have a data analysis "lab book" but a paper version
I should later read [this article](http://starpu-simgrid.gforge.inria.fr/misc/SIGOPS_paper.pdf) untitled **An Effective Git And Org-Mode Based WorkflowFor Reproducible Research**
I should later read [this article](http://starpu-simgrid.gforge.inria.fr/misc/SIGOPS_paper.pdf) untitled **An Effective Git And Org-Mode Based WorkflowFor Reproducible Research**
I finished the second module ! Yay!
I finished the second module ! Yay!
## Module 3: une analyse réplicable
### 27.0.3.20
I did a replicable analysis of incidence of varicella.
## Module 4: L'enfer des données
#### 27.03.20
Les données sont parfois de types différent (ex texte et image), et il faut toutes les garder ensemble.
De plus les données peuvent être trop grosses (par exemple le texte). Le format binaire prend moins de place et limite la conversion des nombre du format texte au format binaire pour faire les calculs. Or l'avantage des formats texte sont les metadonnées.
Pb du format binaire, est qu'il peut changer d'un systeme d'exploitation à l'autre (différents boutismes)
Deux formats binaires peuvent remplir ces critères:
* FITS (Flexible Image Transport System)
* HDF5 (Hierachical Data Format version 5)
This is interesting but I don't think I am ready to use this yet (neither are my cotauthors...).