diff --git a/module4/ressources/exo1.html b/module4/ressources/exo1.html index 688322c3d089b3f54f158d93d65008914ddafd3a..1a3cf26a1ee16c9a240d9b110034864721218162 100644 --- a/module4/ressources/exo1.html +++ b/module4/ressources/exo1.html @@ -3,58 +3,56 @@

Table of Contents

-
-

Exercice 1: Ré-exécuter n'est pas répliquer…

-
+
+

Exercice 1 : Ré-exécuter n'est pas répliquer…

+

Même si la terminologie peut varier d'un auteur ou d'une communauté à l'autre, il est important de comprendre que l'on peut distinguer -différent niveau de "réplication" selon que l'on s'est contenté de +différents niveaux de "réplication" selon que l'on s'est contenté de vérifier que l'on pouvait ré-exécuter le code et obtenir exactement les mêmes résultats ou bien que l'on arrivait à reproduire des résultats similaires en suivant une approche similaire (éventuellement avec un -autre langage, une autre méthode de calcul, etc.). À Ce sujet, vous +autre langage, une autre méthode de calcul, etc.). À ce sujet, vous pourrez vouloir par exemple lire https://arxiv.org/abs/1708.08205.

-Le diable se cache souvent dans des endroits auxquels on ne penserait -jamais et nous sommes nous-mêmes allés de surprise en surprise en +Le diable se cache souvent dans des endroits auxquels on n'aurait jamais +pensé et nous sommes nous-mêmes allés de surprise en surprise en préparant ce MOOC, notamment avec l'exercice du module 2 sur Challenger. C'est pourquoi nous vous proposons dans cet exercice, de refaire une partie de l'analyse des données de Challenger, comme l'ont fait Siddhartha Dallal et ses co-auteurs il y a presque 30 ans dans leur article Risk Analysis of the Space Shuttle: Pre-Challenger Prediction of Failure et publié dans le Journal of the American -Statistical Association (Vol. 84, No. 408, Déc., 1989), mais dans -dans un autre langage de votre choix (Python, R, Julia, SAS, -…). +Statistical Association (Vol. 84, No. 408, Déc., 1989) mais dans un autre langage de votre choix (Python, R, Julia, SAS…).

Nous savons d'expérience que si les estimations de pente et d'intercept sont généralement les mêmes, on peut avoir des différences -lorsque l'on regarde un peu plus dans les détails les estimateurs de -variance et le R2. Il peut également y avoir des surprises dans le +lorsque l'on regarde les estimateurs de variance et le R2 un peu plus +dans les détails. Il peut également y avoir des surprises dans le graphique final selon les versions de bibliothèques utilisées.

L'ensemble des calculs à effectuer est décrit ici avec les -indications sur comment contribuer: +indications sur comment contribuer : https://app-learninglab.inria.fr/gitlab/moocrr-session1/moocrr-reproducibility-study/

-Vous y trouverez notre réplication des calculs de Dallal et al. (en -R), une mise en œuvre en python et une en R (très similaires à ce que +Vous y trouverez notre réplication des calculs de Dallal et al. (en +R), une mise en œuvre en Python et une en R (très similaires à ce que vous avez pu utiliser dans le module 2). Cet exercice peut donc se -faire à deux niveaux: +faire à deux niveaux :

  1. un niveau facile pour ceux qui repartiront du code dans le langage @@ -67,17 +65,17 @@ Jupyter du MOOC, n'hésitez pas à consulter un niveau plus difficile pour ceux qui souhaiteront le réécrire -complètement (éventuellement dans un autre langage que R ou python, +complètement (éventuellement dans un autre langage que R ou Python, l'expérience peut être d'autant plus intéressante que nous n'avons pas testé ces variations). Là, si les fonctions de calcul d'une -régression logistique ne sont pas présente, il y a par contre +régression logistique ne sont pas présentes, il y a par contre intérêt à en savoir un minimum pour pouvoir les implémenter. L'exercice en est d'autant plus instructif.

Vous pourrez alors discuter sur le forum des succès et des échecs que -vous avez pu rencontrer. Pour cela: +vous aurez pu rencontrer. Pour cela :

  • Vous publierez auparavant dans votre dépôt les différents notebooks @@ -87,7 +85,7 @@ bibliothèques installées.
  • Vous indiquerez votre résultat (que ça soit un succès ou échec à obtenir les mêmes résultats) en remplissant ce tableau (vous avez les droits d'édition donc il vous suffit d'éditer les fichiers via -l'interface GitLab). Vous vérifierez les valeurs obtenues pour +l'interface GitLab). Vous vérifierez les valeurs obtenues pour :
    1. les coefficients de la pente et de l'intercept
    2. les estimations d'erreur de ces coefficients
    3. @@ -96,7 +94,7 @@ l'interface GitLab). Vous vérifierez les valeurs obtenues pour
    4. la zone de confiance
  • -Pour chacun vous indiquerez si le résultat est: +Pour chacun vous indiquerez si le résultat est :

    • identique
    • @@ -105,16 +103,16 @@ Pour chacun vous indiquerez si le résultat est:
    • non fonctionnel (pas de résultat obtenu)

    -Vous indiquerez également dans ce tableau: +Vous indiquerez également dans ce tableau :

      -
    • Un lien vers votre espace gitlab contenant les différents notebooks
    • -
    • Le nom du système d'exploitation utilisé
    • -
    • Le langage utilisé et son numéro de version
    • -
    • Les numéros des principales bibliothèques utilisées +
    • un lien vers votre espace gitlab contenant les différents notebooks
    • +
    • le nom du système d'exploitation utilisé
    • +
    • le langage utilisé et son numéro de version
    • +
    • les numéros des principales bibliothèques utilisées
        -
      • Python: numpy, pandas, matplotlib, statsmodels, …
      • -
      • R: BLAS, ggplot, dplyr si chargées
      • +
      • Python : numpy, pandas, matplotlib, statsmodels…
      • +
      • R : BLAS, ggplot, dplyr si chargées
diff --git a/module4/ressources/exo2.html b/module4/ressources/exo2.html index 6536cd1d10a20c4f9c8b09641fc2b97ae4d4eae6..47ca06c4c5ebc354a3dc4c24862face744f29d3c 100644 --- a/module4/ressources/exo2.html +++ b/module4/ressources/exo2.html @@ -3,37 +3,37 @@

Table of Contents

-
-

Exercice 2: L'importance de l'environnement

-
+
+

Exercice 2 : L'importance de l'environnement

+

Dans cet exercice, nous vous proposons de reprendre l'exercice précédent mais en mettant à jour l'environnement de calcul. En effet, nous avons rencontré des surprises en préparant ce MOOC puisqu'il nous est arrivé d'avoir des résultats différents entre nos machines et -l'environnement jupyter que nous avions mis en place pour le MOOC. Ça -sera peut-être également votre cas! +l'environnement Jupyter que nous avions mis en place pour le MOOC. Ça +sera peut-être également votre cas !

    -
  1. Pour ceux qui ont suivi le parcours jupyter, recréer +
  2. Pour ceux qui ont suivi le parcours Jupyter, recréez l'environnement du MOOC sur votre propre machine en suivant les -instructions données +instructions données dans les ressources de la section 4A du module 2.
  3. -
  4. Vérifier si vous obtenez bien les même résultats que ceux +
  5. Vérifiez si vous obtenez bien les mêmes résultats que ceux attendus.
  6. -
  7. Mettre à jour (vers le haut ou vers la bas) cet environnement et -vérifier si vous obtenez les mêmes résultats
  8. +
  9. Mettez à jour (vers le haut ou vers la bas) cet environnement et +vérifiez si vous obtenez les mêmes résultats.

Comme précédemment, vous mettrez à jour le tableau et vous discuterez -sur le forum des succès et des échec que vous aurez rencontrés. +sur le forum des succès et des échecs que vous aurez rencontrés.

diff --git a/module4/ressources/exo3.html b/module4/ressources/exo3.html index a4c8e0d8c88e853e2ff22cdbf3c06ad2e5959091..cc3e5cd9482b28baa622fc38ef70eac16cda7e00 100644 --- a/module4/ressources/exo3.html +++ b/module4/ressources/exo3.html @@ -3,14 +3,14 @@

Table of Contents

-
-

Exercice 3: Répliquer un papier de Rescience

-
+
+

Exercice 3 : Répliquer un papier de Rescience

+

Rescience (http://rescience.github.io/) est un journal de sciences computationnelles entièrement ouvert dont l'objectif est d'encourager