<h2id="orga4fb7ce">Exercice 1 : Ré-exécuter n'est pas répliquer…</h2>
<divclass="outline-text-2"id="text-orga4fb7ce">
<p>
<p>
Même si la terminologie peut varier d'un auteur ou d'une communauté à
Même si la terminologie peut varier d'un auteur ou d'une communauté à
l'autre, il est important de comprendre que l'on peut distinguer
l'autre, il est important de comprendre que l'on peut distinguer
...
@@ -55,7 +45,7 @@ vous avez pu utiliser dans le module 2). Cet exercice peut donc se
...
@@ -55,7 +45,7 @@ vous avez pu utiliser dans le module 2). Cet exercice peut donc se
faire à deux niveaux :
faire à deux niveaux :
</p>
</p>
<olclass="org-ol">
<olclass="org-ol">
<listyle="margin-bottom:0;">un niveau facile pour ceux qui repartiront du code dans le langage
<li>un niveau facile pour ceux qui repartiront du code dans le langage
qu'ils n'auront initialement pas utilisé et se contenteront de le
qu'ils n'auront initialement pas utilisé et se contenteront de le
ré-exécuter. Pour cela, nul besoin de maîtriser la régression
ré-exécuter. Pour cela, nul besoin de maîtriser la régression
logistique, il suffit de bien inspecter les sorties produites et de
logistique, il suffit de bien inspecter les sorties produites et de
...
@@ -64,7 +54,7 @@ ceux qui ré-exécuteraient le notebook Python dans l'environnement
...
@@ -64,7 +54,7 @@ ceux qui ré-exécuteraient le notebook Python dans l'environnement
Jupyter du MOOC, n'hésitez pas à consulter <ahref="https://www.fun-mooc.fr/courses/course-v1:inria+41016+session01bis/jump_to_id/4ab5bb42ca1e45c8b0f349751b96d405">les ressources de la
Jupyter du MOOC, n'hésitez pas à consulter <ahref="https://www.fun-mooc.fr/courses/course-v1:inria+41016+session01bis/jump_to_id/4ab5bb42ca1e45c8b0f349751b96d405">les ressources de la
section 4A du module 2</a> qui expliquent comment y importer un
section 4A du module 2</a> qui expliquent comment y importer un
notebook.</li>
notebook.</li>
<listyle="margin-bottom:0;">un niveau plus difficile pour ceux qui souhaiteront le réécrire
<li>un niveau plus difficile pour ceux qui souhaiteront le réécrire
complètement (éventuellement dans un autre langage que R ou Python,
complètement (éventuellement dans un autre langage que R ou Python,
l'expérience peut être d'autant plus intéressante que nous n'avons
l'expérience peut être d'autant plus intéressante que nous n'avons
pas testé ces variations). Là, si les fonctions de calcul d'une
pas testé ces variations). Là, si les fonctions de calcul d'une
...
@@ -78,41 +68,41 @@ Vous pourrez alors discuter sur le forum des succès et des échecs que
...
@@ -78,41 +68,41 @@ Vous pourrez alors discuter sur le forum des succès et des échecs que
vous aurez pu rencontrer. Pour cela :
vous aurez pu rencontrer. Pour cela :
</p>
</p>
<ulclass="org-ul">
<ulclass="org-ul">
<listyle="margin-bottom:0;"><b>Vous publierez auparavant dans votre dépôt les différents notebooks</b>
<li><b>Vous publierez auparavant dans votre dépôt les différents notebooks</b>
en prenant bien soin d'enrichir votre document des informations
en prenant bien soin d'enrichir votre document des informations
(numéros de version, etc.) sur votre système et sur les
(numéros de version, etc.) sur votre système et sur les
bibliothèques installées.</li>
bibliothèques installées.</li>
<listyle="margin-bottom:0;">Vous indiquerez votre résultat (que ça soit un succès ou échec à
<li>Vous indiquerez votre résultat (que ça soit un succès ou échec à
obtenir les mêmes résultats) en <b>remplissant ce <ahref="https://app-learninglab.inria.fr/gitlab/moocrr-session1/moocrr-reproducibility-study/blob/master/results.md">tableau</a></b> (vous avez
obtenir les mêmes résultats) en <b>remplissant ce <ahref="https://app-learninglab.inria.fr/gitlab/moocrr-session1/moocrr-reproducibility-study/blob/master/results.md">tableau</a></b> (vous avez
les droits d'édition donc il vous suffit d'éditer les fichiers via
les droits d'édition donc il vous suffit d'éditer les fichiers via
l'interface GitLab). Vous vérifierez les valeurs obtenues pour :
l'interface GitLab). Vous vérifierez les valeurs obtenues pour :
<olclass="org-ol">
<olclass="org-ol">
<listyle="margin-bottom:0;">les coefficients de la pente et de l'intercept</li>
<li>les coefficients de la pente et de l'intercept</li>
<listyle="margin-bottom:0;">les estimations d'erreur de ces coefficients</li>
<li>les estimations d'erreur de ces coefficients</li>
<listyle="margin-bottom:0;">le goodness of fit</li>
<li>le goodness of fit</li>
<listyle="margin-bottom:0;">la figure</li>
<li>la figure</li>
<listyle="margin-bottom:0;">la zone de confiance</li>
<li>la zone de confiance</li>
</ol></li>
</ol></li>
<listyle="margin-bottom:0;"><p>
<li><p>
Pour chacun vous indiquerez si le résultat est :
Pour chacun vous indiquerez si le résultat est :
</p>
</p>
<ulclass="org-ul">
<ulclass="org-ul">
<listyle="margin-bottom:0;">identique</li>
<li>identique</li>
<listyle="margin-bottom:0;">proche à moins de trois décimales</li>
<li>proche à moins de trois décimales</li>
<listyle="margin-bottom:0;">très différent</li>
<li>très différent</li>
<listyle="margin-bottom:0;">non fonctionnel (pas de résultat obtenu)</li>
<li>non fonctionnel (pas de résultat obtenu)</li>
</ul>
</ul>
<p>
<p>
Vous indiquerez également dans ce tableau :
Vous indiquerez également dans ce tableau :
</p>
</p>
<ulclass="org-ul">
<ulclass="org-ul">
<listyle="margin-bottom:0;">un lien vers votre espace gitlab contenant les différents notebooks</li>
<li>un lien vers votre espace gitlab contenant les différents notebooks</li>
<listyle="margin-bottom:0;">le nom du système d'exploitation utilisé</li>
<li>le nom du système d'exploitation utilisé</li>
<listyle="margin-bottom:0;">le langage utilisé et son numéro de version</li>
<li>le langage utilisé et son numéro de version</li>
<listyle="margin-bottom:0;">les numéros des principales bibliothèques utilisées
<li>les numéros des principales bibliothèques utilisées
You will find there our replications of the computations by Dallal <i>et
al.</i> (in R), one in Python and one in R (very similar to what you have
used in module 2). This exercise can be done at two levels:
</p>
<olclass="org-ol">
<listyle="color: #b62567;">an easy level at which you start from the code in the language that you did not use initially, and content yourself with re-executin it. This doesn't require mastering logistic regression, it is sufficien to inspect the outputs produced and check that they correspond to the expected values. For those who want to re-execute the Python notebook in our MOOC's Jupyter environment, check <ahref="https://www.fun-mooc.fr/courses/course-v1:inria+41016+session01bis/jump_to_id/4ab5bb42ca1e45c8b0f349751b96d405">the resources for sequence 4A of module 2</a> that explain how to import a notebook.</li>
<listyle="color: #b62567;">a more difficult level at which you rewrite the analysis completely, possibly in a different language than Python or R, which makes the exercise more interesting because we have not tested such variants. If logistic regression is not already implemented for your language, you will need a good understanding of it in order to write the code yourself, which of course makes the exercise even more instructive.</li>
</ol>
<pstyle="color: #b62567;">
You can discuss your successes or failures on the forum, after following these instructions:
</p>
<ulclass="org-ul">
<listyle="color: #b62567;"><b>First, publish your notebooks in your repository</b>, taking care to enrich your document with information about your system and your libraries (version numbers etc.).</li>
<listyle="color: #b62567;">Indicate your result by adding to this <ahref="https://app-learninglab.inria.fr/gitlab/moocrr-session1/moocrr-reproducibility-study/blob/master/results.md">table</a> (you have write permissions, so you can simply edit it via the GitLab interface). Check the values obtained for:
<olclass="org-ol">
<listyle="color: #b62567;">the slope and intercept coefficients</li>
<listyle="color: #b62567;">the error estimates for these coefficients</li>
<listyle="color: #b62567;">the goodness of fit</li>
<listyle="color: #b62567;">R: BLAS, ggplot, dplyr if used</li>
</ul></li>
</ul></li>
</ul>
<pstyle="color: #b62567;">
Don't worry if these instructions seem confusing, they are reproduced above the <ahref="https://app-learninglab.inria.fr/gitlab/moocrr-session1/moocrr-reproducibility-study/blob/master/results.md">table</a> and you will quickly notice if something is missing when you try to add your data.
</p>
<pstyle="color: #b62567;">
We will compile a synthesis of the principal divergences observes and make it available at the end of the MOOC.
You will find there our replications of the computations by Dallal /et
al./ (in R), one in Python and one in R (very similar to what you have
used in module 2). This exercise can be done at two levels:
1. an easy level at which you start from the code in the language that you did not use initially, and content yourself with re-executin it. This doesn't require mastering logistic regression, it is sufficien to inspect the outputs produced and check that they correspond to the expected values. For those who want to re-execute the Python notebook in our MOOC's Jupyter environment, check [[https://www.fun-mooc.fr/courses/course-v1:inria+41016+session01bis/jump_to_id/4ab5bb42ca1e45c8b0f349751b96d405][the resources for sequence 4A of module 2]] that explain how to import a notebook.
2. a more difficult level at which you rewrite the analysis completely, possibly in a different language than Python or R, which makes the exercise more interesting because we have not tested such variants. If logistic regression is not already implemented for your language, you will need a good understanding of it in order to write the code yourself, which of course makes the exercise even more instructive.
You can discuss your successes or failures on the forum, after following these instructions:
- *First, publish your notebooks in your repository*, taking care to enrich your document with information about your system and your libraries (version numbers etc.).
- Indicate your result by adding to this [[https://app-learninglab.inria.fr/gitlab/moocrr-session1/moocrr-reproducibility-study/blob/master/results.md][table]] (you have write permissions, so you can simply edit it via the GitLab interface). Check the values obtained for:
1) the slope and intercept coefficients
2) the error estimates for these coefficients
3) the goodness of fit
4) the plot
5) the confidence region
- For each of these values, specify if your result is
- identical
- close, to three decimal places
- very different
- non functional (no result obtained)
Also provide in this table:
- a link to your GitLab workspace with your notebook(s)
Don't worry if these instructions seem confusing, they are reproduced above the [[https://app-learninglab.inria.fr/gitlab/moocrr-session1/moocrr-reproducibility-study/blob/master/results.md][table]] and you will quickly notice if something is missing when you try to add your data.
We will compile a synthesis of the principal divergences observes and make it available at the end of the MOOC.