"D'après l'article servant de base à cet exercice, les auteurs estiment plusieurs paramètres : $s_{\\hat{\\alpha}} = 3.052$ et $s_{\\hat{\\beta}} = 0.047$. La qualité de l'ajustement est caractérisée par un coefficient $G^2 = 18.086$ avec 21 degrés de liberté."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Informations techniques sur la machine et l'installation python"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Importation des librairies"
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"%matplotlib inline\n",
"import sys\n",
"import platform\n",
"import numpy as np\n",
"import pandas as pd\n",
"import matplotlib.pyplot as plt\n",
"import statsmodels.api as sm\n",
"import seaborn as sn"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Détermination de la version des différentes librairies ainsi que de l'OS"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"3.6.4 |Anaconda, Inc.| (default, Mar 13 2018, 01:15:57) \n",
"Nous commençons par charger les données provenant du lien [https://app-learninglab.inria.fr/moocrr/gitlab/moocrr-session3/moocrr-reproducibility-study/raw/master/data/shuttle.csv](https://app-learninglab.inria.fr/moocrr/gitlab/moocrr-session3/moocrr-reproducibility-study/raw/master/data/shuttle.csv). __Soulignons que le lien donné par [l'exemple](https://app-learninglab.inria.fr/moocrr/gitlab/moocrr-session3/moocrr-reproducibility-study/blob/master/src/Python3/challenger.ipynb) ne peut pas être lu correctement par la librairie pandas__."
"Le fichier ne possédant aucune ligne _nulle_ , nous pouvons continuer en toute tranquillité. Nous voulons obtenir un aperçu graphique du nombre d'accidents comme une fonction de la température ambiante."
"Nous cherchons maintenant à déterminer la probabilité qu'un joint soit détruit. Pour cela, nous utilisons un outil de régression logistique disponible dans la librairie statsmodels."
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"<table class=\"simpletable\">\n",
"<caption>Generalized Linear Model Regression Results</caption>\n",
"Nous obtenons $G^2 = 18.086$ ainsi que les erreurs standards sur les coefficients $s_\\hat{\\alpha} = 3.052$ et $s_\\hat{\\beta} = 0.047$. Les résultats de l'article sont donc correctement reproductibles."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Probabilité d'accident"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Nous utilisons le modèle logisitique afin de prévoir la probabilité d'occurrence d'un accident en fonction de la température initiale."
"Bien que l'utilisation d'un tel modèle pour prédire la probabilité d'un accident soit hautement discutable (trop peu de points et plusieurs points pathologiques), il en résulte sûrement un résultat surestimé. Ainsi, pour une valeur de $T = 31$ °F, la probabilité d'accident serait très importante."