Au sens commun, la **standardisation** est la production en série de modèles standards, c’est-à-dire qui suivent une norme de référence mise en place pour atteindre des résultats prédéfinis. Dans le cadre du prélèvement par carottage, cette standardisation s’entend comme l’*ensemble des manipulations formalisées et identifiables permettant d’arriver à la production en série de prélèvements normés sous forme de carottes d’os*.
L’objectif de la première partie de cette étude est de vérifier la **fidélité** de la méthode de carottage c’est-à-dire son étroitesse d’accord entre trois séries de mesures successives obtenues dans des conditions identiques, prescrites ci-après, provenant d’un même échantillon homogène, dans un laps de temps assez court, on parle alors de **répétabilité** de la méthode.
# 2. Matériels et méthodes
3 séries de 10 carottages sont réalisées sur le même os, de type DVI, par le même technicien, dans un laps de temps assez court.
Le perçage de l'os est réalisé sous hotte aspirante de type laboratoire dentaire, marque Zubler. La perceuse est un outil électroportatif de marque Dremel, sur lequel est monté un trépan dentaire de 2 mm de diamètre et 10 mm de long. La carotte est retirée du trépan après perçage par poussée vers le bas à l'aide d'une canule puis collectée dans un microtube.
Chaque carotte est pesée individuellement sur une balance de précision *Ohaus Adventurer pro* à 0,1 mg près.
Il en résulte que le prélèvement par carottage permet d’obtenir des échantillons dont :
- le diamètre est de 2 mm du fait de la contrainte induite par le choix du trépan
- la longueur est déterminée par le technicien en fonction d’un repère millimétré sur le trépan, c’est-à-dire au plus égale soit à l’épaisseur de l’os compact soit à la longueur utile du trépan. Toutefois, l'opération d'éjection réclamant une poussée assez forte, un certain nombre de carottes sont abîmées durant cette phase.
knitr::kabble(head(std_data, caption="Masses des carottes d'os"), align = "c")
print(xtable::xtable(std_data,caption="Masses des carottes d'os", tabular.environment = "longtable"),
type="html",html.table.attributes="border=0")
```
# 3. Visualisation des données
## a) Histogramme de densité
```{r data_histo}
### Visualisation des donnees
### Histogramme et courbe de distribution
hist(masses, proba=TRUE, main = "Distribution des masses de carottes")
lines(density(masses))
```
Notre population composée de 30 observations de masses de carottes provenant du même os est modélisée par cet histogramme montrant une répartition de la fréquence de distribution des masses de carottes typique d’une loi de Gauss
Ces boîtes à moustaches montre que chaque série de carottages présente une étendue faible des observations, hormis la S01 mais il est démontré que cette différence n’est pas significative. Des observations se situent en dehors des boites dans chaque série et constituent des points extrêmes sans pour autant être des valeurs aberrantes au regard de l’ensemble de la population observée. Enfin, la médiane de la S03 est plus élevée que celles de S01 et S02. Cette dernière série dont la variance est aussi la a été réalisée chronologiquement après et l’expérience du technicien grandissante, il se pourrait que la méthode soit mieux maîtrisée. En effet, l’éjection de la carotte reste un moment critique où celle-ci peut être abîmée partiellement ou cassée, entraînant alors une perte de matière aléatoire.
# 4. Analyse de la répétabilité
Ceci est un document R markdown que vous pouvez aisément exporter au format HTML, PDF, et MS Word. Pour plus de détails sur R Markdown consultez <http://rmarkdown.rstudio.com>.
Après la réalisation des différentes mesures, il est nécessaire de s'assurer de l'absence de valeurs aberrantes et de l'égalité des variances associées aux différentes séries. Il s'agit de la démarche de démonstration de répétabilité telle que décrite par la norme ISO17025 dont l'activité du laboratoire dépend.
Lorsque vous cliquerez sur le bouton **Knit** ce document sera compilé afin de ré-exécuter le code R et d'inclure les résultats dans un document final. Comme nous vous l'avons montré dans la vidéo, on inclue du code R de la façon suivante:
## a) Homogénéité des variances
Pour tester la variance maximale par rapport aux autres, un **test de Cochran** est réalisé.
```{r cars}
summary(cars)
```{r Cochran}
### Recherche de variabilité excessive
library(outliers)
cochran.test(masses~series)
```
Et on peut aussi aisément inclure des figures. Par exemple:
Au regard des résultats du test de Cochran, la p-value ne permettent pas de rejeter l'hypothèse H0 au risque $/alpha $=0.5%, c'est-à-dire que la variance de S01 n'est pas significativement supérieure aux autres. Il n' y a donc pas de variabilité aberrante entre les trois séries.
En premier lieu, il convient de vérifier la normalité de la distribution de nos observations par un test de Shapiro-Wilk qui est toutefois sensible aux données doublons et que par conséquent nous appuyons par deux autres tests.
```{r normalité}
lmstd <- lm(masses~series, data = std_data)
plot(lmstd, which=2)
shapiro.test(residuals(lmstd))
library(fBasics)
library(outliers)
library(nortest)
dagoTest (residuals(lmstd))
lillie.test(residuals(lmstd))
```
Les 3 tests réalisés permettent de conclure à la normalité de la distribution des masses.
**Le principe de l'ANOVA** est d'étudier à l'aide d'un test statistique si la part de dispersion imputable au facteur étudié (variabilité inter-classe des 3 séries de carottage) est significativement supérieure à la part résiduelle (ou variabilité intrinsèque des carottes).
```{r anova}
### ANOVA unifactorielle
library(car)
Anova(lmstd)
### Test d'indépendance des résidus
durbinWatsonTest(lmstd)
plot(lmstd,1)
```{r pressure, echo=FALSE}
plot(pressure)
### Test d'homogénéité des résidus
bartlett.test(residuals(lmstd)~series)
leveneTest(residuals(lmstd)~series)
fligner.test(residuals(lmstd)~series)
```
Vous remarquerez le paramètre `echo = FALSE` qui indique que le code ne doit pas apparaître dans la version finale du document. Nous vous recommandons dans le cadre de ce MOOC de ne pas utiliser ce paramètre car l'objectif est que vos analyses de données soient parfaitement transparentes pour être reproductibles.
Au risque de 5%, la différence entre les séries est donc significatives mais pas au risque de 2%. Les conditions de l'ANOVA ne sont toutefois pas toutes respectées puisque si les observations suivent une loi normale et leurs variances sont homogènes, elles ne sont pas indépendantes. Il faut donc opter pour des modèles mixtes (mixed-effects models).
D'après les tests statistiques réalisés 2 à 2 entre le facteur séries, les variances entre S02 et S03 sont significativement différentes au risque de 5% mais pas les variances entre S01 et S02 ni entre S02 et S03.
## b) Homogénéité des moyennes
Pour tester les valeurs aberrantes en terme de dispersion de moyennes, un **test de Grubbs** est réalisé.
```{r Grubbs}
### Visualisation de moyennes et de valeurs aberrantes
library(Publish)
ci.mean(masses~series, data=std_data)
### Recherche de moyenne aberrante
moyennes = tapply(masses, series, mean)
grubbs.test(x=moyennes)
```
Au regard de la p-value, aucune des moyennes n'est significativement différente des autres. Aucune moyenne ne peut donc être considérée comme aberrante.
## c) Limite de répétabilité
L'écart maximal en tre 2 mesures au risque alpha de 5% est donné dans la norme ISO 5725 par la formule :
$ r = 2.83/sigma_{r} $
soit dans notre cas:
```{r limite répétabilité}
sd <- sd(masses)
2.83*sd
2*sqrt(2*sd)
```
# 5. Test sur d'autres types d'os
## a) Os coxal
Comme les résultats ne sont pas stockés dans les fichiers Rmd, pour faciliter la relecture de vos analyses par d'autres personnes, vous aurez donc intérêt à générer un HTML ou un PDF et à le commiter.
Maintenant, à vous de jouer! Vous pouvez effacer toutes ces informations et les remplacer par votre document computationnel.