diff --git "a/Exercice \303\251valuer par les pairs/code_exo_pair" "b/Exercice \303\251valuer par les pairs/code_exo_pair" index 24606f05ee1cce8afe78586e5da1662aade58262..b0dec66dd1f24ef9de133c3380b2c28c610fe5ba 100644 --- "a/Exercice \303\251valuer par les pairs/code_exo_pair" +++ "b/Exercice \303\251valuer par les pairs/code_exo_pair" @@ -241,9 +241,12 @@ levels(data$class_age) ``` Tout c'est bien passé + #### Intégration de la varible au tableau précédent status en fonction de l'habitude de tabagisme. ```{r} -table_age<-table(data$class_age,data$Statut,data$Smoke) +table_age<-table(data$Status,data$Smoke,data$class_age) +table_age +prop_statut ``` @@ -281,27 +284,48 @@ Dead = 1 -1. Transformation de la variable qualitative `Statut` en variable binaire `Death` -Pour effectuer cette transformation nous allons utiliser le package `dplyr` qui contient une la fontion `mutate` +1. Transformation de la variable qualitative `Status` en variable binaire `Death` +On commence par créer un objet `Death` pour qu'il soit le reflet de la variable `Status` de notre jeu de donnée ```{r} -library(dplyr) +Death<-data$Status ``` - - +On commence alors à modifier dans ce vecteur les noms des niveaux de cet objets +Ainsi, on remplace le niveau _Death_ par _1.0_ et _Alive_ par _0.0_ ```{r} -convert_Status = function(s) { - if ("Alive"==TRUE){ - - ws=0 - -}else{ - - ws=1 +levels(Death) +levels(Death)[c(2)]<-1.0 +levels(Death) +levels(Death)[c(1)]<-0.0 +levels(Death) +``` +On vérifie la nature de `Death -} -} +```{r} +class(Death) +``` +Avant de l'implémenter dans notre jeu de donnée, nous convestissons `Death` en une variable numérique +```{r} +Death<-as.integer(Death) +Death +summary(Death) +``` +On constate ici un problème qui c'est produit alors de converssion: +R a remplacé chaque 0 par 1 et chaque 1 par 2 +On corrige ceci pour avoir un vecteur correctement coder en 0=Alive et 1=Death +```{r} +Death2 <- numeric(length(Death)) +for (i in 1:length(Death)) if (Death[i] == 2) Death2[i] <- 1 else Death2[i] <- 0 +Death2 +``` +Le problème semble corrigé +On intègre donc ce vecteur `Death2` bien codé en 0 et 1 à notre jeu de donnée. Cette nouvelle variable de `data` est nommée `Death` +```{r} +data$Death<-Death2 +View(data) ``` +Vérification de la concordance entre les variables `Status` et `Death` ```{r} -data$Death = convert_Status(data$Status) +table(data$Status,data$Death) ``` +Toute les données Alive sont bien codées en 0 et les données Death en 1