codage statut en binaire + création table effectif de statu/tabagisme/age

parent c1dd9326
......@@ -241,9 +241,12 @@ levels(data$class_age)
```
Tout c'est bien passé
#### Intégration de la varible au tableau précédent status en fonction de l'habitude de tabagisme.
```{r}
table_age<-table(data$class_age,data$Statut,data$Smoke)
table_age<-table(data$Status,data$Smoke,data$class_age)
table_age
prop_statut
```
......@@ -281,27 +284,48 @@ Dead = 1
1. Transformation de la variable qualitative `Statut` en variable binaire `Death`
Pour effectuer cette transformation nous allons utiliser le package `dplyr` qui contient une la fontion `mutate`
1. Transformation de la variable qualitative `Status` en variable binaire `Death`
On commence par créer un objet `Death` pour qu'il soit le reflet de la variable `Status` de notre jeu de donnée
```{r}
library(dplyr)
Death<-data$Status
```
On commence alors à modifier dans ce vecteur les noms des niveaux de cet objets
Ainsi, on remplace le niveau _Death_ par _1.0_ et _Alive_ par _0.0_
```{r}
convert_Status = function(s) {
if ("Alive"==TRUE){
ws=0
}else{
ws=1
levels(Death)
levels(Death)[c(2)]<-1.0
levels(Death)
levels(Death)[c(1)]<-0.0
levels(Death)
```
On vérifie la nature de `Death
}
}
```{r}
class(Death)
```
Avant de l'implémenter dans notre jeu de donnée, nous convestissons `Death` en une variable numérique
```{r}
Death<-as.integer(Death)
Death
summary(Death)
```
On constate ici un problème qui c'est produit alors de converssion:
R a remplacé chaque 0 par 1 et chaque 1 par 2
On corrige ceci pour avoir un vecteur correctement coder en 0=Alive et 1=Death
```{r}
Death2 <- numeric(length(Death))
for (i in 1:length(Death)) if (Death[i] == 2) Death2[i] <- 1 else Death2[i] <- 0
Death2
```
Le problème semble corrigé
On intègre donc ce vecteur `Death2` bien codé en 0 et 1 à notre jeu de donnée. Cette nouvelle variable de `data` est nommée `Death`
```{r}
data$Death<-Death2
View(data)
```
Vérification de la concordance entre les variables `Status` et `Death`
```{r}
data$Death = convert_Status(data$Status)
table(data$Status,data$Death)
```
Toute les données Alive sont bien codées en 0 et les données Death en 1
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment