Faire un traitement de données dans un notebook

Chargement des données aléatoire

N’ayant pas d’idée j’ai choisi de générer des données aléatoirement a l’aide d’un outil en ligne Mockaroo. Ce n’est pas libre de droit mais c’est juste pour avoir des données

Chargement des données

donnees = read.table("random.data", header = TRUE, sep = ",")

Analyse du tableau

Rapide apperçu des données avec la commande summary()

summary(donnees)
##        id          first_name         last_name            email          
##  Min.   :  1.00   Length:81          Length:81          Length:81         
##  1st Qu.: 40.00   Class :character   Class :character   Class :character  
##  Median : 60.00   Mode  :character   Mode  :character   Mode  :character  
##  Mean   : 56.01                                                           
##  3rd Qu.: 80.00                                                           
##  Max.   :100.00                                                           
##     gender           ip_address       
##  Length:81          Length:81         
##  Class :character   Class :character  
##  Mode  :character   Mode  :character  
##                                       
##                                       
## 

Le tableaux contient 6 colonnes: id, prénom (first_name), nom de famille (last_name) , email (email), “genre” (gender) et adresse ip (ip_adresse)

Quel est le prénom le plus commun

sort(table(donnees$first_name))
## 
##      Adah     Alisa Anjanette     Barry     Belia      Bert       Bil    Blondy 
##         1         1         1         1         1         1         1         1 
##    Briant     Brion    Brodie     Carly Cathyleen   Celinda  Clarance   Corrine 
##         1         1         1         1         1         1         1         1 
##      Dasi    Dennis    Desiri   Dimitry    Elinor  Estrella       Eva Evangelia 
##         1         1         1         1         1         1         1         1 
##    Felita   Ferrell  Filberto       Gay     Gelya      Geri      Glen       Guy 
##         1         1         1         1         1         1         1         1 
##      Hali     Halli       Ham    Harlie      Hart       Ian       Ike     Irwin 
##         1         1         1         1         1         1         1         1 
##     Jandy    Janice    Kelcey   Kincaid     Lacie     Lemmy  Leonidas    Marcus 
##         1         1         1         1         1         1         1         1 
##      Marj   Melissa    Meriel   Merrily     Mikel    Nadean    Nanice    Nelson 
##         1         1         1         1         1         1         1         1 
##     Nerta    Nicole     Niles   Octavia     Paxon  Percival      Petr   Phillie 
##         1         1         1         1         1         1         1         1 
##  Rachelle     Reena      Rivi   Roberta    Roldan   Rosanne      Rudd  Shoshana 
##         1         1         1         1         1         1         1         1 
##   Susette     Sybil  Terrence   Theresa     Tonie     Truda      Vern       Zeb 
##         1         1         1         1         1         1         1         1 
##     Zelda 
##         1

Tous les prénoms n’ont qu’un occurence

La proportion femmes/hommes

barplot(table(donnees$gender), xlab = "", ylab = "Pourcentage", las = 2)