Faire un traitement de données dans un notebook
N’ayant pas d’idée j’ai choisi de générer des données aléatoirement a l’aide d’un outil en ligne Mockaroo. Ce n’est pas libre de droit mais c’est juste pour avoir des données
Chargement des données
donnees = read.table("random.data", header = TRUE, sep = ",")
Rapide apperçu des données avec la commande summary()
summary(donnees)
## id first_name last_name email
## Min. : 1.00 Length:81 Length:81 Length:81
## 1st Qu.: 40.00 Class :character Class :character Class :character
## Median : 60.00 Mode :character Mode :character Mode :character
## Mean : 56.01
## 3rd Qu.: 80.00
## Max. :100.00
## gender ip_address
## Length:81 Length:81
## Class :character Class :character
## Mode :character Mode :character
##
##
##
Le tableaux contient 6 colonnes: id, prénom (first_name), nom de famille (last_name) , email (email), “genre” (gender) et adresse ip (ip_adresse)
sort(table(donnees$first_name))
##
## Adah Alisa Anjanette Barry Belia Bert Bil Blondy
## 1 1 1 1 1 1 1 1
## Briant Brion Brodie Carly Cathyleen Celinda Clarance Corrine
## 1 1 1 1 1 1 1 1
## Dasi Dennis Desiri Dimitry Elinor Estrella Eva Evangelia
## 1 1 1 1 1 1 1 1
## Felita Ferrell Filberto Gay Gelya Geri Glen Guy
## 1 1 1 1 1 1 1 1
## Hali Halli Ham Harlie Hart Ian Ike Irwin
## 1 1 1 1 1 1 1 1
## Jandy Janice Kelcey Kincaid Lacie Lemmy Leonidas Marcus
## 1 1 1 1 1 1 1 1
## Marj Melissa Meriel Merrily Mikel Nadean Nanice Nelson
## 1 1 1 1 1 1 1 1
## Nerta Nicole Niles Octavia Paxon Percival Petr Phillie
## 1 1 1 1 1 1 1 1
## Rachelle Reena Rivi Roberta Roldan Rosanne Rudd Shoshana
## 1 1 1 1 1 1 1 1
## Susette Sybil Terrence Theresa Tonie Truda Vern Zeb
## 1 1 1 1 1 1 1 1
## Zelda
## 1
Tous les prénoms n’ont qu’un occurence
barplot(table(donnees$gender), xlab = "", ylab = "Pourcentage", las = 2)