Résultat méthodologique devient ensemble des codes ayant permis de faire les calculs accompagnés d'une explication détaillée
2. Etude de cas : incidence des syndromes grippaux
Format date selon la norme ISO 8601 des date : l'année commence par la 1ere semaine qui contient le 4 janvier ou celle qui a plus de la moitié des ces jours dans l'année en cours.
Ne jamais faire des modications de données à la main : plutôt avec du code.
3. Importer les données avec Rstudio / R
environnement RStudio ; langage R ; bibliothèque parsedate pour la gestion des
dates en format iso
Important de lire les données directement de la source et faire attention aux données manquantes.
Pour charger un document d'un site web : insérer un chunk R dans le document markdown l'adresse
Dans le chunk data_url = "lien url"
Si première ligne à ignorer : écrire 'data = read.csv(data_url, skip=1)'
Pour voir les premières lignes de données : 'head(data)'
Pour voir les dernière lignes de données : 'tail(data)'
Recherche de données manquantes 'données_manquantes = apply(data, 1, function(x) any(is.na(x)))'
Le "1" fait passer la commande ligne par ligne et la fonction fait la recherche de données manquantes colonne par colonne.
Pour inspecter le type de données : 'class(data$variable)';
Ceci donne : interger (Nb entier); factor (V. qualitative);
Pour transformer une donnée comme "-" ou "?" en valeur manquante, il faut relire les données en spécifiant les valeur à lire comme valeur manquante :