From 09f45b24eaa893c4673fd62212c7ea44c7189933 Mon Sep 17 00:00:00 2001 From: 61108243dd1ab58c494e6087352737ae <61108243dd1ab58c494e6087352737ae@app-learninglab.inria.fr> Date: Wed, 6 Nov 2024 10:48:25 +0000 Subject: [PATCH] ajout fin module 2 et module 3 --- journal/Readme.md | 63 +++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 63 insertions(+) diff --git a/journal/Readme.md b/journal/Readme.md index 43dd816..1c111df 100644 --- a/journal/Readme.md +++ b/journal/Readme.md @@ -54,6 +54,69 @@ Possible de faire du Python mais les variables ne sont pas conservées entre blo **POSSIBLE DE CONNECTER RSTUDIO A GITLAB/GITHUB POUR CLONER PROJET ET CHARGER/COMMIT/PUSH LES FICHIERS DIRECTEMENT** +HAL (etat français), Zenodo (CERN), figshare : outils d archivage de doc final et de docs annexes comme des images + + +Modifier doc depuis cmd : echo texte à ajouter >> fichier.md +Visualiser fichier : less fichier.md + +git checkout fichier -> revenir à la version précédente d'un fichier (avant git add?) + +Revenir à version précédente : identifier commit qui intéresse dans history du fichier dans gitlab, on peut ensuite télécharger la version antérieure du fichier, la modifier ou l'utiliser pour remplacer la version en cours + # Module 3 +Attention aucune modification de fichier à la main car sinon pas de traces : du code partout pour une analyse réplicable + +Rstudio + +library(parsedate) pour gérer donners format ISO 8601 + +Importer depuis url : +``` +data_url <- "lien de téléchargement (dispo depuis historique de téléchargement)" +data <- read.csv(data_url, skip = 1, #ignorer première ligne du fichier en question car contient commentaire + na.strings = "-") #indique que les - doivent être considérés comme NA +``` + +Trouver lignes avec NA : +``` +lignes_na <- apply(data, 1, # parcourir les lignes + function(x) any(is.na(x))) +data[lignes_na,] # visualiser les lignes avec NA +``` + +Conversion norme ISO 8601 +``` +convert_week <- function(date){ + ws <- paste(date) + iso <- paste0(substring(ws, 1, 4), # 4ères lettres = annee + "-W", substring(ws, 5, 6)) # 5 et 6ème lettre = mois + as.character(parse_iso_8601(iso)) +} + +data$date <- as.Date(sapply(data$week, convert_week)) # sapply sort du chr donc format date ne serait pas gardé, besoin de convertir avc as.Date après avoir converti en chr dans la fonction +data <- data[order(data$date),] # ranger par ordre chronologique +``` + +Pics annuel +``` +pic_annuel <- function(annee) { + debut <- paste0(annee-1, "-08-01") # debut au 1er aout car creux du pic (alors que janvier au milieu du début de forte pente) + fin <- paste0(annee, "-08-01") + semaines <- data$date > debut & data$date <= fin + sum(data$inc[semaines], na.rm = TRUE) +} + +annees <- 1986:2017 # annee 1985 début en janvier au milieu du pic, pas de données de aout 1984 donc on préfére commencer en 1986 + +incidence_annuelle <- data.frame(annee = annees, incidence = sapply(annees, pic_annuel)) +``` + +Puis visualisation avec lignes, points, histo etc... + +Une analyse réplicable doit contenir toutes les étapes de traitement des données sous une forme executable +Important d'expliquer tous les choix qui peuvent influencer les résultats +Nécessite d'exposer beaucoup de détails techniques, parce que c'est à ce niveau qu'on fait des erreurs! + # Module 4 \ No newline at end of file -- 2.18.1