--- title: "Le pouvoir d'achat des ouvriers anglais du XVIe au XIXe siècle" author: "Sergio Castro" date: "30/6/2025" output: html_document --- ```{r} library(dplyr) library(ggplot2) library(scales) ``` # Introduction Dans ce document, j'explore un jeu de données historiques contenant des informations sur les prix du blé et les salaires entre 1565 et 1830 (en supposant des pas de 5 ans sur 53 observations). Voici les données de William Playfair que j'ai trouve sur le MOOC ```{r} data <- read.csv("C:/Users/CASTRO PACHECO/mooc-rr/module3/exo3/playfairdata.csv") ``` Je verifie la structure. ```{r} # Structure du jeu de données str(data) ``` # Données manquantes et plages de valeurs Je fais un résumé rapide ```{r} # Statistiques descriptives de base summary(data) ``` Maintenant je vais voir s'il y a des données manquantes. J'en vois trois sur la colonne des salaires. ```{r} # Vérification des valeurs manquantes colSums(is.na(data)) ``` # Q1: Rapport entre le prix du blé et le salaire moyen Pour répondre à la consigne, j'ai reproduit un graphique dans l'esprit de celui de Playfair. Le prix du blé est représenté par des barres verticales, tandis que les salaires sont illustrés par une surface bleue délimitée par une courbe rouge. Ces deux séries sont superposées dans un même graphique afin de visualiser leur évolution conjointe, tout en conservant l’impression générale du graphique original. ```{r} ggplot(data, aes(x = Year)) + geom_col(aes(y = Wheat), fill = "black", color = "black", width = 3)+ # Ligne rouge pour les salaires, taille un peu plus épaisse geom_line(aes(y = Wages ), color = "red", size = 2) + # Titres et thème labs( title = "Prix d'un quart de boisseau de ble (barres noires) et salaires (ligne rouge)", x = "Annee", y = "Shillings" ) + theme( panel.grid.major = element_line(color = "grey80"), panel.grid.minor = element_blank(), axis.title.y.left = element_text(color = "black", size = 12), axis.text.y.left = element_text(color = "black") ) ``` # Q2: Rapport entre le prix du blé et le salaire moyen (version améliorée) Ce graphique présente l’évolution conjointe du prix du blé et des salaires des travailleurs. Le prix du blé est affiché en barres noires, avec son échelle indiquée sur l’axe droit, tandis que les salaires hebdomadaires sont représentés par une courbe rouge, avec leur échelle sur l’axe gauche. L’utilisation de deux axes y distincts permet de comparer ces deux variables aux unités différentes sur un même graphique. ```{r} # Calcul du facteur de mise à l'échelle pour que Wheat et Wages cohabitent # On met Wheat à l'échelle de Wages scale_factor <- max(data$Wages, na.rm = TRUE) / max(data$Wheat, na.rm = TRUE) ggplot(data, aes(x = Year)) + geom_col(aes(y = Wheat * scale_factor), fill = "black", color = "black", width = 3) + geom_line(aes(y = Wages), color = "red", size = 1.5) + scale_y_continuous( name = "Salaires (shillings par semaine)", sec.axis = sec_axis(~ . / scale_factor, name = "Prix du ble (prix d'un quart de boisseau)") ) + labs( title = "Prix du ble (barres noires) et salaires (ligne rouge)", x = "Annee" ) + theme_minimal() + theme( axis.title.y.left = element_text(color = "red", size = 12), axis.text.y.left = element_text(color = "red"), axis.title.y.right = element_text(color = "black", size = 12), axis.text.y.right = element_text(color = "black") ) ``` # Q3: Rapport entre le prix du blé et le salaire moyen (version améliorée) ## Augmentation du pouvoir d'achat. Il nous faut mainentant montrer que le pouvoir d'achat des ouvriers a monté au fil des années. Pour cela, on calculer la quantité de boisseaux de blé qu'un salarié peut acheter par semaine. ```{r} data$wheat_bags_per_wage = data$Wages / (data$Wheat*4) ggplot(data, aes(x = Year)) + geom_col(aes(y = wheat_bags_per_wage), fill = "black", color = "black", width = 3) + labs( title = "Boisseaux de ble qui peuvent etre achetes avec un salaire hebdomadaire", x = "Annee", y = "Boisseaux de ble qui peuvent etre \n achetes avec un salaire hebdomadaire" ) + theme_minimal() + theme( axis.title.y.right = element_text(color = "black", size = 12), axis.text.y.right = element_text(color = "black") ) ``` ## Relation entre le prix du blé et les salaires. Ce graphique présente la relation entre le prix du blé et les salaires des travailleurs. Chaque point correspond à une année, dont la progression est indiquée par un dégradé de couleur allant des années les plus anciennes (en clair) aux plus récentes (en foncé). Cette représentation permet d’apprécier simultanément l’évolution conjointe des deux variables et leur lien au fil du temps, sans utiliser l’axe temporel classique. ```{r} ggplot(data, aes(x = Wheat, y = Wages, color = Year)) + geom_point(size = 3) + scale_color_gradient(low = "lightblue", high = "darkblue") + labs( title = "Relation entre prix du ble et salaires selon les annees", x = "Prix du ble (prix d'un quart de boisseau)", y = "Salaires (shillings par semaine)", color = "Annee" ) + theme_minimal() ```