Dans cette étude, nous souhaitons analyser l'évolution du pouvoir d'achat des ouvriers anglais du XVIe au XIXe siècle.
Pour cela, nous allons utiliser les données publiées par William Playfair en 1821 dans son livre "A Letter on Our Agricultural Distresses, Their Causes and Remedies".
# Librairies utilisées
La librairie `ggplot2` permet de générer des graphiques.
La librairie `ggprepel` permet d'empêcher la supperposition des étiquettes dans les graphiques ggplot.
```{r}
library(ggplot2)
library(ggrepel)
```
# Importation des données
Les données initialement représentées par William Playfair en 1821 dans son livre "A Letter on Our Agricultural Distresses, Their Causes and Remedies", sont disponible au format CSV à cette [url](https://raw.githubusercontent.com/vincentarelbundock/Rdatasets/master/csv/HistData/Wheat.csv).
Les explications concernant les colonnes sont données sur [le site d'origine](https://vincentarelbundock.github.io/Rdatasets/doc/HistData/Wheat.html) :
| Nom de la colonne | Explications |
| :--- | :--- |
|`Year`|Année par tranche de 5 ans, de 1565 à 1821|
|`Wheat`|Prix du blé (en shillings par quart de boisseau de blé)|
La première colonne n'est pas prise en compte dans l'analyse, car elle contient seulement les numéros des différentes lignes. Le salaire par semaine n'est pas renseigné pour les trois dernières années : 1815, 1820, 1821. Leurs données sont tout de même conservées.
```{r}
data <- read.csv(data_file)[2:4]
```
```
## Quelques explications
# Reproduction du diagramme de Playfair
Ceci est un document R markdown que vous pouvez aisément exporter au format HTML, PDF, et MS Word. Pour plus de détails sur R Markdown consultez <http://rmarkdown.rstudio.com>.
Dans un premier temps, nous souhaitons reproduire numériquement le diagramme proposé par Playfair en 1821.
```{r}
cols <- c("Prix du quart de boiseau de blé" = "lightgray",
"Salaire par semaine" = "#FF3333")
Lorsque vous cliquerez sur le bouton **Knit** ce document sera compilé afin de ré-exécuter le code R et d'inclure les résultats dans un document final. Comme nous vous l'avons montré dans la vidéo, on inclue du code R de la façon suivante:
ggplot(data) +
geom_col(aes(x = Year, y = Wheat, fill = "Prix du quart de boiseau de blé"),
width = 1,
color = "black") +
scale_y_continuous(expand = c(0, 0)) +
geom_line(aes(x = Year, y = Wages, color = "Salaire par semaine"),
linewidth = 1.2) +
geom_area(aes(x = Year, y = Wages), fill = "#00CCCC", alpha = 0.5) +
labs(
title = "Evolution du prix du quart de boiseau de blé et du salaire par
Dans la représentation graphique de William Playfair, les deux unités "shillings par quart de boisseau de blé" et "shillings par semaine" sont simplifiées et rassemblées dans une seule unité, appelée "shillings". Cette représentation manque de précision et ne serait plus acceptée aujourd'hui. Nous nous proposons donc d'améliorer le graphique initial en faisant apparaître les deux unités sur deux axes des ordonnées distincts.
```{r}
cols <- c("Prix du quart de boiseau de blé" = "lightgray",
"Salaire par semaine" = "#FF3333")
ggplot(data) +
geom_col(aes(x = Year, y = Wheat, fill = "Prix du quart de boiseau de blé"),
width = 1,
colour = "black") +
scale_y_continuous(expand = c(0, 0),
sec.axis = sec_axis(data$Wages ~ .,
name = "Salaire par semaine (en shillings)")) +
geom_line(aes(x = Year, y = Wages, colour = "Salaire par semaine"),
size = 1.2) +
geom_area(aes(x = Year, y = Wages), fill = "#00CCCC", alpha = 0.5) +
labs(
title = "Evolution du prix du quart de boiseau de blé et du salaire par
semaine de 1565 à 1821",
x = "Année",
y = "Prix du quart de boiseau de blé (en shillings)"
La représentation de la fluctuation du prix du blé par un histogramme et non par une courbe semble jusdicieuse, puisque les données sont disponibles par tranche de 5 ans, et que les prix subissent en de courts lapses de temps, des variations très importantes dans des sens opposés. Une représentation par une courbe donnerait une fausse estimation du prix du blé les années pour lesquelles aucune donnée n'est disponible. L'évolution des salaires par semaine des ouvriers anglais pourrait également être représentée par un histogramme, se superposant à celui du prix du blé (voir le graphique ci-dessous qui est moins lisible). Cependant, les données révèlent une constante augmentation des salaires de 1565 à 1810 sans grande variation, la représentation par une courbe permet de mieux visualiser cette évolution.
```{r cars}
```{r}
summary(cars)
cols <- c("Prix du quart de boiseau de blé" = "lightgray",
"Salaire par semaine" = "#FF3333")
ggplot(data) +
geom_col(aes(x = Year, y = Wheat, fill = "Prix du quart de boiseau de blé"),
width = 1) +
scale_y_continuous(expand = c(0, 0),
sec.axis = sec_axis(data$Wages ~ .,
name = "Salaire par semaine (en shillings)")) +
geom_col(aes(x = Year, y = Wages, fill = "Salaire par semaine"),
width = 1) +
labs(
title = "Evolution du prix du quart de boiseau de blé et du salaire par
semaine de 1565 à 1821",
x = "Année",
y = "Prix du quart de boiseau de blé (en shillings)"
Et on peut aussi aisément inclure des figures. Par exemple:
# Evolution du pouvoir d'achat des ouvrier anglais au cours du temps
```{r pressure, echo=FALSE}
Dans cette étude, le pouvoir d'achat est définie comme la quantité de blé qu'un ouvrier peut acheter avec son salaire hebdomadaire. Un quart de boisseau équivaut à 6,8 kg. Le pouvoir d'achat, en kg, est donc obtenu en divisant le salaire hebdomadaire par le prix du quart de boisseau de blé, puis en multipliant le résultat par le coefficient 6,8 pour passer du quart de boiseau au kilogramme. Ce calcul est effectué pour l'ensemble du jeu de données (execpté pour les années 1815, 1820, 1821 qui n'ont pas de données pour le salaire hebdomadaire). Le graphique suivant montre l'évolution du pouvoir d'achat des ouvriers anglais de 1565 à 1810. Le pouvoir achat semble effectivement avoir augmenté entre 1565 et 1790, mais il a regressé quelque peu entre 1795 et 1810.
geom_col(aes(x = Year, y = PouvoirAchat), width = 2, fill = "#00CCCC",
colour = "black") +
labs(
title = "Evolution du pouvoir d'achat des ouvriers anglais de 1565 à 1810",
x = "Année",
y = "Quantité de blé achetable par semaine (en kg)"
) +
theme_light()
```
```
Vous remarquerez le paramètre `echo = FALSE` qui indique que le code ne doit pas apparaître dans la version finale du document. Nous vous recommandons dans le cadre de ce MOOC de ne pas utiliser ce paramètre car l'objectif est que vos analyses de données soient parfaitement transparentes pour être reproductibles.
# Autre représentation de l'évolution du pouvoir d'achat
Une autre manière de représenter le pouvoir d'achat des ouvriers anglais est d'afficher le prix du quart de boiseau de blé en fonction du salaire par semaine de l'année correspondante. Les années sont affichées à côté des points sous forme d'étiquettes. Un pouvoir d'achat plus important correspond à une année où le salaire hebdomadaire a été important (points se situant sur la partie droite de l'axe x) et où le prix du blé a été faible (partie basse de l'axe y). On voit ainsi se détacher plusieurs points, notamment ceux des années 1760, 1775, 1780, 1785 et 1790. Cependant, cette représentation présente plusieurs incovénients :
- On ne voit pas les étiquettes des points trop proches les uns des autres
- Il est difficile de comprendre l'évolution au cours du temps du pouvoir d'achat (ce que voulait montrer Playfair)
- La corrélation entre le prix du blé, le salaire par semaine et le pouvoir d'achat n'est pas directe. Ainsi, il est difficile de savoir quels points sur le graphe représente les meilleurs pouvoirs d'achat : Faut-il privilégier un salaire fort ou un prix du blé faible ?
Je préfère pour ma part, la représentation précédente, qui présente clairement l'évolution au cours du temps, de l'évolution du pouvoir d'achat des ouvriers anglais.
```{r}
ggplot(data, aes(x = Wages, y = Wheat)) +
geom_point(colour = "#00CCCC") +
geom_label_repel(aes(label = Year),
box.padding = 0.35,
point.padding = 0.5,
segment.color = "grey50"
) +
labs(
title = "Prix du quart de boiseau de blé en fonction du salaire
par semaine de l'année correspondante",
x = "Salaire par semaine (en shillings)",
y = "Prix du quart de boiseau de blé (en shillings) "
) +
theme_light()
```
Comme les résultats ne sont pas stockés dans les fichiers Rmd, pour faciliter la relecture de vos analyses par d'autres personnes, vous aurez donc intérêt à générer un HTML ou un PDF et à le commiter.
Maintenant, à vous de jouer! Vous pouvez effacer toutes ces informations et les remplacer par votre document computationnel.