Commit 6bd54cf8 authored by Christophe's avatar Christophe

Nouveaux noms et md avec Makefile.

parent 14a8e33e
ressources-md: introduction_to_markdown.md introduction_to_markdown_fr.md ressources-md: Module1_1_MaterielSupplementaire_fr.md Module1_2_MaterielSupplementaire_fr.md\
Module1_3_MaterielSupplementaire_fr.md Module1_5_MaterielSupplementaire_fr.md\
Module1_1_SupplementaryMaterial.md Module1_2_SupplementaryMaterial.md
include ../../Makefile.ressources include ../../Makefile.ressources
---
TITLE: Ressources pour la séquence 1 du module 1
AUTHOR: Christophe Pouzat
---\n
broken-links:nil c:nil creator:nil
Notes et références sur la séquence 1 : « Nous utilisons tous des cahiers de notes »
====================================================================================
Manuscrits annotés
------------------
En guise d'entrée dans l'univers des manuscrits annotés, je fais suivre
une petite sélection de passages du premier chapitre de « LA PAGE. DE
L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE » d'Anthony Grafton (Hazan, 2012) :
``` example
Par le mouvement même de sa plume sur la page, il est clair que
Casaubon maîtrise tout ce qu'il lit. Constamment, il souligne des
mots et des expressions, il note en marge des mots clés et des résumés
montrant qu'il a lu attentivement, même quand, précise-t-il dans son
journal intime, il étudie en une journée quarante à cinquante pages
in-folio de grec émaillées de nombreuses abréviations. Les passages
plus importants donnent lieu en marge à des commentaires plus
longs. Sur les pages de titre, Casaubon porte très souvent — un peu
comme Montaigne — un jugement global sur la valeur de l'ouvrage.
Par ailleurs, il note ses réflexions dans des carnets, ou prend
des notes sur des textes qu'il ne peut pas acheter. Tels qu'ils sont
réunis dans sa bibliothèque, ses livres représentent une vie entière de
lecture que l'on peut reconstituer au fil des pages.
```
Pages 32 et 33, à propos d'[Isaac
Casaubon](https://fr.wikipedia.org/wiki/Isaac_Casaubon) (1559-1614).
``` example
Pourtant, Harvey a laissé beaucoup plus que cela, et notamment
des traces des ses lectures sous forme de plus d'une centaine de livres
couverts d'annotations magnifiquement écrites de sa belle écriture
italique — en plus des cahiers dans lesquels il notait des extraits.
Manifestement, Harvey considérait la lecture comme sa profession,
et il en a fait aussi un art. Décennie après décennie, il couche ses
pensées sur l'histoire dans une édition in-folio de 1555 de l'Histoire
romaine de Tite-Live. Ses notes, en latin pour la plupart, parcourent
les marges, se répandent entre les chapitres et remplissent
des feuilles volantes, prenant un aspect particulièrement érudit et
assez rébarbatif.
```
Pages 35 et 36, à propos de [Gabriel
Harvey](https://en.wikipedia.org/wiki/Gabriel_Harvey) (1545-1630).
``` example
... Mais dans l'exemplaire de travail qui subsiste du
texte, l'édition de base de 1549, il [Casaubon] introduit tant d'annotations
précises que les catalogueurs de la Bibliothèque bodléienne, qui n'étaient
pas rompus à la rhétorique, ont classé ce livre imprimé parmi les manuscrits.
```
Page 40.
Armoires à notes de Placcius et Leibniz
---------------------------------------
J'ai trouvé cet exemple dans les travaux d'[Ann
Blair](https://projects.iq.harvard.edu/ablair) comme « [The Rise of
Note-Taking in Early Modern
Europe](https://dash.harvard.edu/handle/1/4774908) » et son livre « [TOO
MUCH TO KNOW. Managing Scholarly Information before the Modern
Age](https://yalebooks.yale.edu/book/9780300165395/too-much-know) »,
publié chez *Yale University Press* en 2011.
La préface de « L'île des pingouins » d'Anatole France
------------------------------------------------------
Étant très loin de connaître Anatole France sur le bout des doigts, j'ai
trouvé la référence citée dans le remarquable article de Keith Thomas
publié par la *London Review of Books*, [le 10 juin
2010](https://www.lrb.co.uk/v32/n11/keith-thomas/diary). Cet article (en
anglais) décrit et discute le travail concret de prise de notes par un
historien, il est de plus très bien écrit et plein d'anecdotes.
Les livres de bord
------------------
Je remercie Joël Caselli de m'avoir aidé à interpréter le contenu du
livre de bord d'Éric Tabarly.
Le projet européen de reconstruction des climats des océans atlantique
et indien (et non pacifique comme je le dis dans le cours !) :
[*Climatological Database for the World's Oceans
1750-1850*](http://webs.ucm.es/info/cliwoc/) ; dispose d'un site
internet très intéressant (mais en anglais).
On trouvera des citations abondantes (et effrayantes) de livres de bord
de navires négriers dans le livre de Marcus Rediker « À bord du
négrier : Une histoire atlantique de la traite » (disponible en édition
de poche).
Un absent : le cahier de laboratoire classique
----------------------------------------------
Je traduis ici la section 6.2 *Notebooks and Records* du remarquable
livre de E. Bright Wilson *An Introduction to Scientific Research*
réimprimé par Dover.
Il est difficile de concevoir un cahier de laboratoire parfait et il est
malheureusement rare d'en trouver un qui soit même à peu près
satisfaisant ; la conservation d'une trace écrite du travail effectué
est néanmoins une source majeure d'efficacité. Il y aura forcément des
gens opposés à un ensemble de règles fixes, mais cela sera probablement
plus rare pour le rituel de garder un cahier que sur d'autres sujets.
Par conséquent, un ensemble de règles qui sont généralement considérées
comme satisfaisantes, voire même essentielles, seront quelque peu
dogmatiquement énoncées.
De grandes découvertes ont été retardées en raison d'une négligente
tenue des traces écrites. L'astronome Le Monnier est ainsi supposé avoir
observé la planète Uranus à plusieurs reprises – avant que son
identification comme planète ait été annoncée par Herschel –, mais a
décidé qu'elle était une étoile fixe. Cela s'explique probablement en
partie par le fait qu'il a écrit ses mesures sur des morceaux de papier,
y compris un sac en papier contenant à l'origine de la poudre pour
cheveux !
Les cahiers de laboratoire doivent être solidement reliés, d'une taille
approximative de 20 x 25 cm, avec des pages numérotées. Les feuilles
séparées sont trop facilement perdues pour être satisfaisantes, d'autant
plus qu'un cahier de laboratoire subit souvent un traitement un peu rude
avec peut-être des projections occasionnelles d'acide \[c'est un
physico-chimiste qui écrit\]. Le cas de mesures répétées constitue une
exception où une ébauche spéciale imprimée est souvent utile si un bon
système est établi pour collecter et relier les feuilles séparées. Les
pages avec des lignes sont généralement utilisées, mais il s'agit d'une
question de goût personnel, et certaines préfèrent des pages blanches ou
à carreaux. Un tampon en caoutchouc peut être utilisé pour fournir des
en-têtes pour les entrées les plus communes.
Les données doivent être entrées directement dans le cahier au moment de
l'observation. Il est intolérable d'utiliser sa mémoire ou des fragments
de papier pour l'enregistrement primaire, du fait de l'inévitabilité des
erreurs et des pertes. Il devrait donc y avoir une bonne place pour le
cahier à coté du poste de travail, et l'expérimentateur ne devrait
jamais être sans son cahier lorsqu'il est en action.
Les données doivent être enregistrées à l'encre, de préférence une encre
permanente, un buvard peut être pratique. Sinon, la trace écrite est
trop éphémère. Les cahiers sont soumis à une utilisation intensive et
les écritures au crayons se détériorent trop rapidement. Lorsque le
cahier peut être utilisé comme preuve pour un brevet, l'usage de l'encre
s'impose.
Des graphiques approximatifs et qualitatifs peuvent être dessinés
directement, mais les graphiques précis sont généralement préparés avec
le papier graphique du type le plus approprié \[pensez au papier
millimétré\]. Ils sont ensuite soigneusement collés dans le cahier, une
page vierge étant découpée afin de compenser l'épaisseur ajoutée.
Les cahiers doivent porter le nom de l'utilisateur et les dates
couvertes. \[\]. Les huit ou dix premières pages devraient être
réservées pour une table des matières. Il s'agit de lignes ajoutées
chronologiquement pour chaque série d'expériences similaires, ainsi que
la référence de la page. La table des matières est extrêmement utile
pour trouver des éléments plus tard et est très simple à suivre. Un
index au dos du cahier est avantageux mais pas indispensable.
Chaque élément devrait être datée et, si plusieurs personnes utilisent
un cahier (généralement pas recommandé), paraphé. Le contenu ne devrait
pas inscrit de façon trop dense sur les pages ; le papier est bon marché
par rapport aux autres dépenses de recherche.
La principale difficulté est de décider ce qu'il faut écrire dans le
cahier. Évidemment, on entre les résultats numériques et les valeurs des
variables indépendantes telles que la température, la composition ou la
pression qui sont directement pertinentes. Il est également nécessaire
d'avoir un système d'entrées ou de références afin que, plus tard, il
soit possible de dire quel appareil a été utilisé et dans quelles
circonstances. Une description assez complète de l'appareil devrait être
conservée. Ensuite, lorsque des modifications sont apportées à
l'appareil, elles doivent être décrites immédiatement dans le cahier. Il
devrait également être possible de retracer la source des courbes
d'étalonnage, des corrections, etc., qui étaient appropriées aux données
d'un jour donné. Il est utile que les exigences relatives à l'écriture
d'un article, d'une thèse ou d'un livre soient gardées à l'esprit. Une
telle tâche, une fois effectuée, entraîne généralement la résolution
solennelle de garder un cahier plus détaillé dans le futur. Essayer de
comprendre le cahier de notes de quelqu'un d'autre constitue aussi un
exercice hautement salutaire. Toutes les références aux appareils, aux
lieux, aux horaires, aux livres, aux articles, aux graphiques et aux
personnes devraient être suffisamment explicites pour être
compréhensibles des années plus tard. **Il devrait être possible de
prendre chaque article scientifique et de montrer exactement où chaque
figure, description ou déclaration est justifiée par des observations
originales dans le cahier de laboratoire, et exactement pourquoi les
nombres final et original diffèrent, si tel est le cas**.
Un énoncé du but de chaque expérience et un résumé des conclusions
obtenues rendent le cahier beaucoup plus utile. Les croquis, dessins et
diagrammes sont essentiels. Comme tant d'observations sont visuelles,
*il est important de noter ce qui est réellement vu, y compris des
éléments qui ne sont pas entièrement compris lors de leur observation*.
Les expériences mauvaises ou non prometteuses, même celles considérées
comme des échecs, devraient être entièrement enregistrées. Elles
représentent un effort qui ne doit pas être gaspillé, car souvent
quelque chose peut être récupéré, même si ce n'est qu'une connaissance
de ce qu'il ne faut pas faire.
Les données doivent toujours être entrées dans leur forme la plus
primaire, et non après un calcul ou une transformation. Si c'est le
rapport de deux observations qui est intéressant, mais si les deux
nombres sont effectivement observés, les deux nombres doivent être
enregistrés. Si le poids précis d'un objet est important, les poids
d'équilibrage individuels utilisés et leur identification devraient être
inclus, c'est-à-dire le numéro de série de leur boîte. Dans le cas
contraire, il devient impossible d'appliquer ultérieurement des
corrections d'étalonnage ou de modifier les corrections si de nouvelles
valeurs apparaissent. Naturellement, ce détail n'est pas nécessaire si
seulement un poids approximatif est impliqué. La forme tabulaire est la
meilleure pour les données numériques. Les unités doivent être notées.
Lorsque des brevets sont impliquées, il peut être souhaitable
d'authentifier les pages des cahiers à intervalles réguliers. Le témoin
devrait être quelqu'un qui comprend le contenu mais qui n'est pas
impliqué dans la recherche. Un contenu ajouté ultérieurement à une page
devrait l'être dans une encre de couleur différente, et toutes les
modifications devraient être paraphées, authentifiées et datées si elles
sont susceptibles d'être importantes. Les entreprises industrielles font
ainsi généralement respecter leurs propres règles en matière de cahiers
de laboratoire.
**Numéros d'identification**. Il est stupide de consacrer du temps et de
l'argent à des enregistrements de différents types \[\] si ceux-ci sont
ensuite perdus ou mélangés. Tout enregistrements qui ne peut être inclut
directement dans le cahier de notes devraient porter une identification
complète indélébile. Un système simple qui a fait ses preuves consiste à
écrire à l'encre sur chaque enregistrement un symbole identifiant le
cahier, puis le numéro de page sur lequel les données auxiliaires sont
enregistrées. Si plus d'un enregistrement sont mentionnés sur une page
du cahier, des lettres ou des chiffres supplémentaires peuvent être
ajoutés. Ainsi, EBW II 85c identifie le troisième enregistrement discuté
à la page 85 du deuxième cahier EBW. C'est mieux qu'un numéro de série
qui ne dit pas, sans clé supplémentaire, où chercher la description le
concernant dans le cahier. Un bon système de classement est
indispensable pour tous les films, les photographies, les schémas, les
graphiques, les diagrammes de circuit, les dessins, les plans, etc. Il
est plus difficile de concevoir des méthodes de dépôt satisfaisantes
pour des matériaux très petits ou très grands. Les premiers sont
facilement perdus et les dernier très volumineux. \[\]
Il est important d'archiver les dessins et les plans à partir desquels
les appareils utilisés ont été construits, même si ces dessins sont
grossiers. Ils doivent être datés, paraphés et étiquetés ; en fait, tout
morceau de papier contenant une information utile devrait être marqué de
la sorte. Lorsqu'un équipement électronique ou autre est fabriqué, son
diagramme doit être soigneusement préparé et entièrement étiqueté avec
toutes les constantes. L'appareil doit porter un numéro de série qui
apparaît également sur ce diagramme. Lorsque des modifications sont
apportées, celles-ci doivent être indiquées sur le schéma et datées ou
un diagramme révisé et daté doit être préparé. L'ancien ne doit pas être
obscurci ou jeté, car il peut être nécessaire pour expliquer des données
antérieures, considérées ultérieurement comme étranges. \[\]
Le but de toute cette pratique de prise de notes est de préserver la
valeur \[le temps et les moyens humains et matériels investis dans la
recherche\]. Elle devrait être soigneusement conçus pour s'adapter aux
conditions de chaque laboratoire et devraient être adéquate mais pas
trop élaborés. **Si l'on exige trop de la nature humaine, le système ne
fonctionnera pas**.
#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline
#+OPTIONS: author:t broken-links:nil c:nil creator:nil
#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t
#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t
#+OPTIONS: timestamp:t title:t toc:t todo:t |:t
#+TITLE: Ressources pour la séquence 1 du module 1
#+DATE: <2019-02-21 jeu.>
#+AUTHOR: Christophe Pouzat
#+EMAIL: christophe.pouzat@parisdescartes.fr
#+LANGUAGE: fr
#+SELECT_TAGS: export
#+EXCLUDE_TAGS: noexport
#+CREATOR: Emacs 26.1 (Org mode 9.1.9)
#+STARTUP: indent
* Notes et références sur la séquence 1 : « Nous utilisons tous des cahiers de notes »
** Manuscrits annotés
En guise d'entrée dans l'univers des manuscrits annotés, je fais suivre une petite sélection de passages du premier chapitre de « LA PAGE. DE L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE » d'Anthony Grafton (Hazan, 2012) :
#+BEGIN_EXAMPLE
Par le mouvement même de sa plume sur la page, il est clair que
Casaubon maîtrise tout ce qu'il lit. Constamment, il souligne des
mots et des expressions, il note en marge des mots clés et des résumés
montrant qu'il a lu attentivement, même quand, précise-t-il dans son
journal intime, il étudie en une journée quarante à cinquante pages
in-folio de grec émaillées de nombreuses abréviations. Les passages
plus importants donnent lieu en marge à des commentaires plus
longs. Sur les pages de titre, Casaubon porte très souvent — un peu
comme Montaigne — un jugement global sur la valeur de l'ouvrage.
Par ailleurs, il note ses réflexions dans des carnets, ou prend
des notes sur des textes qu'il ne peut pas acheter. Tels qu'ils sont
réunis dans sa bibliothèque, ses livres représentent une vie entière de
lecture que l'on peut reconstituer au fil des pages.
#+END_EXAMPLE
Pages 32 et 33, à propos d'[[https://fr.wikipedia.org/wiki/Isaac_Casaubon][Isaac Casaubon]] (1559-1614).
#+BEGIN_EXAMPLE
Pourtant, Harvey a laissé beaucoup plus que cela, et notamment
des traces des ses lectures sous forme de plus d'une centaine de livres
couverts d'annotations magnifiquement écrites de sa belle écriture
italique — en plus des cahiers dans lesquels il notait des extraits.
Manifestement, Harvey considérait la lecture comme sa profession,
et il en a fait aussi un art. Décennie après décennie, il couche ses
pensées sur l'histoire dans une édition in-folio de 1555 de l'Histoire
romaine de Tite-Live. Ses notes, en latin pour la plupart, parcourent
les marges, se répandent entre les chapitres et remplissent
des feuilles volantes, prenant un aspect particulièrement érudit et
assez rébarbatif.
#+END_EXAMPLE
Pages 35 et 36, à propos de [[https://en.wikipedia.org/wiki/Gabriel_Harvey][Gabriel Harvey]] (1545-1630).
#+BEGIN_EXAMPLE
... Mais dans l'exemplaire de travail qui subsiste du
texte, l'édition de base de 1549, il [Casaubon] introduit tant d'annotations
précises que les catalogueurs de la Bibliothèque bodléienne, qui n'étaient
pas rompus à la rhétorique, ont classé ce livre imprimé parmi les manuscrits.
#+END_EXAMPLE
Page 40.
** Armoires à notes de Placcius et Leibniz
J'ai trouvé cet exemple dans les travaux d'[[https://projects.iq.harvard.edu/ablair][Ann Blair]] comme « [[https://dash.harvard.edu/handle/1/4774908][The Rise of Note-Taking in Early Modern Europe]] » et son livre « [[https://yalebooks.yale.edu/book/9780300165395/too-much-know][TOO MUCH TO KNOW. Managing Scholarly Information before the Modern Age]] », publié chez /Yale University Press/ en 2011.
** La préface de « L'île des pingouins » d'Anatole France
Étant très loin de connaître Anatole France sur le bout des doigts, j'ai trouvé la référence citée dans le remarquable article de Keith Thomas publié par la /London Review of Books/, [[https://www.lrb.co.uk/v32/n11/keith-thomas/diary][le 10 juin 2010]]. Cet article (en anglais) décrit et discute le travail concret de prise de notes par un historien, il est de plus très bien écrit et plein d'anecdotes.
** Les livres de bord
Je remercie Joël Caselli de m'avoir aidé à interpréter le contenu du livre de bord d'Éric Tabarly.
Le projet européen de reconstruction des climats des océans atlantique et indien (et non pacifique comme je le dis dans le cours !) : [[http://webs.ucm.es/info/cliwoc/][/Climatological Database for the World's Oceans 1750-1850/]] ; dispose d'un site internet très intéressant (mais en anglais).
On trouvera des citations abondantes (et effrayantes) de livres de bord de navires négriers dans le livre de Marcus Rediker « À bord du négrier : Une histoire atlantique de la traite » (disponible en édition de poche).
** Un absent : le cahier de laboratoire classique
Je traduis ici la section 6.2 /Notebooks and Records/ du remarquable livre de E. Bright Wilson /An Introduction to Scientific Research/ réimprimé par Dover.
Il est difficile de concevoir un cahier de laboratoire parfait et il est malheureusement rare d'en trouver un qui soit même à peu près satisfaisant ; la conservation d'une trace écrite du travail effectué est néanmoins une source majeure d'efficacité. Il y aura forcément des gens opposés à un ensemble de règles fixes, mais cela sera probablement plus rare pour le rituel de garder un cahier que sur d'autres sujets. Par conséquent, un ensemble de règles qui sont généralement considérées comme satisfaisantes, voire même essentielles, seront quelque peu dogmatiquement énoncées.
De grandes découvertes ont été retardées en raison d'une négligente tenue des traces écrites. L'astronome Le Monnier est ainsi supposé avoir observé la planète Uranus à plusieurs reprises -- avant que son identification comme planète ait été annoncée par Herschel --, mais a décidé qu'elle était une étoile fixe. Cela s'explique probablement en partie par le fait qu'il a écrit ses mesures sur des morceaux de papier, y compris un sac en papier contenant à l'origine de la poudre pour cheveux !
Les cahiers de laboratoire doivent être solidement reliés, d'une taille approximative de 20 x 25 cm, avec des pages numérotées. Les feuilles séparées sont trop facilement perdues pour être satisfaisantes, d'autant plus qu'un cahier de laboratoire subit souvent un traitement un peu rude avec peut-être des projections occasionnelles d'acide [c'est un physico-chimiste qui écrit]. Le cas de mesures répétées constitue une exception où une ébauche spéciale imprimée est souvent utile si un bon système est établi pour collecter et relier les feuilles séparées. Les pages avec des lignes sont généralement utilisées, mais il s'agit d'une question de goût personnel, et certaines préfèrent des pages blanches ou à carreaux. Un tampon en caoutchouc peut être utilisé pour fournir des en-têtes pour les entrées les plus communes.
Les données doivent être entrées directement dans le cahier au moment de l'observation. Il est intolérable d'utiliser sa mémoire ou des fragments de papier pour l'enregistrement primaire, du fait de l'inévitabilité des erreurs et des pertes. Il devrait donc y avoir une bonne place pour le cahier à coté du poste de travail, et l'expérimentateur ne devrait jamais être sans son cahier lorsqu'il est en action.
Les données doivent être enregistrées à l'encre, de préférence une encre permanente, un buvard peut être pratique. Sinon, la trace écrite est trop éphémère. Les cahiers sont soumis à une utilisation intensive et les écritures au crayons se détériorent trop rapidement. Lorsque le cahier peut être utilisé comme preuve pour un brevet, l'usage de l'encre s'impose.
Des graphiques approximatifs et qualitatifs peuvent être dessinés directement, mais les graphiques précis sont généralement préparés avec le papier graphique du type le plus approprié [pensez au papier millimétré]. Ils sont ensuite soigneusement collés dans le cahier, une page vierge étant découpée afin de compenser l'épaisseur ajoutée.
Les cahiers doivent porter le nom de l'utilisateur et les dates couvertes. [...]. Les huit ou dix premières pages devraient être réservées pour une table des matières. Il s'agit de lignes ajoutées chronologiquement pour chaque série d'expériences similaires, ainsi que la référence de la page. La table des matières est extrêmement utile pour trouver des éléments plus tard et est très simple à suivre. Un index au dos du cahier est avantageux mais pas indispensable.
Chaque élément devrait être datée et, si plusieurs personnes utilisent un cahier (généralement pas recommandé), paraphé. Le contenu ne devrait pas inscrit de façon trop dense sur les pages ; le papier est bon marché par rapport aux autres dépenses de recherche.
La principale difficulté est de décider ce qu'il faut écrire dans le cahier. Évidemment, on entre les résultats numériques et les valeurs des variables indépendantes telles que la température, la composition ou la pression qui sont directement pertinentes. Il est également nécessaire d'avoir un système d'entrées ou de références afin que, plus tard, il soit possible de dire quel appareil a été utilisé et dans quelles circonstances. Une description assez complète de l'appareil devrait être conservée. Ensuite, lorsque des modifications sont apportées à l'appareil, elles doivent être décrites immédiatement dans le cahier. Il devrait également être possible de retracer la source des courbes d'étalonnage, des corrections, etc., qui étaient appropriées aux données d'un jour donné. Il est utile que les exigences relatives à l'écriture d'un article, d'une thèse ou d'un livre soient gardées à l'esprit. Une telle tâche, une fois effectuée, entraîne généralement la résolution solennelle de garder un cahier plus détaillé dans le futur. Essayer de comprendre le cahier de notes de quelqu'un d'autre constitue aussi un exercice hautement salutaire. Toutes les références aux appareils, aux lieux, aux horaires, aux livres, aux articles, aux graphiques et aux personnes devraient être suffisamment explicites pour être compréhensibles des années plus tard. *Il devrait être possible de prendre chaque article scientifique et de montrer exactement où chaque figure, description ou déclaration est justifiée par des observations originales dans le cahier de laboratoire, et exactement pourquoi les nombres final et original diffèrent, si tel est le cas*.
Un énoncé du but de chaque expérience et un résumé des conclusions obtenues rendent le cahier beaucoup plus utile.
Les croquis, dessins et diagrammes sont essentiels. Comme tant d'observations sont visuelles, /il est important de noter ce qui est réellement vu, y compris des éléments qui ne sont pas entièrement compris lors de leur observation/.
Les expériences mauvaises ou non prometteuses, même celles considérées comme des échecs, devraient être entièrement enregistrées. Elles représentent un effort qui ne doit pas être gaspillé, car souvent quelque chose peut être récupéré, même si ce n'est qu'une connaissance de ce qu'il ne faut pas faire.
Les données doivent toujours être entrées dans leur forme la plus primaire, et non après un calcul ou une transformation. Si c'est le rapport de deux observations qui est intéressant, mais si les deux nombres sont effectivement observés, les deux nombres doivent être enregistrés. Si le poids précis d'un objet est important, les poids d'équilibrage individuels utilisés et leur identification devraient être inclus, c'est-à-dire le numéro de série de leur boîte. Dans le cas contraire, il devient impossible d'appliquer ultérieurement des corrections d'étalonnage ou de modifier les corrections si de nouvelles valeurs apparaissent. Naturellement, ce détail n'est pas nécessaire si seulement un poids approximatif est impliqué. La forme tabulaire est la meilleure pour les données numériques. Les unités doivent être notées.
Lorsque des brevets sont impliquées, il peut être souhaitable d'authentifier les pages des cahiers à intervalles réguliers. Le témoin devrait être quelqu'un qui comprend le contenu mais qui n'est pas impliqué dans la recherche. Un contenu ajouté ultérieurement à une page devrait l'être dans une encre de couleur différente, et toutes les modifications devraient être paraphées, authentifiées et datées si elles sont susceptibles d'être importantes. Les entreprises industrielles font ainsi généralement respecter leurs propres règles en matière de cahiers de laboratoire.
*Numéros d'identification*. Il est stupide de consacrer du temps et de l'argent à des enregistrements de différents types [...] si ceux-ci sont ensuite perdus ou mélangés. Tout enregistrements qui ne peut être inclut directement dans le cahier de notes devraient porter une identification complète indélébile. Un système simple qui a fait ses preuves consiste à écrire à l'encre sur chaque enregistrement un symbole identifiant le cahier, puis le numéro de page sur lequel les données auxiliaires sont enregistrées. Si plus d'un enregistrement sont mentionnés sur une page du cahier, des lettres ou des chiffres supplémentaires peuvent être ajoutés. Ainsi, EBW II 85c identifie le troisième enregistrement discuté à la page 85 du deuxième cahier EBW. C'est mieux qu'un numéro de série qui ne dit pas, sans clé supplémentaire, où chercher la description le concernant dans le cahier.
Un bon système de classement est indispensable pour tous les films, les photographies, les schémas, les graphiques, les diagrammes de circuit, les dessins, les plans, etc. Il est plus difficile de concevoir des méthodes de dépôt satisfaisantes pour des matériaux très petits ou très grands. Les premiers sont facilement perdus et les dernier très volumineux. [...]
Il est important d'archiver les dessins et les plans à partir desquels les appareils utilisés ont été construits, même si ces dessins sont grossiers. Ils doivent être datés, paraphés et étiquetés ; en fait, tout morceau de papier contenant une information utile devrait être marqué de la sorte. Lorsqu'un équipement électronique ou autre est fabriqué, son diagramme doit être soigneusement préparé et entièrement étiqueté avec toutes les constantes. L'appareil doit porter un numéro de série qui apparaît également sur ce diagramme. Lorsque des modifications sont apportées, celles-ci doivent être indiquées sur le schéma et datées ou un diagramme révisé et daté doit être préparé. L'ancien ne doit pas être obscurci ou jeté, car il peut être nécessaire pour expliquer des données antérieures, considérées ultérieurement comme étranges. [...]
Le but de toute cette pratique de prise de notes est de préserver la valeur [le temps et les moyens humains et matériels investis dans la recherche]. Elle devrait être soigneusement conçus pour s'adapter aux conditions de chaque laboratoire et devraient être adéquate mais pas trop élaborés. *Si l'on exige trop de la nature humaine, le système ne fonctionnera pas*.
---
TITLE: We all use notebooks (Module 1 sequence 1)
AUTHOR: Christophe Pouzat
---\n
broken-links:nil c:nil creator:nil
Introduction
============
This sequence discusses a much wider issue than *reproducible research*
(RR). Implementing RR requires thorough note-taking and note-taking
concerns everyone. The purpose of this sequence is therefore to remind
the reader / auditor that he/she already knows: **note-taking concerns
everyone**. Few examples are used to that end.
Annotated manuscripts
=====================
As an introduction to the world of annotated manuscripts, I quote now a
small selection of passages from the first chapter of *LA PAGE. DE
L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE* (THE PAGE. FROM ANTIQUITY TO THE
DIGITAL ERA) by Anthony Grafton (Hazan, 2012):
``` example
By the very movement of his pen on the page, it is clear that
Casaubon masters everything he reads. He constantly underlines the importance of
words and expressions, he notes in the margin key words and summaries
showing that he has read carefully, even when, he states in his
diary that he studied in one day forty to fifty pages
in-folio of Greek with many abbreviations. The most important
passages give rise to longer comments in the margin.
On the title pages, Casaubon very often carries - a little
as Montaigne - a global judgment on the value of the work.
In addition, he notes his thoughts in notebooks, or takes
notes on texts he can't buy. As they are
gathered in his library, his books represent a whole life of
reading that can be reconstructed over the pages.
```
Pages 32 and 33, about [Isaac
Casaubon](https://en.wikipedia.org/wiki/Isaac_Casaubon) (1559-1614).
``` example
Yet Harvey left much more than that, including
traces of his readings in the form of more than a hundred books
covered with wonderfully written annotations of his beautiful slanted
writing - in addition to the notebooks in which he wrote extracts.
Clearly, Harvey considered reading to be his profession,
and he made it an art too. Decade after decade, he lays down his
thoughts on history in an in-folio edition of 1555 of Livy's "History
of Rome". His notes, mostly in Latin, go through
the margins, spread between chapters and fill in
loose sheets, taking on a particularly erudite aspect and
quite daunting.
```
Pages 35 and 36, on [Gabriel
Harvey](https://en.wikipedia.org/wiki/Gabriel_Harvey) (1545-1630).
``` example
... But in the remaining working copy of the
text, the basic edition of 1549, he [Casaubon] introduced so many annotations
that the cataloguers of the Bodleian Library, who were only
not familiar with rhetoric, have classified this printed book as a manuscript.
```
Page 40.
Note cabinets from Placcius and Leibniz
=======================================
I found this example in Ann Blair's work such as [The Rise of
Note-Taking in Early Modern
Europe](https://dash.harvard.edu/bitstream/handle/1/4774908/blair_notetaking.pdf?sequence=1)
and her book *TOO MUCH TO KNOW. Managing Scholarly Information before
the Modern Age*, published by Yale University Press in 2011.
On the preface to *Penguin Island*
==================================
The text can be found *legally* at several places, the [Project
Gutenberg](https://en.wikipedia.org/wiki/Project_Gutenberg) one is
missing the "Preface", so don't use it, go to one of the versions
available on [Internet
Archive](https://archive.org/search.php?query=title%3Apenguin%20island%20AND%20-contributor%3Agutenberg%20AND%20mediatype%3Atexts).
The importance of the preface in illustrated by the following two
quotations:
> One word more if you want your book to be well received, lose no
> opportunity for exalting the virtues on which society is based —
> attachment to wealth, pious senti- ments, and especially resignation
> on the part of the poor, which latter is the very foundation of order.
> Proclaim, sir, that the origins of property — nobility and police —
> are treat- ed in your history with the respect which these
> institutions deserve. Make it known that you admit the supernatural
> when it presents itself. On these conditions you will succeed in good
> society.
And more importantly for our present subject:
> The idea occurred to me, in the month of June last year, to go and
> consult on the origins and progress of Penguin art, the lamented M.
> Fulgence Tapir, the learned author of the ‘Universal Annals of
> Painting, Sculpture and Architecture’
>
> Having been shown into his study, I found seated before a roll-top
> desk, beneath a frightful mass of papers, an amaz- ingly short-sighted
> little man whose eyelids blinked behind his gold-mounted spectacles.
>
> To make up for the defect of his eyes his long and mobile nose,
> endowed with an exquisite sense of touch, explored the sensible world.
> By means of this organ Fulgence Tapir put himself in contact with art
> and beauty. It is observed that in France, as a general rule, musical
> critics are deaf and art critics are blind. This allows them the
> collectedness neces- sary for æsthetic ideas. Do you imagine that with
> eyes capable of perceiving the forms and colours with which mysterious
> nature envelops herself, Fulgence Tapir would have raised himself, on
> a mountain of printed and manuscript docu- ments, to the summit of
> doctrinal spiritualism, or that he would have conceived that mighty
> theory which makes the arts of all tunes and countries converge
> towards the Institute of France, their supreme end?
>
> The walls of the study, the floor, and even the ceiling were loaded
> with overflowing bundles, pasteboard boxes swollen beyond measure,
> boxes in which were compressed an in- numerable multitude of small
> cards covered with writing. I beheld in admiration minted with terror
> the cataracts of erudition that threatened to burst forth.
>
> ‘Master,’ said I in feeling tones, ‘I throw myself upon your kindness
> and your knowledge, both of which are inexhaustible. Would you consent
> to guide me in my arduous researches into the origins of Penguin art?’
>
> ‘Sir,’ answered the Master, ‘I possess all art, you under- stand me,
> all art, on cards classed alphabetically and in order of subjects. I
> consider it my duty to place at your dis- posal all that relates to
> the Penguins. Get on that ladder and take out that box you see above.
> You will find in it every- thing you require.’
>
> I tremblingly obeyed. But scarcely had I opened the fatal box than
> some blue cards escaped from it, and slipping through my fingers,
> began to rain down. Almost immediate- ly, acting in sympathy, the
> neighbouring boxes opened, and there flowed streams of pink, green,
> and white cards, and by degrees, from all the boxes, differently
> coloured cards were poured out murmuring like a waterfall on a
> mountain side in April. In a minute they covered the floor with a
> thick layer of paper. Issuing from their inexhaustible reservoirs with
> a roar that continually grew in force, each second in- creased the
> vehemence of their torrential fall. Swamped up to the knees in cards,
> Fulgence Tapir observed the cataclysm with attentive nose. He
> recognised its cause and grew pale with fright
>
> ‘What a mass of art !’ he exclaimed.
>
> I called to him and leaned forward to help him mount the ladder which
> bent under the shower. It was too late. Over- whelmed, desperate,
> pitiable, his velvet smoking-cap and his gold-mounted spectacles
> having fallen from him, he vainly opposed his short arms to the flood
> which had now mounted to his arm-pits. Suddenly a terrible spurt of
> cards arose and enveloped him in a gigantic whirlpool. During the
> space of a second I could see in the gulf the shining skull and little
> fat hands of the scholar, then it closed up and the deluge kept on
> pouring over what was silence and immobility. In dread lest I in my
> turn should be swallowed up ladder and all I maae my escape through
> the topmost pane of the window.
The logbooks
============
I would like to thank Joël Caselli for helping me interpret the content
of Éric Tabarly's logbook.
This example is only superficially anecdotal. Ten years ago, a European
project was aiming at estimating the Atlantic and Indian Oceans climates
during the 18th century using logbooks from ships of the West- and
East-India companies from the Kingdoms of Portugal, Spain, Holland,
Britain and France. See the [Climatological Database for the World's
Oceans 1750-1850](http://webs.ucm.es/info/cliwoc/).
In the same vein, logbooks from slave ships give a lot of quantitative
information about the slave trade between Africa and the "New World"
(see Marcus Rediker frightening book *The Slave Ship: A Human History*,
2007).
One missing: the classic laboratory notebook
============================================
I quote here Sec. 6.2 `Notebooks and Records` of the highly recommended
reading *An Introduction to Scientific Research* by E. Bright Wilson
(reprinted by Dover):
> It is hard to conceive of a perfect laboratory notebook, and it is
> regrettably rare to find one that is even moderately satisfactory; yet
> the keeping of good records of work done is a major key to efficiency.
> There are bound to be dissenters to any set of fixed rules, but these
> will probably be rarer for the ritual of notebook keeping than
> elsewhere. Consequently, a set of rules which is generally regarded as
> satisfactory, or even as essential, will be somewhat dogmatically
> stated.
>
> Some great discoveries have been delayed because of careless record
> keeping. Thus it is related that the astronomer Le Monnier observed
> the planet Uranus on several occasions, before its identification as a
> planet had been announced by Herschel, but decided that it was a fixed
> star. This was probably due in part to the fact that he wrote his
> measurements on scraps of paper, including a paper bag originally
> containing hair powder!
>
> Laboratory notebooks should be permanently and strongly bound and of
> sufficient size, say roughly 8 by 10 inches, with numbered pages.
> Loose-leaf pages or separate sheets are too easily lost to be
> satisfactory, especially since a laboratory notebook gets rather rough
> handling, and perhaps an occasional dousing with acid. An exception is
> the case of routine, repeated measurements, where a printed or
> mimeographed special blank is often useful if a good system is
> established for collecting and binding the separate sheets. Ruled
> pages are generally used, but this is a matter of personal taste, and
> some prefer unruled or cross-sectional pages. A rubber stamp may be
> used to provide headings for routine entries.
>
> Data should be entered directly into the notebook at the time of
> observation. It is intolerable to use memory or scraps of paper for
> primary recording, because of the inevitability of error and loss.
> Therefore, there should be a good place for the notebook at the
> operating position, and the experimenter should never be without his
> book when in action. Data should be recorded in ink, preferably a
> permanent brand, and a blotter should be handy. Otherwise the record
> is too ephemeral. Notebooks get hard usage, and pencil smudges
> rapidly. When the notebook may be used as evidence in a patent case,
> ink is much preferred.
>
> Rough, qualitative graphs can be drawn in directly, but more careful
> ones are usually best prepared on graph paper of the most appropriate
> type These are then carefully pasted in the notebook, a blank page
> being cut out in order to compensate for the bulk of the one added.
>
> Notebooks should carry the name of the user and the dates covered. It
> is convenient in a research group to agree on a standard size, but
> then some sort of external identification is a great timesaver. The
> first eight or ten pages should be reserved for a table of contents.
> This consists of a line added chronologically for each series of
> similar experiments, together with the page reference. The table of
> contents is enormously helpful in finding items later and is very
> simple to keep up. An index in the back of the book is advantageous
> but not indispensable.
>
> Each entry should be dated and, if several individuals use one book
> (not generally recommended), initialed. The material should not be
> crowded on the pages; paper is cheap compared with other research
> expenses. The principal difficulty is in deciding what to put in.
> Obviously, one enters numerical results and those values of the
> independent variables such as temperature, composition, or pressure
> which are directly concerned. It is also necessary to have a system of
> entries or references so that years later it will be possible to tell
> what apparatus was used and under what circumstances. Somewhere there
> should be available a rather complete description of the apparatus.
> Then, when modifications are made, they should be described
> immediately in the notebook. It should also be possible to trace back
> the source of calibration curves, corrections, etc., which were
> appropriate to the data of a given day. It is helpful if the
> requirements for writing a paper, a thesis, or a book are kept in
> mind. Such a task, once carried out, usually leads to solemn resolves
> to keep a more careful notebook in the future. Also extremely salutary
> is the effect of trying to figure out something from another’s book.
> All references to apparatus, places, times, books, papers, graphs, and
> people should be sufficiently explicit to be understandable years
> later. It should be possible to take each scientific paper and show
> just where every figure, description, or statement in it is backed up
> by original observations in the laboratory notebook, and exactly why
> the final and original numbers differ, if they do.
>
> Some statement of the purpose of each experiment and a summary of the
> conclusions reached make the notebook vastly more useful. Sketches,
> drawings, and diagrams are essential. Since so much observation is
> visual, it is important to record what is actually seen, including
> things not fully understood at the time. Bad or unpromising
> experiments, even those deemed failures, should be fully recorded.
> They represent an investment of effort which should not be thrown
> away, because often something can be salvaged, even if it is only a
> knowledge of what not to do. Data should always be entered in their
> most primary form, not after recalculation or transformation. If it is
> a ratio of two observations which is of interest but it is the two
> numbers which are actually observed, the two numbers should be
> recorded. If the precise weight of an object is important, the
> individual balance weights used and their identification should be
> included, i.e., the serial number of the box. Otherwise it is not
> possible to apply calibration corrections later or to change the
> corrections if new values appear. Naturally, this detail is not
> necessary if only a rough weight is involved. A tabular form is best
> for numerical data. Units should be noted.
>
> Where patent questions are involved, it may be desirable to witness
> and even to notarize notebook pages at intervals. The witness should
> be someone who understands the material but is not a coinventor.
> Material added to a page at a later date should be in a
> different-colored ink, and any alterations should be initialed,
> witnessed, and dated if they are likely to be important. Industrial
> concerns usually enforce their own rules concerning patent matters.
>
> Identification Numbers. It is foolish to spend time and money making
> records of various kinds such as pen-and-ink recorder sheets,
> photographic records, or spectra if these are then lost or mixed up.
> Every such record should carry indelibly on it complete
> identification. A simple system of doing this which has worked well in
> practice is to write in ink on each record a symbol identifying the
> notebook and then the page number on which the auxiliary data are
> recorded. If more than one record occurs on a page, letters or further
> numerals can be added. Thus EBW II 85c would identify the third record
> discussed on page 85 of the second EBW notebook. This is better than a
> serial number, which doesn’t tell without extra keying where to look
> for the notebook entry. A good filing system is indispensable for all
> films, photographs, charts, graphs, circuit diagrams, drawings,
> blueprints, etc. It is hardest to devise satisfactory filing methods
> for either very small or very large material. The former are easily
> lost and the latter very bulky. Small envelopes are useful for tiny
> films and also protect them from scratching.
>
> It is thoroughly worth while to save drawings and blueprints from
> which apparatus has been built, however rough these may be. These
> should be dated, initialed, and labeled; in fact every piece of paper
> containing useful material should be so marked. When an electronic or
> other similar piece of equipment is built, a careful circuit diagram
> should be prepared, fully labeled with all constants. The apparatus
> should carry a serial number which also appears on the diagram. When
> changes are made, these should be indicated on the diagram and dated
> or a revised, dated diagram made. The old one should not be obscured
> or thrown away because it may be required to explain earlier data,
> later found to be peculiar. It is convenient to draw such diagrams on
> tracing paper with a good black pencil. Cheap ozalid or similarly
> processed copies can then be made. One should be kept in the
> laboratory, where it will usually prove indispensable for trouble
> shooting. Sooner or later, however, it will be used as scratch paper
> by someone with a brilliant idea to demonstrate; so the official copy
> and spares should be filed elsewhere. A great deal of time is
> unnecessarily wasted poking around the insides of an apparatus trying
> to find out where some wire goes. \[…\] Labeling. Related to the
> question of notebooks and records is that of labeling. Naturally
> bottles of chemicals must carry adequate labels, which should include
> not only the chemical name but also the source, or a notebook page
> reference if there has been any special treatment, or initials and
> date. One research worker departed from a certain laboratory to take
> another job and left a good deal of material behind. One bottle of
> clear liquid carried no label. Those assigned to clean up examined it,
> smelled it, finally concluded that it was water, and poured it down
> the drain. It was water, all right—heavy water at $30 an ounce. Some
> supervisors relentlessly throw out unlabeled bottles on sight. It only
> needs to be done once or twice. Labels are also essential on all kinds
> of specimens, pieces of apparatus, gadgets, etc. Controls on apparatus
> should be labeled and the apparatus itself numbered. Every laboratory
> has orphaned pieces of equipment, often electronic, of which no one
> knows the nature and purpose. The notebook page system is good here,
> provided the old notebooks can be found. Labels should be attached so
> that they will stay. Metal tags can be riveted on. Paper labels should
> be covered with some sort of varnish.
>
> The whole purpose of all these recording systems is to preserve
> values. They should be carefully thought out to fit the conditions of
> each laboratory and should be adequate but not overelaborate. If too
> much is demanded of human nature, the system will break down.
#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline
#+OPTIONS: author:t broken-links:nil c:nil creator:nil
#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t
#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t
#+OPTIONS: timestamp:t title:t toc:t todo:t |:t
#+TITLE: We all use notebooks (Module 1 sequence 1)
#+DATE: <2019-03-21 jeu.>
#+AUTHOR: Christophe Pouzat
#+EMAIL: christophe.pouzat@parisdescartes.fr
#+LANGUAGE: en
#+SELECT_TAGS: export
#+EXCLUDE_TAGS: noexport
#+CREATOR: Emacs 26.1 (Org mode 9.1.9)
* Introduction
This sequence discusses a much wider issue than /reproducible research/ (RR). Implementing RR requires thorough note-taking and note-taking concerns everyone. The purpose of this sequence is therefore to remind the reader / auditor that he/she already knows: *note-taking concerns everyone*. Few examples are used to that end.
* Annotated manuscripts
As an introduction to the world of annotated manuscripts, I quote now a small selection of passages from the first chapter of /LA PAGE. DE L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE/ (THE PAGE. FROM ANTIQUITY TO THE DIGITAL ERA) by Anthony Grafton (Hazan, 2012):
#+BEGIN_EXAMPLE
By the very movement of his pen on the page, it is clear that
Casaubon masters everything he reads. He constantly underlines the importance of
words and expressions, he notes in the margin key words and summaries
showing that he has read carefully, even when, he states in his
diary that he studied in one day forty to fifty pages
in-folio of Greek with many abbreviations. The most important
passages give rise to longer comments in the margin.
On the title pages, Casaubon very often carries - a little
as Montaigne - a global judgment on the value of the work.
In addition, he notes his thoughts in notebooks, or takes
notes on texts he can't buy. As they are
gathered in his library, his books represent a whole life of
reading that can be reconstructed over the pages.
#+END_EXAMPLE
Pages 32 and 33, about [[https://en.wikipedia.org/wiki/Isaac_Casaubon][Isaac Casaubon]] (1559-1614).
#+BEGIN_EXAMPLE
Yet Harvey left much more than that, including
traces of his readings in the form of more than a hundred books
covered with wonderfully written annotations of his beautiful slanted
writing - in addition to the notebooks in which he wrote extracts.
Clearly, Harvey considered reading to be his profession,
and he made it an art too. Decade after decade, he lays down his
thoughts on history in an in-folio edition of 1555 of Livy's "History
of Rome". His notes, mostly in Latin, go through
the margins, spread between chapters and fill in
loose sheets, taking on a particularly erudite aspect and
quite daunting.
#+END_EXAMPLE
Pages 35 and 36, on [[https://en.wikipedia.org/wiki/Gabriel_Harvey][Gabriel Harvey]] (1545-1630).
#+BEGIN_EXAMPLE
... But in the remaining working copy of the
text, the basic edition of 1549, he [Casaubon] introduced so many annotations
that the cataloguers of the Bodleian Library, who were only
not familiar with rhetoric, have classified this printed book as a manuscript.
#+END_EXAMPLE
Page 40.
* Note cabinets from Placcius and Leibniz
I found this example in Ann Blair's work such as [[https://dash.harvard.edu/bitstream/handle/1/4774908/blair_notetaking.pdf?sequence=1][The Rise of Note-Taking in Early Modern Europe]] and her book /TOO MUCH TO KNOW. Managing Scholarly Information before the Modern Age/, published by Yale University Press in 2011.
* On the preface to /Penguin Island/
The text can be found /legally/ at several places, the [[https://en.wikipedia.org/wiki/Project_Gutenberg][Project Gutenberg]] one is missing the "Preface", so don't use it, go to one of the versions available on [[https://archive.org/search.php?query=title%3Apenguin%20island%20AND%20-contributor%3Agutenberg%20AND%20mediatype%3Atexts][Internet Archive]]. The importance of the preface in illustrated by the following two quotations:
#+BEGIN_QUOTE
One word more if you want your book to be well
received, lose no opportunity for exalting the virtues on
which society is based — attachment to wealth, pious senti-
ments, and especially resignation on the part of the poor,
which latter is the very foundation of order. Proclaim, sir,
that the origins of property — nobility and police — are treat-
ed in your history with the respect which these institutions
deserve. Make it known that you admit the supernatural
when it presents itself. On these conditions you will succeed
in good society.
#+END_QUOTE
And more importantly for our present subject:
#+BEGIN_QUOTE
The idea occurred to me, in the month of June last year, to
go and consult on the origins and progress of Penguin art,
the lamented M. Fulgence Tapir, the learned author of the
‘Universal Annals of Painting, Sculpture and Architecture’
Having been shown into his study, I found seated before a
roll-top desk, beneath a frightful mass of papers, an amaz-
ingly short-sighted little man whose eyelids blinked behind
his gold-mounted spectacles.
To make up for the defect of his eyes his long and mobile
nose, endowed with an exquisite sense of touch, explored the
sensible world. By means of this organ Fulgence Tapir put
himself in contact with art and beauty. It is observed that in
France, as a general rule, musical critics are deaf and art
critics are blind. This allows them the collectedness neces-
sary for æsthetic ideas. Do you imagine that with eyes capable
of perceiving the forms and colours with which mysterious
nature envelops herself, Fulgence Tapir would have raised
himself, on a mountain of printed and manuscript docu-
ments, to the summit of doctrinal spiritualism, or that he
would have conceived that mighty theory which makes the
arts of all tunes and countries converge towards the Institute
of France, their supreme end?
The walls of the study, the floor, and even the ceiling were
loaded with overflowing bundles, pasteboard boxes swollen
beyond measure, boxes in which were compressed an in-
numerable multitude of small cards covered with writing. I
beheld in admiration minted with terror the cataracts of
erudition that threatened to burst forth.
‘Master,’ said I in feeling tones, ‘I throw myself upon
your kindness and your knowledge, both of which are
inexhaustible. Would you consent to guide me in my
arduous researches into the origins of Penguin art?’
‘Sir,’ answered the Master, ‘I possess all art, you under-
stand me, all art, on cards classed alphabetically and in
order of subjects. I consider it my duty to place at your dis-
posal all that relates to the Penguins. Get on that ladder and
take out that box you see above. You will find in it every-
thing you require.’
I tremblingly obeyed. But scarcely had I opened the fatal
box than some blue cards escaped from it, and slipping
through my fingers, began to rain down. Almost immediate-
ly, acting in sympathy, the neighbouring boxes opened, and
there flowed streams of pink, green, and white cards, and by
degrees, from all the boxes, differently coloured cards were
poured out murmuring like a waterfall on a mountain side
in April. In a minute they covered the floor with a thick
layer of paper. Issuing from their inexhaustible reservoirs
with a roar that continually grew in force, each second in-
creased the vehemence of their torrential fall. Swamped up
to the knees in cards, Fulgence Tapir observed the cataclysm
with attentive nose. He recognised its cause and grew pale
with fright
‘What a mass of art !’ he exclaimed.
I called to him and leaned forward to help him mount the
ladder which bent under the shower. It was too late. Over-
whelmed, desperate, pitiable, his velvet smoking-cap and his
gold-mounted spectacles having fallen from him, he vainly
opposed his short arms to the flood which had now mounted
to his arm-pits. Suddenly a terrible spurt of cards arose and
enveloped him in a gigantic whirlpool. During the space of a
second I could see in the gulf the shining skull and little fat
hands of the scholar, then it closed up and the deluge kept
on pouring over what was silence and immobility. In dread
lest I in my turn should be swallowed up ladder and all I
maae my escape through the topmost pane of the window.
#+END_QUOTE
* The logbooks
I would like to thank Joël Caselli for helping me interpret the content of Éric Tabarly's logbook.
This example is only superficially anecdotal. Ten years ago, a European project was aiming at estimating the Atlantic and Indian Oceans climates during the 18th century using logbooks from ships of the West- and East-India companies from the Kingdoms of Portugal, Spain, Holland, Britain and France. See the [[http://webs.ucm.es/info/cliwoc/][Climatological Database for the World's Oceans 1750-1850]].
In the same vein, logbooks from slave ships give a lot of quantitative information about the slave trade between Africa and the "New World" (see Marcus Rediker frightening book /The Slave Ship: A Human History/, 2007).
* One missing: the classic laboratory notebook
I quote here Sec. 6.2 =Notebooks and Records= of the highly recommended reading /An Introduction to Scientific Research/ by E. Bright Wilson (reprinted by Dover):
#+BEGIN_QUOTE
It is hard to conceive of a perfect laboratory notebook, and it is regrettably rare to find one that is even moderately
satisfactory; yet the keeping of good records of work done is a major key to efficiency. There are bound to be dissenters
to any set of fixed rules, but these will probably be rarer for the ritual of notebook keeping than elsewhere. Consequently,
a set of rules which is generally regarded as satisfactory, or even as essential, will be somewhat dogmatically stated.
Some great discoveries have been delayed because of careless record keeping. Thus it is related that the astronomer Le Monnier
observed the planet Uranus on several occasions, before its identification as a planet had been announced by Herschel, but
decided that it was a fixed star. This was probably due in part to the fact that he wrote his measurements on scraps of paper,
including a paper bag originally containing hair powder!
Laboratory notebooks should be permanently and strongly bound and of sufficient size, say roughly 8 by 10 inches, with numbered
pages. Loose-leaf pages or separate sheets are too easily lost to be satisfactory, especially since a laboratory notebook gets
rather rough handling, and perhaps an occasional dousing with acid. An exception is the case of routine, repeated measurements,
where a printed or mimeographed special blank is often useful if a good system is established for collecting and binding the
separate sheets. Ruled pages are generally used, but this is a matter of personal taste, and some prefer unruled or cross-sectional
pages. A rubber stamp may be used to provide headings for routine entries.
Data should be entered directly into the notebook at the time of observation. It is intolerable to use memory or scraps of paper
for primary recording, because of the inevitability of error and loss. Therefore, there should be a good place for the notebook
at the operating position, and the experimenter should never be without his book when in action.
Data should be recorded in ink, preferably a permanent brand, and a blotter should be handy. Otherwise the record is too ephemeral.
Notebooks get hard usage, and pencil smudges rapidly. When the notebook may be used as evidence in a patent case, ink is much
preferred.
Rough, qualitative graphs can be drawn in directly, but more careful ones are usually best prepared on graph paper of the most
appropriate type These are then carefully pasted in the notebook, a blank page being cut out in order to compensate for the bulk of
the one added.
Notebooks should carry the name of the user and the dates covered. It is convenient in a research group to agree on a standard size,
but then some sort of external identification is a great timesaver. The first eight or ten pages should be reserved for a table of
contents. This consists of a line added chronologically for each series of similar experiments, together with the page reference.
The table of contents is enormously helpful in finding items later and is very simple to keep up. An index in the back of the book
is advantageous but not indispensable.
Each entry should be dated and, if several individuals use one book (not generally recommended), initialed. The material should not
be crowded on the pages; paper is cheap compared with other research expenses. The principal difficulty is in deciding what to put in.
Obviously, one enters numerical results and those values of the independent variables such as temperature, composition, or pressure
which are directly concerned. It is also necessary to have a system of entries or references so that years later it will be possible to
tell what apparatus was used and under what circumstances. Somewhere there should be available a rather complete description of the
apparatus. Then, when modifications are made, they should be described immediately in the notebook. It should also be possible to trace
back the source of calibration curves, corrections, etc., which were appropriate to the data of a given day. It is helpful if the
requirements for writing a paper, a thesis, or a book are kept in mind. Such a task, once carried out, usually leads to solemn resolves
to keep a more careful notebook in the future. Also extremely salutary is the effect of trying to figure out something from another’s
book. All references to apparatus, places, times, books, papers, graphs, and people should be sufficiently explicit to be understandable
years later. It should be possible to take each scientific paper and show just where every figure, description, or statement in it is
backed up by original observations in the laboratory notebook, and exactly why the final and original numbers differ, if they do.
Some statement of the purpose of each experiment and a summary of the conclusions reached make the notebook vastly more useful.
Sketches, drawings, and diagrams are essential. Since so much observation is visual, it is important to record what is actually seen,
including things not fully understood at the time. Bad or unpromising experiments, even those deemed failures, should be fully recorded.
They represent an investment of effort which should not be thrown away, because often something can be salvaged, even if it is only a
knowledge of what not to do. Data should always be entered in their most primary form, not after recalculation or transformation. If it
is a ratio of two observations which is of interest but it is the two numbers which are actually observed, the two numbers should be
recorded. If the precise weight of an object is important, the individual balance weights used and their identification should be
included, i.e., the serial number of the box. Otherwise it is not possible to apply calibration corrections later or to change the
corrections if new values appear. Naturally, this detail is not necessary if only a rough weight is involved. A tabular form is best for
numerical data. Units should be noted.
Where patent questions are involved, it may be desirable to witness and even to notarize notebook pages at intervals. The witness should
be someone who understands the material but is not a coinventor. Material added to a page at a later date should be in a different-colored
ink, and any alterations should be initialed, witnessed, and dated if they are likely to be important. Industrial concerns usually enforce
their own rules concerning patent matters.
Identification Numbers. It is foolish to spend time and money making records of various kinds such as pen-and-ink recorder sheets,
photographic records, or spectra if these are then lost or mixed up. Every such record should carry indelibly on it complete identification.
A simple system of doing this which has worked well in practice is to write in ink on each record a symbol identifying the notebook and then
the page number on which the auxiliary data are recorded. If more than one record occurs on a page, letters or further numerals can be added.
Thus EBW II 85c would identify the third record discussed on page 85 of the second EBW notebook. This is better than a serial number, which
doesn’t tell without extra keying where to look for the notebook entry.
A good filing system is indispensable for all films, photographs, charts, graphs, circuit diagrams, drawings, blueprints, etc. It is hardest
to devise satisfactory filing methods for either very small or very large material. The former are easily lost and the latter very bulky.
Small envelopes are useful for tiny films and also protect them from scratching.
It is thoroughly worth while to save drawings and blueprints from which apparatus has been built, however rough these may be. These should be
dated, initialed, and labeled; in fact every piece of paper containing useful material should be so marked. When an electronic or other
similar piece of equipment is built, a careful circuit diagram should be prepared, fully labeled with all constants. The apparatus should
carry a serial number which also appears on the diagram. When changes are made, these should be indicated on the diagram and dated or a revised,
dated diagram made. The old one should not be obscured or thrown away because it may be required to explain earlier data, later found to be
peculiar. It is convenient to draw such diagrams on tracing paper with a good black pencil. Cheap ozalid or similarly processed copies can then
be made. One should be kept in the laboratory, where it will usually prove indispensable for trouble shooting. Sooner or later, however, it will
be used as scratch paper by someone with a brilliant idea to demonstrate; so the official copy and spares should be filed elsewhere. A great deal
of time is unnecessarily wasted poking around the insides of an apparatus trying to find out where some wire goes.
[...]
Labeling. Related to the question of notebooks and records is that of labeling. Naturally bottles of chemicals must carry adequate labels, which
should include not only the chemical name but also the source, or a notebook page reference if there has been any special treatment, or initials
and date. One research worker departed from a certain laboratory to take another job and left a good deal of material behind. One bottle of clear
liquid carried no label. Those assigned to clean up examined it, smelled it, finally concluded that it was water, and poured it down the drain.
It was water, all right—heavy water at $30 an ounce. Some supervisors relentlessly throw out unlabeled bottles on sight. It only needs to be done
once or twice. Labels are also essential on all kinds of specimens, pieces of apparatus, gadgets, etc. Controls on apparatus should be labeled and
the apparatus itself numbered. Every laboratory has orphaned pieces of equipment, often electronic, of which no one knows the nature and purpose.
The notebook page system is good here, provided the old notebooks can be found. Labels should be attached so that they will stay. Metal tags can
be riveted on. Paper labels should be covered with some sort of varnish.
The whole purpose of all these recording systems is to preserve values. They should be carefully thought out to fit the conditions of each
laboratory and should be adequate but not overelaborate. If too much is demanded of human nature, the system will break down.
#+END_QUOTE
---
TITLE: Ressources pour la séquence 2 du module 1
AUTHOR: Christophe Pouzat
---\n
broken-links:nil c:nil creator:nil
Notes et références sur la séquence 2 : « Un aperçu historique de la prise de notes »
=====================================================================================
Références générales
--------------------
En plus des deux livres déjà cités (en séquence 1) :
- « LA PAGE. DE L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE » d'Anthony Grafton
(Hazan, 2012) ;
- « [TOO MUCH TO KNOW. Managing Scholarly Information before the
Modern
Age](https://yalebooks.yale.edu/book/9780300165395/too-much-know) »,
d'Ann Blair publié chez *Yale University Press* en 2011 ;
j'ai utilisé :
- « L'histoire du livre » de Frédéric Barbier ;
- le remarquable site de Jacques Poitou, [langages écritures
typographies](http://j.poitou.free.fr/pro/index.html) ;
- le site [l'aventure des écritures](http://classes.bnf.fr/ecritures/)
de la BNF ;
- le catalogue de l'exposition de la BNF « Tous les savoirs du monde :
Encyclopédies et bibliothèques de Sumer au XXIème siècle » ;
- « [Du papyrus à
l'hypertexte](http://litmedmod.ca/sites/default/files/pdf/vandendorpe-papyrusenligne_lr.pdf) »
de Christian Vandendorpe (La Découverte, 1999).
Sur les tablettes de cires
--------------------------
Voir le site de Jacques Poitou (d'où les illustrations sont empruntées)
et le livre de Frédéric Barbier, « L'histoire du livre ».
Sur le passage du rouleau (*volumen*) au codex
----------------------------------------------
Voir le livre de Frédéric Barbier, celui d'Anthony Grafton.
Le *volumen* est un livre à base de feuilles de papyrus collées les unes
aux autres et qui s'enroule sur lui-même. Il a été créé en Égypte vers
3000 av. J.-C. Le texte est rédigé en colonnes parallèles assez
étroites. C'est le support du texte par excellence durant les trente
siècles précédant notre ère, d'abord en Égypte, puis dans tout le monde
méditerranéen.
Comme l'explique Frédéric Barbier : « La forme du *volumen* impose une
pratique de lecture complexe : il faut dérouler (*explicare*) et
enrouler en même temps, ce qui interdit par exemple, de travailler
simultanément sur plusieurs rouleaux (un texte et son commentaire) ou de
prendre des notes, impose une lecture suivie et empêche la simple
consultation. »
Le *volumen* n'est clairement pas adapté à une lecture « nomade » ;
imagine-t-on Ulysse partant pour son Odyssée avec les 24 *volumen* de
l'Iliade ?
Le *volumen* est à l'origine du terme « volume » dans un « livre en
plusieurs volumes » comme dans la désignation du concept géométrique.
Le passage au codex repose sur deux innovations :
- la collection des tablettes de cires en « groupes reliés » ;
- la généralisation du parchemin (peau, généralement, de mouton
spécialement préparée) au détriment du papyrus. Cette généralisation
résulte une lutte pour l'hégémonie culturelle entre deux descendants
de généraux d'Alexandre le Grand, en effet d'après Pline l'ancien :
[Ptolémé
Épiphane](https://fr.wikipedia.org/wiki/Ptol%C3%A9m%C3%A9e_V)
d'Alexandrie cherchait à empêcher [Eumène
II](https://fr.wikipedia.org/wiki/Eum%C3%A8ne_II) d'établir une
bibliothèque à Pergame (au 2e siècle avant J.-C.) et avait interdit
l'exportation du papyrus (produit exclusivement en Égypte), ce qui
incita Eumène à chercher un substitut qui devint le parchemin.
Le remplacement du rouleau par le codex aura des conséquences majeures
sur l'organisation du livre ainsi que sur la façon de lire et il
permettra le développement ultérieur de l'imprimerie.
La principale révolution introduite par le codex est la notion de page.
Grâce à elle, le lecteur peut accéder de manière directe à un chapitre
ou à un passage du texte, alors que le rouleau impose une lecture
continue. **Les mots ne sont de plus pas séparés par des espaces**.
Comme l'écrit Collette Sirat : « Il faudra vingt siècles pour qu’on se
rende compte que l’importance primordiale du codex pour notre
civilisation a été de permettre la lecture sélective et non pas
continue, contribuant ainsi à l’élaboration de structures mentales où le
texte est dissocié de la parole et de son rythme. »
Au fil des siècles, le codex — qu'on désigne le plus souvent comme un
manuscrit — va évoluer et se donner peu à peu les attributs du livre
moderne : séparation entre les mots (VIIe siècle), début de ponctuation
(VIIIe siècle), table des matières, titre courant, marque de paragraphe
(XIe siècle), pagination, index (XIIIe siècle), etc.
Un point intéressant : le contenu de la Thora est « fixé » avant
l'apparition du codex et, aujourd'hui encore, la Thora est écrite sur
des *volumen* (dans les synagogues au moins). La religion chrétienne se
développe en même temps que le codex, adopte ce support et le répand ;
elle ne donnera jamais au *volumen* un statut « supérieur », pas plus
que ne le fera la religion musulmane.
Sur Eusèbe de Césarée
---------------------
Pour en savoir plus sur [Eusèbe de
Césarée](https://fr.wikipedia.org/wiki/Eus%C3%A8be_de_C%C3%A9sar%C3%A9e),
consultez le passionnant deuxième chapitre du livre d'Anthony Grafton.
Parallèle chinois
-----------------
Comme je le dis, mon inculture fait que je ne rends pas justice aux
contributions chinoises, musulmanes, précolombienne, etc. J'essaierai de
combler cette énorme lacune pour les seconde version du CLOM…
Ce que je dis sur le passage du volumen au codex accompagné d'un
développement des « outils de navigation » (index, table des matières,
etc) en Chine lors du développement de leishus vient du bouquin d'Ann
Blair (p. 31) qui cite un article de Susan Cherniack, « Book Culture and
Textual Transmission in Sung China », *Harvard Journal of Asiatic
Studies* Vol. 54, No. 1 (Jun., 1994), pp. 5-125.
Retour sur l'armoire à notes
----------------------------
Nous revenons sur le « bout de papier » ou la fiche comme support de
note. L'inconvénient est que le bout de papier ou la fiche se perdent
facilement et ne servent à rien s'ils ne sont pas **classés** en plus
d'être rangés. Problème résolu par l'armoire de Placcius. D'une certaine
façon, sa conception fait qu'on accède à son contenu par l'index.
L'avantage est que les notes peuvent être réorganisées si elles
contiennent des information sur plusieurs sujets. Elle peuvent aussi
être directement collées dans un livre lors de la composition d'un
florilège ou d'un ouvrage de synthèse.
Ce dernier procédé était très couramment employé par les humanistes et
les érudit de la renaissance et du début de la période moderne. [Conrad
Gessner](https://fr.wikipedia.org/wiki/Conrad_Gessner) (1516-1565) était
un champion de cette technique ; il obtenait même parfois ses fiches en
découpant les pages des livres. Encore une fois, ne faites pas cela avec
les livres de bibliothèques !
L'index et John Locke
---------------------
Sur l'origine de l'index, on pourra lire l'article de Jean Berger :
[Indexation, Memoire, pouvoir et representations au seuil du XIIe
siecle : La redecouverte des feuillets de tables du Liber De Honoribus,
premier cartulaire de la collegiale Saint-Julien de
Brioude](https://www.theindexer.org/files/25-2-berger.pdf), *The
Indexer*.
La méthode de John Lock est expliquée dans l'article *Indexing
commonplace books: John Locke’s method* d'Alan Walker, [The
Indexer](https://www.theindexer.org/issues/query.php?vol=22&iss=3), vol.
22, p. 114-118, 2001.
Sur [John Locke](https://fr.wikipedia.org/wiki/John_Locke) (1632-1704)
« papa du libéralisme » et actionnaire de la *Royal African Company*
principale compagnie négrière britannique, voir l'article
[Wikipedia](https://en.wikipedia.org/wiki/John_Locke#Constitution_of_Carolina)
(en anglais) et le livre « Contre-histoire du libéralisme » de Domenico
Losurdo (La Découverte / Poche, 2014, p. 34-36).
#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline
#+OPTIONS: author:t broken-links:nil c:nil creator:nil
#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t
#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t
#+OPTIONS: timestamp:t title:t toc:t todo:t |:t
#+TITLE: Ressources pour la séquence 2 du module 1
#+DATE: <2019-02-21 jeu.>
#+AUTHOR: Christophe Pouzat
#+EMAIL: christophe.pouzat@parisdescartes.fr
#+LANGUAGE: fr
#+SELECT_TAGS: export
#+EXCLUDE_TAGS: noexport
#+CREATOR: Emacs 26.1 (Org mode 9.1.9)
#+STARTUP: indent
* Notes et références sur la séquence 2 : « Un aperçu historique de la prise de notes »
** Références générales
En plus des deux livres déjà cités (en séquence 1) :
- « LA PAGE. DE L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE » d'Anthony Grafton (Hazan, 2012) ;
- « [[https://yalebooks.yale.edu/book/9780300165395/too-much-know][TOO MUCH TO KNOW. Managing Scholarly Information before the Modern Age]] », d'Ann Blair publié chez /Yale University Press/ en 2011 ;
j'ai utilisé :
- « L'histoire du livre » de Frédéric Barbier ;
- le remarquable site de Jacques Poitou, [[http://j.poitou.free.fr/pro/index.html][langages écritures typographies]] ;
- le site [[http://classes.bnf.fr/ecritures/][l'aventure des écritures]] de la BNF ;
- le catalogue de l'exposition de la BNF « Tous les savoirs du monde : Encyclopédies et bibliothèques de Sumer au XXIème siècle » ;
- « [[http://litmedmod.ca/sites/default/files/pdf/vandendorpe-papyrusenligne_lr.pdf][Du papyrus à l'hypertexte]] » de Christian Vandendorpe (La Découverte, 1999).
** Sur les tablettes de cires
Voir le site de Jacques Poitou (d'où les illustrations sont empruntées) et le livre de Frédéric Barbier, « L'histoire du livre ».
** Sur le passage du rouleau (/volumen/) au codex
Voir le livre de Frédéric Barbier, celui d'Anthony Grafton.
Le /volumen/ est un livre à base de feuilles de papyrus collées les unes aux autres et qui s'enroule sur lui-même. Il a été créé en Égypte vers 3000 av. J.-C. Le texte est rédigé en colonnes parallèles assez étroites. C'est le support du texte par excellence durant les trente siècles précédant notre ère, d'abord en Égypte, puis dans tout le monde méditerranéen.
Comme l'explique Frédéric Barbier : « La forme du /volumen/ impose une pratique de lecture complexe : il faut dérouler (/explicare/) et enrouler en même temps, ce qui interdit par exemple, de travailler simultanément sur plusieurs rouleaux (un texte et son commentaire) ou de prendre des notes, impose une lecture suivie et empêche la simple consultation. »
Le /volumen/ n'est clairement pas adapté à une lecture « nomade » ; imagine-t-on Ulysse partant pour son Odyssée avec les 24 /volumen/ de l'Iliade ?
Le /volumen/ est à l'origine du terme « volume » dans un « livre en plusieurs volumes » comme dans la désignation du concept géométrique.
Le passage au codex repose sur deux innovations :
- la collection des tablettes de cires en « groupes reliés » ;
- la généralisation du parchemin (peau, généralement, de mouton spécialement préparée) au détriment du papyrus. Cette généralisation résulte une lutte pour l'hégémonie culturelle entre deux descendants de généraux d'Alexandre le Grand, en effet d'après Pline l'ancien : [[https://fr.wikipedia.org/wiki/Ptol%C3%A9m%C3%A9e_V][Ptolémé Épiphane]] d'Alexandrie cherchait à empêcher [[https://fr.wikipedia.org/wiki/Eum%C3%A8ne_II][Eumène II]] d'établir une bibliothèque à Pergame (au 2e siècle avant J.-C.) et avait interdit l'exportation du papyrus (produit exclusivement en Égypte), ce qui incita Eumène à chercher un substitut qui devint le parchemin.
Le remplacement du rouleau par le codex aura des conséquences majeures sur l'organisation du livre ainsi que sur la façon de lire et il permettra le développement ultérieur de l'imprimerie.
La principale révolution introduite par le codex est la notion de page. Grâce à elle, le lecteur peut accéder de manière directe à un chapitre ou à un passage du texte, alors que le rouleau impose une lecture continue. *Les mots ne sont de plus pas séparés par des espaces*. Comme l'écrit Collette Sirat : « Il faudra vingt siècles pour qu’on se rende compte que l’importance primordiale du codex pour notre civilisation a été de permettre la lecture sélective et non pas continue, contribuant ainsi à l’élaboration de structures mentales où le texte est dissocié de la parole et de son rythme. »
Au fil des siècles, le codex — qu'on désigne le plus souvent comme un manuscrit — va évoluer et se donner peu à peu les attributs du livre moderne : séparation entre les mots (VIIe siècle), début de ponctuation (VIIIe siècle), table des matières, titre courant, marque de paragraphe (XIe siècle), pagination, index (XIIIe siècle), etc.
Un point intéressant : le contenu de la Thora est « fixé » avant l'apparition du codex et, aujourd'hui encore, la Thora est écrite sur des /volumen/ (dans les synagogues au moins). La religion chrétienne se développe en même temps que le codex, adopte ce support et le répand ; elle ne donnera jamais au /volumen/ un statut « supérieur », pas plus que ne le fera la religion musulmane.
** Sur Eusèbe de Césarée
Pour en savoir plus sur [[https://fr.wikipedia.org/wiki/Eus%C3%A8be_de_C%C3%A9sar%C3%A9e][Eusèbe de Césarée]], consultez le passionnant deuxième chapitre du livre d'Anthony Grafton.
** Parallèle chinois
Comme je le dis, mon inculture fait que je ne rends pas justice aux contributions chinoises, musulmanes, précolombienne, etc. J'essaierai de combler cette énorme lacune pour les seconde version du CLOM...
Ce que je dis sur le passage du volumen au codex accompagné d'un développement des « outils de navigation » (index, table des matières, etc) en Chine lors du développement de leishus vient du bouquin d'Ann Blair (p. 31) qui cite un article de Susan Cherniack, « Book Culture and Textual Transmission in Sung China », /Harvard Journal of Asiatic Studies/ Vol. 54, No. 1 (Jun., 1994), pp. 5-125.
** Retour sur l'armoire à notes
Nous revenons sur le « bout de papier » ou la fiche comme support de note. L'inconvénient est que le bout de papier ou la fiche se perdent facilement et ne servent à rien s'ils ne sont pas *classés* en plus d'être rangés. Problème résolu par l'armoire de Placcius. D'une certaine façon, sa conception fait qu'on accède à son contenu par l'index.
L'avantage est que les notes peuvent être réorganisées si elles contiennent des information sur plusieurs sujets. Elle peuvent aussi être directement collées dans un livre lors de la composition d'un florilège ou d'un ouvrage de synthèse.
Ce dernier procédé était très couramment employé par les humanistes et les érudit de la renaissance et du début de la période moderne. [[https://fr.wikipedia.org/wiki/Conrad_Gessner][Conrad Gessner]] (1516-1565) était un champion de cette technique ; il obtenait même parfois ses fiches en découpant les pages des livres. Encore une fois, ne faites pas cela avec les livres de bibliothèques !
** L'index et John Locke
Sur l'origine de l'index, on pourra lire l'article de Jean Berger : [[https://www.theindexer.org/files/25-2-berger.pdf][Indexation, Memoire, pouvoir et representations au seuil du XIIe siecle : La redecouverte des feuillets de tables du Liber De Honoribus, premier cartulaire de la collegiale Saint-Julien de Brioude]], /The Indexer/.
La méthode de John Lock est expliquée dans l'article /Indexing commonplace books: John Locke’s method/ d'Alan Walker, [[https://www.theindexer.org/issues/query.php?vol=22&iss=3][The Indexer]], vol. 22, p. 114-118, 2001.
Sur [[https://fr.wikipedia.org/wiki/John_Locke][John Locke]] (1632-1704) « papa du libéralisme » et actionnaire de la /Royal African Company/ principale compagnie négrière britannique, voir l'article [[https://en.wikipedia.org/wiki/John_Locke#Constitution_of_Carolina][Wikipedia]] (en anglais) et le livre « Contre-histoire du libéralisme » de Domenico Losurdo (La Découverte / Poche, 2014, p. 34-36).
---
TITLE: A historical survey of note taking
AUTHOR: Christophe Pouzat
---\n
broken-links:nil c:nil creator:nil
Illustrations used in the first figure
======================================
All illustrations are taken from Wikimedia Commons
- Top left: A clay tablet (pre-cuneiform period, -3000).
- Top center: A fresco from Pompeii with the portrait of [Terentius
Neo and his
wife](https://en.wikipedia.org/wiki/Portrait_of_Paquius_Proculo).
She carries a [wax tablet](https://en.wikipedia.org/wiki/Wax_tablet)
and a *stylus* (the main medium of note-takers up to the 19th
century); he carries a *volumen* or
[scroll](https://en.wikipedia.org/wiki/History_of_scrolls), the
stuff of books until the beginning of the Common Era.
- Top right: a notebook made of paper from the 17th century with
[commonplaces](https://en.wikipedia.org/wiki/Commonplace_book).
"Commonplace" is a translation of the Latin term locus communis
(from Greek tópos koinós, see literary topos) which means "a theme
or argument of general application", such as a statement of
proverbial wisdom (Wikipedia).
- Bottom left: An [index
card](https://en.wikipedia.org/wiki/Index_card), a notes medium
whose use exploded with bureaucratization and the development of
libraries. Still heavily used in the humanities. Apparently first
used (if not created) by the father of taxonomy, [Carl
Linneaus](https://en.wikipedia.org/wiki/Carl_Linnaeus). You can find
his cards at: <http://linnean-online.org/61332/#/0>.
- Bottom center: A [Post-it
note](https://en.wikipedia.org/wiki/Post-it_note) as most of us use
every day.
- Bottom right: A "modern days" numerical tablet.
Wax tablet and stylus
=====================
From the [Wikipedia page](https://en.wikipedia.org/wiki/Wax_tablet):
> A wax tablet is a tablet made of wood and covered with a layer of wax,
> often linked loosely to a cover tablet, as a "double-leaved" diptych.
> It was used as a reusable and portable writing surface in Antiquity
> and throughout the Middle Ages.
>
> Writing on the wax surface was performed with a pointed instrument, a
> stylus. Writing by engraving in wax required the application of much
> more pressure and traction than would be necessary with ink on
> parchment or papyrus,\[1\] and the scribe had to lift the stylus in
> order to change the direction of the stroke. Therefore, the stylus
> could not be applied with the same degree of dexterity as a pen. A
> straight-edged, spatula-like implement (often placed on the opposite
> end of the stylus tip) would be used in a razor-like fashion to serve
> as an eraser. The entire tablet could be erased for reuse by warming
> it to about 50 °C and smoothing the softened wax surface. The modern
> expression of "a clean slate" equates to the Latin expression "tabula
> rasa".
From the *scroll* to the *codex*
================================
The shift from the *scroll* to the *codex* is fundamental for
development of written civilization.
A scroll (from the Old French escroe or escroue), is a roll of papyrus,
[parchment](https://en.wikipedia.org/wiki/Parchment), or paper
containing writing.
From
[Wikipedia](https://en.wikipedia.org/wiki/History_of_scrolls#Replacement_by_the_Codex):
> The codex was a new format for reading the written word, consisting of
> individual pages loosely attached to each other at one side and bound
> with boards or cloth. It came to replace the scroll thanks to several
> problems that limited the scroll's function and readability. For one,
> scrolls were very long, sometimes as long as ten meters. This made
> them hard to hold open and read, a difficulty not helped by the fact
> that most scrolls in that era were read horizontally, instead of
> vertically as scrolling virtual documents are read now. The text on a
> scroll was continuous, without page breaks, which made indexing and
> bookmarking impossible. Conversely, the codex was easier to hold open,
> separate pages made it possible to index sections and mark a page, and
> the protective covers kept the fragile pages intact better than
> scrolls generally stayed. This last made it particularly attractive
> for important religious texts.
The bottom left mosaic shows Virgil seating (70-19 BCE) holding a scroll
of the *Aeneid*, with Clio, muse of history, also holding a scroll.
As explained by Frédéric Barbier (*Histoire du Livre*): "The scroll /
volumen imposes a complex reading practice: one must unroll
(*explicare*) and roll at the same time; that forbids working on several
scrolls (the original text and its commentary) at the same time or to
take notes. It imposes a continuous reading and making consultation
impossible."
Scrolls are clearly unsuited to "nomadic reading"; can you imagine
Ulysses embarking for his Odyssey carrying the 24 scrolls/volumen of the
Iliad?
The term *volumen* is the origin of our modern *volumes* (a book in
several volumes) as of the word for the geometrical concept.
Switching from scroll to codices required two innovations:
- The collection of wax tablets bound together with leather strands.
- The generalization of
[parchment](https://en.wikipedia.org/wiki/Parchment) (usually sheep
skin specially processed) as a replacement for
[papyrus](https://en.wikipedia.org/wiki/Papyrus). This
generalization could be due (according to Pliny the Elder) to a
rivalry between the cities of Pergamon and Alexandria for cultural
hegemony: [Ptolemy V
Epiphanes](https://en.wikipedia.org/wiki/Ptolemy_V_Epiphanes) King
of Egypt wanted to block [Eumenes
II](https://en.wikipedia.org/wiki/Eumenes_II) from developing in
Pergamon a library that could compete with the one of Alexandria; he
therefore imposed an embargo on papyrus export (Egypt was the sole
papyrus producer). Eumenes looked for an alternative and fostered
parchment development. The link between Pergamon and parchment is
much clearer in German where Pergamon is written in the way as in
English but where parchment is written *Pergament*.
Switching from scrolls to codices will have major consequences on books
organization as well as on the reading practices, it will later on allow
printing development.
The main revolution brought by the codex is the *page*. Thanks to this
structural element, the reader can access directly to a specific chapter
or a specific part of the text, while scrolls imposed continuous reading
**at a time when there were no blanks between words**. According to
Collette Sirat: "Twenty centuries will be necessary to realize the
paramount importance of the codex for our civilization through the
**selective reading** it made possible as opposed to the continuous
reading. It opened room for the elaboration of mental structures where
the text is dissociated from the speech and its rhythm."
Notice the red letters used on the codex (bottom right), an example of
[rubrication](https://en.wikipedia.org/wiki/Rubrication) used by scribes
to mark paragraphs. With printing and the high cost of colors it
entailed, an empty space started to be used to that end. Thinking about
it, colors don't cost anything on a numerical support and could
perfectly be used again in the same way.
Eusebius and the invention of cross-references
==============================================
From the Wikipedia page on
[Eusebius](https://en.wikipedia.org/wiki/Eusebius):
> Eusebius of Caesarea (ad 260/265 – 339/340), also known as Eusebius
> Pamphili, was a historian of Christianity, exegete, and Christian
> polemicist. He became the bishop of Caesarea Maritima about 314 AD.
> Together with Pamphilus, he was a scholar of the Biblical canon and is
> regarded as an extremely learned Christian of his time. He wrote
> Demonstrations of the Gospel, Preparations for the Gospel, and On
> Discrepancies between the Gospels, studies of the Biblical text.
According to Anthony Grafton and Megan Williams (2006) *Christianity and
the Transformation of the Book*, The Belknap Press of Harvard University
Press, his writings are crucial for our knowledge of the first three
centuries of Christian history. *He brought several essential
innovations to the book's organization like the cross-references*.
Eusebian canons
===============
Quote from
[Wikipedia](https://en.wikipedia.org/wiki/Eusebius#Biblical_text_criticism):
> For an easier survey of the material of the four Evangelists, Eusebius
> divided his edition of the New Testament into paragraphs and provided
> it with a synoptical table so that it might be easier to find the
> pericopes that belong together. These canon tables or "Eusebian
> canons" remained in use throughout the Middle Ages, and illuminated
> manuscript versions are important for the study of early medieval art,
> as they are the most elaborately decorated pages of many Gospel books.
*Codex* significance
====================
Following Frédéric Barbier (*HISTOIRE DU LIVRE*, Armand Colin, 2009):
- *Codex* invention is crucial for the development of written
civilization.
- The *codex* lends itself to **consultation reading**.
- We can add to the *codex* a "navigation system" making consultation
easier.
- We can take notes while consulting a *codex*.
- The combination of the *codex* with the *Carolingian minuscule*
constitutes an extremely powerful intellectual tools, never seen
before.
Example of *Carolingian minuscule* can be found on the corresponding
[Wikipedia page](https://en.wikipedia.org/wiki/Carolingian_minuscule).
Over centuries, *codices*—that we often call *manuscripts*—will slowly
evolve and gain modern days book attributes:
- separation between words (VIIth century),
- start of punctuation (VIIIth century),
- table of content,
- running title,
- paragraph marks (rubrication, XIth century),
- pagination,
- index (XIIIth century).
An interesting point: Torah's content got "fixed" before the *codex*
generalization and today Torah scrolls are still used.
Let us not forget China
=======================
The link between the *codex* generalization, on the one hand, and the
apparition of "navigation guides" like the table of content, the index,
the running title, on the other hand as a counterpart in the Chinese
civilization.
In China, competitive examinations to become a high ranking state
employee developed in the IXth century (CE). The main part of these exam
was a paper on what we would now call general knowledge of the Classics
where the students were asked to demonstrate their knowledge through
appropriate quotations.
To fulfill the need of "textbook" appropriate for this kind of
examination what is called
[leishus](https://en.wikipedia.org/wiki/Leishu) were produced. They are
described as follows on Wikipedia:
> The leishu are composed of sometimes lengthy citations from other
> works and often contain copies of entire works, not just excerpts. The
> works are classified by a systematic set of categories, which are
> further divided into subcategories. Leishu may be considered
> anthologies, but are encyclopedic in the sense that they may comprise
> the entire realm of knowledge at the time of compilation.
The efficient use of the leishu requires an indexing system, a table of
content, etc. Very interestingly, the scroll will be abandoned and the
codex will generalize in China around that time, as observed by Ann
Blair in her book *TOO MUCH TO KNOW*, Yale Univ. Press, 2010 (pp.
28-31).
Most of the leishus **were printed** (from the IXth century on!). The
picture on the right side (a banknote printing plate) is there to remind
us of who was (by far) the most advanced at that time. The Chinese were
of course printing their leishus on paper that they discovered in the
VIIIth century BCE.
Getting organized by using the right slot
=========================================
Now that we briefly reviewed the timeline of the main navigation
elements of the books—navigation elements that can of course be applied
to our lab/note-books—we come back to the paper slips and cards as notes
media.
We see (again) Placcius' and Leibniz's closet since it displays both the
benefits and the shortcomings of media that hold **a single note**.
Obvious shortcomings are:
- Paper slips and cards get easily lost.
- They are essentially useless if they are not **classified** in
addition to being filed.
These problems are solved by Placcius' cabinet, the content of which is
fundamentally accessed through the index.
Clear benefits are:
- Paper slips can be easily reorganized when they contain information
on several subjects.
- Paper slips can be directly pasted in a book when composing an
anthology or a compendium.
This last technique (pasting when making an anthology) was
systematically used by the Renaissance polymath [Conrad
Gessner](https://en.wikipedia.org/wiki/Conrad_Gessner) (1516-1565) who
even got his paper slips by cutting parts of pages from books (don't do
that with library books)!
Constructing a notebook index the John Locke way
================================================
We will now learn about an index construction technique due to [John
Locke](https://en.wikipedia.org/wiki/John_Locke) (1632-1704), the
grand-father of liberalism and a major investor in the *Royal African
Company*, the largest company in the
[slave-trade](https://en.wikipedia.org/wiki/John_Locke#Constitution_of_Carolina)
business at that time…
The indexing method is here illustrated using my own notebook. The two
pages that are displayed describe the structure of a dataset in the
[HDF5](https://www.hdfgroup.org/) format on the left side and the
corresponding structure (designed to map the former one) of a
`data frame` object of the [R](https://www.r-project.org/) language.
This dataset contain **calcium** concentration measurements made in
**neurons**. This notes were taken while writing some computer **code**
to analyze the data.
The precise content of the pages does not matter here in order to
understand how Locke's method works. The important points are:
- The pages are numbered (we are seeing here pages 86 and 87).
- Keywords are written at the bottom of the page: **code**; **neuro**;
**calcium**.
This method can be applied after note-taking, you just need to have few
pages left at the end of your notebook. That's in fact what I did since
I had started filling my notebook before learning about the method (I
learned about while preparing the French version of this lecture in
September 2017).
We now the index. It is located at the end of the notebook although
Locke recommends placing it at the beginning. Since I did not know about
the method when I started the notebook, I had to place it at the end…
The idea is to enter the keywords used in the notebook based on their
**first letter** and the **first vowel following the first letter**.
The index is therefore made of the 26 letters (you see letters "A" to
"R" here, the remaining ones are on the next page) subdivided the five
most common vowels ("y" goes together with "i" in that case).
Pages 86 and 87 contained the keyword **code** that goes into the entry
"Co" of the index (you see "86-89" because the following pages also
concern code for the same project). The keyword **Neuro** giving an
entry on line "Ne", while the keyword **Calcium** gives an entry on line
"Ca".
The keyword **Criquet** (not shown above) gives an entry on line "Ci".
It is also a good idea to list the set of keywords used in the notebook
on the page preceding or following the index.
#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline
#+OPTIONS: author:t broken-links:nil c:nil creator:nil
#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t
#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t
#+OPTIONS: timestamp:t title:t toc:t todo:t |:t
#+TITLE: A historical survey of note taking
#+DATE: <2019-03-21 jeu.>
#+AUTHOR: Christophe Pouzat
#+EMAIL: christophe.pouzat@parisdescartes.fr
#+LANGUAGE: en
#+SELECT_TAGS: export
#+EXCLUDE_TAGS: noexport
#+CREATOR: Emacs 26.1 (Org mode 9.1.9)
* Illustrations used in the first figure
All illustrations are taken from Wikimedia Commons
- Top left: A clay tablet (pre-cuneiform period, -3000).
- Top center: A fresco from Pompeii with the portrait of [[https://en.wikipedia.org/wiki/Portrait_of_Paquius_Proculo][Terentius Neo and his wife]]. She carries a [[https://en.wikipedia.org/wiki/Wax_tablet][wax tablet]] and a /stylus/ (the main medium of note-takers up to the 19th century); he carries a /volumen/ or [[https://en.wikipedia.org/wiki/History_of_scrolls][scroll]], the stuff of books until the beginning of the Common Era.
- Top right: a notebook made of paper from the 17th century with [[https://en.wikipedia.org/wiki/Commonplace_book][commonplaces]]. "Commonplace" is a translation of the Latin term locus communis (from Greek tópos koinós, see literary topos) which means "a theme or argument of general application", such as a statement of proverbial wisdom (Wikipedia).
- Bottom left: An [[https://en.wikipedia.org/wiki/Index_card][index card]], a notes medium whose use exploded with bureaucratization and the development of libraries. Still heavily used in the humanities. Apparently first used (if not created) by the father of taxonomy, [[https://en.wikipedia.org/wiki/Carl_Linnaeus][Carl Linneaus]]. You can find his cards at: [[http://linnean-online.org/61332/#/0]].
- Bottom center: A [[https://en.wikipedia.org/wiki/Post-it_note][Post-it note]] as most of us use every day.
- Bottom right: A "modern days" numerical tablet.
* Wax tablet and stylus
From the [[https://en.wikipedia.org/wiki/Wax_tablet][Wikipedia page]]:
#+BEGIN_QUOTE
A wax tablet is a tablet made of wood and covered with a layer of wax, often linked loosely to a cover tablet, as a "double-leaved" diptych.
It was used as a reusable and portable writing surface in Antiquity and throughout the Middle Ages.
Writing on the wax surface was performed with a pointed instrument, a stylus. Writing by engraving in wax required the application of much
more pressure and traction than would be necessary with ink on parchment or papyrus,[1] and the scribe had to lift the stylus in order to
change the direction of the stroke. Therefore, the stylus could not be applied with the same degree of dexterity as a pen. A straight-edged,
spatula-like implement (often placed on the opposite end of the stylus tip) would be used in a razor-like fashion to serve as an eraser.
The entire tablet could be erased for reuse by warming it to about 50 °C and smoothing the softened wax surface. The modern expression of
"a clean slate" equates to the Latin expression "tabula rasa".
#+END_QUOTE
* From the /scroll/ to the /codex/
The shift from the /scroll/ to the /codex/ is fundamental for development of written civilization.
A scroll (from the Old French escroe or escroue), is a roll of papyrus, [[https://en.wikipedia.org/wiki/Parchment][parchment]], or paper containing writing.
From [[https://en.wikipedia.org/wiki/History_of_scrolls#Replacement_by_the_Codex][Wikipedia]]:
#+BEGIN_QUOTE
The codex was a new format for reading the written word, consisting of individual pages loosely attached to each other at one
side and bound with boards or cloth. It came to replace the scroll thanks to several problems that limited the scroll's function
and readability. For one, scrolls were very long, sometimes as long as ten meters. This made them hard to hold open and read, a
difficulty not helped by the fact that most scrolls in that era were read horizontally, instead of vertically as scrolling virtual
documents are read now. The text on a scroll was continuous, without page breaks, which made indexing and bookmarking impossible.
Conversely, the codex was easier to hold open, separate pages made it possible to index sections and mark a page, and the protective
covers kept the fragile pages intact better than scrolls generally stayed. This last made it particularly attractive for important
religious texts.
#+END_QUOTE
The bottom left mosaic shows Virgil seating (70-19 BCE) holding a scroll of the /Aeneid/, with Clio, muse of history, also holding a scroll.
As explained by Frédéric Barbier (/Histoire du Livre/): "The scroll / volumen imposes a complex reading practice: one must unroll (/explicare/) and roll at the same time; that forbids working on several scrolls (the original text and its commentary) at the same time or to take notes. It imposes a continuous reading and making consultation impossible."
Scrolls are clearly unsuited to "nomadic reading"; can you imagine Ulysses embarking for his Odyssey carrying the 24 scrolls/volumen of the Iliad?
The term /volumen/ is the origin of our modern /volumes/ (a book in several volumes) as of the word for the geometrical concept.
Switching from scroll to codices required two innovations:
- The collection of wax tablets bound together with leather strands.
- The generalization of [[https://en.wikipedia.org/wiki/Parchment][parchment]] (usually sheep skin specially processed) as a replacement for [[https://en.wikipedia.org/wiki/Papyrus][papyrus]]. This generalization could be due (according to Pliny the Elder) to a rivalry between the cities of Pergamon and Alexandria for cultural hegemony: [[https://en.wikipedia.org/wiki/Ptolemy_V_Epiphanes][Ptolemy V Epiphanes]] King of Egypt wanted to block [[https://en.wikipedia.org/wiki/Eumenes_II][Eumenes II]] from developing in Pergamon a library that could compete with the one of Alexandria; he therefore imposed an embargo on papyrus export (Egypt was the sole papyrus producer). Eumenes looked for an alternative and fostered parchment development. The link between Pergamon and parchment is much clearer in German where Pergamon is written in the way as in English but where parchment is written /Pergament/.
Switching from scrolls to codices will have major consequences on books organization as well as on the reading practices, it will later on allow printing development.
The main revolution brought by the codex is the /page/. Thanks to this structural element, the reader can access directly to a specific chapter or a specific part of the text, while scrolls imposed continuous reading *at a time when there were no blanks between words*. According to Collette Sirat: "Twenty centuries will be necessary to realize the paramount importance of the codex for our civilization through the *selective reading* it made possible as opposed to the continuous reading. It opened room for the elaboration of mental structures where the text is dissociated from the speech and its rhythm."
Notice the red letters used on the codex (bottom right), an example of [[https://en.wikipedia.org/wiki/Rubrication][rubrication]] used by scribes to mark paragraphs. With printing and the high cost of colors it entailed, an empty space started to be used to that end. Thinking about it, colors don't cost anything on a numerical support and could perfectly be used again in the same way.
* Eusebius and the invention of cross-references
From the Wikipedia page on [[https://en.wikipedia.org/wiki/Eusebius][Eusebius]]:
#+BEGIN_QUOTE
Eusebius of Caesarea (ad 260/265 – 339/340), also known as Eusebius Pamphili, was a historian of Christianity, exegete, and Christian polemicist. He became the bishop of Caesarea Maritima about 314 AD. Together with Pamphilus, he was a scholar of the Biblical canon and is regarded as an extremely learned Christian of his time. He wrote Demonstrations of the Gospel, Preparations for the Gospel, and On Discrepancies between the Gospels, studies of the Biblical text.
#+END_QUOTE
According to Anthony Grafton and Megan Williams (2006) /Christianity and the Transformation of the Book/, The Belknap Press of Harvard University Press, his writings are crucial for our knowledge of the first three centuries of Christian history. /He brought several essential innovations to the book's organization like the cross-references/.
* Eusebian canons
Quote from [[https://en.wikipedia.org/wiki/Eusebius#Biblical_text_criticism][Wikipedia]]:
#+BEGIN_QUOTE
For an easier survey of the material of the four Evangelists, Eusebius divided his edition of the New Testament into paragraphs and provided it with a synoptical table so that it might be easier to find the pericopes that belong together. These canon tables or "Eusebian canons" remained in use throughout the Middle Ages, and illuminated manuscript versions are important for the study of early medieval art, as they are the most elaborately decorated pages of many Gospel books.
#+END_QUOTE
* /Codex/ significance
Following Frédéric Barbier (/HISTOIRE DU LIVRE/, Armand Colin, 2009):
- /Codex/ invention is crucial for the development of written civilization.
- The /codex/ lends itself to *consultation reading*.
- We can add to the /codex/ a "navigation system" making consultation easier.
- We can take notes while consulting a /codex/.
- The combination of the /codex/ with the /Carolingian minuscule/ constitutes an extremely powerful intellectual tools, never seen before.
Example of /Carolingian minuscule/ can be found on the corresponding [[https://en.wikipedia.org/wiki/Carolingian_minuscule][Wikipedia page]].
Over centuries, /codices/---that we often call /manuscripts/---will slowly evolve and gain modern days book attributes:
- separation between words (VIIth century),
- start of punctuation (VIIIth century),
- table of content,
- running title,
- paragraph marks (rubrication, XIth century),
- pagination,
- index (XIIIth century).
An interesting point: Torah's content got "fixed" before the /codex/ generalization and today Torah scrolls are still used.
* Let us not forget China
The link between the /codex/ generalization, on the one hand, and the apparition of "navigation guides" like the table of content, the index, the running title, on the other hand as a counterpart in the Chinese civilization.
In China, competitive examinations to become a high ranking state employee developed in the IXth century (CE). The main part of these exam was a paper on what we would now call general knowledge of the Classics where the students were asked to demonstrate their knowledge through appropriate quotations.
To fulfill the need of "textbook" appropriate for this kind of examination what is called [[https://en.wikipedia.org/wiki/Leishu][leishus]] were produced. They are described as follows on Wikipedia:
#+BEGIN_QUOTE
The leishu are composed of sometimes lengthy citations from other works and often contain copies of entire works, not just excerpts. The works are classified by a systematic set of categories, which are further divided into subcategories. Leishu may be considered anthologies, but are encyclopedic in the sense that they may comprise the entire realm of knowledge at the time of compilation.
#+END_QUOTE
The efficient use of the leishu requires an indexing system, a table of content, etc. Very interestingly, the scroll will be abandoned and the codex will generalize in China around that time, as observed by Ann Blair in her book /TOO MUCH TO KNOW/, Yale Univ. Press, 2010 (pp. 28-31).
Most of the leishus *were printed* (from the IXth century on!). The picture on the right side (a banknote printing plate) is there to remind us of who was (by far) the most advanced at that time. The Chinese were of course printing their leishus on paper that they discovered in the VIIIth century BCE.
* Getting organized by using the right slot
Now that we briefly reviewed the timeline of the main navigation elements of the books---navigation elements that can of course be applied to our lab/note-books---we come back to the paper slips and cards as notes media.
We see (again) Placcius' and Leibniz's closet since it displays both the benefits and the shortcomings of media that hold *a single note*.
Obvious shortcomings are:
- Paper slips and cards get easily lost.
- They are essentially useless if they are not *classified* in addition to being filed.
These problems are solved by Placcius' cabinet, the content of which is fundamentally accessed through the index.
Clear benefits are:
- Paper slips can be easily reorganized when they contain information on several subjects.
- Paper slips can be directly pasted in a book when composing an anthology or a compendium.
This last technique (pasting when making an anthology) was systematically used by the Renaissance polymath [[https://en.wikipedia.org/wiki/Conrad_Gessner][Conrad Gessner]] (1516-1565) who even got his paper slips by cutting parts of pages from books (don't do that with library books)!
* Constructing a notebook index the John Locke way
We will now learn about an index construction technique due to [[https://en.wikipedia.org/wiki/John_Locke][John Locke]] (1632-1704), the grand-father of liberalism and a major investor in the /Royal African Company/, the largest company in the [[https://en.wikipedia.org/wiki/John_Locke#Constitution_of_Carolina][slave-trade]] business at that time...
The indexing method is here illustrated using my own notebook. The two pages that are displayed describe the structure of a dataset in the [[https://www.hdfgroup.org/][HDF5]] format on the left side and the corresponding structure (designed to map the former one) of a =data frame= object of the [[https://www.r-project.org/][R]] language. This dataset contain *calcium* concentration measurements made in *neurons*. This notes were taken while writing some computer *code* to analyze the data.
The precise content of the pages does not matter here in order to understand how Locke's method works. The important points are:
- The pages are numbered (we are seeing here pages 86 and 87).
- Keywords are written at the bottom of the page: *code*; *neuro*; *calcium*.
This method can be applied after note-taking, you just need to have few pages left at the end of your notebook. That's in fact what I did since I had started filling my notebook before learning about the method (I learned about while preparing the French version of this lecture in September 2017).
We now the index. It is located at the end of the notebook although Locke recommends placing it at the beginning. Since I did not know about the method when I started the notebook, I had to place it at the end...
The idea is to enter the keywords used in the notebook based on their *first letter* and the *first vowel following the first letter*.
The index is therefore made of the 26 letters (you see letters "A" to "R" here, the remaining ones are on the next page) subdivided the five most common vowels ("y" goes together with "i" in that case).
Pages 86 and 87 contained the keyword *code* that goes into the entry "Co" of the index (you see "86-89" because the following pages also concern code for the same project). The keyword *Neuro* giving an entry on line "Ne", while the keyword *Calcium* gives an entry on line "Ca".
The keyword *Criquet* (not shown above) gives an entry on line "Ci".
It is also a good idea to list the set of keywords used in the notebook on the page preceding or following the index.
---
TITLE: Ressources pour la séquence 3 du module 1
AUTHOR: Christophe Pouzat
---\n
broken-links:nil c:nil creator:nil
Notes et références sur la séquence 3 : « Du fichier texte au langage de balisage léger »
=========================================================================================
Fichier texte et éditeur de texte
---------------------------------
Une définition plus technique (et moins circulaire !) du fichier texte
se trouve sur [la page
wikipédia](https://fr.wikipedia.org/wiki/Fichier_texte) consacrée au
sujet. Pour plus de détails sur les éditeurs de texte, voir aussi la
[page wikipédia
correspondante](https://fr.wikipedia.org/wiki/%C3%89diteur_de_texte).
Un logiciel de « [traitement de
texte](https://fr.wikipedia.org/wiki/Traitement_de_texte) » est plus
sophistiqué qu'un simple éditeur de texte ; il permet de faire plus, ce
qui sous entend qu'il peut aussi ouvrir et manipuler des fichiers
textes.
\*Attention\* : le format « natif » des traitements de texte est
rarement un format texte. Les fichiers `doc` et `docx` de `Word` et
`odt` de `LibreOffice` *ne sont pas des fichiers textes*.
Le cas du fichier `PDF` ouvert avec un éditeur de texte
-------------------------------------------------------
Dans le cours filmé, j'utilise l'exemple du
[PDF](https://en.wikipedia.org/wiki/Portable_Document_Format) — je donne
l'adresse de la page wikipedia en anglais, bien plus complète que celle
en français — ouvert avec un éditeur de texte pour montrer que le
fichier ne peut pas être visualisé avec un tel logiciel, il faut un
logiciel de rendu dédié comme `Adobe Reader`, `Evince`, `MuPDF`,
`Aperçu`,… Vous remarquez néanmoins que le début du fichier contient du
texte (la première ligne nous apprend que le fichier utilise la version
1.3 du format `PDF`). Cette partie au format texte du fichier contient
les méta-données — qui ne sont pas montrées, en tout cas pas
directement, par les logiciels de rendu. Ces méta-données sont (en
partie) au format
[XMP](https://en.wikipedia.org/wiki/Extensible_Metadata_Platform)
(*Extensible Metadata Platform*), nous y reviendrons dans la cinquème
séquence.
Sur l'UTF-8
-----------
Une table des symboles UTF-8, avec leur code se trouve à l'adresse :
<http://www.utf8-chartable.de/>. C'est pratique pour insérer un symbole
pas très courant comme la lettre « TLO » : Ꮰ de la langue cherokee, ou
le symbole mathématique ∀, « pour tout ».
Pour ceux qui doivent souvent utiliser des lettres grecs (par exemple
pour écrire des équations), il est possible sous Linux de (re)définir
des combinaisons de touches pour générer directement les dites lettres.
Ces combinaisons sont définies dans le fichier `.XCompose`, le début de
mon fichier contient :
``` example
# On charge la base de donnée de Compose la plus complète en UTF-8
include "/usr/share/X11/locale/en_US.UTF-8/Compose"
# espace insécable fine
<Multi_key> <Multi_key> <Space> : " " U202F
# Lettres greques
<Multi_key> <space> <a> : "α" Greek_alpha
<Multi_key> <space> <A> : "Α" Greek_ALPHA
<Multi_key> <space> <b> : "β" Greek_beta
<Multi_key> <space> <B> : "Β" Greek_BETA
<Multi_key> <space> <g> : "γ" Greek_gamma
<Multi_key> <space> <G> : "Γ" Greek_GAMMA
<Multi_key> <space> <d> : "δ" Greek_delta
<Multi_key> <space> <D> : "Δ" Greek_DELTA
<Multi_key> <space> <e> : "ε" Greek_epsilon
<Multi_key> <space> <E> : "Ε" Greek_EPSILON
<Multi_key> <space> <z> : "ζ" Greek_zeta
<Multi_key> <space> <Z> : "Ζ" Greek_ZETA
<Multi_key> <space> <h> : "η" Greek_eta
```
J'ai en plus redéfini la « \<Multi<sub>key</sub>\> » pour qu'elle
corresponde à la touche « impression d'écran » de mon clavier. Pour
apprendre à redéfinir des touches, consultez :
<https://wiki.archlinux.org/index.php/Keyboard_configuration_in_Xorg#Configuring_compose_key>.
#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline
#+OPTIONS: author:t broken-links:nil c:nil creator:nil
#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t
#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t
#+OPTIONS: timestamp:t title:t toc:t todo:t |:t
#+TITLE: Ressources pour la séquence 3 du module 1
#+DATE: <2019-02-21 jeu.>
#+AUTHOR: Christophe Pouzat
#+EMAIL: christophe.pouzat@parisdescartes.fr
#+LANGUAGE: fr
#+SELECT_TAGS: export
#+EXCLUDE_TAGS: noexport
#+CREATOR: Emacs 26.1 (Org mode 9.1.9)
#+STARTUP: indent
* Notes et références sur la séquence 3 : « Du fichier texte au langage de balisage léger »
** Fichier texte et éditeur de texte
Une définition plus technique (et moins circulaire !) du fichier texte se trouve sur [[https://fr.wikipedia.org/wiki/Fichier_texte][la page wikipédia]] consacrée au sujet. Pour plus de détails sur les éditeurs de texte, voir aussi la [[https://fr.wikipedia.org/wiki/%C3%89diteur_de_texte][page wikipédia correspondante]].
Un logiciel de « [[https://fr.wikipedia.org/wiki/Traitement_de_texte][traitement de texte]] » est plus sophistiqué qu'un simple éditeur de texte ; il permet de faire plus, ce qui sous entend qu'il peut aussi ouvrir et manipuler des fichiers textes.
*Attention* : le format « natif » des traitements de texte est rarement un format texte. Les fichiers =doc= et =docx= de =Word= et =odt= de =LibreOffice= /ne sont pas des fichiers textes/.
** Le cas du fichier =PDF= ouvert avec un éditeur de texte
Dans le cours filmé, j'utilise l'exemple du [[https://en.wikipedia.org/wiki/Portable_Document_Format][PDF]] — je donne l'adresse de la page wikipedia en anglais, bien plus complète que celle en français — ouvert avec un éditeur de texte pour montrer que le fichier ne peut pas être visualisé avec un tel logiciel, il faut un logiciel de rendu dédié comme =Adobe Reader=, =Evince=, =MuPDF=, =Aperçu=,... Vous remarquez néanmoins que le début du fichier contient du texte (la première ligne nous apprend que le fichier utilise la version 1.3 du format =PDF=). Cette partie au format texte du fichier contient les méta-données — qui ne sont pas montrées, en tout cas pas directement, par les logiciels de rendu. Ces méta-données sont (en partie) au format [[https://en.wikipedia.org/wiki/Extensible_Metadata_Platform][XMP]] (/Extensible Metadata Platform/), nous y reviendrons dans la cinquème séquence.
** Sur l'UTF-8
Une table des symboles UTF-8, avec leur code se trouve à l'adresse : [[http://www.utf8-chartable.de/]]. C'est pratique pour insérer un symbole pas très courant comme la lettre « TLO » : Ꮰ de la langue cherokee, ou le symbole mathématique ∀, « pour tout ».
Pour ceux qui doivent souvent utiliser des lettres grecs (par exemple pour écrire des équations), il est possible sous Linux de (re)définir des combinaisons de touches pour générer directement les dites lettres. Ces combinaisons sont définies dans le fichier =.XCompose=, le début de mon fichier contient :
#+BEGIN_EXAMPLE
# On charge la base de donnée de Compose la plus complète en UTF-8
include "/usr/share/X11/locale/en_US.UTF-8/Compose"
# espace insécable fine
<Multi_key> <Multi_key> <Space> : " " U202F
# Lettres greques
<Multi_key> <space> <a> : "α" Greek_alpha
<Multi_key> <space> <A> : "Α" Greek_ALPHA
<Multi_key> <space> <b> : "β" Greek_beta
<Multi_key> <space> <B> : "Β" Greek_BETA
<Multi_key> <space> <g> : "γ" Greek_gamma
<Multi_key> <space> <G> : "Γ" Greek_GAMMA
<Multi_key> <space> <d> : "δ" Greek_delta
<Multi_key> <space> <D> : "Δ" Greek_DELTA
<Multi_key> <space> <e> : "ε" Greek_epsilon
<Multi_key> <space> <E> : "Ε" Greek_EPSILON
<Multi_key> <space> <z> : "ζ" Greek_zeta
<Multi_key> <space> <Z> : "Ζ" Greek_ZETA
<Multi_key> <space> <h> : "η" Greek_eta
#+END_EXAMPLE
J'ai en plus redéfini la « <Multi_key> » pour qu'elle corresponde à la touche « impression d'écran » de mon clavier. Pour apprendre à redéfinir des touches, consultez : [[https://wiki.archlinux.org/index.php/Keyboard_configuration_in_Xorg#Configuring_compose_key]].
---
TITLE: Ressources pour la séquence 5 du module 1
AUTHOR: Christophe Pouzat
---\n
broken-links:nil c:nil creator:nil
Notes et références sur la séquence 5 : « Les étiquettes et les logiciels d'indexation pour s'y retrouver »
===========================================================================================================
La structure de la séquence
---------------------------
Nous revenons ici sur le problème de l'indexation, pas tant sur
l'indexation d'un document unique que sur l'indexation de documents
multiples dans des formats divers :
- comme nous l'avons déjà affirmé, prendre des notes abondantes et
détaillées n'est utile que si nous pouvons retrouver les
informations qu'elles contiennent quand nous en avons besoin ;
- pour des notes contenues dans un seul fichier texte, la fonction de
recherche de notre éditeur favori nous permet généralement d'aller
assez loin ;
- pour des notes manuscrites contenues dans un cahier, la méthode de
Locke — que nous avons exposée dans notre deuxième séquence — et qui
repose sur des mots clé ou étiquettes, donne de bons résultats ;
- les notes manuscrites sur fiches sont généralement stockées dans un
meuble dont la structure matérialise un index — comme l'armoire de
Placcius et Leibniz — ;
- mais nous voulons ici aller plus loin, dans le cadre restreint des
« notes » numérisées, en discutant de l'indexation de fichiers
multiples qu'ils soient au format « texte » où dans d'autres format
comme les images `jpg` où les fichier `pdf` ;
- cela nous amménera à introduire les « moteurs de recherche de
bureau » et à expliquer comment des `étiquettes` ou `mots-clés`
peuvent être ajoutés à nos fichiers.
La citation de Leibniz
----------------------
J'ai trouvé la citation introductive :
« Il me semble que l'apparat savant contemporain est comparable à un
grand magasin qui contient une grande quantité de produits, stockés de
façon totalement désordonnée, mélangée ; où les nombres ou lettres
d'indexation manquent ; où les inventaires et livres de comptes pouvant
aider à ordonner le contenu ont disparus.
Plus grande est la quantité d'objets amassés, plus petite est leur
utilité. Ainsi, ne devrions nous pas seulement essayer de rassembler de
nouveaux objets de toutes provenances, mais nous devrions aussi essayer
d'ordonner ceux que nous avons déjà. »
sur le site <http://www.backwordsindexing.com/index.html>, c'est donc
une traduction de traduction. J'emploie ici le terme volontairement
anachronique d'« \[apparat
savant\](<https://fr.wikipedia.org/wiki/Apparat_savant>) » qui est un
terme technique de l'édition désignant : citations, références et
sources, notes en bas de pages, introduction, texte en langue originale
(en parallèle avec la traduction), commentaire historique ou
philologique, index fontium (les sources), index locorum (références
avec renvoi à la page où le passage est cité ou mentionné, par ex. :
Évangile selon Marc 1, 1 : p. 100), index nominum (les noms propres),
index rerum (les thèmes), etc. La référence au « grand magasin » est,
elle aussi anachronique !
Leibniz a, pendant une bonne partie de sa vie, « gagné celle-ci » comme
[bibliothécaire](https://www.reseau-canope.fr/savoirscdi/societe-de-linformation/le-monde-du-livre-et-des-medias/histoire-du-livre-et-de-la-documentation/biographies/leibniz-le-bibliothecaire.html),
ce qui explique en partie sont intérêt très poussé pour les questions de
classifications, d'indexations, etc.
Rechercher avec un éditeur de texte
-----------------------------------
La diapo correspondante rappelle juste au lecteur quelque chose qu'il
sait déjà et qui est vue, par les gens qui passent des notes « papier »
aux notes « numériques », comme le gros attrait du numérique.
Les gens de monde Unix/Linux connaissent aussi généralement le programme
[grep](https://fr.wikipedia.org/wiki/Grep) qui permet de faire des
recherches de mots et, plus généralement d'[expressions
régulières](https://fr.wikipedia.org/wiki/Expression_r%C3%A9guli%C3%A8re),
sur un ou *plusieurs* fichiers ; nous y reviendrons.
Recherche avec index construit « à la main » sur des cahiers de notes
---------------------------------------------------------------------
Là encore, il s'agit juste d'un rappel pour les lecteurs assidus de ce
cours ; à ce stade se sont des experts dans la méthode d'indexation de
Locke.
Recherche avec index « matérialisés »
-------------------------------------
Encore un rappel pour les lecteurs.
Vers les outils « sophistiqués » de l'informatique
--------------------------------------------------
- les techniques que nous venons de voir ou revoir ne fonctionnent que
pour un seul « document » — recherche avec l'éditeur de texte, index
d'un cahier — et/ou pour un seul type de document ;
- les outils informatiques dont nous disposons nous permettent d'aller
plus loin dans l'indexation des fichiers numériques ;
- il est possible de rajouter des étiquettes ou mots-clés à des
fichiers textes comme à des fichiers images (\`jpg\`, \`png\`) ou
des fichiers « mixtes » (\`pdf\`) grâce aux métadonnées qu'ils
contiennent ;
- les moteurs de recherche de bureau permettent d'indexer l'ensemble
des fichiers textes d'une arborescence donnée mais aussi les
métadonnées des autres fichiers.
Les moteurs de recherche de bureau
----------------------------------
Les moteurs de recherche de bureau comme :
- [DocFetcher](http://docfetcher.sourceforge.net/fr/index.html)
(Linux, MacOS, Windows) ;
- [Tracker](https://wiki.gnome.org/Projects/Tracker) (Linux) ;
- [Recoll](https://www.lesbonscomptes.com/recoll/index.html.fr)
(Linux, MacOS, Windows) ;
- [Spotlight](https://fr.wikipedia.org/wiki/Spotlight_(moteur_de_recherche))
(MacOS) ;
permettent de rechercher le *contenu* des fichiers textes, des
courriels, des fichiers générés par les `traitements de texte`
— c'est-à-dire des fichiers qui contiennent essentiellement du texte,
mais qui sont stockés dans un format type `doc`, `docx`, `odt`, etc qui
ne sont pas des formats texte —, des fichiers `pdf` — quand ceux-ci ne
sont pas des *images* de textes —, mais aussi des
[métadonnées](https://en.wikipedia.org/wiki/Portable_Document_Format#Metadata)
des fichiers `pdf`, etc.
Les moteurs de recherche de bureau « utilisent des techniques
d'[indexation](https://fr.wikipedia.org/wiki/Indexation_automatique_de_documents)
qui permettent de réduire considérablement les temps de recherche, par
rapport aux fonctions de recherche intégrées par défaut aux systèmes
d'exploitation. Au contraire de ces derniers, ils prennent aussi souvent
en charge les
[métadonnées](https://fr.wikipedia.org/wiki/M%C3%A9tadonn%C3%A9e), et
sont capables de faire une [analyse
syntaxique](https://fr.wikipedia.org/wiki/Analyse_syntaxique) des
fichiers. » (Source : [Moteur de recherche de
bureau](https://fr.wikipedia.org/wiki/Moteur_de_recherche_de_bureau) sur
Wikipédia)
Comme exemple de « fonctions de recherche intégrées par défaut », on
trouvera sur les systèmes Unix/Linux le programme [grep
](https://fr.wikipedia.org/wiki/Grep)avec lequel nous pouvons chercher
les occurrences du mot « Galilée » dans le répertoire
« RR<sub>MOOC</sub> » de notre cours sur GitHub (après l'avoir cloné) :
``` bash
grep -r Galilée
```
``` example
PITCHME.md:## Galilée qui observe les lunes de Jupiter
PITCHME.md:Le 7 janvier 1610, Galilée fait une découverte capitale : il remarque trois « petites étoiles » à côté de Jupiter. Après quelques nuits d'observation, il découvre qu'il y en a une quatrième et qu'**elles accompagnent la planète**, c'est ce qu'il note sur son cahier d'observations. Ce sont les satellites visibles de Jupiter, qu'il nommera plus tard les étoiles Médicées ou astres médicéens – en l'honneur de ses protecteurs, la Famille des Médicis – et qui sont aujourd'hui appelés lunes galiléennes.
PITCHME.md:Ces observations amèneront Galilée à rejeter l'hypothèse géocentrique (la terre est le centre de l'Univers et tout tourne autour d'elle) en faveur du système copernicien héliocentrique. Cela l'amènera indirectement (je « fais court ») et bien plus tard, le 22 juin 1633, a être condamné par l'inquisition, ce qui lui vaudra de finir ses jours en résidence surveillée.
PITCHME.md:Remarquez l'avantage des « bouts de papiers classés » de Placcius et Leibniz sur le _codex_ de Galilée : les premiers peuvent être facilement réordonnées.
Notes_module1.org:- [[https://en.wikipedia.org/wiki/Galileo_Galilei][la page wikipedia sur Galilée]] contient de nombreux liens, certains vers ses cahiers de notes ;
Notes_module1.org:Comme exemple de « fonctions de recherche intégrées par défaut » on trouvera sur les systèmes Unix/Linux le programme [[https://fr.wikipedia.org/wiki/Grep][grep ]]avec lequel nous pouvons chercher les occurrences du mot « Galilée » dans le répertoire « RR_MOOC » de notre cours sur GitHub (après l'avoir cloné) :
Notes_module1.org:grep -r Galilée
```
Une version plus sophistiquée de `grep` est fournie par le programme
[cgvg](http://uzix.org/cgvg.html).
Pourquoi des étiquettes
-----------------------
Une requête basée sur un simple mot renvoie souvent un très grand nombre
de propositions, même si la plupart des moteurs de recherche de bureau
permettent de filtrer ces dernières. Une façon efficace de limiter leur
nombre est d'inclure dans nos documents des étiquettes, c'est-à-dire des
points d'ancrage labelisés, qui seront aisément indexés par le moteur de
recherche de bureau et dont le label ne correspond à aucun mot ou
locution du dictionnaire — nous effectuons ainsi une version simplifiée
du travail de l'*indexeur*, la personne chargée de construire l'index
d'un livre. Pour que l'étiquette garde un sens, il suffit d'encadrer un
mot par une paire de signes de ponctuation comme « : », « ; » ou « ? ».
Un label comme « :code: » sera facilement mémorisé et fera un parfait
équivalent du mot-clé « code » utilisé dans l'exemple du cahier de note
de la deuxième séquence de ce module — pour illustrer la méthode de
Locke.
Il nous reste encore nous reste encore un détail technique à régler dans
le cas de nos notes prises en format texte comme `Markdown`. En effet,
nous ne souhaitons pas que nos étiquettes apparaissent dans les sorties
`html`, `pdf` ou `docx` de nos notes. Un façon de procéder, pour les
langages de balisage légers qui ne disposent pas d'étiquettes — par
exemple, `Markdown` n'en dispose pas, alors que `org` en a — et de les
inclure dans des commentaires. En `Markdown`, tout ce qui est encadré
par `<!--` et `-->` est considéré comme un commentaire et ne figure pas
dans les sorties `html` ou `pdf` des notes. Nous pouvons ainsi
utiliser :
``` example
<!-- ;code; -->
```
à l'endroit de nos notes où nous souhaitons aller rapidement lorsque que
nous cherchons une information relative à de la programmation
(production de codes).
Les métadonnées
---------------
### Fichiers images
Nous savons à présent comment rajouter des étiquettes à un fichier au
format texte, mais nous devons souvent aussi travailler avec des
fichiers contenant des images ou des photos, comme les fichiers
[JPEG](https://fr.wikipedia.org/wiki/JPEG) — les appareils photos
numériques utilisent tous ce format —,
[GIF](https://fr.wikipedia.org/wiki/Graphics_Interchange_Format) ou
[PNG](https://fr.wikipedia.org/wiki/Portable_Network_Graphics). La
question se pose alors, peut-on ajouter des étiquettes à nos fichiers
images de sorte que nos moteurs de recherche de bureau les indexent ? La
réponse et oui, grâce aux
[métadonnées](https://fr.wikipedia.org/wiki/M%C3%A9tadonn%C3%A9e) que
contiennent ces fichiers. Les métadonnées, dans ce cas, sont des données
stockées dans le fichier mais qui ne sont pas montrées par le logiciel
de rendu (en tout cas, pas montrées par défaut). Nous savons tous que
ces métadonnées « existent » ; ce sont elles qui contiennent la date, la
localisation GPS, le temps d'exposition, etc. de nos photos numériques.
Dans les fichiers `JPEG`, elles sont stockées suivant l'[exchangeable
image file
format](https://fr.wikipedia.org/wiki/Exchangeable_image_file_format)
(`EXIF`). La plupart des logiciels de manipulations d'images et de
photos permettent d'accéder au contenu des métadonnées et de les
modifier. L'exemple illustré dans le cours utilise une solution très
simple en « ligne de commande »,
[ExifTool](http://owl.phy.queensu.ca/~phil/exiftool/) qui permet de
visualiser et de modifier les métadonnées. D'autres logiciels comme
[exiv2](http://www.exiv2.org/index.html) ou
[ImageMagick](https://imagemagick.org/script/index.php) permettent de le
faire (pour ne citer que des logiciels libres disponibles sur Linux,
Windows et MacOS). Certains des éléments du format `EXIF` sont des
chaînes de caractères, c'est-à-dire du texte, que nous somme libres
d'utiliser comme nous le souhaitons ; nous pouvons dès lors les utiliser
pour rajouter nos étiquettes. Nous illustrons dans le cours comment le
faire avec `ExifTool`, mais nous aurions aussi pu le faire avec le
programme
[mogrify](https://www.imagemagick.org/script/command-line-options.php#comment)
d'ImageMagick. Tous les moteurs de recherche de bureau que nous avons
mentionné vont « aller regarder » les métadonnées des fichier `JPEG`
lors de la phase d'indexation et nous permettront ainsi d'exploiter les
étiquettes que nous y aurons insérées.
`EXIF` n'est pas le seul format de métadonnées existant ; un format plus
récent est l'[Extensible Metadata Platform
](https://fr.wikipedia.org/wiki/Extensible_Metadata_Platform)(`XMP`),
disponible pour un plus grand nombre de formats de fichiers — il n'est
pour l'instant pas lu sur les fichiers `JPEG` par `DocFetcher`, c'est
pourquoi nous avons mis en avant le format `EXIF`, mais cela devrait
évoluer assez vite ; les autres moteurs comme `Tracker` et `Recoll` le
lisent.
### Fichiers `PDF`
En plus des fichiers images, nous sommes tous très fréquemment amenés à
travailler avec les fichiers « composites » — contenant textes, images,
et plus — que sont les fichiers
[PDF](https://fr.wikipedia.org/wiki/Portable_Document_Format). Ces
fichiers contiennent eux aussi des métadonnées ; c'est d'ailleurs pour
eux qu'Adobe a initialement introduit le format `XMP` que nous venons de
discuter. Ces métadonnées peuvent être lues et modifiées, en particulier
l'élément `Keywords` (mot-clé) qui peut contenir des chaînes de
caractères de longueur arbitraires et qui est parfait pour accueillir
nos étiquettes. Le programme `ExifTool`, permet de modifier les
métadonnées des fichiers `PDF`. Les moteurs de recherche de bureau que
nous avons mentionnés, vont tous aller lire les métadonnées des fichiers
`PDF` lors de la phase d'indexation.
### Fichiers audios
Les formats audio comme le
[mp3](https://fr.wikipedia.org/wiki/MPEG-1/2_Audio_Layer_III) ou le
[ogg](https://fr.wikipedia.org/wiki/Ogg) contiennent eux aussi des
métadonnées, où sont stockés les titres, noms des interprètes, etc ; ces
métadonnées peuvent être modifiées et sont lues par les moteurs de
recherche de bureau lors de la phase d'indexation.
#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline
#+OPTIONS: author:t broken-links:nil c:nil creator:nil
#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t
#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t
#+OPTIONS: timestamp:t title:t toc:t todo:t |:t
#+TITLE: Ressources pour la séquence 5 du module 1
#+DATE: <2019-02-21 jeu.>
#+AUTHOR: Christophe Pouzat
#+EMAIL: christophe.pouzat@parisdescartes.fr
#+LANGUAGE: fr
#+SELECT_TAGS: export
#+EXCLUDE_TAGS: noexport
#+CREATOR: Emacs 26.1 (Org mode 9.1.9)
#+STARTUP: indent
* Notes et références sur la séquence 5 : « Les étiquettes et les logiciels d'indexation pour s'y retrouver »
** La structure de la séquence
Nous revenons ici sur le problème de l'indexation, pas tant sur l'indexation d'un document unique que sur l'indexation de documents multiples dans des formats divers :
- comme nous l'avons déjà affirmé, prendre des notes abondantes et détaillées n'est utile que si nous pouvons retrouver les informations qu'elles contiennent quand nous en avons besoin ;
- pour des notes contenues dans un seul fichier texte, la fonction de recherche de notre éditeur favori nous permet généralement d'aller assez loin ;
- pour des notes manuscrites contenues dans un cahier, la méthode de Locke — que nous avons exposée dans notre deuxième séquence — et qui repose sur des mots clé ou étiquettes, donne de bons résultats ;
- les notes manuscrites sur fiches sont généralement stockées dans un meuble dont la structure matérialise un index — comme l'armoire de Placcius et Leibniz — ;
- mais nous voulons ici aller plus loin, dans le cadre restreint des « notes » numérisées, en discutant de l'indexation de fichiers multiples qu'ils soient au format « texte » où dans d'autres format comme les images =jpg= où les fichier =pdf= ;
- cela nous amménera à introduire les « moteurs de recherche de bureau » et à expliquer comment des =étiquettes= ou =mots-clés= peuvent être ajoutés à nos fichiers.
** La citation de Leibniz
J'ai trouvé la citation introductive :
« Il me semble que l'apparat savant contemporain est comparable à un grand magasin qui contient une grande quantité de produits, stockés de façon totalement désordonnée, mélangée ; où les nombres ou lettres d'indexation manquent ; où les inventaires et livres de comptes pouvant aider à ordonner le contenu ont disparus.
Plus grande est la quantité d'objets amassés, plus petite est leur utilité. Ainsi, ne devrions nous pas seulement essayer de rassembler de nouveaux objets de toutes provenances, mais nous devrions aussi essayer d'ordonner ceux que nous avons déjà. »
sur le site [[http://www.backwordsindexing.com/index.html]], c'est donc une traduction de traduction. J'emploie ici le terme volontairement anachronique d'« [apparat savant](https://fr.wikipedia.org/wiki/Apparat_savant) » qui est un terme technique de l'édition désignant : citations, références et sources, notes en bas de pages, introduction, texte en langue originale (en parallèle avec la traduction), commentaire historique ou philologique, index fontium (les sources), index locorum (références avec renvoi à la page où le passage est cité ou mentionné, par ex. : Évangile selon Marc 1, 1 : p. 100), index nominum (les noms propres), index rerum (les thèmes), etc. La référence au « grand magasin » est, elle aussi anachronique !
Leibniz a, pendant une bonne partie de sa vie, « gagné celle-ci » comme [[https://www.reseau-canope.fr/savoirscdi/societe-de-linformation/le-monde-du-livre-et-des-medias/histoire-du-livre-et-de-la-documentation/biographies/leibniz-le-bibliothecaire.html][bibliothécaire]], ce qui explique en partie sont intérêt très poussé pour les questions de classifications, d'indexations, etc.
** Rechercher avec un éditeur de texte
La diapo correspondante rappelle juste au lecteur quelque chose qu'il sait déjà et qui est vue, par les gens qui passent des notes « papier » aux notes « numériques », comme le gros attrait du numérique.
Les gens de monde Unix/Linux connaissent aussi généralement le programme [[https://fr.wikipedia.org/wiki/Grep][grep]] qui permet de faire des recherches de mots et, plus généralement d'[[https://fr.wikipedia.org/wiki/Expression_r%C3%A9guli%C3%A8re][expressions régulières]], sur un ou /plusieurs/ fichiers ; nous y reviendrons.
** Recherche avec index construit « à la main » sur des cahiers de notes
Là encore, il s'agit juste d'un rappel pour les lecteurs assidus de ce cours ; à ce stade se sont des experts dans la méthode d'indexation de Locke.
** Recherche avec index « matérialisés »
Encore un rappel pour les lecteurs.
** Vers les outils « sophistiqués » de l'informatique
- les techniques que nous venons de voir ou revoir ne fonctionnent que pour un seul « document » — recherche avec l'éditeur de texte, index d'un cahier — et/ou pour un seul type de document ;
- les outils informatiques dont nous disposons nous permettent d'aller plus loin dans l'indexation des fichiers numériques ;
- il est possible de rajouter des étiquettes ou mots-clés à des fichiers textes comme à des fichiers images (`jpg`, `png`) ou des fichiers « mixtes » (`pdf`) grâce aux métadonnées qu'ils contiennent ;
- les moteurs de recherche de bureau permettent d'indexer l'ensemble des fichiers textes d'une arborescence donnée mais aussi les métadonnées des autres fichiers.
** Les moteurs de recherche de bureau
Les moteurs de recherche de bureau comme :
- [[http://docfetcher.sourceforge.net/fr/index.html][DocFetcher]] (Linux, MacOS, Windows) ;
- [[https://wiki.gnome.org/Projects/Tracker][Tracker]] (Linux) ;
- [[https://www.lesbonscomptes.com/recoll/index.html.fr][Recoll]] (Linux, MacOS, Windows) ;
- [[https://fr.wikipedia.org/wiki/Spotlight_(moteur_de_recherche)][Spotlight]] (MacOS) ;
permettent de rechercher le /contenu/ des fichiers textes, des courriels, des fichiers générés par les =traitements de texte= — c'est-à-dire des fichiers qui contiennent essentiellement du texte, mais qui sont stockés dans un format type =doc=, =docx=, =odt=, etc qui ne sont pas des formats texte —, des fichiers =pdf= — quand ceux-ci ne sont pas des /images/ de textes —, mais aussi des [[https://en.wikipedia.org/wiki/Portable_Document_Format#Metadata][métadonnées]] des fichiers =pdf=, etc.
Les moteurs de recherche de bureau « utilisent des techniques d'[[https://fr.wikipedia.org/wiki/Indexation_automatique_de_documents][indexation]] qui permettent de réduire considérablement les temps de recherche, par rapport aux fonctions de recherche intégrées par défaut aux systèmes d'exploitation. Au contraire de ces derniers, ils prennent aussi souvent en charge les [[https://fr.wikipedia.org/wiki/M%C3%A9tadonn%C3%A9e][métadonnées]], et sont capables de faire une [[https://fr.wikipedia.org/wiki/Analyse_syntaxique][analyse syntaxique]] des fichiers. » (Source : [[https://fr.wikipedia.org/wiki/Moteur_de_recherche_de_bureau][Moteur de recherche de bureau]] sur Wikipédia)
Comme exemple de « fonctions de recherche intégrées par défaut », on trouvera sur les systèmes Unix/Linux le programme [[https://fr.wikipedia.org/wiki/Grep][grep ]]avec lequel nous pouvons chercher les occurrences du mot « Galilée » dans le répertoire « RR_MOOC » de notre cours sur GitHub (après l'avoir cloné) :
#+NAME: grep-Leibniz-RR_MOOC
#+BEGIN_SRC sh :results output :exports both
grep -r Galilée
#+END_SRC
#+RESULTS: grep-Leibniz-RR_MOOC
: PITCHME.md:## Galilée qui observe les lunes de Jupiter
: PITCHME.md:Le 7 janvier 1610, Galilée fait une découverte capitale : il remarque trois « petites étoiles » à côté de Jupiter. Après quelques nuits d'observation, il découvre qu'il y en a une quatrième et qu'**elles accompagnent la planète**, c'est ce qu'il note sur son cahier d'observations. Ce sont les satellites visibles de Jupiter, qu'il nommera plus tard les étoiles Médicées ou astres médicéens – en l'honneur de ses protecteurs, la Famille des Médicis – et qui sont aujourd'hui appelés lunes galiléennes.
: PITCHME.md:Ces observations amèneront Galilée à rejeter l'hypothèse géocentrique (la terre est le centre de l'Univers et tout tourne autour d'elle) en faveur du système copernicien héliocentrique. Cela l'amènera indirectement (je « fais court ») et bien plus tard, le 22 juin 1633, a être condamné par l'inquisition, ce qui lui vaudra de finir ses jours en résidence surveillée.
: PITCHME.md:Remarquez l'avantage des « bouts de papiers classés » de Placcius et Leibniz sur le _codex_ de Galilée : les premiers peuvent être facilement réordonnées.
: Notes_module1.org:- [[https://en.wikipedia.org/wiki/Galileo_Galilei][la page wikipedia sur Galilée]] contient de nombreux liens, certains vers ses cahiers de notes ;
: Notes_module1.org:Comme exemple de « fonctions de recherche intégrées par défaut » on trouvera sur les systèmes Unix/Linux le programme [[https://fr.wikipedia.org/wiki/Grep][grep ]]avec lequel nous pouvons chercher les occurrences du mot « Galilée » dans le répertoire « RR_MOOC » de notre cours sur GitHub (après l'avoir cloné) :
: Notes_module1.org:grep -r Galilée
Une version plus sophistiquée de =grep= est fournie par le programme [[http://uzix.org/cgvg.html][cgvg]].
** Pourquoi des étiquettes
Une requête basée sur un simple mot renvoie souvent un très grand nombre de propositions, même si la plupart des moteurs de recherche de bureau permettent de filtrer ces dernières. Une façon efficace de limiter leur nombre est d'inclure dans nos documents des étiquettes, c'est-à-dire des points d'ancrage labelisés, qui seront aisément indexés par le moteur de recherche de bureau et dont le label ne correspond à aucun mot ou locution du dictionnaire — nous effectuons ainsi une version simplifiée du travail de l'/indexeur/, la personne chargée de construire l'index d'un livre. Pour que l'étiquette garde un sens, il suffit d'encadrer un mot par une paire de signes de ponctuation comme « : », « ; » ou « ? ». Un label comme « :code: » sera facilement mémorisé et fera un parfait équivalent du mot-clé « code » utilisé dans l'exemple du cahier de note de la deuxième séquence de ce module — pour illustrer la méthode de Locke.
Il nous reste encore nous reste encore un détail technique à régler dans le cas de nos notes prises en format texte comme =Markdown=. En effet, nous ne souhaitons pas que nos étiquettes apparaissent dans les sorties =html=, =pdf= ou =docx= de nos notes. Un façon de procéder, pour les langages de balisage légers qui ne disposent pas d'étiquettes — par exemple, =Markdown= n'en dispose pas, alors que =org= en a — et de les inclure dans des commentaires. En =Markdown=, tout ce qui est encadré par =<!--= et =-->= est considéré comme un commentaire et ne figure pas dans les sorties =html= ou =pdf= des notes. Nous pouvons ainsi utiliser :
#+BEGIN_EXAMPLE
<!-- ;code; -->
#+END_EXAMPLE
à l'endroit de nos notes où nous souhaitons aller rapidement lorsque que nous cherchons une information relative à de la programmation (production de codes).
** Les métadonnées
*** Fichiers images
Nous savons à présent comment rajouter des étiquettes à un fichier au format texte, mais nous devons souvent aussi travailler avec des fichiers contenant des images ou des photos, comme les fichiers [[https://fr.wikipedia.org/wiki/JPEG][JPEG]] — les appareils photos numériques utilisent tous ce format —, [[https://fr.wikipedia.org/wiki/Graphics_Interchange_Format][GIF]] ou [[https://fr.wikipedia.org/wiki/Portable_Network_Graphics][PNG]]. La question se pose alors, peut-on ajouter des étiquettes à nos fichiers images de sorte que nos moteurs de recherche de bureau les indexent ? La réponse et oui, grâce aux [[https://fr.wikipedia.org/wiki/M%C3%A9tadonn%C3%A9e][métadonnées]] que contiennent ces fichiers. Les métadonnées, dans ce cas, sont des données stockées dans le fichier mais qui ne sont pas montrées par le logiciel de rendu (en tout cas, pas montrées par défaut). Nous savons tous que ces métadonnées « existent » ; ce sont elles qui contiennent la date, la localisation GPS, le temps d'exposition, etc. de nos photos numériques. Dans les fichiers =JPEG=, elles sont stockées suivant l'[[https://fr.wikipedia.org/wiki/Exchangeable_image_file_format][exchangeable image file format]] (=EXIF=). La plupart des logiciels de manipulations d'images et de photos permettent d'accéder au contenu des métadonnées et de les modifier. L'exemple illustré dans le cours utilise une solution très simple en « ligne de commande », [[http://owl.phy.queensu.ca/~phil/exiftool/][ExifTool]] qui permet de visualiser et de modifier les métadonnées. D'autres logiciels comme [[http://www.exiv2.org/index.html][exiv2]] ou [[https://imagemagick.org/script/index.php][ImageMagick]] permettent de le faire (pour ne citer que des logiciels libres disponibles sur Linux, Windows et MacOS). Certains des éléments du format =EXIF= sont des chaînes de caractères, c'est-à-dire du texte, que nous somme libres d'utiliser comme nous le souhaitons ; nous pouvons dès lors les utiliser pour rajouter nos étiquettes. Nous illustrons dans le cours comment le faire avec =ExifTool=, mais nous aurions aussi pu le faire avec le programme [[https://www.imagemagick.org/script/command-line-options.php#comment][mogrify]] d'ImageMagick. Tous les moteurs de recherche de bureau que nous avons mentionné vont « aller regarder » les métadonnées des fichier =JPEG= lors de la phase d'indexation et nous permettront ainsi d'exploiter les étiquettes que nous y aurons insérées.
=EXIF= n'est pas le seul format de métadonnées existant ; un format plus récent est l'[[https://fr.wikipedia.org/wiki/Extensible_Metadata_Platform][Extensible Metadata Platform ]](=XMP=), disponible pour un plus grand nombre de formats de fichiers — il n'est pour l'instant pas lu sur les fichiers =JPEG= par =DocFetcher=, c'est pourquoi nous avons mis en avant le format =EXIF=, mais cela devrait évoluer assez vite ; les autres moteurs comme =Tracker= et =Recoll= le lisent.
*** Fichiers =PDF=
En plus des fichiers images, nous sommes tous très fréquemment amenés à travailler avec les fichiers « composites » — contenant textes, images, et plus — que sont les fichiers [[https://fr.wikipedia.org/wiki/Portable_Document_Format][PDF]]. Ces fichiers contiennent eux aussi des métadonnées ; c'est d'ailleurs pour eux qu'Adobe a initialement introduit le format =XMP= que nous venons de discuter. Ces métadonnées peuvent être lues et modifiées, en particulier l'élément =Keywords= (mot-clé) qui peut contenir des chaînes de caractères de longueur arbitraires et qui est parfait pour accueillir nos étiquettes. Le programme =ExifTool=, permet de modifier les métadonnées des fichiers =PDF=. Les moteurs de recherche de bureau que nous avons mentionnés, vont tous aller lire les métadonnées des fichiers =PDF= lors de la phase d'indexation.
*** Fichiers audios
Les formats audio comme le [[https://fr.wikipedia.org/wiki/MPEG-1/2_Audio_Layer_III][mp3]] ou le [[https://fr.wikipedia.org/wiki/Ogg][ogg]] contiennent eux aussi des métadonnées, où sont stockés les titres, noms des interprètes, etc ; ces métadonnées peuvent être modifiées et sont lues par les moteurs de recherche de bureau lors de la phase d'indexation.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment