From 6bd54cf8bb98c6323d6814252762e2a7228bc1aa Mon Sep 17 00:00:00 2001 From: Christophe Date: Thu, 21 Mar 2019 13:21:25 +0100 Subject: [PATCH] Nouveaux noms et md avec Makefile. --- module1/ressources/Makefile | 4 +- .../Module1_1_MaterielSupplementaire_fr.md | 269 +++++++++++++ .../Module1_1_MaterielSupplementaire_fr.org | 116 ++++++ .../Module1_1_SupplementaryMaterial.md | 358 ++++++++++++++++++ .../Module1_1_SupplementaryMaterial.org | 273 +++++++++++++ .../Module1_2_MaterielSupplementaire_fr.md | 171 +++++++++ .../Module1_2_MaterielSupplementaire_fr.org | 73 ++++ .../Module1_2_SupplementaryMaterial.md | 337 +++++++++++++++++ .../Module1_2_SupplementaryMaterial.org | 173 +++++++++ .../Module1_3_MaterielSupplementaire_fr.md | 87 +++++ .../Module1_3_MaterielSupplementaire_fr.org | 56 +++ .../Module1_5_MaterielSupplementaire_fr.md | 284 ++++++++++++++ .../Module1_5_MaterielSupplementaire_fr.org | 112 ++++++ 13 files changed, 2312 insertions(+), 1 deletion(-) create mode 100644 module1/ressources/Module1_1_MaterielSupplementaire_fr.md create mode 100644 module1/ressources/Module1_1_MaterielSupplementaire_fr.org create mode 100644 module1/ressources/Module1_1_SupplementaryMaterial.md create mode 100644 module1/ressources/Module1_1_SupplementaryMaterial.org create mode 100644 module1/ressources/Module1_2_MaterielSupplementaire_fr.md create mode 100644 module1/ressources/Module1_2_MaterielSupplementaire_fr.org create mode 100644 module1/ressources/Module1_2_SupplementaryMaterial.md create mode 100644 module1/ressources/Module1_2_SupplementaryMaterial.org create mode 100644 module1/ressources/Module1_3_MaterielSupplementaire_fr.md create mode 100644 module1/ressources/Module1_3_MaterielSupplementaire_fr.org create mode 100644 module1/ressources/Module1_5_MaterielSupplementaire_fr.md create mode 100644 module1/ressources/Module1_5_MaterielSupplementaire_fr.org diff --git a/module1/ressources/Makefile b/module1/ressources/Makefile index ecaf8a7..f96a787 100644 --- a/module1/ressources/Makefile +++ b/module1/ressources/Makefile @@ -1,3 +1,5 @@ -ressources-md: introduction_to_markdown.md introduction_to_markdown_fr.md +ressources-md: Module1_1_MaterielSupplementaire_fr.md Module1_2_MaterielSupplementaire_fr.md\ +Module1_3_MaterielSupplementaire_fr.md Module1_5_MaterielSupplementaire_fr.md\ +Module1_1_SupplementaryMaterial.md Module1_2_SupplementaryMaterial.md include ../../Makefile.ressources diff --git a/module1/ressources/Module1_1_MaterielSupplementaire_fr.md b/module1/ressources/Module1_1_MaterielSupplementaire_fr.md new file mode 100644 index 0000000..a98c66a --- /dev/null +++ b/module1/ressources/Module1_1_MaterielSupplementaire_fr.md @@ -0,0 +1,269 @@ +--- +TITLE: Ressources pour la séquence 1 du module 1 +AUTHOR: Christophe Pouzat +---\n +broken-links:nil c:nil creator:nil + +Notes et références sur la séquence 1 : « Nous utilisons tous des cahiers de notes » +==================================================================================== + +Manuscrits annotés +------------------ + +En guise d'entrée dans l'univers des manuscrits annotés, je fais suivre +une petite sélection de passages du premier chapitre de « LA PAGE. DE +L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE » d'Anthony Grafton (Hazan, 2012) : + +``` example + Par le mouvement même de sa plume sur la page, il est clair que +Casaubon maîtrise tout ce qu'il lit. Constamment, il souligne des +mots et des expressions, il note en marge des mots clés et des résumés +montrant qu'il a lu attentivement, même quand, précise-t-il dans son +journal intime, il étudie en une journée quarante à cinquante pages +in-folio de grec émaillées de nombreuses abréviations. Les passages +plus importants donnent lieu en marge à des commentaires plus +longs. Sur les pages de titre, Casaubon porte très souvent — un peu +comme Montaigne — un jugement global sur la valeur de l'ouvrage. +Par ailleurs, il note ses réflexions dans des carnets, ou prend +des notes sur des textes qu'il ne peut pas acheter. Tels qu'ils sont +réunis dans sa bibliothèque, ses livres représentent une vie entière de +lecture que l'on peut reconstituer au fil des pages. +``` + +Pages 32 et 33, à propos d'[Isaac +Casaubon](https://fr.wikipedia.org/wiki/Isaac_Casaubon) (1559-1614). + +``` example + Pourtant, Harvey a laissé beaucoup plus que cela, et notamment +des traces des ses lectures sous forme de plus d'une centaine de livres +couverts d'annotations magnifiquement écrites de sa belle écriture +italique — en plus des cahiers dans lesquels il notait des extraits. +Manifestement, Harvey considérait la lecture comme sa profession, +et il en a fait aussi un art. Décennie après décennie, il couche ses +pensées sur l'histoire dans une édition in-folio de 1555 de l'Histoire +romaine de Tite-Live. Ses notes, en latin pour la plupart, parcourent +les marges, se répandent entre les chapitres et remplissent +des feuilles volantes, prenant un aspect particulièrement érudit et +assez rébarbatif. +``` + +Pages 35 et 36, à propos de [Gabriel +Harvey](https://en.wikipedia.org/wiki/Gabriel_Harvey) (1545-1630). + +``` example +... Mais dans l'exemplaire de travail qui subsiste du +texte, l'édition de base de 1549, il [Casaubon] introduit tant d'annotations +précises que les catalogueurs de la Bibliothèque bodléienne, qui n'étaient +pas rompus à la rhétorique, ont classé ce livre imprimé parmi les manuscrits. +``` + +Page 40. + +Armoires à notes de Placcius et Leibniz +--------------------------------------- + +J'ai trouvé cet exemple dans les travaux d'[Ann +Blair](https://projects.iq.harvard.edu/ablair) comme « [The Rise of +Note-Taking in Early Modern +Europe](https://dash.harvard.edu/handle/1/4774908) » et son livre « [TOO +MUCH TO KNOW. Managing Scholarly Information before the Modern +Age](https://yalebooks.yale.edu/book/9780300165395/too-much-know) », +publié chez *Yale University Press* en 2011. + +La préface de « L'île des pingouins » d'Anatole France +------------------------------------------------------ + +Étant très loin de connaître Anatole France sur le bout des doigts, j'ai +trouvé la référence citée dans le remarquable article de Keith Thomas +publié par la *London Review of Books*, [le 10 juin +2010](https://www.lrb.co.uk/v32/n11/keith-thomas/diary). Cet article (en +anglais) décrit et discute le travail concret de prise de notes par un +historien, il est de plus très bien écrit et plein d'anecdotes. + +Les livres de bord +------------------ + +Je remercie Joël Caselli de m'avoir aidé à interpréter le contenu du +livre de bord d'Éric Tabarly. + +Le projet européen de reconstruction des climats des océans atlantique +et indien (et non pacifique comme je le dis dans le cours !) : +[*Climatological Database for the World's Oceans +1750-1850*](http://webs.ucm.es/info/cliwoc/) ; dispose d'un site +internet très intéressant (mais en anglais). + +On trouvera des citations abondantes (et effrayantes) de livres de bord +de navires négriers dans le livre de Marcus Rediker « À bord du +négrier : Une histoire atlantique de la traite » (disponible en édition +de poche). + +Un absent : le cahier de laboratoire classique +---------------------------------------------- + +Je traduis ici la section 6.2 *Notebooks and Records* du remarquable +livre de E. Bright Wilson *An Introduction to Scientific Research* +réimprimé par Dover. + +Il est difficile de concevoir un cahier de laboratoire parfait et il est +malheureusement rare d'en trouver un qui soit même à peu près +satisfaisant ; la conservation d'une trace écrite du travail effectué +est néanmoins une source majeure d'efficacité. Il y aura forcément des +gens opposés à un ensemble de règles fixes, mais cela sera probablement +plus rare pour le rituel de garder un cahier que sur d'autres sujets. +Par conséquent, un ensemble de règles qui sont généralement considérées +comme satisfaisantes, voire même essentielles, seront quelque peu +dogmatiquement énoncées. + +De grandes découvertes ont été retardées en raison d'une négligente +tenue des traces écrites. L'astronome Le Monnier est ainsi supposé avoir +observé la planète Uranus à plusieurs reprises – avant que son +identification comme planète ait été annoncée par Herschel –, mais a +décidé qu'elle était une étoile fixe. Cela s'explique probablement en +partie par le fait qu'il a écrit ses mesures sur des morceaux de papier, +y compris un sac en papier contenant à l'origine de la poudre pour +cheveux ! + +Les cahiers de laboratoire doivent être solidement reliés, d'une taille +approximative de 20 x 25 cm, avec des pages numérotées. Les feuilles +séparées sont trop facilement perdues pour être satisfaisantes, d'autant +plus qu'un cahier de laboratoire subit souvent un traitement un peu rude +avec peut-être des projections occasionnelles d'acide \[c'est un +physico-chimiste qui écrit\]. Le cas de mesures répétées constitue une +exception où une ébauche spéciale imprimée est souvent utile si un bon +système est établi pour collecter et relier les feuilles séparées. Les +pages avec des lignes sont généralement utilisées, mais il s'agit d'une +question de goût personnel, et certaines préfèrent des pages blanches ou +à carreaux. Un tampon en caoutchouc peut être utilisé pour fournir des +en-têtes pour les entrées les plus communes. + +Les données doivent être entrées directement dans le cahier au moment de +l'observation. Il est intolérable d'utiliser sa mémoire ou des fragments +de papier pour l'enregistrement primaire, du fait de l'inévitabilité des +erreurs et des pertes. Il devrait donc y avoir une bonne place pour le +cahier à coté du poste de travail, et l'expérimentateur ne devrait +jamais être sans son cahier lorsqu'il est en action. + +Les données doivent être enregistrées à l'encre, de préférence une encre +permanente, un buvard peut être pratique. Sinon, la trace écrite est +trop éphémère. Les cahiers sont soumis à une utilisation intensive et +les écritures au crayons se détériorent trop rapidement. Lorsque le +cahier peut être utilisé comme preuve pour un brevet, l'usage de l'encre +s'impose. + +Des graphiques approximatifs et qualitatifs peuvent être dessinés +directement, mais les graphiques précis sont généralement préparés avec +le papier graphique du type le plus approprié \[pensez au papier +millimétré\]. Ils sont ensuite soigneusement collés dans le cahier, une +page vierge étant découpée afin de compenser l'épaisseur ajoutée. + +Les cahiers doivent porter le nom de l'utilisateur et les dates +couvertes. \[…\]. Les huit ou dix premières pages devraient être +réservées pour une table des matières. Il s'agit de lignes ajoutées +chronologiquement pour chaque série d'expériences similaires, ainsi que +la référence de la page. La table des matières est extrêmement utile +pour trouver des éléments plus tard et est très simple à suivre. Un +index au dos du cahier est avantageux mais pas indispensable. + +Chaque élément devrait être datée et, si plusieurs personnes utilisent +un cahier (généralement pas recommandé), paraphé. Le contenu ne devrait +pas inscrit de façon trop dense sur les pages ; le papier est bon marché +par rapport aux autres dépenses de recherche. + +La principale difficulté est de décider ce qu'il faut écrire dans le +cahier. Évidemment, on entre les résultats numériques et les valeurs des +variables indépendantes telles que la température, la composition ou la +pression qui sont directement pertinentes. Il est également nécessaire +d'avoir un système d'entrées ou de références afin que, plus tard, il +soit possible de dire quel appareil a été utilisé et dans quelles +circonstances. Une description assez complète de l'appareil devrait être +conservée. Ensuite, lorsque des modifications sont apportées à +l'appareil, elles doivent être décrites immédiatement dans le cahier. Il +devrait également être possible de retracer la source des courbes +d'étalonnage, des corrections, etc., qui étaient appropriées aux données +d'un jour donné. Il est utile que les exigences relatives à l'écriture +d'un article, d'une thèse ou d'un livre soient gardées à l'esprit. Une +telle tâche, une fois effectuée, entraîne généralement la résolution +solennelle de garder un cahier plus détaillé dans le futur. Essayer de +comprendre le cahier de notes de quelqu'un d'autre constitue aussi un +exercice hautement salutaire. Toutes les références aux appareils, aux +lieux, aux horaires, aux livres, aux articles, aux graphiques et aux +personnes devraient être suffisamment explicites pour être +compréhensibles des années plus tard. **Il devrait être possible de +prendre chaque article scientifique et de montrer exactement où chaque +figure, description ou déclaration est justifiée par des observations +originales dans le cahier de laboratoire, et exactement pourquoi les +nombres final et original diffèrent, si tel est le cas**. + +Un énoncé du but de chaque expérience et un résumé des conclusions +obtenues rendent le cahier beaucoup plus utile. Les croquis, dessins et +diagrammes sont essentiels. Comme tant d'observations sont visuelles, +*il est important de noter ce qui est réellement vu, y compris des +éléments qui ne sont pas entièrement compris lors de leur observation*. + +Les expériences mauvaises ou non prometteuses, même celles considérées +comme des échecs, devraient être entièrement enregistrées. Elles +représentent un effort qui ne doit pas être gaspillé, car souvent +quelque chose peut être récupéré, même si ce n'est qu'une connaissance +de ce qu'il ne faut pas faire. + +Les données doivent toujours être entrées dans leur forme la plus +primaire, et non après un calcul ou une transformation. Si c'est le +rapport de deux observations qui est intéressant, mais si les deux +nombres sont effectivement observés, les deux nombres doivent être +enregistrés. Si le poids précis d'un objet est important, les poids +d'équilibrage individuels utilisés et leur identification devraient être +inclus, c'est-à-dire le numéro de série de leur boîte. Dans le cas +contraire, il devient impossible d'appliquer ultérieurement des +corrections d'étalonnage ou de modifier les corrections si de nouvelles +valeurs apparaissent. Naturellement, ce détail n'est pas nécessaire si +seulement un poids approximatif est impliqué. La forme tabulaire est la +meilleure pour les données numériques. Les unités doivent être notées. + +Lorsque des brevets sont impliquées, il peut être souhaitable +d'authentifier les pages des cahiers à intervalles réguliers. Le témoin +devrait être quelqu'un qui comprend le contenu mais qui n'est pas +impliqué dans la recherche. Un contenu ajouté ultérieurement à une page +devrait l'être dans une encre de couleur différente, et toutes les +modifications devraient être paraphées, authentifiées et datées si elles +sont susceptibles d'être importantes. Les entreprises industrielles font +ainsi généralement respecter leurs propres règles en matière de cahiers +de laboratoire. + +**Numéros d'identification**. Il est stupide de consacrer du temps et de +l'argent à des enregistrements de différents types \[…\] si ceux-ci sont +ensuite perdus ou mélangés. Tout enregistrements qui ne peut être inclut +directement dans le cahier de notes devraient porter une identification +complète indélébile. Un système simple qui a fait ses preuves consiste à +écrire à l'encre sur chaque enregistrement un symbole identifiant le +cahier, puis le numéro de page sur lequel les données auxiliaires sont +enregistrées. Si plus d'un enregistrement sont mentionnés sur une page +du cahier, des lettres ou des chiffres supplémentaires peuvent être +ajoutés. Ainsi, EBW II 85c identifie le troisième enregistrement discuté +à la page 85 du deuxième cahier EBW. C'est mieux qu'un numéro de série +qui ne dit pas, sans clé supplémentaire, où chercher la description le +concernant dans le cahier. Un bon système de classement est +indispensable pour tous les films, les photographies, les schémas, les +graphiques, les diagrammes de circuit, les dessins, les plans, etc. Il +est plus difficile de concevoir des méthodes de dépôt satisfaisantes +pour des matériaux très petits ou très grands. Les premiers sont +facilement perdus et les dernier très volumineux. \[…\] + +Il est important d'archiver les dessins et les plans à partir desquels +les appareils utilisés ont été construits, même si ces dessins sont +grossiers. Ils doivent être datés, paraphés et étiquetés ; en fait, tout +morceau de papier contenant une information utile devrait être marqué de +la sorte. Lorsqu'un équipement électronique ou autre est fabriqué, son +diagramme doit être soigneusement préparé et entièrement étiqueté avec +toutes les constantes. L'appareil doit porter un numéro de série qui +apparaît également sur ce diagramme. Lorsque des modifications sont +apportées, celles-ci doivent être indiquées sur le schéma et datées ou +un diagramme révisé et daté doit être préparé. L'ancien ne doit pas être +obscurci ou jeté, car il peut être nécessaire pour expliquer des données +antérieures, considérées ultérieurement comme étranges. \[…\] + +Le but de toute cette pratique de prise de notes est de préserver la +valeur \[le temps et les moyens humains et matériels investis dans la +recherche\]. Elle devrait être soigneusement conçus pour s'adapter aux +conditions de chaque laboratoire et devraient être adéquate mais pas +trop élaborés. **Si l'on exige trop de la nature humaine, le système ne +fonctionnera pas**. diff --git a/module1/ressources/Module1_1_MaterielSupplementaire_fr.org b/module1/ressources/Module1_1_MaterielSupplementaire_fr.org new file mode 100644 index 0000000..be3e291 --- /dev/null +++ b/module1/ressources/Module1_1_MaterielSupplementaire_fr.org @@ -0,0 +1,116 @@ +#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline +#+OPTIONS: author:t broken-links:nil c:nil creator:nil +#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t +#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t +#+OPTIONS: timestamp:t title:t toc:t todo:t |:t +#+TITLE: Ressources pour la séquence 1 du module 1 +#+DATE: <2019-02-21 jeu.> +#+AUTHOR: Christophe Pouzat +#+EMAIL: christophe.pouzat@parisdescartes.fr +#+LANGUAGE: fr +#+SELECT_TAGS: export +#+EXCLUDE_TAGS: noexport +#+CREATOR: Emacs 26.1 (Org mode 9.1.9) +#+STARTUP: indent + +* Notes et références sur la séquence 1 : « Nous utilisons tous des cahiers de notes » + +** Manuscrits annotés +En guise d'entrée dans l'univers des manuscrits annotés, je fais suivre une petite sélection de passages du premier chapitre de « LA PAGE. DE L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE » d'Anthony Grafton (Hazan, 2012) : + +#+BEGIN_EXAMPLE + Par le mouvement même de sa plume sur la page, il est clair que +Casaubon maîtrise tout ce qu'il lit. Constamment, il souligne des +mots et des expressions, il note en marge des mots clés et des résumés +montrant qu'il a lu attentivement, même quand, précise-t-il dans son +journal intime, il étudie en une journée quarante à cinquante pages +in-folio de grec émaillées de nombreuses abréviations. Les passages +plus importants donnent lieu en marge à des commentaires plus +longs. Sur les pages de titre, Casaubon porte très souvent — un peu +comme Montaigne — un jugement global sur la valeur de l'ouvrage. +Par ailleurs, il note ses réflexions dans des carnets, ou prend +des notes sur des textes qu'il ne peut pas acheter. Tels qu'ils sont +réunis dans sa bibliothèque, ses livres représentent une vie entière de +lecture que l'on peut reconstituer au fil des pages. +#+END_EXAMPLE + +Pages 32 et 33, à propos d'[[https://fr.wikipedia.org/wiki/Isaac_Casaubon][Isaac Casaubon]] (1559-1614). + +#+BEGIN_EXAMPLE + Pourtant, Harvey a laissé beaucoup plus que cela, et notamment +des traces des ses lectures sous forme de plus d'une centaine de livres +couverts d'annotations magnifiquement écrites de sa belle écriture +italique — en plus des cahiers dans lesquels il notait des extraits. +Manifestement, Harvey considérait la lecture comme sa profession, +et il en a fait aussi un art. Décennie après décennie, il couche ses +pensées sur l'histoire dans une édition in-folio de 1555 de l'Histoire +romaine de Tite-Live. Ses notes, en latin pour la plupart, parcourent +les marges, se répandent entre les chapitres et remplissent +des feuilles volantes, prenant un aspect particulièrement érudit et +assez rébarbatif. +#+END_EXAMPLE + +Pages 35 et 36, à propos de [[https://en.wikipedia.org/wiki/Gabriel_Harvey][Gabriel Harvey]] (1545-1630). + +#+BEGIN_EXAMPLE +... Mais dans l'exemplaire de travail qui subsiste du +texte, l'édition de base de 1549, il [Casaubon] introduit tant d'annotations +précises que les catalogueurs de la Bibliothèque bodléienne, qui n'étaient +pas rompus à la rhétorique, ont classé ce livre imprimé parmi les manuscrits. +#+END_EXAMPLE + +Page 40. + +** Armoires à notes de Placcius et Leibniz + J'ai trouvé cet exemple dans les travaux d'[[https://projects.iq.harvard.edu/ablair][Ann Blair]] comme « [[https://dash.harvard.edu/handle/1/4774908][The Rise of Note-Taking in Early Modern Europe]] » et son livre « [[https://yalebooks.yale.edu/book/9780300165395/too-much-know][TOO MUCH TO KNOW. Managing Scholarly Information before the Modern Age]] », publié chez /Yale University Press/ en 2011. +** La préface de « L'île des pingouins » d'Anatole France +Étant très loin de connaître Anatole France sur le bout des doigts, j'ai trouvé la référence citée dans le remarquable article de Keith Thomas publié par la /London Review of Books/, [[https://www.lrb.co.uk/v32/n11/keith-thomas/diary][le 10 juin 2010]]. Cet article (en anglais) décrit et discute le travail concret de prise de notes par un historien, il est de plus très bien écrit et plein d'anecdotes. +** Les livres de bord +Je remercie Joël Caselli de m'avoir aidé à interpréter le contenu du livre de bord d'Éric Tabarly. + +Le projet européen de reconstruction des climats des océans atlantique et indien (et non pacifique comme je le dis dans le cours !) : [[http://webs.ucm.es/info/cliwoc/][/Climatological Database for the World's Oceans 1750-1850/]] ; dispose d'un site internet très intéressant (mais en anglais). + +On trouvera des citations abondantes (et effrayantes) de livres de bord de navires négriers dans le livre de Marcus Rediker « À bord du négrier : Une histoire atlantique de la traite » (disponible en édition de poche). + + + + + +** Un absent : le cahier de laboratoire classique + +Je traduis ici la section 6.2 /Notebooks and Records/ du remarquable livre de E. Bright Wilson /An Introduction to Scientific Research/ réimprimé par Dover. + +Il est difficile de concevoir un cahier de laboratoire parfait et il est malheureusement rare d'en trouver un qui soit même à peu près satisfaisant ; la conservation d'une trace écrite du travail effectué est néanmoins une source majeure d'efficacité. Il y aura forcément des gens opposés à un ensemble de règles fixes, mais cela sera probablement plus rare pour le rituel de garder un cahier que sur d'autres sujets. Par conséquent, un ensemble de règles qui sont généralement considérées comme satisfaisantes, voire même essentielles, seront quelque peu dogmatiquement énoncées. + +De grandes découvertes ont été retardées en raison d'une négligente tenue des traces écrites. L'astronome Le Monnier est ainsi supposé avoir observé la planète Uranus à plusieurs reprises -- avant que son identification comme planète ait été annoncée par Herschel --, mais a décidé qu'elle était une étoile fixe. Cela s'explique probablement en partie par le fait qu'il a écrit ses mesures sur des morceaux de papier, y compris un sac en papier contenant à l'origine de la poudre pour cheveux ! + +Les cahiers de laboratoire doivent être solidement reliés, d'une taille approximative de 20 x 25 cm, avec des pages numérotées. Les feuilles séparées sont trop facilement perdues pour être satisfaisantes, d'autant plus qu'un cahier de laboratoire subit souvent un traitement un peu rude avec peut-être des projections occasionnelles d'acide [c'est un physico-chimiste qui écrit]. Le cas de mesures répétées constitue une exception où une ébauche spéciale imprimée est souvent utile si un bon système est établi pour collecter et relier les feuilles séparées. Les pages avec des lignes sont généralement utilisées, mais il s'agit d'une question de goût personnel, et certaines préfèrent des pages blanches ou à carreaux. Un tampon en caoutchouc peut être utilisé pour fournir des en-têtes pour les entrées les plus communes. + +Les données doivent être entrées directement dans le cahier au moment de l'observation. Il est intolérable d'utiliser sa mémoire ou des fragments de papier pour l'enregistrement primaire, du fait de l'inévitabilité des erreurs et des pertes. Il devrait donc y avoir une bonne place pour le cahier à coté du poste de travail, et l'expérimentateur ne devrait jamais être sans son cahier lorsqu'il est en action. + +Les données doivent être enregistrées à l'encre, de préférence une encre permanente, un buvard peut être pratique. Sinon, la trace écrite est trop éphémère. Les cahiers sont soumis à une utilisation intensive et les écritures au crayons se détériorent trop rapidement. Lorsque le cahier peut être utilisé comme preuve pour un brevet, l'usage de l'encre s'impose. + +Des graphiques approximatifs et qualitatifs peuvent être dessinés directement, mais les graphiques précis sont généralement préparés avec le papier graphique du type le plus approprié [pensez au papier millimétré]. Ils sont ensuite soigneusement collés dans le cahier, une page vierge étant découpée afin de compenser l'épaisseur ajoutée. + +Les cahiers doivent porter le nom de l'utilisateur et les dates couvertes. [...]. Les huit ou dix premières pages devraient être réservées pour une table des matières. Il s'agit de lignes ajoutées chronologiquement pour chaque série d'expériences similaires, ainsi que la référence de la page. La table des matières est extrêmement utile pour trouver des éléments plus tard et est très simple à suivre. Un index au dos du cahier est avantageux mais pas indispensable. + +Chaque élément devrait être datée et, si plusieurs personnes utilisent un cahier (généralement pas recommandé), paraphé. Le contenu ne devrait pas inscrit de façon trop dense sur les pages ; le papier est bon marché par rapport aux autres dépenses de recherche. + +La principale difficulté est de décider ce qu'il faut écrire dans le cahier. Évidemment, on entre les résultats numériques et les valeurs des variables indépendantes telles que la température, la composition ou la pression qui sont directement pertinentes. Il est également nécessaire d'avoir un système d'entrées ou de références afin que, plus tard, il soit possible de dire quel appareil a été utilisé et dans quelles circonstances. Une description assez complète de l'appareil devrait être conservée. Ensuite, lorsque des modifications sont apportées à l'appareil, elles doivent être décrites immédiatement dans le cahier. Il devrait également être possible de retracer la source des courbes d'étalonnage, des corrections, etc., qui étaient appropriées aux données d'un jour donné. Il est utile que les exigences relatives à l'écriture d'un article, d'une thèse ou d'un livre soient gardées à l'esprit. Une telle tâche, une fois effectuée, entraîne généralement la résolution solennelle de garder un cahier plus détaillé dans le futur. Essayer de comprendre le cahier de notes de quelqu'un d'autre constitue aussi un exercice hautement salutaire. Toutes les références aux appareils, aux lieux, aux horaires, aux livres, aux articles, aux graphiques et aux personnes devraient être suffisamment explicites pour être compréhensibles des années plus tard. *Il devrait être possible de prendre chaque article scientifique et de montrer exactement où chaque figure, description ou déclaration est justifiée par des observations originales dans le cahier de laboratoire, et exactement pourquoi les nombres final et original diffèrent, si tel est le cas*. + +Un énoncé du but de chaque expérience et un résumé des conclusions obtenues rendent le cahier beaucoup plus utile. +Les croquis, dessins et diagrammes sont essentiels. Comme tant d'observations sont visuelles, /il est important de noter ce qui est réellement vu, y compris des éléments qui ne sont pas entièrement compris lors de leur observation/. + +Les expériences mauvaises ou non prometteuses, même celles considérées comme des échecs, devraient être entièrement enregistrées. Elles représentent un effort qui ne doit pas être gaspillé, car souvent quelque chose peut être récupéré, même si ce n'est qu'une connaissance de ce qu'il ne faut pas faire. + +Les données doivent toujours être entrées dans leur forme la plus primaire, et non après un calcul ou une transformation. Si c'est le rapport de deux observations qui est intéressant, mais si les deux nombres sont effectivement observés, les deux nombres doivent être enregistrés. Si le poids précis d'un objet est important, les poids d'équilibrage individuels utilisés et leur identification devraient être inclus, c'est-à-dire le numéro de série de leur boîte. Dans le cas contraire, il devient impossible d'appliquer ultérieurement des corrections d'étalonnage ou de modifier les corrections si de nouvelles valeurs apparaissent. Naturellement, ce détail n'est pas nécessaire si seulement un poids approximatif est impliqué. La forme tabulaire est la meilleure pour les données numériques. Les unités doivent être notées. + +Lorsque des brevets sont impliquées, il peut être souhaitable d'authentifier les pages des cahiers à intervalles réguliers. Le témoin devrait être quelqu'un qui comprend le contenu mais qui n'est pas impliqué dans la recherche. Un contenu ajouté ultérieurement à une page devrait l'être dans une encre de couleur différente, et toutes les modifications devraient être paraphées, authentifiées et datées si elles sont susceptibles d'être importantes. Les entreprises industrielles font ainsi généralement respecter leurs propres règles en matière de cahiers de laboratoire. + +*Numéros d'identification*. Il est stupide de consacrer du temps et de l'argent à des enregistrements de différents types [...] si ceux-ci sont ensuite perdus ou mélangés. Tout enregistrements qui ne peut être inclut directement dans le cahier de notes devraient porter une identification complète indélébile. Un système simple qui a fait ses preuves consiste à écrire à l'encre sur chaque enregistrement un symbole identifiant le cahier, puis le numéro de page sur lequel les données auxiliaires sont enregistrées. Si plus d'un enregistrement sont mentionnés sur une page du cahier, des lettres ou des chiffres supplémentaires peuvent être ajoutés. Ainsi, EBW II 85c identifie le troisième enregistrement discuté à la page 85 du deuxième cahier EBW. C'est mieux qu'un numéro de série qui ne dit pas, sans clé supplémentaire, où chercher la description le concernant dans le cahier. +Un bon système de classement est indispensable pour tous les films, les photographies, les schémas, les graphiques, les diagrammes de circuit, les dessins, les plans, etc. Il est plus difficile de concevoir des méthodes de dépôt satisfaisantes pour des matériaux très petits ou très grands. Les premiers sont facilement perdus et les dernier très volumineux. [...] + +Il est important d'archiver les dessins et les plans à partir desquels les appareils utilisés ont été construits, même si ces dessins sont grossiers. Ils doivent être datés, paraphés et étiquetés ; en fait, tout morceau de papier contenant une information utile devrait être marqué de la sorte. Lorsqu'un équipement électronique ou autre est fabriqué, son diagramme doit être soigneusement préparé et entièrement étiqueté avec toutes les constantes. L'appareil doit porter un numéro de série qui apparaît également sur ce diagramme. Lorsque des modifications sont apportées, celles-ci doivent être indiquées sur le schéma et datées ou un diagramme révisé et daté doit être préparé. L'ancien ne doit pas être obscurci ou jeté, car il peut être nécessaire pour expliquer des données antérieures, considérées ultérieurement comme étranges. [...] + +Le but de toute cette pratique de prise de notes est de préserver la valeur [le temps et les moyens humains et matériels investis dans la recherche]. Elle devrait être soigneusement conçus pour s'adapter aux conditions de chaque laboratoire et devraient être adéquate mais pas trop élaborés. *Si l'on exige trop de la nature humaine, le système ne fonctionnera pas*. + diff --git a/module1/ressources/Module1_1_SupplementaryMaterial.md b/module1/ressources/Module1_1_SupplementaryMaterial.md new file mode 100644 index 0000000..c9aa06e --- /dev/null +++ b/module1/ressources/Module1_1_SupplementaryMaterial.md @@ -0,0 +1,358 @@ +--- +TITLE: We all use notebooks (Module 1 sequence 1) +AUTHOR: Christophe Pouzat +---\n +broken-links:nil c:nil creator:nil + +Introduction +============ + +This sequence discusses a much wider issue than *reproducible research* +(RR). Implementing RR requires thorough note-taking and note-taking +concerns everyone. The purpose of this sequence is therefore to remind +the reader / auditor that he/she already knows: **note-taking concerns +everyone**. Few examples are used to that end. + +Annotated manuscripts +===================== + +As an introduction to the world of annotated manuscripts, I quote now a +small selection of passages from the first chapter of *LA PAGE. DE +L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE* (THE PAGE. FROM ANTIQUITY TO THE +DIGITAL ERA) by Anthony Grafton (Hazan, 2012): + +``` example + By the very movement of his pen on the page, it is clear that +Casaubon masters everything he reads. He constantly underlines the importance of +words and expressions, he notes in the margin key words and summaries +showing that he has read carefully, even when, he states in his +diary that he studied in one day forty to fifty pages +in-folio of Greek with many abbreviations. The most important +passages give rise to longer comments in the margin. +On the title pages, Casaubon very often carries - a little +as Montaigne - a global judgment on the value of the work. +In addition, he notes his thoughts in notebooks, or takes +notes on texts he can't buy. As they are +gathered in his library, his books represent a whole life of +reading that can be reconstructed over the pages. +``` + +Pages 32 and 33, about [Isaac +Casaubon](https://en.wikipedia.org/wiki/Isaac_Casaubon) (1559-1614). + +``` example + Yet Harvey left much more than that, including +traces of his readings in the form of more than a hundred books +covered with wonderfully written annotations of his beautiful slanted +writing - in addition to the notebooks in which he wrote extracts. +Clearly, Harvey considered reading to be his profession, +and he made it an art too. Decade after decade, he lays down his +thoughts on history in an in-folio edition of 1555 of Livy's "History +of Rome". His notes, mostly in Latin, go through +the margins, spread between chapters and fill in +loose sheets, taking on a particularly erudite aspect and +quite daunting. +``` + +Pages 35 and 36, on [Gabriel +Harvey](https://en.wikipedia.org/wiki/Gabriel_Harvey) (1545-1630). + +``` example +... But in the remaining working copy of the +text, the basic edition of 1549, he [Casaubon] introduced so many annotations +that the cataloguers of the Bodleian Library, who were only +not familiar with rhetoric, have classified this printed book as a manuscript. +``` + +Page 40. + +Note cabinets from Placcius and Leibniz +======================================= + +I found this example in Ann Blair's work such as [The Rise of +Note-Taking in Early Modern +Europe](https://dash.harvard.edu/bitstream/handle/1/4774908/blair_notetaking.pdf?sequence=1) +and her book *TOO MUCH TO KNOW. Managing Scholarly Information before +the Modern Age*, published by Yale University Press in 2011. + +On the preface to *Penguin Island* +================================== + +The text can be found *legally* at several places, the [Project +Gutenberg](https://en.wikipedia.org/wiki/Project_Gutenberg) one is +missing the "Preface", so don't use it, go to one of the versions +available on [Internet +Archive](https://archive.org/search.php?query=title%3Apenguin%20island%20AND%20-contributor%3Agutenberg%20AND%20mediatype%3Atexts). +The importance of the preface in illustrated by the following two +quotations: + +> One word more if you want your book to be well received, lose no +> opportunity for exalting the virtues on which society is based — +> attachment to wealth, pious senti- ments, and especially resignation +> on the part of the poor, which latter is the very foundation of order. +> Proclaim, sir, that the origins of property — nobility and police — +> are treat- ed in your history with the respect which these +> institutions deserve. Make it known that you admit the supernatural +> when it presents itself. On these conditions you will succeed in good +> society. + +And more importantly for our present subject: + +> The idea occurred to me, in the month of June last year, to go and +> consult on the origins and progress of Penguin art, the lamented M. +> Fulgence Tapir, the learned author of the ‘Universal Annals of +> Painting, Sculpture and Architecture’ +> +> Having been shown into his study, I found seated before a roll-top +> desk, beneath a frightful mass of papers, an amaz- ingly short-sighted +> little man whose eyelids blinked behind his gold-mounted spectacles. +> +> To make up for the defect of his eyes his long and mobile nose, +> endowed with an exquisite sense of touch, explored the sensible world. +> By means of this organ Fulgence Tapir put himself in contact with art +> and beauty. It is observed that in France, as a general rule, musical +> critics are deaf and art critics are blind. This allows them the +> collectedness neces- sary for æsthetic ideas. Do you imagine that with +> eyes capable of perceiving the forms and colours with which mysterious +> nature envelops herself, Fulgence Tapir would have raised himself, on +> a mountain of printed and manuscript docu- ments, to the summit of +> doctrinal spiritualism, or that he would have conceived that mighty +> theory which makes the arts of all tunes and countries converge +> towards the Institute of France, their supreme end? +> +> The walls of the study, the floor, and even the ceiling were loaded +> with overflowing bundles, pasteboard boxes swollen beyond measure, +> boxes in which were compressed an in- numerable multitude of small +> cards covered with writing. I beheld in admiration minted with terror +> the cataracts of erudition that threatened to burst forth. +> +> ‘Master,’ said I in feeling tones, ‘I throw myself upon your kindness +> and your knowledge, both of which are inexhaustible. Would you consent +> to guide me in my arduous researches into the origins of Penguin art?’ +> +> ‘Sir,’ answered the Master, ‘I possess all art, you under- stand me, +> all art, on cards classed alphabetically and in order of subjects. I +> consider it my duty to place at your dis- posal all that relates to +> the Penguins. Get on that ladder and take out that box you see above. +> You will find in it every- thing you require.’ +> +> I tremblingly obeyed. But scarcely had I opened the fatal box than +> some blue cards escaped from it, and slipping through my fingers, +> began to rain down. Almost immediate- ly, acting in sympathy, the +> neighbouring boxes opened, and there flowed streams of pink, green, +> and white cards, and by degrees, from all the boxes, differently +> coloured cards were poured out murmuring like a waterfall on a +> mountain side in April. In a minute they covered the floor with a +> thick layer of paper. Issuing from their inexhaustible reservoirs with +> a roar that continually grew in force, each second in- creased the +> vehemence of their torrential fall. Swamped up to the knees in cards, +> Fulgence Tapir observed the cataclysm with attentive nose. He +> recognised its cause and grew pale with fright +> +> ‘What a mass of art !’ he exclaimed. +> +> I called to him and leaned forward to help him mount the ladder which +> bent under the shower. It was too late. Over- whelmed, desperate, +> pitiable, his velvet smoking-cap and his gold-mounted spectacles +> having fallen from him, he vainly opposed his short arms to the flood +> which had now mounted to his arm-pits. Suddenly a terrible spurt of +> cards arose and enveloped him in a gigantic whirlpool. During the +> space of a second I could see in the gulf the shining skull and little +> fat hands of the scholar, then it closed up and the deluge kept on +> pouring over what was silence and immobility. In dread lest I in my +> turn should be swallowed up ladder and all I maae my escape through +> the topmost pane of the window. + +The logbooks +============ + +I would like to thank Joël Caselli for helping me interpret the content +of Éric Tabarly's logbook. + +This example is only superficially anecdotal. Ten years ago, a European +project was aiming at estimating the Atlantic and Indian Oceans climates +during the 18th century using logbooks from ships of the West- and +East-India companies from the Kingdoms of Portugal, Spain, Holland, +Britain and France. See the [Climatological Database for the World's +Oceans 1750-1850](http://webs.ucm.es/info/cliwoc/). + +In the same vein, logbooks from slave ships give a lot of quantitative +information about the slave trade between Africa and the "New World" +(see Marcus Rediker frightening book *The Slave Ship: A Human History*, +2007). + +One missing: the classic laboratory notebook +============================================ + +I quote here Sec. 6.2 `Notebooks and Records` of the highly recommended +reading *An Introduction to Scientific Research* by E. Bright Wilson +(reprinted by Dover): + +> It is hard to conceive of a perfect laboratory notebook, and it is +> regrettably rare to find one that is even moderately satisfactory; yet +> the keeping of good records of work done is a major key to efficiency. +> There are bound to be dissenters to any set of fixed rules, but these +> will probably be rarer for the ritual of notebook keeping than +> elsewhere. Consequently, a set of rules which is generally regarded as +> satisfactory, or even as essential, will be somewhat dogmatically +> stated. +> +> Some great discoveries have been delayed because of careless record +> keeping. Thus it is related that the astronomer Le Monnier observed +> the planet Uranus on several occasions, before its identification as a +> planet had been announced by Herschel, but decided that it was a fixed +> star. This was probably due in part to the fact that he wrote his +> measurements on scraps of paper, including a paper bag originally +> containing hair powder! +> +> Laboratory notebooks should be permanently and strongly bound and of +> sufficient size, say roughly 8 by 10 inches, with numbered pages. +> Loose-leaf pages or separate sheets are too easily lost to be +> satisfactory, especially since a laboratory notebook gets rather rough +> handling, and perhaps an occasional dousing with acid. An exception is +> the case of routine, repeated measurements, where a printed or +> mimeographed special blank is often useful if a good system is +> established for collecting and binding the separate sheets. Ruled +> pages are generally used, but this is a matter of personal taste, and +> some prefer unruled or cross-sectional pages. A rubber stamp may be +> used to provide headings for routine entries. +> +> Data should be entered directly into the notebook at the time of +> observation. It is intolerable to use memory or scraps of paper for +> primary recording, because of the inevitability of error and loss. +> Therefore, there should be a good place for the notebook at the +> operating position, and the experimenter should never be without his +> book when in action. Data should be recorded in ink, preferably a +> permanent brand, and a blotter should be handy. Otherwise the record +> is too ephemeral. Notebooks get hard usage, and pencil smudges +> rapidly. When the notebook may be used as evidence in a patent case, +> ink is much preferred. +> +> Rough, qualitative graphs can be drawn in directly, but more careful +> ones are usually best prepared on graph paper of the most appropriate +> type These are then carefully pasted in the notebook, a blank page +> being cut out in order to compensate for the bulk of the one added. +> +> Notebooks should carry the name of the user and the dates covered. It +> is convenient in a research group to agree on a standard size, but +> then some sort of external identification is a great timesaver. The +> first eight or ten pages should be reserved for a table of contents. +> This consists of a line added chronologically for each series of +> similar experiments, together with the page reference. The table of +> contents is enormously helpful in finding items later and is very +> simple to keep up. An index in the back of the book is advantageous +> but not indispensable. +> +> Each entry should be dated and, if several individuals use one book +> (not generally recommended), initialed. The material should not be +> crowded on the pages; paper is cheap compared with other research +> expenses. The principal difficulty is in deciding what to put in. +> Obviously, one enters numerical results and those values of the +> independent variables such as temperature, composition, or pressure +> which are directly concerned. It is also necessary to have a system of +> entries or references so that years later it will be possible to tell +> what apparatus was used and under what circumstances. Somewhere there +> should be available a rather complete description of the apparatus. +> Then, when modifications are made, they should be described +> immediately in the notebook. It should also be possible to trace back +> the source of calibration curves, corrections, etc., which were +> appropriate to the data of a given day. It is helpful if the +> requirements for writing a paper, a thesis, or a book are kept in +> mind. Such a task, once carried out, usually leads to solemn resolves +> to keep a more careful notebook in the future. Also extremely salutary +> is the effect of trying to figure out something from another’s book. +> All references to apparatus, places, times, books, papers, graphs, and +> people should be sufficiently explicit to be understandable years +> later. It should be possible to take each scientific paper and show +> just where every figure, description, or statement in it is backed up +> by original observations in the laboratory notebook, and exactly why +> the final and original numbers differ, if they do. +> +> Some statement of the purpose of each experiment and a summary of the +> conclusions reached make the notebook vastly more useful. Sketches, +> drawings, and diagrams are essential. Since so much observation is +> visual, it is important to record what is actually seen, including +> things not fully understood at the time. Bad or unpromising +> experiments, even those deemed failures, should be fully recorded. +> They represent an investment of effort which should not be thrown +> away, because often something can be salvaged, even if it is only a +> knowledge of what not to do. Data should always be entered in their +> most primary form, not after recalculation or transformation. If it is +> a ratio of two observations which is of interest but it is the two +> numbers which are actually observed, the two numbers should be +> recorded. If the precise weight of an object is important, the +> individual balance weights used and their identification should be +> included, i.e., the serial number of the box. Otherwise it is not +> possible to apply calibration corrections later or to change the +> corrections if new values appear. Naturally, this detail is not +> necessary if only a rough weight is involved. A tabular form is best +> for numerical data. Units should be noted. +> +> Where patent questions are involved, it may be desirable to witness +> and even to notarize notebook pages at intervals. The witness should +> be someone who understands the material but is not a coinventor. +> Material added to a page at a later date should be in a +> different-colored ink, and any alterations should be initialed, +> witnessed, and dated if they are likely to be important. Industrial +> concerns usually enforce their own rules concerning patent matters. +> +> Identification Numbers. It is foolish to spend time and money making +> records of various kinds such as pen-and-ink recorder sheets, +> photographic records, or spectra if these are then lost or mixed up. +> Every such record should carry indelibly on it complete +> identification. A simple system of doing this which has worked well in +> practice is to write in ink on each record a symbol identifying the +> notebook and then the page number on which the auxiliary data are +> recorded. If more than one record occurs on a page, letters or further +> numerals can be added. Thus EBW II 85c would identify the third record +> discussed on page 85 of the second EBW notebook. This is better than a +> serial number, which doesn’t tell without extra keying where to look +> for the notebook entry. A good filing system is indispensable for all +> films, photographs, charts, graphs, circuit diagrams, drawings, +> blueprints, etc. It is hardest to devise satisfactory filing methods +> for either very small or very large material. The former are easily +> lost and the latter very bulky. Small envelopes are useful for tiny +> films and also protect them from scratching. +> +> It is thoroughly worth while to save drawings and blueprints from +> which apparatus has been built, however rough these may be. These +> should be dated, initialed, and labeled; in fact every piece of paper +> containing useful material should be so marked. When an electronic or +> other similar piece of equipment is built, a careful circuit diagram +> should be prepared, fully labeled with all constants. The apparatus +> should carry a serial number which also appears on the diagram. When +> changes are made, these should be indicated on the diagram and dated +> or a revised, dated diagram made. The old one should not be obscured +> or thrown away because it may be required to explain earlier data, +> later found to be peculiar. It is convenient to draw such diagrams on +> tracing paper with a good black pencil. Cheap ozalid or similarly +> processed copies can then be made. One should be kept in the +> laboratory, where it will usually prove indispensable for trouble +> shooting. Sooner or later, however, it will be used as scratch paper +> by someone with a brilliant idea to demonstrate; so the official copy +> and spares should be filed elsewhere. A great deal of time is +> unnecessarily wasted poking around the insides of an apparatus trying +> to find out where some wire goes. \[…\] Labeling. Related to the +> question of notebooks and records is that of labeling. Naturally +> bottles of chemicals must carry adequate labels, which should include +> not only the chemical name but also the source, or a notebook page +> reference if there has been any special treatment, or initials and +> date. One research worker departed from a certain laboratory to take +> another job and left a good deal of material behind. One bottle of +> clear liquid carried no label. Those assigned to clean up examined it, +> smelled it, finally concluded that it was water, and poured it down +> the drain. It was water, all right—heavy water at $30 an ounce. Some +> supervisors relentlessly throw out unlabeled bottles on sight. It only +> needs to be done once or twice. Labels are also essential on all kinds +> of specimens, pieces of apparatus, gadgets, etc. Controls on apparatus +> should be labeled and the apparatus itself numbered. Every laboratory +> has orphaned pieces of equipment, often electronic, of which no one +> knows the nature and purpose. The notebook page system is good here, +> provided the old notebooks can be found. Labels should be attached so +> that they will stay. Metal tags can be riveted on. Paper labels should +> be covered with some sort of varnish. +> +> The whole purpose of all these recording systems is to preserve +> values. They should be carefully thought out to fit the conditions of +> each laboratory and should be adequate but not overelaborate. If too +> much is demanded of human nature, the system will break down. diff --git a/module1/ressources/Module1_1_SupplementaryMaterial.org b/module1/ressources/Module1_1_SupplementaryMaterial.org new file mode 100644 index 0000000..1732bc9 --- /dev/null +++ b/module1/ressources/Module1_1_SupplementaryMaterial.org @@ -0,0 +1,273 @@ +#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline +#+OPTIONS: author:t broken-links:nil c:nil creator:nil +#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t +#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t +#+OPTIONS: timestamp:t title:t toc:t todo:t |:t +#+TITLE: We all use notebooks (Module 1 sequence 1) +#+DATE: <2019-03-21 jeu.> +#+AUTHOR: Christophe Pouzat +#+EMAIL: christophe.pouzat@parisdescartes.fr +#+LANGUAGE: en +#+SELECT_TAGS: export +#+EXCLUDE_TAGS: noexport +#+CREATOR: Emacs 26.1 (Org mode 9.1.9) + +* Introduction + +This sequence discusses a much wider issue than /reproducible research/ (RR). Implementing RR requires thorough note-taking and note-taking concerns everyone. The purpose of this sequence is therefore to remind the reader / auditor that he/she already knows: *note-taking concerns everyone*. Few examples are used to that end. + +* Annotated manuscripts +As an introduction to the world of annotated manuscripts, I quote now a small selection of passages from the first chapter of /LA PAGE. DE L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE/ (THE PAGE. FROM ANTIQUITY TO THE DIGITAL ERA) by Anthony Grafton (Hazan, 2012): + +#+BEGIN_EXAMPLE + By the very movement of his pen on the page, it is clear that +Casaubon masters everything he reads. He constantly underlines the importance of +words and expressions, he notes in the margin key words and summaries +showing that he has read carefully, even when, he states in his +diary that he studied in one day forty to fifty pages +in-folio of Greek with many abbreviations. The most important +passages give rise to longer comments in the margin. +On the title pages, Casaubon very often carries - a little +as Montaigne - a global judgment on the value of the work. +In addition, he notes his thoughts in notebooks, or takes +notes on texts he can't buy. As they are +gathered in his library, his books represent a whole life of +reading that can be reconstructed over the pages. +#+END_EXAMPLE + +Pages 32 and 33, about [[https://en.wikipedia.org/wiki/Isaac_Casaubon][Isaac Casaubon]] (1559-1614). + +#+BEGIN_EXAMPLE + Yet Harvey left much more than that, including +traces of his readings in the form of more than a hundred books +covered with wonderfully written annotations of his beautiful slanted +writing - in addition to the notebooks in which he wrote extracts. +Clearly, Harvey considered reading to be his profession, +and he made it an art too. Decade after decade, he lays down his +thoughts on history in an in-folio edition of 1555 of Livy's "History +of Rome". His notes, mostly in Latin, go through +the margins, spread between chapters and fill in +loose sheets, taking on a particularly erudite aspect and +quite daunting. +#+END_EXAMPLE + +Pages 35 and 36, on [[https://en.wikipedia.org/wiki/Gabriel_Harvey][Gabriel Harvey]] (1545-1630). + +#+BEGIN_EXAMPLE +... But in the remaining working copy of the +text, the basic edition of 1549, he [Casaubon] introduced so many annotations +that the cataloguers of the Bodleian Library, who were only +not familiar with rhetoric, have classified this printed book as a manuscript. +#+END_EXAMPLE + +Page 40. + +* Note cabinets from Placcius and Leibniz + +I found this example in Ann Blair's work such as [[https://dash.harvard.edu/bitstream/handle/1/4774908/blair_notetaking.pdf?sequence=1][The Rise of Note-Taking in Early Modern Europe]] and her book /TOO MUCH TO KNOW. Managing Scholarly Information before the Modern Age/, published by Yale University Press in 2011. + +* On the preface to /Penguin Island/ + +The text can be found /legally/ at several places, the [[https://en.wikipedia.org/wiki/Project_Gutenberg][Project Gutenberg]] one is missing the "Preface", so don't use it, go to one of the versions available on [[https://archive.org/search.php?query=title%3Apenguin%20island%20AND%20-contributor%3Agutenberg%20AND%20mediatype%3Atexts][Internet Archive]]. The importance of the preface in illustrated by the following two quotations: + +#+BEGIN_QUOTE +One word more if you want your book to be well +received, lose no opportunity for exalting the virtues on +which society is based — attachment to wealth, pious senti- +ments, and especially resignation on the part of the poor, +which latter is the very foundation of order. Proclaim, sir, +that the origins of property — nobility and police — are treat- +ed in your history with the respect which these institutions +deserve. Make it known that you admit the supernatural +when it presents itself. On these conditions you will succeed +in good society. +#+END_QUOTE + +And more importantly for our present subject: + +#+BEGIN_QUOTE +The idea occurred to me, in the month of June last year, to +go and consult on the origins and progress of Penguin art, +the lamented M. Fulgence Tapir, the learned author of the +‘Universal Annals of Painting, Sculpture and Architecture’ + +Having been shown into his study, I found seated before a +roll-top desk, beneath a frightful mass of papers, an amaz- +ingly short-sighted little man whose eyelids blinked behind +his gold-mounted spectacles. + +To make up for the defect of his eyes his long and mobile +nose, endowed with an exquisite sense of touch, explored the +sensible world. By means of this organ Fulgence Tapir put +himself in contact with art and beauty. It is observed that in +France, as a general rule, musical critics are deaf and art +critics are blind. This allows them the collectedness neces- +sary for æsthetic ideas. Do you imagine that with eyes capable +of perceiving the forms and colours with which mysterious +nature envelops herself, Fulgence Tapir would have raised +himself, on a mountain of printed and manuscript docu- +ments, to the summit of doctrinal spiritualism, or that he +would have conceived that mighty theory which makes the +arts of all tunes and countries converge towards the Institute +of France, their supreme end? + +The walls of the study, the floor, and even the ceiling were +loaded with overflowing bundles, pasteboard boxes swollen +beyond measure, boxes in which were compressed an in- +numerable multitude of small cards covered with writing. I +beheld in admiration minted with terror the cataracts of +erudition that threatened to burst forth. + +‘Master,’ said I in feeling tones, ‘I throw myself upon +your kindness and your knowledge, both of which are +inexhaustible. Would you consent to guide me in my +arduous researches into the origins of Penguin art?’ + +‘Sir,’ answered the Master, ‘I possess all art, you under- +stand me, all art, on cards classed alphabetically and in +order of subjects. I consider it my duty to place at your dis- +posal all that relates to the Penguins. Get on that ladder and +take out that box you see above. You will find in it every- +thing you require.’ + +I tremblingly obeyed. But scarcely had I opened the fatal +box than some blue cards escaped from it, and slipping +through my fingers, began to rain down. Almost immediate- +ly, acting in sympathy, the neighbouring boxes opened, and +there flowed streams of pink, green, and white cards, and by +degrees, from all the boxes, differently coloured cards were +poured out murmuring like a waterfall on a mountain side +in April. In a minute they covered the floor with a thick +layer of paper. Issuing from their inexhaustible reservoirs +with a roar that continually grew in force, each second in- +creased the vehemence of their torrential fall. Swamped up +to the knees in cards, Fulgence Tapir observed the cataclysm +with attentive nose. He recognised its cause and grew pale +with fright + +‘What a mass of art !’ he exclaimed. + +I called to him and leaned forward to help him mount the +ladder which bent under the shower. It was too late. Over- +whelmed, desperate, pitiable, his velvet smoking-cap and his +gold-mounted spectacles having fallen from him, he vainly +opposed his short arms to the flood which had now mounted +to his arm-pits. Suddenly a terrible spurt of cards arose and +enveloped him in a gigantic whirlpool. During the space of a +second I could see in the gulf the shining skull and little fat +hands of the scholar, then it closed up and the deluge kept +on pouring over what was silence and immobility. In dread +lest I in my turn should be swallowed up ladder and all I +maae my escape through the topmost pane of the window. +#+END_QUOTE + +* The logbooks + +I would like to thank Joël Caselli for helping me interpret the content of Éric Tabarly's logbook. + +This example is only superficially anecdotal. Ten years ago, a European project was aiming at estimating the Atlantic and Indian Oceans climates during the 18th century using logbooks from ships of the West- and East-India companies from the Kingdoms of Portugal, Spain, Holland, Britain and France. See the [[http://webs.ucm.es/info/cliwoc/][Climatological Database for the World's Oceans 1750-1850]]. + +In the same vein, logbooks from slave ships give a lot of quantitative information about the slave trade between Africa and the "New World" (see Marcus Rediker frightening book /The Slave Ship: A Human History/, 2007). + +* One missing: the classic laboratory notebook + +I quote here Sec. 6.2 =Notebooks and Records= of the highly recommended reading /An Introduction to Scientific Research/ by E. Bright Wilson (reprinted by Dover): + +#+BEGIN_QUOTE +It is hard to conceive of a perfect laboratory notebook, and it is regrettably rare to find one that is even moderately +satisfactory; yet the keeping of good records of work done is a major key to efficiency. There are bound to be dissenters +to any set of fixed rules, but these will probably be rarer for the ritual of notebook keeping than elsewhere. Consequently, +a set of rules which is generally regarded as satisfactory, or even as essential, will be somewhat dogmatically stated. + +Some great discoveries have been delayed because of careless record keeping. Thus it is related that the astronomer Le Monnier +observed the planet Uranus on several occasions, before its identification as a planet had been announced by Herschel, but +decided that it was a fixed star. This was probably due in part to the fact that he wrote his measurements on scraps of paper, +including a paper bag originally containing hair powder! + +Laboratory notebooks should be permanently and strongly bound and of sufficient size, say roughly 8 by 10 inches, with numbered +pages. Loose-leaf pages or separate sheets are too easily lost to be satisfactory, especially since a laboratory notebook gets +rather rough handling, and perhaps an occasional dousing with acid. An exception is the case of routine, repeated measurements, +where a printed or mimeographed special blank is often useful if a good system is established for collecting and binding the +separate sheets. Ruled pages are generally used, but this is a matter of personal taste, and some prefer unruled or cross-sectional +pages. A rubber stamp may be used to provide headings for routine entries. + +Data should be entered directly into the notebook at the time of observation. It is intolerable to use memory or scraps of paper +for primary recording, because of the inevitability of error and loss. Therefore, there should be a good place for the notebook +at the operating position, and the experimenter should never be without his book when in action. +Data should be recorded in ink, preferably a permanent brand, and a blotter should be handy. Otherwise the record is too ephemeral. +Notebooks get hard usage, and pencil smudges rapidly. When the notebook may be used as evidence in a patent case, ink is much +preferred. + +Rough, qualitative graphs can be drawn in directly, but more careful ones are usually best prepared on graph paper of the most +appropriate type These are then carefully pasted in the notebook, a blank page being cut out in order to compensate for the bulk of +the one added. + +Notebooks should carry the name of the user and the dates covered. It is convenient in a research group to agree on a standard size, +but then some sort of external identification is a great timesaver. The first eight or ten pages should be reserved for a table of +contents. This consists of a line added chronologically for each series of similar experiments, together with the page reference. +The table of contents is enormously helpful in finding items later and is very simple to keep up. An index in the back of the book +is advantageous but not indispensable. + +Each entry should be dated and, if several individuals use one book (not generally recommended), initialed. The material should not +be crowded on the pages; paper is cheap compared with other research expenses. The principal difficulty is in deciding what to put in. +Obviously, one enters numerical results and those values of the independent variables such as temperature, composition, or pressure +which are directly concerned. It is also necessary to have a system of entries or references so that years later it will be possible to +tell what apparatus was used and under what circumstances. Somewhere there should be available a rather complete description of the +apparatus. Then, when modifications are made, they should be described immediately in the notebook. It should also be possible to trace +back the source of calibration curves, corrections, etc., which were appropriate to the data of a given day. It is helpful if the +requirements for writing a paper, a thesis, or a book are kept in mind. Such a task, once carried out, usually leads to solemn resolves +to keep a more careful notebook in the future. Also extremely salutary is the effect of trying to figure out something from another’s +book. All references to apparatus, places, times, books, papers, graphs, and people should be sufficiently explicit to be understandable +years later. It should be possible to take each scientific paper and show just where every figure, description, or statement in it is +backed up by original observations in the laboratory notebook, and exactly why the final and original numbers differ, if they do. + +Some statement of the purpose of each experiment and a summary of the conclusions reached make the notebook vastly more useful. +Sketches, drawings, and diagrams are essential. Since so much observation is visual, it is important to record what is actually seen, +including things not fully understood at the time. Bad or unpromising experiments, even those deemed failures, should be fully recorded. +They represent an investment of effort which should not be thrown away, because often something can be salvaged, even if it is only a +knowledge of what not to do. Data should always be entered in their most primary form, not after recalculation or transformation. If it +is a ratio of two observations which is of interest but it is the two numbers which are actually observed, the two numbers should be +recorded. If the precise weight of an object is important, the individual balance weights used and their identification should be +included, i.e., the serial number of the box. Otherwise it is not possible to apply calibration corrections later or to change the +corrections if new values appear. Naturally, this detail is not necessary if only a rough weight is involved. A tabular form is best for +numerical data. Units should be noted. + +Where patent questions are involved, it may be desirable to witness and even to notarize notebook pages at intervals. The witness should +be someone who understands the material but is not a coinventor. Material added to a page at a later date should be in a different-colored +ink, and any alterations should be initialed, witnessed, and dated if they are likely to be important. Industrial concerns usually enforce +their own rules concerning patent matters. + +Identification Numbers. It is foolish to spend time and money making records of various kinds such as pen-and-ink recorder sheets, +photographic records, or spectra if these are then lost or mixed up. Every such record should carry indelibly on it complete identification. +A simple system of doing this which has worked well in practice is to write in ink on each record a symbol identifying the notebook and then +the page number on which the auxiliary data are recorded. If more than one record occurs on a page, letters or further numerals can be added. +Thus EBW II 85c would identify the third record discussed on page 85 of the second EBW notebook. This is better than a serial number, which +doesn’t tell without extra keying where to look for the notebook entry. +A good filing system is indispensable for all films, photographs, charts, graphs, circuit diagrams, drawings, blueprints, etc. It is hardest +to devise satisfactory filing methods for either very small or very large material. The former are easily lost and the latter very bulky. +Small envelopes are useful for tiny films and also protect them from scratching. + +It is thoroughly worth while to save drawings and blueprints from which apparatus has been built, however rough these may be. These should be +dated, initialed, and labeled; in fact every piece of paper containing useful material should be so marked. When an electronic or other +similar piece of equipment is built, a careful circuit diagram should be prepared, fully labeled with all constants. The apparatus should +carry a serial number which also appears on the diagram. When changes are made, these should be indicated on the diagram and dated or a revised, +dated diagram made. The old one should not be obscured or thrown away because it may be required to explain earlier data, later found to be +peculiar. It is convenient to draw such diagrams on tracing paper with a good black pencil. Cheap ozalid or similarly processed copies can then +be made. One should be kept in the laboratory, where it will usually prove indispensable for trouble shooting. Sooner or later, however, it will +be used as scratch paper by someone with a brilliant idea to demonstrate; so the official copy and spares should be filed elsewhere. A great deal +of time is unnecessarily wasted poking around the insides of an apparatus trying to find out where some wire goes. +[...] +Labeling. Related to the question of notebooks and records is that of labeling. Naturally bottles of chemicals must carry adequate labels, which +should include not only the chemical name but also the source, or a notebook page reference if there has been any special treatment, or initials +and date. One research worker departed from a certain laboratory to take another job and left a good deal of material behind. One bottle of clear +liquid carried no label. Those assigned to clean up examined it, smelled it, finally concluded that it was water, and poured it down the drain. +It was water, all right—heavy water at $30 an ounce. Some supervisors relentlessly throw out unlabeled bottles on sight. It only needs to be done +once or twice. Labels are also essential on all kinds of specimens, pieces of apparatus, gadgets, etc. Controls on apparatus should be labeled and +the apparatus itself numbered. Every laboratory has orphaned pieces of equipment, often electronic, of which no one knows the nature and purpose. +The notebook page system is good here, provided the old notebooks can be found. Labels should be attached so that they will stay. Metal tags can +be riveted on. Paper labels should be covered with some sort of varnish. + +The whole purpose of all these recording systems is to preserve values. They should be carefully thought out to fit the conditions of each +laboratory and should be adequate but not overelaborate. If too much is demanded of human nature, the system will break down. +#+END_QUOTE + diff --git a/module1/ressources/Module1_2_MaterielSupplementaire_fr.md b/module1/ressources/Module1_2_MaterielSupplementaire_fr.md new file mode 100644 index 0000000..5e9a914 --- /dev/null +++ b/module1/ressources/Module1_2_MaterielSupplementaire_fr.md @@ -0,0 +1,171 @@ +--- +TITLE: Ressources pour la séquence 2 du module 1 +AUTHOR: Christophe Pouzat +---\n +broken-links:nil c:nil creator:nil + +Notes et références sur la séquence 2 : « Un aperçu historique de la prise de notes » +===================================================================================== + +Références générales +-------------------- + +En plus des deux livres déjà cités (en séquence 1) : + +- « LA PAGE. DE L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE » d'Anthony Grafton + (Hazan, 2012) ; +- « [TOO MUCH TO KNOW. Managing Scholarly Information before the + Modern + Age](https://yalebooks.yale.edu/book/9780300165395/too-much-know) », + d'Ann Blair publié chez *Yale University Press* en 2011 ; + +j'ai utilisé : + +- « L'histoire du livre » de Frédéric Barbier ; +- le remarquable site de Jacques Poitou, [langages écritures + typographies](http://j.poitou.free.fr/pro/index.html) ; +- le site [l'aventure des écritures](http://classes.bnf.fr/ecritures/) + de la BNF ; +- le catalogue de l'exposition de la BNF « Tous les savoirs du monde : + Encyclopédies et bibliothèques de Sumer au XXIème siècle » ; +- « [Du papyrus à + l'hypertexte](http://litmedmod.ca/sites/default/files/pdf/vandendorpe-papyrusenligne_lr.pdf) » + de Christian Vandendorpe (La Découverte, 1999). + +Sur les tablettes de cires +-------------------------- + +Voir le site de Jacques Poitou (d'où les illustrations sont empruntées) +et le livre de Frédéric Barbier, « L'histoire du livre ». + +Sur le passage du rouleau (*volumen*) au codex +---------------------------------------------- + +Voir le livre de Frédéric Barbier, celui d'Anthony Grafton. + +Le *volumen* est un livre à base de feuilles de papyrus collées les unes +aux autres et qui s'enroule sur lui-même. Il a été créé en Égypte vers +3000 av. J.-C. Le texte est rédigé en colonnes parallèles assez +étroites. C'est le support du texte par excellence durant les trente +siècles précédant notre ère, d'abord en Égypte, puis dans tout le monde +méditerranéen. + +Comme l'explique Frédéric Barbier : « La forme du *volumen* impose une +pratique de lecture complexe : il faut dérouler (*explicare*) et +enrouler en même temps, ce qui interdit par exemple, de travailler +simultanément sur plusieurs rouleaux (un texte et son commentaire) ou de +prendre des notes, impose une lecture suivie et empêche la simple +consultation. » + +Le *volumen* n'est clairement pas adapté à une lecture « nomade » ; +imagine-t-on Ulysse partant pour son Odyssée avec les 24 *volumen* de +l'Iliade ? + +Le *volumen* est à l'origine du terme « volume » dans un « livre en +plusieurs volumes » comme dans la désignation du concept géométrique. + +Le passage au codex repose sur deux innovations : + +- la collection des tablettes de cires en « groupes reliés » ; +- la généralisation du parchemin (peau, généralement, de mouton + spécialement préparée) au détriment du papyrus. Cette généralisation + résulte une lutte pour l'hégémonie culturelle entre deux descendants + de généraux d'Alexandre le Grand, en effet d'après Pline l'ancien : + [Ptolémé + Épiphane](https://fr.wikipedia.org/wiki/Ptol%C3%A9m%C3%A9e_V) + d'Alexandrie cherchait à empêcher [Eumène + II](https://fr.wikipedia.org/wiki/Eum%C3%A8ne_II) d'établir une + bibliothèque à Pergame (au 2e siècle avant J.-C.) et avait interdit + l'exportation du papyrus (produit exclusivement en Égypte), ce qui + incita Eumène à chercher un substitut qui devint le parchemin. + +Le remplacement du rouleau par le codex aura des conséquences majeures +sur l'organisation du livre ainsi que sur la façon de lire et il +permettra le développement ultérieur de l'imprimerie. + +La principale révolution introduite par le codex est la notion de page. +Grâce à elle, le lecteur peut accéder de manière directe à un chapitre +ou à un passage du texte, alors que le rouleau impose une lecture +continue. **Les mots ne sont de plus pas séparés par des espaces**. +Comme l'écrit Collette Sirat : « Il faudra vingt siècles pour qu’on se +rende compte que l’importance primordiale du codex pour notre +civilisation a été de permettre la lecture sélective et non pas +continue, contribuant ainsi à l’élaboration de structures mentales où le +texte est dissocié de la parole et de son rythme. » + +Au fil des siècles, le codex — qu'on désigne le plus souvent comme un +manuscrit — va évoluer et se donner peu à peu les attributs du livre +moderne : séparation entre les mots (VIIe siècle), début de ponctuation +(VIIIe siècle), table des matières, titre courant, marque de paragraphe +(XIe siècle), pagination, index (XIIIe siècle), etc. + +Un point intéressant : le contenu de la Thora est « fixé » avant +l'apparition du codex et, aujourd'hui encore, la Thora est écrite sur +des *volumen* (dans les synagogues au moins). La religion chrétienne se +développe en même temps que le codex, adopte ce support et le répand ; +elle ne donnera jamais au *volumen* un statut « supérieur », pas plus +que ne le fera la religion musulmane. + +Sur Eusèbe de Césarée +--------------------- + +Pour en savoir plus sur [Eusèbe de +Césarée](https://fr.wikipedia.org/wiki/Eus%C3%A8be_de_C%C3%A9sar%C3%A9e), +consultez le passionnant deuxième chapitre du livre d'Anthony Grafton. + +Parallèle chinois +----------------- + +Comme je le dis, mon inculture fait que je ne rends pas justice aux +contributions chinoises, musulmanes, précolombienne, etc. J'essaierai de +combler cette énorme lacune pour les seconde version du CLOM… + +Ce que je dis sur le passage du volumen au codex accompagné d'un +développement des « outils de navigation » (index, table des matières, +etc) en Chine lors du développement de leishus vient du bouquin d'Ann +Blair (p. 31) qui cite un article de Susan Cherniack, « Book Culture and +Textual Transmission in Sung China », *Harvard Journal of Asiatic +Studies* Vol. 54, No. 1 (Jun., 1994), pp. 5-125. + +Retour sur l'armoire à notes +---------------------------- + +Nous revenons sur le « bout de papier » ou la fiche comme support de +note. L'inconvénient est que le bout de papier ou la fiche se perdent +facilement et ne servent à rien s'ils ne sont pas **classés** en plus +d'être rangés. Problème résolu par l'armoire de Placcius. D'une certaine +façon, sa conception fait qu'on accède à son contenu par l'index. + +L'avantage est que les notes peuvent être réorganisées si elles +contiennent des information sur plusieurs sujets. Elle peuvent aussi +être directement collées dans un livre lors de la composition d'un +florilège ou d'un ouvrage de synthèse. + +Ce dernier procédé était très couramment employé par les humanistes et +les érudit de la renaissance et du début de la période moderne. [Conrad +Gessner](https://fr.wikipedia.org/wiki/Conrad_Gessner) (1516-1565) était +un champion de cette technique ; il obtenait même parfois ses fiches en +découpant les pages des livres. Encore une fois, ne faites pas cela avec +les livres de bibliothèques ! + +L'index et John Locke +--------------------- + +Sur l'origine de l'index, on pourra lire l'article de Jean Berger : +[Indexation, Memoire, pouvoir et representations au seuil du XIIe +siecle : La redecouverte des feuillets de tables du Liber De Honoribus, +premier cartulaire de la collegiale Saint-Julien de +Brioude](https://www.theindexer.org/files/25-2-berger.pdf), *The +Indexer*. + +La méthode de John Lock est expliquée dans l'article *Indexing +commonplace books: John Locke’s method* d'Alan Walker, [The +Indexer](https://www.theindexer.org/issues/query.php?vol=22&iss=3), vol. +22, p. 114-118, 2001. + +Sur [John Locke](https://fr.wikipedia.org/wiki/John_Locke) (1632-1704) +« papa du libéralisme » et actionnaire de la *Royal African Company* +principale compagnie négrière britannique, voir l'article +[Wikipedia](https://en.wikipedia.org/wiki/John_Locke#Constitution_of_Carolina) +(en anglais) et le livre « Contre-histoire du libéralisme » de Domenico +Losurdo (La Découverte / Poche, 2014, p. 34-36). diff --git a/module1/ressources/Module1_2_MaterielSupplementaire_fr.org b/module1/ressources/Module1_2_MaterielSupplementaire_fr.org new file mode 100644 index 0000000..35eeedb --- /dev/null +++ b/module1/ressources/Module1_2_MaterielSupplementaire_fr.org @@ -0,0 +1,73 @@ +#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline +#+OPTIONS: author:t broken-links:nil c:nil creator:nil +#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t +#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t +#+OPTIONS: timestamp:t title:t toc:t todo:t |:t +#+TITLE: Ressources pour la séquence 2 du module 1 +#+DATE: <2019-02-21 jeu.> +#+AUTHOR: Christophe Pouzat +#+EMAIL: christophe.pouzat@parisdescartes.fr +#+LANGUAGE: fr +#+SELECT_TAGS: export +#+EXCLUDE_TAGS: noexport +#+CREATOR: Emacs 26.1 (Org mode 9.1.9) +#+STARTUP: indent + +* Notes et références sur la séquence 2 : « Un aperçu historique de la prise de notes » +** Références générales +En plus des deux livres déjà cités (en séquence 1) : +- « LA PAGE. DE L'ANTIQUITÉ À L'ÈRE DU NUMÉRIQUE » d'Anthony Grafton (Hazan, 2012) ; +- « [[https://yalebooks.yale.edu/book/9780300165395/too-much-know][TOO MUCH TO KNOW. Managing Scholarly Information before the Modern Age]] », d'Ann Blair publié chez /Yale University Press/ en 2011 ; +j'ai utilisé : +- « L'histoire du livre » de Frédéric Barbier ; +- le remarquable site de Jacques Poitou, [[http://j.poitou.free.fr/pro/index.html][langages écritures typographies]] ; +- le site [[http://classes.bnf.fr/ecritures/][l'aventure des écritures]] de la BNF ; +- le catalogue de l'exposition de la BNF « Tous les savoirs du monde : Encyclopédies et bibliothèques de Sumer au XXIème siècle » ; +- « [[http://litmedmod.ca/sites/default/files/pdf/vandendorpe-papyrusenligne_lr.pdf][Du papyrus à l'hypertexte]] » de Christian Vandendorpe (La Découverte, 1999). + + +** Sur les tablettes de cires +Voir le site de Jacques Poitou (d'où les illustrations sont empruntées) et le livre de Frédéric Barbier, « L'histoire du livre ». +** Sur le passage du rouleau (/volumen/) au codex +Voir le livre de Frédéric Barbier, celui d'Anthony Grafton. + +Le /volumen/ est un livre à base de feuilles de papyrus collées les unes aux autres et qui s'enroule sur lui-même. Il a été créé en Égypte vers 3000 av. J.-C. Le texte est rédigé en colonnes parallèles assez étroites. C'est le support du texte par excellence durant les trente siècles précédant notre ère, d'abord en Égypte, puis dans tout le monde méditerranéen. + +Comme l'explique Frédéric Barbier : « La forme du /volumen/ impose une pratique de lecture complexe : il faut dérouler (/explicare/) et enrouler en même temps, ce qui interdit par exemple, de travailler simultanément sur plusieurs rouleaux (un texte et son commentaire) ou de prendre des notes, impose une lecture suivie et empêche la simple consultation. » + +Le /volumen/ n'est clairement pas adapté à une lecture « nomade » ; imagine-t-on Ulysse partant pour son Odyssée avec les 24 /volumen/ de l'Iliade ? + +Le /volumen/ est à l'origine du terme « volume » dans un « livre en plusieurs volumes » comme dans la désignation du concept géométrique. + +Le passage au codex repose sur deux innovations : +- la collection des tablettes de cires en « groupes reliés » ; +- la généralisation du parchemin (peau, généralement, de mouton spécialement préparée) au détriment du papyrus. Cette généralisation résulte une lutte pour l'hégémonie culturelle entre deux descendants de généraux d'Alexandre le Grand, en effet d'après Pline l'ancien : [[https://fr.wikipedia.org/wiki/Ptol%C3%A9m%C3%A9e_V][Ptolémé Épiphane]] d'Alexandrie cherchait à empêcher [[https://fr.wikipedia.org/wiki/Eum%C3%A8ne_II][Eumène II]] d'établir une bibliothèque à Pergame (au 2e siècle avant J.-C.) et avait interdit l'exportation du papyrus (produit exclusivement en Égypte), ce qui incita Eumène à chercher un substitut qui devint le parchemin. + +Le remplacement du rouleau par le codex aura des conséquences majeures sur l'organisation du livre ainsi que sur la façon de lire et il permettra le développement ultérieur de l'imprimerie. + +La principale révolution introduite par le codex est la notion de page. Grâce à elle, le lecteur peut accéder de manière directe à un chapitre ou à un passage du texte, alors que le rouleau impose une lecture continue. *Les mots ne sont de plus pas séparés par des espaces*. Comme l'écrit Collette Sirat : « Il faudra vingt siècles pour qu’on se rende compte que l’importance primordiale du codex pour notre civilisation a été de permettre la lecture sélective et non pas continue, contribuant ainsi à l’élaboration de structures mentales où le texte est dissocié de la parole et de son rythme. » + +Au fil des siècles, le codex — qu'on désigne le plus souvent comme un manuscrit — va évoluer et se donner peu à peu les attributs du livre moderne : séparation entre les mots (VIIe siècle), début de ponctuation (VIIIe siècle), table des matières, titre courant, marque de paragraphe (XIe siècle), pagination, index (XIIIe siècle), etc. + +Un point intéressant : le contenu de la Thora est « fixé » avant l'apparition du codex et, aujourd'hui encore, la Thora est écrite sur des /volumen/ (dans les synagogues au moins). La religion chrétienne se développe en même temps que le codex, adopte ce support et le répand ; elle ne donnera jamais au /volumen/ un statut « supérieur », pas plus que ne le fera la religion musulmane. + +** Sur Eusèbe de Césarée +Pour en savoir plus sur [[https://fr.wikipedia.org/wiki/Eus%C3%A8be_de_C%C3%A9sar%C3%A9e][Eusèbe de Césarée]], consultez le passionnant deuxième chapitre du livre d'Anthony Grafton. +** Parallèle chinois +Comme je le dis, mon inculture fait que je ne rends pas justice aux contributions chinoises, musulmanes, précolombienne, etc. J'essaierai de combler cette énorme lacune pour les seconde version du CLOM... + +Ce que je dis sur le passage du volumen au codex accompagné d'un développement des « outils de navigation » (index, table des matières, etc) en Chine lors du développement de leishus vient du bouquin d'Ann Blair (p. 31) qui cite un article de Susan Cherniack, « Book Culture and Textual Transmission in Sung China », /Harvard Journal of Asiatic Studies/ Vol. 54, No. 1 (Jun., 1994), pp. 5-125. +** Retour sur l'armoire à notes +Nous revenons sur le « bout de papier » ou la fiche comme support de note. L'inconvénient est que le bout de papier ou la fiche se perdent facilement et ne servent à rien s'ils ne sont pas *classés* en plus d'être rangés. Problème résolu par l'armoire de Placcius. D'une certaine façon, sa conception fait qu'on accède à son contenu par l'index. + +L'avantage est que les notes peuvent être réorganisées si elles contiennent des information sur plusieurs sujets. Elle peuvent aussi être directement collées dans un livre lors de la composition d'un florilège ou d'un ouvrage de synthèse. + +Ce dernier procédé était très couramment employé par les humanistes et les érudit de la renaissance et du début de la période moderne. [[https://fr.wikipedia.org/wiki/Conrad_Gessner][Conrad Gessner]] (1516-1565) était un champion de cette technique ; il obtenait même parfois ses fiches en découpant les pages des livres. Encore une fois, ne faites pas cela avec les livres de bibliothèques ! + +** L'index et John Locke + +Sur l'origine de l'index, on pourra lire l'article de Jean Berger : [[https://www.theindexer.org/files/25-2-berger.pdf][Indexation, Memoire, pouvoir et representations au seuil du XIIe siecle : La redecouverte des feuillets de tables du Liber De Honoribus, premier cartulaire de la collegiale Saint-Julien de Brioude]], /The Indexer/. + +La méthode de John Lock est expliquée dans l'article /Indexing commonplace books: John Locke’s method/ d'Alan Walker, [[https://www.theindexer.org/issues/query.php?vol=22&iss=3][The Indexer]], vol. 22, p. 114-118, 2001. + +Sur [[https://fr.wikipedia.org/wiki/John_Locke][John Locke]] (1632-1704) « papa du libéralisme » et actionnaire de la /Royal African Company/ principale compagnie négrière britannique, voir l'article [[https://en.wikipedia.org/wiki/John_Locke#Constitution_of_Carolina][Wikipedia]] (en anglais) et le livre « Contre-histoire du libéralisme » de Domenico Losurdo (La Découverte / Poche, 2014, p. 34-36). diff --git a/module1/ressources/Module1_2_SupplementaryMaterial.md b/module1/ressources/Module1_2_SupplementaryMaterial.md new file mode 100644 index 0000000..c971590 --- /dev/null +++ b/module1/ressources/Module1_2_SupplementaryMaterial.md @@ -0,0 +1,337 @@ +--- +TITLE: A historical survey of note taking +AUTHOR: Christophe Pouzat +---\n +broken-links:nil c:nil creator:nil + +Illustrations used in the first figure +====================================== + +All illustrations are taken from Wikimedia Commons + +- Top left: A clay tablet (pre-cuneiform period, -3000). +- Top center: A fresco from Pompeii with the portrait of [Terentius + Neo and his + wife](https://en.wikipedia.org/wiki/Portrait_of_Paquius_Proculo). + She carries a [wax tablet](https://en.wikipedia.org/wiki/Wax_tablet) + and a *stylus* (the main medium of note-takers up to the 19th + century); he carries a *volumen* or + [scroll](https://en.wikipedia.org/wiki/History_of_scrolls), the + stuff of books until the beginning of the Common Era. +- Top right: a notebook made of paper from the 17th century with + [commonplaces](https://en.wikipedia.org/wiki/Commonplace_book). + "Commonplace" is a translation of the Latin term locus communis + (from Greek tópos koinós, see literary topos) which means "a theme + or argument of general application", such as a statement of + proverbial wisdom (Wikipedia). +- Bottom left: An [index + card](https://en.wikipedia.org/wiki/Index_card), a notes medium + whose use exploded with bureaucratization and the development of + libraries. Still heavily used in the humanities. Apparently first + used (if not created) by the father of taxonomy, [Carl + Linneaus](https://en.wikipedia.org/wiki/Carl_Linnaeus). You can find + his cards at: . +- Bottom center: A [Post-it + note](https://en.wikipedia.org/wiki/Post-it_note) as most of us use + every day. +- Bottom right: A "modern days" numerical tablet. + +Wax tablet and stylus +===================== + +From the [Wikipedia page](https://en.wikipedia.org/wiki/Wax_tablet): + +> A wax tablet is a tablet made of wood and covered with a layer of wax, +> often linked loosely to a cover tablet, as a "double-leaved" diptych. +> It was used as a reusable and portable writing surface in Antiquity +> and throughout the Middle Ages. +> +> Writing on the wax surface was performed with a pointed instrument, a +> stylus. Writing by engraving in wax required the application of much +> more pressure and traction than would be necessary with ink on +> parchment or papyrus,\[1\] and the scribe had to lift the stylus in +> order to change the direction of the stroke. Therefore, the stylus +> could not be applied with the same degree of dexterity as a pen. A +> straight-edged, spatula-like implement (often placed on the opposite +> end of the stylus tip) would be used in a razor-like fashion to serve +> as an eraser. The entire tablet could be erased for reuse by warming +> it to about 50 °C and smoothing the softened wax surface. The modern +> expression of "a clean slate" equates to the Latin expression "tabula +> rasa". + +From the *scroll* to the *codex* +================================ + +The shift from the *scroll* to the *codex* is fundamental for +development of written civilization. + +A scroll (from the Old French escroe or escroue), is a roll of papyrus, +[parchment](https://en.wikipedia.org/wiki/Parchment), or paper +containing writing. + +From +[Wikipedia](https://en.wikipedia.org/wiki/History_of_scrolls#Replacement_by_the_Codex): + +> The codex was a new format for reading the written word, consisting of +> individual pages loosely attached to each other at one side and bound +> with boards or cloth. It came to replace the scroll thanks to several +> problems that limited the scroll's function and readability. For one, +> scrolls were very long, sometimes as long as ten meters. This made +> them hard to hold open and read, a difficulty not helped by the fact +> that most scrolls in that era were read horizontally, instead of +> vertically as scrolling virtual documents are read now. The text on a +> scroll was continuous, without page breaks, which made indexing and +> bookmarking impossible. Conversely, the codex was easier to hold open, +> separate pages made it possible to index sections and mark a page, and +> the protective covers kept the fragile pages intact better than +> scrolls generally stayed. This last made it particularly attractive +> for important religious texts. + +The bottom left mosaic shows Virgil seating (70-19 BCE) holding a scroll +of the *Aeneid*, with Clio, muse of history, also holding a scroll. + +As explained by Frédéric Barbier (*Histoire du Livre*): "The scroll / +volumen imposes a complex reading practice: one must unroll +(*explicare*) and roll at the same time; that forbids working on several +scrolls (the original text and its commentary) at the same time or to +take notes. It imposes a continuous reading and making consultation +impossible." + +Scrolls are clearly unsuited to "nomadic reading"; can you imagine +Ulysses embarking for his Odyssey carrying the 24 scrolls/volumen of the +Iliad? + +The term *volumen* is the origin of our modern *volumes* (a book in +several volumes) as of the word for the geometrical concept. + +Switching from scroll to codices required two innovations: + +- The collection of wax tablets bound together with leather strands. +- The generalization of + [parchment](https://en.wikipedia.org/wiki/Parchment) (usually sheep + skin specially processed) as a replacement for + [papyrus](https://en.wikipedia.org/wiki/Papyrus). This + generalization could be due (according to Pliny the Elder) to a + rivalry between the cities of Pergamon and Alexandria for cultural + hegemony: [Ptolemy V + Epiphanes](https://en.wikipedia.org/wiki/Ptolemy_V_Epiphanes) King + of Egypt wanted to block [Eumenes + II](https://en.wikipedia.org/wiki/Eumenes_II) from developing in + Pergamon a library that could compete with the one of Alexandria; he + therefore imposed an embargo on papyrus export (Egypt was the sole + papyrus producer). Eumenes looked for an alternative and fostered + parchment development. The link between Pergamon and parchment is + much clearer in German where Pergamon is written in the way as in + English but where parchment is written *Pergament*. + +Switching from scrolls to codices will have major consequences on books +organization as well as on the reading practices, it will later on allow +printing development. + +The main revolution brought by the codex is the *page*. Thanks to this +structural element, the reader can access directly to a specific chapter +or a specific part of the text, while scrolls imposed continuous reading +**at a time when there were no blanks between words**. According to +Collette Sirat: "Twenty centuries will be necessary to realize the +paramount importance of the codex for our civilization through the +**selective reading** it made possible as opposed to the continuous +reading. It opened room for the elaboration of mental structures where +the text is dissociated from the speech and its rhythm." + +Notice the red letters used on the codex (bottom right), an example of +[rubrication](https://en.wikipedia.org/wiki/Rubrication) used by scribes +to mark paragraphs. With printing and the high cost of colors it +entailed, an empty space started to be used to that end. Thinking about +it, colors don't cost anything on a numerical support and could +perfectly be used again in the same way. + +Eusebius and the invention of cross-references +============================================== + +From the Wikipedia page on +[Eusebius](https://en.wikipedia.org/wiki/Eusebius): + +> Eusebius of Caesarea (ad 260/265 – 339/340), also known as Eusebius +> Pamphili, was a historian of Christianity, exegete, and Christian +> polemicist. He became the bishop of Caesarea Maritima about 314 AD. +> Together with Pamphilus, he was a scholar of the Biblical canon and is +> regarded as an extremely learned Christian of his time. He wrote +> Demonstrations of the Gospel, Preparations for the Gospel, and On +> Discrepancies between the Gospels, studies of the Biblical text. + +According to Anthony Grafton and Megan Williams (2006) *Christianity and +the Transformation of the Book*, The Belknap Press of Harvard University +Press, his writings are crucial for our knowledge of the first three +centuries of Christian history. *He brought several essential +innovations to the book's organization like the cross-references*. + +Eusebian canons +=============== + +Quote from +[Wikipedia](https://en.wikipedia.org/wiki/Eusebius#Biblical_text_criticism): + +> For an easier survey of the material of the four Evangelists, Eusebius +> divided his edition of the New Testament into paragraphs and provided +> it with a synoptical table so that it might be easier to find the +> pericopes that belong together. These canon tables or "Eusebian +> canons" remained in use throughout the Middle Ages, and illuminated +> manuscript versions are important for the study of early medieval art, +> as they are the most elaborately decorated pages of many Gospel books. + +*Codex* significance +==================== + +Following Frédéric Barbier (*HISTOIRE DU LIVRE*, Armand Colin, 2009): + +- *Codex* invention is crucial for the development of written + civilization. +- The *codex* lends itself to **consultation reading**. +- We can add to the *codex* a "navigation system" making consultation + easier. +- We can take notes while consulting a *codex*. +- The combination of the *codex* with the *Carolingian minuscule* + constitutes an extremely powerful intellectual tools, never seen + before. + +Example of *Carolingian minuscule* can be found on the corresponding +[Wikipedia page](https://en.wikipedia.org/wiki/Carolingian_minuscule). + +Over centuries, *codices*—that we often call *manuscripts*—will slowly +evolve and gain modern days book attributes: + +- separation between words (VIIth century), +- start of punctuation (VIIIth century), +- table of content, +- running title, +- paragraph marks (rubrication, XIth century), +- pagination, +- index (XIIIth century). + +An interesting point: Torah's content got "fixed" before the *codex* +generalization and today Torah scrolls are still used. + +Let us not forget China +======================= + +The link between the *codex* generalization, on the one hand, and the +apparition of "navigation guides" like the table of content, the index, +the running title, on the other hand as a counterpart in the Chinese +civilization. + +In China, competitive examinations to become a high ranking state +employee developed in the IXth century (CE). The main part of these exam +was a paper on what we would now call general knowledge of the Classics +where the students were asked to demonstrate their knowledge through +appropriate quotations. + +To fulfill the need of "textbook" appropriate for this kind of +examination what is called +[leishus](https://en.wikipedia.org/wiki/Leishu) were produced. They are +described as follows on Wikipedia: + +> The leishu are composed of sometimes lengthy citations from other +> works and often contain copies of entire works, not just excerpts. The +> works are classified by a systematic set of categories, which are +> further divided into subcategories. Leishu may be considered +> anthologies, but are encyclopedic in the sense that they may comprise +> the entire realm of knowledge at the time of compilation. + +The efficient use of the leishu requires an indexing system, a table of +content, etc. Very interestingly, the scroll will be abandoned and the +codex will generalize in China around that time, as observed by Ann +Blair in her book *TOO MUCH TO KNOW*, Yale Univ. Press, 2010 (pp. +28-31). + +Most of the leishus **were printed** (from the IXth century on!). The +picture on the right side (a banknote printing plate) is there to remind +us of who was (by far) the most advanced at that time. The Chinese were +of course printing their leishus on paper that they discovered in the +VIIIth century BCE. + +Getting organized by using the right slot +========================================= + +Now that we briefly reviewed the timeline of the main navigation +elements of the books—navigation elements that can of course be applied +to our lab/note-books—we come back to the paper slips and cards as notes +media. + +We see (again) Placcius' and Leibniz's closet since it displays both the +benefits and the shortcomings of media that hold **a single note**. + +Obvious shortcomings are: + +- Paper slips and cards get easily lost. +- They are essentially useless if they are not **classified** in + addition to being filed. + +These problems are solved by Placcius' cabinet, the content of which is +fundamentally accessed through the index. + +Clear benefits are: + +- Paper slips can be easily reorganized when they contain information + on several subjects. +- Paper slips can be directly pasted in a book when composing an + anthology or a compendium. + +This last technique (pasting when making an anthology) was +systematically used by the Renaissance polymath [Conrad +Gessner](https://en.wikipedia.org/wiki/Conrad_Gessner) (1516-1565) who +even got his paper slips by cutting parts of pages from books (don't do +that with library books)! + +Constructing a notebook index the John Locke way +================================================ + +We will now learn about an index construction technique due to [John +Locke](https://en.wikipedia.org/wiki/John_Locke) (1632-1704), the +grand-father of liberalism and a major investor in the *Royal African +Company*, the largest company in the +[slave-trade](https://en.wikipedia.org/wiki/John_Locke#Constitution_of_Carolina) +business at that time… + +The indexing method is here illustrated using my own notebook. The two +pages that are displayed describe the structure of a dataset in the +[HDF5](https://www.hdfgroup.org/) format on the left side and the +corresponding structure (designed to map the former one) of a +`data frame` object of the [R](https://www.r-project.org/) language. +This dataset contain **calcium** concentration measurements made in +**neurons**. This notes were taken while writing some computer **code** +to analyze the data. + +The precise content of the pages does not matter here in order to +understand how Locke's method works. The important points are: + +- The pages are numbered (we are seeing here pages 86 and 87). +- Keywords are written at the bottom of the page: **code**; **neuro**; + **calcium**. + +This method can be applied after note-taking, you just need to have few +pages left at the end of your notebook. That's in fact what I did since +I had started filling my notebook before learning about the method (I +learned about while preparing the French version of this lecture in +September 2017). + +We now the index. It is located at the end of the notebook although +Locke recommends placing it at the beginning. Since I did not know about +the method when I started the notebook, I had to place it at the end… + +The idea is to enter the keywords used in the notebook based on their +**first letter** and the **first vowel following the first letter**. + +The index is therefore made of the 26 letters (you see letters "A" to +"R" here, the remaining ones are on the next page) subdivided the five +most common vowels ("y" goes together with "i" in that case). + +Pages 86 and 87 contained the keyword **code** that goes into the entry +"Co" of the index (you see "86-89" because the following pages also +concern code for the same project). The keyword **Neuro** giving an +entry on line "Ne", while the keyword **Calcium** gives an entry on line +"Ca". + +The keyword **Criquet** (not shown above) gives an entry on line "Ci". + +It is also a good idea to list the set of keywords used in the notebook +on the page preceding or following the index. diff --git a/module1/ressources/Module1_2_SupplementaryMaterial.org b/module1/ressources/Module1_2_SupplementaryMaterial.org new file mode 100644 index 0000000..d140e11 --- /dev/null +++ b/module1/ressources/Module1_2_SupplementaryMaterial.org @@ -0,0 +1,173 @@ +#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline +#+OPTIONS: author:t broken-links:nil c:nil creator:nil +#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t +#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t +#+OPTIONS: timestamp:t title:t toc:t todo:t |:t +#+TITLE: A historical survey of note taking +#+DATE: <2019-03-21 jeu.> +#+AUTHOR: Christophe Pouzat +#+EMAIL: christophe.pouzat@parisdescartes.fr +#+LANGUAGE: en +#+SELECT_TAGS: export +#+EXCLUDE_TAGS: noexport +#+CREATOR: Emacs 26.1 (Org mode 9.1.9) + + +* Illustrations used in the first figure + +All illustrations are taken from Wikimedia Commons +- Top left: A clay tablet (pre-cuneiform period, -3000). +- Top center: A fresco from Pompeii with the portrait of [[https://en.wikipedia.org/wiki/Portrait_of_Paquius_Proculo][Terentius Neo and his wife]]. She carries a [[https://en.wikipedia.org/wiki/Wax_tablet][wax tablet]] and a /stylus/ (the main medium of note-takers up to the 19th century); he carries a /volumen/ or [[https://en.wikipedia.org/wiki/History_of_scrolls][scroll]], the stuff of books until the beginning of the Common Era. +- Top right: a notebook made of paper from the 17th century with [[https://en.wikipedia.org/wiki/Commonplace_book][commonplaces]]. "Commonplace" is a translation of the Latin term locus communis (from Greek tópos koinós, see literary topos) which means "a theme or argument of general application", such as a statement of proverbial wisdom (Wikipedia). +- Bottom left: An [[https://en.wikipedia.org/wiki/Index_card][index card]], a notes medium whose use exploded with bureaucratization and the development of libraries. Still heavily used in the humanities. Apparently first used (if not created) by the father of taxonomy, [[https://en.wikipedia.org/wiki/Carl_Linnaeus][Carl Linneaus]]. You can find his cards at: [[http://linnean-online.org/61332/#/0]]. +- Bottom center: A [[https://en.wikipedia.org/wiki/Post-it_note][Post-it note]] as most of us use every day. +- Bottom right: A "modern days" numerical tablet. + +* Wax tablet and stylus + +From the [[https://en.wikipedia.org/wiki/Wax_tablet][Wikipedia page]]: + +#+BEGIN_QUOTE +A wax tablet is a tablet made of wood and covered with a layer of wax, often linked loosely to a cover tablet, as a "double-leaved" diptych. +It was used as a reusable and portable writing surface in Antiquity and throughout the Middle Ages. + +Writing on the wax surface was performed with a pointed instrument, a stylus. Writing by engraving in wax required the application of much +more pressure and traction than would be necessary with ink on parchment or papyrus,[1] and the scribe had to lift the stylus in order to +change the direction of the stroke. Therefore, the stylus could not be applied with the same degree of dexterity as a pen. A straight-edged, +spatula-like implement (often placed on the opposite end of the stylus tip) would be used in a razor-like fashion to serve as an eraser. +The entire tablet could be erased for reuse by warming it to about 50 °C and smoothing the softened wax surface. The modern expression of +"a clean slate" equates to the Latin expression "tabula rasa". +#+END_QUOTE + +* From the /scroll/ to the /codex/ + +The shift from the /scroll/ to the /codex/ is fundamental for development of written civilization. + +A scroll (from the Old French escroe or escroue), is a roll of papyrus, [[https://en.wikipedia.org/wiki/Parchment][parchment]], or paper containing writing. + +From [[https://en.wikipedia.org/wiki/History_of_scrolls#Replacement_by_the_Codex][Wikipedia]]: + +#+BEGIN_QUOTE +The codex was a new format for reading the written word, consisting of individual pages loosely attached to each other at one +side and bound with boards or cloth. It came to replace the scroll thanks to several problems that limited the scroll's function +and readability. For one, scrolls were very long, sometimes as long as ten meters. This made them hard to hold open and read, a +difficulty not helped by the fact that most scrolls in that era were read horizontally, instead of vertically as scrolling virtual +documents are read now. The text on a scroll was continuous, without page breaks, which made indexing and bookmarking impossible. +Conversely, the codex was easier to hold open, separate pages made it possible to index sections and mark a page, and the protective +covers kept the fragile pages intact better than scrolls generally stayed. This last made it particularly attractive for important +religious texts. +#+END_QUOTE + +The bottom left mosaic shows Virgil seating (70-19 BCE) holding a scroll of the /Aeneid/, with Clio, muse of history, also holding a scroll. + +As explained by Frédéric Barbier (/Histoire du Livre/): "The scroll / volumen imposes a complex reading practice: one must unroll (/explicare/) and roll at the same time; that forbids working on several scrolls (the original text and its commentary) at the same time or to take notes. It imposes a continuous reading and making consultation impossible." + +Scrolls are clearly unsuited to "nomadic reading"; can you imagine Ulysses embarking for his Odyssey carrying the 24 scrolls/volumen of the Iliad? + +The term /volumen/ is the origin of our modern /volumes/ (a book in several volumes) as of the word for the geometrical concept. + +Switching from scroll to codices required two innovations: +- The collection of wax tablets bound together with leather strands. +- The generalization of [[https://en.wikipedia.org/wiki/Parchment][parchment]] (usually sheep skin specially processed) as a replacement for [[https://en.wikipedia.org/wiki/Papyrus][papyrus]]. This generalization could be due (according to Pliny the Elder) to a rivalry between the cities of Pergamon and Alexandria for cultural hegemony: [[https://en.wikipedia.org/wiki/Ptolemy_V_Epiphanes][Ptolemy V Epiphanes]] King of Egypt wanted to block [[https://en.wikipedia.org/wiki/Eumenes_II][Eumenes II]] from developing in Pergamon a library that could compete with the one of Alexandria; he therefore imposed an embargo on papyrus export (Egypt was the sole papyrus producer). Eumenes looked for an alternative and fostered parchment development. The link between Pergamon and parchment is much clearer in German where Pergamon is written in the way as in English but where parchment is written /Pergament/. + +Switching from scrolls to codices will have major consequences on books organization as well as on the reading practices, it will later on allow printing development. + +The main revolution brought by the codex is the /page/. Thanks to this structural element, the reader can access directly to a specific chapter or a specific part of the text, while scrolls imposed continuous reading *at a time when there were no blanks between words*. According to Collette Sirat: "Twenty centuries will be necessary to realize the paramount importance of the codex for our civilization through the *selective reading* it made possible as opposed to the continuous reading. It opened room for the elaboration of mental structures where the text is dissociated from the speech and its rhythm." + +Notice the red letters used on the codex (bottom right), an example of [[https://en.wikipedia.org/wiki/Rubrication][rubrication]] used by scribes to mark paragraphs. With printing and the high cost of colors it entailed, an empty space started to be used to that end. Thinking about it, colors don't cost anything on a numerical support and could perfectly be used again in the same way. + +* Eusebius and the invention of cross-references + +From the Wikipedia page on [[https://en.wikipedia.org/wiki/Eusebius][Eusebius]]: +#+BEGIN_QUOTE +Eusebius of Caesarea (ad 260/265 – 339/340), also known as Eusebius Pamphili, was a historian of Christianity, exegete, and Christian polemicist. He became the bishop of Caesarea Maritima about 314 AD. Together with Pamphilus, he was a scholar of the Biblical canon and is regarded as an extremely learned Christian of his time. He wrote Demonstrations of the Gospel, Preparations for the Gospel, and On Discrepancies between the Gospels, studies of the Biblical text. +#+END_QUOTE + +According to Anthony Grafton and Megan Williams (2006) /Christianity and the Transformation of the Book/, The Belknap Press of Harvard University Press, his writings are crucial for our knowledge of the first three centuries of Christian history. /He brought several essential innovations to the book's organization like the cross-references/. + +* Eusebian canons + +Quote from [[https://en.wikipedia.org/wiki/Eusebius#Biblical_text_criticism][Wikipedia]]: +#+BEGIN_QUOTE +For an easier survey of the material of the four Evangelists, Eusebius divided his edition of the New Testament into paragraphs and provided it with a synoptical table so that it might be easier to find the pericopes that belong together. These canon tables or "Eusebian canons" remained in use throughout the Middle Ages, and illuminated manuscript versions are important for the study of early medieval art, as they are the most elaborately decorated pages of many Gospel books. +#+END_QUOTE + +* /Codex/ significance + +Following Frédéric Barbier (/HISTOIRE DU LIVRE/, Armand Colin, 2009): +- /Codex/ invention is crucial for the development of written civilization. +- The /codex/ lends itself to *consultation reading*. +- We can add to the /codex/ a "navigation system" making consultation easier. +- We can take notes while consulting a /codex/. +- The combination of the /codex/ with the /Carolingian minuscule/ constitutes an extremely powerful intellectual tools, never seen before. + +Example of /Carolingian minuscule/ can be found on the corresponding [[https://en.wikipedia.org/wiki/Carolingian_minuscule][Wikipedia page]]. + +Over centuries, /codices/---that we often call /manuscripts/---will slowly evolve and gain modern days book attributes: +- separation between words (VIIth century), +- start of punctuation (VIIIth century), +- table of content, +- running title, +- paragraph marks (rubrication, XIth century), +- pagination, +- index (XIIIth century). + +An interesting point: Torah's content got "fixed" before the /codex/ generalization and today Torah scrolls are still used. + +* Let us not forget China + +The link between the /codex/ generalization, on the one hand, and the apparition of "navigation guides" like the table of content, the index, the running title, on the other hand as a counterpart in the Chinese civilization. + +In China, competitive examinations to become a high ranking state employee developed in the IXth century (CE). The main part of these exam was a paper on what we would now call general knowledge of the Classics where the students were asked to demonstrate their knowledge through appropriate quotations. + +To fulfill the need of "textbook" appropriate for this kind of examination what is called [[https://en.wikipedia.org/wiki/Leishu][leishus]] were produced. They are described as follows on Wikipedia: +#+BEGIN_QUOTE +The leishu are composed of sometimes lengthy citations from other works and often contain copies of entire works, not just excerpts. The works are classified by a systematic set of categories, which are further divided into subcategories. Leishu may be considered anthologies, but are encyclopedic in the sense that they may comprise the entire realm of knowledge at the time of compilation. +#+END_QUOTE + +The efficient use of the leishu requires an indexing system, a table of content, etc. Very interestingly, the scroll will be abandoned and the codex will generalize in China around that time, as observed by Ann Blair in her book /TOO MUCH TO KNOW/, Yale Univ. Press, 2010 (pp. 28-31). + +Most of the leishus *were printed* (from the IXth century on!). The picture on the right side (a banknote printing plate) is there to remind us of who was (by far) the most advanced at that time. The Chinese were of course printing their leishus on paper that they discovered in the VIIIth century BCE. + +* Getting organized by using the right slot + +Now that we briefly reviewed the timeline of the main navigation elements of the books---navigation elements that can of course be applied to our lab/note-books---we come back to the paper slips and cards as notes media. + +We see (again) Placcius' and Leibniz's closet since it displays both the benefits and the shortcomings of media that hold *a single note*. + +Obvious shortcomings are: +- Paper slips and cards get easily lost. +- They are essentially useless if they are not *classified* in addition to being filed. +These problems are solved by Placcius' cabinet, the content of which is fundamentally accessed through the index. + +Clear benefits are: +- Paper slips can be easily reorganized when they contain information on several subjects. +- Paper slips can be directly pasted in a book when composing an anthology or a compendium. + +This last technique (pasting when making an anthology) was systematically used by the Renaissance polymath [[https://en.wikipedia.org/wiki/Conrad_Gessner][Conrad Gessner]] (1516-1565) who even got his paper slips by cutting parts of pages from books (don't do that with library books)! + +* Constructing a notebook index the John Locke way + +We will now learn about an index construction technique due to [[https://en.wikipedia.org/wiki/John_Locke][John Locke]] (1632-1704), the grand-father of liberalism and a major investor in the /Royal African Company/, the largest company in the [[https://en.wikipedia.org/wiki/John_Locke#Constitution_of_Carolina][slave-trade]] business at that time... + +The indexing method is here illustrated using my own notebook. The two pages that are displayed describe the structure of a dataset in the [[https://www.hdfgroup.org/][HDF5]] format on the left side and the corresponding structure (designed to map the former one) of a =data frame= object of the [[https://www.r-project.org/][R]] language. This dataset contain *calcium* concentration measurements made in *neurons*. This notes were taken while writing some computer *code* to analyze the data. + +The precise content of the pages does not matter here in order to understand how Locke's method works. The important points are: +- The pages are numbered (we are seeing here pages 86 and 87). +- Keywords are written at the bottom of the page: *code*; *neuro*; *calcium*. + +This method can be applied after note-taking, you just need to have few pages left at the end of your notebook. That's in fact what I did since I had started filling my notebook before learning about the method (I learned about while preparing the French version of this lecture in September 2017). + + +We now the index. It is located at the end of the notebook although Locke recommends placing it at the beginning. Since I did not know about the method when I started the notebook, I had to place it at the end... + +The idea is to enter the keywords used in the notebook based on their *first letter* and the *first vowel following the first letter*. + +The index is therefore made of the 26 letters (you see letters "A" to "R" here, the remaining ones are on the next page) subdivided the five most common vowels ("y" goes together with "i" in that case). + +Pages 86 and 87 contained the keyword *code* that goes into the entry "Co" of the index (you see "86-89" because the following pages also concern code for the same project). The keyword *Neuro* giving an entry on line "Ne", while the keyword *Calcium* gives an entry on line "Ca". + +The keyword *Criquet* (not shown above) gives an entry on line "Ci". + +It is also a good idea to list the set of keywords used in the notebook on the page preceding or following the index. + diff --git a/module1/ressources/Module1_3_MaterielSupplementaire_fr.md b/module1/ressources/Module1_3_MaterielSupplementaire_fr.md new file mode 100644 index 0000000..a3cc3de --- /dev/null +++ b/module1/ressources/Module1_3_MaterielSupplementaire_fr.md @@ -0,0 +1,87 @@ +--- +TITLE: Ressources pour la séquence 3 du module 1 +AUTHOR: Christophe Pouzat +---\n +broken-links:nil c:nil creator:nil + +Notes et références sur la séquence 3 : « Du fichier texte au langage de balisage léger » +========================================================================================= + +Fichier texte et éditeur de texte +--------------------------------- + +Une définition plus technique (et moins circulaire !) du fichier texte +se trouve sur [la page +wikipédia](https://fr.wikipedia.org/wiki/Fichier_texte) consacrée au +sujet. Pour plus de détails sur les éditeurs de texte, voir aussi la +[page wikipédia +correspondante](https://fr.wikipedia.org/wiki/%C3%89diteur_de_texte). + +Un logiciel de « [traitement de +texte](https://fr.wikipedia.org/wiki/Traitement_de_texte) » est plus +sophistiqué qu'un simple éditeur de texte ; il permet de faire plus, ce +qui sous entend qu'il peut aussi ouvrir et manipuler des fichiers +textes. + +\*Attention\* : le format « natif » des traitements de texte est +rarement un format texte. Les fichiers `doc` et `docx` de `Word` et +`odt` de `LibreOffice` *ne sont pas des fichiers textes*. + +Le cas du fichier `PDF` ouvert avec un éditeur de texte +------------------------------------------------------- + +Dans le cours filmé, j'utilise l'exemple du +[PDF](https://en.wikipedia.org/wiki/Portable_Document_Format) — je donne +l'adresse de la page wikipedia en anglais, bien plus complète que celle +en français — ouvert avec un éditeur de texte pour montrer que le +fichier ne peut pas être visualisé avec un tel logiciel, il faut un +logiciel de rendu dédié comme `Adobe Reader`, `Evince`, `MuPDF`, +`Aperçu`,… Vous remarquez néanmoins que le début du fichier contient du +texte (la première ligne nous apprend que le fichier utilise la version +1.3 du format `PDF`). Cette partie au format texte du fichier contient +les méta-données — qui ne sont pas montrées, en tout cas pas +directement, par les logiciels de rendu. Ces méta-données sont (en +partie) au format +[XMP](https://en.wikipedia.org/wiki/Extensible_Metadata_Platform) +(*Extensible Metadata Platform*), nous y reviendrons dans la cinquème +séquence. + +Sur l'UTF-8 +----------- + +Une table des symboles UTF-8, avec leur code se trouve à l'adresse : +. C'est pratique pour insérer un symbole +pas très courant comme la lettre « TLO » : Ꮰ de la langue cherokee, ou +le symbole mathématique ∀, « pour tout ». + +Pour ceux qui doivent souvent utiliser des lettres grecs (par exemple +pour écrire des équations), il est possible sous Linux de (re)définir +des combinaisons de touches pour générer directement les dites lettres. +Ces combinaisons sont définies dans le fichier `.XCompose`, le début de +mon fichier contient : + +``` example +# On charge la base de donnée de Compose la plus complète en UTF-8 + include "/usr/share/X11/locale/en_US.UTF-8/Compose" + # espace insécable fine + : " " U202F + # Lettres greques + : "α" Greek_alpha + : "Α" Greek_ALPHA + : "β" Greek_beta + : "Β" Greek_BETA + : "γ" Greek_gamma + : "Γ" Greek_GAMMA + : "δ" Greek_delta + : "Δ" Greek_DELTA + : "ε" Greek_epsilon + : "Ε" Greek_EPSILON + : "ζ" Greek_zeta + : "Ζ" Greek_ZETA + : "η" Greek_eta +``` + +J'ai en plus redéfini la « \key\> » pour qu'elle +corresponde à la touche « impression d'écran » de mon clavier. Pour +apprendre à redéfinir des touches, consultez : +. diff --git a/module1/ressources/Module1_3_MaterielSupplementaire_fr.org b/module1/ressources/Module1_3_MaterielSupplementaire_fr.org new file mode 100644 index 0000000..da636e6 --- /dev/null +++ b/module1/ressources/Module1_3_MaterielSupplementaire_fr.org @@ -0,0 +1,56 @@ +#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline +#+OPTIONS: author:t broken-links:nil c:nil creator:nil +#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t +#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t +#+OPTIONS: timestamp:t title:t toc:t todo:t |:t +#+TITLE: Ressources pour la séquence 3 du module 1 +#+DATE: <2019-02-21 jeu.> +#+AUTHOR: Christophe Pouzat +#+EMAIL: christophe.pouzat@parisdescartes.fr +#+LANGUAGE: fr +#+SELECT_TAGS: export +#+EXCLUDE_TAGS: noexport +#+CREATOR: Emacs 26.1 (Org mode 9.1.9) +#+STARTUP: indent + +* Notes et références sur la séquence 3 : « Du fichier texte au langage de balisage léger » + +** Fichier texte et éditeur de texte +Une définition plus technique (et moins circulaire !) du fichier texte se trouve sur [[https://fr.wikipedia.org/wiki/Fichier_texte][la page wikipédia]] consacrée au sujet. Pour plus de détails sur les éditeurs de texte, voir aussi la [[https://fr.wikipedia.org/wiki/%C3%89diteur_de_texte][page wikipédia correspondante]]. + +Un logiciel de « [[https://fr.wikipedia.org/wiki/Traitement_de_texte][traitement de texte]] » est plus sophistiqué qu'un simple éditeur de texte ; il permet de faire plus, ce qui sous entend qu'il peut aussi ouvrir et manipuler des fichiers textes. + +*Attention* : le format « natif » des traitements de texte est rarement un format texte. Les fichiers =doc= et =docx= de =Word= et =odt= de =LibreOffice= /ne sont pas des fichiers textes/. + +** Le cas du fichier =PDF= ouvert avec un éditeur de texte + +Dans le cours filmé, j'utilise l'exemple du [[https://en.wikipedia.org/wiki/Portable_Document_Format][PDF]] — je donne l'adresse de la page wikipedia en anglais, bien plus complète que celle en français — ouvert avec un éditeur de texte pour montrer que le fichier ne peut pas être visualisé avec un tel logiciel, il faut un logiciel de rendu dédié comme =Adobe Reader=, =Evince=, =MuPDF=, =Aperçu=,... Vous remarquez néanmoins que le début du fichier contient du texte (la première ligne nous apprend que le fichier utilise la version 1.3 du format =PDF=). Cette partie au format texte du fichier contient les méta-données — qui ne sont pas montrées, en tout cas pas directement, par les logiciels de rendu. Ces méta-données sont (en partie) au format [[https://en.wikipedia.org/wiki/Extensible_Metadata_Platform][XMP]] (/Extensible Metadata Platform/), nous y reviendrons dans la cinquème séquence. + +** Sur l'UTF-8 + +Une table des symboles UTF-8, avec leur code se trouve à l'adresse : [[http://www.utf8-chartable.de/]]. C'est pratique pour insérer un symbole pas très courant comme la lettre « TLO » : Ꮰ de la langue cherokee, ou le symbole mathématique ∀, « pour tout ». + +Pour ceux qui doivent souvent utiliser des lettres grecs (par exemple pour écrire des équations), il est possible sous Linux de (re)définir des combinaisons de touches pour générer directement les dites lettres. Ces combinaisons sont définies dans le fichier =.XCompose=, le début de mon fichier contient : + +#+BEGIN_EXAMPLE + # On charge la base de donnée de Compose la plus complète en UTF-8 + include "/usr/share/X11/locale/en_US.UTF-8/Compose" + # espace insécable fine + : " " U202F + # Lettres greques + : "α" Greek_alpha + : "Α" Greek_ALPHA + : "β" Greek_beta + : "Β" Greek_BETA + : "γ" Greek_gamma + : "Γ" Greek_GAMMA + : "δ" Greek_delta + : "Δ" Greek_DELTA + : "ε" Greek_epsilon + : "Ε" Greek_EPSILON + : "ζ" Greek_zeta + : "Ζ" Greek_ZETA + : "η" Greek_eta +#+END_EXAMPLE + +J'ai en plus redéfini la «  » pour qu'elle corresponde à la touche « impression d'écran » de mon clavier. Pour apprendre à redéfinir des touches, consultez : [[https://wiki.archlinux.org/index.php/Keyboard_configuration_in_Xorg#Configuring_compose_key]]. diff --git a/module1/ressources/Module1_5_MaterielSupplementaire_fr.md b/module1/ressources/Module1_5_MaterielSupplementaire_fr.md new file mode 100644 index 0000000..5a2fef0 --- /dev/null +++ b/module1/ressources/Module1_5_MaterielSupplementaire_fr.md @@ -0,0 +1,284 @@ +--- +TITLE: Ressources pour la séquence 5 du module 1 +AUTHOR: Christophe Pouzat +---\n +broken-links:nil c:nil creator:nil + +Notes et références sur la séquence 5 : « Les étiquettes et les logiciels d'indexation pour s'y retrouver » +=========================================================================================================== + +La structure de la séquence +--------------------------- + +Nous revenons ici sur le problème de l'indexation, pas tant sur +l'indexation d'un document unique que sur l'indexation de documents +multiples dans des formats divers : + +- comme nous l'avons déjà affirmé, prendre des notes abondantes et + détaillées n'est utile que si nous pouvons retrouver les + informations qu'elles contiennent quand nous en avons besoin ; +- pour des notes contenues dans un seul fichier texte, la fonction de + recherche de notre éditeur favori nous permet généralement d'aller + assez loin ; +- pour des notes manuscrites contenues dans un cahier, la méthode de + Locke — que nous avons exposée dans notre deuxième séquence — et qui + repose sur des mots clé ou étiquettes, donne de bons résultats ; +- les notes manuscrites sur fiches sont généralement stockées dans un + meuble dont la structure matérialise un index — comme l'armoire de + Placcius et Leibniz — ; +- mais nous voulons ici aller plus loin, dans le cadre restreint des + « notes » numérisées, en discutant de l'indexation de fichiers + multiples qu'ils soient au format « texte » où dans d'autres format + comme les images `jpg` où les fichier `pdf` ; +- cela nous amménera à introduire les « moteurs de recherche de + bureau » et à expliquer comment des `étiquettes` ou `mots-clés` + peuvent être ajoutés à nos fichiers. + +La citation de Leibniz +---------------------- + +J'ai trouvé la citation introductive : + +« Il me semble que l'apparat savant contemporain est comparable à un +grand magasin qui contient une grande quantité de produits, stockés de +façon totalement désordonnée, mélangée ; où les nombres ou lettres +d'indexation manquent ; où les inventaires et livres de comptes pouvant +aider à ordonner le contenu ont disparus. + +Plus grande est la quantité d'objets amassés, plus petite est leur +utilité. Ainsi, ne devrions nous pas seulement essayer de rassembler de +nouveaux objets de toutes provenances, mais nous devrions aussi essayer +d'ordonner ceux que nous avons déjà. » + +sur le site , c'est donc +une traduction de traduction. J'emploie ici le terme volontairement +anachronique d'« \[apparat +savant\]() » qui est un +terme technique de l'édition désignant : citations, références et +sources, notes en bas de pages, introduction, texte en langue originale +(en parallèle avec la traduction), commentaire historique ou +philologique, index fontium (les sources), index locorum (références +avec renvoi à la page où le passage est cité ou mentionné, par ex. : +Évangile selon Marc 1, 1 : p. 100), index nominum (les noms propres), +index rerum (les thèmes), etc. La référence au « grand magasin » est, +elle aussi anachronique ! + +Leibniz a, pendant une bonne partie de sa vie, « gagné celle-ci » comme +[bibliothécaire](https://www.reseau-canope.fr/savoirscdi/societe-de-linformation/le-monde-du-livre-et-des-medias/histoire-du-livre-et-de-la-documentation/biographies/leibniz-le-bibliothecaire.html), +ce qui explique en partie sont intérêt très poussé pour les questions de +classifications, d'indexations, etc. + +Rechercher avec un éditeur de texte +----------------------------------- + +La diapo correspondante rappelle juste au lecteur quelque chose qu'il +sait déjà et qui est vue, par les gens qui passent des notes « papier » +aux notes « numériques », comme le gros attrait du numérique. + +Les gens de monde Unix/Linux connaissent aussi généralement le programme +[grep](https://fr.wikipedia.org/wiki/Grep) qui permet de faire des +recherches de mots et, plus généralement d'[expressions +régulières](https://fr.wikipedia.org/wiki/Expression_r%C3%A9guli%C3%A8re), +sur un ou *plusieurs* fichiers ; nous y reviendrons. + +Recherche avec index construit « à la main » sur des cahiers de notes +--------------------------------------------------------------------- + +Là encore, il s'agit juste d'un rappel pour les lecteurs assidus de ce +cours ; à ce stade se sont des experts dans la méthode d'indexation de +Locke. + +Recherche avec index « matérialisés » +------------------------------------- + +Encore un rappel pour les lecteurs. + +Vers les outils « sophistiqués » de l'informatique +-------------------------------------------------- + +- les techniques que nous venons de voir ou revoir ne fonctionnent que + pour un seul « document » — recherche avec l'éditeur de texte, index + d'un cahier — et/ou pour un seul type de document ; +- les outils informatiques dont nous disposons nous permettent d'aller + plus loin dans l'indexation des fichiers numériques ; +- il est possible de rajouter des étiquettes ou mots-clés à des + fichiers textes comme à des fichiers images (\`jpg\`, \`png\`) ou + des fichiers « mixtes » (\`pdf\`) grâce aux métadonnées qu'ils + contiennent ; +- les moteurs de recherche de bureau permettent d'indexer l'ensemble + des fichiers textes d'une arborescence donnée mais aussi les + métadonnées des autres fichiers. + +Les moteurs de recherche de bureau +---------------------------------- + +Les moteurs de recherche de bureau comme : + +- [DocFetcher](http://docfetcher.sourceforge.net/fr/index.html) + (Linux, MacOS, Windows) ; +- [Tracker](https://wiki.gnome.org/Projects/Tracker) (Linux) ; +- [Recoll](https://www.lesbonscomptes.com/recoll/index.html.fr) + (Linux, MacOS, Windows) ; +- [Spotlight](https://fr.wikipedia.org/wiki/Spotlight_(moteur_de_recherche)) + (MacOS) ; + +permettent de rechercher le *contenu* des fichiers textes, des +courriels, des fichiers générés par les `traitements de texte` +— c'est-à-dire des fichiers qui contiennent essentiellement du texte, +mais qui sont stockés dans un format type `doc`, `docx`, `odt`, etc qui +ne sont pas des formats texte —, des fichiers `pdf` — quand ceux-ci ne +sont pas des *images* de textes —, mais aussi des +[métadonnées](https://en.wikipedia.org/wiki/Portable_Document_Format#Metadata) +des fichiers `pdf`, etc. + +Les moteurs de recherche de bureau « utilisent des techniques +d'[indexation](https://fr.wikipedia.org/wiki/Indexation_automatique_de_documents) +qui permettent de réduire considérablement les temps de recherche, par +rapport aux fonctions de recherche intégrées par défaut aux systèmes +d'exploitation. Au contraire de ces derniers, ils prennent aussi souvent +en charge les +[métadonnées](https://fr.wikipedia.org/wiki/M%C3%A9tadonn%C3%A9e), et +sont capables de faire une [analyse +syntaxique](https://fr.wikipedia.org/wiki/Analyse_syntaxique) des +fichiers. » (Source : [Moteur de recherche de +bureau](https://fr.wikipedia.org/wiki/Moteur_de_recherche_de_bureau) sur +Wikipédia) + +Comme exemple de « fonctions de recherche intégrées par défaut », on +trouvera sur les systèmes Unix/Linux le programme [grep +](https://fr.wikipedia.org/wiki/Grep)avec lequel nous pouvons chercher +les occurrences du mot « Galilée » dans le répertoire +« RRMOOC » de notre cours sur GitHub (après l'avoir cloné) : + +``` bash +grep -r Galilée +``` + +``` example +PITCHME.md:## Galilée qui observe les lunes de Jupiter +PITCHME.md:Le 7 janvier 1610, Galilée fait une découverte capitale : il remarque trois « petites étoiles » à côté de Jupiter. Après quelques nuits d'observation, il découvre qu'il y en a une quatrième et qu'**elles accompagnent la planète**, c'est ce qu'il note sur son cahier d'observations. Ce sont les satellites visibles de Jupiter, qu'il nommera plus tard les étoiles Médicées ou astres médicéens – en l'honneur de ses protecteurs, la Famille des Médicis – et qui sont aujourd'hui appelés lunes galiléennes. +PITCHME.md:Ces observations amèneront Galilée à rejeter l'hypothèse géocentrique (la terre est le centre de l'Univers et tout tourne autour d'elle) en faveur du système copernicien héliocentrique. Cela l'amènera indirectement (je « fais court ») et bien plus tard, le 22 juin 1633, a être condamné par l'inquisition, ce qui lui vaudra de finir ses jours en résidence surveillée. +PITCHME.md:Remarquez l'avantage des « bouts de papiers classés » de Placcius et Leibniz sur le _codex_ de Galilée : les premiers peuvent être facilement réordonnées. +Notes_module1.org:- [[https://en.wikipedia.org/wiki/Galileo_Galilei][la page wikipedia sur Galilée]] contient de nombreux liens, certains vers ses cahiers de notes ; +Notes_module1.org:Comme exemple de « fonctions de recherche intégrées par défaut » on trouvera sur les systèmes Unix/Linux le programme [[https://fr.wikipedia.org/wiki/Grep][grep ]]avec lequel nous pouvons chercher les occurrences du mot « Galilée » dans le répertoire « RR_MOOC » de notre cours sur GitHub (après l'avoir cloné) : +Notes_module1.org:grep -r Galilée +``` + +Une version plus sophistiquée de `grep` est fournie par le programme +[cgvg](http://uzix.org/cgvg.html). + +Pourquoi des étiquettes +----------------------- + +Une requête basée sur un simple mot renvoie souvent un très grand nombre +de propositions, même si la plupart des moteurs de recherche de bureau +permettent de filtrer ces dernières. Une façon efficace de limiter leur +nombre est d'inclure dans nos documents des étiquettes, c'est-à-dire des +points d'ancrage labelisés, qui seront aisément indexés par le moteur de +recherche de bureau et dont le label ne correspond à aucun mot ou +locution du dictionnaire — nous effectuons ainsi une version simplifiée +du travail de l'*indexeur*, la personne chargée de construire l'index +d'un livre. Pour que l'étiquette garde un sens, il suffit d'encadrer un +mot par une paire de signes de ponctuation comme « : », « ; » ou « ? ». +Un label comme « :code: » sera facilement mémorisé et fera un parfait +équivalent du mot-clé « code » utilisé dans l'exemple du cahier de note +de la deuxième séquence de ce module — pour illustrer la méthode de +Locke. + +Il nous reste encore nous reste encore un détail technique à régler dans +le cas de nos notes prises en format texte comme `Markdown`. En effet, +nous ne souhaitons pas que nos étiquettes apparaissent dans les sorties +`html`, `pdf` ou `docx` de nos notes. Un façon de procéder, pour les +langages de balisage légers qui ne disposent pas d'étiquettes — par +exemple, `Markdown` n'en dispose pas, alors que `org` en a — et de les +inclure dans des commentaires. En `Markdown`, tout ce qui est encadré +par `` est considéré comme un commentaire et ne figure pas +dans les sorties `html` ou `pdf` des notes. Nous pouvons ainsi +utiliser : + +``` example + +``` + +à l'endroit de nos notes où nous souhaitons aller rapidement lorsque que +nous cherchons une information relative à de la programmation +(production de codes). + +Les métadonnées +--------------- + +### Fichiers images + +Nous savons à présent comment rajouter des étiquettes à un fichier au +format texte, mais nous devons souvent aussi travailler avec des +fichiers contenant des images ou des photos, comme les fichiers +[JPEG](https://fr.wikipedia.org/wiki/JPEG) — les appareils photos +numériques utilisent tous ce format —, +[GIF](https://fr.wikipedia.org/wiki/Graphics_Interchange_Format) ou +[PNG](https://fr.wikipedia.org/wiki/Portable_Network_Graphics). La +question se pose alors, peut-on ajouter des étiquettes à nos fichiers +images de sorte que nos moteurs de recherche de bureau les indexent ? La +réponse et oui, grâce aux +[métadonnées](https://fr.wikipedia.org/wiki/M%C3%A9tadonn%C3%A9e) que +contiennent ces fichiers. Les métadonnées, dans ce cas, sont des données +stockées dans le fichier mais qui ne sont pas montrées par le logiciel +de rendu (en tout cas, pas montrées par défaut). Nous savons tous que +ces métadonnées « existent » ; ce sont elles qui contiennent la date, la +localisation GPS, le temps d'exposition, etc. de nos photos numériques. +Dans les fichiers `JPEG`, elles sont stockées suivant l'[exchangeable +image file +format](https://fr.wikipedia.org/wiki/Exchangeable_image_file_format) +(`EXIF`). La plupart des logiciels de manipulations d'images et de +photos permettent d'accéder au contenu des métadonnées et de les +modifier. L'exemple illustré dans le cours utilise une solution très +simple en « ligne de commande », +[ExifTool](http://owl.phy.queensu.ca/~phil/exiftool/) qui permet de +visualiser et de modifier les métadonnées. D'autres logiciels comme +[exiv2](http://www.exiv2.org/index.html) ou +[ImageMagick](https://imagemagick.org/script/index.php) permettent de le +faire (pour ne citer que des logiciels libres disponibles sur Linux, +Windows et MacOS). Certains des éléments du format `EXIF` sont des +chaînes de caractères, c'est-à-dire du texte, que nous somme libres +d'utiliser comme nous le souhaitons ; nous pouvons dès lors les utiliser +pour rajouter nos étiquettes. Nous illustrons dans le cours comment le +faire avec `ExifTool`, mais nous aurions aussi pu le faire avec le +programme +[mogrify](https://www.imagemagick.org/script/command-line-options.php#comment) +d'ImageMagick. Tous les moteurs de recherche de bureau que nous avons +mentionné vont « aller regarder » les métadonnées des fichier `JPEG` +lors de la phase d'indexation et nous permettront ainsi d'exploiter les +étiquettes que nous y aurons insérées. + +`EXIF` n'est pas le seul format de métadonnées existant ; un format plus +récent est l'[Extensible Metadata Platform +](https://fr.wikipedia.org/wiki/Extensible_Metadata_Platform)(`XMP`), +disponible pour un plus grand nombre de formats de fichiers — il n'est +pour l'instant pas lu sur les fichiers `JPEG` par `DocFetcher`, c'est +pourquoi nous avons mis en avant le format `EXIF`, mais cela devrait +évoluer assez vite ; les autres moteurs comme `Tracker` et `Recoll` le +lisent. + +### Fichiers `PDF` + +En plus des fichiers images, nous sommes tous très fréquemment amenés à +travailler avec les fichiers « composites » — contenant textes, images, +et plus — que sont les fichiers +[PDF](https://fr.wikipedia.org/wiki/Portable_Document_Format). Ces +fichiers contiennent eux aussi des métadonnées ; c'est d'ailleurs pour +eux qu'Adobe a initialement introduit le format `XMP` que nous venons de +discuter. Ces métadonnées peuvent être lues et modifiées, en particulier +l'élément `Keywords` (mot-clé) qui peut contenir des chaînes de +caractères de longueur arbitraires et qui est parfait pour accueillir +nos étiquettes. Le programme `ExifTool`, permet de modifier les +métadonnées des fichiers `PDF`. Les moteurs de recherche de bureau que +nous avons mentionnés, vont tous aller lire les métadonnées des fichiers +`PDF` lors de la phase d'indexation. + +### Fichiers audios + +Les formats audio comme le +[mp3](https://fr.wikipedia.org/wiki/MPEG-1/2_Audio_Layer_III) ou le +[ogg](https://fr.wikipedia.org/wiki/Ogg) contiennent eux aussi des +métadonnées, où sont stockés les titres, noms des interprètes, etc ; ces +métadonnées peuvent être modifiées et sont lues par les moteurs de +recherche de bureau lors de la phase d'indexation. diff --git a/module1/ressources/Module1_5_MaterielSupplementaire_fr.org b/module1/ressources/Module1_5_MaterielSupplementaire_fr.org new file mode 100644 index 0000000..a2ce89b --- /dev/null +++ b/module1/ressources/Module1_5_MaterielSupplementaire_fr.org @@ -0,0 +1,112 @@ +#+OPTIONS: ':nil *:t -:t ::t <:t H:3 \n:nil ^:t arch:headline +#+OPTIONS: author:t broken-links:nil c:nil creator:nil +#+OPTIONS: d:(not "LOGBOOK") date:t e:t email:nil f:t inline:t num:t +#+OPTIONS: p:nil pri:nil prop:nil stat:t tags:t tasks:t tex:t +#+OPTIONS: timestamp:t title:t toc:t todo:t |:t +#+TITLE: Ressources pour la séquence 5 du module 1 +#+DATE: <2019-02-21 jeu.> +#+AUTHOR: Christophe Pouzat +#+EMAIL: christophe.pouzat@parisdescartes.fr +#+LANGUAGE: fr +#+SELECT_TAGS: export +#+EXCLUDE_TAGS: noexport +#+CREATOR: Emacs 26.1 (Org mode 9.1.9) +#+STARTUP: indent + +* Notes et références sur la séquence 5 : « Les étiquettes et les logiciels d'indexation pour s'y retrouver » +** La structure de la séquence + +Nous revenons ici sur le problème de l'indexation, pas tant sur l'indexation d'un document unique que sur l'indexation de documents multiples dans des formats divers : +- comme nous l'avons déjà affirmé, prendre des notes abondantes et détaillées n'est utile que si nous pouvons retrouver les informations qu'elles contiennent quand nous en avons besoin ; +- pour des notes contenues dans un seul fichier texte, la fonction de recherche de notre éditeur favori nous permet généralement d'aller assez loin ; +- pour des notes manuscrites contenues dans un cahier, la méthode de Locke — que nous avons exposée dans notre deuxième séquence — et qui repose sur des mots clé ou étiquettes, donne de bons résultats ; +- les notes manuscrites sur fiches sont généralement stockées dans un meuble dont la structure matérialise un index — comme l'armoire de Placcius et Leibniz — ; +- mais nous voulons ici aller plus loin, dans le cadre restreint des « notes » numérisées, en discutant de l'indexation de fichiers multiples qu'ils soient au format « texte » où dans d'autres format comme les images =jpg= où les fichier =pdf= ; +- cela nous amménera à introduire les « moteurs de recherche de bureau » et à expliquer comment des =étiquettes= ou =mots-clés= peuvent être ajoutés à nos fichiers. + +** La citation de Leibniz +J'ai trouvé la citation introductive : + +« Il me semble que l'apparat savant contemporain est comparable à un grand magasin qui contient une grande quantité de produits, stockés de façon totalement désordonnée, mélangée ; où les nombres ou lettres d'indexation manquent ; où les inventaires et livres de comptes pouvant aider à ordonner le contenu ont disparus. + +Plus grande est la quantité d'objets amassés, plus petite est leur utilité. Ainsi, ne devrions nous pas seulement essayer de rassembler de nouveaux objets de toutes provenances, mais nous devrions aussi essayer d'ordonner ceux que nous avons déjà. » + +sur le site [[http://www.backwordsindexing.com/index.html]], c'est donc une traduction de traduction. J'emploie ici le terme volontairement anachronique d'« [apparat savant](https://fr.wikipedia.org/wiki/Apparat_savant) » qui est un terme technique de l'édition désignant : citations, références et sources, notes en bas de pages, introduction, texte en langue originale (en parallèle avec la traduction), commentaire historique ou philologique, index fontium (les sources), index locorum (références avec renvoi à la page où le passage est cité ou mentionné, par ex. : Évangile selon Marc 1, 1 : p. 100), index nominum (les noms propres), index rerum (les thèmes), etc. La référence au « grand magasin » est, elle aussi anachronique ! + +Leibniz a, pendant une bonne partie de sa vie, « gagné celle-ci » comme [[https://www.reseau-canope.fr/savoirscdi/societe-de-linformation/le-monde-du-livre-et-des-medias/histoire-du-livre-et-de-la-documentation/biographies/leibniz-le-bibliothecaire.html][bibliothécaire]], ce qui explique en partie sont intérêt très poussé pour les questions de classifications, d'indexations, etc. + +** Rechercher avec un éditeur de texte + +La diapo correspondante rappelle juste au lecteur quelque chose qu'il sait déjà et qui est vue, par les gens qui passent des notes « papier » aux notes « numériques », comme le gros attrait du numérique. + +Les gens de monde Unix/Linux connaissent aussi généralement le programme [[https://fr.wikipedia.org/wiki/Grep][grep]] qui permet de faire des recherches de mots et, plus généralement d'[[https://fr.wikipedia.org/wiki/Expression_r%C3%A9guli%C3%A8re][expressions régulières]], sur un ou /plusieurs/ fichiers ; nous y reviendrons. + +** Recherche avec index construit « à la main » sur des cahiers de notes + +Là encore, il s'agit juste d'un rappel pour les lecteurs assidus de ce cours ; à ce stade se sont des experts dans la méthode d'indexation de Locke. + +** Recherche avec index « matérialisés » + +Encore un rappel pour les lecteurs. + +** Vers les outils « sophistiqués » de l'informatique + +- les techniques que nous venons de voir ou revoir ne fonctionnent que pour un seul « document » — recherche avec l'éditeur de texte, index d'un cahier — et/ou pour un seul type de document ; +- les outils informatiques dont nous disposons nous permettent d'aller plus loin dans l'indexation des fichiers numériques ; +- il est possible de rajouter des étiquettes ou mots-clés à des fichiers textes comme à des fichiers images (`jpg`, `png`) ou des fichiers « mixtes » (`pdf`) grâce aux métadonnées qu'ils contiennent ; +- les moteurs de recherche de bureau permettent d'indexer l'ensemble des fichiers textes d'une arborescence donnée mais aussi les métadonnées des autres fichiers. + +** Les moteurs de recherche de bureau + +Les moteurs de recherche de bureau comme : +- [[http://docfetcher.sourceforge.net/fr/index.html][DocFetcher]] (Linux, MacOS, Windows) ; +- [[https://wiki.gnome.org/Projects/Tracker][Tracker]] (Linux) ; +- [[https://www.lesbonscomptes.com/recoll/index.html.fr][Recoll]] (Linux, MacOS, Windows) ; +- [[https://fr.wikipedia.org/wiki/Spotlight_(moteur_de_recherche)][Spotlight]] (MacOS) ; +permettent de rechercher le /contenu/ des fichiers textes, des courriels, des fichiers générés par les =traitements de texte= — c'est-à-dire des fichiers qui contiennent essentiellement du texte, mais qui sont stockés dans un format type =doc=, =docx=, =odt=, etc qui ne sont pas des formats texte —, des fichiers =pdf= — quand ceux-ci ne sont pas des /images/ de textes —, mais aussi des [[https://en.wikipedia.org/wiki/Portable_Document_Format#Metadata][métadonnées]] des fichiers =pdf=, etc. + +Les moteurs de recherche de bureau « utilisent des techniques d'[[https://fr.wikipedia.org/wiki/Indexation_automatique_de_documents][indexation]] qui permettent de réduire considérablement les temps de recherche, par rapport aux fonctions de recherche intégrées par défaut aux systèmes d'exploitation. Au contraire de ces derniers, ils prennent aussi souvent en charge les [[https://fr.wikipedia.org/wiki/M%C3%A9tadonn%C3%A9e][métadonnées]], et sont capables de faire une [[https://fr.wikipedia.org/wiki/Analyse_syntaxique][analyse syntaxique]] des fichiers. » (Source : [[https://fr.wikipedia.org/wiki/Moteur_de_recherche_de_bureau][Moteur de recherche de bureau]] sur Wikipédia) + +Comme exemple de « fonctions de recherche intégrées par défaut », on trouvera sur les systèmes Unix/Linux le programme [[https://fr.wikipedia.org/wiki/Grep][grep ]]avec lequel nous pouvons chercher les occurrences du mot « Galilée » dans le répertoire « RR_MOOC » de notre cours sur GitHub (après l'avoir cloné) : + +#+NAME: grep-Leibniz-RR_MOOC +#+BEGIN_SRC sh :results output :exports both +grep -r Galilée +#+END_SRC + +#+RESULTS: grep-Leibniz-RR_MOOC +: PITCHME.md:## Galilée qui observe les lunes de Jupiter +: PITCHME.md:Le 7 janvier 1610, Galilée fait une découverte capitale : il remarque trois « petites étoiles » à côté de Jupiter. Après quelques nuits d'observation, il découvre qu'il y en a une quatrième et qu'**elles accompagnent la planète**, c'est ce qu'il note sur son cahier d'observations. Ce sont les satellites visibles de Jupiter, qu'il nommera plus tard les étoiles Médicées ou astres médicéens – en l'honneur de ses protecteurs, la Famille des Médicis – et qui sont aujourd'hui appelés lunes galiléennes. +: PITCHME.md:Ces observations amèneront Galilée à rejeter l'hypothèse géocentrique (la terre est le centre de l'Univers et tout tourne autour d'elle) en faveur du système copernicien héliocentrique. Cela l'amènera indirectement (je « fais court ») et bien plus tard, le 22 juin 1633, a être condamné par l'inquisition, ce qui lui vaudra de finir ses jours en résidence surveillée. +: PITCHME.md:Remarquez l'avantage des « bouts de papiers classés » de Placcius et Leibniz sur le _codex_ de Galilée : les premiers peuvent être facilement réordonnées. +: Notes_module1.org:- [[https://en.wikipedia.org/wiki/Galileo_Galilei][la page wikipedia sur Galilée]] contient de nombreux liens, certains vers ses cahiers de notes ; +: Notes_module1.org:Comme exemple de « fonctions de recherche intégrées par défaut » on trouvera sur les systèmes Unix/Linux le programme [[https://fr.wikipedia.org/wiki/Grep][grep ]]avec lequel nous pouvons chercher les occurrences du mot « Galilée » dans le répertoire « RR_MOOC » de notre cours sur GitHub (après l'avoir cloné) : +: Notes_module1.org:grep -r Galilée + +Une version plus sophistiquée de =grep= est fournie par le programme [[http://uzix.org/cgvg.html][cgvg]]. + + +** Pourquoi des étiquettes + +Une requête basée sur un simple mot renvoie souvent un très grand nombre de propositions, même si la plupart des moteurs de recherche de bureau permettent de filtrer ces dernières. Une façon efficace de limiter leur nombre est d'inclure dans nos documents des étiquettes, c'est-à-dire des points d'ancrage labelisés, qui seront aisément indexés par le moteur de recherche de bureau et dont le label ne correspond à aucun mot ou locution du dictionnaire — nous effectuons ainsi une version simplifiée du travail de l'/indexeur/, la personne chargée de construire l'index d'un livre. Pour que l'étiquette garde un sens, il suffit d'encadrer un mot par une paire de signes de ponctuation comme « : », « ; » ou « ? ». Un label comme « :code: » sera facilement mémorisé et fera un parfait équivalent du mot-clé « code » utilisé dans l'exemple du cahier de note de la deuxième séquence de ce module — pour illustrer la méthode de Locke. + +Il nous reste encore nous reste encore un détail technique à régler dans le cas de nos notes prises en format texte comme =Markdown=. En effet, nous ne souhaitons pas que nos étiquettes apparaissent dans les sorties =html=, =pdf= ou =docx= de nos notes. Un façon de procéder, pour les langages de balisage légers qui ne disposent pas d'étiquettes — par exemple, =Markdown= n'en dispose pas, alors que =org= en a — et de les inclure dans des commentaires. En =Markdown=, tout ce qui est encadré par == est considéré comme un commentaire et ne figure pas dans les sorties =html= ou =pdf= des notes. Nous pouvons ainsi utiliser : + +#+BEGIN_EXAMPLE + +#+END_EXAMPLE + +à l'endroit de nos notes où nous souhaitons aller rapidement lorsque que nous cherchons une information relative à de la programmation (production de codes). + +** Les métadonnées + +*** Fichiers images +Nous savons à présent comment rajouter des étiquettes à un fichier au format texte, mais nous devons souvent aussi travailler avec des fichiers contenant des images ou des photos, comme les fichiers [[https://fr.wikipedia.org/wiki/JPEG][JPEG]] — les appareils photos numériques utilisent tous ce format —, [[https://fr.wikipedia.org/wiki/Graphics_Interchange_Format][GIF]] ou [[https://fr.wikipedia.org/wiki/Portable_Network_Graphics][PNG]]. La question se pose alors, peut-on ajouter des étiquettes à nos fichiers images de sorte que nos moteurs de recherche de bureau les indexent ? La réponse et oui, grâce aux [[https://fr.wikipedia.org/wiki/M%C3%A9tadonn%C3%A9e][métadonnées]] que contiennent ces fichiers. Les métadonnées, dans ce cas, sont des données stockées dans le fichier mais qui ne sont pas montrées par le logiciel de rendu (en tout cas, pas montrées par défaut). Nous savons tous que ces métadonnées « existent » ; ce sont elles qui contiennent la date, la localisation GPS, le temps d'exposition, etc. de nos photos numériques. Dans les fichiers =JPEG=, elles sont stockées suivant l'[[https://fr.wikipedia.org/wiki/Exchangeable_image_file_format][exchangeable image file format]] (=EXIF=). La plupart des logiciels de manipulations d'images et de photos permettent d'accéder au contenu des métadonnées et de les modifier. L'exemple illustré dans le cours utilise une solution très simple en « ligne de commande », [[http://owl.phy.queensu.ca/~phil/exiftool/][ExifTool]] qui permet de visualiser et de modifier les métadonnées. D'autres logiciels comme [[http://www.exiv2.org/index.html][exiv2]] ou [[https://imagemagick.org/script/index.php][ImageMagick]] permettent de le faire (pour ne citer que des logiciels libres disponibles sur Linux, Windows et MacOS). Certains des éléments du format =EXIF= sont des chaînes de caractères, c'est-à-dire du texte, que nous somme libres d'utiliser comme nous le souhaitons ; nous pouvons dès lors les utiliser pour rajouter nos étiquettes. Nous illustrons dans le cours comment le faire avec =ExifTool=, mais nous aurions aussi pu le faire avec le programme [[https://www.imagemagick.org/script/command-line-options.php#comment][mogrify]] d'ImageMagick. Tous les moteurs de recherche de bureau que nous avons mentionné vont « aller regarder » les métadonnées des fichier =JPEG= lors de la phase d'indexation et nous permettront ainsi d'exploiter les étiquettes que nous y aurons insérées. + +=EXIF= n'est pas le seul format de métadonnées existant ; un format plus récent est l'[[https://fr.wikipedia.org/wiki/Extensible_Metadata_Platform][Extensible Metadata Platform ]](=XMP=), disponible pour un plus grand nombre de formats de fichiers — il n'est pour l'instant pas lu sur les fichiers =JPEG= par =DocFetcher=, c'est pourquoi nous avons mis en avant le format =EXIF=, mais cela devrait évoluer assez vite ; les autres moteurs comme =Tracker= et =Recoll= le lisent. + +*** Fichiers =PDF= +En plus des fichiers images, nous sommes tous très fréquemment amenés à travailler avec les fichiers « composites » — contenant textes, images, et plus — que sont les fichiers [[https://fr.wikipedia.org/wiki/Portable_Document_Format][PDF]]. Ces fichiers contiennent eux aussi des métadonnées ; c'est d'ailleurs pour eux qu'Adobe a initialement introduit le format =XMP= que nous venons de discuter. Ces métadonnées peuvent être lues et modifiées, en particulier l'élément =Keywords= (mot-clé) qui peut contenir des chaînes de caractères de longueur arbitraires et qui est parfait pour accueillir nos étiquettes. Le programme =ExifTool=, permet de modifier les métadonnées des fichiers =PDF=. Les moteurs de recherche de bureau que nous avons mentionnés, vont tous aller lire les métadonnées des fichiers =PDF= lors de la phase d'indexation. + +*** Fichiers audios +Les formats audio comme le [[https://fr.wikipedia.org/wiki/MPEG-1/2_Audio_Layer_III][mp3]] ou le [[https://fr.wikipedia.org/wiki/Ogg][ogg]] contiennent eux aussi des métadonnées, où sont stockés les titres, noms des interprètes, etc ; ces métadonnées peuvent être modifiées et sont lues par les moteurs de recherche de bureau lors de la phase d'indexation. -- 2.18.1