From c13ddae1eba1fc8651f26446f3986a6cfe74dc90 Mon Sep 17 00:00:00 2001 From: 30a25558637cb46af376f3f831fa6cec <30a25558637cb46af376f3f831fa6cec@app-learninglab.inria.fr> Date: Fri, 3 Apr 2020 14:11:18 +0000 Subject: [PATCH] Update logbook.md --- journal/logbook.md | 38 ++++++++++++++++++++++++++++++++++++++ 1 file changed, 38 insertions(+) diff --git a/journal/logbook.md b/journal/logbook.md index 71e6421..10fea47 100644 --- a/journal/logbook.md +++ b/journal/logbook.md @@ -6,9 +6,47 @@ Semaine du 23 au 27 mars : env. 3h passées 03/04/2020 - Création du journal de bord et fin du module 1 Semaine du 30 mars au 3 avril : env. 3-4h passées +# Extraits de cours +## La TEI (Text Encoding Initiative), un vocabulaire et des spécifications pour une analyse textuelle transparente +[Voir cours complet](https://www.fun-mooc.fr/courses/course-v1:inria+41016+self-paced/courseware/2bfe60a86fed4994b5493a220c38eb69/13f6fd96266746a0bd9d717a12f1f835/) +** La TEI en pratique + +Bernard et Bohet définissent ainsi la TEI (Bernard and Bohet 2017) : "Il +s'agit d'un balisage s'appuyant sur le langage XML et qui se présente +comme un dictionnaire de balises couvrant à peu près toutes les +situations". Il s'agit de permettre à une machine de lire ces données. + +La TEI permet d'*introduire dans le texte des informations allant bien +au-delà des éléments formels* comme le montre +[[https://fr.wikipedia.org/wiki/Text_Encoding_Initiative][ce comparatif +tiré de Wikipédia]] entre d'une part, un encodage en HTML, où l'on prend +en compte uniquement les aspects de présentation, et d'autre part, un +encodage en TEI, où l'on peut introduire des informations sur les +personnages, la versification des éléments. + +Le travail s'effectue sur des données numériques ; si les données sont +issues d'une numérisation, elles doivent au préalable être traitées avec +un logiciel de reconnaissance optique des caractères (OCR) (Humanum +2015). + +Il existe des *éditeurs* tels que +[[https://framalibre.org/content/xml-copy-editor][XML Copy Editor]]. +Certains logiciels incluent un *convertisseur* ; on peut citer : +- le [[http://textometrie.ens-lyon.fr/spip.php?rubrique96][logiciel TXM]] +- le [[http://obvil.sorbonne-universite.site/developpements/odette][logiciel Odette]] permet de passer d'un document en traitement de texte à des +données en XML/TEI + +Exemple de texte encodé : Oscar Wilde. /The Importance of Being Earnest/ +[[https://teibyexample.org/examples/TBED05v00.htm?target=wilde][disponible +sur le site web TEI by example]] + + # Liens remarquables Entretien avec Marie-Noëlle Bourguet sur le carnet d'Alexandre de Humboldt : [version longue](https://www.youtube.com/watch?v=nWAPUP5zP7I&feature=youtu.be) - [version courte](https://www.fun-mooc.fr/courses/course-v1:inria+41016+self-paced/courseware/2bfe60a86fed4994b5493a220c38eb69/70128091282c4f688523983a4b08d151/) [Markdown et Pandoc](https://enacit.epfl.ch/cours/markdown-pandoc/#editeurs_markdown) [Formatage simple de texte avec Markdown](https://support.zendesk.com/hc/fr/articles/203691016-Formatage-de-texte-avec-Markdown#topic_xqx_mvc_43__row_xww_xln_1n) + +# Divers +Une idée de livre à découvrir : « L'île des pingouins » d'Anatole France -- 2.18.1