# Table des matières 1. [Notes et références sur la séquence 3 : « Du fichier texte au langage de balisage léger »](#org736edbb) 1. [Fichier texte et éditeur de texte](#org0b71038) 2. [Le cas du fichier `PDF` ouvert avec un éditeur de texte](#orgeaa3b7b) 3. [Sur l'UTF-8](#orgac295bd) # Notes et références sur la séquence 3 : « Du fichier texte au langage de balisage léger » ## Fichier texte et éditeur de texte Une définition plus technique (et moins circulaire !) du fichier texte se trouve sur [la page wikipédia](https://fr.wikipedia.org/wiki/Fichier_texte) consacrée au sujet. Pour plus de détails sur les éditeurs de texte, voir aussi la [page wikipédia correspondante](https://fr.wikipedia.org/wiki/%C3%89diteur_de_texte). Un logiciel de « [traitement de texte](https://fr.wikipedia.org/wiki/Traitement_de_texte) » est plus sophistiqué qu'un simple éditeur de texte ; il permet de faire plus, ce qui sous entend qu'il peut aussi ouvrir et manipuler des fichiers textes. \*Attention\* : le format « natif » des traitements de texte est rarement un format texte. Les fichiers `doc` et `docx` de `Word` et `odt` de `LibreOffice` *ne sont pas des fichiers textes*. ## Le cas du fichier `PDF` ouvert avec un éditeur de texte Dans le cours filmé, j'utilise l'exemple du [PDF](https://en.wikipedia.org/wiki/Portable_Document_Format) — je donne l'adresse de la page wikipedia en anglais, bien plus complète que celle en français — ouvert avec un éditeur de texte pour montrer que le fichier ne peut pas être visualisé avec un tel logiciel, il faut un logiciel de rendu dédié comme `Adobe Reader`, `Evince`, `MuPDF`, `Aperçu`,… Vous remarquez néanmoins que le début du fichier contient du texte (la première ligne nous apprend que le fichier utilise la version 1.3 du format `PDF`). Cette partie au format texte du fichier contient les méta-données — qui ne sont pas montrées, en tout cas pas directement, par les logiciels de rendu. Ces méta-données sont (en partie) au format [XMP](https://en.wikipedia.org/wiki/Extensible_Metadata_Platform) (*Extensible Metadata Platform*), nous y reviendrons dans la cinquème séquence. ## Sur l'UTF-8 Une table des symboles UTF-8, avec leur code se trouve à l'adresse : . C'est pratique pour insérer un symbole pas très courant comme la lettre « TLO » : Ꮰ de la langue cherokee, ou le symbole mathématique ∀, « pour tout ». Pour ceux qui doivent souvent utiliser des lettres grecs (par exemple pour écrire des équations), il est possible sous Linux de (re)définir des combinaisons de touches pour générer directement les dites lettres. Ces combinaisons sont définies dans le fichier `.XCompose`, le début de mon fichier contient : # On charge la base de donnée de Compose la plus complète en UTF-8 include "/usr/share/X11/locale/en_US.UTF-8/Compose" # espace insécable fine : " " U202F # Lettres greques : "α" Greek_alpha : "Α" Greek_ALPHA : "β" Greek_beta : "Β" Greek_BETA : "γ" Greek_gamma : "Γ" Greek_GAMMA : "δ" Greek_delta : "Δ" Greek_DELTA : "ε" Greek_epsilon : "Ε" Greek_EPSILON : "ζ" Greek_zeta : "Ζ" Greek_ZETA : "η" Greek_eta J'ai en plus redéfini la « key> » pour qu'elle corresponde à la touche « impression d'écran » de mon clavier. Pour apprendre à redéfinir des touches, consultez : .