---
TITLE: Ressources pour la séquence 3 du module 1
AUTHOR: Christophe Pouzat
---\n
broken-links:nil c:nil creator:nil
Notes et références sur la séquence 3 : « Du fichier texte au langage de balisage léger »
=========================================================================================
Fichier texte et éditeur de texte
---------------------------------
Une définition plus technique (et moins circulaire !) du fichier texte
se trouve sur [la page
wikipédia](https://fr.wikipedia.org/wiki/Fichier_texte) consacrée au
sujet. Pour plus de détails sur les éditeurs de texte, voir aussi la
[page wikipédia
correspondante](https://fr.wikipedia.org/wiki/%C3%89diteur_de_texte).
Un logiciel de « [traitement de
texte](https://fr.wikipedia.org/wiki/Traitement_de_texte) » est plus
sophistiqué qu'un simple éditeur de texte ; il permet de faire plus, ce
qui sous entend qu'il peut aussi ouvrir et manipuler des fichiers
textes.
\*Attention\* : le format « natif » des traitements de texte est
rarement un format texte. Les fichiers `doc` et `docx` de `Word` et
`odt` de `LibreOffice` *ne sont pas des fichiers textes*.
Le cas du fichier `PDF` ouvert avec un éditeur de texte
-------------------------------------------------------
Dans le cours filmé, j'utilise l'exemple du
[PDF](https://en.wikipedia.org/wiki/Portable_Document_Format) — je donne
l'adresse de la page wikipedia en anglais, bien plus complète que celle
en français — ouvert avec un éditeur de texte pour montrer que le
fichier ne peut pas être visualisé avec un tel logiciel, il faut un
logiciel de rendu dédié comme `Adobe Reader`, `Evince`, `MuPDF`,
`Aperçu`,… Vous remarquez néanmoins que le début du fichier contient du
texte (la première ligne nous apprend que le fichier utilise la version
1.3 du format `PDF`). Cette partie au format texte du fichier contient
les méta-données — qui ne sont pas montrées, en tout cas pas
directement, par les logiciels de rendu. Ces méta-données sont (en
partie) au format
[XMP](https://en.wikipedia.org/wiki/Extensible_Metadata_Platform)
(*Extensible Metadata Platform*), nous y reviendrons dans la cinquème
séquence.
Sur l'UTF-8
-----------
Une table des symboles UTF-8, avec leur code se trouve à l'adresse :
. C'est pratique pour insérer un symbole
pas très courant comme la lettre « TLO » : Ꮰ de la langue cherokee, ou
le symbole mathématique ∀, « pour tout ».
Pour ceux qui doivent souvent utiliser des lettres grecs (par exemple
pour écrire des équations), il est possible sous Linux de (re)définir
des combinaisons de touches pour générer directement les dites lettres.
Ces combinaisons sont définies dans le fichier `.XCompose`, le début de
mon fichier contient :
``` example
# On charge la base de donnée de Compose la plus complète en UTF-8
include "/usr/share/X11/locale/en_US.UTF-8/Compose"
# espace insécable fine
: " " U202F
# Lettres greques
: "α" Greek_alpha
: "Α" Greek_ALPHA
: "β" Greek_beta
: "Β" Greek_BETA
: "γ" Greek_gamma
: "Γ" Greek_GAMMA
: "δ" Greek_delta
: "Δ" Greek_DELTA
: "ε" Greek_epsilon
: "Ε" Greek_EPSILON
: "ζ" Greek_zeta
: "Ζ" Greek_ZETA
: "η" Greek_eta
```
J'ai en plus redéfini la « \key\> » pour qu'elle
corresponde à la touche « impression d'écran » de mon clavier. Pour
apprendre à redéfinir des touches, consultez :
.