10 raisons de préférer les fichiers texte aux fichiers binaires

Les fichiers sources au format texte offrent de nombreux avantages par rapport aux fichiers binaires, surtout lorsqu’ils reposent sur des formats structurés.

Les fichiers binaires de type .doc ne peuvent être lus et modifiés qu’avec l’application qui les a générés. Ils sont donc opaques. Les fichiers texte peuvent être modifiés à l’aide d’une multitude d’outils, graphiques ou non. Il sont donc transparents. Voici 10 raisons de les préférer aux fichiers binaires.

Raison n° 1 : les fichiers texte vous laissent la liberté de l’outil

Un fichier texte peut être modifié avec une multitude d’outils en mode graphique ou texte (c’est la moindre des choses). Un fichier DITA XML peut par exemple être modifié avec XMetal, XML Mind Editor, ou Emacs, SciTE et j’en passe.

Raison n° 2 : les fichiers texte vous garantissent d’avoir toujours accès à vos données

Corollaire de la raison n° 1, vous aurez toujours la maîtrise de vos données, même si l’éditeur fournissant l’application vous ayant servi à créer vos documents venait à changer d’activité et à fournir des abris de jardin au lieu de logiciels.

Les fichiers binaires sont des contenants opaques.

Raison n° 3 : les fichiers texte facilitent la recherche en texte libre

Si vous vous demandez dans quels fichiers XML vous pouvez bien avoir écrit thixotropie un jour d’ivresse, grep est votre ami :

grep -lri thixotropie *.xml

affiche en un clin d’œil les fichiers fautifs.

(Tous les exemples de cet article se réfèrent à la ligne de commande Bash de GNU/Linux, mais vous pouvez faire la même chose sous d’autres environnements, également avec des outils graphiques.)

Raison n° 4 : les fichiers texte aiment les expressions rationnelles

Comment extraire toutes les adresses email de vos 10 000 fichiers DITA XML ? Les expressions rationnelles (ou expressions régulières) sont là pour vous aider. Inutile de dire qu’elles sont difficiles à appliquer à des fichiers binaires…

Raison n° 5 : les projets utilisant des fichiers texte sont plus faciles à gérer

Les fichiers texte sont fort bien gérés par les logiciels de gestion de versions de type Subversion (qui ont été créés pour eux, en fait). Vous pouvez regrouper tous vos projets sous un même référentiel et conserver tout l’historique nominatif des modifications. Vous pouvez également figer les versions par création d’un simple libellé (tag) et créer des branches pour créer un nouveau projet à partir d’un projet existant. Si vous voulez recréer vos documents tels qu’ils se présentaient le 10 octobre 2007, par exemple, il vous suffit d’extraire la version correspondante. Vous pourrez alors créer un nouveau projet, différent du premier, à partir de cette version, si besoin est.

Raison n° 6 : vous pouvez modifier des milliers de fichiers texte en une seule opération

Imaginons que vous souhaitiez remplacer dans 10 000 fichiers XML toutes les occurrences du terme ghât par kymris (comme je vous comprends…), il suffit d’entrer par exemple :

perl -pi -e "s/ghât/kymris/g;" *.xml

Les fichiers texte sont des contenants transparents.

Raison n° 7 : vous pouvez modifier des informations de structure de milliers de fichiers texte en une seule opération

Plus fort encore : vous pouvez également modifier les informations de structuration des fichiers. Si vous voulez remplacer toutes les introductions par des prérequis dans les 10 000 fichiers susdits, vous appliquez les commandes suivantes :

perl -pi -e "s/<context>/<prereq>/g;" *.xml
perl -pi -e "s/<\/context>/<\/prereq>/g;" *.xml

Vous avez bien sûr committé auparavant vos fichiers sous le logiciel de gestion de version et vérifié que votre projet compilait bien avant de le committer à nouveau. Ce type de commande est extrêmement puissant, donc extrêmement dangereux, et, si vous n’y prenez pas garde, vous pouvez réduire à néant des mois de travail en une fraction de seconde ! (Imaginons que vous remplaciez tous les e par des a : comment revenez-vous en arrière ?)

Raison n° 8 : les projets en fichiers texte sont moins volumineux

À chaque nouvelle version d’un document en mode binaire correspond un nouveau fichier dont le volume s’ajoute aux précédents. Si vous gérez des fichiers texte sous un logiciel de gestion de versions, seul le contenu réellement différent (mots ou balises) sera effectivement enregistré sous ce logiciel, ce qui réduit fortement le poids total en octets du projet.

Raison n° 9 : les fichiers texte favorisent le travail collaboratif

Si vous gérez des fichiers texte sous un logiciel de gestion de versions, plusieurs personnes peuvent travailler en même temps sur les mêmes fichiers. Par exemple, un rédacteur technique peut modifier les procédures contenues dans un fichier DITA XML de type task, tandis qu’un autre en modifiera les prérequis. Le logiciel de gestion de versions se chargera de fusionner les modifications après qu’ils auront committé leur instance du fichier.

Les fichiers texte vous laissent zoomer sur vos données.

Raison n° 10 : les fichiers texte séparent mieux le fond de la forme

Ce n’est pas le cas de tous les fichiers texte, mais les formats structurés de type DocBook et DITA XML ont le bon goût de clairement distinguer le fond de la forme. Simples à créer et à modifier, ils délèguent toute la mise en page à une feuille de style et à une chaîne de publication, laissant le rédacteur marketing et technique se consacrer à ce qu’il sait faire le mieux : transmettre efficacement une information technique au public visé.

Raison n° 11 : les fichiers texte sont volontiers modulaires

10 raisons ne suffisent pas à épuiser les avantages des fichiers texte. En outre, ils se prêtent facilement à la création de documents modulaires, chose que les logiciels utilisant des formats binaires font très mal.





Commentaires

C'est un remake à la sauce VCS/XML de www.textfiles.com/100/whytext.oct ?

Ah, tiens, ce texte manquait à ma culture, merci ! Cela dit son auteur ne serait que partiellement d’accord avec moi, puisque je ne défends les fichiers texte que du côté du format source. Le fichier cible proposé au public est souvent compilé, comme le PDF, par exemple. J’ai corrigé l’intro de l’article pour être plus précis sur ce point.

Ajouter un commentaire

Plain text

  • Aucune balise HTML autorisée.
  • Les adresses de pages web et de courriels sont transformées en liens automatiquement.
  • Les lignes et les paragraphes vont à la ligne automatiquement.
CAPTCHA
Si vous êtes un robot, ne remplissez pas ce champ.
12 + 1 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.