15. Conversion de textes et tableaux existants en HTML

Conversion de textes

Pour la conversion de documents existants en HTML il existe des programmes de conversion qui nous facilitent énormément la tâche. Nous essaierons ici, de donner quelques indications sur le principe de fonctionnement du programme rtfToHTML qui permet la conversion en format HTML de fichiers préparés avec un logiciel de traitement de texte. Pour une description détaillée de ce programme et de son fonctionnement, le lecteur est prié de se référer aux URLs indiqués plus bas.

Nous discuterons essentiellement ici du programme rtfToHTML puisqu'il est du domaine public et qu'il est disponible sur la plupart des plateformes informatiques. Il existe d'autres solutions qui ne sont pas aussi générales. Pour un inventaire de celles-ci, il est possible de contacter le WWW FAQ.

Une affaire de correspondance

Tout d'abord, pour convertir un document produit avec un traitement de texte en format HTML il faut nécessairement que le fichier d'origine contiennent des annotations. En effet, le programme de conversion ne peut "inventer" ou deviner ce que l'auteur veut obtenir comme produit final.

Pour traiter un texte, les programmes de conversion comme rtfToHTML utilisent un tableau de correspondance entre les styles de caractère (gras, souligné, italique etc.) ou de paragraphe (titre, entête, corps, etc) et une annotation HTML. Si un style défini dans le document de traitement de texte ne se retrouve pas dans le tableau de correspondance, le logiciel de conversion ne saura pas quoi en faire.

Par exemple, dans le programme rtfToHTML, le contenu d'un paragraphe de style "heading 1" sera annoté en "<H1>" dans le document html, celui de style "heading 2" en "<h2>" etc. Évidemment, si un paragraphe a le style "entete 1" le programme de converson ne l'annotera pas à moins que vous ayez préalablement édité le tableau de conversion. Voici un extrait du fichier d'équivalences de rtftoHTML (html-trans) qui accompagne l'application:


"heading 1",0,"h1"

"Heading 1",0,"h1"

"heading 2",0,"h2"

"Heading 2",0,"h2"

"heading 3",0,"h3"

"Heading 3",0,"h3"

"heading 4",0,"h4"

"Heading 4",0,"h4"

"heading 5",0,"h5"

"Heading 5",0,"h5"

"heading 6",0,"h6"

"Heading 6",0,"h6"

En résumé, il est essentiel, si on veut obtenir un résultat probant, que le document produit avec un traitement de texte soit formaté en utilisant les styles de paragraphes. De plus, il faut que ces styles soient définis dans le tableau de conversion du logiciel. Naturellement, le programme rtfToHTML assume une nomenclature anglaise pour les styles de paragraphes ce qui nous oblige à faire très attention à la nomenclature de styles utilisée.

Des textes riches

Comme son nom l'indique, le programme rtfToHTML ne décode et donc ne converti que les documents qui sont en format "rich text" ou rtf. Il faut donc enrégistrer le document que l'on désire convertir en format RTF avant de le soumettre au programme de conversion. Le format "rich text" utilise le jeu de caractères US-ASCII et peut donc être lu par un simple éditeur de texte. De plus, le format RTF est supporté par tous les principaux logiciels de traitement de texte ce qui implique que vous pouvez utiliser le logiciel de conversion de façon universelle.

Une table des matières plus dynamique

Le programme rtfToHTML supporte les annotations HTML 2.0 de base. De plus, si une table des matières est présente dans le document, rtfToHTML produira un document HTML distinct contenant la table des matières et des pointeurs de type <A HREF #?> à des sections d'un deuxième document HTML contenant, celui-là, le corps du document et des annotations de type <A NAME= ?>.

Des images presque parfaites

Le programme rtfToHTML reconnaît les images contenues dans le document source et insère des pointeurs de type IMAGE référant à des fichiers de type GIF dans le document de sortie. Le programme produit même une série de fichiers d'images dans le format natif de la plateforme informatique utilisée (p. ex: pict ou bmp) qu'il faut ensuite convertir en gif au moyen d'un tiers programme.

En résumé

Le programme rtfToHTML est un outil relativement puissant qui permet de convertir en format HTML des documents produits avec des logiciels de traitement de texte. Lorsque le document de départ est formaté selon les règles de l'art, le résultat peut être très satisfaisant. À partir d'un document statique conçu pour être imprimé sur papier, on se retrouve avec un document hypertexte dans lequel on peut naviguer et visualiser des images en couleur.

Évidemment, ce ne sont pas tous les documents qui ont avantage à être converti en format hypertexte. De plus, si on veut vraiment tirer profit du HTML, on doit souvent "éditer" le fichier produit par le programme de conversion et comme le processus de conversion n'est pas vraiment réversible...

Conversion de tableaux

Depuis quelques mois, on retrouve une macro EXCEL (fonctionnant sur version 5.0) qui permet de traduire directement un tableau excel en fichier html. Cette macro se nomme xl2html.xls et est disponible à l'URL suivant: Exceltohtml. L'auteur s'appelle Jordan Evans et la macro est un gratuitiel.

Pour convertir un fichier excel en tableau html, il suffit d'entrer les données dans un tableau excel, de sélectionner ensuite la zone et de lancer la macro. Celle-ci vous demandera ensuite quelques questions par rapport au titre, à l'entête et aux commentaires en bas de page. Vous pouvez laisser des champs en blanc. Une fois la macro lancée, elle fabriquera le fichier que vous pourrez éditer dans votre éditeur html préféré.

Références

Chapitre suivant
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20
Retour à la page principale