15. Conversion de textes et tableaux existants en HTML
Pour la conversion de documents existants en HTML il existe des programmes de conversion
qui nous facilitent énormément la tâche.
Nous essaierons ici, de donner quelques indications sur le principe de
fonctionnement du programme rtfToHTML qui permet la conversion en format HTML de fichiers
préparés avec un logiciel de traitement de texte. Pour une description détaillée de ce programme
et de son fonctionnement, le lecteur est prié de se référer aux URLs indiqués
plus bas.
Nous discuterons essentiellement ici du programme rtfToHTML puisqu'il est du domaine public
et qu'il est disponible sur la plupart des plateformes informatiques. Il existe d'autres solutions
qui ne sont pas aussi générales. Pour un inventaire de celles-ci, il est possible de contacter le
WWW FAQ.
Une affaire de correspondance
Tout d'abord, pour convertir un document produit avec un traitement de texte en
format HTML il faut nécessairement que le fichier d'origine contiennent
des annotations. En effet, le programme de conversion ne peut "inventer" ou
deviner ce que l'auteur veut obtenir comme produit final.
Pour traiter un texte, les programmes de conversion comme rtfToHTML
utilisent un tableau de correspondance entre les styles de caractère
(gras, souligné, italique etc.) ou de paragraphe (titre, entête,
corps, etc) et une annotation HTML. Si un style défini dans le document
de traitement de texte ne se retrouve pas dans le tableau de correspondance, le
logiciel de conversion ne saura pas quoi en faire.
Par exemple, dans le programme rtfToHTML, le contenu d'un paragraphe de style
"heading 1" sera annoté en "<H1>" dans le document html, celui de
style "heading 2" en "<h2>" etc. Évidemment, si un paragraphe a le
style "entete 1" le programme de converson ne l'annotera pas à moins que vous ayez
préalablement édité le tableau de conversion. Voici un extrait du
fichier d'équivalences de rtftoHTML (html-trans) qui accompagne l'application:
"heading 1",0,"h1"
"Heading 1",0,"h1"
"heading 2",0,"h2"
"Heading 2",0,"h2"
"heading 3",0,"h3"
"Heading 3",0,"h3"
"heading 4",0,"h4"
"Heading 4",0,"h4"
"heading 5",0,"h5"
"Heading 5",0,"h5"
"heading 6",0,"h6"
"Heading 6",0,"h6"
En résumé, il est essentiel, si on veut obtenir un
résultat probant, que le document produit avec un traitement de
texte soit formaté en utilisant les styles de paragraphes. De plus, il
faut que ces styles soient définis dans le tableau de conversion du
logiciel. Naturellement, le programme rtfToHTML assume une nomenclature
anglaise pour les styles de paragraphes ce qui nous oblige à faire
très attention à la nomenclature de styles utilisée.
Des textes riches
Comme son nom l'indique, le programme rtfToHTML ne décode et donc ne converti
que les documents qui sont en format "rich text" ou rtf. Il faut donc
enrégistrer le document que l'on désire convertir en format RTF
avant de le soumettre au programme de conversion. Le format "rich text" utilise
le jeu de caractères US-ASCII et peut donc être lu par un simple
éditeur de texte. De plus, le format RTF est supporté par tous
les principaux logiciels de traitement de texte ce qui implique que vous pouvez utiliser
le logiciel de conversion de façon universelle.
Une table des matières plus dynamique
Le programme rtfToHTML supporte les annotations HTML 2.0 de
base. De plus, si une table des matières est présente dans le
document, rtfToHTML produira un document HTML distinct contenant la table des
matières et des pointeurs de type <A HREF #?> à des sections d'un
deuxième document HTML contenant, celui-là, le corps du document et des
annotations de type <A NAME= ?>.
Des images presque parfaites
Le programme rtfToHTML reconnaît les images contenues dans le document source et
insère des pointeurs de type
IMAGE référant à des fichiers de type GIF dans le document de sortie.
Le programme produit même une série de fichiers d'images dans le format natif
de la plateforme informatique utilisée (p. ex: pict ou bmp) qu'il faut ensuite convertir
en gif au moyen d'un tiers programme.
En résumé
Le programme rtfToHTML est un outil relativement puissant qui permet de
convertir en format HTML des documents produits avec des logiciels de
traitement de texte. Lorsque le document de départ est formaté
selon les règles de l'art, le résultat peut être
très satisfaisant. À partir d'un document statique conçu
pour être imprimé sur papier, on se retrouve avec un document
hypertexte dans lequel on peut naviguer et visualiser des images en couleur.
Évidemment, ce ne sont pas tous les documents qui ont avantage à être
converti en format hypertexte. De plus, si on veut vraiment tirer
profit du HTML, on doit souvent "éditer" le fichier produit par le
programme de conversion et comme le processus de conversion n'est pas vraiment
réversible...
Depuis quelques mois, on retrouve une macro EXCEL (fonctionnant sur version 5.0) qui
permet de traduire directement un tableau excel en fichier html. Cette macro se nomme
xl2html.xls et est disponible à l'URL suivant:
Exceltohtml. L'auteur
s'appelle Jordan Evans et la macro est un gratuitiel.
Pour convertir un fichier excel en tableau html, il suffit d'entrer les données
dans un tableau excel, de sélectionner ensuite la zone et de lancer la macro. Celle-ci vous
demandera ensuite quelques questions par rapport au titre, à l'entête et aux
commentaires en bas de page. Vous pouvez laisser des champs en blanc. Une fois la macro lancée, elle
fabriquera le fichier que vous pourrez éditer dans votre éditeur html préféré.
Références