lodemenos.net
 

Exportando LaTeX a profanos

¿Documentos LaTeX en Word?

Muchas de las ventajas que tiene LaTeX se diluyen cuando los documentos generados deben estar disponibles para usuarios profanos de este entorno.
Martes 3 de junio de 2008.

Una de las pegas más grandes que tiene el empleo de LaTeX en entornos no estríctamente científicos o académicos reside en el trasvase de documentos con usuarios tipicos, es decir, usuarios de Word. No vamos a entrar en la eterna discusión, en lugar de ello nos plantearemos un problema simple: los usuarios de Word no pueden editar un archivo LaTeX. Sería magnífico que estos usuarios quisieran aprender a usar LaTeX y que tuviesen orgasmos recurrentes cada vez que comparasen sus características con lo que ellos consideran normal, pero las cosas en el mundo real no funcionan así.

Personalmente me he tenido que plantear estas cuestiones ya que en mi ámbito laboral todo el mundo emplea Word para entregar sus documentos, tanto a otros compañeros como a clientes u otras entidades. Ya están puestas las semillas para que internamente se maneje LaTeX como método de documentación, ya que permite emplear paradigmas útiles imposibles de implementar empleando sistemas propietarios WYSIWY(ST)G (’ST’ es de ’Suppose To’). Otro motivo de herejía en este texto reside en que el sistema operativo en el que voy a describir el proceso es Windows (para más inri yo lo estoy haciendo en Windows... Vista). Así que aquí está el objetivo de este texto al fin: conseguir un archivo editable amigable en Word a partir de un documento LaTeX en una máquina con Windows.

Pues yo no he encontrado nada para hacer esto bien...

Suponiendo que tenemos las fuentes LaTeX correctamente redactadas la cuestión es muy sencilla. Posiblemente muchos hayais buscado programas tipo tex2word o algo así, encontrando soluciones de pago o incluso macros para Word que distan mucho de funcionar bien. Mi primera opción fue esta, pensando que sería algo fácil de encontrar. Tras darme cuenta de que no, busqué conversores tipo tex2odf (para poder abrir con OpenOffice) e incluso pdf2txt, pdf2odf,... El caso es que ningún conversor de este tipo resultaba sencillo de emplear y los resultados distan mucho de ser amigables.

También intenté emplear LyX, que tiene muy buena pinta. Es un editor WYSIWYM (’What You Mean’, frente a ’What You Get’) libre que trata LaTeX de manera visual y que, teoricamente, permite importar LaTeX y exportar a multitud de formatos. El problema es que la última versión disponible (1.5.5) tiene un bug profundo que hace que el propio formato lyx tenga problemas de importación. En cualquier caso se queda en la recámara para un futuro.

La última opción planteada (aparte de piratear ciertos softwares propietarios, lo cual no está bien, niños) consistió en exportar LaTeX a HTML o XHTML, haciéndolo editable en Word y OpenOffice. Si empleais MikTex, existe el paquete tex4ht, instalable desde el gestor de descargas, que realiza multitud de conversiones de formatos pero que es tremendamente complicado de configurar para que realice una tarea concreta esporádica como la que estamos tratando. En cualquier caso, existen documentos web con tutoriales acerca de su instalación y uso muy recomendables y muy instructivos, ya que en realidad se trata de una herramienta tremendamente útil.

Tras todas estas peleas, me decanté a última hora por un software llamado tth, que aparecía como uno de los más antiguos en varias referencias de blogs y webs especializadas en LaTeX.

tth

Una vez descargado el software de la dirección de arriba, lo descomprimimos en una ruta que introduciremos en el path de nuestro equipo [1] y así lo tendremos accesible desde cualquier consola que abramos.

Nos posicionamos en la ruta del documento que deseamos hacer editable con Word y escribimos:

tth -u -w2 -e2 miarchivolatex.tex

Para ver qué hace cada parámetro:

tth -?

Acto seguido (casi instantaneamente) tendremos generado un documento HTML listo para ser subido a un servidor web o, lo que nos interesa, ser editado mediante WORD u OpenOffice.

Pegas... solucionables.

Ciertos detalles hacen que la conversión no sea inmediata (por ahora):

a) Las imágenes tienen su tamaño original y no se reescalan. Si estábamos empleando escalas en LaTeX, parece que no las respeta y nos coloca las imágenes en su tamaño enorme o minúsculo. Dependiendo de la cantidad de imágenes, el proceso de adaptación puede ser más o menos tedioso. Estoy seguro de que hay mecanismos en Word u OpenOffice para automatizar estas tareas.

b) Se pierden las referencias de nueva página \newpage y otras similares. En general no afecta demasiado al aspecto del documento, pero a la hora de generar la versión final, habrá que insertar los saltos a mano para los sitios concretos.

c) No respeta el paquete BABEL. Por ello los títulos de secciones aparecen en inglés. No me ha dado lugar a comprobar si esto es configurable, pero en realidad no es complicado corregir esto con cualquier script de sustitución de texto realizado a posteriori sobre el HTML.

d) Los footnotes se agrupan al final, ya que interpreta el documento HTML como una página única. De nuevo, supongo que hay formas de automatizar la recolocación de estas notas, ya sea mediante macros o algún sistema parecido.

Conclusión.

Aunque no se trate de un proceso directo de conversión a un formato de proceso de textos puro y duro, el empleo de (X)HTML como maquetado intermedio hace que, a efectos prácticos, ésto se consiga. Es un proceso fácil que permite incluir en un procesado por lotes la conversión, es gratis, es ligero... Y aunque el formato final no sea exactamente igual al compilado en LaTeX, podemos tener contento a nuestro jefe y a nuestros clientes, trabajando en LaTeX y presentando la información como a ellos les viene bien.

O eso creen.

Saludos.

[1] Típicamente en propiedades de Mi Pc -> Avanzadas

Exportando LaTeX a profanos

¿has probado con sciwriter para pasar de xthml a tex y viceversa?, lo encuentras en el siguiente enlace

pi