HTML5; documentos para todos los canales de salida

CloudEmpresasMovilidadTabletas

Tomás Carrasco, Country Manager Compart Iberia, analiza el papel decisivo que juegan los sistemas HTML5 y PDF en la medida que el volumen de documentos físicos se contrae.

La distribución digital de documentos está desplazando a la física. Por eso, la documentación tiene que estar elaborada para cualquier tipo de canal de salida, sin importar el formato o fuente. Lo ideal es que este factor se tenga en cuenta desde el mismo momento de la creación del documento. Por eso, los sistemas HTML 5 y PDF son claves en este aspecto.

El volumen de documentos físicos se está contrayendo en toda Europa. Encuestas actuales, como la de Universal Postal Union (UPU), citan una caída perceptible de hasta dos dígitos. Muchas compañías ya están enviando facturas, estados de cuenta y similares como archivos adjuntos de correo electrónico o los cuelgan en sus páginas web para descargarlos desde allí. Y es que esta tendencia va en aumento. Con la eliminación de los costes postales y los de impresión, la distribución digital tiene un enorme potencial en el ahorro, concretamente con cifras de seis dígitos, lo cual acelera el progreso en este campo.

Es muy probable que en pocos años más de la mitad de todos los documentos se envíen por vía electrónica, incluso pólizas de seguros, cancelaciones de contratos y otros documentos escritos que, por razones legales, aún permanecen en formato papel pero que también próximamente serán enviados de manera digital. La impresión y la distribución física estarán reservados para aquellos materiales que enfaticen y hagan especial hincapié en el tacto y en la óptica, especialmente catálogos de productos de primera calidad y folletos de imagen de empresa. El papel será, por tanto, cada vez más considerado un producto de mayor calidad.

HTML5 para toda ocasión

En cualquier caso, la relación entre la correspondencia física y la digital está cambiando e influye desde el mismo momento de la creación del documento. El reto está en preparar ese documento, sin importar los caracteres, y dotarle de los datos estructurales necesarios para que pueda tener salida en cualquier tipo de canal. Eso significa que los sistemas de gestión de salida de documentos necesitan separarse del mítico formato A4 y también de los contenidos que suministran los  dispositivos de salida electrónicos, en lo concerniente al tamaño de la pantalla  o de la presentación.

Tengamos en cuenta a los tablet PC, los smartphones y otros dispositivos que están avanzando como auténticas oficinas móviles para las operaciones de negocio de hoy en día. En otras palabras, documentos diseñados originalmente para impresión, ahora tienen que tener la capacidad de ser multicanal, y estar “enriquecidos” para su presentación final con tanta información como sea posible, como por ejemplo metadatos, hiperlinks e instrucciones para estructuración de texto.

En este contexto, el formato HTML5 jugará un papel decisivo en la estructuración y semántica de la descripción los documentos. Los textos basados en lenguaje de marcas están sentando las directrices en las plataformas móviles de iPhone, iPad y dispositivos Android. Y no es de extrañar: los contenidos HTML5 pueden ser facilmente procesados para cualquier canal electrónico de salida, ya sea un smartphone o un web site. Un documento HTML5 puede imprimirse o convertirse en otro tipo de forma de salida física si es necesario y además pueden convertirse en archivos PDF de cualquier tamaño de página.

Los documentos multicanal también son inteligentes

HTML5 es actualmente el formato más inteligente para la creación y desarrollo de documentos, independientemente de su tamaño o de su canal de salida. Ello permite rediseñar, por ejemplo, los A4 para dispositivos smartphone, o convertir páginas orientadas a texto de cualquier formato. Los datos se extraen individualmente (incluidos la recuperación de elementos de una factura), para construir tablas de datos y lista de índices. Y aún hay más.

Con HTML5, incluso los elementos visuales, links y gráficos pueden incluirse. Esto crea documentos capacitados para cualquier tipo de canal, sino también, documentos inteligentes que ofrecen a los usuarios un valor añadido más allá de la pantalla de texto.

Es más lógico instalar un sistema de gestión de salida (OMS) para crear inicialmente todos los documentos en HTML5, o por lo menos en PDF, si consideramos que este formato es también mucho más avanzado con respecto a los datos estructurales integrados. Aún muchas empresas están ancladas en el pasado. A menudo han invertido mucho tiempo y dinero en sus sistemas y están comprensiblemente menos que entusiasmados en las nuevas herramientas para formatos.

La cuestión a la que tienen que enfrentarse es cómo capturan por lo menos algo de la información estructural de las aplicaciones de legado existentes para el posterior procesamiento.  Proveedores de servicio OMS se han especializado concretamente en “leer” los datos básicos de los documentos finales basados en sistemas de legado y prepararlos para archivos HTML5 o XML que puedan ser enriquecidos con más información, como puede ser más color y archivos de audio y vídeo.

Volviendo a la fuente

En el análisis final, las fuentes textuales en la generación de documentos deben ser identificados. ¿Dónde están los datos originales? ¿Permiten las fuentes extraer la suficiente información estructural para reusarla? Estas preguntas deben dirigirse cuando miramos hacia la creación de documentos inteligentes. El hecho es que, muchas veces, los datos se pierden en el camino de salida, sin importar qué canal, y es una situación que ya no está acorde con los tiempos.

A menudo, los documentos digitales que pueden ser leidos y procesados en los dispositivos, primero se convierten en formatos analógicos; por ejemplo, impresión, y después en  documentos TIF o JPG. El contenido se convierte así en una “nube de píxeles”. El contenido es inicialmente encriptado (imágenes de mapa de bits) y luego se hacen “legibles”” a través de caracteres de reconocimiento óptico (OCR). Esto no sólo es engorroso, sino que también implica la pérdida de los datos semánticos estructurales necesarios para su posterior reutilización.

Este no es el caso cuando los documentos están creados en un format que lleva todos los datos necesarios para la salida, permitiendo que el contenido sea desarrollado en cualquier tipo de canal, ya sea una apágina web, un dispositivo final móvil o de impresión.

Leer la biografía del autor  Ocultar la biografía del autor