Libelium: “La gobernanza del dato implica lograr que el dato sea entendible, interoperable y accesible”

Libelium: “La gobernanza del dato implica lograr que el dato sea entendible, interoperable y accesible”.

En esta entrevista, Antonio Jara, CSO de Libelium, desglosa el papel estratégico de los espacios de datos en la economía digital europea y su aplicación práctica.

Antonio Jara, Chief Scientific Officer de Libelium, desglosa en esta entrevista el complejo pero crucial concepto de los espacios de datos y su impacto en la economía digital, así como el papel de Libelium en este panorama. La conversación, enfocada en temas técnicos y la visión de Libelium, arrojó luz sobre la gobernanza del dato, la interoperabilidad y los desafíos futuros.

Interoperabilidad, soberanía y gobernanza del dato

– Para empezar, ¿podría ofrecernos una definición rigurosa de un espacio de datos y cuál es su principal diferencia con una base de datos tradicional?

La definición de un espacio de datos, según la norma UNE que se alineará con ISO y que se lanzará el 17 de julio, establece que es un espacio constituido para garantizar que las acciones de datos realizadas en un marco se lleven a cabo de manera confiable y eficaz. Esto significa que los consumidores invocan servicios de acceso o procesamiento de datos ligados a productores de datos.

En términos más sencillos, la diferencia clave con una base de datos o un portal de datos es que un espacio de datos garantiza una transacción del dato totalmente supervisada y confiable. En esencia, es inicialmente un catálogo de datos, pero, más importante aún, es todo el ecosistema de confianza que asegura que cuando alguien accede a tu dato, lo hace bajo criterios que tú has marcado: quién puede acceder, en qué cantidad, en qué momento y bajo qué condiciones. Esto se supervisa y se garantiza la transacción segura. El concepto tiene mucho sentido cuando se comparten datos con cierta reticencia o bajo restricciones, pero se desea garantizar su compartición solo en circunstancias y condiciones específicas. Aquí entran en juego tres conceptos clave:

El primero es el concepto de Catálogo, que consiste en un listado de todos los datos existentes y disponibles, tanto públicos como, crucialmente, privados. El segundo es el Entorno de Confianza, que debe generar suficiente seguridad para que el propietario del dato confíe en que no será utilizado por la competencia, ni generará problemas a medio plazo. En último lugar, las Herramientas de Soberanía y Gobernanza, que se refieren a tener los mecanismos reales para gestionar esa soberanía, decidiendo cuándo compartir, quién puede acceder, y si se monetiza o no.

“Un catálogo de datos, es todo el ecosistema de confianza que asegura que cuando alguien accede a tu dato, lo hace bajo criterios que tú has marcado”

Un ejemplo práctico es el consumo de agua de cada vivienda en Valencia, un dato hiperpersonal. El espacio de datos garantiza que ese dato se use solo de manera genuina y ética para ciertos casos, evitando usos no deseados como multar por viviendas de uso turístico, pero permitiendo el acceso para emergencias como incendios. La soberanía del dato es precisamente esa capacidad del propietario de decidir el uso y tener la potestad de cancelar su propagación o exigir su borrado. Los espacios de datos abren este “petróleo digital” al universo.

– Nos ha comentado sobre la soberanía y gobernanza del dato. ¿Qué rol juega la interoperabilidad en este ecosistema?

La interoperabilidad es absolutamente clave, porque para que un dato sea consumible, debe existir un “esperanto” o lenguaje universal que todos entiendan. Por ejemplo, en el caso del consumo de agua, todos deben saber qué significa, si está en litros o metros cúbicos. El grupo de trabajo número 2 de la norma UNE se centra precisamente en la interoperabilidad, mientras que el grupo 1 es gobernanza y el 3, el marco legal.

Desde España, se están liderando iniciativas muy importantes como Smart Data Models, impulsada por la Universidad Autónoma de Madrid, que está creando este lenguaje universal para los datos. Utiliza el concepto de “linked data” (datos enlazados) para mapear y traducir los datos a un lenguaje común. En última instancia, la gobernanza del dato implica lograr que el dato sea entendible, interoperable y accesible antes de poder añadir las capas de control y soberanía.

Impacto económico y social

– Pasando al impacto económico y social, ¿por qué considera que los espacios de datos son una pieza clave para la economía digital europea?

El dato, a menudo, no se explota plenamente por miedo a compartirlo o por salir de su zona inicial. Los espacios de datos abren una gran cantidad de oportunidades económicas que antes se veían como imposibles o inaccesibles. Son un habilitador clave, especialmente en lo que respecta a la reutilización y el fomento de una economía de escala.

Volviendo al ejemplo de las viviendas de uso turístico: un algoritmo de IA entrenado para detectar estas viviendas a partir de datos de consumo de agua, desarrollado en un espacio de datos, puede ser replicado y utilizado por cualquier ciudad con una empresa de agua. Esto genera un modelo de negocio escalable de detección y facturación. Este principio se aplica a innumerables sectores como la salud, el turismo o el medio ambiente. El uso secundario del dato, más allá de su propósito original, es extremadamente relevante y genera un valor significativo.

Un ejemplo relevante es la European Building Database, una base de datos con información de todos los edificios de Europa, que permite calcular el impacto de desastres naturales como las DANAS o incendios en términos de costes de reconstrucción. La Digital Twin of the Earth (Destination Earth), que contiene información sobre calidad del aire, propagación del viento y contaminación a escala global, es otro ejemplo de cómo los espacios de datos permiten explotar información masiva para múltiples aplicaciones. Grandes empresas como Mastercard y Amadeus ya están trabajando en espacios de datos.

– En casos de predicción de catástrofes, ¿qué relevancia tienen los gemelos digitales?

Para nosotros en Libelium, el gemelo digital es la capa de explotación del dato. Es donde el dato se pone más en valor para la toma de decisiones. Un gemelo digital es tan poderoso como los datos y modelos que lo alimentan; cuantos más datos se tengan, más escenarios y casuísticas se pueden explorar y simular. Esto permite entender mejor lo que sucede en el mundo.

“Los espacios de datos abren una gran cantidad de oportunidades económicas”

Imagina poder acceder a bases de datos de todos los edificios, consumos, movimientos de personas, tráfico, consumos energéticos, calidad del aire o ruido. Esto permite que un gemelo digital entienda el impacto de eventos, como unas fiestas patronales, o simule el comportamiento de multitudes.

Un caso muy ilustrativo es el de Starlite Marbella. Originalmente, el gemelo digital se implementó para cumplir con la normativa de aforos y seguridad en caso de desastres. Sin embargo, se descubrieron usos secundarios de gran valor, como informar a los clientes sobre los tiempos de espera en las barras o ayudar a la empresa a identificar las zonas más concurridas para cobrar más por el patrocinio y la publicidad. Esto demuestra cómo se puede rentabilizar el sistema más allá de su propósito inicial.
La clave es que en un espacio de datos se pueden fusionar diversas fuentes de datos —sensores propios, datos de telefonía móvil de operadoras, datos de consumo de tarjetas de crédito— para obtener un conocimiento total. En una plataforma de datos tradicional, cada empresa solo accedería a sus propios datos, pero el espacio de datos permite esta visión unificada y mucho más valiosa.

– ¿Cómo se alinean los espacios de datos con estrategias europeas como el Data Act, Gaia-X y Simple?

Data Act es una regulación europea que exige soberanía, repetitividad y trazabilidad del dato. La soberanía asegura el derecho del usuario a decidir sobre el uso de su dato. La trazabilidad permite auditar y verificar cómo y dónde se ha utilizado. La repetitividad garantiza que una acción o conclusión derivada del dato sea consistente y se pueda reproducir, abordando la volatilidad de tecnologías como la IA generativa. Complementa al AI Act, que se enfoca en los algoritmos.

En cambio, Gaia-X Ofrece el entorno de confianza o “trust framework”. Su valor añadido sobre una plataforma de datos normal es la implementación de seguridad, trazabilidad y confianza. Actúa como el sistema de alarmas, puertas y guardias que controlan el acceso a una “parcela de datos”, permitiendo al propietario decidir quién entra y cómo.

En su caso, SIMPL es una iniciativa europea crucial para facilitar la traducción y el puente entre diferentes espacios de datos existentes, ya sean regionales o nacionales. Libelium es adjudicataria para implementar el nodo de Smart Cities de Simple en el consorcio Edic (European Digital Infrastructure Consortio), liderado por los Ayuntamientos de Valencia y Barcelona. Su objetivo es crear un mercado único del dato en Europa, permitiendo la cooperación entre espacios de datos diversos, como el espacio de datos nacional de turismo (PIA) y el europeo (Deploytour). Simple no es un espacio de datos en sí mismo, sino un intercambiador o puente entre ellos.

Rol de Libelium en los Espacios de Datos

– ¿Cuál es el papel de Libelium en la creación de espacios de datos y la gestión de gemelos digitales?

En Libelium, hemos desarrollado Iris360, una plataforma totalmente basada en código abierto y en estándares europeos. Su propósito es ser el “pegamento” que conecta múltiples protocolos e iniciativas. Nuestra virtud reside en estar involucrados en la mayoría de los proyectos clave a nivel europeo y nacional en este ámbito.

“Buscamos garantizar que cualquier organización pueda integrar sus datos y su transformación digital en las iniciativas europeas”

Somos miembros del espacio de datos de turismo DeployTour, colaboramos en la PIA de Segitur, lideramos técnicamente dos espacios de datos para ciudades inteligentes (DS for SSCC, de islas de calor y DANAS), y ahora gestionamos el nodo Simple para la interconexión entre múltiples espacios de datos. Además, lideramos técnicamente la caja de herramientas para construir gemelos digitales para la Comisión Europea, un proyecto de 20 millones de euros.

Nuestra propuesta de valor es ser el “pasaporte a Europa” para cualquier entidad. Buscamos garantizar que cualquier organización pueda integrar sus datos y su transformación digital en las iniciativas europeas (Gaia-X, IDSA, Fware, Simpl, Smart Data Models y los espacios de datos de la UE). Esto ofrece dos ventajas fundamentales. En primer lugar, una independencia de un proveedor particular (vendor lock-in) gracias a los estándares abiertos. Y en segundo lugar, una garantía de “hablar el idioma” que Europa requiere, lo cual será crucial en futuros programas de ayuda como el Smart Economy de red.es.

En cuanto a Iris360 integra cinco capas: gestión de dispositivos, gestión del dato, gestión de espacios de datos, gestión de gemelos digitales (explotación) y visualización (mapas 3D, metaverso). Sí, se podría decir que somos un puente entre el mundo físico y el digital, pero con la particularidad de que garantizamos que esta digitalización se realiza siguiendo los estándares y normativas europeas, facilitando el acceso al Mercado Único Digital de Europa.

Perspectiva estratégica y futuro

– Mirando al futuro, ¿en qué sectores cree que se acelerará más la adopción de los espacios de datos en los próximos años?

En primer lugar, el sector del automóvil es el más avanzado. Con su implementación propia, Catena-X. Necesitan optimizar la eficiencia en su cadena de valor con márgenes ínfimos, interconectando a múltiples proveedores para información sobre stock, mermas y problemas. Los espacios de datos son clave para compartir información privilegiada de forma segura entre proveedores y con el consumidor final, sin comprometer la competitividad.

El segundo sector dónde más se está adoptando los espacios de datos es en lo relacionado con el Medio Ambiente, pues no afecta directamente a personas. Sectores como el clima (DestinationEarth) o los océanos (Edito.eu, el Gemelo Digital Europeo de los Océanos). Como los océanos y el planeta son “de todos y de nadie”, hay menos reticencia a compartir sus datos, lo que genera multitud de casos de uso como la predicción de DANAS o la gestión de islas de calor.

“Los espacios de datos representan la democratización de esa optimización para otros sectores más allá del B2B”

En tercer lugar, el sector de la salud, que paradójicamente esel que afecta directamente a personas, es el tercer caso de uso más potente y ya se están licitando grandes contratos, como el de Telefónica para el espacio nacional de datos de salud. Existe una necesidad imperiosa de compartir información vital (historial clínico) entre países o regiones para algo tan crucial como la vida. Esto no solo facilita la atención individual (receta electrónica nacional), sino también la investigación científica, permitiendo el acceso a datos anonimizados de millones de personas.

En último lugar, la Administración General del Estado ya está creando su propio espacio nacional de datos, y los de turismo y Smart Cities también avanzan, practicando con el ejemplo.

En los próximos dos años, veremos la ejecución y puesta en marcha del Espacio Nacional de Datos de Salud y un acceso sin precedentes a los catálogos de datos de las administraciones públicas. Otros sectores como la industria, el turismo y la agricultura también evolucionarán. Así como SAP transformó la cadena de suministro en el retail (ej. Mercadona), los espacios de datos representan la democratización de esa optimización para otros sectores más allá del B2B, permitiendo un intercambio de datos privados de forma segura y sin las elevadas licencias de software propietario.

– ¿Identifica barreras técnicas o culturales que puedan impedir la adopción global de los espacios de datos?

Sí, hay dos barreras principales. La primera de ellas tiene que ver con la nueva forma de identificación mediante la Wallet Europea (EU ID). Cambiamos de sistemas como el DNI electrónico (que ya tenía una adopción limitada de su chip) a una nueva “wallet” similar a las de blockchain o códigos QR, como las usadas en China (WeChat, Alipay). Para acceder a un espacio de datos, no se usará usuario y contraseña, sino esta wallet europea. Esto representa un cambio cultural significativo en cómo nos identificamos digitalmente, lo cual genera cierta resistencia inicial.

“Un gran beneficio es la soberanía del dato, ya que el usuario podrá ver quién ha accedido a sus datos y gestionar los permisos”

Sin embargo, esta wallet es el futuro de la identidad digital. Actúa como un pasaporte que contiene “credenciales verificables” (VC) o “visados” que acreditan tu estatus (estudiante, ingeniero, empleado de Libelium, etc.). Si una credencial cambia (por ejemplo, dejas de ser empleado), el acceso se revoca automáticamente. Además, estas wallets no solo serán para personas, sino también para máquinas, móviles, etc.. Un gran beneficio es la soberanía del dato, ya que el usuario podrá ver quién ha accedido a sus datos (como el historial médico) y gestionar los permisos. La principal barrera aquí es la lenta adopción de esta nueva tecnología, además de desafíos prácticos como la dependencia del móvil (si te quedas sin batería, “desapareces” del planeta).

La segundo es la necesidad de autotraducción y la aceptación de la “entropía” de los datos: No podemos esperar que todos los datos se traduzcan y adapten manualmente a un lenguaje común. Se necesita que los datos sean capaces de autotraducirse y autoadaptarse, algo en lo que se espera que la IA generativa juegue un papel fundamental. Así como ChatGPT entiende un texto con faltas de ortografía o en múltiples idiomas sin traducción manual, necesitamos que los sistemas acepten datos menos estructurados.

El mundo B2B aún está muy anclado en la idea de datos limpios y estructurados. Sin embargo, debemos empezar a vivir con un cierto nivel de “entropía” o inseguridad, aceptando que el dato se adapte por sí solo, algo que la IA generativa puede facilitar. La clave es el “descubrimiento del dato” en lugar de su estricta traducción y limpieza. Esto representa una barrera psicológica, especialmente para industrias B2B que son reacias a introducir “entropía” en sus procesos, aunque la realidad es que los datos nunca están completamente limpios. Se trata de gestionar el riesgo dentro de un rango de confianza aceptable.