Alianza española en el campo del Big Data Analysis

Las empresas Datumize y SDG Group anuncian un acuerdo preferente para ofrecer Business Intelligence a las compañías más medianas para alumbrar y sacar partido a sus datos ocultos. Y hasta Intel les tiene echado el ojo.

En el gran lago del datawarehouse, la punta del iceberg sólo muestra el 12% de los datos críticos, esos imprescindibles procedentes del ERP y el CRM que hacen que el negocio siga funcionando cada vez que se levanta la persiana y entra la luz. Sin embargo, por debajo de la línea de flotación, aún permanece el grueso de los datos que en algún momento han pasado por las redes de comunicación de las empresas: 23% son históricos, triviales u obsoletos; el resto, hasta 65%, son como si no existieran. “Son los llamados Dark Data, un término que estoy convencido se va a popularizar tanto o más que el Big Data actual”, señala Nacho Lafuente, fundador y CEO de la start-up española Datumize. “Nadie sabe dónde están, ni si se guardan, pero existir existen porque han pasado por diferentes canales de información de la compañía. Son datos oscuros, porque no se llegan a aprovechar: los responsables de negocio no saben que existen, o no saben que se pueden recuperar; o bien no se atreven a hacerlo porque sospechan que supondrá un coste enorme, y a las malas, habría que tocar los sistemas críticos que no pueden dejar de funcionar de ninguna manera”.

Según este emprendedor zaragozano y afincado en Barcelona, con una amplia experiencia en el sector tecnológico y financiero (Siemens, Oracle, BEA System, Banc Sabadell), “las grandes organizaciones utilizan complejos sistemas de información, y dejan sin capturar datos que serían relevantes para mejorar el negocio. Este fue mi primer contacto con los llamados datos oscuros o dark data”, recuerda. “Las reservas de los operadores turísticos se almacenan, pero no se guardan las consultas de disponibilidad ni las no realizadas, ni se sabe por qué o en qué momento se abandonó la compra. Las máquinas contienen métricas internas que no se comparten, ni en logística se guardan las consultas que se realizan sobre el inventario, solo los registros de trazabilidad de bultos y movimientos. Pues Globalia empezó con nosotros a detectar oportunidades perdidas y ahora es capaz de generar hasta 60 millones diarios. No solo hay vida dentro del centro de datos, hay un mundo real físico y lleno de móviles WiFi que permite detectar su presencia y movimientos por dentro del centro comercial”.

Nacho Lafuente
Nacho Lafuente

Datumize lo tuvo muy claro desde el principio: “Nosotros hacemos producto, no consultoría”, dice Nacho Lafuente. Tienen un producto comercial desarrollado por ellos mismos que es capaz de inspeccionar los datos empaquetados que circulan por las redes empresariales de forma no intrusiva y sin modificar sus estructuras, “algo que hasta el momento solo estaba en manos de agencias de inteligencia y espionaje. Nuestra tecnología es propia, no está basada en las propuestas de código abierto que hay por ahí (Hadoop, Spark, Kafka), es un software escrito en Java customizado para capturar datos oscuros, tiene un principio activo, nuestra ‘salsa secreta’, es el Data Collector”.

Este software innovador “y disruptivo” se compone de dos módulos: Kosmos y Observer. Kosmos está diseñado para “esnifar” toda la información que circula o ha circulado por las cañerías (pipelines) en el centro de datos de la empresa, procedentes de las diversas aplicaciones empresariales (ERP, CRM…), de los programas legacy, de la Web, etc., pero también de los datos en tránsito, especialmente destinado a capturar el comportamiento de los clientes “con la intención primero de incrementar ventas y canales, a la par de disminuir costes operativos, con el fin último de generar nuevos beneficios. Se transforman en el formato adecuado, se guardan en un repositorio y es ahí cuando entran nuestros colegas de SDG aplicando su conocimiento industrial para darles sentido y valor”.

Datumize no solo ha cerrado este acuerdo con la consultora italo-hispana, también ha llamado la atención de la misma Intel, que la ha invitado en varias ocasiones a su centro de desarrollo en Israel donde se está redefiniendo la nueva estrategia de Intel hacia la Nube y el Internet de las Cosas. Así, Datumize saca su expertice fuera del centro de datos con Observer, el módulo capaz de aprovechar la información que generan las personas y las cosas: TPV, sensores, lectores de código de barras, cajas registradoras, contadores de billetes, hot-spots… Para ello disponen de un gateway que se puede llevar a cualquier sitio, donde su software es tan ligero que se puede ejecutar en estas piezas del tamaño de una pastilla USB, con su ‘Intel inside’ (el acuerdo se firmó hace apenas tres meses, y ya han estado en la feria Computex de Taiwán donde han hablado con quince fabricantes). “Depende de lo que se quiera gastar el cliente, puede costarle 40 euros con el minimum minimorum, o irse a la versión más top de 400 euros ruguerizada en metal y con un Xeon dentro”, cuenta Nacho Lafuente, que también apunta la posibilidad de poder venderlos como OEM.

Estrategia y rendimiento del negocio

“En el mundo industrial y comercial, a veces hay un ordenador a mano, y otras no. Johnson & Johnson tiene máquinas compradas hace cinco años que pueden valer cada una entre 6.000 y 100.000 euros, y que no las van a cambiar porque no traigan sensores. Pero es tan fácil como añadirle la tecnología de Datumize”, señala Javier Urioste, socio co-fundador de SDG Group. “Las papelerías que venden bolígrafos Bic o los bares que ponen cañas de Damm no saben realmente cuánta gente entra en sus establecimientos y sus proveedores no tienen ni idea de cómo se venden los productos. Se lo dan al mayorista y poco más pueden hacer, sabes cuántos barriles de cerveza te han pedido, pero no sabes en el bar cómo se produce la venta, a qué horas y qué cantidades, ni puede hacer ninguna acción de marketing específica más allá de facilitarte las sillas y las sombrillas. Si lográsemos capturar el comportamiento de las personas y las cosas en el punto de venta y ver sus interacciones, se podrían ofrecer ofertas más ajustadas y optimizar la calidad del servicio o la experiencia del consumidor, incluso detectar anomalías y adelantarse a las reparaciones. Poder pasar de cuatro días a 20 minutos las acciones correctivas. Se van a cambiar las reglas del juego”. ¡Se acabó la servilleta atravesando el grifo de cerveza en hora punta!

Es cierto que hay distribuciones de código abierto por ahí, pero el 99% de las compañías prefieren centrarse en su core de hacer yogures y comprar el software. “Las piezas de un coche también se podrían adquirir por separado, pero al final la gente prefiere comprarse el coche ya montado… A veces, incluso resulta más barato”, apunta Nacho Lafuente. “Salvo que seas Google o Amazon, que se tienen que hacer sus propias herramientas, el software estándar está ahí a disposición de quien quiera aplicarlo”.

Javier Urioste hace un cálculo del coste aproximado de un proyecto: “Hacer un prototipo a un cliente no es caro; caro es si escalas a mucho volumen. Por ejemplo, una cadena de ropa de moda puede hacer pruebas en 25 tiendas y luego pasarlo a otras 50 tiendas por unos 80.000 euros. El proyecto que hemos diseñado para que el Ayuntamiento de Dubái controle la flota de taxis y limusinas y no dén rodeos innecesarios a los turistas y visitantes de negocio se acerca a los 2,5 millones de euros. Pero es que ellos quieren una solución en tiempo real o NRT (‘near real time’, menos de un segundo de latencia), para otros niveles que se pida menos de un minuto la inversión puede ser menor. La verdad es que hay diversos modelos de licenciar según industrias. En los canales digitales y de comercio electrónico, se puede cobrar por el volumen de datos (consumidos o capturados) como Grupo Piñero; en las utillities o industrias fabriles como Gas Natural, por contador o máquina fija. En poco tiempo, la gestión de los datos oscuros se convertirá en el centro del éxito de los negocios”.