Hortonworks: “El reto está en conectar y entender los datos”

DataWorks Summit Keynote

Durante el DataWorks Summit, la compañía muestra la importancia de contar con una plataforma moderna para dar respuesta al crecimiento exponencial de la información.

Especial desde Berlín

A lo largo de esta semana se está celebrando el congreso DataWorks Summit, organizado por HortonWorks. Para aquellos que no la conozcan, se trata de una empresa basada 100% en código abierto que puso a Hadoop en el mercado empresarial y es una de las que dieron el pistoletazo de salida a la hora de desarrollar plataformas Open Source capaces de orquestar tanto datos estructurados como no estructurados.

Desde su fundación en 2011 ha mantenido el desarrollo de una arquitectura moderna capaz de gestionar distintas capas y fuentes de forma unificada, pero teniendo en cuenta también aquellos datos que aún se mantienen en datacenters tradicionales gobernados por aplicaciones on-premise. Tal vez este ha sido el gran paso que dio en su momento, ya que ha ayudado a muchas organizaciones a modernizarse sin tener que perder su legado de hace años, décadas.

En la actualidad, las empresas se enfrentan a grandes retos a la hora de gestionar de forma eficiente su información. Tal y como señala John Kreisa, vicepresidente de Marketing de Hortonworks, se han juntado cuatro grandes tendencias que han generado la tormenta perfecta: internet de las cosas, cloud computing, inteligencia artificial y datos en streaming.

John Kreisa, vicepresidente de Marketing de Hortonworks, durante la keynote inaugural del evento

“Para las empresas, esto supone mantener múltiples clústeres, con información proveniente de muchas fuentes y con un creciente número de tipos de datos, lo que puede suponer un caos. Nuestra misión es llevar todos esos datos a una plataforma global, con un acceso común a esa información. Y todo ello aplicando medidas de seguridad y gobierno que aseguren el cumplimiento de las normativas”, explica el directivo.

Pero, ¿para qué mantener accesibles todos los datos de múltiples fuentes en una plataforma global? La respuesta a esta pregunta se encuentra en la analítica. La arquitectura de Hortonworks es capaz de realizar análisis avanzado de la información en cualquier lugar, desde la nube, el edge computing o el centro de datos privado. No solamente de los que están almacenados en silos, sino también los que se encuentran en movimiento, los transaccionales: “obtener información y analítica de los datos en tiempo real es claramente lo que diferenciará a las empresas”, apunta Scott Gnau, CTO de Hortonworks.

Para entender claramente este concepto, pongamos el ejemplo de una persona que hace uso de su tarjeta de crédito en Berlín, pero media hora después alguien hace lo mismo con una tarjeta clonada en San Francisco. El poder analizar la información transaccional en tiempo real permite bloquear esa tarjeta casi al instante sin tener que esperar a que las dos operaciones sean almacenadas en un repositorio de transacciones bancarias y salte una alarma tras encontrar esa incongruencia, algo que puede tardar días. 

Plataforma Hortonworks
La plataforma moderna de datos de Hortonworks cubre las fuentes de datos, así como su ciclo de vida

No es una cuestión que pueda afectar a una industria concreta, sino todo lo contrario. En la actualidad, cualquier empresa (sea cual sea su negocio) es una empresa de datos. Desde las relacionadas con el desarrollo  a la manufactura, pasando por la distribución, marketing y ventas, servicios… todas pueden -y deben- sacar partido de la información que generan cada día, cruzándola con la que está en reposo, archivada en silos.

Las novedades presentadas en el DataWorks Summit 2018

La evolución en el desarrollo de las soluciones de Hortonworks siempre ha venido marcada por la gestión de datos y las necesidades que las empresas se iban encontrando. En 2011, coincidiendo con su fundación, convirtieron Hadoop en una solución empresarial, de tal forma que pudieran gestionar todos sus datos no estructurados desde la misma plataforma (HDP). En 2015 consiguieron hacer lo propio pero con los datos que se encontraban en movimiento (HDF), mientras que el año pasado anunciaron las capacidades para conectar ambos mundos, algo impensable poco tiempo atrás. En la misma plataforma era ya posible gestionar y relacionar los datos provenientes de estas dos fuentes. 

El siguiente paso era el más lógico: había que añadir otra capa más de gestión por encima de las anteriores para poder controlar todo el ciclo de vida de los datos de forma unificada, sin tener que saltar de una plataforma a otra en función de la información manejada en cada momento. Es aquí donde entra en juego Hortonworks DataPlane Service, anunciado recientemente, y más concretamente el servicio Hortonworks Data Steward Studio (DSS). Está diseñado para añadir más capacidades de seguridad y de gobierno de toda esa información de forma independiente al repositorio o data lake en el que se encuentre.

Hortonworks
La evolución de Hortonworks siempre se ha basado en expandir las funcionalidades de su plataforma de datos

Tal y como nos asegura Dinesh Chandrasekhar, director de Marketing de Producto de Hortonworks, el reto de las empresas es poder gestionar y acceder de forma segura a todos esos datos desde una misma consola: “DSS facilita a las empresas localizar los niveles de confianza a la hora de acceder a los datos. Es posible realizar un gobierno de la información para que los trabajadores puedan hacer uso de ella en función de los roles marcados por los administradores. No es lo mismo que acceda un científico de datos que un tomador de decisiones de negocio. Cada uno puede acceder a los recursos con total seguridad”.

Asimismo, DSS permite organizar los datos de forma unificada: catalogarlos, realizar búsquedas globales… incluso aporta herramientas para facilitar el cumplimiento de normativas como la GDPR.

Hortonworks en España

Durante el evento también hemos tenido la oportunidad de charlar con James Grehan, vicepresidente regional de Hortonworks para el Sur de Europa. Lleva un año en la compañía para liderar los mercados de España, Italia e Israel, fecha en la que abrió la delegación en Madrid. Su llegada a la confirma la estrategia de expansión internacional que buscará durante los próximos años. 

Para Grehan, que cuenta con un amplio bagaje en el sector TIC tras pasar por compañías como Oracle, Quest Software, BMC o VMware, el mercado español está demandando soluciones Open Source, pero necesitaba una alternativa presencial a nivel local para que las empresas puedan tener un contacto más directo con Hortonworks. Hay que tener en cuenta que el modelo de negocio se encuentra principalmente en el soporte y los servicios ya que el software está disponible de forma gratuita para cualquier organización: “Este hecho ha generado un pico de negocio importante en nuestro primer año”. 

Muchos de los asistentes al DataWorks Summit forman parte de la Comunidad de Desarrolladores Open Source

“El valor que aporta Hortonworks a nuestros clientes es ofrecerles casos de uso para que sepan qué pueden hacer realmente con sus datos”, añade. En cierta medida, las organizaciones españolas llevan tiempo trabajando con soluciones basadas en código abierto, pero en entornos de desarrollo y prueba, no en producción.

Es algo que está cambiando últimamente, tal y como corrobora  Grehan. “Hay que tener en cuenta que en España hay gente muy válida desde hace años para desplegar este tipo de entornos Open Source, pero es desde hace dos o tres cuando las compañías están encontrando las bondades que pueden aportar la comunidad de desarrolladores y este tipo de herramientas. Al final, la adopción de soluciones de código abierto se debe a la ventaja competitiva que encuentran las empresas con respecto a su competencia“, finaliza.