Cloudera: “Nuestra plataforma consigue que los científicos de datos y los profesionales de TI colaboren más activamente”

Interesante entrevista la que hemos realizado a David Pieterse, vicepresidente de ventas de Cloudera EMEA, para hablar sobre big data, analítica, código abierto, inteligencia artificial y otros conceptos relacionados con la disrupción digital y la innovación.

Aprovechando su visita a Madrid hace algunas semanas, tuvimos la oportunidad de charlar con David Pieterse, que lidera el negocio de la emergente Cloudera en la región EMEA. nos contó no solamente detalles de esta compañía, sino también su visión del mundo tecnológico con detalles realmente interesantes que compartimos con los lectores de Silicon a continuación: 

La nube es un hecho en las empresas pero me gustaría saber cuál es la relación que tiene con el Big Data. ¿Crees que el Big Data habría sido posible sin la existencia de las tecnologías cloud?

La nube es un tema muy interesante para todos nuestros clientes y partners. Es un método de despliegue. La idea es que sepan definir qué datos quieren mover a la nube y qué datos alojar en su infraestructura. De la misma forma ocurre con las cargas de trabajo. Pero está claro que Cloud y Big Data van de la mano. Precisamente lo que hacemos en Cloudera es proporcionar una plataforma moderna que aporte a las organizaciones Analítica e Inteligencia Artificial, todo ello realmente optimizado para la nube.

Son tecnologías que se unen para que cualquier tipo de empresa pueda acceder a ellas, ya sean pymes o grandes corporaciones, ¿es así?

Es correcto, los precios de tecnologías basadas en nube han descendido, mientras que la potencia de proceso sigue aumentando considerablemente. Esto facilita a las empresas el acceso rápido a tecnologías muy avanzadas. Pero aquí es importante contar con una estrategia híbrida, especialmente para grandes empresas.

Aquí también entra en juego el Open Source. ¿Qué significa el código abierto para una empresa como Cloudera?

Como comunidad de desarrolladores es fundamental. Una comunidad significa que hay gente aportando cosas mientras otros las usan, pero también ofreciendo recursos. Esta relación tiene que mantenerse así. Hay muchos proyectos basados en código abierto, pero solamente se potencian los más importantes, los que verdaderamente aportan valor. Y es en ellos en los que hay que centrarse para convertirlos en software que puedan usar las empresas con seguridad, que esté probado a nivel de escala. De esta forma conseguimos lo mejor de la comunidad Open Source mientras aportamos recursos.

De hecho, en la actualidad hay grandes empresas como Microsoft, IBM… que son los principales contribuidores de la comunidad Open Source…

Exactamente, estas compañías hace tiempo que se dieron cuenta de las bondades que ofrece la comunidad de código abierto, no solamente para hacer negocio sino también para estar seguros de que hay equipos de desarrolladores detrás para resolver problemas que puedan suceder a medida que el software evoluciona.

Las  bases de datos juegan un papel fundamental para gestionar la información. ¿Qué visión tiene Cloudera de las BB.DD. tradicionales?, ¿crees que desaparecerán debido a la creciente importancia de las que gestionan datos no estructurados?

Cuando se gestiona información, en algún momento tiene que convertirse en datos estructurados para poder se analizados, incluso aquellos cuyo origen es no estructurado. Es cierto que se está produciendo una gran innovación en ámbitos como el IoT, dispositivos conectados…  que están generando grandes volúmenes de información no estructurada, pero también se siguen produciendo cantidades ingentes de datos transaccionales que deben ser almacenados de forma tradicional. Es por ello que ambos modelos seguirán coexistiendo para que el ser humano y las máquinas puedan extraer valor de todo ello. Lo que Cloudera busca es hacer más fácil a las empresas la gestión de sus grandes volúmenes de datos con una plataforma moderna, pero respetando las fuentes de datos tradicionales. Ese es uno de los motivos por los que tantas organizaciones están adoptándola.

David Pieterse, en un momento de la entrevista que tuvimos con él
David Pieterse, en un momento de la entrevista que tuvimos con él

Centrándonos en las soluciones que desarrolla Cloudera, ¿en qué áreas se está centrando actualmente y qué soluciones destacarías?

Estamos desarrollando soluciones de machine learning y analítica avanzada que buscan resolver los tres grandes problemas que tienen las organizaciones: Conocer mejor a los clientes, crear nuevos servicios para ellos basados en la innovación que encuentran en los datos que manejan y, por último, pero no menos importante, proteger sus negocios de ciberataques en un mundo hiperconectado.

Cloudera desarrolla la tecnología detrás de todo esto. Por ejemplo, destacaría Cloudera Science Workbench, una solución que permite gestionar y analizar toda la información, pero también facilita la colaboración de los profesionales de TI y científicos de datos para poder resolver esas problemáticas. De hecho, está siendo cada vez más popular entre los científicos de datos porque permite que puedan estar conectados entre sí. Antes, cada desarrollador, cada responsable de datos, trabajaba de forma independiente al resto porque prefería usar unas herramientas mejor que otras. Lo normal es que trabajaran aislados unos de otros.

Esta solución trabaja conjuntamente con nuestra oferta de gestión de datos (Enterprise Data Hub), lo que la convierte en una verdadera plataforma segura, abierta, que cumple con los estándares de la industria para que los científicos de datos puedan usar el lenguaje de programación y las librerías que deseen mientras colaboran entre ellos. Esto nunca fue fácil debido a lo comentado anteriormente.

Hablando de científicos de datos, ¿es difícil encontrar buenos profesionales en este campo?

La comunidad de científicos de datos está muy demandada desde hace tiempo y no es fácil encontrarlos. Juegan un rol muy, muy importante en las empresas a la hora de detectar patrones matemáticos y extraer el valor que realmente tienen los datos para las empresas, pero además de esto tienen que entender exactamente el negocio para poder ayudar a mejorarlo. Es, sin lugar a dudas, un perfil realmente duro. Desde Cloudera estamos trabajando muy de cerca con esta comunidad para desarrollar mejores productos.

Pasemos a la Inteligencia Artificial. ¿Deberíamos como ciudadanos preocuparnos por los importantes avances que se están produciendo en este campo?

Es una pregunta muy interesante. No nos tenemos que preocupar por la Inteligencia Artificial. Cuando la gente piensa en ella le vienen a la mente películas como Terminator. Pero esto es sólo ficción.  La Inteligencia Artificial no es nueva, en su forma más simple es Machine Learning y hemos estado desarrollando este concepto desde hace más de 30 años. La diferencia es que ahora es posible ejecutar procesos de aprendizaje de máquina directamente desde un portátil, desde un smartphone. Y esa Inteligencia Artificial no debería preocuparnos, sino todo lo contrario. Nos estamos valiendo de ella para mejorar nuestras vidas, no para empeorarlas. Tenemos que ser positivos con estos avances.