Las cuatro V de Big Data

Por Carles Zaragoza, Técnico Preventa de Terracotta Software AG desmenuza las cuatro Vs de Big Data: volumen, variedad, velocidad y valor de negocio.

El término Big Data, hoy en día en boca de todos, se refiere a la cantidad ingente de información que no puede ser manejada por las tradicionales herramientas de gestión de bases de datos y estrategias de computación. Sin embargo, el concepto no hace referencia simplemente al tamaño de la información, como su nombre podría indicar, sino también a la variedad del contenido y a la velocidad con la que los datos se generan, almacenan y analizan. Estas dimensiones son las tres V que definen el Big Data, es decir volumen, velocidad y variedad, pero debemos añadir una cuarta V realmente importante, la del valor que tiene el dato para el negocio.

Más que nunca, debido a la crisis económica, las empresas deben gestionar todo este volumen de información, estructurada y no estructurada, proveniente de distintas fuentes, para mejorar la toma de decisiones de negocio. Por ello, cada vez son más las que adoptan herramientas que les permiten extraer conocimiento de sus datos. Las empresas españolas no son ajenas a este fenómeno global, pero es cierto que el proceso de adopción de estas herramientas es más lento si lo comparamos con otros países europeos. No obstante, sectores como la Banca, la industria energética o las Telecomunicaciones son ya conscientes de que para ser competitivos deben ser capaces de interpretar todos los datos que generan.

La adopción de tecnologías de gestión de Big Data va a aumentar la competitividad de las empresas españolas, permitiendo realizar procesos antes impensables como, por ejemplo, realizar una oferta personalizada a clientes y en tiempo real, analizar el sentimiento de los clientes para tomar acciones especificas, aumentar la proactitivad en la atención y supervisión de incidencias, el control de la demanda energética en tiempo real, mejorar los tiempos de acceso a los sistemas de información, etc.

Y es que, son muchos los datos que pueden ser representados también de diversas maneras, estamos hablando, por ejemplo, de información proveniente de procesos de negocio, bases de datos tradicionales, redes sociales, dispositivos móviles, audio, vídeo, sistemas GPS, sensores digitales que miden y transmiten el posicionamiento, movimiento o temperatura, etc. Las aplicaciones que analizan estos datos requieren que la velocidad de lectura, análisis y respuesta mediante eventos o alertas, sea lo mayor posible y en el momento preciso. Estas son las características principales de las oportunidades de negocio que permite el aprovechamiento del Big Data.

Aunque las potencialidades del Big Data parecen infinitas, su utilidad depende de cómo se procesen en tiempo real estos volúmenes de información. El instituto McKinsey Global anticipa que los recursos de este sector se multiplicarán durante los próximos años y estima que para 2018 cerca de 200.000 personas trabajarán directamente en el análisis de datos sólo en Estados Unidos y casi 1,5 millones de usuarios los utilizarán para tomar decisiones corporativas.

Implementar una solución alrededor de Big Data implica la integración de diversos componentes y arquitecturas. Esta plataforma requiere módulos para tratar a gran escala y de forma distribuida grandes volúmenes de información de todo tipo. Existen aproximaciones basadas en computación distribuida en memoria, en la nube y de código abierto. De código abierto son Hadoop, un framework sumamente popular que permite a las aplicaciones trabajar con enormes repositorios de datos y cientos de nodos, ehCache para gestionar terabytes de datos directamente en memoria, MapReduce, Google File System y sistemas de bases de datos no relacionales necesarios para albergar y procesar la enorme complejidad de datos de todo tipo, como NoSql o Cassandra. Muchos de estos proyectos de código abierto se están utilizando por los fabricantes de software como base de la construcción de soluciones comerciales completas y preparadas para un entorno empresarial.

El futuro del Big Data se presenta apasionante y lleno de oportunidades para las empresas españolas. Es un cambio disruptivo en las organizaciones, una nueva realidad que transforma el mercado generando nuevos retos en su capitalización.