Apache Drill: Acelerando las consultas de Big Data en Hadoop

Este proyecto intentará crear una versión de código abierto de Dremel, unas herramientas que Google ya utiliza para realizar análisis internos de datos.

Encontrar formas mucho más veloces para completar las consultas de Big Data por parte de los usuarios corporativos en el framework Hadoop. Ése es el objetivo fundamental de “Drill”, el último proyecto en recibir el espaldarazo de la Fundación Apache y, por lo tanto, en ocupar un hueco en su incubadora.

“Hemos pasado unos cuantos meses hablando con un montón de organismos y usuarios potenciales, así como con nuestra base de clientes actual. Queríamos lanzar nuestro producto como un proyecto de código abierto, en lugar de guardarlo para nuestro uso exclusivo””, comenta Tomer Shiran, director de gestión de producto en MapR Technology y miembro fundador de Drill, que destaca su potencial para “obtener respuestas mucho más rápido, en cuestión de un sólo segundo”.

Para cumplir con su cometido, los desarrolladores de Drill intentarán crear una versión open source de las herramientas Dremel que Google ya utiliza para acelerar sus análisis de datos internos.

Además, se espera potenciar los “análisis interactivos” frente al clásico procesamiento de información por lotes, tanto si se están buscando anomalías en los patrones de uso, tendencias de datos o incluso intrusiones en la red.

Y es que para todo eso “se necesita conseguir una respuesta bastante rápida”, recalca Shiran, “porque si no, en el momento en el que finalmente lo averiguas, puede convertirse en noticias caducadas”.