Proyecto Serengeti: Hadoop entra de lleno en la esfera virtual

VMware ha puesto a disposición de los usuarios un kit de herramientas gratuitas bajo licencia Apache 2.0 que ayudará a automatizar las cargas de trabajo del famoso framework open source en la nube.

VMware ha anunciado el lanzamiento de un nuevo proyecto open source bautizado como Serengeti, cuyo objetivo es permitir a las empresas “implementar, administrar y escalar” el framework Hadoop de la forma más rápida y sencilla posible en entornos cloud y virtuales.

En la práctica este proyecto cuenta con un set de herramientas que ya está disponible para descarga en GitHub, con un sólo cick y bajo licencia Apache 2.0. Adicionalmente, VMware también ha decidido ofrecer una versión compilada como binaria en un appliance virtual capaz de funcionar con vSphere. Y para ello ha contado con la colaboración directa de otras compañías como Cloudera, Greenplum, HortonWorks y MapR, que han ayudado al desarrollo del código que permitirá automatizar el despliegue de cargas de trabajo Hadoop en una infraestructura virtual.

Además de impulsar esta iniciativa de código abierto, VMware contribuirá con la creación de extensiones para Apache Hadoop que adapten sus componentes al fenómeno de la virtualización, contribuyendo a una mejor escalabilidad y rendimiento en entornos virtuales.

La compañía también ha aprovechado la ocasión para liberar una actualización de otro proyecto open source conocido como Spring para Apache Hadoop. Éste se estrenó el pasado mes de febrero y facilita a los desarrolladores la construcción de aplicaciones distribuidas con Hadoop. La revisión de VMware contempla la integración con bases de datos HBase, Cascading y mayor seguridad. También ha sido publiicada con licencia Apache 2.0.