Microsoft presenta Spark Connector para Azure DocumentDB

El gigante del software ha hecho el anuncio durante la conferencia Strata + Hadoop World junto con varias nuevas actualizaciones del gran ecosistema de datos de la compañía.

Microsoft se ha tomado en serio convertirse en el proveedor de servicios de Big Data en la nube para los clientes de Azure.

La compañía ha presentado un nuevo conector Apache Spark para Azure DocumentDB, entre varias nuevas incorporaciones a su cartera de soluciones de grandes datos durante la conferencia de Big Data Strata + Hadoop World, celebrada en San José, California (EEUU).

En total, las nuevas incorporaciones están pensadas para ayudar a las empresas a integrar sistemas flexibles y de alto rendimiento para el procesamiento y análisis de datos en la nube.

Apache Spark es el motor de procesamiento de datos de código abierto, fácil de desarrollar, con la capacidad de acortar las cargas de trabajo de Big Data y permitir análisis sofisticados. “Combinado con Azure DocumentDB, el servicio de documentos NoSQL de Microsoft, la tecnología permitirá a partir de ahora a los clientes de Azure implementar la ciencia de datos y obtener información en tiempo real”, ha afirmado Dharma Shukla, ingeniero y director general de software libre de analítica y NoSQL de Microsoft.

“Conectando Apache Spark a Azure DocumentDB aumentamos la capacidad de nuestros clientes para resolver problemas de la ciencias de datos en rápido movimiento, pudiendo recuperrar rápidamente los datos usando DocumentDB“, ha afirmado Shukla.

Microsoft también ha anunciado la disponibilidad general de nuevas API MongoDB (interfaces de programación de aplicaciones) para DocumentDB. Con el respaldo de los acuerdos de nivel de servicio empresarial, las API permiten que las aplicaciones basadas en las bases de datos NoSQL de MongoDB “direccionen” los datos de DocumentDB utilizando sus actuales controladores y conjuntos de herramientas.

Microsoft también ha anunciado que SQL Server Community Technology Preview (CTP) 1.4 para Windows y Linux estará disponible en los próximos días. Además de algunos ajustes específicos de Linux, éste contendrá funciones de reconstrucción de índices añadiendo cierta flexibilidad a bases de base de datos de administrador congestionadas (DBA).

Lea también : Google Cloud presenta BigLake, su nueva herramienta de análisis de datos