Microsoft amplía su línea de Big Data Analytics basada en la nube |

El gigante del software ha presentado nuevos avances de R Server para HDInsight, actualizaciones de Spark para HDInsight y la disponibilidad general de Azure Data.

Durante la conferencia mundial Strata + Hadoop del año pasado, Microsoft abrazó Linux en un impulso para atraer a las empresas a su creciente cartera de oferta de Big Data basada en la nube.

Este año, la compañía ha ampliado el soporte para R, el lenguaje de programación estadístico popular entre los científicos de datos y desarrolladores para la integración de aplicaciones de Big Data y el descubrimiento de datos de autoservicio.

Microsoft anunció el 29 de marzo una versión preliminar de R Server para Azure HDInsight, la distribución de Microsoft basada en la nube para la plataforma de procesamiento de grandes volúmenes de datos Hadoop. Tras la adquisición el año pasado de Revolution Analytics, el principal patrocinador del lenguaje R de código abierto, Microsoft R Server ha sustituido a Revolution R Enterprise.

“Recogemos el conjunto más completo de algoritmos para el aprendizaje automático (machine learning) y funciones estadísticas en la nube, aprovechando Hadoop y Spark”, ha afirmado Joseph Sirosh, vicepresidente de Microsoft Data Group, como destaca eWeek.

Para aplicaciones de Big Data a gran escala, Microsoft ha actualizado Spark para Azure HDInsight a la versión 1.6 de Apache Spark. Desde que en 2010 se hiciera open source, las empresas han adoptado de forma generalizada Spark debido a que es un motor de procesamiento de datos muy rápido, con capacidades analíticas sofisticadas y su facilidad de uso de comparativas.

En esta última aplicación, la compañía ha mejorado 10 veces el rendimiento de gestión, de acuerdo con Sirosh. La actualización también incluye nuevos algoritmos de aprendizaje automático y de gestión de memoria automática.

Por otro lado, el catálogo de Azure Data ya está disponible desde el 30 de marzo. El servicio permite a las empresas mantener un repositorio de metadatos, que a su vez permite el descubrimiento de datos de autoservicio, un primer paso crucial para ayudar a los desarrolladores, analistas de negocio y los científicos de datos a extraer conocimiento de los datos de sus organizaciones.

Lea también : Cisco lanza Hypershield para securizar centros de datos y nubes en la era de la IA