Yahoo abre 13,5 TB de datos para la innovación de Machine Learning

El mundo académico podrá estudiar cómo transformar los datos de tecnologías de aprendizaje automático y utilizarlos para nuevos objetivos.

Yahoo ha liberado el mayor conjunto de datos para su uso por la comunidad académica con el objetivo de fomentar la evolución de las tecnologías de aprendizaje automático (machine learning).

Suju Rajan, director de investigación de Yahoo Labs, ha afirmado que el fin es fomentar la innovación.

“Muchos investigadores y científicos de datos no tienen acceso a bases de datos de gran escala, un privilegio tradicionalmente reservado a las grandes empresas”, ha afirmado el directivo.

“El acceso a bases de datos de este tamaño es esencial para diseñar y desarrollar algoritmos para el aprendizaje automático y tecnologías a la escala real del Big Data”, ha afirmado Gert Lanckriet, profesor del departamento de ingeniería informática de la Universidad de California en San Diego.

Yahoo ha registrado ya una lista de socios académicos para aprovechar estos datos, que son de naturaleza anónima y que muestran la interacción de aproximadamente unos 20 millones de usuarios con diferentes productos de Yahoo, como Yahoo Finanzas, Deportes, Películas, Inmobiliario, Noticias y la página principal de inicio.

En total el gigante tecnlógico ha liberado 13,5 terabytes (TB) de datos sin comprimir con más de 110.000 millones de eventos entre febrero y mayo de 2015.