Los servicios cognitivos de Microsoft incorporan una app de reconocimiento de voz

La nueva Custom Speech Service se añade al conjunto de herramientas Cognitive Services de la compañía y a la colección de APIs que los desarrolladores pueden usar para construir aplicaciones de aprendizaje e inteligencia artificial.

Microsoft ha incorporado la nueva Custom Speech Service a su colección de herramientas de inteligencia artificial y aprendizaje automático para ayudar a los desarrolladores a crear aplicaciones cognitivas de reconocimiento de voz.

Custom Speech Service, actualmente disponible en vista previa, aborda algunas de las deficiencias de los sistemas de reconocimiento de voz, como entornos ruidosos y diferentes estilos del habla. La nueva app permite a los desarrolladores crear modelos de lenguaje personalizados que adapten el discurso de un usuario al vocabulario de una aplicación, a los entornos o al número de usuarios que se espera que una app tenga en cuenta.

“Bajo Custom Speech Service se aprovecha un algoritmo que cambia el reconocimiento de voz existente de Microsoft a los datos suministrados por el desarrollador”, ha explicado John Roach, miembro del equipo de Microsoft Research, en un post.

Microsoft también ha anunciado otras dos ofertas cognitivas, Content Moderator y Bing Speech API, que estarán disponibles en marzo.

Los desarrolladores podrán utilizar Content Moderator para detectar blasfemias en más de 100 idiomas en formato texto. También, como una mejora de seguridad, la solución permite detectar URLs de phishing, información de identificación personal y buscar malware.

Por su parte, Bing Speech API permitirá convertir el audio hablado en texto en tiempo real o desde dentro de un archivo multimedia.