Éxito en las investigaciones de Microsoft sobre reconocimiento de voz

Los investigadores de la compañía de Redmond han conseguido reducir la tasa de error de palabras a un mínimo histórico, al 6,3 %.

Las investigaciones que está acometiendo Microsoft en temas de reconocimiento del habla, o reconocimiento de voz, están dando sus frutos.

Según ha anunciado la compañía de Redmond, su equipo ha conseguido reducir la tasa de error de palabras (conocida por las siglas WER) a mínimos históricos. En una evaluación de benchmark realizada con el estándar Switchboard, ha bajado dicha tasa al 6,3 %. Hasta ahora la mejor marca de IBM, que también trabaja en estas cuestiones, ha sido del 6,6 %.

“Este nuevo hito se ha beneficiado de una amplia gama de nuevas tecnologías desarrolladas en la comunidad de Inteligencia Artificial por parte de muchas organizaciones diferentes durante los últimos 20 años”, indica Xuedong Huang, jefe científico para temas de voz de Microsoft. Hace justo dos décadas la tasa WER más favorable era de más del 43 %.

Gracias a este logro, Microsoft espera poder avanzar en la creación de experiencias personales con tecnologías como Cortana o Skype Translator. Entre sus objetivos, tal y como explican sus responsables, están crear sistemas de Inteligencia Artificial capaces de anticiparse a las peticiones de los usuarios y que, además de oír, hablen, vean y, sobre todo, entiendan.

Bajar la tasa de error de palabras da esperanzas para conseguir máquinas que comprendan el habla de la gente tan bien como los propios humanos.