Las investigaciones que está acometiendo Microsoft en temas de reconocimiento del habla, o reconocimiento de voz, están dando sus frutos.
Según ha anunciado la compañía de Redmond, su equipo ha conseguido reducir la tasa de error de palabras (conocida por las siglas WER) a mínimos históricos. En una evaluación de benchmark realizada con el estándar Switchboard, ha bajado dicha tasa al 6,3 %. Hasta ahora la mejor marca de IBM, que también trabaja en estas cuestiones, ha sido del 6,6 %.
“Este nuevo hito se ha beneficiado de una amplia gama de nuevas tecnologías desarrolladas en la comunidad de Inteligencia Artificial por parte de muchas organizaciones diferentes durante los últimos 20 años”, indica Xuedong Huang, jefe científico para temas de voz de Microsoft. Hace justo dos décadas la tasa WER más favorable era de más del 43 %.
Gracias a este logro, Microsoft espera poder avanzar en la creación de experiencias personales con tecnologías como Cortana o Skype Translator. Entre sus objetivos, tal y como explican sus responsables, están crear sistemas de Inteligencia Artificial capaces de anticiparse a las peticiones de los usuarios y que, además de oír, hablen, vean y, sobre todo, entiendan.
Bajar la tasa de error de palabras da esperanzas para conseguir máquinas que comprendan el habla de la gente tan bien como los propios humanos.
Mejora su plataforma para ayudar a gestionar los riesgos asociados a una adopción masiva de…
Sin embargo, aumentaron los incidentes con gravedad media o baja. Los expertos advierten sobre la…
La pérdida por acción GAAP de la compañía menguó hasta los 0,09 dólares durante el…
Ubicado en Estambul, permite revisar el código fuente de los productos, actualizaciones de software y…
Durante el primer trimestre de su año fiscal 2024 alcanzó los 378,6 millones de dólares.
La compañía californiana ha sufrido descensos en el segmento de productos, como los iPhone, pero…