IBM afina su tecnología de reconocimiento del habla a niveles casi humanos

El Gigante Azull considera que lograr paridad en reconocimiento del habla con las personas “es sólo una cuestión de tiempo”.

Además de presentar avances en almacenamiento, IBM ha anunciado durante las últimas horas un nuevo logro que tiene que ver con el reconocimiento de voz.

El Gigante Azul ha perfeccionado su tecnología para reconocer conversaciones hasta tal punto que la capacidad y las probabilidades de éxito de su sistema se encuentran ya muy cerca de la capacidad humana. Según ha explicado la empresa, su tasa de error se encuentra ahora mismo en el 5,5 %, todo un récord. Hace tan sólo seis meses había conseguido situarla en el 6,9 %, y ahora se reduce otro 20 %.

Para saber lo precisa que es una tecnología de este tipo, se hacen mediciones respecto a la paridad humana teniendo en cuenta la tasa de error que se produce entre dos personas que conversan. Tal y como recuerda IBM, esta tasa parecía estar en el 5,9 %. En asociación con Appen, la ha evaluado de nuevo. En estos momentos se situaría en el 5,1 %.

“Estos desarrollos del habla se basan en décadas de investigación y consiguen un reconocimiento del habla comparable al de los humanos es una tarea compleja”, comenta Michael Karasick, vicepresidente de IBM para Cognitive Computing.

“En IBM”, señala Karasick, “nos dedicamos a crear la tecnología que un día se igualará con la complejidad de cómo interactúan el oído humano, la voz y el cerebro. Este progreso tendrá importantes implicaciones para la forma en la que el hombre y la máquina colaborarán en el futuro, haciendo las interacciones más naturales y productivas”.

“Creemos que es sólo una cuestión de tiempo antes de lograr paridad en el reconocimiento del habla con los seres humanos”, concluye Michael Karasick.