Categories: Innovación

¿Qué es Google Duplex?

La manera en la que interactuamos con la tecnología está cambiando radicalmente a causa de la innovación mediante la voz. Un ejemplo de este cambio es el sistema Google Duplex, basado en inteligencia artificial, que crea nuevas experiencias de voz que ayudan a realizar tareas por teléfono como programar una cita, hacer una reserva, etc.

Con esta nueva mecánica, Google simplifica todavía más tareas como realizar llamadas telefónicas o enviar mensajes y ahí es donde entra en juego Duplex, que ofrece la oportunidad de gestionar estas tareas de manera sencilla.

Pero, ¿qué hay detrás de esta idea? ¿Cómo funciona Duplex?

Este servicio está integrado con el Asistente de Google y solamente tenemos que pedirle, mediante la voz, que haga una reserva en un determinado restaurante, por ejemplo, e introducir algunos parámetros como el número de personas, la fecha, la hora y el nombre de quien reserva. Una vez hecho esto, el Asistente de Google utilizará automáticamente Duplex para hacer una llamada telefónica a ese restaurante y reservar por ti; después te enviará una confirmación. Duplex imitará a un humano para que la conversación telefónica sea natural.

Este es el gran éxito de Duplex: la conversación de las llamadas telefónicas puede imitar a un humano con voces de personas reales e incluso añade interjecciones como ‘hum’ para que parezca más humano. Duplex también reproduce fielmente las cadencias de las conversaciones, como puede ser la latencia en las respuestas. Por ejemplo, si la persona dice «¿hola?», tiene que responder rápidamente, pero si dice una frase muy larga, debe tomarse un tiempo antes de responder para imitar el tiempo de reflexión.  Google ha conseguido con Duplex un sistema muy avanzado, aunque en algunos momentos hace alguna inflexión poco natural y robótica, pero son lo suficientemente pequeñas como para que nadie al otro lado del teléfono piense mucho en ello, si es que lo notan.

Aunque Duplex en las tareas básicas es muy preciso, también necesita mejoras, como gestionar fácilmente algunas declaraciones complejas o los problemas con el ruido de fondo o la calidad del sonido. Para estas situaciones en las que no puede completar su tarea, Google Duplex ha incorporado un mecanismo de seguridad para que un operador humano complete la tarea.

La tecnología que usa Duplex está basada en el procesamiento del lenguaje natural. Para ello, se necesita un traductor de voz a texto preciso con el que entender lo que le dice la persona al teléfono. A continuación, otro modelo tiene que interpretar el contexto del objetivo de la llamada telefónica y luego hay que crear una respuesta adecuada. Finalmente, un modelo de conversión de texto a voz traduce esta respuesta en una voz similar a la humana que la diga por teléfono. Estos pasos deben repetirse constantemente a lo largo de la llamada telefónica en tiempo real, por lo que los modelos deben ser precisos y rápidos.

Google Duplex utiliza una red neuronal recurrente combinada con la tecnología de reconocimiento automático del habla (RAH o, en inglés, ASR: automatic speech recognition) de Google, los parámetros de la conversación (por ejemplo: la hora deseada, los nombres) y un sistema de conversión de texto a voz (TTS: text-to-speech en inglés).

Ana Suárez

Recent Posts

Así están aprovechando los ciberdelincuentes la campaña de la Renta en España

Páginas web similares a las de la Agencia Tributaria, emails y SMS de phishing y…

8 horas ago

Las 6 transformaciones de la IA en la Gestión Contable

Desde ARBENTIA explican cómo la Inteligencia artificial está transformando la Gestión Contable.

8 horas ago

Joppy se hace con el negocio de su competidor Rviewer

La compañía española especializada en reclutamiento tecnológico anuncia también la captación de más de medio…

9 horas ago

Telefónica Tech completa la comercialización de la gama de soluciones Webex by Cisco

Lanza el servicio Webex Calling, que reemplaza los sistemas de telefonía empresarial convencionales y las…

9 horas ago

Check Point Software consigue mejores ingresos y ganancias de lo esperado

Sus ingresos del primer trimestre rozaron los 600 millones de dólares, mientras que los beneficios…

10 horas ago

IBM refuerza sus operaciones de seminconductores en Canadá

Ha llegado a acuerdos con las Administraciones para invertir alrededor de 187 millones de dólares…

11 horas ago