Categories: AppsCloudMovilidad

Google lanza Cloud Text-to-Speech para desarrolladores

Los desarrolladores nos han estado diciendo que les gustaría agregar texto a voz a sus propias aplicaciones, por lo que hoy traemos esta tecnología a Google Cloud Platform” explica Google en su web.

Los sistemas de texto a voz se han estado desarrollando durante años hasta que actualmente muchas de las aplicaciones que se usan en el día a día los incorporan. El sistema Cloud Text-to-Speech de Google cuenta con 32 voces diferentes en 12 idiomas. Los desarrolladores podrán personalizar el tono, la velocidad de conversación y la ganancia de volumen de los archivos MP3 o WAV que genera el servicio.

Esta solución se puede utilizar para habilitar dispositivos IoT, convertir textos como libros o noticias en audiolibros o podcasts, además, de alimentar sistemas de respuestas de voz para centros de llamadas, entre otros.

De las 32 voces, algunas han sido creadas por WaveNet, el modelo de DeepMind capaz de crear el audio en bruto a partir del texto. Esto quiere decir, que en vez de crear la voz basándose en una colección de fragmentos cortos de voz, el modelo WaveNet utiliza un modelo de aprendizaje automático lo que permite que la voz suene más real y no tan robótica como las que estamos acostumbrados.

Además, el nuevo modelo WaveNet genera formas de onda mil veces más rápido que el original y puede generar un segundo de voz en 50 milisengundos.

Silicon Redacción

La redacción de Silicon está compuesta por periodistas y redactores especializados en Tecnologías de la Información y Comunicaciones.

Recent Posts

Los envíos de tabletas vuelven a crecer

Durante el primer trimestre del año aumentaron un 0,5 % hasta los 30,8 millones de…

2 horas ago

AWS re/Start se expande a nuevas regiones en España

Su programa formativo permite a personas desempleadas o subempleadas ganar habilidades en tecnología cloud y…

4 horas ago

El ‘phishing’ se dispara un 60 % en un año

Los nuevos ataques se apoyan en esquemas impulsados por la inteligencia artificial, como el 'vhishing'…

5 horas ago

HUAWEI presenta su nueva serie de smartphones: Pura 70

Los primeros integrantes de la familia HUAWEI Pura son los modelos Pura 70, Pura 70…

5 horas ago

Proofpoint lanza prevención para la pérdida de datos multicanal

Proofpoint DLP Transform funciona en los principales canales: correo electrónico, nube, endpoint y web.

6 horas ago

Los ingresos de Cyberark se disparan un 37 %

Además, la compañía dejó atrás las pérdidas durante el primer trimestre de 2024.

7 horas ago