Mozilla ha estado recabando muestras de voz a través de su proyecto Common Voice. Y, ahora, ha decidido lanzar la primera versión de una gran colección de voces que se caracteriza por ser de dominio público.
De hecho, sus responsables dicen que “ya es el segundo mayor conjunto de datos de voz disponible para el público que conocemos”. Y a esto habría que añadir que “personas de todo el mundo están añadiendo y validando nuevas muestras todo el tiempo”. Aunque de momento las muestras que se ofrecen están en inglés, Mozilla asegura que pronto se seguirá con “todos los idiomas”.
El repositorio actual cuenta con unas 400.000 grabaciones que pertenecen a 20.000 personas distintas. En total serían 500 horas de discurso.
El objetivo de Mozilla con Common Voice es ayudar a desarrolladores, fabricantes, empresas e investigadores a la hora de trabajar con tecnología habilitada por voz.
“La mayoría de nosotros solamente tenemos acceso a una colección bastante limitada de datos de voz”, explican desde Mozilla, añadiendo que esto es “un componente esencial para crear motores de reconocimiento de voz de alta calidad”. Además, “estos datos de voz pueden costar más de decenas de miles de dólares y su escala es insuficiente para crear un reconocimiento de voz a un nivel que espera la gente”.
“Al proporcionar este nuevo conjunto de datos públicos”, concluye Mozilla, “queremos ayudar a superar estas barreras y facilitar la creación de nuevos y mejores sistemas de reconocimiento de voz”. Entre ellos, su propio Deep Speech.
Bienvenido a un nuevo episodio del podcast semanal Silicon Pulse, un espacio en el que…
El autodenominado “sistema operativo de trabajo” busca ser más que una plataforma de colaboración y…
Su propuesta consta de tres modelos, con 1.300, 2.600 y 7.000 millones de parámetros.
Los modelos ECS205L y ECS208L, en formatos de 5 y 8 puertos, se caracterizan por…
Durante 2024 esta categoría rebasó a la de servidores corporativos en la nube comprometidos.
Con esta función, las empresas pueden realizar y recibir llamadas de voz con sus números…