Facebook logra traducir entre un centenar de idiomas sin basarse en el inglés

En el mundo existen 7000 idiomas diferentes. En España, por ejemplo, hay varias lenguas que son oficiales junto al castellano.

Para no perder esa riqueza y, al mismo tiempo, facilitar la comunicación, la industria tecnológica trabaja en herramientas de traducción que permitan reconocer al instante qué dice un texto o qué está contando la persona que se tiene delante aunque hable en un idioma desconocido. Aquí la inteligencia artificial juega un papel fundamental.

Facebook está investigando en esta parcela y ha anunciado un hito: un modelo de traducción automática multilingüe masivo. Bautizado como M2M-100, es capaz de traducir 100 idiomas diferentes en cualquier dirección sin pasar necesariamente por el inglés, como suele ocurrir en estos casos.

Otros sistemas de traducción se apoyan en modelos de inteligencia artificial separados para cada idioma o confían en el inglés como punto de referencia. “Es mucho más fácil encontrar traducciones del chino al inglés y del inglés al francés que, digamos, del francés al chino”, explica la ayudante de investigación Angela Fan. ¿Por qué? “Porque los datos de entrenamiento en inglés son los más disponibles”.

Facebook ha tomado otro camino y ha decidido construir un conjunto de datos diverso, con 7500 millones de oraciones paralelas en un centenar de idiomas.

Para ello, ha usado técnicas de escalado que le han permitido construir un modelo con 15 000 millones de parámetros. Ha aprovechado recursos de minería de datos ya existentes como ccAligned, ccMatrix y LASER. Y ahora publica su trabajo como código abierto a través de GitHub.

La red social asegura que este nuevo modelo multilingüe ha conseguido una mejora de 10 puntos en la métrica BLEU de evaluación de traducciones respecto a alternativas centradas en el inglés.

Mónica Tilves

Licenciada en Xornalismo por la Universidad de Santiago de Compostela en la especialidad de Periodismo Electrónico y Multimedia. Apasionada de los gadgets, la fotografía digital, el diseño web y el arte. Tras un primer contacto con el mundo de la prensa escrita y con la suficiencia investigadora debajo del brazo, me decanto por los medios online. Cubro la actualidad informativa en Silicon Week desde 2011, además de colaborar en otras publicaciones del grupo NetMediaEurope en España como Silicon News. Ahora en Silicon.es.

Recent Posts

Samsung y su inteligencia artificial buscan respaldar a las pymes en España

Desde Samsung destacan la relevancia de los nuevos dispositivos con IA para mejorar las operativas…

10 horas ago

La privacidad, el talento y los presupuestos, tres desafíos para la innovación

Un 68 % de los profesionales encuestados por Dell Technologies teme que la IA generativa…

11 horas ago

Snowflake lanza Arctic

Arctic, de Snowflake, es un LLM empresarial con licencia Apache 2.0 que establece un estándar…

12 horas ago

HPE Aruba Networking anuncia nuevos puntos de acceso WiFi 7

Sus soluciones son capaces de utiliza por completo las bandas de 5 y 6 GHz,…

13 horas ago

Lenovo ahonda en la era de la inteligencia artificial con tres PC ThinkCentre M75

Introduce los ordenadores ThinkCentre M75t Gen 5, ThinkCentre M75s Gen 5 y ThinkCentre M75q Gen…

14 horas ago

CrowdStrike Falcon XDR incluirá los servicios de IA de NVIDIA

CrowdStrike y NVIDIA se unen para prevenir problemas con la creación de modelos de seguridad…

14 horas ago