Press release

El Instituto de Innovación Tecnológica anuncia el lanzamiento de NOOR, el modelo de PNL en árabe más grande del mundo

0
Patrocinado por Businesswire

El Instituto de Innovación Tecnológica (Technology Innovation Institute, TII), un centro de investigación global y pilar de investigación aplicada del Consejo de Investigación de Tecnología Avanzada de Abu Dabi, anunció hoy el lanzamiento de NOOR, el modelo de procesamiento de lenguaje natural (natural language processing, NLP) en árabe más grande del mundo hasta la fecha.

Este comunicado de prensa trata sobre multimedia. Ver la noticia completa aquí: https://www.businesswire.com/news/home/20220411005089/es/

Noor, the world's largest Arabic NLP Model - AI Cross-Center Unit, Technology Innovation Institute (Photo: AETOSWire)

Noor, the world’s largest Arabic NLP Model – AI Cross-Center Unit, Technology Innovation Institute (Photo: AETOSWire)

El equipo de investigadores avanzados y especialistas en inteligencia artificial (IA) de TII ha unido fuerzas con LightOn, una empresa de tecnología que desbloquea la inteligencia artificial a escala extrema para empresas, para transformar el modelo de PNL en árabe. El modelo NOOR tiene la capacidad de llevar a cabo tareas más allá del dominio del lenguaje, al ofrecer datos de alta calidad de canalización de extremo a extremo, incluido el rastreo, el filtrado y la conservación a escala. El modelo facilita la capacitación y el servicio distribuidos a escala extrema, para entregar aplicaciones con inferencia eficiente y especialización de modelos.

El Dr. Ray O. Johnson, director ejecutivo de TII y ASPIRE, afirmó: “Con este desarrollo, estamos bien encaminados a mejorar nuestras capacidades y credenciales de investigación, así como a elevar el estatus de Abu Dabi y los Emiratos Árabes Unidos como un ecosistema de investigación serio. Nuestros equipos de expertos han demostrado una vez más que esta región puede lograr resultados de investigación y desarrollo innovadores para impactar al mundo”.

El Dr. Ebtesam Almazrouei, director de la Unidad de Centro Cruzados de IA de TII, señaló: “Los grandes modelos de lenguaje han tomado al mundo del procesamiento del lenguaje natural por sorpresa, y estamos orgullosos de presentar este modelo de vanguardia con 10 000 millones de parámetros: el modelo de PNL en árabe más grande del mundo. El conjunto de datos en árabe excepcionalmente grande recopilado para entrenar el modelo es el resultado de meses de trabajo que incluyeron la selección, la eliminación y el filtrado de diversas fuentes. Un agradecimiento especial a todo el equipo que trabajó en este proyecto para hacer de NOOR el modelo de exploración en árabe preferido para académicos y empresas de todo el mundo”.

Al referirse al lanzamiento, el Prof. Mérouane Debbah, investigador jefe del Centro de Investigación de Ciencias Digitales y Unidad de Centro Cruzados de IA de TII, señaló: “Con NOOR, TII ha ampliado el alcance del modelo estándar moderno en árabe al aprovechar el conocimiento en modelos de idiomas grandes para desarrollar experiencia interdisciplinaria y de vanguardia en esta nueva generación de investigación de IA”.

Para seleccionar los conjuntos de datos en árabe de múltiples dominios de alta calidad más grandes del mundo, el conjunto de datos único de NOOR de más de 30 000 millones de palabras combina datos web con libros, poesía, artículos de noticias e información técnica para ampliar significativamente la aplicabilidad del modelo.

El Dr. Ebtesam Almazrouei dijo que el modelo NOOR está basado en la popular arquitectura de transformador. Como modelo de solo decodificador, similar en estructura a GPT-3, está programado para abordar tareas generativas con una arquitectura actualizada para reflejar los últimos desarrollos en el mundo del aprendizaje automático, incluidas algunas mejoras como mejores incrustaciones posicionales. Para ayudar a garantizar la calidad a escala en el conjunto de datos de NOOR, el equipo de TII diseñó una tubería de filtrado automatizada basada en técnicas de aprendizaje automático. Estas herramientas identifican el texto como referencias de calidad y protegen el modelo de la exposición al contenido spam.

Aprovechando el paralelismo 3D de última generación, NOOR se capacitó en un recurso informático de alto rendimiento con 128 GPU A100, lo que permite la distribución de los cálculos y garantiza el uso eficiente de los recursos de hardware disponibles.

El director de la Unidad de Centro Cruzados de IA señaló que este fue solo el primer paso en los esfuerzos de la Unidad para contribuir de forma más amplia a la Estrategia de los EAU para la Inteligencia Artificial.

Llamado así por la palabra árabe “luz”, el modelo ha sido llamado así para establecer la correlación del modelo del idioma árabe con la iluminación de la mente.

Acerca del Instituto de Innovación Tecnológica (TII)

Para obtener más información, visite www.tii.ae

*Fuente: AETOSWire

El texto original en el idioma fuente de este comunicado es la versión oficial autorizada. Las traducciones solo se suministran como adaptación y deben cotejarse con el texto en el idioma fuente, que es la única versión del texto que tendrá un efecto legal.