Ya está disponible la serie AMD Instinct MI300

AMD ya tiene lista y disponible en el mercado una nueva familia de aceleradores AMD Instinct MI300.

Se trata de los AMD Instinct MI300X, que prometen mejorías en ancho de banda de memoria para inteligencia artificial generativa, con un máximo de 5,3 TB/s.

Estos aceleradores funcionan con la arquitectura AMD CDNA 3. Cuentan con 192 GB de capacidad de memoria HBM3 y potencian el rendimiento para el entrenamiento y la inferencia de modelos de lenguaje grandes.

En comparación con los anteriores MI250X, ofrecen 1,5 veces más capacidad de memoria, 1,7 veces más ancho de banda de memoria teórica máxima y alrededor de un 40 % más de unidades de cómputo. También introducen soporte para FP8 y sparsity.

AMD ha presentado también la unidad de procesamiento acelerado Instinct MI300A con GPU CDNA 3 y CPU Zen 4.

Esta APU de centro de datos para computación de alto rendimiento e inteligencia artificial, aprovecha la arquitectura AMD Infinity de cuarta generación. Con 128 GB de memoria HBM3, ofrece casi el doble de rendimiento por vatio en cargas de trabajo que MI250X.

“Los aceleradores AMD Instinct de la serie MI300 están diseñados con nuestras tecnologías más avanzadas, brindan un rendimiento líder y estarán en implementaciones empresariales y de nube a gran escala”, declara Victor Peng, presidente de AMD.

Este directivo  destaca el “enfoque de ecosistema abierto” para que “los proveedores de nube, OEM y ODM” puedan entregar “tecnologías que permiten a las empresas adoptar e implementar soluciones impulsadas por IA”.

Así, por ejemplo, Microsoft Azure ND MI300X v5 Virtual Machine funciona con MI300X, al igual que los servidores PowerEdge XE9680 de Dell.

Por su parte, el blade HPE Cray Supercomputing EX255a y el superordenador El Capitan del Laboratorio Nacional Lawrence Livermore están equipados con APUs MI300A.

Otro anuncio de AMD es la plataforma de software abierto AMD ROCm 6, que incrementa el rendimiento de aceleración de inteligencia artificial unas 8 veces con aceleradores de la serie MI300 en Llama 2 y que es compatible con FlashAttention, HIPGraph y vLLM.

Redacción Silicon

La redacción de Silicon está compuesta por profesionales del periodismo 2.0

Recent Posts

Los deepfakes, una amenaza para las elecciones de Estados Unidos

Realizar deepfakes cada vez es más sencillo y ya se están utilizando para crear vídeos…

18 horas ago

Dell Technologies sufre un descenso del 14 % en sus ingresos anuales

Su ejercicio fiscal 2024 terminó con 88.400 millones de dólares, de los que 22.300 millones…

2 días ago

Salesforce roza los 35.000 millones de dólares en ingresos anuales

Durante su año fiscal 2024, ya terminado, la compañía que dirige Marc Benioff mejoró sus…

2 días ago

Los ingresos trimestrales de HPE se reducen un 14 %

Durante el primer trimestre de su año fiscal 2024 bajó hasta los 6.800 millones de…

2 días ago

Intel presenta su empresa independiente de FPGA: Altera

Entre su oferta se encuentra Agilex 5, la única matriz de puerta programable en campo…

2 días ago

Septeo se hace con otra empresa española

Compra ACIGrup en señal de compromiso con el sector 'hospitality' y el mercado ibérico.

2 días ago