Oracle и Nvidia сотрудничают, чтобы создать суперкомпьютер Zettaflops: способный поддержать до 131072 Blackwell B200 графических процессоров

Sep 14,2024

Oracle запустил новый кластер, который будет использоваться для обучения искусственным интеллекту через Oracle Cloud Infrastructure (OCI).Этот самый мощный кластер будет основан на предстоящем графическом процессоре Nvidia Blackwell, с общим выступлением AI до 2,4Zettaflops, что еще более мощно, чем недавно объявленный AI Cluster Elon Musk.

Новый суперкомпьютерный кластер Oracle можно настроить с помощью графических процессоров NVIDIA Hopper или Blackwell для AI и HPC (высокопроизводительные вычисления), а также различные сетевые устройства, включая ультра-низкую задержку ROCEV2 с Neck-7 NIC и ConnectX-8 Supernic или Networks на основе на основе Networks на основе на основе Networks на основе Networks на основе сетиНа nvidia Quantum-2 Infiniband.HPC хранилище также может быть выбрано в соответствии с требованиями производительности:

Super Cluster OCI, оснащенный графическим процессором H100, может поддерживать до 16384 графических процессоров, обеспечивая пиковую производительность 65 FP8/Int8 ExaFlops и полную пропускную способность сети 13pb/s;

Super Cluster OCI, оснащенный графическим процессором H200, будет запущен в конце этого года, который может масштабировать до 65536 графических процессоров и обеспечить до 260 FP8/Int8 ExaFlops и пропускную способность сети 52PB/S;

Super Cluster OCI, оснащенный графическим процессором Blackwell B200, будет расширяться до 131072 графических процессоров, обеспечивая пиковую производительность до 2,4 FP8/int8 Zettaflops.

Предстоящий суперкомпьютерный кластер OCI намного превышает возможности современных ведущих систем.Согласно Oracle, количество графических процессоров в верхнем Super Cluster, основанном на B200, более чем в три раза больше, чем в Frontier Supercomputer (используя 37888 AMD Instinct Mi250x GPU) и более чем в шесть раз больше, чем у других супер -кластеров.

Предстоящий Super Cluster OCI будет использовать шкаф NVIDIA GB200 NVL72 с жидким охлаждением, с 72 графическими процессорами, которые общаются друг с другом в одном домене NVLINK с общей полосой полосы пропускания 129,6 ТБ/с.Oracle заявил, что GPU Nvidia Blackwell будет доступен в первой половине 2025 года (из -за ограниченной доступности Blackwell в этом году), но в настоящее время неясно, когда OCI предложит полностью загруженный кластер Blackwell.
Продукт RFQ