На конференции GTC в Вашингтоне генеральный директор NVIDIA Дженсен Хуанг представил суперчип Vera Rubin Superchip. Новая платформа готова установить новые стандарты в области искусственного интеллекта и высокопроизводительных вычислений, продолжая интенсивный цикл инноваций компании.
Прототип под названием Vera Rubin Superchip объединяет системную память LPDDR и память HBM4, которая расположена непосредственно на графических процессорах. Главной особенностью Vera Rubin Superchip является его ошеломляющая производительность. Согласно заявлению, новый чип должен обеспечить более чем трёхкратное повышение производительности по сравнению с предшественниками.


NVIDIA объявила о поступлении первых экземпляров графических ускорителей Rubin на этапы внутреннего тестирования, а запуск серийного производства Superchip намечен на 2026 год. В основе Rubin лежат два чипа формата Reticle, демонстрирующие вычислительную мощность до 50 PFLOPS в задачах FP4 и оснащенные 288 ГБ инновационной памяти HBM4. Эти компоненты будут взаимодействовать с 88-ядерным процессором Vera на базе архитектуры Arm, обладающим 176 потоковыми блоками и скоростью передачи данных через NVLINK-C2C до 1,8 ТБ/с.
Комплексная система NVL144 сможет достигать производительности до 3,6 Exaflops для FP4 и 1,2 Exaflops для задач машинного обучения FP8, что позволит ускорить вычисления примерно в 3,3 раза по сравнению с существующей платформой GB300 NVL72. Объем используемой памяти возрастет до 13 ТБ/с с помощью HBM4 и общей емкости 75 ТБ высокоскоростной системной памяти, а скорость передачи данных через NVLINK и CX9 достигнет соответственно 260 ТБ/с и 28,8 ТБ/с.


Кроме того, компания представила Rubin Ultra NVL576 – решение, которое планируется выпустить во второй половине 2027 года. Эта модель расширяет возможности системы NVL от 144 до 576 ядер. Увеличенная версия будет включать четыре мощных GPU, 1 ТБ памяти HBM4e и обеспечивать производительность до 15 эксафлопсов FP4 и 5 эксафлопсов FP8. Благодаря NVLINK, объем оперативной памяти вырастет до 365 ТБ, а пропускная способность составит 1,5 петабайта в секунду. NVIDIA также продемонстрировала ряд конфигураций серверных решений для вычислений, включая модель CPX, адаптированную для работы с большими языковыми моделями.












