Компания NVIDIA объявила о выпуске графического процессора NVIDIA Hopper, новой платформы, которую производитель называет ускоренными вычислениями следующего поколения. Hopper является официальным преемником серии Ampere, и ускоряет динамическое программирование до 40 раз с использованием новых рекомендаций DPX.

Первым процессором, основанным на архитектуре Hopper стал H100. NVIDIA H100 изготовлен по технологии TSMC 4N, а его монолитная конструкция содержит около 80 миллиардов транзисторов. Чтобы представить это число в масштабе, GA100 составляет 54 миллиарда, а графический процессор GA102 в RTX 3090 – всего лишь 28,3 миллиарда. TDP чипа составляет 700 Вт. Это позволит майнить криптовалюту, чем будут рады брокеры в Казахстане.

Как утверждает производитель, чип H100 превосходит процессор A100 предыдущего поколения в три раза в вычислениях с двойной точностью, тензорных вычислениях с одинарной точностью и вычислениях с половинной точностью, при этом он в шесть раз быстрее в 8-битных вычислениях с плавающей запятой.

Переход на память HBM3 повышает скорость передачи данных на вывод с 2,43 ГБит/с до 4,8 ГБит/с, но в остальном конфигурация памяти не изменилась: пять активных стеков HBM3 (с одним фиктивным), что даёт общую ёмкость 80 ГБ на GPU и общую пропускную способность 3 ТБ/сек. Соединение NVLink графического процессора также переходит на 4-е поколение, в результате чего пропускная способность между графическим процессором и его хост-системой составляет 900 ГБ/с. Для продуктов, которые не используют NVLink, H100 также реализует PCIe 5.0.

Ключевыми особенностями ускорителей NVIDIA H100 являются новый движок Transformer Engine, который можно использовать для ускорения нейронных сетей типа Transformer «до 6 раз» по сравнению с Ampere. Также стоит отметить поддержку специальных DPX-инструкций для динамического программирования, второе поколение технологии виртуализации Multi-Instance GPU, и новый коммутатор NVSwitch.

В своих релизных материалах NVIDIA неоднократно заявляла, что H100 «можно развернуть в центре обработки данных любого типа». Это связано с тем, что компания предлагает H100 в различных форм-факторах, начиная от карт расширения PCI Express 5.0 с показателем TDP на уровне 350 Вт, так и в форм-факторе SXM5 с заявленным TDP 700 Вт. PCIe-версия получит менее мощный чип с 14 592 ядрами CUDA. А версия в формате SXM5 будет построена на чипе с 16 896 ядрами.

Естественно, к этому запуску прилагается новая система DGX, получившая название DGX H100. Это четвертое поколение суперкомпьютерного модуля NVIDIA очень похоже на DGX A100 предыдущего поколения; в основном, он заменяет восемь графических процессоров A100 на восемь ускорителей SXM H100, что дает ему полные 32 петафлопса 8-битных вычислений. Таким образом, DGX SuperPOD объединяет 32 системы DGX, что дает в общей сложности 1 экзафлоп мощности вывода ИИ.

NVIDIA заявляет, что новейший DGX SuperPOD позволит клиентам, использующим суперкомпьютеры, «масштабироваться настолько, насколько это необходимо, с шагом в 32 узла». Действительно, это, похоже, является основой для проекта суперкомпьютера Eos, который объединяет около 18 SuperPOD, включая 576 систем DGX H100, соединяющих вместе 4608 графических процессоров H100.

Большинство анонсированных продуктов NVIDIA нацелены непосредственно на правительства и крупные исследовательские организации (обычно субсидируемые государством), которым требуется абсолютный максимум вычислительной мощности для обработки чисел. Производитель не предоставил никаких данных о ценах. H100 уже находится в производстве и будет доступен партнёрам NVIDIA в третьем квартале нынешнего года.

Подпишись вTelegram
NVIDIA RTX 50xx – характеристики и график выхода видеокарт

NVIDIA RTX 50xx – характеристики и график выхода видеокарт

Gigabyte представила 4K и 2K QD-OLED мониторы

Gigabyte представила 4K и 2K QD-OLED мониторы

Realme GT Neo 7 получит батарею на 7000 мАч

Realme GT Neo 7 получит батарею на 7000 мАч

Камера iPhone 16 заняла 20-е место в рейтинге DxOMark

Камера iPhone 16 заняла 20-е место в рейтинге DxOMark

Планшет OPPO Pad 3 Pro вышел на глобальный рынок  – Snapdragon 8 Gen 3, 144 Гц и 12 ГБ ОЗУ

Планшет OPPO Pad 3 Pro вышел на глобальный рынок – Snapdragon 8 Gen 3, 144 Гц и 12 ГБ ОЗУ

Представлена Sony Alpha 1 II – беззеркальная камера за $6500

Представлена Sony Alpha 1 II – беззеркальная камера за $6500

Представлен Nubia Z70 Ultra – фотофлагман на Snapdragon 8 Elite

Представлен Nubia Z70 Ultra – фотофлагман на Snapdragon 8 Elite

Представлен Redmi A4 5G – 120 Гц, Snapdragon 4s Gen 2 и цена $101

Представлен Redmi A4 5G – 120 Гц, Snapdragon 4s Gen 2 и цена $101

Microsoft выпустила мини-ПК Windows 365 Link, напоминающий Mac mini

Microsoft выпустила мини-ПК Windows 365 Link, напоминающий Mac mini

Valve разрабатывает Steam Controller 2 и геймпад для VR-гарнитуры

Valve разрабатывает Steam Controller 2 и геймпад для VR-гарнитуры

Apple выпустила iOS 18.1.1

Apple выпустила iOS 18.1.1

MacBook Pro на M4 Max протестировали в играх

MacBook Pro на M4 Max протестировали в играх