Как и предполагалось на днях, сегодня на мероприятии GTC 2024 компания Nvidia представила свой новый GPU — первый из поколения Blackwell.
На этом графическом процессоре будут построены ускорители для ИИ нового поколения. Анонс довольно объёмный, хотя Nvidia раскрыла пока не всю информацию. В частности, нет даже внятно указанного имени. В основном компания говорит о GPU Blackwell, а на сайте можно найти разные варианты, но они, видимо, относятся к не графическому ядру, а к готовым решениям, которые Nvidia порой тоже называет GPU, хотя это полноценный ускоритель.
Начать стоит с того, что GPU Blackwell представляет собой гигантский графический процессор. Он содержит 208 млрд транзисторов. Для сравнения: GH100 имеет 80 млрд транзисторов. Вторая особенность заключается в том, что GPU Blackwell — это первый многочиповый GPU Nvidia. Он состоит из двух одинаковых кристаллов, да ещё и окружённых микросхемами памяти. Между собой кристаллы соединены шиной NV-High Bandwidth (NV-HBI) с пропускной способностью в 10 ТБ/с. Количество ядер CUDA или каких-либо иных вычислительных блоков пока не раскрывается, но, учитывая гигантский скачок в количестве транзисторов, вполне логично ожидать и огромный прирост количества вычислительных блоков.
Вокруг GPU размещены восемь стеков памяти HBM3e суммарным объёмом 192 ГБ с 8192-битной шиной и пропускной способностью в невероятные 8 ТБ/с.
Производится всё это по техпроцессу 4 нм, а не 3 нм, как предполагалось, но это обновлённый техпроцесс TSMC 4NP.
Сама Nvidia, сравнивая GPU Blackwell с GH100, говорит о том, что новое решение быстрее старого в 2,5–5 раз в зависимости от режима. Что интересно, производительность в режиме FP32 вообще не указана, хотя из-за акцента на вычисления ИИ это может быть не так важно.
На самом деле параметры нового GPU, кроме прочего, хорошо показывают, куда Nvidia сейчас вкладывает все силы. Если посмотреть на историю игровых графических процессоров компании, такого гигантского скачка за одно поколение, похоже, никогда не было. Учитывая ажиотаж вокруг ИИ и позиции Nvidia на этом рынке, ничего удивительного в такой ставке нет — этот рынок приносит компании огромные деньги.
Также Nvidia сразу рассказала об ускорителе GB200 Grace Blackwell Superchip, который будет содержать два GPU нового поколения и процессор с 72 ядрами Arm Neoverse V2. Производительность такого монстра в режиме FP4 составит невероятные 40 PFLOPS.