Компания Nvidia вчера представила чудовищный GPU поколения Blackwell для ускорителей для ИИ, но не раскрыла ряда параметров. Сегодня кое-что в Сети появилось.
К примеру, ресурс WCCF Tech утверждает, что новый графический процессор содержит 40 960 ядер CUDA, то есть 20 480 ядер на каждый кристалл. Напомним, новый GPU является двухчиповым решением. Для сравнения: у GH100 имеется 18 432 ядра CUDA, то есть прирост не особо велик. Впрочем, половинку нового GPU компания всё равно никак отдельно не использует, так что всё же речь идёт именно о почти 41 000 ядер. На сайте Nvidia этой информации пока нет.
Этот же источник говорит о поддержке PCIe 6.0, чего также нет в пресс-релизе или у других больших источников.
Ресурс Tom’s Hardware в свою очередь говорит о двух вариациях нового GPU: B100 и B200. Технически это один и тот же графический процессор, но с немного разными параметрами. В чём именно различия, точно неясно, и пока есть данные только о TDP — 700 Вт и 1000 Вт соответственно. При этом производительность у этих вариантов разная, но это может достигаться как разницей в частотах, так и урезанием вычислительных блоков.
В любом случае, у B100 производительность в новом формате FP4 составляет 7 либо 14 PFLOPS в зависимости от режима, а у B200 это 9 либо 18 PFLOPS. В случае ускорителя GB200 Grace Blackwell Superchip, где имеются два новых GPU, производительность составляет 20 либо 40 PFLOPS, а это значит, что именно в этой форме новый GPU представлен в полной своей версии, так как на каждый процессор приходится уже по 10/20 PFLOPS.
Данных о чистой производительности в режимах FP32 и FP64 до сих пор нет. Но, к примеру, в режиме FP64 Tensor показатель для B100, B200 и GB200 составляет соответственно 30, 40 и 90 PFLOPS.