Компания Nvidia раскрыла новые подробности о первом GPU поколения Blackwell.
В частности, нам наконец-то рассказали, насколько графический процессор нового поколения быстрее старого в вычислениях с двоичной точностью (FP64). Оказалось, что существенно, но не колоссально — на 30%. На фоне многократной разницы в вычислениях INT8, это не особо впечатляет.
Если говорить точнее, GPU B100 имеет производительность около 45 TFLOPS, но на данный момент для рынка это не так важно, как производительность в задачах ИИ. Для сравнения, производительность AMD Instinct MI300X достигает 81,7 TFLOPS.
Но зато в тех задачах, для которых архитектура Blackwell и разрабатывалась, новое решение раскрывается во всей красе. В обучении модели с 1,8 трлн параметров GB200 опережает H100 в 30 раз, одновременно обеспечивая в 25 раз более высокую энергоэффективность и в 25 раз более низкую совокупную стоимость владения.