Компания Nvidia представила сегодня ускоритель H200, который впервые для такого решения получил память HBM3e. На фоне H100 новое решение в ряде задач может быть почти вдвое быстрее. Но и H200 померкнет на фоне B100, согласно обещаниям Nvidia.
Компания решила, что уже вполне можно дразнить публику будущим продуктом. Напомним, B100 будет топовым решением архитектуры Blackwell и ожидается в следующем году.
Судя по диаграмме, нас ждёт более чем двукратный прирост производительности относительно уже H200, а на самом деле разница может быть и ощутимо больше.
Опять-таки, это результат в конкретной задаче: вывод модели GPT-3 со 178 млрд параметров. Но, само собой, стоит ожидать улучшений и в других сценариях.
Никаких технических подробностей, конечно, нет, но новый ускоритель, вероятно, сохранит память HBM3e, как у анонсированного сегодня H200, так как нового типа памяти в следующем году не ожидается.