Компания Nvidia сегодня анонсировала доступность в облаке Microsoft Azure нового типа суперкомпьютера, в котором используется ускорение средствами GPU. Уточним, что пока инстансы NDv2 доступны для предварительного просмотра, но их уже можно объединять в кластеры.
По словам Nvidia, новое решение, предназначенное для требовательных суперкомпьютерных вычислений, задач искусственного интеллекта и машинного обучения, значительно превосходит традиционные решения на базе CPU по производительности и цене.
Как утверждается, всего один инстанс NDv2 обеспечивает производительность на порядок выше по сравнению с традиционным суперкомпьютерным узлом без ускорения средствами GPU в таких приложениях, как глубокое обучение. Производительность можно линейно наращивать, объединяя сотни инстансов.
Заказчики могут быстро развернуть несколько инстансов и обучить сложные модели ИИ за считанные часы. Им доступно до 800 GPU Nvidia V100 с тензорными ядрами, которые связаны в единую сеть соединениями Mellanox InfiniBand. По сути, впервые у разработчиков появляется возможность, не покидая рабочее место, арендовать суперкомпьютер, сопоставимый с громоздкой локальной системой, сборка которой может занять месяцы.
Для NDv2 характерна оптимизация под ПО для машинного обучения и фреймворки глубокого обучения, включая TensorFlow, PyTorch и MxNet из репозитария контейнеров Nvidia NGC и Azure Marketplace. Репозитарий также поддерживает пакеты Helm для установки программ ИИ на кластерах Kubernetes.