Несколько дней назад компания AMD представила первые в мире графические адаптеры, основанные на семинанометровом GPU. Модели Radeon Instinct MI60 и MI50 получили GPU Vega 20 и ориентированы в первую очередь на ускорение вычислений искусственного интеллекта.
Vega 20 очень похож на Vega 10, так что и производительность Radeon Instinct MI60/MI50 близка к Radeon Instinct MI25. Но только в случае FP16 и FP32, тогда как в режиме двойной точности (FP64) производительность MI60 почти на порядок превосходит возможности MI25: 7,4 TFLOPS против 768 GFLOPS.
Кроме того, на презентации AMD сравнивала свою новинку с топовой картой Nvidia Tesla V100 в тесте Resnet 50 (распознавание изображений). Согласно подсчётам самой AMD, её ускоритель лишь немного проигрывает конкуренту: 334 изображений в секунду у MI60 против 357 у V100.
Однако оказалось, что в этом случае сравнение хоть и честное, но не полное. Дело в том, что оно проводилось в режиме FP32 без использования тензорных ядер, имеющихся в активе новых GPU Nvidia.
Если задействовать этот резерв, производительность Tesla V100 вырастает втрое — до 1189-1232 изображений в секунду в зависимости от типа подключения. Более того, в этом режиме производительность ускорителя Tesla T4 с TDP всего 75 Вт также выше, чем у MI60.
Да, использование тензорных ядер возможно не везде, да и сама AMD утверждает, что именно режим FP32 используется в большинстве случаев, но эти ядра способны в разы повысить производительность ускорителей Nvidia последнего поколения.