Компания AMD сегодня представила ускоритель AMD Instinct MI100, который она называет самым быстрым в мире GPU для суперкомпьютерных вычислений и первым GPU для x86-совместимых серверов, производительность которого превышает 10 TFLOPS (1012 операций с плавающей запятой в секунду) при работе с числами в формате FP64, то есть с двойной точностью.
Говоря точнее, пиковая производительность заявлена равной 11,5 TFLOPS (FP64) и 46,1 TFLOPS (FP32). Второй формат часто используется в задачах ИИ и машинного обучения. Основой AMD Instinct MI100 служит новая архитектура AMD CDNA, а применение новой технологии AMD Matrix Core MI100 позволило получить почти семикратное увеличение теоретической пиковой производительности FP16 с плавающей запятой для рабочих нагрузок обучения ИИ по сравнению с ускорителями AMD предыдущего поколения.
В состав ускорителя входит 32 ГБ памяти HBM2, работающей на частоте 1,2 ГГц. Пропускная способность подсистемы памяти — 1,23 ТБ/с. Ускоритель поддерживает стандарт PCIe Gen 4.0, обеспечивающей пиковую теоретическую пропускную способность канала между CPU и GPU до 64 ГБ/с. Кроме того, полагаясь на технологию внутренних соединений AMD Infinity Fabric второго поколения, Instinct MI100 располагает примерно в два раза большой пиковую пропускную способностью однорангового (P2P) ввода-вывода по сравнению с PCIe 4.0. Совокупная пропускная способность карты с тремя линиями AMD Infinity Fabric достигает 340 ГБ/с. В состав сервера можно включить один или два «улья» по четыре ускорителя в каждом, каждый из которых характеризуется пропускной способностью до 552 ГБ/с.
В системах основных партнеров AMD появление ускорителей AMD Instinct MI100 ожидается к концу года.