Пару месяцев назад компания Nvidia представила первый графический процессор поколения Ampere — GA100. Он уже лёг в основу специализированных ускорителей Nvidia A100, но при этом он не появится в потребительском сегменте. GA100 — самый огромный GPU и один из самых огромных полупроводниковых чипов в целом, если мы говорим не о размерах, а о количестве транзисторов. Напомним, их у новинки 54 млрд.
Однако сегодня стало известно о ещё более крупном чипе, причём тоже производящимся по семинанометровому техпроцессу. Британская компания Graphcore представила Colossus MK2 GC200 IPU — массово-параллельный процессор, разработанный совместно с Poplar SDK, нацеленный на ускорение вычислений, связанных с ИИ. То есть формально это прямой конкурент Nvidia GA100.
Colossus GC200 состоит из 59,4 млрд транзисторов, при этом он совсем немного, но всё же физически меньше монстра Nvidia: 823 против 826 мм2. Производительность Colossus GC200 достигает 250 TFLOPS (FP16) либо 62,5 TFLOPS (FP32), в обоих случаях с учётом структурированной разреженности (Structured Sparsity). Для сравнения, GA100 в тех же условиях обеспечивает 624 TFLOPS и 156 TFLOPS. Напомним, технология структурированной разреженности помогает удвоить производительность вычислений над матрицами, используя разреженность данных. Разреженная матрица — это матрица с преимущественно нулевыми элементами в ней, и подобные матрицы довольно часто встречаются в приложениях, связанных с использованием ИИ.
Конфигурация Colossus GC200 весьма необычна, так как это массово-параллельный процессор. Тут имеется 1472 IPU (целочисленных процессора), каждый из которых располагает собственной внутрипроцессорной памятью (суммарно 900 МБ) с пропускной способностью в 47,5 ТБ/с. Каждое ядро IPU может параллельно обрабатывать шесть потоков, так что суммарно Colossus GC200 способен одновременно работать с 8832 потоками данных. Между собой все блоки IPU объединены посредством структуры IPU-Exchange с пропускной способностью 8 ТБ/с. С «внешним миром» чип обменивается данными посредством IPU-Links — специальной 10-канальной шины с пропускной способностью 320 ГБ/с. Также стоит отметить поддержку PCIe 4.0.
Возвращаясь к конкуренции с Nvidia, у Graphcore есть не только сам чип Colossus GC200, но и система IPU-M2000, включающая четыре чипа Colossus GC200 и 450 ГБ памяти Exchange-Memory. Но IPU-M2000 не является прямым конкурентом для Nvidia DGX A100 (система с восемью Nvidia A100).
Вместо этого производитель сравнивает DGX A100 с восемью стойками IPU-M2000, потому что у них сходная цена: за продукт Nvidia просят 199 000 долларов, а стойка с восемью IPU-M2000 оценивается в 259 600 долларов. И при таких условиях продукт Nvidia, конечно, не способен выдержать конкуренцию.
Graphcore уже позволяет желающим оформить заказы, а поставки начнутся в четвёртом квартале.