Самый монструозный GPU Nvidia неожиданно получил сильного конкурента. Представлен Graphcore Colossus MK2 GC200 IPU

Пару месяцев назад компания Nvidia представила первый графический процессор поколения Ampere — GA100. Он уже лёг в основу специализированных ускорителей Nvidia A100, но при этом он не появится в потребительском сегменте. GA100 — самый огромный GPU и один из самых огромных полупроводниковых чипов в целом, если мы говорим не о размерах, а о количестве транзисторов. Напомним, их у новинки 54 млрд.

Самый монструозный GPU Nvidia неожиданно получил сильного конкурента. Представлен Graphcore Colossus MK2 GC200 IPU

Однако сегодня стало известно о ещё более крупном чипе, причём тоже производящимся по семинанометровому техпроцессу. Британская компания Graphcore представила Colossus MK2 GC200 IPU — массово-параллельный процессор, разработанный совместно с Poplar SDK, нацеленный на ускорение вычислений, связанных с ИИ. То есть формально это прямой конкурент Nvidia GA100.

Самый монструозный GPU Nvidia неожиданно получил сильного конкурента. Представлен Graphcore Colossus MK2 GC200 IPU

Colossus GC200 состоит из 59,4 млрд транзисторов, при этом он совсем немного, но всё же физически меньше монстра Nvidia: 823 против 826 мм2. Производительность Colossus GC200 достигает 250 TFLOPS (FP16) либо 62,5 TFLOPS (FP32), в обоих случаях с учётом структурированной разреженности (Structured Sparsity). Для сравнения, GA100 в тех же условиях обеспечивает 624 TFLOPS и 156 TFLOPS. Напомним, технология структурированной разреженности помогает удвоить производительность вычислений над матрицами, используя разреженность данных. Разреженная матрица — это матрица с преимущественно нулевыми элементами в ней, и подобные матрицы довольно часто встречаются в приложениях, связанных с использованием ИИ.

Конфигурация Colossus GC200 весьма необычна, так как это массово-параллельный процессор. Тут имеется 1472 IPU (целочисленных процессора), каждый из которых располагает собственной внутрипроцессорной памятью (суммарно 900 МБ) с пропускной способностью в 47,5 ТБ/с. Каждое ядро IPU может параллельно обрабатывать шесть потоков, так что суммарно Colossus GC200 способен одновременно работать с 8832 потоками данных. Между собой все блоки IPU объединены посредством структуры IPU-Exchange с пропускной способностью 8 ТБ/с. С «внешним миром» чип обменивается данными посредством IPU-Links — специальной 10-канальной шины с пропускной способностью 320 ГБ/с. Также стоит отметить поддержку PCIe 4.0.

Возвращаясь к конкуренции с Nvidia, у Graphcore есть не только сам чип Colossus GC200, но и система IPU-M2000, включающая четыре чипа Colossus GC200  и 450 ГБ памяти Exchange-Memory. Но IPU-M2000 не является прямым конкурентом для Nvidia DGX A100 (система с восемью Nvidia A100).

Самый монструозный GPU Nvidia неожиданно получил сильного конкурента. Представлен Graphcore Colossus MK2 GC200 IPU

Вместо этого производитель сравнивает DGX A100 с восемью стойками IPU-M2000, потому что у них сходная цена: за продукт Nvidia просят 199 000 долларов, а стойка с восемью IPU-M2000 оценивается в 259 600 долларов. И при таких условиях продукт Nvidia, конечно, не способен выдержать конкуренцию.

Самый монструозный GPU Nvidia неожиданно получил сильного конкурента. Представлен Graphcore Colossus MK2 GC200 IPU

Graphcore уже позволяет желающим оформить заказы, а поставки начнутся в четвёртом квартале.