Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Данный материал является обновлением нашего первого обзора карт MTT из Китая и посвящен тестированию их на последней актуальной версии драйверов. Поэтому истории самой компании, появления этих карт у нас, а также теоретическая часть спрятаны под спойлеры, ибо там ничего нового нет.

Предыстория

 

Как мы получали данные карты в 2023 году

Компания Moore Threads и ее видеокарты

 

История появления компании и ее видеокарт

Особенности архитектуры

 

Детали теории и как работают процессоры MTT

Особенности карт Moore Threads MTT S80 (16 ГБ) и MTT S70 (7 ГБ)

 

Как устроены видеокарты MTT, их температурные и шумовые характеристики

Тестирование: синтетические тесты

Мы провели повторное тестирование пары видеокарт Moore Threads со стандартными параметрами в нашем наборе синтетических тестов, с использованием последней версии драйверов на момент написания текста — 270.80. Тестовый набор в случае китайских GPU всё еще сильно не дотягивает до полноценного — хотя ранее мы добавили в него много новых тестов, но из-за крайне ограниченной поддержки графических API китайскими решениями (даже с новыми драйверами, немного улучшившими ситуацию) пришлось сильно урезать список и даже протестировать GPU в старых DirectX 10 тестах, которые мы давно выкинули из наших обычных материалов по картам AMD, Intel и Nvidia. Самое обидное, что нам снова придется обойтись без приложений DirectX 12, которые сейчас составляют основу наших синтетических тестов для графических процессоров, потому что необходимую поддержку со стороны драйверов решения MTT вряд ли вообще когда-либо получат.

Синтетические тесты проводились на следующих конфигурациях:

  • MTT S80 со стандартными параметрами и новыми драйверами 270.80 (MTT S80 NEW)
  • MTT S80 со стандартными параметрами и старыми драйверами 230.40 (MTT S80)
  • MTT S70 со стандартными параметрами и новыми драйверами 270.80 (MTT S70 NEW)
  • MTT S70 со стандартными параметрами и старыми драйверами 230.40 (MTT S70)
  • Radeon RX 5500 XT со стандартными параметрами (RX 5500 XT)
  • GeForce GTX 1650 со стандартными параметрами (GTX 1650)
  • GeForce GTX 1050 Ti со стандартными параметрами (GTX 1050 Ti)
  • GeForce GTX 1050 со стандартными параметрами (GTX 1050)

Соперники для анализа производительности видеокарт MTT и с новой версией драйверов остались теми же, и их было довольно сложно выбрать, особенно с учетом того, что решений подобного уровня производительности Nvidia с AMD давно не выпускали. Из имеющихся видеокарт Radeon мы взяли лишь одну модель из древнего поколения на основе еще первой архитектуры RDNA — Radeon RX 5500 XT. Она является чуть ли не самой слабой из той линейки (редкую RX 5300 не считаем) и достаточно старой и медленной для того, чтобы китайские видеокарты могли составить ей хоть какую-то конкуренцию.

Из решений производства Nvidia выбор был несколько шире, так как они выпустили в свое время линейку GeForce GTX 16 с относительно слабыми GPU. Из нее мы и взяли также почти самую слабую модель — GTX 1650 (в GTX 1630 нет смысла, так как она медленнее даже GTX 1050 Ti). А из GPU еще более старших поколений у нас будут представлены модели GTX 1050 Ti или GTX 1050, в зависимости от теста. Конечно, все они не являются прямыми соперниками китайским GPU по цене и возможностям, так как видеокарты AMD и Nvidia обычно и дешевле и стабильнее, но для синтетических тестов это не особенно важно.

Тесты Direct3D 10

Из DirectX 10-тестов из RightMark3D мы оставили только несколько примеров с наибольшей нагрузкой на GPU, в этот раз их будет чуть больше — по причине того, что видеокарты MTT не поддерживают самую современную версию этого графического API и с самыми новыми драйверами, а протестировать их надо. Первая пара тестов измеряет производительность выполнения относительно простых пиксельных шейдеров с циклами при большом количестве текстурных выборок (до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере. Оба примера включают самозатенение и шейдерный суперсэмплинг, увеличивающий нагрузку на видеочипы.

Первый тест пиксельных шейдеров — Fur. При максимальных настройках в нем используется от 160 до 320 текстурных выборок из карты высот и несколько выборок из основной текстуры. Производительность в данном тесте сильнее всего зависит от количества и эффективности блоков TMU, но на результат влияет также и эффективность выполнения сложных программ.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

В задачах процедурной визуализации меха с большим количеством текстурных выборок, ранее чаще остальных хорошо выглядели решения компании AMD, которые были в лидерах с выхода первых графических процессоров архитектуры GCN, а модели на чипах Navi архитектуры RDNA1 стали еще сильнее, что говорит о большей эффективности выполнения ими подобных программ — но лишь по сравнению с решениями Nvidia, как выяснилось позднее.

Обе модели видеокарт компании Moore Threads выступают в этих тестах даже еще лучше, обогнав своих условных соперников: и Radeon RX 5500 XT и GeForce GTX 1650 с GTX 1050. Благодаря большому количеству блоков TMU, видеокарты S80 и S70 оказались заметно быстрее остальных видеокарт в этом тесте. Интересно, что S70 со старыми драйверами проигрывала старшей модели очень прилично и больше того, что должно быть по теории, но новые драйверы приблизили младшую модификацию к старшей. Которая, в свою очередь, почему-то даже стала медленнее в более сложных условиях высокой детализации. Причем это не ошибка, как показали чуть более сложные шейдеры и условия второго теста.

Еще один DX10-тест Steep Parallax Mapping также измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок. При максимальных настройках он использует от 80 до 400 текстурных выборок из карты высот и несколько выборок из базовых текстур. Этот шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, в том числе и такие варианты как steep parallax mapping. Кроме того, в нашем тесте мы включили самозатенение, увеличивающее нагрузку на видеочип в два раза, и суперсэмплинг, также повышающий требования к мощности GPU.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Диаграмма очень похожа на предыдущую, видеокарты GeForce выглядят чуть получше по отношению к Radeon, а две китайские видеокарты остались в лидерах. Старшая из них намного опережает остальные GPU — большое количество блоков текстурирования дает китайским видеокартам явное преимущество в таких тестах со сложными шейдерами и многочисленными текстурными выборками.

И снова примерно то же самое мы наблюдаем с младшим вариантом MTT S70, который со старыми драйверами был примерно на уровне Radeon RX 5500 XT, а драйверы новой версии значительно улучшили результат. А для S80 и сложных условий повышенной детализации даже ухудшили, хотя в режиме Low он чуть увеличился. Впрочем, это ничего не изменило, китайские видеокарты оказались теперь заметно быстрее как обеих видеокарт Nvidia, так и Radeon, также и во втором тесте.

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере. В последние годы скорость выполнения арифметических инструкций в пиксельном шейдере стала не так важна, ведь большинство вычислений перешли в compute shaders, но для устаревших игр это важно.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Результаты следующей пары предельных математических тестов для DirectX 10 чаще всего не полностью соответствуют разнице по частотам и количеству вычислительных блоков, на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и упор в ПСП, и много чего еще. Так что в тесте Mineral видеокарты зачастую обеспечивают не самые показательные результаты, иногда далекие как от теории, так и от результатов в аналогичных тестах из других пакетов.

В прошлом году мы отмечали, что видеокарты MTT показали тут не самый высокий результат, хотя старшая модель обошла обе GeForce, но она отстала от видеокарты AMD, что не соответствует теоретическим пиковым показателям всех этих решений. А младшая видеокарта S70 слишком сильно уступала старшему варианту, оказавшись слабейшей в тесте, уступив даже сравнительно слабой по теории GeForce GTX 1050.

Можно сказать, что с новыми драйверами всё круто изменилось. Мы писали, что драйверы для разных моделей на базе одного и того же GPU могут быть настроены по-разному, так и получилось — с обновленной версией S70 оказалась куда ближе к S80, как и должно быть с самого начала. И вообще, теперь S80 лучшая в сравнении, пусть и с небольшим преимуществом, а младшая уступила только Radeon — но зато обогнала S80, работающую под управлением старых драйверов. Так что соответствие теоретических показателей и реальной скорости вычислений для китайских решений явно улучшилось.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для блоков ALU, текстурная выборка в нем только одна, а вот количество инструкций типа sin и cos увеличено вдвое — до 130. Посмотрим, что изменится при увеличении нагрузки:

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Второй тест математических вычислений для китайских видеокарт оказался похуже. Со старыми драйверами младшая S70 уступала старшей S80 более чем в полтора раза, чего не должно быть по теории, и мы писали о вопросах к оптимизации драйверов, продолжая предполагать, что они могут быть основаны на разном коде. Судя по всему, так оно и было, ведь с новыми драйверами S70 отстает от S80 уже намного меньше. Хотя нужно заметить, что в подобных математических тестах мы нередко получали результаты, далекие от теории, многие GPU при тестировании чаще всего не загружены работой на 100% и сильно ограничены чем-то еще, кроме скорости ALU.

Но теперь, с увеличенной производительностью при новой версии драйверов, старшая MTT S80 заметно сильнее опережает обе GeForce, чем со старым ПО. А младшая модель S70 из аутсайдера сравнения превратилась в середнячка — она хоть и не догнала Radeon, но даже чуть опередила GeForce GTX 1650. Пусть это до сих пор не совсем соответствует теории, но уже куда ближе к ней. И это важно именно в подобных задачах, которые частенько перекликаются с тем, что получается в реальном ПО. И если про видеокарты Moore Threads мы раньше писали, что в математических DX10-тестах они показали себя средне, то их положение с новыми драйверами заметно улучшилось, особенно это касается младшей модели.

Переходим к тесту геометрических шейдеров. В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, но один из них (Hyperlight, демонстрирующий использование техник: instancing, stream output, buffer load, использующий динамическое создание геометрии и stream output), на всех видеокартах компании AMD не работает, да и на видеокартах MTT отработал так себе, поэтому мы оставили лишь второй — Galaxy. В этом тесте анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Все вычисления в этом тесте производятся в геометрическом шейдере, и это уже куда менее распространенная задача, по сравнению с текстурированием и интенсивными математическими вычислениями из прошлых тестов, и это привело к тому, что обе видеокарты MTT показали себя явно слабее и AMD и Nvidia, даже с учетом того, что мы сравниваем их с очень старыми моделями. Разница между S80 и S70 невелика, и в этот раз она вполне соответствует теоретической.

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, так как производительность соответствует количеству точек, но видеокарты MTT S80 и S70 показали крайне низкие результаты в несколько раз ниже даже своих устаревших условных конкурентов от AMD и Nvidia. Radeon RX 5500 XT и GeForce GTX 1650 в этом тесте находятся примерно на одном уровне, и обе достаточно эффективно выполняют работу, а вот видеокарты MTT плохо подготовлены для геометрических шейдеров — у них слабые геометрические конвейеры, да и драйверы вряд ли хорошо оптимизированы для подобных задач. И последнее обновление не дало существенного результата — скорость повысилась лишь на единицы процентов, что не меняет вообще ничего из наших выводов.

Переходим в тестированию скорости текстурных выборок из вершинных шейдеров. В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты «Earth» и «Waves» схожи по сути, в обоих используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет. И так как результаты оказались в целом схожими, будет достаточно лишь теста «Waves», количество билинейных текстурных выборок в данном случае до 24 на каждую вершину.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Как показала практика, на результаты этого теста может также влиять филлрейт и пропускная способность памяти, ограничивающая производительность, но у видеокарт Moore Threads с этим проблем нет, а как и со скоростью текстурных выборок самих по себе, а вот с оптимизацией драйверов под разные задачи, тем более относительно слабо распространенные, у них до сих пор большая беда, и мы еще раз смогли в этом убедиться.

Ситуация в этом тесте если и лучше, чем с геометрическими шейдерами, то не слишком — MTT S80 и S70 всё равно заметно уступили остальным участникам тестирования. Рассматриваемые китайские видеокарты показали крайне низкую скорость, отставая от единственного представителя Radeon до пяти раз и уступая даже слабейшей из GeForce до трех раз. Младшая модель S70 и в этот раз отстала от старшей модели не так уж далеко, но это не может быть утешением, так как в целом по геометрическим и вершинным шейдерам ситуация для видеокарт MTT печальная — они явно проигрывают даже очень старым и медленным GPU двух известных производителей.

Ах да, мы же перетестировали MTT с новыми драйверами… Хотя они и дали прирост в несколько процентов во всех протестированных нами случаях и условиях, существенным его назвать можно разве что для модели S70, да и то с большими оговорками, ведь она всё равно уступила слабейшей из GeForce более чем вдвое. Так что хотя прирост от новой версии драйверов есть и в этом тесте, он не позволяет догнать даже таких старых и слабых соперников в этом случае.

Тесты 3DMark Vantage

Обычно мы рассматриваем также устаревшие синтетические тесты из пакета 3DMark Vantage, ведь в них зачастую можно найти что-то интересное, чего нет в других, более современных тестах. Feature тесты из этого тестового пакета имеют поддержку DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новых видеокарт мы всегда делаем какие-то полезные выводы.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно довольно высока, и тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя иногда они всё же получаются несколько заниженными в случае некоторых GPU. Видеокарты Moore Threads же явно отстают от своих пиковых параметров, провозглашенных производителем — эффективная скорость текстурирования решений MTT оказалась явно ниже, чем даже у старых видеокарт AMD и Nvidia.

Хотя в целом производительность полноценной модели китайского графического процессора Chunxiao в этом тесте оказалась достаточно высока, чтобы обойти и Radeon RX 5500 XT и пару GeForce. А вот младшая модель на урезанном варианте GPU на старых драйверах смогла осилить лишь GTX 1050 Ti, чего не должно быть по теории, тогда у нас получилась двойная разницу между моделями S80 и S70, что могло объясняться лишь разной оптимизацией для этих видеокарт. Что и доказали новые драйверы, ведь с ними S70 заметно приблизилась к S80 и теперь даже младшая модель MTT опережает всех своих условных соперников от AMD и Nvidia. А вот S80 получила очень слабое ускорение от новых драйверов в этом тесте.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Результаты второго подтеста 3DMark Vantage показывают производительность блоков ROP без учета величины пропускной способности видеопамяти, и тест измеряет именно производительность подсистемы ROP, а ПСП обычно не оказывает явного влияния. В прошлогоднем тесте мы особо отметили несуразную разницу между MTT S80 и S70 — ну не может быть такой разницы между парой решений на одном и том же GPU, хоть и с разным количеством исполнительных блоков. Очевидно, что в очередной раз проявилась разница в прошлогодних драйверах, оптимизированных для двух моделей по-разному.

И вот тут драйверы версии 270.80 изменили буквально всё — S70 теперь отстает от S80 примерно соответственно теории. Обе китайские видеокарты теперь стали ближе к впечатляющим теоретическим показателям пиковой скорости заполнения сцены, и сравнивать их с имеющимися у нас Radeon RX 5500 XT и парой GeForce просто нет смысла — MTT в разы быстрее справляются с такими условиями, что объясняется, скорее всего, родственностью их архитектуры с PowerVR, скажем так. Но нужно понимать, что это — искусственные условия, хорошо подходящие для тайловой архитектуры, а в реальных задачах такой разницы с традиционными GPU точно не будет.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Результаты этого теста из пакета 3DMark Vantage зависят не только исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а сразу от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно полезный тест, так как результаты в нем нередко хорошо коррелируют с тем, что получается в игровых тестах. Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage видеокарты Moore Threads выступают очень неплохо — как и в аналогичных тестах предыдущего раздела из RightMark.

Но год назад мы и в этом случае отмечали слишком большую разницу между старшей видеокартой S80 и младшей S70, которая уступала первой слишком сильно. Но свежие драйверы уже одинаково оптимизированы для обеих моделей, и S70 заметно приблизилась к топовому GPU, который также получил хоть и небольшой, но всё же ощутимый прирост производительности. В результате, хотя младшей S70 и не хватило скорости, чтобы обогнать Radeon RX 5500 XT и GeForce GTX 1650, но разница между ними в этом тесте уже совсем невелика, что намного лучше прошлогодней ситуации. Ну а старшая S80 теперь уже безоговорочно впереди всех.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что в нем рассчитываются физические взаимодействия (имитация ткани) при помощи GPU. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Скорость рендеринга в этом тесте также должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Должны в теории, но на видеокартах Nvidia мы давно получаем явно некорректные результаты в этом тесте, поэтому не учитываем их, как и результаты видеокарт поколения Radeon RX 7000. А для MTT всё даже еще хуже, результаты в этом тесте в десятки раз ниже, чем у конкурентов.

Как и в тестах геометрических и вершинных шейдеров из предыдущего раздела, тут всё очень плохо, и это не объяснить теорией. Скорее всего, дело в драйверах, которые никто не оптимизирует для таких задач и непопулярных тестовых пакетов. И обновление версии драйверов до 270.80 не изменило практически ничего, несмотря на то, что чисто формально S70 ускорилась более чем втрое. S80 вообще чуть-чуть потеряла в скорости, а обе они заметно медленнее своих условных соперников в любом случае.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

В этом случае мы видим почти то же самое, что и на прошлой диаграмме — и во втором геометрическом тесте из 3DMark Vantage результаты у китайских видеокарт компании Moore Threads получились не совсем корректные — в десятки раз хуже, чем у Radeon и GeForce. Новый драйвер ничего не улучшил и тут, MTT всё так же безнадежно отстают. Да, S70 снова ускорилась втрое, но толку то…

Мы даже предположили в прошлом году, что в китайских GPU есть какая-то аппаратная особенность или даже ошибка, связанная с обработкой геометрии в таких задачах, из-за которой это приходится обходить в драйверах, частично рассчитывая что-то на CPU, как это было в старые добрые годы расцвета аппаратно-ускоренной 3D-графики на стыке веков. Но всё же есть большая вероятность, что всё в очередной раз объясняется просто отсутствием необходимых оптимизаций в драйвере под этот конкретный тип задач.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

В этом математическом тесте производительность разных GPU не всегда соответствует теории, но она обычно близка к пиковой производительности видеочипов в предельных задачах, пусть и с оговорками. В тесте используются операции с плавающей запятой, и новые архитектуры обычно неплохо с ними справляются, но и старички тоже хороши — хотя тест уже порядком устарел, но для представленных GPU он подходит идеально.

Разница между младшей и старшей видеокартами MTT в этот раз оказалась слишком маленькой, что также не соответствует теории. Более того, свежие драйверы не улучшили, а даже ухудшили показатель младшей модели S70, а для старшей S80 он увеличился буквально на пару процентов. Остается порадоваться тому, что обе китайские видеокарты обошли и Radeon RX 5500 XT и GeForce GTX 1650, не говоря о самой слабой GTX 1050 Ti, оставшейся далеко позади с более чем вдвое худшим результатом.

Если подводить итоги обновления драйверов по DirectX 10 тестам, то можно сказать, что в тестах с текстурированием и заполнением буфера кадра, видеокарты MTT на фоне своих устаревших соперников смотрятся достаточно сильно, и свежие драйверы усилили их позиции в том числе и в математических тестах. А вот когда речь заходит о чем-то более редком для игр и ПО, вроде геометрических шейдеров или текстурных выборок из вершинных шейдеров, то в таких задачах китайский графический процессор выглядит очень бледно, несмотря на все программные улучшения. Посмотрим еще, что получится в более современных синтетических тестах, использующих DirectX 11.

Тесты Direct3D 11

Видеокарты Moore Threads изначально поддерживают DirectX 11, это позволило использовать Direct3D11-тесты из пакета разработчиков SDK Radeon. Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в этом примере используется гидродинамика сглаженных частиц. Число частиц в тесте устанавливаем максимально возможное — 64 000 штук.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

В первом Direct3D11-тесте модели видеокарт MTT S80 и S70 показали близкие результаты, что несколько неожиданно и странно. Их нельзя назвать провальными, как в некоторых тестах из предыдущих разделов, но всё же исполнение вычислительных шейдеров D3D11 не слишком хорошо оптимизировано в драйверах видеокарт MTT, судя по всему, поэтому они отстали не только от Radeon RX 5500 XT, но и GeForce GTX 1650, и даже уступили слабейшей GTX 1050 Ti! Впрочем, судя по высокой частоте кадров, вычисления в этом примере из SDK слишком просты даже для видеокарт такого низкого уровня.

Что касается свежих драйверов версии 270.80, то они… не изменили ровным счетом ничего. Похоже, что разработчики ПО для MTT (сами китайцы или специалисты Imagination Tech, архитектура которой легла в основу китайских GPU) оптимизировали DX11-часть драйвера разве что для конкретных игр, но не в универсальном виде, подходящем для любого ПО, использующего эту версию графического API. В первом DX11-тесте мы вообще не увидели никакой разницы между драйверами версий 270.80 и 230.40, возможно, она появится в остальных.

Второй D3D11-тест называется InstancingFX11, в этом примере из SDK используются DrawIndexedInstanced-вызовы для отрисовки множества одинаковых моделей объектов в кадре, а их разнообразие достигается при помощи использования текстурных массивов с различными текстурами для деревьев и травы. Для увеличения нагрузки на GPU мы использовали максимальные настройки: число деревьев и плотность травы.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Производительность рендеринга в этом тесте больше всего зависит от оптимизации драйвера и командного процессора GPU, с чем всё всегда было отлично у решений Nvidia, а вот AMD этим сначала не особо отличались, но затем улучшили свои позиции и теперь почти не уступают GeForce. Про решения Moore Threads этого не скажешь — мы уже отмечали, что как только задача отходит от распространенных тестов текстурирования и математических вычислений, то S80 и S70 показывают печально низкие результаты. Как получилось и в этот раз. Обновления драйверов за год снова не принесли никаких изменений для уже второго из наших DX11-тестов. И тут явно виноват недостаток оптимизации, так как по теории MTT точно не должны отставать в десятки раз от AMD и Nvidia.

Рассмотрим третий D3D11-пример — VarianceShadows11. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно любопытный именно с практической точки зрения. При тестировании мы использовали настройки по умолчанию.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. Тест этот важен потому, что подобные техники для отрисовки теней нередко используются в реальных играх, и, скорее всего, именно поэтому нам наконец-то попался тест DX11, в котором MTT S80 и S70 даже год назад показали неплохие результаты. Хотя и тогда они всё равно отставали от всех решений AMD и Nvidia — компаний, которые давно и хорошо оптимизировали аппаратное и программное обеспечение.

Разница между старшей и младшей моделями MTT и в прошлом году была небольшой, а обновление версии драйверов до 270.80 принесло явное и существенное улучшение в скорости рендеринга теней. Теперь не только старшая S80, но и младшая S70 стала быстрее обеих GeForce, хотя от Radeon они обе довольно далеки. Подобные работы по оптимизации для DX11-кода не могут не радовать — близкие техники отрисовки теней и сейчас часто используют в играх, поэтому мы должны увидеть схожий эффект от драйвера новой версии и в игровых тестах.

А теперь — новинка, в этом материале мы добавили еще один DX11-тест, который наконец-то заработал с новыми драйверами — это бенчмарк Fire Strike (обычная версия) из тестового пакета 3DMark. Это довольно известный и часто применяемый тест для сравнения производительности не слишком мощных графических процессоров.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Видеокарты MTT в этом тесте находятся примерно на уровне GeForce GTX 1050 Ti и уступают модели GTX 1650 совсем немного, а вот Radeon RX 5500 XT обгоняет их всех с большим преимуществом. Но всё же можно назвать позитивным результатом для решений MTT уже одно то, что этот популярный тест в принципе на них работает. Удивительна лишь довольно слабая разница между моделями S70 и S80 — 3% и 7% для разных тестов, соответственно. Чаще всего у нас получалась большая разница, да и по теории она должна быть несколько большей.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

В общем, если подводить какие-то итоги по синтетическим тестам, то можно сказать, что проблема в драйверах никуда не делась. Новая версия 270.80 позволила значительно увеличить производительность в большинстве из проведенных нами тестов, но во многих случаях она всё равно остается крайне низкой, что просто не позволяет на равных конкурировать с представителями даже очень старых поколений производства других компаний. По примеру видеокарт AMD и Intel, мы уже встречались со случаями, когда новые драйверы с внедренными в них оптимизациями позволяли поднять скорость рендеринга в разы, и это частично получилось и у MTT, но китайские решения всё равно продолжают уступать во многом именно из-за недостаточной проработки драйверов. Хотя у них есть запас по аппаратной производительности, но она скрыта не самой лучшей программной частью, и прошло уже очень много времени, а решения всех недостатков мы так и не увидели. И это понятно, ведь те же AMD и Nvidia долгие годы работали над оптимизацией своих драйверов, а Intel продолжает это делать и сейчас, но даже они уступают лидерам в этом моменте, что уж говорить о более мелких участниках рынка.

Тестирование: игровые тесты

Конфигурация тестового стенда

 

Конфигурация тестового стенда

Список инструментов тестирования

Во всех игровых тестах использовалось низкое качество графики в настройках.

  • Ashes of the Singularity
  • Dota 2
  • PlayerUnknown’s Battlegrounds
  • Counter-Strike: Global Offensive
  • Heroes of the Storm
  • World of Tanks
  • Monster Hunter: World
  • Far Cry 5
  • Crysis 3

Результаты тестирования в 3D-играх в разрешении 1920×1080

В прошлом году мы отобрали девять игровых тестов, в которых можно было получить приемлемую производительность на картах MTT, и всё работало без нареканий, причем игры требовались не очень старые, но ориентированные на DirectX 11 или DirectX 10. Напомним, что список официально поддерживаемых игр с сайта производителя по большей части состоит из китайских названий, которые ничего не говорят игрокам в остальном мире.

Тогда же мы протестировали в качестве конкурентов 4 карты бюджетного уровня:

  • Nvidia GeForce GTX 1650 4 ГБ (Palit GeForce GTX 1650 StormX)
  • Nvidia GeForce RTX 3050 8 ГБ (Palit GeForce GTX 3050 StormX)
  • AMD Radeon RX 6500 XT 4 ГБ (Gigabyte Radeon RX 6500 XT Gaming)
  • Intel Arc A380 6 ГБ (Gigabyte Intel Arc A380 Gaming)

В этом обновлении мы добавили еще и результаты Intel Arc A310 — самого медленного из регулярно тестируемых нами ускорителей на сегодняшний день:

  • Intel Arc A310 4 ГБ (Gigabyte Intel Arc A310 Gaming)

Повторим, что уровень карт MTT — разрешение не выше Full HD (почти всегда даже ниже). Также понятно, что использовать максимальный уровень графики для подобных экспериментов бессмысленно, даже со средним качеством игры зачастую буксовали, поэтому все тесты в итоге для единообразия выполнены на низких настройках графики в разрешении 1080p.

Конечно, основной предмет исследования в этот раз — изменение результатов карт MTT на новой версии драйверов 270.80 по сравнению с прошлой версией 230.40. Однако для чистоты эксперимента мы перетестировали и все остальные карты на актуальных версиях драйверов. Оптимизацией для самых бюджетных карт никто не занимается, и наши тесты это хорошо показали: либо изменений у них нет вообще, либо разница составляет 1-2 fps (и не всегда в сторону увеличения) А вот у MTT S80 и MTT S70… Впрочем, смотрите сами.

Полоски с результатом на более новой версии драйверов во всех случаях расположены ниже.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Ранее комфорт в Ashes of the Singularity даже у S80 был приемлемым, но не полным. При этом загрузка GPU у карт MTT была не максимальной (очевидная проблема драйверов). Теперь же ситуация весьма ощутимо поменялась в лучшую сторону: S80 улучшил производительность на 38%, а S70 — на 40%. При этом S80 сравнялся с Arc A310, по-прежнему отставая от GeForce GTX 1650 (но теперь он отстает на 14%, а было почти 1,5 раза). Играть стало комфортно как на S80, так и на S70.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

В Dota 2 при минимальном качестве графики играть в 1920×1080 было весьма комфортно и раньше, минимальный FPS всегда был выше 60. Тем не менее, новые драйверы обеспечили прирост 40% для S80 и 43% для S70 по сравнению с прошлогодними результатами. В итоге S80 не только догнал, но и обогнал GeForce GTX 1650, а S70 прилично подобрался к нему, сходу обогнав Arc A310.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

На старых версиях драйверов играть в PUBG почти было невозможно. При этом снова фиксировался «недогруз» карт MTT, они работали на 60%-70% по загрузке ядер, то есть была проблема с драйверами. Сравнивать с конкурентами даже не было смысла. На новых версиях драйверов производительность S80 выросла в 2,3 раза, а S70 — в 2,42 раза! Феноменальная работа по оптимизации! Да, до конкурентов всё еще далеко, однако уже стало можно играть, минимальный FPS не падал ниже 30.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Ранее мы отмечали, что в CS:GO комфорт был на приличном уровне, хотя минимальный FPS иногда падал ниже 40. Теперь же S80 улучшил свой результат на 44%, а S70 — на 49%. Конкуренты всё равно быстрее, но результаты теперь сопоставимы, а играть можно без каких-либо проблем — нареканий на стабильность, лаги и пр. не было.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

В Heroes of the Storm мы и ранее отмечали хороший комфорт, нареканий не было. Но всё равно стоит отметить, что новая версия драйвера MTT принесла S80 почти 35% прироста скорости, а S70 — 37%. Конкуренты снова быстрее, но разница сократилась серьезно.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Ситуация в World of Tanks практически такая же с точки зрения комфорта: играть можно, и отлично. При этом производительность S80/S70 на новых драйверах выросла очень сильно: +60%. В результате S80 и S70 смогли обойти не только Arc A310, но и GeForce GTX 1650, да и до Radeon RX 6500 XT осталось совсем чуть-чуть. В этой игре стало можно повышать качество графики до среднего, обе карты MTT при этом работают стабильно и обеспечивают приличный комфорт.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

В игре Monster Hunter: World у S80/S70 ранее наблюдались периодические лаги и фризы, теперь их практически нет, а в чистом виде производительность на новых драйверах выросла у S80 на 35%, а у S70 — на 29%. До конкурентов не дотянули совсем немного.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

В прошлом году мы отмечали, что у карт MTT были серьезные проблемы в этой игре, перерисовка сцен шла рывками. Теперь ситуация сильно улучшилась, геймплей стал плавным, хотя чистая производительность всё равно не дотягивает до планки комфорта.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Crysis 3 был единственным игровым тестом в нашем наборе, где карты MTT были вровень с конкурентами, имея достаточно высокий абсолютный показатель FPS, хотя и с периодическими лагами и фризами, особенно при вспышках огня (взрывах), когда показатель FPS мог падать до 10-15. На новых драйверах положение улучшилось, играть стало приятно, лаги пропали, а S80 тихой сапой стал лидером в общем зачете, обойдя даже GeForce RTX 3050 (S70 вышел на третье место). Впрочем, трубить в фанфары пока рано, это все-таки низкое качество графики.

Выводы

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Moore Threads MTT S80/S70 в целом

Ранее мы отмечали, что даже сам факт появления компании, желающей играть в одной лиге с такими монстрами, как Nvidia, AMD и Intel, является большим плюсом. При этом Moore Threads Technology ориентирована исключительно на внутренние китайские и свои собственные технологии, отсюда и первоначальная оптимизация и отладка ПО под китайские игры. Кроме того, карты уровня S80/S70, несмотря на солидный внешний вид, всё же в большей степени ориентированы на офисные ПК для огромного китайского госаппарата, а также для многочисленных бизнес-центров, которым не важны возможности их компьютеров в плане 3D-игр.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

Изначально мы отмечали, что главная проблема MTT S70/S80 — драйверы. Аналогично продукция компании Intel, которая вышла на рынок настольных ускорителей графики в 2022 году, поначалу катастрофически страдала из-за низкого качества ПО. Однако ситуация у Intel с тех пор заметно улучшилась, оптимизация драйверов не прекращается и по сей день, и сейчас карты семейства Arc почти во всех современных играх не уступают ни по скорости, ни и по качеству картинки сопоставимым по ТТХ решениям конкурентов. Но в случае Intel создатели драйверов ориентировались в первую очередь на современные игры на базе API DirectX 12 и Vulkan и лишь потом занялись оптимизацией ПО под «старье». В MTT выбрали противоположный подход: вначале поддержка старых игр с API DirectX 9, потом постепенное внедрение поддержки DirectX 10, теперь вот уже взялись за DirectX 11. Мы не знаем, почему так происходит; разработчик и его партнеры закрыты для внешнего мира. Вероятно, играют роль ограничения самой архитектуры, куда добавить поддержку API DirectX 12 и Vulkan просто невозможно. Другой вероятной причиной является отсутствие сотрудничества MTT с мировыми производителями игр, ведь у тех же AMD, Intel и Nvidia этот канал связи давным-давно налажен, и результат оптимизации налицо.

Китайские разработчики могут помочь с теми играми, которые выпускаются для внутреннего рынка — вероятно, поэтому они и доминируют в списке совместимости, выложенном на сайте MTT. Однако для выхода на глобальный рынок требуется сотрудничество с маститыми разработчиками, многие из которых находятся в США или Европе, и тут, скорее всего, вмешается политика, которая помешает такому сотрудничеству. Поэтому пока специалисты MTT пытаются самостоятельно отлаживать свое ПО, ориентируясь на свободные (а может, и не свободные) источники знаний по работе API и библиотек. И нынешние тесты показали, что результат есть, и весьма неплохой: с новыми драйверами производительность обеих карт сильно подросла во всех используемых нами играх — а это известные проекты уровня DX9/DX10/DX11.

Обновленный обзор китайских видеоускорителей Moore Threads MTT S80 и S70 (август 2024 г.)

В итоге MTT S80/S70 уже приемлемо работают в качестве игровых видеокарт, позволяют запускать некоторые игры уровня не выше DirectX 11 и обеспечивают в них приличный комфорт в разрешениях не выше Full HD при низком качестве графики. Разумеется, им еще далеко до уровня продуктов массового спроса, еще предстоит много работы по оптимизации драйверов и обслуживающего ПО (хотя бы возможность выбора языка интерфейса очень хотелось бы увидеть).

Moore Threads MTT S80 (16 ГБ)

Наши тесты показали, что в целом эта карта по-прежнему медленнее, чем Nvidia GeForce GTX 1650. Она может конкурировать только с GeForce GTX 1050 Ti или даже с GeForce GTX 1050, хотя в ряде игр все-таки догоняет GeForce GTX 1650 и Arc A310). Возможно, по мере отладки и выпуска новых версий драйверов картина и соотношение сил будут меняться и дальше, благо «на бумаге» характеристики у MTT S80 довольно серьезные. Стоит отметить, что поддержки DirectX 12 у этой карты может не появиться вовсе, если верна версия, что GPU основан на купленной старой архитектуре Imagination Tech, которая переработана под новые API и оптимизирована.

Прошлогодние наши исследования показали, что карта прекрасно аппаратно декодирует видеопотоки, но вот поддержка OpenCL была никакой. В результате почти во всех программах видеомонтажа (например, в Adobe Premiere) в окнах превью ничего не было. Новые драйвера улучшают ситуацию, уже стало возможно работать с превью, но пока полно артефактов. Ждем дальнейшего улучшения драйверов.

Мы отмечали, что видеокарта MTT S80 имеет достаточно тихий кулер, но для своего уровня производительности потребление у карты очень высокое, поскольку GPU произведен с использованием несовременного уже техпроцесса. Более того, GPU и микросхемы памяти всегда работают на высоких частотах, включая режим простоя (потребление после перехода в 2D почти не снижается). Если разработчикам удастся реализовать полноценный режим простоя, с резким снижением частот, то и потребление упадет, а там и до выключения вентиляторов недалеко. Всё это существенно улучшило бы пользовательский опыт взаимодействия с картой. Надеемся, что это возможно исправить в будущих версиях драйверов. И не помешало бы реализовать выключение подсветки для тех, кому будет мешать этот постоянно горящий оранжевый «глаз».

Moore Threads MTT S70 (7 ГБ)

Мы уже упоминали, что подход к созданию младшей версии ускорителя странный: не только уменьшить вдвое емкость микросхем видеопамяти по сравнению со старшим вариантом, но и снять одну из восьми микросхем, получив в итоге объем 7 ГБ вместо 16 ГБ. При этом карты мало различаются по количеству исполнительных блоков. Безусловно, 16 ГБ для игровой видеокарты такого уровня, как MTT S80, это излишняя роскошь (8 ГБ хватило бы за глаза). Впрочем, возможно, установка 16 ГБ локальной памяти несет какой-то другой смысл. В любом случае, разница в производительности между S80 и S70 совсем небольшая и явно определяется не объемом памяти.

Что касается самой видеокарты, то для нее справедливо абсолютно всё, сказанное выше про S80.

Итог

На данный момент видеокарты MTT по-прежнему остаются не массовыми продуктами, они всё еще нуждаются в долгой отладке и совершенствовании. Человек, купивший сейчас любую из этих видеокарт, поневоле становится бета-тестером за свои же деньги.

Тем не менее, прогресс в совершенствовании ПО наблюдать отрадно. За полгода производительность в целом заметно выросла, проблемы со стабильностью в играх стали отмечаться реже, хотя они всё еще имеются, особенно в играх под DX11. Пока мы с осторожным оптимизмом смотрим в будущее этих продуктов.

К тому же приятно отметить, что кто-то пытается делать свое, не завися от американских технологий. Главное достижение этого подхода — возможность усиления конкуренции, которая сейчас очень не помешает с учетом непомерно раздутых аппетитов американских производителей GPU.

Данный обзор — не последний. Мы планируем провести дополнительное исследование, когда для него наберется достаточно материала, включая тесты в профессиональных приложениях с поддержкой OpenCL.

Благодарим Владислава Громова из Хабаровска (Telegram-канал)
за помощь в оперативном получении нового оборудования из Китая


Источник