Наряду с запуском нового решения Arm Total Compute Solution на 2023 год в виде Cortex-X4, A720 и A520, мы также рассматриваем графические процессоры Arm на следующий год. Сюда входят новые Immortalis G720, Mali G720 и Mali G620. Это графические процессоры Arm 5-го поколения, и это также новое соглашение об именах для графических процессоров Arm. Больше никаких «Вальхалл» или «Бифрост»; это просто “5-е поколение”.
Каждый из этих графических процессоров является относительно простым шагом вперед по сравнению со своими предшественниками, а Immortalis G720 является лучшим графическим процессором от Arm. Как и в случае с их ядрами, графические процессоры здесь особенно рекламируются за их повышение эффективности, хотя есть и довольно большой прирост производительности. По словам Арма, треть потребляемой мощности в высокопроизводительных играх приходится на доступ к памяти, а использование пропускной способности памяти сократилось на 40%.
Учитывая, насколько хорошим был Immortalis G715 в прошлом году, становится ясно, что Arm действительно начинает становиться грозным соперником, когда дело доходит до графических процессоров.
Различие между Бессмертным и Злым
Прежде чем углубляться в новые графические процессоры Arm, важно определить, в чем различия между Immortalis и Mali, особенно потому, что линии, обозначающие имена общих частей, несколько размыты. Когда я спросил Arm, мне сказали, что, когда OEM-производители оснащают свои чипсеты графическими процессорами Arm, графические процессоры продаются как Immortalis. должен имеют блок трассировки лучей, тогда как Mali G720 может но не обязан.
Кроме того, Mali G720 может иметь от шести до девяти ядер, тогда как Immortalis G720 может иметь до 16 ядер. Что касается Mali G620, то он ограничен пятью ядрами, хотя это гораздо более бюджетный графический процессор.
Immortalis G720 от Arm — лучший графический процессор на данный момент
Большая революция новейших графических процессоров Arm — это Deferred Vertex Shading, или DVS. Arm уже лидирует в области шейдинга с переменной скоростью и трассировки лучей, а следующим шагом к улучшению стала пропускная способность и энергопотребление. В результате этих улучшений Arm заявляет о повышении производительности на 15% на ватт, а также в среднем на 15% о повышении пиковой производительности.
Что касается реальной производительности, Arm показал улучшение производительности до 20% по сравнению с Immortalis G715, где большая часть этого может быть связана с экономией полосы пропускания за счет DVS. Из-за этой экономии полосы пропускания могут быть добавлены эффекты уровня ПК, такие как динамическое освещение в реальном времени, цветение, глубина резкости и окклюзия окружающего пространства на экране. Фактически, в результате этого десктопный рендерер Unreal Engine 5 появится на Android позже в этом году.
Отложенное затенение вершин является «главной функцией» G720 и позволяет средству визуализации откладывать затенение вершин до затенения фрагментов (для каждого тайла). Порядок в списке полигонов по-прежнему сохраняется, а частота кадров увеличивается (в среднем на 15 %) по сравнению с G715, а это означает, что пользователь может извлечь выгоду из снижения использования полосы пропускания благодаря тому, что конвейеру рендеринга не нужно хранить промежуточные данные вершин в памяти. Арм также заверил меня, что это также не повлияет на частоту кадров, так что вы получите постоянный игровой опыт. Это встроено в графический процессор, поэтому разработчикам не нужно ничего делать для его использования.
В свою очередь, хотя Arm не поделился какими-либо конкретными цифрами, это также улучшит производительность при использовании трассировки лучей. Учитывая лидерство ARM в этой области уже со своими графическими процессорами Immortalis, это, вероятно, только увеличит разрыв, если конкуренты не сделают значительных скачков. Arm также добавила модуль 2x MSAA, поскольку ранее, когда разработчик запрашивал 2x MSAA от графического процессора, он автоматически переходил на 4x MSAA.
В графическом процессоре также были сделаны другие улучшения, но они меньше по масштабу. Внешний интерфейс потока команд (CSF) претерпел некоторые улучшения за счет дополнительных рабочих регистров для потоковой обработки, а другие устройства по всем направлениям улучшили свою пропускную способность. CSF обрабатывает планирование и вызовы отрисовки с помощью собственных вычислительных возможностей.
Арм говорит, что при тех же ограничениях мощности, что и у прошлогоднего графического процессора, у вас будет более мощный графический процессор, который масштабируется до более эффективного графического процессора при той же мощности.
Как и в случае с его ядрами, эффективность графического процессора имеет большое значение.
Похоже, что в этом году Arm добилась больших успехов в эффективности, и с ее графическими процессорами дело обстоит точно так же. Это не значит, что повышение производительности не является целью, как это очевидно (и компания все еще пытается наверстать упущенное), но эффективность важна для большинства людей. Хотя потенциал прироста производительности на этот раз чрезвычайно велик, большинство людей, вероятно, будут надеяться на лучшее время автономной работы в целом.
Сказав это, эти 40% улучшения пропускной способности нельзя недооценивать, а 15% улучшение средней частоты кадров не вызывает насмешек. Мы будем рады увидеть, какие наборы микросхем могут включать этот графический процессор в будущем, и как он сравнивается с будущими графическими процессорами в таких наборах микросхем, как Snapdragon 8 Gen 3 позже в этом году.