Несколько недель назад мы видели, как Apple анонсировала свои новейшие устройства серии iPhone 13, набор телефонов, работающих на новейшей SoC Apple A15. Сегодня, в преддверии полного обзора устройства, который мы рассмотрим в ближайшем будущем, мы более подробно рассмотрим набор микросхем нового поколения, посмотрим, что именно Apple изменила в новом кристалле, и соответствует ли он требованиям. Реклама.
Анонс A15 в этом году был немного страннее с точки зрения PR Apple, особенно потому, что компания в целом избегала сравнения поколений между новым дизайном и собственным A14 от Apple. Особенно примечателен тот факт, что Apple предпочла описать SoC в контексте конкуренции; Хотя для Mac в этом нет ничего необычного, в этом году анонс iPhone стал более заметным, чем обычно.
Несколько конкретных фактов об A15 заключались в том, что Apple использует новые конструкции для своих процессоров, более быстрый нейронный движок, новый 4- или 5-ядерный графический процессор в зависимости от варианта iPhone, а также совершенно новый конвейер отображения и аппаратный блок мультимедиа для видео. кодирование и декодирование, а также новые улучшения ISP для улучшения качества камеры.
Что касается ЦП, улучшения были очень расплывчатыми, поскольку Apple указала, что он на 50% быстрее, чем у конкурентов, и показатели производительности графического процессора также были сделаны таким образом, описывая 4-ядерный графический процессор A15, который на 30% быстрее, чем конкуренция, а 5-ядерный вариант на 50% быстрее. Мы опробовали SoC на начальном этапе, и в сегодняшней статье мы сосредоточимся на точных показателях производительности и эффективности нового чипа.
Повышение частоты; Ядра с тактовой частотой 3,24 ГГц и эффективностью 2,0 ГГц
Говорят, что начиная со стороны ЦП, новый A15 имеет две новые микроархитектуры ЦП, как для ядер производительности, так и для ядер эффективности. Первые несколько отчетов о производительности новых ядер были сосредоточены вокруг частот, которые мы теперь можем подтвердить в наших измерениях:
Максимальная частота по сравнению с загруженными потоками Максимальная МГц на ядро |
||||||
Яблоко A15 | 1 | 2 | 3 | 4 | ||
Производительность 1 | 3240 | 3180 | ||||
Производительность 2 | 3180 | |||||
Эффективность 1 | 2016 г. | 2016 г. | 2016 г. | 2016 г. | ||
Эффективность 2 | 2016 г. | 2016 г. | 2016 г. | |||
Эффективность 3 | 2016 г. | 2016 г. | ||||
Эффективность 4 | 2016 г. |
Максимальная частота по сравнению с загруженными потоками Максимальная МГц на ядро |
||||||
Яблоко A14 | 1 | 2 | 3 | 4 | ||
Производительность 1 | 2998 | 2890 | ||||
Производительность 2 | 2890 | |||||
Эффективность 1 | 1823 г. | 1823 г. | 1823 г. | 1823 г. | ||
Эффективность 2 | 1823 г. | 1823 г. | 1823 г. | |||
Эффективность 3 | 1823 г. | 1823 г. | ||||
Эффективность 4 | 1823 г. |
По сравнению с A14, новый A15 увеличивает пиковую частоту одноядерного кластера с двумя производительными ядрами на 8%, достигнув теперь 3240 МГц по сравнению с 2998 МГц в предыдущем поколении. Когда оба высокопроизводительных ядра активны, их рабочая частота фактически увеличивается на 10%, оба теперь работают на агрессивной частоте 3180 МГц по сравнению с 2890 МГц в предыдущем поколении.
В целом, увеличение частоты Apple здесь довольно агрессивно, учитывая тот факт, что довольно сложно продвинуть этот аспект производительности дизайна, особенно когда мы не ожидаем значительного увеличения производительности со стороны нового технологического узла. A15 должен быть сделан на варианте узла N5P от TSMC, хотя ни одна из компаний не раскрывает точных деталей конструкции. TSMC заявляет об увеличении частоты на + 5% по сравнению с N5, поэтому для Apple, если бы они пошли дальше, это означало бы увеличение энергопотребления, о чем следует помнить, когда мы углубимся в характеристики мощности процессоров.
E-ядра A15 теперь могут работать с тактовой частотой до 2016 МГц, что на 10,5% больше, чем у ядер A14. Частота здесь не зависит от производительности ядер, так как количество потоков в кластере не влияет на другой кластер, или наоборот. Apple внесла еще несколько интересных изменений в маленькие ядра этого поколения, о которых мы поговорим чуть позже.
Гигантские кэши: производительный ЦП от L2 до 12 МБ, от SLC до массивных 32 МБ
Еще одна прямолинейная техническая деталь, которую Apple раскрыла во время своего запуска, заключалась в том, что A15 теперь имеет вдвое больший объем системного кеша по сравнению с A14. Два года назад мы подробно описали новый SLC A13, который вырос с 8 МБ в A12 до 16 МБ, размер, который также оставался неизменным в поколении A14. Apple, утверждающая, что они удвоили это значение, следовательно, будет означать, что теперь это 32 МБ в A15.
Глядя на наши тесты задержки на новом A15, мы действительно можем теперь подтвердить, что SLC теперь удвоился до 32 МБ, что еще больше увеличивает глубину памяти для достижения DRAM. SLC от Apple, вероятно, станет ключевым фактором в энергоэффективности чипа, поскольку сможет поддерживать доступ к памяти на одном и том же кристалле, а не переходить на более медленную и неэффективную DRAM с меньшим энергопотреблением. Мы видели, что эти типы кэшей последнего уровня используются большим количеством поставщиков SoC, но при 32 МБ новый A15 затмевает реализации конкурентов, такие как SLC 3 МБ на Snapdragon 888 или предполагаемый SLC 6-8 МБ на Exynos 2100 .
Что Apple не разглашала, так это изменения кеш-памяти второго уровня для производительных ядер, которая теперь выросла на 50% с 8 МБ до 12 МБ. Фактически это был тот же размер L2, что и на Apple M1, только на этот раз он обслуживает только два ядра производительности, а не четыре. Задержка доступа увеличилась с 16 циклов на A14 до 18 циклов на A15. Что касается ядер производительности, я также вижу некоторые изменения в скоростях L1, так как кажется, что он может делать доступы за один цикл к строкам кеша, пока они находятся на одной странице, тот же тип доступа на A14 занимает 3 цикла.
L2 12 МБ снова огромен, более чем вдвое по сравнению с объединенным L3 + L2 (4 + 1 + 3×0,5 = 6,5 МБ) других конструкций, таких как Snapdragon 888. Похоже, что Apple вложила в это много SRAM. годового поколения SoC.
Ядра эффективности в этом году, похоже, не изменили размер своего кеша, оставаясь на уровне 64 КБ L1D и 4 МБ общего L2, однако мы видим, что Apple увеличила TLB L2 до 2048 записей, теперь охватывая до 32 МБ, что, вероятно, облегчит доступ к SLC. задержки. Интересно, что Apple в этом году теперь позволяет ядрам эффективности иметь более быстрый доступ к DRAM, с задержками около 130 нс по сравнению с + 215 нс на A14, что снова следует иметь в виду в следующем разделе статьи о производительности.
Изменения в микроархитектуре ЦП: год медленный?
Микроархитектуры ЦП в этом году были чем-то вроде подстановочного знака. Ранее в этом году Arm анонсировала новый Armv9 ISA, в основном определяемый новым набором инструкций SVE2 SIMD, а также новый IP-процессор процессора серии Cortex, в котором используется новая архитектура. Еще в 2013 году Apple была печально известна тем, что первой на рынке представила процессор Armv8, первый мобильный дизайн с поддержкой 64-битной архитектуры. Учитывая этот контекст, я в целом ожидал, что поколение этого года также представит v9, но, тем не менее, это не относится к A15.
С точки зрения микроархитектуры новые производительные ядра на A15, похоже, не сильно отличаются от прошлогодних разработок. Я еще не потратил время на то, чтобы изучить каждый уголок дизайна, но, по крайней мере, внутренняя часть процессора идентична по пропускной способности и задержкам по сравнению с производительными ядрами A14.
Ядра эффективности претерпели больше изменений, наряду с некоторыми изменениями TLB подсистемы памяти, новое ядро E теперь получает дополнительный целочисленный ALU, в результате чего общее количество увеличилось до 4 по сравнению с предыдущими 3. Ядро в течение некоторого времени больше не могло можно назвать «маленьким» в любом случае, и, похоже, в этом году он еще больше вырос, опять же, что мы продемонстрируем в разделе производительности.
Возможной причиной более умеренных изменений микроархитектуры Apple в этом году может быть ряд факторов – Apple заметно потеряла своего ведущего архитектора по ядрам с большой производительностью, а также часть проектных групп, уступив Nuvia еще в 2019 году ( позже приобретенный Qualcomm в начале этого года). Переход к Armv9 может также означать, что над дизайном будет проделана дополнительная работа, а ситуация с пандемией также может поспособствовать некоторому неидеальному исполнению. Нам нужно будет изучить A16 в следующем году, чтобы действительно определить, замедлилась ли темп дизайна Apple, или это было просто пробуксовкой, или просто затишье перед гораздо более крупными изменениями в следующей микроархитектуре.
Конечно, здесь говорится о довольно консервативном улучшении процессоров A15, которые, если смотреть на производительность и эффективность, совсем не так.