На конференции WWDC компания Apple объявила о выпуске нового SoC M2 из 20 миллиардов транзисторов. К сожалению, в некоторых областях, например, для центрального процессора, это довольно незначительный рост. В основном увеличение производительности связано с GPU и редактированием видео. В целом рост производительности немного разочаровывает, если учесть затраты на новый M2 и то, что после выпуска M1 прошло уже почти два года. История с повышением цены похожа на ситуацию с A16, когда Apple была вынуждена использовать SoC A16 на моделях iPhone Pro и A15 на обычных iPhone из-за стоимости комплектующих.
Сегодня мы обсудим подробности архитектуры M2 и будущие проекты Apple, в том числе M2 Pro/Max и M3, о которых не говорили на WWDC. Также благодаря помощи пользователя Locuza мы проведём анализ площади кристалла по снимкам M2, опубликованным Apple.
Очень странно видеть, что некоторые специалисты называют новый продукт M1.5 или M1+. Это просто чушь. В целом M1 создан на основе тех же IP-блоков, что и Apple A14 (с небольшими изменениями). M2, имеющий кодовое название Staten, основан на тех же IP-блоках, что и A15 (кодовое название Ellis). Кодовые названия взяты у самых известных островов Нью-Йорка, поэтому намекают о тесной взаимосвязи этих архитектур. Разочарование незначительным ростом производительности при переходе на новое поколение вызвано тем, что после выпуска M1 пришлось ждать два года. Многие люди ожидали от M2 большего.
Мы уже говорили об этом в прошлом: во многом замедление развития связано с тем, что многие потрясающие инженеры Apple уходят в такие компании, как Nuvia и Rivos. Утечка мозгов за последние годы не прекратилась из-за не самой лучшей корпоративной культуры Apple; к тому же многие компании, в частности, такие гиперскейлеры, как Google, Microsoft, Amazon и Meta, платят больше, чем платила Apple за привлечение сотрудников. Наконец, произошёл исход из компании мотивированных инженеров, считающих, что им успешно удалось выполнить переход Apple с процессоров Intel на собственные. Эти инженеры ушли, потому что захотели работать над более интересными проектами в компаниях-гиперскейлерах или в традиционных фирмах.
Эти увольнения привели к тому, что в A15 и M2, а также, возможно, в следующем чипе A16, рост производительности ЦП будет более умеренным. Мы слышали, что в A16 не используется ядро нового поколения на основе Armv9; печально, если это так, ведь Apple первой использовала Armv8. Мы слышали, что это ядро Armv9 нового поколения появится только в M3, который станет первым продуктом Apple на техпроцессе N3 TSMC. Apple уже спроектировала и передала в производство M2 Pro и M2 Max, в которых по-прежнему используются N5 и IP-блоки A15.
Давайте исследуем снимок. Apple опубликовала снимок M1 и M2, не имеющий никаких пометок. Из него следует, что M2 имеет площадь 141,7 мм2, но мы считаем, что Apple подредактировала снимок кристалла. Такое происходит не впервые. Apple так же поступила с M1 Max, скрыв соединения между кристаллами, использованное в M1 Ultra. Ещё компания сместила геометрические размеры.
Снимок M2, кажется, тоже сделан не в масштабе. Можно сравнить ячейки SRAM и PHY, которые должны быть одинаковыми у всех чипов, и увидеть, что M2 кажется меньше, чем он должен быть. Кроме того, представленный Apple M2, похоже, имеет бОльшую, чем у A15, плотность транзисторов, что тоже выглядит несоответствием. Он должен иметь меньшую плотность из-за меньшей общей площади, выделенной на ячейки SRAM высокой плотности, и большей площади, выделенной для ввода-вывода и прочей логики. Поэтому Locuza изменил масштаб снимка кристалла M2. После масштабирования ячейки SRAM и идентичные PHY стали эквивалентны по размерам этим элементам на M1 и A15. Из-за обработки маркетингового изображения Apple после масштабирования кристалла появился диапазон погрешностей примерно в 3%. Значения в статье представлены так, как они были измерены, без учёта величин погрешностей.
Давайте теперь разберёмся, как Apple использовала увеличившуюся площадь кристалла.
Начнём с P-Core Apple. Оно создано на основе ядра Avalanche Apple, использовавшегося в A15, однако присутствуют небольшие отличия. Это соответствует подходу, использованному в M1 Pro и M1 Max: в них применялось модифицированное ядро Firestorm, способное справляться с бОльшими объёмами памяти благодаря расширенной адресации страниц. В ядра на основе M также внесено несколько модификаций, помогающих в работе со страницами разного размера, которые должны поддерживаться в MacOS.
Само ядро на 21% больше по площади, чем ядро M1, и на 7% больше, чем у A15. Большая часть увеличения площади кристалла между поколениями связана с размером общего кэша L2, выросшим с 12 МБ до 16 МБ. Блок AMX выглядит одинаковым с A15 и M1. Слой совместно используемой логики тоже стал существенно больше, это является показателем того, что полоса пропускания между ядрами, кэшем L2 и SLC стала шире. Суммарно Apple выделила 5,2 мм2 на большие P-Core, однако связанный с ними рост производительности в основном вызван увеличением тактовых частот. Судя по обзорам, увеличение количества инструкций на такт (IPC) достаточно незначительно.
Очень интересное изменение заключается в том, что ROB в ядре Avalanche, используемом в A15 и M2, стал меньше по сравнению с ROB (Re-order Buffer, переупорядочивающим буфером) ядра Firestorm, применяемого в M1 и A14. Это особенно интересно, потому что Apple использует самый крупный ROB в отрасли, чтобы обеспечить ядро самым широким и высоким количеством инструкций на такт в отрасли.
При переходе от A14 к A15 самым большим изменением с точки зрения центрального процессора стало E-Core; здесь ситуация такая же. После масштабирования опубликованного Apple снимка кристалла видно, что ядра E-Core между A15 и M2 выглядят практически идентично, и это хороший признак того, что масштаб подобран правильно. Apple не вносила или почти не вносила изменений в E-Core для процессоров Mac по сравнению с изменениями и новым физическим дизайном ядер P-Core.
Про E-Core сказать особо нечего, поскольку достаточно очевидно, что оно ничем не отличается от E-Core A15, который уже тщательно протестирован. В целом комплекс E-Core лишь на 1 мм2 больше по сравнению с предыдущим поколением, при том, что весь комплекс ЦП больше на 6,2 мм2.
После масштабирования GPU тоже стало похоже, что он имеет примерно такой же размер ядер, в сравнении с M1 и его 128 АЛУ. Это очень интересно, потому что это один из тех аспектов, в которых M1 отличался от A14. Это было архитектурное изменение, несмотря на то, что оба этих процессора относятся к одному поколению. У Apple уже был прецедент с SoC X, в котором появились изменения по сравнению с SoC A. Например, много лет назад A6 и A6X имели разные архитектуры GPU. Учитывая, что SoC серии M — это просто ребрендированная серия X, это логично. Текущее поколение ядра GPU, кажется, осталось неизменным, однако совместно используемая логика и прочие элементы стали больше, поэтому можно предположить, что есть изменения в аспектах фиксированной функциональности. Основным отличием стало количество ядер, Apple увеличила его до десяти. Отдельно можно упомянуть тактовую частоту GPU, выросшую с 1,27 ГГц до 1,406 ГГц.
По сравнению с предыдущим поколением новый GPU увеличился почти на 7 мм2. Это приличный рост производительности, хоть Apple и заявила, что при максимальном уровне производительности энергопотребление немного увеличивается. Однако при том же уровне энергопотребления Apple всё равно получила неплохое повышение производительности из-за улучшения памяти и более широкого/медленного дизайна. Мы также добавили в график показатели NPU и SLC. Показатели NPU кажутся немного странными, поэтому их мы пропустим. А вот с SLC всё любопытно.
Каждый массив данных на 2 МБ одинаков по размерам у M1, A15 и отмасштабированного снимка кристалла M2, что логично и оправдывает то, что мы масштабировали его, подгоняя под одинаковый размер PHY. При переходе от первого ко второму поколению техпроцесса N5 размер SRAM не уменьшился. Несмотря на это, SLC немного выросла в размерах; скорее всего, увеличили пропускную способность различных IP-блоков, например, выросшего в размерах GPU.
Последний IP-блок, который нужно сравнить — это контроллер памяти + PHY. Здесь Apple существенно увеличила площадь для поддержки LPDDR5 6400. На изображении выше показан один блок, но, разумеется, контроллер памяти имеет много каналов. Общая площадь, выделенная 128-битной шине LP5, примерно равна 14 мм2 по сравнению с 8,1 мм2 на M1 с его 128-битной LP4X и 4,3 мм2 на A15 с 64-битной LP4X. С точки зрения затрат стоит заметить, что LPDDR5 6400 существенно дороже LPDDR4X 4266.
Это тоже важный аспект для Apple, которая собирается разделить линейку A15 и A16 в iPhone этого года. Мы писали об этом решении здесь. В целом, Apple придётся столкнуться с подобными проблемами и у M2, именно поэтому компания оставляет модели на основе M1 для нижнего ценового диапазона. Сочетание небольшого повышения стоимости кремниевых пластин, увеличения площади кристалла с 118,91 мм2 до 155,25 мм2 и более дорогой памяти сильно мешает компании.
Последний IP-блок, который мы не проанализировали — это сильно увеличившийся медиадвижок, обеспечивающий расширенные возможности работы с медиа. Серия Apple M, несомненно, является лучшей SoC для творческих работников, и с этим вопросов нет. Если вы работаете с пакетом Adobe, то серия M подойдёт вам больше всего.
Комментарии (14)
hardtop
13.06.2022 14:32+3А зачем эпплу сейчас слишком быстрый М2? Это подорвёт продажи 14 и 16 дюймовых ноутов.
нормальный минорный апдейт получился.
Hardcoin
13.06.2022 14:48Что бы отнять долю у windows-устройств. Очень быстрые ноутбуки - это хорошо в конкурентной борьбе.
napa3um
13.06.2022 15:01+6Так по железной производительности их мало кто сейчас обгоняет и так (если ноут - не печка), а остальную экономику они на софтварной стороне законкурируют. Эпл, в основном, продают не сырые герцы и флопы, а какие-нибудь минуты рендера в каком-нибудь Давинчи или Адобе, где они всегда подхитрят со всякими периферийными блоками процессора или режимами памяти :).
Zhenya1243
13.06.2022 16:45Интересно, смогут ли когда-нибудь встройки заменить дискретки. Чтобы геймерам достаточно было купить хороший процессор.Для крупных вычислений, рендера, конечно, вряд-ли, но чтобы можно было комфортно играть в современные игры на средних-высоких.
andreymal
13.06.2022 16:50Это зависит не от процессора, а от разработчиков игр. Если они будут делать средне-высокие настройки специально под мощные дискретки, то никакая встройка уже не поможет
nixtonixto
13.06.2022 17:40+1Вряд ли смогут, потому что мощный видеочип по размерам и количеству транзисторов заметно больше мощного процессора. Поэтому, в лучшем случае — получится видеокарта со встроенным процессором. И у процессора с таким видеоядром будет вечный конфликт с доступом к ОЗУ.
pomponchik
13.06.2022 21:19-1Так тот же Steam Deck уже практически подходит под это описание. 20-30 fps на высоких в Cyberpunk 2077.
leok
13.06.2022 17:49Нереалистично ожидать после большого улучшения такое же или похожее улучшение.
Nbx
13.06.2022 18:45Довольно долго у эпла были очень большие улучшения с каждой итерации процессоров, но похоже догнали конкурентов и теперь на 50% улучшать с новой версией фактически нереально. Чуда не произошло.
napa3um
13.06.2022 19:06-4Если бы всех этих сомнительных событий в полупроводниковой сфере не случилось (ковидные манёвры в Китае, повлиявшие на работу крупных заводов электроники, возня на Тайване, - мировом поставщике чипов, спец-операция на Украине - мировом поставщике неона для изготовления этих чипов, сюда же на чуть более околоконспирологических основаниях можно включить и спекуляции на производстве/продаже майнингового оборудования), и все более-менее развитые страны и их сателиты бы продолжали иметь примерно равный (или хотя бы стабильный) доступ к новейшим технологиям производства чипов, то сейчас мы бы уже потребляли трёхнанометровые процессоры, обгоняющие M1 на процентов 50-100 по производительности/энергоэффективности, и рассматривали бы анонсы двухнанометровых на новый год :).
Но, конечно, история не знает сослагательного наклонения, и такой стационарной экономической системы в глобальном капитализме нам не видать, и всё, что происходит, происходит неизбежно и как следствие процессов, развивающихся десятилетиями/столетиями. Крупные капиталы изо всех сил борются за закрепление своего доминирования в шестом технологическом укладе и в первенстве перехода в седьмой, используя для этого абсолютно любые методы. "Мирный" маркетинговый закон Мура постепенно трансформируется в "военный" закон стратегического превосходства, и основным тормозом прогресса становятся не технологии, а механизмы перераспределения ресурсов и благ по планете :). (На правах вечерней графомании.)
logran
14.06.2022 10:28+1Ну почему же, AMD смогли. Сперва с переходом на рязань, а потом дав ей пару очень неплохих скейлов.
NickViz
" Судя по обзорам, увеличение межпроцессорного взаимодействия (IPC) достаточно незначительно " IPC в данном случае instructions per cycle и перевести надо как судя по обзорам увеличение количества инструкций на такт незначительно.
PatientZero Автор
Спасибо, исправлю