Хотя чиплеты существуют уже несколько десятилетий, их использование исторически ограничивалось определенными, специализированными областями применения. Однако сегодня они находятся на передовой линии развития технологий, обеспечивая работу миллионов настольных ПК, рабочих станций, серверов, игровых консолей, телефонов по всему миру.
Всего за несколько лет большинство ведущих производителей микросхем использовали технологию чиплетов для создания инноваций. Теперь очевидно, что чиплеты могут стать стандартом в индустрии. Давайте разберемся, что делает их столь значимыми и как они формируют будущее технологий.
Что такое чиплеты?
Чиплеты — это отдельные функциональные блоки процессора, которые соединяются в единое целое, заменяя традиционный монолитный дизайн. Вместо того чтобы объединять все части в единый чип (так называемый монолитный подход), отдельные секции производятся в виде отдельных чипов. Затем эти отдельные чипы собираются в единый корпус с помощью сложной системы соединений.
Такая компоновка позволяет уменьшить размеры деталей, которые могут воспользоваться новейшими методами производства, повышая эффективность процесса и позволяя вместить больше компонентов.
Те части чипа, которые не могут быть значительно уменьшены или не требуют уменьшения, могут быть изготовлены с помощью старых и более экономичных методов.
Хотя процесс производства таких процессоров сложен, общая стоимость обычно ниже. Кроме того, это дает компаниям, производящим процессоры, возможность расширить ассортимент своей продукции.
Процесс производства процессоров
Чтобы полностью понять, почему производители процессоров стали использовать чиплеты, сначала разберёмся, как создаются эти устройства. CPU и GPU начинаются с кремниевых пластин — больших дисков из сверхчистого кремния, обычно диаметром 300 мм (12 дюймов) и толщиной от 0,5 мм до 1,5 мм.
Кремниевая пластина проходит последовательность сложных этапов, в результате чего образуется множество слоев различных материалов — изоляторов, диэлектриков и металлов. Узоры этих слоев создаются с помощью процесса, называемого фотолитографией, когда ультрафиолетовый свет проходит через увеличенную версию узора (маску), а затем уменьшается с помощью линз до нужного размера.
Затем рисунок повторяется с заданными интервалами по всей поверхности пластины, и каждая из них в конечном итоге становится процессором. Поскольку чипы прямоугольные, а пластины круглые, узоры должны перекрывать периметр пластины. Эти перекрывающиеся части в конечном итоге выбрасываются, так как они не являются функциональными.
После завершения работ пластина тестируется с помощью датчика, прикладываемого к каждому чипу. По результатам электрического тестирования инженеры получают информацию о качестве процессора по длинному списку критериев. Этот начальный этап, известный как бининг чипов, помогает определить «класс» процессора.
Например, если чип предназначен для центрального процессора, каждая деталь должна функционировать правильно, работая в заданном диапазоне тактовых частот при определенном напряжении. Каждый участок пластины классифицируется по результатам тестирования.
После этого пластина разрезается на отдельные части, или «матрицы», которые пригодны для использования. Затем эти матрицы устанавливаются на подложку, напоминающую специализированную материнскую плату. Процессор далее проходит процедуру компоновки (например, с помощью теплораспределителя), после чего он готов к продаже.
Вся последовательность действий может занимать несколько недель, и такие компании, как TSMC и Samsung, берут высокую плату за каждую полупроводниковую пластину — от $3 000 до 20 000 в зависимости от используемого технологического узла.
Технологический узел — это термин, который обозначает поколение полупроводникового производства. В прошлом название узла соответствовало длине затвора транзистора, но с развитием технологий оно потеряло связь с физическими размерами. Теперь этот термин отражает общее усовершенствование процессов: увеличение плотности транзисторов, снижение энергопотребления и повышение производительности.
Тем не менее, каждый новый технологический узел приносит улучшения по сравнению с предыдущим. Он может быть дешевле в производстве, потреблять меньше энергии при той же тактовой частоте (или наоборот) или иметь более высокую плотность. Последний показатель измеряет, сколько компонентов может поместиться на заданной площади матрицы. На графике ниже вы можете увидеть, как это менялось с годами для графических процессоров (самых больших и сложных чипов, которые можно найти в ПК).
Хотя логика по-прежнему занимает большую часть матрицы, объем SRAM в современных CPU и GPU за последние годы значительно вырос. Например, чип Vega 20 компании AMD, используемый в видеокарте Radeon VII (2019), имеет суммарный кэш L1 и L2 объемом 5 МБ. Всего два поколения GPU спустя, чип Navi 21, используемый в серии Radeon RX 6000 (2020), включал более 130 МБ кэш-памяти — поразительный 25-кратный рост.
Можно ожидать, что этот показатель будет расти и дальше по мере разработки новых поколений процессоров, но поскольку память не масштабируется так же, как логика, производство всех схем на одном технологическом узле будет становиться все менее рентабельным.
В идеальном мире можно было бы спроектировать матрицу, в которой аналоговые секции изготавливались бы на самом большом и дешевом узле, части SRAM — на гораздо меньшем, а логика предназначалась бы для абсолютно передовой технологии. К сожалению, это практически недостижимо. Однако существует альтернативный подход.
История чиплетов: от Pentium II до современных CPU
В 1995 году компания Intel представила Pentium II, преемника линейки процессоров Pentium, основанных на архитектуре P5, но уже с использованием новой архитектуры P6. От других процессоров того времени его отличала конструкция, скрытая под пластиковым корпусом: печатная плата, на которой располагались две микросхемы. Основной чип содержал всю логику обработки и аналоговые системы, а один или два отдельных модуля SRAM служили кэшем второго уровня.
В то время как Intel производила основной чип, кэш-память поставлялась внешними поставщиками. Такой подход стал довольно стандартным для настольных ПК в середине и конце 1990-х годов, пока прогресс в производстве полупроводников не позволил полностью интегрировать логику, память и аналоговые системы в одну матрицу.
Pentium II от Intel — процессор в центре, чипы кэша справа. Источник: Wikimedia
Хотя Intel продолжала экспериментировать с несколькими чипами в одном корпусе, она в основном придерживалась так называемого монолитного подхода к процессорам — то есть один чип для всего. Для большинства процессоров не было необходимости в более чем одном кристалле, поскольку технологии производства были достаточно развиты (и доступны по цене), чтобы сделать их простыми.
Однако другие компании, в первую очередь IBM, были более заинтересованы в использовании многочипового подхода. В 2004 году можно было приобрести 8-чиповую версию серверного процессора POWER4, состоящую из четырех процессоров и четырех модулей кэша, установленных в одном корпусе (так называемый многочиповый модуль или подход MCM).
Примерно в это же время начал появляться термин «гетерогенная интеграция», отчасти благодаря исследованиям, проведенным DARPA. Целью гетерогенной интеграции является разделение различных секций вычислительной системы, изготовление их по отдельности на узлах, наиболее подходящих для каждой из них, а затем объединение их в один корпус.
Сегодня этот метод более известен как «система в корпусе» (SiP) и является стандартным для оснащения смарт-часов чипами с момента их создания. Например, в часах Apple Watch Series 1 процессор, память DRAM и NAND Flash, несколько контроллеров и другие компоненты находятся в единой структуре.
Рентгеновский снимок S1 SiP от Apple. Источник: iFixit
Аналогичная схема может быть реализована с помощью различных систем на одном кристалле (так называемая SoC или система-на-чипе). Однако такой подход не позволяет использовать преимущества различных узлов, и каждый компонент не может быть изготовлен таким образом.
Для технологического вендора использовать гетерогенную интеграцию для нишевого продукта — это одно, а применять ее для большей части своего ассортимента — совсем другое. Именно так поступила компания AMD со своей линейкой процессоров. В 2017 году полупроводниковый гигант представил свою архитектуру Zen, выпустив процессор Ryzen для настольных ПК. Всего несколько месяцев спустя AMD представила две многочиповые линейки: Threadripper и EPYC, причем в последней представлены конфигурации, включающие до четырех чипов.
С выпуском Zen 2 два года спустя AMD полностью перешла на HI, MCM, SiP — называйте это как хотите. Они вынесли большинство элементов аналоговой системы из процессора и поместили их в отдельную матрицу. Они производились на более простом и дешевом технологическом узле, а для остальной части логики и кэша использовался более продвинутый.
Так чиплеты стали популярным словом.
Меньше — значит лучше
Чтобы понять, почему AMD выбрала именно это направление, давайте рассмотрим изображение ниже. На нем изображены два старших процессора серии Ryzen 5 — 2600 слева, использующий так называемую архитектуру Zen+, и 3600 справа, работающий на базе Zen 2.Теплораспределители на обеих моделях были сняты, а фотографии сделаны с помощью инфракрасной камеры. На одном кристалле 2600 расположено восемь ядер, хотя в данной модели два из них отключены.
Это же относится и к 3600, но здесь мы видим, что в корпусе две плашки — верхняя Core Complex Die (CCD), на которой расположены ядра и кэш, и нижняя Input/Output Die (IOD), содержащая все контроллеры (для памяти, PCI Express, USB и т. д.) и физические интерфейсы.
Поскольку оба процессора Ryzen устанавливаются в одно и то же гнездо материнской платы, эти два изображения практически совпадают по масштабу. На первый взгляд может показаться, что площадь двух чипов в 3600 больше, чем площадь одного чипа в 2600, но внешность может быть обманчивой.
Если мы напрямую сравним чипы, содержащие ядра, то станет ясно, сколько места в предыдущей модели занимает аналоговая схема — это все сине-зеленые цвета, окружающие золотистые ядра и кэш. Однако в Zen 2 CCD под аналоговые системы отведено очень мало площади, она почти полностью состоит из логики и SRAM.
Чип Zen+ имеет площадь 213 мм² и был изготовлен компанией GlobalFoundries по 12-нм технологическому процессу. Для Zen 2 AMD сохранила услуги GlobalFoundries для изготовления 125 мм² IOD, но для изготовления 73 мм² CCD использовала более совершенный техпроцесс N7 компании TSMC.
Zen+ (вверху) vs Zen 2 CCD (внизу)
Суммарная площадь чипов в новой модели меньше, и она также может похвастаться вдвое большим объемом кэша L3, поддерживая более быструю память и PCI Express. Однако самое лучшее в чиплетном подходе — это то, что компактный размер ПЗС позволил AMD поместить в корпус еще один. Эта разработка привела к появлению серии Ryzen 9, предлагающей 12- и 16-ядерные модели для настольных ПК.
Еще лучше то, что благодаря использованию двух меньших чипов вместо одного большого, на каждой пластине потенциально может выпускаться больше матриц. В случае с Zen 2 CCD на одной 12-дюймовой (300 мм) пластине может быть произведено на 85 % больше матриц, чем в модели Zen+.
Чем меньше кусочек пластины, тем меньше вероятность обнаружить производственные дефекты (поскольку они, как правило, распределены по поверхности диска случайным образом), поэтому, принимая во внимание все это, подход с использованием чиплетов не только дал AMD возможность расширить свой ассортимент, но и сделал это гораздо более экономически выгодно — одни и те же ПЗС могут использоваться в нескольких моделях, и каждая пластина производит их сотни!
Но если такой вариант разработки настолько хорош, почему его не применяет Intel? Почему мы не видим, как он используется в других процессорах, например в GPU?
Вслед за ведущей компанией
Отвечая на первый вопрос, отметим, что Intel также постепенно внедряет технологию чиплетов. Первая потребительская архитектура CPU, в которой используются чиплеты, называется Meteor Lake. Однако подход Intel несколько уникален, поэтому давайте рассмотрим, чем он отличается от подхода AMD.
Используя термин «тайлы» вместо «чиплеты», это поколение процессоров разделяет ранее монолитную конструкцию на четыре отдельных чипа:
Вычислительный Тайл: содержит все ядра и кэш-память L2.
Тайл GFX: содержит интегрированный графический процессор
Тайл SoC: включает в себя кэш L3, PCI Express и другие контроллеры.
Тайл IO: содержит физические интерфейсы для памяти и других устройств.
Между SoC и тремя другими тайлами имеются высокоскоростные соединения с низкой задержкой, и все они подключены к другому тайлу, известному как интерпозер. Этот интерпозер обеспечивает питание каждого чипа и содержит трассы между ними. Затем интерпозер и четыре плитки устанавливаются на дополнительную плату, что позволяет упаковать всю сборку.
В отличие от Intel, AMD не использует специальные монтажные матрицы, но имеет собственную уникальную систему соединений, известную как Infinity Fabric, для обработки операций с данными чиплета. Подача питания осуществляется через довольно стандартный пакет, и AMD также использует меньшее количество чиплетов. Так почему же дизайн Intel является таковым?
Одна из проблем с подходом AMD заключается в том, что он не очень подходит для ультрамобильного сектора с низким энергопотреблением. Именно поэтому AMD по-прежнему использует монолитные процессоры для этого сегмента. Дизайн Intel позволяет смешивать и сочетать различные тайлы для удовлетворения конкретных потребностей. Например, в бюджетных моделях ноутбуков могут повсеместно использоваться тайлы гораздо меньшего размера, в то время как у AMD для каждой цели есть чиплеты только одного размера.
Недостатком системы Intel является то, что она сложна и дорога в производстве (что приводило к различным проблемам). Однако обе компании, производящие процессоры, полностью привержены концепции чиплета. Когда все звенья производственной цепочки будут спроектированы вокруг нее, стоимость должна снизиться.
Если говорить о графических процессорах, то они содержат относительно мало аналоговых схем по сравнению с остальными частями корпуса. Однако объем SRAM внутри них неуклонно растет. Эта тенденция побудила AMD использовать свой опыт работы с чиплетами в серии Radeon 7000, а графические процессоры Radeon RX 7900 получили многоядерный характер. Эти GPU включают в себя одну большую матрицу для ядер и кэша L2, а также пять или шесть меньших матриц, каждая из которых содержит часть кэша L3 и контроллер памяти.
Вынеся эти компоненты за пределы основной матрицы, инженеры смогли значительно увеличить количество логики, не прибегая к новейшим, самым дорогим технологическим процессам, чтобы сохранить размеры чипа на приемлемом уровне. Хотя эта инновация, вероятно, помогла снизить общую стоимость, ее применение не привело к значительному расширению графического портфолио AMD.
В настоящее время потребительские графические процессоры Nvidia и Intel не демонстрируют никаких признаков того, что они перейдут на чиплеты AMD. Обе компании полагаются на TSMC в производстве и, похоже, довольствуются выпуском очень больших чипов, перекладывая затраты на плечи своих клиентов.
Тем не менее, известно, что обе компании активно изучают и внедряют архитектуры на основе чиплетов в некоторые свои GPU. Например, в графических процессорах Nvidia для центров обработки данных Blackwell используется чиплетный дизайн, в котором две большие матрицы соединены высокоскоростным каналом связи, способным передавать 10 терабайт в секунду, и фактически работают как один GPU.
Чиплеты
Неважно, когда произойдут эти изменения, главная правда заключается в том, что они должны произойти. Несмотря на огромный технологический прогресс в производстве полупроводников, существует определенный предел, до которого можно уменьшить каждый компонент.
Для дальнейшего повышения производительности чипов у инженеров, по сути, есть два пути — добавлять больше логики и необходимой памяти для ее поддержки, а также увеличивать внутреннюю тактовую частоту. Что касается последнего, то среднестатистический процессор уже много лет не подвергался существенным изменениям в этом аспекте. Процессор AMD FX-9590, выпущенный в 2013 году, мог достигать 5 ГГц при определенных нагрузках, а максимальная тактовая частота современных моделей составляет 5,7 ГГц (у Ryzen 9 9950X).
Самый высокочастотный потребительский процессор Intel — Core i9-14900KS, максимальная турбочастота которого составляет 6,2 ГГц для двух ядер. Этот процессор « special edition» является рекордсменом по самой высокой тактовой частоте среди настольных CPU.
Однако что изменилось, так это количество микросхем и SRAM. Упомянутый выше AMD FX-9590 имел 8 ядер (и 8 потоков) и 8 МБ кэша L3, в то время как 9950X может похвастаться 16 ядрами, 32 потоками и 64 МБ кэша L3. Процессоры Intel также увеличили количество ядер и SRAM.
Первый GPU Nvidia с унифицированными шейдерами, G80 2006 года, состоял из 681 миллиона транзисторов, 128 ядер и 96 кБ кэша L2 на чипе площадью 484 мм2. В 2022 году был выпущен AD102, который теперь состоит из 76,3 млрд транзисторов, 18 432 ядер и 98 304 кБ кэша L2 на площади 608 мм2.
В 1965 году соучредитель компании Fairchild Semiconductor Гордон Мур заметил, что в первые годы производства микросхем плотность компонентов внутри матрицы удваивалась каждый год при фиксированной минимальной стоимости производства. Это наблюдение стало известно как закон Мура и позже было интерпретировано как «количество транзисторов в чипе удваивается каждые два года», исходя из тенденций производства.
Закон Мура достаточно точно отражает прогресс полупроводниковой промышленности на протяжении почти шести десятилетий. Огромный прирост логики и памяти в процессорах и графических процессорах в значительной степени был обусловлен постоянным совершенствованием технологических узлов, в результате чего компоненты со временем становились все меньше. Однако эта тенденция не может продолжаться вечно, независимо от того, какие новые технологии появляются.
Вместо того чтобы ждать, пока эти физические пределы будут достигнуты, такие компании, как AMD и Intel, взяли на вооружение технологию чиплетов, исследуя инновационные способы объединения этих модульных компонентов для создания все более мощных процессоров.
Через несколько десятилетий в среднестатистическом ПК будут стоять процессоры и графические процессоры размером с вашу руку. Но стоит снять теплораспределитель, и вы обнаружите множество крошечных чипов — не три или четыре, а десятки, изобретательно сложенных друг на друга. Господство микросхем только начинается.
Немного рекламы
Спасибо, что остаётесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99, уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps от $19 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).
Dell R730xd в 2 раза дешевле в дата-центре Maincubes Tier IV в Амстердаме? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 — 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB — от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?
Комментарии (2)
NickDoom
30.01.2025 11:30Это называется «микросборка» и существует столько, сколько существует микросхема.
Недостаток — ёбкость как у печатной платы (простите мне мой французский), ремонтопригодность — как у микросхемы.
Но да, круто. Можно сделать микросборку с распиновкой старого двухъядерного пня, а внутри — 16 холодных ядер и 16 гигов рамы. По цене всяко меньше, чем менять всё от материнки до блока питания, про экологию вообще помолчу (я ещё прошлый май не простил и не прощу, наверное, никогда — а за окном уже на новый такой же май углеродные выбросы набираются). Тык — и снова имеем вполне годную офисную машинку.
LAutour
Не хватает упоминаний про дорайзеновых процессорах Intel presler (раздельные кристаллы ядер процессора ) и Intel arrandale (кристалл видеокарты на одной подложке с кристаллом процессора), чем они отличаются или не отличаются от "чиплетных" процессоров (внешне - они похожи).