Одним из самых известных принципов в мире технологий, конечно, является закон Мура. На протяжении более 55 лет «закон» описывал и предсказывал уменьшение транзисторов, указывая так называемые «технологические нормы». Словно некие «часы судного дня», с каждым годом уменьшались размеры основных элементов интегральной схемы, поэтому инженерам удавалось регулярно удваивать количество транзисторов на чипе.

Примечательно, что когда Гордон Мур высказал идею своего закона, технологии интегральных схем позволяли размещать всего около полусотни транзисторов на один кристалл.

После десятков лет «усилий и вливаний» можно оценить, какой путь проделан. Если вы читаете это со своего смартфона, то зайдите в какую‑нибудь программу для вывода технической информации (например, AIDA64) и посмотрите про свой процессор — там будет написано «техпроцесс 6 нм» или «10 нм». Это соответствует примерно 100 миллионам транзисторам на 1 квадратный миллиметр!

Но что же такое 1 нанометр? Это примерно 5 атомов кремния. И, глядя на все эти наименования, можно подумать, что скоро закон Мура исчезнет, что не будет дальнейшего скачка вычислительной мощности за счет достижений в производстве полупроводников и что инженерия твердотельных устройств — это бесперспективный карьерный путь.

Но это не так! Большинство критических характеристик «7-нм транзистора» на самом деле значительно больше, чем 7 нм, и этот разрыв между номенклатурой и физической реальностью существует уже около двух десятилетий.

Вот к примеру транзистор от Intel под техпроцесс 10 нм:

iedm-2017-intel-10-xtor.png
«Типичный» finfet

Ну и что, спросите вы? А вот что: продолжая фокусироваться на старых обозначениях, мы теряем из вида факт, что существуют реально достижимые способы, которыми полупроводниковая технология продолжит двигать вычисления вперед даже после того, как станет затруднительно совершенствовать геометрию транзисторов.

И ещё: этот взгляд на прогресс полупроводников не позволяет указать тот путь, который будет стимулировать новые разработки. Наконец, просто раздражает, что так сильно привязываются к номеру, который по существу мало о чем говорит.

И так, с 1971 года, когда выпустили микропроцессор Intel 4004, линейные размеры МОП‑транзистора сократились примерно в 1000 раз, а количество транзисторов на одном кристалле увеличилось примерно в 15 миллионов раз. Параметры, используемыми для измерения этого феноменального прогресса в плотности интеграции, были в первую очередь измерения, называемые полушаг металлизации (half‑pitch) и длиной затвора (gate). Удачно, что долгое время они были примерно одинаковыми.

Полушаг металлизации — это половина расстояния от начала одного металлического соединения до начала следующего на чипе.

В планарной, или двумерной конструкции транзистора, которая была доминирующей до 2010-х, длина затвора измеряла пространство между электродами истока и стока полевого транзистора. В этом пространстве находились затворы, которые управляли потоком электронов между истоком и стоком. Исторически это был самый важный параметр для определения производительности транзистора, поскольку чем меньше длина затвора, тем быстрее переключение устройства.

half-pitch%20planar.png
Half‑pitch планарный

В эпоху, когда длина затвора и полушаг металлизации были примерно одинаковыми, они определяли характеристики технологии производства чипов, став по сути номером техпроцесса. Их обычно уменьшали на 30 процентов с каждым поколением. Такое уменьшение позволяет удвоить плотность транзисторов, поскольку уменьшение длины и ширины прямоугольника на 30 процентов это ≈ уменьшение площади вдвое.

Всё это служило цели на протяжении 1970-х и 1980-х годов, но прекратилось в середине 1990-х годов. Стремясь продолжить исторический рост скорости и эффективности устройства, производители микросхем стали сокращать длину затвора, причем куда больше чем другие характеристики. Например, транзисторы, изготовленные с использованием так называемого 130-нм техпроцесса, на самом деле имели 70-нм затворы. Как результат — продолжение пути удвоения плотности по закону Мура, но с непропорционально уменьшающейся длиной затвора. Тем не менее, промышленность, по большей части, придерживалась ритма старого соглашения об именовании техпроцессов.

Исследования начала 2000-х годов расширили направления разработок, поскольку процессоры столкнулись с ограничениями по рассеиваемой мощности. Инженеры нашли способы продолжать совершенствовать устройства. Например, подвергая часть кремния транзистора деформационному напряжению, носители заряда могут быстрее проходить через них при более низких электрических напряжениях, что повышает скорость и энергоэффективность КМОП‑устройств без существенного уменьшения длины затвора.

Далее, проблемы с утечкой тока потребовали структурных изменений. В 2011 году Intel перешла на FinFET техпроцесса 22-нм, и устройства имели длину затвора 26 нм, полушаг 40 нм и ширину «плавников» 8 нм.

«К тому времени номер процесса уже не имел никакого значения, поскольку нельзя было определить характеристику, относящуюся к тому, что делается на самом деле», — говорит Паоло Гарджини, пожизненный научный сотрудник IEEE и ветеран Intel, возглавляющий одну из новых метрических инициатив.

Таким образом, мы видим, что полупроводниковой промышленности нужно что‑то получше.

Одним из решений является простое согласование номенклатуры с размерами, важными для транзистора. Это не означает возврат к длине затвора, которая больше не является самой важной характеристикой. Вместо этого предлагается использовать два значения, которые обозначают реальный предел площади, необходимой для изготовления логического транзистора. Первая называется шаг затвора с контактом (contacted gate pitch). Это минимальное расстояние от затвора одного транзистора до затвора другого. Вторая важная метрика, шаг металла (pitch), измеряет минимальное расстояние между двумя горизонтальными межсоединениями. Как говорят в ARM, этих двух значений достаточно для хорошей оценки минимально возможной площади транзистора. Каждый другой шаг проектирования — формирование логических или SRAM‑ячеек, блоков схем — добавляется к этому минимуму. «Хороший логический процесс с продуманными физическими характеристиками проектирования позволит добиться наименьшей деградации» — говорит инженер Брайан Клайн.

Гарджини, являющийся также председателем Международной дорожной карты по устройствам и системам IEEE (IRDS), предложил отрасли «вернуться к реальности», приняв трехзначную метрику, которая объединяет шаг контактного затвора (G), шаг металла (M) и, что особенно важно для будущих чипов, количество слоев или ярусов устройств на чипе (T). (IRDS является преемником Международной дорожной карты по технологиям для полупроводников, или ITRS, ныне несуществующей, многолетней общеотраслевой работы, которая прогнозировала аспекты будущих техпроцессов).

gmt%20method.png
GMT диаграмма

Как и в случае с номенклатурой техпроцессов, значения шага затвора и шага металла метрики GMT продолжат уменьшаться в течение десятилетия. Однако они будут делать это все медленнее и достигнут конечной точки примерно через 10 лет при текущих темпах прогресса. К тому времени шаг металла приблизится к пределам того, что может разрешить литография в экстремальном ультрафиолете. И хотя предыдущему поколению литографических машин удалось эффективно продвинуться далеко за пределы длин волн 193 нм, никто не ожидает, что то же самое произойдет с экстремальным ультрафиолетом. Но это разговор следующих статей.

«Примерно к 2029 году мы достигнем предела того, что мы можем сделать с помощью литографии», — говорит Гарджини. «После этого путь вперед — это „штабелирование“. Это единственный способ увеличить плотность, который у нас есть». Вот тогда термин «число ярусов» (T) начнет приобретать значение. Современная усовершенствованная кремниевая КМОП‑технология представляет собой один слой транзисторов, соединенных в схемы более чем дюжиной слоев металлических соединений. Но если бы вы могли построить два слоя транзисторов, вы могли бы почти удвоить плотность устройств одним махом.

Для кремниевых КМОП это пока еще лабораторные наработки, но это не должно затянуться надолго. Более десяти лет промышленные исследователи изучают способы производства «монолитных 3D ИС» — чипов, в которых слои транзисторов накладываются друг на друга. Это было нелегко, поскольку температуры обработки кремния обычно настолько высоки, что нанесение одного слоя может повредить другой. Тем не менее, несколько промышленных исследовательских проектов (в частности, в бельгийской нанотехнологической исследовательской фирме Imec, французской CEA‑Leti и Intel) разрабатывают технологию, которая позволит наносить два типа транзисторов в логике КМОП — NMOS и PMOS — один на другой.

Будущая некремниевая технология может стать 3D еще раньше. Например, профессор Массачусетского технологического института Макс Шулакер и его коллеги участвовали в разработке 3D‑чипов, которые опираются на слои транзисторов из углеродных нанотрубок. Поскольку вы можете обрабатывать их при относительно низких температурах, вы можете построить несколько слоев гораздо проще.

Шулакер%20Макс%20мит.jpeg
А вот и сам Макс Шулакер

Другие группы работают над логическими или запоминающими устройствами, которые можно построить в слоях металлических соединений над кремнием. К ним относятся микромеханические реле и транзисторы, изготовленные из атомарной толщины полупроводников, таких как дисульфид вольфрама.

В 2019 году видная группа ученых собралась в кампусе Калифорнийского университета в Беркли, чтобы придумать свою собственную метрику. В неформальную группу вошли некоторые из самых известных имен в области исследований полупроводников. На встрече в июне присутствовали все три инженера из Беркли, которым приписывают создание FinFET: Чэньмин Ху, Цу‑Дже Кинг Лю и Джеффри Бокор. Бокор является заведующим кафедрой электротехники в университете. Ху — бывший главный технический директор в TSMC, крупнейшей фабрике полупроводников. Лю — декан инженерного колледжа и входит в совет директоров Intel. Также из Беркли присутствовал Саиф Салахуддин, пионер в разработке сегнетоэлектрических устройств.

 Ху один из тех кто занимался разработкой FinFET
Ху один из тех кто занимался разработкой FinFET

Из Стэнфордского университета были Х. С. Филип Вонг, профессор и вице‑президент по корпоративным исследованиям в TSMC, Субхасиш Митра, который изобрел ключевую технологию самотестирования и совместно с Вонгом разработал первый компьютер на основе углеродных нанотрубок, а также Джеймс Д. Пламмер, бывший член совета директоров Intel и старейший декан инженерного факультета Стэнфорда. Позже присоединились исследователь TSMC Керем Акарвардар и Димитри Антонидис из MIT.

«У всех них было ощущение, что их область становится менее привлекательной для лучших студентов, особенно студентов из США», — говорит Лю — «Логика, стоящая за этим убеждением, казалась простой: если вы видете область, в которой прогресс маловероятен уже через 10 лет, зачем вам тратить четыре‑шесть лет на обучение? Это кажущееся отсутствие привлекательности пришло тогда, когда нам на самом деле нужно все больше и больше инновационных решений для дальнейшего продвижения вычислительных технологий».

Эта группа экспертов искала метрику, которая бы стирала «ощущение часов Судного дня» в проектировании. Они решили — что самое важное — эта метрика не должна иметь естественной конечной точки. Другими словами, числа должны расти с прогрессом, а не падать. Она также должна была быть простой, точной и соответствовать главной цели улучшения полупроводниковой технологии — более производительным вычислительным системам.

Для этого они хотели чего‑то, что не просто описывало бы технологию, используемую для создания чипа, как это делает метрика GMT. Они хотели метрику, которая учитывала бы не только чип, но и другие ключевые аспекты, влияющие на производительность всей компьютерной системы. Это может показаться излишне амбициозным, и, возможно, так оно и есть, но это соответствует направлению, в котором начинают развиваться вычисления.

Посмотрите на кристалл современного FPGA чипа, и вы найдете гораздо больше, чем просто «программируемые вентили». Внутри упаковки массив ячеек окружен рядом «чиплетов», включая, в частности, два чипа DRAM с высокой пропускной способностью. Небольшая полоска кремния, протравленная плотным массивом межсоединений, связывает процессор с памятью.

«Железо» вычислительной машины состоит из логики, памяти и связи между ними. Поэтому, чтобы придумать свою новую метрику, Вонг и его коллеги выбрали в качестве параметров плотность каждого из этих компонентов, назвав их DL, DM и DC. Объединив индексы, они окрестили свою идею метрикой LMC.

Улучшения каждой из метрик DL, DM и DC являются главными вкладами в общую скорость и энергоэффективность вычислительных систем. Они построили графики исторических данных, показывающие корреляцию между ростом логики, памяти и подключений, что предполагает сбалансированное увеличение DL, DM и DC, которое продолжается уже десятилетиями. Этот баланс подразумевается в компьютерных архитектурах, и, что поразительно, он справедлив для вычислительных систем различной степени сложности, от мобильных и настольных процессоров вплоть до самых быстрых в мире суперкомпьютеров. Этот сбалансированный рост предполагает, что аналогичные улучшения потребуются и в будущем, говорит Вонг.

an-alternative-to-the-node-metric-called-lmc-captures-a-technology-u2019s-value-by-stating-the-density-of-logic-dl-the-dens.png
Метрика LMC

LMC фиксирует ценность технологии, указывая плотность логики (DL), плотность основной памяти (DM) и плотность межсоединений, связывающих их (DC).

В метрике LMC DL — это плотность логических транзисторов, выраженная в числе устройств на квадратный миллиметр. DM — это плотность основной памяти системы в ячейках памяти на квадратный миллиметр. А DC — это соединения между логикой и основной памятью в межсоединениях на квадратный миллиметр. Если есть несколько уровней устройств или 3D‑стек чипов, учитывается весь объем выше этого квадратного миллиметра.

DL, пожалуй, наиболее исторически знаком из всех них, поскольку люди подсчитывают количество транзисторов на чипе с момента появления первых интегральных схем. Хотя это звучит просто, это не так. Различные типы схем на процессоре различаются по плотности, в основном из‑за межсоединений, которые связывают устройства. Самая плотная часть логической микросхемы, как правило, — это память SRAM, которая составляет кэши процессора, где данные хранятся для быстрого, многократного доступа. Эти кэши представляют собой большие массивы ячеек по шесть транзисторов, которые могут быть упакованы близко друг к другу, отчасти из‑за их одинаковости. По этому показателю наивысшее значение, зарегистрированное для DL на данный момент, — это 135-мегабитный массив SRAM, изготовленный с использованием 5-нм процесса TSMC, который упаковывает эквивалент 286 миллионов транзисторов на квадратный миллиметр.

Но блоки логики более сложны, менее однородны и менее плотны, чем встроенная в них SRAM. Поэтому судить о технологии только по SRAM может быть несправедливо. В 2017 году тогдашний старший научный сотрудник Intel Марк Бор выступил за формулу, которая использует взвешенные плотности некоторых распространенных логических ячеек. Формула учитывает количество транзисторов на единицу площади для простого и повсеместного двухвходового, четырехтранзисторного вентиля NAND и для распространенной, но более сложной схемы, называемой сканирующим триггером. Бор сказал в то время, что SRAM настолько отличается по своей плотности, что ее следует измерять отдельно.

Измерение DM немного проще. Сейчас основная память это DRAM, потому что она недорогая, имеет высокую выносливость и относительно быстро считывается и записывается. Ячейка DRAM состоит из одного транзистора, который управляет доступом к конденсатору, который хранит бит в виде заряда. Поскольку заряд со временем утекает, ячейки должны периодически обновляться. В наши дни конденсатор встроен в межсоединенные слои над кремнием, поэтому на плотность влияет не только размер транзистора, но и геометрия межсоединений. Самое высокое значение DM, которое группа LMC смогла найти в опубликованной литературе, было получено от Samsung. В 2018 году компания подробно описала технологию DRAM с плотностью 200 миллионов ячеек на квадратный миллиметр (200M).

DRAM не всегда будет удерживать свои позиции в качестве основной памяти. Альтернативные технологии, такие как магниторезистивная RAM, сегнетоэлектрическая RAM, резистивная RAM и RAM с изменением фазы, уже сегодня находятся в коммерческом производстве.

Обеспечение стабильного соединения между основной памятью и логикой уже является основным узким местом в современных вычислительных системах. Межсоединения между процессором и памятью, которые измеряет DC, исторически создавались на уровне корпусирования, а не производства микросхем. По сравнению с плотностью логики и плотностью памяти, DC улучшался гораздо менее стабильно на протяжении десятилетий. Вместо этого наблюдались дискретные скачки по мере внедрения и усовершенствования новых технологий упаковки. Сейчас однокристальные системы (SoC) начали уступать место наборам чиплетов, тесно связанных вместе на кремниевых интерпозерах (так называемые 2,5-D системы) или уложенных в 3D‑структуры. Система, использующая технологию 3D‑укладки микросхем System on Integrated Chips компании TSMC, имела самый высокий опубликованный DC в 12 000 межсоединений на квадратный миллиметр (12K).

Однако DC не обязательно должен подключать логику к отдельной микросхеме памяти. Для некоторых систем основная память полностью встроена. Например, мегачип машинного обучения Cerebras Systems полностью полагается на SRAM, встроенную в непосредственной близости с его логическими ядрами на одной массивной пластине кремния.

Таким образом, самые лучшие параметры DL, DM, DC — 260M, 200M, 12K.

Давно прошли времена, когда одно число могло описать, насколько продвинут полупроводниковый техпроцесс, утверждает технический директор Intel Майкл Мейберри. Однако ему в принципе нравится идея иметь комплексную метрику на уровне системы. «Выбор чего‑то согласованного, даже если оно несовершенно, более полезен, чем текущее брендирование техпроцессов», — говорит он.

Он хотел бы, чтобы LMC был расширен дополнительным уровнем детализации, чтобы указать, что и как измеряется. Например, относительно значения DM Мейберри говорит, что, возможно, оно должно быть конкретно связано с памятью, которая находится в том же корпусе чипа, что и процессор, который он обслуживает. И то, что классифицируется как «основная память», также может потребовать тонкой настройки, добавляет он. В будущем между процессором и устройствами хранения данных может быть несколько слоев памяти. Например, Intel и Micron производят память 3D XPoint, тип энергонезависимой системы, которая занимает нишу между DRAM и хранилищем.

Еще одна критика заключается в том, что и метрика на основе плотности, такая как LMC, и метрика на основе литографии, такая как GMT, находятся на шаг дальше от того, чего хотят клиенты заводов и производителей микросхем памяти. «Есть площадь [плотность], но есть также производительность, мощность и стоимость», — говорит Джиллеспи из AMD. Каждая конструкция чипа делает компромиссы вокруг этих четырех осей, до такой степени, что «нет единого числа, которое могло бы когда‑либо охватить, насколько хорош техпроцесс», — добавляет Мейберри.

«Самой важной метрикой для памяти и хранилища по‑прежнему остается стоимость за бит», — говорит Гуртедж Сингх Сандху, старший научный сотрудник и вице‑президент третьего в мире производителя DRAM, Micron Technologies. «Также внимательно рассматриваются несколько других факторов, включая различные метрики производительности, основанные на конкретных рыночных приложениях».

Есть также и те, кто утверждает, что новая метрика не нужна на данном этапе. Такие меры «действительно полезны только в приложениях, где доминирует масштабирование», — говорит Грегг Бартлетт, старший вице‑президент по инжинирингу и качеству в GlobalFoundries, которая прекратила свою работу над 7-нм техпроцессом в 2018 году. «В этой области работает всего несколько компаний, а также ограниченное количество клиентов и приложений, поэтому она менее актуальна для подавляющего большинства полупроводниковой промышленности». Только Intel, Samsung и TSMC остались в погоне за последними несколькими процессами, но они вряд ли являются игроками второго плана, генерирующими большую часть мирового дохода от производства полупроводников.

Бартлетт, чья компания не входит в эту группу, считает, что интеграция КМОП‑логики со специализированными технологиями, такими как встроенная энергонезависимая память и миллиметровая радиосвязь, имеет более важное значение для будущего отрасли, чем масштабирование.

Но нет сомнений, что постоянное масштабирование важно для многих потребителей полупроводников. И создатели метрики LMC и метрики GMT чувствуют срочность, хотя и по разным причинам. Для Вонга и сторонников LMC отрасль должна четко обозначить свое долгосрочное будущее в эпоху, когда масштабирование транзисторов не так важно, чтобы они могли набрать технических специалистов, которые воплотят это будущее в жизнь.

Для Гарджини и сторонников GMT речь идет о том, чтобы отрасль не сбивалась с пути. По его мнению, без синхронизации метрики отрасль становится менее эффективной. «Это увеличивает вероятность отказа», — говорит он. «У нас есть 10 лет», пока кремниевые КМОП‑технологии полностью не перестанут масштабироваться. «Этого едва достаточно», чтобы произвести необходимые прорывы, которые будут поддерживать вычисления.

Комментарии (10)


  1. Ilya_JOATMON
    13.08.2024 18:13

    Словом к 30 му году упремся в физические пределы миниатюризации транзистора.

    Объемная компоновка же вызывает вопросы по отводу тепла от нее. А так же вопросы трассировки соединений в чипе.


    1. amartology
      13.08.2024 18:13
      +2

      Да в них давно уже по факту упёрлись, и начали улучшать степень интеграции другими способами. Собственно, предел возможностей теплоотвода тоже уже давно пройден, большая часть любого сложного чипа - это "темный кремний". Зато можно поставить пачку специализированных ускорителей под любой тип задач, или очень много памяти.

      Что касается трассировки, то прямо сейчас делается новый принципиальный шаг - перенос разводки питания под транзисторы.

      Так что кремниевая КМОП-технология с нами ещё на много десятилетий, можно не переживать.


      1. shares-caisson
        13.08.2024 18:13

        Имхо, следующим фронтиром будет постепенный перенос функций из софта в железо по примерно следующему процессу: программисты пишут себе спокойно рыхлый код на всяких питонах, потому что "время разработчика дороже", девелопер экспириенс и прочее; после чего это жрёт десятки процентов производительности на масштабах датацентров гиперскейлеров, те профилируют это дело и пишут максимально оптимизированные версии, но этого всё равно мало, после чего разработчики железа, которым нужно куда-то девать свободный кремний ходят вокруг этих библиотек и годами думают, что же из этого всего можно затянуть в железо и постепенно реализуют -- тут какую-нибудь функцию шифрования в одну инструкцию превратят, там зип аппаратный сделают, аудио/видео и т.д. -- это понятно и давно уже. Дальше глядишь и больше функций будут зашивать по мере того, как бюджет транзисторов будет всё безграничнее, часть из операционных систем заедет в железо и т.д. да и обычный ход исполнения будет всё умнее и содержать по сути прошитое предсказание исполнения типичных для конкретного продукта нагрузок.

        И кто знает сколько нас ещё ждёт уровней специализации и разделения производительности между ядрами: вот это сильно быстрое, вот это обычное, это отдельное ядро для виндовс дефендера, а тут микро-пылинка чисто движения мышки обработать, чтобы остальной чип из спячки не выводить.


        1. amartology
          13.08.2024 18:13

          Имхо, следующим фронтиром будет 

          это текущий фронтир - специализированные сопроцессоры и расширения систем команд под популярные задачи уже давно в ходу. Вон уже даже в микроконтроллеры начали ставить нейроядра.


          1. shares-caisson
            13.08.2024 18:13

            Да, текущий, я имел в виду что это ещё надолго может занять индустрию, прежде чем иссякнет поток того, что ещё можно запихать в железо с очередным обновлением и все ещё получить пользу и оптимизацию. И то что это сейчас становится и более доступной и более принимаемой идеей, если раньше какое-нибудь расширение системы команд это коммитмент на долгие десятилетия и гигантская инвестиция, то сейчас есть вся инфраструктура, чтобы это делать проще и повседневнее что ли. Условно добавил в ллвм и 95% софта может использовать новую фичу после пересборки, а делать таковую -- ежедневный процесс деплоя.


  1. amartology
    13.08.2024 18:13
    +1

    Статья интересная, хоть и излишне многословная, а вот перевод местами прямо спотыкается об технические термины. "Металлический полушаг" прямо обязан резать слух студенту профильной специальности.


    1. stepancherro Автор
      13.08.2024 18:13

      Согласен, недосмотрел. Думаю "полушаг металлизации" более точное, и в литературе встречается.


      1. amartology
        13.08.2024 18:13

        За ChatGPT надо очень внимательно вычитывать технические переводы, она регулярно изобретает смешные термины на ровном месте.


        1. stepancherro Автор
          13.08.2024 18:13

          Да не, им вообще лучше не пользоваться. Вот context.reverso.net более-менее подходит.


          1. amartology
            13.08.2024 18:13

            ChatGPT для переводов и последующей коррекции стиля можно и нужно пользоваться, это прекрасный инструмент. Просто, как и любой инструмент, она не заменяет собой живого корректора.