Примерно в каждой второй теме на Хабре, касающейся космонавтики или электроники, всплывает тема радиационной стойкости. Через новости об отечественной космонавтике красной нитью проходит тематика импортозамещения радстойкой элементной базы, но в то же самое время Элон Маск использует дешевые обычные чипы и гордится этим. А изральтяне в «Берешите» использовали радстойкий процессор и тоже гордятся этим. Да и в принципе микроэлектронная отрасль в России живет по большей части за счет госзаказа с соответствующими требованиями. Наблюдение за регулярными спорами насчет того, как надо правильно строить спутники, показывает, что подготовка участников обычно невысока, а их аргументация отягощена стереотипами, случайно услышанными вырванными из контекста фактами и знаниями, устаревшими много лет назад. Я подумал, что читать это больше нет сил, поэтому, дорогие аналитики, устраивайтесь поудобнее на своих диванах, и я начну небольшой (на самом деле большой) рассказ о самых популярных заблуждениях на тему того, что такое радиационная стойкость интегральных микросхем.


Рисунок 1. Непременная красивая картинка про космическое излучение и хрупкую Землю.

Самые популярные тезисы относительно радиационной стойкости, используемые в околокосмических спорах, выглядят примерно так:

  1. Радстойкие микросхемы не нужны. Кубсаты прекрасно летают на обычных, на МКС стоят обычные ноутбуки Lenovo, в Dragon стоят обычные микросхемы, да даже NASA в Orion поставило обычные микросхемы!
  2. На спутники вполне можно ставить очень старые микросхемы, вплоть до «рассыпухи», никакая серьезная производительность там не нужна. Зато без радстойкости никуда, поэтому и летают на старье.
  3. Тезис, дополняющий предыдущий: радстойкие микросхемы в принципе нельзя сделать на низких проектных нормах, поэтому и применение проверенных временем компонентов не просто оправдано, но и необходимо.
  4. Для того, чтобы микросхема была радстойкой, необходимо и достаточно сделать ее по технологии «кремний на изоляторе» или «кремний на сапфире».
  5. Все «военные» микросхемы — радстойкие, а все радстойкие — «военные».

Как видите, некоторые из этих тезисов прямо противоречат друг другу — что регулярно и служит предметом спора или причиной для далеко идущих неверных выводов.

Начать разговор нужно с важного дисклеймера: радиационная стойкость не является центром мира и единственным качеством, которым должна обладать подходящая для использования в космосе или другой агрессивной среде микросхема. Радиационная стойкость — это лишь одно требование из длинного ряда, включающего в себя надежность, расширенный температурный диапазон, устойчивость к электростатическому разряду, вибростойкость — и достоверное подтверждение всех вышеперечисленных параметров, то есть длительную и дорогую сертификацию. Важно все, что может не позволить чипу проработать весь необходимый срок службы, причем большинство применений радстойких чипов предполагают невозможность ремонта или замены. С другой стороны, если по одному из параметров что-то не так, конструктор конечного изделия часто может найти способ обойти ограничение — поставить самую чувствительную к дозе радиации микросхему за толстую стенку, мониторить ток потребления уязвимого к тиристорному эффекту чипа и сбрасывать его питание при необходимости, или термостатировать чип с узким температурным диапазоном. А может не найти, и единственным способом решить поставленную задачу будет заказ новой радстойкой ASIC.

Также полезно помнить, что разработчики систем специального назначения — такие же люди, как и любые другие разработчики. Многие из них тоже любят писать ко вчерашнему дедлайну наполненный костылями код и использовать железо помощнее, чтобы он точно на нем заработал; некоторые и Ардуино бы использовали, если б оно было соответствующим образом сертифицировано. И, разумеется, люди, которые ставят задачи разработчикам систем специального назначения и разработчикам микросхем для них, редко стесняются в требованиях, и к надёжности, и к производительности, и к радстойкости. Поэтому современные проектные нормы на спутниках еще как нужны — хочется и большие объемы DRAM, и многоядерные процессоры, и самые современные ПЛИС. Я уже упомянул выше о том, что последствия плохой радиационной стойкости и других потенциальных проблем можно по крайней мере частично обойти, поэтому от применения всего этого великолепия разработчиков в большей степени удерживает ничего отсутствие данных о том, что именно надо обходить, чем коммерческий статус чипов.

Радиационные эффекты


Понятия «радиационная стойкость» и «радиационностойкая микросхема» — это грандиозные упрощения. На самом деле существует много разных источников ионизирующего излучения, и они могут влиять на функционирование электронных приборов по-разному. Соответственно, для разных применений необходима стойкость к разным наборам воздействующих факторов и разным уровням воздействия, так что «стойкая» микросхема, предназначенная для работы на низкой околоземной орбите совершенно не обязана нормально работать при разборе завалов в Чернобыле.

Ионизирующее излучение называется ионизирующим, потому что выделение в объеме вещества энергии при торможении прилетающих частиц ионизирует вещество. У каждого материала своя энергия, необходимая для ионизации и создания электронно-дырочной пары. Для кремния это 3.6 эВ, для его оксида — 17 эВ, для арсенида галлия — 4.8 эВ. Также прилетевшая частица может не ионизировать атом, а “сдвинуть” его с правильного места в кристаллической решетке (в кремнии для этого нужно передать атому 21 эВ). Созданные в веществе электронно-дырочные пары могут по-разному влиять на электрические и физические свойства и на поведение электрической схемы. Радиационные эффекты можно разделить на четыре большие группы: эффекты полной поглощенной дозы, эффекты мощности дозы, эффекты, вызванные попаданием одиночных частиц, и эффекты смещения. Это разделение — до некоторой степени условность: например, облучение потоком тяжелых ионов, вызывающих одиночные эффекты, приводит и к набору полной поглощенной дозы.

Дозовые эффекты

Полная поглощенная доза излучения измеряется в радах, с указанием вещества, поглощающего излучение. 1 рад = 0.01 Дж/кг, то есть количество энергии, выделившееся в единице массы вещества. Реже используется единица измерения Грэй, равная 100 рад (или 1 Дж/кг). При этом важно понимать, что поглощенная доза в разных веществах будет различаться для одного и того же количества ионизирующих частиц, выпущенных источником радиации (это экспозиционная доза). В случае с кремниевыми микросхемами нужный материал — это оксид кремния, потому что воздействие на него, а не на кремний, в основном влияет на электрические характеристики схемы, так как подвижность дырок в SiO2 при нормальной температуре настолько мала, что они накапливаются в оксиде, создавая встроенный положительный заряд. Типичные уровни дозовой стойкости коммерческих микросхем лежат в диапазоне 5-100 крад(Si), востребованные покупателями уровни радиационной стойкости начинаются на 30 крад(Si) и заканчиваются где-то в районе 1 Град(Si), в зависимости от назначения микросхем. Смертельная доза для человека — около 6 Грэй.



Рисунок 2. Примеры расчетов набора полной поглощенной дозы за 10 лет на различных круговых орбитах за защитой в 1г/см^2. Источник — Н.В. Кузнецов, «Радиационная опасность на околоземных орбитах и межпланетных траекториях космических аппаратов».

Эффекты воздействия полной дозы связаны с накоплением этого положительного заряда в диэлектриках и проявляются в КМОП-схемах несколькими основными путями:

  1. Сдвиг порогового напряжения транзисторов, возникающий из-за накопления положительного заряда в подзатворном диэлектрике и изменения электрического поля в канале транзистора. У n-канальных транзисторов порог обычно уменьшается (но зависимость может быть немонотонной), а у p-канальных увеличивается, причем величина сдвига имеет корреляцию с толщиной подзатворного оксида, то есть с проектными нормами. Пороги транзисторов в схемах с грубыми проектными нормами могут измениться настолько, чтобы послужить причиной функционального отказа (n-канальные транзисторы перестают закрываться, p-канальные — открываться); в субмикронных технологиях этот эффект менее важен, но в аналоговых схемах способен доставить много головной боли.
  2. Возникновение неуправляемого тока утечки. Он может течь из истока транзистора в его же сток или в соседний транзистор. Причина утечек — накопление положительного заряда, но только не в подзатворном диэлектрике, а в толстом изолирующем. Фактически, параллельно основному транзистору формируется паразитный транзистор, напряжение на затворе которого управляется дозой радиации. Проявление этого эффекта определяется особенностями геометрии перехода от подзатворного диэлектрика к изолирующему, то есть в намного большей мере зависит от конкретной технологии, чем от проектных норм.
  3. Уменьшение подвижности носителей заряда из-за накопления дефектов, на которых рассеиваются носители заряда. Влияние этого фактора на субмикронные цифровые схемы на кремнии невелико, но он более важен для силовых транзисторов, в том числе на сложных полупроводниках (нитриде галлия и карбиде кремния).
  4. Увеличение 1/f шумов, вызванное паразитными краевыми транзисторами. Оно важно для аналоговых и радиочастотных схем. Значение этого эффекта растет с уменьшением проектных норм, когда влияние остальных дозовых эффектов уменьшается.

В биполярных схемах основной дозовый эффект — падение коэффициента усиления, вызванное ростом базового тока из-за утечки из эмиттера в базу по границе кремния и пассивирующего оксида. Другой специфический для биполярных транзисторов дозовый эффект состоит в том, что они могут (не обязательно) реагировать не только на уровень набранной дозы, но и на скорость ее набора — чем медленнее набирается доза, тем хуже стойкость. Этот эффект называется ELDRS (Enhanced Low Dose Rate Sensitivity) и он сильно усложняет и удорожает тестирование, причем часто не только биполярных, но и КМОП-схем — потому что в них тоже иногда бывают биполярные транзисторы и потому что проще заставить всех тестироваться единообразно, чем разбираться, где ELDRS может быть, а где нет.

Мощность дозы

Другая часть эффектов, связанных с мощностью дозы — это сверхбыстрый набор дозы, при котором в микросхеме генерируется настолько большое количество электронно-дырочных пар, что они не успевают рекомбинировать, и в чип вносится огромный электрический заряд, который рассасывается через линии земли и питания в течение значительного времени — на которое схема перестает работать. Это время называется «время потери работоспособности» и является основной характеристикой стойкости микросхемы или прибора к подобного рода эффектам. Кроме этого, большое количество внесенного в микросхему заряда серьезно изменяет потенциалы областей, соединенных с землей и с питанием — что может привести к возникновению тиристорного эффекта.

Именно эффекты высокой мощности дозы — то, ради стойкости к чему изначально развивалась технология «кремний на сапфире» и «кремний на изоляторе», потому что единственный способ уменьшить вносимый в схему заряд состоит в том, чтобы отделить активную область микросхемы от объема подложки, не дав заряду из подложки поучаствовать в процессе. Почему эти эффекты важны? Большая мощность дозы в течение небольшого времени — типичное следствие ядерного взрыва.

Одиночные эффекты

Одиночные эффекты связаны не с длительным воздействием излучения, а с измеримым эффектом от попадания единственной ионизирующей частицы. Их можно разделить на две большие группы:

  1. Неразрушающие. К ним относятся сбои в разного рода запоминающих элементах (кэш-памяти, регистровых файлах, конфигурационной памяти ПЛИС и т.д.), переходные процессы в комбинационной логике и в аналоговых схемах. Главная особенность этого вида эффектов — они не приводят к физическому разрушению микросхемы и могут быть исправлены программно или аппаратно. Более того, переходные процессы исправляются сами по себе через какое-то время (вопрос в том, насколько оно велико). Основной практический интерес представляют сбои в массивах памяти — просто потому, что они составляют львиную долю всех сбоев в силу большого количества памяти в современных микроэлектронных системах.
  2. Разрушающие. К ним относятся тиристорный эффект и разнообразные, но, к счастью, редкие эффекты типа пробивания затвора или лавинного выгорания транзистора. Их отличительная черта — то, что они необратимо разрушают элемент микросхемы. В случае с тиристорным эффектом чип обычно (но не всегда!) можно спасти, если быстро сбросить питание. Разрушающие эффекты представляют серьезную опасность для некоторых видов флэш-памяти и для приборов с высокими напряжениями и плотностями тока, самыми важными из которых являются силовые ключи.

Удельная энергоотдача ионизирующей частицы называется «линейная передача энергии» (ЛПЭ) и измеряется в МэВ, передаваемых за единицу длины пролета частицы в материале, на единицу плотности материала, то есть в (МэВ*см^3)/(мг*см) или в (МэВ*см^2)/мг. ЛПЭ нелинейно и немонотонно зависит от энергии частицы и взаимосвязана с длиной пробега, которая для актуальных в микроэлектронике частиц и материалов может составлять от сотен нанометров до сотен миллиметров.

Количество частиц, встречающихся в космосе, убывает с ростом ЛПЭ (см. рисунок 4). Важные значения — 30 (соответствует ионам железа) и 60 или 80 (после которых вероятность события считается пренебрежимо малой). Кроме этого, важной является цифра в 15 МэВ*см^2/(мг) — это максимальная ЛПЭ, которую могут иметь продукты ядерной реакции при попадании протона или нейтрона в кремний. Протоны — один из основных видов солнечного излучения, и хотя их собственная ЛПЭ невелика (десятые доли единицы), они оказывают существенное влияние из-за ядерных реакций и вторичной ионизации. Вторичная ионизация может возникать прямо в активной области, а может быть следствием попадания протона в атом какого-то материала с большим атомным номером — например, вольфрама или тантала. Тяжелые элементы активно используются в современной микроэлектронной технологии, например, для создания контактов от кремния к первому слою металлизации. Вторичная ионизация также является причиной, по которой не стоит для повышения радиационной стойкости паковать чипы в свинцовые коробки.



Рисунок 3. Зависимость ЛПЭ от энергии для разных типов частиц.

Отдельно стоит обратить внимание на ядра гелия (альфа-частицы) — не только потому, что их достаточно много в составе солнечной радиации, но и потому, что довольно много источников альфа-излучения можно встретить в обычной жизни.



Рисунок 4. Сравнение количества частиц разных типов за двухлетнюю миссию на орбите, по статье Xapsos et.al., «Model for Cumulative Solar Heavy Ion Energy and Linear Energy Transfer Spectra», IEEE TNS, Vol. 5, No. 6., 2007

1, 30 или 60 МэВ*см^2/(мг) — насколько это много? Порог сбоя стандартной ячейки памяти в технологии 7 нм находится намного ниже единицы, в 180 нм — в пределах от единицы до десятки. Применение специальной схемотехники позволяет поднять порог, например, до сотни, но обычно разумнее добиться цифры в 15 или 30 единиц, а остатки редких событий отфильтровать с помощью помехоустойчивого кодирования. 60 единиц — это цифра, обычно фигурирующая в требованиях по стойкости к разрушающим эффектам.

Эффекты смещения

Эффекты смещения — это локальное разрушение кристаллической решетки, то есть «выбивание» атома из предназначенного для него места. Энергия, необходимая для повреждения кристаллической решетки, обычно довольно велика, поэтому большинство пролетающих частиц не вызывают этот эффект. Зато его причиной может быть ядерная реакция в результате попадания протона или нейтрона, которых на орбите много. Такие локальные дефекты решетки приводят к уменьшению подвижности носителей заряда, росту шумов и некоторым другим эффектам. Они сказываются на обычных КМОП-микросхемах меньше, чем «обычные» дозовые эффекты, но доминируют в солнечных батареях, фотоприемниках, силовых транзисторах, а также в сложных полупроводниках, у которых нет оксида, например в арсениде галлия и нитриде галлия. Именно этим и объясняется их высокая дозовая стойкость — в них просто нет эффектов, вызывающих быструю деградацию кремниевых чипов, а то, что есть, проявляется слабее и позже. Количество излучения, вызывающего эффекты смещения измеряется в частицах (обычно протонах или нейтронах) на квадратный сантиметр площади чипа.

Итак, с описанием воздействующих факторов излучения разобрались, теперь давайте посмотрим, где и в каких сочетаниях они угрожают микросхемам.

Что? Где? Когда?


На рисунке 2 показан пример расчета набора полной дозы на разных орбитах. Дальше надо обсудить множество допущений — солнечную активность, форму, материал и толщину защиты и так далее, но в целом, несмотря на то, что рисунок представляет собой типичного сферического коня в вакууме, тренд ясен: на разных орбитах скорость набора полной дозы может различаться на пять порядков. При этом на низких орбитах, под первым поясом Ван Аллена, доза набирается так медленно, что многие обычные коммерческие микросхемы способны выдержать несколько лет в таких условиях. Да что микросхемы, даже гораздо более хрупкие люди летают там годами без серьезных последствий для здоровья. А между тем, низкие орбиты — это практически вся пилотируемая космонавтика, дистанционное зондирование земли, спутниковая связь, обещаемый уже совсем скоро спутниковый интернет и, как говорят американцы, the last but not least, практически все кубсаты запускаются на низкие орбиты.

Коммерческие микросхемы на низких орбитах

Собственно, именно из популярности и важности низких орбит и растут ноги у спекуляций на тему того, что дорогие радстойкие микросхемы не нужны, и вполне можно обходиться обычными. Но у использования в космосе коммерческих микросхем есть и подводные камни, проявляющиеся даже на низких орбитах.

Во-первых, пояса ван Аллена защищают Землю и ее ближние окрестности только от легких частиц, в основном от солнечных электронов и протонов. Более тяжелые частицы, хоть и встречаются намного реже, спокойно долетают даже до нашего последнего щита — атмосферы — и, правильно, вызывают одиночные эффекты, в том числе тиристорный эффект, способный в любой момент необратимо разрушить какую-нибудь микросхему и с ней весь космический аппарат. Поэтому применять коммерческие микросхемы можно только в случае, если приняты меры по их защите от одиночных эффектов.

Вторая проблема состоит в том, что микросхемы на спутнике — это не только процессоры и память, но и множество других видов чипов, в том числе силовых и аналоговых, и с их радиационной стойкостью все гораздо сложнее и намного менее предсказуемо. Да и современные системы на кристалле содержат большое количество нецифровых блоков; например, у большинства чипов флэш-памяти первым перестает работать используемый для записи генератор высокого напряжения, а у аналоговых КМОП-схем сдвигается опорное напряжение, генерируемое при помощи пары биполярных транзисторов, и даже небольшие утечки могут серьезно изменить рабочую точку малопотребляющих аналоговых каскадов. Стойкость силовых ключей к разрушающим одиночным эффектам может сильно зависеть от приложенного к ним напряжения, и так далее и тому подобное.

Третья важная проблема использования коммерческих микросхем в космосе состоит в том, что стойкость к полной дозе и тиристорному эффекту чувствительна к изменению параметров техпроцесса, в том числе небольшим, так что если на фабрике что-то поменяли, вы можете выкинуть результаты своих испытаний в мусорную корзину. А для коммерческих микросхем производитель гарантирует стабильность функциональных параметров, а не технологического процесса. Более того, в разных партиях вам могут встретиться кристаллы с разных фабрик; например, процессор из шестого айфона, Apple A9, производился на 16 нм TSMC и 14 нм Samsung, и пользователю не сообщалось, какая версия стоит в его телефоне. Для борьбы с этой проблемой во всем мире для разработки радстойких микросхем используются институты Trusted Foundry или сертифицированных техпроцессов — словом, какой-то формы гарантии неизменности техпроцесса со стороны фабрики.

Итого правильный ответ на вопрос «можно ли применять в космосе обычные коммерческие микросхемы?» звучит так: «Да, можно, на некоторых орбитах и при соблюдении ряда требований и условий». Полезный совет: если вы все же решили использовать коммерческий чип и вложиться в его испытания, купите запас сразу лет на десять вперед. Это, кстати, вполне себе бизнес-модель большой и уважаемой компании 3DPlus — они испытывают на радстойкость все коммерческие микросхемы подряд, находят те, которые имеют (по сути случайно) достаточные показатели, закупают большие партии и дальше пакуют чипы в собственные корпуса под собственной маркой.

Другие орбиты

Однако, спутники летают не только на низкой околоземной орбите. В качестве примера других требований давайте рассмотрим единственный способ обеспечить стабильную связь в окрестностях Северного полюса — а это стратегически важный для России район — орбиту “Молния”, названную так в честь первого запущенного на нее аппарата.

image

Рисунок 5. Орбита “Молния”.

Главная особенность этой орбиты состоит в том, что из-за большой вытянутости (минимальная высота — около 500 км над поверхностью Земли, максимальная — до 40 000 км, период 12 часов) аппарат четыре раза в сутки пересекает радиационные пояса. Срок активного существования самых первых спутников “Молния” составлял всего около полугода — в первую очередь, из-за вызванного радиацией падения мощности солнечных панелей, которым нужно было питать мощный (орбита-то высокая) радиопередатчик.

На геостационарной орбите или на орбитах навигационных аппаратов рисунок 2 обещает нам дозу в несколько сотен крад(Si) — а дозовая стойкость коммерческих микросхем может легко составлять 5-10 крад(Si), то есть ни о каких 10-15 годах активного существования таких чипов на орбите речи быть не может. Точнее, может, но для этого понадобится гораздо более толстая защита — или защита из чего-то более плотного, чем алюминий. Впрочем, тут мы погружаемся в дивный мир конструирования космических аппаратов, так что давайте ограничимся фразой о том, что доставка каждого килограмма на орбиту дорога, а идея спрятать наиболее уязвимую электронику поглубже внутрь корпуса, экранировав ее с помощью других компонентов — неплоха, но полностью проблем не решит.

Военные микросхемы

Занимаясь вопросом развенчания мифов о радстойкости, необходимо обязательно сказать о том, что нельзя ставить знак равенства между «радстойкими», «космическими» и «военными» микросхемами. Не все военные микросхемы — радстойкие, и не все радстойкие — военные. Если мы обратимся к американскому военному стандарту Mil-Std-883 (к американскому, потому что его российский аналог в части радиации засекречен), то мы найдем в нем множество разных тестов на влияние окружающей среды — термоциклирование, влажность, воздух с морской солью и т.д. и т.п.

Радиации касаются следующие пункты:

1017.2 Neutron irradiation
1019.8 Ionizing radiation (total dose) test procedure
1020.1 Dose rate induced latchup test procedure
1021.3 Dose rate upset testing of digital microcircuits
1023.3 Dose rate response of linear microcircuits


Полная доза и мощность дозы. Одиночные эффекты? Никак нет. В техническом задании на микросхему могут фигурировать требования на стойкость к одиночным сбоям и/или тиристорному эффекту, но эти требования не стандартизованы и каждый раз определяются заново, исходя из потребностей конкретных заказчиков каждого чипа. Получается, что статус «military» не является гарантией возможности запустить микросхему в космос? Да, это так. Примером может служить судьба печально знаменитого «Фобос-грунта», гибель которого была вызвана, согласно официальной версии (очень сложно доказуемой, зато очень удобной), попаданием тяжелой заряженной частицы в американскую микросхему памяти класса «military», которая не была стойкой к одиночным сбоям.

Мирный атом и другие

Важность радиационной стойкости не ограничивается только космическими и военными применениями. Естественный радиационный фон на уровне моря во много раз ниже даже того, что происходит на низкой орбите, но атмосфера Земли не только служит последним щитом на пути космического излучения, но и рождает вторичные частицы при взаимодействии с ним. Вторичные частицы — в основном нейтроны. Появляясь в верхних слоях атмосферы, они обычно не долетают до поверхности, однако на высотах полетов гражданских авиалайнеров и доза излучения набирается значительная, и по одиночным сбоям собрана весьма внушительная статистика. В медицине давным-давно применяется рентгеновское излучение, а радиотерапия — один из важных способов борьбы со злокачественными опухолями, и в подобных установках тоже нужна электроника.

И, конечно же, не стоит забывать, что вся возня с нежно любимым всеми электронщиками бессвинцовым припоем была затеяна во многом из-за того, что свинец и некоторые другие материалы, применяемые при производстве микросхем, содержат примеси более тяжелых элементов, в частности урана, и их применение приводит к генерации небольшого, но все же хорошо измеримого потока альфа-частиц — прямо около уязвимого кремния. В случае c BGA-корпусами или 3D-сборками — по всей поверхности уязвимого кремния.



Рисунок 6. Иллюстрация шарика припоя как источника альфа-частиц.

Хорошая новость — у альфа-частиц достаточно маленькая глубина пробега в кремнии (от единиц до десятков микрон, в зависимости от энергии), и многослойная металлизация помогает уменьшить их влияние. Плохая новость — на низких проектных нормах все альфа-частицы, которые все-таки долетают до кремния, вызывают сбои, и не только одиночные, но и множественные (об этом подробнее чуть ниже). Например, в прошлом году TSMC опубликовали на 2018 IEEE International Reliability Physics Symposium статью об измерении количества сбоев от загрязнения альфа-частицами в памяти по проектным нормам 7 нм, то есть эта проблема продолжает существовать и требовать каких-то действий и в мире, где все перешли на бессвинцовый припой.

Еще одно применение радиационностойких микросхем, о котором хотелось бы сказать пару слов — это физика высоких энергий и атомная энергетика. В активных зонах адронных коллайдеров и атомных реакторов (а также в технике, предназначенной для ликвидации радиационных катастроф) тоже нужна электроника, причем крайне желательно такая, которая не нуждается в замене и ремонте на протяжении значительного времени. Требования по полной поглощенной дозе для таких применений — десятки и даже сотни Мегарад(Si), то есть на три порядка больше, чем в обычных космических применениях. Дополнительно усложняет ситуацию то, что такая стойкость требуется не от цифровых схем, а от силовых и аналоговых — схем управления электроприводами и первичной обработки показаний многоканальных сенсоров. И если с обеспечением дозовой стойкости цифровых схем все более-понятно даже при больших дозах, то в случае с аналогом разработка электрической схемы имеет принципиальное значение, а сама получившаяся схема составляет даже большее ноу-хау, чем это обычно бывает в аналоговом дизайне.



Рисунок 7. Обычная и радстойкая схема источника опорного напряжения. Из статьи Y. Cao et.al., «A 4.5 MGy TID-Tolerant CMOS Bandgap Reference Circuit Using a Dynamic Base Leakage Compensation Technique», IEEE TNS, Vol.60, N.4, 2013

Проиллюстрирую масштаб задач, стоящих перед разработчиками чипов для атомной энергетики, своим любимым примером. Источник опорного напряжения (ИОН), равного ширине запрещенной зоны кремния (bandgap voltage reference) — относительно простая и хорошо известная схема. При воздействии радиации меняются параметры биполярных транзисторов, используемых в качестве диодов (падает коэффициент усиления из-за появления утечки эмиттер-база). В результате опорное напряжение обычной схемы ИОН, определяющее точность всех измерений, может сместиться, скажем, на 15-20%, что соответствует эффективной разрядности АЦП в два-три бита. У схемы справа опорное напряжение изменяется в пределах 1% (что больше 7 бит) при дозе ионизирующего излучения в 4.5 МГр. Для того, чтобы добиться этого впечатляющего результата, схему потребовалось серьезно переработать, добавив целую россыпь обратных связей, компенсирующих дозовую утечку. В радстойком варианте примерно в четыре раза больше элементов, чем в обычном, и его энергопотребление в два раза больше. А самая плохая новость заключается в том, что для каждой новой схемы стратегию обеспечения радиационной стойкости и ее реализацию приходится разрабатывать отдельно. А ведь есть еще проблема защиты аналоговых схем от одиночных эффектов, решение которой тоже достаточно плохо формализуется.

Радиационная стойкость и проектные нормы


На сайте одной микроэлектронной фабрики довольно долго красовалось утверждение, что радиационной стойкости нельзя добиться на проектных нормах ниже 600 нм, потому что иначе «заряженные частицы прошивают кремний». По удивительному совпадению, минимальными проектными нормами, доступными той фабрике, были как раз 600 нм. А один высокопоставленный сотрудник другой фабрики сообщал в интервью, что сделать микросхемы для космоса на проектных нормах ниже 90 нм «технологически невозможно». И снова так совпало, что технологически невозможно сделать что-то на нормах ниже 90 нм на этой конкретной фабрике. Маркетинговые причины этих ситуаций и сиюминутная выгода от них вполне понятны, но в долгосрочной перспективе подобные фразы, сказанные на широкую аудиторию, как мне кажется, приносят больше вреда, чем пользы.

Также регулярно встречаются не привязанные ни к какому маркетингу рассуждения о том, что микросхемы, выполненные по проектным нормам грубее некоторого предела, иммунны к разрушающим одиночным сбоям (в частности, к тиристорному эффекту), а значит многолетнее использование давно устаревших технологий не только оправдано, но и необходимо.
Или наоборот, фразы о том, что к тиристорному эффекту иммунны микросхемы с проектными нормами ниже 250 нм, потому что у них настолько низкие рабочие напряжения, что тиристор просто не может открыться. Или есть мнения, что на самом деле проблема не в проектных нормах, а в том, что КМОП-технология принципиально уязвима к радиации (что подтверждается сделанными заявителем в семидесятых испытаниями), а старые радстойкие чипы — биполярные/КНС/GaAs. А раз КМОП-технология принципиально плоха, но все современные чипы делаются на ней — это значит, что современные чипы нерадстойкие по определению, и единственный верный путь для космонавтики — вложение денег в доведение до ума давно заброшенного арсенида галлия (заодно и на коммерческом рынке Intel победим) или возврат к проверенной временем дискретной логике. А еще лучше — к лампам.

Радстойкие — значит старые и отсталые?

Справедливости ради, надо отметить, что в проектных нормах около пары микрон и больше действительно обычно не бывает ни тиристорного эффекта, ни одиночных сбоев — просто потому, что для переключения элементов на таких проектных нормах нужна очень большая энергия. При нормальной работе — тоже, так что хотелось бы пожелать тем, кто предлагает продолжать пользоваться старыми микросхемами, попробовать собрать процессор Intel Core на логике 74 серии, и подумать, какая ракета вообще способна будет поднять в воздух получившегося монстра.

С другой стороны, не процессорами едиными жива микроэлектроника. Существует огромное количество задач, для которых совсем маленькие проектные нормы не нужны или не настолько обязательны, и вполне хватает уровней 500-90 нм. Мировой коммерческий рынок микросхем на пластинах диаметром 200 мм (а это проектные нормы 90 нм и выше) уже несколько лет растет, вплоть до дефицита производственного оборудования. На «устаревших» проектных нормах производятся как давно разработанные, так и совершенно новые микросхемы, и многие фабрики готовы гарантировать долгосрочное будущее техпроцессов (но не обязательно их полную неизменность). Поэтому «отсталость» той или иной фабрики от условного TSMC вовсе не означает невозможность коммерческого успеха ни на гражданском, ни на спецстойком поприще.

Дороговизна разработки, производства и сертификации радстойких микросхем — еще большая головная боль для производителей, чем в автомобильной или промышленной электронике. Маленькие тиражи (а речь часто идет если не о сотнях, то о тысячах штук) усложняют коммерциализацию подобного рода разработок, ведь если нужно разделить на тысячу чипов миллион долларов (стоимость разработки относительно несложного чипа по нормам 180 нм), то это уже тысяча долларов на чип, а ведь еще нужна сертификация, которая тоже легко может вылиться в несколько миллионов (особенно если испытывать КМОП-схемы на ELDRS). А если нужно окупить на маленьком тираже миллиард долларов? Именно столько стоит разработка по нормам 5-7 нм. Дороговизна разработки и сертификации привела к тому, что во всем мире разработка значительной части радстойких микросхем напрямую или косвенно дотируется государствами. Это сильно сокращает количество новых проектов, побуждает дольше и изобретательнее продавать то, что есть, и максимально переиспользовать проверенные IP-блоки. В итоге востребованные радстойкие микросхемы производятся и используются по много лет, создавая иллюзию, что все радстойкие микросхемы — старые. И клиенты в большинстве случаев этим довольны, потому что в ситуации, когда надежность все же первична по отношению к производительности, переиспользование уже зарекомендовавшего себя решения — это часто лучшее, что можно придумать, а наличие «flight heritage» — колоссальное конкурентное преимущество. Это тоже способствует продлению срока активного производства удачных разработок — даже тогда, когда они уже морально устаревают, и когда уже есть замена. Кроме того, даже установка pin-to-pin-совместимого аналога в большинстве случаев требует как минимум пересогласования конструкторской документации, а как максимум проведения дорогостоящих испытаний. И это в ситуации, когда никакой разработки не требуется, что же говорить о случае, когда для применения нового чипа что-то действительно надо переделывать? Разумеется, в такой ситуации разработчики аппаратуры стремятся переиспользовать проверенные решения целиком.

Не помогает восприятию обществом и то, что путь новых разработок в космос долог и тернист — и в новости еще дольше, а ведь именно из научно-популярных новостей обыватели обычно узнают о достижениях космической индустрии. В 2015 году было несколько сообщений вида «на спутнике New Horizons, долетевшем до Плутона, стоит такой же процессор, как в приставке Sony PlayStation», а приставке этой на момент выхода новостей было уже за двадцать лет. Отличная и очень грамотная подача материала, ничего не скажешь. New Horizons был запущен в 2006 году, а разработка проекта началась в 2000 году — в год первого полета процессора Mongoose-V, то есть это был самый новый доступный процессор с уже имеющимся опытом работы на орбите. Разработка этого процессора закончилась в 1998 году, а началась в 1994 году — аккурат одновременно с выходом PlayStation. Вот другой пример: процессоры архитектуры Power750 вышли для гражданских применений в 1997 году, в 1998 году дебютировал iMac с таким процессором. В 2001 году была закончена разработка радстойкого аналога — RAD750. В космос этот процессор впервые попал в 2005 году, а в новости — только в 2012, после мягкой посадки на Марс ровера Curiosity. Конечно же, тогда тоже не обошлось без желтых заголовков про процессор пятнадцатилетней давности, а ведь разработка проекта Curiosity началась в 2003 году, то есть даже до первого полета процессора RAD750.

Передовые рубежи

Несмотря на все вышеизложенное, прямо сейчас уровень проектных норм, на котором ведутся разработки вычислительных платформ для космоса — это 65-45-22 нм. По 45 нм уже выпущен в серийное производство американский комплект микросхем RAD5500, по 28 нм в следующем году должен выйти европейский процессор DAHLIA, по 65 нм в бельгийском IMEC сейчас активно создается рассчитанная на долгосрочное применение платформа для разработки ASIC. Не отстают и российские разработчики — в дорожной карте НИИСИ РАН на будущий год значится выход радстойкого процессора на 65 нм, а публикации на эту тему говорят о создании платформы разработки, то есть у этих проектных норм большое будущее не только в Европе, но и в России.

И даже на этом уровне проектных норм развитие радстойкой электроники не останавливается — если посмотреть в свежие номера IEEE Transactions on Nuclear Science, там можно найти достаточно работ по изучению транзисторов с проектными нормами 20-16-14 нм, подготавливающих почву для новых поколений космических микропроцессоров. На таких проектных нормах разработчиков ожидает много нового и интересного: во-первых, нельзя сделать кольцевые транзисторы, во-вторых, в FinFET совсем другая геометрия канала и изоляции, в-третьих, есть FDSOI-технологии, в которых тоже достаточно специфики.

Уменьшение проектных норм, безусловно, влияет на радиационную стойкость изготавливаемых на них микросхем, но вовсе не обязательно в худшую сторону. Общий тренд состоит в том, что со снижением проектных норм влияние полной дозы уменьшается, а одиночных эффектов увеличивается. Сдвиг порогового напряжения в проектных нормах 180 нм и ниже измеряется в единицах или десятках милливольт даже для больших доз: подзатворный оксид такой тонкий, что накапливающийся в нем заряд туннелирует в канал вместо того, чтобы накапливаться. Переходной слой в технологиях с изоляцией STI достаточно компактный, что позволяет во многих случаях обеспечить низкие утечки при полной дозе в несколько десятков или даже сотен крад(Si). А если применить в глубоко субмикронной объемной технологии кольцевые транзисторы и охранные кольца, то мы разом избавимся от всех дозовых проблем.



Рисунок 8. Примеры радиационностойких элементов AND разработки компании «Миландр» на технологии SOI BCD.

На рисунке 8 — два варианта реализации одного и того же логического элемента AND для разных условий. Слева мы видим полный фарш — кольцевые транзисторы в индивидуальных охранных кольцах. Справа — вариант попроще, для низкой полной дозы: транзисторы линейные, вместо охранных колец только хорошие контакты в земле. И в обоих случаях диэлектрическая изоляция n-канальных транзисторов от p-канальных, чтобы обезопасить микросхему от тиристорного эффекта. В объемной технологии эту функцию выполняют охранные кольца. При этом надо отметить, что для многих космических применений вполне достаточно стойкости к полной дозе на уровне 50-100 крад(Si), и линейные транзисторы прекрасно с этим справляются, не требуя существенно ухудшать функциональные параметры схемы ради достижения стойкости.

С одиночными сбоями ситуация такая: приблизительный диаметр области, из которой идет сбор заряда при попадании одиночной частицы — порядка одного микрона, то есть больше размеров ячейки памяти, выполненной по глубоко субмикронным проектным нормам. И действительно, экспериментально обнаруживаются так называемые множественные сбои, когда одна частица вызывает переключение сразу нескольких бит. Более того, с уменьшением проектных норм уменьшается и энергия, необходимая для переключения бита памяти, то есть к сбоям приводит большее количество попаданий, чем для чипов, выполненных по более грубым проектным нормам. В том числе — попадание альфа-частиц из радиоактивных примесей в конструкционных материалах.



Рисунок 9. Сравнение количества сбоев от попадания одиночной частицы для двух разных вариантов 6T SRAM в технологии с проектными нормами 65 нм. Источник — А. Балбеков и др., «Вопросы применимости СБИС по 65 нм КМОП технологии в условиях воздействия факторов космического пространства».

На рисунке 9 изображены экспериментальные данные по одиночным сбоям в объемной технологии 65 нм. Слева — обычная 6T-SRAM. Десять сбоев от одного попадания! От такого код Хэмминга вас не защитит. Так что, если мы говорим о коммерческих микросхемах, то на грубых проектных нормах с одиночными сбоями все будет несколько лучше, чем на тонких. По крайней мере, они останутся одиночными, и их будет реально исправить при помощи кодирования. Но если микросхема специально создается для космических применений, то в арсенале разработчика есть огромное количество архитектурных, схемных и топологических решений, способных обеспечить высокую стойкость одновременно с высокой производительностью. В правой части рисунка — тоже 6T-SRAM, с точно такой же электрической схемой, но с другой топологией. Цена улучшений, убирающих множественные сбои, тиристорный эффект и повышающих стойкость к полной дозе — четырехкратный рост площади. Звучит не очень приятно, но никто не говорил, что будет легко. Тем не менее, Radiation Hardening by Design работает и позволяет достигать заранее заданных показателей стойкости на маленьких проектных нормах на любой объемной технологии.

Почему заранее заданных? Потому что достижение разных уровней стойкости требует применения разных методов ее повышения, и для каждой технологии и технического задания нужный набор методов свой. Тогда почему бы не применять все сразу, чтобы точно было хорошо? Потому что достижение радиационной стойкости всегда происходит за счет ухудшения функциональных параметров (энергопотребления, площади кристалла, скорости и т.д.), а они являются первым приоритетом. Именно поэтому нужны четкие требования технического задания, как по функциональности, так и по стойкости. Правда, микросхемы не так часто делаются для решения одной-единственной задачи, особенно радстойкие, у которых тираж для каждого из имеющихся применений может составлять несколько десятков штук. Но все же хорошее понимание требований позволяет, например, не использовать кольцевые транзисторы, сильно увеличивающие площадь и ток потребления, и получать в итоге более конкурентоспособные продукты.

Глаз внимательного читателя наверняка зацепился за слово «объемной» во фразе «заранее заданных показателей стойкости на маленьких проектных нормах на любой объемной технологии». Не лишнее ли оно там? Всем же известно, что радстойкие микросхемы нужно делать на технологии «кремний на изоляторе» или «кремний на сапфире».

Кремний на изоляторе


За технологией «кремний на изоляторе» давно и прочно закрепилась слава радиационностойкой. Корни этого популярного заблуждения уходят в седую древность, когда предшественник КНИ, кремний на сапфире, активно использовался для военных разработок. Почему? Транзисторы в такой технологии электрически отделены друг от друга и, что более важно, от подложки. Это означает, что область сбора радиационно-индуцированного заряда при кратковременном воздействии на чип излучения с высокой мощностью дозы, будет маленькой. Это, в свою очередь, существенно уменьшает время потери работоспособности — то, что нужно для работы в условиях атомной войны. И действительно, никакого другого метода снижения времени потери работоспособности, кроме полной диэлектрической изоляции, не существует.

Вторая важная часть мифа «КНИ = радстойкость» — это устойчивость к тиристорному эффекту, в том числе при воздействии с высокой мощностью дозы. Тиристорный эффект или «защелка» — чуть ли не главная головная боль разработчиков микросхем и приборов для космоса, и неудивительно, что технология, позволяющая от него избавиться, заслужила славу радиационностойкой. Но на самом деле ситуация опять несколько сложнее.

image

Рисунок 10. Сечение объемной КМОП-технологии с паразитным тиристором.

Причина возникновения тиристорного эффекта — паразитная тиристорная структура, присутствующая внутри элементов объемной КМОП-технологии. Если сопротивления Rs и Rw достаточно велики, то эта тиристорная структура при попадании заряженной частицы может открыться и закоротить землю чипа с питанием, что, сами понимаете, нехорошо. Насколько велики эти сопротивления в реальных микросхемах? Ответ на этот вопрос довольно прост: контакт к подложке или карману — это лишняя площадь, поэтому их количество стараются минимизировать. А это, в свою очередь значит, что по умолчанию тиристорный эффект в «обычной» микросхеме скорее будет, чем нет. Правда, тиристорный эффект может случиться не только от радиации, но и при воздействии, например, электростатического разряда или даже просто от повышенной температуры и большой плотности тока при неудачной топологии. В «обычных» применениях с тиристорным эффектом сталкиваются производители силовой и автомобильной электроники.

В значительной части космических систем вполне допустима перезагрузка в случае непредвиденных обстоятельств, то есть можно попробовать применить подверженный «защелке» чип, поставив в линию питания схему контроля тока потребления и сброса питания при превышении нормы. Это, собственно, регулярно и делается в ситуациях, когда очень надо применить высокопроизводительную коммерческую микросхему, а чипы защиты от тиристорного эффекта (Latchup Current Limiter) — довольно популярный радстойкий продукт. Но у такого решения есть много ограничений. Сбросить питание можно не везде и не всегда, перезагрузка в процессе выполнения важного маневра способна поставить крест на длительной миссии. Ток потребления современной микросхемы может различаться во много раз в зависимости от режима ее работы, то есть потребление в режиме «ничего не происходит и есть защелка» может быть меньше, чем в случае штатной работы в другом режиме. На какой уровень ставить ограничение тока? Тоже непонятно. Время, за которое нужно успеть отключить питание и предотвратить разрушение чипа, зависит от множества факторов, в том числе от конкретной микросхемы. Где-то можно никуда не спешить и сбрасывать питание столько раз, сколько будет нужно, а где-то уже после первого-второго раза чип все равно необратимо сгорает.

В микросхеме, выполненной по технологии КНИ, тиристорного эффекта не может быть в принципе, потому что все транзисторы электрически разделены. И самое лучшее — то, что для достижения стойкости к тиристорному эффекту не надо делать вообще ничего. То есть, коммерческие микросхемы, выполненные по технологии КНИ, тоже абсолютно устойчивы к нему, что сильно облегчает их применение в космосе. Так, например, коммерческий КНИ процессор будет управлять новым американским космическим кораблем «Орион».



Рисунок 11. Радиационно-индуцированные утечки в объемной КМОП-технологии. Источник — J. Schwank et.al., «Radiation effects in MOS oxides», IEEE TNS, Vol. 55, No. 4, 2008

В чем проблема? В том, что, кроме эффектов мощности дозы и «защелки», есть еще одиночные сбои и полная поглощенная доза, с которыми у КНИ-технологии все далеко не так радужно. На рисунке показаны два пути утечки в объемной КМОП-технологии. Оба этих пути легко закрываются при правильном топологическом проектировании — один использованием кольцевых n-канальных транзисторов, второй — при помощи охранных колец. Эти решения имеют недостатки с точки зрения функционирования схемы (ограничения на минимальный размер кольцевого транзистора, потери площади при использовании охранных колец), но с точки зрения обеспечения радиационной стойкости они очень эффективны.



Рисунок 12. Дополнительный механизм утечки в КНИ технологии.

В технологии КНИ есть еще один путь утечки из истока в сток по границе кремния и скрытого оксида. Скрытый оксид намного толще подзатворного, а значит, в нем может накопиться много положительного заряда. Если мы рассмотрим «нижний» транзистор (правая часть рисунка 12), для которого скрытый оксид является подзатворным, то увидим, что в нормальной ситуации напряжение «исток-затвор» этого транзистора — ноль, а его пороговое напряжение — несколько десятков вольт, то есть ток через этот транзистор не течет. При облучении в скрытом оксиде накапливается положительный заряд (на этот процесс влияет геометрия основного транзистора, в частности — толщина приборного слоя кремния), и пороговое напряжение «нижнего» n-канального транзистора падает. Как только оно падает ниже нуля, ток начинает свободно течь через транзистор по неуправляемому нижнему каналу. Таким образом, с точки зрения полной поглощенной дозы технология КНИ принципиально строго хуже объемной технологии. Но, может быть, есть способ как-то исправить положение?

Обычно подложка микросхемы заземлена, но ведь в КНИ нам ничего не мешает подать на нее не землю, а отрицательное напряжение и таким образом закрыть нижний транзистор? С одной стороны, идея здравая и она активно используется. Причем в случае с полностью обедненным КНИ (FDSOI) и нормами 45-28 нм контроль потенциала под скрытым оксидом используется и при нормальном функционировании. С другой стороны, электрическое поле в скрытом оксиде не только закрывает паразитный транзистор, но и ускоряет накопление положительного заряда в скрытом оксиде. В итоге, в зависимости от параметров техпроцесса и величины приложенного отрицательного напряжения, дозовая стойкость микросхемы с поданным на подложку отрицательным напряжением может не только не улучшиться, но и стать хуже! Дальше, как это обычно водится, есть тонкости, но принципиально ситуация состоит в том, что топологические и схемотехнические методы на объемной технологии позволяют добиться практически любых разумных уровней стойкости к полной дозе, и под «разумными уровнями» я здесь понимаю, скажем 100 Мрад(Si). На КНИ же существуют фундаментальные ограничения, и уровень стойкости конкретного техпроцесса может быть достаточно низким. Обойти эти ограничения без вмешательства в технологию (обычно недоступного из коммерческих соображений) никак нельзя, и узнать параметры дозовой стойкости без дорогостоящих испытаний тоже не получится.

Ничуть не менее интересна и ситуация с одиночными сбоями в КНИ. С одной стороны, в КНИ гораздо меньше объем, из которого собирается выделившийся при попадании ионизирующей частицы заряд (хотя насчет точной формы этого объема много лет идут споры между ведущими учеными). С другой стороны, подзатворная область («тело») КНИ МОП транзистора настолько мала, что попадание в нее даже небольшого заряда способно существенно поднять напряжение в ней. Если напряжение поднимется достаточно высоко для открывания pn-перехода исток-тело, то включится паразитный биполярный транзистор исток-тело-сток, и заряд, внесенный ионизирующей частицей, умножится на коэффициент усиления этого транзистора. На практике это означает падение пороговой ЛПЭ до уровней ниже 1 МэВ*см^2/(мг), то есть к сбою приводит попадание в микросхему чего угодно. Конечно же, с паразитным тиристорным эффектом в КНИ можно справиться — присоединив подзатворную область к истоку транзистора или к земле/питанию. Но, во-первых, этого никто не делает в коммерческих микросхемах (потому что нет необходимости), а во-вторых, контакт к телу — это потеря площади, особенно чувствительная для ключей, где он должен быть независимым. В каждой ячейке кэш-памяти как минимум два ключа, что приводит к значительному росту площади кэша и кристалла в целом. В то же самое время в объемной технологии для подавления тиристорного эффекта и паразитного биполярного эффекта может быть достаточно одного контакта на 4-8 ячеек памяти, да и даже охранные кольца можно сделать с меньшими потерями площади, чем на контакты к телу транзистора в КНИ. Важным преимуществом КНИ в глубоко субмикронных технологиях является то, что диэлектрическая изоляция предотвращает распространение заряда и множественные сбои с большой кратностью, которые могут появляться в объемной технологии. Однако, размер трека ионизирующей частицы сравним с размерами ячейки памяти, и двойные сбои в КНИ вполне себе регистрируются.

Итого ситуация с радиационной стойкостью технологии «кремний на изоляторе» выглядит таким образом, что она не «радиационно стойкая сама по себе», а имеет ряд преимуществ и ряд недостатков относительно объемной технологии. Часть недостатков КНИ можно обойти при помощи специальных приемов проектирования, но то же самое можно сделать и в объемной технологии. Поэтому при выборе коммерческой микросхемы для использования в условиях воздействия радиации нельзя полагаться на КНИ как на панацею, а при выборе технологии для разработки специализированной радстойкой СБИС надо тщательно взвешивать все «за» и «против» КНИ и объемной технологии для решения конкретной задачи и обеспечения требуемых уровней стойкости к различным радиационным эффектам.

Заключение


Над обеспечением радиационной стойкости интегральных микросхем работают сотни тысяч специалистов по всему миру, и объять необъятное одной научно-популярной статьей невозможно. Да это и тема не для статьи и даже не для диссертации. Во всяком случае, не для кандидатской диссертации. В силу специфики формата, коллеги-специалисты найдут здесь достаточно упрощений, неточностей и может даже фактических ошибок. Хотелось бы, чтобы нет, но сообщения о необходимых правках принимаются в личку. Не претендуя на полноту и новизну, я надеюсь, что справился с тем, чтобы наглядно описать самые популярные связанные с радиационной стойкостью вопросы и заблуждения, а также донести до читателя мысль, что микроэлектроника вообще и космическая микроэлектроника в частности — одна из самых быстро прогрессирующих областей науки и техники, поэтому проверенные временем знания и стереотипы на поверку часто оказываются устаревшими, неполными или неправильными, а простые и очевидные рецепты никто не использует, потому что на самом деле их не существует.

Комментарии (96)


  1. BelerafonL
    21.05.2019 13:15
    +3

    Спасибо за статью! Просто невероятно классно! Хабр — торт!


    1. amartology Автор
      21.05.2019 15:35
      +1

      Вам спасибо за отзыв! Про укрощение самосвалов, или что у вас там еще есть интересного, тоже хотелось бы еще почитать. Хабру для того, чтобы быть тортом, отчаянно нужно больше качественного «железного» контента.


  1. MichaelBorisov
    21.05.2019 13:52

    Спасибо за великолепную статью, для начинающего это очень полезно.

    Хочу заметить по терминологии: у вас используется термин «тело» МОП-транзистора, вероятно, вы так перевели это с английского «Body», но в русской терминологии используется термин «подложка».


    1. amartology Автор
      21.05.2019 14:31
      +2

      «Тело» — у транзистора, «подложка» — у микросхемы. Вся идея КНИ состоит в том, что тело транзистора электрически отделено от подложки микросхемы. Если термин «тело» (действительно калька с body) вам по каким-то причинам не нравится, то правильным термином будет все же «подзатворная область транзистора», а не «подложка». Но «подзатворная область транзистора» — это очень длинно, поэтому, сколько себя помню, все говорят «тело».


      1. MichaelBorisov
        21.05.2019 16:23

        Ну, может, я и ошибаюсь, но в советских справочниках и учебниках в контексте полевых транзисторов всегда упоминались названия выводов: «сток», «исток», «затвор» и «подложка». Может, тут есть разница между дискретным полевым транзистором, где кристалл и подложка одна для всего транзистора, и микросхемой, где таких транзисторов на одной подложке много. В общем, смотрите, вам виднее, т.к. вы более близки к теме, я просто предупредил, исходя из своих знаний, о возможной ошибке.


        1. amartology Автор
          21.05.2019 16:44
          +1

          в советских справочниках и учебниках в контексте полевых транзисторов
          Вся статья, в общем-то, о том, что не стоит тащить в 2019 год знания из советских справочников. Спасибо, что подтвердили нужность выбранной темы)

          А если серьезно, то, как я уже сказал в предыдущем комментарии, в КНИ, в отличие от объемной технологии, подзатворная область n-канальных транзисторов электрически отделена от подложки микросхемы и может быть подключена или к истоку, или к произвольному потенциалу. А подзатворная область p-канальных транзисторов и в объемной технологии находится не в подложке, а в кармане. Более того, и в объемных технологиях бывают опции с тройным карманом, позволяющие подключить подзатворную область n-канального транзистора не на подложку, а к произвольному потенциалу. Такие опции полезны для аналоговых применений, потому что позволяют устранить зависимость порогового напряжения от напряжения на истоке (актуально для дифпар). Именно поэтому называть подзатворную область или тело транзистора подложкой — неправильно. Но другого удобного русскоязычного термина не сложилось, поэтому прижилась калька из английского языка.

          В дискретных транзисторах, кстати, отдельного внешнего вывода подложки обычно вообще нет, ее подключают на сток, вот так:
          image
          Более того, в показанной выше структуре к «подложке» подключен сток, а «тело» тоже есть, и оно при этом не является в точности «подзатворной областью», зато подключено к истоку.


  1. pz_true
    21.05.2019 14:33

    Заранее прошу прощения за ламерский вопрос.
    Хотелось бы узнать, имеет ли смысл в очень тонких полупроводниках? Что то в виде напыления на графен или подобное висящее в пустоте. Не будут ли тогда пролетать насквозь радиация принося мало вреда микросхемам?


    1. CorneliusAgrippa
      21.05.2019 14:39
      +4

      Пролетать-то она может и будет, только вы замучаетесь от «висящего в пустоте» тепло отводить.


    1. amartology Автор
      21.05.2019 14:45
      +1

      Пока есть материал — есть взаимодействие, и чем меньше будет материала, тем больше будет влияние каждого конкретного случая взаимодействия. Дефекты обычно накапливаются не в объеме, а на границах раздела, так что уменьшение толщины — не панацея. Граница раздела материала с ничем —тоже граница)
      Пример такого рода — силовые транзисторы на нитриде галлия. У них очень тонкая (фактически двухмерная) рабочая область, и они уязвимы к эффектам смещения, существенно влияющим на подвижность носителей.


      1. pz_true
        21.05.2019 14:46

        Спасибо!


  1. webhamster
    21.05.2019 15:25

    Замечательно написано! Теперь, если срач поднимается, достаточно дать сылку на эту статью.


    1. khim
      21.05.2019 19:33
      -4

      И вы думаете хоть кто-то сподобится пойти читать «стока букав»?


      1. Zenitchik
        21.05.2019 20:19
        +1

        В любом случае, это будет достойный повод посоветовать гражданину заткнуться.


  1. sergionys
    21.05.2019 15:28

    Полезно для развития


  1. ci4rovik
    21.05.2019 15:28

    Спасибо! Очень интересно.


  1. saege5b
    21.05.2019 15:56

    В статье были упомянуты лампы.
    Не так давно поднималась волна восхищения транзисторами типа ламп, где ширина между электродами очень мала.
    Взгляд со стороны можно?


    1. amartology Автор
      21.05.2019 16:29

      Я видел несколько статей про транзисторы с вакуумным каналом, и пока что у меня создалось впечатление, что это очередная крайне перспективная технология, которая навсегда или очень надолго останется на лабораторных столах вместе с нанотрубками и графеном. С практической точки зрения оно станет востребованным после того, как будут исчерпаны резервы гетероструктур (канал из германия, нитрида галлия и т.д.), а там только-только начались первые шаги. Хотя конкретно в этом случае есть перспективы совместимости с КМОП-технологией, что сильно повышает шансы.


      1. nad_oby
        21.05.2019 21:59

        Или может кому-нибудь очень сильно понадобиться (почти) терагерцовые микросхемы, тут у "вакуумных" транзисторов есть неплохой шанс.
        А как технология обкатается и до нас доберётся до простых пользователей.
        И да когда прочитал что эти радиолампы можно чуть ли не обычной литографией делать сильно удивился.
        А по поводу радиационной стойкости там все хорошо by design если я правильно понял.


        1. amartology Автор
          21.05.2019 22:29

          Там есть затвор и подзатворный диэлектрик, то есть по идее поле в канале наводиться будет.


          1. nad_oby
            23.05.2019 10:47

            А я понадеялся на 10.1109/IEDM.1985.190922 хотя там конкретики нет.
            UPD. dx.doi.org/10.1063/1.4717751 тут конретнее немного.


            1. amartology Автор
              23.05.2019 11:00

              1985 год, камон! Если бы это работало, за тридцать лет его довели бы до ума уже.


    1. SvSh123
      21.05.2019 16:41

      Смотреть пока не на что. :)
      Эти «вакуумные транзисторы» вот уже лет 20 без видимых успехов ковыряет то одна, то другая команда. То ли результатов нет, то ли они засекречены…


  1. Kirpitch
    21.05.2019 17:59

    Спасибо! Прочитал с большим интересом!


  1. worldmind
    21.05.2019 18:28

    А обычный металлический корпус компа это достаточная защита от всяких вторичных частиц?


    1. amartology Автор
      21.05.2019 19:00
      +1

      Если вас интересует космическое излучение и вторичные частицы от него, то стоящий на высоте около уровня моря корпус компьютера — это небольшое и не очень важное дополнение к атмосфере, поэтому можете не переживать — то, что мог бы остановить корпус, и так остановит атмосфера, а то, что не остановит атмосфера, корпус не остановит тоже.


      1. worldmind
        21.05.2019 19:18

        ну а это реальная проблема и имеет ли смысл от неё защищаться в бытовой электронике?


        1. amartology Автор
          21.05.2019 19:38

          В бытовой электронике вероятность чего-то такого настолько мала, что не стоит переживать. А там, где это релевантно (например, в суперкомпьютерах), защита делается.


        1. JerleShannara
          21.05.2019 20:23
          +1

          Пока вы со своим ПК/Телефоном не лазаете по хранилищу радиоактивных отходов — проблемы нет


          1. General_Failure
            22.05.2019 07:49

            Что-то не обращал внимание — а Сидорыч в Сталкере случайно не продаёт модные свинцовые чехольчики для PDA и других гаджетов?


      1. MichaelBorisov
        23.05.2019 00:41

        Как-то мне завлаб по чувствительным радиационным измерениям рассказывал, что от космического излучения их немножко защищает 5 этажей здания над лабораторией, и свинцовый домик (из кирпичей толщиной в несколько сантиметров), но всё равно этого недостаточно.


  1. Vsevo10d
    21.05.2019 19:13
    +1

    Примерно в каждой второй теме на Хабре, касающейся космонавтики или электроники

    Как автор одной такой статьи, позволивший себе в двух словах обежать такую сложную и непрофильную для меня тему, выражаю благодарность за ее подробное изложение. Сохранил в закладки.


  1. Eltaron
    21.05.2019 20:50

    у большинства чипов флэш-памяти первым перестает работать используемый для записи генератор высокого напряжения

    Спасибо, как раз утром пытался починить карту, на которую перестали записываться файлы. Вот оно как, значит.


    1. amartology Автор
      21.05.2019 21:07
      +2

      Вы запускали ее в космос или совали под ускоритель? )


      1. Jef239
        22.05.2019 03:32

        Полетов на самолете не хватит? Вообще, то, что летает на 11 км, защищать от радиации надо или можно обычные наземные микросхемы ставить?


        1. amartology Автор
          22.05.2019 08:42

          То, что летает на 11 км, надо обязательно защищать от одиночных сбоев и отказов. Интенсивность там невелика, так что наверное можно обойтись наземными чипами и защитой на уровне системы и софта. Зарубежные производители предлагают для гражданской авионики довольно много специализированных чипов или протестированных версий обычных. На космический корабль Orion, если я правильно помню, в итоге пошел целиком даже не процессор, а прямо бортовой компьютер от какого-то «Боинга», потому что он оказался достаточно стойким ко всему, к чему надо.
          С военной авионикой, сами понимаете, военная история.


  1. Paskin
    21.05.2019 21:50

    Кроме космоса и ликвидации аварий — есть еще медицинские приборы (рентгенаппараты и томографы) и приборы неразрушающего контроля. Типичная «камера» томографа мало того что находится практически в фокусе рентгеновской трубки — так еще и делает каждую секунду 4 оборота вместе со всем gantry, при этом производя почти гигабайт данных…


  1. chektor
    21.05.2019 22:01

    Интересная заметка, спасибо. А где можно (и можно ли) получить (послушать) шумы транзисторов в условиях радиации? Например интересуют шумы, одиночного КП302 и пары КПС104 (диф. каскад), полевых транзисторов (в диапазоне 1 Гц -30 кГц, в режиме усиления нановольтового -сумикровольтового полезного сигнала, динамический диапазон 120 дБ, на разных высотах орбиты, от источников «разной радиации»). Буквально «пару минут шума».


    1. amartology Автор
      21.05.2019 22:35


      Вот примерно так может выглядеть влияние дозы радиации на 1/f шумы. Первый попавшийся пример, 65 нм КМОП. По конкретным транзисторам — видимо только самостоятельно испытывать.


      1. chektor
        21.05.2019 22:56

        Хотелось бы на слух. У полевых транзисторов несколько другой шум, нежели у биполярных. А ещё у полевых транзисторов есть ещё «шум жареной кукурузы».


        1. amartology Автор
          21.05.2019 23:02

          Из вариантов получить файл на слух в звуковом диапазоне, боюсь, только самостоятельно испытать. В контексте разрядности аналого-цифрового преобразования «шум жареной кукурузы» редко изучается.


          1. chektor
            21.05.2019 23:10

            Спасибо! Будет оказия, слетаю, послушаю. :))


            1. amartology Автор
              22.05.2019 00:51

              Зачем летать? Оно все прекрасно на Земле тестируется.


              1. chektor
                22.05.2019 01:04

                Понимаете, коллега, у нас разные задачи. Вы рассматриваете шум, как помеху. А я в этом шуме ищу контакты с другим Разумом! Мне нужен космический шум.
                Помните, «что в шуме тебе моём»?


                1. amartology Автор
                  22.05.2019 09:03

                  Если вас интересуют контакты с другим разумом, то вам все должно было стать понятно из спектрограммы шума.
                  И да, вы зря ищете в звуковом диапазоне, 2-100 ГГц гораздо перспективнее в этом плане.


                1. mayorovp
                  22.05.2019 09:11
                  +1

                  В таком случае вам тем более нужно провести предварительные испытания на земле. Чтобы было с чем сравнивать космический шум.


  1. RtZ
    21.05.2019 22:27

    Спасибо! Очень интересно и понятно.


  1. dag_tech
    21.05.2019 22:39

    Ну просто какая-то супер-статья! Какое-то своеобразное впечатление, когда понимаю, что многое не понимаю, да и вообще далек от темы, однако понимаю, что все по делу, с корректной детализацией, четкой последовательностью…
    Спасибо!


  1. p1024x
    21.05.2019 22:57

    Отличный материал получился! Спасибо!


  1. ganqqwerty
    21.05.2019 23:00

    некоторые и Ардуино бы использовали

    я бы и Xeon использовал


  1. ArilinRoman
    21.05.2019 23:02

    Годная статья.
    Но фактические блохи есть, которые тоже из серии если не мифов, то заблуждений.
    Я немного позанимаюсь заклепничеством.

    Мировой коммерческий рынок микросхем на пластинах диаметром 200 мм (а это проектные нормы 90 нм и выше) уже несколько лет растет, вплоть до дефицита производственного оборудования.

    Таки нет.
    Количество пластин диаметра 300мм очень растет, исходя из потребностей рынка.
    А количество пластин диаметра 200мм и ниже, падает или замерло. Если замерло, то это все равно падает относительно бурного роста 300мм.
    Ниже рисунок из отчета 2018.
    <img src="" alt=«image»/>

    Все-таки при прочих равных схемотехнических приемах, технология SOI позволяет достичь лучшей «стойкости» относительно КМОП (если говорить о достижении максимальной стойкости к накопленной дозе).
    Негативный эффект придонного паразитного транзистора (рис12) имеет место быть, но явление это известно, и есть способы его подавления за счет технологии, есть есть такая цель (снижая толщину диэлектрика изоляции, управление концентрацией примеси, потенциал к подложке и т.д.).


    1. amartology Автор
      22.05.2019 01:06

      Если замерло, то это все равно падает относительно бурного роста 300мм.
      Я не говорил, что 200 мм растут так же быстро, как 300 мм. Но растут, и из вашего графика это тоже видно. Вводятся в строй новые специализированные техпроцессы под IoT и автоэлектронику.

      Все-таки при прочих равных схемотехнических приемах, технология SOI позволяет достичь лучшей «стойкости» относительно КМОП (если говорить о достижении максимальной стойкости к накопленной дозе).
      Нет, не позволяет. На КНИ можно добиться Мегарада, ну может быть двух — и то на практике регулярно получается на порядок меньше, например, потому, что нельзя увеличить толщину приборного слоя, которая зависит от поставщика пластин, а не от фабрики)
      На объеме можно сделать 100 Мрад. Или 400 Мрад.

      есть способы его подавления за счет технологии
      Это если у вас есть возможность вмешательства в технологию. Большинство разработчиков микросхем, и радстойких тоже — fabless, и ради них и их мизерных тиражей никто не будет менять процессы, изначально сделанные например для automotive.


  1. Garry_D
    22.05.2019 00:02

    Замечательная статья! Вот интересно, если знать технологию изготовления, проектные нормы, топологию, конструкцию и пр. для индустриальной микросхемы, насколько точно можно рассчитать ее рад. стойкость? В статье упоминается 3D-plus, которая отбирает подходящие микросхемы с помощью испытаний. Может она прямо не все подряд испытывает, а сначала расчетно оценивает: какие могут оказаться подходящими, а какие нет? Так же, как и прочие компании, которые применяют индустриальные микросхемы для космоса.


    1. amartology Автор
      22.05.2019 00:55

      Для оценки дозовой стойкости конструкцию надо знать настолько точно, что дешевле и проще испытать, чем пытаться рассчитывать что-то. Расчеты и моделирование обычно применяются при создании новых техпроцессов, а не при анализе существующих чипов.
      По одиночным сбоям можно оценить заранее предельное значение чувствительного объема. По разрушающим одиночным эффектам возможны очень грубые оценки.


  1. dragonnur
    22.05.2019 02:30

    Несколько оффтопичная мыслЯ из тех, что приходят опосля — Молнию надо было стабилизировать вращением, цилиндрический спутник довольно большого размера с хрустальным (я не шучу, глёт-силикат был бы лучше алюминия КМК) покрытием «стакана», прямо на поверхность, а сам стакан покрыть СБ. И деградация батарей будет медленней.
    А вторая — сменить «направление» полёта, чтобы в рабочем состоянии машина находилась ниже ВанАлленовских поясов, а при их «форсировании» — «спала». Конечно, так изначально спутников надо будет больше и опорно-поворотные устройства для антенн сложней, зато потом подновлять группировку реже.
    Всё вышесказанное — «имха» по напальцевой прикидке, если чуть более всерьёз — это и считать надо всерьёз.


    1. VT100
      22.05.2019 07:41

      Её рабочее состояние — долгий сеанс связи в окрестностях апогея. Намного выше Ван-Аллена.


    1. amartology Автор
      22.05.2019 09:00

      в рабочем состоянии машина находилась ниже ВанАлленовских поясов, а при их «форсировании» — «спала».
      А разве во время сна спутника радиацию ему отключают? Влияние радиации на полупроводниковые приборы зависит от электрических режимов, но это не значит, что в выключенном состоянии его нет. Более того, известны прецеденты, когда в отключённом состоянии реакция на радиацию хуже. В том числе такие результаты получали для эффектов смещения, релевантных для солнечных панелей.
      Так что сон во время прохождения радиационных поясов мог не только не помочь, но и сделать хуже.

      Почему от замены плоских СБ на цилиндрические должно что-то поменяться, я вообще не улавливаю идею, если честно. Это не говоря о том, что цилиндр должен иметь площадь, в разы большую, чем площадь плоских СБ, то есть он просто не влез бы на ракету.


  1. VT100
    22.05.2019 07:51

    … эффекты высокой мощности дозы ...

    При поиске по теме «транзисторы 2Т312 и АМС „Марс“ как-то наткнулся на обсуждение „а зачем вообще меняли золото на алюминий при производстве этих транзисторов?“ Ответ был в том, что более лёгкие металлы лучше ведут себя в потоках мощного рентгеновского излучения — меньше поглощают и перегреваются.


  1. berqman
    22.05.2019 08:45

    а когда будут статьи про вечный двигатель?


    1. amartology Автор
      22.05.2019 10:23

      А в Википедии ещё не всё сказано по этому поводу? Тогда напишите вы)


  1. ArilinRoman
    22.05.2019 09:05

    Я не говорил, что 200 мм растут так же быстро, как 300 мм. Но растут, и из вашего графика это тоже видно. Вводятся в строй новые специализированные техпроцессы под IoT и автоэлектронику.


    Не знаю, где вы там на графике какой-то рост 200мм усмотрели, какие-то флуктуации.
    Ниже 180нм — все делается в подавляющем большинстве на диаметре 300мм ( и 90нм тоже).
    Причина одна — подавляющее большинство оборудования делает под диаметр 300мм и выше.
    Старые линейки на 200мм используют, пока на них не устареет оборудование.

    Это если у вас есть возможность вмешательства в технологию. Большинство разработчиков микросхем, и радстойких тоже — fabless, и ради них и их мизерных тиражей никто не будет менять процессы, изначально сделанные например для automotive


    Дык мы то не про аутомотив речь ведем. Ясно, что GF не будет вам профиль кармана и контакт к подложке разрабатывать, с характеризацией элементной базы и выпуском нового PDK.
    Я имею в виду, что те фабрики\компании, которые изначально нацелены на космос\военку, реализуют SOI, заточенную именно под достижение максимальной стойкости (амерская Honeywell, отечественные-которые-не-буду-называть).


    1. amartology Автор
      22.05.2019 10:20

      Старые линейки на 200мм используют, пока на них не устареет оборудование.
      Это поэтому на рынке дефицит оборудования под 200 мм, ASML продолжает продавать новое оборудование под 200 мм и делать заводской ремонт/апгрейд старого? Ну окей.

      Я имею в виду, что те фабрики\компании, которые изначально нацелены на космос\военку
      Все полторы, с заоблачными ценами и нормами не ниже 150 нм? Окей, Honeywell предлагает на КНИ 150 нм дозу в 1 Мрад(Si). 100 Мрад(Si), достижимые на более дешёвых коммерческих 130 нм, не предлагает. Поэтому подавляющее большинство разработчиков из экономических соображений давно перешли на коммерческие объемные процессы или автомотив — зачем платить больше, если результат получается лучше? Из преимуществ у «фабрик, заточенных под космос», может быть упрощение и удешевление испытаний и сертификации, но это не к КНИ вопрос, на объемных процессах так тоже можно.
      К слову, на отечественной-фабрике-которую-вы-не-хотите-называть, для аналоговых КНИ схем открытые источники репортят стойкость от 20 крад(Si). Это, честно говоря, не выглядит как заточка под достижение максимальной стойкости технологическими методами.

      P.S. в интерфейсе есть кнопка ответа на конкретное сообщение вместо создания новой ветки комментариев.


  1. hooperer
    22.05.2019 11:13

    … давным давно, когда я контроллеры делал для спутника, раньше трава была мягче ещё и корпуса были обязательно керамические. 554, 1564, а уж 127 с 9-й приёмкой точно не видел в пластике )))
    Ввиду, в том числе, и физических эффектов от возможных воздушных пузырей в пластике (естественно с атмосферным давлением) — воспроизводящими весьма занимательную физику и интересные эффекты в вакууме.


    1. amartology Автор
      22.05.2019 11:17

      Вообще главной причиной нелюбви военных к пластику было то, что он испускает газ, а в герметичных космических платформах это очень неудобно. Но с тех пор и платформы стали герметичными, и качество пластика улучшилось. Военные всего мира до сих предпочитают керамику, но чипы в пластике прекрасно летают. И даже спецстойкие чипы пакуют в пластик — обычно для коммерческих применений; это, в сочетании с сокращённый объемом испытаний («поверьте нам на слово, что точно такой же кристалл в керамике очень стойкий»), позволяет серьезно снизить стоимость и сделать её разумной например для кубсатов.


      1. hooperer
        22.05.2019 11:37

        да, сейчас уже пластик другой. лет 10...15 как да. И летает в вакууме и внутри гермоотсеков.
        как раз наружу не ставили пластик раньше, только керамику. В гермоотсеке с военпредами можно было договориться о многом. И о 5-й приёмке, и прочих радостях.
        Кстати про газ и герметичность.
        Несмотря на то, что спутники в вакууме и безвоздушное пространство, на самом деле вокруг спутников вполне себе остаётся атмосфЭра и она иногда даже весьма сильно мешает.


      1. hhba
        22.05.2019 23:47
        +1

        Ну, у керамики и ТКЛР можно сделать более подходящий, и монтаж кристаллов в ряде случаев попросту технологичнее. По крайней мере так мне говорили еще в институте (но это могло быть релевантно для позавчерашнего дня).

        Но главное в другом — что может быть красивее электрокорунда! Никакой бездушный полиуретан с ним не сравнится!


        1. amartology Автор
          23.05.2019 00:33
          +1

          Проклятые капиталисты и не менее проклятые кубсатчики считают, что красивее электрокорунда может быть счёт с меньшим количеством нулей)


          1. hhba
            23.05.2019 13:30

            Это да, но на самом деле именно сам по себе керамический корпус мало что к цене добавляет, вы же понимаете ))


  1. noname2019
    22.05.2019 11:17

    Статья прекрасная. Мои познания в электронике застряли на уровне 50-летней давности, но написано так, что, если не вникать в детали, всё понимаешь. Вот вопрос — а натурные испытания разных типов микросхем и технологий проводятся? Так и просится — экспериментальный спутник с набором чипов разного рода и орбитой, чтобы провести их через самые разные радиационные условия вблизи Земли. Может, даже какой-нибудь кубсат или рой таких.


    1. amartology Автор
      22.05.2019 11:23

      На уровне испытания должны проводиться 15-20 лет. За это время вся тестируемая электроника успеет очень сильно устареть. К тому же, задача испытаний — найти худший случай и дать какие-то гарантии, а «испытания» на орбите валидны только для этой конкретной орбиты, для конкретной солнечной активности во время испытаний, для конкретной конструкции спутника и т.д.
      Поэтому наличие полётного опыта используют как приятное дополнение к испытаниям, подтверждающее их адекватность, но ни в коем случае их не заменяющее.


    1. VT100
      22.05.2019 16:49

      Мельком попадалась информация, что американы делали такое вот прям недавно (2000-2010). Но подтвердить ссылкой не могу.


  1. xtovo
    22.05.2019 11:56

    неплохой текст.
    Вопрос. Как проводятся испытания на радиационную стойкость?
    Дело в том, что я работаю в www.protom.ru
    Мы выпускаем ускорители, которые выдают пучок протонов интенсивностью до 2*10^9
    и энергией 30-330 МэВ, и которые идеально подходят для подобных испытаний.


    1. amartology Автор
      22.05.2019 12:01

      Как проводятся испытания на радиационную стойкость?
      Это очень сложная тема, насчет того, как правильно проводить испытания, каждодневно ломается немало копий.
      В НИИП в Лыткарино 4-5 июня будет проходить ежегодная конференция «Стойкость», вам наверное стоит начать с ее посещения. По ссылке есть список людей в программном комитете, его тоже можно посмотреть.


      1. xtovo
        22.05.2019 12:40

        Меня интересовало известно ли Вам о нас?
        На сколько я понимаю, основные повреждения в электронике происходят как раз от протонов энергий в 10-ки МэВ


        1. amartology Автор
          22.05.2019 12:59

          Я разработчик, а не испытатель, поэтому никогда специально не интересовался производителями ускорителей. Такой вопрос надо немного другим людям задавать.
          Что касается протонов, то они важный, но не единственный вид излучения, и назвать их «основным» я бы не решился.


          1. xtovo
            22.05.2019 14:17

            > Такой вопрос надо немного другим людям задавать.

            спросите кого надо, при случае.

            На столе лежит книжка
            vk.com/onuchin1963?w=wall314445117_807%2Fall
            «Методология обеспечения стойкости бортовой аппаратуры космических аппаратов к воздействию ионизирующего излучения космического пространства»

            «МИФИ» Москва 2017

            То, как там излагается «взаимодействие частиц с веществом» — это сплошное дилетанство.
            Посмотрел программы по расчётам доз в космическом пространстве — тоже прошлое тысячелетие, дремучий лес. Дозы считать не имеют.

            Большие надежды возлагаю на результаты от
            m.phys.org/news/2019-02-van-allen-probes-phase-exploration.html


            1. hooperer
              22.05.2019 15:07

              Я бы и в Мифи другим людям бы вопросы о стойкости Бортовой аппаратуры КА задавал.
              К примеру тем, кто её, аппаратуру, КА делал и проектировал. Там весьма умные спецы остались.


              1. xtovo
                22.05.2019 15:14

                Конечно, я «слегка» перегнул палку.
                Просто люди считают упрощённо, что человеку пришедшему и ЦЕРНа, из Физики Высоких Энергий кажется дилетанством.


                1. hooperer
                  22.05.2019 18:01

                  Да. И снова таки, люди с которыми работал лично я лет 15 назад в Мифи при создании КНА- вполне компетентны в вопросе радиационной стойкости оборудования, не только микросхем. Они до сих пор работают и читают там лекции, так что попавшая к Вам книга не говорит о том, что всё плохо)
                  Ностальгия, да. Altera, Actel, оборачивание в определённый слой Octogon systems…


                  1. hhba
                    22.05.2019 23:49

                    Эммм, а что, Октагон делал что-то вменяемое когда-либо, что можно было сунуть куда-то туда?


                    1. hooperer
                      23.05.2019 19:26

                      Ну как Вам сказать.
                      мы брали Octagon Systems, 4020-386-25MHz-1MB, CPU Card.
                      Накрывали стальным листом толщиной 3 мм., благо это было внутри гермоотсека. Соединяли isa шину с 54sx16 ( на тестах это была apa600). Второй 54sx16 был сопроцессором для анализа Быстрых событий. И вся эта конструкция (таких было аж 9) Быстро для 2003 года собирала, обрабатывала, запаковывала и Анализировала (ассемблер под dos наше всё) Большое количество данных с большого количества фэу после предусилителей. Периодически их сохраняя и делая сторонние манипуляции. Вполне себе работоспособные 4020 были, их тогда даже Nasa рекомендовали, по-моему.


                      1. hhba
                        24.05.2019 09:06

                        Не, я же не говорю, что октагоновские поделки были плохими в своем сегменте, у меня вопрос был скорее в целом к тому, как что-то из того сегмента могло попасть в космос. Совершенно ведь рядовые процессорные модули, ничем особым не выделяющиеся, и носящие звание «для ответственных применений» довольно условно. Лет пятнадцать назад было много статей по применению их изделий в околокосмической тематике (больше всего почему-то запомнилась система сбора данных для транспортера РН, даже не знаю, почему именно она), но я не слышал, чтобы засовывали именно в КА.

                        Накрывали стальным листом толщиной 3 мм


                        Со всех сторон полагаю? Массивная была защита… А почему не более экзотические материалы?


                        1. hooperer
                          24.05.2019 12:38

                          Тут дело в конструктиве.
                          То-есть в гермоотсеке были «крейты». Разработки Института Астрофизики Мифи, разумеется. Из спецсплава, естественно. Не помню точно, но что-то самолётное и лёгкое. С сетками по торцам и в задней стенке. Передняя панель — разъёмы, они в силуминовом листе(порядка 3..5 мм), держащим под 90 градусов плату. И так получилось что только под углом могло что-то «прилететь», там и закрыли. около 550 километров если интересно и 82.5 градуса. Соответственно нам было «не комфортно» не только в Рад. поясах — нас дёргала и Курская магнитная аномалия, и Бразильская, и над Атлантикой. Но с учетом 82.5 понятно что большая часть шла от Солнца потому как вот.

                          И да, мажоритирование было и на octagone и на моих 54sx16 и на сопроцессоре тоже приходилось развлекаться. Но вся соль была в том, что мы ловили частицы с Фэу и можно было проверять блоки памяти Хорошими алгоритмами. Что так же как и мажоритирование даёт дополнительные «бонусы к защите». Которым и сейчас учат там же те же люди, которые закладывали идеи. Соответственно лучше про рад. стойкость к практикам обращаться а не теоретикам. А они — практики — там ещё есть.


                          1. hhba
                            24.05.2019 13:03

                            И так получилось что только под углом могло что-то «прилететь»


                            Да, я потом уже подумал, что вы вероятно вы от Солнца только и защищались.

                            И да, мажоритирование было и на octagone


                            Ммм, на самом модуле? Разве было? ЕМНИП у Октагона на всех модулях и процессоры, и память, и генераторы были одиночные. Скорее вы за счет избыточного количества самих модулей добивались мажоритирования, нет?

                            Соответственно лучше про рад. стойкость к практикам обращаться а не теоретикам


                            Беда в том, что теоретики мало чего толкового пишут, а практики не пишут вообще. Как-то давно надо было побольше почитать про то, как лучше организовать скраббер для памяти в зависимости от ее особенностей, и нашелся в итоге только обрывок какого-то реферата, буквально несколько предложений, относящихся к особенностям работы адресных дешифраторов в SRAM. Ну это так, к слову.


  1. Serge3leo
    22.05.2019 12:42

    … Десять сбоев от одного попадания! От такого код Хэмминга вас не защитит....

    Честно говоря, хорошо известны коды исправляющие последовательности ошибок соседних бит, например, Рида-Соломона. Но естественно, для исправления с контролем пакета 10 бит, придётся добавить где-то 21 бит, соответственно, и слово должно быть не слишком коротким.ш


    1. amartology Автор
      22.05.2019 13:11

      Честно говоря, хорошо известные коды Соломона-Рида ни в коей мере не относятся к базовым понятиям. Именно поэтому они остались за рамками этой статьи.
      Но к слову, гораздо проще сделать так, чтобы соседние физически биты памяти логически были в разных словах, чем городить ECC на 10 ошибок в слове. Или переделать ячейку памяти. Или есть принципиально маленькие, но важные объемы памяти, например, регистровые файлы. Нюансов огромное количество, но у меня не было цели освещать нюансы.


      1. Serge3leo
        22.05.2019 16:36

        гораздо проще сделать так, чтобы соседние физически биты памяти логически были в разных словах, чем городить ECC на 10 ошибок в слове
        Хм. Реализации Рида-Соломона или типа того можно ж тупо подворовать от связистов, из WiFi, флэш-накопителей и многого другого. А вот так что-б любые 10 соседних элементов, и по горизонтали, и по вертикали, и по диагонали, и гуртом, и в линию, оказывались в разных словах?.. Тут зело думать надобно ж ;)


        1. hhba
          22.05.2019 23:55

          Обождите, подворовать — и куда впихнуть? Сейчас люди на уровне схематика/топологии сделали себе DICE-ячейку и раскидали биты по памяти, все это работает само по себе. Вы предлагаете им вместо этого в регистры, в ROB, в кэш всунуть БЧХ? Кое-где конечно это нужно, но не везде же… Умаешься это прозрачно на уровне железа делать.


        1. netch80
          23.05.2019 07:51

          Скорее что-то такого рода (заметьте, это ещё не в космосе, но проблема уже стоит).
          Или вообще дублирование полных компонентов с исключением и перезапуском сбойнувшего. Но в таком варианте всегда вопрос «а судьи кто?» — блок арбитража должен быть тупым как пробка.


          1. amartology Автор
            23.05.2019 09:02

            1) Там решается проблема отказов, а не сбоев. Со сбоями оно ничего не делает. А проблема отказов стоит всегда и везде.
            2) В любой системе всегда будет уязвимое звено, и блок арбитража — не исключение. Поэтому он должен быть не столько тупым, сколько маленьким, чтобы минимизировать вероятность попадания в него.


            1. netch80
              23.05.2019 09:14

              > Там решается проблема отказов, а не сбоев.

              Прошу расшифровать терминологию. Отказ — это постоянный переход в нерабочее состояние? Это не было ясно из исходного сообщения.
              В таком случае такое же управление с исключением нерабочих компонентов вполне пригодно (а если есть запасные — тем более). Я не говорю «оптимально», но пригодно должно быть.
              А против проблемы отключения целого модуля из-за минимального отказа вполне поможет дробление этих модулей (до разумного, конечно).

              > и блок арбитража — не исключение. Поэтому он должен быть не столько тупым, сколько маленьким,

              Эээ… если он маленький, то вероятность попадания, да, ниже, а вот последствия — выше.
              На мой чайниковский взгляд — тут надо было бы сделать на той же технологии хоть миллион логических блоков впараллель, но затем аналоговый сумматор результатов и аналоговое их применение — на технике вплоть до сантиметровых размеров :) Или просто логику на грубых дискретных элементах размерами в миллиметры.

              Понятно, что это взгляд со стороны, и погружённый в это специалист предложит как-то иначе.


              1. amartology Автор
                23.05.2019 10:05

                Отказ — это постоянный переход в нерабочее состояние? Это не было ясно из исходного сообщения
                Исходная ветка комментариев говорит об исправлении при помощи ECC сбоев, а не отказов. Память продолжает работать нормально, но радиация записывает в некоторые биты неверные значения, которые надо найти и исправить.

                хоть миллион логических блоков впараллель, но затем аналоговый сумматор результатов
                … и слабым звеном станет этот аналоговый сумматор. Или следующий за его выходом логический вентиль.

                вероятность попадания, да, ниже, а вот последствия — выше.
                Полностью избавиться от радиационноиндуцированных сбоев нельзя, можно только снизить ожидаемую частоту их появления до некоторого заранее заданного значения. Минимизация размеров критичных узлов — один из приемов, которые позволяет этого добиться.


                1. netch80
                  23.05.2019 10:36

                  > Память продолжает работать нормально, но радиация записывает в некоторые биты неверные значения, которые надо найти и исправить.

                  «Записывает» это в смысле «один раз изменила» или «там повреждение, из-за которого они будут неверными теперь навсегда»? Если один раз — то для RAID есть методы типа «перечитать, исправить и записать начисто».
                  Если навсегда — ну или как вы в соседнем комментарии писали — «размазывать» хранение одного байта/слова по физически далёким участкам (сработает разве что для памяти; для CPU, шинных модулей, логики периферии и т.п. — уже не поможет), или достаточное дублирование, арбитраж, и помечать неисправным целый компонент.

                  > и слабым звеном станет этот аналоговый сумматор. Или следующий за его выходом логический вентиль.

                  А если реле? Мне сложно себе представить, чтобы радиация быстро испортила такой механический логический элемент. Он может остаться одним из самых долгоживущих в этих условиях.

                  > Минимизация размеров критичных узлов — один из приемов, которые позволяет этого добиться.

                  Вот и интересно, почему тут именно минимизация помогает, а не максимизация (при которой даже суперчастица ну выбьет нафиг кусок элемента, но остальное будет работать). Это против очевидной логики, а, значит, какой-то ещё фактор в ней не учитывается.


                  1. amartology Автор
                    23.05.2019 10:49

                    «Записывает» это в смысле «один раз изменила» или «там повреждение, из-за которого они будут неверными теперь навсегда»?
                    Бывает и так, и так, но первое — это сбой, а второе — отказ.
                    Если один раз — то для RAID есть методы типа «перечитать, исправить и записать начисто».
                    Которые и реализуются на гораздо более низком уровне в радстойких микросхемах, и реализуются на высоком уровне в радстойких системах, в том числе на основе нестойких компонентов. Вопрос в частоте сбоев, потере производительности на постоянные перезаписи и т.д. и т.п.

                    или достаточное дублирование, арбитраж, и помечать неисправным целый компонент.
                    Все так и делается. Или даже не дублирование, а троирование с голосованием или троирование плюс четвертая копия в холодном резерве.

                    А если реле?
                    Итак, вам нужно запустить
                    в космос полмиллиарда реле. Ваши действия?
                    По поводу максимизации размеров — та же логика. Рабочие токи в ампер на вентиль, разумеется, помогают от одиночных сбоев, но вы же не можете с каждым кубсатом АЭС вместо солнечных панелей в космос запускать, правда?


        1. amartology Автор
          23.05.2019 09:13

          10 соседних элементов, и по горизонтали, и по вертикали, и по диагонали, и гуртом, и в линию, оказывались в разных словах
          Не любые. В приведенном примере десять сбоев были в строго определенной конфигурации — 2*5, вытянутые по вертикали, а все сбои с кратностью меньше десяти были подмножествами этой конфигурации. И причины такого положения дел были понятны из топологии чипа. Поэтому на практике вместо того, чтобы внедрять коды Рида-Соломона с огромным оверхедом, достаточно просто сделать так, чтобы в физической строке памяти шли не подряд биты одного слова, а по очереди биты двух разных слов. Такая топология (в данном конкретном случае, разумеется) позволяет ограничиться простейшим SECDED Хэммингом для исправления вообще всех ошибок.


  1. Yelin
    22.05.2019 16:46

    Огромное спасибо за великолепную, хорошо построенную, очень познавательную статью в области радстойкости! Подобного уровня посты сразу заставляют рожать новые идеи. Браво автору!!!


  1. hhba
    23.05.2019 00:13

    Автору — огромное спасибо за статью! Еще раз почитал про проблемы КНИ. Думаю, что стоило бы еще упомянуть про толстый отсеченный кремний (про который вы рассказывали), с ним хоть и дополнительные трудности возникают, но по крайней мере снимается аргумент про сниженную пороговую ЛПЭ для regular SOI.

    Будем ждать с нетерпением 2021 года — что там у ESCC и НИИСИ получится на 28 и 65 нм соответственно.