Хотя корпорация Intel отказывается поведать миру, какие именно физические процессы лежат в основе новых чипов, на основании обнародованных данных можно заключить, что истоки 3D XPoint лежат в 1960-х: технология базируется на достижениях американского ученого Стэнфорда Овшинского, зарегистрировавшего за свою жизнь свыше 400 патентов в сфере энергетики и информационных технологий. Его изобретение получило название PRAM (Phase-change memory — память на основе фазового перехода).
Стэнфорд Овшинский, изобретатель PRAM
В отличие от флэш-памяти, для представления двоичных значений PRAM использует бинарные химические соединения халькогенов в аморфном (значение «0») и кристаллическом (значение «1») состояниях. Физической основой такого подхода является кардинальное различие электрического сопротивления халькогенидов, зависящее от агрегатного состояния вещества, тогда как флэш-память работает благодаря изменению заряда на плавающем затворе. В зависимости от уровня последнего меняется и пороговое напряжение транзистора, становясь выше или ниже и кодируя таким образом 1 или 0. Для записи иного значения необходимо инициировать сброс накопленного заряда, однако, чтобы «оттянуть» электроны с плавающего затвора, требуется сравнительно высокое напряжение, которое, в свою очередь, достигается за счет процесса подкачки. Поскольку накопление энергии требует определенного времени, флэш-память получается довольно «медлительной»: в сравнении с той же SRAM время считывания блока данных оказывается выше практически в 100 тысяч раз. PRAM же, напротив, лишена этого недостатка, так как значения отдельных битов можно изменять без предварительного стирания информации.
Именно PRAM и легла в основу 3D XPoint. Как ясно из названия (XPoint следует читать как crosspoint, что в переводе означает «пересечение»), кристаллы памяти нового образца получили перекрестную структуру.
Структура 3D XPoint
Пара «селектор — ячейка памяти» располагается в точке пересечения перпендикулярных проводников. Селектор активируется при подаче напряжения определенной величины, при этом агрегатное состояние вещества в ячейке изменяется и происходит запись бита. Поскольку адресация происходит без участия транзисторов, это позволило существенно уменьшить площадь кристалла, повысив плотность хранения данных: согласно заявлениям разработчиков, по сравнению с DRAM выигрыш составляет от 4 до 10 раз.
Первое поколение чипов 3D XPoint выполняется по 20-нанометровому техпроцессу, а сами микросхемы являются двухслойными. С переходом на EUV-литографию появится возможность усложнения производства до 10 нм, причем структура будет расти в трех измерениях, что поможет значительно увеличить емкость чипов, а также в разы ускорить процесс чтения/записи. Существует и перспектива хранения двух битов в одной ячейке за счет использования пограничных состояний вещества, каждое из которых обладает собственными электрическими характеристиками. Такие исследования уже проводились Intel и ST Microelectronics, хотя до их реализации в коммерческих продуктах пока еще далеко.
Несмотря на все преимущества, энергонезависимая память PRAM, к семейству которой также относится 3D XPoint, имеет и слабые места. Среди них следует акцентировать внимание на непосредственном контакте области фазового перехода и диэлектрика, что со временем способно привести к отслоению последнего и спровоцировать утечку заряда. Другим нюансом является возрастание сопротивления халькогенидов, которое описывается степенным законом ~t^0,1. В многоуровневых структурах это может приводить к перемешиванию ниже- и вышележащих слоев вещества в промежуточном состоянии, что делает чипы чувствительными к малейшим отклонениям от пороговых значений напряжения. Очевидно, Intel удалось решить указанные проблемы, сделав кристалл более стабильным, однако подробности технологии не раскрываются.
Intel Optane SSD DC P4800X — первый коммерческий накопитель на 3D XPoint
Все перечисленное выше выглядит очень вкусно, однако понять, насколько 3D XPoint хороша в реальных сценариях, можно лишь при наличии в руках готовых устройств. И таковые уже существуют: 20 марта 2017 года корпорация Intel представила линейку накопителей на основе инновационной памяти, получивших название Optane SSD DC P4800X формата PCI Express HHHL. Устройства используют 128-гигабитные 20-нанометровые чипы 3D XPoint, имеют объем 375 или 750 ГБ и снабжены контроллером Intel NVMe ASIC, который способен управлять четырьмя кристаллами на одном канале одновременно, что обеспечивает феноменальные показатели: при обработке блоков 4 КБ производительность девайса достигает 550 000 IOPS при чтении и 500 000 IOPS при записи, причем задержка не превышает 10 мкс. Максимальная же скорость последовательного считывания достигает 2400 МБ/с, а записи — 2000 МБ/с. Ресурс Optane также достаточно высок: Intel декларирует порядка 12,3 ПБ перезаписи.
Intel Optane SSD DC P4800X
Впечатляет? Бесспорно! Но не спешите оформлять заказы: рекомендованная цена Optane составляет 1520 американских долларов, по состоянию же на февраль 2018 года стоимость накопителя в России варьируется от 106 до 118 тысяч рублей. Все это напоминает выпуск Axlon RAM Disk для Apple II, который оказался на добрую сотню баксов дороже самого компьютера (об этом и других интересных девайсах мы писали в статье «Эволюция твердотельных накопителей: от первых моделей 70-х до наших дней»), с той лишь разницей, что детище Intel ориентировано на корпоративный сектор и наукоемкие отрасли, где скорость обработки информации выходит на передний план.
Существуют ли решения потребительского класса на основе 3D XPoint? Да. Продукт получил название Intel Optane Memory и выпускается в двух вариантах: на 16 ГБ (средняя цена — около 3200 рублей) и 32 ГБ (5100 рублей). Оба накопителя представляют собой NVMe SSD, выполненные в форм-факторе M.2 2280-S3-B-M, и характеризуются следующими параметрами:
Объем, ГБ |
32 |
16 |
Скорость последовательного чтения, МБ/с |
1350 |
900 |
Скорость последовательной записи, МБ/с |
290 |
145 |
Скорость случайного чтения, IOPS |
240 000 |
190 000 |
Скорость случайной записи, IOPS |
65 000 |
35 000 |
Показатели (как и стоимость одного гигабайта) не радуют, однако Intel Optane Memory позиционируется вовсе не как полноценный твердотельный накопитель, а как этакий «ускоритель HDD», к тому же — не для всех. Процессор седьмого поколения или более старший, чипсет Intel 200 Series или более новый, BIOS c UEFI-драйвером RST 15.5 или выше, Windows 10. Собрали платформу на Ryzen, до сих пор сидите на Core i7 2700 или являетесь поклонником Linux? В таком случае эта технология не для вас. И даже если ваша машина полностью соответствует перечисленным требованиям, не стоит торопиться с покупкой.
В связи с малым объемом и особенностями работы алгоритма кэширования, сколь-нибудь заметное ускорение устройство способно обеспечить лишь при загрузке операционной системы и использовании какого-то фиксированного набора приложений. В то же время контентмейкеры попросту не заметят прироста производительности, так как Intel Optane Memory игнорирует операции с мультимедийными файлами (драйвер проверяет расширения) в силу ограниченной емкости. Установка и обновление программ также будут осуществляться с прежней скоростью, ведь в кэш отправляются исполняемые файлы, к которым было хотя бы три последовательных обращения, а инсталляторы запускаются единожды. Придется ли по вкусу данное решение заядлым геймерам? С учетом того, что доступное пространство раз в пять меньше по сравнению с «весом» современных ААА-игр, ответ очевиден.
Впрочем, если опять же обратиться к истории, аналогичная ситуация наблюдалась с флэш-памятью, когда первый розничный продукт (флэшка IBM DiskOneKey) вышел только 10 лет спустя после появления технологии. Быть может, нечто подобное произойдет с 3D Xpoint: через какое-то время себестоимость чипов снизится и любой желающий сможет приобрести модель уровня DC P4800X по адекватной цене?
Слишком сложно и слишком дорого
Цены новых устройств прокомментировал Гай Блелок, директор компании IM Flash (совместное предприятие, основанное Intel и Micron в 2006 году), дав интервью известному отраслевому изданию EE Times. По его словам, в ближайшем будущем полноценных накопителей потребительского класса, использующих память 3D XPoint, ждать точно не стоит, а может быть, таковые и вовсе никогда не появятся.
Гай Блелок, директор компании IM Flash
На то есть целый ряд вполне объективных причин. Одна из них заключается в том, что для создания новых чипов необходимо свыше 100 наименований сырья, причем некоторые позиции настолько уникальны, что выпускаются одной-единственной компанией в мире. Это, в свою очередь, порождает проблемы с привлечением инвестиций. «Для многих инвесторов такое положение дел является неприемлемым — они хотят быть уверены в бесперебойности поставок на случай форс-мажора», — рассказал Блелок.
Другая проблема обусловлена особенностями технологического процесса. Выпуск 3D XPoint требует дополнительных шагов в производственной цепочке, так как перекрестная архитектура увеличивает риски взаимного загрязнения материалов, входящих в состав ячеек. Добавляются такие сложные этапы, как вакуумное осаждение и выпаривание, что влечет за собой существенное снижение производительности фабрик, а это уже отражается на себестоимости готовых устройств. Хотя компенсировать сокращение объемов продукции и можно, удовольствие это чрезвычайно дорогое даже для такой крупной корпорации, как Intel.
По предварительным расчетам, число выпускаемых пластин потребуется увеличить со 180 до 1000 в час на условные 2 квадратных метра площади. Учитывая, что на данном витке развития технологий повысить плотность производства практически невозможно, для пятикратного увеличения мощностей и сам завод придется расширить по меньшей мере в 5 раз, что повлечет за собой серьезные капитальные расходы. Самое же неприятное — то, что дальнейший переход на 3D XPoint второго и третьего поколений потребует сопоставимых вложений. И здесь становятся очевидными преимущества памяти 3D NAND, в случае с которой смена техпроцесса приводит к росту затрат лишь в пределах 20–30%.
Сравнение затрат на модернизацию производства 3D NAND и 3D XPoint
Помимо этого, Гай Блелок отметил, что 3D XPoint чрезвычайно сложно масштабировать. Теоретически возможно создание даже четырехслойных чипов, однако для их массового выпуска необходимы EUV-сканеры экстремальной ультрафиолетовой литографии, коммерческих версий которых попросту не существует. Все перечисленное — серьезные сдерживающие факторы для дальнейшей эволюции технологии, так что в ближайшей перспективе мечтать о том, чтобы цена накопителей 3D XPoint снизилась до приемлемого уровня, увы, не приходится.
Есть и еще один нюанс, на который обратил внимание далеко не каждый. В настоящее время гарантийный срок новых Optane составляет 3 года, однако в будущем корпорация обещает увеличить его до 5 лет. Как правило, столь существенный разброс свидетельствует об отсутствии достаточных статистических данных, на основании которых можно судить о частоте возникновения неполадок или полном отказе оборудования. А это может означать только одно: говорить о надежности и отказоустойчивости накопителей 3D XPoint пока еще рано, и показатель 12,3 PBW на практике способен оказаться значительно меньше.
3D NAND — оптимальное сочетание цены и производительности
К счастью, хоронить классическую NAND еще рановато, ведь на смену планарным чипам пришли вертикальные трехмерные, причем их появление было обусловлено не только необходимостью удовлетворения растущих потребностей IT, но и экономической целесообразностью. Перейдя на 14-нанометровый технологический процесс, производители флэш-памяти встали на распутье. Повышение плотности кристалла потребовало бы полной модернизации производства, поэтому куда рентабельнее оказались инвестиции в дальнейшие научные изыскания, результатом которых и стало создание многослойных микросхем.
Напомним, что в основе NAND-памяти лежат транзисторы с плавающим затвором, способные удерживать заряд в течение длительного времени. Уменьшение их размеров чревато утечками из одной ячейки в другую, что может повлечь за собой повреждение сохраненных данных. Аналогичная проблема возникает и при попытке построения трехмерных кластеров, однако решить ее оказывается значительно проще: достаточно создать изолированную область из непроводящего вещества, где и будет храниться заряд. Технология получила название CTF (Charge Trap Flash — «ловушка для заряда»), а в качестве материала для изолирующего слоя стал использоваться нитрид кремния (SiN).
Устройство CTF
В отличие от планарных чипов, в 3D NAND каждая ячейка представлена многослойным цилиндром. Его внешний слой является не чем иным, как управляющим затвором, внутренний же — изолятором. Помещенные друг на друга ячейки образуют стек, по оси которого проходит общий канал из поликристаллического кремния. Таким образом, число ячеек в стеке оказывается равным количеству слоев в кристалле.
Принцип устройства ячеек в 3D NAND
Такая архитектура обеспечивает целый ряд важнейших преимуществ:
- За счет увеличения числа ячеек на единицу площади повышается плотность хранения данных и, как следствие, появляется возможность создания более емких накопителей.
- Скорость чтения/записи удается существенно повысить, так как интерференция между ячейками практически отсутствует. Благодаря этому, при сохранении и считывании данных выполняется только одна операция вместо трех (отпадает необходимость в дополнительной проверке).
- 3D NAND служит значительно дольше, так как запись не требует высокого напряжения.
Усилиями компании SanDisk, в настоящее время принадлежащей Western Digital, технология 3D NAND получила дальнейшее развитие. Принцип ее устройства остался прежним, однако на смену линейным строкам пришли U-образные. При этом переключающий транзистор и линия истока оказались перемещены в верхнюю часть последовательности, что позволило исключить вероятность их повреждения под воздействием высоких температур и, таким образом, снизить количество ошибок в ходе операций чтения/записи.
Схема 3D NAND BiCS
Новое поколение 3D NAND получило название BiCS, что расшифровывается как Bit Cost Scalable, и такое название оказалось вполне оправданным. Ведь данная технология позволила создавать высокоемкие 64-слойные чипы на базе отлаженного 40-нанометрового производства, благодаря чему отпала необходимость в дорогостоящей фотолитографии в глубоком ультрафиолете (EUV).
3D NAND BiCS легла в основу доступных и производительных решений, ориентированных на частного потребителя. Еще августе 2017 года Western Digital перешла на производство твердотельных SATA-накопителей, основанных на трехмерных чипах последнего поколения, и теперь мы рады предложить своим клиентам обновленную линейку SSD Blue. Хотя 3D NAND BiCS оказывается медленнее 3D XPoint, по соотношению цены и качества данное предложение является лучшим на рынке. Цифры, приведенные ниже, говорят сами за себя.
Серия |
WD Blue SSD |
|||
Форм-фактор |
2,5?, 7 мм / M.2 2280 |
|||
Интерфейс |
SATA 6 Гбит/с |
|||
Емкость |
250 ГБ |
500 ГБ |
1 ТБ |
2 ТБ |
Скорость последовательного чтения, МБ/с |
До 560 |
|||
Скорость последовательной записи, МБ/с |
До 540 |
|||
Скорость произвольного чтения (блоки по 4 КБ), IOPS |
До 95 000 |
|||
Скорость произвольной записи (блоки по 4 КБ), IOPS |
До 85 000 |
|||
TBW, ТБ |
До 500 |
|||
MTTF, млн ч |
До 1,75 |
Широкий модельный ряд позволяет подобрать вариант, всецело отвечающий вашим потребностям. Тем, кто желает повысить быстродействие компьютера, вполне хватит SSD на 250 ГБ, способного вместить операционную систему и установленное программное обеспечение. Если же вы являетесь контентмейкером и вам важна не только скорость, но и доступный объем, рекомендуем обратить внимание на флагман Blue-серии емкостью 2 ТБ. Что же касается отказоустойчивости, то даже при ежедневной нагрузке до 80 ГБ перезаписи накопители исправно проработают как минимум 7 лет — рекордный показатель для устройств подобного класса.
Для тех, кто не терпит компромиссов и хочет выжать максимум из собственного ПК или ноутбука, мы подготовили высокоскоростные WD Black SSD на основе планарных чипов, производительность которых удалось существенно увеличить за счет использования интерфейса PCIe Gen3 NVMe с пропускной способностью 8 Гбит/с. В подавляющем большинстве высоконагруженных сценариев (3D-моделирование, кодирование видео, «тяжелые» видеоигры и VR) потенциала WD Black оказывается более чем достаточно: SSD демонстрируют стабильную скорость 2050 МБ/с при последовательном чтении и 800 МБ/с при последовательной записи, а также до 170 000 IOPS при произвольном чтении и до 130 000 IOPS при произвольной записи (блоки по 4 КБ). Накопители выпускаются в двух модификациях: на 256 и 512 ГБ.
Вместо заключения
На данный момент все еще рано говорить о полном переосмыслении подхода к созданию твердотельных накопителей. Напротив, наблюдаются предпосылки к сегментации рынка: если 3D XPoint может доминировать в корпоративном секторе, то 3D NAND уверенно осваивает розницу. Вследствие высокой дороговизны решений, основанных на потомке PRAM, о каком-либо противостоянии не может идти и речи, тем более что подобная производительность является избыточной для большинства бытовых и профессиональных задач, а значит, с учетом цены, конечный пользователь не получает каких-либо значимых преимуществ. Скорее всего, обе технологии будут развиваться параллельно, не конкурируя между собой до тех пор, пока в недрах исследовательских лабораторий не появится нечто принципиально новое. Но когда произойдет очередной прорыв, можно лишь гадать.
Комментарии (8)
CasualLinux
28.02.2018 07:35Я правильно понял, что 3D XPoint супер-пупер накопитель для корпоративного сегмента не работающий только под win10? То есть они забили на суперкомпьютеры и серверы. Кому они вообще ее собираются продавать?
Laney1
28.02.2018 12:28ограничения "win10 и новый чипсет" относятся только к Optane Memory в режиме кэширующего ускорителя HDD. Во всех остальных случаях (на других чипсетах, в других ОС) им можно пользоваться как обычным жестким диском.
TrllServ
Очень корректно написана статья.
Но я не вижу особых преимуществ у «3D XPoint» перед «NAND» или «3D NAND» при сравнении в относительно равных условиях.
Например, если взять не особо передовой «hyper X» на 480Gb ваших коллег (кстати, очень жду ваш аналог) и сравнить основные показатели, за которые ценят ссд это почти синхронные чтение/запись(в Mbps) 1400/1000 против асинхронных 1350/290, и в 4k случайное чтение/запись (в kIOPS) 130/118 против 240/65, так же сохраняется асинхронность. Особо обращаю на это внимание, потому как скорость записи важна — в большинстве операций домашнего/офисного использования.
Усугубляет ситуацию не очень продуманный алгоритм кеширования, из-за которого при реальных тестах Optane на 32 Gb, отличий замечено не было при системе i5-8400, 16Gb ddr4.
PS: Возможно при возможности ручной настройки, что именно и как кешировать, результаты были бы иными, но несравнимы с поным переходом на указанный накопитель или использование его как кеш диск.
speshuric
Из тех обзоров и тестов, что я видел (phoronix, thg, если я не ошибся в ссылках), ключевое преимущество в том, скорости на небольших блоках и глубине очереди 1-2 не зависят от кеширований накопителя и очень-очень достойные, сравнимы со скоростью записи в кеш на SSD. Это на самом деле очень важное достижение для некоторых профилей OLTP-нагрузки. Это тот самый профиль, который СУБД "ненавидит". Сейчас эта проблема на крупных и дорогих СХД более-менее решена огромными (относительно) объёмами кеширования и бесперебойным питанием этой памяти, фактически, чтобы write through(который используется во всяких write ahead log и transaction log) работал как write-back.
Отчасти эту же проблему пытаются решить всевозможные in-memory OLTP (но там, правда, еще парочку жирных коряг убирают).
И современные СХД, и современные enterprise СУБД — всё это вообще никак не дёшево. Если Optane позволит не покупать пару лицух СУБД, или позволит сэкономить на хранилищах, или позволит не переписывать еще пару лет legacy-приложение, то он очень быстро войдёт в датацентры.
И, да, производителю SSD для домашнего пользователя сейчас (и в обозримой перспективе) проще поставить лишний dram-кэш, который сгладит все эти Q1-Q2 доступы.
PS: тоже обратил внимание, что для корпоративного блога очень корректная статья.
TrllServ
Верно описано в целом, но вся проблема заключается в «не очень продуманный алгоритм кеширования» при том, что именно это устройство позиционируется как SOHO.
Возможно это не очевидно из моего предыдущего комментария — устройство могут успешно применять специалисты, которые понимают устройство «дисковой» и кеширующей подсистемы железа и софта. Но ни один из таких сценариев не описан интел. И не работает «из коробки».
Серверный вариант имеет привлекательные параметры, но цена кусается — применение оправдано, когда устройство должно быть относительно компактным. Иначе несколько серверных же ссд предпочтительнее.
speshuric
Согласен, эти мелкие "оптаны" вышли непоймизачем:
PS: ссылку на phoronix я случайно не ту вставил.
TrllServ
Спасибо за ссылки. Очень интересные материалы. По непонятной причине 900P для меня открытие, хотя подписан на множество профильных ресурсов. И это действительно неплохой шаг для интел, по сравнению с предыдущей версией.
Чисто технически это хорошо, и это альтернативное развитие ссд.
Однако доверяя лишь голым цифрам, не очень понимаю восторга статьи на THG. В большинстве их пользовательских тестов преимущество 900Р колеблется между 10-15% от nand конкурентов, что не может давать «вау» эффекта.
PS:
Мы делали ещё один тест, который мало где встретишь. Реальные ощущения среднего пользователя на сборку рабочей станции.
Замену HDD на хороший SSD замечают все, причем практически сразу т.е. не требуется долгого пользования. Переход с SATA3 на NVMe, замечают уже менее половины, даже после длительного. А вот переход на скорости более 1000-1200Mbs т.е. разницу между накопителями 1Gbs и 2Gbs при IOPS более 50k уже не заметил ни кто, при реальном использовании.
speshuric
Капитан Очевидность тут рядом подсказывает: Мало замечают, потому что больше рулят не байты в секунду, а задержки. Понятно, что если задержки с 10-100 мс (HDD) падают до 0,5-2 (нормальный SSD), то это заметно. А дальше уже только в экстремальных случаях.
На самом деле в энтерпрайзе до "не замечают" еще очень далеко, но "внезапно" узкими местами становится то, что казалось мгновенным.