Летом 2021 года был представлен новый стандарт NVM Express 2.0 (NVMe 2.0). Изначально NVMe был разработан для твердотельных накопителей и сетей хранения данных, но в последней версии добавлена полноценная поддержка жестких дисков. Конечно, возникает логичный вопрос: зачем? Но обо всем по порядку.

Добавление поддержки жестких дисков — одно из самых крупных новшеств NVMe 2.0, которое удивило многих пользователей. Современные жесткие диски используют интерфейс SATA 3.0 с теоретической пропускной способностью 6 Гбит/с, которой вполне хватает. Конечно, жесткие диски продолжают эволюционировать, рано или поздно пропускная способность превысит возможности SATA 3.0. Например, Seagate анонсировала жесткие диски Mach.2 с двойным приводом, которые вплотную подбираются к уровню 6 Гбит/с. Емкость HDD достигла отметки 20 Тбайт, причем рост продолжится, поскольку дата-центрам нужны все большие объемы. Для подобных HDD увеличение пропускной способности неизбежно, чтобы копирование тех же 20 Тбайт не длилось вечность.

Но и в таком случае можно было просто доработать стандарт SATA до 12 Гбит/с, как это произошло со стандартом SAS. Почему консорциум производителей решил поставить точку на SATA и перейти на PCI Express и NVMe 2.0 даже для жестких дисков?

Основным стимулом добавления поддержки NVMe для жестких дисков является упрощение экосистемы. Тем более спецификация NVMe будет эволюционировать в сторону NVMeoF (NVME over Fabrics), в результате к жестким дискам можно будет обеспечить сетевой доступ без дополнительных уровней абстракции. Подсистема NVMe HDD будет напрямую поддерживаться современными и гибкими инфраструктурными решениями с открытым исходным кодом, например, Kubernetes. Конечно, можно будет использовать такие API, как Redfish.

Жесткие диски NVMe 2.0 можно назвать явным сигналом постепенного ухода протокола SATA с рынка, поскольку он не обновлялся уже 12 лет. Избавление от SATA и переход всех жестких дисков на NVMe позволит освободить место на материнских платах и упростит подключение накопителей только NVMe (по крайней мере, на потребительском сегменте). Но не следует ожидать, что это случится в ближайшее время. Вспомните, как долго производители устанавливали интерфейс IDE на материнские платы параллельно с SATA. Да и NVMe HDD пока не появились на розничном рынке. И раньше 2025 года их вряд ли можно ожидать.

Основные функции NVMe 2.0

Ниже мы приведем основные функции стандарта NVMe 2.0. В целом, они направлены на снижение информации избыточности NVMe, а также на более глубокие возможности управления SSD со стороны хост-системы.

Zoned Namespaces (ZNS) в стандарте NVMe 2.0 позволит SSD и хост-системе договариваться о физическом расположении данных на накопителе. ZNS позволит учитывать физические особенности SSD при размещении данных, что улучшит системную производительность в целом, а также увеличит емкость (+20%). Можно ожидать снижения избыточной записи (4-5x), уменьшения задержек ввода/вывода. С преимуществами ZNS можно ознакомиться здесь.

NVMe Key-Value Command Set позволяет использовать ключи для доступа к данным на NVMe SSD вместо логических адресов блоков (LBA). Переход с LBA на ключи позволит уменьшить избыточность, поскольку SSD не придется работать с таблицей трансляции LBA.

Rotational Media Support — здесь как раз подразумевается поддержка жестких дисков. Все функции NVMe обновлены с учетом требований поддержки HDD.

NVMe Endurance Group Management — накопители поддерживают распределение по группам (Endurance Groups, NVMe Sets). Для каждой группы можно выбрать, например, хранение разного числа битов на ячейку, что сказывается на плотности записи данных и скорости записи. Группы позволяют лучше адаптироваться к разным сценариям: хранилища с низкими задержками небольшой емкости или хранилища значительной емкости, но с высокими задержками. Подробнее о группах можно узнать здесь.

Конечно, NVMe 2.0 будет обратно совместим с предыдущими стандартами NVMe. В результате NVMe 2.0 SSD/HDD можно будет подключать к нынешним материнским платам со слотами M.2 или к картам M.2.

Seagate демонстрирует первый жесткий диск NVMe

Seagate на конференции Open Compute Project Summit 2021 показала первый жесткий диск, подключенный к хост-системе по интерфейсу PCIe. Подобно твердотельным накопителям, жесткий диск опирался на протокол NVMe. Конечно, использование одного протокола для различных типов накопителей существенно упростит инфраструктуру дата-центров.

Экспериментальный HDD использовал проприетарный контроллер Seagate, поддерживающий три основных протокола SAS, SATA и NVMe в виде «родного порта NVMe» без каких-либо мостов. Работа HDD была показана в корпусе 2U JBOD с довольно простым коммутатором PCIe, к которому через интерфейс PCIe были подключены 12 3,5-дюймовых жестких дисков.

Конечно, современные HDD вряд ли могут нагрузить даже один канал PCIe 2.0, но будущие HDD с несколькими приводами обещают намного большую пропускную способность. И в какой-то момент 6 Гбит/с, которые обеспечивает SATA, или 12 Гбит/с SAS окажутся недостаточными. Индустрии следует заблаговременно озаботиться поиском интерфейса для подключения HDD в будущем, и вариант PCIe/NVMe кажется вполне логичным. Кроме того, SSD отвоевывают себе место в дата-центрах, протокол NVMe начинает преобладать, поэтому поддержку этого протокола на HDD можно только приветствовать. Все сказанное как раз и привело к тому, что будущие жесткие диски обзаведутся поддержкой NVMe 2.0.

Не стоит забывать, что использование одного физического интерфейса и логического протокола для HDD и SSD упростит аппаратную и программную инфраструктуру дата-центров, ускорит разработку соответствующих решений, облегчит масштабирование и снизит себестоимость владения TCO.

Как мы отмечали, не стоит ожидать, что жесткие диски с подключением PCIe через NVMe появятся уже завтра. Seagate планирует начать поставки первых комплектов для разработки (EDU) жестких дисков PCIe/NVMe своим клиентам не раньше сентября 2022. А тестовые образцы (CTU) появятся не раньше 2024 года. Причем тестовые образцы будут поставляться крупным корпоративным клиентам для оценки перспектив использования, в рознице HDD NVMe не появятся даже в 2024 году. Пока что Seagate позиционирует PCIe/NVMe HDD только на дата-центры. Хотя и персональные компьютеры не мешает перевести на новый протокол, что тоже упростит инфраструктуру и повысит производительность. Но здесь все же речь идет о долгосрочных перспективах.

Заключение

Добавление поддержки жестких дисков в спецификацию NVMe 2.0 удивило многих. Все же современные HDD не преодолевают планку интерфейса SATA 6 Гбит/с. Но причина кроется отнюдь не в пропускной способности интерфейса. Протокол SATA постепенно устаревает и становится "неудобным", если можно так выразиться. Поэтому индустрия заблаговременно продумывает переход на более современные варианты интерфейсов, которые справятся с потребностями инфраструктуры хранения данных в будущем.

Вполне логичным интерфейсом здесь кажется NVMe с физическим подключением PCIe, поскольку он уже хорошо зарекомендовал себя для SSD. Единый интерфейс упростит инфраструктуру дата-центров, облегчит масштабирование, снизит себестоимость владения TCO. Поддержка NVMeoF (NVME over Fabrics) открывает дальнейшие перспективы доступа к массивам жестких дисков в сетях хранения данных, как и прямая интеграция в экосистему Kubernetes или поддержка современных API Redfish.

NVMe HDD появятся не раньше 2024 года, причем только в корпоративном сегменте. Позднее можно ожидать переход и на настольный сегмент. Как нам кажется, первые настольные Seagate PCIe/NVMe выйдут тогда, когда емкость достигнет 30-40 Тбайт, число приводов увеличится до двух, а технология HAMR будет распространена повсеместно.

Комментарии (25)


  1. staticmain
    12.01.2022 21:10
    +2

    в результате к жестким дискам можно будет обеспечить сетевой доступ без дополнительных уровней абстракции

    С учетом существования Intel ME, AMD PSP наличие доступа к данным жесткого диска в обход ОС в сеть звучит максимально небезопасно.


    1. creker
      12.01.2022 21:36
      +5

      Почему? iscsi торчит в сеть и никого это не волнует. Чего вдруг тут это станет проблемой?


    1. edo1h
      12.01.2022 21:36
      +2

      речь не про то, что можно не загружая операционку прочитать содержимое диска, а про оффлоад части протокола nvmeof для снижения задержек/увеличения пропускной способности.


      домашних пользователей это никак не затронет (во всяком случае я не слышал ничего о планах внедрения nvmeof за пределами датацентров)


  1. Nurked
    12.01.2022 23:44
    +2

    Кстати, дорогие Seagate, а вы не подскажете, как можно получить доступ к драйверу NVME 2.0? Я его как не ищу, найти не могу. Или всё это только закрыто-проприетарные разработки?


  1. ifap
    12.01.2022 23:50
    +1

    Вспомните, как долго производители устанавливали интерфейс IDE на материнские платы параллельно с SATA.

    А вспомните как долго производители приводов продолжали совать ATA даже в новые модели? Я вот помню писк восторга ЕМНИП на "Хоботе": сегодня на обзор попал один из первых "резаков" с настоящим SATA, а не те же яйца, вид в профиль PATA, к которому присобачен SATA-разъем.


    1. woddy
      14.01.2022 02:13

      А в чем разница? для приводов скорости ATA хватает, чипы дешевле старые ставить чем новые разрабатывать


      1. ifap
        14.01.2022 11:42

        Дык вопрос был: почему на мамках еще долго были ATA разъемы.


  1. izogfif
    13.01.2022 09:23

    Единый интерфейс упростит инфраструктуру дата-центров

    Кто-нибудь может это прокомментировать? В инфраструктуре дата-центров прям какие-то особые затраты закладываются на то, что "вот эти накопители будем подключать по SATA, а не по PCI-Express, а поэтому [куча каких-то действий / приспособлений, которые бы в случае подключения по PCI-Express не потребовались, т.е. вот вообще не потребовались, а не были заменены на специальные PCI-Express-приспособления]"?


    1. SlyFoxMan
      13.01.2022 10:22
      +1

      Скорее всего тут имеется ввиду т.н компануемая инфраструктура. Если кратко и грубо говоря, то есть общая высокоскростная фабрика (eth 100G/200G/400G), в которую подключены вычислительные узлы и ресурсы хранения, ресурсы хранения представляют собой EBOF'ы и EBOD'ы (как JBOD'ы, только отдают накопители наружу через NVMe over Fabric) и это все управляется через SDN и SDS.

      Пример EBOF'a это например OpenFlex от Western Digital.


    1. creker
      13.01.2022 12:03

      Разные интерфейсы это ведь не просто кабель другой. Речь обо всей экосистеме. SAS, SATA и PCIe требуют совершенно разных инструментов для обслуживания инфраструктуры. Другие утилиты, другие драйверы, другие протоколы, другие бекплейны. Все разное и порой несовместимое. Зачем это нужно людям. Лучше они переведут все на nvme, где у них будет единый набор спек для железа, программных протоколов, бекплейнов, менеджмента и всего всего.


    1. Am0ralist
      15.01.2022 10:25

      Унификация же ж. В том числе для построения железок в будущем. А не так, что закладывай столько то псие, столько то сата, столько то u2 и т.п.
      А с учётом, что NVME там вообще позволяет подобное как протокол, то логичнее именно что перейти на новый более современный стандарт, а не тянуть три-пять разных (сата и сас, псие, u2...)


  1. casuss
    13.01.2022 10:55
    +1

    А в ленточные накопители завезут NVME? ))


    1. Sky550
      13.01.2022 13:09

      Пока их SAS устраивает. Может LTO11 или 12 будет на NVME.


  1. myc
    14.01.2022 01:01

    Странно. SSD стремительно дешевеют. При том догоняют HDD по объему. Вангую, что будет как с SATA CDROM — вроде как логичный ход, но уже нафиг не нужен из-за отсутсвия в обиходе носителей.


    1. aleks_raiden
      14.01.2022 23:42

      да как-то не особо догоняют. Не вижу дешевых 17Тб SSD вокруг ) а дисков полно 15+ Тб, у самого в домашней системе 2 х 17Tb


      1. myc
        15.01.2022 02:21

        Судя по трендам, через 3-5 лет ssd обгонят hdd по размеру при соизмеримой цене.


        1. Am0ralist
          15.01.2022 10:26

          Они уже столько лет догоняют, что судя по трендам — не особо то.


          1. edo1h
            15.01.2022 14:15

            зашёл на сайт одного магазина, hdd на 16 ТБ стоит 30к, ssd на 4 ТБ начинаются тоже от 30к. то есть цена за гигабайт различается в 4 раза.
            не сказать, что это мало, но разница в производительности слишком велика, так что уже сейчас применение hdd осмысленно только в немногих задачах вроде резервного копирования.


            1. Am0ralist
              15.01.2022 14:58

              Допустим вам нужно зеркало на 16 тб. Два диска или 8 дисков предпочтёте подключать, с учётом, что в первом случае у вас на большинстве материнок ещё куча разъёмов будет, а во втором — уже не во все впихнёшь? И вот чем больше объем нужно получить, тем серьёзнее вопрос. Да, конечно, можно дисковую полку на 96 набить ссдшками, только насколько больше таких полок придётся ставить, чтоб догнать HDD? Или по какой цене выйдет?
              Вот 16 тб на екаталоге от 25к, за 30 — уже и 18 тб есть.
              А SSDPE2NV153T801 — 200к. Уже в 8 раз цена разница, а там QLC ж, то бишь не для скоростей, а для хранения…

              Так-то и жесткие будут цену за гигабайт в дальнейшем ронять.

              Поэтому пока что скорость и объем — перпендикулярные оси.

              так что уже сейчас применение hdd осмысленно только в немногих задачах вроде резервного копирования.
              А ещё системах хранения информации. Вообще. Для бекапов холодных вообще ленты осмысленнее, если что)))


              1. edo1h
                15.01.2022 15:24

                Допустим вам нужно зеркало на 16 тб. Два диска или 8 дисков предпочтёте подключать, с учётом, что в первом случае у вас на большинстве материнок ещё куча разъёмов будет, а во втором — уже не во все впихнёшь?

                я предпочту raid 6 на 6 дисках соответственно. или, быть может, даже raid 5. разница в цене за гигабайт ещё немного уменьшится.


                ну и надо понимать, что большие объёмы сегодня это почти полностью прерогатива серверных систем. там нет проблем с количеством портов )


                Уже в 8 раз цена разница, а там QLC ж, то бишь не для скоростей, а для хранения…

                ну это серверный накопитель. да и intel — не самый дешёвый бренд.


                а там QLC ж, то бишь не для скоростей, а для хранения…

                ой, да ладно вам. приведите нагрузку, в которой этот qlc будет медленнее hdd )))


                Compared to Intel's 7.68TB P4320, the larger P4326 drives have improved random read and sequential write performance, while sequential read performance is unchanged and steady-state random write speeds fall significantly to just 11k IOPS.


                Так-то и жесткие будут цену за гигабайт в дальнейшем ронять.

                разумеется, будут. но наверняка ssd будут ронять быстрее.


                1. Am0ralist
                  15.01.2022 15:40

                  я предпочту raid 6 на 6 дисках соответственно. или, быть может, даже raid 5. разница в цене за гигабайт ещё немного уменьшится.
                  скажем так, и как часто у вас рейды 5-6 успешно пересобирались при поломке одного диска? А что мешает собрать 5-6 рейд на hdd и так же уменьшить цену за гигабайт рейда?
                  ну это серверный накопитель. да и intel — не самый дешёвый бренд.
                  Не поверите, других такого объема просто не было)
                  Объем же на юнит тоже вполне себе метрика.
                  ой, да ладно вам.
                  Ну ведь по факту, qlc — медленнее и ненадёжнее, чем нормальные ссд… а ценник — я лично сам ох… нел.
                  разумеется, будут. но наверняка ssd будут ронять быстрее.
                  не уверен, ибо заводы ещё строить и строить, новые нормы осваивать, а при этом надёжность будет только падать…
                  Уж ж были случаи, что при отключении годовом ссд стирались. Уже ж прошивки правили, чтоб при неотключении годовом холодные данные не терялись (то есть изредка по сути перезаписывал контроллер заново данные).
                  Ну в общем, не факт, что минимальный ценник на ссд не будет выше всегда, чем на hdd.
                  Вопрос только в том, что на домашнем использовании это может быть не актуально, но мы и под статьёй не про домашние решения)


                  1. edo1h
                    15.01.2022 15:55

                    Объем же на юнит тоже вполне себе метрика.

                    так тут 2.5" как раз в более выгодном положении.
                    сходу нагуглил системы 1u на 32 u.2 nvme. сколько там 3.5" hdd поместится в 1u? )


                    Уж ж были случаи, что при отключении годовом ссд стирались

                    если мы говорим про серверные системы, для них это вообще не важно.


                    1. Am0ralist
                      15.01.2022 16:08

                      если мы говорим про серверные системы, для них это вообще не важно.
                      А потеря холодных — критична. На жестком просто механика накрывается, а на ссд утечёт заряд, а ты даже не узнаешь…
                      так тут 2.5" как раз в более выгодном положении.
                      сходу нагуглил системы 1u на 32 u.2 nvme. сколько там 3.5" hdd поместится в 1u? )
                      ну да, я имел ввиду не юнит высоты, а в смысле на железку. Уровня, что на комплект мать/проц лимитное количество подключаемых девайсов.
                      Вот тогда либо 16 тб интела, либо 18 тб 3,5)


  1. saege5b
    15.01.2022 00:50

    А как будут выглядеть пачка NVMe на материнке? И как в них подключать диски? И сейчас иногда приходится извращаться с длинными сата шнурками.


    1. edo1h
      15.01.2022 02:17

      ну вот, например:
      https://store.supermicro.com/supermicro-55cm-oculink-to-u-2-pcie-with-power-cable-cbl-sast-0956.html


      пока это всё дорого, но если оно станет массовым, то это не проблема.