SSD-накопитель PM1733 с обработкой аппаратных сбоев по типу RAID-5/6

SSD-накопители работают на порядок быстрее HDD, но страдают из-за ненадёжных контроллеров. Samsung пытается это исправить. Компания запустила в массовое производство две первые модели SSD с рядом новых технологий: 96-слойная 3D флеш-память с четырьмя битами на ячейку QLC V-NAND, поддержка PCIe 4.0 (скорость чтения 8 ГБ/с) и самое главное — более надёжные контроллеры, которые продолжают работу после многих сбоев, раньше считавшихся фатальными.

«Гарантированная работа даже при возникновении ошибок на уровне микросхемы означает внедрение первых в отрасли "неубиваемых" (never-dying) SSD-накопителей», — заявляется в пресс-релизе Samsung.

Инновационный технологический стек реализован в SSD-накопителях PM1733 и PM1735 для дата-центров. Возможно, в будущем более надёжные контроллеры внедрят и в недорогие SSD-накопители для масс-маркета. Всего на основе PM1733 и PM1735 компания Samsung планирует выпустить 19 моделей SSD.



Известно, что максимальная ёмкость SSD будет 32 (30,72) терабайта, а в модель PM1733 для упрощения миграции поставят два порта PCIe, как указано ниже на фотографии с конференции Samsung Tech Day в Сан-Хосе (см. надпись на стенде).



Полные технические характеристики PM1733 и PM1735 пока не объявлены, но компания рассказала о трёх ключевых инновациях в этих SSD, кроме перехода на PCIe 4.0 с соответствующим ростом производительности.

Fail-In-Place


Технология Samsung Fail-In-Place (FIP) позволяет SSD надёжно обрабатывать аппаратные сбои, которые в противном случае стали бы фатальными для SSD, вплоть до полного отказа NAND.

Накопитель самой большой ёмкости PM1733 на 30,72 ТБ может более или менее нормально продолжать работать даже после потери любого из 512-ти NAND блоков ячеек флеш-памяти.

Для справки, в 96-слойной вертикальной флеш-памяти QLC V-NAND на кристалл послойно напыляют проводящие и изолирующие слои, которые образуют проводники затворов и сами затворы. Затем в этих слоях формируют множество отверстий на всю глубину слоёв. На стенки отверстий наносят структуру полевых транзисторов — изоляторы и плавающие затворы. Таким образом формируют столбец кольцеобразных полевых транзисторов с плавающими затворами.

Ранее Samsung позиционировала их как 90+ слоёв, а не 96, потому что каждый такой чип состоит из двух установленных друг на друга 48-слойных кристаллов 3D NAND. Специалисты предполагали, что в месте стыка двух кристаллов происходит разрушение слоёв или компания отключает эти слои в связи с высоким уровнем отказа ячеек в них.


96-слойная 3D NAND из двух 48-слойных кристаллов 3D NAND (International Memory Workshop 2018)

За прошедший год технологический процесс наверняка усовершенствовался. Кроме того, Samsung начала массовое производство памяти с ячейкой QLC, которая будет хранить четыре бита данных.

И поверх всего этого установлен контроллер, который выдерживает выход из строя целых блоков ячеек памяти. Накопитель будет сканировать повреждённые или потерянные данные, восстанавливать их и перемещать на всё ещё работающие флеш-чипы, а также продолжать работать с высокой пропускной способностью и QoS. По сути, это похоже на массив RAID-5/6, который переходит в деградированный режим вместо отключения всего массива (при выходе из строя одного диска RAID 5 надёжность тома сразу снижается до уровня RAID 0).

Конечно, если с накопителем случилась такая неприятность, разумно будет его заменить, но благодаря технологии FIP замену можно выполнить в удобное для оператора время, не сталкиваясь с простоем из-за немедленного отказа.

Впрочем, внедрение Fail-In-Place не меняет того факта, что у PM1733 и PM1735 сохраняется прежний рейтинг выносливости на количество перезаписей в день Drive Writes Per Day (DWPD). Он равен 1 и 3, соответственно. То есть весь объём накопителя предполагается перезаписывать 1 или 3 раза в день. В этом случае соблюдается гарантированный срок службы SSD в пять лет.

Общая продолжительность жизни всё ещё сопоставима с предыдущим поколением накопителей, но риск преждевременной смерти за исключением нормального износа NAND значительно уменьшен.

Виртуализация


Кроме того, в накопителях PM1733 и PM1735 реализована технология виртуализации. Samsung внедрила дополнительные функции виртуализации NVMe на основе Single-Root I/O Virtualization (SR-IOV), что позволяет одному контроллеру SSD NVMe предоставлять множество виртуальных контроллеров (до 64 в случае дисков Samsung). Каждый виртуальный контроллер может быть назначен на другую виртуальную машину, работающую на хост-системе, и обеспечить дисковое пространство для этой виртуальной машины без нагрузки на процессор — так же, как если бы весь диск был назначен на одну виртуальную машину через PCIe. Ёмкость каждого SSD-накопителя можно гибко распределить между различными пространствами имён, которые, в свою очередь, могут быть подключены к соответствующему виртуальному контроллеру.



Машинное обучение


Третья технология Samsung — это машинное обучение V-NAND. Компания не раскрывает точных подробностей о том, как они используют машинное обучение, но говорит, что оно используется для прогнозирования и анализа характеристик флеш-ячеек, в том числе путём обнаружения изменений в характеристиках электрических схем.

В 3D NAND всё труднее становится применять стандартные стратегии программирования ячеек, чтения и исправления ошибок. Недостаточно одного только отслеживания циклов P/E для каждого блока, ведь между слоями в верхней и нижней части 3D-стека могут быть значительные различия, также как между разными микросхемами. Samsung наверняка не единственная, кто пытается применить машинное обучение для решения этих проблем. Новая функция обеспечит стабильную производительность и повышенную надёжность современных накопителей на TLC V-NAND, но её важность резко возрастет в случае с накопителями QLC V-NAND.

Поставки первых дисков PM1733 и PM1735 уже начались. Обе модели сделаны на одной технологической платформе. PM1733 расклассифицирован как DWPD 1 и предлагает объём до 30,72 ТБ, а у PM1735 специально уменьшенная ёмкость, чтобы гарантировать DWPD 3 с резервированием отдельных блоков ячеек по типу RAID 5/6, как было описано выше. Обе модели доступны в форм-факторах U.2 или подключаемых модулей PCIe. Форм-фактор U.2 предоставляет несколько дополнительных вариантов ёмкости, в то время как у подключаемых модулей интерфейс PCIe 4.0 x8, который обеспечивает на 25% более высокую скорость последовательного чтения (в других рабочих нагрузках PCIe 4.0 x4 достаточно быстр, чтобы не быть узким местом).

Комментарии (50)


  1. Stepler
    21.09.2019 10:12

    Виртуализация может начать новую гонку, если сейчас контроллер SSD NVMe предоставляет до 64 виртуальных, то сколько будет через год (?).


  1. staticmain
    21.09.2019 10:25

    32 терабайта. Тут домой 1ТБ SSD купить уже великая проблема, а эти диски вообще как квартира в Нью-Йорке будут стоить.


    1. SergeyMax
      21.09.2019 10:31

      Терабайтник же вроде меньше десятки нынче стоит?


      1. staticmain
        21.09.2019 10:36

        Те, которые нонейм или по старой технологии — 10. Samsung/seagate 550 МБ/сек — 20круб.


        1. SergeyMax
          21.09.2019 10:39

          Не знаю насчёт самсунга и старой технологии, но например в три раза более быстрый Intel 660p — 8500 рублей…


          1. xDiezz
            21.09.2019 11:42

            660p сложно назвать быстрым на реальных тестах. Это провальная линейка от интел, в отличие от 760p


            1. EvgeniyNuAfanasievich
              21.09.2019 15:07

              Быстрый вроде в т.з. не было в комменты свыше.


            1. SergeyMax
              21.09.2019 15:49

              Он может быть действительно не самый быстрый, но после того, как я заменил свой SATA3 SSD со скоростью чтения/записи порядка 550 МБ/с на NVMe со скоростью чтения 3200 МБ/с, и не заметил никакой разницы — я стал относиться к тестам чуть менее внимательно.


              1. HardWrMan
                22.09.2019 13:02

                Потому, что после 200МБ/с скорости интерфейса уже следует обращать внимание на IOPSы.


            1. iproger
              21.09.2019 18:45
              +1

              У него проседают скорости после нескольких минут непрерывной записи или чтения?


              1. safari2012
                22.09.2019 04:48
                +1

                После заполнения SLC-кэша


          1. skrimafonolog
            22.09.2019 10:50

            Не знаю насчёт самсунга и старой технологии, но например в три раза более быстрый Intel 660p — 8500 рублей…


            Цена ниже в новых моделях не просто так.
            В связи с большей плотностью упаковки.

            А увеличение плотности — это заодно и снижение надежности.

            То есть если вам положить 2 диска:

            Один дешевле с «четверной упаковкой»
            И один дороже с «двойной упаковкой»

            одного размера, то что вы, как неискушенный пользователь выберите?

            Ну или как пользователь искушенный, но кому достаточно работы диска в пару лет?

            Конечно, тот, что дешевле.

            О том и речь в статье — объемы выросли, цена упала, но и надежность упала.
            А сейчас пришла пора о надежности подумать.


        1. CaptainFlint
          21.09.2019 12:40

          860 Evo за 9-10 тыр продаётся.


        1. JamboJet
          21.09.2019 15:29

          Терабайт «ноунейма» (Londisk на aliexpress) в августе назад стоил ~5тр за SATA и ~6тр за NVME.



      1. burzooom
        21.09.2019 23:56

        Такая цена в украинских магазинах, samsung evo 970 pro 1tb m2 за эквивалент 13 000 рублей


    1. denisromanenko
      21.09.2019 11:46

      Написано же что это максимальная поддерживаемая ёмкость. Конечно будет куча подвидов с разными размерами.


    1. denisromanenko
      21.09.2019 11:52

      Терабайтный самсунг NVMe на том же ситилинке стоит 12 тысяч.

      Понятно, что деньги не маленькие, но и не такие уж огромные — если работа требует быстрый доступ сразу к терабайту данных — цена вполне нормальная.

      А для домашних целей SSD 256 + 1 Tb HDD (новый и быстрый) перекрывают потребности с лихвой даже для игр.


      1. Garbus
        22.09.2019 04:30
        +1

        Не стоит забывать вариант — ноутбук, где по большому счету имеет смысл только ССД. И устойчивый к сбоям диск более чем желателен.


      1. VIkrom
        22.09.2019 09:15

        Новым (и не очень) играм тоже желателен SSD. Battlefield установленный на HDD очень долго загружает карту в сравнении с SSD.


        1. denisromanenko
          22.09.2019 09:45

          Тут наверное еще проблема в умении программистов, создавших игру — у меня все игры на HDD, и тот же бэтмен аркхем найт, где огромный бесшовный город с кучей деталей — прогружает карту буквально за 10 секунд от старта игры.


          Кстати, новые HDD работают намного быстрее таких же sata-3, но выпущенных 5-6 лет назад. Уж не знаю с чем это связано, но запуск+отклик системы на свежей хдд тошибы примерно такой же, как на трехлетнем ссд


          1. yatanai
            22.09.2019 20:48

            2 варианта? Увеличили количество блинов или более умные контроллеры. Учитывая что недавно я вытащил из одного мёртвого HDD (год прожил) ОЗУ на 512Мб, я ничему уже не удивлюсь.


  1. wormball
    21.09.2019 11:33
    +4

    «Неубиваемый» и «QLC» в одном предложении слегонца настораживают.


    1. NetBUG
      21.09.2019 11:48

      Вот и пытаются взаимно компенсировать


      1. EvgeniyNuAfanasievich
        21.09.2019 16:01

        Может объем будет падать помаленьку, но само устройство будет работать дальше


        1. Alexsandr_SE
          21.09.2019 21:15

          Только недолго. Износ ячеек памяти будет более-менее равномерным и данная технология будет сигналом к срочной замене.


          1. EvgeniyNuAfanasievich
            22.09.2019 11:24

            Так в чем тогда сокральный смысл живучих контроллеров, если вопрос живучести памяти и живучести самого устройства, в случае проблем с памятью остается открытым.


          1. ClearAirTurbulence
            22.09.2019 18:05

            Даже консьюмерские SSD довольно живучи. Широко известный тест:
            techreport.com/review/27909/the-ssd-endurance-experiment-theyre-all-dead

            Да, они сдохли, но на них перед этим столько записали, сколько дома обычно не пишут.


            1. skrimafonolog
              22.09.2019 18:25

              Даже консьюмерские SSD довольно живучи


              А теперь посмотрите какой там тип флеш-памяти.
              Но с современными QLC не все так радужно.


    1. panvartan
      21.09.2019 11:54

      Вы путаете неубиваемость и бессмертие.


    1. KorDen32
      21.09.2019 12:28

      Вначале тоже хотел это написать, потом дошло:
      — у нас дохнут контроллеры, но MLC живуч.
      — хорошо, выпустим неубиваемые супер-зарезервированные контроллеры, а для капитализма у нас есть QLC.


      1. crea7or
        22.09.2019 14:51

        Флешпамять правда живучее чем пишут/говорят. Это как со светодиодами. Лампы светодиодны дохнут не из-за смерти диодов в абсолютном большинстве случаев, а потому что конденсаторы высохли в драйверах. Я так больше десятка оживил разных. Очень неприятно когда высокотехнологические устройства дохнут из-за конденсатора за 3 рубля.


        1. usrsse2
          22.09.2019 22:51

          Не знаю, у меня всегда диоды сгорают (чернеют). Ставлю перемычку вместо светодиода, лампочка еще какое-то время работает.


  1. lingvo
    21.09.2019 13:48

    Для меня неубиваемая электроника — это та, которая не дохнет, если на нее подать +12В вместо +3.3В или поменять местами + и -. А все остальное — фигня.


    Подождем реальных тестов на надежность.


    1. karavan_750
      21.09.2019 15:08

      Исходя из вашего мнения о неубиваемости, каких тестов вы ожидаете?
      Прожарку ssd в микроволновке?


      1. prs123
        21.09.2019 16:32

        Там в соседнем посте Galaxy Fold царапают и ломают. Думаю, человек здесь тоже хотел увидеть что-то схожее


        1. karavan_750
          21.09.2019 16:46

          Вспоминается древний анек об испытаниях японской пилы бригадой сибирских лесорубов.


          1. 500rur
            22.09.2019 18:35

            Это рассказ на самом деле. www.proza.ru/2013/03/06/1258


            1. karavan_750
              23.09.2019 16:23

              Меня смущает год публикации рассказа.
              Короткий вариант анека я слышал где-то в 2001-м.


      1. lingvo
        21.09.2019 18:08
        -2

        Веселые минусовщики. Вы вообще слово неубиваемая понимаете? Это от слова убивать если что. То есть неубиваемая означает, что вы специально (или чаще всего случайно)пытаетесь что-то убить, а оно все равно выживает.
        То есть это испытание за пределами нормальных условий эксплуатации для конкретного прибора, при которых оно обычно безвозвратно ломается.
        Да и испытание в микроволновке, если что, хотя на самом деле это обычно испытания на что-то, что может произойти вследствие воздействия неожиданных для данного применения факторов или фактора воздействия «дурака».


        Вообще в оригинальном тексте записано never-dying и это больше означает «неумирающий» чем неубиваемый. И смысл совсем другой.


  1. old_bear
    21.09.2019 17:38
    -1

    SSD-накопители работают на порядок быстрее HDD, но страдают из-за ненадёжных контроллеров.

    Вот ведь, а я то уж думал, что проблема в попытках несколько бит в одной ячейке NAND-а хранить. А виноваты то оказывается контролёры — ненадёжные какие-то.


    1. hjornson
      21.09.2019 20:48

      Судя по контексту статьи — там все же имелось в виду не то что сами контроллеры дохнут, а то что контроллер не может обрабатывать отказ ячеек в массиве.

      И тут стоит вспомнить знаменитую серию самсунгов 7200.11. Там дело было как раз в контроллере.


      1. exzotikfruit_official
        21.09.2019 22:43
        +2

        Seagate’ов наверное имели в виду


        1. hjornson
          21.09.2019 23:03

          Проглючило, сорь.
          Да, сигейтов.


  1. Crazyvlad
    21.09.2019 22:19

    Интересно, а в чем идея?
    В продуктиве рейд 6 или аналог используется. Все равно диск с отказами придётся менять ASAP и тут его внутренний рейд не поможет совсем.
    По ощущениям, это сделано для уменьшения количества брака… Или уменьшения отказов в гарантийный период.


  1. nApoBo3
    21.09.2019 22:32
    +4

    ИМХО попытка сделать хорошую мину при плохой игре. Мы поставили, мягко говоря, весьма сомнительную память, но зато у нас теперь больше pci линий( сомнительно, что данная память сможет их загрузить ) и мы прикрутили кучу сложных технологии, чтобы компенсировать недостатки памяти, но продвигать будем как достижение, а не как попытки дотянуть брак хотя бы до второго сорта.
    Несколько лет назад все ssd были быстрыми, некоторые лучше, некоторые хуже. Обидно видеть, что индустрия пошла по пути шулера, с их slc кэшем и многие ssd под длительной нагрузкой стали настолько медленным, что скоро их hdd обгонят.


    1. burzooom
      22.09.2019 00:02
      +1

      ссд рулят в основном не из-за гигабайт\с, (ну довели скорость до 5-6 гб\с ииии… и что?) а из-за высокой скорости доступа к фрагментам файлов, разбросанных по диску


      1. nApoBo3
        22.09.2019 00:47
        -1

        Тут вылезает одна интересная деталь, если диск заполнен, то у ssd очень проседает скорость записи( которая и так не фантан у подобных моделей со сложной организацией памяти ), а когда диск не заполнен фрагментация файлов будет весьма не большой.


        1. burzooom
          22.09.2019 01:13

          вот у меня к примеру и ссд, и хдд заполнены до отвала, но тормозит почемуто из-за этого только хдд. А главное — это нештатная ситуация. SDD на 500 гб не справляется с ролью «оперативной постоянной памяти» (и так 150 гб на сис.раздел ушло), и нужно апдейтить до 1тб. Как и хдд, нужно купить вместо 2тб подешевевшие 8 и забыть на лет пять про отсутствие места


    1. atbuhw
      23.09.2019 14:21

      Я полностью согласен, только то же самое можно (и да, я так сам тоже считаю) сказать и про всю индустрию ssd в целом. «Мы поставили ненадёжную NAND-память вместо надёжной hdd, но зато прикрутили кучу сложных технологий (TRIM, принципиально ломающий возможность восстановления ошибочно удалённых данных; wear leveling, из-за которого диск „если сдохнет, так уж сдохнет“, чтобы вообще ничего нельзя восстановить было), чтобы компенсировать ненадёжность памяти, и хотя бы один конкретный файл можно было сохранить хотя бы больше 1000 раз.»