В нашем блоге на Хабре мы не только рассказываем о развитии своего облачного сервиса 1cloud, но и много пишем о новых технологиях, в том числе в области процессоров и памяти. Мы уже публиковали подборку высокопроизводительных и емких устройств хранения, а также рассказывали о 16-терабайтном диске от Samsung и новом подходе к созданию флэш-памяти от Intel.

Индустрия хранения данных переживает этап драматических перемен, которые проявятся, как в ближайшее время, так и в долгосрочной перспективе. Поэтому сегодня мы поговорим о технологиях, которые приведут к этим изменениям.

Ближайшее будущее


Жесткие диски с Ethernet-интерфейсом

В 2014 году Seagate анонсировала накопитель Kinetic HDD с интерфейсом Ethernet, который в несколько раз производительнее существовавших на тот момент конкурирующих продуктов.

С помощью платформы Kinetic Open Storage можно отказаться от традиционной схемы работы с привычными системами хранения данных, позволил приложениям и хостам связываться друг с другом напрямую через их жесткие диски с помощью TCP/IP-инфраструктуры дата-центров, используя открытый API. У каждого 4TB Kinetic HDD дисков есть два гигабитных Ethernet-порта, каждый со своим IP-адресом.

Подобный подход позволяет также сократить затраты на железо, одновременно повысив вычислительные мощности.

Аналитик Forrester Генри Бальтазар так прокомментировал появление Ethernet-дисков от Seagate:

Если данная технология будет коммерчески успешно, то это очень сильно изменит ИТ-индустрию, поскольку прямая связь дисков с приложениями позволит в той или иной степени отказаться от контроллеров хранения, файловых систем, SAN и даже RAID-массивов. Это отличное решение для объектных хранилищ и распространенных файловых систем (Hadoop, Lustre, GlusterFS) распределенных баз данных вроде Cassandra.

Жесткие диски с гелием

Еще в 2013 году подразделение Western Digital под названием HGST представило свой заполненный гелием диск на 6 терабайт. Заполнение диска гелием, а не более плотным воздухом, позволяет увеличить емкость диска и снизить его нагрев. Гелиевый винчестер на 7200 оборотах в минуту примерно на 4-5 градусов холоднее, чем обычный, поскольку теплопроводность гелия на порядок выше воздуха.



Впоследствии HGST выпустила винчестер на 10 терабайт, обойдя продукт своего главного конкурента Seagate для корпоративного сектора, емкость которого не превышает 8 ТБ. Компания планирует к 2017 году полностью перейти на выпуск дисков с гелием, полностью отказавшись от винчестеров, использующих воздух.

Запись с перекрытием дорожек (Shingled magnetic recording, SMR)

Запись с перекрытием дорожек — это техника хранения, которая использует наложение дорожек данных при записи или «усекаются». Это позволяет увеличить количество дорожек на каждой пластине и сократить расстояние между ними, что в свою очередь приводит к повышению емкости диска на 25%.

Однако с технологией SMR есть и проблемы — для перезаписи и обновления информации, нужно перезаписать не только нужный фрагмент, но и данные на последних дорожках. Записывающий элемент таких дисков шире считывающего, поэтому он захватывает данные на граничащих дорожках — это и вызывает необходимость перезаписи. Все это приводит к низкой производительности записи.

Развитием технологии SMR занимаются как Seagate так и HGST (обе компании писали о ней в своих блогах на Хабре – здесь и здесь). HGST запускала заполненный гелием диск на 10 ТБ, использующий эту технологию — он предназначен для применения в облачных приложениях и приложениях холодного хранения, поскольку они не требуют большой производительности записи.

Среднесрочная перспектива


Диски на 60 ТБ по технологии термоассистируемой магнитной записи

В настоящий момент диски высокой емкости используют технологию перпендикулярной магнитной записи (PMR, perpendicular magnetic recording), представленной еще в 2005 году и обеспечивает запись 1 Тбайт данных на дисковую пластину.

И Western Digital и Seagate работают над дисками, использующими технологию термоассистируемой магнитной записи (heat assisted magnetic recording, HAMR), которая призвана заменить PMR. HAMR использует небольшой лазер для нагрева части диска, на которую планируется осуществить запись. Это позволяет уменьшить размеры магнитной области, хранящей один бит информации, и увеличить стабильность хранения данных. С помощью технологии HAMR возможно создание дисков на 3,5” с емкостью 60 Тбайт.

Гибридные диски с памятью с фазовым переходом и NAND-технологией

Память с фазовым переходом (Phase change memory, PCM) рассматривается как будущая замена технологии флэш-памяти NAND, используемой в SSD-накопителях. PCM использует халькогенид, который при нагреве может «переключаться» между двумя состояниями: кристаллическим и аморфным.

Изменения состояния ячейки могут быть произведены около миллиона раз, что значительно превышает параметры коммерчески успешных high-end SLC NAND-ячеек в SSD-винчестерах энтерпрайз-уровня — 30 тысяч циклов перезаписи.

Проблема PCM-памяти в большой задержке записи, но IBM продемонстрировала, что гибридное устройство, которые использует PCM, NAND и DRAM на одном контроллере может работать до 275 раз быстрее, чем стандартное SSD-устройство. Скорость считывания такого диска колеблется в промежутке от 100 до 300 наносекунд, а время записи от 10 до 150 микросекунд.

По оценкам IBM, первые коммерческие продукты, основанные на гибридной технологии PCM, появятся в продаже уже в 2016 году.

Новые поколения ленточных носителей Linear Tape –Open

Впервые представленная в 2000 году, текущее поколение технологии LTO-записи, LTO-6 предлагает емкость 6,25 ТБ, соотношение компрессии 2.5:1 и стоимость записи 1,3 цента на гигабайт или меньше. Следующие два поколения повысят емкость до 16 Тбайт, а затем и до 32 Тбайт.

В сентябре 2014 года компании, сформировавшие консорциум LTO Program Technology — HP, IBM, Quantum — анонсировали расширенную дорожную карту по подготовке новых поколений (9 и 10) ленточных накопителей, с компрессионной емкостью 62,5 ТБ и 120 ТБ соответственно. Скорость передачи должна вырасти до 1,770 МБ/сек для 9 поколения и до 2,750 МБ/сек для 10.

Отдаленное будущее


IBM 154TB

В мае 2014 года IBM и Fujifilm анонсировали ленточное устройство хранения, которое может хранить 85,9 млрд бит на квадратном дюйме магнитной ленты. Подобная плотность позволяет создавать картриджи, способные хранить до 154 терабайт несжатых данных, что в 62 раза больше, чем могут предложить LTO-6 картриджи. Коммерческие реализации технологии могут появиться в течение ближайших 10 лет.

Для получения столь высокой плотности эксперты Fujifilm разработали технологию Nanocubic, которая позволяет создавать сверхтонкий магнитный слой. Чем тоньше магнитный слой, тем больше намагниченных доменов размещается на единице площади магнитной ленты.



Генетические хранилища

Ученые спокойно работают с ДНК мамонта, который был заморожен на протяжении тысяч лет, так что нет никаких сомнений в том, что ДНК может сохраняться долгое время. Британские ученые в 2013 году продемонстрировали, как ДНК можно использовать для хранения архивных данных, которые можно прочитать со 100% точностью.

Молекулы ДНК — это очень плотная среда хранения, в одном грамме может помещаться до 2000 ТБ данных.

На данном уровне развития технологии синтез ДНК является слишком дорогим процессом для использования ДНК в коммерческих хранилищах данных. Однако в будущем этот инструмент может применяться для долгосрочного хранения важной информации — например, данные различных государственных ведомств.

Комментарии (24)


  1. iscsi
    25.11.2015 20:01

    Давайте поможем Даше найти готовые продукты на базе Kinetic.


    1. MasMaX
      26.11.2015 13:38

      Она же Dora!!!


  1. rinnaatt
    25.11.2015 21:07

    Молекулы ДНК — это очень плотная среда хранения, в одном грамме может помещаться до 2000 ТБ данных.


    Интересно, я где-то читал что для полной постройки нашего тела используется небольшая часть ДНК, а вдруг в «неиспользуемых» частях содержатся какая-нибудь интереснейшая информация о смысле жизни и ответ на «главный вопрос».


    1. kumbr_87
      25.11.2015 22:06
      +6

      42


    1. dkukushkin
      25.11.2015 22:23

      Главный вопрос — как из бессознательного сделать сознательное. Ответ на него в ДНК быть может и есть, однако т.к. ДНК представляют из себя компилированный код, его реверс-инжиниринг может оказаться сложнее чем изучение коннектома и работы нейронов.

      Часто легче изучить как работает программа и написать аналог, чем реверсить и копаться в ассемблере.


    1. Pravo
      26.11.2015 03:35

      // там комментарии


    1. Spaceoddity
      26.11.2015 12:15
      -1

      — Вопрос лишен смысла. Под «жизнью— Спрашивающий подразумевает частный феномен, объяснимый лишь в терминах целого.
      — Частью какого целого является жизнь? — спросил Лингман.
      — Данный вопрос в настоящей форме не может разрешиться. Спрашивающий все ещё рассматривает «жизнь— субъективно, со своей ограниченной точки зрения.

      Чтобы правильно задать вопрос, нужно знать большую часть ответа.

      Роберт Шекли. «Верный вопрос».


  1. semenyakinVS
    26.11.2015 02:30
    +1

    Молекулы ДНК — это очень плотная среда хранения, в одном грамме может помещаться до 2000 ТБ данных.


    Боюсь, скорость считывания будет низкой. Я так понимаю, там ведь нужна химическая реакция чтобы информацию считать? Вряд ли химическая реакция будет быстрее чем электромагнитное взаимодействие… Впрочем, знающие люди могут меня исправить. Как, по скорости не будет проблем?


    1. namespace
      26.11.2015 03:16

      Я не очень знающий, но по-моему то, что «померять потенциал» и провести органическую хим. реакцию — это задачи совершенно разного порядка сложности, довольно очевидно.


  1. TimsTims
    26.11.2015 11:21
    -1

    Такой интересный вопрос вдруг нарисовался в голове:
    А почему все производители так сосредоточены на форм-факторе 3.5"? Почему бы не перейти на 4.5", 5.5"? В системных блоках места достаточно и под бОльшие ХДД. В серверных стойках на несколько юнитов тоже полно места, и вместо размещения 10 дисков по 3.5" можно было бы аналогично засунуть например 5-6 дисков по 5.5", но из-за их бОльшего радиуса — в них будет и больше объем записи.

    Далее, почему нельзя в жесткие диски вставлять сразу несколько считывающих головок на один блин? Сейчас с каждого блина считывает только одна головка, а если поставить с другой стороны еще одну головку, то будет x2 по скоросте и IOPS возрастет, надо только немного увеличить размеры.

    А гелий… он ведь все-равно будет оттуда со временем вылетать, приводя диск в негодность?


    1. vorphalack
      26.11.2015 12:19

      уже были 5.25" quantum bigfoot. отличались надежностью жигулей и скоростью запорожца в гору.


    1. GrakovNe
      26.11.2015 12:21

      Куда это гелий будет вылетать из герметичного бокса? Он так не умеет. А несколько головок на таких скоростях, которые мотыляются туда-сюда несколько раз в секунду — чревато небольшими проблемами


      1. TimsTims
        26.11.2015 12:42

        А несколько головок на таких скоростях, которые мотыляются туда-сюда несколько раз в секунду — чревато небольшими проблемами

        Ну понятно, что это сделать будет нелегко, но уж явно выглядит попроще, чем «Запись с перекрытием дорожек» или другие хитроумные технологии.


        1. GrakovNe
          26.11.2015 13:24

          Чтобы реализовать запись с перекрытием, придется только изменить алгоритм чтения данных, механика — слабое, но более-менее обсчитанное и протестированное место винта, остается без изменений. Чтобы всунуть еще парочку головок — придется изменять все: от собственно механики HDD и аэродинамики внутри диска до микрокода драйвера, которому все это придется как-то согласовывать и сделать так, чтобы оно работало. Надежность понижается в разы, но растет ли скорость вдвое? Обычно вы читаете один файл, в нормальном случае располагающийся последовательно на поверхности, чтобы не тратиться на репозиционирование. Читаете ли вы два файла одновременно? Нужны ли вам два фрагмента файла, которые разнесены по пластинкам диска (что означает, что файл, как минимум, какая-нибудь киношка fullHD или однофайловая БД на сотню тысяч записей)? И получите ли вы в итоге хоть какой-то прирост скорости, если головка вместо цикла «встали на место — почитали», будет постоянно корректировать свое положение чтобы не зацепить соседку?
          UPD: по поводу «больший диаметр» — не забывайте, что «стрела» с головкой на конце, которая бегает по поверхности — рычаг. То есть, чем она длиннее, тем большую точность позиционирования «здесь» нужно обеспечить, чтобы «там» она оставалась приемлимой


          1. TimsTims
            26.11.2015 14:01

            Читаете ли вы два файла одновременно?

            Легко — я включаю фильм, а в это время на заднем фоне Dropbox синхронизирует файлы. Системе одновременно нужно два файла, головка диска постоянно прыгает туда-сюда.
            А так — одна головка подстроилась под стрим для фильма, вторая — дропбокса(упрощенно. Конечно у дропбокса операций гораздо больше будет).

            нормальном случае располагающийся последовательно на поверхности

            Ну не обязательно ведь. Он вполне может быть размазан по нескольким пластинам. Пусть одна головка читает с одного места, другая подхватит и будет считывать другой/продолжение. Головкам меньше нужно будет затрачивать время на перепозиционирование, в итоге скорость в целом вырастет.

            постоянно корректировать свое положение чтобы не зацепить соседку

            Не могу представить ситуацию, как головки, расположенные с двух противоположных концов смогут друг друга зацепить. Вообще, по первой картинке может предположить, в HDD влезет аж 4 головки, на каждую примерно по 20% площади диска.

            Написать алгоритмы по оптимальному расположению головок, или синхронному считыванию данных мне кажется вполне реализуемым алгоритмом.

            придется изменять все: от собственно механики HDD и аэродинамики внутри диска до микрокода драйвера

            Конечно придется поработать, это не винтики поменять. Но и сидеть на месте нельзя, скоро SSD догонит HDD по ценам.


            1. GrakovNe
              26.11.2015 14:28

              ну и пусть себе догоняет, я только за. Достоинства SSD видно и слышно, в то время как HDD — бутылочное горлышко, которое хочется выбросить


              1. TimsTims
                26.11.2015 15:48

                Это сейчас HDD бутылочное горлышко, а добавят например дополнительных чудо-головок и уже не будет «бутылочное горлышко», кто его знает.

                Опять-же, у HDD всё-еще есть свои плюсы по сравнению с SSD, поэтому их всё еще используют в ЦОДах и различных СХД.
                Плюсы начиная от стоимости $ за гбайт, заканчивая сроком службы.


                1. GrakovNe
                  26.11.2015 15:51

                  HDD это в любом случае механика, как ни крути на каких угодно скоростях. SSD — куча транзисторов. Когда транзистор начнет работать медленнее механики, мы с физикой будем очень недовольны происходящим


                1. stychos
                  28.11.2015 23:33

                  Вы думаете, если добавить ещё один набор головок (а то и три, как Вы предлагаете), и соответственно этому усложнить логику контроллера — то HDD по-прежнему будут дешевле SSD?


      1. 26.11.2015 13:44
        +1

        Куда это гелий будет вылетать из герметичного бокса? Он так не умеет

        Гелий так умеет как никто другой. Из-за очень малого размера молекулы (меньше, чем у водорода) он понемногу просачивается через что угодно.


        1. Spaceoddity
          26.11.2015 14:08
          -2

          Из-за очень малого размера молекулы

          Молекулы?))


          1. leshabirukov
            26.11.2015 15:48

            В физике к молекулам причисляют также одноатомные молекулы, то есть свободные (химически не связанные) атомы (например, инертных газов, ртути и т. п.).

            Молекула


        1. GrakovNe
          26.11.2015 14:22
          -1

          молекула гелия, это конечно сильно. А вообще, герметичный бокс — это такой, через который не «просачивается» ничего, в том числе и гелий, по крайней мере, в обозримом будущем


  1. MasMaX
    26.11.2015 13:40

    Насчет HDD по Ethernet — в этом случае предполагается что для программ диски будут выглядеть как обычные, а не сетевые хранилища? Или как обычно — диск сетевой и имитируется симлинками как обычный?