Все три производителя начали продажи относительно небольших, от 2ТБ HDD SMR дисков (черепичных), не указывая это в спеках: WD, Seagate, Toshiba
В англоязычном интернете и СМИ такие действия критикуются и, думается, справедливо. В России же ресурс THG отметился статьей Western Digital использует DM-SMR, делая диски WD Red пригодными для NAS и RAID. Эта статья по моему оценочному суждению — беспардонная ложь, от заголовка до вывода: "Благодаря технологии записи DM-SMR, Western Digital сделал свои жесткие диски WD Red пригодными для NAS и RAID." Интересно, что в англоязычном варианте статьи Western Digital Fesses Up: Some Red HDDs Use Slow SMR Tech Without Disclosure
нет и намека на подобное искажение фактов
Также в тексте thg.ru ссылается на Алана Брауна,
Выход из создавшейся ситуации нашел Алан Браун, сетевой администратор UCL Mullard Space Science Laboratory. Он обнаружил, что при выгрузке данных из RAID-массивов, выполняемых при добавлении нового диска в существующий RAID-массив и последующей перезаписи для балансировки доступа, система выводит новые жесткие диски WD Red HDD из-под своего контроля.
Довольно туманно что именно значит "система выводит новые жесткие диски WD Red HDD из-под своего контроля. " — но по смыслу предложения это и есть решение
В то же время Алан действительно писал по теме — но совершенно противоположное
Диск WD40EFAX, который я заполнял нулями, в среднем дал 40 МБ / с, но начинал со скоростью 120 МБ / с.
В случае ZFS ресилвер не является сканированием из «конца в конец» на уровне блоков, а прыгает по всему диску по мере восстановления четности каждого файла. Похоже, это вызывает еще одну проблему на WD40EFAX, где запрос на проверку сектора, в который еще не был записан, приводит к тому, что накопитель внутренне регистрирует ошибку «ID сектора не найден (IDNF)», и выдает ошибку аппаратного ввода-вывода от интерфейса к хост-системе.
RAID-контроллеры (аппаратные или программные, RAID5 / 6 или ZFS) вполне разумно решат, что диск неисправен после нескольких из них, и выбросят его из массива, если он еще этого не сделал по истечении времени ожидания.
Это, безусловно, соответствует тому, что я заметил, — ресильвер идет на скорости около 100 МБ / с в течение примерно 40 минут, после чего накопители «Умирают» и умирают повторно, если я пытаюсь перезапустить ресильвер, однако, если я оставляю это — через час или около того, они работают еще 40 минут, прежде чем отвалиться.
Трудно представить что именно заставило thg.ru пойти на такое. Можно только догадываться, было ли это связано с давлением со стороны рекламодателей. В любом случае ситуация, когда популярные и предназначенные именно для NAS диски молча заменяются существенно менее пригодными по той же цене и без изменения спецификаций заслуживает внимания.
В конференции на сайте WD нашлось упоминание проблемы. Суть та же
I’ve just purchased 3 WD REDs to replace aging drives in a ZFS array
ALL THREE are failing during resilvering with IDNF (sector ID not found) errors:
Насколько мне удалось понять, проблема у
WD RED — WD Red EFAX — SMR диски и имеют 256 Мб кеша. Диски EFRX — не используют SMR (это обычные CMR диски) и имеют кэш 64 Мб
У Toshiba несколько моделей подробнее здесь
У Seagate несколько серий — подробнее здесь
igrblkv
Как я понимаю, для железного RAID-контроллёра есть повод пометить диск как неисправный, пока тот «тупит» раскладывая как надо то, что ему «налили»?..
Но при этом «налить» надо больше кэша — что-бы диск начал «тупить»?
А как к подобному отнесутся софтовые mdadm, ZFS и прочие? У них нет более тонких настроек для имеющихся дисков? Ведь они как-то различают HDD и SSD, например? Иначе-бы при наличии SSD все HDD диски периодически отваливались как «неисправные»…
Ну и для всяких WAFL это по-боку, вроде, должно быть? Они всегда пишут в чистую область, а уже потом «разгребают» данные, в моменты простоя?..
PS: В ЖЖ подробностей больше — возможно, стоит скопипастить часть в статью или, как минимум, хотя-бы дать ссылки на статьи в ЖЖ.
kvazimoda24
Я так понял, что диск не просто тупит, а выкидывает ошибку. Всё это очень похоже на сырость прошивки.
BD9
Нет.
Железный или программный контроллер не могут разобраться почему действие выполняется очень долго, и предполагают, что диск умирает. Они могли бы справиться с этим, если бы диск сообщал, что у него —
СПИДчерепичная запись, или руками пользователь бы подправил нужное значение, если бы пользователь опять же об этом знал. Новластипроизводители это скрывают.Разгрести данные опосля будет тяжело, ибо будет выполняться ну очень долго. И опять же, диск должен сообщить, что у него такая беда, а ФС и ОС должны суметь сделать вот это всё. И, как обычно, если железо/софт сняты с поддержки, то кто и как эти новые способности будет добавлять?
Опять же, диск будет постоянно дёргать головами и писать-переписывать, а значит, время жизни будет сокращаться. И в это время он будет неспособен на свою обычную работу.
Как-то не стоит это всё +25% ёмкости, ПМСМ.
3dnews.ru/1008543
3dnews.ru/1008687
Wexter
Полгода юзаю 8 дисков st2000dm008 в mdadm RAID5, которые как оказалось тоже с SMR, пока ни разу не отваливались. Хотя и гигантской нагрузки я им не давал.
igrblkv
Тут тонкость в том, что пока диск успевает разгрести кэш, т.е. его «наливают» не через край — то проблем и не будет.
Ну и RAID5 ещё и считает перед записью — на что то-же требуется время, которое так необходимо диску, что-бы кэш не переполнялся…
katzen
Там XOR в подсчётах, то есть никакой паузы и ожидания фактически нет.
2gusia Автор
Я не тестил SMR диски в ZFS, но интересовался этим и цитировал источники еще несколько лет назад. в ZFS очень существенно замедляется работа. Как видно из цитат в этом посте — до отвала по IDNF (sector ID not found)
КМК только если SSD уж совсем колом станет :) По опыту ZFS полагается на установленные у диска таймауты в попытке записать в него сектор (TLER и около него)/ Один диск будет тупить и пытаться что-то записать долго-долго, другой выкинет почти сразу.
-я попытался написать как можно более не-эмоциональный пост на хабре. Все же он тут первый — но отрицательную карму почему то уже имею :) (не знаю только где посмотреть сколько — но пустило только в Recovery Mode). И то написал только потому, что читатели сильно посоветовали — глядишь, народ уберегу от неудачных покупок.
dfgwer
Жаргон страшный, везде аббреватуры без объяснений. Объяснить что такое черепичные, смысл аббреватур.
Также непонятен смысл новости. Хорошая новость или плохая новость хоть?
corvair
Основано на том, что головка
воспроизведениячтения уже, чем записи и при обычной «плоскостной» записи ширина дорожки задаётся шириной пишущей головки, а считывающая не использует всю ширину дорожки. При черепичной записи соседние дорожки в пределах ленты частично накладываются друг на друга подобно черепице и усекаются по ширине, что позволяет уместить больше дорожек с данными на блине. Для чтения оставшейся ширины достаточно, но пишущая головка затирает всю ленту и её приходится переписывать, что даёт побочный эффект в виде замедления работы накопителя.Описание от Seagate
BD9
Вто так лучше не объяснять, ибо ничего не понятно.
Shingled magnetic recording
thg.ru — журнашлюхи, в т.ч. дающие рекламу сайтов с MS виндой и офисом по 10$.
Черепичная запись даёт +25% ёмкости при падении случайной записи до примерно нуля. Производители ЖД устроили олигополию и оборзели. На SMR будут переводиться все ЖД — ибо +25% ёмкости, а на остальное — насрать.
Получается такая вот борьба с торрентами.
Один из выходов — использовать F2FS и подобные ФС (приспособленные для флэша и т.д.). Однако в openSUSE/SLE F2FS по умолчанию запрещена, ибо ненадёжна пока что.
ФС с COW похоже что лучше не использовать с SMR, т.е. яблочная APFS и виндовая ReFS тоже в пролёте.
igorp1024
А можно прояснить мысль про борьбу с торрентами? Это, в смысле, если торренты качать на рейд-массив из этих дисков (т.е., писать кучу мелких блоков), то они отказывают и таким образом вред торрентам?
gecube
яблочники скорее всего могут позволить себе ставить в imac отдельные серии накопителей, где не будет проблем. Либо SSD.
2gusia Автор
Новость плохая. Что такое SMR если не знаете — очень может быть вам и не надо. Это про тонкости организации дорожек на блине жесткого диска.
Если хотите мое объяснение
От Сигейта на Хабре
От NIX
saege5b
(Кидалово.)
MaximRV
Если аббревиатуры непонятны — новость не для вас. Всё просто, легче фильтровать нужные новости от ненужных.
bepas
2gusia
1) эти читатели считают Хабр лучшим ресурсом по HDD?2) когда не пускало
а) Ваша местная карма была отрицательной?
б) это не послужило Вам никаким «знАком»?
3) теперь, спустя несколько дней — Вы удовлетворены?
4) что еще я забыл спросить? (с)
5) спасибо за статью!
2gusia Автор
1 — вот что писали. Ну и на хабре у меня аккаунт есть, а много где — и нету. На муське еще есть — но там точно не в жилу :)
2а — да, -1. Не знаю уж за что — это моя первая публикация, минусовых комментов тоже не было.
2б — не-а :) мнение одного анонима — это точно не знак, это шум
3 — я даже удивлен. Приятно удивлен — ожидал более агрессивной реакции. Впрочем, 7 минусов набралось, так то все в целом нормально :)
4 — про здоровье — спасибо, хорошо. Надеюсь, как и у Вас ;)
5 — приятно быть хоть чуточку полезным людям
bepas
И тут приходится каждому самому решать :(
Еще раз спасибо и успехов всяческих — не только здоровья, а и ваще!
dartraiden
Да, и это вполне нормальное поведение контроллера. Нефиг щёлкать клювом в RAID-е. Не успел ответить за отведенное время — извини, накопитель, но семеро одного не ждут. В лучшем случае ты тормозишь, в худшем — ты сыпешься, поэтому проще тебя заранее заменить от греха подальше.
ShadowTheAge
Ну и вообще вся суть RAID в том что мы жертвуем объемом ради скорости/надежности, тогда как цель у SMR противоположная
vanyas
Нет, raid бывают разные, одни только для надежности (RAID1), другие только для скорости (RAID0, который не жертвует объемом) и другие, совмещающие скорость+надежность