Вопреки заявлениям рекламщиков Самсунга инженеры оной не только не исправили в 860х и 870х сериях SATA SSD ошибки предыдущих 840х и 850х, но и добавили новых. После трёх лет препирательств с пользователями разработчики подсистемы накопителей libata-core.c в Linux наконец-то приняли патчи, предлагавшиеся пользователями.
Когда-то Samsung выпускал оптические приводы, плохо читающие диски. Затем были НЖМД накопители, которые часто сбоили и ломались. Поэтому не было ничего удивительного в обнаружении ошибок в твёрдотельных накопителях этого производителя. Найти их признаки можно, поискав «FPDMA QUEUED» в выводе dmesg. Для SSD от Samsung уже давно наличествовали исправления в ядре Linux.
Прежний код libata-core.c для борьбы с ошибками Samsung SATA SSD:
{ "Samsung SSD 840*", NULL, ATA_HORKAGE_NO_NCQ_TRIM |
ATA_HORKAGE_ZERO_AFTER_TRIM, },
{ "Samsung SSD 850*", NULL, ATA_HORKAGE_NO_NCQ_TRIM |
ATA_HORKAGE_ZERO_AFTER_TRIM, },
Поэтому было удивительно узнать от представителей компании Самсунг, что в новой 860-й серии SSD, выпущенной в начале 2018 года, ошибки были исправлены. Как оказалось, старые ошибки там остались, и ещё появились новые.
Первая ошибка — для серий 840-870:
Накопители Samsung SSD SATA могут портить данные при выполнении команды Queued TRIM, которая используется в Linux (но не в Windows, поскольку разработчики Microsoft не считают её полезной). Подвержены SATA контроллеры Intel, AMD AM4 чипсетов (у более старых тяжелее ошибки — см. далее), Asmedia, Marvell и прочие. Лечится отключением Queued TRIM. Пользователи некоторых дистрибутивов Linux не видели этой ошибки из-за отключения этой фичи создателями дистрибутивов. Зачастую действует негласное правило: "Если Windows какую-то фичу не использует, то лучше её и нам не применять, ибо производители железа отказываются заниматься ошибками не-Windows пользователей".
Вторая ошибка — для серий 860-870:
Накопители Samsung SATA SSD могут портить данные и в разы снижают скорость при работе с SATA портами, подключёнными к южным мостам ATI - AMD. Здесь уже Windows может сбоить. Подвержены SATA контроллеры в южных мостах AM3+ и старее (SB 950 и старее). Лечится отключением NCQ для всех чипсетов c Vendor ID = 0x1002 (ATI). Скорость работы SSD накопителей падает от этого в 2-3 раза (до 10 раз в некоторых тестах).
Код libata-core.c для борьбы с ошибками Samsung SATA SSD выглядит теперь так:
{ "Samsung SSD 840*", NULL, ATA_HORKAGE_NO_NCQ_TRIM |
ATA_HORKAGE_ZERO_AFTER_TRIM, },
{ "Samsung SSD 850*", NULL, ATA_HORKAGE_NO_NCQ_TRIM |
ATA_HORKAGE_ZERO_AFTER_TRIM, },
{ "Samsung SSD 860*", NULL, ATA_HORKAGE_NO_NCQ_TRIM |
ATA_HORKAGE_ZERO_AFTER_TRIM |
ATA_HORKAGE_NO_NCQ_ON_ATI, },
{ "Samsung SSD 870*", NULL, ATA_HORKAGE_NO_NCQ_TRIM |
ATA_HORKAGE_ZERO_AFTER_TRIM |
ATA_HORKAGE_NO_NCQ_ON_ATI, },
Но есть ещё и
Третья ошибка — для неизвестных серий: Накопители Samsung SSD SATA сбоят при работе в устройствах со включённым энергосбережением у контроллеров SATA. Подвержены ноутбуки со включённым энергосбережением оных. Некоторые контроллеры по умолчанию не используют энергосбережение, но начинают это делать при установке пакета TLP. Он ставится по умолчанию для ноутбуков в некоторых дистрибутивах. Пример: openSUSE.
Обновления прошивок для накопителей Samsung SATA SSD пока что не исправили эти ошибки. SATA SSD накопители с чипами Phison, Marvell и прочими работают на том же железе хорошо.
Долгое время разработчики Linux тянули время с запросами пользователей на добавление патчей для глючных Самсунгов, утверждая, что-де у «вас там блок питания барахлит». Дополнительный толчок для применения патчей стал выпуск в 2021 году 870-й серии SATA SSD с теми же самыми ошибками, что и в 860-й.
Указанные патчи уже применяются в дистрибутивах Linux. Как обычно, можно поменять поведение по умолчанию на нужное с помощью параметров ядра. Возможна настройка с точностью до отдельного порта SATA. Есть способ лучше — использовать NVMe SSD (подходит и для старых систем).
Недавно главу Samsung под нажимом властных кругов досрочно выпустили из тюрьмы, где он отбывал срок за подкуп предыдущего президента (президентши) Южной Кореи и прочие дела.
Компания Samsung продолжает утверждать об отсутствии ошибок в их SATA SSD.
Источники:
https://www.phoronix.com/scan.php?page=news_item&px=Samsung-860-870-More-Quirks
https://bugzilla.kernel.org/show_bug.cgi?id=201693
https://bugzilla.kernel.org/show_bug.cgi?id=203475
https://github.com/torvalds/linux/blob/master/drivers/ata/libata-core.c
https://github.com/torvalds/linux/commit/7a8526a5cd51cf5f070310c6c37dd7293334ac49
https://en.wikipedia.org/wiki/List_of_AMD_chipsets
https://linux-hardware.org/?id=ide:samsung-ssd-860-evo-250gb
https://linux-hardware.org/?id=ide:samsung-ssd-860-evo-500gb
Комментарии (33)
Retifff
17.09.2021 20:42+8Компания
ГнусмасSamsung давно известна своими низкокачественными поделиямиТо-то эти "низкокачественные поделия" в лидерах продаж. Я про SSD.
0x24
18.09.2021 23:54+1У меня самого 860-ий. Но когда это высокие продажи стали свидетельствовать о качестве продукта?
dartraiden
17.09.2021 20:46Подвержены SATA контроллеры в южных мостах AM3+ и старее (SB 950 и старее)
Это касается не только Samsung. И это следствие того, что контроллер у AMD был хуже, чем у Intel.
www.ixbt.com/storage/ssd-p16-amd.shtml
www.ixbt.com/storage/ssd-p47-ctrl.shtml
Уважающие себя ресурсы тестировали накопители именно на платформе Intel.
Сейчас никаких проблем у AMD с SATA-контроллерами уже нет. Как и с процессорами.JerleShannara
17.09.2021 21:01+2Пссс, просто там теперь ip cores от asmedia в роли sata, usb и ещё много чего стоит.
zmc
17.09.2021 21:33+4Заказуха чистой воды, не?
d33
17.09.2021 22:24+1Был у меня привод DVD от самсунга.
Зацарапаный диск прочитал аки новый, работал тихо, писал ровно.
В комплекте шли разноцветные(!!!) сменные панельки для корпуса, коробка и куча болтов.
Годнота.
vlivyur
18.09.2021 02:12Где-то после CDD выше скоростей x8,Samsung скатился и больше их не покупали.Но что-то подсказывает что ваш случай тоже мог иметь место-у меня микроволновка от них 15лет проработала и продали её,потому что мыть не захотелось.
aamonster
18.09.2021 13:45+1С микроволновками вроде у них проблем никогда и не было, в годы дохнущих CD-ROM 52x и (позже вроде) HDD поговорка звучала как "Самсунгу нельзя делать ничего вращающегося, кроме столиков в микроволновку".
SergeiMinaev
17.09.2021 23:09Мне кажется, ТС просто столкнулся с проблемой на личном опыте и решил выговориться )
ShadowMaster
17.09.2021 23:24-2Было у меня 3 жестких диска от самсунга. Все умерли.
screwer
18.09.2021 02:18А у меня их террабайтник живой с 2011 года. Стоял в двух системах, и только недавно был снят используется как носимая дискета.
Что забавно - пережил переволюсовку, когда я взял пигтейл от модульного БП другой марки, только защитный диод выбило. Перепаял - и диск снова в строю. А вот Хитачи не выжил, в той же самой ситуации, с тем же самым пигтейлом.
Hisoka
18.09.2021 05:08WD 1тб, с 2009 работает. Живой.
LucasP
18.09.2021 10:02Seagate Barracuda 320GB, 2010 г. Тоже живой, хотя есть переназначенный сектор, но он в файлопомойке стоит и менять пока неохота.
ShadowMaster
18.09.2021 20:04+1WD 320 Гб, кажется 2006 года. Наработка 111 тысяч часов, почти 13 лет. Жив, продолжает трудится.
Seagate 12 серии живой. Тот самый у которых бывает муха цеце. Несколько переназначенных секторов из-за подохшего блока питания.
А самсунги сдохли, три из трёх. Кроме них умирал только один макстор.
Am0ralist
20.09.2021 14:06На текущей работе разбирал старые завалы жестких, коробочку мертвых дисков набрал, считай почти все сегейты — на 80-160 гб и немножко 250-320-500. Посмотрел в остатке — тоже большая часть за сигейтами, т.е. просто кто-то любил ставить в основном их, эх, а жаль, не получилось как у бэкблейзов статистику подбить) Но в общем сегейты складывается ощущение действительно побольше ломались, а как купили самсунговское подразделение…
Hait
18.09.2021 12:47Ну так-то любой диск при каком-то пределе умрёт. У меня два сегейта сдохло, через неделю +- после окончания гарантии
ZardoZAntony
18.09.2021 22:28Самсунги мои любимые были. Самые тихие и холодные. С 2008 года у меня их 500GB стоит.
redneko
17.09.2021 21:40+8Тема интересна, но тон, будто IT-версию СпидИнфо читал. По факту - ловил глюки на серверных PM моделях под CentOS, когда данные SSD одномоментно пропадали до ресета по питанию, но при этом дома такой же Samsung (860) в сервере живёт и радует безглючностью под OL8.4 без данных патчей.
SerjV
18.09.2021 00:26+2Вот да. Трабла с этими SSD под Линуксами вполне достойна внимания.
Но огульно охаивать Гнусмас - это перебор. У него есть свои скелеты в подполье (по тем же hdd в своё время сталкивался, хотя у сегейта "летательность" была куда выше), но если посмотреть на всю гамму производимой им продукции - то в среднем она как минимум не хуже среднего в своих классах (а так-то и в лидерах есть).
Именно поэтому и интересна тема про совместимость их SSD (как минимум надо себе это пометить даже)...
p.s. Хотелось написать популярную в своё время рекомендацию по исправлению ошибок, но её зацензурил РКН для защиты детей от информации
edo1h
19.09.2021 16:10По факту — ловил глюки на серверных PM моделях под CentOS, когда данные SSD одномоментно пропадали до ресета по питанию
можно детали?
при этом дома такой же Samsung (860) в сервере живёт и радует безглючностью под OL8.4 без данных патчей.
это вообще ни о чём не говорит. некоторые проблемы могут проявляться только при очень редком стечении обстоятельств
redneko
19.09.2021 16:32+1можно детали?
Работали в сервере 24/7, использовались чисто для загрузки CentOS7, записи на них не было (всё нужное было в tmpfs). Чипсет - intel c246. Спустя пару-тройку месяцев в dmesg куча выхлопа с FPDMA, сервер не пингуется. Лечилось ресетом по питанию через IPMI, после чего работало еще пару месяцев. Свежего fw на ssd не было. Конкретные модели увы уже не вспомню.
это вообще ни о чём не говорит. некоторые проблемы могут проявляться только при очень редком стечении обстоятельств
Согласен. Общее тут только - Oracle Linux, чипсет и производитель SSD
redneko
19.09.2021 16:42это вообще ни о чём не говорит. некоторые проблемы могут проявляться только при очень редком стечении обстоятельств
О, это вообще классика. Был еще случай. Закупали сервера HP ML350gen8. Ставили платы Decklink в них. Всё идеально работало до тех пор, пока Intel и HP не начали поставлять новые процессоры (Xeon E3 v2). И всё, приплыли - сервер мог завестись, а мог зависнуть в стадии PCIe link training error. Мог пройти POST и зависнуть позже. С серверами Dell было аналогично. Пришлось менять процы на старые. Весь ответ HP был - всё, что не входит в наш HCL ваши проблемы, несмотря на купленную поддержку.
gwg605
18.09.2021 00:10+2Тон и безаппеляционность заявления вызывает сомнения в достоверности данной информации.
Ну а совместимость системы с устройствами всегда была головной болью разработчиков. Все поразному понимают стандарт, и кричать о багах может только тот кто сам разрабатывал этот стандарт, но и это большой вопрос, может просто плохо написал стандарт... Ну и линукс не винда и макось, видишь проблему, пофикси и опубликуй изменения. Мой друг как раз так и сделал когда у него были проблемы с сетевой картой.
Зачем кидаться какашками? или надо было выговориться?romxx
20.09.2021 01:58Ну, что в Recovery Mode человек пишет, должно наводит на мысль, что прошлый раз у человека был еще менее удачный. Но тут видимо в прошивке надо что-то подправить :-}
edo1h
20.09.2021 02:36+1так все пруфы же приведены, что именно у вас вызывает сомнения?
gwg605
20.09.2021 03:35Какие пруфы? Что под Линуксом queued TRIM с Самсунгом не работает? В этом особо вопросов не было. А то что Самсунг не хочет исправлять проблему не увидел. А точно ли проблема у Самсунга? ;-) Я не нашел детального аудита где и как лажает Самсунг, честно говоря не очень старался, возможно оно где-то и существует. Вот с этого надо начинать пруфы. Ну и хотелось бы получить ответы почему Самсунг не хочет фиксить проблему? может там возможно двоякое толкование стандарта или какие-то другие проблемы? А может просто никогда не поддерживали, и пилить новую фичу экономичеси не выгодно? Где реальный разбор проблемы?
Ну и еще замечание: работал на проекте с моторолловским драгонболом, там errata был несколько страниц, на половину из перечисленного мы "наступили", но нашли ворэраунды на те проблемы на которые нарвались, переписали 90% рефернсного кода, и все стабильно заработало. В софте это сделать легче.
ЗЫ. Из статьи я узнал только то, что под Линуксом есть проблемы с Самсунгом. за это спасибо. но все остальное, вода :(edo1h
20.09.2021 05:31А то что Самсунг не хочет исправлять проблему не увидел.
а какие действия по исправлению он предпринял?
А точно ли проблема у Самсунга? ;-)
ну… по второй проблеме, вполне вероятно, нет.
но проблемный асинхронный трим — это почти наверняка проблема в прошивке.
Adler_lug
18.09.2021 09:18+1Когда-то Samsung выпускал оптические приводы, плохо читающие диски.
Когда-то может и выпускал, но у меня в начале 2000-х был обычный CD-Rom Samsung который успешно читал то, что соседские LG и Nec уже были не в состоянии прочитать. Не раз бывало, что ко мне приходили знакомые "в гости" со своими убитыми дисками, что бы с них скопировал содержимое.
И буквально на днях видел один раритетный комп из конца нулевых, на котором стоял такой точно обычный CD-Rom, который все еще успешно читал CD.
amarao
Картиночка у вас ... дурная.
BD9 Автор
Убрал.
Жду предложений по новой.