Вопреки заявлениям рекламщиков Самсунга инженеры оной не только не исправили в 860х и 870х сериях SATA SSD ошибки предыдущих 840х и 850х, но и добавили новых. После трёх лет препирательств с пользователями разработчики подсистемы накопителей libata-core.c в Linux наконец-то приняли патчи, предлагавшиеся пользователями.


Когда-то Samsung выпускал оптические приводы, плохо читающие диски. Затем были НЖМД накопители, которые часто сбоили и ломались. Поэтому не было ничего удивительного в обнаружении ошибок в твёрдотельных накопителях этого производителя. Найти их признаки можно, поискав «FPDMA QUEUED» в выводе dmesg. Для SSD от Samsung уже давно наличествовали исправления в ядре Linux.

Прежний код libata-core.c для борьбы с ошибками Samsung SATA SSD:

{ "Samsung SSD 840*", NULL, ATA_HORKAGE_NO_NCQ_TRIM |
ATA_HORKAGE_ZERO_AFTER_TRIM, },
{ "Samsung SSD 850*", NULL, ATA_HORKAGE_NO_NCQ_TRIM |
ATA_HORKAGE_ZERO_AFTER_TRIM, },

Поэтому было удивительно узнать от представителей компании Самсунг, что в новой 860-й серии SSD, выпущенной в начале 2018 года, ошибки были исправлены. Как оказалось, старые ошибки там остались, и ещё появились новые.

Первая ошибка — для серий 840-870:

Накопители Samsung SSD SATA могут портить данные при выполнении команды Queued TRIM, которая используется в Linux (но не в Windows, поскольку разработчики Microsoft не считают её полезной). Подвержены SATA контроллеры Intel, AMD AM4 чипсетов (у более старых тяжелее ошибки — см. далее), Asmedia, Marvell и прочие. Лечится отключением Queued TRIM. Пользователи некоторых дистрибутивов Linux не видели этой ошибки из-за отключения этой фичи создателями дистрибутивов. Зачастую действует негласное правило: "Если Windows какую-то фичу не использует, то лучше её и нам не применять, ибо производители железа отказываются заниматься ошибками не-Windows пользователей".

Вторая ошибка — для серий 860-870:

Накопители Samsung SATA SSD могут портить данные и в разы снижают скорость при работе с SATA портами, подключёнными к южным мостам ATI - AMD. Здесь уже Windows может сбоить. Подвержены SATA контроллеры в южных мостах AM3+ и старее (SB 950 и старее). Лечится отключением NCQ для всех чипсетов c Vendor ID = 0x1002 (ATI). Скорость работы SSD накопителей падает от этого в 2-3 раза (до 10 раз в некоторых тестах).

Код libata-core.c для борьбы с ошибками Samsung SATA SSD выглядит теперь так:

{ "Samsung SSD 840*",		NULL,	ATA_HORKAGE_NO_NCQ_TRIM |
						ATA_HORKAGE_ZERO_AFTER_TRIM, },
{ "Samsung SSD 850*",		NULL,	ATA_HORKAGE_NO_NCQ_TRIM |
						ATA_HORKAGE_ZERO_AFTER_TRIM, },
{ "Samsung SSD 860*",		NULL,	ATA_HORKAGE_NO_NCQ_TRIM |
						ATA_HORKAGE_ZERO_AFTER_TRIM |
						ATA_HORKAGE_NO_NCQ_ON_ATI, },
{ "Samsung SSD 870*",		NULL,	ATA_HORKAGE_NO_NCQ_TRIM |
						ATA_HORKAGE_ZERO_AFTER_TRIM |
						ATA_HORKAGE_NO_NCQ_ON_ATI, },

Но есть ещё и

Третья ошибка — для неизвестных серий: Накопители Samsung SSD SATA сбоят при работе в устройствах со включённым энергосбережением у контроллеров SATA. Подвержены ноутбуки со включённым энергосбережением оных. Некоторые контроллеры по умолчанию не используют энергосбережение, но начинают это делать при установке пакета TLP. Он ставится по умолчанию для ноутбуков в некоторых дистрибутивах. Пример: openSUSE.

Обновления прошивок для накопителей Samsung SATA SSD пока что не исправили эти ошибки. SATA SSD накопители с чипами Phison, Marvell и прочими работают на том же железе хорошо.

Долгое время разработчики Linux тянули время с запросами пользователей на добавление патчей для глючных Самсунгов, утверждая, что-де у «вас там блок питания барахлит». Дополнительный толчок для применения патчей стал выпуск в 2021 году 870-й серии SATA SSD с теми же самыми ошибками, что и в 860-й.

Указанные патчи уже применяются в дистрибутивах Linux. Как обычно, можно поменять поведение по умолчанию на нужное с помощью параметров ядра. Возможна настройка с точностью до отдельного порта SATA. Есть способ лучше — использовать NVMe SSD (подходит и для старых систем).

Недавно главу Samsung под нажимом властных кругов досрочно выпустили из тюрьмы, где он отбывал срок за подкуп предыдущего президента (президентши) Южной Кореи и прочие дела.

Компания Samsung продолжает утверждать об отсутствии ошибок в их SATA SSD.

Источники:

https://www.phoronix.com/scan.php?page=news_item&px=Samsung-860-870-More-Quirks

https://bugzilla.kernel.org/show_bug.cgi?id=201693

https://bugzilla.kernel.org/show_bug.cgi?id=203475

https://github.com/torvalds/linux/blob/master/drivers/ata/libata-core.c

https://github.com/torvalds/linux/commit/7a8526a5cd51cf5f070310c6c37dd7293334ac49

https://en.wikipedia.org/wiki/List_of_AMD_chipsets

https://linux-hardware.org/?id=ide:samsung-ssd-860-evo-250gb

https://linux-hardware.org/?id=ide:samsung-ssd-860-evo-500gb

https://linux-hardware.org/?id=ide:samsung-ssd-860-evo-1tb

https://linux-hardware.org/?probe=5a21d12b42

Комментарии (33)


  1. amarao
    17.09.2021 20:23
    +2

    Картиночка у вас ... дурная.


    1. BD9 Автор
      17.09.2021 20:25

      Убрал.
      Жду предложений по новой.


  1. Retifff
    17.09.2021 20:42
    +8

    Компания Гнусмас Samsung давно известна своими низкокачественными поделиями

    То-то эти "низкокачественные поделия" в лидерах продаж. Я про SSD.


    1. dartraiden
      17.09.2021 20:45
      +12

      И в лидерах по выносливости.


      1. senchik
        18.09.2021 23:54
        +2

        Главное чтобы не получилось как с фольцвагеном и дизельгейтом


    1. 0x24
      18.09.2021 23:54
      +1

      У меня самого 860-ий. Но когда это высокие продажи стали свидетельствовать о качестве продукта?


  1. dartraiden
    17.09.2021 20:46

    Подвержены SATA контроллеры в южных мостах AM3+ и старее (SB 950 и старее)
    Это касается не только Samsung. И это следствие того, что контроллер у AMD был хуже, чем у Intel.

    www.ixbt.com/storage/ssd-p16-amd.shtml
    www.ixbt.com/storage/ssd-p47-ctrl.shtml

    Уважающие себя ресурсы тестировали накопители именно на платформе Intel.

    Сейчас никаких проблем у AMD с SATA-контроллерами уже нет. Как и с процессорами.


    1. JerleShannara
      17.09.2021 21:01
      +2

      Пссс, просто там теперь ip cores от asmedia в роли sata, usb и ещё много чего стоит.


  1. zmc
    17.09.2021 21:33
    +4

    Заказуха чистой воды, не?


    1. d33
      17.09.2021 22:24
      +1

      Был у меня привод DVD от самсунга.

      Зацарапаный диск прочитал аки новый, работал тихо, писал ровно.

      В комплекте шли разноцветные(!!!) сменные панельки для корпуса, коробка и куча болтов.

      Годнота.


      1. vlivyur
        18.09.2021 02:12

        Где-то после CDD выше скоростей x8,Samsung скатился и больше их не покупали.Но что-то подсказывает что ваш случай тоже мог иметь место-у меня микроволновка от них 15лет проработала и продали её,потому что мыть не захотелось.


        1. aamonster
          18.09.2021 13:45
          +1

          С микроволновками вроде у них проблем никогда и не было, в годы дохнущих CD-ROM 52x и (позже вроде) HDD поговорка звучала как "Самсунгу нельзя делать ничего вращающегося, кроме столиков в микроволновку".


    1. SergeiMinaev
      17.09.2021 23:09

      Мне кажется, ТС просто столкнулся с проблемой на личном опыте и решил выговориться )


    1. ShadowMaster
      17.09.2021 23:24
      -2

      Было у меня 3 жестких диска от самсунга. Все умерли.


      1. screwer
        18.09.2021 02:18

        А у меня их террабайтник живой с 2011 года. Стоял в двух системах, и только недавно был снят используется как носимая дискета.

        Что забавно - пережил переволюсовку, когда я взял пигтейл от модульного БП другой марки, только защитный диод выбило. Перепаял - и диск снова в строю. А вот Хитачи не выжил, в той же самой ситуации, с тем же самым пигтейлом.


        1. Hisoka
          18.09.2021 05:08

          WD 1тб, с 2009 работает. Живой.


          1. LucasP
            18.09.2021 10:02

            Seagate Barracuda 320GB, 2010 г. Тоже живой, хотя есть переназначенный сектор, но он в файлопомойке стоит и менять пока неохота.


            1. ShadowMaster
              18.09.2021 20:04
              +1

              WD 320 Гб, кажется 2006 года. Наработка 111 тысяч часов, почти 13 лет. Жив, продолжает трудится.

              Seagate 12 серии живой. Тот самый у которых бывает муха цеце. Несколько переназначенных секторов из-за подохшего блока питания.

              А самсунги сдохли, три из трёх. Кроме них умирал только один макстор.


              1. Am0ralist
                20.09.2021 14:06

                На текущей работе разбирал старые завалы жестких, коробочку мертвых дисков набрал, считай почти все сегейты — на 80-160 гб и немножко 250-320-500. Посмотрел в остатке — тоже большая часть за сигейтами, т.е. просто кто-то любил ставить в основном их, эх, а жаль, не получилось как у бэкблейзов статистику подбить) Но в общем сегейты складывается ощущение действительно побольше ломались, а как купили самсунговское подразделение…


      1. Hait
        18.09.2021 12:47

        Ну так-то любой диск при каком-то пределе умрёт. У меня два сегейта сдохло, через неделю +- после окончания гарантии


      1. ZardoZAntony
        18.09.2021 22:28

        Самсунги мои любимые были. Самые тихие и холодные. С 2008 года у меня их 500GB стоит.


    1. edo1h
      20.09.2021 02:35

      коммиты в ядре тоже заказуха?


  1. redneko
    17.09.2021 21:40
    +8

    Тема интересна, но тон, будто IT-версию СпидИнфо читал. По факту - ловил глюки на серверных PM моделях под CentOS, когда данные SSD одномоментно пропадали до ресета по питанию, но при этом дома такой же Samsung (860) в сервере живёт и радует безглючностью под OL8.4 без данных патчей.


    1. SerjV
      18.09.2021 00:26
      +2

      Вот да. Трабла с этими SSD под Линуксами вполне достойна внимания.

      Но огульно охаивать Гнусмас - это перебор. У него есть свои скелеты в подполье (по тем же hdd в своё время сталкивался, хотя у сегейта "летательность" была куда выше), но если посмотреть на всю гамму производимой им продукции - то в среднем она как минимум не хуже среднего в своих классах (а так-то и в лидерах есть).

      Именно поэтому и интересна тема про совместимость их SSD (как минимум надо себе это пометить даже)...

      p.s. Хотелось написать популярную в своё время рекомендацию по исправлению ошибок, но её зацензурил РКН для защиты детей от информации


    1. edo1h
      19.09.2021 16:10

      По факту — ловил глюки на серверных PM моделях под CentOS, когда данные SSD одномоментно пропадали до ресета по питанию

      можно детали?


      при этом дома такой же Samsung (860) в сервере живёт и радует безглючностью под OL8.4 без данных патчей.

      это вообще ни о чём не говорит. некоторые проблемы могут проявляться только при очень редком стечении обстоятельств


      1. redneko
        19.09.2021 16:32
        +1

        можно детали?

        Работали в сервере 24/7, использовались чисто для загрузки CentOS7, записи на них не было (всё нужное было в tmpfs). Чипсет - intel c246. Спустя пару-тройку месяцев в dmesg куча выхлопа с FPDMA, сервер не пингуется. Лечилось ресетом по питанию через IPMI, после чего работало еще пару месяцев. Свежего fw на ssd не было. Конкретные модели увы уже не вспомню.

        это вообще ни о чём не говорит. некоторые проблемы могут проявляться только при очень редком стечении обстоятельств

        Согласен. Общее тут только - Oracle Linux, чипсет и производитель SSD


      1. redneko
        19.09.2021 16:42

        это вообще ни о чём не говорит. некоторые проблемы могут проявляться только при очень редком стечении обстоятельств

        О, это вообще классика. Был еще случай. Закупали сервера HP ML350gen8. Ставили платы Decklink в них. Всё идеально работало до тех пор, пока Intel и HP не начали поставлять новые процессоры (Xeon E3 v2). И всё, приплыли - сервер мог завестись, а мог зависнуть в стадии PCIe link training error. Мог пройти POST и зависнуть позже. С серверами Dell было аналогично. Пришлось менять процы на старые. Весь ответ HP был - всё, что не входит в наш HCL ваши проблемы, несмотря на купленную поддержку.


  1. gwg605
    18.09.2021 00:10
    +2

    Тон и безаппеляционность заявления вызывает сомнения в достоверности данной информации.


    Ну а совместимость системы с устройствами всегда была головной болью разработчиков. Все поразному понимают стандарт, и кричать о багах может только тот кто сам разрабатывал этот стандарт, но и это большой вопрос, может просто плохо написал стандарт... Ну и линукс не винда и макось, видишь проблему, пофикси и опубликуй изменения. Мой друг как раз так и сделал когда у него были проблемы с сетевой картой.


    Зачем кидаться какашками? или надо было выговориться?


    1. romxx
      20.09.2021 01:58

      Ну, что в Recovery Mode человек пишет, должно наводит на мысль, что прошлый раз у человека был еще менее удачный. Но тут видимо в прошивке надо что-то подправить :-}


    1. edo1h
      20.09.2021 02:36
      +1

      так все пруфы же приведены, что именно у вас вызывает сомнения?


      1. gwg605
        20.09.2021 03:35

        Какие пруфы? Что под Линуксом queued TRIM с Самсунгом не работает? В этом особо вопросов не было. А то что Самсунг не хочет исправлять проблему не увидел. А точно ли проблема у Самсунга? ;-) Я не нашел детального аудита где и как лажает Самсунг, честно говоря не очень старался, возможно оно где-то и существует. Вот с этого надо начинать пруфы. Ну и хотелось бы получить ответы почему Самсунг не хочет фиксить проблему? может там возможно двоякое толкование стандарта или какие-то другие проблемы? А может просто никогда не поддерживали, и пилить новую фичу экономичеси не выгодно? Где реальный разбор проблемы?

        Ну и еще замечание: работал на проекте с моторолловским драгонболом, там errata был несколько страниц, на половину из перечисленного мы "наступили", но нашли ворэраунды на те проблемы на которые нарвались, переписали 90% рефернсного кода, и все стабильно заработало. В софте это сделать легче.

        ЗЫ. Из статьи я узнал только то, что под Линуксом есть проблемы с Самсунгом. за это спасибо. но все остальное, вода :(


        1. edo1h
          20.09.2021 05:31

          А то что Самсунг не хочет исправлять проблему не увидел.

          а какие действия по исправлению он предпринял?


          А точно ли проблема у Самсунга? ;-)

          ну… по второй проблеме, вполне вероятно, нет.
          но проблемный асинхронный трим — это почти наверняка проблема в прошивке.


  1. Adler_lug
    18.09.2021 09:18
    +1

    Когда-то Samsung выпускал оптические приводы, плохо читающие диски.

    Когда-то может и выпускал, но у меня в начале 2000-х был обычный CD-Rom Samsung который успешно читал то, что соседские LG и Nec уже были не в состоянии прочитать. Не раз бывало, что ко мне приходили знакомые "в гости" со своими убитыми дисками, что бы с них скопировал содержимое.

    И буквально на днях видел один раритетный комп из конца нулевых, на котором стоял такой точно обычный CD-Rom, который все еще успешно читал CD.