RAM диск, это PCIe диск построенный на базе чипов RAM памяти. Такой диск не может сохранять данные после отключения питания (если не используется поддерживающий аккумулятор), но обладает исключительно высокими скоростями чтения/записи (особенно для случая рандомного доступа), а также имеет неограниченный ресурс. Это важно в задачах, требующих большого количества циклов перезаписи информации, где даже профессиональные SSD диски не выживают долго. Для операционной системы RAM диск должен быть неотличим от SSD или HDD диска и не требовать специальных драйверов или настройки. В отличие от диска, виртуально размещённого в RAM памяти компьютера, где максимальный объём памяти ограничен 128-256 ГБ у лучших материнских плат, RAM диск для PCIe слота, в общем случае, не имеет лимитов объёма и может работать в любой материнской плате с PCIe слотом.
Этот проект начался несколько лет назад в рамках DC программы (*distributed computing – распределённые вычисления). Со временем скорость интернет-соединения выросла и основной проблемой скорости DC стала низкая скорость HDD. SSD частично решали эту проблему, но повышенный износ SSD, вызванный постоянной перезаписью заданий, отталкивал новых пользователей DC сети. Никому не хочется гробить свой недешёвый SSD ради абстрактной цели. Но ресурс и большая скорость записи/чтения с равномерной латентностью очень важны для DC вычислений, где задержка или сбой в каждом сегменте замедляет всю сеть вычислителей.
В этот момент наша команда сформировала образ будущего RAM диска на базе re-fan (*бывшей в употреблении и перепаянной) DDR памяти. Дело в том, что такая память стоит достаточно дёшево – примерно 40 центов за гигабайт для DDR3 – и хорошо доступна в больших количествах. Перепайка, выполненная с соблюдением температурных режимов, не вредит RAM чипам. Такие производители памяти как Kllisre, ZIFEI, TANBASSH, Rasalas etc. используют именно re-fan чипы. Они же установлены в большинстве бюджетных ноутбуков и планшетов Китайских производителей. Использование re-fan позволяет снизить стоимость конечного устройства до приемлемых значений без потери его характеристик или надёжности.
Вторым очевидным условием было то, чтобы будущий диск работал в системе также, как HDD или SSD диск и был бы полностью совместим с операционной системой и программными продуктами. Поэтому за основу был взят чип Silicon Motion SM2262EN. Этот чип поддерживает PCIe x4, NVME 1.3, собственную DDR память для буферизации и 8 каналов NAND/TLC памяти. Благодаря этому он может использовать всю доступную скорость PCIe x4 не теряя её.
Первая проблема таилась в том, что интерфейсы NAND и DDR памяти очень сильно отличаются и просто так подключить DDR вместо NAND не получится.
Вторая проблема была в том, что длина дорожек между DDR чипом и SM2262EN не может быть бесконечной. А чтобы набрать объём в 1 TB нам потребуется 256 чипов DDR памяти по 4GB каждый.
Напрашивалось использование FPGA в роли промежуточного звена между SM2262EN и DDR, но третья проблема состояла в том, что HMC FPGA не может адресовать такое количество чипов DDR памяти (данный диск возможен в версиях от 128 гигабайт до 2 терабайт).
Я не буду тратить ваше время на историю наших поисков, но, в итоге, мы пришли к архитектуре с четырьмя FPGA, равномерно распределёнными по плате, каждая из которых подключена к двум банкам по 32 чипа DDR и программно имитирует работу двух NAND чипов каждая.
Благодаря этому решению SM2262EN не видит трюка и работает с памятью также, как с NAND чипами. Длины дорожек между FPGA и самым дальним DDR чипом в банке находятся в рамках допустимого и их импедансы могут быть согласованы, используя резисторы и DCI (*Digitally Controlled Impedance) технологию. Большая площадь 12-и слойной платы и изобилие свободного места позволило нам сократить множество пассивных компонентов используя межслойную ёмкость и сопротивление самих проводников. Данные решения тщательно обкатывались в HyperLynx и позже подтвердили работоспособность в прототипе. Пример такой трассировки изображён на рис. ниже.
Дополнительно на плате установлены управляемые источники питания (PIMC) и система загрузки с двумя чипами памяти BIOS, содержащими битстримы и настроечную информацию. Два чипа установлены из соображений надёжности. Также диск имеет индикатор нагрузки и семисегментный индикатор, на который выводятся статусы работы диска, коды самодиагностики и ошибок. Этот маленький помощник позволит оперативно диагностировать диск и выявлять проблемы. Ниже показан проект печатной платы и изготовленные образцы:
Тестирование диска показало скорость чтения/записи на уровне 7000/6000 МБ/с соответственно, что является пределом для PCIeX4 gen 4 и приближается к пределу скорости DDR3 памяти (см. скриншот из этого видео).
Особенно примечательны результаты тестов RND4K Q32T16 и Q1T1 – такая скорость достигается за счёт особенностей работы банка памяти DDR чипов, представляющего собой виноградную гроздь из носителей малого объёма, что позволяет работать с ними параллельно и одновременно, в отличие от одного единственного NAND чипа. Нам не известны SSD диски, способные показать сравнимую скорость в таких тестах.
На рисунке ниже показаны основные элементы управления DDRAM диском. Это индикатор нагрузки, дисплей и кнопка самотеста. После нажатия данной кнопки диск отключает весь обмен по PCIe и запускает тестирование всех своих элементов, включая чипы памяти. Все данные на диске будут уничтожены при этом. В течение теста индикатор показывает номер тестируемого банка памяти. Если тест пройден, индикатор покажет P = passed. В противном случае будет отображён код ошибки. Для удобства пользователя таблица расшифровки кодов ошибок нарисована на плате диска справа от индикатора. Во время работы индикатор мигает десятичной точкой с частотой 2 Гц. Это является признаком нормальной работы всех систем диска.
С обратной стороны платы диска установлены чипы DDR памяти, накрытые радиатором. Радиатор необходим, т.к. чипы установлены очень плотно и снизу дополнительно подогреваются чипами FPGA и другими элементами устройства. Радиатор не только отводит лишнее тепло, но также выравнивает нагрев различных участков платы диска, что исключает перекос характеристик DDR чипов вызванный неравномерным нагревом. Использован сухой термоинтерфейс на базе термопрокладки от 3M.
Для снижения механической нагрузки на PCIe разъём и упрощения установки диска в материнскую плату диск имеет выступ на плате, опирающийся на край разъёма. При необходимости этот выступ можно отломать, для этого предусмотрена линия разлома из просверленных в ряд отверстий. Однако, мы пока не встречали материнскую плату, где он бы мешал.
Во время ресурсных испытаний диск отработал 200 часов непрерывно под максимальной нагрузкой и чередующимися операциями чтения/записи. Никаких изменений в характеристиках диска отмечено не было. Ниже можно увидеть видео тестирования скорости:
Сейчас мы тестируем прототип RAM диска, использующего два чипа SM2262EN параллельно и работающего в слоте x8. Ожидаемо, скорость выросла вдвое.
Комментарии (194)
kolu4iy
14.07.2021 17:19+13Не знаю зачем, но shut up and take my money!
Hlad
15.07.2021 08:23+4Подозреваю, что это устройство разрабатывалось для майнинга Chia. Но Chia фактически загнулась до завершения разработки, и поэтому приходится обходиться мутными формулировками при ответе на вопрос «зачем?»
Хотя по дешёвке такую фигню даже я купил бы: например, чтобы иногда ставить на неё тяжелые игрухи.zartarn
15.07.2021 09:08К сожалению у них на сайте нет даже подписки на какую нибудь рассылку, чтоб узнать о том что оно появилось в продаже. :(
ZyXI
16.07.2021 01:01Устройство выглядит как отличное место для хранения какого‐нибудь кеша. Если бы у меня была такая штука, я бы стал смотреть, не могу ли я использовать её в качестве кеширующего устройства для моего RAID5 (с помощью bcache) (с кешированием только чтений, конечно) или даже дополнительно включить в состав RAID1 массива, в котором у меня находится / (по сути тот же кеш, только с гарантией, что mdadm скопирует туда все данные).
emashev
17.07.2021 16:57У нас была большая БД, которую приходилось восстанавливать из бекапа ежедневно, проверять целостность, создавать версии с деперсонализацией и расскатывать потом по разным стендам. Причем, весь процесс занимал почти 20 часов. ССД работали на пределе своих возможностей, такая штука ускорила бы процесс.
VaalKIA
14.07.2021 17:53Почему скорость на 4Кб, просела вдое?
Hisoka
14.07.2021 20:03+4Потому что увеличилось соотношение количества служебной информации к полезной.
JerleShannara
14.07.2021 21:08+1Потому, что DDR эффективна тогда, когда чтение/запись идёт большими burst запросами.
DistortNeo
14.07.2021 23:00Burst-запрос для DDR-3 имеет длину в 8 слов (16 байт). Если мы читаем блоками по 4 КБ, то это сразу становится последовательным доступом.
vanxant
14.07.2021 23:47+4Не, с этим нормально. Просто страница ддр имеет размер 8к, а не 4к, а переключение страниц стоит дорого.
DistortNeo
15.07.2021 11:44Полнейшая чушь. Это справедливо, если мы читаем по 16 байт из случайных страниц. Но мы только один раз переключаемся на страницу и вычитываем её последовательно.
Задача для самостоятельной работы: найдите, сколько тактов занимает активация строки, а дальше посчитайте, какую долю времени занимает активация строки в бенчмарке. Если всё так, как вы пишете, то переключение страниц должно занимать около 300-500 нс, в реальной памяти это значение на порядок меньше.
Так что снижение скорости при работе блоками по 4К объясняется только логикой работы контроллера, который считает, что работать с флеш-памятью.
vanxant
15.07.2021 13:44Ну разберитесь как работает ддр память.
Сами ячейки драм не стали сильно быстрее со времён 286-ых. Ну да, снизили напряжение с 5В до 1.7 (в ддр3), вот в три раза рост. Ну что-то схемотехникой добавили. Итого реальная частота ячеек 66 - 100 МГц.
При открытии страницы память считывает во внутренний кэш (ну ок, линейку операционников) страницу (строку) размером 8К целиком. При закрытии страницы - обязательно записывает эти 8К обратно, потому что конденсаторы при чтении разрядились, и в них пусто. И только после этого может открыть другую страницу. Сколько там тайминги у конкретно этой ддр? 21? 23? Тут возможно ещё и чипы "разнокалиберные", поэтому тайминги по самому медленному стоят. Итого на лишнее переключение страницы, т.е. на открыть-закрыть-открыть, уходит грубо 65-70 тактов. Вычитать из кэша открытой страницы 4К на двойной скорости при 4 каналах это ... тоже 64 такта.
Просто уж очень подозрительно падает производительность ровно в два раза при переходе от 1М блоков (где читаются 8К страницы целиком) к 4К блокам.
DistortNeo
15.07.2021 14:17Сколько там тайминги у конкретно этой ддр? 21? 23?
Тайминги считаются относительно частоты шины (до 1000 МГц, а не 100 МГц).
Итого на лишнее переключение страницы, т.е. на открыть-закрыть-открыть, уходит грубо 65-70 тактов. Вычитать из кэша открытой страницы 4К на двойной скорости при 4 каналах это… тоже 64 такта.
Нет, канал в данном случае один. И вычитать 4К — это 512 тактов. Теперь понимаете, что переключение страниц здесь никакой роли не играете?
Просто уж очень подозрительно падает производительность ровно в два раза при переходе от 1М блоков (где читаются 8К страницы целиком) к 4К блокам.
А вам не кажется, что это банально связано с тем, что контроллер думает, что работает с флеш-памятью? И какие внутри него используются алгоритмы — а чёрт его знает.
vanxant
15.07.2021 14:24Нет, канал в данном случае один
А вы на картинки точно смотрели?каждая из которых подключена к двум банкам по 32 чипа DDR
Т.е. тут ширина шины 256 бит, а не 64, что эквивалентно 4 каналам.вычитать 4К — это 512 тактов
Нет, за такт передается 16 байт, ибо ддрDistortNeo
15.07.2021 14:40Т.е. тут ширина шины 256 бит, а не 64, что эквивалентно 4 каналам.
Интересно, из каких соображений вы сделали вывод о ширине шины? То, что она подключена к двум банкам по 32 чипа, ещё не означает, что работа осуществляется со всеми чипами одновременно.
К тому же, в тексте явно написано:
Тестирование диска показало скорость чтения/записи на уровне 7000/6000 МБ/с соответственно, что является пределом для PCIeX4 gen 4 и приближается к пределу скорости DDR3 памяти
Из чего следует, что речь идёт о скорости, эквивалентной одному каналу.
Нет, за такт передается 16 байт, ибо ддр
16 байт относительно Clock Rate, либо 8 байт относительно Transfer Rate.
Если тайминги считаются относительно Clock Rate, тогда да, ошибся — 256 тактов на передачу 4К данных.В любом случае: прочитать 8K без переключения страниц будет 512 тактов + 1 переключение (70 тактов) + ещё небольшой оверхед (CL там всякие), а прочитать 2 раза по 4K — те же 512 тактов + 2 переключения + двойной оверхед. То есть около 600 тактов против около 700 тактов. Это уже не в полтора раза разница.
Вообще, как мне кажется, узким местом может являться ещё и использование встроенной памяти в самом контроллере.
EmbeNewsMaker Автор
16.07.2021 01:38Не сложно гуглятся статьи эпохи ДДР3 с тестами виртуальных рам дисков прямо в оперативе. И везде просадка на 4к.
https://www.foxnews.com/tech/faster-than-an-ssd-how-to-turn-extra-memory-into-a-ram-disk https://kuharbogdan.com/stati-po-1s/1s-na-ram-diske-chast-2-testyi/amp/
DistortNeo
16.07.2021 02:53+1И везде просадка на 4к.
Угу. На первой картинке — в 6 раз, на второй — в 10. Но виновата не операционка и софт, а почему-то особенность работы памяти, хотя никаких разумных объяснений этому нет. Похоже на заговор плоскоземельщиков.
Чтобы эксперимент был чистым, надо сранивать блоки 4К, 8К, 16К друг с другом, а не 4К и 512К.
checkpoint
14.07.2021 17:57Интересно, сколько это добро потребляет электроэнергии ?
Ну стоимость разработки тоже интересна, хотя бы прикидочно.
hw_store
14.07.2021 19:43+4Это переводная статья, надо писать автору первоисточника )))
...мне тоже интересно
Hlad
15.07.2021 08:23Учитывая пассивный радиатор — в районе 10-20 Вт, вряд ли больше.
dragonnur
27.10.2021 08:06Для пассивного радиатора при температуре 40-50 Ц нормально рассеивать по ватту на 16 кв.см. Тут навскидку 300 кв. см, так что оценка ближе к верхней границе, а если терможвачка и электроника в целом выдержат 70 Ц - то можно и все 50 вт рассеять.
beho1der
14.07.2021 18:12+1Очень интересная итоговая стоимость,а переиспользование DDR3 очень круто, позволяет отложить ее переработку!
PereslavlFoto
14.07.2021 19:53+3Переработка DDR3 не нужна, потому что в России огромный спрос на такую память. Я знаю несколько организаций, где с радостью примут ненужную память.
dcoder_mm
14.07.2021 21:40А можете ли вы (или кто нибудь еще кто это читает) мне объяснить есть ли смысл вообще в переработке электронных компонентов?
Единственное что я читал об этом, это вот эта заметка (не разрядите человеку сайт хабраэффектом, там сервер на солнечной батарейке работает) 2009 года, где автор сокрушается, что большая часть ресурсов вложенных в производство чипа в этом чипе не содержится и потрачены безвозвратно.ba00
15.07.2021 00:20+3В "бытовых условиях" добывают только золото и серебро, в промышленных еще ряд ценных металлов. Посмотрите почем принимают комплектующие на переработку.
Am0ralist
15.07.2021 10:59+1Не только, ещё платину и насколько других осаждают, если уверены, что есть не только золото и серебро в заметных количествах.
Принимают за небольшие суммы, кстати.
gxcreator
15.07.2021 10:42+1Финансовый смысл есть, китайцы вполне себе перерабатывают память, можно на али встретить модули с затертой маркировкой и кривым SPD, которые судя по всему собраны из разных чипов, сдутых с б/у железа.
Еще отлично переиспользуются старые блоки питания. Например некоторые T12 STM32 паяльные станции с того же али имеют в себе старые бп от макбука.
dcoder_mm
15.07.2021 10:56+1Но то что вы назвали это скорее upcycling, а я имел ввиду переработку самих компонентов (чипы памяти, процессоры). Вот как выше писали про извлечение металлов. Я правда всё еще не могу представить что это выгодно для обычных микросхем.
С другой стороны вы правы в том, что в выброшенном устройстве из огромной кучи деталей скорее всего сломалось всего несколько, поэтому переработка убитых чипов не так важна как переиспользование оставшихся.Am0ralist
15.07.2021 11:00+1Я правда всё еще не могу представить что это выгодно для обычных микросхем.
Вы просто плохо знаете химию (ахтунг, залипучие видео)dcoder_mm
15.07.2021 12:29+5При всём уважении, но видео это самый проклятый в плане навигации и поиска информации вид контента в интернете. Давать ссылку на длинное видео без таймингов и пояснений уже считается чем-то неприличным, а уж на целый канал тем более. Инопланетяне из книжек Уоттса сочли бы это актом неприкрытой агрессии.
У меня ушло несколько минут на поиски видео не про золотые разъемы, и тыканье вот в этом видео чтобы понять сколько желтого металла (я действительно не знаю химию, а в видео нет ни одной формулы или другой оценки чистоты выхода) получилось из кулька мостов. 1.76гр из 220гр — 0.8%.
Тогда как пдфки на поиск которых, и поиск золота в которых я тоже потратил пару минут, раз (не чипы, но целые устройства. стр 22 и дальше) и два (для чипов, но не понятно каких, судя по фото DIP и SOIC. стр 4) дают оценку около 0.1%.Так или иначе, даже 0.1% оказывается в 100 раз лучше чем high grade gold ore (10ppm) из шахты.
Am0ralist
15.07.2021 13:33-1Ну у меня таймингов его видео тоже нет, я просто их смотрю по мере выпусков.
Содержимое золота и серебра в разных чипах — разное. И в общем падает со временем — в более старых больше золота, чем в новых. А ещё отдельно контакты с плат — тоже позолоченные.
Чистоту он процентов 90-99 получает (путем перерастроверния повторного).
PS. Химические формулы он в видео периодически вставляетvvzvlad
15.07.2021 17:09Изначальный вопрос был про переработку компонентов, а не плат/разьемов. Текстолит стоит сильно дешевле кремния.
Am0ralist
15.07.2021 17:32Изначальный вопрос касался компонентов, переработки памяти в целом, и даже в том комменте, которому отвечал, было написано «процессор».
Угадайте, сколько золота можно добыть из кучки старых процессоров с ножками даже без пережигания его чипа.
Поэтому я уточнил, что кроме чипов ещё и другие элементы компьютерных компонентов перерабатывают в поисках золота.
xFFFF
15.07.2021 12:57Кроме извлечения ценных металлов, все остальное нерентабельно. Тот же кремний проще получить из природного сырья, чем из бу микросхем.
Все, что не подходит для вторичного использования, и не содержит ценных металлов - отправляется на свалку.
nixtonixto
15.07.2021 10:53+1Смысл в переработке есть, т.к. содержание драгметаллов в электронных компонентах на порядки выше, чем их содержание в земле. И одновременно уменьшаются мусорные полигоны. Но для окупаемости нужны БелАЗовские объёмы.
Большинство продаваемых на Али микросхем и модулей — распай или сделаны из распая.
dcoder_mm
14.07.2021 18:13+3Это всё интересно, но можно ли её развернуть лицом в бездонный космос и ловить Single Event Upset от космических лучей? Вот эта пдф говорит о порядка 1E-12 ошибок на бит в час, а на этой грелке 16 терабит.
VelocidadAbsurda
14.07.2021 18:22+2Тогда нужно добавлять ещё RAM и эмулировать «полноформатный» NAND со spare area и ECC в ней :) Тот контроллер SSD как раз будет к такому готов.
Scinolim
14.07.2021 20:07Эта пдф — довольно стара. Ячейки памяти сейчас гораздо меньше, попасть ОМГ частицей в них сложнее. Да и нужен способ отличать Single Event Upset от «просто глюкануло», квантовой флуктуации, утечки тока или ещё чего-то. Так что таких грелок придётся ставить одну на одной, а там и до ATLAS недалеко будет. (по цене тоже)
dcoder_mm
14.07.2021 20:46+4Да, но в статье б/у DDR3 чипы, а количество битов в грелке сравнимо с upset rate из пдф (возможно я как-то неправильно её читаю?): -тера это E12 а upset rate E-12 или E-13. Если чувствительность к SEU с тех пор не уменьшилась на порядки, должно сработать.
Показать что биты флипает кто-то из космоса можно, проведя тест в горизонтальном и вертикальном положениях.
@amartology здравствуйте, у вас найдется минутка поговорить о космических лучах?
Fox_exe
14.07.2021 18:31+3Ну теперь можно делать коммерчискую партию и выкидывать на рынок.
Майнеры Chia оторвут с руками, причем с любым ценником :Dczz
14.07.2021 21:38-3Да и вообще, chia — всё. Окупаемость при текущей сложности — 3 года.
acc0unt
14.07.2021 22:31-2Криптовалюта, единственная ценность в которой — новый способ её майнить. Что же могло пойти не так?
dcoder_mm
14.07.2021 22:41+5Подождите, а с предыдущими 99 было не так?
acc0unt
14.07.2021 22:42Ну, подавляющее большинство криптовалют вообще ничего нового и ценного в себе на фоне существующих валют не несут. Умирают они ещё быстрее.
dcoder_mm
14.07.2021 23:03+7И в процессе забирают с собой видеокарточки и ssd. Пора придумать крипту с proof of destruction и выдавать монеты за увеличение энтропии, чтобы избежать промежуточных этапов и лицемерия.
MentalBlood
15.07.2021 09:41+1Таки глобально постоянно расти будет
dcoder_mm
15.07.2021 09:58+2Таки посмотрите, сплошной профит и пассивный доход!
(Simulation theory №35968: Мы живем в криптомайнере, ускоренное расширение вселенной обусловлено растущей сложностью сети)
ClearAirTurbulence
14.07.2021 19:32+6Не хватает ЕСС, аккумулятора, м.2 разъема для подключения обычного ssd для сбрасывания инфы на него при выключении пк. Ну и эмуляция nand, наверное, снижает производительность.
Fox_exe
14.07.2021 20:12+1В статье написано, что производительность упирается только в возможности PCI-E x4, что близко к предельным скоростям DDR3 чипов.
Тоесть FPGA вполне себе справляются и даже запас есть.
EmbeNewsMaker Автор
15.07.2021 04:04+1Да, поэтому не применили DDR4. Её скорость бы просто не раскрылась, а цена выше.
nitro80
15.07.2021 09:19И получится новая версия gigabyte i-ram.
Я бы наверно купил, при условии адекватной стоимости
EmbeNewsMaker Автор
27.07.2021 07:40Аккумулятор там есть, как оказалось. Над кнопкой коннектор. Используется литий полимер.
PereslavlFoto
14.07.2021 19:52-3Издавна мучает меня вопрос: откуда люди берут 256 ГБ памяти? Ведь обычную Compact Flash на 8 гигабайт ни у кого не допросишься, а тут в задаче — в тридцать два раза больше!
Ох.WicRus
14.07.2021 21:47+4Предположу, в данном случае это убитые планки памяти скупленные за копейки или полученные иным незатратным способом. С них сняли чипы, проверили на каком нибудь самодельном устройстве и затем переиспользовали в данной вундервафле.
drWhy
14.07.2021 21:54+1Серверной памяти DDR3 на вторичном рынке море.
PereslavlFoto
14.07.2021 22:06-1Так на вторичном рынке очень дорого.
V1RuS
14.07.2021 23:46+2так серверная дешевле — ее в десктоп не воткнешь.
а в модулях 1-2 ГБ чипы должны стоить еще дешевле — их все продают и почти никто не покупает.
anonymous
00.00.0000 00:00JerleShannara
14.07.2021 22:05+3Издавна мучает меня вопрос: откуда люди берут 256 ГБ памяти? Ведь обычную Compact Flash на 8 гигабайт ни у кого не допросишься, а тут в задаче — в тридцать два раза больше!
CF это Flash память, NVRAM. DDR3 — это RAM память. Две разные памяти.PereslavlFoto
14.07.2021 22:07Однако ни ту, ни другую невозможно допроситься.
alan008
14.07.2021 23:45+1Вам её бесплатно что ли отдать должны? На Aliexpress море БУ "памятей", начиная аж с DDR1
RNZ
14.07.2021 20:25-5От "disk" что в оригинальной, и "диск" в переводе - вот прям коробит уже. А так штука зачётная получилась.
ibrin
14.07.2021 21:03+2диск - это коротко и ясно, совсем не то что какой-то накопитель. А есть еще графопостроитель, ПЭВМ, НЖМД, СБИС, и прочие термины, что так ласкают слух.
VaalKIA
15.07.2021 08:42+1Когда-то ещё писали: «электронный квазидиск»
Maccimo
15.07.2021 11:10+2«Квазидиск» видел в статьях про «Радио-86РК» и им подобные. Для писюков такого не припомню. Звучит футуристично даже в 2021 году.
dragonnur
27.10.2021 08:56+1Было и про квазидиск для БК-0010 (статьи Конюшенко в журнале "Радиолюбитель"); я собирал на тоже рециклируемых К541РУ2, но забросил, когда прожорливость по питанию выскочила за полкиловатта. И было-то всего полмегабайта, а наполеоновские планы простирались гораздо дальше, но проводка и зарплатка не позволяли :-).
RNZ
15.07.2021 21:17-1Всё смешалось. А если молодёжь покрутит у виска и спросит "какой-такой диск дядя?", расчехлишь старый монокль и начнёшь бубнёжь о том, как дырявил перфокарты и зачищал пасики? "Накопитель" - то что нужно. Не надо тащить всякие архаизмы туда, где им не место.
EmbeNewsMaker Автор
15.07.2021 04:07Ну а что вас не устраивает в этом слове? SSD диск, RAM диск, HDD диск и так далее - всё диски. Зато сразу понятно что это.
RNZ
15.07.2021 21:18Нет там дисков, кроме как в hdd. Всё это - накопители данных.
EmbeNewsMaker Автор
15.07.2021 23:18Процессоров тоже нет. Это давно БИС с кешем и прочей требухой на борту, включая видеокарту иногда. И что?..
JerleShannara
15.07.2021 23:31Кстати говоря да, это давно уже SoC, а не CPU.
dcoder_mm
16.07.2021 00:00А Apple M1 это SiP или уже SoM?
JerleShannara
16.07.2021 00:16Это PoP, который состоит из SoC и RAM =)
dcoder_mm
16.07.2021 00:22Но RAM же не сверху а сбоку стоит, причем чипы RAM в отдельных корпусах. Звучит как SoM
Картинка
RNZ
16.07.2021 01:09С чего вдруг? В каждом SoC есть ИС исполняющая инструкции, т.е. процессор там есть.
stalinets
14.07.2021 21:14-1Мне бы хотелось иметь USB- или eSATA-коробку, в которую можно было бы напихать 30-40 планок разной ненужной RAM по 512-1024 Мб и использовать тупо как ещё один диск для временных файлов, типа под торренты с "проходнячковым" контентом, или под своп. Разумеется, добавить батарейки для предотвращения стирания. Но кажется, это всё равно будет дорого и сложно. Как и всякие идеи RAIDов из старых карт памяти. Слишком дорого будет сделать такую плату, слишком малую ёмкость имеют те планки RAM, которые "не жалко".
А устройство из статьи мне не нравится тем, что там очень много микросхем. Вероятность отказа одной из них очень высока, и если обычная оператива иногда ломается, то эта штука должна ломаться постоянно.
Javian
14.07.2021 21:38+3Периодически такие идеи реализуются, но USB- или eSATA - это не тот интерфейс, который позволяет пользоваться данными с максимальной скоростью. Возможно USB Type-C даст эту возможность.
vicsoftware
14.07.2021 23:54+1Gigabyte решил сделать полноценный диск на RAM. Включая возможность сохранения информации между выключениями. Поэтому им пришлось поставить аккумулятор для питания модулей. В итоге одна из проблем, в которую они упёрлись - существенное потребление этой платы при увеличении количества модулей. Собственно, вроде после RAMDISK на DDR1 была ещё память на DDR2, но там тоже объем по современным понятиям - смехотворный.
Надо было позиционировать устройство чисто под временное хранение.
vorphalack
15.07.2021 04:12+1они там уперлись в то, что эта хрень работала чуть ли не со скоростью IDEшного харда соответствующего объема… глядя на список косяков вообще задаешься вопросом, нафига ее в прод подписали вообще?
nitro80
15.07.2021 09:22Ну не знаю насчёт скорости, сопоставимой с IDE, в видеороликах тех времён winxp устанавливалась примерно как сейчас win10 на новом SSD.
Javian
15.07.2021 06:01Мне казалось, что про это (или аналогичное) устройство я читал как о кеше для жесткого диска, например при использовании в сервере с 1С. А батарея должна была продержать память минут 10 только на случай кратковременных сбоев питания.
P.S. нашел обзор на IXBT - устройство работает только через SATA:
Gigаbyte i-RAM — это плата расширения (для шины PCI), которая способна выступать как обычный винчестер, если на нее установить модули памяти DDR и подключить в одном из портов Serial ATA на материнской плате при помощи стандартного SATA-кабеля.
Собственно шина PCI в данном случае не играет никакой роли, поскольку с нее берется только сигнал Reset и питание: +12, +3,3 и +5 вольт, когда компьютер включен, и +5VSB (Stand By), когда компьютер выключен, но его блок питания подключен к сети. То есть с тем же успехом эту плату RAM-диска можно было бы выполнить и для другого форм-фактора. Или, скажем, можно взять и поместить ее в отдельный корпус с собственным питанием и подключать к ПК/серверу извне по шине Serial ATA, как внешний винчестер.
VaalKIA
15.07.2021 15:15+1Надо было позиционировать устройство чисто под временное хранение.
Помню, что были модели, куда вставлялась sdcard, при отключении питания, аккум был нужен только что бы слить туда данные и при включении — залить обратно, всё это происходило довольно быстро (при тех объёмах), никакого упора в потребление энергии тут нет.
stalinets
15.07.2021 18:25Да, я про такие устройства слышал. Но сейчас они не особо актуальны из-за появления NVMe, особенно RAID NVMe.
Поэтому я и пытаюсь увидеть применение.
Маленький, но быстрый накопитель на RAM уже не так нужен (есть NVMe).
Маленький и медленный накопитель на RAM тоже не нужен (есть USB-флешки за копейки).
Большой и быстрый накопитель на RAM сделать будет сложно (в корпус системника не поместится плата на 30-50 слотов под DDR/DDR2 и т.д., значит, придётся как-то выносить PCI-E шину кабелем, а это гемор).
Значит, остаётся большой, но медленный RAM drive. То есть это будет внешняя большая коробка, подключаемая по USB 3.x или eSATA.
Делать его на основе ещё актуальных, больших планок RAM (2 Гб и больше) нерационально: такая память дорогая, дороже флеша. Значит, надо рассчитывать на "мусорные" планки по 256 Мб, 512 Мб, 1 Гб. Меньше уже совсем нерационально, больше - глупо (планки на 2 Гб ещё можно использовать в офисном компе, набрав 4*2=8 Гб оперативы, гиговые планки туда-сюда, 4 Гб памяти для десятки уже мало; на 512 Мб планки точно не пригодятся). И планок потребуется очень много, чтоб набрать приличную ёмкость. Соответственно, будет много слотов. Штук 30-50 я вижу нормальным вариантом. И планки оно должно жрать разного объёма и разной ёмкости, с разным типом расположения чипов, т.е. работать будет на самой низкой частоте и с очень тупыми таймингами.
Вот и надо считать. Сколько будет стоить такая плата? Очень дорого. Сколько набьётся туда RAM, если у нас 50 слотов? Гигабайт 50-100 максимум (повторяю, ставить не мусорные планки смысла нет). И в итоге у нас получается, в сущности, фигня. Не фантастический быстрый диск, маленького (по сравнению с SSD) объёма, сложный и глючный. Дорогой из-за платы.
Не получается вывести это в какие-то красивые рамки. Хотя идея и красивая.
Хотя можно всё это рассчитать для самой дешёвой и никому не нужной памяти. По-моему, это серверная DDR3. Может быть, там, применяя 4-гиговые планки, и можно что-то выжать и побороться с обычным SATA-SSD или HDD. Но мне кажется, дело гиблое.
Am0ralist
15.07.2021 18:51+1Основаная проблема ссд в качестве кэшей — это быстрое убивание собственно ссд, DDR в этом плане вроде как не так зависит от количества перезаписей. Поэтому не факт, что не имеет смысла ставить немусорные планки. Особенно, если в качестве сравнения будут так называемые «серверные» ссд. Но особого рынка для этого не будет, да…
EmbeNewsMaker Автор
15.07.2021 23:07Вы часто даже не узнаете мусорная планка вам попалась или нет. Хорошо если китайцы честно напишут свой бренд, а ведь могут и наклейку самсунга прилепить. А потом мы читаем в статьях - самсунг скатился, все чипы из разных партий и разных дат производства ))))
edo1h
15.07.2021 20:25Маленький, но быстрый накопитель на RAM уже не так нужен (есть NVMe).
nvme не такой уж и быстрый, время доступа порядка 100 мкс, тут, я подозреваю, может быть на порядок лучше
edo1h
16.07.2021 01:52тут же есть картинка, получается на чтение миллион IOPS с глубиной очереди 1, это 1 мкс, на два порядка быстрее обычного nvme!
EmbeNewsMaker Автор
15.07.2021 23:16NVMe, это уровень протокола и он поддержан в данном проекте главным чипом.
Остальное вообще не поняла. Люди, кони, рам, юсб...
amarao
14.07.2021 21:49+3Сервер 1ТБ памяти вполне себе реальность.
justhabrauser
14.07.2021 23:18+2… за нереальные деньги за этот самый 1TB RAM
amarao
15.07.2021 00:16+1Ну, память стоит столько, сколько стоит. Я не думаю, что у этой штуки цена сильно меньше, чем у соответствующего набора планок. Сервер там будет стоить прилично, но в его составе будет довольно много всего полезного, не только слоты для памяти.
EmbeNewsMaker Автор
15.07.2021 04:13+3В планке вы платите за бренд, сборку, разработку. Если поищете цены на новые чипы ДДР памяти, то они даже в розницу дешевле чем они же на планке. А в распайку попадают планки непопулярных объёмов (1-2 ГБ), непопулярных форматов (серверная ДДР3 мало кому нужна). Чипы там по цене отходов. Их распаивают, тестируют, сортируют и собирают из них новые планки, которые потом продают на алиэкспрессе под собственными брендами. А иначе откуда на китайской планке самсунговские чипы из разных партий? :)
Alexsey
15.07.2021 02:52+3Как, однако, обтекаемо ребятки пишут о причинах создания данного продукта. Теперь тоже буду писать distributed computing вместо hdd mining. ;)
EmbeNewsMaker Автор
15.07.2021 04:14+3Насколько знаю, этот диск больше года делали, когда о майнинге ещё речи не шло.
Alexsey
15.07.2021 14:49Майнингу на дисках гораздо больше лет, чем chia. BurstCoin появился в далеком 2014.
opxocc
15.07.2021 09:19В отличие от диска, виртуально размещённого в RAM памяти компьютера, где максимальный объём памяти ограничен 128-256 ГБ у лучших материнских плат
Вот это прямо «резануло слух», как уже выше заметили — есть сервера и по терабайту на материнскую плату, а я вот хотел бы напомнить про то что есть еще Optane PMem, которая может работать как обычный ssd, причем энергонезависимый.EmbeNewsMaker Автор
15.07.2021 23:04Видимо имелись ввиду игровые МП доступные простому пользователю. Сервера всё-таки специфическое устройство.
В остальном согласна, способы набрать тер оперативки есть.
clawham
15.07.2021 09:59а где аккум и таймер до потери данных? зачем чипы было распаивать — надо чтоб люди туда сами в разъемы свои планки ставили, тайминги настраивали для оптимального энергопотребления и нагрева. ну короче нишевый продукт для майнинга чиа но помоему эта чиа уже всё?
dcoder_mm
15.07.2021 10:07Они же брали чипы дохлых планок и материнок по два рубля за мешок.
Но согласитесь, продукт для майнинга который подразумевает upcycling старой электроники это неплохо.
clawham
15.07.2021 10:59+1оно неплохо когда после майнинга чтото полезное останется а не эти бестолковые железки :) почему за формфактор стандартный топлю? потому что потом когда бум пройдет — хоть чтото полезное останется. а тут что? эти платы и наработки никуда кроме майнинга изаз отсутствия поддержки рефреша экономного от аккума — не пойдут.
JerleShannara
15.07.2021 14:03+1Почему не пойдут? Если сделать высоту пониже, то вполне себе пойдут под /tmp cache и прочее, что обнуляется/не имеет значения после перезагрузки.
EmbeNewsMaker Автор
15.07.2021 23:00За всё время перевода и консультирования ни разу не слышала от разрабов слова майнинг.
EmbeNewsMaker Автор
15.07.2021 22:59Вы думаете что разработчики не смогли настроить оптимальные тайминги? ))))))
Мне кажется, нишевый продукт как раз тот, который настройки имеет. А массовый имеет одну кнопку, как айфон.
Планки вы и сейчас можете вставлять в серверную МП, никаких преград кроме четырёхзначных сумм в евро.
clawham
16.07.2021 08:13Вот именно в этом разрезе с таким доступом к дешевым чипам — ниша — это выпуск дешевых ёмкох плашек ;) а уже под эти планки потом — плату инкапсулятор в NVMe с аккумом и получилось бы чтото сильно более привлекательное и после кончины чиа :)
EmbeNewsMaker Автор
27.07.2021 07:44Плашки китайцы делают. Никто не будет там демпинговать. Если есть цена Х за гиг, столько будет у всех. То, что вы предлагаете, это хрупкий конструктор для очень ограниченного круга рукодельщиков кмк.
Hasan81
15.07.2021 10:32+1А мне понравилось. Быстрее чем ssd. А я бы купил такую, если бы были разъемы вместо распаянной памяти + аккумулятор. Поставил бы туда 60Гб под операционку + еще одну под базу данных и радовался бы.
Надеюсь, что у Вас получится довести до успешной коммерческой реализации.
EmbeNewsMaker Автор
15.07.2021 22:53Так а что мешает взять любую современную МП на райзене, поддерживающую до 256 гиг? Воткнуть туда 4 планки, а диск создать виртуальный средствами ОС. Если вам 64 ГБ достаточно, то это оптимальный вариант.
ПК на УПС целиком поставить.
edo1h
15.07.2021 23:01Так а что мешает взять любую современную МП на райзене, поддерживающую до 256 гиг?
ЕМНИП лимит для систем на AM4 128 ГБ
Am0ralist
15.07.2021 23:17ага, 256 вроде только для тредриперов заявляется
EmbeNewsMaker Автор
16.07.2021 01:43Не суть важно. Если человеку надо 64Г, это вполне решаемо "бытовым" уровнем. Вопрос только в финансах на такую мать и память.
Am0ralist
16.07.2021 02:20Ну, вас просто немного поправили.
Правда мне кажется вопрос в том, что плашек на 64 ГБ ддр4 просто нет, а на ам4 вроде только 4 слота максимум. Пока плашек на 32 не было тоже говорилось про максимум 64 Гб, а потом люди и по 128 ставили.
Кстати, каюсь, на самом деле тредрипперы вроде как до 512 Гб поддерживать могут, если верить леновке…EmbeNewsMaker Автор
16.07.2021 03:41--вас просто немного поправили.
Я перевела текст так, как он был написан.
Am0ralist
16.07.2021 10:58Не, не, в статье всё правильно!
Просто многие по домам скупают старые бу серверные железки (типа ксеонов с алиэкспресса) и там 256 набивают. Да и тредриперы у обычных людей дома стоят (если там видеообработкой занимаются). Или там макбуки про с ксеонами. То есть вариантов получить >256 гигов на самом деле много.
Просто к ним пока не относятся декстопные железки. Вот у DDR5 вроде как модули по 128 Гб сразу планируются, вот тогда объемы подрастут сразу капитально.dragonnur
27.10.2021 09:45+2Если сейчас программы уже пишут левой ногой за чашку риса... Матерь Б-жья, это сколько уровней абс(т)ракции сверху навалят? Что-то мне кажется, старина Билли с Виндоуз 12 выйдет и скажет "Ну вот, всем хватит каких-то 640 гигабайт"
Hasan81
19.07.2021 11:37Это конечно можно, но в таком варианте, как вы предложили, при перезагрузке придется образ куда-то бэкапить,а потом перезаливать обратно.
vikarti
28.10.2021 13:48+1Софт для RAMDisk'ов для Windows все это штатно поддерживает (либо периодически снапшоты сливаются на нормальный диск либо при выходе).
А есть еще решения вроде PrimoCache — там идея что для диска (подразумевается что это HDD) делается 2 уровня кеша — на SSD и в памяти и сбрасывается кэш в фоне. Можно попробовать в качестве L2 кэша для SSD — вот такое использовать.
Bergtagen
15.07.2021 11:13+2Shut up and take my money. Бомбическая штука, если вы добавите батарейку, сделаете её разных размеров от 128ГБ до ваших 2ТБ и осилите low-profile хотя бы до 256ГБ. Обмазаться сотнями гигабайт кэшей, сделать ураганные разделы для ОС и БД и больше не обращать внимания на износ накопителей - это мечта. Делайте, не останавливайтесь!
Простите за экспрессию :)edo1h
15.07.2021 20:27осилите low-profile
хотя бы стандартной высоты сделали. то, что на фотографиях, в сервер не воткнуть.
Bergtagen
15.07.2021 21:28Можно было бы наверно в длину вытянуть, до стандартных видеокартных 270мм, похоже, ещё есть куда расти. И два контроллера в Raid1. И терабайт. Это я уже мечтать начал :)
EmbeNewsMaker Автор
15.07.2021 22:48В высокий корпус встаёт. Если у вас слим, можно использовать райзер кмк и тогда хоть ложить эту плату рядом с МП. Они пробовали сделать стандартный размер, но отвергли такое решение, не получилось что-то с трассировкой платы. Такая картинка у меня есть.
edo1h
15.07.2021 22:59В высокий корпус встаёт
4u? и то есть сомнения
можно использовать райзер кмк и тогда хоть
ложитькласть эту плату рядом с МП.обычно там всё впритык.
EmbeNewsMaker Автор
16.07.2021 01:47Я видела фотку где он стоит в корпусе и крышка закрывается. Какой-то залман, для домашнего ПК. Но большой. Типа игровой, с лампочками ))))
Ну а в такой блэйд вам никакая высота не пойдёт. Только райзер и снаружи прикручивать )))))
edo1h
16.07.2021 01:58Какой-то залман, для домашнего ПК
я же по сервера говорил.
тот залман по ширине, скорее всего, или 4u, или чуть больше.Ну а в такой блэйд
это не блейд )
стоечные сервера (и прочее оборудование) бывают разной толщины, кратной стандартной единице — юниту
на той фотографии корпус 1u, бывают 2u, …
EmbeNewsMaker Автор
27.07.2021 07:45Там есть поддержка аккумулятора. Подключается в разъём над кнопкой.
Buhram
15.07.2021 11:39+1Мне кажется, что есть смысл на напаивать чипы на плату, а поставить на ней разъемы под готовые планки. ЕСС ДДР3 на рынке много и она дешевая.
Xobotun
15.07.2021 16:00+3Мне здесь видится два возражения:
• выше уже сказали, что чипы по-отдельности стоят дешевле, чем планки.
• мне кажется, что плотность размещения чипов будет меньше раза в два-три. Сейчас они напаяны на всю нижнюю поверхность платы, а в случае с ddr придётся делать много разъёмов, и не факт, что чипов на планках будет столько же, сколько на нижней стороне платы.
Не уверен, что существуют smd-разъёмы под ddr3 полноценного форм-фактора. Плюс даже если такие есть, они будут удорожать устройство на стоимость разъёма и стоимость планки. Зачем, когда можно поставить чипы?
Разъёмы вертикального типа, боюсь, будут занимать два pci-e места по высоте, а диагональные — меньше планок влезет при тех же горизонтальных габаритах. Плоские платы с чипами более эффективные в разрезе "терабайт на pci-e место".
Плюс боюсь, что придётся заказывать более многослойные платы, чтобы все дорожки подвести под тесносидящие разъёмы с соблюдением импедансов и длин дорожек.
В общем, мне кажется, что решение хуже по всем параметрам, кроме кастомизируемости. А она нужна только простым людям, у компаний есть деньги. :(
czz
15.07.2021 17:36В принципе, чтобы не возникали трудности с форм-фактором, можно было бы сделать внешний девайс
EmbeNewsMaker Автор
15.07.2021 22:39Посмотрите на гигабайт айрам - 4 планки занимают всю площадь карты. Плюс разъёмы будут отламываться и будут дороже, про надёжность даже говорить нет смысла...
peacemakerv
16.07.2021 13:41Во время теста на видео индикатор иногда показывает "F", это что, "failed" ?
"Full" ?
vitalif
16.07.2021 23:404.4 гигабайта в секунду 4 кб блоками при глубине очереди 1 - это же 1.1 миллиона iops, а это же задержка (latency) 0.9 МИКРОсекунды.
Это же абсолютно нереально при использовании стандартных дисковых интерфейсов... там же один только системный вызов, по идее, занимает сравнимое время. А ещё задержки контроллера, pcie... может быть, с тестом что-то не то?
Люди ради того, чтобы прокачать миллион iops даже в параллель - бьются и изобретают SPDK, io_uring и так далее. А тут вдруг через стандартный интерфейс в 1 поток с глубиной 1? Лажа какая-то.
EmbeNewsMaker Автор
18.07.2021 00:51У аналогичных проектов трёхлетней давности скорость 1000-2000 в этом тесте, и это на ген3. Возможно, какие-то режимы устанавливаются со стороны диска...
vitalif
18.07.2021 09:40Да какие еще режимы...Разработчик сего чуда есть в доступности?
Можно его попросить повторить тест под Linux через fio? А не под виндой через cdm
Bergtagen
19.07.2021 00:44Ну вон Интел предлагает свои чудо-оптаны с 1.5 млн иопсов. Понятно, что в реальности надо делить на три, но тем не менее, величины одного порядка. Может миллион уже не так и много?
https://habr.com/ru/company/intel/blog/543728/edo1h
19.07.2021 01:02Ну вон Интел предлагает свои чудо-оптаны с 1.5 млн иопсов.
нет, тут речь о миллионе iops в один поток.
optane обещает время доступа ≈10 мкс, а это в один поток 100к iops. на практике у меня получается в разы меньше.чтобы вы понимали масштабы: взял не самый плохой сервер (xeon gold первого поколения на 4 ГГц), на tmpfs получил ≈0.5kk iops на чтение.
Bergtagen
19.07.2021 10:28Значит не один поток, а
за счёт особенностей работы банка памяти DDR чипов, представляющего собой виноградную гроздь из носителей малого объёма, что позволяет работать с ними параллельно и одновременно, в отличие от одного единственного NAND чипа.
2х8 потоков, которые контроллер обрабатывает весьма неплохо на примере Transcend 220S:
https://www.ixbt.com/data/transcend-220s-1tb-test.html
https://www.ixbt.com/img/x780x600/r30/00/02/21/68/22cdm4kwrite.png
Два по 1700 минус накладные расходы - вот и вышло 3000 на запись. Не?edo1h
19.07.2021 11:26Значит не один поток, а
на картинке (фотографии, блин, а не скриншоте) с cdm смотрим нижнюю строчку — q1t1 и есть в один поток, делим мегабайты в секунду на 4096 (размер блока) и получаем iops.
Bergtagen
19.07.2021 23:26Смотри, на фотоскрине 2 970 000 000 / 4096 = 725 000 иопсов.
Если взять по моей ссылке этот же контроллер в Transcend 220S, но не 1Т1, а 8Т8 (и умножить на 2 ядра), получим (1 680 000 000 * 2) / 4096 = 820 000 иопсов в теории и видимо такие вот накладные расходы, что на практике 725к, а не 820к.
Я к чему это. На фотоскрине в 1Т1 не 1Т1, а 1Т16! Грубо говоря, контроллер тянет из cdm Т1 с 16-кратной скоростью. Потому и разница с 32Т1, а на самом деле 32Т16, небольшая, там уже некуда расти. Вот и никакого чуда в миллионе в один поток. Это я гипотезы выдвигаю в отсутствие разработчика :)edo1h
20.07.2021 00:06Я к чему это. На фотоскрине в 1Т1 не 1Т1, а 1Т16!
то есть cdm врёт? )
Bergtagen
20.07.2021 12:37Вполне возможно, почему нет? Не каждый день попадаются самоделки)
edo1h
20.07.2021 12:45А причём тут самоделка или нет?
Глубина очереди 1 означает, что мы даем накопителю задание, дожидаемся его завершения, даём следующее и т.д.
Cdm использует микрософтовский diskspd, исходники есть, можете посмотреть.
Bergtagen
20.07.2021 12:53Ну фраза-то вот.
за счёт особенностей работы банка памяти DDR чипов, представляющего собой виноградную гроздь из носителей малого объёма, что позволяет работать с ними параллельно и одновременно
Почему бы накопителю не рапортовать о завершении до того, как происходит запись, собирая пакет из 16 заданий и выкидывая потом скопом дальше?
edo1h
20.07.2021 14:02Мы в первую очередь про iops'ы на чтение.
С записью примерно так и работает (у dc накопителей точно) — накопитель принял команду, отчитался о её выполнении, а потом в фоне сбросил в nand, но и в этом случае мы получаем >10 мкс, на порядок больше!
EmbeNewsMaker Автор
27.07.2021 07:52Ключевой момент - отчитался. У SM есть свой буфер, насколько могу судить по маркировке на 4 гига. То есть, он может туда доооолго класть задания и немедленно отчитываться о завершении, а потом уже распихивать их по основной памяти. У ССД дисков я таких объёмов буфера не встречала, у моего, например, 512 МБ всего. А он 3300 выдаёт в кристалдиске и 680 в 1т1
edo1h
27.07.2021 12:20ох, попробую ещё раз с самого начала и развёрнуто…
речь про то, что скорость случайного чтения >4 ГБ/с пакетами размером по 4 КБ при q1t1 вызывает подозрения, она означает более миллиона iops, или, другими словами, задержки менее одной микросекунды.
вот как это выглядит:
приложение дало команду — os обработала — запрос пошёл по шине pcie — контроллер получил команду — контроллер получил данные из локальной памяти — данные пошли по шине pcie — os получила данные — приложение получило оповещение, что данные получены и может выдавать следующую команду.
после этого идёт следующий запрос, всё выполняется строго последовательно (q1t1 же).в качестве иллюстраций, почему latency менее 1 мкс вызывает сомнения, можно привести:
- асинхронная запись на обычный накопитель nvme. в этом случае цепочка передачи очень похожа на приведённую выше (контроллер сбрасывает полученные данные в буфер, после чего отдельный фоновый процесс сбрасывает в nand), но задержки выше минимум на порядок;
- доступ к ram-диску; на не слишком плохом сервере я с файлом на tmpfs получил вдвое большие задержки (при этом цепочка гораздо короче, прямой доступ к памяти вместо обращения по шине pcie к внешнему контроллеру).
если я правильно понял этот документ, на пакетах размером 1500 байт задержки шины pcie составляют 1.8 мкс, а у нас, напомню, чтение идёт блоками по 4096 байт, то есть только на передачу данных по шине pcie потребуется несколько микросекунд.
теперь понятны сомнения?
vitalif
19.07.2021 01:29+2Ага, уже ответили, оптан 1.5 млн дает в параллель и это именно под него Jens Axboe делал io_uring, без уринга вообще только 600к выходило даже в параллель https://lore.kernel.org/linux-block/20190116175003.17880-1-axboe@kernel.dk/
Tsentr
18.07.2021 00:40где такое купить?
EmbeNewsMaker Автор
27.07.2021 07:49На их сайте должны были уже запустить магазин.
n0isy
30.07.2021 09:40Вы к этому случайно не причастны? Как-то опасно смотрится их "магазин" с оплатой криптой и без обратного адреса. Вообще выглядит "падазрительна".
edo1h
30.07.2021 12:33… плюс нереальные цифры в cdm, путаница с ревизиями pcie
непонятно, то ли нас дурят с характеристиками, то ли вообще мошенничество и после получения денег стартап исчезнет.EmbeNewsMaker вы несколько раз упоминали, что общаетесь с разработчиками, можете попросить их прояснить эти моменты?
EvgeniiNx
18.07.2021 00:40Хороший проект класная весчь
Для 3D рендинга быстрый кеш незаменим
Да и много где
babenek
27.07.2021 07:53В фоомфакторе 2.5" такого нет случайно? Хорошая штука для свопа на ноут... и /tmp
EmbeNewsMaker Автор
27.07.2021 07:54Там с трассировкой платы большие проблемы в таком формфакторе, да и уместится туда всего пара десятков гиг.
Am0ralist
27.07.2021 09:39+1По мне проще в ноут напихать 32 гига и этот своп вырубить, если не очень нужен (в домашних задачах у меня даже на 16 гигах за несколько лет под виндой проблем не было ни одной). Или взять ноут с m2 и sata и в последний пихнуть самые дешевые ссд-ки под убой неважной инфы…
babenek
28.07.2021 09:32+1Речь про старенький ноут, у которого только на 16Гиг разведены-распаяны разъёмы. Процессором он силён, но вот как начать запускать виртуалку с IDE и браузерами... Брать новый - не позволяет религия разумного потребления. Менять существующие 8 Гиг на 16 - опасение, что лептоп сдохнет и эта память окажется не нужной, а 2.5" диск и в сервер 1юнит впихнуть можно.
Am0ralist
28.07.2021 09:53Менять существующие 8 Гиг на 16 — опасение, что лептоп сдохнет и эта память окажется не нужной
Есть такая замечательная вещь, как — авито)
И да, в ноуте с i5 3-го поколения я именно что заменил 2х4 на 2х8, поставил ссд (120, 256, затем 512), а жесткий снёс в отсек hdd. Единственно, чего так и не сделал, не заменил матрицу на ips fullhd, ибо там без прошивки было нельзя, а это делало стоимость апгрейда слишком высокой.
malishich
29.07.2021 14:32Почему все эти Silicon Motion со своими SM2262EN или Broadcom-ы с их чипами наглухо закрывают доступ к спецификациям (даташитам) на их продукцию. Как это способствует еще большему распрастранению их продукции?
Dier_Sergio_Great
04.12.2021 02:41можно купить у них в магазине эти диски
https://ddramdisk.store/shop/от 140$ до 2100$ в зависимости от объема.
Интересно то что на устройствах нет слотов для планок памяти, вся память распаяна.устройства от 114Gb до 2Tb
JerleShannara
04.12.2021 02:52У них память от поставщиков памяти для всяких Altermiter/Sunkuivchai/YourBestBrandFromAli — китайцы с б/у памятью. В таком формате делать слоты под ОЗУ — делать дороже.
Nick_Shl
Не понятно зачем вообще было использовать SM2262EN - почему было не поставить FPGA?
Неужели нет готового свободного PCIe модуля для FPGA? Тогда не пришлось бы делать эмуляцию NAND/NOR.
nerudo
Чтобы подключить много памяти требуется *большая* FPGA. Она стоит дорого, что явно не вписывается в концепцию использования «бывшей в употреблении и перепаянной» памяти. Статья совсем не щедрая до технических подробностей, но судя по фото там стоят весьма бюджетные FPGA. Плюс реализовать внутри FPGA поддержку NVMe заметно сложнее, чем сэмулировать интерфейс флэш-памяти.
EmbeNewsMaker Автор
Я только переводила текст, но на эту тему разработчики прочитали мне целую лекцию с экономическими выкладками. Резюме: если брать новую ДДР память и мощные FPGA, стоимость устройства превысит 5 тысяч евро. А с выбранным подходом у них получилось полтора евро за гигабайт ёмкости в устройстве. Выбранный контроллер очень дешёвый и быстрый.
Bergtagen
А может есть какой-нибудь тестовый образец, который можно купить или взять на какое-то время для тестов? Думаю, многим было бы интересно узнать цифры, кроме cdm. Я в Москве.
EmbeNewsMaker Автор
Я не знаю, следите за их сайтом. Они обещали открыть магазин asap.
Dier_Sergio_Great
https://ddramdisk.store/shop/
drWhy
Довольно гуманные ценники, кстати.
acc0unt
Вот то, что в статье про это говорится. А так — помимо подключения к PCIe такой приблуде нужно было бы реализовывать ещё и NVMe во всей красе.
EmbeNewsMaker Автор
SM2262EN поддерживает NVME по дефолту, и девайс его тоже поддерживает.
JerleShannara
Кажись один из разработчиков этого диска уже был на хабре и я с ним даже в комментах переругивался. И у них была задача — сделать самый дешман вариант для майнинга. В этом варианте внешний ASIC, который умеет быстро жить с PCIe — идеален, т.к. ПЛИС, которая может хотя бы в PCIe Gen.3 x8 стоит около 2000$, про Gen 4 лучше не буду вообще упоминать.
Alexsey
Тоже сразу вспомнился этот товарищ. И что-то мне подсказывает что это их детище. И вообще есть подозрение что этот перевод - часть пиар компании, быстрый гуглеж показывает что очень много за последние пару недель упоминаний их сайта от новых аккаунтов на различных тематических ресурсах.
EmbeNewsMaker Автор
Я нашла 3 упоминания :) И это в гугле, яндекс показывает 2.
VT100
Даже "старенькие" Cyclone IV от Intel/Altera имеют аппаратные блоки PCIe. Xilinx, думаю, — не отстаёт.
По видимому разработчики не осилили / не нашли дешёво "корку" NVMe.
JerleShannara
Cyclone IV это PCIe Gen 1, причём ещё и x1 зачастую. Gen 3 появилась в Arria 10 (и не во всех причём), где оно ограничено x8 на один аппаратный контроллер, при этом ценник одной такой ПЛИС уже 100500% превышает цену NVMe контроллера. Для x16 надо уже брать Stratix 10