Привет!
Ранее я писала, что мы подготовили супер приз для участников конференции HighLoad++ 2024 Москва, а именно книгу «Сто лет недосказанности. Квантовая механика для всех в 25 эссе» Алексея Семихатова с подписью автора.
Для того, чтобы выиграть книгу, нужно было ответить на 3 небольших технических вопроса.
Они должны были показаться легкими для тех, кто хорошо знаком с Системами Хранения Данных и понимает, как они устроены. А вот посетителям, не так плотно работающим с СХД, надо было немного поразмышлять, предположить, как она работает и логически прийти к правильному ответу.
Некоторые вопросы были дискуссионные. Так было задумано. Посетители стенда с интересом спорили, предполагали и часто высказывали самые разные неправильные, но интересные ответы. Были дискуссии о том, что неверно составлен тест, что ответы обсуждаемы. Поэтому мы решили разобрать вопросы и ответы тут. Если вам есть, что дополнить, добро пожаловать в комментарии.
Вот эти вопросы:
-
Для чего нужна дедупликация?
Варианты:
А. Снижает износ SSD
Б. Повышает скорость записи
В. Снижает частоту ошибок
Г. (Правильно) Позволяет использовать место эффективнее и записывать больше данных
Дедупликация — это метод сжатия массива данных, использующий исключение дублирующих копий повторяющихся данных. Те, кто это знал, а таких было большинство, сходу отвечали правильно. Кто не знал, но начинал думать, как правило, приходил к правильному ответу. А некоторые даже приходили к тому, что верный вариант не только Г, но и А — мол раз меньше данных пишем, то и износ снижается.
-
Иногда контроллер СХД начинает некоторые диски использовать намного активнее, чем другие. Для чего это делается?
Варианты:
А. Снизить количество переключений, за счёт этого повысить скорость чтения и записи.
Б. Чтобы отделить горячие данные от холодных.
В. (Правильно) Чтобы диски выходили из строя по очереди.
Г. Это делается при пересчёте контрольных сумм.
Здесь речь про одну из стратегий, которую может (но не обязана) использовать СХД. Поскольку избежать выхода дисков из строя невозможно — у них все равно есть конечный ресурс и рано или поздно они его выработают, то важной задачей становится прогнозирование выхода дисков из строя и снижение вероятности одновременного отключения нескольких дисков. В варианте В как раз и описан один из способов упорядочивания «выпадания» дисков.
-
Допустим у вас есть два ЦОД - в Санкт-Петербурге и в Казани. Для какого вида совместной работы их можно использовать?
Отметьте все верные.
А. Бесперебойной работы облачной инфраструктуры.
Б. Регулярного резервного копирования.
В. Работа баз данных высоконагруженных приложений.
Г. Видеохостинг.
Д. Работа с банковскими онлайн транзакциями.
Самый дискуссионный вопрос. Но главный посыл здесь в географической удаленности Казани и Питера. Это около 1200 км по прямой, а значит даже по оптоволокну задержки будут от 5 ms. И здесь оставалось поразмышлять, для каких задач такие задержки не страшны.
И это, конечно же, вариант Б. Остальные можно (и нужно) обсуждать. Эту проблему можно нивелировать софтом, но гарантированный вариант все же только Б.
Как показала практика, вопросы были интересные и посетителям стенда зашли. За идеи вопросов хочется сказать спасибо блогу компании RUVDS. Именно здесь мы почерпнули идею своих вопросов.
Всего за два дня мы получили 231 ответ, из них правильных было 77.
Надо отметить, что тут мы не учитываем людей, которые даже не пытались отвечать.
Каждый час происходил розыгрыш книг – в итоге 17 счастливых обладателей уникальной книги.