Шаг за шагом проектируем сокращатель ссылок / forpes.ru

Главная
Шаг за шагом проектируем сокращатель ссылок

Шаг за шагом проектируем сокращатель ссылок +3

11.07.2025 19:21

IvanZiv972003 36 6000 Источник

Всем привет!

В этой статье я хочу показать, что из себя представляет System Design. На примере простого и очень популярного насобеседованиях сервиса «Сокращатель ссылок», мы рассмотрим стадии System Design и в конце у нас будет готова схема системы со всеми расчетами.

В данной статье мы не будем обсуждать сложные определения и подводные камни каждого подхода. Мы лишь сфокусируемся на порядке обязательных этапов в System Design для получения результата. Материал будет простой и понятный для того чтобы точно убедиться, что в System Design нет ничего сложного, это лишь конечный набор правил и технологий, комбинацию которых нужно применять.

System Design состоит из следующих шагов:

Требования к системе (рассмотрим в этой статье)
Расчет нагрузки и стоимости вашей системы (рассмотрим в этой статье)
Верхнеуровневый дизайн (рассмотрим в этой статье)
Выбор баз данных (рассмотрим частично в этой статье)
Модульный дизайн (не будем рассматривать)
Оптимизация системы (рассмотрим в этой статье)
Оснащение системы дополнительными подсистемами (не будем рассматривать)

Так каксистема «Сокращать ссылок» очень простая, шаги «Модульный дизайн» и «Оснащение системы дополнительными подсистемами» мы опустим.

Не буду долго тянуть, давайте начинать!

Сбор требований

Как мы знаем, есть 2 вида требований:

Функциональные требования — это четкие, конкретные описания, что должна делать система, какие функции она предоставляет пользователям и как реагирует на их действия. Они отвечают на вопрос: «Какую задачу решает система?» и описывают конкретные функции.

Давайте сразу зафиксируем функциональные требования для нашего сервиса «Сокращаетесь ссылок»:

Получение короткой короткой ссылки из длинного URL.
Перенаправление с короткой ссылки на исходный URL.

Нефункциональные требования — описывают как IT‑Система должна работать, а не что она делает. Они определяют характеристики производительности, надежности, безопасности и другие аспекты, которые влияют на качество системы и которые должны также быть связаны с бизнес‑целями.

Высокая доступность — сервис должен работать всегда.
Минимальная задержка — перенаправление должно быть быстрым.
Масштабируемость — система должна выдерживать миллионы запросов.

Давайте также определим дополнительные требования которые возникают из бизнес-ограничений, анализа рынка и т.д.

Дневное кол-во уникальных пользователей нашего сервиса (DAU) = 100 000
В среднем 10% пользователей генерирует в день 1 короткую ссылку
Остальные 90% пользователей в среднем переходят по коротким ссылкам из нашего сервиса по 10 раз в день.

Подробнее про сбор требований можете найти тут: System Design: Чек-лист по сбору и фиксации требований на все случае жизни.

Двигаемся дальше.

Расчет нагрузки и стоимости

Этап расчет нагрузки и стоимости чрезвычайно важен. Во-первых мы будем понимать примерную стоимость нашей системы и уже на таком раннем этапе сможем сделать вывод, получится ли нам позволить такую систему или нет. Во-вторых расчет нагрузки позволит уже сейчас продумать перечень технологий и кол-во оборудования, которое мы будем использовать.

Начнем с расчета кол-ва запросов в секунду. Придется разделить запросы к системе на 2 части. 1ая часть говорит о том что 10000 пользователей обращаются в системе 1 раз, 2ая часть говорит о том, что 90000 обращаются к системе по 10 раз каждый, следовательно

$RPS = {DAU * Q \over 86400} = {10000*1 + 90000*10\over86400}={910000\over86400} \approx11RPS$ ,
Далее считаем кол-во одновременных соединений в течении дня. Для этого зафиксируем, что в среднем сессия пользователя ограничивается запросом к системе и ответом. Таким образом предположим что s = 0.3с., p = 86400с., так как наша система работает 24 часа.

$CCU = {DAU * Q * s \over p} = {910000*0.3\over86400}\approx3\ соедниения/сек.$

С этим справится почти любой компьютер.
Далее определяем каков средний размер одной единицы данных которая проходит через нашу систему. Предположим что длинный URL весит в среднем 200Б или 1600Бит. В таком случае размер маленькой ссылки в расчетах учитывать не будем и считаем через большее значение:

$R = RPS* S=11*1600\approx18000Бит=18Кбит/сек$

Так как 1 сетевой инстанс на 1Гбит/сек стоит 300$, то мы выберем его, так как даже при превышении нагрузки в 10 раз, его все равно хватит.
Далее вычисляем сетевой трафик, где кол-во операции в день = 910000, а средний размер информации для запроса и ответа в среднем равно 200Б. Так как при запросе и при ответе каждый раз фигурирует ссылка, то читаем что на 1 запрос приходится 400Б.

$A = N * S = 910000*400 = 364000000Б=364000МБ=364ГБ\ в\ сутки$ ,

Так как 1 ГБ трафик провайдеры просят 0.1$, следовательно мы потратим примерно 37$ в сутки или 1110$ в месяц.
Далее считаем объем хранимых данных на горизонте времени (1 год). Считаем что хранени й ссылки с ее метаданными занимает не более 500Б. Ссылку загружают всего 10000 раз в день (согласно требованиям):

$V =N* S* T = 10000*500*365\approx2000000000Б=2ТБ$

Так как SSD стоит за 1ТБ 300$, то в год это 600$ на быструю память. Часть также можно заходить в RAM.

Подробнее про расчет нагрузки и стоимости можно найти тут: System Design: Чек-лист для расчета нагрузки и стоимости системы на все случаи жизни и тут Магия чисел в System Design: эти формулы спасут вас от банкротства и помогут оптимизировать вашу систему.

Едем дальше.

Дизайн

Так как наша система очень проста, то тут можно обойтись просто верхнеуровневым дизайном. Выглядит он следующим образом.

У нас есть:

Client — браузер или мобильное приложение
Link service — сервис. который будет получать 2 вида запросов: один на генерацию короткой ссылки по длинной, а второй за перенаправление с короткой на длинную.
Shortener service — сервис, который отвечает за генерирование короткой ссылки из длинной
DB — База данных, где хранятся все наши короткие и длинные ссылки, а также дата добавления, id, кол‑во запросов короткой ссылки и т. д.

Верхеуровневый дизайн сервиса "Сокращатель ссылок" — Верхеуровневый дизайн сервиса «Сокращатель ссылок»

Давайте вернемся к функциональным требованиям:

Получение короткой ссылки из длинного URL. Работает следующим образом: Наш Client в запросе передаtт длинную ссылку в сервис Link service. После чего Link service сперва проверяет в DB, не была ли для этого длинного URL сгенерированна короткая ссылка ранее. Если да, то Link service , сразу возвращает это корочку ссылку. Если нет, то он обращается к Shortener service, для генерации короткой ссылки. Shortener service генерирует короткую ссылку, сохраняет ее в DB и передает короткую ссылку в Link service, который в свою очередь отправляет эту ссылку Client. (Опустим момент, что Shortener service также через DB проверяет уникальность созданной короткой ссылки).
Перенаправление с короткой ссылки на исходный URL. Работает следующим образом: Наш Client переходит по короткой ссылке и отправляется в наш сервис Link service, который по id короткой ссылки получает из DB и отдает Client информацию о редиректе на сайт по длинному URL.

Проектирование API

Давайте схематичного набросаем API.

API для создания короткой ссылки. Для сервиса Link service запрос на генерирование короткой ссылки из длинной будем использовать ручку POST /shorten. Метод POST используется так как почти каждый такой запрос будет сопровождаться созданием новой записи в базе данных.

Пример запроса:

POST http://shorturl.ru/shorten
{
  "long_url" : "https://systemdesign.ru/long-long-long-url"
}

Пример ответа:

HTTP/1.1 200 
Content-Length: 40
{
  "short_url":"http://shorturl.ru/qwe123"
}

Тут qwe123 — это короткий код ссылки. В последствии он может быть использован для поиска в DB.

API для редиректа по короткой ссылке будем использовать также метод сервиса Link service: GET /{short_url}. Метод GET используется потому, что мы не будем влиять на систему, мы лишь получим данные и разойдемся)

Пример запроса:

GET https://shorturl.ru/qwe123

Пример ответа:

HTTP/1.1 301 Moved Permanently  
Location: https://systemdesign.ru/long-long-long-url
Content-Length: 0

HTTP 301 Moved Permanently — код состояния, который указывает, что ссылка была перемещена навсегда. То есть мы тут сообщаем, что каждый раз при запросе по этой короткой ссылке мы всегда будем его перенаправлять на длинную. Кстати для временного редиректа используется не 301 Moved Permanently, а 302 Found, который сообщает что это временная акция и в скором времени длинная ссылка может измениться, но это не наш случай.

Location — заголовок, который указывает на длинную ссылку, на которую необходимо перенаправить пользователя.

Content-Length — заголовок, указывающий на то, что тело ответа пустое.

Как работает перенаправление?

Шаг 1: Вы кликаете на https://shorturl.ru/qwe123

Ваш браузер отправляет запрос к серверу http://shorturl.ru

Шаг 2: Сервер ищет код qwe123 в БД

Он быстро проверяет: Есть ли запись с таким кодом? Куда перенаправлять?

Шаг 3: Сервер отправляет ответ 301 Moved Permanently

Если код найден, сервер отвечает:

HTTP/1.1 301 Moved Permanently  
Location: https://systemdesign.ru/long-long-long-url

Шаг 4: Браузер перенаправляет вас на длинный URL

Браузер видит код 301 и автоматически переходит по указанному в Location адресу.

Выбор базы данных

У нас всего лишь одна база данных DB. Будем использовать реляционную СУБД PostgreSQL. Потому что наша таблица имеет строгую структуру и нам важна быстрота. Не будем уходить в подробности на данном этапе. Тема очень обширная и на это понадобится отдельная статья или курс.

Оптимизация

Первым делать нужно понимать, что кол-во пользователей будет расти, а нам ссылаясь на нефункицональные требования необходимо, чтобы наша система была масштабируемой, доступной и с минимальной задержкой. Давай те оптимизирует систему, чтобы она отвечала этим требованиям, при росте пользователей.

Если кол-во пользователей вырастит в 1000 раз это будет уже совсем другая нагрузка. 1 сервер может не справиться. Поэтому мы можем применить горизонтальное маштабирование - Добавляем несколько серверов (инстанс = экземпляр= нода) и распределяем между ними данные и нагрузку. Покажем это на схеме:

Но как же нам распределить нагрузку равномерно между всеми серверами? Для этого существуют балансировщики нагрузки (load balancer) — это как «умный распределитель» в мире серверов. Основная задача — равномерно раздавать запросы между разными машинами, чтобы ни один сервер не захлебнулся от перегрузки, пользователи получали ответы быстро (даже при наплыве трафика), система не падала, если одна из машин сломалась. Покажем работу балансировка нагрузки на схеме:

А что же с БД? Тут мы также можем осуществить горизонтальное масштабирование для чтения. Работает это так, 1 БД (мастер) будет использоваться для записи, после чего 1 БД синхронизирует данные со 2 БД (реплика) и в последствии также через балансировщик нагрузки будем читать данные из двух таблиц. (На самом деле вопрос репликация очень широкий и данной статье я привожу просто пример распространенного использования, который также покрыт различными подводными камнями). Таким образом наша система будет выглядеть следующим образом:

На рисунке явно видно, что сервис Shortener servive, генерирует короткие ссылки и складывает их в DB (Мастер БД на запись). Сервис Link service же наоборот только читает данные из DB (мастер) и DB_2 (реплика), которыесинхронизируются между собой (стрелочка от DB до DB_2).

Отлично, но как бы нам еще снизить нагрузку на БД, а также повысить время откика? Для этого есть Кэширование — это временное сохранение часто используемых данных в быстродоступном хранилище (кэше), чтобы ускорить их получение и снизить нагрузку на основную систему. В качестве кэширования выберем БД типа «Ключ‑значение» Redis. Данная БД отлично подходит для кэширования, так как поиск по ней очень быстрый и простой (Не будет вдаваться в подробности). Далее наша схема будет выглядеть уже вот так:

Теперь при частом обращении к сервису Link service для получения редиректа с длинной ссылки на короткую, Link service будет обращаться в кэш, где сохраняются недавние запросы к БД.

Что еще можно сделать?

Это систему всегда можно усложнить, например добавив такие сервисы как аутентификации и авторизации, добавив сервис оплаты и еще много сервисов, улучшающих нашу систему. Также можно добавить систему мониторинга и сервис уведомлений с брокером сообщений. А также, инвалиадцию кэша, партицирование, шардирование, избыточность и многое другое. Все лишь зависит от требований и нужды. Но мы на этой закончим)

В данной статье я постарался наглядно показать из каких шагов состоит System Design, без детального погружения. Секрет System Design в том, что даже одну и ту же систему мы можем построить по разному. System Design — это не про знание технологий, а про образ мышления. Если вы научитесь разбирать задачу по частям, взвешивать компромиссы и предвидеть проблемы, вы пройдёте не только собеседование, но и станете сильнее как инженер.

Нет «идеального» дизайна — есть оптимальный для конкретных требований и усоливий.

Спасибо за внимание!

Если же вас интересует еще больше примеров, детальное объяснение каждого шага, а также если вы хотите научиться принимать взвешенные архитектурные решения, которые выдержат миллионы пользователей и не сломаются при первой же проблеме. С гордостью представляю вам свой новый курс на Stepik, где представлены все этапы System Design с подробными лекциями, конспектами и практикой: C нуля до проектирования систем уровня senior-инженера. Специально для Habr до 31 августа действует промокод 20% HABR20.

Комментарии (36)

pnmv
11.07.2025 19:56
#28559148
Сокращатель ссылок - это хорошо.

Плохо, что такие ссылки, да на незнакомый ресурс, могут восприеиматься как что-нибудь нехорошее.

ReadOnlySadUser
11.07.2025 19:56
#28559220
Если честно, я так и не понял, почему после добавления балансировщика, клиент вдруг стал ходить к Shortener Service напрямую)

santjagocorkez
11.07.2025 19:56
#28559234
Overkill на этапе выбора БД. Поскольку сервис заявлен, как крайне примитивный, а в метаданных очень сложно придумать отношения, то реляционная база данных здесь не нужна, и гораздо лучше подошла бы NoSQL база (например, GDB, MDB, dBase), которые работают вообще, как пулемет, имеют весьма лаконичный и строгий API и дадут огромный выигрыш уже тем, что этапы разбора запроса и планирование его выполнения отсутствуют как таковые.

Вспомним, хотя бы, бенчмарки openldap (штатный сторадж у нее GDB, если не изменяет память), которая (даже с парсером LDAP запроса) показывала сотни тысяч RPS в начале 2000-х, естественно, на железе того времени.

D_Dementy
11.07.2025 19:56
#28559354
"Сервис опалы" звучит интригующе. "Сервис анафемы" еще предлагаю запилить.

Gorthauer87
11.07.2025 19:56
#28559412
Зачем тут распределённый монолит с общей базой под видом двух сервисов? Видно же, что это только усложняет логику и не даёт вообще никаких профитов.
1. IvanZiv972003 Автор
  11.07.2025 19:56
  #28559616
  Хороший вопрос)
  
  Я решил не уходить к микросервисам напрямую, так как цель статьи показать шаги решения задач по System Design.
  
  Если мы говорим, про микросервисы, тогда Link service не должен ходить в БД, в которую пишет Shortener service. Варианты для Link service такие:
  1. Либо достает длинные ссылки по коротким из своего Кэша (Redis)
  2. Либо из реплики основной БД (куда пишет Shortener service)
  3. Либо комбинация
  
  Но тут возникает вопрос
  Что делать если Кэш сброшен или в реплике неактуальные данные?) Мы снова приходим к распределенному монолиту, так как приходится вызывать основную БД
  
  В таком случае для Кэша
  1. нам на помощь может прийти Kafka для асинхронного восстановления кэша: Кэш-воркер постоянно подписан на Kafka и восстанавливает Redis при сбоях (из истории Kafka). Так Kafka используется для асинхронного взаимодействия между Link service и Shortener service.
  2. Резервный кэш - всегда есть еще один Кэш (Redis), готовый прийти на помощь в случае сбоя.
  
  Если только реплика (без кэша) и она неактуальна, то мы тут как не крути либо возвращаем ошибку и ждем пока все синхронизируется, либо идем опять основную БД, тем самым порождая распределенный монолит
  
  Что касается реплики и кеша вместе - то тут нужно чтобы TTL в Redis, покрывал синхронизацию мастера и реплики (То есть удаляя запись из Кэша, мы должны быть уверены что она появилась в реплике)
  
  Либо Вообще сделать отдельный сервис на преобразование длинного в короткий ( сохранение в свое БД) и отдельный сервис для получения длинного из короткого (получаем из Кэша) - например как Bit.ly , но тогда все равно есть Кафка, Кэш-воркеры и периодические запросы основной БД.
  
  Как вы видите такие рассуждения выбиваются из общей тематики статьи, поэтому и не подсвечиваются.
  1. tkutru
    11.07.2025 19:56
    #28559708
    Если система изначально позиционируется как очень простая, то и монолит можно было не распределять. Притом бд общая. Микросервисы в данном случае тем более будут overkill. Имхо.

dph
11.07.2025 19:56
#28559714
А у автора есть реальный опыт проектирования и защиты сайзинга для сколь-нибудь сложных систем? А то тут что не пункт - то ошибка проектирования (
1. trump-card
  11.07.2025 19:56
  #28559900
  Осуждаешь? Предлагай! Распиши ошибки и свой вариант решения!
  1. nin-jin
    11.07.2025 19:56
    #28560128
    Пишем простейший сервис, использующий децентрализованную конвергентную базу данных. Поднимаем его на нужном числе узлов в разных дата-центрах. Балансируем нагрузку через dns. Всё. Никаких Кафок, Редисов, Постгресов, балансировщиков, микросервисов и прочих звездолётов, скрепленных изолентой. При этом получаем синхронизацию узлов в реальном времени, устойчивость к разделению сети, неограниченное горизонтальное масштабирование, автоматическое восстановление при сбоях, локальную авторизацию, шаринг прав, и отработку каждого запроса за миллисекунды.
    
    Katasonov
    11.07.2025 19:56
    #28560956
    А цена вопроса? Есть ли такие в мире опенсорс?
    
    nin-jin
    11.07.2025 19:56
    #28561092
    Конечно: crus.hyoo.ru
    
    Katasonov
    11.07.2025 19:56
    #28561122
    "Сохранность данных не гарантируется" отличная база данных.
    
    nin-jin
    11.07.2025 19:56
    #28561134
    На то она и бета версия. Можете задонатить, чтобы ускорить релиз.
    
    Katasonov
    11.07.2025 19:56
    #28561214
    Я так понимаю дизайн интервью вы с этой базой вряд-ли пройдете.
    
    nin-jin
    11.07.2025 19:56
    #28561714
    Ну, в Яндексе, когда я всё это рассказал, мне сказали, что подыщут проект, в котором мне было бы интересно. Год уже ищут. Так что да, можно сказать не прошёл.
    
    Katasonov
    11.07.2025 19:56
    #28561778
    А я думал там один только интересный проект это поисковый движок на хардкором си. Но я уже старый и видимо Яндекс уже не тот, а в России я давным давно не был.
    
    ApxuTechTop
    11.07.2025 19:56
    #28561554
    Так сохранность не гарантируется потому что скоро выйдет новое апи с другим форматом хранения данных, и потому что для хранения используются сервера добровольцев(это чтобы можно было легко протестировать свой проект)
    
    nin-jin
    11.07.2025 19:56
    #28561746
    То, что публичные сервера поддерживаются энтузиастами, как раз не особо влияет на сохранность, так как копия данных есть на каждом клиенте. А вот сохранять обратную совместимость на них было бы больно, пока формат не устаканился.

Fafhrd
11.07.2025 19:56
#28560654
Если да, то Link service , сразу возвращает это корочку ссылку. Если нет, то он обращается к Shortener service, для генерации короткой ссылки.

Привет отслеживанию переходов и тестированию эффективности информационных площадок.

totsamiynixon
11.07.2025 19:56
#28560844
Для новичков: я бы не стал руководствоваться этой статьей при подготовке к System Design. Найдите книжку топ 100 типовых задач на систем дизайн интервью и посмотрите 5 роликов на Ютубе на английском и 5 на русском. Чтобы понимать, в каком стиле может быть коммуникация с инеивртювером. И делать это за недели 2-3 до собесов, чтобы было свежо в голове. Это спринт, а не марафон.

Секрет System Design секции интервью в том, попадется ли вам знакомая задачка и какое будет настроение у интервьювера. Но даже если вам попадется именно задача на сокращатель ссылок, то с таким решением как в статье вас развернет даже интервьювер, у которого вчера жена родила.

Секрет System Design в том, что даже одну и ту же систему мы можем построить по разному.

Соответственно, типичный интервьювер решение задачи интерпретирует как хочет, особенно оценка будет не в вашу пользу, если вы решаете задачу не так, как в методичке, или не так, как решил бы ее сам интервьювер. Гейм Овер.

Нет «идеального» дизайна — есть оптимальный для конкретных требований и усоливий.

Даже для конкретных требований и условий бывают очень разные градации оптимальности. Все зависит от степени детализации требований. Чем дольше собираются требования, тем позже начало разработки, но тем выше точность в выборе решения. В современном Agile мире дизайн не бывает оптимальным никогда, так как требования собираются прямо в процессе разработки. Помимо всего прочего, команду болтает со стороны в сторону: что-то не учел PO, новая аналитика от продакт менеджера показывает, что пользователю нужно B, а изначально разрабатывалось под А. Поэтому дизайн получается просто минимально рабочим. Я думаю не нужно объяснять разницу между "оптимально" и "минимально жизнеспособно". И чем дольше разрабатывается продукт в таком режим, тем менее жизнеспособным он становится - постоянные сбои в одном месте из-за того, что "ветер подул" в другом. И тут такие исходы:
- Продукт умирает в зародыше по не техническим причинам (1-12 месяцев).
- Продукт умирает от того, что тот способ, которым строили минимально жизнеспособно решение не выдержал конкуренции и в конечном итоге начал отставать от конкурентов по скорости внедрения фич (через 1-3 года). Причем у конкурентов тоже может быть криво косо, но инвестор залил больше денег и теперь не 9 женщин рожает ребенка за месяц, а 19. А может быть и так, что денег залили вам, но у конкурента его 9 женщин рожает быстрее, чем ваши 19. В общем это отчасти лотерея.
- Продукт растет, но выживает на грани, скорость внедрения фич критически минимальная, стоимость обслуживания критически максимальная (3-6 лет); но база клиентов покрыта и рефакторинг начался более менее вовремя. Но проблема в том, что его делают те люди, которые делали "чтобы заработало" и делать "оптимально" они не знают как, а если и знают, то уже забыли; в результате рефакторинга получается чуть менее уродливое нечто и так до следующего рефакторинга через 2-3 года.
- Продукт выживает на грани, но без рефакторинга. Новые фичи перестают добавляться. Продукт превращается в Легаси и уходит на саппорт (6+ лет до бесконечности).
- Продукт изначально строится как клон какого-то другого софта. Тут можно попробовать построить что-то оптимальное, но где вы найдёте людей, которые обладают нужными знаниями и опытом... В итоге получается чуть лучше и чуть дешевле, чем у конкурента и может быть даже получится переманить часть аудитории. Или "импортозаместить". А может быть и нет.
Реальная работа это: придти на новый проект и разобраться, как он устроен. Найти способ добавить новую фичу и не сломать существующие. Перед этим провести валидацию требований, а достаточно ли информации, чтобы сделать хоть что-то. Протянуть эту фичу по всей системе. И тд.

Поэтому системный архитектор сейчас это просто самый опытный человек в компании с точки зрения знания продукта и его технической реализации; и его самая главная задача, это помогать добавлять новые функции на кросс-командном уровне, чтобы сохранить "минимальную жизнеспособность". Откуда ему знать, как делать оптимальные системы, если он сам с ними никогда не работал и у него такой задачи не стоит.

А так, систем дизайн интервью проверяет только одну вещь - как вы готовились к систем дизайн интервью и вашу удачу. Вот и думайте.
1. IvanZiv972003 Автор
  11.07.2025 19:56
  #28562014
  Добрый день.
  
  Статья не предназначена для подготовки к собеседованию по System Design и уж точно не является полным теоретическим материалом по этой теме. Привожу пример примитивной системы для того, чтобы было понимание последовательности шагов, которой нужно придерживаться при решени задач проектирования. По этапам System Design есть вопрос?
  
  Зачем экстраполировать содержание статьи для новичков или людей которые просто хотят узнать что-то новое, до масштабов руководства по прохождению собеседований и решения реальных задач?
  
  Если бы я хотел написать полное руководство, я бы последнем делом выкладывал ее на Хабр как она есть. Потому что важного материала очень много и он не всегда интуитивно понятен.
  
  С вашей стороны некорректно делать акцент на новичках и не советовать им читать мой материал. Или по по аналогии я предположу, что изучение физики в школе вы сразу начали с Курса теоретической физики Ландау и Лифшица?
  1. nin-jin
    11.07.2025 19:56
    #28562170
    По этапам System Design есть вопрос?
    
    Разумеется. Вопрос безопасности не рассмотрен вообще. А авторизация улетела в "дополнительные опциональные фичи".
    
    IvanZiv972003 Автор
    11.07.2025 19:56
    #28562296
    Как известно Авторизация в системе относится к функциональным требованиям, так как она описывает конкретное поведение системы - процесс проверки и подтверждения прав пользователя для доступа к системе. Как правило выступает отдельным модулем.
    
    Безопасность - относится к нефункциональным требованиям, так как определяет как система себя ведет с точки зрения защиты.
    
    И требования к авторизации и требования к безопасности, как вы видите, не входят в требования к системе описанной в этой статье.
    
    Но ваши ожидания от статьи я зафиксировал, учту в следующих итерациях или вынесу в отельный материал, спасибо!
    
    nin-jin
    11.07.2025 19:56
    #28562350
    Ага, обновите промпт, может хоть с восьмой попытки у вас получится статья по System Design без вопиющих косяков.
    
    IvanZiv972003 Автор
    11.07.2025 19:56
    #28562448
    На мой взгляд вы не очень любезны, однако надеюсь, что каждый открываемый вами материал будет соответствовать вашим ожиданиям.
    
    totsamiynixon
    11.07.2025 19:56
    #28562668
    А RPS, CCU, R, A точно важнее авторизации и аутентификации? А как же панель управления, аналитика и другие элементы системы, которые имеют ключевую бизнес ценность? Что да двойные стандарты.
    
    Наклепали (не Вы конкретно) какой-то горе-фреймворк для расчета сферического коня в вакууме, и теперь пытаетесь подогнать реальность под него (Вы в частности). Типа "мы не придумали как это считать и чтобы классно на интервью выглядело, поэтому давайте не считать".
    
    santjagocorkez
    11.07.2025 19:56
    #28562568
    А можно хотя бы один жизнеспособный пример авторизации в отношении анонимных пользователей?
    
    nin-jin
    11.07.2025 19:56
    #28562766
    А откуда вы взяли вдруг анонимных пользователей? Они очень быстро засрут вам всю базу данных.
    
    santjagocorkez
    11.07.2025 19:56
    #28563682
    Оттуда, что аутентификация не заявлялась, из чего следует, что все пользователи анонимны.
    
    Вопрос тот же: авторизация при анонимности пользователей.
    
    nin-jin
    11.07.2025 19:56
    #28563868
    У нас тут похоже какая-то спец-олимпиада..
    
    santjagocorkez
    11.07.2025 19:56
    #28563908
    Не иначе. Спец. олимпиада «назови аутентификацию авторизацией»
  1. totsamiynixon
    11.07.2025 19:56
    #28562646
    На мой взгляд такой материал не несёт никакой ценности для тех, кто всё-таки решил разобраться в системном дизайне.
    
    Джунам и миддлам не до этого, им бы просто основы языка и среды разработки понять (включая базовые принципы развертки, CI/CD, базы данных, юнит тестирование и ТД).
    
    А синьеров с ролью тех лида Ваш пример собьёт с толку. Как делать рассчет уже написана масса статей, Вы сами приводите ссылки. А дизайн у Вас получился как минимум спорный, и чего-то новое подчерпнуть не сможет даже техлид в небольшом стартапе (5-6 лет опыта), а уж техлид в бигтехе (10+ лет опыта) тем более.
    
    Остаются всякие недосиеньеры, которые каждый год ходят по собесам в надежде заткнуть собой какую-нибудь дырку за побольше денег. Но для них стратегия другая. Думать и понимать не надо, надо заучить, "задрочить", и пока не забыл идти на интервью. Потому что на самой работе все будет совсем не так.
    
    Тогда для кого статья?
    
    Я в комментарии старался подсветить читателю стати, что не надо думать, что читатель какой-то не такой, если его опыт совсем другой, если он не согласен с Вашим решением. Если у него есть свое решение, а его предложения заворачивают "более опытные" на работе или на интервью. Возможно его решение даже технически лучше "старшего" или "экзаменатора", он подошёл более творчески и креативно, но язык у него подвешен не как у старшего или синдром самозванца. И это надо проламывать, в себе настаивать, искать способы донести бизнесу и команде свой вариант технического решения, но и при этом слушать обратную связь и учиться ее фильтровать. Если критика по делу, а не вкусовщина - принять, поправить решение, выучить что-то новое, заполнить пробелы. Если критика в роде "я говорю твое решение говно, значит говно" - тоже сделать выводы, но уже не о себе.

griha_shershen
11.07.2025 19:56
#28563850
Откуда взялись 300 долларов за гигабитное соединение? На всех хостингах это обойдётся максимум 1к как допуслуга а чаще это встроено в тариф(хотя 3 моих любтивх хостинга до машины за 3к дают только 200-250мбит)

rexer
11.07.2025 19:56
#28563982
У меня есть замечание к статье - оно в разделе "Выбор базы данных"

На настоящем System Design собесе вас как раз попросят объяснить выбор PostgreSQL и ответ типа:

> Будем использовать реляционную СУБД PostgreSQL. Потому что наша таблица имеет строгую структуру и нам важна быстрота

Вас не спасет. Как раз это тот вопрос и то место, которое точно "будут качать", а по формулировке почти любая БД вам подойдет (плюс непонятно при чем тут строгая структура).

Второй важный момент, который упущен, это то, как вы будете генерировать уникальные короткие ссылки - ответ на этот вопрос как раз влияет на архитектуру и нагрузку очень серьезно.

Вот эти два момента - они основные и вам надо их доработать. А статья написана аккуратно, читать приятно было.

kadim_rd
11.07.2025 19:56
#28569378
A = N * S = 910 000 * 400 = 364 000 000 Б = 364 МБ.

И с хранением данных за год такая же ошибка

Шаг за шагом проектируем сокращатель ссылок +3

Сбор требований

Расчет нагрузки и стоимости

Дизайн

Проектирование API

Как работает перенаправление?

Выбор базы данных

Оптимизация

Что еще можно сделать?

Комментарии (36)

IvanZiv972003 Автор

IvanZiv972003 Автор

IvanZiv972003 Автор

IvanZiv972003 Автор