Часто клиенты, подписывая договор об услугах облачных провайдеров, не задумываются о том, где территориально будут храниться их данные. Между тем, в размещении серверов есть своя неожиданная логика. Расскажем о ней подробнее в этом материале.
Где находятся данные, хранящиеся в облаке
Сегодня для многих интернет — не место, которое посещают время от времени, а пространство, в котором живут. Благодаря этому возникает интересное искажение: человек, находящийся на другом континенте, может казаться ближе, чем живущий в соседнем доме. Отчасти это стало возможно благодаря распространению облачных сервисов для хранения данных.
Когда пользователь загружает данные в облако, чаще всего он не задумывается о том, где они будут находиться. Для многих гораздо важнее скорость передачи данных, чем место их хранения. Разбираться в географии — задача облачного провайдера, которому требуется определить оптимальное местоположения точек присутствия (POP, Point of presence) — место для размещения оборудования провайдера.
На основе выбранных точек строятся сети доставки контента (CDN, Content Delivery Network). CDN — это территориально распределенная сетевая инфраструктура. Она состоит из серверов и точек присутствия, которые принимают данные клиентов и фильтруют и направляют трафик, зеркаля и кэшируя контент. CDN помогает сократить время отклика и защитить сайты от перегрузок в моменты наплыва посетителей.
По какому принципу строится CDN
Несмотря на то, что CDN — это географически распределенная сеть, в основе ее построения может лежать не только физическое расположение. Рассмотрим несколько вариантов построения таких сетей.
По территориальной близости
Одна из крупнейших в мире CDN — Akamai насчитывает свыше 233 000 серверов в более чем 130 странах и в более чем 1 600 сетях. При размещении серверов компания выбирает место с точностью до квартала. Другой CDN-провайдер — Fastly делает ставку на меньшее количество точек присутствия (у компании их всего 32) и создание сети с уникальными возможностями. Свои серверы компания размещает на перспективных пересечениях сетей.
При этом, в основе действий обеих компаний лежит одинаковый подход. Провайдер выбирает площадки в соответствии с текущей или прогнозируемой потребностью рынка, которая позволит быть ближе к пользователям.
По мере роста сетей провайдеры ищут возможности для создания новых PoP. Как правило, большинство из них сталкиваются с одинаковыми проблемами. Большая часть пользователей находятся в населенных пунктах, а места расположения самых крупных сетей хорошо известны. Поэтому логичной выглядит установка серверов на пересечении самых масштабных сетей, расположенных вблизи максимального количества пользователей. Однако это не всегда срабатывает, так как на CDN неожиданно оказывает влияние политика и культура.
По языковой принадлежности
Язык — еще один важный фактор, влияющий на определения местоположения точек доступа. Например, расстояние между европейскими странами довольно мало. Но фактически в каждой стране кэшируется собственный контент. В Германии читают и смотрят немецкие материалы, во Франции — французские. Поэтому каждая страна получает собственный PoP.
Австралия остается проблемным участком для провайдеров, задача которых — удержать повышенный трафик в пределах сети, в которой находятся пользователи. Если это не удается, приходится обращаться к другим близлежащим сетям. Каналы связи с Азией имеют более узкую полосу трафика, чем каналы связи с западным побережьем США. Поэтому, если пользователь запрашивает небольшой объем данных, он может получить их из Сингапура или Малайзии. Объемные файлы с большей долей вероятности будут идти через США.
По политическим мотивам
Еще один существенный момент — место хранения данных с точки зрения законодательства той или иной страны. Иногда пользователи сами хотят, чтобы их данные обрабатывались внутри их страны. Но чаще всего на этом настаивают регуляторы. Для этого требуется добавить мощности, способные справиться со скачками спроса на определенный контент.
По ситуации
Иногда на решение о размещении новых серверов влияют крупные внешние события. Например, в 2010 году компания Akamai обеспечивала потоковую трансляцию чемпионата мира по футболу. Компании пришлось размещать свое оборудование там, где потребуются мощности. Для этого эксперты анализировали, у каких команд выше шансы пройти в следующий раунд и когда люди будут смотреть матч из дома, а когда из паба.
Очевидно, что чем дальше проходит команда, тем больший интерес проявляют местные жители к трансляции чемпионата. Игры, которые проходят в нерабочее время, скорее всего, будут смотреть в телевизоре дома или в пабе, а игры в рабочее время будут транслироваться в окне на рабочем столе компьютера.
Очевидно, что такие сложные подсчеты с прогнозами развития ситуаций — сложная задача. Поэтому поставщики облачных услуг стремятся абстрагироваться от нее, используя достаточно мощностей, которые хватит даже на пики потребления трафика. Тенденция такова, что многие истории, связанные с географией и языком, уходят в прошлое. Сегодня компании стараются делать ставку не на время и географическое расположение, а на метрики потока данных и проценты пропускной способности. В перспективе провайдеры будут и дальше разделять влияние физических условий на производительность сети от физической реальности того, что происходит внутри сетей.