Сегодня речь пойдёт о защите информации: рассказываем, зачем превращать персональные данные в неперсональные и как это делается.
Современным компаниям не нужно много рассказывать про сложности работы с персональными данными. Все и так знают, как непросто обеспечить правильное хранение такой информации, какими серьёзными угрозами могут обернуться даже небольшие инциденты, не говоря уже о скандалах с утечками. Есть и менее очевидные проблемы – например, если команда создаёт систему, которая будет работать с персданными, продукт нужно как-то тестировать. Реальные данные для этого лучше не брать, приходится их видоизменять, маскировать, анонимизировать.
У разработчиков есть целый набор технологий для разных сценариев работы с персданными. Чтобы безопасно передать информацию, её шифруют. Чтобы оператор колл-центра не увидел состояние счёта клиента, цифры автоматически скрывают маской. А мы хотим рассказать про технологию токенизации, которую недавно внедрили в одном из наших проектов.
Что такое токенизация
Токен – это сущность, которая заменяет данные в процессах обмена между информационными системами. Система токенизации служит прослойкой между защищённой базой и системами-получателями данных. Она присваивает данным, которые соответствуют определённой позиции в БД, своеобразный идентификатор – токен.
Только токены передаются внешним системам. Если злоумышленник их перехватит, реальные пользовательские данные он не узнает. Когда система токенизации получает ответ на запрос, она проводит обратную операцию и возвращает рабочей системе результат с реальными данными.
В чём состояла задача
Нашему заказчику нужно было соблюсти требования законодательства, которое обязывает российские компании обрабатывать и хранить персональные данные россиян на территории РФ. Трудность в том, что наш клиент взаимодействует с международной информационной системой, поэтому от нас требовалось выстроить такой процесс, который бы и бизнес-процессам не помешал, и закон не нарушил.
Здесь мы и применили токенизацию. Наш сервис включает в себя хранилище и средства преобразования персданных. С ним интегрированы рабочие системы заказчика. Сотрудники компании видят на UI реальные данные пользователей, а во внешнюю систему они приходят в преобразованном виде. В преобразованном виде данные хранятся и во внешней БД. Токенизатор запрашивает их, возвращает в первоначальное состояние и сохраняет результат в хранилище заказчика.
То есть реальная персональная информация не покидает российский сервер. При этом с точки зрения бизнес-процессов данные каждого пользователя в зарубежной системе хранятся и обрабатываются абсолютно корректно.
Такая схема также позволяет сотрудникам заказчика заполнять клиентские данные на русском языке, ведь теперь мы не зависим от требований международной системы, которая понимает только латиницу.
Кому ещё может быть это полезно
Токенизацию можно применять во всех случаях, когда нужно обрабатывать приватные данные. Медицинская информация, кадровые архивы, электронные письма и сообщения – если компании нужно куда-то передавать такие данные, то токены помогут ей сохранить безопасность.
Для интернет-магазинов и вообще любых онлайн-площадок, где можно что-нибудь купить, токенизация – это страховка от рисков из-за обработки платёжных данных. Чувствительная информация хранится в закрытой базе у провайдера, а токены используются при проведении покупок. Провайдер получает токен, проводит транзакцию внутри своей инфраструктуры, возвращает результат (деньги списаны, можно отпускать товар).
Банки, платёжные системы, финансовые организации используют токены, чтобы клиентам не приходилось вручную менять данные карты при перевыпуске. В этом случае новая карта автоматически подтягивается к уже сохранённому токену. С токенизацией также проще выполнять требования законодательства и отраслевых стандартов вроде PCI DSS.
Чем токенизация отличается от шифрования
Закономерный вопрос – зачем создавать дополнительный сервис, если информацию можно просто зашифровать. Самое главное – токенизация работает проще, компании не приходится преобразовывать весь объём персональных данных – они хранятся в изначальном виде внутри защищённого контура. Для создания токенов требуется гораздо меньше вычислительных ресурсов, чем для того, чтобы зашифровать и дешифровать информацию. И масштабироваться с токенами гораздо проще – в случае шифрования требования к ресурсам будут расти гораздо быстрее.
Наконец, зашифрованные данные должны храниться на собственных мощностях, а токенизация позволяет компании держать их у внешнего провайдера. Как следствие, злоумышленникам незачем такую компанию атаковать, бизнес может доверить свою безопасность профессионалам.
gecube
очень поверхностно описано. Все-таки суть токенизации в чем?
fedorro
Вместо данных о пользователе отправляется его ИД. Ещё этот ИД можно обратимо преобразовать в другой ИД и назвать токеном, как я понял.
gecube
Ну, это понятно, но это накладывает определенные ограничения на ту систему, которая на картинке справа.
Предположим, я делаю систему, которая отправляет СМСки. И я хочу, чтобы в СМС было написано обращение к пользователю ("Уважаемый, Федор!"). Ну, и чем мне помогут токены? Все равно придется в правую систему как-то передавать имя пользователя. Уникальные айди хороши и они сработают ТОЛЬКО ЛИШЬ, ЕСЛИ нужно отличать пользователя А от пользователя Б, но я бы не сказал, что это самая популярная задача...