Многие предприятия обмениваются документами, которые пикселизированы, чтобы защитить личную информацию: это могут быть номера банковских счетов, фотографии или любая другая персональная информация. Хотя используемая для этого пикселизация должна быть простым и эффективным способом сокрытия конфиденциальной информации, но теперь компьютеры стали достаточно «умны», чтобы «прочитать» такие искаженные образы, даже если Ваш глаз не может этого сделать. Пикселизированные документы более не являются безопасными!

Исследователи из Университета Техаса и Cornell Tech разработали программу на основе искусственного интеллекта, которая способна читать стандартные техники маскировки контента (например, размытость или пикселизация), чтобы прочитать то, что за ними спрятано.

Один из авторов, Виталий Шматиков, предупредил, что помимо сложных технических разработок, «техники, которые мы использовали в этом документе, вполне стандартны в области распознавания изображений, что вызывает беспокойство».

Но эти исследователи — не единственные, кто разрабатывает такой тип программ. Для тех, кто хочет воспользоваться подобными решениями, уже доступны более мощные техники распознавания объектов и лиц. Это означает, что кибер-преступники уже могут иметь инструменты для раскрытия личной информации, которую Вы скрыли.



Для проведения своего исследования, они использовали в нейронных сетях изображения с лицами, словами и объектами. Чем больше раз нейронные сети «видели» эти изображения, тем проще им было их распознавать. После успешного запоминания фотографий, нейронные сети были способны успешно побороть три технологии защиты конфиденциальности, включая технологию размытия YouTube, пикселизацию и Privacy Preserving Photo Sharing (P3).

Получается, что пикселизация или размытие информации уже не являются лучшими способами для сокрытия конфиденциальной информации при обмене документами. По данным исследования, ПО способно было распознать 80% искаженных изображений.

По словам Лоуренса Саула, исследователя по вопросам машинного обучения в Университете Калифорнии (Сан-Диего, США), «чтобы преодолеть конфиденциальность, на самом деле Вам не требуется показать, что Вы способны восстанавливать оригинальное изображение в 99,9% случаев. Если в 40 или 50 процентах случаев Вы можете угадать лицо или определить сокрытый текст, то этого достаточно, чтобы понять, что данный метод сокрытия информации должно быть устарел».

Чтобы обеспечить безопасность Вашей корпоративной информации, лучшее, что Вы можете сделать, — это предотвратить обмен этими документами (если это возможно или Вы можете это сделать).
Поделиться с друзьями
-->

Комментарии (15)


  1. fishca
    06.10.2016 09:58
    -2

    а интересно есть способы распознавания стеганографии?
    или…

    нельзя...
    image


    1. iChaos
      06.10.2016 11:44

      Есть и немало: https://ru.wikipedia.org/wiki/Стеганография#Атаки_на_стегосистемы
      Другое дело, что хорошо спроектированная и реализованная стегосистема, должна в как можно большей степени нивелировать эффект этих методов…


      1. fishca
        06.10.2016 13:30

        Спасибо. Думаю плохо спроектированную нет смысла реализовывать.


  1. Mobyman
    06.10.2016 09:59
    +4

    > Чтобы обеспечить безопасность Вашей корпоративной информации, лучшее, что Вы можете сделать, — это предотвратить обмен этими документами (если это возможно или Вы можете это сделать).

    А я подумал, что можно просто закрашивать сплошным цветом, это не подходит? :) Да и вообще, это вроде не новость, уж лет 5 назад где-то читал подобное.


  1. n0wheremany
    06.10.2016 10:44
    +11

    Примеров то нет, какое было изображение, какое стало, после «депикселизациии».
    Если изображение размыто до 16х16 и получилось 4 пикселя как в топике, то ты хоть что сделай — все равно не получится исходное изображение.
    >Чем больше раз нейронные сети «видели» эти изображения, тем проще им было их распознавать
    Такое ощущение, что показывали исходное изображение, потом пикселизированное. И «нейронные сети» их вычисляли.

    Если размывать до 2x2 (что бы это не значило), то о какой конфиденциальности может иди речь?
    Но лично мне проще закрасить приватные данные.


    1. leshabirukov
      06.10.2016 11:12
      +6

      Вот-вот, подано ужасно. Эмоции есть, конкретики нет, слово «нейросеть» используется вместо слова «магия».
      Правда, в данном случае можно попытаться додумать недописанное. Вырисовывается что-то такое: нейросеть натренировали на специальную задачу: восстанавливать из пикселизации написанный определённым шрифтом (или даже почерком) текст. Опять же очевидно, что чем меньше пикселей, тем меньше качество распознавания, выше требования к априорной информации (например, знать позиции букв).
      Додумать можно, но статья не располагает, будто болтуна слушаешь.


  1. rPman
    06.10.2016 11:33
    +2

    Полагаю если пытаться восстанавливать по одному кадру видео то это нереально, но если по серии кадров, двигащихся, то вполне возможно, и полагаю, без нейросети (это простое уравнение, с большим количеством неизвестных)


  1. Smi1e
    06.10.2016 11:50

    Добавлю к теме знаменитые статьи YUVladimir.


    1. Gryphon88
      06.10.2016 17:12

      Это немного не то: размытие — это линейная обратимая операция. В мире холодных чисел мы можем матрицу изображения умножить на передаточную матрицу (смаз, дефокус), а потом поделить результат на матрицу смаза и получить исходное изображение. В реальности все похуже, но все равно работает.
      А усреднение или любой ранговый фильтр нелинеен, и поэтому не существует способа его обратить.

      Вот исходная научная статья c arxiv.org , а не желтушная с wired. Даже немного кода есть. Если вкратце, то ведётся с помощью сопоставление хитрой нейросети сопоставление мозаичной картинки и базы фотографий. По одной картинке ну вообще никак, визально лучше сделать можно, но тоже с помощью базы и на полное обращение никто не претендует.


  1. SyavaSyava
    06.10.2016 12:43

    В оригинале так же ничего не понятно — по крайней мере с моим уровнем английского я не заметил никакой конкретики. Похоже, теперь «neural network» действительно будет заменять «магию», как раньше это делали всякие «data mining», «big data» и прочие чудо-технологии.
    Накидал в пресс-релизе побольше «neural network», создал «startup», поднял пару раундов финансирования на $100500 — профит. Суть процесса не меняется с пресловутого «бума доткомов».
    Очень полезным было бы очевидное применение «neural network» для вычленения хоть крох смысла из подобных статей, но именно этого применения мы судя по всему и не дождёмся. Да и зачем? Результат известен — нуль, и без всяких «neural network».


  1. CAJAX
    06.10.2016 15:04

    Ссылочка по теме https://github.com/Tetrachrome/subpixel


    1. funnybanana
      12.10.2016 03:30
      +1

      wow эффекта не вышло, на их примере верхняя строка входное изображение, вторая строка результат, а третья — оригинал:

      image

      Но достаточно просто прищурить глаза глядя на верхнюю строку и получаем тот же результат…

      Для движущихся же объектов задача вполне имеет решение — многокадровое суперразрешение.

      Достаточно быстро моргать глядя на видео, тогда лицо человека скрытого с помощью пикселизации — будет видно более разборчиво.


  1. DistortNeo
    06.10.2016 18:14

    Забавно, учитывая, что в задачах распознавания лиц используется нормализация — приведение всех изображений к единому представлению. Причём в старых алгоритмах использовался ресамплинг до разрешения порядка 16х16, а то и меньше.

    Для движущихся же объектов задача вполне имеет решение — многокадровое суперразрешение.

    Если нейросети настолько прокачаны, что способны распознавать лицо из пикселей, то ничто не мешает с помощью нейросети просто подменять одно лицо на другое.


  1. chieftain_yu
    07.10.2016 08:43

    Если скормить ей «черный квадрат», что получится?


    1. iChaos
      07.10.2016 14:21

      > Если скормить ей «черный квадрат», что получится?

      Автопортрет Малевича ;)