Эволюция детекции дипфейков: от подсчета морганий до распознавания микроскопических изменений цвета кожи / forpes.ru

Главная
Эволюция детекции дипфейков: от подсчета морганий до распознавания микроскопических изменений цвета кожи

Эволюция детекции дипфейков: от подсчета морганий до распознавания микроскопических изменений цвета кожи +15

01.06.2026 07:41

konstantin_kozhin 0 7700 Источник

— …для начала нужно понять главное.
— Что главное?
— Ложки не существует.

В 2026 году этот диалог из фильма «Матрица» звучит уже не как философская метафора, а как обыденность в интернете. Все понимают, что видео теперь не является доказательством, голос больше не подтверждает личность, а в фотографиях от реальности нет и следа. Для обычного пользователя это означает потерю доверия к контенту, а для бизнеса — риск подделки личности, мошенничества и ошибочных решений. Как же так вышло, что нас повсюду окружают симулякры?

Сгенерированный контент стал нормой

Масштаб проблемы ярко представлен в исследовании компании Ahrefs, где выяснили, что в апреле 2025 года 74,2% новых веб-страниц содержали сгенерированный материал. Анализ охватывал около 900 тысяч страниц, опубликованных за месяц. При этом полностью «человеческими» были признаны лишь около четверти материалов.

Но на создании развлекательных видео проблема не заканчивается. Согласно отчету Regula Deepfake Trends 2024, каждая вторая компания в мире уже сталкивалась с инцидентами, связанными с дипфейками.

Ключевые выводы исследования Regula В данном случае технологии уже используются в качестве инструмента социальной инженерии, применяются в мошенничестве и подделке личности, а также в корпоративных атаках. Ущерб от подобных инцидентов, по данным Regula, уже исчисляется сотнями тысяч долларов.

Вместе с этим индустрия генерации и индустрия обнаружения дипфейков развиваются как две стороны одной гонки вооружений.

Проследим за гонкой вооружений вокруг дипфейков

Каждый новый скачок в качестве генерации сопровождался волной исследований в области детекции. Пока одни модели учатся рисовать реалистичные лица, другие пытаются обнаружить артефакты, ошибки в рендеринге или отличия физиологии реального человека и дипфейка. Основная проблема в том, что методы детекции устаревают быстрее, чем создаются новые методы генерации.

Ранний этап

Первые массовые дипфейки были достаточно примитивными, так как генеративные модели плохо работали с мимикой и освещением. Поэтому многие подделки можно было легко распознать визуально, чем и пользовались первые детекторы, которые появлялись в 2018–2020 годах. Одной из самых известных ранних работ стала статья In Ictu Oculi: Exposing AI Generated Fake Face Videos by Detecting Eye Blinking. Исследователи заметили, что ранние модели генерации почти не воспроизводили естественное моргание. Причина была в том, что в обучающих датасетах было мало изображений людей с закрытыми глазами.

Пример обнаружения моргания на оригинальном видео (сверху) и на поддельном (снизу), сгенерированном DeepFake. Обратите внимание, что в первом случае моргание можно обнаружить в течение 6 секунд, а во втором этого нет, что ненормально с физиологической точки зрения.

Детектор анализировал частоту и последовательность моргания в видео, и если человек на записи подозрительно медленно моргал, видео помечалось как потенциальный дипфейк.

Становление

Следующий этап начался с того, что исследователи перестали искать отдельные артефакты. Индустрия сместилась в сторону крупных датасетов и универсальных моделей детекции.

Ключевым проектом стал FaceForensics++. Авторы предложили не только масштабный датасет и бенчмарк, но и доменно-специфичный подход к детекции лицевых манипуляций. Вместо того чтобы анализировать изображение целиком, система сначала отслеживает лицо, выделяет его область и затем передает ее в классификатор. Это позволило обучать модели на множестве примеров подделок и проверять, насколько хорошо они работают на разных типах манипуляций.

Входное изображение обрабатывается устойчивым методом отслеживания лица; полученная информация используется для выделения области изображения, которая занята лицом. Затем эта область передается в обученную классификационную сеть, и та выдает предсказание.

Фактически проект стал стандартным бенчмарком для детекции дипфейков.

Современный этап (2021–2026)

После 2021 года появились модели, которые способны генерировать контент, неотличимый от реальных видео. Они умеют синхронизировать движения губ с речью, учитывают освещение и угол наклона камеры и даже работают в реальном времени. На этом фоне индустрия детекции начала уходить от концепции поиска визуальных дефектов, заменив ее более сложными подходами.

В качестве примера можно назвать проект Intel FakeCatcher. Вместо анализа пиксельных артефактов система исследовала микроскопические изменения цвета кожи, связанные с кровотоком. Для человека они незаметны, но генеративные модели долгое время воспроизводили их некорректно.

Система выделяет несколько областей лица на подлинных и поддельных портретных видео, извлекает из них биологические сигналы, связанные с кровотоком, и анализирует их пространственную и временную согласованность. Затем признаки передаются в классификатор, и он оценивает вероятность того, настоящее видео или поддельное.

Появились современные методы детекции, но проблема никуда не делась: модели генерации все еще развиваются быстрее, чем способы их обнаружения. Отсюда вывод: универсального способа детекции не существует, поэтому нужно сменить фокус в сторону устойчивости моделей к новым типам генерации и создания более практичных бенчмарков.

MNW Benchmark — еще один датасет или решение проблемы?

Датасеты очень быстро устаревают, ведь многие из них создавались в эпоху ранних моделей, где дипфейки содержали заметные артефакты и свои особенности. Именно эту проблему пытается решить Microsoft-Northwestern-Witness (MNW) Benchmark.

Из чего состоит MNW

MNW создавался, чтобы приблизить детекцию дипфейков к реальным условиям современной генерации. Ключевая идея MNW — не просто в увеличении объема данных, а в разнообразии источников синтетического контента. Первая версия MNW содержит более 50 тысяч артефактов: изображения, видео- и аудиофайлы. При этом авторы подчеркивают, что набор предназначен именно для оценки детекторов, а не для их обучения или коммерческого использования.

*Примеры сгенерированных изображений из MNW Benchmark.*

Датасет содержит разные визуальные сценарии, чтобы проверять, насколько хорошо детекторы работают не только на знакомых тестовых данных, но и на более разнообразном контенте, похожем на реальные публикации в интернете.

Бенчмарк включает сразу несколько типов синтетического контента:

сгенерированные изображения;
дипфейк-видео;
синтетическое аудио;
мультимодальный контент, где одновременно используется несколько типов данных.

При этом данные генерируются не одной моделью, а большим набором современных нейросетей. Это важно, потому что детектор не должен запоминать артефакты конкретной модели, он должен уметь обобщать признаки синтетического контента.

Еще одна особенность MNW — регулярное обновление. Команда планирует пополнять датасет весной и осенью, чтобы учитывать новые генераторы, новые артефакты и новые способы обхода детекторов. Поэтому MNW стоит воспринимать не как статичный набор данных, а как живой тест на устойчивость моделей.

Также важная особенность MNW — ориентация на способность моделей обобщать новые типы генерации. По сути, бенчмарк отражает главный сдвиг современной индустрии — переход от поиска конкретных дефектов изображения к задаче устойчивой детекции синтетического контента в постоянно меняющейся среде.

Что в итоге?

Главный вывод этой гонки не в том, что однажды появится идеальный детектор дипфейков. Скорее наоборот: каждый детектор отражает слабости генеративных моделей своего времени. В этом смысле MNW Benchmark важен не как очередной набор данных, а как симптом зрелости индустрии. Детекция перестает быть разовой проверкой «настоящее или фейк» и становится частью инфраструктуры цифрового доверия. В мире, где видео, голос и изображение больше не являются доказательством сами по себе, рассчитывать на доверие не получится, его придется постоянно заслуживать.

— Ложки не существует.
— Не существует?
— …Всё — обман. Дело в тебе.