Трудно представить себе жизнь современного человека без машинного обучения и искусственного интеллекта. Данные технологии создают новые возможности. Например, системы безопасности в метро используют машинное обучение для распознавания и поиска лиц, которые находятся в розыске. Компьютерное зрение используется в беспилотных автомобилях и летательных аппаратах для коммерческих и военных целей.
Как можно использовать ML "не во благо":
Результаты работы машинного обучения могут быть использованы сторонними лицами, для извлечения персональных данных в корыстных или обывательских целях. Именно этого сейчас боятся жители больших городов с внедрением служб видео и фото фиксации (мониторинга).
С помощью этих технологий можно дезинформировать или создавать фейковые новости.
Примечательно, что можно практически не беспокоится за поколение, родившееся после 1996, так как молодые люди с легкостью отличают “зерна от плевел” и фильтруют новости из социальных сетей и новостных ресурсов, о чем говорит публикация об исследовании. Только 7% молодых людей Поколения Z уверены, что социальные сети - это надежный информационный источник, в тоже время более половины студентов склонны верить онлайн газетам и новостным сайтам.
Обзор инструментов с применением технологии машинного обучения (искусственного интеллекта)
А вы знали, что с помощью этих современных технологий можно сгенерировать данные в виде фото (картинок), видео или текста?
Генерация фото (картинок). Воспользуйтесь сервисом thispersondoesnotexist и получите реалистичное онлайн фото никогда не существовавшего человека. Тот же самый принцип, но с генерацией фотографий котиков, получив три-пять пушистых фотографий вы поймете, что сервис иногда выдает довольно курьезные картинки.
Генерация видео. Возможно вы встречали на интернет просторах реалистичное видео синтезированого Барака Обамы, чей искусственный рот может произнести любую вложенную в него речь. Технология генерации видео с использованием искусственного интеллекта была изобретена учеными Вашингтонского Университета для создания публичных речей и впечатлила общественность.
Генерация текста. Алгоритм GPT-3 может генерировать любой связный текст по введенному пользователем текстовому описанию.
Генерация музыки. Здесь заслуживают особого внимания нейронные сети от OpenAI: Jukebox создана для генерации музыки из ничего; MuseNet может сгенерировать 4-минутные композиции, используя десять различных музыкальных инструментов.
DeepAI позволяют "создать текст" через API. Есть примеры описания API для: bash/Node.js/Python/Ruby/C#.
Ниже перечислены некоторые инструменты, которые открывают нам другие интересные возможности:
Image Colorization - добавит красок на черно-белые изображения;
Facial RecognitionImage Similarity - определяет лица на любом изображении или видео;
Sentiment Analysis - классифицирует настроение текста;
Nudity Detection - определит есть ли на фото взрослый контент;
Text Summarization - сократит длинный текст без потери смысла;
Pose Detection - распознает позы людей на фото;
Face Anonymization - анонимизирует лица на фото.
Text Tagging - найдет ключевые слова в тексте;
Другие довольно интересные проекты от OpenAI доступны по ссылке: https://openai.com/projects/
Другие довольно интересные проекты от OpenAI доступны по ссылке: https://openai.com/projects/
Векторы развития и сценарии использования
поиск объектов и паттернов (людей и их поведения на фото, видео и в тексте) - "поиск",
искажение или полное удаление объектов - "клоакинг"
генерация и поиск "искусственных объектов" - "фейки" (создание и поиск).
Что здесь примечательно, так это две стороны одной и той же медали. С одной стороны, эти инструменты позволяют создавать новую информацию. А с другой, проверять ее на соответствие реальности. Это похоже на противоборство между созданием объектов и их дальнейшим детектированием. Как пример, создание фейковых новостей и их поиск среди реальных событий или поиск людей на фото (видео) против защиты от этого поиска.
Что касается "поиска", первое, что приходит на ум для поиска людей по фото это сервис FindFace. О нём известно с 2016 года. Сейчас этот проект переключился на b2b.
Но на рынке есть похожие компании, боты и сервисы. Их услугами могут пользоваться и частные лица.
Для защиты от инструментов поиска по фото Вы можете воспользоваться разными инструментами и сервисами.
Среди которых:
"Photo Protection" от D-ID
"Face Anonymization API" от DeepAI
Image "Cloaking" Protecting Personal Privacy by UChicago CS Researchers
Современные инструменты искусственного интеллекта и машинного обучения привносят в нашу жизнь новые возможности, новый контент и новые знания. А знание - это сила, даже если знание получено посредством искусственно созданных объектов.
Фейковые новости могут быть использованы не только для управления людьми, но и для выявления значимых настроений и мнений людей, до реальных событий. Например, чтобы узнать мнение людей до создания закона.
А искажение ("cloaking") фото может позволить найти компромисс между публичностью и приватностью, сохранением персональных данных.
Поделитесь в комментариях, используете ли инструменты генерации данных и какие заслуживают внимания?