С момента появления искусственного интеллекта прошло почти 70 лет. За эти годы он превратился в доступный рабочий инструмент, которым могут воспользоваться для своих целей даже школьники. Мы сталкиваемся с ИИ буквально на каждом шагу, произнося «окей, гугл» или «слушай, Алиса!», общаясь с чат-ботами банков и получая «письма счастья» со штрафами за нарушение ПДД. И всё чаще раздаются голоса, говорящие, что в скором времени более быстрый и сообразительный, чем человек, ИИ заменит людей, которые останутся без работы и без средств к существованию. Не заменит. Но вот пять сфер, в которых ИИ может серьёзно потеснить людей, — разберёмся, стоит ли нам опасаться конкуренции с «бездушной железякой».

Работа с изображениями

Распознавание образов было одной из самых популярных задач, которую пытались решить с помощью ИИ. Создание компьютерного зрения, как и систем распознавания речи и понимания смысла текстов являются ключевыми направлениями, в которых развиваются связанные с ИИ.

Современные генеративно-состязательные нейросети научились не только распознавать человека на фото. Они вполне успешно делают это на видеороликах, причём даже если человек замотал лицо шарфом или надел медицинскую маску.

Изображения, на которых тренировалась нейросеть DFI. Источник: A. Singh, D. Patil, G Meghana Reddy, SN Omkar (2017). Face Identification (DFI) with Facial Key Points using Spatial Fusion Convolutional Network / arXiv.org
Изображения, на которых тренировалась нейросеть DFI. Источник: A. Singh, D. Patil, G Meghana Reddy, SN Omkar (2017). Face Identification (DFI) with Facial Key Points using Spatial Fusion Convolutional Network / arXiv.org

Однако работа над узнаванием людей по фрагментам их лиц началась значительно раньше, чем пандемия. Например, опубликованная в 2017 году работа Disguised Face Identification (DFI) with Facial KeyPoints using Spatial Fusion Convolutional Network («Идентификация маскированных лиц по ключевым точкам с использованием пространственной свёрточной сети») рассказывает о результатах работы нейросети, натренированной на распознавание лиц, скрытых очками, шарфом, накладными усами или бородой.

Для распознавания лиц нейросеть DFI использовала всего 14 ключевых точек на лице, поэтому точность «узнавания» замаскированных лиц была невелика. Современные коммерческие нейросети используют несколько сотен ключевых точек на лице человека, поэтому могут обнаружить соответствие, используя лишь те части лица, которые присутствуют на изображении.

Например, китайская компания SenseTime считывает 240 ключевых точек, расположенных вокруг носа, глаз, рта. Это обеспечивает распознавание частично скрытых лиц с точностью до 90%.

Minvision, ещё один китайский разработчик систем распознавания лиц, с началом пандемии срочно дообучил свою нейросеть на распознавание людей в масках. Источником ключевых точек для опознания были глаза и области вокруг них.

Современные ИИ успешно справляются не только с работой «Большого Брата», но и выступают в роли творцов, создавая, например, фотографии несуществующих людей, котиков, аниме-персонажей или абстрактную живопись.

Изображения, сгенерированные нейросетью StyleGAN. Источник: thispersondoesnotexist.com, thiscatdoesnotexist.com, thiswaifudoesnotexist.net, thisartworkdoesnotexist.com
Изображения, сгенерированные нейросетью StyleGAN. Источник: thispersondoesnotexist.com, thiscatdoesnotexist.com, thiswaifudoesnotexist.net, thisartworkdoesnotexist.com

Свежий известный пример коммерческого использования ИИ в дизайне — нейросеть Николай Иронов, которая создавала фирменный стиль и логотипы по программе «Экспресс-дизайн» в Cтудии Артемия Лебедева.

Логотипы, разработанные нейросетью студии Артемия Лебедева. Источник: https://www.artlebedev.ru/express-design
Логотипы, разработанные нейросетью студии Артемия Лебедева. Источник: https://www.artlebedev.ru/express-design

Несмотря на фантастические возможности, которые демонстрируют нейросети, живым дизайнерам нечего опасаться: ИИ может создать бесконечное количество вариантов логотипа или картины, но выбрать среди них удачные и наиболее соответствующие поставленной задаче может только человек. Да и взаимодействовать заказчики всё-таки предпочитают с живым человеком. Более того, ИИ может повысить продуктивность дизайнера, ведь тому уже не придётся перебирать варианты вручную.

Что касается задач, связанных с распознаванием образов на видео и фото, тут с нейросетями тягаться сложно, да и вряд ли имеет смысл. Эта работа относится к разряду той, которую с радостью перепоручат роботам.

Работа с текстами

Работа с текстами — ещё одна область, в которой ИИ уверенно занимают сильные позиции. Разработанный некоммерческой компанией OpenAI алгоритм генерации текста GPT (Generative Pretrained Transformer) позволяет научить нейросети продолжать начатые человеком фразы, а также писать самостоятельные тексты.

Для обучения первой версии алгоритма использовали 117 млн параметров. Вторую версию алгоритма — GPT-2 —обучали уже на 1,5 млрд параметров, а GPT-3, самая современная версия, обучена на 175 млрд параметров. Это огромный массив данных, содержащий книги, новостные сайты, рецепты, технические руководства, религиозную литературу, путеводители и всю англоязычную Википедию. Не обошлось без довольно спорных материалов, посвящённых НЛО, пришельцам и теориям заговоров.

В результате GPT-3 умеет значительно больше, чем её ранние версии. Например, с её помощью можно пообщаться с историческими личностями или попросить её сочинить диалог между Ньютоном и Эйнштейном, стилизованный под Властелина Колец. GPT-3 также может сделать макет сайта по его описанию.

Успехи GPT в основном связаны с английским языком, однако имеются адаптации нейросети для русского, например, сайт «Порфирьевич», построенный на базе обученной на русской художественной литературе GPT-2, довольно успешно продолжает фразы, написанные человеком.

Результат работы нейросети «Порфирьевич»
Результат работы нейросети «Порфирьевич»

Свою нейросеть для генерации заголовков новостей представила компания «ВКонтакте». Чтобы создать нейросеть, разработчики использовали архитектуру Universal Transformer и технику компрессии данных BPE (Byte Pair Encoding). Такой подход обычно применяется в машинном переводе и позволяет ограничиться небольшим словарём для генерации заголовков. Сотрудники «ВКонтакт»е стали первыми, кто использовал BPE для модели суммаризации текста, а также первые, кто обучил такую модель на русскоязычных новостных материалах.

Заголовок новостей, сгенерированный нейросетью «ВКонтакте»
Заголовок новостей, сгенерированный нейросетью «ВКонтакте»

Любопытный эксперимент компании «Яндекс» сочиняет стихи, используя заголовки из «Яндекс.Новостей». Сервис, получивший название «Яндекс.Автопоэт» автоматически определяет стихотворный размер по чередованию ударных и безударных слогов, а затем составляет рифмованные строчки.

Результат работы поэтической нейросети Яндекса
Результат работы поэтической нейросети Яндекса

 Нейросети на базе GPT-3 научились вести довольно осмысленный диалог на разные темы, но с генерацией полноценного текста дела пока обстоят не лучшим образом. И хотя лучшие образцы всё ещё выглядят довольно странно, но не менее странно выглядят SEO-тексты, написанные копирайтерами-массовиками.

Поэтому редакторам и авторам уже сейчас стоит задуматься над тем, как и для кого они пишут, развиваться профессионально, переходя от написания слов и предложений к решению задач заказчиков, управлению вниманием читателей и донесением пользы. А нейросети помогут не тратить время на бессмысленный улучшайзинг.

Персональные ассистенты

Ещё одна область, в которой применение ИИ обеспечило успех — это персональные ассистенты. Сири, Кортана, Алиса, Алекса, а также голосовой помощник Google стали привычными и уже не вызывают удивления. Они могут проверить почту, заказать такси, прочитать новости, назначить встречу и сделать много другое. И самое приятное: не нужно нажимать кнопки, достаточно обратиться к ним голосом.

Благодаря системе распознавания речи на базе нейросети помощники «понимают» обращённую к ним просьбу и выполняют её. Конечно, на сегодняшний день взаимопонимание далеко от идеала, но прогресс неумолим. Совсем недавно китайские специалисты разработали технологию, с помощью которой ИИ будет распознавать в человеческой речи сарказм — одну из самых нетривиальных форм проявления особенностей характера.

Способность распознавать сарказм считается одним из показателей уровня ИИ. Считается даже, что именно эта функция отражает движение по пути к развитию самостоятельности мышления.

Цифровые персональные ассистенты быстро развиваются. Они уже обзавелись множеством функций, которые раньше выполняли секретари и личные помощники. Учитывая тенденцию, вполне закономерным предположением будет полное вытеснение людей в массовом сегменте и замена их на нейросетевые аналоги. Однако есть вероятность, что, как и в случае с текстами и графикой, цифровизация профессии секретаря приведёт к тому, что процессами по-прежнему будет управлять живой человек, в то время как рутина останется на долю ИИ.

Безопасность

Практически безграничные аналитические возможности ИИ просто не могли не задействовать в сфере обеспечения кибербезопасности. Поручить нейросети разбираться с уведомлениями SIEM-систем, предварительно обучив её распознавать кибератаки — мечта практически любого SOC-аналитика.

Разработчики систем защиты также используют машинное обучение. Они собирают озёра данных об инцидентах и обучают на них нейросети. Благодаря глобальной системе сбора информации такие решения постепенно учатся обнаруживать и блокировать не только старые, но и новые угрозы, выявляя совокупности признаков, которые с большой вероятностью остались бы незамеченными. Нейросети могут даже распознавать атаки, традиционно остающиеся за пределами внимания антивирусных сенсоров — мошеннические письма с элементами социальной инженерии, не содержащие никаких вредоносных компонентов.

Уже сейчас очевидно, что даже лучшие SOC-аналитики не могут напрямую конкурировать с нейросетями, однако это и не требуется. Вместо изучения бесконечных журналов и уведомлений о сработавших алёртах ИБ-эксперты могут сосредоточиться на глубоком обучении нейросетей и формировании стратегии выявления инцидентов безопасности.

Медицина

Ещё одна сфера, в которой обрабатываются гигантские массивы данных — медицина. Анализы крови, МРТ, рентгеновские снимки, наследственные заболевания, мониторинг артериального давления, пульса и множества других параметров, с одной стороны, позволяют достаточно точно производить диагностику, а с другой стороны, порождают врачебные ошибки. Обработка большого количества информации силами одного человеческого мозга создаёт ненулевой риск упустить что-то важное.

Есть и ещё один важный момент: люди редко обращаются к врачам, если у них не случится что-то серьёзное. А ведь многие заболевания проще предупредить на ранних стадиях, чем лечить, когда они уже проявляют себя.

Понимая это, в компании Toshiba решили создать ИИ, который позволил бы врачам анализировать данные медицинских осмотров сотрудников компаний, назначения лекарств и всю сопутствующую информацию. Обработка этой информации с помощью обученной нейросети позволяет выдавать предупреждения до момента, когда у людей начинают развиваться заболевания, связанные с образом жизни.

Для прогнозирования риска заболеваний, связанных с образом жизни, ИИ считывает базовые характеристики пациента — артериальное давление, состав крови, окружность живота, частота употребления алкоголя и многое другое. Используя эти сведения, он выдаёт прогноз, через сколько лет состояние здоровья человека достигнет опасного порога, и он получит в качестве диагноза одно из шести заболеваний: диабет, болезни почек, печени, гипертонию, гиперлипидемию или метаболический синдром.

Схема работы медицинского ИИ Toshiba. Источник: Toshiba
Схема работы медицинского ИИ Toshiba. Источник: Toshiba

Вместе с прогнозом развития заболеваний пациенты получают рекомендации по изменению образа жизни, например, по ежедневному выполнению физических упражнений или снижению количества алкоголя. В рекомендации также указано, как изменения в поведении отразятся на риске развития опасных заболеваний.

В настоящее время точность прогнозов медицинского ИИ, разработанного Toshiba, составляет 96%. Добавление в анализ большего количества данных, таких как информация о ДНК пациента и семейная история болезни, позволит ещё больше повысит точность прогнозирования. Использование информации о ДНК и учёт семейного анамнеза позволяют всерьёз говорить об индивидуальном медицинском обслуживании.

Медицина — ещё одна отрасль, в которой применение ИИ даёт огромные преимущества. Однако, как и в других сферах, «роботы» не отнимут работу у человека, а будут делать то, что у них получается значительно лучше — анализировать и сопоставлять данные, выдавая варианты живому врачу предупреждения о возможности заболевания на самых ранних стадиях, варианты диагноза и стандартные рекомендации по лечению в соответствии с протоколами. А врач, которому уже не нужно вручную вести журнал приёма и выписывать рекомендации, может сосредоточиться на пациенте, чтобы удостовериться, что ИИ-коллега не ошибся.

Оправданы ли опасения

Успех ИИ во многих сферах человеческой деятельности вызывает опасения, связанные с тем, что машины заменят людей, но в действительности бояться нечего. Несмотря на все преимущества искусственного интеллекта нельзя забывать, что это всё ещё компьютерная программа, которая может ошибаться по разным причинам от ошибок в коде до некорректных данных, использованных для обучения. Ценой такой ошибки может стать человеческая жизнь, как едва не произошло при использовании ИИ-решения на базе суперкомпьютера IBM Watson Health в онкологическом центре Memorial Sloan Kettering: лечение, которое назначала нейросеть, было, по словам врачей, смертельно опасно для некоторых больных.

Таким образом, несмотря на все опасения, внедрении любой новой технологии скорее меняет характер работы людей, а не вытесняет их из профессии. Взяв на себя рутину, ИИ обеспечит людям условия для профессионального роста и развития.

Комментарии (1)


  1. AlexVist
    30.09.2021 19:15
    +2

    Не обижайтесь. Но ИИ еще нет. Особенно умилило при штрафы. Вот в начале месяца получил штраф через Госуслуги. И, поверьте, тут ИИ голову себе сломает. Но такого маразма я еще не встречал! - https://www.youtube.com/watch?v=KbM1nl10zIs