Данная статья максимально подробно пересказывает информацию первой секции с недавно прошедшего форума Data Day.
Секция 1. Стратегия. Как поменять бизнес-процессы через data-driven-подход и как не пропустить внедрение генеративного ИИ.
Панельная дискуссия. ChatGPT где деньги?
Участники дискуссии
Евгений Смирнов
Альфа-Банк. Руководитель лаборатории машинного обучения, модератор и генеральный продюсер форума
Александр Крайнов
Яндекс. Руководитель лаборатории искусственного интеллекта
Илья Щиров
Райффайзенбанк. Директор по продукту, руководитель направления по развитию AI и Support продуктов
Валентин Малых
ИТМО. Доцент Высшей школы цифровой культуры
Елизавета Гончарова
AIRI. Научный сотрудник лаборатории FusionBrain
Первый вопрос обзорного характера. Участники панельной дискуссии обсуждают самые яркие кейсы применения генеративного искусственного интеллекта, которые они встречали в своей практике или в практике их партнёров.
Александр Крайнов:
У меня много примеров, ведь я сам из области компьютерного зрения. Мне хочется говорить о генерации изображений и текста. Но вспомним первое конкретное достижение нейронных сетей, когда они обыграли все другие методы машинного обучения. Это было распознавание и синтез речи. Почему-то это проигнорировали, когда речь шла о компьютерном зрении, но на самом деле это был значимый прорыв. Сейчас мы слышим голос в навигаторах и персональных ассистентах, и невозможно отличить его от человеческого. В "Алисе", например, есть фразы, записанные актёрами, и фразы, сгенерированные ИИ. Если модель не ошибается, разницы не почувствуешь. Это невероятно яркий пример.
Валентин Малых:
Я расскажу про случай, когда у моего хорошего товарища помощник-программист сгенерировал его секретный ключ. Это был момент, когда мы осознали необходимость обеспечения безопасности в генеративном ИИ, особенно в генерации кода. Такой случай вызвал у нас страх и потребность в серьезном подходе к вопросам безопасности.
Илья Щиров:
Я поделюсь примером, связанным с генерацией изображений. Когда я готовился к этому мероприятию, мне нужно было обновить профессиональные фотографии. Вместо того чтобы идти к фотографу, я использовал онлайн-сервис. Загружая случайные фотографии, я получил профессиональные аватарки за считанные минуты. Этот пример показывает, как генеративные модели могут заменить целые профессии, и это был настоящий вау-эффект для меня.
Елизавета Гончарова:
Мне нравится пример с генерацией датасетов для тренировки моделей. Раньше это была большая проблема, но сейчас можно создать качественный датасет, который поможет адаптировать модель под конкретный язык или домен. Это значительно упрощает работу разработчиков и снижает затраты на выполнение задач.
Общий вывод: Генеративные модели позволяют создавать изображения, тексты и датасеты, что открывает огромные возможности для бизнеса и упрощает жизнь разработчиков. Однако важно помнить о безопасности и рисках, связанных с использованием ИИ, особенно в чувствительных областях, таких как генерация кода или работа с персональными данными.
Доклад. Как изменить подход к работе с клиентами на основе данных? Связь бизнеса и клиента через Data Science?
Петр Савостин
Т-Банк. Руководитель AI Bank
Про спикера
О моём пути. В индустрии я уже 8 лет, в 2019 году развивал машинное обучение и искусственный интеллект в Тинькофф. В 2021 году начал запускать команды на основе инсайтов из работы с машинным обучением, что помогло улучшить клиентский опыт. Мы запустили мобильную команду, Тинькофф мессенджер, управление финансами в мобильном приложении. Сейчас я отвечаю за главный экран мобильного банка.
Я хочу поговорить о том, как данные могут изменить подход к работе с клиентами. Каждый раз, когда я рассказываю о продукте, клиентском опыте и его улучшении на основе данных, мне попадаются негативные кейсы. Когда опыт получается плохим, возникает вопрос: кто сталкивался с ошибками или проблемами при использовании какого-либо сервиса за последний месяц?
Россия отличается высоким уровнем клиентского ориентирования, и многие компании стремятся к этому. Но проблемы все равно возникают. Я сегодня расскажу не о конверсиях, а о том, как с помощью данных улучшить клиентский опыт.
Раньше у нас была аналитика, но позже мы начали делать продукты на основе данных. Процесс автоматизации начинался с простых регулярных выражений, затем мы использовали модели. Задача была увеличить автоматизацию при высоком качестве. В 2019 году мы придумали методы анализа текстовых данных, написанных пользователями. Принцип "чем проще, тем лучше" дал 40% результата. Мы сортировали предложения по количеству слов и анализировали, сколько из них обрабатывает бот, а сколько — сотрудник. Это помогло найти точки роста и улучшить автоматизацию.
Автоматизация никогда не бывает стопроцентной. В 2019-2020 годах около 40% обращений можно было полностью автоматизировать, но дальше начиналась проблемы. Поэтому важно искать точки роста за пределами продукта, анализируя причины обращений пользователей.
Например, мы изучили обращения новых клиентов и обнаружили, что на старте активации продукта в мобильном приложении возникали проблемы. Ранее была кнопка для активации, которую убрали, но процесс остался. Это вызывало множество обращений. Решение таких проблем на основе данных помогло сократить обращения и улучшить клиентский опыт.
Изучая данные, мы нашли интересные случаи:
Изменение номера телефона. Раньше это был сложный процесс, требующий участия сотрудника. Мы внедрили лицевую биометрию, что позволило менять номер телефона автоматически. Это улучшило безопасность и упростило процесс для клиентов.
Анализ частоты использования слов и автоматизация на их основе. Мы обнаружили, что короткие предложения часто не автоматизируются, и начали обучать модели на основе этих данных.
Таким образом, изучая данные, мы можем улучшить клиентский опыт, предугадывая желания пользователей. Это приводит к росту бизнесовых показателей, снижению количества обращений и улучшению общего впечатления от сервиса.
Доклад. Нужен ли генеративный ИИ для вашей задачи?
Валентин Малых
ИТМО. Доцент Высшей школы цифровой культуры
Про спикера
Давайте начнём с основ, то есть с того, кто я такой и почему говорю на эту тему. Я работаю в области обработки текстов с 2013 года, уже около 11 лет. У меня есть опыт работы в таких компаниях, как Яндекс и Huawei, и я имею представление о том, как устроена наша область.
Я хочу немного рассказать о том, что сейчас происходит с ожиданиями в отношении генеративного ИИ, которые, на мой взгляд, довольно сильно перегреты.
Обсудим задачу обработки текстов и её разнообразие. Для бизнеса вся эта разнообразная сфера не столь интересна. Поэтому предлагаю классификацию задач в этой области. Я выделяю три с половиной типа задач: классификация, тестирование, генерация и информационный поиск.
Классификация — это процесс, при котором объекты распределяются по категориям. Например, у вас есть мешок фруктов, и вы сортируете яблоки и апельсины в разные корзины. В реальной жизни это может быть классификация обращений клиентов, где некоторые обращения могут быть спамом и должны быть отфильтрованы.
Тегирование — это разметка текста. Например, если у нас есть текст, из которого нужно выделить имя нашей любимой собачки. Регулярные выражения могут справиться с этой задачей быстро и эффективно.
Генерация текста сейчас на пике популярности. Это процесс, при котором создаётся текст в ответ на запрос. Например, генерация ответов для пользователей на сообщения. Шаблоны и алгоритмы, такие как Textrank, могут помочь с задачами генерации и суммаризации.
Информационный поиск — это задача нахождения нужного документа среди большого набора. Например, поиск по базе нормативных актов компании. Метод BM25 отлично подходит для этой задачи и позволяет быстро и дешево найти нужную информацию.
Таким образом, для большинства задач в области обработки текстов можно использовать проверенные временем методы, которые не требуют больших ресурсов. Генеративный ИИ может быть полезен в некоторых случаях, но важно понимать, зачем его использовать и можно ли обойтись более простыми и дешевыми решениями.
Доклад. За границами текста: Как применять мультимодальные модели в решении ваших задач.
Елизавета Гончарова
AIRI. Научный сотрудник лаборатории FusionBrain
Про спикера
Немного о себе: я научный сотрудник в Институте искусственного интеллекта. В команде мы занимаемся разработкой и исследованием разного рода мультимодальных архитектур, которые позволяют объединять силу и мощь больших языковых моделей с возможностью обработки данных из других областей, например, изображений и видео.
Более стандартные классические методы будут ничуть не хуже, а может, даже и лучше, но в моём докладе я предлагаю немного поразмышлять о том, что ещё можно сделать с помощью новых технологий и куда мы можем двигаться дальше. Для каких задач могут пригодиться модели нового поколения, которые работают не только с текстом, но и с данными других форматов, такими как изображения, видео, аудио?
История и применение моделей машинного обучения:
Давайте немного вернёмся к истории и тому, как зарождалось применение моделей машинного обучения и искусственного интеллекта в задачах, характерных для бизнес-процессов. Обычно у нас возникала конкретная задача, требующая работы с данными определённой природы, например, с текстами или изображениями. Мы обучали одну специфическую модель для решения этой задачи. Например, для суммирования отзывов пользователей обучали одну модель, а для ответов на вопросы - другую.
Этот подход позволяет иметь много специализированных моделей, успешно решающих конкретные задачи. Но с развитием искусственного интеллекта и генеративных моделей мы увидели, что можем взять одну большую модель, которая сможет решать различные задачи, сформулированные на естественном языке, без дополнительного обучения и настройки.
Мультимодальные модели нового поколения:
Текстовый домен обогащён большим количеством знаний, накопленных человечеством. Однако не вся информация может быть представлена текстом. У нас есть изображения, звуки, видеоряд. Человек часто воспринимает информацию визуально, и было бы неплохо, если бы и модели могли работать с такими данными так же эффективно, как с текстом.
Сейчас активен тренд на развитие мультимодальных моделей. Например, в недавней презентации OpenAI, где была представлена новая модель GPT-4, сделан акцент на том, что модель теперь принимает изображения и может работать с ними.
Универсальная мультимодальная модель должна иметь в ядре языковую модель с хорошими знаниями о мире, но на входе и выходе работать с данными разных типов: изображениями, видео, аудио и текстами. Например, если мы хотим забронировать отель, показав модель изображение, или подобрать техническое устройство по фотографии.
Для этих задач и развиваются мультимодальные модели, и тренд на их развитие становится всё более заметным. Открытые модели показывают высокое качество, и их использование становится всё более привлекательным.
Как строятся мультимодальные модели:
История мультимодальных моделей не нова. Например, такие системы, как ChatGPT, могут выдать изображение по запросу. Это достигается за счёт агентного подхода, где текстовая модель обращается к внешнему ассистенту, например, модели Кандинский, для создания изображений.
Другой подход - это интуитивное обучение, где большие языковые модели обучаются на данных, содержащих как текст, так и изображения. Это позволяет моделям делать связку между текстом и картинкой. Этот подход трудоёмкий, но для бизнеса может подойти следующий уровень - обучение переводчика, который переводит изображения в текстовый формат, понятный модели.
Создание универсальных моделей, которые не только понимают изображения, но и генерируют их, становится всё более актуальным. Эти модели могут работать с данными различных типов внутри одного контекста, что позволяет использовать их для решения широкого спектра задач.
Таким образом, мультимодальные модели представляют собой новый этап в развитии искусственного интеллекта. Они позволяют объединить мощь языковых моделей с возможностью обработки данных из других доменов, что открывает новые перспективы для бизнеса и науки. В будущем мы будем видеть всё больше таких моделей и их применение в различных областях.
Доклад. Опыт Ростелекома по оптимизации процессов работы с данными и ИИ.
Михаил Комаров
Ростелеком. Директор по развитию бизнеса в области данных
Про уровень внедрения ИИ в компании
Ростелеком – это большая группа компаний, и мы много делаем в области искусственного интеллекта (ИИ). Например, 30% обращений в наш контакт-центр закрываются чат-ботом, при этом уровень удовлетворенности клиентов выше, чем при общении с человеком. Также поднимаются вопросы по безопасности нейронных сетей и их практическому использованию в повседневной работе.
Для того чтобы все работало, нужно обратить внимание на данные.
Если у нас не выстроена работа с данными, если нет их качества, то даже лучшие модели ИИ не дадут результата. В Ростелекоме создан кластер экспертов, который отвечает за работу с данными и ИИ. Мы выстроили внутреннюю инфраструктуру и также помогаем другим компаниям с этими вопросами.
Основные направления нашей работы:
Выстраивание инфраструктуры для работы с данными.
Применение ИИ для повышения операционной эффективности или увеличения выручки, например, в умных городах или медицине.
Управление данными, включая их сбор, хранение и обеспечение качества.
Мы дважды прошли через процесс импортозамещения, сначала перешли на отечественные решения, затем разработали собственные. Технологии быстро меняются, и мы хотим предлагать лучшие решения на рынке, комбинируя собственные разработки и партнёрские решения.
Одним из наших проектов является обезличивание данных с помощью интеллектуальных алгоритмов, что сохраняет их особенности и безопасность. Также мы занимаемся генерацией данных, когда их недостаточно для обучения моделей.Особое внимание уделяется неструктурированным данным – изображениям, текстам и видео. Мы разработали решения для их обработки и обучения моделей на таких данных.
Для работы с открытыми источниками и неструктурированными данными создана платформа, которая может собирать и анализировать данные из социальных сетей, СМИ и других источников. Применения этой технологии разнообразны, например, для анализа технологических трендов.
Мы также разработали решение для автоматического анализа научных статей, трендов и патентов, которое формирует отчёты по заданным тематикам. Примеры таких отчётов доступны по подписке.
В заключение хочу сказать, что не всегда достаточно имеющихся данных для улучшения бизнес-показателей. Совместное предприятие Ростелекома и ВТБ, платформа больших данных, помогает улучшить показатели бизнеса, добавляя необходимые данные, обезличенные и проверенные на качество.
Следующая секция будет опубликована отдельно.