Успех новых продуктов у аудитории можно предсказать с помощью машинного обучения. Такой метод прогноза в последние годы стали использовать и в кинобизнесе. О том, как узнать с помощью ИИ, стоит ли выпускать новый фильм и как его рекламировать, — в обзоре Binary District.



Зачем ИИ киностудиям


Проблема выбора сценариев и продвижения фильмов в последние годы становится для развитых стран особенно острой. По данным Ассоциации американского кино (MPAA), объем европейского рынка кинопроката в 2017 году составил 10,1 миллиарда долларов, почти вернувшись к уровню 2011 года (10,6 млрд).

Рынок США и Канады также достиг зрелости: в 2015 году он дорос до 11,1 миллиарда долларов и к концу 2017 остался на том же уровне. Производство фильмов при этом продолжает расти: в 2017 году их было выпущено на 8% больше, чем в прошлом.

Одним из крупнейших провалов в 2018 году стал фильм «Хан Соло» студии Walt Disney. При бюджете в 250 миллионов долларов в мировом прокате он заработал всего 213 миллионов. Говорят, что причина была в маркетинге: тизер вышел поздно, а рекламная кампания заработала на полную мощность всего за месяц до премьеры картины.

Вопрос, как избежать таких провалов, волнует не только продюсеров, но также режиссеров, сценаристов, ученых и предпринимателей, которые пытаются разобраться в этом с помощью машинного обучения. Мы отобрали три лучших примера подобных экспериментов.

Как заставить ИИ читать между строк


Одним из первых способов предугадать успех будущего фильма с помощью искусственного интеллекта стал анализ текстов киносценариев. Им воспользовалась компания ScriptBook, основанная в Антверпене в 2015 году. Через год стартап привлек 1,4 миллиона долларов инвестиций, а летом 2018 года — представил свою технологию на кинофестивале в Карловых Варах.

Принцип работы прост: в систему загружают PDF-файл со сценарием, и уже через пять минут она дает детальный отчет. Машина предсказывает возрастной рейтинг, анализирует персонажей, указывает протагонистов и антагонистов, оценивает эмоциональность каждого персонажа, предсказывает аудиторию проекта — включая пол и расу, а также дает оценку возможных кассовых сборов.


Анализ фильма «Пассажиры» с помощью ScriptBook

ИИ ScriptBook проанализировал фильмы, которые выходили с 2015 года. По данным разработчиков, он сумел выделить бесперспективные проекты в три раза лучше, чем это делали люди. Для этого ИИ дали изучить 62 вышедших за это время фильма Sony, 32 из которых провалились в прокате.

Оказалось, что убыточность большинства «фильмов-неудачников» можно было предвидеть: ScriptBook предсказал провал для 22 из этих 32 фильмов. А всем 30 кинолентам, которые хорошо показали себя в прокате, система дала зеленый свет. Перед этим ИИ успел потренироваться на 6500 существующих сценариях и определил успех уже выпущенных проектов с точностью 84%.

Лучший результат у алгоритма был с фильмом «Пассажиры», премьера которого состоялась в США в декабре 2016 года. Искусственный интеллект почти не ошибся в финансовом результате: драма о путешествии космического корабля в будущее набрала 110 миллионов долларов вместо предсказанных 118.

А вот мюзикл «Ла-Ла Ленд» ИИ недооценил почти в 8 раз: романтический фильм с Райаном Гослингом в главной роли собрал в прокате 446 миллионов долларов вместо предсказанных 59 миллионов. Правда, ScriptBook всего равно дал ему «зеленый свет», благодаря небольшому производственному бюджету — всего 30 миллионов долларов.


«Тихое место», кадр из фильма.

Многие опасаются, что такие системы убьют авторское кино, которое может быть не столь прибыльным и отходить от привычных шаблонов. Но, как указывают разработчики в блоге ScriptBook, главное для анализа — не доход, а ROI. В этом плане фильм «Тихое место», заработавший 163 миллиона долларов при бюджете в 17 миллионов, смотрится выгоднее, чем «Форсаж», привлекший в прокате миллиард, но стоивший 250 миллионов долларов.

Зачем смотреть трейлеры вместе с ИИ


Одного сценария все-таки недостаточно, чтобы понять, кому может понравиться фильм и какой аудитории лучше его рекламировать. Вот трейлеры — другое дело, считают в 20th Century Fox. Разработка, которую студия представила в ноябре 2018 года, получила название Merlin Video. Это нейросеть, которая распределяет трейлеры разных фильмов по категориям и анализирует, как часто в них встречаются одни и те же объекты. В итоге, по данным киностудии, ИИ дает в два раза более детальную оценку аудитории, чем все другие методы.

Руководители Data Science-команды 20th Century Fox рассказали о том, как все это работает, в научной статье на сайте Корнелльского университета и в блоге. Для примера они взяли фильм «Логан» — третий и последний фантастический боевик Marvel о суровом бойце по имени Росомаха, вышедший в 2017 году и собравший в прокате 600 миллионов долларов (бюджет фильма был в шесть раз меньше).

На какие еще фильмы могли бы пойти зрители, которым нравятся такие картины? Чем так нравится публике этот герой? На этот вопрос нейросеть ответила после того, как ей удалось определить, какие объекты встречаются в трейлере наиболее часто. Как заметил Merlin, главное в Росомахе — это борода. В числе других признаков также были «дерево», «волосы на лице», «автомобиль» и «мужчина».

Помимо частоты повторения деталей, нейросеть учитывает время на экране. Трейлеры с долгими крупными планами персонажей скорее характерны для драматических фильмов. А вот трейлеры с быстрой и частой сменой сцен — для боевиков, отметили авторы проекта.

После этого Merlin собрал данные о популярности фильмов, кассовых сборах, числе их просмотров в интернете и приступил к сравнению. Двадцатку фильмов, которые с наиболее высокой вероятностью «зашли» бы фанатам «Логана», по мнению алгоритма, киностудия совместила с итогами опросов реальных зрителей. В половине случаев ИИ угадал.



В числе совпадений при этом оказались не только фильмы о супергероях — такие как «Люди Икс: Апокалипсис», «Доктор Стрэндж» и «Бэтмен против Супермена: Рассвет правосудия». Merlin не обошел вниманием и криминальный триллер «Джон Уик 2» — в нем такой же, как в «Логане», брутальный герой измученного вида.

Расхождения, однако, были более показательными: например, алгоритм посчитал, что зрителям «Логана» должен понравиться «Тарзан» — видимо, из-за изобилия деревьев в кино. Зато такие очевидные рекомендации как «Человек-муравей» и «Дедпул» он пропустил — их трейлеры были менее драматическими.

Алгоритм стал постоянно использоваться в 20th Century Fox после выхода мюзикла «Величайший шоумен» в ноябре 2017 года. Модель, построенная разработчиками, кроме анализа трейлеров с помощью Merlin Video включает в себя также изучение текста киносценария с помощью Merlin Text (более подробно об этом рассказано в статье на сайте Корнелльского университета).

Прогноз по аудитории фильма можно делать как для уже вышедших лент, так и для тех, которые еще только готовятся — за 6-8 месяцев до их официального релиза. Для выяснения того, насколько этот прогноз совпал с реальностью, используются данные о продажах билетов в кинотеатрах. Сейчас анализ дополняют данными о том, какие киноленты пользователи покупают и берут напрокат онлайн.

Как узнать, кто будет лучшей рекламой для фильма


Рекламные ролики и сценарии — не единственное, что может определять финансовый успех фильмов. Специалисты из университета Айовы в 2015 году обнаружили, что сократить бюджет кинокартины — и улучшить ее прибыльность — можно еще на этапе ее производства. Для анализа данных ученые создали базу из 4000 фильмов, вышедших в 2000–2010 годах, и обучили программу искать по ней общие для коммерчески выгодных лент признаки.

Набор признаков состоял из четырех групп:

  • «кто» — в эту группу входили параметры успешности режиссера и актеров;
  • «что» — жанр и возрастной рейтинг фильма;
  • «когда» — в какое время года вышел фильм и насколько этот год был успешен для киноиндустрии;
  • группа с «гибридными признаками»: например, снимались ли приглашенные актеры раньше или появлялись ли они в данном жанре до этого.

Далее при помощи искусственного интеллекта исследователи пытались выделить признаки, которые наиболее заметно коррелируют с возвратом инвестиций. Для оценки последнего параметра использовалось значение (выручка — бюджет)/бюджет.

Оказалось, что главный признак успеха — это известность режиссера и выручка его предыдущих картин. Звездность актеров гарантировала рост выручки почти вполовину (на 46%), но возврат инвестиций при этом был не больше 17%. Безусловно, зрители с большей охотой пойдут в кино на именитых актеров, но чтобы их пригласить, надо потратить гораздо больше денег, отмечают исследователи.

В исследовании не учитывалось, что кинокомпании могут иметь другие источники дохода, кроме продаж билетов в кинотеатрах. Так, компания Disney продает игрушки и другие товары по мотивам самых успешных лент. Но такие доходы тоже зависят от популярности фильма у зрителей.

Узнать о том, как использовать распознавание лиц, нейросети и машинное обучение в бизнесе, можно на интенсивном курсе AI for Business. Спикеры курса из Microsoft, «Наносемантики» и Home Credit Bank расскажут, как применять разные виды ИИ и какие для этого есть инструменты. Ближайший интенсив пройдет 30-31 марта.

Комментарии (9)


  1. exehoo
    22.01.2019 15:23

    В половине случаев ИИ угадал

    Предсказательная сила как у монетки! =)

    Самая большая засада филигранно просчитанных блокбастеров — это сарафанное радио в духе «В трейлере всё вкусное показали, а сюжет один в один как у прошлогоднего ****».


  1. glioma
    22.01.2019 17:44
    +1

    Как по мне, так «Хан Соло» в разы лучше всех последних поделок под Звёздные войны.


  1. sshikov
    22.01.2019 19:40

    Ну нет же тут никакой BigData… ML есть, без вопросов. AI, что бы мы не называли этим словом — наверное тоже. А вот больших данных — нет. Анализ PDF со сценарием — это NLP, но никак не BigData. Зачем все термины в одну кучу мешать?


  1. exfizik
    22.01.2019 21:12

    объем европейского рынка кинопроката в 2017 году составил 10,1 миллиона долларов


    Вы тут на 3 порядка не ошиблись? Наверное, должно быть в миллиардах.


    1. Masha_IT Автор
      22.01.2019 23:46

      да, поправили опечатку. Спасибо, что заметили:)


  1. shadovv76
    23.01.2019 10:31

    а есть компенсация для статистики проданных билетов (период праздников, погода в летний сезон, совпадение с другими мероприятиями национального/глобального значение, олимпиады, ЧМ и т.д.)?


    1. Masha_IT Автор
      23.01.2019 12:10

      в описанных примерах это не учитывалось (в исследованиях об этом нет упоминаний). Но возможно, такие исследования с помощью ИИ еще будут проводиться, будем следить)


  1. sibirier
    23.01.2019 12:41

    Интересно какой сюжет и с какими актерами нагенерирует похожая сеть, если запустить её в обратную сторону.


  1. AlexTOPMAN
    23.01.2019 13:43

    Абзац 7: «Машина предсказывает возрастной рейтинг, анализирует персонажей...»
    Давайте сразу называть вещи своими именами. Не «угадала/предсказала», а «классифицировала на основе изученной статистики (выборка обучения) по количеству выявленных анализом положительных и отрицательных факторов». А то любят мистики нагнать. Прорицателя придумали, ага…