На imcdb.org энтузиасты уже два десятка лет отмечают автомобили в фильмах: кадры, марки, модели. Верифицируют находки на форуме, спорят о деталях. В итоге появилась крупнейшая база “машин-актёров” в кино: 1,75 млн страниц с кадрами и описаниями транспорта из фильмов разных стран. Я собрал всё это в один датасет.

Фильмы любят все, а вместе с актёрами зрители давно следят и за машинами в кадре. Автомобили - такие же герои кино, они отражают дух эпохи: дизайн меняется, поколения сменяют друг друга, а кино фиксирует это на плёнке. В каждой стране -своя культура авто: в советских фильмах легко узнать привычные “Волги”, а в Австралии ностальгируют по своим моделям.

Сбор данных

Дизайн сайта - ещё из позапрошлого десятилетия, но самое ценное - это данные. Полноценный анализ данных на сайте невозможен - там только поиск. В общем, мне стало интересно собрать данные.

Написал парсер по id - он проходится по всем страницам и собирает данные в csv. Сам парсер - на питоне, библиотеки request хватает для скрейпинга.

Данные со всех страниц потихоньку за неделю собрались в один датасет - парсер работал фоном на компе .

Данные выложил на Kaggle, описал датасет и поля. Можно скачивать и пользоваться. Надо только понимать, что все данные на сайте вводилось вручную. Есть модерация и удаление дубликатов, но все равно есть вероятность несоответствий. Около 1000 скачиваний сейчас. Апвоты приветствуются.

В данных есть ссылки на кадры из фильмов с конкретным транспортным средством (там кроме машин ? еще мотоциклы ?, грузовики ?, бульдозеры ?, лесовозы ? и еще много чего).  Есть названия транспортных средств, года выпуска, типы (кабриолет, седан, хетчбек и т.п.). Каждое транспортное средство связано с фильмом и кадром где оно появлялось. В части данных есть время появления транспортного средства на экране. Ещё есть роль автомобиля в кино: главная, второстепенная, просто ненадолго появляется в кадру и т.п.. Есть разделения по стране производства фильма и производства автомобиля.

Транспортное средство далее буду называть “автомобилем” для простоты

Все поля в дасете:

  • Brand - Марка автомобиля

  • Car Full Name - Полное название автомобиля (с годом выпуска)

  • Car Id - ID автомобиля

  • Car Name - Название автомобиля

  • Car Origin - Страна происхождения автомобиля

  • Car Built In - Страна производства автомобиля

  • Car Made For - Страна, для которой выпускался автомобиль

  • Car Image Link - Ссылка на кадр с автомобилем из фильма

  • Car Type - Тип кузова

  • Car Year - Год начала выпуска модели

  • Car Stars - Роль автомобиля в фильме (главная, значимая, фоновая и т.п.)

  • Class -Тип транспортного средства

  • IMDb Movie Id - ID фильма на imdb.com

  • IMDb Link - Ссылка на фильм в imdb.com

  • Movie Title - Название фильма на родном языке

  • Movie Eng Title - Название фильма на английском

  • Movie Original Title - Оригинальное название фильма

  • Movie Type - Тип фильма (жанр/категория)

  • Movie Years and Episodes - Год выпуска и эпизоды (для сериалов)

  • Time in Movie - Время появления автомобиля в кадре

  • Movie Year - Год выхода фильма

У каждой строки есть IMDb id и ссылки на сайт imdb.com (самая известная база фильмов). Это позволяют джойнить данные с датасетами фильмов, включая имена актеров, режиссеров и т.д. То есть, симбиоз данных автомобилей в кино и развёрнутых данных о фильмах позволяет ответить на вопросы типа: 

  • «Какие топ марки машин в фильмах Тарантино?»,

  • «Сколько раз встречается Газ-24 в фильмах Рязанова?»,

  • «Какой процент румынских машин в румынских фильмах?',

  • „Какое самое популярное авто в ужастиках?“,

  • „В каком фильме встречаются Феррари F-40 и 'Запорожец' ЗАЗ-966?“

Автомобиль в фильмах часто играет одну из главных ролей. Это:

и много других - это целая вселенная.

Много экзотики можно накопать из любимых фильмов. 

Почему бы не соединить вселенную машин-актеров и вселенную людей актеров? Получается круто. Для обучения намного интереснее синтетических датасетов без эмоциональной окраски.

Анализ данных и визуализация

Посмотрим что есть в датасете. 

Ниже диаграмма показывает Top 30 самых частотных марок машин. Отметка “Unknown” означает, что марку определить не удалось — чаще всего из-за размытых силуэтов или кадров из старых фильмов.

В Top 30 стран “-” означает что страна - производитель не указана. Интересно, что картины из СССР и России получили очень достойную проработку - энтузиасты тщательно восстановили данные и внесли их в базу.

На диаграмме зелёным цветом показано количество автомобилей в зависимости от их «значимости» в фильме.
Здесь действует та же логика, что и у актёров:

  • Роль первого плана (4-я позиция) - автомобиль главного героя или машина, которая играет ключевую роль в сюжете.

  • Роль второго плана - заметный, но не центральный автомобиль.

  • Роль третьего плана - появляется эпизодически.

  • Массовка (Background) - фоновые машины, создающие атмосферу времени и места действия.

Розовым показаны автомобили по типу кузова. Самый популярный - седан

Теперь - к инсайтам

Ниже представлен график частоты появления автомобильных марок в фильмах. Показатель рассчитан как число появлений конкретной марки, нормализованное на количество фильмов за каждый год. На графике - топ-10 брендов.

Из него хорошо видно:

  • Долгое доминирование Ford.

  • Fiat - яркий взлёт и постепенный закат (1950-1990).

  • Появление и закрепление Toyota с 1970-х годов.

  • Nissan, Honda и BMW с середины XX века идут примерно в одном темпе, занимая устойчивые позиции.

Распределение машин по типам кузова в кино

  • В начале XX века на экране доминировали кабриолеты.

  • В 1960-е появляются хэтчбеки, быстро закрепляясь в повседневной кинореальности.

  • Внедорожники впервые входят в кадр во время Второй мировой войны, а настоящий бум их появления начинается в 1990-х.

  • Само распределение кузовов заметно меняется в годы Второй мировой, отражая эпоху и потребности времени.

Примеры выше хорошо показывают, как автомобили в кино отражают эпоху и её события.

Если добавить к датасету данные IMDb о фильмах, открывается ещё один слой анализа - топы моделей в разных жанрах.

Ужастики

Здесь безоговорочно доминирует легендарный Ford Crown Victoria в разных поколениях и модификациях. Классический полицейский седан стал неотъемлемым элементом хорроров, создавая нужный фон: будь то сцена погони, блокпост или патруль в тумане.

Комедии

На первом месте - настоящая икона стиля, итальянская Vespa. Скутер стал символом лёгкости и беззаботности, поэтому часто появляется в комедиях как элемент романтики, свободы и ироничных ситуаций.

Научная фантастика

В этом жанре ярче всего проявляется категория “Made for Movie” - автомобилей, созданных специально для фильмов. Это легендарные Бэтмобили, постапокалиптические монстры из вселенной «Безумного Макса», футуристичные прототипы, которых в реальности не существовало.

Можно задавать вопросы и поискать ответы, например:

«Сколько раз встречается ГАЗ-24 в фильмах Эльдара Рязанова?»

23 появления в кадрах в разных модификациях. Машина сопровождает целую эпоху и стала таким же узнаваемым элементом, как и сами герои фильмов.

Пример ссылки с "Волгой" из фильма: https://imcdb.org/vehicle_734354.htm

Итог

Комбинации данных автомобилей и фильмов даёт уникальную почву для анализа. А если ещё добавить спецификации автомобилей, то открываются неожиданные вопросы и ответы, например:

  • Каков средний объём двигателя автомобилей во всех комедиях с участием Шварценеггера?

  • Насколько отличается дорожный просвет у машин в фильмах о гонках и военных драмах?

Дополнительно к данным можно по MCP подключать LLM (У меня - Claude Desktop Sonnet/Opus). И это связка уже может искать инсайты в описаниях фильмах и сюжетах.

Если интересно, пишите в комментариях! Могу сделать другие визуализации или глубже разобрать отдельные примеры.

Про данные, свои проекты и визуализации рассказываю в канале @data_bar

Комментарии (0)


  1. dyadyaSerezha
    14.09.2025 18:08

    Это, конечно, всё интересно, но...

    Сколько раз встречается ГАЗ-24 в фильмах Эльдара Рязанова?

    Ну, напрмер, я получу ответ "18". И тогда что? А если ответ "1818", то что? Даже не спрашиваю, повлияет ли это на мою жизнь. Очевидно, что нет. Но хотя бы расширит/углубит ли мою картину мира, моё понимание жизни? Очень врядли. Хотя может быть, для кого-то это кладезь бесценной инфы, но точно не для меня. И я не могу представить себе этого кого-то.

    Люди, напишите, кого действительно интересует приведенный в цитате вопрос (или подобный ему).


  1. dom1n1k
    14.09.2025 18:08

    Там пятибальная система, а не четырех. И это очень логично.
    Всё-таки есть разница между автомобилем, который важная часть образа главного героя, и тем, который фактически сам главный герой (например, как Делориан в "Назад в будущее").