На imcdb.org энтузиасты уже два десятка лет отмечают автомобили в фильмах: кадры, марки, модели. Верифицируют находки на форуме, спорят о деталях. В итоге появилась крупнейшая база “машин-актёров” в кино: 1,75 млн страниц с кадрами и описаниями транспорта из фильмов разных стран. Я собрал всё это в один датасет.

Фильмы любят все, а вместе с актёрами зрители давно следят и за машинами в кадре. Автомобили - такие же герои кино, они отражают дух эпохи: дизайн меняется, поколения сменяют друг друга, а кино фиксирует это на плёнке. В каждой стране -своя культура авто: в советских фильмах легко узнать привычные “Волги”, а в Австралии ностальгируют по своим моделям.
Сбор данных
Дизайн сайта - ещё из позапрошлого десятилетия, но самое ценное - это данные. Полноценный анализ данных на сайте невозможен - там только поиск. В общем, мне стало интересно собрать данные.
Написал парсер по id - он проходится по всем страницам и собирает данные в csv. Сам парсер - на питоне, библиотеки request хватает для скрейпинга.
Данные со всех страниц потихоньку за неделю собрались в один датасет - парсер работал фоном на компе .
Данные выложил на Kaggle, описал датасет и поля. Можно скачивать и пользоваться. Надо только понимать, что все данные на сайте вводилось вручную. Есть модерация и удаление дубликатов, но все равно есть вероятность несоответствий. Около 1000 скачиваний сейчас. Апвоты приветствуются.
В данных есть ссылки на кадры из фильмов с конкретным транспортным средством (там кроме машин ? еще мотоциклы ?, грузовики ?, бульдозеры ?, лесовозы ? и еще много чего). Есть названия транспортных средств, года выпуска, типы (кабриолет, седан, хетчбек и т.п.). Каждое транспортное средство связано с фильмом и кадром где оно появлялось. В части данных есть время появления транспортного средства на экране. Ещё есть роль автомобиля в кино: главная, второстепенная, просто ненадолго появляется в кадру и т.п.. Есть разделения по стране производства фильма и производства автомобиля.
Транспортное средство далее буду называть “автомобилем” для простоты
Все поля в дасете:
Brand - Марка автомобиля
Car Full Name - Полное название автомобиля (с годом выпуска)
Car Id - ID автомобиля
Car Name - Название автомобиля
Car Origin - Страна происхождения автомобиля
Car Built In - Страна производства автомобиля
Car Made For - Страна, для которой выпускался автомобиль
Car Image Link - Ссылка на кадр с автомобилем из фильма
Car Type - Тип кузова
Car Year - Год начала выпуска модели
Car Stars - Роль автомобиля в фильме (главная, значимая, фоновая и т.п.)
Class -Тип транспортного средства
IMDb Movie Id - ID фильма на imdb.com
IMDb Link - Ссылка на фильм в imdb.com
Movie Title - Название фильма на родном языке
Movie Eng Title - Название фильма на английском
Movie Original Title - Оригинальное название фильма
Movie Type - Тип фильма (жанр/категория)
Movie Years and Episodes - Год выпуска и эпизоды (для сериалов)
Time in Movie - Время появления автомобиля в кадре
Movie Year - Год выхода фильма
У каждой строки есть IMDb id и ссылки на сайт imdb.com (самая известная база фильмов). Это позволяют джойнить данные с датасетами фильмов, включая имена актеров, режиссеров и т.д. То есть, симбиоз данных автомобилей в кино и развёрнутых данных о фильмах позволяет ответить на вопросы типа:
«Какие топ марки машин в фильмах Тарантино?»,
«Сколько раз встречается Газ-24 в фильмах Рязанова?»,
«Какой процент румынских машин в румынских фильмах?',
„Какое самое популярное авто в ужастиках?“,
„В каком фильме встречаются Феррари F-40 и 'Запорожец' ЗАЗ-966?“
Автомобиль в фильмах часто играет одну из главных ролей. Это:
982 De Lorean DMC 12 доктора Эмметта Брауна из «Назад в Будущее»
Говорящий автомобиль KITT «1979 Chevrolet Chevette» из «Рыцаря Дорог »
«1965 Lamborghini 350 GT» в истории о Тонино Ламборгини
Хищный «1971 Lincoln Continental Mark III Barris Kustoms [89-65A]» из «The Car»
Легендарный катафалк «1959 Cadillac Ambulance Miller‑Meteor Sentinel 'Ecto-1''' охотников за приведениями,
Жёлтый герой «2007 Chevrolet Camaro Replica 'Bumblebee» из «Трансформеров»
и много других - это целая вселенная.

Много экзотики можно накопать из любимых фильмов.
Лесовоз «1957 ATZ TDT-60» из «Девчат» (Название на английском «The Girls» заставляет улыбнуться)
Редкий «KhAZ SPT-104» из «Иронии судьбы»
Военный грузовик «1940 Chevrolet G-7107 Cargo [G-506]» из «Семнадцати мгновений весны».

Почему бы не соединить вселенную машин-актеров и вселенную людей актеров? Получается круто. Для обучения намного интереснее синтетических датасетов без эмоциональной окраски.
Анализ данных и визуализация
Посмотрим что есть в датасете.
Ниже диаграмма показывает Top 30 самых частотных марок машин. Отметка “Unknown” означает, что марку определить не удалось — чаще всего из-за размытых силуэтов или кадров из старых фильмов.
В Top 30 стран “-” означает что страна - производитель не указана. Интересно, что картины из СССР и России получили очень достойную проработку - энтузиасты тщательно восстановили данные и внесли их в базу.

На диаграмме зелёным цветом показано количество автомобилей в зависимости от их «значимости» в фильме.
Здесь действует та же логика, что и у актёров:
Роль первого плана (4-я позиция) - автомобиль главного героя или машина, которая играет ключевую роль в сюжете.
Роль второго плана - заметный, но не центральный автомобиль.
Роль третьего плана - появляется эпизодически.
Массовка (Background) - фоновые машины, создающие атмосферу времени и места действия.
Розовым показаны автомобили по типу кузова. Самый популярный - седан

Теперь - к инсайтам
Ниже представлен график частоты появления автомобильных марок в фильмах. Показатель рассчитан как число появлений конкретной марки, нормализованное на количество фильмов за каждый год. На графике - топ-10 брендов.
Из него хорошо видно:
Долгое доминирование Ford.
Fiat - яркий взлёт и постепенный закат (1950-1990).
Появление и закрепление Toyota с 1970-х годов.
Nissan, Honda и BMW с середины XX века идут примерно в одном темпе, занимая устойчивые позиции.

Распределение машин по типам кузова в кино
В начале XX века на экране доминировали кабриолеты.
В 1960-е появляются хэтчбеки, быстро закрепляясь в повседневной кинореальности.
Внедорожники впервые входят в кадр во время Второй мировой войны, а настоящий бум их появления начинается в 1990-х.
Само распределение кузовов заметно меняется в годы Второй мировой, отражая эпоху и потребности времени.

Примеры выше хорошо показывают, как автомобили в кино отражают эпоху и её события.
Если добавить к датасету данные IMDb о фильмах, открывается ещё один слой анализа - топы моделей в разных жанрах.
Ужастики
Здесь безоговорочно доминирует легендарный Ford Crown Victoria в разных поколениях и модификациях. Классический полицейский седан стал неотъемлемым элементом хорроров, создавая нужный фон: будь то сцена погони, блокпост или патруль в тумане.

Комедии
На первом месте - настоящая икона стиля, итальянская Vespa. Скутер стал символом лёгкости и беззаботности, поэтому часто появляется в комедиях как элемент романтики, свободы и ироничных ситуаций.

Научная фантастика
В этом жанре ярче всего проявляется категория “Made for Movie” - автомобилей, созданных специально для фильмов. Это легендарные Бэтмобили, постапокалиптические монстры из вселенной «Безумного Макса», футуристичные прототипы, которых в реальности не существовало.

Можно задавать вопросы и поискать ответы, например:
«Сколько раз встречается ГАЗ-24 в фильмах Эльдара Рязанова?»
23 появления в кадрах в разных модификациях. Машина сопровождает целую эпоху и стала таким же узнаваемым элементом, как и сами герои фильмов.

Пример ссылки с "Волгой" из фильма: https://imcdb.org/vehicle_734354.htm
Итог
Комбинации данных автомобилей и фильмов даёт уникальную почву для анализа. А если ещё добавить спецификации автомобилей, то открываются неожиданные вопросы и ответы, например:
Каков средний объём двигателя автомобилей во всех комедиях с участием Шварценеггера?
Насколько отличается дорожный просвет у машин в фильмах о гонках и военных драмах?
Дополнительно к данным можно по MCP подключать LLM (У меня - Claude Desktop Sonnet/Opus). И это связка уже может искать инсайты в описаниях фильмах и сюжетах.
Если интересно, пишите в комментариях! Могу сделать другие визуализации или глубже разобрать отдельные примеры.
Про данные, свои проекты и визуализации рассказываю в канале @data_bar
Комментарии (0)
dom1n1k
14.09.2025 18:08Там пятибальная система, а не четырех. И это очень логично.
Всё-таки есть разница между автомобилем, который важная часть образа главного героя, и тем, который фактически сам главный герой (например, как Делориан в "Назад в будущее").
dyadyaSerezha
Это, конечно, всё интересно, но...
Ну, напрмер, я получу ответ "18". И тогда что? А если ответ "1818", то что? Даже не спрашиваю, повлияет ли это на мою жизнь. Очевидно, что нет. Но хотя бы расширит/углубит ли мою картину мира, моё понимание жизни? Очень врядли. Хотя может быть, для кого-то это кладезь бесценной инфы, но точно не для меня. И я не могу представить себе этого кого-то.
Люди, напишите, кого действительно интересует приведенный в цитате вопрос (или подобный ему).