Я патентный поверенный, мне интересно работать с данными, у Роспатента появилась открытая и удобная для обработки статистика по зарубежным заявителям (https://www1.fips.ru/registers-web/ ), и мне стало интересно поизучать ее.
Коротко о процессе: скачал два файла с данными (за 2023 год и за 2024 год (с учетом даты выхода статьи это почти полные данные за 2024 год)), с помощью небольшого скрипта на питоне построил следующие графики:
Страны, из которых подаются заявки,
Месяцы подачи заявок,
Топ-заявители за 2023, 2024 годы,
Облака слов из названий заявок топ-заявителей.
Перед предоставлением данных анализа, думаю, целесообразно привести немного теории о зарубежном патентовании. Если российский заявитель хочет подать заявку за рубеж, у него есть два пути: подать уже имеющуюся российскую заявку в интересующую страну или страны или подать международную заявку и уже ее перевести на национальные фазы в интересующие страны. Обычно первый путь выбирают, когда интересующих стран 1-3, а второй когда их больше.
Международной заявке присваивается номер следующего вида: PCT/AA20BB/CCCCCC, где PCT - указание на международную заявку, AA - двухбуквенный код страны, 20BB - год подачи международной заявки, CCCCCC - номер международной заявки.
Динамика подачи заявок зарубежными заявителями в РФ следующая: до 2021 года включительно было подано больше 10 тысяч заявок в год, в 2022 - 7954, в 2023 - 6069 (см. отчеты Роспатента https://rospatent.gov.ru/ru/about/reports). У Роспатента есть данные по всем зарубежным заявкам, поданным как по процедуре PCT, так и напрямую в РФ, минуя международную фазу. Но по всем таким заявкам данные можно получить только с большой задержкой, а по международным заявкам данные уже есть (см. https://www1.fips.ru/registers-web/). Хотя мои данные не полные, они отражают общую картину, так как, например, в 2023 году было подано только 1214 заявок напрямую, а по процедуре PCT - 4855.
Так как в 2024 году по процедуре PCT подано 3647 заявки, то можно предположить, что за год общий спад подачи зарубежными заявителями составил около 25%
Страны, из которых подают заявки в РФ
Я взял все PCT-номера и посчитал количество заявок, поданных из топ-10 стран (рисунок 1).
EP - это европейское патентное ведомство, поэтому с учетом наличия отдельных заявок из Великобритании, Франции и других не попавших в топ-10 стран, можно сказать, что Европейские компании уверенно лидируют в топе зарубежных заявителей. На втором месте - Китай, что не удивительно, на третьем - США.
IB - это заявки поданные непосредственно в международное патентное ведомство, топ-3 заявителя в этом столбце - это АРСЕЛОРМИТТАЛ (Люксембург), ПФАЙЗЕР ИНК (США), НОВАРТИС АГ (Швейцария).
Видно, что почти все страны-лидеры в 2024 году подают меньше чем в 2023, кроме Франции, которая увеличила подачу примерно на 10%.
Месяцы подачи заявок
В подаче российских заявителей есть повторяющийся из года в год помесячный паттерн, поэтому я решил посмотреть, нет ли такого у зарубежных заявителей (см. рисунок 2).
Как видно из рисунка 2, апрель, май, ноябрь - месяцы низкой подачи, но декабрь при этом - не сильно выделяющийся месяц в отличие от российских заявителей, у которых он явный лидер из-за стремления выполнить годовые планы некоторыми категориями заявителей. Трудно сказать, почему апрель и май 2024 года демонстрируют настолько сильную просадку, возможно, что причиной были ожидания каких-то возможных ущемлений прав зарубежных заявителей на законодательном уровне.
Топ-заявители за 2023, 2024 годы
Топ заявителей показан на рисунке 3.
В основном среди лидеров ожидаемо широко известные компании. На общем фоне спада подачи у лидеров обращает на себя внимание рост подачи у Сяоми (+8%), Нестле (+43%), Арселормиттал (+73%) - вторая по размерам металлургическая компания в мире.
На первом месте с большим отрывом от второго - компания, связанная с курением (Филипп Моррис), на втором - малоизвестная британская компания NICOVENTURES TRADING LIMITED, на третьем - китайский гигант Сяоми.
Области интереса топ-заявителей
Далее будет представлен анализ патентного портфеля топ-заявителей через облако слов из названий поданных ими в РФ заявок.
-
ФИЛИП МОРРИС
-
НИКОВЕНЧЕРС ТРЕЙДИНГ
-
Сяоми
-
НЕСТЛЕ
-
ХОФФМАНН-ЛЯ РОШ
-
НИППОН СТИЛ КОРПОРЕЙШН
-
АРСЕЛОРМИТТАЛ
-
ДжФЕ СТИЛ КОРПОРЕЙШН
-
БАСФ
-
КЕЙТИЭНДДЖИ КОРПОРЕЙШН
Выводы
Количество зарубежных заявок неуклонно падает, снижая уровень конкуренции и из-за этого уровень разработок местных компаний.
В топе заявителей на первых двух местах находятся табачные компании, что не может не огорчать, так как курение, каким бы комфортным и “безопасным” оно ни было, является вредной привычкой, сокращающей жизнь.
На третьем месте - Сяоми, которая не только не потеряла интереса к рынку РФ, но и наращивает подачу заявок.
Обращает на себя внимание, что в топ-10 находятся три компании, связанные с производством стали и изделий из стали - две японские и одна европейско-индийская.
CrazyElf
Прикольно, но я бы сначала стоп-слова выкинул, как обычно делают, а потом уже 1-2-3-граммы брал для облаков слов. Все эти "в", "и", "с", "для" только засоряют вывод ) Ну и непонятно, как вы брали 1-2-граммы, если у вас "аэрозоль" и "генерирующие" не взлетели как отдельное слово, хотя они есть в сочетаниях с другими словами, а по другим словам вроде есть одиночные термины на том же графике. Загадочно.
galimov_a Автор
Спасибо за рекомендацию! Убрал предлоги и т.п.
Попробовал сделать облака из 1, 2 и 3 слов, получилось, что из одного слова наиболее понятные. Изменил рисунки.
До этого было облако по умолчанию, и там код как-то сам отбирал слова и словосочетания.
CrazyElf
Ну да, обычно у меня получалось, что сочетания из 2 слов очень редко были нужны, но иногда они несколько проясняли контекст. А основная часть облака получалась таки из одиночных слов. Ещё можно с помощью
pymorphy3
привести слова в нормальную форму, чтобы опять же не забивать облако разными падежами одного и того же слова. Ну и чтобы статистика опять же не размывалась этими падежами.galimov_a Автор
Попробовал. Забавно, что из "стали" (от слова сталь) получилось слово "стать":) Сделал принудительную замену "стали" на "сталь". Получше стал график, благодарю за совет!