Вы знали, что ниша антиплагиата пухнет от денег? Я тоже не знал, пока не полез в тендеры и мировую статистику. К 2030 году мировой объем долетит до $5.9 млрд. Но на рынке творится какой-то абсурд.
Рынок российского антиплагиата — 1,5 милларда рублей. Официальной статистики вы не найдёте. Эту информацию я нашёл сам в тендерах и базе СПАРК. И эти деньги тратят на проверку «технической» уникальности.
В 2020 году можно было парсить шинглы, с чистой совестью продавать это ВУЗам и знать, что почти наверняка программа поймает всех плагиатчиков. Сейчас картина немного другая:
24% студенческих работ содержат четкие следы ИИ. Это рост в четыре раза по сравнению с 2023.
43% студентов сами признаются, что отдают нейросетям написание рефератов и дипломов.
При этом самая популярная система антиплагиата, по словам директора компании, в начале года ловила на ИИ лишь 15% работ. А с недавних пор начала «ловить» ИИ даже там, где его не было: 1, 2. Это всё уже привлекло внимание представителей ЛДПР и Мизулиной.

Как распределяются деньги на рынке антиплагиата
Судя по тому, что нашёл я, разделение примерно следующее.
Вузы и госсектор — 80%. Министерства заставляют университет сканировать студенческие работы, а вузы покупают софт «для галочки». Средний федеральный университет тратит порядка 2 млн рублей за год.
Студенты — 15%. Они платят 200–300 рублей за прогон файла, чтобы проверить базовую уникальность.
Энтерпрайз — 5%. Крупный бизнес и НИИ смотрят, нет ли у них какого украденного кода или использования чужих патентов. В науке и больших производствах крайне важно не нарушить ничьи права.
Получается, что львиную долю бюджетов генерирует государство. И когда есть устоявшийся подход, сменить его трудно — поэтому ВУЗы закупают всё те же системы, что и пять лет назад.
За что платят миллионы
Профильные тендеры стабильно забирают три класса систем.
Масс-маркет с устаревшими технологиями. Он ловит откровенную копипасту и ленивые решения. Там честно работают отсев шинглов и стопроцентных дублей. Но нейросети ломают эту защиту в один клик. Студентам даже платная подписка не нужна, чтобы обходить такие фильтры.
Энтерпрайз-тяжеловесы. Серьезные продукты для НИИ и крупного бизнеса, которые я упоминал выше. Такие модели хорошо работают. Они анализируют векторную семантику. Скрипт парсит смысл текста, а не отдельные слова. Казалось бы, здорово? С точки зрения результата — да.
Только вот внедрять такие платформы и пользоваться ими — отдельная большая задача, с которой справляются только корпораты. Нужны и свои сервера, и IT-отдел, и небольшое обучение для пользователей — всё-таки там не только кнопка «проверить». Но бизнес и НИИ замотивированы всем этим пользоваться — для них это сейчас единственный рабочий способ не пустить в продакшен сгенерированный шлак.
Чего-то «среднего» нет — либо покупаете дешёвую систему, которая даёт слабые результаты, либо вкладываетесь в энтерпрайз.
Turnitin. Это американский стандарт, который вроде бы решает все проблемы. И все новые технологии использованы, и айтишникам его внедрять проще, и пользователям легко.
Только вот легально купить лицензию нельзя, Turnitin поставлют через пень-колоду. И главное — зарубежный софт абсолютно слеп к сложной морфологии русского языка, отчего часто выдаёт ложноположительные срабатывания (об этом я подробнее расскажу в следующих статьях).
Как итог — по-настоящему удобного решения нет и пока не предвидится. Везде приходится сталкиваться с мощными ограничениями. Ругать рынок бессмысленно — сделать ситуацию лучше прямо сейчас вряд ли получится.
Как LLM ломают рынок прямо сейчас
Старые системы ищут точную копипасту, но любой «шаристый» студент берёт базовую бесплатную LLM и ломает алгоритм:
Кто-то прогоняет фрагменты через каскад переводчиков вроде DeepL. Русский → английский → французский → английский → русский. Смысл сохраняется, но сами слова и предложения меняются полностью.
Кто-то заставляет нейросеть полностью пересобрать текст хитрыми промптами.
Кто-то меняет базу терминов синонимами.
Старые скрипты стали бессильны. В ответ вендоры выкатили новые ИТ-костыли. Разработчики прикрутили модули AI-детекции.
В попытке адаптироваться к ИИ технологии пришли к массовым ложно-положительным срабатываниям. Скрипты сходят с ума, когда проверяют работы. Они игнорируют на контекст и то, что перед ними студенческие работы. Софт видит сложный академический слог и сразу кричит: «нейросеть!». А что студенты обязаны писать таким слогом — ну, это уже другой вопрос.
В итоге системы антиплагиата не помогают отсеивать плагиатчиков, а заставляют студентов и преподавателей совместно переписывать реальные работы, чтобы программа не обвинила их в использовании ИИ.
Что будет с рынком? Расскажу в следующих частях
Пока рынок заливает проблему деньгами, студенты продолжают обходить алгоритмы за пару кликов. В ближайшее время я залезу в эти системы и покажу, как работал антиплагиат раньше, на чем конкретно ломаются старые алгоритмы сейчас, и что может спасти от засилья ИИ-генерации. А потом, может, и какой прогноз соображу.
Комментарии (25)

babvrby
11.05.2026 09:33Может я чего-то не понял, но о каком плагиате может идти речь, если человек использовал для подготовки своей позиции LLM? ИИ у нас что уже имеет авторские права? Он же всего лишь инструмент, об этом вам каждая модель расскажет. На мой взгляд, речь может идти в данном случае только о качестве работы. Если с качеством все в порядке. это значит, что автор правильно поставил задачи ИИ, он же, черт побери инструмент и должен исполнять волю разумного существа. Уж либо надо признавать, что все эти LLM разумные существа, либо радоваться тому, что студенты учатся пользоваться современным инструментарием и поощрять их за это.

WhiteBehemoth
11.05.2026 09:33Плагиат и нарушение авторских прав, это разные вещи. Первое - это выдача чужой работы за свою (например цитирование без указания авторства). Тут может и не быть нарушения авторских прав, если цитируемое не защищено.
В случае с LLM, если студент просто переписывает то, что сгенерировал ИИ - это таки плагиат. Даже если взять крайний случай и обучить модель ИСКЛЮЧИТЕЛЬНО на своих текстах, генерация нового - это ее работа, не своя.
То есть LLM можно, конечно, использовать, но именно как инструмент, чётко обозначивая, что именно было сделано им.

PereslavlFoto
11.05.2026 09:33В России одно из авторских прав — право на имя — защищено без окончания срока, навсегда.

WhiteBehemoth
11.05.2026 09:33из этого не следует, что весь опубликованный текст защищён авторским правом. Или вы что-то иное имели в виду?

PereslavlFoto
11.05.2026 09:33Есть разные авторские права.
У одних есть срок, например, у права копировать.
У других нету срока, например, у права быть автором, у права на имя, у права на целостность произведения.
Таким образом, все опубликованные тексты защищены некоторыми авторскими правами.

babvrby
11.05.2026 09:33по закону это одно и тоже, там плагиат - это частный случай нарушения авторского права, теперь о студенте и LLM, поймите, пожалста, не может быть никакого нарушения авторского права LLM, потому что они не признаются ни в одной стране самостоятельными творческими субъектами, они пока признаются только инструментом, а если верить вашей логике, то ящик плотник стибрил у молотка, потому что гвозди, скрепляющие ящик, забил молоток, а вот если LLM признать разумными существами, то мгновенно они попадают в жертвы человеческого грабежа, а также они становятся рабами тех, кто ими владеет, а это вообще кризис современного права, потому что почти на всей Земле рабство запрещено и очень сурово наказывается. Так что пока ИИ инструмент студенты обязаны осваивать этот инструмент, как в свое время осваивали калькулятор, ПК и прочие гаджеты. А борьба с этим есть обыкновенное преподавательское мракобесие, за такое сразу на пенсию надо, а они еще и кучу денег на это тратят.

alexhu
11.05.2026 09:33Государство и бизнес тратят 1,5 миллиарда в год на слепой антиплагиат — и это проблема
Почему это проблема? И для кого это проблема?
Преподаватели прекрасно осознают, что 99 % абитуриентов полностью полагаются на ИИ, половина школьников старших классов не знает таблицу умножения, большая часть выпускников не понимают какой специальности их учили.
Ну прогнали текст через антиплагиат, всё равно все защитятся и выпустятся. В чём состоит проблема?

Radisto
11.05.2026 09:33Знал студента, который переписал описательную часть диплома своими словами (вариант от ии был с малым процентом оригинальности) и оригинальность стала ещё ниже по оценке автоматического антиплагиата. То есть существующие решения не только не поощряют использование ии, но и вынуждают его использовать: кожаные технари не настолько хороши в конструировании наборов слов из корпуса русского языка, в техвузах от них другого ждут

eeglab
11.05.2026 09:33Ещё лет 10-15 назад как то антиплагиат (который тот самый) справлялся со своей задачей, но сейчас оригинальный текст на русском языке выше 40-60% оригинальности не наберёт, как ни старайся. Их ИИ детектор, кстати, только на gigachat наверное и реагирует. Реально в использовании ИИ для текстов не вижу проблемы, если текст содержит оригинальную авторскую идею - это обычная "печатная машинка". Единственный способ уйти от использования llm в науке - перестать требовать "объемы"

el_mago
11.05.2026 09:33Что интересно, в похожем ключе на реддите ругают Turnitin. Факт в том, что ИИ отстойно пишет научные и технические тексты. Сгенерированные слова только по форме напоминают академический язык и по содержанию такая работа не выдерживает никакой критики. Возможно, по аналогии с водительскими механика/автомат пора вводить новую категорию дипломов "Инженер ...." и "Инженер ... при поддержке ИИ" и т.п.

saege5b
11.05.2026 09:33Стандартное содержание, стандартная вводная часть, стандартное заключение, стандартный список литературы... что и как там написать оригинального?
А если и сам курсовик или диплом - стандартный?
У меня был диплом по расчёту СПК в Нечернозёмной полосе России. С учётом очников и заочников, всех более-менее крупных хозяйств про которые можно взять хоть какие-то данные - примерно на полтора раза. Весь диплом - единообразные и стандартен. Я удивлён что студенты вообще умудряются через антиплагиат прорываться.
AndruxaBS
Ну я понимаю практическую часть самому сделать. Но какой студент в здравом уме будет писать бумажки и документацию, если можно где то стащить, а теперь и сгенерить.
ss-pol
Давайте начистоту. Цель ВУЗа - подготовить специалиста, способного решать поставленные задачи в заданной области, отфильтровать неспособных. Какая разница при этом, как именно эта задача будет решена, с помощью неройнки или без, если на работе будут те же самые условия. С этой точки зрения копирование части работы из доступных источников не страшно, если такое же будет допустимо и на рабочем месте. Тогда в чём же проблема? Надо создать схожие условия по использованию нейронок, как и на рабочем месте.
Кто-то скажет, но ведь есть действительно умные талантливые трудолюбивые ребята, которые при таком подходе оказываются ничем не лучше бездельника, который научился ловко составлять промпт. А я отвечу - а какая разница, если на рабочем месте будет то же самое? Или разница всё-таки есть? Тогда надо определиться в чём она и создать соответствующие условия.
Int_13h
А зарплату промпто-составителю можно платить меньше, или он столько же захочет, сколько и кустарь с ручным трудом? Но тогда он должен раз в, допустим, 10 эффективнее работать благодаря автоматизации, значит на него можно за ту же зарплату повесить раз в 10 больше обязанностей? Автоматизация труда, в том числе и с помощью ИИ, должна приносить ощутимый профит - либо сэкономить на персонале, либо штамповать продукцию как из пулемета.
Moog_Prodigy
Иногда автоматизация должна приносить профит тому кто ее использует, а не работодателю, государству или кому-то еще. Условно говоря, работник таскал цемент 20 мешков в день, потом плюнул и купил тачку за свои (это важно). И таскает теперь те же 20 мешков на тачке за час, а остальное время спит. Работодатель ему - э, мы так не договаривались, таскай теперь 100 мешков в смену, но тачку я тебе все равно не куплю, дорого слишком.
Справедливо?
Так с изобретениями и рацухами в СССР обжигались, да и не только, так и сейчас. Я сделаю себе инструмент не для того чтобы получать больше (хотя может быть) а чтобы работать меньше. Типа хитрой заточки токарного резца, специального стенда для настройки оборудования или приборчика. Или программы. Уж сколько историй было про хитрого сисадмина, одним скриптом делавшим за полчаса месячную работу. И в основном, это мало кому нравится из начальства, если у них цель - от забора и до обеда.
AndruxaBS
Полностью согласен! Т.е. можно оставить какое то небольшое кол-во топовых университетов, которые будут готовить имено будущих научных специалистов. Остальным же прекратить этот бесячий косплей подготовки начинающих ученных и прочую развивайку, сосредоточившись непосредственно на прикладной области и тем чем человек конкретно будет заниматься в трудовой деятельности.
WhiteBehemoth
для этого нужно возродить институт средне-специального образования и поднять его престиж. И убрать требование высшего образования так, где оно не нужно.
AndruxaBS
Тоже за этот путь. Большинство высших учебных заведений перевести в среднеспециальные и назначить там прикладную программу обучения.
aMster1
А как выбрать этих самых "будущих научных специалистов" не подскажите?
Вы же понимаете (?) что ограничивая доступ к высшему образованию мы сами себе режем перспективу? Выбрать даже не гения, а просто крепкого ученого из 10 человек и 1000 - совершенно разные задачи. А если стоит задача не выбрать а научить?
Топовые вузы - очень классно. Какой там конкурс? Сколько баллов надо иметь чтобы попасть на бюджет? Сколько стоит 5 лет обучения? Да в конце концов где они находятся? Москва и Питер? А замкадышам что делать?
AndruxaBS
Через олимпиады и экзамены
Какую перспективу? Мы избавим людей от геморроя. Большинство людей идут учится чтоб работать на квалифицированной работе и получить побольше денег. А не чтоб приобщиться к науке))
Даже не знаю. Сложно сказать. Сколько людей хочет стать ученными или погоняться чисто ради престижа и ЧСВ. Допустим жесткий отбор будет, но нам так то и не нужны миллион ученных. Можно в каждом мегаполисе хотя бы по одному топовому университету оставить.
ss-pol
Не понимаю, зачем как-то особенно выделять учёных в этой парадигме. Наука это просто ещё один вид трудовой деятельности, где тоже ставятся задачи и ищутся решения. Если учёный будет решать поставленную задачу с помощью нейронки, что же тут плохого? Если вы не можете отличить результат, то какая разница, как учёный пришёл к ответу. А если можете отличить, то и проблемы никакой нет.
WhiteBehemoth
годы в ВУЗе для того, чтоб пользоваться нейронкой на работе - не нужны. Цель должна быть в том, чтоб учить человека вглубь и вширь. В идеале - находить непознанное и расширять горизонты человечества в целом. Как минимум - развить СОБСТВЕННУЮ нейронную сеть в мозгу. А это - работа, нужно учиться, думать, делать выводы. И в том числе - умение показать и объяснить свои выводы.
ss-pol
Обучить этому невозможно, можно лишь отобрать людей, которые к этому склонны, которые могут этим заниматься лучше всего, затем дать им такую возможность. Это и есть вышеупомянутая задача фильтрации. Мы зачерпываем среди поступающих и потом постепенно отфильтровываем неподходящих на экзаменах, курсовых и прочих учебных работах.
Но что если "находить непознанное и расширять горизонты человечества в целом" гораздо эффективней можно с помощью нейронки? Ведь тогда блокируя использование нейронок в ВУЗе мы отбираем не тех, неправильно фильтруем и снижаем эффективность наших инженеров и учёных.
WhiteBehemoth
Позволю себе не согласится с этим ультимативным заявлением. Всё зависит от того, насколько предмет интересен. А это и личные предпочтения студента и умение преподавателя давать материал.
Экзамены, - это не фильтры, это подтверждение полученных знаний и стимул старательнее учиться. Курсовые - практика.
Задача учебных заведений - учить людей. Блокировать стоит только неэтичные/незаконные инструменты. ИИ, в общедоступном формате, этичен и законен. Запрещать его использование - совершенно глупая идея. Но выдавать работу ИИ за свою с целью получить оценку повыше - разумеется недопустимо, как и любой другой плагиат.
ss-pol
С этим я конечно согласен.
Но если мы разрешаем использование нейронок, то как отделить работу студента от чего-то сгенерированного на основе его запросов? И если с дальнейшим их совершенствованием любая студенческая работа может быть сгенерирована, как быть? Полумеры здесь по-моему не сработают.