Государство и бизнес тратят 1,5 миллиарда в год на слепой антиплагиат

Главная
Государство и бизнес тратят 1,5 миллиарда в год на слепой антиплагиат — и это проблема

Государство и бизнес тратят 1,5 миллиарда в год на слепой антиплагиат — и это проблема +1

11.05.2026 09:31

Albert_Wesker 27 8600 Источник

Вы знали, что ниша антиплагиата пухнет от денег? Я тоже не знал, пока не полез в тендеры и мировую статистику. К 2030 году мировой объем долетит до $5.9 млрд. Но на рынке творится какой-то абсурд.

Рынок российского антиплагиата — 1,5 милларда рублей. Официальной статистики вы не найдёте. Эту информацию я нашёл сам в тендерах и базе СПАРК. И эти деньги тратят на проверку «технической» уникальности.

В 2020 году можно было парсить шинглы, с чистой совестью продавать это ВУЗам и знать, что почти наверняка программа поймает всех плагиатчиков. Сейчас картина немного другая:

24% студенческих работ содержат четкие следы ИИ. Это рост в четыре раза по сравнению с 2023.
43% студентов сами признаются, что отдают нейросетям написание рефератов и дипломов.

При этом самая популярная система антиплагиата, по словам директора компании, в начале года ловила на ИИ лишь 15% работ. А с недавних пор начала «ловить» ИИ даже там, где его не было: 1, 2. Это всё уже привлекло внимание представителей ЛДПР и Мизулиной.

Как распределяются деньги на рынке антиплагиата

Судя по тому, что нашёл я, разделение примерно следующее.

Вузы и госсектор — 80%. Министерства заставляют университет сканировать студенческие работы, а вузы покупают софт «для галочки». Средний федеральный университет тратит порядка 2 млн рублей за год.

Студенты — 15%. Они платят 200–300 рублей за прогон файла, чтобы проверить базовую уникальность.

Энтерпрайз — 5%. Крупный бизнес и НИИ смотрят, нет ли у них какого украденного кода или использования чужих патентов. В науке и больших производствах крайне важно не нарушить ничьи права.

Получается, что львиную долю бюджетов генерирует государство. И когда есть устоявшийся подход, сменить его трудно — поэтому ВУЗы закупают всё те же системы, что и пять лет назад.

За что платят миллионы

Профильные тендеры стабильно забирают три класса систем.

Масс-маркет с устаревшими технологиями. Он ловит откровенную копипасту и ленивые решения. Там честно работают отсев шинглов и стопроцентных дублей. Но нейросети ломают эту защиту в один клик. Студентам даже платная подписка не нужна, чтобы обходить такие фильтры.

Энтерпрайз-тяжеловесы. Серьезные продукты для НИИ и крупного бизнеса, которые я упоминал выше. Такие модели хорошо работают. Они анализируют векторную семантику. Скрипт парсит смысл текста, а не отдельные слова. Казалось бы, здорово? С точки зрения результата — да.

Только вот внедрять такие платформы и пользоваться ими — отдельная большая задача, с которой справляются только корпораты. Нужны и свои сервера, и IT-отдел, и небольшое обучение для пользователей — всё-таки там не только кнопка «проверить». Но бизнес и НИИ замотивированы всем этим пользоваться — для них это сейчас единственный рабочий способ не пустить в продакшен сгенерированный шлак.

Чего-то «среднего» нет — либо покупаете дешёвую систему, которая даёт слабые результаты, либо вкладываетесь в энтерпрайз.

Turnitin. Это американский стандарт, который вроде бы решает все проблемы. И все новые технологии использованы, и айтишникам его внедрять проще, и пользователям легко.

Только вот легально купить лицензию нельзя, Turnitin поставлют через пень-колоду. И главное — зарубежный софт абсолютно слеп к сложной морфологии русского языка, отчего часто выдаёт ложноположительные срабатывания (об этом я подробнее расскажу в следующих статьях).

Как итог — по-настоящему удобного решения нет и пока не предвидится. Везде приходится сталкиваться с мощными ограничениями. Ругать рынок бессмысленно — сделать ситуацию лучше прямо сейчас вряд ли получится.

Как LLM ломают рынок прямо сейчас

Старые системы ищут точную копипасту, но любой «шаристый» студент берёт базовую бесплатную LLM и ломает алгоритм:

Кто-то прогоняет фрагменты через каскад переводчиков вроде DeepL. Русский → английский → французский → английский → русский. Смысл сохраняется, но сами слова и предложения меняются полностью.
Кто-то заставляет нейросеть полностью пересобрать текст хитрыми промптами.
Кто-то меняет базу терминов синонимами.

Старые скрипты стали бессильны. В ответ вендоры выкатили новые ИТ-костыли. Разработчики прикрутили модули AI-детекции.

В попытке адаптироваться к ИИ технологии пришли к массовым ложно-положительным срабатываниям. Скрипты сходят с ума, когда проверяют работы. Они игнорируют на контекст и то, что перед ними студенческие работы. Софт видит сложный академический слог и сразу кричит: «нейросеть!». А что студенты обязаны писать таким слогом — ну, это уже другой вопрос.

В итоге системы антиплагиата не помогают отсеивать плагиатчиков, а заставляют студентов и преподавателей совместно переписывать реальные работы, чтобы программа не обвинила их в использовании ИИ.

Что будет с рынком? Расскажу в следующих частях

Пока рынок заливает проблему деньгами, студенты продолжают обходить алгоритмы за пару кликов. В ближайшее время я залезу в эти системы и покажу, как работал антиплагиат раньше, на чем конкретно ломаются старые алгоритмы сейчас, и что может спасти от засилья ИИ-генерации. А потом, может, и какой прогноз соображу.

Комментарии (27)

AndruxaBS
11.05.2026 09:33
#29955490
Ну я понимаю практическую часть самому сделать. Но какой студент в здравом уме будет писать бумажки и документацию, если можно где то стащить, а теперь и сгенерить.
1. ss-pol
  11.05.2026 09:33
  #29955564
  Давайте начистоту. Цель ВУЗа - подготовить специалиста, способного решать поставленные задачи в заданной области, отфильтровать неспособных. Какая разница при этом, как именно эта задача будет решена, с помощью неройнки или без, если на работе будут те же самые условия. С этой точки зрения копирование части работы из доступных источников не страшно, если такое же будет допустимо и на рабочем месте. Тогда в чём же проблема? Надо создать схожие условия по использованию нейронок, как и на рабочем месте.
  
  Кто-то скажет, но ведь есть действительно умные талантливые трудолюбивые ребята, которые при таком подходе оказываются ничем не лучше бездельника, который научился ловко составлять промпт. А я отвечу - а какая разница, если на рабочем месте будет то же самое? Или разница всё-таки есть? Тогда надо определиться в чём она и создать соответствующие условия.
  1. Int_13h
    11.05.2026 09:33
    #29955612
    А зарплату промпто-составителю можно платить меньше, или он столько же захочет, сколько и кустарь с ручным трудом? Но тогда он должен раз в, допустим, 10 эффективнее работать благодаря автоматизации, значит на него можно за ту же зарплату повесить раз в 10 больше обязанностей? Автоматизация труда, в том числе и с помощью ИИ, должна приносить ощутимый профит - либо сэкономить на персонале, либо штамповать продукцию как из пулемета.
    
    Moog_Prodigy
    11.05.2026 09:33
    #29956584
    Иногда автоматизация должна приносить профит тому кто ее использует, а не работодателю, государству или кому-то еще. Условно говоря, работник таскал цемент 20 мешков в день, потом плюнул и купил тачку за свои (это важно). И таскает теперь те же 20 мешков на тачке за час, а остальное время спит. Работодатель ему - э, мы так не договаривались, таскай теперь 100 мешков в смену, но тачку я тебе все равно не куплю, дорого слишком.
    
    Справедливо?
    
    Так с изобретениями и рацухами в СССР обжигались, да и не только, так и сейчас. Я сделаю себе инструмент не для того чтобы получать больше (хотя может быть) а чтобы работать меньше. Типа хитрой заточки токарного резца, специального стенда для настройки оборудования или приборчика. Или программы. Уж сколько историй было про хитрого сисадмина, одним скриптом делавшим за полчаса месячную работу. И в основном, это мало кому нравится из начальства, если у них цель - от забора и до обеда.
  1. AndruxaBS
    11.05.2026 09:33
    #29955618
    Полностью согласен! Т.е. можно оставить какое то небольшое кол-во топовых университетов, которые будут готовить имено будущих научных специалистов. Остальным же прекратить этот бесячий косплей подготовки начинающих ученных и прочую развивайку, сосредоточившись непосредственно на прикладной области и тем чем человек конкретно будет заниматься в трудовой деятельности.
    
    WhiteBehemoth
    11.05.2026 09:33
    #29956188
    для этого нужно возродить институт средне-специального образования и поднять его престиж. И убрать требование высшего образования так, где оно не нужно.
    
    AndruxaBS
    11.05.2026 09:33
    #29956336
    Тоже за этот путь. Большинство высших учебных заведений перевести в среднеспециальные и назначить там прикладную программу обучения.
    
    aMster1
    11.05.2026 09:33
    #29956324
    А как выбрать этих самых "будущих научных специалистов" не подскажите?
    
    Вы же понимаете (?) что ограничивая доступ к высшему образованию мы сами себе режем перспективу? Выбрать даже не гения, а просто крепкого ученого из 10 человек и 1000 - совершенно разные задачи. А если стоит задача не выбрать а научить?
    
    Топовые вузы - очень классно. Какой там конкурс? Сколько баллов надо иметь чтобы попасть на бюджет? Сколько стоит 5 лет обучения? Да в конце концов где они находятся? Москва и Питер? А замкадышам что делать?
    
    AndruxaBS
    11.05.2026 09:33
    #29956416
    А как выбрать этих самых "будущих научных специалистов" не подскажите?
    
    Через олимпиады и экзамены
    
    Вы же понимаете (?) что ограничивая доступ к высшему образованию мы сами себе режем перспективу? Выбрать даже не гения, а просто крепкого ученого из 10 человек и 1000 - совершенно разные задачи. А если стоит задача не выбрать а научить?
    
    Какую перспективу? Мы избавим людей от геморроя. Большинство людей идут учится чтоб работать на квалифицированной работе и получить побольше денег. А не чтоб приобщиться к науке))
    
    Топовые вузы - очень классно. Какой там конкурс? Сколько баллов надо иметь чтобы попасть на бюджет? Сколько стоит 5 лет обучения? Да в конце концов где они находятся? Москва и Питер? А замкадышам что делать?
    
    Даже не знаю. Сложно сказать. Сколько людей хочет стать ученными или погоняться чисто ради престижа и ЧСВ. Допустим жесткий отбор будет, но нам так то и не нужны миллион ученных. Можно в каждом мегаполисе хотя бы по одному топовому университету оставить.
    
    ss-pol
    11.05.2026 09:33
    #29956382
    Не понимаю, зачем как-то особенно выделять учёных в этой парадигме. Наука это просто ещё один вид трудовой деятельности, где тоже ставятся задачи и ищутся решения. Если учёный будет решать поставленную задачу с помощью нейронки, что же тут плохого? Если вы не можете отличить результат, то какая разница, как учёный пришёл к ответу. А если можете отличить, то и проблемы никакой нет.
    
    AndruxaBS
    11.05.2026 09:33
    #29959918
    Потомучто совершенно разный вид деятельности заниматься изобретением нового и решать прикладные задачи. Я вообще не про нейронки, а про то что должен быть разный процесс подготовки первых и вторых
  1. WhiteBehemoth
    11.05.2026 09:33
    #29956178
    Цель ВУЗа - подготовить специалиста, способного решать поставленные задачи в заданной области, отфильтровать неспособных
    
    годы в ВУЗе для того, чтоб пользоваться нейронкой на работе - не нужны. Цель должна быть в том, чтоб учить человека вглубь и вширь. В идеале - находить непознанное и расширять горизонты человечества в целом. Как минимум - развить СОБСТВЕННУЮ нейронную сеть в мозгу. А это - работа, нужно учиться, думать, делать выводы. И в том числе - умение показать и объяснить свои выводы.
    
    ss-pol
    11.05.2026 09:33
    #29956486
    Цель должна быть в том, чтоб учить человека вглубь и вширь. В идеале - находить непознанное и расширять горизонты человечества в целом
    
    Обучить этому невозможно, можно лишь отобрать людей, которые к этому склонны, которые могут этим заниматься лучше всего, затем дать им такую возможность. Это и есть вышеупомянутая задача фильтрации. Мы зачерпываем среди поступающих и потом постепенно отфильтровываем неподходящих на экзаменах, курсовых и прочих учебных работах.
    
    Но что если "находить непознанное и расширять горизонты человечества в целом" гораздо эффективней можно с помощью нейронки? Ведь тогда блокируя использование нейронок в ВУЗе мы отбираем не тех, неправильно фильтруем и снижаем эффективность наших инженеров и учёных.
    
    WhiteBehemoth
    11.05.2026 09:33
    #29957008
    Обучить этому невозможно
    
    Позволю себе не согласится с этим ультимативным заявлением. Всё зависит от того, насколько предмет интересен. А это и личные предпочтения студента и умение преподавателя давать материал.
    
    Мы зачерпываем среди поступающих и потом постепенно отфильтровываем неподходящих на экзаменах, курсовых и прочих учебных работах.
    
    Экзамены, - это не фильтры, это подтверждение полученных знаний и стимул старательнее учиться. Курсовые - практика.
    
    Но что если "находить непознанное и расширять горизонты человечества в целом" гораздо эффективней можно с помощью нейронки? Ведь тогда блокируя использование нейронок в ВУЗе мы отбираем не тех, неправильно фильтруем и снижаем эффективность наших инженеров и учёных.
    
    Задача учебных заведений - учить людей. Блокировать стоит только неэтичные/незаконные инструменты. ИИ, в общедоступном формате, этичен и законен. Запрещать его использование - совершенно глупая идея. Но выдавать работу ИИ за свою с целью получить оценку повыше - разумеется недопустимо, как и любой другой плагиат.
    
    ss-pol
    11.05.2026 09:33
    #29957490
    Задача учебных заведений - учить людей. Блокировать стоит только неэтичные/незаконные инструменты. ИИ, в общедоступном формате, этичен и законен. Запрещать его использование - совершенно глупая идея. Но выдавать работу ИИ за свою с целью получить оценку повыше - разумеется недопустимо, как и любой другой плагиат.
    
    С этим я конечно согласен.
    
    Но если мы разрешаем использование нейронок, то как отделить работу студента от чего-то сгенерированного на основе его запросов? И если с дальнейшим их совершенствованием любая студенческая работа может быть сгенерирована, как быть? Полумеры здесь по-моему не сработают.

anonymous
11.05.2026 09:33
#29955600
1. WhiteBehemoth
  11.05.2026 09:33
  #29956150
  Плагиат и нарушение авторских прав, это разные вещи. Первое - это выдача чужой работы за свою (например цитирование без указания авторства). Тут может и не быть нарушения авторских прав, если цитируемое не защищено.
  
  В случае с LLM, если студент просто переписывает то, что сгенерировал ИИ - это таки плагиат. Даже если взять крайний случай и обучить модель ИСКЛЮЧИТЕЛЬНО на своих текстах, генерация нового - это ее работа, не своя.
  
  То есть LLM можно, конечно, использовать, но именно как инструмент, чётко обозначивая, что именно было сделано им.
  1. PereslavlFoto
    11.05.2026 09:33
    #29956346
    В России одно из авторских прав — право на имя — защищено без окончания срока, навсегда.
    
    WhiteBehemoth
    11.05.2026 09:33
    #29956450
    из этого не следует, что весь опубликованный текст защищён авторским правом. Или вы что-то иное имели в виду?
    
    PereslavlFoto
    11.05.2026 09:33
    #29956588
    Есть разные авторские права.
    
    У одних есть срок, например, у права копировать.
    
    У других нету срока, например, у права быть автором, у права на имя, у права на целостность произведения.
    
    Таким образом, все опубликованные тексты защищены некоторыми авторскими правами.

anonymous
11.05.2026 09:33
#29956572

alexhu
11.05.2026 09:33
#29955636
Государство и бизнес тратят 1,5 миллиарда в год на слепой антиплагиат — и это проблема

Почему это проблема? И для кого это проблема?

Преподаватели прекрасно осознают, что 99 % абитуриентов полностью полагаются на ИИ, половина школьников старших классов не знает таблицу умножения, большая часть выпускников не понимают какой специальности их учили.

Ну прогнали текст через антиплагиат, всё равно все защитятся и выпустятся. В чём состоит проблема?

Radisto
11.05.2026 09:33
#29955640
Знал студента, который переписал описательную часть диплома своими словами (вариант от ии был с малым процентом оригинальности) и оригинальность стала ещё ниже по оценке автоматического антиплагиата. То есть существующие решения не только не поощряют использование ии, но и вынуждают его использовать: кожаные технари не настолько хороши в конструировании наборов слов из корпуса русского языка, в техвузах от них другого ждут
1. eeglab
  11.05.2026 09:33
  #29955940
  Ещё лет 10-15 назад как то антиплагиат (который тот самый) справлялся со своей задачей, но сейчас оригинальный текст на русском языке выше 40-60% оригинальности не наберёт, как ни старайся. Их ИИ детектор, кстати, только на gigachat наверное и реагирует. Реально в использовании ИИ для текстов не вижу проблемы, если текст содержит оригинальную авторскую идею - это обычная "печатная машинка". Единственный способ уйти от использования llm в науке - перестать требовать "объемы"

el_mago
11.05.2026 09:33
#29956138
Что интересно, в похожем ключе на реддите ругают Turnitin. Факт в том, что ИИ отстойно пишет научные и технические тексты. Сгенерированные слова только по форме напоминают академический язык и по содержанию такая работа не выдерживает никакой критики. Возможно, по аналогии с водительскими механика/автомат пора вводить новую категорию дипломов "Инженер ...." и "Инженер ... при поддержке ИИ" и т.п.

saege5b
11.05.2026 09:33
#29957644
Стандартное содержание, стандартная вводная часть, стандартное заключение, стандартный список литературы... что и как там написать оригинального?

А если и сам курсовик или диплом - стандартный?

У меня был диплом по расчёту СПК в Нечернозёмной полосе России. С учётом очников и заочников, всех более-менее крупных хозяйств про которые можно взять хоть какие-то данные - примерно на полтора раза. Весь диплом - единообразные и стандартен. Я удивлён что студенты вообще умудряются через антиплагиат прорываться.

D7ILeucoH
11.05.2026 09:33
#29958286
Имею опыт работы с антиплагиатом.

Написал свой диплом полностью сам, вообще без цитат. 60 страниц вышло с картинками примерно. Оригинальность 93% кажется. При том что я 100% писал сам и своими словами. Почему плагиат? Титульник, содержание и код посчитало за плагиат. Система толком не работает.

Не люблю антиплагиат и всю эту непонятную движуху с попытками узнать оригинальность текста. Оригинальность результатов почему-то вообще никого не интересует. Это абсурд...