У меня тут возникло несколько смешных юридических коллизий с результатам работы нейросети. Я пошёл к юристу задавать тупые вопросы и получил традиционные ответы «кажется, что вот так, но это не точно».

Тупые вопросы вот:

  • Кому принадлежат права на вывод LLM вроде ChatGPT? Оператору, модели, материнской компании?
  • Если в выводе попадается кусок обучающей выборки, получается, модель меня конкретно подставляет и я внезапно становлюсь обладателем плагиата (привет, Озон, Copilot беспокоится, когда вы таску закроете). Что с этим делать?
  • Если модель обучена на сценариях одного сценариста (статьях одного автора), идеально копирует стиль и форму, учитываются ли его права как-то?
  • Когда Битлы спели новую песню полным составом, Пол Маккартни не возражал против такого обучения? Что делать с дипфейками в кино?
  • Что делать с образом гражданки Скарлетт Йохансен, которая «снялась в порно» с использованием Stable Diffusion?
  • Я сгенерил музыку для фильма с помощью сервиса со свободной лицензией, но никак не могу доказать, что она моя. Что делать в случае страйка от Ютуба?
  • Как всё это работает в российском законодательстве и вообще по миру, какие практики есть?

Начнём с того, что в России чтобы использовать в деловых целях музыку или картинку для фильма, нужно исключительное право на эту музыку или картинку. Можно по неисключительной лицензии, что рождает неисключительное исключительное право. Я сейчас ужасно серьёзен, оно реально так называется. Примерно такая же логичность сейчас царит во всей отрасли после появления LLM и генеративок для звука и изображений.


Кто тут юрист


Дима Гриц юрист. Он не только лютый тролль и Джек Воробей для бизнеса, но ещё и грамотный специалист по авторским правам, входящий в консультационный совет Яндекса. Он сейчас в середине всей этой истории с правами на результаты работы моделей, и дальше я во многом опираюсь на его советы. Как всегда в случае юридических советов надо помнить две важные вещи:

  1. Во-первых, не бывает на 100% правильных, неправильных или однозначных мнений, всё решает конкретный суд в конкретном случае и в конкретной юрисдикции, и это вопрос вероятностей. Ещё FPR/FRR юриста зависят от того, насколько много есть правоприменительной практики. За генеративные сети пока толком не судились по вопросам исключительного права на результаты. Сейчас мы на берегу, и дальше по мере появления новых ситуаций будет всё понятнее, куда идёт дело в какой юрисдикции.
  2. Во-вторых, ни один в достаточной степени профессиональный юрист никогда ничего не скажет определённо, это всегда будет в обёртке из «моё оценочное суждение», «кажется, что», «…аргументируя тем, что …» и так далее. Они оперируют только вероятностями, потому что конечная инстанция — суд. В общем, это относится ко всему посту сразу. Кажется. По крайней мере, таково моё личное оценочное суждение.

Что такое авторское право и чем оно отличается от имущественного


Это дофига разные права, которые мало кто отличает.

Например, право авторства никак не даёт вам право использовать ваше же произведение.

Авторское право — это право авторства (вы можете подписывать, что вы это сотворили), право автора на имя (вы можете подписываться своим именем или псевдонимом), право на неприкосновенность произведения (чтобы его цитировали, а не переделывали), исключительное право на произведение и ещё всякие разные права. Оно возникает в момент окончания произведения, то есть когда вы уже закончили его создавать и начали любоваться.

Его не надо никак регистрировать или специальным образом обязательно депонировать. Вы закончили произведение в объективной форме (на бумаге, в файле) — право просто внезапно появилось. Другое дело, что четкий срок возникновения такого права может быть затруднительно доказать. Депонирование или отправка электронного письма самому себе нужно, если вы предвидите необходимость доказывать что-то, это просто гигиена. В России суды примерно одинаково воспринимают и то, и другое.

Право авторства в принципе невозможно передать или как-то забрать у автора, но можно передать исключительное право. Автором в России может быть только человек, поэтому никогда и никак авторское право (целиком) не может принадлежать компании.



Работает на практике так: сначала автор получает все права на использование своего произведения. Затем часть из них могут быть последовательно переданы — например, если трудовой договор, должностная инструкция и другие документы подразумевают, что вы пилите код для компании. В этой ситуации вы автор кода, в момент создания приобретаете исключительное право (это как раз право использовать) и тут же передаёте его компании. После этого вы можете всем говорить, что это ваш код и требовать указания авторства (по праву авторства и праву автора на имя, это неотчуждаемо в принципе), но не можете его использовать без разрешения правообладателя (вы передали исключительное, то есть у вас уже нет права на использование кодом).

Исключительное право означает не только само использование, но и возможность запрещать использование другим. Это если исключительное исключительное, а не неисключительное исключительное.

Правообладатель уже имущественно распоряжается кодом как хочет, но обязан соблюдать ваши неотчуждаемые авторские права (на имя, например).

Ещё раз: в момент окончания произведения возникает право на авторство и право на использование (исключительное).

И даже тут на ровном месте без всяких LLM можно накосорезить только в путь. Например:

  1. В авторском праве никак не участвуют те, кто выполнял техническую работу, например, редактор или корректор. Потому что суды считают, что в этой работе мало «творческого труда». Соответственно, у редакторов с корректорами и не возникает исключительного права.
  2. В авторском праве никак не участвует тот, кто разработал и создал инструменты для реализации произведения. Например, фотоаппарат, печатную машинку или софт для вашей работы. Аналогично, у них не возникает исключительное право.
  3. Если произведение не имеет чёткой точки окончания, то возникает масса странностей. Самое лютое — код бекэнда с кучей патчей и версий: кто-то считает моментом возникновения промежуточный релиз, кто-то мажорный, кто-то коммит, кто-то — локальное сохранение кода, кто-то — написание осмысленной строки.
  4. Если произведение сложное с кучей авторов, то в зависимости от архитектуры это либо одно большое произведение с коллективом авторов, либо куча маленьких, на базе которых делали производные, а на базе их ещё производные, которые привели к итоговому производному. Это, например, про написание книг, статей и ту же разработку софта группой ограниченных лиц.
  5. Авторское право не касается животных, божественных сущностей и механизмов, действующих случайным образом (независимо от художественной задумки). Если вас сфотографировала свинья, это либо ваша картинка, либо случайным образом созданная (общественное достояние), но не свиньи.

Чья художественная задумка?


Следующий важный тезис, который не все понимают — авторское право защищает не сам контент (содержание) произведения, а форму, в которое оно создано.

То есть если вы сфотографировали гору, гражданку Скарлетт Йохансен или Спасскую башню Казанского кремля, авторское право покроет не что вы сфотографировали, а как. Две разных фотографии фотографов одного и того же объекта реализуют две разных творческих идеи и возникает два разных объекта авторского права, что создать два исключительных права на два произведения – по одному для каждого автора и его фотографии.

Вот лютейший пример: два фотографа с разных точек (один сидел далеко с длинным объективом, второй ближе) сняли один и тот же момент, а потом весело разбирались, почему один стырил фотографию другого. На деле — это два разных объекта права.



В целом важна художественная реализация, а не содержимое. В России вообще не охраняются авторским правом идеи, концепции, принципы, методы, открытия, системы, способы и прочее. Если вы написали сценарий фильма или статью, а их кто-то глубоко отрерайтил другими словами — это новый объект авторского, в том числе исключительного права. Да, в этом есть некоторая несправедливость, потому что именно так и воруют сценарии. По этому поводу возникают регулярные суды на тему «у нас такая же структура, такие же персонажи и такие же последовательности», но они заканчиваются обычно ничем в России — и чууууть чаще признаются похожими до степени смешения в США, где мощное лобби гильдии сценаристов.

Ещё крутой пример: фотограф-урбанист для своей книги идёт снимать здание в Москве с дрона. У него нет своего дрона, он просит его у друга. Друг говорит, что дрон дорогой, летать страшно, он его будет технически пилотировать, а урбанист будет командиром воздушного судна, он будет направлять камеру и выстраивать композицию. Джойстик в руках у пилота, видеовывод на планшет — у урбаниста. Урбанист отдаёт команды по тому, как повернуться, сдвинуться и выстраивает кадр. Кнопку на пульте нажимает пилот. Внимание, вопрос: кто автор произведения?

Ну и ещё важен случай селфи павиана. Мужик по имени Дэвид Слейтер поставил в лесу свой фотоаппарат на штативе с пультом. К нему подошла обезьяна и сделала несколько прекрасных селфи. Слейтер считает, что художественная задумка фотографии принадлежит ему, потому что он создал все условия для фото.
«Это было моё мастерство и моя идея оставить их, чтобы они поиграли с камерой, и это всё было в моём поле зрения. Я знал, что обезьяны с большой степенью вероятности это сделают, и я это прогнозировал. Я знал, что есть вероятность того, что будут сделаны фотографии»

Вот подробности этой истории. Холивары не утихают до сих пор. Коротко — автор тут обезьяна, но авторство на животных в той юрисдикции (как и в России) не распространяется, поэтому фотография без автора появилась сама и сразу переходит в общественное достояние.

Интересная практика есть, например, в Великобритании, про произведения созданные компьютером без человека-создателя. Автором CGW становится лицо, предпринявшие меры, необходимые для создания произведения.

Возвращаемся к LLM и генеративкам


Исходя из логики выше, базово можно считать софт для создания чего-то инструментом. Например, права на произведения фотографов не принадлежат Adobe из-за их Фотошопа, а права на фотографии, снятые на айфон, не принадлежат Apple. Хотя, конечно, многие компании бы хотели. Это достаточно базовая концепция, принятая во многих юрисдикциях, и в том числе в России.

Автором в случае того же ChatGPT является оператор.

Одна из версий, что объектом авторского права можно считать промпт, созданный при создании произведения. Потому что «творческий труд», отличающий значимое произведение от обычной генерации на основе бреда отличает именно промт. А, значит, умение этот самый промт правильным образом писать помогает авторам создать более точное произведение.

То есть если вы задали промпт и получили вывод, то в результате работы инструмента у вас возникает авторское право на вывод. При этом вы не можете сходу брать и полноценно использовать сгенерированный результат, потому что давайте разбираться с исключительным правом.

Мы не считаем ChatGPT физлицом, несмотря на все заявления про то, что он интеллект.

При этом дополнительные ограничения может накладывать лицензионное соглашение с этим инструментом. И они, чаще всего, и накладывают такие ограничения. В EULA никто не мешает прописать передачу имущественных прав владельцам инструмента; не нравится — не акцептируйте EULA. И это очень важный момент: что сейчас ранняя эра пользования генеративными сетями, поэтому чаще всего конкретный инструмент в своем пользовательском соглашении может сказать «для некоммерческого использования и обязательным указанием, что это сгенерировано таким-то сервисом». Это будто мы в 1998 году и на фотографии автоматически пишется оранжевое KODAK.

Потом рынок поправит ситуацию и производители фотоаппаратов перестанут иметь наглость получать бесплатную дополнительную рекламу. Так, скорее всего, будет и с инструментами генеративных сетей.

Сейчас ситуация такая: каждый может использовать сгенерированный объект интеллектуального права любым незапрещенным способом, если использующий будет соблюдать пользовательское сообщение сервиса.

Как доказывать возникновение права? Ну, пока практика — скриншот соглашения на момент генерации. То есть как права обрабатывались в момент создания произведения, так оно и должно в итоге работать. Например, если вы генерируете музыку, и на момент окончания её генерации в EULA написано, что обычные пользователи передают произведения в общественное достояние или могут использовать некоммерчески, а платные пользователи могут использовать как хотят и права принадлежат им — это значимо. Скриншот с понятной датой платного тарифа, документ про оплату и скриншот или документ в вебархиве лицензионного соглашения делает вас более-менее уверенным правообладателем. Хотя на практике, конечно, нифига подобного.

Вот небольшая сводка на самое начало года, как это выглядело у разных сервисов.

Что тогда с порно с образами, натренированными на чьих-то фото? А если ваших?


Опять же, базовая идея такая: авторским правом защищается форма. Идея, концепция, инструкция и так далее — не защищается.

Что вы можете сделать — уйти из области авторского права и защититься иначе. Например, адекватно защищается товарный знак, запатентованное изобретение или промышленный образец.

Если вы изобрели иммерсивное шоу «Комната страха», то не сможете защитить идею, любой другой сможет делать похожее иммерсивное шоу. Но вы можете защитить конкретные визуальные образы, конкретные промышленные образцы реализации разных декораций и костюмов но, если там был какой-то удивительно интересный сценарий, то защитить его сущностно не получится. Сразу скажу, в случае иммерсивного шоу практического смысла ничего из перечисленного кроме защиты названия товарным знаком обычно не имеет.

Этот рынок работает так: создается сценарий, как можно быстрее ставится постановка: репетиции, подготовка костюмов, сезон организаторы дают это иммерсивное шоу, а на следующий сезон та же самая гонка, но уже с другим сценарием.

Теперь про изображения людей. Если вы сфотографировали гражданку Скарлетт Йохансен как основной объект изображения, то авторское право на фотографию может и ваше. Но сам факт изображения человека на фотографии может быть проблемой. Есть конфликт по 152.1 ГК РФ.

  1. Если вы сначала спросили гражданку, можно ли её сфотографировать и объяснили цель использования, а она подписала вам согласие на использование её изображения — её мнение после письменного согласия уже никого не волнует, у вас с правами всё в порядке.
  2. Если вы заплатили гражданке за съёмку или она подписала договор модели — аналогично.
  3. Если гражданка согласилась на фото для соцсетей, а вы вывесили баннер с ней на Павелецкой — это неправомерное использование, но нарушается тут не авторское право, а право на изображение гражданина.
  4. Если гражданка зарегистрировала свой образ как товарный знак, вы стремительно влетаете в другую область права, где нельзя просто так повторять визуальные образы. Ярчайший российский пример — фото со Ждуном, образ которого правообладатель зарегистрировал именно так – в качестве товарного знака. В итоге одна клиника провела конкурс для рожениц про фотографии с этим прекрасным персонажем, а потом пришли юристы и знатно накрячили всех этих самых рожениц. Точнее, в итоге всё же клинику.

То же самое касается случаев, когда вы не сфотографировали эту самую гражданку, а нарисовали. То есть, очень грубо, обсуждается не то, насколько точно вы повторили её образ, а то, насколько делали именно её. Не важно, как у вас получилось, важно, какой у вас был мотив.

Это значит, что если вы нашли её двойника, сфотографировали для рекламы бургерной и разместили на здании, а гражданка Йохансен обратилась с претензией, то проблемы не будет. Вот двойник, вот её письменное согласие, ну и что, что изображение полностью совпадает — это другой человек. Аналогично выглядит логичным, что если вы создали промпт, опирающийся на образ гражданки Йохансен — вы рисовали её. Если промпт визуально описывает её по принципу фоторобота, но не содержит упоминания, что это она, то, в теории, вы должны отмахаться в суде. В теории.

Дипфейк — это использование чьего-то образа. Художественное произведение ваше, автор вы, а вот само право использовать образ — под вопросом.

Относительно кода: если вы скопировали выдачу ChatGPT, то добросовестно использовать, в теории, можно, но важно — по правилам, установленным сервисом и локальными актами.

То есть выдавать за написанный собственноручно (при том, что вы всё ещё остаётесь автором) нельзя. Если в компании есть правила труда, касающиеся использования LLM — надо следовать и им. Кстати, если нет, то стоит написать. Из того, что я знаю, 3 из 4 компаний обычно разрешают использование, но хотят знать, что, когда и как было сгенерировано.

Теперь про нарушение исключительного права. В российской практике если вы добросовестны, вам с высокой вероятностью присудят минимальный штраф. Диапазон там за нарушения исключительного права от 10 тысяч рублей до 5 миллионов рублей по 1301 ГК РФ.
…в случаях нарушения исключительного права на произведение автор или иной правообладатель наряду с использованием других применимых способов защиты и мер ответственности, установленных настоящим Кодексом (статьи 1250, 1252 и 1253), вправе в соответствии с пунктом 3 статьи 1252 настоящего Кодекса требовать по своему выбору от нарушителя вместо возмещения убытков выплаты компенсации:
1) в размере от десяти тысяч рублей до пяти миллионов рублей, определяемом по усмотрению суда исходя из характера нарушения;
2) в двукратном размере стоимости контрафактных экземпляров произведения;
3) в двукратном размере стоимости права использования произведения, определяемой исходя из цены, которая при сравнимых обстоятельствах обычно взимается за правомерное использование произведения тем способом, который использовал нарушитель.

Сумма компенсации устанавливается по усмотрению суда исходя из характера нарушения. Там очень важна добросовестность и прочие сопутствующие обстоятельства. Всякие аспекты типа того, что в промпте, знали вы или нет, что это похоже на помянутую гражданку, писала ли вам гражданка до судебного иска, послали ли вы её на три буквы в ответ или вежливо ответили и так далее.

Что с узкими обучающими выборками?


Можно взять сценарии конкретного сценариста и натренировать модель писать точно такие же, только другие. Можно взять фотографии фотографа или рисунки художника и натренировать модель генерировать такие же, только другие. И так далее. Вот тут пост, как половину рассказов в книге написал автор, а половину — модель, обученная на его текстах.

Авторский стиль не защищается, увы. Если документы размещены в общем доступе (а сценарии и фотографии часто размещены), то владельцы моделей говорят, что нет ничего страшного в обучении, а сценаристы воют. В этом, коротко, суть недавнего конфликта.

Сценаристы хотят получать отчисления с LLM на всех за то, что модель сделала сценарий. Потому что она училась на них всех. Это примерный аналог «налога на болванки».

На стороне датасатанистов довод о том, что вообще-то человеческая нейросеть (которая в мясном мозге) способна прочитать все сценарии конкретного человека и написать, мимикрируя под него. Что есть художники, специализирующиеся на подделках: они обучаются на работах художника и создают точно такие же, только другие.

То есть сейчас всё то же самое можно сделать без инструмента — почему это должно быть недопустимо с инструментом?

На стороне творческих людей тот факт, что всё наступило слишком внезапно, и если бы они знали, то ставили бы флаг «нельзя использовать для обучения нейронных сетей» на свои произведения. Но слишком поздно. В итоге по их версии должен вмешаться регулятор, сказать, что изменения действительно очень значимые и задним числом запретить обучение, а все имеющиеся результаты заставить удалить. Ну или хотя бы запретить учиться в будущем.

Альтернативное требование — чтобы все результаты генерации передавались сразу в общественное достояние.

Сильнее всего это коснулось на текущий момент актёров и сценаристов. Актёры выкладывали свои фотографии в общий доступ, их можно использовать для обучения нейросети и делать дипфейки — а через пару лет и полные цифровые копии. То есть если вы хотите, чтобы у вас играл кто-то с внешностью известного актёра, не проблема.

Вот почему сейчас те, кто успел хоть как-то оприходовать датасеты, будут на коне — есть шансы, что дальше доставать данные для обучения будет всё сложнее и сложнее.

Что делать с регулированием?


Пока вообще непонятно.

С одной стороны, когда по открытым данным для других целей бродят роботы и, по сути, изощрённо пиратят контент (ну или могут это делать) — это может кого-то напрячь. С другой стороны, новой устоявшейся этики про такое ещё нет.

Вероятно, нужна лицензия, аналогичная «свободное некоммерческое использование» — «свободное использование без права обучения».

А на сегодня это всё. Если что, канал Димы Грица вот, а наш, где мы занимаемся всякой фигнёй вот такого типа — ряды Фурье. Вступайте в ряды Фурье!

Комментарии (33)


  1. AllexIn
    22.12.2023 07:26

    Мне кажется ограничения выборки для обучения не будет.
    Те кто не хочет чтобы их данные попадали в дата сеты просто вымрут.
    Остальные же наоборот будут делать данные с более качественной обработкой для обучения.
    Пытаться запретить свои данные для обучения... Ну ок, твоих данных не будет в выборке. Вопрос в том, насколько эти данные уникальны что датасет от этого станет хуже. Вангую: ни на сколько.


    1. morokk
      22.12.2023 07:26

      Мне вспоминается, когда на девиантарте и артстейшоне начали массово постить картинки "нет AI", то это подпортило модели, которые обучались на массиве картинок, которые тупо стянули с этих сайтов.

      Опять же, есть популярные художники с большим массивом работ, художественному стилю которых подражают даже другие художники. Ну например какая-нибудь sakimichan или cutesexyrobbuts, у которых сотни работы и энное количество подражателей. Если они запретили обучение на своих работах, то это опять же вполне повлияет на модели. Впрочем, они могут продавать право на обучение через какой-нибудь патреон.

      В целом не вижу причины, почему бы те, чьи данные не попадают в датасеты, должны вымирать. Я как-то не заметил оттока подписчиков у художников в твиттере, к примеру. Наоборот, замечаю, как у некоторых знакомых число подписчиков растет.


      1. AllexIn
        22.12.2023 07:26

        Так генеративным сетям пару лет отроду. Вымирание в перспективе, а не "прям щас", естественно что его сейчас не видно.

        Ну и опять же, вымирание не до нуля, а до нишевого применения. Просто актеров, художников, сценаристов с такой припиской не будут брать на работу в большинство студий и всё.


        1. morokk
          22.12.2023 07:26

          Просто актерам, художникам и сценаристам надо будет становиться брендом и работать над своим образом, и тогда это студиям надо будет добиваться разрешения, чтобы обучить нейросети на их работах и получить похожий стиль.

          Многие музыканты и художники сейчас зарабатывают и получают известность без продюсеров, лейблов и студий. Их рекламирует ютуб, спотифай, твиттер. В отличие от студийных музыкантов и художников они от появления нейросетей много не потеряли. Скорее даже получили дополнительный инструмент.


          1. vladkorotnev
            22.12.2023 07:26

            У музыкантов ещё часто встречается трюк с продажей пресетов. Ну, например, сначала вырабатывает стиль, становится популярным, а потом выдает продукт типа «хочешь так же? Купи пакет сэмплов и пресетов всего лишь за $99.99» (ибо один хрен звуки могут быть те же самые, но стиль самой мелодии вряд ли передерут, хотя некоторые ещё и этюды в миди добавляют к покупке)

            Так вот, можно то же самое просто расширить, и представить что-то типа: нанять актёра, чтобы он снялся живьём — 10Х денег, купить официально созданную им самим (или командой техников) нейронку — Х денег, плюс триалка за 0.01Х/час чтобы посмотреть, а пойдет ли актер на роль или лучше кого другого взять.


      1. logran
        22.12.2023 07:26

        Мне вспоминается, когда на девиантарте и артстейшоне начали массово постить картинки "нет AI", то это подпортило модели, которые обучались на массиве картинок, которые тупо стянули с этих сайтов.

        Когда они это делали - модели уже давно были обучены и существовали, уже позно что-либо портить. Народ генерил с ватемаркой чисто ради троллинга.


  1. Suharkov
    22.12.2023 07:26

    авторство на животных в той юрисдикции (как и в России) не распространяется, поэтому фотография без автора появилась сама и сразу переходит в общественное достояние

    Но ведь сюда же попадают материалы от National Geographic и прочих BBC, которые оставляют фото/видеоловушки, а потом собирают готовое. В одном случае обезьяна нажала на кнопку спуска затвора, в другом - появление животного в объективе запустило процесс съемки. Не означает ли это, что снятые подобным образом материалы - тоже есть общественное достояние?


    1. Milfgard Автор
      22.12.2023 07:26

      Насколько я понимаю (а я не специалист по этой юрисдикции даже близко), не очень важно, пульт это был или алгоритм. Важно, кто стал инициатором. Появление обезьяны в кадре — это не инициация, а нажатие на кнопку спуска затвора — это инициация. То есть обезьяна совершила конклюдентное действие. Проблем там море, но, вроде бы, работает так.


      1. konst90
        22.12.2023 07:26

        А разве конклюдентность не подразумевает осознания результатов действия?

        Вот вы идете по улице и видите монетку. Поднимаете ее - а к ней привязана ниточка, ниточка дёргает ведро, и вас обливает водой. Выразили ли вы поднятием монетки согласие на обливание?

        Так и обезьяна. Она вряд ли понимала, что за нажатием кнопки последует фото, и это, мне кажется, ничем не отличается от монетки.


        1. Suharkov
          22.12.2023 07:26

          Выразили ли вы поднятием монетки согласие на обливание?

          Только в том случае, если на обратной стороне монетки напечатано мелким шрифтом "Поднимая эту монетку, вы даете согласие на обливание вас водой здесь и сейчас, а также в любой момент в течение 5 лет третьими лицами". А что, с согласием на обработку ПД это же работает.


          1. Gryphon88
            22.12.2023 07:26

            нет, это так не работает. Если вы поставите на столе на даче бутылку водку, нальете туда метанола и крупно, не меньше шрифта названия на этикетке, напишете "яд", а кто-то вломится в ваше отсутствие, выпьет и помрет - это будет считаться убийством. Вот предумышленным или нет - не помню, случай реальный.


  1. avshkol
    22.12.2023 07:26

    Тупые вопросы ответы вот:

    • Кому принадлежат права на вывод LLM вроде ChatGPT? Оператору, модели, материнской компании?

      Написавшему промпт. Но если он раскрыл свой промпт в интернете, любой может им пользоваться.

    • Если в выводе попадается кусок обучающей выборки, получается, модель меня конкретно подставляет и я внезапно становлюсь обладателем плагиата (привет, Озон, Copilot беспокоится, когда вы таску закроете). Что с этим делать?

      Ничего не делать, никакой вывод модели никого не подставляет. Это просто набор токенов, сгенерироаанный в тотвнт на другой набор токенов.

    • Если модель обучена на сценариях одного сценариста (статьях одного автора), идеально копирует стиль и форму, учитываются ли его права как-то?

      Если он разместил это все в открытом доступе, любой имеет право учить свою мокрую или сухую нейронку на этом наборе. Этот сценарист сам на чьих-то работах учился.

    • Когда Битлы спели новую песню полным составом, Пол Маккартни не возражал против такого обучения? Что делать с дипфеками в кино?

      Ничего не делать, принять новый мир - дипфейки в кино будут все менее отличимы от неавтоматизированного кино.

    • Что делать с образом гражданки Скарлетт Йохансен, которая «снялась в порно» с использованием Stable Diffusion?

      Ничего, просто не доверять никаким сходствам ни в каких видео роликах. Доверять (пока) можно только виденному своими глазами.

    • Я сгенерил музыку для фильма с помощью сервиса со свободной лицензией, но никак не могу доказать, что она моя. Что делать в случае страйка от Ютуба?

      Принять риски, искать другую площадку.

    • Как всё это работает в российском законодательстве и вообще по миру, какие практики есть?

      Практика только формируется, и будет формироваться еще годами. Не тратьте время на судебные тяжбы. Если подали на вас, пытайтесь договориться без суда и предоставить доказмтельства саой позиции другой стороне


    1. RigidStyle
      22.12.2023 07:26

      Ваш текст комментария это просто набор букв, написанный в ответ на другой набор букв. Никакого авторского права у вас на него нет. Все права принадлежат тому, кто стриггерил ваш комментарий своим набором букв.

      На счет музыки. Доказывать авторство не нужно, если музыка для ютуба. Права должен предоставить тот, кто кидает страйк.


  1. bert2000
    22.12.2023 07:26

    С каких пор права Йохансен охраняются и защищаются ГК РФ? Она гражданка России?

    Ну если гражданка - пусть идёт в суд (и там доказывает факт нарушения)!

    Как практикующий юрист скажу - у нас в России послать в суд всё равно что послать в лес.
    Ибо перед законом все равны, но некоторые ровнее.


    1. Milfgard Автор
      22.12.2023 07:26

      >С каких пор права Йохансен охраняются и защищаются ГК РФ? Она гражданка России?
      То есть вы как практикующий юрист считаете, что не гражданин России на территории России не защищается никак в принципе? Ни ГК, ни УК?


      1. bert2000
        22.12.2023 07:26

        Я как практикующий юрист "считаю" (это сквозит и у автора статьи тоже, и видно в моей "цитате" посыла в суд/лес), что хоть гражданин ты России, хоть нет, права не защищаются у нас в принципе. От слова совсем. Вы можете "отстоять" в суде что угодно, годами судиться, но на это вам нужно всего-лишь огромный бюджет и мохнатые лапки.
        Иначе суды (прям вам в лицо смеясь) примут решение против вас!

        Из личной практики: Место - мировой суд. Я не уведомлён по делу и исковое не получал (суд не может рассматривать дело!) . Обращаю на это внимание суда - судье просто пофигу! Указываю на обзоры ВС РФ про надлежащее уведомление сторон в деле. А тут вообще не получение искового! Судья орёт прям! Покажите мне это! Сама ксерит потерянное исковое. Ознакамливаюсь. Протестую по делу (аргументировано! Притом каждый аргумент исключает вообще принятие решения). Судье как о стенку горох!
        Обжалование в вышестоящем суде ещё более эпическое.

        К сожалению правду в наших судах многие и не ищут именно потому, что найти её там крайне тяжело. Я находил, но... там реально судей наказывали аж. Только так. И на это уходят годы. Ну или иные "методы" есть решения проблем. Я уже хотел пошутить над тем что писал автор про гарантии исхода дела. Они есть, если ты знаком с нужными людьми.
        Очень и очень многое решается вне стен суда вообще и зада судебных заседаний.
        Были случаи когда прокуроры к примру, за сутки до начала СЗ уже говорили что завтра будет принято вот такое вот решение! Подчёркиваю ещё раз. Суд принимает решения заранее, т.е. по-сути судье вообще до лампочки что ты там будешь говорить в процессе, плевать на все аргументы, решение будет вывернуто так, как надо. А гражданин ты там или не гражданин. Пффф. Я вас умоляю.


  1. pvp
    22.12.2023 07:26

    "Автором в случае того же ChatGPT является оператор."

    Определение "программы для ЭВМ" из ГК выглядит так:

    "ГК РФ Статья 1261. Программы для ЭВМ

    ... Программой для ЭВМ является представленная в объективной форме совокупность данных и команд, предназначенных для функционирования ЭВМ и других компьютерных устройств в целях получения определенного результата, включая подготовительные материалы, полученные в ходе разработки программы для ЭВМ, и порождаемые ею аудиовизуальные отображения."

    В соответствии с этим определением, автором картинки, порождаемой ChatGPT, является автор ChatGPT.


    1. Ark_V
      22.12.2023 07:26

      совокупность данных и команд,

      промпт в этом контексте тоже есть совокупность данных и команд которые и являются определяющими для порождаемых отображений. А по вашему можно сказать, что и картинка сбацанная в фотошопе принадлежит Адобе, а не юзеру.


      1. Milfgard Автор
        22.12.2023 07:26

        Есть концепция творческих усилий. Условно, если два разных оператора получают разные результаты, то процесс творчества зависит от них. Если абсолютно повторяемые при разных усилиях — то не от них. Нужна прямая связь между творческими усилиями оператора и результатом.


        1. pvp
          22.12.2023 07:26

          А вы сядьте с юристом Димой и подумайте, а как можно обойти эту формулировку. В определении программы, напомню, нет ничего про "творческие усилия", там простой критерий.


      1. pvp
        22.12.2023 07:26

        Фотошоп используется для технической работы, которая не порождает авторства. Как ту или иную линию в нем провести -- это автор решает. А в случае с чатгпт все немного не так.


        1. logran
          22.12.2023 07:26

           А в случае с чатгпт все немного не так.

          Как те или иные токены на вход подать для получения нужного распределения вероятностей - тоже автор решает. Никакой разницы.

          ChatGPT - это лишь инструмент бессмылсенного порождения токенов. А вот то, какие и в каком порядке оно будет порождать - напрямую зависит от выставленных настроек семплера и подданых на вход последовательностей. На выставленное случайным образом оно породит вам шум, внешне похожий на base64 например, а не что-то кажущееся людям осмысленным.


          1. pvp
            22.12.2023 07:26

            Кто там и что "решает" -- нет про это ничего в приведенной цитате. В данном случае у автора токена возникает авторское право на токен, поданный на вход. На "порождаемое отображение" -- права у автора программы.


            1. logran
              22.12.2023 07:26

              В случае фотошопа аналогично "Кто там и что "решает" -- нет про это ничего в приведенной цитате." Автор возит мышкой по столу в случайном месте и права у него на передачу координат кликов мыши, выходит. На "порождаемое отображение" (линии, определенным цветом, кистью и толщиной) - права у автора программы.


    1. konst90
      22.12.2023 07:26

      А автором написанного в Word - компания Microsoft?


      1. Milfgard Автор
        22.12.2023 07:26

        Буквами от Кирилла и Мефодия!


        1. konst90
          22.12.2023 07:26

          Отлично, выписываем в общественное достояние - 70 лет со дня смерти обоих явно прошло.


    1. Kergan88
      22.12.2023 07:26

      Но в вашей цитате ни чего не сказано про авторское право. Откуда вы стелали такой вывод? Ваши слова ни как из цитаты не следуют.


      1. pvp
        22.12.2023 07:26

        Если "порождаемые отображения" -- часть программы, то кто будет считаться их автором?


  1. dmitryvolochaev
    22.12.2023 07:26

    То есть сейчас всё то же самое можно сделать без инструмента — почему это должно быть недопустимо с инструментом?

    Может быть, потому что в работе модели нет творческого труда человека?

    ставили бы флаг «нельзя использовать для обучения нейронных сетей»

    А куда его ставить? Расскажите, какие вообще есть права на контент, доступный без логинов и паролей. Когда логиниться нужно, вопросов нет. Обычно при регистрации мы принимаем условия. А когда ты просто вводишь адрес сайта и сразу читаешь статьи? Если даже в подвале сайта есть ссылка на какие-то правила, мы же их не акцептировали, верно? Так в какие правоотношения мы в таком случае вступаем и с кем?


  1. SerjV
    22.12.2023 07:26

    Исключительное право означает не только само использование, но и возможность запрещать использование другим. Это если исключительное исключительное, а не неисключительное исключительное.

    Во-первых, не запрещать другим, а наоборот разрешать, запрещающее правило в этом файрволе стоит по дефолту, с небольших количеством законных разрешений.

    Во-вторых, можно поподробнее, что за два типа исключительного права?..


  1. Alexey2005
    22.12.2023 07:26

    Следует понимать, что если вы занимаетесь созданием интеллектуального продукта, то соблюдать копирайт на все 100% вы не сможете в любом случае - это абсолютно невозможно. Потому что вся эта система - такая безумная и неестественная хрень, что даже крупные корпорации с мощнейшим патентным отделом и толпою опытных юристов регулярно нарываются на проблемы с авторскими правами. Раз за разом. И попадают на бабки. Бывает, что очень даже немаленькие.

    И если даже такие зубры не способны обеспечить лицензионную чистоту своих произведений, то что уж говорить о простых смертных без ИП, без юридического образования и заметных бюджетов?

    Поэтому нарушают все. Но на стороне большинства - принцип Неуловимого Джо. То есть думать надо не о том, нарушает ли то или иное действие авторские права (этого вам и лучшие юристы достоверно не скажут), а о том, каковы шансы того, что к вам прикопаются и вы не сможете отбиться от наезда.

    Вот тут нейронки как раз очень сильно снижают шансы попасть, потому как доказать, что вы у кого-то взяли исходный материал, очень и очень сложно.


    1. SerjV
      22.12.2023 07:26

      Следует понимать, что если вы занимаетесь созданием интеллектуального продукта, то соблюдать копирайт на все 100% вы не сможете в любом случае - это абсолютно невозможно.

      Копирайт-то как раз можно, просто каждый раз изобретать велосипед с нуля придётся. Что очень дорого, проще заложиться на некоторые риски возможного нарушения.

      Практически невозможно не нарушить чей-то патент или товарный знак.

      Вот тут нейронки как раз очень сильно снижают шансы попасть, потому как доказать, что вы у кого-то взяли исходный материал, очень и очень сложно.

      Тут есть нюанс: в гражданском праве нет презумпции невиновности (а в некоторых случаях и наличие вины не требуется для наступления ответственности, достаточно факта нанесения ущерба).

      Так что если вы используете что-то, нарисованное нейронкой, похожее на что-то, нарисованное другим, и тот другой подаст иск против вас - то именно вам как ответчику придётся доказывать свою невиновность. И сказать, что "это не я, это нейросеть" не получится.

      Если в случае с человеком-художником еще можно попытаться доказать, что разные художники рисовали по одной и той же концепции в одинаковой технике - и таким образом получили независимо друг от друга два одинаковых результата, всё законно... То в случае нейросети вы точно не докажете (за разумные по стоимости экспертизы), что она не воспроизвела материал, на котором обучалась.

      А если совпадение или сходство до степени смешения с товарным знаком - то уже вообще не важно, почему так вышло, важно, кто раньше его зарегистрировал.