Gentoo, один из самых популярных дистрибутивов Linux, ввёл запрет на принятие изменений, созданных при помощи инструментов генеративного искусственного интеллекта (ГИИ). Этот запрет охватывает различные аспекты работы над дистрибутивом. Так, разработчики больше не могут использовать ГИИ для написания кода, отчётов об ошибках или документации. Но не исключено, что в будущем эти изменения будут пересмотрены. Подробности — под катом.

Что и почему случилось?

Сразу напомним, что Gentoo — это настраиваемый и гибкий дистрибутив Linux, который призван обеспечить оптимальную производительность и эффективное использование ресурсов компьютера. Основная особенность Gentoo заключается в том, что он предоставляет пользователю полный контроль над конфигурацией системы. Согласно данным Distrowatch.com, за последние 12 месяцев Gentoo вышел на 57-е место в рейтинге популярности дистрибутивов Linux и других Unix-подобных ОС, уступая одно место дистрибутиву Xubuntu. В топ-3 лидеров входят MX Linux, Mint и EndeavourOS.

Именно его команда разработчиков приняла решение отклонить любые изменения, которые были созданы с использованием AI. Это включает в себя не только запрет на использование различных ИИ-инструментов, таких как чат-боты OpenAI ChatGPT и Google Bard, но также помощников программиста типа GitHub Copilot от Microsoft. Под полным ограничением оказалось также применение машинного интеллекта для создания сценариев системы управления пакетами, написания программного кода, составления документации и формирования отчётов об ошибках.

27 февраля этого года один из представителей команды разработки Gentoo Михал Гурны (Michał Górny) предложил ввести упомянутые запретные меры. Он полагает, что есть несколько причин для нововведений, включая потенциальные проблемы с авторскими правами, контроль качества и этические соображения относительно высокого энергопотребления систем, обеспечивающих работу ИИ-сервисов. 10 марта было проведено первое рассмотрение предложенного запрета членами комитета, координирующего развитие Gentoo. Больше месяца ушло на уточнение и согласование неоднозначных моментов — и 14 апреля нововведения были приняты. Все 6 членов комитета проголосовали единогласно, предложение было утверждено в качестве профилактической меры, до возникновения какого-либо конкретного инцидента или проблемы.

Причины запрета

Гурны считает, что технологические гиганты не слишком строго соблюдают авторские права. В этих условиях реальна ситуация, когда защищённые фрагменты кода попадут в файлы open-source-проекта и создадут правовые проблемы для Gentoo. Например, владельцы генеративных моделей, используемых в коммерческих целях, недавно столкнулись с рядом претензий со стороны правообладателей контента. Базы данных контента, такого как тексты, изображения и другие материалы, использовались для обучения нейронных сетей.

Месяц назад против компании Nvidia был подан судебный иск от авторов книг. По их словам, платформа искусственного интеллекта NeMo, разработанная Nvidia и используемая для создания персонализированных чат-ботов, была обучена на контроверзиальном наборе данных, незаконно копировавшем и распространявшем книги без согласия владельцев. На основании закона об авторском праве истцы настаивают на выплате компенсаций и уничтожении всех копий набора данных Books3. Авторы утверждают, что набор данных Books3 содержал пиратские книги, скопированные из библиотеки Bibliotek.

Случай с Nvidia не единичный. В 2022 году несколько разработчиков подали иск в США против Microsoft. Они утверждали, что инструмент для предложения кода под названием Copilot, разработанный Microsoft для GitHub на основе модели Codex от OpenAI, нарушает законы об авторском праве и требования к лицензированию программного обеспечения. Разработчики заявляли, что Copilot может воспроизводить их код без разрешения. В ходе процесса судья частично удовлетворил ходатайства компаний-ответчиков о прекращении дела, отклонив некоторые требования, но этот конфликт ещё не разрешён до конца. Microsoft при этом держит своих клиентов в курсе текущих изменений по результатам судебного процесса.

ИИ и качество генерируемого кода

Недавно эксперт по безопасности компании Lasso Security Бар Ланьядо заметил, что модели ИИ часто выдумывают название библиотеки для Python под названием "huggingface-cli" после запроса пользователей о совете по программированию. Чтобы проверить, насколько это распространено, он создал настоящую библиотеку с таким же названием. Выяснилось, что крупные компании, такие как Alibaba, Tencent и Baidu, включили это выдуманное название в свою документацию как действительное. К счастью, "huggingface-cli" не содержала вредоносный код, так как это был эксперимент, но он показал, что даже технологические гиганты не застрахованы от серьёзных проблем при использовании ИИ.

Гурны также высказал сомнения по поводу качества кода, создаваемого ИИ. Он убеждён, что даже лучшие модели машинного интеллекта вызывают так называемые галлюцинации или допускают ошибки в сгенерированном коде. Несмотря на тот факт, что умные ассистенты действительно способны помочь программистам, для Gentoo важно, чтобы пользователи оставались осторожными и внимательными при работе с такими инструментами. При этом нельзя полностью полагаться и на профессиональный подход и опыт команды проекта. Ошибки возможны, поэтому код нужно будет рецензировать тщательнее, что увеличит трудозатраты персонала.

Маркетинг или реальная забота о клиенте?

В своём сообщении в рассылке для сообщества Gentoo Гурны подчёркивает разницу между ценностями больших корпораций, которые обладают мощными сервисами ИИ, и ценностями команды, которую он представляет. Гурны считает, что большие корпорации используют ИИ-сервисы без должного внимания к этическим и социальным последствиям. В то время как команда Gentoo придерживается более принципиального подхода к использованию технологий, учитывая интересы и безопасность своего сообщества. По его мнению, для крупных игроков не только копирайт, но и люди не имеют значения. Развитие и активное использование инструментов ИИ, по мнению команды разработки, приводит только «к огромным энергозатратам, легализации массовых увольнений, деградации интернета и увеличению объёмов спама и мошенничества в сети». Он уверен, что Gentoo всегда будет отличаться от подобных мейнстримных дистрибутивов.

Здесь есть и другой момент. Вполне вероятно, что Gentoo использует запрет на использование ИИ и в качестве грамотного маркетингового хода. Компания знает, что таким способом она привлечёт внимание консервативных пользователей Linux, которые предпочитают сборки, поддерживаемые исключительно людьми. Но со стороны руководства Gentoo не лишним будет продумать надёжные инструменты для обеспечения контроля нововведений. Актуальная цель после введения запрета — это не только установка чётких правил для сообщества, но и создание сознательного отношения и уважения участников к ним.

Комментарии (14)


  1. NickDoom
    19.04.2024 11:26

    Лучшее, что ИИ в Генте сделать может — это оптимизировать, находясь при этом в рамках алгоритмов строгого формального контроля его выхлопа.


  1. opusmode
    19.04.2024 11:26
    +8

    Gentoo не одобряет всё, что требует автоматизации и не требует страданий.