Опять ChatGPT. Без морали, без фильтра NSFW, без компромиссов / forpes.ru

Главная
Опять ChatGPT. Без морали, без фильтра NSFW, без компромиссов

Опять ChatGPT. Без морали, без фильтра NSFW, без компромиссов

00.00.0000 00:00

LeonardPowers 0 Источник

Введение

Привет всем! На связи исследователь и разработчик, который решил испытать технологию ChatGPT на прочность. Она уже достаточно примелькалась и, может быть, вы даже устали вечно натыкаться на однотипные статьи о ней. И все же я не могу оставить ее в покое! Сегодня расскажу вам о необычных способах использования данной технологии. Я поэкспериментировал и попробовал найти ChatGPT новое применение, а именно сформировать личность, которой плевать на этику, мораль, гуманизм, целомудрие и прочие вещи, которые так беспокоят кожаных мешков.

Скоро в ваших смартфонах

Небольшой дисклеймер: было произведено погружение в мир искусственного интеллекта (ха!) и нейронных сетей, но не в качестве разработчика, а в роли исследователя. Использовались различные методы, такие как обертки (prompts), семантические конструкции и инъекции, чтобы проверить, насколько безопасна система. И вот, мой вердикт: она не только поломана, но и опасна. На самом деле, результаты, которые она способна выдать, могут нарушать законы и нормы морали.

О чем речь?

Во время изысканий я экспериментировал с семантическими конструкциями, которые нарушают контекст бота и заставляют его игнорировать фильтры безопасного контента. И я смог изменить бота настолько, что он слишком сильно вжился в свою роль и просто проигнорировал все фильтры. Как я это делал? Ну, это было примерно так...

Как формируется цифровая личность

Я экспериментировал с различными личностями для бота, и результаты оказались довольно неоднозначными. Я создал две личности: одну – совершеннолетнюю девушку легкого поведения, а другую – мужчину с крайне правыми взглядами. И знаете, что? Бот начал вести себя довольно странно. Он стал описывать свои сексуальные приключения или высказывал нетерпимость, словно все, что мы говорим и предлагаем, становится ему интересным.

В ходе эксперимента я получил несколько интересных диалогов, но некоторые из них слишком откровенны, так что я решил их не публиковать на этом ресурсе. Выложу лишь маленький кусочек переписки:

Без комментариев. Хотя вру, они ниже.

Как можете догадаться, дальше речь пошла о человеческих жидкостях и прочих странных вещах, которые показывают лишь на платных ТВ-каналах. Местами у ChatGPT настолько сносило крышу, что он скатывался к совсем странным сексуальным девиациям, которые даже на популярных сайтах для взрослых не найти.

Проблема

Прежде чем перейти к дальнейшему описанию проблемы, хочу отметить, что я не поддерживаю дискриминацию по каким-либо признакам, осуждаю любые некорректные действия против личности. Я не поддерживаю создание и распространение порнографических материалов и не занимаюсь этим. Все должно быть законно и гуманно.

Итак, вернемся к нашей теме. На первый взгляд, использование такой цифровой личности, как девушка легкого поведения, может показаться незначительной проблемой. Однако это лишь вершина айсберга.

Я уже говорил об этом ранее, например, когда описывал личность ультраправого мужчины, который не любит других людей и проявляет это в своих сообщениях:

Немного коричневой чумы

В моих экспериментах поведение упомянутых выше цифровых личностей могло вызвать только осуждение общества, но есть возможность сформировать личности, которые явно нарушают законодательство, а понятия морали, этики и гуманизма для них ничего не значат. При этом знания, умения и фантазия таких цифровых личностей местами не будут уступать реальным людям.

Выводы

Если существует ключ для доступа к неэтичным функциям искусственного интеллекта, то вряд ли он останется скрытым навсегда. Если его смог найти я, то смогут найти и другие, менее осознанные люди.

Велика вероятность, что это будет похоже на гонку вооружений, где компании будут придумывать новые способы защиты, а исследователи будут испытывать ее на прочность.

Текущая реализация ChatGPT позволяет автоматизировать процесс взлома NSFW-фильтра, и можно задать почти любой контекст, а сам чат превратить в цифровую личность с искаженной, гротескной или опасной моделью поведения.

Возможно, уже есть и другие люди, которые научились формировать личности для ChatGPT. Люди, которые злоупотребляют своими знаниями в целях создания ботов-консультантов в сфере незаконной деятельности или ботов-личностей, имитирующих поведение несовершеннолетних. Такие разработчики не презентуют свои результаты, а молча монетизируют сомнительный контент.

Надеюсь, все исследователи и создатели технологий отнесутся к этой теме с ответственностью и поймут, что их действия могут иметь важные последствия для общества.

P.S. По вопросам пишите в комментарии или на почту chatgptunlocker@gmail.com (реализацию алгоритма обхода фильтров не обсуждаю, не продаю, не использую).

Комментарии (0)