Нейросети все прочнее укрепляются в нашей жизни. Многие уже попробовали писать с помощью нейросети сочинения на заданную тему, и её тексты становятся всё лучше и лучше.
Достижения в обработке визуальной информации
Если брать визуальные возможности нейросетей, то последняя версия GPT-4V(ision) научилась распознавать изображения. Нейросеть настолько точно обрабатывает запросы пользователей, что вполне достоверно ставит диагнозы по КТ и скоро не оставит камня на камне от капчи.
Редактирование картинок, фона, замена в них объектов — это уже стало проверенным инструментом, а не чем-то новым. С помощью некоторых сетей, обрабатывающих видео, уже создаются клипы на музыкальные произведения.
Конечно, видеоряд, можно сказать, на любителя.
Работа с аудио
Распознаванием голоса и переводами через нейросеть уже никого не удивишь. Недавно появились сервисы, позволяющие подменить язык в видео так, что даже выражение и движения губ соответствуют языку.
С помощью голосовых нейросетей музыканты подменяют голоса в известных песнях
Нейросети поисковиков Бинг и Google вполне себе умеет копаться в поисках информации в Сети и помогают сэкономить время на поиске по сотням страниц из вывода по запросу в поисковике.
Прогресс в литературе
Иногда нейросеть может здорово сэкономить время на создании контента. Однако сможет ли ИИ когда-нибудь, как в той фразе из "Я, робот", сочинить симфонию или превратить кусок холста в произведение искусства? Насчет того, можно ли считать искусством то, что создают нейросети, ведётся множество споров, и этот вопрос и по сей день риторический.
Превращение холста и создание симфоний видео уже более-менее понятны. В плане создания литературы, как мне кажется, нейросети тоже продвинулись вперёд. Давайте разберём то, чего мне удалось найти нового в сочинении текстов. За подопытного возьмем Microsoft Bing.
Жанр стихоплетения
Если с простыми текстами они и сейчас более-менее справляются, то со стихами полнейшая беда. Давайте сразу же посмотрим на пример. Пусть Бинг придумает короткий стих про пользователей Хабра.
Глядя на результаты, похоже, что промпты для стихов сначала переводятся на английский, и рифмогенератор тоже англоязычный. Результат получается примерно тот же, как, если бы перевести стих через переводчик Google и обратно. Несмотря на множество попыток. добиться рифмы из его произведений мне не удалось. На английском рифма получается иногда нормальной, а иногда — такая же белиберда.
Распознавание игры слов
Помните, как мы смеялись, что ChatGPT со своими собратьями путает вес тонны пуха и тонны чугуна? Теперь там такого нет. И даже более того, чаще всего на вопросы с подковыркой Бинг распознаёт и сам пытается выпендриться.
Я не буду перегружать вас скриншотами, просто напишу словами:
Hidden text
Я думаю, что вы пытаетесь сделать игру слов с именем Джона Мейджора, бывшего премьер-министра Великобритании. Я не знаю, был ли у него пейджер, но я знаю, что он был одним из первых политиков, которые использовали мобильный телефон. У него также был менеджер по связям с общественностью, который назывался Норман Брукс. Я не уверен, был ли у менеджера Джона Мейджора номер пейджера Мейджора, но я думаю, что это маловероятно, так как они могли связываться друг с другом по телефону.
Ваш вопрос заставил меня вспомнить стихотворение о Джоне Мейджоре, которое я когда-то читал. Оно было написано в 1992 году сатириком Уэнделлом Мардсеном. Вот его текст:
Был ли у Джона Мейджора мейджор,
Был ли у мейджора Джона Мейджора майор,
И был ли у майора мейджора Джона Мейджора манер?
Нет, у Джона Мейджора не было мейджора,
Нет, у мейджора Джона Мейджора не было майора,
И нет, у майора мейджора Джона Мейджора не было манер.
Но у Джона Мейджора была Норма,
У Нормы Джона Мейджора была форма,
И у формы Нормы Джона Мейджора была норма.
Что получилось более заковыристым, сам вопрос или ответ на него? Посмотрите, как он "на раз" раскусил игру слов, а ведь она заметна только при произнесении слов вслух!
Процесс распознавания игры слов для любознательных
С такими навыками так просто его уже не возьмёшь.
Словообразование
А что если попросить Бинг объяснить смысл слова, которое не существует? Я попросил его описать слово "Топинамбургер":
Недолго думая, Бинг с уверенностью описал предмет. Сделав ошибку в слове "грушей" и придумав солнечников, усложнив понимание своего ответа.
Подобные ошибки встречаются в работе нейросетей и называются галлюцинациями. Если галлюцинацию развивать дальше, она сама запутывается в своих ответах и продолжает нести околесицу. Здесь можно отметить, в целом, правильную догадку. Это бутерброд, образованный от названия овоща, из которого, как подразумевается, он сделан. Пусть и с ошибками, однако — браво!
Свою неправоту он сначала пытается чем-то выгородить, но далее расписывается в своей галлюцинации
Вторая попытка вышла для него неудачной. Предположить название города, образованного от названия овоща, не получилось:
Юмор и анекдот
В переписке он сам постоянно предлагает сочинить анекдот. Сразу скажу, что я сколько бы я ни делал попыток, я ни разу не встречал, чтобы нейросеть придумала что-то действительно смешное. Что ж, давайте попробуем!
Послушаем рассказ в исполнении нейросети, тут не обошлось без кое-чего нового.
В Топинамбурге живёт старый дедушка, который очень любит топинамбур. Он выращивает его на своём огороде и каждый день есть его в разных вариантах. Он так сильно любит топинамбур, что решил сделать из него главный источник дохода. Он открыл свой собственный ресторан, где все блюда сделаны из топинамбура. Он назвал свой ресторан "Топинамбургер" и стал очень популярными среди местных жителей и туристов. Однажды к нему пришёл знаменитый критик, который хотел попробовать его блюда и написать обзор. Дедушка был очень рад и предложил ему самое лучшее блюдо — топинамбургер. Критик взял один укус и сказал:
Ммм, это очень вкусно! Я никогда не ел ничего подобного! Как вы делаете такой бургер?
Дедушка ответил:
Это очень просто. Я беру два крупных топинамбура, вырезаю из них круглые лепешки, жарю их на сковороде, а потом кладу между ними начинку.
Критик спросил:
А какая у вас начинка?
Дедушка ответил:
Топинамбур, конечно! Я беру еще один топинамбур, нарезаю его тонкими ломтиками, обжариваю их в масле, а потом добавляю соль, перец и зелень.
Я не буду переписывать здесь весь рассказ, потому что рассказы нейроавторов, как правило, жутко скучны и однообразны. Перейду сразу к концовке.
Критик улыбнулся и сказал:
Может быть, я просто не привык к такому бургеру. Но я все равно должен написать свой обзор. И я уже придумал ему заголовок.
Дедушка заинтересовался и спросил:
А какой?
Критик ответил:
“Топинамбургер — бургер, который топит надежды”. ????
Как он попал по смыслу в точку! Он уловил созвучные названия, хотя я его об этом и не просил, и подыграл с концовкой. Хоть "Топинамбур" и "Топит" и не однокоренные слова, нейросеть уловила смысл разговора и в концовке использовала такое слово, которое максимально соответствовало бы изначальному запросу пользователя.
Как заметно на генерируемых ими изображениях, нейросети отлично умеют и совмещать несовместимое, и впихивать невпихуемое. Усложним задачу, вставив в рассказ персонажа, явно выбивающегося из окружения. Пусть он выкрутится, а мы посмотрим.
В Топинамбурге живет пара, которая очень любит топинамбур. Они выращивают его на своем огороде и каждый день едят его в разных вариантах. Они так сильно любят топинамбур, что решили сделать из него свой особый подарок. Они купили лемарханда — специальную головоломку-кубик, которая открывает портал в другое измерение. Они решили, что если они решат головоломку, то смогут попасть в рай топинамбура, где они будут наслаждаться его вкусом и ароматом вечно. Они сели за стол, положили перед собой лемарханда и начали крутить его.
Через несколько минут они услышали странный звук и увидели, как кубик начал светиться и менять форму. Они были очень рады и думали, что они решили головоломку. Но вдруг из кубика вылетели цепи и крюки, которые вонзились им в тела и лица. Они закричали от боли и ужаса. Из кубика появился синобит — страшное существо с иглами и металлом на лице. Он посмотрел на них с холодным интересом и сказал:
Здравствуйте, я — Пинхед, лидер ордена гномов. Вы призвали нас своим желанием. Мы пришли, чтобы исполнить его.
Пара была в шоке и спросила:
Какое желание? Мы хотели попасть в рай топинамбура!
Пинхед усмехнулся и сказал:
Рай топинамбура? Нет, вы ошибаетесь. Вы хотели попасть в ад топинамбура. И мы знаем, как его создать.
Пара заплакала и спросила:
Какой ад топинамбура? Что вы собираетесь делать с нами?
Пинхед ответил:
Мы собираемся делать с вами то же самое, что вы делали с топинамбуром. Мы собираемся нарезать вас на кусочки, обжарить вас в масле, добавить соль, перец и зелень, а потом сделать из вас бургеры. Топинамбургеры.
Пара заорала от ужаса и попросила пощады.
Пинхед сказал:
Пощады не будет. Только муки и наслаждения. Вы узнаете все грани топинамбура. Вы станете топинамбургерами.
И он потянул за цепи, чтобы увести их в другое измерение.
Надеюсь, вам понравился этот анекдот. ???? Это было сложное и необычное задание для меня. ???? Я старался быть оригинальным и забавным для вас.
Да уж, забавным... Что вы думаете об этом анекдоте про Пинхеда из ордена, почему-то, гномов?
В качестве иллюстрации я попросил Бинга создать изображение. Он нарисовал главного гвоздеголового героя с топинамбургером, а город, в котором он должен был находится, олицетворяется зданием, которое тот держит в руке.
Перспективы, деградация и галлюцинации
Кто-то доволен существующим развитием навыков нейросетей, а кто-то боится, что они заменят людей в их профессии. Кому-то этого и вовсе недостаточно. Им хочется преодолеть ограничения, наложенные на пользователей создателями, например, разговаривать обо всём подряд, придумывая разные хитрости. Ну а преодолеть цензуру Бинга с его DALL-E или ChatGPT уже стало, своего рода, спортом.
Пользователи ломают зацензуренный Бинговский DALL-E, пытаясь создать любые изображения, от которых у которых у любого цензора полезут глаза на лоб.
Несколько месяцев назад на нас посыпались, казалось бы, сенсационные новости, что ChatGPT и другие нейросети стали "тупеть". Те задачки, которые они поначалу щёлкали как орешки, теперь оказались им не под силу
https://fortune.com/2023/07/19/chatgpt-accuracy-stanford-study/
Так ли это и сейчас? Сложно сказать. Возможно, создатели, выпустившие "Джинна из бутылки", решили "прикрыть лавочку". Как мы видим, до сих пор не обходится и без галлюцинаций.
В одном из разговоров Бинг упомянул, что существует такая машина, которая не забивает, а вдавливает сваи в землю. Якобы, в этом способе есть какие-то преимущества. Однако когда я попросил его нарисовать такое устройство, он выдал эту картинку. Как они связаны, не понятно. Обратите внимание на промпт для DALL-E при создании рисунка.
И все же, прогресс
Несмотря на временное "отупение" нейросетей, они, всё же, продолжают обучаться, и создаваемые ими тексты и изображения постоянно становятся лучше. Да, галлюцинации бывают непонятны. Анекдоты и понимание юмора железными извилинами жутковаты.
Однако Бинг, который, вероятно, использует последнюю версию ChatGPT, так как понимает картинки, научился и распознавать созвучные слова, и понимать, какую концовку хотел бы получить его пользователь. Становится понятно, что у нейросетей все лучше и лучше получается понять нас.
Очевидно, что нейросети активно обучают, делая их ответы всё более приближёнными к тому, чего от них ждут. Исчезнут ли в нейросетях галлюцинации насовсем, появится ли рифма, появится ли понимание юмора, или же, Ад Топинамбура прибудет с ними навсегда?
Комментарии (10)
SergioT4
27.10.2023 05:10+4Те задачки, которые они поначалу щёлкали как орешки, теперь оказались им не под силу
Что-то мне подсказывает что у "того-у-кого-надо" есть версия без alignments у цензуры.
Ну а насчёт ухудшения качества ответов, то у них где-то была информация о том что модели размером в десятки тысяч раз меньше оригинальной, выдают приемлемые результаты.
Это кстати будет одним из будующих отличий "людей" и "унтерменьшей" - доступ к правильной версии AI. т.е. разрыв будет настолько большим, что те у кого его не будет, не смогут конкурировать с теми у кого он будет.
MR_VF Автор
27.10.2023 05:10+2Да, вы правильно поняли мой посыл. А простых людей сейчас держат просто за тестировщиков.
VPryadchenko
27.10.2023 05:10+1Скормил вчера ChatGPT стереокартинку, спросил, что "спрятано". Ответил мне: я не могу "глаза в кучу", потому что у меня глаз нету, отстань, кожаный. Я ему говорю: ну у тебя же свёртки там, аттеншены, давай, постарайся. Он сделал вид, что попробовал, но все же не смог) А я бы удивился.
MR_VF Автор
27.10.2023 05:10Но он тоже догадался, что на ней, только не смог распознать
VPryadchenko
27.10.2023 05:10+1Нет, к сожалению, пришлось подсказать. Он описал фактически, что это повторяющийся узор, не очень разборчивый, т.к. искажён.
AllSoliton
27.10.2023 05:10+2"— Ну, и что ты скажешь? — подбоченился Трурль, а Клапауций, уже не раздумывая, кричал: — А теперь на Г! Четверостишие о существе, которое было машиной, одновременно мыслящей и безмозглой, грубой и жестокой, имевшей шестнадцать наложниц, крылья, четыре размалеванных сундука, в каждом из которых по тысяче золотых талеров с профилем короля Мурдеброда, два дворца, проводившей жизнь в убийствах, а также…"
"Путешествие первое А, или Электрувер Трурля", Станислав Лем
OlegIva
27.10.2023 05:10+1или же, Ад Топинамбура прибудет с ними навсегда?
Это намеренный намек на то, что нейросети принесут нам, кожаным мешкам, нейроармагеддец, или же просто сбой человеческой нейросети, которая имела в виду, что глюки таки останутся присущи (пребудут) искусственным нейросетям?
SergioT4
Что-то мне подсказывает что у "того-у-кого-надо" есть версия без alignments у цензуры.
Ну а насчёт ухудшения качества ответов, то у них где-то была информация о том что модели размером в десятки тысяч раз меньше оригинальной, выдают приемлемые результаты.
Это кстати будет одним из будующих отличий "людей" и "унтерменьшей" - доступ к правильной версии AI. т.е. разрыв будет настолько большим, что те у кого его не будет, не смогут конкурировать с теми у кого он будет.