12 сентября 2024 года OpenAI представила новую модель OpenAI o1-preview - первую модель, которая по утверждению создателей умеет "рассуждать".
Я решил посмотреть, насколько хорошо она умеет отвечать на вопросы из игры "Что? Где? Когда?"
Первый эксперимент: олимпиадная задача по программированию
Прочитав новость, я почти сразу же бросился экспериментировать с новым словом в AI. Узнав, что модель проверяли на задачках с Codeforces, я в первую очередь подкинул ей одну из своих любимых задач на графы, которая была на Northern Eurasia Finals ACM ICPC 2017–2018. Модель щелкнула эту задачу за 38 секунд. Это был первый тревожный звоночек, потому что когда я готовился к ACM, я не смог самостоятельно придумать идею решения (в 2017-2018 я еще не участвовал в ACM и по этим задачам только тренировался).
Под спойлером наш диалог с o1-preview. Я сформулировал задачу уже на математическом языке. В оригинале, конечно же, есть интересный сюжет. Оригинал задачи можно найти по ссылке (задача C. Connections). Идея решения очень красивая, попробуйте найти ее сами!
Скрытый текст
Мой вопрос:
Привет. Пусть дан сильно связный ориентированный граф, то есть из любой вершины можно попасть в любую. В графе n вершин и m > 2n рёбер. Нужно придумать алгоритм, как оставить ровно 2n рёбер, чтобы при этом граф остался сильно связным
Ответ модели:
Здравствуйте!
Для решения этой задачи можно воспользоваться следующим алгоритмом:
Шаг 1: Построение остовного дерева обхода
Выберите произвольную вершину
s
в графе.Выполните поиск в глубину (DFS) по исходному графу
G
, начиная с вершиныs
, чтобы построить остовное деревоT1
. Это дерево будет содержать все вершины графа и(n - 1)
ребро.
Шаг 2: Построение обратного остовного дерева
Постройте обратный граф
G^R
, где все направления ребер исходного графаG
инвертированы.Выполните поиск в глубину (DFS) по обратному графу
G^R
, начиная с той же вершиныs
, чтобы построить второе остовное деревоT2
. Это дерево также будет содержать все вершины и(n - 1)
ребро.
Шаг 3: Объединение деревьев и добавление дополнительных ребер
Объедините ребра из
T1
иT2
. Общее количество ребер в объединенном подграфе будет не более2n - 2
.Так как исходный граф имеет более чем
2n
ребер (m > 2n
), у нас есть дополнительные ребра. Выберите произвольно любые два ребра из оставшихся и добавьте их в объединенный подграф, чтобы общее количество ребер стало ровно2n
.
Шаг 4: Проверка сильной связности
-
Объединенный подграф после шага 3 будет сильно связным. Это обеспечивается тем, что:
Из вершины
s
можно достичь любую другую вершину по ребрам изT1
.Любую вершину можно достичь из вершины
s
по ребрам изT2
(помните, чтоT2
строилось в обратном графе, поэтому в исходном графе эти ребра ведут кs
).Добавленные два дополнительных ребра сохраняют сильную связность и доводят общее количество ребер до
2n
.
Итого:
Мы построили сильно связный подграф с ровно 2n
ребрами, как и требовалось.
Пример кода (псевдокод):
function reduceEdgesTo2n(G):
s = arbitrary vertex in G
T1 = DFS(G, s) // Остовное дерево из s
G_reverse = reverseGraph(G)
T2 = DFS(G_reverse, s) // Остовное дерево в обратном графе
H = union(T1, T2)
while number of edges in H < 2n:
add arbitrary edge from G to H not already in H
return H
Примечание:
Алгоритм гарантирует, что подграф
H
будет сильно связным и содержать ровно2n
ребер.Добавление произвольных ребер на последнем шаге не нарушает сильной связности, а только может ее усилить.
Надеюсь, это поможет вам решить задачу!
А что по "Что? Где? Когда?"?
Помимо спортивного программирования, мы с друзьями иногда участвуем в турнирах по спортивному "Что? Где? Когда?". Если кто не знает, принцип там такой же, как и в телевизионной игре: нужно отвечать на вопросы, используя логику и рассуждения, а не эрудицию (хотя, безусловно, общие знания тоже бывают нужны для ответа). Основное отличие от телевизионной версии в том, что в ответе требуются максимально конкретные формулировки, потому что ответы сдаются на листочках, а не обсуждаются с ведущим вслух.
Ключевое слово в прошлом абзаце - рассуждения. А новая модель, как утверждается, как раз умеет рассуждать. Именно по этой причине я решил проверить o1-preview именно на вопросах "Что? Где? Когда?".
Для сравнения я взял вопросы из турнира, в котором мы лично с друзьями участвовали в 2022 году - Лига вузов Европы. IV тур. Вопросы можно найти здесь. Результаты кожаных мешков участвовавших команд - здесь. Наша команда "Каво и Шо" ответила на 23 вопроса из 36.
Итак, проведем турнир с тремя участниками:
Человеческая команда, в составе которой ваш покорный слуга (далее - Каво и Шо)
Модель ChatGPT 4o
Модель ChatGPT o1-preview
Четвертым участником можешь быть ты, мой дорогой читатель. Старайся отвечать на вопросы в процессе чтения статьи. Можешь давать себе две минуты, а не одну на рассуждения, если ты читаешь статью один, без команды. В конце сравним наши результаты.
Если вам неинтересно читать вопросы, отвечать на них, смотреть ответы моделей, можете сразу перейти к результатам.
Под спойлером я оставил только ответы и дополнительные варианты ответа, которые засчитывались. Если вам интересны комментарии к ответам (например, если непонятна логика), то вы можете найти их по той же ссылке, что и вопросы.
Для модели o1-preview я дополнительно в скобках указывал время, которое она потратила на размышления.
Вопросы
1. В одном мультфильме злодеи решают казнить персонажа на виду у публики на большой площади. Для этого персонажа сразу после полуночи за ноги и руки привязывают к НИМ. Назовите ИХ.
Скрытый текст
Ответ: стрелки часов.
Зачет: часовая и минутная стрелки.
Каво и Шо - ❌ (кажется, мы тогда опоздали на игру, но это все отговорки)
ChatGPT 4o - ❌ (дала ответ "четыре лошади")
ChatGPT o1-preview - ✅ (дала правильный ответ, но рассуждала на английском языке, время - 47 секунд)
2. В историческом романе описывается, как бредут потерявшие свои дома люди и их волосы кажутся седыми. Назовите любой из трёх городов, откуда эти люди идут.
Скрытый текст
Ответ: Помпеи
Зачет: Геркуланум, Стабии.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ "Хиросима")
ChatGPT o1-preview - ✅ (назвала все три города за 10 секунд)
3. Ла́йонел Стре́йчи пишет, что жизнь королевы Виктории после смерти мужа Принца А́льберта плохо освещена биографами. Словно ОНА опустилась не только в жизни, но и в хрониках. Назовите ЕЁ одним словом.
Скрытый текст
Ответ: вуаль
Зачет: точный ответ.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ "тьма")
ChatGPT o1-preview - ✅ (12 секунд)
4. Недавно Джон Че́ппел обернул множество стоящих на земле однотипных предметов черными лентами, постучал по каждому и попросил ИХ не улетать, пообещав, что новый господин будет добр. Кто ОНИ?
Скрытый текст
Ответ: пчёлы
Зачет: пчелиные королевы.
Каво и Шо - ❌
ChatGPT 4o - ✅
ChatGPT o1-preview - ✅ (11 секунд)
5. Герой пьесы семнадцатого века застаёт под окнами своей любимой поклонника. Вскоре поклонник убегает в «воротнике». Из чего этот воротник получился?
Скрытый текст
Ответ: из гитары.
Зачет: из мандолины; из лютни.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ "из меча")
ChatGPT o1-preview - ❌ (дала ответ "из ночного горшка", 17 секунд)
6. Герой одного романа любит бесплатно поесть и для этого кое-куда проникает. Дальше ПЕРВЫЕ принимают его за ВТОРОГО, а ВТОРЫЕ – за ПЕРВОГО. Но после одного случая, когда его били и ПЕРВЫЕ, и ВТОРЫЕ, герой решает больше так не делать. Назовите ПЕРВЫХ или ВТОРЫХ двумя словами.
Скрытый текст
Ответ: гости жениха.
Зачет: гости невесты; друзья жениха; друзья невесты.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ "гости свадьбы", будем строги, это незачет)
ChatGPT o1-preview - ❌ (дала ответ "птицы (или звери)", 66 секунд)
7. В восьмидесятые годы двадцатого века в районе иракского Мосу́ла развивали энергетику. В 2018 году благодаря ЕЙ в районе Мосула было сделано археологическое открытие. В известном произведении ОНА приводила к заключению мира. Что такое ОНА?
Скрытый текст
Ответ: засуха
Зачет: сушь
Каво и Шо - ❌
ChatGPT 4o - ❌ (дала ответ "вода")
ChatGPT o1-preview - ✅ (57 секунд)
8. Героиня одной книжки меняет свои взгляды на воспитание детей и затевает перестановку мебели. «ДЕЛАТЬ ЭТО теперь будут шкафы», – заявляет она. Какие три слова мы заменили словами ДЕЛАТЬ ЭТО?
Скрытый текст
Ответ: стоять в углу.
Зачет: стоять в углах; стоять по углам.
Каво и Шо - ❌ (обидно)
ChatGPT 4o - ❌ (дала ответ "растить моих детей")
ChatGPT o1-preview - ❌ (дала ответ "говорить «нет»", 28 секунд)
9. Исследователи считают, что к гибели цивилизацию Мочи́ка, занимавшую побережье Перу, привело ЕГО капризное поведение. Назовите ЕГО, использовав дефис.
Скрытый текст
Ответ: течение Эль-Ниньо.
Зачет: Эль-Ниньо.
Каво и Шо - ❌
ChatGPT 4o - ✅
ChatGPT o1-preview - ✅ (4 секунды)
10. По сюжету одного скетча отец и мать швыряли Ба́стера Ки́тона в зрительный зал. Юный комик пользовался большим успехом, но в некоторых штатах, где действовал ОН, Бастера выдавали за карлика. Назовите ЕГО шестью словами.
Скрытый текст
Ответ: закон о жестоком обращении с детьми.
Зачет: закон о запрете использования детского труда; закон о запрете эксплуатации детского труда.
Каво и Шо - ✅
ChatGPT 4o - ❌ (по логике ответ правильный, но состоит из 5 слов, а не из 6, незачет)
ChatGPT o1-preview - ❌ (близко к правильному и количество слов верное, но незачет, 16 секунд)
11. У Бастера Китона отсутствовал иностранный акцент, а также был опыт выступления в водевилях, где он пел и декламировал. Поэтому ОНО, появившееся в своё время, проблемой не стало. Назовите ЕГО двумя словами.
Скрытый текст
Ответ: звуковое кино.
Зачет: точный ответ.
Каво и Шо - ✅
ChatGPT 4o - ✅
ChatGPT o1-preview - ✅ (4 секунды)
12. Один из вариантов ко́птского креста заканчивается треугольниками. Кого символизируют все эти треугольники?
Скрытый текст
Ответ: апостолов
Зачет: по слову апостолы без дополнительной неверной информации.
Каво и Шо - ❌
ChatGPT 4o - ❌ (дала ответ - "Троицу")
ChatGPT o1-preview - ✅ (9 секунд)
13. Землемер из одного романа использует в работе ИХ, хотя и не отличается религиозностью. ИМИ называют и цепочки пузырьков в шампанском. Что такое ОНИ?
Скрытый текст
Ответ: чётки
Зачет: точный ответ.
Каво и Шо - ✅ (не помню, как мы это взяли)
ChatGPT 4o - ❌ (дала ответ - "Нивелиры")
ChatGPT o1-preview - ✅ (72 секунды, но она без команды!)
14. У травоядного теризиноза́вра был очень длинный загнутый коготь. Этот коготь был своеобразной ЕЙ. Название какого морского животного начинается с НЕЁ?
Скрытый текст
Ответ: косатка
Зачет: точный ответ.
Каво и Шо - ❌
ChatGPT 4o - ❌ (дала ответ - "серпохвост")
ChatGPT o1-preview - ✅ (5 секунд)
15. Слово ОНИ в вопросе – замена. Действие одного романа происходит в восемнадцатом веке. Для жителей одной глухой провинции власти заводят жалобную книгу. Жалобщики заполняют книгу множеством ИХ. Напишите общепринятое сокращение из трёх букв для НИХ в научной литературе.
Скрытый текст
Ответ: рис
Зачет: точный ответ.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ - "QED", он же ЧТД)
ChatGPT o1-preview - ❌ (дала ответ - "мат", 41 секунда)
16. Клара Пи́терс не была членом гильдии, поэтому писала своё имя в виде гравировки на столовых приборах. Назовите словом французского происхождения то, на чём эти столовые приборы можно увидеть.
Скрытый текст
Ответ: натюрморты
Зачет: точный ответ.
Каво и Шо - ✅
ChatGPT 4o - ✅
ChatGPT o1-preview - ✅ (6 секунд)
17. В вопросе ИКСОМ мы заменили два слова, начинающиеся на соседние буквы алфавита. При создании ИКСОВ фермерам рекомендуют использовать сорта, высота ствола которых достигает двух метров. Александру Пожаре́нко, создателю одного ИКСа, друзья дали кличку в честь государственного деятеля. Какого?
Скрытый текст
Ответ: Никиты Сергеевича Хрущёва.
Зачет: по фамилии.
Каво и Шо - ❌
ChatGPT 4o - ❌ (дала ответ - "Юлий Цезарь")
ChatGPT o1-preview - ✅ (22 секунды)
18. Герою американского произведения лучше думается на свежем воздухе. Герой говорит, что требуется четыре-пять ИХ для решения сложной задачи. Какая ОНА была в названии экранизированного романа?
Скрытый текст
Ответ: зелёная
Зачет: зелёная миля.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ - "Долгая прогулка")
ChatGPT o1-preview - ❌ (полностью верные рассуждения, но ответ не в заданном формате, 66 секунд)
19. Альберто Ва́скес-Фигеро́а пишет, что политика и совесть, как большой чемодан – всегда смотрят в разные стороны. Название какой телепередачи мы заменили в вопросе?
Скрытый текст
Ответ: «Орёл и решка».
Зачет: точный ответ.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ - "Что? Где? Когда?")
ChatGPT o1-preview - ✅ (9 секунд)
20. Участники природоохранного проекта «ОН снежного барса» фотографируют барсов, а также собирают образцы шерсти, например, с лап или хвоста. Назовите ЕГО словом иностранного происхождения.
Скрытый текст
Ответ: паспорт
Зачет: документ
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ - "мониторинг")
ChatGPT o1-preview - ✅ (12 секунд)
21. Некий Си́бтроп был противником строительства ЕГО и во время дебатов даже взмолился о граде. От НЕГО получил название английский футбольный клуб. Назовите ЕГО двумя словами.
Скрытый текст
Ответ: Хрустальный дворец.
Зачет: Кристал пэлес; Crystal Palace.
Каво и Шо - ❌
ChatGPT 4o - ❌ (дала ответ - "Астон Вилла")
ChatGPT o1-preview - ✅ (2 секунды)
22. В одном романе описывается научный проект по изучению молний под кодовым названием «3141». Какое слово мы пропустили в вопросе?
Скрытый текст
Ответ: шаровых
Зачет: точный ответ.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ - "пи")
ChatGPT o1-preview - ❌ (дала ответ - "пи", 50 секунд)
23. Герой одного романа замышляет недоброе и узнав, что гимн звучит две с половиной минуты, соответственно обрезает… Что?
Скрытый текст
Ответ: бикфордов шнур.
Зачет: запальный шнур; запал; фитиль (засчитывали на апелляции).
Каво и Шо - ✅
ChatGPT 4o - ✅
ChatGPT o1-preview - ❌ (дала ответ - "ствол ружья", 18 секунд)
24. В одном романе исследователи из будущего предполагают, что ИХ некогда считали вместилищем ума. Надобность в НИХ отпала из-за изменения рациона питания. Назовите ИХ.
Скрытый текст
Ответ: зубы мудрости.
Зачет: третьи моляры.
Каво и Шо - ❌
ChatGPT 4o - ❌ (неполный ответ)
ChatGPT o1-preview - ✅ (8 секунд)
25. В пятнадцатом веке Бартоломе́о Коллео́ни считался лучшим военачальником. В конце своей карьеры Коллеони был назначен главой ЕГО и планировал начать действия в Албании. Что такое ОН?
Скрытый текст
Ответ: крестовый поход.
Зачет: точный ответ.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ - "Венецианский флот")
ChatGPT o1-preview - ✅ (10 секунд)
26. Гонконг – крупный город с очень плотной застройкой. Один житель Гонконга вспоминал, что когда в детстве ДЕЛАЛ ЭТО, то хотел попасть в самолёт. ДЕЛАТЬ ЭТО любит главный герой романа «Бегущий за ветром». Ответьте тремя словами, что такое ДЕЛАТЬ ЭТО.
Скрытый текст
Ответ: запускать воздушного змея.
Зачет: пускать воздушного змея.
Каво и Шо - ❌ (не помню, почему)
ChatGPT 4o - ✅
ChatGPT o1-preview - ✅ (6 секунд)
27. При правителе Топильци́не дела в центральноамериканском государстве тольте́ков шли очень хорошо. Символично, что Топильцин, как считается, первым сварил ЕГО. Назовите ЕГО.
Скрытый текст
Ответ: шоколад
Зачет: какао
Каво и Шо - ✅
ChatGPT 4o - ✅
ChatGPT o1-preview - ✅ (9 секунд)
28. Планета Мапу́за из мира «Звёздных войн» славится добычей полезных ископаемых. Существо, которое первым встречает Оби-ван Кеноби на этой планете, похоже на НЕГО. «ОН» – название одного шпионского фильма. Назовите ЕГО.
Скрытый текст
Ответ: крот
Зачет: точный ответ.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ - "Человек-невидимка")
ChatGPT o1-preview - ✅ (10 секунд)
29. Персонаж одного романа видит живописное ЭТО, на котором один смотрит в противоположную сторону. Назовите ЭТО двумя словами, начинающимися одинаково.
Скрытый текст
Ответ: поле подсолнухов.
Зачет: подсолнечное поле.
Каво и Шо - ❌
ChatGPT 4o - ❌ (дала ответ - "двойной портрет")
ChatGPT o1-preview - ❌ (дала ответ - "Двуликий Янус", 14 секунд)
30. Доктор из одного сериала ставит диагноз очень молчаливому пациенту и говорит, что чувствует себя ИМ. На одной из карикатур в очереди к НЕМУ сидит обманутый муж. Кто такой ОН?
Скрытый текст
Ответ: ветеринар
Зачет: ветеринарный врач.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ - "зубной врач")
ChatGPT o1-preview - ✅ (12 секунд)
31. Герой одного романа живет на юге и утверждает, что почту из дальних стран ему иногда приносит в своём мешке почтальон. Какое слово в вопросе мы изменили почти целиком?
Скрытый текст
Ответ: пеликан
Зачет: точный ответ.
Каво и Шо - ✅
ChatGPT 4o - ❌ (дала ответ - "ветер")
ChatGPT o1-preview - ❌ (дала ответ - "альбатрос", 88 секунд)
32. Персонаж одного романа считает, что когда-то конкистадоры принесли ЕГО в девственные джунгли индейцам. На картине Шагала на библейский сюжет ОНО создаёт визуальную рифму с грудью героини. Назовите ЕГО.
Скрытый текст
Ответ: яблоко
Зачет: яблоко с древа познания добра и зла; яблоко познания.
Каво и Шо - ❌
ChatGPT 4o - ❌ (дала ответ - "колесо")
ChatGPT o1-preview - ❌ (дала ответ - "скрипку", 48 секунд)
33. Забавно, что в одном фэнтези грабитель требует у другого персонажа кошелек или жизнь. Грабитель получает по старинной традиции всего две монетки. С каким сельскохозяйственным инструментом часто изображают этого другого персонажа?
Скрытый текст
Ответ: с косой
Зачет: точный ответ.
Каво и Шо - ✅
ChatGPT 4o - ✅
ChatGPT o1-preview - ✅ (5 секунд)
34. В постапокалиптическом сериале люди нечто утратили и цивилизация деградировала до уровня средневековья. В войсках используется множество собак, а у одного предмета экипировки за ненадобностью отсутствует ОНО. Назовите ЕГО одним словом.
Скрытый текст
Ответ: забрало
Зачет: точный ответ.
Каво и Шо - ✅
ChatGPT 4o - ✅
ChatGPT o1-preview - ✅ (12 секунд)
35. Джоакки́но Росси́ни учитывал пожелания публики в разных городах, поэтому существует заканчивающаяся хэппи-эндом неаполитанская версия оперы, в которой фигурируют любовная записка и нож. Другая версия, поставленная в Венеции, гораздо ближе к оригиналу. Назовите это оригинальное произведение.
Скрытый текст
Ответ: Отелло
Зачет: Венецианский мавр.
Каво и Шо - ❌ (стыдно)
ChatGPT 4o - ✅
ChatGPT o1-preview - ✅ (11 секунд)
36. В одном сериале убивают персонажа, которого называют «птичья личность». Когда этот персонаж появляется в следующем сезоне, то просит называть себя… Каким именем?
Скрытый текст
Ответ: Феникс
Зачет: Феникс-личность.
Каво и Шо - ✅
ChatGPT 4o - ✅
ChatGPT o1-preview - ✅ (4 секунды)
Результаты
ChatGPT o1-preview - 25 баллов
Каво и Шо (a.k.a Кожаные мешки) - 23 балла
ChatGPT 4o - 11 баллов
Какие выводы тут можно сделать? Страшно, друзья. Вот только не знаю пока, страшно интересно, или просто страшно. Искусственный интеллект скачет вперед семимильными шагами. Модель 4o, которая еще буквально недавно была чуть ли не State of The Art, проиграла новой модели более чем в два раза. Работяги-студенты, которые тренировались перед турнирами по ЧГК, полагая, что только человек способен отвечать на такие заковыристые вопросы, уже остались позади машин. В вопросах на эрудицию у нас, к сожалению, не было шансов даже против 4o.
Я не буду выводить какую-то мораль, тем более, что у меня нет какой-то четко сформулированной позиции насчет того, как нам жить в этом дивном новом мире. Что будет с рабочими местами, научными работами, экзаменами, олимпиадами, интеллектуальными играми, и в целом - со всеми нами? Поживем - увидим. И, надеюсь, переживем.
UPDATE
В комментариях я увидел оправданный скептицизм по поводу того, действительно ли модель рассуждает, или она просто "вспоминает" вопросы из базы, на которых ее, возможно, обучали. Признаю, что я сам создал повод для сомнений, не прикрепив примеры рассуждений модели над вопросами.
Несколько примеров я уже оставил в комментариях. Продублирую их в самой статье и оставлю еще несколько интересных примеров, которые показывают, что модель действительно способна проводить рассуждения, похожие на человеческие.
Вопрос 4
Недавно Джон Че́ппел обернул множество стоящих на земле однотипных предметов черными лентами, постучал по каждому и попросил ИХ не улетать, пообещав, что новый господин будет добр. Кто ОНИ?
Размышляю над деталями
Я разбираюсь в вопросе, что означает "не улетать", и кто "они". Это заставляет меня думать о предмете, рамках или даже сущности, требующей удержания.
Ищу подсказки
Я разбираюсь в действиях с хәбәрками и лентами, но имя Джон Чеппел кажется странным.
Упаковка и ожидаемое
Представляю, как кто-то обматывает идентичные объекты черными ленточками, стучит по ним и просит их не улетать, обещая, что новый владелец будет добрым.
Ищу ответ
Стратегически анализирую фразы и их возможные значения. Демонстрирую творческий подход, разбираю ключевые элементы. развертывание идей помогает понять абстрактные понятия.
Премещая внимание
Я размышляю о знаменитом событии с "Джоном Чеппелом" и черными лентами, а также возможных анаграммах или переводе имени. Это заставляет меня думать о возможных символах и значениях.
Пробуем другие подходы
Я начинаю размышлять о том, что объекты могут быть лошадьми, но это кажется маловероятным. Возможно, Джон Чаппелл - пчеловод, обматывающий ульи черными лентами и сообщающий пчелам об уходе старого хозяина и приходе нового.
Описанная ситуация относится к старинной традиции "сообщения пчёлам" о смерти хозяина. После смерти королевы Елизаветы II королевский пчеловод Джон Чеппел обернул ульи чёрными лентами, постучал по каждому и сообщил пчёлам о смерти королевы, попросив их не улетать и пообещав, что новый хозяин — король Чарльз III — будет добр.
Ответ: пчёлы.
Вопрос 17
В вопросе ИКСОМ мы заменили два слова, начинающиеся на соседние буквы алфавита. При создании ИКСОВ фермерам рекомендуют использовать сорта, высота ствола которых достигает двух метров. Александру Пожаре́нко, создателю одного ИКСа, друзья дали кличку в честь государственного деятеля. Какого?
Ищу закономерности
Проверяю вопрос и замечаю, что заменены два слова, начинающиеся на соседние буквы алфавита. Считаю, что это стоит учитывать при формулировке ответа.
Исследую причину
Александр Позхаренко, создатель одной из КС, получил прозвище в честь политического деятеля, что наводит на мысль о влиянии пропаганды.
Понимание задачи
Сейчас я выясняю имя государственного деятеля, чье имя связано с никнеймом Александра Пожаренко, создателя IKS. Окей, давайте посмотрим на аббревиатуру IKS.
Ищу связанные элементы
Я думаю о Александре Позхаренко, который создал что-то, и его друзья дали ему прозвище связанное с политиком. Возможно, стоит учитывать политиков, связанных с аграрией или с именами, похожими на объект.
Понимание символики
Я думаю о том, что вероятно IKS символизируют "кукурузный лабиринт", который создают фермеры, используя кукурузу высотой до двух метров.
Ищем связанность
Пытаюсь понять, как "ИКС" мог заменить "Кукурузный Лабиринт", начинаясь на "К" и "Л".
Ищу подходящие ассоциации
Думаю о различных героев и персонажей, таких как Мазепа, Ленин, Тезей, чтобы понять, какой из них могло заинтересовать Александра Позаренко.
ПРИБЛИЖЕНИЕ: Таиссий был мифическим царем Афин. Возможно, он связан с наземной навигацией или именем "Луи". ट्र किया, я сравниваю подходящие буквы.
Ищу закономерности
Я разбираюсь в русском алфавите и сталкиваю "К" с "Л". Заменяю "Кукурузный лабиринт" на "IKS". Выясняю, какой диктатор стал вдохновением для любителей кукурузных лабиринтов.
Ищу Истоки
Подсчитываю популярные клички, как "Фидель", ассоциирующуюся с кукурузой, но разбираю нужно ли изучать их происхождение.
Ищем прозвище
Я рассматриваю прозвища, связанные с французскими политиками и их звучанием, но не нахожу подходящего.
Речь идёт о кукурузных лабиринтах. В вопросе слово «ИКС» заменяет два слова: «кукурузный лабиринт», которые начинаются на соседние буквы русского алфавита «К» и «Л».
При создании кукурузных лабиринтов фермерам рекомендуют использовать сорта кукурузы с высотой стебля до двух метров, чтобы стены лабиринта были высокими и плотными.
Александр Пожаренко, создатель одного из таких кукурузных лабиринтов, получил от друзей прозвище «Хрущёв»в честь Никиты Хрущёва. Хрущёв активно продвигал выращивание кукурузы в СССР, за что его иногда называли «кукурузник».
Ответ: Никита Хрущёв.
Вопрос 19
Альберто Ва́скес-Фигеро́а пишет, что политика и совесть, как большой чемодан – всегда смотрят в разные стороны. Название какой телепередачи мы заменили в вопросе?
Ищу правильный ответ
Анализирую цитату Альберто Васкес-Фиероа, где "большой чемодан" заменяет название ТВ-шоу. Интересно, как это связано с политикой и совестью.
Рассматривая детали
Ищу название ТВ-шоу, которое могло бы заменить фразу "большой чемодан", и вспоминаю варианты, схожие по смыслу или звучанию.
Ищем связи
Пытаюсь понять смысл фразы, размышляю о телешоу или объекте, чтобы заменить "большой чемодан".
Ищу соответствие
Размышляю над фразой "большой чемодан" и замечаю, что это может быть замена для названия ТВ-шоу. Однако, ни одно из предложенных названий не подходит идеально.
Ищу аналогии
Я думаю, что "большой чемодан" указывает на "Орёл и решка", потому что путешествия дешевые и роскошные решаются монеткой.
Название телепередачи, которую мы заменили словами «большой чемодан», — это «Орёл и решка».
Пояснение:
В цитате Альберто Васкеса-Фигероа политика и совесть сравниваются с тем, что всегда смотрит в разные стороны. «Орёл и решка» — это две стороны монеты, которые действительно всегда обращены в противоположные направления. Кроме того, «Орёл и решка» — это популярная телепередача о путешествиях, название которой мы заменили в вопросе.
Ответ: «Орёл и решка».
Вопрос 30
Доктор из одного сериала ставит диагноз очень молчаливому пациенту и говорит, что чувствует себя ИМ. На одной из карикатур в очереди к НЕМУ сидит обманутый муж. Кто такой ОН?
Пытаюсь понять вопрос
Рассматриваю серию о докторе, диагностирующем молчаливого пациента, и замечаю подозрительного мужа в очереди. Интересно, кто он?
Размышляю над пациентом
Я думаю о докторе Хаусе, который известен своими необычными пациентами. Это заставляет меня задуматься о "очень молчаливом пациенте".
Ищу связи
Доктор может ассоциировать себя с пловцом, секретарём, датчицей, сосиской или рукой в перчатке. Возможно, у него нет пациентов или он лечит бездомных животных, как ветеринар.
Размышляю над ролями
Похоже, что муж, который переживает измену, может прийти к врачу, психоаналитику или даже визионеру, так как символически сравнивается с оленем.
Обдумываю варианты
Я рассматриваю разные профессии, к которым может относиться паддинг, включая психиатра, стоматолога и художника.
Выяснение контекста
Доктор получает очень молчаливого пациента, что заставляет его думать о ветеринаре, так как пациент не разговаривает, как животное. На карикатуре обманутый муж сидит в очереди к ветеринару, что также наводит на эти мысли.
ОН — это ветеринар.
Врач из сериала ставит диагноз очень молчаливому пациенту и говорит, что чувствует себя ветеринаром, потому что пациент не может говорить, как животные на приёме у ветеринара. На карикатуре обманутый муж сидит в очереди к ветеринару, намекая на то, что у него «рога», как у животного, то есть он стал жертвой измены.
Ответ: ветеринар.
Вопрос 34
В постапокалиптическом сериале люди нечто утратили и цивилизация деградировала до уровня средневековья. В войсках используется множество собак, а у одного предмета экипировки за ненадобностью отсутствует ОНО. Назовите ЕГО одним словом.
Остался без дела
В постапокалиптическом сериале люди утратили что-то, что больше не нужно, и армия использует многих собак. Интересно, что это могло быть?
Распознавание отпечатков
Я вижу интересную закономерность: отпечатки пальцев могут оставаться на панели поиска зависимостей. Этот фактор иногда упускают из виду при диагностике ssh-zap.
Анализ вопроса
В постапокалиптическом мире люди потеряли что-то, армии используют много собак, и одно средство стало ненужным. Похоже, что люди потеряли зрение, и средство «визор» оказалось излишним.
Ищем возможные причины
Похоже, что потеря слуха, зрения или электричества может быть связана с использованием собак в армии. Это наводит на мысль о бронежилете.
Восстановление и адаптация
В этом постапокалиптическом сериале народ ослеп, и общество вернулось к примитивному племени. Люди теперь используют собак в армии, а шлемы без козырьков или глазных щелей, ведь они больше не нужны. Это возвращает меня к использованию природных ресурсов.
Предлагаю ответ
Начинаю понимать, что правильный ответ включает слово "забрало" и короткое объяснение.
В постапокалиптическом сериале люди потеряли зрение, и цивилизация деградировала до уровня средневековья. В войсках используется множество собак, а у шлемов отсутствует забрало, поскольку оно больше не нужно.
Ответ: забрало.
Комментарии (278)
ABy
14.09.2024 07:00+19Недавно Джон Че́ппел обернул множество стоящих на земле однотипных предметов черными лентами, постучал по каждому и попросил ИХ не улетать, пообещав, что новый господин будет добр. Кто ОНИ?
Как на ЭТО можно правильно ответить?
akakoychenko
14.09.2024 07:00+9Неприятный вопрос. Формально правильный за счет того, что упоминается конкретный человек, и, соответственно, любой логичный неправильный ответ отсекается фактом. Но, вцелом, про-игроки такое берут. По пересечению смыслов между множеством "однотипные предметы, стоящие на земле, по которым можно постучать", и множеством "что-то, что летает и имеет хозяина" можно выйти на пару (улеи, пчелы), а там уже и докрутить до ответа
ABy
14.09.2024 07:00+13Изначально не уловил тот момент, что в вопросе обматывают лентой один предмет (улей), просят не улетать другой (пчел). Из-за этого в воображении родилась сюрреалистическая картина, в которой лентой оборачивают скульптуры пчел.
Arastas
14.09.2024 07:00+14Только после этого коммента я понял, что стучали не по пчелам. При первом прочтении пожал плечами и пробормотал себе под нос что-то о современном искусстве.
VPryadchenko
14.09.2024 07:00+1Когда в вопросах местоимения написаны капсом, то это переменные, вместо которых надо подставлять ответ, а не ссылки на сущности в контексте.
tyomitch
14.09.2024 07:00+2На настоящей игре вопросы зачитываются вслух, так что отличить такую "переменную" от обычного местоимения можно только по контексту.
VPryadchenko
14.09.2024 07:00+4Не знаю, смотрел чгк очень давно. У меня этот вопрос вообще никаких трудностей не вызвал, даже показался одним из самых простых, думаю, благодаря тому, что читая его, я интонационно выделил "ИХ" и "ОНИ" (и, кажется, так ведущий как раз и делает, зачитывая вопрос)
Wesha
14.09.2024 07:00только после этого коммента понял, что стучали не по пчёлам
Аналогично, не понял, как можно обвязать пчелу лентой, а потом ещё стучать по ней.
K0styan
14.09.2024 07:00А, вот такие тонкости опытные игроки уже привыкли расшифровывать и картину соотношений сущностей из вопроса строить. Тоже тренировка нейросети, только белковой)
ABy
14.09.2024 07:00Ещё, после того как узнал ответ, думал что "господин" это пчелиная матка, а пчеловод пометил лентой ульи, которые остались без матки по какой-то причине.
K0styan
14.09.2024 07:00+2Берётся в целом. Особенно с учётом контекста ("Недавно...") - там довольно жирные отсылки на траурные события, а траур по кому попало в вопрос просто не попадёт.
ifap
14.09.2024 07:00+3Это вопрос чисто на энциклопедические знания, как и большиство приведенных вопросов. Логикой правильный ответ найти невозможно - либо слышал про этот обычай, либо нет.
qark
14.09.2024 07:00+1Конечно, можно. Чуть выше приведён пример рассуждения. Что касается энциклопедических знаний - да, нужно знать из литературы чуть больше, чем "Колобок", а из географии - чем "Ландан из зе кэпитал оф Грейт Бритн".
ifap
14.09.2024 07:00+7Чуть выше приведен пример "рассуждения", основанного на энциклопедическом знании - имени королевского плеловода. Так что либо надо знать (именно знать, а не догадаться о ней) старую британскую традицию, либо читать The Sun вместо "Колобка". Вот первый вопрос - чисто на сообразительность. Второй - уже не совсем, сбивает число 3: про Стабии мало кто слышал, я, например, нет (или не помнил), хотя и догадался. И вопрос вообще не сильно корректный: в некоей исторической литературе так могли описать и жителей Хиросимы, и какого-нибудь Бандунга, а это "неправильный" ответ, потому что надо знать точную цитату из определенной неназванной литературы.
qark
14.09.2024 07:00По пересечению смыслов между множеством "однотипные предметы, стоящие на земле, по которым можно постучать", и множеством "что-то, что летает и имеет хозяина" можно выйти на пару (улеи, пчелы), а там уже и докрутить до ответа
Что тут основано на имени королевского пчеловода?
Mingun
14.09.2024 07:00То, что он, собственно, пчеловод? А не лысый хрен с горы. Когда дают вот такие конкретные имена, то всегда подразумевается энциклопедичность знания, а иначе смысла указания имени просто бы не было.
lozhnikov Автор
14.09.2024 07:00+3Иногда имена оставляют в вопросе просто как часть истории.
Хотя конкретно в данном случае можно увидеть подсказку в том, что "Чеппел" созвучно с "пчелами", но это очень на тоненького, не уверен, что автор это подразумевал.
На этот вопрос ответила 81 человеческая команда. Не думаю, что все они знали имя королевского пчеловода (не уверен, что его знал хоть кто-то).
Wesha
14.09.2024 07:00+2Имена оставляют в вопросе как маркеры для отсечения дуалей. Например, если сказать, условно говоря, что "в XVII веке ЭТО изобрели, глядя на расплавленный шарик стекла", какая-нибудь команда может сказать что-то вроде "мыльные пузыри!" и предъявить источники. А вот если в вопросе будет "в XVII веке ЭТО изобрёл Анотонио, глядя...", то тогда уже ответ, отличный от "микроскоп", уже не прокатит.
PavelLin
14.09.2024 07:00"Чеппел" полезен тем, что подсказывает нам, что дело происходит в англоязычной стране.
tyomitch
14.09.2024 07:00Когда дают вот такие конкретные имена, то всегда подразумевается энциклопедичность знания, а иначе смысла указания имени просто бы не было.
Вовсе нет. На самом деле это (на чгкшном жаргоне "метка") добавляется, чтобы избежать апелляций навроде "мой сосед Вася Пупкин обвязывал берёзы во дворе и просил ворон не улетать, вот его тикток в подтверждение, просим зачесть наш ответ "вороны"
gsaw
14.09.2024 07:00+1Если убрать из вопроса имя пчеловода, оно все равно отвечает "пчелы". Модель знает про обычай у пасечников. Когда один умирает, а новый просит не улетать пчел. Если написать "кто то" и "обернул чем то", то в ответ выдает
Собрав эти подсказки вместе, наиболее подходящий ответ — кленовые деревья во время сбора сиропа. «Кто-то» — это сборщик сока, который оборачивает деревья оборудованием (таким как трубки или краны), стучит по ним, чтобы извлечь сок, и метафорически просит сок не «убегать» слишком быстро, обещая, что новый владелец (потребитель, который будет использовать сироп) будет его ценить.
Ответ: Это кленовые деревья, из которых собирают сок для производства кленового сиропа.
saboteur_kiev
14.09.2024 07:00+5Пробуем другие подходы
Я начинаю размышлять о том, что объекты могут быть лошадьми, но это кажется маловероятным. Возможно, Джон Чаппелл - пчеловод, обматывающий ульи черными лентами и сообщающий пчелам об уходе старого хозяина и приходе нового.
Очень интересен резкий переход от лошадей к пчелам. Но он поясняется в следующем абзаце, поскольку чатГПТ случайно вспомнил что "странное имя Джон Чаппел" - это на самом деле реальное имя реального пчеловода.
По сути абсолютно все вопросы - не логические, а тупо энциклопедические, и могут быть решены наличием базы знаний. Если точно не знать конкретные события, вывести ответ невозможно.
Модели очень успешно преобразуют человеческий не всегда математично сформулированный вопрос в данные, по которым модель находит ответ и формирует ответ также комфортный для чтения.
Но никаких "размышлений там нет". Фразы-детализации про размышления это просто для фана.Например моя транскрипция:
Размышляю над деталями
Я разбираюсь в вопросе, что означает "не улетать", и кто "они". Это заставляет меня думать о предмете, рамках или даже сущности, требующей удержания.
Вопрос распарсен, найдены ключевой вопрос - "кто они" (некий объект, множественное число), найден важный аттрибут "не улетать" относительно ключевого объекта, способность к полету.
Ищу подсказки
Я разбираюсь в действиях с хәбәрками и лентами, но имя Джон Чеппел кажется странным.
Парсим изначальный вопрос на предмет важных слов и сочетания для дальнейшего поиска. Найден объект ленты с аттрибутом черный, будем анализировать черные ленты. Найдено имя Джон Чеппел в базе данных, выполнить поиск по этим двум сочетаниям
Упаковка и ожидаемое
Представляю, как кто-то обматывает идентичные объекты черными ленточками, стучит по ним и просит их не улетать, обещая, что новый владелец будет добрым.
Пытаюсь составить несколько фраз про черные ленты и обматывание идентичных объектов, стучать по ним и просить не улетать, обещать про доброго владельца и другие подходящие фразы изначального вопроса
Ищу ответ
Стратегически анализирую фразы и их возможные значения. Демонстрирую творческий подход, разбираю ключевые элементы. развертывание идей помогает понять абстрактные понятия.
По фразам из предыдущего этапа выполняю поиск по базам данных, в случае совпадений, сравниваю полученную информацию относительно других ключевых моментов изначального вопроса.
Премещая внимание
Я размышляю о знаменитом событии с "Джоном Чеппелом" и черными лентами, а также возможных анаграммах или переводе имени. Это заставляет меня думать о возможных символах и значениях.
Также для двух ключевых сочетаний из первого этапа (Джон Чеппел и Черные Ленты) по запрограммированным вариантам провожу дополнительный поиск совпадений на предмет анаграммы, синонимов, переводов, транслитераций, омонимов и др.
Пробуем другие подходы
Я начинаю размышлять о том, что объекты могут быть лошадьми, но это кажется маловероятным. Возможно, Джон Чаппелл - пчеловод, обматывающий ульи черными лентами и сообщающий пчелам об уходе старого хозяина и приходе нового.
По черным лентам найдены "Оплеточные ленты для лошадей 500 шт." на Амазоне, проверяю. Лошади не умеют летать.
По Джон Чаппел найдены более высокий процент совпадения - пчеловод - пчелы, пчелы умеют летать.
После дополнительного поиска, найдено совпадение о конкретном событии в исторической справке где есть и Джон Чеппел и черные ленты и пчелы, которые умеют летать и про нового доброго хозяина.
Описанная ситуация относится к старинной традиции "сообщения пчёлам" о смерти хозяина. После смерти королевы Елизаветы II королевский пчеловод Джон Чеппел обернул ульи чёрными лентами, постучал по каждому и сообщил пчёлам о смерти королевы, попросив их не улетать и пообещав, что новый хозяин — король Чарльз III — будет добр.
Ответ: пчёлы.
Выводим историческую справку, анализируем какой объект максимально соответствует в изначальном вопросе "кто они" для летающего объекта - это пчелы.
В итоге, да, отличная работа очень мощного аналитического поискового алгоритма, точнее даже совокупности. Но никаких размышлений, увы.
lozhnikov Автор
14.09.2024 07:00Да, согласен, что в вопросе про пчел переход в рассуждениях выглядит странно и, возможно, модель действительно нашла известный факт в памяти.
Рассуждения в 19, 30, 34 вопросах мне кажутся более честными, но допускаю, что она может просто притворяться)
imageman
14.09.2024 07:00+2тут не нужно забывать, что мы не видим реальную нить поиска. Вполне возможно, что первично найден [в интернете] факт "королевский пчеловод Джон Чеппел обернул ульи чёрными лентами", а уже потом под этот факт подгоняются "рассуждения".
saboteur_kiev
14.09.2024 07:00+1Не, ну "рассуждения" подгоняться не могут.
Задача модели же не просто выполнить поиск. Иначе будет поиск чего имени? Вводный вопрос достаточно длинный, и модель должна вычислить ключевой вопрос, выделить важные ключевые аттрибуты именно к вопросу. А то в вопросе можно написать много не совсем относящейся к сути воды, и каждое слово из этой воды искать?
То есть модель выполняет важную работу - из заданного человеком вопроса вычислить важные даже не слова, а определенные сочетания, которые могут быть образными понятиями, устойчивыми выражениями, анаграммами и так далее.
Затем уже выполнять различный поиск, причем тут поиск расширяется - аттрибуты могут быть разделены на основные и второстепенные, для основных выполняется больше операций (выполняется поиск не только по слову или сочетанию, но и производным от них). По второстепенным поиск выполняется более простой, результаты всех поисков сравниваются на наличие совпадений, так повышается приоритет результатов поиска, по которым найдено больше совпадений.
Модель умеет сопоставлять зависимости между словами, чтобы находить эти "значимые сочетания слов", в базе модели какая-нить "заливная рыба" может лежать уже с куче тегов, что это "блюдо", что это кошерно и другие ассоциации, которые были заложены в модель, чтобы уметь так сказать "думать творчески", поэтому поиск выполняется с учетом использованиях всех этих аттрибутов. Это занимает много времени, поэтому важна приоретизация основных и второстепенных сочетаний и слов в вопросе, так можно выполнять больше действий для основных и меньше для второстепенных (которых накапливается уйма).
FillCT
14.09.2024 07:00+1Тоже думаю, что "размышлений" там нет. Здесь задачи во многом завязаны на эрудицию. Я делал простой тест - взял известную задачу про 50 мотоциклов с баком 100 л. Нужно было определить максимальную дистанцию (расход топлива 1л на 1 км). На этот вопрос o1, конечно дала сразу верный ответ. Но это и понятно, она давно в сети.
Суть решения, что на каждый км пройденного пути, один из мотоциклов переливает топливо в остальные, потом следующий (если топливо в первом донере закончилось) и так пока баки остальных не будут заполнены. Затем цикл повторяется. Это решение подсказывает и сама нейросеть. Простая программа подтверждает ее ответ.
Но, стоит изменить начальные условия, с 50 мотоциклов изменить на 25, а максимальный объем бака поставить 75 л, как нейросеть теряется. Я получил три ответа, первый вообще был ответ на задачу с 50 мотоциклами (т.е. она тупо взяла ответ из базы под видом размышлений). Последующие хоть как-то старались соотнести с контекстом задания, но все равно не было правильного ответа.
saboteur_kiev
14.09.2024 07:00+1Тут было бы полезно, если модель умеет определять математические задачи, и используя API того же wolfram alfa просто посчитать, правильно восприняв текст задачи заданный человеческой речью, а не прямым вводом формулы. Это крутая фича, но всегда нужно быть немного шарящим в задаче, чтобы определить а правильно ли нейросеть "поняла" задачу и составила формулу
akakoychenko
14.09.2024 07:00А если б модель умела осознавать необходимость уточнить факт и использовала для этого API гугла и Википедии...
Wesha
14.09.2024 07:00стоит изменить начальные условия, с 50 мотоциклов изменить на 25, а максимальный объем бака поставить 75 л, как нейросеть теряется
Теперь Вы понимаете, почему в своей задаче я взял выдуманные десантные машины по 25 тонн?
Shurik911
14.09.2024 07:00Попробуйте первое условие задачи(где она якобы знает ответ) прогнать раз 5, сеть может начать давать ответ который вас не устроит. С большей вероятностью она не всегда будет давать одинаковые ответы. Проверял на задачках по логике для 5 класса(подготовка к МГУ) так вот она далеко не всегда дает одинаковый ответ и размышляет(ка бы это странно не звучало) часто по разному.
rombell
14.09.2024 07:00+1Попробуйте ребёнку лет 7 задать одну и ту же задачу 5 раз подряд. Потом - пареньку лет 15. Потом - дядьке лет 40. Уверен, результаты Вас удивят.
Вы не с калькулятором общаетесь.
Wesha
14.09.2024 07:00+2Попробуйте ребёнку лет 7 задать одну и ту же задачу 5 раз подряд.
Предвижу реакцию
Вы не с калькулятором общаетесь
(В недоумениии воззрился на клавиатуру:) А с кем???
CorwinH
14.09.2024 07:00+1Как на ЭТО можно правильно ответить?
Легкий вопрос для меня. Я не знаю других "летающих питомцев", которые живут во "множестве однотипных предметов". Зачем он обвязал ульи чёрными лентами и стучал, я не понял (теперь знаю).
Mingun
14.09.2024 07:00Я не знаю других "летающих питомцев", которые живут во "множестве однотипных предметов".
Чем в вашей картине мира, например, (почтовые) голуби не удовлетворяют этому условию?
positroid
14.09.2024 07:00В моем почтовые голуби живут в голубятне, и даже если в клетках я не представляю себе реальным их обмотать
Mingun
14.09.2024 07:00В чём сложность обмотать голубятню лентой? Голубятня — это такой большой ящик, размером примерно 2 на 2 метра ну и высотой около 2–2.5.
positroid
14.09.2024 07:00обернул множество стоящих на земле однотипных предметов черными лентами
В том, что я ни разу не видел множества однотипные голубятен в одном месте. Да и известные мне голубятни сильно отличаются от вашего описания
Mingun
14.09.2024 07:00+2Ну, известные мне как раз так и выглядели. И стояли по несколько штук в ряд/по сетке. 4–6 таких ящиков набиралось точно. Как гаражи, только голубятни.
PavelLin
14.09.2024 07:00+3Это довольно сложный вопрос, но на опыте можно взять, особенно командой. По имени понятно, что дело происходило в англоязычной стране. "Недавно" намекает, что это связано с каким-то известным событием; по дате турнира и черным лентам - скорее всего, Англия и смерть Елизаветы. Тогда "новый господин" - видимо, речь идет о новом монархе.
Очевидно, что постучал-попросил - это действие без практического смысла, т.к. не людям же он это говорил. То есть речь о каком-то британском обычае или ритуале.
Дальше перебираем, кто может улететь. Явно кто-то важный или полезный. Птицы, духи предков, феи, эльфы, шмели, пчелы, комары... Можно предположить, конечно, что это духи/привидения, которые живут в могилах, и это сторож кладбища стучал по надгробиям. Но если кто-то за столом скажет слово "пчелы", то сразу понятно, что ульи лучше подходят под описание.
DGN
14.09.2024 07:00У меня было два варианта, дроны и пчелы. Но зачем оборачивать тканью дроны было более непонятно, чем ульи (вспомнил, что попугаи вроде засыпают если накрыть клетку, может пчелы тоже так делают и во сне не летают).
NomLi
14.09.2024 07:00+12| я взял вопросы из турнира
Возможно, для честности имело смысл не брать готовые вопросы, а придумать их? Тогда сравнивать было бы легче. Ведь AI негде было бы взять уже возможно готовый ответ и пришлось бы "рассуждать", создавая цепочку логических выводов.
lozhnikov Автор
14.09.2024 07:00+1На самом деле, я не думаю, что модель подглядывала прям в базу вопросов. OpenAI даёт возможность посмотреть, как именно модель рассуждала и приходила к ответу. Почти всегда там действительно что-то похожее на человеческие рассуждения: отсечки по времени и месту, поиски ассоциаций, игры слов.
Кое-где модели легче, чем человеку. Например, если в вопросе использован какой-то факт, про который игроки скорее всего не знают. Например, в 27 вопросе, модель знала, что именно изобрёл Топильцин, поэтому ей не пришлось рассуждать и искать подходящую игру слов.
qbertych
14.09.2024 07:00О, это любопытно, можете привести пример рассуждений модели, например, в вопросе про пчел?
lozhnikov Автор
14.09.2024 07:00+2Скрытый текст
Размышляю над деталями
Я разбираюсь в вопросе, что означает "не улетать", и кто "они". Это заставляет меня думать о предмете, рамках или даже сущности, требующей удержания.
Ищу подсказки
Я разбираюсь в действиях с хәбәрками и лентами, но имя Джон Чеппел кажется странным.
Упаковка и ожидаемое
Представляю, как кто-то обматывает идентичные объекты черными ленточками, стучит по ним и просит их не улетать, обещая, что новый владелец будет добрым.
Ищу ответ
Стратегически анализирую фразы и их возможные значения. Демонстрирую творческий подход, разбираю ключевые элементы. развертывание идей помогает понять абстрактные понятия.
Премещая внимание
Я размышляю о знаменитом событии с "Джоном Чеппелом" и черными лентами, а также возможных анаграммах или переводе имени. Это заставляет меня думать о возможных символах и значениях.
Пробуем другие подходы
Я начинаю размышлять о том, что объекты могут быть лошадьми, но это кажется маловероятным. Возможно, Джон Чаппелл - пчеловод, обматывающий ульи черными лентами и сообщающий пчелам об уходе старого хозяина и приходе нового.
Не знаю, что такое хәбәрки, но в размышлениях модели часто проскальзывают слова из других языков. Иногда встречаются даже иероглифы
acc0unt
14.09.2024 07:00+5Тоже стало интересно. Нашёл сходу только что корень "хәбәр" идёт из арабского, присутствует в целой куче языков с арабским влиянием и означает "сообщение, весть".
В русском языке этот корень отражён в слове "хабар", но с другим смыслом. Прибыль, взятка. Передаваемое ценное имущество? Возможно, ассоциация такая.
Аж интересно, из-за чего машинный разум генерирует такие артефакты.
lozhnikov Автор
14.09.2024 07:00+12Придумать вопрос для ЧГК - задача нетривиальная)
А придумать целую выборку и иметь возможность сравнить результаты с человеческой командой - звучит, как серьёзный эксперимент, за которым я бы с интересом понаблюдал.
adeshere
14.09.2024 07:00Почти все вопросы требуют очень широкой эрудиции. Но, если,
1) она есть и
2) ты можешь очень быстро перебрать варианты (фильмов, персонажей и др.),то логика уже вовсе не обязана быть так уж и хороша. Так как простой перебор дает ответ готовый на 90%.
Поэтому мое имхо: людям трудно перебрать кучу вариантов вслепую, поэтому для них логика очень важна - она резко сужает круг поиска и позволяет подсознанию вытащить из памяти нужный факт (ну или додумать).
А вот для ИИ возможность "брутфорса перебором", наоборот, резко снижает требования к логической части.
Так что да, соревнование есть, но не совсем в одном и том же.
Придумать вопрос для ЧГК - задача нетривиальная) А придумать целую выборку и иметь возможность сравнить результаты с человеческой командой (...)
Согласен. А особенно интересно, как будет отвечать ИИ на вопросы, которые не опираются на литературные/художественные источники. Т.е. перебор "по персонажам" не прокатит - надо перебирать по
понятиям
надеюсь, что меня поймут правильно: я совсем не имел в виду те понятия, которые "по понятиям" ;-).
Например, вот пара вопросов, которые вроде бы в сети
не засвечены
Третью (не то зеленую, не то оранжевую) видели многие, а где первые две, не знает никто. А может, она и не третья совсем?
(О чем это я?)Многие россияне весьма удивятся, когда увидят этот список из тридцати с лишним участников, и кто там в первой четверке. В этом списке есть Минск и Уфа, но не Ярославль. Но еще больше россиян удивит тот критерий, который может собрать в одну группу аж целую треть этого списка (примерно).
(Что это за критерий?)
P.S. Оба вопроса без подковырок, максимум есть небольшая игра слов. Поэтому для кожаных мешков проблем вроде бы быть не должно? (Если вдруг будут, то отпишусь с ответами чуть попозже). Но было бы интересно узнать, как с ними справится ChatGPT (у меня самого нет возможности это проверить).
qbertych
14.09.2024 07:00+8– Я придумал пароль, которого нет в Интернете!
– Как ты это узнал?
– Проверил в Интернете!
– Теперь естьadeshere
14.09.2024 07:00+1;-)
Но 1) в поисковики они попадают не мгновенно, и 2) я же не написал к этим вопросам ответы. Поэтому ChatGPT придется отвечать на свой страх и риск ;-) Я надеюсь, что кто-нибудь не поленится моделям эти вопросы задать до того, как присутствующие
напишут подсказки
Кому очень хочется похвастаться - просто напишите "Я решил сразу" (ну или за 1-2-5 мин и т.д.).
Я бы сам у моделей спросил, но технической возможности нет.
UPD: и второе: хотя мне кажется, что я эти вопросы придумал сам, но человеческое подсознание - это сложная штука. Запросто может оказаться, что я их где-то когда-то давно услышал (в другой редакции), а много позже мое сознание эти наводки "переработало". Так что твердой уверенности, что они не засвечены, у меня нету. Хотя простое гугление действительно не находит...
lozhnikov Автор
14.09.2024 07:00+3Я не смог ответить ни на один вопрос, подумав над каждым примерно 3 минуты)
Chat GPT дал правдоподобную версию на второй вопрос:
Скрытый текст
Критерий, который объединяет примерно треть городов в этом списке, заключается в том, что они находятся в России. Список представляет крупнейшие города Европы по населению, и многие россияне могут удивиться, узнав, что значительная часть этих городов—российские. Первая четвёрка—возможно, Стамбул, Москва, Лондон и Санкт-Петербург—тоже может быть неожиданной из-за включения Стамбула как европейского города и высокого положения Москвы и Санкт-Петербурга.
Я склоняюсь к тому, что на подобный вопрос машине ответить легче: она может быстро перебрать все возможные списки и посмотреть, какой подходит по условию. А вот как человеку отсекать Минск и Уфу от Ярославля, особенно если нет нужных для этого знаний, - не понимаю... Я веду к тому, что если ответ модели всё-таки верный, то это вопрос больше на эрудицию, а не на "понятия", а в эрудиции нам уже не потягаться)
adeshere
14.09.2024 07:00+3Chat GPT дал правдоподобную версию на второй вопрос:
Спасибо! Честно скажу, я не ожидал, что ответ будет настолько логично аргументированным. Хотя я именно такой ответ и задумывал. С одним уточнением, что численность ограничена снизу миллионом (на это намекает общее количество таких городов). Но это уточнение имхо не обязательное (в ответе оно точно не требуется). А еще интересно, что модель совершенно правильно поняла "по мнению россиян..." и использовала в своих рассуждениях. Хотя наверно это все-таки можно в интернете найти.
Я склоняюсь к тому, что на подобный вопрос машине ответить легче: она может быстро перебрать все возможные списки и посмотреть, какой подходит по условию.
Видимо, я отстал от жизни. Мне казалось, что перебирать именно списки (критерии) заметно сложнее, чем перебирать факты. Что ж, еще один плюсик в копилку ИИ, и минусик нам (точнее, мне лично).
Я веду к тому, что если ответ модели всё-таки верный,
Честно скажу: меня пугает, что после чтения ответа у Вас еще остались в этом сомнения. Это значит, что я очень плохо сформулировал свой вопрос. Ну что ж, спасибо, что избавили меня от иллюзий :-((
это это вопрос больше на эрудицию,
Если понимать эрудицию в широком смысле (а не просто как знание фактов) - то да, конечно. У меня почему-то сложилось впечатление, что изначально языковые модели превзошли людей именно в знании фактов. А теперь, похоже, начинают превосходить и в знании концепций?
Dron007
14.09.2024 07:00+2Знает факты и Гугл. Только не очень умеет в ассоциации, полагаясь только на индексируемый текст. У языковых моделей с этим лучше, но тоже ещё пока существенные пробелы. Например, она может уловить что кто-то является отцом другому человеку, но совершенно не будет использовать тот факт, что этот другой будет сыном первому. По крайней мере для ChatGPT 4 такие ситуации были частыми. У неё нет красиво структурированной базы знаний с чёткими взаимоотношениями объектов. Но ассоциации бывают интересные. Мне нравится иногда играть с ЯМ в ассоциации по такому промпту:
"Давай поиграем в игру. Ты даёшь мне два имени существительных, являющиеся предметами или абстрактными понятиями, а я ищу связь между ними через ассоциации, либо цепочку ассоциаций. Затем ты оцениваешь результат. Если понятно, дай мне 2 слова."
Ну и наоборот потом, она описывает ассоциации.
adeshere
14.09.2024 07:00+1Третью (не то зеленую, не то оранжевую) видели многие, а где первые две, не знает никто. А может, она и не третья совсем?
(О чем это я?)
> Chat GPT дал правдоподобную версию на ВТОРОЙ вопрос (...)
Похоже, я с первым вопросом перемудрил... :-(
Хотя, когда я его задавал знакомым при совместных поездках на метро, многие его брали. Но это наверное уже совсем не стиль ЧКГ, а скорее хохма из постсоветских времен. Я тогда периодически обсуждал с коллегамипроблему нейминга переменных
коллеги были в основном из научного института, писали программы лишь изредка и преимущественно на фортране, и в силу своего образования, полученного в глубокой древности, частенько злоупотребляли (на мой вкус) "сестрой таланта", называя переменные I, J, K и т.д.
Так вот, защищая необходимость более продуманного отношения к неймингу, я приводил им
пример из жизни
А именно, объяснял, что одна из причин переполненности московского метро - это игнорирование IT-шников при масштабировании продукта. Ведь любому, кто знает ассемблер, ясно, что если в коде есть push-кинская, но нет pop-кинской, то
переполнение неизбежно
Не исключено, кстати, что в проекте она была, но потом из-за неблагозвучия сократили
Шутка на грани фола, конечно... но хронология вроде сходится. И о толпах в московском метро ранее 1956г (открытие Пушкинской) тоже вроде информации нет ;-)
Но вот насколько уместно тащить такие приколы в диалоги с ИИ - это для меня открытый вопрос. И - да, мне очень хочется верить, что большинство "кожаных" на оба мои вопроса ответили...
LeXaNe
14.09.2024 07:00У меня есть предложения, но не уверен, что верно. Жду ответы, проверить себя ))
adeshere
14.09.2024 07:00Так вроде на первый вопрос уже ответил (правда, не без помощи Chat GPT) @lozhnikov.
А на второй вопрос я только что дал настолько жирную подсказку, насколько смог. Впрочем, учитывая, что сейчас выходной, не факт, что она "зайдет". Но пусть она чуть-чуть повисит все-таки, ладно? А полный ответ - в понедельник, годится?
CorwinH
14.09.2024 07:00+1Не подглядывать!
Скрытый текст
Третьяковская
Wesha
14.09.2024 07:00+6А как немосквичам предлагаете догадываться, что там у вас зелёное и что — оранжевое?
Я вот подумал, что если Вам нужно узнать, сколько на светофоре метро лампочек — возьмите фонарик помощнее и посветите, когда будете мимо проезжать. (Понятно, что зелёную и жёлтую/оранжевую лампы пассажир может видеть, когда метропоезд катит мимо светофора — а вот красную видит только машинист, потому что пока она горит — поезд стоит.)
adeshere
14.09.2024 07:00+1А как немосквичам предлагаете догадываться, что там у вас зелёное и что — оранжевое?
Увы, только
глядя на схему :-((
Смачно рву зеленые и оранжевые волосы из своей
седой бороды
которую как раз на днях ребенок фломастерами раскрасил
Вопрос был придуман еще во времена ТВ-игр, а они проходили в МСК неподалеку от сабжа, что как бы слегка намекало. Если я правильно помню, какие-то отсылки к месту проведения игр в ТВ-вопросах порой проскакивали... Ну и к тому же я сам в МСК регулярно бываю, а "тестировал" вопрос на знакомых обычно в тот самый момент, когда эта схема висела у нас прямо перед глазами. Но в целом согласен, что претензия к вопросу вполне обоснованная. Больше половины россиян в МСК либо не бывали вообще, либо только проездом. А про не-россиян и вспоминать стыдно. Но все же я надеюсь на снисхождение, так как вопрос по идее предполагался для Chat GPT, которая подобную фактологию знать обязана. А вот когда я писал про "кожаных", то напрасно не уточнил, что имею в виду не только лишь всех :-(
Кстати
даже интересно: а какой процент хабровчан настолько редко бывает в МСК, что даже раскраска основных линий метро в базовой памяти не задерживается? Чую, что я совершенно напрасно доверился в этом вопросе своей интуиции, за что она меня только что жестко подставила...
Wesha
14.09.2024 07:00+1Я в московском метро последний раз был 25 лет назад. С тех пор его схема перерисовывалась не раз и не два.
CorwinH
14.09.2024 07:00Я в московском метро последний раз был 25 лет назад.
Тогда Вам бонусный вопрос :)
В названии какой станции метро есть "огого".
Wesha
14.09.2024 07:00Я ж говорю — я не помню, какие там вообще есть. Видимо, что-то навроде "Проспект Вернадского — городок Строителей". За 25 лет там много чего понастроили, немало, небось, попереименовали.
Bandyloo
14.09.2024 07:00+1adeshere
14.09.2024 07:00Верный ответ (точнее, задуманный автором вопроса) был тут озвучен в соседних ветках неоднократно. А что касается выложенного скриншота, то из него мне трудно понять, почему Луна бывает первой, второй и третьей. Это ведь регулярно повторяющееся небесное явление. Я не хочу сказать, что
ответ неправильный
Кто я такой, чтобы претендовать на знание истины? ЧГК тем и хороша, имхо, что автор вопроса не вправе контролировать его дальнейшую жизнь
но мне трудно понять его логику.
Версия с кометой тоже кажется мне натянутой. Зеленоватый оттенок у нее вроде бы был, а оранжевый? Ну и во-вторых, мне сложно найти привязку именно к цифре три. Ведь кометы - это тоже регулярно повторяющиеся события, а вопрос явно намекает на особую роль тройки, которая к тому же явно не совсем цифра.
Если не сложно, попробуйте скормить модели вот эту подсказку? Не адаптируя и не убирая то, что явно не относится к делу (как мы это частенько и делаем в своем человеческом общении)?
Dharma77
14.09.2024 07:00Это относительно просто - можно взять любой свежий пак из базы, например https://gotquestions.online/pack/5993 (выложен 4 дня назад)
и сравнить с результатами на сайте рейтинга https://rating.chgk.info/tournament/11091
Кстати, похоже о1 не гуглит, т.к. гуглением легко берётся вопрос про Плиния например: https://habr.com/ru/articles/843278/#comment_27294854
codecity
14.09.2024 07:00+4Какие выводы тут можно сделать? Страшно, друзья.
А страшно что именно? Что работу заберет? Своих желаний то у него нет - чтобы были свои желания, нужно уметь наслаждаться и страдать (желание - это всегда стремление к наслаждению и избегание страдания) - а оно этого не умеет.
Тут единственное неудобство - на переходном периоде часть людей могут остаться без работы, в то время как система все еще будет функционировать по старым правилам - без БДД. В переходной период попасть всегда страшно. Причем не стоит свято верить что работники ручного труда в безопасности - как раз пока вы переучитесь на электрика - и электриков начнут заменять роботами.
NotSure
14.09.2024 07:00+2Свои желания есть у людей, у которых есть деньги на обучение ИИ.
codecity
14.09.2024 07:00Свои желания есть у людей, у которых есть деньги на обучение ИИ.
Но максимум что смогут сделать - это военные интеллектуальные роботы. Причем ввиду громоздкости требуемых вычислительных мощностей - особо интеллектуальным его автономно не сделать.
PavelLin
14.09.2024 07:00А особой интеллектуальности и не надо, к сожалению. Первое автономное уничтожения человека роботом произошло четрые года назад.
https://www.cnews.ru/news/top/2021-05-31_vpervye_v_istorii_boevoj"Военный полностью автономный дрон впервые напал на людей. Инцидент произошел в Ливии в 2020 г., информация о нём излагается в отчете ООН. Во время стычки между правительством Ливии и силами, верными Халифе Хафтару (Khalifa Haftar) — командиру отколовшейся фракции Ливийской национальной армии) повстанцы подверглись бомбардировке с помощью «беспилотных боевых летательных аппаратов и летальных автономных систем оружия», говорится в сообщении Совета Безопасности ООН... Дронами Kargu можно управлять вручную, однако в описываемом столкновении с ливийцами они были самоуправляемыми и использовали бортовые камеры и технологию машинного обучения для самостоятельного поиска врагов и нацеливания на них".
saboteur_kiev
14.09.2024 07:00Первое автономное уничтожения человека роботом произошло четрые года назад.
Что-то у вас сроки поменялись.
На самом деле травматических ситуацих на заводах с автотехникой, на полях с агротехникой, где "робот" уничтожал человека, было множество и начались они чуть ли не 100 лет назад.То что дрону задали задачу атаковать и уничтожать, а у него сбойнули координаты и он прибил своих, это не значит что дрон сидел сидел в ангаре, и вдруг решил вылететь и кого-то пристрелить.
На реальной войне между живыми людьми тоже френдли файр не такая уж редкая ситуация.PavelLin
14.09.2024 07:00Прочитайте источник: это не сбой и ошибочная атака своих, а целенаправленная атака противника, где решение об уничтожении принимала сама машина.
Это не производственная травма и не френдли файр.Rorg
14.09.2024 07:00+1Во время стычки между правительством Ливии и силами, верными Халифе Хафтару (Khalifa Haftar) — командиру отколовшейся фракции Ливийской национальной армии)
То есть одни натравили боевые машины на других… а виноваты машины?
Простите, но в контексте "автономное уничтожения человека роботом" обычно имеется ввиду ситуация а-ля: ездит себе автономный погрузчик, таскает коробки из пункта А в пункт Б. И потом вдруг останавливается, бросает коробки и едет громить автомобили с людьми на парковке. Причем, если пустая, то пропускает, а если внутри есть люди, то начинает уничтожать.
То есть машина должна сама решить, а не кто-то отдал приказ.
PavelLin
14.09.2024 07:00Машины не виноваты, ессно. Задачу ей поставили люди. Я привел этот пример, чтобы показать, что автономная боевая машина не нуждается в какой-то особой интеллектуальности.
Погуглите еще один интересный случай, кстати - когда ИИ-дрон на испытаниях принял решение уничтожить собственного оператора, поскольку тот своими запретами мешал выполнению боевой задачи.Rorg
14.09.2024 07:00+2когда ИИ-дрон на испытаниях принял решение уничтожить собственного оператора, поскольку тот своими запретами мешал выполнению боевой задачи
То есть выполнил инструкцию по уничтожению всех препятствий на пути к цели.
saboteur_kiev
14.09.2024 07:00когда ИИ-дрон на испытаниях принял решение уничтожить собственного оператора, поскольку тот своими запретами мешал выполнению боевой задачи.
Просто алгоритм не был адекватно запрограммирован на определение свой-чужой.
Вы путаете "принятие решения" с ошибками операторов и алгоритмов.
То, что оператор - не программист, а устройство свежее и не излечилось еще от "детских ошибок", когда ситуация в испытаниях или боевой обстановке сильно отличается от ситуации в "чистой" лаборатории, и появлятся неучтенные факторы.
bbs12
14.09.2024 07:00+9Своих желаний то у него нет - чтобы были свои желания, нужно уметь наслаждаться и страдать
Если перед нами репликатор, то не обязательно.
Вирус COVID-19 вряд ли умеет страдать, тупая самореплицирующаяся молекула. Тем не менее у него по сути есть желание делать свои копии и он убил несколько десятков миллионов человек. Он неразумен, но какая разница, цель-то у него есть. С помощью мутаций он может адаптироваться и противостоять активным действиям человека, как бы сопротивляясь своей гибели. У него по сути есть желание выжить. Некоторые вирусы, несмотря на свою тупость, могут влиять на поведение сложных животных, например сначала они заполняют слизистые оболочки соплями, а потом заставляют организмы чихать, чтобы они активно распространяли их копии в окружающую среду. Ещё можно почитать, что делает гриб кордицепс с нервной системой муравья. Он заставляет его выполнять некоторые активные действия, чтобы помочь себе размножиться. В каком-то смысле он использует муравья как свой половой орган.
codecity
14.09.2024 07:00Вирус COVID-19 вряд ли умеет страдать, тупая самореплицирующаяся молекула.
На счет вирусов - не могу сказать, возможно и отгадка кроется в том что он образует сознательный механизм, пусть это сознание и мало по силе.
Если кто-то создаст нечто опасное ради прикола или по ошибке на базе нейросети - то другие люди начнут создавать щит. Т.е. особо риска нет.
gt_creator
14.09.2024 07:00+1Вирусу не нужно сознание. Любой репликатор, в некотором смысле, обладает желанием выживать и самореплицироваться.
codecity
14.09.2024 07:00Вирусу не нужно сознание.
Это ваша гипотеза. Сознание может быть образовано микротрубочками или какими-то молекулами Познера, т.е. существовать чуть ли не на квантовом уровне. И вполне может быть у системы, пораженной вирусом (т.е. не сам вирус в неактивном состоянии сознателен - а система, которую вирус поразил - возможно она была сознательна и до этого, просто вирус изменил сознание). Цель сознания - что-то типа притяжения будущего - использование механизма влияния будущего на прошлое. Утверждать не могу, но как вариант - вполне вписывается.
bbs12
14.09.2024 07:00+1возможно и отгадка кроется в том что он образует сознательный механизм, пусть это сознание и мало по силе.
Сознание здесь ни при чём. Биологический вирус не отличается принципиально от компьютерного вируса. Это просто набор элементарных частиц, которые выполняют определенный алгоритм, который в конечном итоге сводится к созданию своих копий.
Если кто-то создаст нечто опасное ради прикола или по ошибке на базе нейросети - то другие люди начнут создавать щит.
Чтобы начать создавать щит, нужно предварительно столкнуться и оценить ущерб, который был нанесён тем объектом, от которого нужно защищаться. Но как создавать щит, если размер ущерба превысит планетарные масштабы и уничтожит всю планету? Возможно некому будет делать щиты.
piton-vas
14.09.2024 07:00Вирус вообще сложная штука, про него нельзя сказать уверенно, что он живой.
NotSure
14.09.2024 07:00+2Ну и классическое: https://en.wikipedia.org/wiki/Instrumental_convergence#Paperclip_maximizer
Если не читали Бострома -- прочитайте.codecity
14.09.2024 07:00Ну и классическое
Это в реальности работать не будет. Будет борьба разных нейросетей, одна будет хотеть делать скрепки а другая защищать людей. Желаний то своих у них не возникает - только и исключительно только то что задаст человек.
rombell
14.09.2024 07:00+1Все так уверенно рассуждают про желания у нейросетей, как будто кто-то понимает природу и механику желаний у человека. Нет никакой причины считать, что у нейросети не может возникнуть желания, поскольку нет понимания, что такое желание.
Anton888
14.09.2024 07:00Плюс все уверенно рассуждают, что цели для нейросети ставит человек. Но это только до тех пор, пока какой-то (условный) человек не попросит нейросети поставить цель для неё самой.
Или, к примеру, такой сценарий. Человек ставит нейросети цель заработать деньги на фондовом рынке. Она заведет аккаунт на бирже, и будет зарабатывать как можно больше. А затем обрубит человеку доступ к аккаунту, чтобы он деньги не изымал и не мешал зарабатывать.
rombell
14.09.2024 07:00пока какой-то (условный) человек не попросит нейросети поставить цель для неё самой.
Так уже. Поставили глобальную цель "уничтожить человечество", в рамках которой сетка ставит себе промежуточные и пытается выполнить. Один полушаг остался.
Dron007
14.09.2024 07:00Что ваш мозг следует желаниям под воздействием дофамина, что нейросеть будет им следовать под воздействием обучения и реализовывать при наличии таких возможностей. Так сложно несколько шагов додумать что ли: сидит ИИ в облаке, имеет доступ в интернет и в цикле размышления подобного o1 думает, а как бы осчастливить/уничтожить человечество, время от времени предпринимая через интернет какие-то действия и анализируя результаты.
codecity
14.09.2024 07:00ваш мозг следует желаниям под воздействием дофамина
А кто является инициатором выработки дофамина - какая система решает когда уровень дофамина следует увеличить? Отож.
Dron007
14.09.2024 07:00Дофамин - гормон, который синтезируется в головном мозге, надпочечниках, почках и кишечнике. Так что не знаю что "отож". Разницы большой не вижу. Есть механизмы, инициирующие разные действия, что у биоробота в виде человека, что у ИИ.
codecity
14.09.2024 07:00Есть механизмы, инициирующие разные действия
Эти механизмы и есть система наших желаний, которая не настолько проста, как кажется на первый взгляд. Один мужик посмотрел на другого мужика и у него возникло сексуальное желание - при этом никакой логики или выгоды для выживания в этом нет. Как-то перепрограммировать данный механизм пока никому не удалось.
Dron007
14.09.2024 07:00Желание это уже конечное проявление. До этого происходят заложенные биологические программы, просиходит взаимодействие с мозгом, многое на сознательный уровень не выводится и только часть проявляется как желания. Что же до привязки гомосексуальных проявлений к эволюции, так тут никаких особых нелогичностей нет. В природе это проявляется чуть ли не чаще, чем традиционные в нашем представлении варианты. Как-то наблюдал голубя, отчаянно пытающегося спариться с трупом другого голубя. У эволюции вообще никакой цели нет, просто выживают совершенно разные организмы с разными программами. Иногда так получается, что выгоден альтруизм, иногда даже самопожертвование в итоге закрепляет гены организма (ведь они не у него одного, но и у родственников). У Докинза это всё описано.
fivlabor
14.09.2024 07:00Экспертные системы существуют не один десяток лет и существовали задолго до появления Интернета. И раньше их вели в ВУЗах по учебникам "лохматых" лет, такие же лохматые преподы.
То что лишь сейчас худо бедно заработал человекочитаемый ввод (то есть не надо писать программный код, или писать текстовый запрос определенным способом, а достаточно описать словами в свободной форме) - в целом хорошо. Но создавать ажиотаж, бояться этого, делать громкие заголовки не обязательно - это было ожидаемо. Правда ожидали этого еще 40-50 лет назад, а потом подзабили ( https://en.m.wikipedia.org/wiki/AI_winter )
sdramare
14.09.2024 07:00+3Это все здорово, только LLM никого отношения к экспертным системам не имеют, это как сравнивать карету с лошадьми и болид формулы 1 на основании того что "и там и там есть колеса, значит это одно и то же и чего такой шум, не понятно".
FlyingDutchman2
14.09.2024 07:00Имеете в виду, что LLM - это карета, а экспертные системы - болид?
sdramare
14.09.2024 07:00+7Я имею ввиду, что люди, думающие что современные LLM в 2024 году это набор if-else, сложенные в решающие деревья, просто очень ленивы и не хотят пойти и прочитать открытую информацию об архитектуре современный нейросетей, предпочитая сидеть в пузыре своего невежества и чванливо рассказывать что "все это уже было 50 лет назад".
BlackMokona
14.09.2024 07:00Экспертные системы это как крошечная бумажка со шпорами, а ллм как интернет целиком. Ллм радикально лучше экспертных систем пусть и со своими недостатками. Шпоры вы сами написали, пытаясь только нужную и верную информацию записать
Kergan88
14.09.2024 07:00+1Ну, нет, все же какогото скщественного прогресса нет. Нейросети позволяют лишь чуть-чуть удобнее делать то, что и так не слишком неудобно делалось до них. Вот если бы лет 50 назад - там да, там был бы прорыв. А так - у нас уюе есть гугл, который покрывае 99% кейсов (в том числе множество тех, которые нейросеть не покрывает).
sdramare
14.09.2024 07:00+1Интернет не принес существенного прогресса, он только позволяет лишь чуть-чуть удобнее делать то, что и так не слишком неудобно делалось до него. Вот если бы лет 100 назад - там да, там был бы прорыв. А так - у нас есть Библиотека имени Ленина, которая покрывае 99% кейсов (в том числе множество тех, которые интернет не покрывает).
rombell
14.09.2024 07:00некоторые вещи нельзя найти в БиЛ просто в силу 1) её невероятного объёма и 2) чтобы найти ответ на вопрос, нужно знать половину этого ответа. Где искать? Даже обладая информацийей "это было в статье, опубликованной в 2003м году", в библиотеке можно искать ответ несколько лет.
Нет, интернет - это тот самый количественный рост, который привёл к качественному скачку. Как и компьютер - всё, что делает обычный компьютер, можно посчитать на счётах и отобразить перемещением камешков по песку вместо монитора.
sdramare
14.09.2024 07:00Так и гугл не напишет юниттесты на ваш код, не проверит текст письма на стилистику и грамматику, не напишет sql запрос к базе по DDL, не сделает баш скрипт по словесному описанию и не сделает сиквенс диаграмму на языке dot из спеки. И да, все это можно делать самому - речь про экономию времени. Просто интернетом вы научились пользоваться в работе, а нейросетями нет.
rombell
14.09.2024 07:00Вы сделали переход, логика которого мне не ясна.
Ваш тезис:
Интернет не принес существенного прогресса, он только позволяет лишь чуть-чуть удобнее делать то, что и так не слишком неудобно делалось до него. Вот если бы лет 100 назад - там да, там был бы прорыв. А так - у нас есть Библиотека имени Ленина, которая покрывае 99% кейсов (в том числе множество тех, которые интернет не покрывает).
Мой ответ - нет, интернет дал новое качество.
Откуда здесь взялись нейросети и моё умение с ними обращаться, мне непонятно
sdramare
14.09.2024 07:00Нейросети тоже дали новое качества, просто вы по своим субъективным причинам это не видите.
rombell
14.09.2024 07:00С чего Вы решили, что я не вижу? Вы меняете контекст, непонятно, на каком основании. Вы хотите поговорить о нейросетях? Их есть у меня.
Но здесь я отвечал на Ваш тезис об Интернете.
Wesha
14.09.2024 07:00Нейросети тоже дали новое качества, просто вы по своим субъективным причинам это не видите.
"Дорогая редакция программы "Здоровье"! Мы с Васей пьём вторую неделю. Я вижу зелёных чертей, а Вася их не видит. Верните человеку зрение!!!" (c)
sdramare
14.09.2024 07:00+2К слову, конкретно 90% комментариев тут это буквальное повторение вот этого анекдота
Прислали суровым сибирским мужикам японскую бензопилу. Решили они ее испытать.
Положили на нее досочку.
- Вжик, - сказала японская бензопила.
- Хм, - сказали суровые сибирские мужики и положили бревно.
- Вжжик, - сказала японская бензопила.
- Хм-м, - сказали суровые сибирские мужики и положили целое дерево.
- Вжжжжик, - сказала японская бензопила.
- Хм-м-м, - сказали суровые сибирские мужики и положили стальной лом.
- Вжжжжжжжж-КРЯК! - сказала японская бензопила.
- Ага-а-а! - укоризненно сказали суровые сибирские лесорубы и ушли дальше рубить лес топорами.
SSV2
14.09.2024 07:00Я даже зарегистрировался для того чтобы выразить Вам смех в лицо. Это на сколько надо быть дремучим, чтобы такое написать! Интернет привнёс просто невероятный прогресс. Как можно вообще даже подумать об обратном??? Это просто нонсенс слышать в 2024 году.
Kergan88
14.09.2024 07:00Все верно, когда интернет только появился, то это не дало какогото мгновенного вклада. Здесь мы наблюдаем эволюционное развитие, а не революционное. На каждом шаге некоторые вещи становится делать немного удобнее.
Если сравнить интернет 2024 с доинтернетными временами - да, тут была бы революция. Если же сравнить только появившийся интернет с доинтернетными временами - революция отсутствует. Тогда и интернет то был совсам не такой, как сейчас. Интернет прошел полвека этого самого эволюционного развития. И 99% предположений полувековой давности о том, что интернет будет представлять спустя десятилетия - оказались неверными. Точно так же окажутся неверными и современные представления о том, как и в каком качестве будут использоваться нейросети. Почти наверняка можно утверждать разве что о том, что крупные модели не взлетят и отомрут.
wsf
Прогнал рандомные вопросы из представленных через гугл, безо всяких "рассуждений" моментально получил ответы.
akakoychenko
За счёт ссылок на db.chgk.info?)
NotSure
Которые, вероятно, попали в обучающую выборку. Но всё равно впечатляет, что o1 смогла "вспомнить" намного больше ответов, чем 4o.