Claude добавил новую фичу в десктопной версии.
А именно, в интерфейсе появилась третья вкладка - Code.
Даю её скрин, чтобы была видна общая картина.

Код проекта подключается прямо в Claude
Самое главное нововведение - это возможность подключать код проекта прямо в чат и работать с ним без копипаста.
Т.е., теперь можно создавать новые файлы проекта и менять их. Кроме того, можно работать с ветками GIT.
Отсутствует только возможность запускать код на симуляторе (использую Xcode).
А теперь немного пройдемся по деталям
Опции кнопки "Добавить"
Итак, плюсик внизу слева открывает своё подменю. Там уже есть знакомая возможность Добавить файл или фото, а также ещё 3 другие опции. Здесь особенно интересны Slash commands, о которых расскажу чуть позже.
Режимы работы с проектом
Рядом с плюсиком выбор трёх режимов:
Спрашивать разрешения на изменения кода
Применять их автоматом
Работать в режиме планирования.
Название и адрес проекта
Внизу под предыдущими кнопками показывает название и адрес проекта - см. начальный скрин. Здесь же можно выбрать ветку гита.
Выбор модели
Стандартная опция как всегда справа под строкой чата. У меня план Pro, который $20, поэтому можно использовать 3 модели: сейчас это Opus 4.6, Sonnet 4.6 и Haiku 4.5.
Что лучше?
Скрытый текст
До сих пор не могу определить, с чем лучше работать с Opus или Sonnet. Объяснения типа там общие задачи, а тут быстрая модель не помогают. И тот, и другой, работают хорошо и трудно понять разницу. Остаются только какие-то субъективные впечатления, типа Opus более официальный, а Сонет более дружелюбный. А как вы?
Worktree
Ниже выбора модели расположено окно для птички worktree. Во всплывающей подсказке поясняется, что это можно использовать для работы сразу с несколькими задачами.

Режимы работы с моделью
Чуть правее выбор вариантов работы с Claude. Например, Local хороший вариант. Только это ещё надо уточнять, что это означает: полный локал или какой-то условный на слэнге разработчиков. Потому как оказалось, что любой чат Claude есть в интернете, если знать ссылку.
Slash commands
А теперь вернёмся к Slash Commands. Они получаются как вишенки на тортике. А именно: их там с полтора десятка и они оценивают сам чат, рабочую сессию.

В частности, там и возможность сделать резюме по ходу, и сжать контекст чата, и оценить стоимость текущей сессии, и создать CLAUDE.md файл и много чего ещё полезного.
Работать с ними просто: открываем меню, выбираем то, что нужно, кликаем и оно автоматом улетает в чат.
Выводы
По сути это замена Cursor.
И если до сих пор я использовал Cursor именно потому, что не нужно было копипастить, а параллельно и Claude, потому что у него просторное окно чата и удобно обсуждать, планировать и т.д., то теперь необходимость в Cursor явно отпадает. Если только они не придумают какие-то удобные фичи, которых нет у других.
P.S. Интересно, что по ходу работы кнопки внизу справа заменяются на кнопку Open in Cursor. Т.е., у них дружба продолжается. Надолго ли?
Комментарии (111)

yadykin
25.02.2026 02:16лимиты? Раньше auto было без ограничений, сейчас стоит лимит. Всадил лимиты, теперь куковать 17 дней без курсора при подписке Pro
С этим лимитом Claude code становится хорошей альтернативой. Странно, что нигде не вижу новостей о изменениях в тарифах

AppCrafter Автор
25.02.2026 02:16Насчёт лимитов ещё не успел проверить Claude Code. Но вот несколько дней назад работал ещё с чатом Claude и там пару раз нарывался на расходование дневного лимита. Раньше такого как-то не было, никаких сообщений не появлялось.

x4team_only
25.02.2026 02:16Подтверждаю, лимиты тоже стали более жесткими в claude, буквально 1-2 недели назад появилось

Romatio
25.02.2026 02:16Если самый модный опус с самым высоким thinking и большим контекстом, то расход в три раза выше. Плюс если подключены с десяток mcp, скиллы, сабагенты и др.

clarkkent5
25.02.2026 02:16Вообще не заметил разницы в лимитах за последнее время. На Max x5 5-часового лимита хватало впритык просто при кодинге что 2 месяца назад, что сейчас. Если более творческая задача и обработка текста, то уже не хватает лимитов.

d3d11
25.02.2026 02:16Есть вариант потокенной оплаты.
Вообще, зачем этот примитивный интерфейс, когда агент, встроенный в IDE гораздо удобнее и продуктивнее? Я имею ввиду не Cursor, а агенты в VS Code.
funca
25.02.2026 02:16Прелесть claude code в достаточной открытой архитектуре, по сравнению с остальными. Это классный конструктор. У него есть интеграции с разными IDE, включая VSCode, в том числе и в режиме агента.

d3d11
25.02.2026 02:16Это я и имею ввиду - использую claude в vs code. Я о том, что само десктопное приложение от claude - какое то примитивное, по сравнению с IDE.

Spyman
25.02.2026 02:16Может это конкретно с android studio или jetbrain-овскими ide такая беда, но все расширения встраивающиеся туда как будто написаны тем самым llm без участия человека - бесконечные баги, утечки памяти, не очень удобный интерфейс и свойства периодически класть студию. У оценки у них всех около 3/5

RH215
25.02.2026 02:16Есть вариант потокенной оплаты.
Выходит дороже. :)
агент, встроенный в IDE гораздо удобнее и продуктивнее?
Code тоже неплохо интегрирован в VSCode, но кроме того ещё и неплохо интегрирован с чем угодно. А с чем ещё не интегрирован -- можно интегрировать.

werymag
25.02.2026 02:16Я пока ни разу в лимиты не упирался (но, судя по комментариям, скоро упрусь). Как сильно замедляются запросы, когда выходишь за лимиты?
В целом у меня есть вопросы которые можно и моделям попроще кормить, а есть которые хочется получить максимальное качество, видимо теперь придётся думать у кого спрашивать.
AppCrafter Автор
25.02.2026 02:16Как сильно замедляются запросы, когда выходишь за лимиты?
Они вроде как не замедляются, просто к месячной подписке добавляется ещё и дополнительная оплата, теперь уже конкретно по количеству токенов
В целом у меня есть вопросы которые можно и моделям попроще кормить, а есть которые хочется получить максимальное качество, видимо теперь придётся думать у кого спрашивать.
Именно так и получается, что не сильно хочется палить из дорогой пушки (Опус) по воробьям, если можно на простых задачах обойтись Сонетом.

AllFiction
25.02.2026 02:16Claude крутой для кода, но лимиты менее жесткие в Codex от GPT

PC-01
25.02.2026 02:16Курсор сам может с собой попрощаться. Сейчас нет возможности для разработчиков софта тормозить с развитием продуктов в сфере ии. Во множестве плагинов для vs code есть аркестратор. Разница с ним и без него такая же как с копированием кода вручную и тем, что сейчас есть в курсоре.

akod67
25.02.2026 02:16Поясните свою мысль. Я только вкатываюсь в тему вайба, Claude Code / Opus , основной средой последние годы был VSC и что за хайп вокруг Курсора - разбираться было лень. Работает и так всё. Что дополнительно на эту связку можно навесить для левел ап?

lipatovroman
25.02.2026 02:16Я пощупал Cursor. В итоге установил в VSC расширение Codex. Пишет как с нуля, так и правки делает.

MountainGoat
25.02.2026 02:16Находили расширение, которое делает автокомплит через Ии и только его, или по крайней мере не конфликтует с другими? Раньше я использовал Continue — но он засыпал все меню неубираемыми элементами и был за это послан в баню.

aladkoi
25.02.2026 02:16Вокруг Claude code ( это внутренний инструмент атморфик и заточен под их модели) сложилась уже целая индустрия. На сегодня лучше его по возможностям нет.

redpax
25.02.2026 02:16Вкладка code и cowork были уже давно на МАХ подписке. Для более автономного создания MVP я всё же использую replit как мультиагентную систему которая не просто создает код, а еще и тестирует его сама через LAM модель прокликивая всё в интерфейсе. Claude code хорош потом для локальных небольших доработок.

AppCrafter Автор
25.02.2026 02:16Вкладка code и cowork были уже давно на МАХ подписке
Ну так это же на MAX! ))

Ainyru
25.02.2026 02:16У меня бот сидит и всегда будет сидеть в отдельном чате отвечая на четко поставленные вопросы. Никакого доступа к коду и никакой интеграции с IDE.

rbdr
25.02.2026 02:16Это вам нужно просто посмотреть как другие это дело настраивают и работают.
Не то, чтобы про интеграции в ide, а вообще как оно бывает.
Можно пешком идти, для удовольствия, можно на велике, а можно и на ф1

Ainyru
25.02.2026 02:16Я уже давно и одним из первых на все посмотрел. Две главные причины, почему:
1. Я отвечаю за написанное мной. Чтобы отвечать я должен полностью понимать как все работает. Для каждой строчки кода я должен знать причину, почему она такая, а не другая. Без знания и понимания невозможно принимать правильные решения по изменению и развитию проекта. Настоящий разработчик знает, что исходный код - это только часть, вторая часть у него в голове, и обе из них одинаково важны.
2. Чем больше полагаешься на AI бота, тем сильнее деградируешь сам, что приводит к профессиональной некомпетентности.
DigitalSfera
25.02.2026 02:16А чем мешает условный курсор понимать как все работает? Вы говорите про 2 части реализации - в голове, и сам код. У меня использование сводится к тому, что я знаю в голове какая архитектура мне нужна и как она будет выглядеть в виде кода, те я могу написать ее руками. Дальше просто эту задачу объясняю ии и он пишет быстрее в несколько раз. Далее просмотр изменений и прием/отмена. Он же не меняет ничего без вашего ведома - все изменения видны и их можно принять/поправить/убрать. Тут речь не про то что он вас заменяет, а про то что помогает ускорить рутину. Грубо говоря как будто вам крепкого джуна рядом посадили и можно простые задачи ему спихивать, а самому более сложные решать или архитектуру продумывать.

Elendiar1
25.02.2026 02:16Разница примерно как между чтением учебника и написания шпаргалки. В первом случае ты забудешь после прочтения, во втором нет

DigitalSfera
25.02.2026 02:16Если вы пишете абсолютно новый код каждый раз - то аналогия применима. Но по крайней мере у меня обычно 80-90% задач достаточно типовые, в которых происходит взаимодействие с уже знакомыми сущностями - выбрать, обработать, дернуть события, что-то поменять, вернуть данные. Тут скорее применима аналогия с изготовлением стула - вам же не нужно каждый раз изучать процесс его изготовления, если вы его делаете уже в сотый раз. И в плане того же курсора удобно что он видит ваш старый код, и пишет новый на его основе.
Дело то ваше, но просто та проблема которую вы описали "я должен полностью понимать как все работает" - это основная проблема, которая меня смущала в начале использования ии, но прикол в том что он ничего не меняет без вашего одобрения, вы точно так же читаете код и проверяете, что все работает так, как вы хотели. Не нравится - отменили конкретное изменение и написали как надо. Просто писать вручную нужно не 100%, а 15-30%, что сокращает времязатраты.
Абстрактный пример как это выглядит в интерфейсе - я могу приять изменение, могу отклонить.


ZdrasteEtoYa
25.02.2026 02:16Если вы работаете в команде - то ответственность не за код, а за ревью кода. Вот и тут тоже самое. Бизнес готов платить за это. В любом случае, каждому своё, и это прекрасно :)

Nik_Otin
25.02.2026 02:16На чтение кода всё же советую дать доступ. Будет более точно генерить нужный вам код.

Bardakan
25.02.2026 02:16начните с того, что cursor доступен в наших широтах, а claude - наверное единственная нейросеть, создатели которой не просто запрещают пользоваться людям из определенных стран, а еще и банят платные аккаунты с подписками, купленными за фулпрайс.

inetstar
25.02.2026 02:16Как решили вопрос? Просто совсем уж негуманные цены у курсора стали.
И я не пойму, есть ли выгода от дорогих акков? Слухи ходят, что всё по цене апи идёт.

Bardakan
25.02.2026 02:16никак не решал. Пользовался и продолжаю пользоваться cursor. Если под конец месяца кредитов не хватает, то отменяю подписку и снова оформляю (на другой аккаунт)

nidalee
25.02.2026 02:16Claude Code прекрасно работает через residential proxy США, просто exe-шник через Proxifier прокидываете и все ок. Но это конкретно терминальный Code (и обертка для него в vscode).

tonymictian
25.02.2026 02:16У меня Клод стабильно работает, а вот чатГПТ забанил мне оплаченный аккаунт

d3d11
25.02.2026 02:16В наших широтах давно уже без КВН нормально пользоваться интернетом не получается. Я думал он по умолчанию предполагается.

Tsimur_S
25.02.2026 02:16Интересно есть ли экспериментаторы которые используют sonnet/codex в качестве координатора/планера а для получившихся задач китайские нейронки(kimi/glm/minimax)? Какой получается результат?

dkeiz
25.02.2026 02:16все эти нейронки так быстро обновляются что не успеваешь тестировать, да и планирование не такое уж и сложное, GLM 5 легко и сам справится с планом, не понятно зачем вам sonnet сверху.

Soltkreig
25.02.2026 02:16Работаю через корпоративное облако, там без танцев с бубном работают только Cursor и Antigravity.

Kot_na_klaviature
25.02.2026 02:16С вайбкодом люди делятся на 2 категории. Те у кого низкие требования или скилл - их больше всего и для них ИИ прямо божественное открытие, "генерят стартап за 10 минут", "пишет код лучше меня" итд. И те у кого высокие требования к коду/архитектуре - им приходится тратить много времени на исправления. Да - быстрее, но появилось раздражение от ии тупости там где раньше его не было..

Juzujka
25.02.2026 02:16Джуниор тоже может что попало накодить, если правильно задачу не ставить и не проверять.
А без джуниора много времени сеньора будет тратится на простые задачи, которые мог бы сделать джуниор. А сложные джуниор за него не сделает.
А если джуниор умеет не только сам по себе кодить, но ещё и ИИ умеет правильно использовать, то он потенциально смог бы задачи сеньора быстрее решать.

Kuch
25.02.2026 02:16Эти вторые видимо не пробовали opus 4.5-4.6

Kot_na_klaviature
25.02.2026 02:16Эти модели пока доступны только избранным, которые умеют генерировать стартап за 10 минут.

criminalist
25.02.2026 02:16С января в помойку cursor отправил, даже на 3 дня не хватает, сейчас или api deepseek или Qwen в visual code, уже несколько дней бесплатно работаю с ним.

MyraJKee
25.02.2026 02:16Как qwen по сравнению с агентами в cursor?

criminalist
25.02.2026 02:16Мои мысли такие, именно в курсор реализация очень добротная, например если использовать чат gpt codex какой нибудь в cursor и в visual studio разница есть, это только мои ощущения, а по qwen, в целом сойдет плагин конечно не удобный, очень страдает в нем контроль процесса, но так как бесплатно и для моих небольших задач справляется не хуже gpt5 codex, по подписке пока лимиты жду qwen пользуюсь

NineNineOne
25.02.2026 02:16Квен отлично справляется с большинством задач. Если хотите сравнения конкретных моделей, то у квен на сайте это сравнение есть.
Сравнивать "агентов в cursor" с qwen некорректно, это как теплое и мягкое сранивать.Агенты есть и в курсоре, и в квен, можно одних и тех же использовать. Но вы наверное другое подразумевали под агентами?

funca
25.02.2026 02:16Модели в Cursor выглядят подломанными - они как будто запромчены делать массу лишнего, потребляя в процессе уйму токенов.

MyraJKee
25.02.2026 02:16Да, я имел в виду модели которые есть в cursor, qwen я там кажется не видел.
Либо я вообще не так всё понимаю

Juzujka
25.02.2026 02:16Я бесплатный лимит Qwen уже исчерпал. Чему был удивлён, потому что даже при целенаправленном поиске информации об этом нашёл её не сразу.
Теперь через российский прокси на openrouter плачу и пользуюсь.

dima_kos
25.02.2026 02:16Я не понял из статьи, а почему "прощай, cursor" то?

criminalist
25.02.2026 02:16Now only for the rich

dima_kos
25.02.2026 02:16Хз, с текущим курсом не так и дорого вроде, вот когда по 120 будет, тогда задумаемся. С другой стороны если инструмент приносит деньги, то чего бы за него не платить.

criminalist
25.02.2026 02:16Не дорого? ну смотри 29 числа декабря я оплатил подписку 20$, 2 или 3 января уперся в лимит, далее взял другой аккаунт и врубил там опцию, 500 баксов за 8 дней, я считаю это оверпрайс, если тот же deepseek от 1 до 2 баксов в день уходит.

funca
25.02.2026 02:16Курсор жрёт токены как не в себя, а статистика у них абсолютно не прозрачна. Плюс вечно что-то недоделано или отваливается. Мне кажется, что с таким подходом к делу они скоро распугают всех своих клиентов.

criminalist
25.02.2026 02:16Ну в принципе это уже идет, а будет лавинообразно когда клиенты пощупают другие инструменты, не каждый вернутся. Судя по реддит оно уже так и происходит.

dima_kos
25.02.2026 02:16Ого, я столько не трачу, я и 20$ за месяц не вырабатываю. Я код много руками пишу.
Ну и еще я стараюсь не перегружать контекст и жестко ограничиваю правилами курсор.

AppCrafter Автор
25.02.2026 02:16Я не понял из статьи, а почему "прощай, cursor" то?
Ну вот, смотрите: есть две платные подписки - Cursor и Claude. У Cursor главная фишка - модели работают непосредственно с кодом проекта без копипаста. Теперь такая же фишка появилась у Claude и получается, что можно обойтись одним Claude без Cursor.

arturtr
25.02.2026 02:16Так-то Claude Code давно можно добавить в Cursor, VS Code как расширение и получить все эти функции.
Сам Claude Code существует достаточно давно как отдельное приложение

AppCrafter Автор
25.02.2026 02:16Claude Code давно можно добавить в Cursor
Там и добавлять не надо, поскольку он там уже есть. Так вот речь и о том, что теперь Claude Code сам по себе без Cursor встраивается в проект и работает не только в режиме CLI

blackyblack
25.02.2026 02:16Подсказываю: Claude доступен в подписке Github Copilot. Получается значительно выгоднее, чем покупать подписку от самого Claude и меньше вероятность, что вас забанят.

MaksonST
25.02.2026 02:16Самое халявное использование, с подпиской на Github Copilot даже за 10$, используешь стабильно 100 запросов, в. Cursor за 20$ тот же Opus съедает подписку за 3-4 дня, по наблюдениям где то около 30 запросов. Тот же анализ, тот же ум, только дешевле.

blackyblack
25.02.2026 02:16Copilot даже дешевле 10 баксов. С годовой подпиской около 8 долларов в месяц.

Briksins
25.02.2026 02:16Мне вот интересно, людям действительно так пофиг на качество того что они там на вайбкодили? а так же пофиг на свою безопасность?
Да, Claude модели топовые по качеству что они выдают, но Курсор тоже может использовать модели Антропик, как и Гугла и ОпенАИ...
тут вся разница в том что с курсором вы открываете проект в IDE, а с Клауде Код вы просто в терминале посылаете ИИ что-то сделать в проекте. да он вам выкатит diff чего поменял, но это все равно не удобно, это все равно не работа в IDE.
Про безопасность что я упомянул: я без DevContainers вообще больше не работаю. ранить ИИ в материнской системе где ИИ может сделать абсолютно все, ну так себе... Да Клауде тоже можно обернуть в девконтэйнер, но я на иконку курсора нажал, тот открыл проект сразу в контейнере, мне не надо его ручками из терминала запускать.
Ну короче кодить из терминала даже не открывая IDE это мне кажется какой-то пофигизм к качеству чего вы делаете. ИИ на говнокодил, работает и норм, пуш...
В общем со статьей не согласен, особенно учитывая что Курсор тоже может в Антропик модели по желанию.

alex_lol2
25.02.2026 02:16кодить из терминала даже не открывая IDE это мне кажется какой-то пофигизм
с Клауде Код вы просто в терминале посылаете ИИ что-то сделать в проекте. да он вам выкатит diff чего поменял, но это все равно не удобно, это все равно не работа в IDE
Рукалицо. IDE видит все изменённые Клодом файлы. Или у вас IDE из прошлого столетия?

Eduard_Mak
25.02.2026 02:16По наблюдениям у Cursor самый злые лимиты, при этом на тех же моделях cloude code c плагином для VsCode потребляет гораздо меньше за теже деньги.

xXxVano
25.02.2026 02:16Использую курсор в коммерческой разработке (несколько крупных ПК/консольных игр на UE5) уже довольно длительное время. Для вайбкода использую только если какой то одноразовый скрипт на питоне/коммандлет на плюсах написать надо, что бы 1 раз прогнать и выкинуть. В остальном код почти неподдерживаемый получается. Плюс за другими коллегами приходилось вычищать это.
Основной кейс использования - локализовать что то в базе движка/проекта, найти проблему почему такое поведение, найти лучшую точку для встраивания и всякое такое.
И тут Опус справляется в разы лучше, чем Cонет. Сонет часто бывало просто ходит по кругу и не может найти проблему. Про GPT вообще молчу, в последних версиях он больше с тобой спорит что по другому никак нельзя, чем реально ищет проблему. В некоторых задачах Опус находил проблему за пару запросов, которую сонет не мог день найти. И такой же фидбек от других коллег, кто его юзает.Что касается самого курсора, то лично сам не сравнивал его с копайлотом и другими средами, но ребята кто щупал утверждали что копайлот просто не вывозит на столько что даже отказались от него. И курсор на уровне агента просто свою работу делает в разы лучше. Так что тут не только модельку надо сравнивать.

vadim_kudr
25.02.2026 02:16Курсор чрезмерно дорогой и подойдет как игрушка для постепенного отказа от написания кода руками. Тот же windsurf куда приятнее и с еще бесплатным swe 1.5 будет лучше для начала.
Уже потом можно переходить на относительно бесплатный qwen-code, antigravity. И когда прокачаетесь - на claude code.
Имхо, и венец эволюции - lazy vim с плагинами, где можно по acp общаться c qwen-code и другими агентными штуками или просто рядом отображать.

akuli
25.02.2026 02:16Claude Code в десктопе гуд, но это всё равно чат с доступом к файлам. Сейчас неделю пользуюсь Kodik и мне как то ближе формат именно IDE. Агентный режим, inline-правки, автодополнение, плюс код сначала локально маскируется и только потом уходит в облачные LLM

AppCrafter Автор
25.02.2026 02:16код сначала локально маскируется и только потом уходит в облачные LLM
А как именно он маскируется?

AleksandrVi
25.02.2026 02:16Не знаю. Интерфейс и агенты в cursor на голову выше чем в остальных. Не нейрокрки, а именно то как они работают, взаимодействуют с человеком и проектом.
Так что пока все стоит +- одинаково, стоит ли игра свеч. Тем более в курсоре фишек щас очень много
Dmitri-D
Использую opus и уже больше года. Прогресс огромный.
AppCrafter Автор
а почему именно Opus, а не Sonnet?
knight_of_light_1
Потому что Opus умнее Sonnet
Wesha
— Чем, чем умнее?
— Чем Sonnet!
(почти ©)
Juzujka
Умом умнее. То есть думает лучше.
Wesha
...которого у генератора следующего наиболее вероятного токена нет чисто по определению.
И часто Вы
онаантропоморфизируете?bak
А вы можно подумать не следующую букву не клавиатуре жмете когда текст пишите? Может задом наперед? Или может вы научились думать как GPU - разбить мысль на 1000 потоков паралельно их продумать и оба - выдать ответ?
Разница между вами и текущими LLM в том что в вашей нейросетке около 100 триллионов синапсов, а у текущих LLM порядка 1 триллиона весов.
MikhailZ963
Разница между ним (или мной, или вами) и LLM в любом из аспектов, который мы можем выделить. Это принципиально различные системы, и их сравнение между собой никакого практического смысла не несёт.
То что вы можете выделить в их функционирование нечто общее (создание текста), не означает, что в этом и состоит их суть. И даже в вашем сравнении вы упрощаете до крайности. Если в llm за распространение активации отвечают веса, то в случае с мозгом это комплексный процесс, в котором задействованы и синапсы, и нейроны, и химический фон среды, и всё это не просто несколько чисел, а сложные молекулярные структуры.
bak
Ясное дело что реализация одной и той же модели в кремнии будет отличается от реализации в биологии, но принцип похожий.
Веса нейронок в LLM это аналогия синапсов. И те и другие пропускают сигнал или его часть в зависимости от параметров - весов в llm или бихоимии в нейронах / синапсах.
Есть даже исследования которые определили что биологические нейронки хранят примерно 4.7 бит на синапс (имеют 26 различимых уровней силы синапсов).
И в целом архитектура современных LLM (RNN / transformer) основаны на набюдениях за биологическими аналогами (рекуррентные связи, нейромодуляторы внимания, и тд).
Поэтому я не согласен с утверждением что LLM это просто предсказатели токенов, а люди - это принципиально другое. Чтобы так увтерждать надо хотя бы построить модель сопоставимых размеров, и тогда уже и делать выводы.
MikhailZ963
Я понимаю и принимаю ваши аргументы. Они валидны и справедливы на своём уровне абстракции. Я лишь хочу указать, что любая аналогия строиться на абстрагирование, а любое абстрагирование на упрощение.
Мы можем найти в LLM и мозге человека крайнюю схожесть. И эта схожесть строиться на том, какие детали мы систем значимыми, а какие отбросим. Вы указываете, что были исследования установившие "вес" синапса в битах, возможно так и есть, я не знаком с ними, но как я указывал до, синапсы лишь один из множества факторов модуляции сигнала. То что математические модели, на которых построены LLM, вдохновлены мозгом не означает, что они тождественны.
Чтобы сделать выводы о "принципиально другом", ни к чему создавать LLM на 100 триллионов параметров. Достаточно указать на то, что это вопрос рассмотрения систем, то есть субъективности восприятия. Принципиально схожие процессы мы можем найти и в работе LLM, и в работе мозга, и в функционировании цивилизации, и в экономических процессах. Означает ли это их принципиальное сходство? Но ведь мы можем найти и множество различий. Означает ли это их принципиальное различие? Всё это зависит исключительно от того, какие свойства вы посчитаете значимыми, а какими решите принебречь.
Wesha
...я вообще образами думаю — а в слова их приводится переводить для презренных человечишков, которые иначе не понимают.
Примерно так
Kot_na_klaviature
Люди любят все очеловечивать. Солнышко греет, гроза сердится, машина не хочет заводиться теперь и компьютер думает. Антропоморфное мышление.
Q3_Results
Так никого нет близко, кто бы мог с людьми конкурировать
Sanchous98
Нет, разница между мозгом и LLM в том, что у мозга есть абстрактное мышление. Мы не выдаем слово за словом согласно внутренней статистике, наш мозг сначала "визуализирует" ответ, а затем воспроизводит его в виде слов, а может и в виде жестов итп. Вот как LLM наш мозг мыслит, когда мы переводим с одного языка на другой, при этом переводим на в тот язык, который мы не знаем на уровне носителя. Вот в таком случае мы действительно анализируем поток слов, который мы бы на родном языке выдали и подбираем наиболее подходящие на наш взгляд слова из другого языка. Но сам процесс мышления выстроен иначе. Точнее он у нас просто есть в отличии от LLM
Juzujka
Я-то, если что, шутку продолжил, а не очеловечивал алгоритм.
Но получилось интереснее, чем предполагал.
AppCrafter Автор
А вот что говорят другие, по отзывам в интернете. Что называется, есть нюансы.
На реальных задачах разрыв между актуальными Opus и Sonnet небольшой: оба решают большую долю задач.
В предыдущих версиях, Sonnet 3.5, например, лучше справлялся с типичными задачами кодинга, а Opus брал глубиной рассуждений. Сейчас линейки сблизились.
Opus дороже за токен, что очень даже заметно. Его выгодно использовать - финтех, критичные бекенды, сложная оптимизация, редкий, но тяжёлый ресёрч‑рефакторинг.
Sonnet оптимален как «рабочая лошадка» для повседневной разработки.
basme
Вот еще один отзыв из интернета.
Ежедневно использую Claude для реальных коммерческих задач. Enterprise-бекенд, от десятков до сотен тысяч строк кода в контексте, в зависимости от сервиса. Opus 4.5 - основная модель для работы.
Использую Augment, и, поскольку его UI тоже навайбкодили, он иногда забывает предпочитаемую версию модели и ставит дефолтную, и сейчас это Sonnet 4.5. Я не всегда это замечаю глазами в интерфейсе, но каждый раз вижу это в производимом коде, причем, как правило, после первой же выдачи. Может быть, кому-то не очень заметно, насколько Опус умнее Соннета, если постоянно использовать второй. Но вот то, насколько Соннет тупее Опуса в обратной ситуации - это просто невозможно игнорировать. Там пропасть такая, что по факту использовать Опус почти всегда выгоднее - он просто быстрее и правильнее делает как надо, за меньшее число проходов и уточнений.
AppCrafter Автор
ну так это как раз и подтверждает сказанное выше на примере - "Enterprise-бекенд, от десятков до сотен тысяч строк кода в контексте"
А если в проекте нет такой сложности, то стоит ли платить больше? Я вот уже несколько дней подряд на Опусе очень быстро упираюсь в лимит, буквально в рамках одного не самого большого чата. Но в целом, моя исходная постановка вопроса была не совсем правильной. Не какую модель выбрать, а можно использовать разные (из этих двух) под разные задачи. Другое дело, что не всегда заранее можно понять, будет ли задача простой или сложной. Иногда вроде мелочь, а растягивается на пару дней.
KEugene
На идентичных задачах Опус решает проблему намного быстрее Соннета. Из моего личного наблюдения, разница в разы. Грубо говоря, мне надо два-три часа на то, что с Соннетом занимало больше дня. С Опусом 4.6 разрыв еще больше. Хоть у Опуса и дороже токены, эффективность их использования на совершенно ином уровне.
schteinbrenner
Иногда сонет лучше, особенно для задач со средним уровнем сложности. Да и расход токенов меньше.
Dmitri-D
Opus - это reasoning модель - она медлительнее, но зато меньше ошибается и меньше галюцинирует
FSmile
А результат?
deepmind7
На лицо
Kot_na_klaviature
Жестко
FSmile
а я то думаю от куда запах