Если вас привлекает тематика LLMs и вы следите за новостями, связанными с применением моделей GPT, то вам, безусловно, известны GPT агенты, такие как AutoGPT, AgentGPT, GodMode и др. В настоящее время все эти агенты функционируют по одному и тому же принципу: пользователь определяет основную цель агента, назначает набор задач и запускает процесс.

Зачем искать альтернативы?

Существующие сейчас GPT агенты способны автоматизировать определенные задачи, включая поиск и обработку информации, создание и редактирование текстов. Однако попытки использовать их для решения ежедневных задач, скорее всего, вызовут разочарование, поскольку в настоящий момент такие приложения практически не представляют ценности для обычного пользователя.

AutoGPT, основанный на GPT-3.5, работает крайне неэффективно, и вы вряд ли сможете заставить его выполнить даже одну задачу таким образом, чтобы вам не пришлось потратить больше времени на исправления и редактирование, чем если бы вы сделали это самостоятельно. Применение GPT-4 ведет к снижению скорости работы, и ваш бюджет, вероятно, исчерпается раньше, чем AutoGPT завершит выполнение задачи.

Даже если все эти недостатки будут устранены в будущих версиях, остается ключевой вопрос безопасности. AutoGPT и аналогичные приложения имеют доступ к интернету и способны выполнять код, что в теории дает ИИ полную автономию. Этот вопрос вызывает многочисленные дискуссии, и я убежден, что такие дебаты необходимы, поскольку недооценка или переоценка опасности ИИ могут привести к серьезным проблемам.

Чем заменить AutoGPT?

Теперь же перейдем к описанию возможной альтернативы существующим GPT агентам, а именно — создание GPT-агентов с использованием узлов (нод). Потенциально, GPT-агенты на основе узлов помогут преодолеть некоторые ограничения и проблемы, связанные с текущими GPT-агентами. Подход на основе узлов предполагает использование набора узлов, каждый из которых выполняет определенную функцию или задачу. Если вы знакомы с работой с материалами в Blender или использовали ComfyUI для StableDiffusion, то вы уже имеете представление о том, как это работает.

Использование GPT-агентов на основе узлов может представлять интерес для пользователей, которые хотят получить больше контроля над работой ИИ. Вместо того чтобы передавать всю задачу на решение ИИ, как это делается в AutoGPT, пользователь может разбить задачу на отдельные шаги или операции и назначить каждому из них отдельный узел. Это позволяет контролировать каждый этап работы ИИ и внести корректировки при необходимости.

Пример использования

Для примера соберем агента, который читает Python код из указанного файла, находит в нем ошибки и исправляет их. Создадим простой нод, который ищет ошибки в указанном коде и возвращает список ошибок.

Добавим ещё несколько нодов, такие как ввод от пользователя, чтение из файла и прочее.

Плюсы и минусы (в сравнении с AutoGPT)

К сильным сторонам такого интерфейса определенно относится безопасность - ИИ в этом случае не получает больше самостоятельности, чем необходимо для решения конкретной задачи. ИИ тратит на выполнение задач намного меньше токенов, чем в AutoGPT, поэтому такой способ дешевле.

Важно упомянуть, что подобный подход дает возможность более тонкой настройки работы ИИ. Вместо того чтобы доверять решение сложной задачи единому GPT-агенту, можно настроить отдельные узлы так, чтобы они специализировались на выполнении определенных типов задач. Например, один узел может быть оптимизирован для работы с текстами, другой - для анализа данных, третий - для выполнения математических операций и т.д.

Однако, несмотря на все преимущества, GPT-агенты на основе узлов не лишены недостатков. Во-первых, несмотря на повышенный уровень контроля, настройка и управление множеством узлов может стать сложной задачей, особенно для пользователей, которые только начинают свое знакомство с технологиями ИИ. Особенно это актуально, если задачи становятся все более сложными и требуют большого количества специализированных узлов.

Во-вторых, подход на основе узлов может привести к уменьшению гибкости решений. Поскольку каждый узел специализируется на выполнении конкретной задачи, возможность для ИИ "думать за пределами коробки" и находить новые, креативные пути решения задач может быть ограничена. Это может быть недостатком в тех случаях, когда необходимо найти нестандартные решения или когда задача не подразумевает четко определенного пути решения.

Наконец, использование GPT-агентов на основе узлов требует от пользователя более глубокого понимания проблематики и функционирования ИИ. Это может быть барьером для широкого применения данной технологии среди обычных пользователей, не имеющих достаточного уровня технических знаний.

На данный момент это всего лишь концепт, и я только начинаю работу над приложением. Я буду рад, если вы захотите присоединиться к разработке - не стесняйтесь писать мне. Если вам будет интересно следить за ходом разработки, добро пожаловать в группу ВК.

Комментарии (2)


  1. holodoz
    21.05.2023 19:44
    +1

    Это очень похоже на LangChain, или я что-то упускаю?


  1. VPryadchenko
    21.05.2023 19:44

    Первая задача: опиши граф для решения задачи. :)