Вам никогда не хотелось узнать, что растет у вас под ногами? Мне – всегда! Но, увы, растения подписаны только в Ботаническом саду.

Раньше мне приходилось использовать интернет-поисковики, Google Lens, ботанические приложения и, наконец, бумажные определители.

Определитель альпийских цветов
Определитель альпийских цветов

ChatGPT 4 существенно упростил задачу. Оказалось, что он

  • неплохо определяет растения даже без цветков или плодов;

  • не требователен к качеству фото;

  • замечает мельчайшие детали.

Ему есть что сказать даже о случайной траве под ногами, не говоря уже о более сложных композициях:

Где кончается лодка и начинается клумба?
Где кончается лодка и начинается клумба?

На фотографии можно увидеть несколько видов растений. Среди них:

1. Желтые цветы в передней части композиции — это Рудбекия (Rudbeckia).

2. Фиолетовые цветы — вероятно, это Лаванда (Lavandula) или Шалфей (Salvia).

3. Высокие травы на заднем плане — вероятно, декоративные злаки, такие как Мискантус (Miscanthus) или Перистощетинник (Pennisetum).

Ботанический бот

Словом, после очередной прогулки по парку я засела писать Telegram-бота, который принимал картинку, отправлял ее в ChatGPT с промптом «Определи растение на фото» и выдавал ответ.

Киллер-фичей моего бота был этот банальный промпт, благодаря которому идентификация растений происходила тут же на месте съемки, делая его интересным собеседником для прогулок.

В первые дни после запуска бота, выходя на улицу, я не выпускала из рук телефон. Каждую встреченную травинку-былинку я скармливала своему виртуальному тамагочи, который поразительно верно комментировал все полученное.

Оказалось, что на обочинах дорог, по которым я хожу каждый день, растут люцерна, цикорий, лисохвост, щетинник, тимьян, портулак, якорцы, спорыш и даже амарант, а над головой шелестят клен, ясень, катальпа и сумах. Мир изменился! Мой словарный запас —тоже)

Наигравшись с ботом, я поняла, что его потенциал не ограничивается одним-единственным промптом. Есть немало других повседневных задач, укладывающихся в схему «неизменный промпт + изменяемые данные». Например, подсчет калорийности съеденных за день продуктов. Есть уже чей-то бот с ИИ, который это делает. Чем он отличается от моего ботанического? Промптом!

Универсальный бот

Вот моя новая киллер-фича – универсальность. Для ее реализации я подключила к боту PostgreSQL, чтобы хранить промпты пользователей. Для промптов реализована стандартная CRUD-логика.

Команды бота
Команды бота

Выбор промпта включает режим его использования, в котором он будет автоматически добавляться к любому запросу.

Теперь ко всем присланным боту фотографиям будет добавляться текст: "Что на фото?"
Теперь ко всем присланным боту фотографиям будет добавляться текст: "Что на фото?"

Можно отменить использование промпта и просто отправить запрос к ChatGPT:

Запрос без промпта
Запрос без промпта

В бесплатной версии число запросов от одного пользователя ограничено 10, в платной – 50. Оплатить месячную подписку можно здесь же в боте через ЮKassа, стоимость символическая.

В данный момент бот не хранит историю запросов и, соответственно, не поддерживает контекст переписки.

Справка по командам бота
Справка по командам бота

Запускайте бота https://t.me/findplantbot и гуляйте в парках!)

Комментарии (14)


  1. d-sh
    27.10.2024 13:40

    Открой для себя google gemini из ai.google.dev

    1 бесплатный аккаунт там дает 1500 запросов в день, до 15 в минуту.

    Аккаунтов можно сделать несколько.

    Умеет отвечать на картинки, тексты и голосовые сообщения.

    Работает +- так же как чатгпт.


    1. Ioanna Автор
      27.10.2024 13:40

      Спасибо за информацию!


  1. kryvichh
    27.10.2024 13:40

    А действительно ли там были названные растения, или ChatGPT мог ошибаться?


    1. Ioanna Автор
      27.10.2024 13:40

      Иногда ошибается, особенно, если фото нечеткое или если на фото только листья. Но в целом мне нравится его точность.


  1. TVBig
    27.10.2024 13:40

    Добрый день. Отличная разработка, спасибо.
    А вы не предполагаете расширить список поддерживаемых форматов документов (помимо фото), чтобы более эффективно взаимодействовать с chatGPT?


    1. Ioanna Автор
      27.10.2024 13:40

      Думала о добавлении голосовых сообщений, но, насколько я понимаю, они сильно увеличат трафик между ботом и OpenAI API и, соответственно, стоимость этого трафика.


      1. d-sh
        27.10.2024 13:40

        Что за трафик? Виртуальный сервер с безлимитным трафиком подходящий для гпт ботов стоит ~3 доллара в месяц.


        1. Ioanna Автор
          27.10.2024 13:40

          Да, но изображение съедает больше токенов, чем текст, по моим наблюдениям.


    1. d-sh
      27.10.2024 13:40

      А как ты себе это представляешь, как это должно работать, может уже есть такое.


  1. alexandrodua
    27.10.2024 13:40

    Главное не употреблять в пищу ничего на основе его распознаваний. Ибо на каком грибе он решит (вместе с тобой) погаллюцинировать никогда не узнаешь.


  1. ConstantCold
    27.10.2024 13:40

    Классно! Жаль только, что есть ограничение на вывод результата запроса в одном сообщении. Если ответ слишком большой, то обрезает его


    1. Ioanna Автор
      27.10.2024 13:40

      Да, для тестирования было так, но я исправлю.


  1. psemilanceata
    27.10.2024 13:40

    По секрету, только тсс: уже лет 5-7 как пользуюсь несколькими приложениями с гугл плея, которые по фото наиотличнейше определяют растения. А для вас это какое-то ноу-хау?)


    1. Ioanna Автор
      27.10.2024 13:40

      Эти приложения я как раз упомянула во втором абзаце своей статьи.