Третьего дня я решил сделать лид-магнит для своего Telegram-канала. Схема такая - бот собирает у пользователя текст, обрабатывает его нейросетью, выдает что-то полезное, и в конце просит подписаться на канал в обмен на результат. Aiogram 3, Python, VPS за 150 рублей - ничего необычного.

Встал первый вопрос - за что платить? Бот прототипный, аудитория на входе пока еще, собственно, не особо и понятно сколько человек. Платить $20 в месяц ради теста гипотезы - нет. Мы не ищем легких путей. Пошел разбираться, что вообще бесплатного есть.

Groq

console.groq.com

Groq работает на собственных чипах LPU, инференс - Llama 3.1 8B выдает около 2 000 токенов в секунду. API OpenAI-совместимый.

Есть вполне реальные лимиты бесплатного плана:

Chat / LLM:

Модель

Запросов/мин

Запросов/день

Токенов/мин

Токенов/день

llama-3.1-8b-instant

30

14 400

6 000

500 000

llama-3.3-70b-versatile

30

1 000

12 000

100 000

openai/gpt-oss-120b

30

1 000

8 000

200 000

openai/gpt-oss-20b

30

1 000

8 000

200 000

qwen/qwen3-32b

60

1 000

6 000

500 000

llama-4-scout-17b

30

1 000

30 000

500 000

groq/compound

30

250

70 000

без лимита

groq/compound-mini

30

250

70 000

без лимита

14 400 запросов в день от Llama 3.1 8B - это 10 запросов в минуту на протяжении 24 часов. Для прототипного бота с сотнями пользователей - более чем хватит.

Speech-to-Text (если бот принимает голосовые):

Модель

Запросов/мин

Запросов/день

Секунд аудио/день

whisper-large-v3

20

2 000

28 800

whisper-large-v3-turbo

20

2 000

28 800

Очень даже неплохо.

Text-to-Speech (если нужны голосовые ответы):

Модель

Запросов/мин

Запросов/день

orpheus-v1-english

10

100

orpheus-arabic-saudi

10

100

100 запросов в день по TTS - немного. Для статусных сообщений или приветствий хватит, для основного контента - нет.

OpenRouter - агрегатор с бесплатными моделями

openrouter.ai - регистрация, ключ, и сразу доступ к моделям.

Лимиты для бесплатных моделей:

  • 20 запросов в минуту

  • 50 запросов в день - без пополнения счета

  • 1 000 запросов в день - после пополнения от $10 (деньги не тратятся на :free модели)

Актуальные бесплатные модели на май 2026, все по $0/1M токенов:

Модель

Контекст

qwen3-coder-480b-a35b

1 050K

kimi-k2.6

262K

gemma-4-26b-a4b

262K

llama-3.3-70b-instruct

131K

minimax-m2.5

205K

hermes-3-405b-instruct

131K

qwen3-next-80b-a3b-instruct

262K

lfm2.5-1.2b-thinking

33K

Есть еща такая штука openrouter/free. Он сам выбирает из доступных бесплатных ту, что поддерживает параметры запроса.

Google Gemini API - есть бесплатный тир, но с оговоркой

aistudio.google.com/apikey

Актуальные модели на май 2026 с бесплатным доступом:

  • gemini-2.5-flash

  • gemini-2.5-flash-lite

  • gemini-2.5-pro

  • gemini-3.1-flash-lite

  • gemini-3.5-flash

Важный момент: на бесплатном тире промпты и ответы используются для обучения Google. Если бот обрабатывает данные, которые пользователь не собирался никуда передавать - это нужно учитывать. На платном тире обучение отключается.

Cloudflare Workers AI - 10 000 Neurons в день

developers.cloudflare.com/workers-ai

Бесплатно: 10 000 Neurons в день (сбрасывается в 00:00 UTC).
Выше квоты: $0.011 за 1 000 Neurons - нужен Workers Paid план ($5/мес).

100+ моделей: Llama, Mistral, Qwen, Phi, Stable Diffusion и другие.

ElevenLabs - если нужен TTS

elevenlabs.io

Plan

Credits/мес

~Минут TTS

Free

10 000

~10 мин

Starter

30 000

~30 мин

10 000 кредитов в месяц - это примерно 10 минут синтезированной речи. Для приветствий или разовых сообщений в боте - хватит. Важно: Free план не дает коммерческой лицензии, только личное использование.

DeepL - если нужен перевод

deepl.com/en/checkout?is_api=true - ключ после регистрации.

Параметр

Значение

Символов/месяц

500 000

Изображения (beta)

Не тарифицируются

Word/Excel/PDF/PPT

до 10 MB и 500K символов

500K символов в месяц - это примерно 350 страниц A4. 

OCR.space - если нужно распознавание текста с картинок

ocr.space/ocrapi/freekey

Параметр

Значение

Запросов/день

500 (по IP)

Engine 1/2 в месяц

25 000 конвертаций

Engine 3 в месяц

2 500 конвертаций

Engine 3 - рукописный текст, таблицы в Markdown, 200+ языков.


По итогу, основная модель у меня - llama-3.3-70b-versatile. 1 000 запросов в день для теста гипотезы очень даже хватает - пока при моем мелком потоке пользователей до потолка еще не добрался. 

Если лимиты начнут упираться (очень на это надеюсь) - буду переходить на что-то уже более масштабируемое.

Надеюсь, Вам было полезно. Здоровья и хорошего настроения, дорогие читатели.

Комментарии (19)


  1. alwaysdeterminated
    29.05.2026 21:44

    Полезно! thx


  1. Maxim_Q
    29.05.2026 21:44

    Какие из бесплатных нейросетей самые умные и дают хорошие ответы, а какие потупее? Что вы протестировали и какие выводы сделали?


  1. Dreams_and_magic
    29.05.2026 21:44

    Список бесплатных моделей в openrouter у вас не адекватен. Не всё, на что написано free, то реально работает. Нужно проверять через playground. И сделать fallback цепочку из бесплатных РАБОТАЮЩИХ моделей, в конце freerouter модель и в самом конце платная. Список перепроверять не реже 1 раза в месяц.

    Вообще, у всех бесплатных лимитов и у всех услуг у всех провайдеров всегда есть ограничение, в которые вы сразу упрётесь при масштабировании - количество запросов в секунду. Это специально сделано, чтобы не использовали как халяву для энтерпрайза. Поэтому бесплатное можно обычно использовать либо при прототипировании, либо примерно при 5-10 активных юзерах:)

    Для прототипа с использованием openrouter можно подключить очень дешёвые платные модели, типа https://openrouter.ai/tencent/hy3-preview и https://openrouter.ai/deepseek/deepseek-v4-flash.

    Про Google Gemini API - в списке есть например Gemini 2.5 Flash это бесплатно 20 запросов в день, ну это ерунда. Нормальный лимит лишь у моделей Gemma 4 31B и Gemma 4 26B по 1500 запросов в день, но я бы не назвал эти модели пригодными для чего-то серьёзного.

    Лимитов бесплатного Cloudflare Workers AI не хватит почти ни на что.

    Ещё есть бесплатные лимиты у:
    Cerebras
    Mistral
    Китайские провайдеры типа Cherry (но там ХЗ как платить)

    Про голос на русском языке: бесплатные лимиты TTS/STT есть у SaluteSpeech.

    ЗЫ Ещё есть бесплатные сервисы погоды, медицинских диагнозов и лекарств, курсы валют... :)



    1. A-Dobrii
      29.05.2026 21:44

      Интересно а если делать не переключение если не работает, а просто постоянно ратирова запросы в разные модели?

      Тогда лимиты будут уходить "плавнее", возможно вообще с лимитами не сталкнешся .

      Идея да


      1. Dreams_and_magic
        29.05.2026 21:44

        Лимиты есть либо в пределах всего сервиса (как в openrouter), либо в пределах модели (как у Mistral). В первом случае вы просто не пройдёте через бутылочное горлышко, во втором будете параллельно сжигать лимиты при том же бутылочном горлышке. Поэтому используется последовательный перебор при отказах.



        1. A-Dobrii
          29.05.2026 21:44

          А где я сказал делать ротатор в пределах одного сервиса?


    1. Ratenti
      29.05.2026 21:44

      Да, нужны статьи на эти темы, верная мысль

      ЗЫ Ещё есть бесплатные сервисы погоды, медицинских диагнозов и лекарств, курсы валют... :)


      1. Dreams_and_magic
        29.05.2026 21:44

        ага, чтобы минусов наставили))


    1. Neyroskuf
      29.05.2026 21:44

      Я, прошу прощения заранее, возможно, я чего-то не понял, но, по моему скромному мнению, тут человек описывал возможность реализации, а не качественное сравнение моделей или их реальной адаптации под задачу. Рискну предположить, что было бы гораздо полезнее в контектсе самой темы - добавить недостающие элементы. А не иронизировать по поводу сервисов погоды, медицинских диагнозов и лекарств.

      Никто не оспаривает вашу компетентность, но, возможно, нам, как скромным читателям, было бы в разы интереснее узнать про доступы, скажем, к тому жеж мистралу и церебрасу в бесплатной реализации, а не в накидывании говна на вентилятор.


      1. Dreams_and_magic
        29.05.2026 21:44

        Возможность реализации напрямую связана с работоспособностью. То, что не работает, то не реализуемо. Просто список free моделей в openrouter не работает, потому что работает по факту штук пять моделей, и их список постоянно меняется - бесплатный сыр не навсегда (за исключением моделей Nemotron, но они слабые и медленные).

        "Рискну предположить, что было бы гораздо полезнее в контектсе самой темы - добавить недостающие элементы.  " - я их и добавил в комментарии.

        "А не иронизировать по поводу сервисов погоды, медицинских диагнозов и лекарств. " - почему иронизировать? Эти сервисы реально есть и работают в моём телеграм боте.

        "было бы в разы интереснее узнать про доступы, скажем, к тому жеж мистралу и церебрасу в бесплатной реализации " - там всё как обычно, ключ + формат вызова как в openai, т.е. https://api.cerebras.ai/v1/chat/completions и аналогично у Мистраль.

        Самое интересное у Мистраль - возможность использовать их недавно вышедшую плотную версию mistral-medium-3-5, там лимиты в free tier:

        mistral-medium-3-5

        Tokens per Minute

        50 000

        Tokens per Month

        4 000 000

        Requests per Second

        1.00

        Бутылочное горлышко - 1 запрос в секунду.

        У Cеrebras главное ограничение - маленькое окно данных (почти у всех моделей 130тыс токенов). Но и для этого есть применения. Например, я его использую в телеграм боте в инлайн-режиме, там получаются короткие ответы со скоростью 3000 токенов в секунду, т.е. мгновенно.


        "а не в накидывании говна на вентилятор " - чойта сразу говна? у меня вполне конструктивная критика проблемных мест :)


        1. SensDj
          29.05.2026 21:44

          Openrouter прислал письмо что с Россией больше не работает, дал мне 30 дней дотратить мои 20 баксов


          1. amatoravg
            29.05.2026 21:44

            А если под квн заходить?


      1. MountainGoat
        29.05.2026 21:44

        Постоянно мухлевать какие-то списки, и чтобы всё то и дело отваливалось, чтобы не потратить 5 долларов – это диагноз.


        1. A-Dobrii
          29.05.2026 21:44

          Ну представь у тебя подключено 100 разный сервисов, на каждом по 100 аккаунтов, ....


    1. Geologist5330
      29.05.2026 21:44

      И сделать fallback цепочку из бесплатных РАБОТАЮЩИХ моделей

      Звучит так, словно это может прилично увеличить время до ответа. Но для прототипов и пет-проектов, наверное, норм.


  1. NeoCode2
    29.05.2026 21:44

    Интересно есть ли бесплатный API у обычного Grok и ChatGPT? А то так получается что доступ к ним из РФ заблокирован с их стороны, и если к тому что заблокировано со стороны РФ есть куча других способов получить доступ, то вот к этим чатам - только vps с vless+xhttp, который работает все хуже. Но ведь для чатботов трафик минимальный. И возникает мысль - а что если работать через ssh? Или вообще по email? Написать клиента какого-нибудь...

    Или нужен "безголовый" браузер на vps, на котором есть DOM и JS но нет рендеринга, и парсить ответы таким способом?


    1. K0Jlya9
      29.05.2026 21:44

      Grok и ChatGPT

      Эти двое доступны без впна через сервисы для обхода геоблокировок. Типа такого https://dns.geohide.ru:8443/

      Топовый раздаватель API халявы сейчас - гугол с gemini, там моделька 3.1 лайт дает 500 запросов в сутки на рыло, более чем достаточно для 1 человека.

      Следующий за ним - мистраль. У него из интересного есть ocr, недоделанный как и всё от этого провайдера. Качество низкое но зато много.

      Грок и церебрас почти ничего полезного не дают, виспер только и компаунд(встроенный поиск и лимиты приличные), остальные модели там слишком сильно зарезаны или устарели и неактуальны для нас(ттс не поддерживает русский).

      Гемма от гугла с одной стороны по всем бенчмаркам очень хороша, и почти без лимитов, а с другой гугол ее как то испортил на своем бесплатном сервисе, системный промпт она не поддерживает, инструменты и json по-моему тоже, не помню, но в целом она какая то несъедобная там.

      Опенроутер никогда халявы нормальной не давал, даже с 10 баксовым аккаунтом.


  1. Apogee
    29.05.2026 21:44

    Есть бесплатные glm 4.5 и 4.7 в api z.ai

    https://docs.z.ai/guides/overview/pricing

    GLM-4.7-Flash


  1. d3d14
    29.05.2026 21:44

    Зачем вообще так остервенело все собирают подписчиков в свои каналы? На фоне спада в ИТ, монетизируют их?