А есть ли бесплатные API нейросетей? / forpes.ru

Главная
А есть ли бесплатные API нейросетей?

А есть ли бесплатные API нейросетей? +68

29.05.2026 21:08

ArthurEx 62 28000 Источник

Третьего дня я решил сделать лид-магнит для своего Telegram-канала. Схема такая - бот собирает у пользователя текст, обрабатывает его нейросетью, выдает что-то полезное, и в конце просит подписаться на канал в обмен на результат. Aiogram 3, Python, VPS за 150 рублей - ничего необычного.

Встал первый вопрос - за что платить? Бот прототипный, аудитория на входе пока еще, собственно, не особо и понятно сколько человек. Платить $20 в месяц ради теста гипотезы - нет. Мы не ищем легких путей. Пошел разбираться, что вообще бесплатного есть.

Groq

console.groq.com

Groq работает на собственных чипах LPU, инференс - Llama 3.1 8B выдает около 2 000 токенов в секунду. API OpenAI-совместимый.

Есть вполне реальные лимиты бесплатного плана:

Chat / LLM:

Модель	Запросов/мин	Запросов/день	Токенов/мин	Токенов/день
llama-3.1-8b-instant	30	14 400	6 000	500 000
llama-3.3-70b-versatile	30	1 000	12 000	100 000
openai/gpt-oss-120b	30	1 000	8 000	200 000
openai/gpt-oss-20b	30	1 000	8 000	200 000
qwen/qwen3-32b	60	1 000	6 000	500 000
llama-4-scout-17b	30	1 000	30 000	500 000
groq/compound	30	250	70 000	без лимита
groq/compound-mini	30	250	70 000	без лимита

14 400 запросов в день от Llama 3.1 8B - это 10 запросов в минуту на протяжении 24 часов. Для прототипного бота с сотнями пользователей - более чем хватит.

Speech-to-Text (если бот принимает голосовые):

Модель	Запросов/мин	Запросов/день	Секунд аудио/день
whisper-large-v3	20	2 000	28 800
whisper-large-v3-turbo	20	2 000	28 800

Очень даже неплохо.

Text-to-Speech (если нужны голосовые ответы):

Модель	Запросов/мин	Запросов/день
orpheus-v1-english	10	100
orpheus-arabic-saudi	10	100

100 запросов в день по TTS - немного. Для статусных сообщений или приветствий хватит, для основного контента - нет.

OpenRouter - агрегатор с бесплатными моделями

openrouter.ai - регистрация, ключ, и сразу доступ к моделям.

Лимиты для бесплатных моделей:

20 запросов в минуту
50 запросов в день - без пополнения счета
1 000 запросов в день - после пополнения от $10 (деньги не тратятся на :free модели)

Актуальные бесплатные модели на май 2026, все по $0/1M токенов:

Модель	Контекст
qwen3-coder-480b-a35b	1 050K
kimi-k2.6	262K
gemma-4-26b-a4b	262K
llama-3.3-70b-instruct	131K
minimax-m2.5	205K
hermes-3-405b-instruct	131K
qwen3-next-80b-a3b-instruct	262K
lfm2.5-1.2b-thinking	33K

Есть еща такая штука openrouter/free. Он сам выбирает из доступных бесплатных ту, что поддерживает параметры запроса.

Google Gemini API - есть бесплатный тир, но с оговоркой

aistudio.google.com/apikey

Актуальные модели на май 2026 с бесплатным доступом:

gemini-2.5-flash
gemini-2.5-flash-lite
gemini-2.5-pro
gemini-3.1-flash-lite
gemini-3.5-flash

Важный момент: на бесплатном тире промпты и ответы используются для обучения Google. Если бот обрабатывает данные, которые пользователь не собирался никуда передавать - это нужно учитывать. На платном тире обучение отключается.

Cloudflare Workers AI - 10 000 Neurons в день

developers.cloudflare.com/workers-ai

Бесплатно: 10 000 Neurons в день (сбрасывается в 00:00 UTC).
Выше квоты: $0.011 за 1 000 Neurons - нужен Workers Paid план ($5/мес).

100+ моделей: Llama, Mistral, Qwen, Phi, Stable Diffusion и другие.

ElevenLabs - если нужен TTS

elevenlabs.io

Plan	Credits/мес	~Минут TTS
Free	10 000	~10 мин
Starter	30 000	~30 мин

10 000 кредитов в месяц - это примерно 10 минут синтезированной речи. Для приветствий или разовых сообщений в боте - хватит. Важно: Free план не дает коммерческой лицензии, только личное использование.

DeepL - если нужен перевод

deepl.com/en/checkout?is_api=true - ключ после регистрации.

Параметр	Значение
Символов/месяц	500 000
Изображения (beta)	Не тарифицируются
Word/Excel/PDF/PPT	до 10 MB и 500K символов

500K символов в месяц - это примерно 350 страниц A4.

OCR.space - если нужно распознавание текста с картинок

ocr.space/ocrapi/freekey

Параметр	Значение
Запросов/день	500 (по IP)
Engine 1/2 в месяц	25 000 конвертаций
Engine 3 в месяц	2 500 конвертаций

Engine 3 - рукописный текст, таблицы в Markdown, 200+ языков.

По итогу, основная модель у меня - llama-3.3-70b-versatile. 1 000 запросов в день для теста гипотезы очень даже хватает - пока при моем мелком потоке пользователей до потолка еще не добрался.

Если лимиты начнут упираться (очень на это надеюсь) - буду переходить на что-то уже более масштабируемое.

Надеюсь, Вам было полезно. Здоровья и хорошего настроения, дорогие читатели.

Комментарии (62)

Maxim_Q
29.05.2026 21:59
#30038902
Какие из бесплатных нейросетей самые умные и дают хорошие ответы, а какие потупее? Что вы протестировали и какие выводы сделали?
1. KREC_fuse
  29.05.2026 21:59
  #30046840
  Перевожу:всё исследование, которое ты тут провел - не достаточно для меня. Пока я продолжаю лежать на диване, проведи перекрестные тесты и сообщи мне результат по наилучшей выборке их этих моделей.
1. Reiske
  29.05.2026 21:59
  #30046852
  Посмотри minstral, на gpt4, клбчи бесплатные, работает без впн
1. FreeTheOS
  29.05.2026 21:59
  #30046862
  у mistral в groq 30 запросов в минуту и 14 400 в день, отвечает конечно не как клод, но нормально, использовал для юзербота в телеграмм, выполняет такую задачу вполне хорошо, тулзы вызывает тоже нормально

Dreams_and_magic
29.05.2026 21:59
#30038910
Список бесплатных моделей в openrouter у вас не адекватен. Не всё, на что написано free, то реально работает. Нужно проверять через playground. И сделать fallback цепочку из бесплатных РАБОТАЮЩИХ моделей, в конце freerouter модель и в самом конце платная. Список перепроверять не реже 1 раза в месяц.

Вообще, у всех бесплатных лимитов и у всех услуг у всех провайдеров всегда есть ограничение, в которые вы сразу упрётесь при масштабировании - количество запросов в секунду. Это специально сделано, чтобы не использовали как халяву для энтерпрайза. Поэтому бесплатное можно обычно использовать либо при прототипировании, либо примерно при 5-10 активных юзерах:)

Для прототипа с использованием openrouter можно подключить очень дешёвые платные модели, типа https://openrouter.ai/tencent/hy3-preview и https://openrouter.ai/deepseek/deepseek-v4-flash.

Про Google Gemini API - в списке есть например Gemini 2.5 Flash это бесплатно 20 запросов в день, ну это ерунда. Нормальный лимит лишь у моделей Gemma 4 31B и Gemma 4 26B по 1500 запросов в день, но я бы не назвал эти модели пригодными для чего-то серьёзного.

Лимитов бесплатного Cloudflare Workers AI не хватит почти ни на что.

Ещё есть бесплатные лимиты у:
Cerebras
Mistral
Китайские провайдеры типа Cherry (но там ХЗ как платить)

Про голос на русском языке: бесплатные лимиты TTS/STT есть у SaluteSpeech.

ЗЫ Ещё есть бесплатные сервисы погоды, медицинских диагнозов и лекарств, курсы валют... :)
1. A-Dobrii
  29.05.2026 21:59
  #30038932
  Интересно а если делать не переключение если не работает, а просто постоянно ратирова запросы в разные модели?
  
  Тогда лимиты будут уходить "плавнее", возможно вообще с лимитами не сталкнешся .
  
  Идея да
  1. Dreams_and_magic
    29.05.2026 21:59
    #30038984
    Лимиты есть либо в пределах всего сервиса (как в openrouter), либо в пределах модели (как у Mistral). В первом случае вы просто не пройдёте через бутылочное горлышко, во втором будете параллельно сжигать лимиты при том же бутылочном горлышке. Поэтому используется последовательный перебор при отказах.
    
    A-Dobrii
    29.05.2026 21:59
    #30039372
    А где я сказал делать ротатор в пределах одного сервиса?
  1. AlexTest
    29.05.2026 21:59
    #30040332
    А если например старый добрый "мультиаккаунтинг" - распределять нагрузку на несколько бесплатных аккаунтов, насколько серьезные барьеры могут быть в этом направлении ?
    
    riky
    29.05.2026 21:59
    #30042322
    Год, два назад это бы хорошо работало. Но сейчас все личных агентов ставят и все бесплатные сервисы абузят, поэтому лимиты везде низкие. Пробовал мультиакк недавно на cerebras (с прокси конечно) на запросы с маленьким контекстом вроде нормально работает, но при реальной нагрузке типа openclaw все сразу падает, отвечает ошибками. Пока пришёл к тому что проще дешёвые модели использовать. За небольшую плату работает без проблем. Полгода назад у Gemini были просто царские бесплатные лимиты. Можно было десятки долларов в день с акка экономить. А сейчас везде очень слабые нейронки и лимиты смешные. Хотя если задача прям очень простая то пойдёт. До сих пор сервис автоответов на отзывы на гроке бесплатном работает.
1. Ratenti
  29.05.2026 21:59
  #30039036
  Да, нужны статьи на эти темы, верная мысль
  
  ЗЫ Ещё есть бесплатные сервисы погоды, медицинских диагнозов и лекарств, курсы валют... :)
  1. Dreams_and_magic
    29.05.2026 21:59
    #30039046
    ага, чтобы минусов наставили))
1. Neyroskuf
  29.05.2026 21:59
  #30039048
  Я, прошу прощения заранее, возможно, я чего-то не понял, но, по моему скромному мнению, тут человек описывал возможность реализации, а не качественное сравнение моделей или их реальной адаптации под задачу. Рискну предположить, что было бы гораздо полезнее в контектсе самой темы - добавить недостающие элементы. А не иронизировать по поводу сервисов погоды, медицинских диагнозов и лекарств.
  
  Никто не оспаривает вашу компетентность, но, возможно, нам, как скромным читателям, было бы в разы интереснее узнать про доступы, скажем, к тому жеж мистралу и церебрасу в бесплатной реализации, а не в накидывании говна на вентилятор.
  1. Dreams_and_magic
    29.05.2026 21:59
    #30039068
    Возможность реализации напрямую связана с работоспособностью. То, что не работает, то не реализуемо. Просто список free моделей в openrouter не работает, потому что работает по факту штук пять моделей, и их список постоянно меняется - бесплатный сыр не навсегда (за исключением моделей Nemotron, но они слабые и медленные).
    
    "Рискну предположить, что было бы гораздо полезнее в контектсе самой темы - добавить недостающие элементы. " - я их и добавил в комментарии.
    
    "А не иронизировать по поводу сервисов погоды, медицинских диагнозов и лекарств. " - почему иронизировать? Эти сервисы реально есть и работают в моём телеграм боте.
    
    "было бы в разы интереснее узнать про доступы, скажем, к тому жеж мистралу и церебрасу в бесплатной реализации " - там всё как обычно, ключ + формат вызова как в openai, т.е. https://api.cerebras.ai/v1/chat/completions и аналогично у Мистраль.
    
    Самое интересное у Мистраль - возможность использовать их недавно вышедшую плотную версию mistral-medium-3-5, там лимиты в free tier:
    
    mistral-medium-3-5
    
    Tokens per Minute
    
    50 000
    
    Tokens per Month
    
    4 000 000
    
    Requests per Second
    
    1.00
    
    Бутылочное горлышко - 1 запрос в секунду.
    
    У Cеrebras главное ограничение - маленькое окно данных (почти у всех моделей 130тыс токенов). Но и для этого есть применения. Например, я его использую в телеграм боте в инлайн-режиме, там получаются короткие ответы со скоростью 3000 токенов в секунду, т.е. мгновенно.
    
    "а не в накидывании говна на вентилятор " - чойта сразу говна? у меня вполне конструктивная критика проблемных мест :)
    
    SensDj
    29.05.2026 21:59
    #30039248
    Openrouter прислал письмо что с Россией больше не работает, дал мне 30 дней дотратить мои 20 баксов
    
    amatoravg
    29.05.2026 21:59
    #30039370
    А если под квн заходить?
    
    SensDj
    29.05.2026 21:59
    #30039408
    Логинился через гмэйл без впн. По аккаунту решение ими уже принято, проверять поздно. Вот жду может на Хабре кто-то напишет как лучше действовать на будущее... возможно нужен аккаунт зарегенный в другой стране
  1. MountainGoat
    29.05.2026 21:59
    #30039258
    Постоянно мухлевать какие-то списки, и чтобы всё то и дело отваливалось, чтобы не потратить 5 долларов – это диагноз.
    
    A-Dobrii
    29.05.2026 21:59
    #30039374
    Ну представь у тебя подключено 100 разный сервисов, на каждом по 100 аккаунтов, ....
    
    DanielKross
    29.05.2026 21:59
    #30039900
    А накуа? Многовато для пет проектов. А если не пет проекты, для коммерции нужна стабильность, а не искать бесплатные, отваливающиеся сервисы. Для пет проектов наверное проще тогда купить что-то типа 3090, за 600-700 евро и баловаться сколько влезет.
    
    Dreams_and_magic
    29.05.2026 21:59
    #30040568
    Представьте, что вас забанят за такие фокусы:)
    
    riky
    29.05.2026 21:59
    #30042334
    В этом и Проблема бесплатных лимитов, даже если 100 чел так сделает то знатно абузит сервисы и поэтому реальные лимиты заметно ниже и по количеству запросов и по длине контекста никто уже не гарантирует бесплатные лимиты
    
    Bunyaz39
    29.05.2026 21:59
    #30040018
    Пока трафика нет, жалко даже эти пять долларов отдавать. Но когда появляются реальные пользователи, проще заплатить и спать спокойно
1. Geologist5330
  29.05.2026 21:59
  #30039306
  И сделать fallback цепочку из бесплатных РАБОТАЮЩИХ моделей
  
  Звучит так, словно это может прилично увеличить время до ответа. Но для прототипов и пет-проектов, наверное, норм.
  1. Bunyaz39
    29.05.2026 21:59
    #30040032
    В принципе для прототипа сойдет любой костыль, лишь бы как-то работал. Когда появятся деньги, просто выкинешь этот мусор и подключишь стабильную платную апишку
  1. Dreams_and_magic
    29.05.2026 21:59
    #30040312
    Там отказ от генерации приходит за миллисекунды.
    
    "Но для прототипов и пет-проектов, наверное, норм. " - проблема не в скоростях, а в ограничениях. В любом случае на бесплатных тарифах всё медленнее и ненадёжнее, чем на платных, и модели как правило доступны только слабые.

NeoCode2
29.05.2026 21:59
#30039058
Интересно есть ли бесплатный API у обычного Grok и ChatGPT? А то так получается что доступ к ним из РФ заблокирован с их стороны, и если к тому что заблокировано со стороны РФ есть куча других способов получить доступ, то вот к этим чатам - только vps с vless+xhttp, который работает все хуже. Но ведь для чатботов трафик минимальный. И возникает мысль - а что если работать через ssh? Или вообще по email? Написать клиента какого-нибудь...

Или нужен "безголовый" браузер на vps, на котором есть DOM и JS но нет рендеринга, и парсить ответы таким способом?
1. K0Jlya9
  29.05.2026 21:59
  #30039104
  Grok и ChatGPT
  
  Эти двое доступны без впна через сервисы для обхода геоблокировок. Типа такого https://dns.geohide.ru:8443/
  
  Топовый раздаватель API халявы сейчас - гугол с gemini, там моделька 3.1 лайт дает 500 запросов в сутки на рыло, более чем достаточно для 1 человека.
  
  Следующий за ним - мистраль. У него из интересного есть ocr, недоделанный как и всё от этого провайдера. Качество низкое но зато много.
  
  Грок и церебрас почти ничего полезного не дают, виспер только и компаунд(встроенный поиск и лимиты приличные), остальные модели там слишком сильно зарезаны или устарели и неактуальны для нас(ттс не поддерживает русский).
  
  Гемма от гугла с одной стороны по всем бенчмаркам очень хороша, и почти без лимитов, а с другой гугол ее как то испортил на своем бесплатном сервисе, системный промпт она не поддерживает, инструменты и json по-моему тоже, не помню, но в целом она какая то несъедобная там.
  
  Опенроутер никогда халявы нормальной не давал, даже с 10 баксовым аккаунтом.
  1. Dreams_and_magic
    29.05.2026 21:59
    #30040544
    В смысле не давал, 1000 запросов В ДЕНЬ на бесплатные модели.
    
    K0Jlya9
    29.05.2026 21:59
    #30040606
    В смысле приличных бесплатных моделей хер да маленько и они огорожены больше чем другие, например не дают сделать больше чем 1 запрос в минуту, или отвечают со скоростью черепахи, или у них отключена поддержка джейсонов или еще какая-нибудь хрень не дающая нормально использовать.
    
    Dreams_and_magic
    29.05.2026 21:59
    #30040920
    Когда промо-период у новых моделей, то всё летает:) А, так конечно, это всё чисто лишь бы что-нибудь было:) Любая халява это по сути реклама.
    
    Для бесплатного кодинга также можно использовать бесплатные модели в opencode, там они условно безлимитны и промо новых моделей периодически бывают. Gemini 3.1 Flash Lite слабовата в кодинге, главный плюс контент это 1М контент и поддержка картинок, имхо.
    
    dartraiden
    29.05.2026 21:59
    #30042100
    Для бесплатного кодинга ещё можно прикрутить бесплатный DeepSeek
    
    nidalee
    29.05.2026 21:59
    #30041958
    Там почти у каждой "бесплатной" модели свои лимиты. Потыкал пару недель назад эту бесплатность, понял, что городить огород с перебор моделей того не стоит.
  1. gmetan
    29.05.2026 21:59
    #30046844
    сервисы для обхода геоблокировок
    
    Насколько они безопасны? Они же по сути MITM, т.е. ты доверяешь им трафик. На чем основано доверие этим анонимным и бесплатным сервисам, которые нельзя проверить и нет результатов независимой проверки признанным квалифицированным аудитором? даже если трафик зашифрован (https), то теоретически можно его расшифровать.
  1. baytyone
    29.05.2026 21:59
    #30046954
    Нужны голосовые ответы на русском языке. Может быть знаете, и сможете подсказать что-то?
    
    K0Jlya9
    29.05.2026 21:59
    #30046984
    https://github.com/rany2/edge-tts
    
    Тут есть небольшое дополнение, можно выкачать сайт и посмотреть исходники и ресурсы https://edgetts.github.io/
1. den_rad
  29.05.2026 21:59
  #30039462
  Если пользоваться платным ChatGPT, доступ к нему можно получить через OpenRouter + BYOK – добавляете свой ключ ChatGPT в OpenRouter и ходите на OpenRouter, тратя кредиты ChatGPT
  1. Dreams_and_magic
    29.05.2026 21:59
    #30041968
    Да, но есть нюанс - BYOK в OpenRouter можно использовать только API-ключи с оплатой по использованию (pay-as-you-go), но не подписки типа Claude Pro и т.п.

Apogee
29.05.2026 21:59
#30039256
Есть бесплатные glm 4.5 и 4.7 в api z.ai

https://docs.z.ai/guides/overview/pricing

GLM-4.7-Flash

d3d14
29.05.2026 21:59
#30039384
Зачем вообще так остервенело все собирают подписчиков в свои каналы? На фоне спада в ИТ, монетизируют их?
1. A-Dobrii
  29.05.2026 21:59
  #30039396
  Это просто мода такая.
  
  Если вы не помните когда то предлагали всем подписаться на список рассылки, чуть позже в свой блог, потом зайдите в мой Твиттер,и теперь канал.
  
  А вообще - способ расширения личного графа общения, не обязательно прямая монетизация.
1. Bunyaz39
  29.05.2026 21:59
  #30040040
  Аудитория сейчас самый понятный актив. Рекламу продать или свой продукт запустить всегда проще, когда есть лояльная база читателей

RulenBagdasis
29.05.2026 21:59
#30039538
Наверняка, есть! Главное, помнить, что если ты что-то используешь и не платишь за это, ты не клиент, ты товар…
1. surefire
  29.05.2026 21:59
  #30039580
  И также помнить, что если ты что-то используешь и платишь за это, ты не только клиент, но еще и товар.
1. LinkToOS
  29.05.2026 21:59
  #30040088
  если ты что-то используешь и не платишь за это, ты не клиент, ты товар
  
  “Если ты не платишь, это не значит что тебя не используют.”
  А товаром ты быть не можешь. Информация о тебе может быть товаром.
  1. hachucha
    29.05.2026 21:59
    #30049844
    Человек не может быть только субъектом, в каких-то случаях он еще и объект. Поэтому его и называют здесь товаром. Человеком легко манипулировать, если есть достаточно мощности воздействия на него и информации о нем. Рыночная экономика является рыночной только для проигравших, кому продают сказки о том, что много людей не могут договориться. Пока нет гос.финансирования информационных технологий в замен на полную открытость механизмов, ты даже не поймешь, как и где именно тебя мониторят и заставляют "принимать" то или иное решение.

devoln
29.05.2026 21:59
#30039764
По моему опыту и на моих двух задачах Mistral, а конкретно ministral-8b/14b рулят с большим отрывом. Ни одна модель без размышлений с Cloudflare, даже в разы более дорогих (проверял вплоть ло Llama 70b), не смогла даже приблизиться к результатам ministral-8b, не говоря уже о 14b. Просто не слушаются и всё, нарушая правила и запреты, даже описанные несколько раз в промпте разными словами. Я долго искал фолбек, но не нашёл ничего подходящего. Придётся использовать разных провайдеров с той же ministral, где она редко встречается, дороже официальной и только платная или хостить самому.

Не знаю, может это эффект того, что я с самого начала работал с Mistral и подгонял промпт под уже устаревшую pixtral-12b - видимо предка ministral, или это объективно такие хорошие модели под мою задачу, для которой крайне важно следование инструкциям.
1. ququnta
  29.05.2026 21:59
  #30039826
  а чем gpt-oss не подходит? Министраль (девстраль-мини) немного туповата. Насчёт кодинга не знаю, но от реального мира она оторвана, что плохо.
  
  Единственное, гпт очень любит форматирование в маркдауне и ЛаТеКс в формулах. И болтлив. Но кодит вроде хорошо
  1. devoln
    29.05.2026 21:59
    #30039942
    ministral не для кодинга, а решение узкой задачи моего сервиса, под которую я подгоняю промпт. Одна задача - сочинить сцены по желаниям пользователя, с его участием, учитывая ограничения. Вторая - описать физические параметры тела пользователя по фотке, не описывая одежду, фон и другие предметы. Из всего этого потом генерируются фотки.
    
    GPT-OSS - рассуждающая модель, которая сожрёт в разы больше токенов, чего мне не надо. Мне нужен исполнитель, который слушается, а не думает сам.
    
    Для кодинга у меня платный Codex и иногда триал Windsurf.
  1. nidalee
    29.05.2026 21:59
    #30041966
    gpt-oss-120b в баш скрипте на 30 строк умудряется пролюбить перенос строки, оно для кодинга антиполезно.

Bunyaz39
29.05.2026 21:59
#30040012
Для локального тестирования гипотез это еще имеет смысл. Сразу заносить бабки в каждый новый сервис тоже не очень рационально, особенно когда половина из них отвалится через месяц

DamirMur
29.05.2026 21:59
#30040860
Там ещё фишка, если начал кодить на одной модели, то лучше продолжать кодить только на моделях этого семейства. Переключение на модели другого семейства, может похерить весь проект.
1. kuza2000
  29.05.2026 21:59
  #30041724
  Не совсем понял мысль. Что значит "начал кодить на одной модели"? А если я начал кодить сам, мне теперь до конца жизни кодить на этой модели?)

vagon333
29.05.2026 21:59
#30041360
Пользуюсь Groq последние два года.
Очень доволен.
Ежемесячные счета смешные, не превышали 4 доллара при очень интенсивной работе. Сейчас полтора доллара, после переноса некоторых моделей на домашний Inference.

Pavlp59
29.05.2026 21:59
#30042072
А что насчет российских сервисов? Gigachat, Алиса, у них есть халява?
1. Spencer098765
  29.05.2026 21:59
  #30042202
  У вас завидное чувство юмора )

TimurZhoraev
29.05.2026 21:59
#30042210
Если раньше охотились за битками то теперь будут за API ключами для токенов

Aelliari
29.05.2026 21:59
#30042304
Там вроде ещё «Невидиа» давала бесплатный доступ к нейронками для «не РФ», но нужна была иностранная симка для регистрации. Не знаю, правда, есть ли там геоблок по ip
1. Dreams_and_magic
  29.05.2026 21:59
  #30042312
  Там одноразовый небольшой лимит.

voronkovich
29.05.2026 21:59
#30042362
В самом простом случае, вместо API можно использовать CLI, передавая запрос через stdin:
```
echo 'You are helpful coding assistant... Your task is ...' | gemini

# Или так
gemini -p 'Generate commit message...'
```
Обычно, при использовании CLI (Gemini/Qwen) количество доступных бесплатных запросов больше чем в API (у Gemini 1000 RPD). Возможно для совсем простого чатбота этого хватит.

Я недавно сделал Bash-утилиту для генерации Git-коммитов, в которой вместо API используются именно CLI (gemini, qwen, aichat и т.д.). Так как коммитов каждый день я создаю много, я надеялся таким образом сэкономить деньги и не тратить оплаченные токены на такую простую задачу. Результат оказался не очень, особенно с моделями Groq: каждое второе сообщение приходилось редактировать через git commit --amend. Поэтому не стоит сильно надеяться на Groq. Запросы он обрабатывает быстро, но модели у него “тупые”.

В качестве источника для поиска “бесплатных” моделей могу посоветовать models.dev, там есть несколько провайдеров с free tier. Например, aihubmix.com.

Честно говоря, не очень понимаю, чем ваш чатбот может быть полезен для пользователей. Сейчас полно браузерных чатов (да хотя бы и GigaChat или z.ai, без всякой регистрации). Зачем кому-то идти за этим в телеграмм и подписываться на ваш канал?

K0Jlya9
29.05.2026 21:59
#30042502
Кстати о полезных сервисах. У гугла в апи есть моделька для tts, и ее вполне реально абузить, надо только раздобыть сотни аккаунтов Ж)

Озвучил ей книжку

https://cloud.mail.ru/public/BR1r/SJc26FrDs

Nx_anykey_dev
29.05.2026 21:59
#30046856
Z.ai - GLM 4.7 flash бесплатная, по api