Задача — не просто спарсить сообщения из Telegram-каналов. Задача — научиться вылавливать из потока обсуждений актуальные тренды, боли клиентов и рабочие лайфхаки. Это золотая жила для SEO-специалистов, продуктологов и маркетологов.
В этой статье (первой из двух) мы сфокусируемся на создании и деплое юзербота для сбора данных. Во второй части подключим нейросеть для анализа и получим готовые инсайты.
Проблема: почему Telegram — это и сокровищница, и хаос
С приходом Telegram-чатов и каналов живое общение и экспертиза ушли с форумов и блогов. Теперь вся актуальная информация — в тысячах чатов, но она тонет в потоке сообщений.
Для создателей контента (SEO): Сложно увидеть, о чем сейчас говорят и спрашивают люди в нише. Тренды рождаются в чатах, а не в поиске.
Для продуктологов и аналитиков: Открытые чаты конкурентов — кладезь обратной связи. Но нет структуры «вопрос-ответ». Ценные инсайты о фичах, проблемах и ожиданиях пользователей размазаны по диалогам.
Решение: Две ключевые задачи для нашего бота
Генератор контент-плана: Автоматический сбор и анализ тем, вопросов и дискуссий из профессиональных сообществ. Это даст SEO-специалистам готовый список тем, основанный на реальных запросах аудитории.
Детектор трендов и проблем конкурентов: Систематический мониторинг чатов компаний-конкурентов для выявления их нововведений, частых проблем клиентов и неочевидных лайфхаков.
Что дальше?
В этой статье закладываем фундамент: пишем и развертываем юзербота для сбора сырых данных. Во второй части мы научим нейросеть превращать этот хаотичный диалог в структурированные отчеты и actionable-инсайты.
Что такое юзербот и почему он нужен именно здесь? Простыми словами
Давайте разберем главный вопрос: почему мы делаем именно юзербота, а не обычного Telegram-бота?
Обычный бот (того, что создают через @BotFather):
Может работать только в тех чатах, куда его явно добавили администраторы
Не видит сообщения до своего добавления
Не может вступить в публичный канал сам — его туда нужно пригласить
Юзербот (Userbot) — это совсем другое. Это программа, которая работает как «второе приложение» вашего аккаунта.
Представьте, что у вас есть Telegram на телефоне, на компьютере... и вот теперь еще одна программа, которая тоже зашла под вашим номером.
Что это дает:
Может вступить в ЛЮБОЙ публичный канал — как обычный пользователь
Видит ВСЮ историю сообщений в каналах и чатах, куда вы вступили
Читает сообщения в РЕАЛЬНОМ ВРЕМЕНИ — ловит обсуждения по горячим следам
Работает КРУГЛОСУТОЧНО на сервере — не спит, не отвлекается, не забывает
Сохраняет контекст диалогов — видит не только отдельные
Создание User бота для Telegram
Опишу кратко логику работы Userbot:
Юзербот подключается к каналу
Скачивает историю сообщений (при первом подключении)
"Слушает" новые сообщения (постоянно)
Сохраняет всё в базу данных (Текст сообщения, Дата и время, Автор, ID канала, Количество просмотров)
И так начнем. Чтобы исключить возможный бан личного профиля, я зарегистрировал для userbot'а новый. Варианты есть разные, можно купить вторую симкарту, можно поискать варианты на просторах интернета.

Теперь можно начинать, создадим Telegram app, для этого:
Шаг 1:Войдите на сайт (лучше с чистым профилем)

Перейдите на https://my.telegram.org/apps
Войдите, используя номер телефона (с кодом страны, например: +79991234567)
Введите код подтверждения из Telegram

Шаг 2: Создайте приложение

Если приложения еще нет, нажмите "Create new application" или "Create application"
Заполните форму:
App title: любое название (например: "Telegram Userbot" или "Message Parser")
Short name: короткое имя (например: "userbot" или "parser")
Platform: выберите "Other" или "Desktop"
-
Description: описание (необязательно, например: "Userbot for message parsing")
Шаг 3: Получите credentials

После создания вы увидите:
api_id — числовой ID (например: 12345678)
api_hash — строка из букв и цифр (например: abc123def456...)
-
Сохраните данные
API_ID и API_HASH — это не секретные токены, их можно использовать. Не публикуйте их в открытом доступе, но они не так критичны, как токены ботов. Один аккаунт может иметь несколько приложений. Эти credentials нужны для работы userbot через Telethon.
С первым номером удачно завел профиль в ТГ, но почему-то при создании apps появлялась ошибка, потому пришлось создать еще один профиль и там все заработало.
Так, как сервис будет работать в docker, то необходимо сначала сгенерировать сессию Session String локально, для этого на собственном компьютере в powershell (если у вас windows) установите библиотеку telethon. Под спойлером подробнее описано, что такое String Session и зачем он нужен.
Скрытый текст
String Session — это способ хранения авторизационных данных Telegram в виде строки, вместо файла .session. Это особенно удобно для развертывания в контейнерах и облачных платформах, где работа с файлами может быть затруднена.
Принцип работы
Обычная сессия (файл)
# Создается файл userbot_session.session
client = TelegramClient('userbot_session', API_ID, API_HASH)
String Session
# Сессия хранится в виде строки
from telethon.sessions import StringSession
session_string = "1BVtsOHwBu5X..." # Длинная зашифрованная строка
client = TelegramClient(StringSession(session_string), API_ID, API_HASH)
Реализация в коде
1. Конфигурация (config.py)
import os
from dotenv import load_dotenv
load_dotenv()
# Telegram API credentials
API_ID = int(os.getenv('API_ID', '0'))
API_HASH = os.getenv('API_HASH', '')
SESSION_NAME = os.getenv('SESSION_NAME', 'userbot_session')
# Optional: use STRING_SESSION instead of session file
STRING_SESSION = os.getenv('STRING_SESSION', '')
Ключевой момент: STRING_SESSION — опциональная переменная. Если она не указана, используется файл сессии.
2. Инициализация клиента (userbot.py)
from telethon import TelegramClient
from telethon.sessions import StringSession
from config import API_ID, API_HASH, SESSION_NAME, STRING_SESSION
# Выбор типа сессии
if STRING_SESSION:
# Используем String Session
session = StringSession(STRING_SESSION)
logger.info("Используется STRING_SESSION из переменных окружения")
else:
# Используем файл сессии (fallback)
session = SESSION_NAME
logger.info(f"Используется файл сессии: {session}.session")
# Инициализация клиента
client = TelegramClient(session, API_ID, API_HASH)
Логика выбора:
Если
STRING_SESSIONуказан → используем егоЕсли нет → используем файл
{SESSION_NAME}.sessionЕсли файла нет → ошибка (требуется авторизация)
3. Запуск и авторизация
async def main():
# Подключение к базе данных
await db.connect()
# Подключение к Telegram
if STRING_SESSION:
# String Session уже содержит авторизацию
logger.info("Используется STRING_SESSION из переменных окружения")
await client.start() # Просто подключаемся
else:
# Проверяем наличие файла сессии
session_file = f"{SESSION_NAME}.session"
if not os.path.exists(session_file):
# Файла нет - нужна авторизация
logger.error("Файл сессии не найден. Укажите STRING_SESSION или авторизуйтесь локально")
raise FileNotFoundError(f"Файл сессии {session_file} не найден")
else:
# Файл есть - используем его
await client.start()
logger.info("Userbot запущен и готов к работе!")
Преимущества String Session
1. Удобство для контейнеров
Не нужно загружать файлы на сервер
Работает в read-only файловых системах
Проще для Docker/Kubernetes
2. Безопасность
Можно хранить в секретах (secrets management)
Не остается файлов на диске
Легко ротировать (сменить строку)
3. Гибкость
Один и тот же код работает с файлом и строкой
Легко переключаться между режимами
И так сделаем это:
pip install telethon
Далее создайте файл generate_string_session.py с содержимым, заменив API_ID и API_HASH на свои.
Скрытый текст
from telethon.sync import TelegramClient
from telethon.sessions import StringSession
API_ID = 12345678
API_HASH = "4dfgdfgfdgfdhdgfhgfhgfdhgfhg08"
def main():
phone = input("Введите номер телефона (+7...): ").strip()
with TelegramClient(StringSession(), API_ID, API_HASH) as client:
client.start(phone=phone) # спросит код/2FA
print("\nВаш STRING_SESSION:\n")
print(client.session.save())
if __name__ == "__main__":
main()
Запустите скрипт в powershell и подтвердите вход, указа номер телефона и код подтверждения, я использую терминал прям в Cursor.

В итоге мы получили STRING_SESSION для использования в переменных окружения.
Скрытый текст
# config.py - опциональная переменная
STRING_SESSION = os.getenv('STRING_SESSION', '')
# userbot.py - умный выбор типа сессии
from telethon.sessions import StringSession
session_arg = StringSession(STRING_SESSION) if STRING_SESSION else SESSION_NAME
client = TelegramClient(session_arg, API_ID, API_HASH)Теперь перейдем непосредственно к запуску userbot в сервисе bothost.ru, создадим нового бота, укажем все, как на рисунке ниже, заполним собственные переменные окружения, которые получили ранее, в том числе session_string, укажем GIT репозиторий. Так же я указал токен бота, для user бота он не нужен, но платформа требует ввести, что-нибудь.

В дополнительных настройках укажем запускаемый файл бота userbot.py:

Все готово, можно запускать бота (на самом деле завелось не с первой попыток, было множество правок кода).



После запуска парсина, можно отслеживать процесс в логах бота и по размеру базы данных, базу данных можно скачать.

На этом шаге у вас уже есть полноценная база данных со всеми собранными сообщениями. Её можно:
Скачать прямо сейчас — заберите файл
messages.dbчерез панель управления;Немедленно начать анализ — даже без второй части этого руководства;
Экспериментировать самостоятельно — пробуйте разные подходы к обработке данных.
На этом мы выполнили первый шаг, разработали и задеплоили user бота. Код бота в GIT.
Мы создали систему сбора данных — фундамент для анализа. Юзербот теперь:
Работает 24/7 на сервере
Собирает сообщения из выбранных чатов
Сохраняет всё в структурированную базу
Уже показывает базовую статистику
Но это только 50% решения. Сырые данные — как нефть: ценны, но не готовы к использованию.
В следующем туториале подключим бота к OpenAI и попробуем анализировать получаемые данные.
Viktor-T
Так-то всё было бы интересно почитать, пусть и не в одной статье.