Привет! Я Лена, продакт-менеджер в ЮMoney. Финансовые технологии — одна из отраслей, где инновации появляются и внедряются особенно быстро. Нужно постоянно следить за рынком: изучать конкурентов, мониторить тренды и технологические новинки.
Отдельно мне интересны кейсы, когда AI начинает выполнять задачи, которые раньше делали люди. Но подходящего формата для системного мониторинга таких новостей найти не удалось: где-то много «воды», а где-то не хватает конкретики.
Хотелось максимально лаконичный формат:
кто внедрил AI,
для какой задачи,
какие процессы / роли это затронуло,
результаты.
А что, если собрать собственную ленту новостей?
С помощью AI-ассистентов я уже автоматизировала небольшие задачи: один бот «ловит» спамерские отзывы, другой — сообщает про обновления конкурентов. Стало интересно: получится ли создать что-то более сложное без инженерного бэкграунда, но с AI-ассистентом? Например, автономный процесс мониторинга новостей по заданной теме.
В результате я собрала персональный Telegram-канал, в котором новости публикуются автоматически, — о том, как к AI переходят человеческие функции и процессы.
В этой статье расскажу, как устроена система, какие проблемы решала по пути и какие выводы я сделала о работе с AI-ассистентами.
Из чего состоит система

Воркфлоу №1: сбор и подготовка новостей
Запускается ежедневно в 8:00. Его задача — собрать новости и, фильтруя нерелевантные, подготовить публикации. Новости берутся из нескольких RSS-лент: TechCrunch, VentureBeat, The Verge, MIT Technology Review и тому подобное. Один сбор — 200-300 новых статей.
Новости фильтруются в несколько этапов. Берём только материалы, опубликованные за последние 26 часов. Затем система удаляет дубли по ссылкам и проверяет новости по набору ключевых слов — используется около 50 терминов на русском и английском.
Только после того, как мы убрали лишнее, остаётся 30-50 новостей, они и отправляются в LLM. Я использую llama-3.3-70b-instruct через aitunnel. Один запрос стоит около 11 копеек. В месяц ушло ~350₽ с учётом множества тестовых запросов.
Модель оценивает релевантность каждой статьи теме, заданной в промпте — и выставляет скоринг от 0 до 10. Если оценка 6 и выше, LLM пишет пост, затем исключает смысловые дубли. На выходе имеем 10-20 постов и сохраняем их в Google Sheets со статусом pending («готово к публикации»).
Воркфлоу №2: публикация в канал
На этом этапе из таблицы берутся посты со статусом pending и перед публикацией повторно проверяются через LLM.
Зачем нужна вторая проверка?
Медиа могут публиковать одну и ту же новость в разное время и разными словами. Формально тексты не совпадают, смысл — одинаковый.
Поэтому модель ищет среди pending-постов смысловые дубли с уже опубликованными. Если обнаружены, пост получает статус duplicate и не размещается. Если дублей нет — пост публикуется, а статус меняется на published. Отсеиваются около 50% постов.

Грабли, которые я собрала
Telegram нестабильно принимал запросы с российского VPS
n8n развёрнут на Timeweb с техническим доменом .twc1.net.
На ноде публикации Telegram периодически переставал отвечать: getWebhookInfo возвращал Connection timed out. Менять сервер на зарубежный не хотелось, и смена домена не помогла.
AI-ассистент подсказал решение: добавить Cloudflare Workers как промежуточный прокси. Сработало, проблема исчезла, а бесплатного тарифа оказалось более чем достаточно.
LLM обрубала JSON
По плану LLM должна возвращать готовые посты и ссылки в формате JSON. Но при большом объёме новостей модель просто срезала ответ на половине.
Модели было задано условие — все записи должны быть завершёнными, остальное отбрасываем. А сократить потери помогла предварительная дедупликация — меньше лишних данных на входе, меньше шанс упереться в лимит.
Короткие ключевые слова давали мусор
Казалось бы, простая фильтрация по словам — что может пойти не так? Но короткое «ai» начало матчиться на нерелеватные слова: daily, email, cocktail…
В итоге часть ключевых слов я вынесла в отдельный список и проверяю их только по заголовку. Релевантные новости не теряются, мусора — меньше.
Что я поняла про работу с AI-ассистентом
Самым интересным результатом проекта для меня оказался опыт взаимодействия с AI в процессе создания системы.
Держи в голове целевое состояние системы
AI ошибается часто. Без чёткого видения цели легко клюнуть на правдоподобный, но ложный вариант, который незаметно разрушит архитектуру. Вайбкодинг — это не медитация за клавиатурой, а жёсткий менеджмент контекста: сверка с целями, приоритизация, отсев. По сути, это работа продакта и архитектора в одном флаконе — нужно удерживать требования, видеть связи системы и описывать требования без разночтений.

Длинный контекст — враг качества
Когда чат становится слишком длинным, модель начинает галлюцинировать и предлагать решения, которые противоречат уже сделанному. Иногда создаётся впечатление, будто AI забывает часть контекста и заново решает уже закрытые вопросы.
Спасает создание нового чата. А чтобы не пересказывать задачу с нуля, есть два приёма:
загрузить воркфлоу целиком как JSON;
попросить модель в «перегретом» чате самой сделать саммари текущего состояния проекта и продолжить работу уже с этим контекстом.
Хождение по кругу — сигнал остановиться
Если модель снова и снова предлагает неработающее решение, не стоит настаивать и ругать AI-чат. Скорее всего, вы описываете симптом, а не причину.
В таких случаях помогает зафиксировать: что попробовали, что не сработало, почему — и переформулировать задачу. Иногда полезно сходить с проблемой в другой AI-инструмент — свежий взгляд помогает найти решение.
Проверь, нужна ли вообще задача, которую вы пытаетесь решить
AI — исполнительный помощник. Он хорошо разбирается в деталях, но по умолчанию не возражает. Не спрашивает «а нам это точно нужно?», а решает задачу в заданных рамках.
У меня был квест с картинками для постов: как доставать их из статей, передавать в ноду публикации, что делать при отсутствии изображения. AI предлагал всё новые варианты.
Я остановилась, вернулась к цели канала (лаконичность и информативность) и поняла: картинки не нужны. Проблема исчезла.
Что получилось
Канал публикует несколько коротких постов в день автоматически. На беглый просмотр уходит около минуты. Иногда случается забавное: LLM решает, что новость про обновление интерфейса — это «замена людей AI» с релевантностью 8. Иногда проскакивают иероглифы. Но в целом качество отбора устраивает.

Благодаря точной фильтрации в канал попадают практические кейсы перехода задач от людей к AI. По ним видно развитие трендов AI-технологий и регулярно находятся сценарии, которые можно переиспользовать в работе.
AI-ассистент работает как «журналист» и «редактор»: я задала архитектуру и правила, система экономит часы ручного листания источников.
Этот эксперимент хорошо соответствует подходу, который мы применяем в ЮMoney и в продуктовых, и в инженерных направлениях: мы стараемся автоматизировать повторяющиеся процессы там, где это действительно освобождает время для важных задач и улучшения продукта.
Развитие AI-технологий для нас — логичное продолжение этого подхода. AI уже становится частью внутренних процессов, о практических кейсах и результатах мои коллеги рассказывают в подкасте ЮVoice и на митапах ЮMoney.
Вместо заключения
Сейчас, благодаря AI-ассистентам, между идеей и работающим инструментом стало гораздо меньше барьеров.
Главное открытие для меня — вайбкодинг развивает не технические навыки, а продуктовое и критическое мышление. AI ускоряет путь от идеи к реализации, но при этом приходится чаще проверять гипотезы, удерживать контекст и не принимать правдоподобный ответ за правильный.
Поделитесь, каких AI-ассистентов вы уже используете в работе? Как боретесь с галлюцинациями моделей? Как выбираете источники информации на профессиональную тему?
Комментарии (5)

Chuvilev_MM
02.06.2026 16:46Кейс с Cloudflare Workers отличный. Это стандартное решение для стабильной работы ботов, когда нужно обходить сетевые ограничения.
По поводу контекста вы всё верно подметили. Чем длиннее цепочка, тем выше риск деградации ответов. Сейчас вы используете микросервисы, но для масштабирования я бы советовал внедрить RAG по базе ваших публикаций. Это позволит модели опираться на фактуру всей истории проекта, а не только на текущий контекст.
Планируете ли развивать архитектуру в сторону полноценного поиска, или текущей схемы пока хватает? Было бы очень интересно почитать отдельный разбор по реализации RAG в таких задачах, если решите внедрить.

evgeneva Автор
02.06.2026 16:46Спасибо!
Полноценный поиск пока не планировала, хотя сейчас вместе с постами в Google-таблицу сохраняются дополнительные теги от LLM - на какие роли и специальности влияет технология. Это не публикуется, копится для будущего анализа тенденций.Что касается RAG - да, пока текущей схемы хватает. Новые посты сравниваются по смыслу со 100 последними публикациями, а не со всей базой, и явных повторов пока не замечено.
Сейчас основное внимание хочу уделить двум узким местам системы - объёму информации, поступающей в LLM, и фильтрации по ключевым словам. Вижу здесь потенциал для повышения качества отбора.Но если объём публикаций вырастет и потребуется работать уже со всей историей канала, то попробовать RAG будет интересно - выглядит логичным следующим шагом для развития.
alexhu
Ссылки не нашёл - хочу сравнить с этим https://moscowi.ru/. Не репозиторий, именно на новости хотелось бы посмотреть.
И зачем возвращать полную новость, если она у вас уже есть - вы же её сами отправили на llm. Верните только id новости, объёмы данных снизятся.
evgeneva Автор
Спасибо!
Да, такой вариант тоже рассматривала. В моём случае повторная проверка выполняется через LLM и сравнивает смысл публикаций, поэтому модели нужен сам текст поста, а не только идентификатор.
Но если внедрить эмбеддинги или более специализированную дедупликацию, объём передаваемых данных действительно можно будет существенно сократить.
Канал сознательно не добавляла в статью, так как хотелось сфокусироваться на самой системе и опыте её создания. Отправлю название вам в лс :)
alexhu
Сравнивайте на llm, только если не редактируете новость на стороне llm (а вы не задаёте этого действия), то сам текст новости вам только мешает - идентификатора хватит. Остальное всё равно отбросится как ненужное.