• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement-learning

MARL-GPT: на пути к созданию универсальной модели для многоагентных сред +5

  • 29.05.2026 06:33
  • post_nortem
  • 0
  • Блог компании AIRI
  • Робототехника
  • Машинное обучение
  • Искусственный интеллект

Как я выращивал цифрового гомункула и стал нейро-панком

  • 13.05.2026 16:05
  • Imperius14
  • 16
  • Машинное обучение
  • Искусственный интеллект

Как я торговлю автоматизировал +4

  • 30.04.2026 10:16
  • allowq
  • 8
  • Машинное обучение
  • Финансы в IT

Математическое программирование vs RL: может ли ИИ догнать классику в оптимизации? +7

  • 31.03.2026 07:03
  • Lozkins
  • 3
  • Алгоритмы
  • Математика
  • Машинное обучение
  • Искусственный интеллект

Что я вынес из Oxford Machine Learning Summer School 2025

  • 13.10.2025 16:02
  • SuperEstrad
  • 0
  • Natural Language Processing
  • Машинное обучение
  • Робототехника
  • Учебный процесс в IT

Реализуем Q learning на Python +3

  • 02.10.2025 10:23
  • Andrey_Biryukov
  • 1
  • Блог компании OTUS
  • Машинное обучение
  • Искусственный интеллект
  • Python

AI-движки на примере Knowledge Distillation, GAN, Reinforcement learning -1

  • 28.09.2025 12:06
  • xitri_kot
  • 0
  • Python
  • TensorFlow

GEPA вместо RL: как рефлексивная эволюция промптов обгоняет обучение с подкреплением +1

  • 11.09.2025 11:00
  • kucev
  • 0
  • Data Engineering
  • Big Data
  • Машинное обучение
  • Искусственный интеллект
  • Data Mining

Скорость, стратегия и алгоритмы: будущее Формулы-1 в эпоху AI -2

  • 04.09.2025 11:00
  • kucev
  • 0
  • Artificial Intelligence
  • Machine Learning
  • Data Mining
  • Искусственный интеллект
  • Машинное обучение
  • Big Data
  • Data Engineering

LLM на прокачку: практический гайд по Alignment +8

  • 18.08.2025 10:26
  • DeadSailor
  • 0
  • Точка corporate blog
  • Artificial Intelligence
  • Machine Learning
  • Блог компании Точка
  • Блог компании Точка банк
  • Natural Language Processing
  • Python
  • Искусственный интеллект
  • Машинное обучение

GSPO (Qwen RL Algorithm by Alibaba Cloud) +2

  • 10.08.2025 17:56
  • Verbasik
  • 2
  • Машинное обучение

RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты +12

  • 05.08.2025 14:15
  • quantAIengineer
  • 14
  • Python
  • Искусственный интеллект
  • Криптовалюты
  • Машинное обучение

«Скайнет» наоборот: как вырастить и обучить ИИ с помощью Дарвин-Гёдель машины для улучшения человеческой демографии

  • 25.06.2025 13:12
  • Antony_Rain
  • 6
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Python
  • GitHub
  • Машинное обучение

Как мы обучили беспилотники в симуляции для гонок в смешанной реальности +17

  • 24.01.2025 08:42
  • Dataist
  • 1
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Машинное обучение

Контекстные бандиты в ценообразовании

  • 28.12.2024 09:06
  • muxeu
  • 1
  • Блог компании X5 Tech
  • Машинное обучение
  • Алгоритмы
  • Математика
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Вчера
  • Позавчера
09:01

Пасхалки для своих: Emacs в массовой культуре +35

13:01

Треугольник SSH, или Зачем нужны 2 VPS +32

08:05

Разбор медицинского анализатора: Bayer Clinitek Status+ +32

08:00

Отказ от IPv4 и готовность человечества к IPv6‑инфраструктуре +32

11:05

Девять лет, 514 коммитов и один посёлок: как я делал приложение с расписанием автобусов +31

06:01

OCC-RAG: компактные модели, которые отвечают только по источникам +29

07:05

Можно ли «посмотреть за угол»? Физика отвечает: да, конечно, никаких проблем +27

06:04

Советский вундеркинд, клепавший в школе роботов, часть 2 +26

06:00

От перфокарт до мейнфреймов: как в Германии обнаружили забытый «музей» вычислительной техники +23

15:53

Невозможный KY26 +21

00:18

Принцип Ландауэра — сколько весит один бит информации и почему стирание памяти греет Вселенную +20

08:00

Исследование Selectel: каждая четвертая российская компания использует ИИ в облаке +18

08:57

Потратил полгода на обучение своей ии с нуля, вот что вышло +16

12:40

Мейнфрейм 1960-х в браузере: как работает IBM System/360 на микрокоде +15

12:01

Иннерсорсинг в Островке: как мы перестали ждать чужой бэклог и ускорили delivery на несколько кварталов +15

07:03

«Это уже тысячу раз делали»: как мы добавили медиаленту в Яндекс Еду для iOS. А потом переделали +15

10:12

SDET как эволюция QA, или почему автотестов больше недостаточно +13

08:01

CancelledError — не просто очередная ошибка. Разбираемся, как устроена отмена задач в asyncio +13

15:10

Вместо свалки — дата-центр: как старые смартфоны превращают в серверы +11

11:20

Войны фреймворков, неуправляемые разработчики и крэйзи-инопланетяне: разговор с тимлидом Авито +11

08:48

Я обнаружил крупномасштабное распространение вирусов в GitHub +141

10:25

Vibecode по дешевке — домашний сервер с Qwen Code за 25к, который не отключит Anthropic +123

13:40

Как я нашел новую панграмму (разнобуквицу) +93

08:00

Сказ о том, как нейросеть занялась reward hacking прямо у меня на кухне +58

13:02

Про то, как из 0°C получить мороз в десятки градусов и не только +50

09:01

Безымянный китайский телекастер +36

07:00

Когда нашим дорогим инженерам сильно надоело 5 раз проверять документацию за подрядчиками +35

12:45

SI/PI в разработке электронных устройств: анализ, который сэкономит вам время, деньги и нервы +29

07:05

Позвонить бесплатно: история взлома аналоговой телефонии. Часть 1 +29

15:13

ROP Level 1 в GD32F4: «А метлой дверь подпёр?» Или как нежно слить защищенную прошивку через программатор +27

11:14

Внешняя память для LLM: как RAG дает моделям доступ к новым знаниям +27

09:03

«РБПО для бедных»: собираем CI/CD-конвейер безопасной разработки +21

08:05

Продали дом за 7 000 000₽ и потеряли в майнинге. Видеокарты остались — из них вырос сервис генерации +21

09:46

Как с нас пытались взыскать 5 000 000 рублей за детские трусы +20

07:57

КД по ГОСТ за один клик +20

10:50

Делаем науку на ровном месте +19

16:32

Открыл бету AI-Мастера для D&D. Главная проблема оказалась не в кубиках, а в памяти +18

11:00

Солнцезащитный крем снижает синтез витамина D: как это работает +18

08:05

Как мы построили централизованную CMDB для управления Zabbix с RFC, аудитом и откатом изменений +18

09:53

Заглядываем внутрь ESE: от B+ деревьев до артефактов Windows +17

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Vibecode по дешевке — домашний сервер с Qwen Code за 25к, который не отключит Anthropic +123

    • 202

    Продали дом за 7 000 000₽ и потеряли в майнинге. Видеокарты остались — из них вырос сервис генерации +21

    • 70

    Как я нашел новую панграмму (разнобуквицу) +93

    • 41

    Я обнаружил крупномасштабное распространение вирусов в GitHub +141

    • 35

    Лучшие связки CPU и GPU для игрового ПК в 2026 году: от 1080p до 4K +12

    • 34

    Отказ от IPv4 и готовность человечества к IPv6‑инфраструктуре +32

    • 31

    Про то, как из 0°C получить мороз в десятки градусов и не только +50

    • 29

    Как быстро реализовать современный работающий VPN в эпоху блокировок: теория и практика +5

    • 25

    Я собрал свой мессенджер по вечерам после работы +9

    • 25

    Опережая гром: почему наша физика может быть ошибкой восприятия? +4

    • 22

    Почему сейчас стажеры и джуны знают больше, но пишут код гораздо хуже, чем раньше +9

    • 21

    Делаю игру, где бактерии живут в чашке +6

    • 20

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.