• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement learning

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше +4

  • 11.08.2025 09:30
  • ai-talent
  • 1
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум +5

  • 01.08.2025 12:48
  • redmadrobot
  • 1
  • Блог компании red_mad_robot
  • Искусственный интеллект
  • Исследования и прогнозы в IT

От мозга к мультиагентным системам: как устроены Foundation Agents нового поколения +3

  • 24.07.2025 21:44
  • redmadrobot
  • 8
  • red_mad_robot corporate blog
  • Artificial Intelligence
  • Research and forecasts in IT
  • Блог компании red_mad_robot
  • Искусственный интеллект
  • Исследования и прогнозы в IT

LiberalMind 1.5 новая LLM из России +7

  • 23.07.2025 12:15
  • teodor_unusov_official
  • 10
  • TensorFlow
  • Искусственный интеллект
  • Машинное обучение

ИИ простыми словами, часть 2. Reinforcement Learning (RL) +4

  • 06.02.2025 16:18
  • ElKornacio
  • 10
  • Машинное обучение
  • Искусственный интеллект

ИИ на путях: как решить задачу перепланирования расписания движения поездов +5

  • 23.01.2025 15:30
  • artur_temievich
  • 4
  • Первая грузовая компания (ПГК) corporate blog
  • Artificial Intelligence
  • Machine Learning
  • Блог компании Первая грузовая компания (ПГК)
  • Искусственный интеллект
  • Машинное обучение

Практическое обучение с подкреплением: от забав с MuJoCo'м до битв на арене +26

  • 15.01.2025 16:19
  • Ariman
  • 17
  • Искусственный интеллект
  • Python
  • Машинное обучение
  • Программирование
  • Разработка игр

ML-тренды рекомендательных технологий: шесть приёмов, которые помогают угадывать желания пользователя +17

  • 14.11.2024 08:01
  • KirillKhrylchenko
  • 1
  • Блог компании Яндекс
  • Машинное обучение
  • Алгоритмы
  • Natural Language Processing
  • Анализ и проектирование систем

OpenAI o1 — LLM, обученная выполнять сложные логические рассуждения +3

  • 01.10.2024 11:34
  • ruslandevlabs
  • 14
  • Машинное обучение
  • Искусственный интеллект

Научно-исследовательский кружок по ИИ в робототехнике для студентов и взрослых +27

  • 26.09.2024 07:06
  • AmigoRRR
  • 0
  • Блог компании Сбер
  • Программирование
  • Машинное обучение
  • Робототехника
  • Искусственный интеллект

Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM +10

  • 19.09.2024 13:16
  • anna_schenikova
  • 1
  • Блог компании МТС
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Reinforcement Learning в задаче групповой оптимизации цен

  • 08.07.2024 10:34
  • muxeu
  • 0
  • Блог компании X5 Tech
  • Математика
  • Машинное обучение
  • IT-компании

Создание масштабируемых RL систем с Ape-X

  • 01.06.2024 08:56
  • badcasedaily1
  • 1
  • Блог компании OTUS
  • Python
  • Программирование
  • Машинное обучение

Обучение с подкреплением: 10 вариантов применения +9

  • 21.11.2023 10:01
  • MaxRokatansky
  • 1
  • Машинное обучение
  • Блог компании OTUS

Как я учил нейросеть играть в Rocket League +7

  • 20.11.2023 07:27
  • MarkWatney
  • 4
  • Машинное обучение
  • Игры и игровые консоли
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • »
Страница 1 из 5
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
06:16

Почему я больше никогда не буду Team-Lead и тебе не советую +72

08:01

Полный айсберг Android. Часть 1 +27

09:56

Структурки для ошкурки от ВТБ: как потерять 14 млн руб. на «сверхнадежных облигациях» всего за неделю +26

07:05

Китайский интернет куда-то исчезает +26

09:01

Легендарные костыли в продакшене +20

07:00

Как мы делаем ВКС в Яндексе, часть 2: это волшебное слово — эксплуатация +15

00:48

«Очумелые ручки» или собираем держатель для смартфона с клавиатурой и тачпадом из доступных средств +15

13:01

3D-моделирование из бумаги +14

08:00

Искусственный интеллект в разработке: изучаем тренды и реальное применение +12

05:15

Как я шахматного бота писал +12

12:14

Топ-12 бесплатных нейросетей для создания видео и оживления картинок +11

09:10

Главный эффект Манделы в мире программистов — сколько байт в мегабайте +9

07:30

Топ-6 Python-библиотек для визуализации +8

10:58

Оптимизация функций компьютерного зрения (библиотека OpenCV) для RISC-V +7

10:30

Книга: «Дизайн в масштабе. Создание устойчивой дизайн-системы» +7

10:20

N100 это не только ценный мех: самые совершенные процессоры для офисных задач +7

09:43

Spark Connect. А нужны ли перемены? +7

09:01

USDe — стейблкойн, который ничем не обеспечен? +7

09:51

Linux Open Port: пошаговое руководство по управлению портами фаервола +6

08:48

Нужна такая же CRM для B2B, но с перламутровыми пуговицами. Будем кастомизировать сами +6

05:41

Одноразовый вейп в качестве веб-сервера +147

03:25

Что если представить habr в виде obsidian-графа? +69

14:01

Коллекция полезных HTML и CSS фич, которые редко используются +53

13:45

Ростелеком обнаружил переплаты за свет на сотни миллионов рублей +43

09:05

7 SQL-запросов, которые решают 90% всех задач на работе +39

07:01

Что происходило с новым законом про ЦОДы — мы нашли, кто смог подробно всё это объяснить +39

08:00

GPU, диски, серверы — что ещё анонсировали вендоры в августе. Железный дайджест Selectel +38

11:28

Как мы видеокарту AMD на ПЛИС с RISC-V и Linux запускали +35

09:02

Как взломать и разрушить АЭС за 49 минут: разбор кибератаки на ядерный реактор +33

06:59

Как я научил Jetpack Compose показывать рекомпозиции в реальном времени +29

00:08

Не XP единой — почему Windows 2000 была настоящим шедевром Microsoft +29

10:30

Оценка сроков выполнения задач: покоряем закон Хофштадтера +28

12:00

Полный гайд по экономии в облаке Selectel: 3 инструмента, 5 практических сценариев, шпаргалка +26

12:24

Я хотел пошпионить за своим псом, а в результате проследил за TP-Link +25

19:50

Что выяснили про ChatGPT: первые реальные данные несколько удивляют +24

09:06

Гений Пифагора: почему в рекурсивно-вычисляемом клеточном автомате Вселенной наше сознание бессмертно? +22

14:17

У нас было 10k метрик, 500 А/В-экспериментов и 500kk p-value каждый день… +21

09:32

Как избавиться от проприетарных ETL: кейс миграции на dbt +20

13:24

Распродажа в издательстве «Питер» +18

12:00

2 причины смертельной болезни проекта: устаревшие технологии и монополия на знания. Рассказываем, как это лечить +18

15:02

Я разобрался, каршеринг — это не бизнес на аренде авто +180

08:05

Технологии из прошлого: телетайп. Разбираемся в устройстве, воскрешаем старый аппарат +77

17:21

SSL-сертификаты в 2025: самый прибыльный развод в истории интернета +70

12:00

Как мы в Selectel запускали Minecraft-сервер +58

09:23

Вам больше не нужен JavaScript +57

08:01

Осенняя барахолка под Валенсией: ноутбуки, консоли и кое-что еще +52

13:01

Создаём личную систему VoIP +47

09:01

Эпоха групповых чатов. Негласные правила, динамика, модерация +45

16:05

Как устроены массивы в PHP и как код влияет на скорость работы с ними +39

05:12

Бюджет РФ не очень сходится, а также новый самый богатый человек на $393 млрд в облачном компьютинге +36

09:00

Порядок против хаоса: мои главные ошибки и 5 правил организации личной базы знаний +32

10:21

Сибур инвестировал в систему диагностики, чтобы предотвратить миллионы убытков от аварий +31

17:28

Астрономы в замешательстве: исследование чёрной дыры QSO1 массой 50 млн Солнц, которая всех съела +26

14:37

Непостижимая эффективность современных алгоритмов сортировки +26

06:00

N8n: (не)реальные возможности и ограничения +23

22:30

Что такое эмбеддинги и как с ними работать. Вводная для начинающих +22

12:00

FreeBSD в 2025 году: виртуализация, эмуляция и новые правила для AI +22

08:37

Почему китайская полимерная оптика есть, а в России её нет. В чём отличия технологий +19

15:23

Вайбкодинг мертв. На смену пришло агентное роевое программирование +18

10:01

Да, было: большая подборка IT-факапов ко Дню программиста +18

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.