• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement-learning

Что я вынес из Oxford Machine Learning Summer School 2025

  • 13.10.2025 16:02
  • SuperEstrad
  • 0
  • Natural Language Processing
  • Машинное обучение
  • Робототехника
  • Учебный процесс в IT

Реализуем Q learning на Python +3

  • 02.10.2025 10:23
  • Andrey_Biryukov
  • 1
  • Блог компании OTUS
  • Машинное обучение
  • Искусственный интеллект
  • Python

AI-движки на примере Knowledge Distillation, GAN, Reinforcement learning -1

  • 28.09.2025 12:06
  • xitri_kot
  • 0
  • Python
  • TensorFlow

GEPA вместо RL: как рефлексивная эволюция промптов обгоняет обучение с подкреплением +1

  • 11.09.2025 11:00
  • kucev
  • 0
  • Data Engineering
  • Big Data
  • Машинное обучение
  • Искусственный интеллект
  • Data Mining

Скорость, стратегия и алгоритмы: будущее Формулы-1 в эпоху AI -2

  • 04.09.2025 11:00
  • kucev
  • 0
  • Artificial Intelligence
  • Machine Learning
  • Data Mining
  • Искусственный интеллект
  • Машинное обучение
  • Big Data
  • Data Engineering

LLM на прокачку: практический гайд по Alignment +8

  • 18.08.2025 10:26
  • DeadSailor
  • 0
  • Точка corporate blog
  • Artificial Intelligence
  • Machine Learning
  • Блог компании Точка
  • Блог компании Точка банк
  • Natural Language Processing
  • Python
  • Искусственный интеллект
  • Машинное обучение

GSPO (Qwen RL Algorithm by Alibaba Cloud) +2

  • 10.08.2025 17:56
  • Verbasik
  • 2
  • Машинное обучение

RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты +12

  • 05.08.2025 14:15
  • quantAIengineer
  • 14
  • Python
  • Искусственный интеллект
  • Криптовалюты
  • Машинное обучение

«Скайнет» наоборот: как вырастить и обучить ИИ с помощью Дарвин-Гёдель машины для улучшения человеческой демографии

  • 25.06.2025 13:12
  • Antony_Rain
  • 6
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Python
  • GitHub
  • Машинное обучение

Как мы обучили беспилотники в симуляции для гонок в смешанной реальности +17

  • 24.01.2025 08:42
  • Dataist
  • 1
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Машинное обучение

Контекстные бандиты в ценообразовании

  • 28.12.2024 09:06
  • muxeu
  • 1
  • Блог компании X5 Tech
  • Машинное обучение
  • Алгоритмы
  • Математика

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц +7

  • 22.12.2024 14:19
  • kseniiakeera
  • 0
  • Блог компании Open Data Science
  • Машинное обучение
  • Физика
  • Инженерные системы
  • Научно-популярное

Мультимодальные приложения на Llama 3.2 и Llama Stack +6

  • 21.10.2024 08:37
  • ruslandevlabs
  • 13
  • Машинное обучение
  • Искусственный интеллект

Нейронные оптимизаторы запросов в реляционных БД (Часть 2): На пути к продуктивизации +6

  • 04.10.2024 11:24
  • Safreliy
  • 4
  • Блог компании Postgres Professional
  • Машинное обучение
  • Искусственный интеллект
  • PostgreSQL
  • Алгоритмы

Нейронные оптимизаторы запросов в реляционных БД (Часть 1) +27

  • 09.09.2024 10:54
  • Safreliy
  • 9
  • Блог компании Postgres Professional
  • PostgreSQL
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Вчера
  • Позавчера
05:10

В мире всего 4 национальных мессенджера. И все они выросли БЕЗ блокировок +81

08:38

Как Майкл Абраш удвоил скорость Quake +47

08:00

Автоматическое создание и настройка глобального роутера в облаке через Terraform Provider +43

11:19

Инсульт — это не только УДАР. Инструкция для всех +30

09:01

Плохие практики в вёрстке +30

07:00

Uniden Bearcat 785XLT — аналоговый радиосканер, актуальный даже в 2026 году +28

11:30

Пять мини-ПК начала 2026 года: от дешевого Core i3 до ARM-платформы с 24 TOPS +20

01:00

Трансформер своими руками: с нуля до Numpy реализации и обучения +20

15:05

P =? NP: самая дорогая задача в мире, которая может перевернуть всё +19

13:01

Синий экран смерти. Как твой режим убивает тебя +19

09:35

Небезопасный Linux и как с ним бороться +19

09:53

Кружки юных программистов в СССР: как растили кадры без интернета +17

09:39

Как РСХБ Abbyy импортозамещал +16

09:03

[В закладки] Пошаговый алгоритм реагирования на утечки персональных данных для компаний +16

12:14

Как я запилил Skill для подключения хайпового Openclaw к Битрикс24 +12

07:15

Эволюция или топтание на месте? Смотрим на MySQL 5.7 и 8.0 в Yandex Cloud +12

07:00

Мы представляли роботов совсем не такими +12

09:07

EVPN-connector от VK Cloud: знакомим с первым Open-Source-компонентом нашего SDN Sprut +11

09:07

EVPN-connector от VK Cloud: знакомим с первым Open-Source-компонентом нашего SDN Sprut +11

07:05

Интернет Вещей на симках. Обзор стандарта NB-IoT +11

12:49

Как финтех-прокладка Wildberries выдает займы под 85% годовых, маскируясь под «поручителя» +246

08:00

Летающий дворец доктора Дорнье: история самого амбициозного провала золотого века авиации +92

08:06

Тетрис в ядре Linux +67

13:01

Мои двадцать лет в разработке ПО +52

10:06

Ротозумер: разбор классического демо-эффекта +44

09:01

Антикварная бас-гитара Jolana Iris из ЧССР, часть 1: первое знакомство +43

21:12

Выйдет ли что-то из дачного хобби: строим WiFi-косилку +40

14:06

Как устроены самые массивные и самые обширные звёзды +30

05:04

Телеграм решили глушить, а также первый штраф за лайки +30

08:01

Не «как быстрее», а «как лучше»: новое ML-ранжирование маршрутов в Яндекс Картах +29

07:05

Как понизить напряжение: делители +25

11:33

6 советов от практиков AI coding +24

08:36

Почему LLM продолжают генерировать ошибки в коде — и это не исправить масштабированием +24

04:33

Про LRU-кэш (в том числе — на собеседовании) — 3 способа реализации +19

14:05

Самые ожидаемые игры 2026 +18

11:14

РКН создали белый список для 72 AS, но пострадали 391 AS (>225 млн IP адресов) +18

10:35

Качельки для взрослых — колебательный контур +18

13:30

Контроль целостности с помощью inotify, недостатки инструмента +15

12:15

OWASP Top 10 2025 — от кода к цепочке поставок: расширение границ безопасности +15

07:25

Беда «войти в айти» или курсы тестировщика отзывы: Наконец, QA-курсы закрываются +15

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • В мире всего 4 национальных мессенджера. И все они выросли БЕЗ блокировок +81

    • 147

    Как финтех-прокладка Wildberries выдает займы под 85% годовых, маскируясь под «поручителя» +246

    • 124

    $10 миллиардов на Starship впустую: SpaceX возвращается к Falcon Heavy для космических колоний +1

    • 83

    Как мы потратили два года и 30 млн, чтобы сделать 30 ИИ-диктофонов +14

    • 82

    Увольняем джуниора: автоматизируем анализ данных c Claude Code, Codex, Cursor, OpenCode +1

    • 71

    «За что ты так не любишь школу?» За бесполезность и воспитание трусости +3

    • 65

    «Не учись на программиста» — что бы я сказал своему ребёнку в 2026-м -9

    • 58

    РКН создали белый список для 72 AS, но пострадали 391 AS (>225 млн IP адресов) +18

    • 53

    Почему LLM продолжают генерировать ошибки в коде — и это не исправить масштабированием +24

    • 46

    Меньше двух недель осталось до запрета иностранных слов в России -1

    • 44

    Телеграм решили глушить, а также первый штраф за лайки +30

    • 42

    Топ-менеджеры Кремниевой долины в панике: что они знают об ИИ, чего не знаем мы +1

    • 38

    «Мы не догоняем Intel». Как в России создают нейроморфный процессор «Алтай» +12

    • 37

    6 советов от практиков AI coding +24

    • 36

    Не «как быстрее», а «как лучше»: новое ML-ранжирование маршрутов в Яндекс Картах +29

    • 36

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.