• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement-learning

Математическое программирование vs RL: может ли ИИ догнать классику в оптимизации? +7

  • 31.03.2026 07:03
  • Lozkins
  • 3
  • Алгоритмы
  • Математика
  • Машинное обучение
  • Искусственный интеллект

Что я вынес из Oxford Machine Learning Summer School 2025

  • 13.10.2025 16:02
  • SuperEstrad
  • 0
  • Natural Language Processing
  • Машинное обучение
  • Робототехника
  • Учебный процесс в IT

Реализуем Q learning на Python +3

  • 02.10.2025 10:23
  • Andrey_Biryukov
  • 1
  • Блог компании OTUS
  • Машинное обучение
  • Искусственный интеллект
  • Python

AI-движки на примере Knowledge Distillation, GAN, Reinforcement learning -1

  • 28.09.2025 12:06
  • xitri_kot
  • 0
  • Python
  • TensorFlow

GEPA вместо RL: как рефлексивная эволюция промптов обгоняет обучение с подкреплением +1

  • 11.09.2025 11:00
  • kucev
  • 0
  • Data Engineering
  • Big Data
  • Машинное обучение
  • Искусственный интеллект
  • Data Mining

Скорость, стратегия и алгоритмы: будущее Формулы-1 в эпоху AI -2

  • 04.09.2025 11:00
  • kucev
  • 0
  • Artificial Intelligence
  • Machine Learning
  • Data Mining
  • Искусственный интеллект
  • Машинное обучение
  • Big Data
  • Data Engineering

LLM на прокачку: практический гайд по Alignment +8

  • 18.08.2025 10:26
  • DeadSailor
  • 0
  • Точка corporate blog
  • Artificial Intelligence
  • Machine Learning
  • Блог компании Точка
  • Блог компании Точка банк
  • Natural Language Processing
  • Python
  • Искусственный интеллект
  • Машинное обучение

GSPO (Qwen RL Algorithm by Alibaba Cloud) +2

  • 10.08.2025 17:56
  • Verbasik
  • 2
  • Машинное обучение

RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты +12

  • 05.08.2025 14:15
  • quantAIengineer
  • 14
  • Python
  • Искусственный интеллект
  • Криптовалюты
  • Машинное обучение

«Скайнет» наоборот: как вырастить и обучить ИИ с помощью Дарвин-Гёдель машины для улучшения человеческой демографии

  • 25.06.2025 13:12
  • Antony_Rain
  • 6
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Python
  • GitHub
  • Машинное обучение

Как мы обучили беспилотники в симуляции для гонок в смешанной реальности +17

  • 24.01.2025 08:42
  • Dataist
  • 1
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Машинное обучение

Контекстные бандиты в ценообразовании

  • 28.12.2024 09:06
  • muxeu
  • 1
  • Блог компании X5 Tech
  • Машинное обучение
  • Алгоритмы
  • Математика

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц +7

  • 22.12.2024 14:19
  • kseniiakeera
  • 0
  • Блог компании Open Data Science
  • Машинное обучение
  • Физика
  • Инженерные системы
  • Научно-популярное

Мультимодальные приложения на Llama 3.2 и Llama Stack +6

  • 21.10.2024 08:37
  • ruslandevlabs
  • 13
  • Машинное обучение
  • Искусственный интеллект

Нейронные оптимизаторы запросов в реляционных БД (Часть 2): На пути к продуктивизации +6

  • 04.10.2024 11:24
  • Safreliy
  • 4
  • Блог компании Postgres Professional
  • Машинное обучение
  • Искусственный интеллект
  • PostgreSQL
  • Алгоритмы
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
09:01

Реверсим штатный ключ сигнализации JAC-Москвич +33

09:01

Тридцать три тысячи жизней: самое громкое киберпреступление в истории Финляндии +23

07:02

userver 3.0 — большой релиз фреймворка для IO‑bound‑программ, переход на C++20 +23

12:00

Практическое руководство по Qwen: установка, настройка vLLM и работа через API +21

08:00

Автоматизируем создание глобального роутера для связи выделенного и облачного серверов +20

07:00

PicoClaw на Arduino Uno Q +20

07:06

Рецензия на книгу «Основы разработки приложений для iOS» +18

07:05

Если трос оборвался. Что произойдет с кабиной лифта в самом плохом случае? +18

08:17

Разработка RC-машинки с BLDC. Подход с нуля +16

08:17

Свежий взлом Kelp/Aave на $200 млн, или почему я не инвестирую в DeFi +11

08:00

Анализ и модернизация коннектора баз данных с помощью AI-агентов +10

07:09

Возвращение легенды: почему Fortran снова в топе и где его использовать сегодня +10

06:20

IT-монополии наперегонки сращиваются с государством: кто быстрее? +10

13:47

Зачем айтишнику писать книги, и почему сейчас — самый лучший момент? +9

11:17

Как ускорить верификацию: советы для инженеров и менеджеров аппаратной разработки +9

06:00

Apache Cloudberry — преемник Greenplum? +9

09:56

Онбординг сотрудников на удаленке.  Опыт «Инфостарта» +8

11:39

Ловим время в формате DCF77 +7

10:20

Внутри АЛУ микропроцессора 8085 +7

08:24

У женщины нашли опухоль мозга, о которой её предупредили голоса в голове +7

08:00

Я удалил backpropagation из нейросети. Она обучилась методами XIX века +81

11:37

Ревью вайб-кода с гнильцой, который притворяется оптимизированным С++ кодом +68

16:24

Я много лет пытался повысить продуктивность и качество жизни — эксперименты над собой (Часть 1) +65

06:30

Инфраструктура Шрёдингера: как вывести ИТ-ресурсы из суперпозиции и знать всё об активах наверняка +51

07:00

Как устроена торговля между звёздными системами +45

09:01

Что было бы, если бы Linux распространялся под BSD +44

14:43

Почему время замедляется при ускорении? Объяснение, которое вы нигде не найдёте +41

13:01

Голоса в компьютере: поющие сидя +34

10:04

— Мам, купи Suno. — У нас есть Suno дома! ACE‑Step XL 4B — русскоязычная музыкальная студия с открытым исходным кодом +31

15:24

Просто про волновое сопротивление кабеля +28

17:50

AGI уже стучится в дверь человечества. А мы всё ещё думаем, что он станет нашим лучшим другом +26

09:01

12 проблем с отбором резюме: чиним найм по науке +24

06:40

Как организовать балансировку нагрузки Backend приложений Java Spring Cloud + Kubernetes +23

10:55

Чем занимается инженер отдела сопровождения разработки: от предсерийного образца до стабильного продукта +22

07:15

Часы на ВЛИ ИВ-18 +21

11:11

Как (не) перевернуть строку, или Ох, уж этот Unicode +20

07:01

Minisystem: сервисный режим, который может пригодиться каждому, кто работает с СХД +20

07:23

Как я искал проблему в режиме работы, а упёрся в осанку: почему сутулость у меня заметно ухудшала память +16

04:53

Кризис инструментария API: почему разработчики бегут от Postman и его клонов? +16

07:07

Конденсаторное травление печатных плат или фотоэлектрический плоттер ;-)? +15

05:16

Win32 API и ностальгия по окнам странной формы +153

08:00

Ремонт блока питания с Power Delivery. 470 граммов электроники +110

13:01

Электроинструмент становится хуже, и это делается намеренно +108

12:07

Как ИИ-агенты стали новым оружием скамеров на Хабр Карьере +73

20:16

Perl — зря забытый язык программирования? +52

07:05

Механический калькулятор. Как работает арифмометр? +42

09:01

Готовимся к отключению. Эффективные форматы для упаковки и раздачи HTML-страниц +40

12:00

Linux 7.0 и что изменилось в ядре после очередного цикла разработки +34

08:00

Программирование с AI-ассистентом — похороните меня под плинтусом +30

08:12

Легенды 90-х — кто придумал и производил жвачки Turbo, Love is… и TipiTip +29

18:33

Выделение регистров процессора при помощи генетического алгоритма +27

11:35

Vibe++ очень простой язык для промпт-программистов. А почему бы и не да? +27

04:59

Замедление Телеграма замедлилось, а также законопроект об уголовной ответственности за крипту в РФ +27

17:21

Ракета, которая не взлетела: почему компании отказываются от OpenStack +26

09:05

Объяснение лямбда исчисления через Python +25

12:15

Как переложить нагрузку по code review с разработчиков на LLM +23

08:30

Что такое «мышечная память» и можно ли её развить? +18

01:54

Нейропластичность для разработчика — как учиться эффективнее +18

07:21

«Великое очищение» в работе с контентом: что осталось от роли редактора +17

07:01

Playwright vs Selenium на Java: что выбрать для автотестов в 2026 году +16

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Win32 API и ностальгия по окнам странной формы +153

    • 286

    Почему время замедляется при ускорении? Объяснение, которое вы нигде не найдёте +41

    • 249

    Электроинструмент становится хуже, и это делается намеренно +108

    • 196

    Я много лет пытался повысить продуктивность и качество жизни — эксперименты над собой (Часть 1) +65

    • 100

    Perl — зря забытый язык программирования? +52

    • 90

    Как устроена торговля между звёздными системами +45

    • 76

    Vibe++ очень простой язык для промпт-программистов. А почему бы и не да? +27

    • 56

    Просто про волновое сопротивление кабеля +28

    • 48

    Senior Backend не существует. Вы ищете троих +6

    • 45

    Наконец-то он готов: исчерпывающий гайд о запрете иностранных слов в России — всё самое важное в одном посте +7

    • 41

    Что было бы, если бы Linux распространялся под BSD +44

    • 40

    Маск передумал: Model 2 возвращается, но рынок бюджетных авто уже занят китайцами +7

    • 39

    Ремонт блока питания с Power Delivery. 470 граммов электроники +110

    • 37

    Готовимся к отключению. Эффективные форматы для упаковки и раздачи HTML-страниц +40

    • 31

    Часы на ВЛИ ИВ-18 +21

    • 30

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.