• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement-learning

Математическое программирование vs RL: может ли ИИ догнать классику в оптимизации? +7

  • 31.03.2026 07:03
  • Lozkins
  • 3
  • Алгоритмы
  • Математика
  • Машинное обучение
  • Искусственный интеллект

Что я вынес из Oxford Machine Learning Summer School 2025

  • 13.10.2025 16:02
  • SuperEstrad
  • 0
  • Natural Language Processing
  • Машинное обучение
  • Робототехника
  • Учебный процесс в IT

Реализуем Q learning на Python +3

  • 02.10.2025 10:23
  • Andrey_Biryukov
  • 1
  • Блог компании OTUS
  • Машинное обучение
  • Искусственный интеллект
  • Python

AI-движки на примере Knowledge Distillation, GAN, Reinforcement learning -1

  • 28.09.2025 12:06
  • xitri_kot
  • 0
  • Python
  • TensorFlow

GEPA вместо RL: как рефлексивная эволюция промптов обгоняет обучение с подкреплением +1

  • 11.09.2025 11:00
  • kucev
  • 0
  • Data Engineering
  • Big Data
  • Машинное обучение
  • Искусственный интеллект
  • Data Mining

Скорость, стратегия и алгоритмы: будущее Формулы-1 в эпоху AI -2

  • 04.09.2025 11:00
  • kucev
  • 0
  • Artificial Intelligence
  • Machine Learning
  • Data Mining
  • Искусственный интеллект
  • Машинное обучение
  • Big Data
  • Data Engineering

LLM на прокачку: практический гайд по Alignment +8

  • 18.08.2025 10:26
  • DeadSailor
  • 0
  • Точка corporate blog
  • Artificial Intelligence
  • Machine Learning
  • Блог компании Точка
  • Блог компании Точка банк
  • Natural Language Processing
  • Python
  • Искусственный интеллект
  • Машинное обучение

GSPO (Qwen RL Algorithm by Alibaba Cloud) +2

  • 10.08.2025 17:56
  • Verbasik
  • 2
  • Машинное обучение

RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты +12

  • 05.08.2025 14:15
  • quantAIengineer
  • 14
  • Python
  • Искусственный интеллект
  • Криптовалюты
  • Машинное обучение

«Скайнет» наоборот: как вырастить и обучить ИИ с помощью Дарвин-Гёдель машины для улучшения человеческой демографии

  • 25.06.2025 13:12
  • Antony_Rain
  • 6
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Python
  • GitHub
  • Машинное обучение

Как мы обучили беспилотники в симуляции для гонок в смешанной реальности +17

  • 24.01.2025 08:42
  • Dataist
  • 1
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Машинное обучение

Контекстные бандиты в ценообразовании

  • 28.12.2024 09:06
  • muxeu
  • 1
  • Блог компании X5 Tech
  • Машинное обучение
  • Алгоритмы
  • Математика

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц +7

  • 22.12.2024 14:19
  • kseniiakeera
  • 0
  • Блог компании Open Data Science
  • Машинное обучение
  • Физика
  • Инженерные системы
  • Научно-популярное

Мультимодальные приложения на Llama 3.2 и Llama Stack +6

  • 21.10.2024 08:37
  • ruslandevlabs
  • 13
  • Машинное обучение
  • Искусственный интеллект

Нейронные оптимизаторы запросов в реляционных БД (Часть 2): На пути к продуктивизации +6

  • 04.10.2024 11:24
  • Safreliy
  • 4
  • Блог компании Postgres Professional
  • Машинное обучение
  • Искусственный интеллект
  • PostgreSQL
  • Алгоритмы
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
09:01

Реверсим штатный ключ сигнализации JAC-Москвич +47

09:01

Тридцать три тысячи жизней: самое громкое киберпреступление в истории Финляндии +31

07:02

userver 3.0 — большой релиз фреймворка для IO‑bound‑программ, переход на C++20 +23

12:00

Практическое руководство по Qwen: установка, настройка vLLM и работа через API +22

07:00

PicoClaw на Arduino Uno Q +22

08:00

Автоматизируем создание глобального роутера для связи выделенного и облачного серверов +20

07:05

Если трос оборвался. Что произойдет с кабиной лифта в самом плохом случае? +20

13:47

Зачем айтишнику писать книги, и почему сейчас — самый лучший момент? +19

08:17

Разработка RC-машинки с BLDC. Подход с нуля +19

07:06

Рецензия на книгу «Основы разработки приложений для iOS» +18

11:39

Ловим время в формате DCF77 +15

13:01

Устанавливаем почтовый сервер Addy.io для одноразовых почтовых адресов +13

11:17

Как ускорить верификацию: советы для инженеров и менеджеров аппаратной разработки +13

06:20

IT-монополии наперегонки сращиваются с государством: кто быстрее? +13

13:49

PLONK: разбираем уязвимости криптографического протокола +12

16:25

$1.8 миллиарда, два брата и ноль проверок: как The New York Times попалась на AI-хайп +11

10:20

Внутри АЛУ микропроцессора 8085 +11

08:17

Свежий взлом Kelp/Aave на $200 млн, или почему я не инвестирую в DeFi +11

07:09

Возвращение легенды: почему Fortran снова в топе и где его использовать сегодня +11

09:30

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака +10

08:00

Я удалил backpropagation из нейросети. Она обучилась методами XIX века +85

16:24

Я много лет пытался повысить продуктивность и качество жизни — эксперименты над собой (Часть 1) +82

11:37

Ревью вайб-кода с гнильцой, который притворяется оптимизированным С++ кодом +70

14:43

Почему время замедляется при ускорении? Объяснение, которое вы нигде не найдёте +58

06:30

Инфраструктура Шрёдингера: как вывести ИТ-ресурсы из суперпозиции и знать всё об активах наверняка +51

07:00

Как устроена торговля между звёздными системами +47

09:01

Что было бы, если бы Linux распространялся под BSD +44

13:01

Голоса в компьютере: поющие сидя +37

10:04

— Мам, купи Suno. — У нас есть Suno дома! ACE‑Step XL 4B — русскоязычная музыкальная студия с открытым исходным кодом +32

17:50

AGI уже стучится в дверь человечества. А мы всё ещё думаем, что он станет нашим лучшим другом +31

15:24

Просто про волновое сопротивление кабеля +29

10:55

Чем занимается инженер отдела сопровождения разработки: от предсерийного образца до стабильного продукта +24

09:01

12 проблем с отбором резюме: чиним найм по науке +24

06:40

Как организовать балансировку нагрузки Backend приложений Java Spring Cloud + Kubernetes +23

11:11

Как (не) перевернуть строку, или Ох, уж этот Unicode +22

07:15

Часы на ВЛИ ИВ-18 +21

07:01

Minisystem: сервисный режим, который может пригодиться каждому, кто работает с СХД +21

07:23

Как я искал проблему в режиме работы, а упёрся в осанку: почему сутулость у меня заметно ухудшала память +17

07:07

Конденсаторное травление печатных плат или фотоэлектрический плоттер ;-)? +16

04:53

Кризис инструментария API: почему разработчики бегут от Postman и его клонов? +16

05:16

Win32 API и ностальгия по окнам странной формы +153

08:00

Ремонт блока питания с Power Delivery. 470 граммов электроники +113

13:01

Электроинструмент становится хуже, и это делается намеренно +111

12:07

Как ИИ-агенты стали новым оружием скамеров на Хабр Карьере +74

20:16

Perl — зря забытый язык программирования? +51

07:05

Механический калькулятор. Как работает арифмометр? +42

09:01

Готовимся к отключению. Эффективные форматы для упаковки и раздачи HTML-страниц +41

12:00

Linux 7.0 и что изменилось в ядре после очередного цикла разработки +36

08:00

Программирование с AI-ассистентом — похороните меня под плинтусом +30

08:12

Легенды 90-х — кто придумал и производил жвачки Turbo, Love is… и TipiTip +29

17:21

Ракета, которая не взлетела: почему компании отказываются от OpenStack +28

09:05

Объяснение лямбда исчисления через Python +28

18:33

Выделение регистров процессора при помощи генетического алгоритма +27

11:35

Vibe++ очень простой язык для промпт-программистов. А почему бы и не да? +27

04:59

Замедление Телеграма замедлилось, а также законопроект об уголовной ответственности за крипту в РФ +27

12:15

Как переложить нагрузку по code review с разработчиков на LLM +23

08:30

Что такое «мышечная память» и можно ли её развить? +18

07:21

«Великое очищение» в работе с контентом: что осталось от роли редактора +18

01:54

Нейропластичность для разработчика — как учиться эффективнее +18

07:01

Playwright vs Selenium на Java: что выбрать для автотестов в 2026 году +16

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Почему время замедляется при ускорении? Объяснение, которое вы нигде не найдёте +58

    • 331

    Win32 API и ностальгия по окнам странной формы +153

    • 286

    Электроинструмент становится хуже, и это делается намеренно +111

    • 198

    Я много лет пытался повысить продуктивность и качество жизни — эксперименты над собой (Часть 1) +82

    • 127

    Perl — зря забытый язык программирования? +52

    • 91

    Как устроена торговля между звёздными системами +47

    • 84

    Просто про волновое сопротивление кабеля +29

    • 69

    Vibe++ очень простой язык для промпт-программистов. А почему бы и не да? +27

    • 56

    Senior Backend не существует. Вы ищете троих +6

    • 49

    Что было бы, если бы Linux распространялся под BSD +44

    • 46

    Маск передумал: Model 2 возвращается, но рынок бюджетных авто уже занят китайцами +7

    • 42

    Наконец-то он готов: исчерпывающий гайд о запрете иностранных слов в России — всё самое важное в одном посте +7

    • 41

    Ремонт блока питания с Power Delivery. 470 граммов электроники +113

    • 37

    AGI уже стучится в дверь человечества. А мы всё ещё думаем, что он станет нашим лучшим другом +31

    • 34

    Ревью вайб-кода с гнильцой, который притворяется оптимизированным С++ кодом +70

    • 34

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.