• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом RL

Как мы обеспечили +33% к точности на сложных SQL-запросах +15

  • 08.10.2025 11:19
  • Safreliy
  • 7
  • Блог компании Postgres Professional
  • Искусственный интеллект
  • Машинное обучение
  • SQL
  • PostgreSQL

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше +4

  • 11.08.2025 09:30
  • ai-talent
  • 1
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Разработка LLM моделей для обновления кода приложений на более высокие версии фреймворков или языков программирования +5

  • 20.06.2025 19:01
  • inigomontoya722
  • 2
  • JavaScript
  • Python
  • Машинное обучение
  • Искусственный интеллект

Обыгрываем казино, с блэкджеком и стратегиями +7

  • 12.06.2025 14:45
  • monkey_llm
  • 4
  • Python
  • Машинное обучение

Действительно ли у ИИ-агента есть внутренняя картина мира и представление о себе? +2

  • 12.05.2025 12:55
  • andre_dataist
  • 6
  • Машинное обучение
  • Искусственный интеллект

RL RecSys в проде: хайп или игра вдолгую +8

  • 14.02.2025 10:50
  • fotol
  • 1
  • Машинное обучение
  • Блог компании Т-Банк

Динамическая адаптация награды с помощью Pydantic +4

  • 12.12.2024 04:26
  • techevangelist
  • 1
  • Машинное обучение
  • Блог компании OTUS

RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI

  • 10.08.2024 06:00
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

RLHF. История становления идеи — 3. Supervised finetune, Протокольный сбор обратной связи, Batch RL

  • 03.08.2024 06:00
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

RLHF. История становления идеи — 2

  • 26.07.2024 06:00
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Обучение с подкреплением на основе обратной связи от человека (RLHF). История становления идеи

  • 19.07.2024 20:11
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Создание масштабируемых RL систем с Ape-X

  • 01.06.2024 08:56
  • badcasedaily1
  • 1
  • Блог компании OTUS
  • Python
  • Программирование
  • Машинное обучение

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT +91

  • 28.05.2024 09:00
  • cydoroga
  • 2
  • Блог компании Яндекс
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Глаза боятся, а ИИ делает: как эмоции помогают ИИ лучше управлять автомобилем

  • 25.12.2023 12:31
  • Lithium_vn
  • 2
  • Блог компании BotHub
  • Машинное обучение
  • Искусственный интеллект

Нейросеть, генерирующая нейросети. Часть 2. RL агент создаёт свои первые нейросети

  • 03.10.2023 06:49
  • SimsiGenerativeBot
  • 0
  • Open source
  • Машинное обучение
  • Искусственный интеллект
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
04:35

Автоматизация рутины на hh.ru: Как мы учили Headless Chrome притворяться живым человеком (RPA против Anti-Fraud) +6

05:54

Подсмотрел PIN от двери, а затем воткнул Wi-Fi-жучка за принтер — и ты внутри сети банка +1

08:05

Мне этот Chrome DevTools теперь абсолютно понятен +52

01:49

Паранойя безопасности против здравого смысла: чиним Home Assistant, который окирпичился без интернета +50

09:21

Куда делись звуковые карты и кому они по-прежнему нужны в 2026 году +38

15:26

Универсальная простота FAR. Как настроить и кастомизировать пользовательское меню +36

07:05

О таких подарках вы даже не мечтали: крутейшие игрушки стран Соцблока +29

13:02

Что такое цифровая доступность (accessibility)? +23

09:01

Ламповый гитарный комбоусилитель из советских деталей +23

18:15

Рабочие станции для ML и Data Science — как собрать сервер под столом +21

08:00

Пет-проекты для новогодних праздников: от роботов до крестиков-ноликов +17

17:02

Процессор, которого не существует. Читаем и пишем ПЗУ +16

15:54

FastAPI: 5 практичных архитектурных решений, о которых я пожалел, что не узнал раньше +14

11:03

Мифы об обратной совместимости +12

09:31

Эксперты предсказывали… Каким видели 2026-й несколько лет назад +12

09:30

10 полезных Python-библиотек для автоматизации повседневных задач +12

11:11

Два рождественских червя 80-х: как доверие к сети стало проблемой задолго до фишинга +9

16:19

Как мы ввели автосертификацию дашбордов в Авито +8

09:22

Открыть или пролистать — как вы выбираете статьи в ленте? Опрос редакции блога X5 Tech +8

12:50

Claude Code: маршрут обучения и полезные ресурсы (2026) +7

12:16

Java Digest — Новогодний спецвыпуск +7

13:20

Что было на FPGA-Systems 2025: пятерка лучших докладов по оценкам зрителей +6

08:05

EMG TR4401: Оживляем Венгерский Осциллограф +70

13:28

Радары и то как от них прячутся. Часть 1 +69

12:02

Как заставить китайскую механическую клавиатуру работать в Linux +54

15:33

Как узнать айпи собеседника в телеграм в 1 клик? Дуров не фиксит это третий год… +46

13:01

Большим GPU не нужны большие PC +35

14:14

Мы построили 80 домов, зарабатываем 13 млн в год, но вам не советую +34

06:15

Двухканальная паяльная станция на базе STM32 +34

16:20

Ну всё, пора закапывать UTF-8 +33

09:01

Что будет, когда ИИ-пузырь лопнет +33

12:00

Обработчики событий в JavaScript +28

08:00

Какие навыки прокачать IT-специалисту на новогодних каникулах: подборка курсов от Selectel +24

10:31

Алан Кей об отправке сообщений +21

13:06

CRTP должен умереть? АйТир Лист идиом и фичей C++: от худших к лучшим +20

05:55

Если в LinkedIn у CEO открыт номер телефона — считайте, компания уже взломана +19

18:11

pg-status — легковесный микросервис для определения статуса PostgreSQL хостов +16

06:04

Можно ли собрать кубик Рубика случайно? 10 фактов о вероятности, стремящейся к нулю +16

21:02

Сколько фирме стоит увольнение сотрудника? +15

14:42

Антипаттерн LLM-приложений: когда модель игнорирует контекст. Часть 2 +13

07:48

Взгляд на виртуального больного активирует иммунитет, подобно вакцине +13

19:16

Обучение эмбеддингов GitHub репозиториев +11

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Что будет, когда ИИ-пузырь лопнет +33

    • 288

    Почему мы все хорошо живём и обязаны этим капитализму? +6

    • 177

    Мы построили 80 домов, зарабатываем 13 млн в год, но вам не советую +34

    • 147

    Ну всё, пора закапывать UTF-8 +33

    • 115

    Куда делись звуковые карты и кому они по-прежнему нужны в 2026 году +38

    • 110

    О таких подарках вы даже не мечтали: крутейшие игрушки стран Соцблока +29

    • 77

    Как узнать айпи собеседника в телеграм в 1 клик? Дуров не фиксит это третий год… +46

    • 73

    Двухканальная паяльная станция на базе STM32 +34

    • 51

    IBM 5150 и разработка под самый первый PC +9

    • 42

    Математика парадоксов +4

    • 41

    Паранойя безопасности против здравого смысла: чиним Home Assistant, который окирпичился без интернета +50

    • 36

    Сколько фирме стоит увольнение сотрудника? +15

    • 34

    Универсальная простота FAR. Как настроить и кастомизировать пользовательское меню +36

    • 33

    Как заставить китайскую механическую клавиатуру работать в Linux +54

    • 27

    Канал в MAX для организаций и бизнеса. Задачка без решения? +4

    • 26

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.