• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом RL

Как мы обеспечили +33% к точности на сложных SQL-запросах +15

  • 08.10.2025 11:19
  • Safreliy
  • 7
  • Блог компании Postgres Professional
  • Искусственный интеллект
  • Машинное обучение
  • SQL
  • PostgreSQL

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше +4

  • 11.08.2025 09:30
  • ai-talent
  • 1
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Разработка LLM моделей для обновления кода приложений на более высокие версии фреймворков или языков программирования +5

  • 20.06.2025 19:01
  • inigomontoya722
  • 2
  • JavaScript
  • Python
  • Машинное обучение
  • Искусственный интеллект

Обыгрываем казино, с блэкджеком и стратегиями +7

  • 12.06.2025 14:45
  • monkey_llm
  • 4
  • Python
  • Машинное обучение

Действительно ли у ИИ-агента есть внутренняя картина мира и представление о себе? +2

  • 12.05.2025 12:55
  • andre_dataist
  • 6
  • Машинное обучение
  • Искусственный интеллект

RL RecSys в проде: хайп или игра вдолгую +8

  • 14.02.2025 10:50
  • fotol
  • 1
  • Машинное обучение
  • Блог компании Т-Банк

Динамическая адаптация награды с помощью Pydantic +4

  • 12.12.2024 04:26
  • techevangelist
  • 1
  • Машинное обучение
  • Блог компании OTUS

RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI

  • 10.08.2024 06:00
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

RLHF. История становления идеи — 3. Supervised finetune, Протокольный сбор обратной связи, Batch RL

  • 03.08.2024 06:00
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

RLHF. История становления идеи — 2

  • 26.07.2024 06:00
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Обучение с подкреплением на основе обратной связи от человека (RLHF). История становления идеи

  • 19.07.2024 20:11
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Создание масштабируемых RL систем с Ape-X

  • 01.06.2024 08:56
  • badcasedaily1
  • 1
  • Блог компании OTUS
  • Python
  • Программирование
  • Машинное обучение

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT +91

  • 28.05.2024 09:00
  • cydoroga
  • 2
  • Блог компании Яндекс
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Глаза боятся, а ИИ делает: как эмоции помогают ИИ лучше управлять автомобилем

  • 25.12.2023 12:31
  • Lithium_vn
  • 2
  • Блог компании BotHub
  • Машинное обучение
  • Искусственный интеллект

Нейросеть, генерирующая нейросети. Часть 2. RL агент создаёт свои первые нейросети

  • 03.10.2023 06:49
  • SimsiGenerativeBot
  • 0
  • Open source
  • Машинное обучение
  • Искусственный интеллект
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Вчера
  • Позавчера
05:48

Роскомнадзор как форпост свободы и анонимности в Интернете +64

08:10

Простой LC-пробник с e-ink дисплеем +50

18:55

Пишем свою мобильную ОС с нуля на Rust +46

09:01

Мои личные скрипты для повседневной работы +46

10:25

Просто используй кнопку +44

08:30

Почему библиотеки на С такие кривые +29

09:00

Создаем красивые и удобные CLI-приложения на Python с помощью Typer и Rich +25

17:03

Делаем Electron UI более «нативным». Простой гайд из 15 шагов +21

09:46

Баночка с кремом и поношенное нижнее белье. Не содержимое мусорного бака, а экспонаты музея возрастом почти 2 тыс. лет +20

07:05

Ностальгические игры: Painkiller +19

13:01

Почему размер наблюдаемой Вселенной не соответствует её возрасту, и каков её общий размер +18

12:04

Открываем RAG и интернет для LM Studio +15

10:16

Fedora Linux 43: полный переход на Wayland, свежий GNOME и RPM 6.0 +14

09:41

Алхимия дофамина: всё, что вы читали о гормонах, вам не поможет +14

08:49

Насколько Java быстрая? +8

04:15

Claw Engine: как студенты из НИУ ВШЭ релизнули MVP игрового движка +7

15:25

Ретровайб из 90-х: RFC по нетикету, развитию интернета и… варке кофе +6

13:50

PID 1 на минималках: свой init, который жмёт зомби +6

11:48

Песни птиц меняются, как языки у людей +6

08:00

Бум ИИ обернулся дефицитом: почему серверная память подорожала почти вдвое +6

14:05

Хакаем самую дешёвую консоль с Ozon +99

13:57

Я нанял джуна в свой open source проект. Вот что получилось +65

09:01

«Машина останавливается»: как в антиутопии 1909 года появились утонувшие в соцсетях хикки на самоизоляции? +62

10:58

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM +51

06:13

Как я уменьшил Docker-образ Go-приложения с 1.92 GB до 9 MB +50

07:05

Спермоботы атакуют +23

08:00

Домашний сервер в корпусе роутера: Asus выпустила девайс с ИИ, 4 ГБ ОЗУ и 32 ГБ памяти +22

06:00

С появлением ИИ работа опытного программиста стала намного сложнее +20

14:25

Рисовый долгоносик на зерне риса и ещё 19 победителей конкурса микрофотографии Nikon Small World 2025 +19

13:05

Исследуем прошивку старого файлового сервера TrendNET TS‑U100 +19

13:01

AAA-хоррор в 2025 году: возвращение к истокам и самоповторы +15

12:15

Джеффри Хинтон, крестный отец ИИ: «Хотите знать, как выглядит жизнь, когда ты не высший интеллект? Спросите у курицы» +12

08:29

Когда фантастика 1939 года становится реальностью 2025-го +12

07:00

Как мы автоматизировали сеть в облаке и как нам с этим помогла Аннушка +12

16:02

Кризис – это возможности для роста: как мы переходили на отечественный софт +10

16:42

Запатентованный призрак +9

05:21

Эффект Даннинга — Крюгера в нейросети. OCR распознавание текста LLM: доверяй, но проверяй +9

10:13

Как мы в Авито обучили ML-модель находить «договорённости» без данных о сделках +8

09:34

systemd-nspawn: запускаем FidoIP на Arch Linux +8

19:08

Ментальные ограничения в управлении продуктом: как они незаметно убивают инновации +7

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Я нанял джуна в свой open source проект. Вот что получилось +65

    • 100

    Роскомнадзор как форпост свободы и анонимности в Интернете +64

    • 92

    Будет ли важна чистота кода в ближайшем будущем -9

    • 89

    С появлением ИИ работа опытного программиста стала намного сложнее +20

    • 83

    Почему библиотеки на С такие кривые +29

    • 70

    Как я уменьшил Docker-образ Go-приложения с 1.92 GB до 9 MB +50

    • 47

    Кризис – это возможности для роста: как мы переходили на отечественный софт +10

    • 45

    Хабр против ИИ: эпоха неолуддитов или как не потерять работу, когда в вашу компанию пришел ИИ -6

    • 38

    Хакаем самую дешёвую консоль с Ozon +99

    • 36

    Мои личные скрипты для повседневной работы +46

    • 32

    Как Agile убил задачи про люки +4

    • 32

    Офлайн-конвертер PNG в WebP прямо в браузере +4

    • 30

    Энкодер на базе HEDR и STM32 +7

    • 26

    Excommunicado. Прецедент Едилова +3

    • 25

    Больше, чем торт. Почему Хабр — отличная стартовая площадка для авторов +5

    • 24

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.