• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement learning

Марковские цепи в обработке естественного языка и моделировании текстовых данных +12

  • 06.07.2023 17:22
  • MaxRokatansky
  • 2
  • Блог компании OTUS
  • OTUS corporate blog

Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback +13

  • 25.04.2023 14:47
  • Nastaa
  • 9
  • Data Mining
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • Будущее здесь

Захватывающая история о градиенте стратегии в RL +7

  • 15.11.2022 08:58
  • LazyManul
  • 0
  • Машинное обучение

PAC-MAN на основе deep Q network МОДЕЛИ +1

  • 13.12.2021 14:44
  • NewTechAudit
  • 5
  • Python
  • Программирование
  • Машинное обучение

Обучение с подкреплением на Python: Пример не из «качалки» +12

  • 30.10.2021 15:33
  • Dmi3Ut
  • 8
  • Python
  • Машинное обучение
  • Разработка робототехники

Рекомендательные системы: проблемы и методы решения. Часть 2 +5

  • 20.08.2021 14:55
  • Jaylla
  • 6
  • Блог компании Prequel
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Обучение с подкреплением: как работают новые возможности библиотеки SberPM +8

  • 01.07.2021 14:04
  • DanilSmith
  • 0
  • Анализ и проектирование систем
  • Data Mining
  • Управление проектами
  • Блог компании Сбер
  • Анализ и проектирование систем
  • Data Mining
  • Управление проектами

RL — Trust Region Policy Optimization (TRPO) Explained. (Часть 1) +1

  • 15.05.2021 08:28
  • dim2r
  • 0
  • Машинное обучение
  • Recovery Mode

Студенческий AI-хакатон от Deutsche Telekom IT Solutions и Университета ИТМО +3

  • 09.04.2021 07:31
  • yanamay
  • 0
  • Блог компании Deutsche Telekom IT Solutions (ex T-Systems)
  • Хакатоны
  • Машинное обучение
  • Искусственный интеллект
  • Интернет вещей

Сэмплирование Томпсона +40

  • 18.03.2021 08:00
  • fantomius
  • 0
  • Блог компании ДомКлик
  • Python
  • Машинное обучение

Как мы управляли поездами на соревновании NeurIPS 2020: Flatland +7

  • 15.01.2021 09:02
  • hse_spb
  • 2
  • Блог компании Питерская Вышка
  • Машинное обучение
  • Учебный процесс в IT
  • Транспорт

Фронтендер пишет нейронки. Уровень сложности «хочу на ручки» +18

  • 05.01.2021 18:04
  • Werawoolf
  • 10
  • JavaScript
  • TensorFlow

World Models — обучение в воображении +14

  • 12.09.2020 04:07
  • DesertFlow
  • 10
  • Искусственный интеллект

Как Reinforcement Learning помогает ритейлерам +2

  • 10.08.2020 09:33
  • Emiliia_GBC
  • 0
  • Big Data
  • Блог компании GlowByte

Учим ИИ распределять пироги по магазинам с помощью обучения с подкреплением +1

  • 21.07.2020 11:07
  • Elias_Zauer
  • 2
  • Python
  • Машинное обучение
  • Искусственный интеллект
  • Из песочницы
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • »
Страница 2 из 5
ЛУЧШЕЕ

  • Вчера
  • Позавчера
09:01

От React всё также веет безумием, но все об этом молчат +61

13:39

Как выйти из IT?.. и пойти слесарем на завод. Моя попыточка дауншифтинга [1\4] +27

13:01

Большое испытание кальциевых аккумуляторов, часть 2: недозаряд портит, а кипячение убивает +22

08:02

Commodore 64 Ultimate: возрождение легенды в 2025 году +19

08:13

Новый рекорд по упаковке сфер неожиданно пришёл из геометрии +12

07:16

Конфаундинг, или как аналитику попасть в ловушку +10

16:16

Как “по-быстрому” сделанная игра затянула меня в геймдев на 20 лет и какие выводы я из этого сделал +9

06:15

Vue: Composables и TS это вам не Mixins и JS. С ними сложнее +8

10:08

Свой ChatGPT на документах: делаем RAG с нуля +7

09:02

Kubernetes на базе Deckhouse в облаке Linx Cloud: встроенный мониторинг, безопасность и управление сертификатами +7

08:16

«Хочу, но боюсь и не делаю»: что делать со страхом того, что не получится? +7

05:16

Алгоритмы для работы с большими данными в Go: HyperLogLog и Count-Min Sketch +7

04:41

Управление проектами: дайджест публикаций #36 +6

12:00

Как я пришёл в open source в 2025-м (с утилитой для бекапа PostgreSQL), чуть не потеряв проект на ~$1500\мес в 2023-м +5

13:30

Пеликаны, сарказм и логические игры: забавные LLM-бенчмарки +4

13:16

Опыт ≠ меньше денег: за что в ИТ мы на самом деле платим +4

12:15

Алгоритм Диница: как найти максимальный поток в сети (для начинающих) +4

10:15

Как дизайн Kaspersky Thin Client пережил подростковый бунт (и что из этого вышло) +4

10:15

Как дизайн Kaspersky Thin Client пережил подростковый бунт (и что из этого вышло) +4

08:00

Без(д)воз(д)мездно, то есть даром +4

08:41

Как в РФ разрабатывали уникальный судовой радар ближней зоны в диапазоне 76 ГГц +68

09:01

Первые анекдоты о программистах: юмор айтишников на переломе тысячелетий, 1999-2000 годы +58

05:29

VLESS+Reality и Multi-hop: Архитектура VPN-цепочки для нового поколения блокировок +43

00:21

Исследование METR: использование Cursor замедляет опытных разработчиков на 19 % +39

13:01

Голографический принцип: реальность как иллюзия +38

12:00

Самодельный компьютерный стол с навороченной начинкой внутри за 20 шагов +36

18:16

Территория Большого Взрыва. Что, где и когда взорвалось +29

14:05

Drift Skate, Freeskates, Freeline Skates, Кайф +27

08:14

Xreal One Pro — подробный разбор новых AR-очков с чипом X1 и экраном до 191 дюйма +20

17:29

Ещё один PID-контроллер +18

16:32

Девушки, котики и Flux Kontext: как выжать максимум из WebUI Forge? +17

21:09

Не хватило мощности: история бренда «Техносила» +14

11:29

«Почему топ менеджеры выбирали SAP, но...» что пошло не так у автора +13

06:05

История игровой журналистики в России +13

05:48

Универсальные подсказки по промптам (продвинутые советы) (Ч.2) +11

20:45

Цистеин. Как одна аминокислота мешает худеть. И спасибо ей за это +7

14:44

Разработка требований к ПО с помощью Markdown, Git и Obsidian +7

01:17

Сделай удобно: подборка UI/UX-кейсов из цифровых и нецифровых продуктов (#18) +7

18:46

Открытые инструменты для визуализации сетевого трафика +5

04:37

Laravel: электронная подпись на сервере с PDF визуализацией +4

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Самодельный компьютерный стол с навороченной начинкой внутри за 20 шагов +36

    • 181

    VLESS+Reality и Multi-hop: Архитектура VPN-цепочки для нового поколения блокировок +43

    • 115

    От React всё также веет безумием, но все об этом молчат +61

    • 102

    Территория Большого Взрыва. Что, где и когда взорвалось +29

    • 96

    «Почему топ менеджеры выбирали SAP, но...» что пошло не так у автора +13

    • 72

    Исследование METR: использование Cursor замедляет опытных разработчиков на 19 % +39

    • 62

    Хабра-харакири 2: Как я спросил, и мне ответили +2

    • 45

    Как в РФ разрабатывали уникальный судовой радар ближней зоны в диапазоне 76 ГГц +68

    • 36

    Скоро без нас: когда роботы окончательно отберут нашу работу? +2

    • 28

    Без(д)воз(д)мездно, то есть даром +4

    • 28

    Drift Skate, Freeskates, Freeline Skates, Кайф +27

    • 27

    No Cars Allowed? Что с трендом на улицы без авто +2

    • 23

    Не хватило мощности: история бренда «Техносила» +14

    • 23

    Первые анекдоты о программистах: юмор айтишников на переломе тысячелетий, 1999-2000 годы +58

    • 23

    Голографический принцип: реальность как иллюзия +38

    • 21

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.