• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement-learning

Как мы обучили беспилотники в симуляции для гонок в смешанной реальности +17

  • 24.01.2025 08:42
  • Dataist
  • 1
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Машинное обучение

Контекстные бандиты в ценообразовании

  • 28.12.2024 09:06
  • muxeu
  • 1
  • Блог компании X5 Tech
  • Машинное обучение
  • Алгоритмы
  • Математика

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц +7

  • 22.12.2024 14:19
  • kseniiakeera
  • 0
  • Блог компании Open Data Science
  • Машинное обучение
  • Физика
  • Инженерные системы
  • Научно-популярное

Мультимодальные приложения на Llama 3.2 и Llama Stack +6

  • 21.10.2024 08:37
  • ruslandevlabs
  • 13
  • Машинное обучение
  • Искусственный интеллект

Нейронные оптимизаторы запросов в реляционных БД (Часть 2): На пути к продуктивизации +6

  • 04.10.2024 11:24
  • Safreliy
  • 4
  • Блог компании Postgres Professional
  • Машинное обучение
  • Искусственный интеллект
  • PostgreSQL
  • Алгоритмы

Нейронные оптимизаторы запросов в реляционных БД (Часть 1) +27

  • 09.09.2024 10:54
  • Safreliy
  • 9
  • Блог компании Postgres Professional
  • PostgreSQL
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT +91

  • 28.05.2024 09:00
  • cydoroga
  • 2
  • Блог компании Яндекс
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Гайд на Reinforcement Learning для новичков. Реализация простой задачи

  • 07.04.2024 09:17
  • alexmusyka
  • 1
  • Программирование
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Многорукие бандиты в задаче ритейла

  • 28.12.2023 10:31
  • muxeu
  • 2
  • Блог компании X5 Tech
  • Алгоритмы
  • Математика
  • Машинное обучение

Обучение с блэкджеком и подкреплением. Ищем оптимальную стратегию игры +3

  • 14.11.2023 09:00
  • MarkWatney
  • 8
  • Игры и игровые консоли
  • Алгоритмы
  • Математика
  • Машинное обучение

Нейросеть, генерирующая нейросети. Часть 2. RL агент создаёт свои первые нейросети

  • 03.10.2023 06:49
  • SimsiGenerativeBot
  • 0
  • Open source
  • Машинное обучение
  • Искусственный интеллект

Нейросеть, генерирующая нейросети. Часть 1. Генерация случайной свёрточной нейронной сети +2

  • 27.09.2023 06:51
  • SimsiGenerativeBot
  • 3
  • Open source
  • Занимательные задачки
  • Python
  • Машинное обучение
  • Искусственный интеллект

Reinforcement learning для оптимизации цен в ритейле +5

  • 18.09.2023 11:17
  • Mentalitet
  • 0
  • Python
  • Алгоритмы
  • Машинное обучение

Обучение с подкреплением на Python: Пример не из «качалки» +12

  • 30.10.2021 15:33
  • Dmi3Ut
  • 8
  • Python
  • Машинное обучение
  • Разработка робототехники

Обучение с подкреплением в Super Mario Bros. Сравнение алгоритмов DQN и Dueling DQN +5

  • 17.06.2021 09:11
  • hse_spb
  • 0
  • Блог компании Питерская Вышка
  • Python
  • Машинное обучение
  • Учебный процесс в IT
  • Блог компании Питерская Вышка
  • Python
  • Машинное обучение
  • Учебный процесс в IT
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
03:45

JSON в Unity за 10 минут +2

14:05

Пишем один «exe», который работает на 3-х разных ОС без перекомпиляции +73

19:18

Конституция против цензуры: история одного иска в суд +51

09:01

Спидометр для электромопеда на микроконтроллере PIC16F628A +48

11:02

Низкоуровневое программирование под 8086 для любопытных, часть 2 +44

13:01

Про человека и свободу — реально главный вопрос жизни, вселенной и всего такого +32

14:12

Оцифровка показаний стрелочного манометра в Home Assistant +27

08:00

Архитекторы чипов: как Китай строит инфраструктуру по производству современных процессоров +26

09:49

Не смотрите наверх +21

06:47

Размышления об интервью +20

16:46

Творческая утилизация клавиатур +18

08:24

Huawei и HarmonyOS PC: китайский десктоп с собственной ОС появится уже в этом месяце. Что это будет? +17

11:52

Python, Java, C++ и Go — как появились популярные языки программирования +15

08:02

Задачи на собеседованиях. Денежные переводы в SQL. Обновление счетов и уровни изоляций +12

09:00

Фронтенд — новый легаси: Как мы проспали event-driven революцию +11

19:18

Проводим слепой тест переводов прямо на Хабре +8

17:24

Инженерия — не наука +8

13:01

Промпт-инжиниринг на основе здравого смысла: как понимать LLM и получать от них предсказуемый результат +8

15:14

Почему нужно знать историю фронтенда, даже если просто пишешь на React +7

11:19

Аркадий Стругацкий против Deepseek и ChatGPT: как ИИ повлияет на художественный перевод +7

07:51

Путь самурая к заветной 1К на LeetCode [личный опыт] +7

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Аркадий Стругацкий против Deepseek и ChatGPT: как ИИ повлияет на художественный перевод +7

    • 61

    Задачи на собеседованиях. Денежные переводы в SQL. Обновление счетов и уровни изоляций +12

    • 59

    Конституция против цензуры: история одного иска в суд +54

    • 49

    Не смотрите наверх +21

    • 45

    Фронтенд — новый легаси: Как мы проспали event-driven революцию +11

    • 43

    Инженерия — не наука +8

    • 24

    Проводим слепой тест переводов прямо на Хабре +8

    • 23

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.