Публикации с тегом reinforcement-learning / forpes.ru

Публикации с тегом reinforcement-learning

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT +91

Гайд на Reinforcement Learning для новичков. Реализация простой задачи

Многорукие бандиты в задаче ритейла

Обучение с блэкджеком и подкреплением. Ищем оптимальную стратегию игры +3

Нейросеть, генерирующая нейросети. Часть 2. RL агент создаёт свои первые нейросети

Нейросеть, генерирующая нейросети. Часть 1. Генерация случайной свёрточной нейронной сети +2

Reinforcement learning для оптимизации цен в ритейле +5

Обучение с подкреплением на Python: Пример не из «качалки» +12

Обучение с подкреплением в Super Mario Bros. Сравнение алгоритмов DQN и Dueling DQN +5

Машинное обучение с подкреплением через соревновательные нейронные сети +2

Машинное обучение глубокой нейронной сети с подкреплением на tensorflow.js: Трюки +4

«
1
2
»

Страница 2 из 2