Публикации с тегом reinforcement learning / forpes.ru

Публикации с тегом reinforcement learning

Практическое обучение с подкреплением: от забав с MuJoCo'м до битв на арене +26

ML-тренды рекомендательных технологий: шесть приёмов, которые помогают угадывать желания пользователя +17

OpenAI o1 — LLM, обученная выполнять сложные логические рассуждения +3

Научно-исследовательский кружок по ИИ в робототехнике для студентов и взрослых +27

Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM +10

Reinforcement Learning в задаче групповой оптимизации цен

Создание масштабируемых RL систем с Ape-X

Обучение с подкреплением: 10 вариантов применения +9

Как я учил нейросеть играть в Rocket League +7

Нейросеть, генерирующая нейросети. Часть 2. RL агент создаёт свои первые нейросети

Нейросеть, генерирующая нейросети. Часть 1. Генерация случайной свёрточной нейронной сети +2

Reinforcment Learning: Google Recsim +3

Лето с AIRI. Как мы съездили на летнюю школу по искусственному интеллекту +1

Марковские цепи в обработке естественного языка и моделировании текстовых данных +12

Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback +13

«
1
2
3
4
5
6
»

Страница 2 из 6