RL — Trust Region Policy Optimization (TRPO) Explained. (Часть 1) +1 15.05.2021 08:28 dim2r 0 Машинное обучение Recovery Mode
Обучение умных игровых соперников в Unity методом «игра с самим собой» средствами ML-Agents +2 18.06.2020 09:51 ph_piter 5 Программирование Разработка игр Алгоритмы Блог компании Издательский дом «Питер» Unity
Глубокое обучение с подкреплением: пинг-понг по сырым пикселям +17 13.05.2019 11:16 dim2r 0 Машинное обучение Разработка робототехники Программирование Алгоритмы Python
Обзор AI & ML решений в 2018 году и прогнозы на 2019 год: Часть 2 — Инструменты и библиотеки, AutoML, RL, этика в AI +16 11.02.2019 07:22 gubanovpa 0 Машинное обучение Big Data Искусственный интеллект Алгоритмы Data Mining
Обучение с подкреплением на языке Python +10 28.12.2018 14:30 ph_piter 1 Машинное обучение Алгоритмы Python Профессиональная литература Блог компании Издательский дом «Питер»
Обучение с подкреплением никогда не работало +18 02.03.2018 13:12 m1rko 1 Алгоритмы Машинное обучение
Глубинное обучение с подкреплением пока не работает +58 23.02.2018 20:19 m1rko 22 Алгоритмы Обработка изображений Машинное обучение Разработка робототехники Разработка игр