RL — Trust Region Policy Optimization (TRPO) Explained. (Часть 1) +1 15.05.2021 08:28 dim2r 0 Машинное обучение Recovery Mode
Глубокое обучение с подкреплением: пинг-понг по сырым пикселям +17 13.05.2019 11:16 dim2r 0 Машинное обучение Разработка робототехники Программирование Алгоритмы Python
Можно ли считать статистику при малом количестве данных? +23 23.01.2019 07:11 dim2r 25 Научно-популярное Занимательные задачки Математика Статистика в IT