Публикации автора dim2r / forpes.ru

Публикации автора dim2r

RL — Trust Region Policy Optimization (TRPO) Explained. (Часть 1) +1

Глубокое обучение с подкреплением: пинг-понг по сырым пикселям +17

Можно ли считать статистику при малом количестве данных? +23

Страница 1 из 1