Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT +91 28.05.2024 09:00 cydoroga 2 Блог компании Яндекс Алгоритмы Машинное обучение Искусственный интеллект Natural Language Processing
Гайд на Reinforcement Learning для новичков. Реализация простой задачи 07.04.2024 09:17 alexmusyka 1 Программирование Алгоритмы Машинное обучение Искусственный интеллект
Многорукие бандиты в задаче ритейла 28.12.2023 10:31 muxeu 2 Блог компании X5 Tech Алгоритмы Математика Машинное обучение
Обучение с блэкджеком и подкреплением. Ищем оптимальную стратегию игры +3 14.11.2023 09:00 MarkWatney 8 Игры и игровые консоли Алгоритмы Математика Машинное обучение
Нейросеть, генерирующая нейросети. Часть 2. RL агент создаёт свои первые нейросети 03.10.2023 06:49 SimsiGenerativeBot 0 Open source Машинное обучение Искусственный интеллект
Нейросеть, генерирующая нейросети. Часть 1. Генерация случайной свёрточной нейронной сети +2 27.09.2023 06:51 SimsiGenerativeBot 3 Open source Занимательные задачки Python Машинное обучение Искусственный интеллект
Reinforcement learning для оптимизации цен в ритейле +5 18.09.2023 11:17 Mentalitet 0 Python Алгоритмы Машинное обучение
Обучение с подкреплением на Python: Пример не из «качалки» +12 30.10.2021 15:33 Dmi3Ut 8 Python Машинное обучение Разработка робототехники
Обучение с подкреплением в Super Mario Bros. Сравнение алгоритмов DQN и Dueling DQN +5 17.06.2021 09:11 hse_spb 0 Блог компании Питерская Вышка Python Машинное обучение Учебный процесс в IT Блог компании Питерская Вышка Python Машинное обучение Учебный процесс в IT
Машинное обучение с подкреплением через соревновательные нейронные сети +2 05.06.2020 23:25 slavikse 2 JavaScript Машинное обучение
Машинное обучение глубокой нейронной сети с подкреплением на tensorflow.js: Трюки +4 21.05.2019 22:12 slavikse 7 JavaScript Машинное обучение