OpenAI o1 — LLM, обученная выполнять сложные логические рассуждения +3 01.10.2024 11:34 ruslandevlabs 14 Машинное обучение Искусственный интеллект
Научно-исследовательский кружок по ИИ в робототехнике для студентов и взрослых +27 26.09.2024 07:06 AmigoRRR 0 Программирование Машинное обучение Робототехника Искусственный интеллект Блог компании Сбер
Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM +10 19.09.2024 13:16 anna_schenikova 1 Машинное обучение Искусственный интеллект Блог компании МТС Natural Language Processing
Reinforcement Learning в задаче групповой оптимизации цен 08.07.2024 10:34 muxeu 0 Математика Машинное обучение IT-компании Блог компании X5 Tech
Создание масштабируемых RL систем с Ape-X 01.06.2024 08:56 badcasedaily1 1 Программирование Python Машинное обучение Блог компании OTUS
Обучение с подкреплением: 10 вариантов применения +9 21.11.2023 10:01 MaxRokatansky 1 Машинное обучение Блог компании OTUS
Как я учил нейросеть играть в Rocket League +7 20.11.2023 07:27 MarkWatney 4 Машинное обучение Игры и игровые консоли
Нейросеть, генерирующая нейросети. Часть 2. RL агент создаёт свои первые нейросети 03.10.2023 06:49 SimsiGenerativeBot 0 Open source Машинное обучение Искусственный интеллект
Нейросеть, генерирующая нейросети. Часть 1. Генерация случайной свёрточной нейронной сети +2 27.09.2023 06:51 SimsiGenerativeBot 3 Python Open source Машинное обучение Занимательные задачки Искусственный интеллект
Reinforcment Learning: Google Recsim +3 05.09.2023 14:51 MaxRokatansky 0 Машинное обучение Блог компании OTUS
Лето с AIRI. Как мы съездили на летнюю школу по искусственному интеллекту +1 16.08.2023 13:40 babycar27 0 Машинное обучение Робототехника Искусственный интеллект Конференции Блог компании AIRI
Марковские цепи в обработке естественного языка и моделировании текстовых данных +12 06.07.2023 17:22 MaxRokatansky 2 Блог компании OTUS OTUS corporate blog
Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback +13 25.04.2023 14:47 Nastaa 9 Алгоритмы Data Mining Машинное обучение Искусственный интеллект Будущее здесь
PAC-MAN на основе deep Q network МОДЕЛИ +1 13.12.2021 14:44 NewTechAudit 5 Программирование Python Машинное обучение