RLHF. История становления идеи — 3. Supervised finetune, Протокольный сбор обратной связи, Batch RL 03.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
RLHF. История становления идеи — 2 26.07.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
Обучение с подкреплением на основе обратной связи от человека (RLHF). История становления идеи 19.07.2024 20:11 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
Новый «ИИгрок»: что мы знаем о Grok? 05.04.2024 08:43 CyberPaul 0 Блог компании Serverspace IT-инфраструктура История IT Искусственный интеллект IT-компании
Reinforcement Learning from Human Feedback: когда одной математики мало +6 21.08.2023 13:06 dustalov 2 Будущее здесь Big Data Открытые данные Машинное обучение Искусственный интеллект
Тварь дрожащая или право имею: как мы лепили виртуального юриста из русскоязычных нейросетей +24 18.05.2023 15:01 Alliesverse 20 Functional Programming Machine Learning Artificial Intelligence Big Data Функциональное программирование Машинное обучение Искусственный интеллект
Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback +13 25.04.2023 14:47 Nastaa 9 Data Mining Алгоритмы Машинное обучение Искусственный интеллект Будущее здесь
ChatGPT — лучший помощник программиста. Примеры реальных задач. Плагины и инструменты +47 17.04.2023 09:00 alizar 80 Блог компании RUVDS.com Программирование Машинное обучение Искусственный интеллект Будущее здесь