Poisoned Data — отравление данных для LLM и создание «Спящего Агента» 20.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI 10.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
RLHF. История становления идеи — 3. Supervised finetune, Протокольный сбор обратной связи, Batch RL 03.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
RLHF. История становления идеи — 2 26.07.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
Обучение с подкреплением на основе обратной связи от человека (RLHF). История становления идеи 19.07.2024 20:11 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
Новый «ИИгрок»: что мы знаем о Grok? 05.04.2024 08:43 CyberPaul 0 Искусственный интеллект IT-компании IT-инфраструктура История IT Блог компании Serverspace
Reinforcement Learning from Human Feedback: когда одной математики мало +6 21.08.2023 13:06 dustalov 2 Big Data Машинное обучение Открытые данные Искусственный интеллект Будущее здесь
Тварь дрожащая или право имею: как мы лепили виртуального юриста из русскоязычных нейросетей +24 18.05.2023 15:01 Alliesverse 20 Big Data Машинное обучение Функциональное программирование Искусственный интеллект Machine Learning Artificial Intelligence Functional Programming
Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback +13 25.04.2023 14:47 Nastaa 9 Алгоритмы Data Mining Машинное обучение Искусственный интеллект Будущее здесь
ChatGPT — лучший помощник программиста. Примеры реальных задач. Плагины и инструменты +47 17.04.2023 09:00 alizar 80 Программирование Машинное обучение Искусственный интеллект Будущее здесь Блог компании RUVDS.com