Poisoned Data — отравление данных для LLM и создание «Спящего Агента» 20.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
Стеганография в LLM и защита от нее 13.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI 10.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
Не любой In-context learning одинаково полезен 06.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
RLHF. История становления идеи — 3. Supervised finetune, Протокольный сбор обратной связи, Batch RL 03.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
RLHF. История становления идеи — 2 26.07.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
Обучение с подкреплением на основе обратной связи от человека (RLHF). История становления идеи 19.07.2024 20:11 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing