Публикации автора MrsWallbreaker / forpes.ru

Публикации автора MrsWallbreaker

Один суффикс, чтобы взломать их всех +3

Poisoned Data — отравление данных для LLM и создание «Спящего Агента»

Стеганография в LLM и защита от нее

RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI

Не любой In-context learning одинаково полезен

RLHF. История становления идеи — 3. Supervised finetune, Протокольный сбор обратной связи, Batch RL

RLHF. История становления идеи — 2

Обучение с подкреплением на основе обратной связи от человека (RLHF). История становления идеи

Страница 1 из 1