Публикации с тегом RLHF / forpes.ru

Публикации с тегом RLHF

За кулисами нейросетей: полный цикл тренировки языкового ИИ +2

Знания без практики — мертвы | Разница между «декларативной» и «процедурной» памятью у LLM

Почему текст от LLM узнаётся за пять секунд: разбираю стилистические маркеры через архитектуру моделей +30

Классификация галлюцинаций LLM | «Врага нужно знать в лицо» +11

171 эмоция, психиатр и прямая связь с reward hacking — пробуем заглянуть внутрь Claude +1

Искусственный интеллект

Как ИИ-подхалимы затягивают в ИИ-психоз, или К чему приводит токсичное поддакивание +33

Ваш любимый ИИ не умеет считать. Что ещё скрывает текстовая модель? +6

Да-машина: почему ваш AI никогда не скажет что код — отстой +3

Практика alignment: данные, RLHF и UX как конкурентное преимущество

Humans-in-the-loop vs synthetic data: за что идёт борьба на рынке AaaS

Выбросить нельзя, переобозначить. Или как дообучать LLM даже на ошибках и без RLHF +1

DeepSeek-R1 для чайников +80

DeepSeek-R1 для чайников +80

Законы масштабирования – архитектура O1 Pro // Инфраструктура синтетических данных, RLAIF, токеномика вычислений +1

Poisoned Data — отравление данных для LLM и создание «Спящего Агента»

«
1
2
»

Страница 1 из 2