Геометрия превосходства: Почему DeepSeek-V4 и Moonshot AI убили AdamW, и как оптимизатор Muon меняет физику обучения 18.05.2026 18:53 YH7H22 0 Машинное обучение
Тихий убийца Трансформеров: как Weight Decay уничтожает эмбеддинги и нормализацию 17.05.2026 18:31 YH7H22 7 Машинное обучение
Оптимизация пластичности ИИ: техники и инструменты для разработчиков +1 29.01.2025 22:15 juliasherparpa 0 Искусственный интеллект Блог компании Шерпа Роботикс