Геометрия превосходства: Почему DeepSeek-V4 и Moonshot AI убили AdamW, и как оптимизатор Muon меняет физику обучения 18.05.2026 18:53 YH7H22 0 Машинное обучение