Распределённый инференс и шардирование LLM. Часть 2: скрипт vLLM, Ray Serve для вывода API и настройка KubeRay Cluster +23 14.05.2025 08:00 Myskat_90 1 Блог компании Флант Блог компании Московский кредитный банк Искусственный интеллект DevOps IT-инфраструктура
Построение инфраструктуры для работы с языковыми моделями: опыт X5 Tech +9 07.02.2025 07:16 EgorovM 0 Блог компании X5 Tech IT-инфраструктура Искусственный интеллект IT-компании