Распределённый инференс и шардирование LLM. Часть 2: скрипт vLLM, Ray Serve для вывода API и настройка KubeRay Cluster +18 14.05.2025 08:00 Myskat_90 0 Блог компании Флант Блог компании Московский кредитный банк Искусственный интеллект DevOps IT-инфраструктура
Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes +53 12.05.2025 08:35 Myskat_90 3 Видеокарты Блог компании Флант Блог компании Московский кредитный банк Искусственный интеллект Kubernetes DevOps
Облачная инфраструктура в помощь продуктовым командам — как мы это делаем в МКБ 05.08.2024 10:39 Myskat_90 0 Московский кредитный банк corporate blog Блог компании Московский кредитный банк DevOps