Распределённый инференс и шардирование LLM. Часть 3: настройка авторизации и интеграция с Open WebUI +13 16.05.2025 08:00 Myskat_90 10 Блог компании Флант Блог компании Московский кредитный банк Искусственный интеллект DevOps IT-инфраструктура
Распределённый инференс и шардирование LLM. Часть 2: скрипт vLLM, Ray Serve для вывода API и настройка KubeRay Cluster +23 14.05.2025 08:00 Myskat_90 1 Блог компании Флант Блог компании Московский кредитный банк Искусственный интеллект DevOps IT-инфраструктура
Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes +53 12.05.2025 08:35 Myskat_90 3 Видеокарты Блог компании Флант Блог компании Московский кредитный банк Искусственный интеллект Kubernetes DevOps
Облачная инфраструктура в помощь продуктовым командам — как мы это делаем в МКБ 05.08.2024 10:39 Myskat_90 0 Московский кредитный банк corporate blog Блог компании Московский кредитный банк DevOps