Видеокарты для нейросетей: две RTX 5060 Ti 16GB или одна RTX 3090 24GB? Тест LLM‑инференса +25 18.06.2025 08:00 dmitrifriend 34 Блог компании BotHub Компьютерное железо Искусственный интеллект Машинное обучение
Ускорение DeepSeek-R1 с подвохом: Когда токены в секунду врут о реальной скорости +3 18.06.2025 07:44 Banakhovich 6 Искусственный интеллект
Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта +70 09.06.2025 14:21 Banakhovich 109 Искусственный интеллект
Тестирование производительности видеокарт на примере больших языковых моделей с использованием Llama.cpp -3 09.06.2025 09:56 COBECT 1 Видеокарты Машинное обучение Искусственный интеллект
Как мы прикрутили RAG для интент-классификации, или Трудности перевода на LLM-ский +15 20.02.2025 08:00 nsykhr 0 Блог компании ДомКлик Natural Language Processing Машинное обучение
Квантовать или не квантовать LLM? +16 10.10.2024 08:42 FirstJohn 2 Блог компании FirstVDS Машинное обучение Искусственный интеллект Open source
Распределённый инференс llama.cpp через RPC +24 14.09.2024 16:07 efreelancer 15 Machine Learning Artificial Intelligence Машинное обучение DevOps Искусственный интеллект
Установка LLM на скромном VPS 24.07.2024 09:00 ru_vds 13 Блог компании RUVDS.com Хостинг Open source Серверное администрирование Искусственный интеллект
Enbeddrus — обучение независящей от языка эмбеддинг-модели 02.06.2024 14:31 efreelancer 0 Python Машинное обучение Искусственный интеллект Natural Language Processing