Ускорение LLM: универсальные методы для популярных архитектур +42 05.02.2025 07:00 roman-gorb 0 Блог компании Яндекс Машинное обучение Искусственный интеллект Алгоритмы Программирование
Анализ DeepSeek R1-Zero и R1 +12 30.01.2025 10:07 PatientZero 2 Машинное обучение Искусственный интеллект Научно-популярное
Алгоритмы спекулятивного инференса LLM +3 05.01.2025 09:25 svtDanny 4 Машинное обучение Искусственный интеллект Алгоритмы Высокая производительность Open source
Пять элементов Inference-платформы Selectel. Как мы сделали своего Аватара +28 27.12.2024 08:01 antonaleks605 9 Блог компании Selectel Kubernetes Высокая производительность Машинное обучение Серверное администрирование
Тензорные компиляторы: что это за «звери» и где они «обитают» +16 25.12.2024 07:12 yadro_team 3 Блог компании YADRO Машинное обучение Искусственный интеллект Компиляторы
Влияние программного обеспечения и архитектуры ускорителя на производительность -1 09.12.2024 08:00 NelSon29 4 Искусственный интеллект Высокая производительность Процессоры Машинное обучение
Как мы исследовали энергоэффективность инференса нейросетей на планшете +21 14.11.2024 09:45 burchanie 0 Блог компании YADRO Искусственный интеллект Тестирование IT-систем Планшеты Процессоры
Теоретическая и реальная производительность Intel AMX 11.04.2024 12:08 ErmIg 4 Высокая производительность C++ Алгоритмы Обработка изображений Искусственный интеллект
Разворачиваем ML модель с использованием ONNX на Android в километре над землей 09.04.2024 07:54 JediPhilosopher 4 Разработка под Android Машинное обучение
Ускорение инференса LLM +52 02.04.2024 07:01 roman-gorb 5 Блог компании Яндекс Программирование Алгоритмы Машинное обучение Искусственный интеллект
Реализация нейронной сети для соревнования Digit Recognizer на Kaggle и её прикладное использование. Часть №2 +1 07.12.2023 05:06 dan_sw 0 JavaScript ReactJS Машинное обучение Flask TensorFlow
Реализация нейронной сети для соревнования Digit Recognizer на Kaggle и её прикладное использование. Часть №1 +3 05.12.2023 08:22 dan_sw 0 Python Машинное обучение TensorFlow
Почему ONNX так популярен в ML: конвертации, утилиты и инференс +9 26.08.2023 08:43 svtDanny 0 Высокая производительность Open source IT-инфраструктура Машинное обучение Искусственный интеллект
Распознаем автомобильные номера на TorchServe +3 06.04.2023 18:03 yet_another_mle 0 Python Машинное обучение Искусственный интеллект
Атака на Nvidia DeepStream с помощью некорректного фрейма видео в формате H264 +6 29.06.2021 07:40 ivankudryavtsev 3 Высокая производительность Информационная безопасность GPGPU Машинное обучение Искусственный интеллект