• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом inference

Эффективный инференс множества LoRA адаптеров +3

  • 27.06.2025 08:19
  • svtDanny
  • 0
  • Искусственный интеллект
  • Машинное обучение
  • Open source

Поднимаем DeepSeek llm локально -2

  • 03.02.2025 07:27
  • svtDanny
  • 12
  • Машинное обучение
  • Искусственный интеллект

Мануал по запуску полной модели DeepSeek-R1 локально (бюджет ~6k$) +13

  • 30.01.2025 06:09
  • took_the_lead
  • 57
  • Artificial Intelligence
  • Machine Learning
  • Computer hardware
  • Искусственный интеллект
  • Машинное обучение
  • DevOps
  • Компьютерное железо

Пять элементов Inference-платформы Selectel. Как мы сделали своего Аватара +28

  • 27.12.2024 08:01
  • antonaleks605
  • 9
  • Блог компании Selectel
  • Kubernetes
  • Высокая производительность
  • Машинное обучение
  • Серверное администрирование

Nvidia Triton Inference Server: строим production ML без разработчиков +34

  • 16.12.2024 08:07
  • antonaleks605
  • 4
  • Блог компании Selectel
  • Data Engineering
  • IT-инфраструктура
  • IT-компании
  • Облачные сервисы

Пишем сервис инференса ML-модели на go, на примере BERT-а +7

  • 06.12.2024 09:24
  • dmitry_syubaev
  • 0
  • Блог компании X5 Tech
  • Машинное обучение
  • Python
  • Go

Ускорение и облегчение моделей для поддержания диалога виртуальных ассистентов Салют

  • 13.08.2024 10:05
  • Andriljo
  • 0
  • Блог компании Конференции Олега Бунина (Онтико)
  • Блог компании SberDevices
  • Машинное обучение
  • Искусственный интеллект

Aqueduct: Как мы экономим железо для МЛ-вычислений

  • 01.07.2024 13:17
  • bugrimov
  • 8
  • Open source
  • Python
  • Программирование
  • Машинное обучение
  • Data Engineering

Вышел Savant 0.2.6. Релиз с улучшениями для GPU без NVENC и Jetson Orin Nano +2

  • 08.11.2023 14:20
  • ivankudryavtsev
  • 0
  • Программирование
  • Обработка изображений
  • Машинное обучение
  • Искусственный интеллект

Сборка OpenCV с поддержкой OpenVINO +1

  • 23.03.2023 10:21
  • ilikeMagic
  • 0
  • Python
  • C++
  • Обработка изображений
  • Машинное обучение

Делаем инференс на Nvidia Triton Inference Server +7

  • 19.02.2023 16:55
  • yet_another_mle
  • 1
  • Python
  • Машинное обучение
  • Искусственный интеллект

Simulating Return Type Inference in C# +26

  • 28.06.2022 20:00
  • Stefanio
  • 24
  • Программирование
  • .NET
  • C#
  • ООП

Как мы распознаем фото документов пользователей. Часть II +12

  • 29.12.2021 13:47
  • ilgrad
  • 4
  • Блог компании inDriver
  • Python
  • Обработка изображений
  • Машинное обучение

Quantization Aware Training. Или как правильно использовать fp16 inference в TensorRT +2

  • 21.05.2021 09:22
  • pagin
  • 7
  • Высокая производительность
  • Программирование
  • Серверная оптимизация
  • Машинное обучение
  • Искусственный интеллект

Как запихать нейронку в кофеварку +30

  • 27.10.2020 06:34
  • ZlodeiBaal
  • 14
  • Блог компании Блог компании Recognitor
  • Блог компании Recognitor
  • Анализ и проектирование систем
  • Машинное обучение
  • DevOps
  • Компьютерное железо
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Вчера
  • Позавчера
09:01

От React всё также веет безумием, но все об этом молчат +64

13:39

Как выйти из IT?.. и пойти слесарем на завод. Моя попыточка дауншифтинга [1\4] +31

13:01

Большое испытание кальциевых аккумуляторов, часть 2: недозаряд портит, а кипячение убивает +24

08:02

Commodore 64 Ultimate: возрождение легенды в 2025 году +24

16:16

Как «по-быстрому» сделанная игра затянула меня в геймдев на 20 лет и какие выводы я из этого сделал +21

08:13

Новый рекорд по упаковке сфер неожиданно пришёл из геометрии +13

07:16

Конфаундинг, или как аналитику попасть в ловушку +10

10:08

Свой ChatGPT на документах: делаем RAG с нуля +9

05:16

Алгоритмы для работы с большими данными в Go: HyperLogLog и Count-Min Sketch +9

08:00

Без(д)воз(д)мездно, то есть даром +8

06:15

Vue: Composables и TS это вам не Mixins и JS. С ними сложнее +8

09:02

Kubernetes на базе Deckhouse в облаке Linx Cloud: встроенный мониторинг, безопасность и управление сертификатами +7

08:16

«Хочу, но боюсь и не делаю»: что делать со страхом того, что не получится? +7

12:00

Как я пришёл в open source в 2025-м (с утилитой для бекапа PostgreSQL), чуть не потеряв проект на ~$1500\мес в 2023-м +6

04:41

Управление проектами: дайджест публикаций #36 +6

17:50

Как собрать друзей на игру и не сойти с ума: мой бот для геймеров +4

13:30

Пеликаны, сарказм и логические игры: забавные LLM-бенчмарки +4

13:16

Опыт ≠ меньше денег: за что в ИТ мы на самом деле платим +4

12:15

Алгоритм Диница: как найти максимальный поток в сети (для начинающих) +4

10:15

Как дизайн Kaspersky Thin Client пережил подростковый бунт (и что из этого вышло) +4

08:41

Как в РФ разрабатывали уникальный судовой радар ближней зоны в диапазоне 76 ГГц +70

09:01

Первые анекдоты о программистах: юмор айтишников на переломе тысячелетий, 1999-2000 годы +58

05:29

VLESS+Reality и Multi-hop: Архитектура VPN-цепочки для нового поколения блокировок +46

00:21

Исследование METR: использование Cursor замедляет опытных разработчиков на 19 % +40

13:01

Голографический принцип: реальность как иллюзия +38

12:00

Самодельный компьютерный стол с навороченной начинкой внутри за 20 шагов +36

18:16

Территория Большого Взрыва. Что, где и когда взорвалось +31

14:05

Drift Skate, Freeskates, Freeline Skates, Кайф +27

08:14

Xreal One Pro — подробный разбор новых AR-очков с чипом X1 и экраном до 191 дюйма +22

17:29

Ещё один PID-контроллер +18

16:32

Девушки, котики и Flux Kontext: как выжать максимум из WebUI Forge? +17

11:29

«Почему топ менеджеры выбирали SAP, но...» что пошло не так у автора +15

21:09

Не хватило мощности: история бренда «Техносила» +14

06:05

История игровой журналистики в России +14

05:48

Универсальные подсказки по промптам (продвинутые советы) (Ч.2) +11

20:45

Цистеин. Как одна аминокислота мешает худеть. И спасибо ей за это +7

14:44

Разработка требований к ПО с помощью Markdown, Git и Obsidian +7

01:17

Сделай удобно: подборка UI/UX-кейсов из цифровых и нецифровых продуктов (#18) +7

18:46

Открытые инструменты для визуализации сетевого трафика +5

15:29

Разбирая бэклог. Часть 19. 10 трёхмерных консольных beat 'em up'ов. 1997-2003 +5

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Самодельный компьютерный стол с навороченной начинкой внутри за 20 шагов +36

    • 186

    От React всё также веет безумием, но все об этом молчат +64

    • 129

    VLESS+Reality и Multi-hop: Архитектура VPN-цепочки для нового поколения блокировок +46

    • 126

    Территория Большого Взрыва. Что, где и когда взорвалось +31

    • 105

    «Почему топ менеджеры выбирали SAP, но...» что пошло не так у автора +15

    • 72

    Исследование METR: использование Cursor замедляет опытных разработчиков на 19 % +40

    • 68

    Хабра-харакири 2: Как я спросил, и мне ответили +2

    • 47

    Как в РФ разрабатывали уникальный судовой радар ближней зоны в диапазоне 76 ГГц +70

    • 36

    Скоро без нас: когда роботы окончательно отберут нашу работу? +2

    • 33

    No Cars Allowed? Что с трендом на улицы без авто +1

    • 31

    Не хватило мощности: история бренда «Техносила» +14

    • 30

    Без(д)воз(д)мездно, то есть даром +8

    • 29

    Drift Skate, Freeskates, Freeline Skates, Кайф +27

    • 27

    Первые анекдоты о программистах: юмор айтишников на переломе тысячелетий, 1999-2000 годы +58

    • 23

    Голографический принцип: реальность как иллюзия +38

    • 22

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.