• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом inference

Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум +4

  • 01.08.2025 12:48
  • redmadrobot
  • 1
  • Блог компании red_mad_robot
  • Искусственный интеллект
  • Исследования и прогнозы в IT

Эффективный инференс множества LoRA адаптеров +3

  • 27.06.2025 08:19
  • svtDanny
  • 0
  • Искусственный интеллект
  • Машинное обучение
  • Open source

Поднимаем DeepSeek llm локально -2

  • 03.02.2025 07:27
  • svtDanny
  • 12
  • Машинное обучение
  • Искусственный интеллект

Мануал по запуску полной модели DeepSeek-R1 локально (бюджет ~6k$) +13

  • 30.01.2025 06:09
  • took_the_lead
  • 57
  • Artificial Intelligence
  • Machine Learning
  • Computer hardware
  • Искусственный интеллект
  • Машинное обучение
  • DevOps
  • Компьютерное железо

Пять элементов Inference-платформы Selectel. Как мы сделали своего Аватара +28

  • 27.12.2024 08:01
  • antonaleks605
  • 9
  • Блог компании Selectel
  • Kubernetes
  • Высокая производительность
  • Машинное обучение
  • Серверное администрирование

Nvidia Triton Inference Server: строим production ML без разработчиков +34

  • 16.12.2024 08:07
  • antonaleks605
  • 4
  • Блог компании Selectel
  • Data Engineering
  • IT-инфраструктура
  • IT-компании
  • Облачные сервисы

Пишем сервис инференса ML-модели на go, на примере BERT-а +7

  • 06.12.2024 09:24
  • dmitry_syubaev
  • 0
  • Блог компании X5 Tech
  • Машинное обучение
  • Python
  • Go

Ускорение и облегчение моделей для поддержания диалога виртуальных ассистентов Салют

  • 13.08.2024 10:05
  • Andriljo
  • 0
  • Блог компании Конференции Олега Бунина (Онтико)
  • Блог компании SberDevices
  • Машинное обучение
  • Искусственный интеллект

Aqueduct: Как мы экономим железо для МЛ-вычислений

  • 01.07.2024 13:17
  • bugrimov
  • 8
  • Open source
  • Python
  • Программирование
  • Машинное обучение
  • Data Engineering

Вышел Savant 0.2.6. Релиз с улучшениями для GPU без NVENC и Jetson Orin Nano +2

  • 08.11.2023 14:20
  • ivankudryavtsev
  • 0
  • Программирование
  • Обработка изображений
  • Машинное обучение
  • Искусственный интеллект

Сборка OpenCV с поддержкой OpenVINO +1

  • 23.03.2023 10:21
  • ilikeMagic
  • 0
  • Python
  • C++
  • Обработка изображений
  • Машинное обучение

Делаем инференс на Nvidia Triton Inference Server +7

  • 19.02.2023 16:55
  • yet_another_mle
  • 1
  • Python
  • Машинное обучение
  • Искусственный интеллект

Simulating Return Type Inference in C# +26

  • 28.06.2022 20:00
  • Stefanio
  • 24
  • Программирование
  • .NET
  • C#
  • ООП

Как мы распознаем фото документов пользователей. Часть II +12

  • 29.12.2021 13:47
  • ilgrad
  • 4
  • Блог компании inDriver
  • Python
  • Обработка изображений
  • Машинное обучение

Quantization Aware Training. Или как правильно использовать fp16 inference в TensorRT +2

  • 21.05.2021 09:22
  • pagin
  • 7
  • Высокая производительность
  • Программирование
  • Серверная оптимизация
  • Машинное обучение
  • Искусственный интеллект
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
13:01

Про свёрла +69

09:01

Автоматический светодиод +31

13:02

Прощание с доступной Windows: Microsoft хоронит SE-версию и уступает нишу конкурентам +12

08:12

Теорема о разделяющей оси при обнаружениях столкновений +11

07:43

Фрактальная монотипия +10

08:47

О прионах и дизайне белков +9

08:20

IOCCC: Best of Show 2018 +8

07:06

Наглядное пособие начинающего ретрогеймера. С чего начать путь в мир старых шедевров +6

15:45

Почему Европа не смогла сделать свою Кремниевую долину +5

12:09

По пакету всему свету. Изучаем пакеты в Arch Linux +5

08:00

Как ходоки получают разряды: обсуждаем соревнования по Nordic Walking +5

06:15

Контентный модуль APM на OpenTelemetry — архитектура, метрики, выводы +5

11:45

Грабли, которые я собрал на пути в геймдеве и чему они меня научили +4

15:15

Секреты сильной команды +3

14:52

Учим LM Studio ходить в интернет при ответах на вопросы +3

10:07

Парсинг Авито. Делаем парсер на Python без ограничения по запросам +3

15:50

Идеальное опровержение Эйнштейна +2

14:16

Альтернативный способ хранения скриншотов в Playwright и способ их обновления +2

08:15

Почему в интерфейсах со сложной логикой недостаточно показать макеты в Figma? +2

12:16

Chief Data Officer: роскошь или необходимость для компаний? +1

20:59

История о том, как я вытащил себя из бесконечной ленты и стал успевать все +65

00:01

Взаимодействие микросервисов: проблемы, решения, практические рекомендации +53

09:01

Мемы админов и про админов. Часть 2: для чего одмину бубен? +47

13:01

Нерешённые вопросы о происхождении жизни +40

16:24

Throw — это новый goto +27

10:29

Шикарные портативные консоли лета 2025 года: новинки карманного гейминга +26

10:10

Изучаем Go: руководство для JavaScript-разработчиков. Часть 1 +22

09:44

Небольшое ретро-программинг приключение, или как я снова полюбил кодить +22

16:10

Как писать промт для генерации изображения/видео и получить лучший результат? +19

08:00

10 лет Windows 10: почему «десятка» живет дольше, чем планировалось +17

07:00

Покажи свой стартап/пет-проект (август) +12

11:15

Почему LLM не мыслят как люди +11

14:02

Больше 40 товарных знаков: как создатели Atomic Heart защитили свою игру в России +9

20:45

Об индексах на столбцах с низкой кардинальностью +8

05:56

Как захватить Вселенную за AGE (Часть 1) +6

15:36

Операционка как пет-проект — подборка «экспериментов» +5

09:45

Оптимальный выбор файловой системы и создание драйвера для OSPI Flash с GitHub Copilot +5

19:46

Что такое ИДЕЯ с точки зрения геймдизайна, сколько она на самом деле стоит, и как генерится +4

19:40

То, что должно успокаивать – заставляет бояться. ГАМК, астроциты и ПТСР +4

12:14

Головоломка «меледа»: история, алгоритм решения +4

13:01

Как я от нечего делать замедлил Postgres в 42 000 раз +63

09:01

Самодельные французские радиолампы 1920 г. Часть 3. Разрядная трубка, лампа накаливания +56

08:10

Физика ошибок не прощает. Она догонит тебя на крыше и заставит платить (дважды) +49

18:45

Как выйти из IT?.. и пойти слесарем на завод. Моя попыточка дауншифтинга [4\5] +38

17:07

Кому нужна математика? +35

08:32

Выделенные серверы + Kubernetes: практическое руководство +31

07:00

HTC Desire HD: история, дизайн и возможности легендарного смартфона +30

08:05

Домофон Лидер-М. Как скрестить трубку с ключом и всем проиграть +29

10:21

«Плохие парни работают просто»: пентестеры разбирают реальные кейсы +24

10:17

Моё мини-исследование про продолжительность жизни в России +23

13:40

Промт для изучения чего угодно: протокол Олега-Деминга +19

07:40

Как мы ускорили проверку документации с помощью AI-агента: от боли к решению +19

04:52

DNS-хаос, зомби-поды и майнеры в кластере: самые невероятные случаи при работе с Kubernetes +19

18:34

Plata — как выходцы из «Тинькофф» строят банк-единорог в Мексике +18

08:42

Ставим шину AHB-Lite на ядро YRV +17

06:00

Как учить английский по сериалам и не бросить на второй серии +16

15:02

Барьеры памяти «Golang» +14

14:10

История игровой журналистики в России. Часть 4: Журнал «Великий Dракон» +14

09:00

Как не потерять миллионы на SLA: архитектурный подход к управлению ожиданиями +14

08:22

Ближайшая суперземля K2-18 b может быть океанической планетой +14

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • 10 лет Windows 10: почему «десятка» живет дольше, чем планировалось +17

    • 244

    Как превратить ноутбук в полноценное рабочее место не хуже стационарного ПК +3

    • 213

    Throw — это новый goto +27

    • 111

    Моё мини-исследование про продолжительность жизни в России +23

    • 98

    Шикарные портативные консоли лета 2025 года: новинки карманного гейминга +26

    • 79

    Взаимодействие микросервисов: проблемы, решения, практические рекомендации +53

    • 54

    Почему LLM не мыслят как люди +11

    • 52

    Наше общение нам больше не принадлежит. Размышляю как ИИ создаст альтернативу для Telegram без VPN и прослушки +4

    • 51

    IoT по-взрослому — сбор данных с датчиков для Умного дома на одноплатнике Repka Pi 4 под управлением NapiLinux +7

    • 43

    Нерешённые вопросы о происхождении жизни +40

    • 41

    История о том, как я вытащил себя из бесконечной ленты и стал успевать все +65

    • 38

    Как выйти из IT?.. и пойти слесарем на завод. Моя попыточка дауншифтинга [4\5] +38

    • 35

    Про свёрла +69

    • 33

    Как научиться играть в стратегии Total War: ультимативный гайд для новичков в серии +1

    • 30

    Физика ошибок не прощает. Она догонит тебя на крыше и заставит платить (дважды) +49

    • 30

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.