• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement-learning

Как мы обучили беспилотники в симуляции для гонок в смешанной реальности +17

  • 24.01.2025 08:42
  • Dataist
  • 1
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Машинное обучение

Контекстные бандиты в ценообразовании

  • 28.12.2024 09:06
  • muxeu
  • 1
  • Блог компании X5 Tech
  • Машинное обучение
  • Алгоритмы
  • Математика

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц +7

  • 22.12.2024 14:19
  • kseniiakeera
  • 0
  • Блог компании Open Data Science
  • Машинное обучение
  • Физика
  • Инженерные системы
  • Научно-популярное

Мультимодальные приложения на Llama 3.2 и Llama Stack +6

  • 21.10.2024 08:37
  • ruslandevlabs
  • 13
  • Машинное обучение
  • Искусственный интеллект

Нейронные оптимизаторы запросов в реляционных БД (Часть 2): На пути к продуктивизации +6

  • 04.10.2024 11:24
  • Safreliy
  • 4
  • Блог компании Postgres Professional
  • Машинное обучение
  • Искусственный интеллект
  • PostgreSQL
  • Алгоритмы

Нейронные оптимизаторы запросов в реляционных БД (Часть 1) +27

  • 09.09.2024 10:54
  • Safreliy
  • 9
  • Блог компании Postgres Professional
  • PostgreSQL
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT +91

  • 28.05.2024 09:00
  • cydoroga
  • 2
  • Блог компании Яндекс
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Гайд на Reinforcement Learning для новичков. Реализация простой задачи

  • 07.04.2024 09:17
  • alexmusyka
  • 1
  • Программирование
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Многорукие бандиты в задаче ритейла

  • 28.12.2023 10:31
  • muxeu
  • 2
  • Блог компании X5 Tech
  • Алгоритмы
  • Математика
  • Машинное обучение

Обучение с блэкджеком и подкреплением. Ищем оптимальную стратегию игры +3

  • 14.11.2023 09:00
  • MarkWatney
  • 8
  • Игры и игровые консоли
  • Алгоритмы
  • Математика
  • Машинное обучение

Нейросеть, генерирующая нейросети. Часть 2. RL агент создаёт свои первые нейросети

  • 03.10.2023 06:49
  • SimsiGenerativeBot
  • 0
  • Open source
  • Машинное обучение
  • Искусственный интеллект

Нейросеть, генерирующая нейросети. Часть 1. Генерация случайной свёрточной нейронной сети +2

  • 27.09.2023 06:51
  • SimsiGenerativeBot
  • 3
  • Open source
  • Занимательные задачки
  • Python
  • Машинное обучение
  • Искусственный интеллект

Reinforcement learning для оптимизации цен в ритейле +5

  • 18.09.2023 11:17
  • Mentalitet
  • 0
  • Python
  • Алгоритмы
  • Машинное обучение

Обучение с подкреплением на Python: Пример не из «качалки» +12

  • 30.10.2021 15:33
  • Dmi3Ut
  • 8
  • Python
  • Машинное обучение
  • Разработка робототехники

Обучение с подкреплением в Super Mario Bros. Сравнение алгоритмов DQN и Dueling DQN +5

  • 17.06.2021 09:11
  • hse_spb
  • 0
  • Блог компании Питерская Вышка
  • Python
  • Машинное обучение
  • Учебный процесс в IT
  • Блог компании Питерская Вышка
  • Python
  • Машинное обучение
  • Учебный процесс в IT
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
09:01

Абсурдно усложнённая схема регистров в Intel 80386 +38

07:50

AntiqGPT. Неожиданное применение этих ваших LLM +28

08:02

Попытка создать виртуальный офис с VR-очками Quest 3: ожидания и реальность +19

08:00

«Я слышу свой код»: как работает Java-программист, потерявший зрение +19

14:05

Устройства, которые мы потеряли: Что за железо внутри первого коммуникатора от HTC, опередившего iPhone на 5 лет? +10

05:25

Датчик толщины нити (филамента) +10

08:15

Оптимизируем C++ шаблоны: от инлайнинга до модулей +9

13:01

Вы не там ищете свободу воли, мистер Сапольски +8

09:09

Управление проектами: дайджест публикаций #33 +8

13:24

Я недооценивал цифровой блок клавиатуры +6

11:25

Краткая история зелёного флуоресцентного белка +6

09:06

Продолжаем чинить стартовую страницу в Firefox +6

07:16

Ищем похожие иероглифы при помощи искусственного интеллекта +6

08:00

Красота спасает мир, или Как работа со своим образом спасла меня от выгорания и научила себя принимать +4

12:11

Обманчивая простота капитализма +2

04:31

Как пройти… к третьей нормальной форме? +2

12:10

10 лучших нейросетей-синонимайзеров: какую нейросеть выбрать для текста в 2025 году +1

10:03

Уязвимость LED-панелей +1

08:16

Код-ревью: борьба или мотивация? +1

07:52

Еще разок про gomock и функциональные тесты +1

07:20

Великая иллюзия Copilot +81

13:01

Как я делал генератор синуса на мосту Вина +52

09:01

«Красная звезда» Александра Богданова: техноутопия 1908 года с пришельцами, заговорами и электронными сетями +49

12:25

Учёный против бюрократов: как один упрямец спас британский флот от молний +37

08:06

Всего два месяца — и новый релиз: Linux 6.15 уже готов +34

08:00

Mystical: визуальный язык программирования. Что это и как работает? +30

11:20

Почему бензин так воняет? (и почему нам это нравится?) +23

11:09

Культура домашних компьютеров для хобби +21

22:12

Вы уверены, что defer всегда безопасен? +19

13:22

Офисный провал: Как принудительные командировки айтишников убивают продуктивность и лояльность +18

17:20

Тиндер для работодателей и соискателей: как мы разработали алгоритм мэтчинга на Авито +16

11:59

Интернет больше нас не отпустит +16

19:25

Как добавить теги в чат. Часть первая +15

14:02

Философия программирования зашла в тупик +14

11:00

DevOps не умер, нет. Но ему плоховато +14

20:06

Программисты не исчезнут никогда +13

13:16

CI/CD на GitHub Actions и GitLab CI для самых маленьких. Часть 1 +12

11:06

По следам Clair Obscur: Expedition 33: в какие JRPG нырнуть, если пленил французский хит +10

07:25

Эвристики, которые почти всегда работают +9

10:22

Обзор монитора Samsung 27″ ViewFinity S9 +7

14:47

Решаем проблему «деградации» YouTube с помощью NoDPI +215

11:34

Почему гражданам запретили покупать USDT за рубли и доллары +81

13:01

Вас к тефифону! История удивительного и необычного аудио-проигрывателя +51

16:46

Важнейшая модель теории вероятностей +47

09:01

TIG сварка в домашней мастерской, начало. Обзор, подборка мелочей. Часть 1 +46

12:01

Как использовать японские подходы в IT. Часть 6: покажи и расскажи +34

08:00

Как не запутаться в обновлениях 1C: работаем с «Обновлятором» +32

08:05

Цифровые домофоны. Гость из Польши в российских подъездах +27

10:49

Многозадачности больше не существует. Зачем снова становиться однозадачным +26

16:52

Как уведомить Роскомнадзор об обработке персональных данных: пошаговая инструкция для ИТ-компаний и стартапов +24

07:00

Как мы создали новую технологию маршрутизации для пешеходов и велосипедистов +24

17:11

TIG сварка — мои советы начинающим +21

12:15

Почему не работает ping внутри пода в Kubernetes? +19

08:08

Почему у первого Macintosh разрешение экрана было 512×342, а не 512×384 +18

07:50

Игра в CIFA. История румынской вычислительной техники +18

22:21

Почему S.T.A.L.K.E.R.: Тень Чернобыля — навсегда величайший проект постсоветского пространства +16

21:44

Всё об устройстве и работе SSTV с примерами на Python +15

09:41

Фронтенд и бэкенд больше не будут общаться как прежде: создаём конструктор сценариев на базе Backend Driven UI +15

07:30

Антиматерию заказывали? Как в ЦЕРН учатся антивещество транспортировать +15

12:25

Марс ближе, чем когда-либо, но дальше, чем рассказывают +13

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Почему гражданам запретили покупать USDT за рубли и доллары +83

    • 246

    Решаем проблему «деградации» YouTube с помощью NoDPI +225

    • 133

    Пирамида писательских талантов -1

    • 130

    Почему S.T.A.L.K.E.R.: Тень Чернобыля — навсегда величайший проект постсоветского пространства +16

    • 102

    Новая проблема с ИИ? +11

    • 75

    TIG сварка в домашней мастерской, начало. Обзор, подборка мелочей. Часть 1 +46

    • 54

    Программисты не исчезнут никогда +13

    • 49

    Интернет больше нас не отпустит +16

    • 49

    Как уведомить Роскомнадзор об обработке персональных данных: пошаговая инструкция для ИТ-компаний и стартапов +24

    • 49

    Интернет на Кубе — к сожалению, шаг на десятки лет назад +2

    • 47

    DevOps не умер, нет. Но ему плоховато +14

    • 45

    Я устал писать плохой фидбек на алгоритмических собеседованиях -8

    • 41

    Возможное расширение языка C++ операцией скалярного произведения +6

    • 41

    Обманчивая простота капитализма +5

    • 38

    Великая иллюзия Copilot +81

    • 38

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.