• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement-learning

Как мы обучили беспилотники в симуляции для гонок в смешанной реальности +17

  • 24.01.2025 08:42
  • Dataist
  • 1
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Машинное обучение

Контекстные бандиты в ценообразовании

  • 28.12.2024 09:06
  • muxeu
  • 1
  • Блог компании X5 Tech
  • Машинное обучение
  • Алгоритмы
  • Математика

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц +7

  • 22.12.2024 14:19
  • kseniiakeera
  • 0
  • Блог компании Open Data Science
  • Машинное обучение
  • Физика
  • Инженерные системы
  • Научно-популярное

Мультимодальные приложения на Llama 3.2 и Llama Stack +6

  • 21.10.2024 08:37
  • ruslandevlabs
  • 13
  • Машинное обучение
  • Искусственный интеллект

Нейронные оптимизаторы запросов в реляционных БД (Часть 2): На пути к продуктивизации +6

  • 04.10.2024 11:24
  • Safreliy
  • 4
  • Блог компании Postgres Professional
  • Машинное обучение
  • Искусственный интеллект
  • PostgreSQL
  • Алгоритмы

Нейронные оптимизаторы запросов в реляционных БД (Часть 1) +27

  • 09.09.2024 10:54
  • Safreliy
  • 9
  • Блог компании Postgres Professional
  • PostgreSQL
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT +91

  • 28.05.2024 09:00
  • cydoroga
  • 2
  • Блог компании Яндекс
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Гайд на Reinforcement Learning для новичков. Реализация простой задачи

  • 07.04.2024 09:17
  • alexmusyka
  • 1
  • Программирование
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Многорукие бандиты в задаче ритейла

  • 28.12.2023 10:31
  • muxeu
  • 2
  • Блог компании X5 Tech
  • Алгоритмы
  • Математика
  • Машинное обучение

Обучение с блэкджеком и подкреплением. Ищем оптимальную стратегию игры +3

  • 14.11.2023 09:00
  • MarkWatney
  • 8
  • Игры и игровые консоли
  • Алгоритмы
  • Математика
  • Машинное обучение

Нейросеть, генерирующая нейросети. Часть 2. RL агент создаёт свои первые нейросети

  • 03.10.2023 06:49
  • SimsiGenerativeBot
  • 0
  • Open source
  • Машинное обучение
  • Искусственный интеллект

Нейросеть, генерирующая нейросети. Часть 1. Генерация случайной свёрточной нейронной сети +2

  • 27.09.2023 06:51
  • SimsiGenerativeBot
  • 3
  • Open source
  • Занимательные задачки
  • Python
  • Машинное обучение
  • Искусственный интеллект

Reinforcement learning для оптимизации цен в ритейле +5

  • 18.09.2023 11:17
  • Mentalitet
  • 0
  • Python
  • Алгоритмы
  • Машинное обучение

Обучение с подкреплением на Python: Пример не из «качалки» +12

  • 30.10.2021 15:33
  • Dmi3Ut
  • 8
  • Python
  • Машинное обучение
  • Разработка робототехники

Обучение с подкреплением в Super Mario Bros. Сравнение алгоритмов DQN и Dueling DQN +5

  • 17.06.2021 09:11
  • hse_spb
  • 0
  • Блог компании Питерская Вышка
  • Python
  • Машинное обучение
  • Учебный процесс в IT
  • Блог компании Питерская Вышка
  • Python
  • Машинное обучение
  • Учебный процесс в IT
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
08:01

AAEON de next-RAP8: одноплатный ПК с производительностью десктопа на Intel Core 13 поколения +11

05:42

Установка Stable Diffusion + ComfyUI +7

08:10

Clair Obscure: Expedition 33 вернула мне веру в игровую индустрию +6

09:01

Простой механизм поиска с нуля +5

08:42

Мета-акторы, готовый скелет микросервиса +5

07:51

Влияли ли на климат Земли пролетавшие мимо звёзды? +4

06:03

YOLO на Rust: производительность, удобство и открытость +3

02:11

Что такое прогрессивная перегрузка на самом деле? +2

11:37

Realtime тестирование UserGate NGFW G9300 +1

09:47

Решение проблемы мертвого времени с помощью Copilot +1

08:16

Прокачаться в работе с Ansible — подборка ресурсов +1

14:04

Пишем 3D-игру весом в 600Кб… Ч.1 +50

07:49

FreeBSD 14.3: Wi-Fi на новом уровне, поддержка облаков и перспективы новинки +35

13:01

Покажите ваше Portfolio! История уникального карманного компьютера от Atari +31

09:01

ЭВМ и роботы на страницах советской научной фантастики. Часть 2: киберутопии и немного прото-киберпанка конца 50-х +29

09:15

Почему LLM не знают, что такое «помидор», и как не дать себя обмануть? +24

11:08

Создание своего ядра на Rust +18

09:20

Берут они охотно старинные полотна +16

08:05

SIGame в 2025 году — полный гайд по «Своей Игре» +12

13:48

Эпоха «крошечных команд» в Кремниевой долине началась +11

17:26

Представляю @vue-dnd-kit/components: Готовые компоненты для быстрой разработки интерфейсов с перетаскиванием +7

14:16

Почему канал клиента ты можешь разогнать на 25К подписчиков, а свой — только на 135 человек +7

11:52

Usenet – то, что было до веб +7

08:00

От золота до меди и алмазов: как добывают ресурсы на крупнейших карьерах мира +7

11:16

Как мы ускорили разработку python-микросервисов с помощью шаблонизатора +6

06:15

Компилятор для Intel-8008 +6

07:01

Мультиконтейнерные поды в Kubernetes: новые возможности и лучшие практики использования сайдкаров +5

05:00

Развертывание микросервисов: проблемы, решения, стратегии, антипаттерны, практические рекомендации +5

14:16

Ральф Титор: незрячий изобретатель круиз-контроля +4

12:43

UX не так прост. 18 примеров темных паттернов +4

09:46

Вызов игроку как портрет геймплея +4

05:33

Зажигаем миллиард цветов миллионом строк +117

09:02

Тайное уравнение, позволявшее США следить за всеми +108

10:13

Наше расследование: ищем отечественные микросхемы в «отечественных» счетчиках электроэнергии. Часть 6 +63

08:05

Учим ЭЛТ-монитор играть музыку +58

17:10

Я устал от ограничений Strava и написал свой «швейцарский нож» для анализа тренировок на Python и FastAPI +45

15:11

Дизайн в электронике — кому он нужен? Тем более если это Ардуино, пусть и русская… +42

13:01

Простой самодельный терменвокс +39

14:07

Как Cursor устроен изнутри. Часть 1 +36

09:06

Трудности обслуживания приложений под Android +31

08:02

Со дна на сушу: разбираемся в сетях между дата-центрами +30

07:16

Cambridge Z88: портативный компьютер с амбициями Sinclair +29

13:26

Проективные вопросы на собеседованиях: не дайте себя подловить +26

08:00

ARGUS: как масштабировать рекомендательные трансформеры +24

12:15

Как в авиации защищают сталь +23

11:46

20+ кейсов с изображениями в ChatGPT. Или экономим 100,000₽+ на дизайнерах +20

14:05

Нам обещают хиты. Главные игры с летних презентаций 2025 +15

12:28

Мы тысячу лет писали музыку по нотам, а потом пришла нейросеть +15

10:25

Техники антипродуктивности +15

15:01

Передаем документацию заказчику: Markdown, Git, CI/CD и почти полная автоматизация +13

13:20

Энергосберегающие технологии человеческого мозга +13

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Не одним MacBook единым: ноутбук для айтишника +5

    • 193

    Мы тысячу лет писали музыку по нотам, а потом пришла нейросеть +15

    • 95

    Почему LLM не знают, что такое «помидор», и как не дать себя обмануть? +25

    • 43

    Я устал от ограничений Strava и написал свой «швейцарский нож» для анализа тренировок на Python и FastAPI +45

    • 41

    Проективные вопросы на собеседованиях: не дайте себя подловить +26

    • 41

    Дизайн в электронике — кому он нужен? Тем более если это Ардуино, пусть и русская… +42

    • 39

    Как Cursor устроен изнутри. Часть 1 +36

    • 36

    Зажигаем миллиард цветов миллионом строк +117

    • 30

    Будущее после кремния: технологический каннибализм как геополитическая стратегия -4

    • 28

    Техники антипродуктивности +15

    • 27

    Как в авиации защищают сталь +23

    • 25

    Тайное уравнение, позволявшее США следить за всеми +108

    • 25

    Энергосберегающие технологии человеческого мозга +13

    • 23

    Как ИИ изменит людей на самом деле +8

    • 20

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.