• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом обучение с подкреплением

Что не так с обучением с подкреплением (Reinforcement Learning)? +56

  • 21.01.2019 23:25
  • DesertFlow
  • 26
  • Машинное обучение
  • Искусственный интеллект

Улучшение агента на основе Q-Learning, торгующего stocks, путем добавления рекуррентности и формирования наград +17

  • 18.01.2019 12:26
  • Alexey_mosc
  • 0
  • Машинное обучение

Как учиться с помощью машинного обучения у экспертов в Dota 2 +20

  • 10.01.2019 13:00
  • miksaz
  • 4
  • Блог компании Питерская Вышка
  • Алгоритмы
  • Искусственный интеллект
  • Машинное обучение
  • Учебный процесс в IT
  • Recovery Mode

Обучение с подкреплением на языке Python +10

  • 28.12.2018 14:30
  • ph_piter
  • 1
  • Блог компании Издательский дом «Питер»
  • Python
  • Алгоритмы
  • Машинное обучение
  • Профессиональная литература

Можно ли обучить с подкреплением агента для торговли на рынке акций? Реализация на языке R +9

  • 14.12.2018 14:59
  • Alexey_mosc
  • 6
  • Машинное обучение
  • R

Обучение с подкреплением: разбираем на видеоиграх +6

  • 31.10.2018 08:55
  • Smile-Events
  • 3
  • Машинное обучение
  • Блог компании Smile-Expo

Обучение с подкреплением в среде PyBullet +7

  • 22.08.2018 17:41
  • zishnik
  • 2
  • Машинное обучение

Обучение с подкреплением никогда не работало +18

  • 02.03.2018 13:12
  • m1rko
  • 1
  • Алгоритмы
  • Машинное обучение

Глубинное обучение с подкреплением пока не работает +58

  • 23.02.2018 20:19
  • m1rko
  • 22
  • Разработка робототехники
  • Разработка игр
  • Обработка изображений
  • Машинное обучение
  • Алгоритмы

Добро пожаловать в эру глубокой нейроэволюции +29

  • 08.01.2018 10:21
  • atepeq
  • 2
  • Алгоритмы
  • Машинное обучение

Логарифмируй это: метод логарифмической производной в машинном обучении +18

  • 21.08.2017 13:06
  • mr-pickles
  • 1
  • Машинное обучение
  • Математика
  • Алгоритмы
  • Блог компании Wunder Fund

Эволюционные стратегии как масштабируемая альтернатива обучению с подкреплением +13

  • 06.06.2017 11:38
  • sergeypid
  • 13
  • Обработка изображений
  • Машинное обучение
  • Алгоритмы

Нейросетка играет в Доту +42

  • 15.01.2017 22:52
  • Parilo
  • 56
  • Разработка робототехники
  • Программирование
  • Машинное обучение
  • Алгоритмы
  • C++

BlackBox Challenge: Что внутри черного ящика?

  • 30.04.2016 10:39
  • GNC
  • 0
  • Спортивное программирование
  • Машинное обучение
  • Big Data

Обзор примера применения обучения с подкреплением с использованием TensorFlow +22

  • 07.01.2016 21:31
  • Parilo
  • 14
  • Программирование
  • Математика
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • »
Страница 6 из 7
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
06:00

Запустили векторный поиск в YDB: рассказываем, как он работает +23

02:02

Кубик мысли: простой проект, который говорит вместо тебя +5

06:00

Каналы(channels) в Go +3

00:23

Как «взломать» сайт Мосбиржи и получать лучшие BID и OFFER в Excel — без подписок, с помощью Python и API брокера +3

06:03

Обработка асинхронных операций с Flowable: Бенчмарки производительности +1

09:01

Большинству людей плевать на качество софта +71

14:07

Вы тоже заказываете платы, компоненты и всячину здесь? +57

13:01

Пишем простой драйвер Linux для устройства, ничего не зная о драйверах и о USB +40

08:27

Телеграфируем кодом Морзе через Java Stream API (часть 1 из 2) +37

07:29

Простой ультразвуковой отпугиватель собак +35

11:34

Лучшее IT-событие этого лета. За что говорят «спасибо» Summer Merge +27

12:49

Сжатие текста в Angie: статика, динамика, производительность +20

19:20

Почему я отказался внедрять тёмные паттерны и не получил оффер на фронтенд-лида +19

08:50

Б/У Antminer S9 в помощь радиолюбителю +15

15:18

Как мы в Авито используем split-тесты для оценки алгоритмов продвижения объявлений +14

04:50

Илон Маск создал Меха-Гитлера, а также релиз самого умного Grok 4 +14

09:00

200 тысяч единиц уже готовы, еще миллион — на подходе: разворачиваем контуры в один клик +12

07:00

Одноплатники как роутеры: новинки 2025 года и их возможности +12

09:10

Как я полюбил LESS и с его помощью избавился от копипасты в своём CSS-коде, а разметку сделал семантической +11

12:32

Как я случайно стал UI-дизайнером радиоприёмника — и заработал 60к за 15 часов +10

05:54

MCP для новичков +10

13:14

А был ли патчик? Как долго живут уязвимости в Рунете +9

07:07

Недельный геймдев: #234 — 13 июля, 2025 +9

16:34

Как я пишу код быстрее +8

12:04

Как грамотно организовать тесты в Playwright +8

09:01

От React всё также веет безумием, но все об этом молчат +90

16:16

Как «по-быстрому» сделанная игра затянула меня в геймдев на 20 лет и какие выводы я из этого сделал +88

13:39

Как выйти из IT?.. и пойти слесарем на завод. Моя попыточка дауншифтинга [1\4] +58

08:02

Commodore 64 Ultimate: возрождение легенды в 2025 году +40

13:01

Большое испытание кальциевых аккумуляторов, часть 2: недозаряд портит, а кипячение убивает +38

08:13

Новый рекорд по упаковке сфер неожиданно пришёл из геометрии +15

08:00

Без(д)воз(д)мездно, то есть даром +15

07:16

Конфаундинг, или как аналитику попасть в ловушку +14

12:00

Как я пришёл в open source в 2025-м (с утилитой для бекапа PostgreSQL), чуть не потеряв проект на ~$1500\мес в 2023-м +13

13:05

Кладбище криминальных экшенов. Почему почти все клоны GTA провалились, а студии закрылись +12

05:16

Алгоритмы для работы с большими данными в Go: HyperLogLog и Count-Min Sketch +11

17:50

Как собрать друзей на игру и не сойти с ума: мой бот для геймеров +10

08:00

Кремниевая революция по-китайски: как Пекин собирается обойти Тайвань и США к 2030 году +10

08:16

«Хочу, но боюсь и не делаю»: что делать со страхом того, что не получится? +9

10:08

Свой ChatGPT на документах: делаем RAG с нуля +8

06:15

Vue: Composables и TS это вам не Mixins и JS. С ними сложнее +8

15:35

Как ваш полет домой поможет инопланетянам определить местоположение Земли +7

09:02

Kubernetes на базе Deckhouse в облаке Linx Cloud: встроенный мониторинг, безопасность и управление сертификатами +7

12:15

Алгоритм Диница: как найти максимальный поток в сети (для начинающих) +6

09:52

Скоро без нас: когда роботы окончательно отберут нашу работу? +6

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • От React всё также веет безумием, но все об этом молчат +90

    • 267

    Большинству людей плевать на качество софта +71

    • 125

    No Cars Allowed? Что с трендом на улицы без авто +5

    • 76

    Простой ультразвуковой отпугиватель собак +35

    • 64

    Без(д)воз(д)мездно, то есть даром +15

    • 62

    Что делать вайбкодеру после 07/07 +1

    • 49

    Скоро без нас: когда роботы окончательно отберут нашу работу? +6

    • 49

    Как «по-быстрому» сделанная игра затянула меня в геймдев на 20 лет и какие выводы я из этого сделал +88

    • 42

    Шифрование на основе хешей -6

    • 39

    Как я пришёл в open source в 2025-м (с утилитой для бекапа PostgreSQL), чуть не потеряв проект на ~$1500\мес в 2023-м +13

    • 35

    Из личного VPN в целый сервис -1

    • 31

    Как выйти из IT?.. и пойти слесарем на завод. Моя попыточка дауншифтинга [1\4] +58

    • 31

    Вы тоже заказываете платы, компоненты и всячину здесь? +61

    • 25

    Как ваш полет домой поможет инопланетянам определить местоположение Земли +7

    • 24

    Commodore 64 Ultimate: возрождение легенды в 2025 году +40

    • 23

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.