• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement learning

Mountain Car: решаем классическую задачу при помощи обучения с подкреплением +16

  • 20.03.2019 08:13
  • ArgentumWalker
  • 8
  • Блог компании Питерская Вышка
  • Python
  • Машинное обучение
  • Программирование

Интуитивный RL (Reinforcement Learning): введение в Advantage-Actor-Critic (A2C) +11

  • 04.03.2019 09:58
  • SunZi
  • 0
  • Машинное обучение
  • Искусственный интеллект

OpenAI Gym+ROS+Gazebo: обучение автономного робота в домашних условиях. Часть 1 +13

  • 21.02.2019 15:47
  • karay
  • 12
  • Python
  • Искусственный интеллект
  • Машинное обучение
  • Разработка робототехники
  • Робототехника
  • Из песочницы

Обзор AI & ML решений в 2018 году и прогнозы на 2019 год: Часть 2 — Инструменты и библиотеки, AutoML, RL, этика в AI +16

  • 11.02.2019 07:22
  • gubanovpa
  • 0
  • Big Data
  • Data Mining
  • Алгоритмы
  • Искусственный интеллект
  • Машинное обучение

Открытый курс «Deep Learning на пальцах» +76

  • 05.02.2019 08:05
  • sim0nsays
  • 68
  • Блог компании Open Data Science
  • Python
  • Машинное обучение
  • Обработка изображений

Что не так с обучением с подкреплением (Reinforcement Learning)? +56

  • 21.01.2019 23:25
  • DesertFlow
  • 26
  • Машинное обучение
  • Искусственный интеллект

NeurIPS: как покорить лучшую конференцию по ML +62

  • 27.11.2018 11:00
  • Scitator
  • 11
  • Блог компании Open Data Science
  • Искусственный интеллект
  • Конференции
  • Машинное обучение

Neurotic Bikes: генезис +34

  • 17.10.2018 14:13
  • IrmaVeoll
  • 9
  • Машинное обучение
  • Искусственный интеллект
  • Из песочницы

Эффективные методы сжатия данных при тренировке нейросетей. Лекция в Яндексе +41

  • 11.03.2018 12:37
  • Leono
  • 5
  • Сжатие данных
  • Машинное обучение
  • Блог компании Яндекс

Случайные эволюционные стратегии в машинном обучении +48

  • 01.03.2018 06:10
  • Siarshai
  • 15
  • Машинное обучение
  • Математика
  • Алгоритмы

Платформы для экспериментов по обучению с подкреплением и не только +7

  • 19.01.2018 06:43
  • rodiohabr
  • 1
  • Машинное обучение
  • Из песочницы

Добро пожаловать в эру глубокой нейроэволюции +29

  • 08.01.2018 10:21
  • atepeq
  • 2
  • Алгоритмы
  • Машинное обучение

Пробуем q-learning на вкус, повесть в трех частях +10

  • 26.12.2017 16:32
  • kismir
  • 0
  • Программирование
  • Алгоритмы
  • Python
  • Из песочницы

Введение в обучение с подкреплением: от многорукого бандита до полноценного RL агента +6

  • 04.12.2017 10:23
  • a-pichugin
  • 0
  • Машинное обучение
  • Python
  • Data Mining
  • Big Data
  • Блог компании New Professions Lab

AlphaGo Zero совсем на пальцах +61

  • 04.12.2017 08:27
  • JustRoo
  • 45
  • Машинное обучение
  • Анализ и проектирование систем
  • Алгоритмы
  • Big Data
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • »
Страница 4 из 5
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
09:01

От React всё также веет безумием, но все об этом молчат +27

08:02

Commodore 64 Ultimate: возрождение легенды в 2025 году +13

07:16

Конфаундинг, или как аналитику попасть в ловушку +8

08:13

Новый рекорд по упаковке сфер неожиданно пришёл из геометрии +7

08:16

«Хочу, но боюсь и не делаю»: что делать со страхом того, что не получится? +6

06:15

Vue: Composables и TS это вам не Mixins и JS. С ними сложнее +6

04:41

Управление проектами: дайджест публикаций #36 +6

13:39

Как выйти из IT?.. и пойти слесарем на завод. Моя попыточка дауншифтинга [1\4] +5

05:16

Алгоритмы для работы с большими данными в Go: HyperLogLog и Count-Min Sketch +5

13:30

Пеликаны, сарказм и логические игры: забавные LLM-бенчмарки +3

13:16

Опыт ≠ меньше денег: за что в ИТ мы на самом деле платим +3

13:01

Большое испытание кальциевых аккумуляторов, часть 2: недозаряд портит, а кипячение убивает +3

12:15

Алгоритм Диница: как найти максимальный поток в сети (для начинающих) +3

10:15

Как дизайн Kaspersky Thin Client пережил подростковый бунт (и что из этого вышло) +3

10:08

Свой ChatGPT на документах: делаем RAG с нуля +3

09:02

Kubernetes на базе Deckhouse в облаке Linx Cloud: встроенный мониторинг, безопасность и управление сертификатами +3

10:15

Как дизайн Kaspersky Thin Client пережил подростковый бунт (и что из этого вышло) +2

09:52

Скоро без нас: когда роботы окончательно отберут нашу работу? +2

08:00

Без(д)воз(д)мездно, то есть даром +2

07:36

Продолжаем делать реализацию LISP на Python. Часть 1: структуры +2

08:41

Как в РФ разрабатывали уникальный судовой радар ближней зоны в диапазоне 76 ГГц +63

09:01

Первые анекдоты о программистах: юмор айтишников на переломе тысячелетий, 1999-2000 годы +53

05:29

VLESS+Reality и Multi-hop: Архитектура VPN-цепочки для нового поколения блокировок +38

00:21

Исследование METR: использование Cursor замедляет опытных разработчиков на 19 % +38

13:01

Голографический принцип: реальность как иллюзия +37

12:00

Самодельный компьютерный стол с навороченной начинкой внутри за 20 шагов +33

18:16

Территория Большого Взрыва. Что, где и когда взорвалось +28

14:05

Drift Skate, Freeskates, Freeline Skates, Кайф +20

08:14

Xreal One Pro — подробный разбор новых AR-очков с чипом X1 и экраном до 191 дюйма +19

17:29

Ещё один PID-контроллер +16

16:32

Девушки, котики и Flux Kontext: как выжать максимум из WebUI Forge? +15

21:09

Не хватило мощности: история бренда «Техносила» +13

06:05

История игровой журналистики в России +12

11:29

«Почему топ менеджеры выбирали SAP, но...» что пошло не так у автора +10

05:48

Универсальные подсказки по промптам (продвинутые советы) (Ч.2) +8

14:44

Разработка требований к ПО с помощью Markdown, Git и Obsidian +7

01:17

Сделай удобно: подборка UI/UX-кейсов из цифровых и нецифровых продуктов (#18) +7

20:45

Цистеин. Как одна аминокислота мешает худеть. И спасибо ей за это +5

18:46

Открытые инструменты для визуализации сетевого трафика +4

04:37

Laravel: электронная подпись на сервере с PDF визуализацией +3

13:01

Блеск и ад p2p-торговли на Bybit +79

08:07

Хронометр Гаррисона: прибор, спасший жизни сотен моряков +74

09:01

Самодельные любительские радиолампы. Франция, 1920 г. Часть 1 +68

13:20

Август 2009. Катастрофа в Саянах +57

08:06

Novomatic Coolfire. Самый навороченный игровой автомат двухтысячных +40

00:26

С торца — экран, внутри — эпоха: портативные (носимые) компьютеры 80-85 гг +34

08:01

ZFS on Linux: установка Ubuntu с корнем в ZFS, RAID и шифрованием +32

14:17

От Аристотеля до Тьюринга: что такое функциональное программирование и как оно облегчает жизнь +28

12:00

Python в Enterprise-разработке: почему популярность ЯП распространилась и на корпоративный сектор. Часть 1 +27

12:36

Руководство по pgcrypto — шифрование внутри PostgreSQL. Часть 2 +22

09:58

«IT-Планета 2025»: задачи третьего этапа по PostgreSQL +20

07:45

От промтов к агентам: как мы дошли до трансформеров, что LLM умеют уже сейчас и что нас ждёт в 2027 году +19

16:17

Почему топ менеджеры выбирали SAP, но не выбирали 1С, а теперь они тусуются на ЦИПР? +18

10:22

Как уменьшить размер модели Power BI на 90% +18

07:00

Хронический тонзиллит: «резать» или терпеть? Вот в чём вопрос +18

21:12

Сознание — не место для дискуссий +17

09:07

Краткий обзор платформы данных Т-Банка +17

11:59

Маленькое приключение в поиске ошибок. The Battle for Wesnoth +14

22:33

Как измеряется работа выполненная в z/OS и что из этого следует +13

16:12

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров +13

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Самодельный компьютерный стол с навороченной начинкой внутри за 20 шагов +33

    • 151

    Max от VK — мессенджер, который хочет стать российским WeChat. Что уже есть и что не так? -16

    • 136

    Почему топ менеджеры выбирали SAP, но не выбирали 1С, а теперь они тусуются на ЦИПР? +18

    • 133

    VLESS+Reality и Multi-hop: Архитектура VPN-цепочки для нового поколения блокировок +38

    • 93

    Территория Большого Взрыва. Что, где и когда взорвалось +28

    • 72

    «Почему топ менеджеры выбирали SAP, но...» что пошло не так у автора +10

    • 69

    Блеск и ад p2p-торговли на Bybit +79

    • 59

    От Аристотеля до Тьюринга: что такое функциональное программирование и как оно облегчает жизнь +28

    • 53

    ZFS on Linux: установка Ubuntu с корнем в ZFS, RAID и шифрованием +32

    • 53

    Исследование METR: использование Cursor замедляет опытных разработчиков на 19 % +38

    • 51

    Хабра-харакири 2: Как я спросил, и мне ответили +2

    • 40

    Самодельные любительские радиолампы. Франция, 1920 г. Часть 1 +68

    • 38

    Сознание — не место для дискуссий +17

    • 37

    Шаг за шагом проектируем сокращатель ссылок +2

    • 35

    Python в Enterprise-разработке: почему популярность ЯП распространилась и на корпоративный сектор. Часть 1 +27

    • 34

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.