• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом Q-learning

Обыгрываем казино, с блэкджеком и стратегиями +7

  • 12.06.2025 14:45
  • monkey_llm
  • 4
  • Python
  • Машинное обучение

Как я открыл WebSocket для Сомников из Чёрного Зеркала, а они начали водить хороводы +6

  • 26.05.2025 13:24
  • redeschwall
  • 2
  • JAVA
  • Дизайн игр
  • Программирование
  • Веб-разработка
  • Искусственный интеллект

Нейронные оптимизаторы запросов в реляционных БД (Часть 1) +27

  • 09.09.2024 10:54
  • Safreliy
  • 9
  • Блог компании Postgres Professional
  • PostgreSQL
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Гайд на Reinforcement Learning для новичков. Реализация простой задачи

  • 07.04.2024 09:17
  • alexmusyka
  • 1
  • Программирование
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Кратко про алгоритм обучения Q-learning и как он реализуется в Python для новичков

  • 01.04.2024 04:34
  • badcasedaily1
  • 0
  • Машинное обучение
  • Блог компании OTUS

Обучение с блэкджеком и подкреплением. Ищем оптимальную стратегию игры +3

  • 14.11.2023 09:00
  • MarkWatney
  • 8
  • Игры и игровые консоли
  • Алгоритмы
  • Математика
  • Машинное обучение

Джон Кармак взялся за сильный ИИ — и у него особый подход. Список фундаментальной литературы для начала +87

  • 13.03.2023 09:00
  • alizar
  • 89
  • Блог компании RUVDS.com
  • Машинное обучение
  • Научно-популярное
  • Искусственный интеллект
  • Будущее здесь

Q-Learning в сфере оптимизации бизнес-процессов +1

  • 04.04.2022 11:41
  • NewTechAudit
  • 0
  • Python
  • Программирование
  • Машинное обучение
  • Читальный зал
  • Natural Language Processing

Обучение с подкреплением в Super Mario Bros. Сравнение алгоритмов DQN и Dueling DQN +5

  • 17.06.2021 09:11
  • hse_spb
  • 0
  • Блог компании Питерская Вышка
  • Python
  • Машинное обучение
  • Учебный процесс в IT
  • Блог компании Питерская Вышка
  • Python
  • Машинное обучение
  • Учебный процесс в IT

Фронтендер пишет нейронки. Уровень сложности «мартышка и уравнение Беллмана» +7

  • 20.01.2021 17:46
  • Werawoolf
  • 2
  • JavaScript
  • TensorFlow

Как я учил змейку играть в себя с помощью Q-Network +20

  • 29.08.2019 13:35
  • Platun0v
  • 4
  • Python
  • Машинное обучение
  • Искусственный интеллект
  • Из песочницы

Применение рекуррентных слоев для решения многоходовок +31

  • 25.04.2018 13:11
  • Roaming
  • 4
  • Машинное обучение
  • Python

Пробуем q-learning на вкус, повесть в трех частях +10

  • 26.12.2017 16:32
  • kismir
  • 0
  • Программирование
  • Алгоритмы
  • Python
  • Из песочницы

Обучение с подкреплением на примере игры «крестики-нолики» +9

  • 02.05.2017 07:11
  • MonteKarlo
  • 13
  • Машинное обучение

Спортивный анализ данных, или как стать специалистом по data science +61

  • 26.04.2017 14:05
  • romovpa
  • 12
  • Спортивное программирование
  • Машинное обучение
  • Data Mining
  • Big Data
  • Блог компании Яндекс
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
13:20

День, когда высох Ниагарский водопад +47

08:00

История Rust: от стартапа до продакшена +43

08:11

Post-PHP эра: куда движется веб-разработка? +31

07:06

Whitechapel MG1: редкий компьютер с графическим интерфейсом из «Автостопом по Галактике» +26

07:00

Всё переписать: запускаем Cilium dualstack overlay поверх IPv6 underlay +25

09:01

ЦОД как сервис, сисадмин как разработчик: как менялись модели +24

14:28

DOOMQL: DOOM-подобный многопользовательский шутер на чистом SQL +23

13:01

161-ФЗ и аппеляция на Bybit: как я победил треугола +22

08:38

Цифровизация производства: как российские IT-решения экономят миллиарды +19

08:13

Устройство на работу на позицию senior developer в 2025 году в Москве. Мой опыт +19

09:02

Я рад, что застал рождение Рунета +17

06:31

Рецензия на книгу «Разработка мультитенантных SaaS-архитектур: принципы, модели, практика» +17

07:52

«Я играю, меня не беспокоить!». Как я стал зажигать световое табло On Air при подключении к TeamSpeak +16

11:48

Юридический лайфхак: ищем настоящие традиционные товары с помощью одного интересного госреестра +15

08:05

Делаем брелок с LED матрицей ярче +15

07:00

Как я делал датчики для души, а они стали приносить деньги +13

10:38

Решил поучаствовать в бета-тестировании одной из российских ОС: что из этого вышло +12

08:20

«Высокая женщина в белом с формами — это круто»: как популярность Димитреску пошли от ее прообраза — Хассяку-сама +11

10:40

Все роли в кибербезопасности на одной схеме: инструкция по планированию карьеры +10

05:46

Новый экспериментальный API для JSON в Go +8

10:49

MAX без оболочки: Что мы нашли в его APK +194

07:47

МТС: нам плевать на вашу тайну связи? +154

09:17

Как ФБР запустило стартап для наркокартелей и три года читало их переписку — история Anom +82

09:01

Звуковые эффекты на ZX Spectrum: AYFXEdit и BeepFX +64

13:01

Как снимать на плёнку и не разочароваться в ней: снимаем бюджетно в 2025 году +37

14:45

Pixel Table: от идеи до реализации интерактивного пиксельного стола +31

07:00

Рецепт стали — теория и практика +29

06:09

Идентификатор моего рабочего стола +26

15:09

PostgreSQL 18: Часть 5 или Коммитфест 2025-03 +24

08:01

Голограммы, которым еще далеко до Рейчел +23

07:00

Как мы ищем рестораны на карте: геоиндекс в Яндекс Еде +22

07:15

На заводе отключают Wi-Fi? А ведь можно резервировать связь для АСУТП через мм-волновые технологии +21

08:05

Canary-деплой в Kubernetes с использованием Argo Rollouts и Istio +20

08:30

Почему тревожники — лучшие сотрудники? +18

14:05

Big O +17

10:09

Возвращаем команде ответственность на все деньги +17

14:09

Играемся с видеокартой Tesla H100 (GH100) +16

11:36

Куны, гривны и говяды. Какими раньше были деньги на Руси +16

07:58

Один из крупнейших взломов NPM: более 18 пакетов были скомпрометированы +16

17:27

Что нового в Maven 4? +15

10:05

Почему в Linux «Всё есть файл»? Или почему гениальные абстракции UNIX настолько гениальны +162

16:22

Не смотрите на % использования процессора при гиперпоточности +138

09:01

Куда инвестирует великий программист Джефф Дин +38

05:06

Новая труба в Китай, а также секс-рецессия в США +34

07:59

«Весь в отца»: они «запатентовали» надпись на одежде и потребовали с нас 1 000 000 рублей, угрожая судом и полицией +33

13:01

Разворачиваем онлайн-игру на виртуальном сервере +31

08:00

Деструктуризация в JavaScript +31

00:29

Как Windows захватила наши клавиатуры +31

15:18

if err != nil: почему мы (не) любим обработку ошибок в Go? Обзор предложений по её улучшению +30

15:18

if err != nil: почему мы (не) любим обработку ошибок в Go? Обзор предложений по её улучшению +30

12:30

Почему так сложно использовать юмор в играх +29

14:24

Неожиданный скачок продуктивности благодаря Rust +25

13:54

Infrastructure as Code на практике: как мы рефакторили сложный Ansible-репозиторий +22

15:08

Не промптом единым: как миксовать нейросети и ручную работу +20

14:14

Lua, как инструмент во встроенных системах +18

09:51

Обзор USB-CAN переходника USB2CANFD_V1 +17

11:24

Велосипедный пузырь на рынке в XIX веке: как это было +16

05:25

Узнаем из дампа памяти, какие документы открывал пользователь +15

13:57

Java Digest #28 +14

15:03

Claude Code за $3/месяц и 2 новые «стелс» модели: потестил за вас +13

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • MAX без оболочки: Что мы нашли в его APK +194

    • 448

    Почему в Linux «Всё есть файл»? Или почему гениальные абстракции UNIX настолько гениальны +162

    • 153

    МТС: нам плевать на вашу тайну связи? +154

    • 150

    Как снимать на плёнку и не разочароваться в ней: снимаем бюджетно в 2025 году +37

    • 116

    Я за ИИ +5

    • 111

    Я тимлид, который искал работу в 2025 -29

    • 76

    Как Windows захватила наши клавиатуры +31

    • 73

    Не смотрите на % использования процессора при гиперпоточности +138

    • 71

    Немножко о выборе мышек для программистов +6

    • 68

    Новая труба в Китай, а также секс-рецессия в США +34

    • 62

    Я начал в найме, дорос до 800 000 в месяц, но живу до первого попадоса +9

    • 59

    Неожиданный скачок продуктивности благодаря Rust +25

    • 54

    Как ФБР запустило стартап для наркокартелей и три года читало их переписку — история Anom +84

    • 49

    Устройство на работу на позицию senior developer в 2025 году в Москве. Мой опыт +19

    • 42

    40 реальных технологий, вдохновлённых фильмами и книгами +10

    • 39

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.