Переменное подкрепление: как алгоритмы управляют нашим вниманием и что с этим делать / forpes.ru

Главная
Переменное подкрепление: как алгоритмы управляют нашим вниманием и что с этим делать

Переменное подкрепление: как алгоритмы управляют нашим вниманием и что с этим делать -1

07.06.2025 08:58

georgeriaskin 3 590 Источник

Наверняка вы когда-нибудь замечали, как трудно оторваться от залипания в шорт видео или от прокручивания алгоритмической ленты. И это не случайность, так работает система подкрепления нашего мозга.

Предлагаю разобраться в её механиках, почему она настолько эффективна, как перестать быть ее жертвой и начать использовать в свою пользу. Поехали.

Что вообще такое переменное подкрепление?

Это механизм, при котором награда за выполненное действие приходит нерегулярно и непредсказуемо. Смоделируем, я решил публиковать видео на YouTube, первое набрало 500 просмотров, второе – 1 500, третье – 600, четвертое — вдруг 2 400.

Такой нелинейный рост будет выступать непредсказуемой наградой и мотивировать меня дойти не до 2 400, а уже, например, до 3 500 просмотров. Если бы рост шел «лесенкой» (500, 600, 700…), мотивация бы со временем перестала расти из-за предсказуемости награды.

Система подкрепления помогает фиксировать связь между действием и результатом. Сделал X → это привело к результату Y → нужно продолжать делать X. А переменное подкрепление помогает более устойчиво закрепить эту связь.

Все дело в дофамине, который отвечает за ожидание награды и помогает мозгу обучаться на основе результата. Когда результат превышает ожидания, мозг регистрирует так называемую ошибку предсказания и дофаминовый сигнал возрастает, а за ним закрепляется поведение, которое привело к успеху.

Предсказуемые награды, в свою очередь, вызывают гораздо меньший отклик, потому что мозг их уже «учел».

Откуда же взялась система подкрепления мозга?

Она присутствует у человека с древнейших времен и помогала еще первобытным людям выживать в суровом мире, полном опасностей.

Наш предок точно не знал, где и когда найдет пищу. Каждый убитый зверь, найденный куст ягод или источник пресной воды был неожиданной наградой, поощряющей продолжать поиски.

Это формировало связь между действием (поиск) и наградой (еда, вода), побуждая искать себе пропитание снова. Без этой системы добыча ресурсов была бы хаотичной, а мотивация к исследованию мира – более слабой.

Помимо первичной проблемы пропитания, система помогала выживать в экстремальных ситуациях. Убежал от хищника и спасся – мозг запомнил удачную стратегию.

Помог племени? Получи благодарность, признание, доступ к лучшим ресурсам и множеству партнеров. Такое поведение вызывает дофаминовый отклик и усиливает мотивацию к повторению действий, полезных для общества.

В обратную сторону тоже работает. Если племя отвергло индивида – он испытает дискомфорт, который будет мотивировать его искать способы вернуться в группу, ведь он потерял часть доступных благ.

Научился первым разводить огонь или ловить рыбу? Получи всплеск дофамина. Передал знания другим и увидел, как у них получается? Получи еще один всплеск дофамина.

Система подкрепления позволила нам не только выжить, но и развиться. Она побуждает нас действовать в условиях неопределенности, исследовать мир и повторять действия, которые приносят результат.

Обратная сторона системы подкрепления

Сегодня система активно используется против нас в алгоритмах социальных сетей, казино, маркетинге. Она же заставляет нас делать импульсивные покупки и бесконечно проверять уведомления в ожидании чего-то значимого.

Игровые автоматы – классический пример. Мы ставим $30, проигрываем пару раз, а затем выигрываем $100 (первая прикормка). Баланс падает до $50, потом снова подскакивает до $80. Выигрыши непредсказуемы, но наш мозг запоминает их как потенциальную награду, а это поддерживает азарт и формирует привычку.

Игроку дают поверить, что он может выиграть, но на длинной дистанции автомат все равно заберет деньги. Казино всегда в плюсе.

На этой механике построены и рекомендательные ленты, цель которых – удерживать наше внимание как можно дольше. Их главная метрика – время, проведенное пользователем в приложении.

Как это работает: скроллю я ТикТок, мне показывает 5-6 нормальных по качеству видосов, становится скучно, и я собираюсь уйти, и в этот момент алгоритм подсовывает топовый видос, который оставляет меня в приложении. И так по кругу.

От предсказуемости каждого следующего видео моя мотивация разжижать мозг дальше падала, но алгоритм подкинул видос, вызвавший ошибку предсказания, и я остался скроллить.

Смысл манипуляций в максимизации прибыли. Дольше алгоритм удержит пользователя → больше рекламы ему покажется → больше заработает платформа. Так наше внимание конвертируется в прибыль.

Самое страшное здесь, что технология отлично с этим справляется, а еще и параллельно учится на наших действиях. У нее есть прогноз того, когда нам станет скучно, и она будет препятствовать нашему оттоку. Это намного умнее казино: против нас играют данными о наших предпочтениях и поведении.

Но что если этот механизм можно использовать в свою пользу и не терять на нем время, а учиться чему-то новому или делать что-то полезное?

Как использовать это в свою пользу?

Система подкрепления может быть не только инструментом манипуляций, но и мощным мотиватором. При правильном понимании её механик она станет крутым рычагом для обучения и достижения целей. Вот несколько лайфхаков:

Выбрать сферу с переменными наградами. Система сильнее включается там, где есть потенциал кратного роста. Это может быть предпринимательство, контент, творчество, инвестиции – то есть сферы, где возможен «джекпот».
Найти точки роста. Делать как можно больше экспериментов, изучать чужой опыт, тестировать гипотезы. Больше попыток – выше вероятность наткнуться на ошибку предсказания и закрепить успешное поведение.
Повторить работающие стратегии. Если стратегия уже дала результат, нужно повторить ее и попытаться добиться с ней больших успехов. Залетел определенный формат контента – нужно продолжать делать его и постоянно улучшать. Так поведение закрепится, превратившись в привычку.
Создать свои награды. Важно отмечать как большие, так и маленькие победы, можно даже записывать их в отдельный блокнот. При получении награды мозг запомнит, за что она выдавалась и будет стараться повторить это.

К сожалению или к счастью, отключить систему подкрепления мы не можем, зато можем перенаправить ее в нужное нам русло и получить от этого выгоду. В мире, где все борются за наше внимание, очень важно держать фокус и использовать систему прежде всего в свою пользу.

Спасибо, что прочитали до конца! Если статья понравилась – подписывайтесь на мой Telegram-канал, там такой контент выходит чаще.

Комментарии (3)

hypocrites
07.06.2025 09:54
#28407872
Нет, не замечал. Я использую хронологическую и вам советую. Алгоритмы работают только на слабых умишком зумеров со внимательностью рыбки.
1. cyber_lapti
  07.06.2025 09:54
  #28408266
  там в подписке дело иначе непрерывно вываливает неинтересный хлам а не то-что интересно тебе да твоим друзьям/подпискам
  
  вообще статья опирается на ошибочное предположение о первобытных людях тк у первых был пищевой безлимит и размеры которых хищники боялись да только со временем началось истощение рессурсов с постепенным уменьшением размеров где основной угрозой жизни был сам человек поэтому таких смыло нафиг оставив только неалгоритмичных

F0XinB0X
07.06.2025 09:54
#28411998
Интересный текст, однако, реальное применение довольно размыто. Если я в работе и так постоянно экспериментирую, то что делать, шеф?)

Переменное подкрепление: как алгоритмы управляют нашим вниманием и что с этим делать -1

Комментарии (3)

hypocrites

cyber_lapti

F0XinB0X