Частотность употребления разных слов у наркоманов/алкоголиков/курителей табака, по сравнению с остальными людьми

По американской статистике, 10% населения США в возрасте 12 лет и старше страдают от той или иной формы зависимости — в официальной терминологии это называется substance use disorder (SUD) (зависимость). Вероятно, в РФ этот показатель гораздо выше. По оценке РБК, здесь 10% населения принимают суррогатные напитки (медицинские лосьоны, «боярышник», омыватели стекла, паленка и др.), а легальный алкоголь употребляют многократно большее количество людей.

В последние годы люди стали проводить огромное количество времени в социальных сетях, где общаются, обмениваются мыслями и т. д. Это огромный объём информации, достаточный для системы машинного обучения. И зависимых людей в социальных сетях тоже очень много. Благодаря достижениям учёных стало возможным автоматически выявлять наркоманов, алкоголиков и курильщиков табака по их лексике и культурным интересам (музыка, фильмы).

Возможно, в будущем начнётся даже автоматическая фильтрация наркоманов в Интернете. Например, им запретят регистрацию на некоторых сайтах или будет присваиваться особенный значок в профиле.

Cпециалисты с кафедры информационных систем Университета Мэриленда и Исследовательского центра восстановления от зависимостей при Исследовательском институте Карильона в Виргинском политехническом университете разработали систему машинного обучения, которая автоматически определяет людей, страдающих зависимостью, а также людей с риском зависимости (то есть граждане, которые по своим интересам слабо отличаются от настоящих наркоманов и алкоголиков).

Как известно, пристрастие к определённым веществам неизбежно сказывается на социальной активности человека и коррелирует с его чертами личности. Например, постоянно курящие табак люди проявляют значительно более высокий показатель «открытости к опыту», но значительно меньший показатель «добросовестности», чем некурящие люди (см. исследование Кэмпбелла и др., 2014). Употребление алкоголя положительно коррелирует с социальностью и экстравертностью (исследование Кука и др., 1998).

Десятки других научных работ тоже выявили связь между постоянным употреблением какого-нибудь наркотика и особенностями личности и социального поведения. Очень часто употребление веществ коррелирует с пониженной «добросовестностью» — это черта личности, которая связана с самодисциплиной, добросовестным исполнением обязанностей и стремлением к достижению цели. Такая корреляция вполне понятна, ведь именно эти черты характера требуются для избавления от наркотической зависимости.

С другой стороны, науке известны и факторы риска, которые повышают вероятность возникновения зависимости — это возраст, пол, импульсивность, стремление к удовольствиям, реакция на новизну, склонность к упражнениям и скудная окружающая среда (исследование Кэрролла и др., 2009). Известны и другие факторы, увеличивающие риск, в том числе социальное окружение (соседи), семейное окружение (родственники), общественные нормы.

Раньше учёные проводили такие исследования с помощью социальных опросов, но сейчас благодаря огромному количеству информации в социальных сетях можно изучать поведение людей не отходя от компьютера. Для системы машинного обучения американские исследователи использовали базу, собранную в рамках проекта myPersonality с 2007 по 2012 годы. Это было популярное приложение для Facebook, где люди проходили психологические тесты и подробно рассказывали о своей личности и привычках, среди них были наркоманы, алкоголики и курящие табак.

С психологическими профилями пользователей Facebook ассоциировали их активность в социальной сети — 22 млн обновлений статуса от 153 тыс. пользователей. В среднем 143 сообщения от каждого пользователя, а среднее количество слов — 1730 на человека. Из базы исключили неанглоязычных пользователей и тех, кто написал меньше 500 слов. Осталось 21 млн постов от 106 509 человек. После фильтрации низкочастотных слов (с частотой менее 50 в базе) словарный корпус составил 73 935 слов.

Исследователи учли опыт предшественников, которые доказали, что личность человека легче изучить не по его словам, а по его лайкам. Поэтому они составили также базу лайков для 5,1 млн пользователей.

После обучения система смогла с большой точностью предсказывать наличие зависимости у человека независимо от того, проходил ли он психологические тесты. Так, вероятность курения табака определяется с наибольшей точностью 86%, вероятность употребления наркотиков — 84%, вероятность употребления алкоголя — 81%.

Более того, результаты анализа лайков и частотности слов у наркоманов и алкоголиков представляют реальный научный интерес. Они показывают, в каком конкретно отношении отличаются интересы и поведение зависимого человека от интересов и поведения того, кто не употребляет веществ.

По частотности употребления слов у зависимых людей (наркотики, табак) чаще встречается брань (fuck, shit). Среди интересов у алкоголиков лидирует фильм «V — значит вендетта», а наркоманы любят слушать музыкальные группы Radiohead, The Cure и Depeche Mode.



Научная статья опубликована 16 мая 2017 года на сайте препринтов arXiv.org (arXiv:1705.05633).
Поделиться с друзьями
-->

Комментарии (101)


  1. c_kotik
    29.05.2017 16:44
    -2

    Не уж то скоро будет гораздо меньше шедевральных "пацанячьих" цитат?


    1. sergof
      29.05.2017 19:00
      +5

      Неужто скоро люди станут писать без ошибок? Нет, не может быть…


      1. Contriver
        30.05.2017 20:41
        +2

        Эти наркоманы и алкоголики точно нет.
        У нас в России у этих категорий своя оффлайн соцсеть, подписка за стакан в группы у подвала, на скамейке
        могут лайкнуть между глаз или в лоб, репостят 10 руб у проходящих мимо. Идя на работу смотрю как она разрастается захватывая новые территории.


        По американской статистике

        они у них там тупые (Задорнов) надо как у нас в оффлайне квасить и ширять.
        Что русскому хорошо то немцу амеру смерть.


  1. pewpew
    29.05.2017 16:49
    +1

    легальный алкоголь употребляют многократно большее количество людей

    Что есть легальный? Хороший и качественный самогон или модное нынче крафтовое пиво можно считать легальными? Или они в одном ряду с тройным одеколоном?


    1. arandomic
      29.05.2017 17:38
      +6

      Тот, который прошел через цепкие руки государства — с его акцизами и прочими ЕГАИС


    1. UJIb9I4AnJIbIrUH
      31.05.2017 15:04

      Тут вообще скользкая формулировка. Те, кто пьёт Боярышники имеют реальные проблемы с зависимостью, но это точно не относится к тем, кто пьёт легальные напитки. А то автор приравнял всех под одну гребёнку и можно подумать, на на легальщине у нас в разы больше, чем 10% зависимых.


  1. noldowalker
    29.05.2017 16:51
    +4

    Как будто табак, алкоголь и внезапно кофе — не наркотики. И вообще послы странный. Давайте запретим некоторой категории граждан выражать свои мысли в сети потому что они употребляют что-то.


    1. demimurych
      29.05.2017 17:08
      +2

      Насколько мне известно, принадлежность какого-либо вещества к наркотикам определяется на основе законодательно закрепленных списков. А не на основе действия самого вещества.


      1. dimkss
        29.05.2017 18:09
        +1

        Кстати интересно почему вас минусуют. Оно так и есть.


      1. 0xd34df00d
        29.05.2017 19:47
        +3

        Определять действия веществ на основе списков, а не списки на основе действия веществ, несколько странно и представляется неконструктивным.


        1. surius
          29.05.2017 20:07

          A с чего вы взяли, что делается так вам это представляется? В действительности списки весьма динамичны и регулярно обновляются.
          Более того, есть известная проблема, которая заключается в том, что препараты, отличающиеся друг от друга только минорными заместителями могут иметь значительно различные биологические свойства. Это, собственно и не позволяет, в некоторых ситуациях, вносить вещества в списки одним махом. Есть и обратная проблема суть которой в том, что введение заместителя к веществу которое находится в списке выводит его из зоны регулирования (потому как это другое зимическое соединение), но может так получиться что биологические эффекты сохранятся/усилятся/ослабятся.


          1. 0xd34df00d
            29.05.2017 20:46
            +3

            A с чего вы взяли, что делается так вам это представляется?

            С того, что там до сих пор нет алкоголя, например.


            1. surius
              29.05.2017 21:19

              А вы все соединения обладающие биоактивностью в тот лист включить хотите? Алкоголь, к слову сказать, находится в другом списке. И именно по этому, его отпуск, в формате пруктов пригодных к потреблению, осуществляется в соответствии с правилами и нормами. (18 лет, в России)


    1. alltiptop
      29.05.2017 17:08

      Ссылку на кофе можно пожалуйста? Интересно внезапно стало.


      1. k155la3
        29.05.2017 22:27
        +2

        Какую «ссылку»? Вы не слышали о том, что в кофе — кофеин? или о том, что кофеин — наркотик?


        1. PerlPower
          29.05.2017 23:15

          И все-таки можно ссылку? А то под медицинское определение «вещество, лекарственное средство, которое оказывает специфическое (стимулирующее, седативное, галлюциногенное и др.) действие на ЦНС, что является причиной его немедицинского потребления.» можно подогнать очень много веществ. Но почему-то часто привязываются именно к кофеину. Чем он особенный?


          1. pewpew
            30.05.2017 08:40
            +2

            1. ThunderCat
              30.05.2017 22:19
              -1

              Не-не-не, про зависимость от кофе — это и к зависимости от игр и к соц. сетей приравнять можно.
              В статье нигде нет ни строчки о том, что кофеин относится к наркотикам, по тому что не относится он к ним. Это из разряда городских легенд.


              1. pewpew
                31.05.2017 14:21

                Смотря что считать наркотиком. Лично я ими считаю все вещества, которые вызывают привыкание. Резкая остановка приёма такого вещества спровоцирует «ломку» (больше физическую, чем психическую).
                А то, что государства ведут какие-то там реестры — это лично мне до лампочки. Это государства заинтересованы в контроле оборота веществ и ради корыстной выгоды управляют этими списками.
                Явным примером является алкогольное лобби, выгодное крупному бизнесу. К примеру от передозировки природного каннабиса ещё никто не умер, а от синьки мрут постоянно, что не мешает нашему доблестному государству легально выпускать алкоголь и всячески гнобить каннабис. Так же и с табаком. Все знают что он вреден, но никто за его хранение, распространение и употребление никого в тюрягу не сажает. Двойные стандарты.


                1. ThunderCat
                  31.05.2017 14:40
                  -1

                  Лично я ими считаю все вещества, которые вызывают привыкание.

                  Круто. А я вот считаю что сосед который мне перфоратором фигачит утром в стену достоин смерти через засверливание насмерть. Но такая штука как закон и подзаконные акты противоречит моему личному мнению, впрочем как и вашему.


                  1. pewpew
                    31.05.2017 15:22
                    +1

                    Вы интересовались, относится ли кофеин к наркотикам. Не уточнили, однако по чьему мнению. Если имелось ввиду официально, в РФ — нет. А если по сути, то да. Так правильно? Или я что-то упустил?


                    1. ThunderCat
                      31.05.2017 19:17

                      Если имелось ввиду официально, в РФ — нет. А если по сути, то да
                      нет. Суть в названии, называйте между собой и кошкой как хотите, по СУТИ кофеин не входит в список наркотических веществ ни в одной стране мира. Это в-во, влияющее на цнс и эндокринную систему. Как валериана, которая успокаивает, а не возбуждает. Есть определение наркотика — запрещенный к распространению без контроля препарат, все остальное — разрешенные препараты и в-ва, влияющие на цнс. Все равно как вертолет назвать самолетом, «ведь сам летает, и еще — я так считаю»!


                    1. ThunderCat
                      31.05.2017 19:25

                      И в догонку — американское определение наркотиков:
                      Narcotic — a chemical agent that induces stupor, coma, or insensibility to pain. The term usually refers to opiates or opioids, which are called narcotic analgesics.
                      (вольный перевод): Химический агент, вызывающий обездвиживание, кому или нечуствительность к боли, чаще всего относится к группе опиатов или опиоидов, чаще называемые наркотическими анальгетиками. Пойду обездвижусь кофем за компом…


          1. Swill
            31.05.2017 15:15
            +1

            Ну так кофе оказывает стимулирующее воздействие на ЦНС? Оказывает. Вот и ответ, под определение.
            Привыкание и толерантность описаны довольно широко. Да, ломки при отмене нет. Но вялось, сонливость — легко.


            1. ThunderCat
              31.05.2017 19:27

              блин, ДА ГДЕ ВЫ ПРОЧЛИ ЧТО ВОЗДЕЙСТВИЕ ПРЕПАРАТА НА ЦНС ОТНОСИТ ЕГО К НАРКОТИКАМ??? На РенТВ???


              1. Swill
                31.05.2017 19:38

                В Википедии. Раздел «Научные определения», Медицинский критерий.
                Кстати, там отличная статья, раскрывающая всю многогранную неуверенность термина.


                1. ThunderCat
                  31.05.2017 21:24

                  Термином наркотическое средство (наркотик) называют вещества, отвечающие трём критериям:
                  Медицинский критерий — вещество, лекарственное средство, которое оказывает специфическое (стимулирующее, седативное, галлюциногенное и др.) действие на ЦНС, что является причиной его немедицинского потребления.
                  Социальный критерий — немедицинское потребление рассматриваемого вещества принимает большие масштабы, и наносимый вред приобретает социальную значимость.
                  Юридический критерий — средство официально признано наркотическим и включено в перечень наркотических средств.

                  Угу, ученый изнасиловал журналиста. Вырвав из контекста мы можем что угодно назвать чем угодно. Только вещества попадающие под все три определения являются наркотическими. По этому параметру в юридический критерий попадает например фастфуд. А под медицинский -вышеупомянутая валериана лекарственная. Не будь Выбегаллой, не вырывай из контекста.


          1. darthmaul
            31.05.2017 19:40

            стимулирующее
            действие кофеин имеет, особенно при больших дозах, это факт.


          1. k155la3
            01.06.2017 02:55

            Ну, в первую очередь потому, что он — просто хороший пример.

            И да, наркотиком действительно можно назвать много чего. Включая многими любимый алкоголь (который и на «тяжёлый наркотик» при минимальном на то желании классификатора вполне потянет).


        1. alltiptop
          30.05.2017 20:38

          В чае тоже есть кофеин, как и в кока-коле/пепси. В кисломолочной продукции содержится % спирта и т.д., список можно перечислять долго.

          Как сказал тов. Парацельс: «Всё есть яд, и ничто не лишено ядовитости; одна лишь доза делает яд незаметным»

          И так, какие дозы употребления кофе можно считать значимыми для определения наркотического действия (можно с таблицей по времени выведения, скорости употребления и массой тела)?
          И определение, собственно, наркотика — как видно оно сильно разниться.


          1. k155la3
            01.06.2017 03:01

            А при чём тут «доза»?

            Вещество относится к наркотическим вне зависимости от терапевтической (или, если уж на то пошло, летальной) дозы.

            Общепринятое определение «наркотика» в двух словах — действие на психику + физиологическое привыкание. Ему кофеин соответствует.


            1. alltiptop
              01.06.2017 03:31

              Если доза не имеет значения, то тогда и чай с колой справедливо называть наркотиками наравне с кофе, и не делать последний чем-то исключительным.


              1. k155la3
                01.06.2017 03:33

                Ну, «наркотик»-то относится всё же к действующему веществу.

                А то, что чай содержит кофеин — общеизвестно. Нет, кофе не исключителен. :)


    1. ThunderCat
      29.05.2017 17:55

      Наркотические средства — вещества синтетического или естественного происхождения, препараты, растения, включенные в Перечень наркотических средств, психотропных веществ и их прекурсоров, подлежащих контролю в Российской Федерации, в соответствии с законодательством Российской Федерации, международными договорами Российской Федерации, в том числе Единой конвенцией о наркотических средствах 1961 года

      таким образом кофе туда не попадает точно, алкоголь и сигареты тоже продаются свободно, единственное ограничение — достижение покупателем 18 лет. Так что не наркотики, а скорее психотропные вещества, разрешенные к свободной продаже. А посыл действительно странный.


      1. xirahai
        29.05.2017 20:21


        1. ThunderCat
          29.05.2017 23:20

          угу, на заборе тоже написано, а там дрова лежат. И кстати — чистый спирт вполне может быть наркотиком, а вот спиртные напитки — нет. Есть препараты, содержащие наркотические в-ва в составе, но к наркотикам не причисляемые, и соответственно, свободно распространяемые. В частности(внезапно) — Перманганат калия (в концентрации 45 процентов или более) относится к препаратам "включенным в списки II, III, IV перечня наркотических средств, психотропных веществ и их прекурсоров, подлежащих контролю в Российской Федерации", а порошок и р-р данной субстанции в меньшей концентрации продается без рецепта.


          1. APLe
            30.05.2017 00:02
            +2

            Прошу прощения, а что такое «порошок перманганата калия меньшей концентрации»? Его мелом разбавляют?


            1. ThunderCat
              30.05.2017 19:33

              1) порошок
              и
              2) р-р данной субстанции в меньшей концентрации
              так понятней?


          1. desert_beaver
            30.05.2017 10:40
            +2

            Извините, конечно, но вы звон слышите, а откуда он исходит не понимаете. Сами все написали, но прочитать не смогли. В какой перечень входит перманганат калия?

            наркотических средств, психотропных веществ и их прекурсоров

            Вы реально полагаете, что марганцовкой можно упарываться? Семивалентный марганец — сильный окислитель, а само соединение только лишь участвует в процессе синтеза, но само по себе наркотиком не является.


            1. ThunderCat
              30.05.2017 20:23
              +1

              перепрочел свой коммент — действительно неудачно фразы состыковал, получилось что я в качестве примера наркотических средств указал калия перманганат, хотя хотел только подчеркнуть что он находится в списке контролируемых в-в. Мой косяк. В качестве же препаратов содержащих наркотические в-ва могу упомянуть корвалол, в составе которого фигурирует фенобарбитал. Тоже не очень корректно, все же он более психотропный, седативный препарат, но сейчас навскидку не вспомню всю клинфарму, помню что точно есть и с наркотическими.


            1. darthmaul
              31.05.2017 19:46

              только лишь участвует в процессе синтеза
              более того, в процессе синтеза большинства наркотиков так или иначе участвует вода…
              Вообще, идея запрещать прекурсоры — идиотизм.


              1. k155la3
                01.06.2017 02:49

                Не.
                Сама идея — вовсе не идиотизм.

                Иначе я на легальных основах организую фирму, которая выпускает и продаёт легально всем подряд 2-хлор-1-фенилпропан бочками (то есть, проводит почти весь сложный синтез амфетамина), а нарикам и барыгам потом останется только его с раствором аммиака в метаноле замешать, осадить и высушить. Но ладно, амфетамин — химически простой. Но ведь то же самое — с любым наркотиком: можно выпускать прекурсор, который сам по себе наркотиком являться не будет, но требует только простого восстановления/окисления/замещения/ещё-чего-то при простом смешивании/нагреве/кипячении.

                Если не запрещать прекурсоры, нет смысла запрещать наркотики вообще. Тоже вариант, вполне себе, но выбран вариант с запретом. А при таких делах свободная продажа прекурсоров — эпик фейл в логике.


                1. darthmaul
                  01.06.2017 11:40

                  Самые популярные наркотики это марихуана, героин, кокаин и амфетамин с производными. Синтезируется только последний, причём довольно просто из общедоступных реагентов, 5 стадийный синтез если память не подводит. Остальные — из растительного сырья, которое надо где-то вырастить. Да, разные синтетические психотропные препараты станут дешевле от разрешения прекурсоров, но разве это критично?


                  1. k155la3
                    01.06.2017 12:00

                    Конечно. Растительные наркотики ведь можно сделать "прекурсором" — денатурировать, ткзть. И поиметь выгоды на РЕЗКО упростившейся логистике. А потом в нарколабах проводить обратную операцию (которую сделать достаточно простой — например, простой нагрев с разложением до исходного).


                    Критично или нет снижение цены — долгий спор между либертарианцами и сторонниками запретов. Это я б сразу вынес за рамки — тема сложная, аргументов и примеров есть с обеих сторон.


                    Но если мы уж поставили целью повышать цены на наркоту и ограничивать ее распространение, то ограничение оборота прекурсоров — первейшая задача.


        1. Contriver
          01.06.2017 11:53

          18300-72 от этого ГОСТ из дедушкиного сундука прёт нафталином, этиловый спирт уже давно не наркотик
          ГОСТ 5962-2013 правильный
          5.1 Этиловый ректификованный спирт из пищевого сырья по степени воздействия на организм человека относится к 4-му классу опасности по ГОСТ 12.1.007-1.1. --По степени воздействия на организм вредные вещества подразделяют на четыре класса опасности:
          4-й — вещества малоопасные.
          Не опаснее бытовых моющих для посуды, несмытые с посуды


          1. pewpew
            01.06.2017 12:40

            16-ходовое решение, как из мухи сделать слона: муха-мура-тура-тара-кара-каре-кафе-кафр-каюр-каюк-крюк-урюк-урок-срок-сток-стон-слон.

            “Хроника изменения соответствующих ГОСТов в нашей стране”.

            Госстандар СССР. Спирт этиловый ректификованный технический, технические условия. ГОСТ 18300-72.

            Издание официальное. Государственный комитет стандартов СССР Москва. Утверждён и введён вдействие Постановлением Госкомитета стандартов Совета Министров СССР от 26.12.1972 г. №2329.

            Пункт 5. ТРЕБОВАНИЯ БЕЗОПАСНОСТИ 5.1.

            1972 год: Этиловый спирт – легковоспламеняющаяся, бесцветная жидкость с характерным запахом, относится к сильнодействующим накотикам, вызывающим сначала возбуждение, а затем паралич нервной системы.

            1982 год: Этиловый спирт – легковоспламеняющаяся, бесцветная жидкость с характерным запахом, относится к сильнодействующим наркотикам (ГОСТ18300-72 п.5.1 в изменённой редакции 1982 г. и ГОСТ 5964-82 п.4.1.).

            1993 год: Этиловый спирт – легковоспламеняющаяся, бесцветная жидкость с характерным запахом (ГОСТ 5964-93 п.7.1.).

            Вот так, за 20 лет, полностью исчезли из первоначального определения: “относится к сильнодействующим накотикам, вызывающим сначала возбуждение, а затем паралич нервной системы.”


    1. Politura
      29.05.2017 22:29
      +1

      Давайте запретим некоторой категории граждан выражать свои мысли в сети потому что они употребляют что-то.

      Да разве это не прекрасно? Заводит себе, например, Милонов твитор, а у него там через пару постов автоматический статус: «конченый наркоман, не просыхает 24 часа в сутки».

      А вообще, ну очевидно же, что предложение запрета регистрации это нежные фантазии автора статьи, ничего общего с действительностью не имеющие.


    1. saiscea
      30.05.2017 16:56

      Замените «табак, алкоголь, наркотики» на «антиобщественное поведение и disloyalty to the gov't». Посыл стал более понятным?


  1. Ugrum
    29.05.2017 17:06
    +2

    Возможно, в будущем начнётся даже автоматическая фильтрация наркоманов в Интернете. Например, им запретят регистрацию на некоторых сайтах или будет присваиваться особенный значок в профиле.

    Да чо уж там, сразу направление на принудительное лечение выписывать и бригаду санитаров присылать.
    "Слышь Петровна, Ваську из пятой квартиры вчера в ЛПУ забрали, он так отбивался, так кричал, что это не его блохи в свитере каком то, да кто ж ему поверит то, тунеядцу. Досиделся за контупером своим до блох в свитерах. Ну ничего, ему там мозги на место вправят".


  1. Color
    29.05.2017 17:08
    +2

    Возможно, в будущем начнётся даже автоматическая фильтрация наркоманов в Интернете. Например, им запретят регистрацию на некоторых сайтах или будет присваиваться особенный значок в профиле.

    Научились бы лучше детей фильровать. И присваивать им значок. Сразу бы большинство проблем интернета разрешилось.


    Ах да, и тех, кто хочет "фильтровать кого-либо в интернете" туда же.


    1. ArkturTierry
      29.05.2017 18:04
      -1

      Это что же, Вы поддерживаете деанонимизацию интернетов?
      А вообще да. «В обществе где нет цветовой цифровой дифференциации штанов -нет цели!»
      А вообще говоря, это «исследование» вызывает много вопросов, потому что частота употребления слов сильно зависит от контекста и темы беседы. Ну и от собеседников разумеется. Эдак врач, посещающий профильные форумы рискует получить цифровую метку.
      В отрыве от этих факторов трудно представить себе, сколько ложных срабатываний счетчика могло произойти. Сводящих достоверность исследования к нулю.
      И потом, вот употребляет человек некоторые слова, близко «по маске» к определенной социальной группе. И что, на основании этих алгоритмов выдавать ему бан на посещение каких-то сайтов или ставить его на учет в полиции? 1984 годом прям повеяло.


      1. Color
        29.05.2017 18:16

        Вообще, я за то, чтобы интернет был as-is, и кто не хочет/не может нормально воспринимать то, что там есть, туда и пусть и не лезет. Эх, мечты, мечты...


        А по поводу алгоритма — согласен. Уж очень косвенно это все. Да и, имхо, единственное, что может сказать о человеке, что он, там, наркоман — это заключение медицинской экспертизы. Все остальное — ну разве что рекламу таргенировать, но никак не применять к человеку описанные ограничения. Я даже не буду тут описывать случаи ложных срабатываний, которые вероятно будут происходить. Сама идея применять подобное для дискриминации людей — мрак.


  1. frees2
    29.05.2017 17:18

    Лет 13 назад читал труды московской школы ( Семиотика). Особого труда вычислить пол, возраст, уровень образования нет. Наука позволяет. Только это очень муторно и долго.
    У алкоголиков бывают резкие суждения.

    Один из критериев вычисления хомяков.
    К примеру, на хабрахабре комментируют некоторые товарищи. На вопрос по теме обращаются не к труду, самому исследованию, статье, а к авторитету автора труда.


  1. Loki3000
    29.05.2017 17:31
    +1

    Среди интересов у алкоголиков лидирует фильм «V — значит вендетта»

    О как! Получается что я непьющий алкоголик:)


    1. burundukh
      29.05.2017 17:38
      -1

      и нелюбовь к явлению Squirt ))


    1. Scrblmer
      30.05.2017 12:11
      +1

      Из того что многим алкоголикам нравится «V — значит вендетта» не следует что те, кому нравится этот фильм, являются алкоголиками.


  1. alexhott
    29.05.2017 17:31

    Была такая штука как Яндекс крипта — сейчас попробовал но ссылка уже не работает. Кем тебя считает яндекс — думаю нам просто не показывали, а них скорее всего еще были пункты: Алкоголик, наркоман и тп.


    1. xirahai
      29.05.2017 20:06

      Во вКонтакте например этот вопрос открытым текстом анкетируется:


  1. burundukh
    29.05.2017 17:34

    поздна. этот бы фильтр лет 5 назад, для любителей «покушать та»
    курлык.


  1. LoadRunner
    29.05.2017 17:35
    +5

    курцов табака
    И шнец, и жнец, и табака курец?

    наркоманы любят слушать музыкальные группы Radiohead, The Cure и Depeche Mode
    В отрыве от контекста звучит как аргумент в споре троллей.


    1. sets
      29.05.2017 18:34

      Честно говоря, без отрыва — тоже :)


    1. Pakos
      30.05.2017 11:08

      Видел одно "исследование" по гаданию на кофейной гуще (не прямо гадания, конечно, но достоверность данных была не шибко выше), из него получалось что все наркоманы — люди (или что все люди наркоманы). Проецируя на эту тему — "ненаркоманы" тоже любят их слушать, но в данном срезе чуть меньше и потому их можно внести в таблицу.


    1. ClearAirTurbulence
      30.05.2017 11:26

      курцов табака

      Правильно: Чекуртаб (человек курящий табак)
      Еще есть Чепьювин (человек, пьющий вино).

      А как вы себе продлеваете жизнь?
      — А как вы себе продлеваете жизнь? — заинтересовался я. — Может быть, вы знаете какие-либо старинные лекарства, травы?
      — И лекарство одно знаю, и о смерти и всякой ерунде не думаю, вот и продлеваюсь. А как тебя величать-то?
      — Величать — значит звать, — сказал я. — Меня зовут Матвей Людмилович.
      — А меня — Степан Степанович. Я этих материнских отчеств не признаю, — добавил он с доброй стариковской усмешкой. — Завели новые моды — женские отчества, корабли с парусами, на конях по дорогам скачут… Нет, мне старику, к этим новинкам уже не привыкнуть.
      Окончив свою речь, Смотритель выдвинул ящик стола и вынул оттуда кожаный мешочек и пачечку бумаги.
      — Что это такое? — заинтересовался я.
      — Это кисет, а в кисете — махорка. Самосад.
      — Как, неужели вы Чекуртаб? — изумился я. — И еще в такие годы!
      — Никакой я не Чекуртаб, а просто курящий. Напридумывали словечек!

      — Да ты бери, пей. Как слеза! К своему будущему дню рождения гоню. Выпей ты, а потом и я хватану.
      — Вы — Чепьювин! — воскликнул я. — Как несовместимо это с вашим почтенным возрастом!
      — Пей, — ласково повторил старик. — А то обидишь меня.
      — А вы скажете мне бранные выражения?
      — Скажу, скажу. Только пей. Все скажу.


      1. LoadRunner
        30.05.2017 11:31

        Да, читал я это давно, в детстве ещё. «Девушка у обрыва» Вадима Шефнера, если кому интересно.
        Всё жду, когда же наконец-то аквалид создадут.


      1. MTyrz
        02.06.2017 23:17

        Пионерлагерь и ностальгия!
        Благодарю.


  1. Notzeal
    29.05.2017 17:50
    +1

    судя по выводам, употребляющие алкоголь в разы культурнее курильщиков и наркоманов :)
    пьют для смелости, чтобы обратиться через интернет к даме мечты? :)
    а Т1 и Т9 вообще равны… совпадение? не думаю ©


  1. old_bear
    29.05.2017 18:02

    Ещё одна вариация на тему «особого мнения»: раз специально обученная нейросеть назначила тебя алкоголиком и тунеядцем наркоманом, то всё — обратное уже не докажешь, если только ты не Том Круз.


    1. HiMem-74
      29.05.2017 18:49

      Скоро уже — не поздоровался с ботом при входе в интернет — сразу либо наркоман, либо проститутка. И другим ботам расскажет.


    1. k155la3
      29.05.2017 22:34

      Да. Придётся пить. :)

      … а ведь, возможно, что такой эффект и будет — таргетированная реклама, всё такое…


      1. Notzeal
        30.05.2017 10:44

        как в Блэк Миррор? чтобы отключить рекламу придется не платить, а пить? :)


    1. drafff
      30.05.2017 11:20

      Самое страшное, то чем больше выходит работ по изучению людей (в широком смысле), тем реалистичнее становится ваш комментарий.


  1. Zenitchik
    29.05.2017 18:03
    +1

    А депутатов по их заявлениям можно на наркоманию проверять?


    1. Ugrum
      30.05.2017 11:57

      Нет. Проверялка на такой диапазон не рассчитана, сломается.


  1. Politura
    29.05.2017 19:41

    По частотности употребления слов у зависимых людей чаще встречается брань (fuck, shit).

    Вот не надо всех под одну гребенку, у алкоголиков нет бранных слов в списке, а есть, например, ladies.


  1. densss2
    29.05.2017 19:54
    +2

    а наркоманы любят слушать музыкальные группы Radiohead, The Cure и Depeche Mode.


    Как много я только что узнал о себе…


  1. Max_Spiral
    29.05.2017 19:59

    Интересно, а кто-нибудь знает сколько он сообщений в год печатает.


  1. lash05
    29.05.2017 20:15

    По оценке РБК, здесь 10% населения принимают суррогатные напитки
    — по данной ссылке есть просто утверждение:
    «Боярышник», «паленку» и «незамерзайку» пьют 15 млн россиян.
    — хорошо бы сослаться именно на отчет об обследовании — с указанием методики проведения, сроков, формы…


  1. wych-elm
    29.05.2017 21:50

    ловите_наркомана.jpg


  1. immaculate
    30.05.2017 06:05
    +2

    Как можно узнать статью Ализара с первых слов? «Вероятно, в РФ этот показатель гораздо выше»


  1. VIPDC
    30.05.2017 06:38

    Статья интересная, но вот крутой переход от
    «вероятность курения табака определяется с наибольшей точностью 86%, вероятность употребления наркотиков — 84%, вероятность употребления алкоголя — 81%.»
    к
    "....., результаты анализа лайков и частотности слов у наркоманов и алкоголиков представляют реальный научный интерес"
    Несколько смущает, т, е. система может с очень хорошей вероятностью определять кто употребляет.
    Но вот делать далеко идущие заявления алкоголик, слишком поспешно.

    Мой родственник бывший алкоголик, речь его до и после (как он завязал) на мой субъективный взгляд вообще не отличается.


    1. Deosis
      30.05.2017 08:22

      Скорее они подтвердили утверждение, о том что человек по пьяни может написать фигню.


      1. Notzeal
        30.05.2017 10:46

        к сожалению, фигню в интернете пишут и абсолютно трезвые люди :(

        и почему-то мне кажется, что процент «трезвой фигни» в разы больше, чем «пьяной»


  1. vesper-bot
    30.05.2017 10:04

    По первой же картинке — алкоголики и наркоманы в основном те, у кого есть деньги (money). Похоже на доказательства Капитана Очевидность.


    1. UJIb9I4AnJIbIrUH
      31.05.2017 15:16

      Не обязательно они у них есть. Они их просто обсуждают.


  1. saiscea
    30.05.2017 16:35

    Так вот ты какая, новая френология…


  1. ingegnere
    30.05.2017 17:35

    а потом хомячки спрашивают зачем тебе 4 браузера и почему ты сидиш через андройд в виртуальной машине?


    1. Ugrum
      30.05.2017 17:43

      Ой.


    1. Pakos
      31.05.2017 12:45

      А не-хомячки — что такое "андройд" и как делать "сидиш" без мягкого знака.


  1. Ruslikk
    30.05.2017 20:42

    Полезные советы. Чтобы вас не посчитали алкоголиком, регулярно используйте следующее заклинание:
    «death hear interrog negemo number work»


  1. sic
    31.05.2017 04:48
    +1

    или будет присваиваться особенный значок в профиле


    «Подскажите пожалуйста, я давно употребляю, но все еще не получил значок, а у всех моих друзей он есть, сколько надо употреблять и чего конкретно, а то здоровье кажется не выдерживает, а значок я хочу?!»


  1. mydogandi
    31.05.2017 05:44
    -2

    Вероятно, в РФ этот показатель гораздо выше.

    Ну, вот откуда такая уверенность?! А уж доверять оценкам РБК, это как верить «СМИ» Медуза.


  1. Hoksmur
    31.05.2017 06:33

    Так, вероятность курения табака определяется с наибольшей точностью 86%, вероятность употребления
    наркотиков — 84%, вероятность употребления алкоголя — 81%.

    А каково будет "оправдываться" оставшимся 14%, 16% и 19%, доказывая, что "я не"?


  1. ingegnere
    31.05.2017 15:58

    когда профайлинг автоматизирован с выводом результата в профиль, становиться реально страшно


  1. OlegZH
    31.05.2017 17:34

    Результаты более чем спорные. Их слабое место — это, даже, не пресловутая значимость (даже если её каким-то образом смогли обеспечить), а то, что люди, попадающие в определённую среду, начинают играть по правилам среды. Здесь, по сути, исследуется изменённое сознание. А чистых, «фоновых» объектов для анализа у нас нет. Хотя нам и сообщают, что

    После обучения система смогла с большой точностью предсказывать наличие зависимости у человека независимо от того, проходил ли он психологические тесты. Так, вероятность курения табака определяется с наибольшей точностью 86%, вероятность употребления наркотиков — 84%, вероятность употребления алкоголя — 81%.
    Откуда эти проценты? Про людей заранее было точно известно? (Или я чего-то здесь не понял.)

    И, вообще, вычислять наркоманов по каким-то записям в соцсетях — последнее дело. Их всех надо вычислять исключительно в реальной жизни. Но ещё важнее создавать такие условия, чтобы наркоманов, вообще, не было. И тогда все силы машинного обучения направить на то, чтобы представить себе, например, что мог бы сотворить человек в новой для себя области, где он ещё ничего не сделал, смоделировать это.


  1. msts2017
    31.05.2017 17:58

    Чет РБК загнул, прикинул на свой город, получается очередь за боярышником — 14 человек в час при 16 часовом рабочем дне на точку продажи, точка на каждой второй остановке общественного транспорта.


  1. Keroro
    01.06.2017 06:04

    Забавно конечно. Но всё же, чтобы делать такие далеко идущие выводы о человеке, точность 80% совершенно недостаточная.

    1% женщин в возрасте 40 лет, участвовавших в регулярных обследованиях, имеют рак груди. 80% женщин с раком груди имеют положительный результат маммографии. 9.6% здоровых женщин также получают положительный результат (маммография, как любые измерения, не дает 100% результатов). Женщина-пациент из этой возрастной группы получила положительный результат на регулярном обследовании. Какова вероятность того, что она фактически больна раком груди?

    В случах с приведенной выше задачей большинство врачей оценивают вероятность между 70% и 80%, что совершенно неправильно.

    Правильный ответ — 7.8%


    1. ingegnere
      01.06.2017 09:49

      Статистика вещь интересная но не очень точная, а вот когда по какому то тригеру в Вашем профиле появиться статус хрона или торчка и будет передаваться всем сервисам при каждом запросе это уже печально


      1. sic
        01.06.2017 11:31

        Это социально опасное явление, причем далеко не только для тех, кто поимел «ачивку», а для всех остальных. До сих пор, в среде неведующих бытует мнение, что наркоманы — это те самые ужасные люди из фильмов про наркоманов (и полностью равны отбросам), а если они смогут увидеть, что в реальной жизни довольно многие выглядят не столь плохо, то интерес к веществам только увеличится. Более того, людей может удивить положительная корреляция между уровнем собственности или социальной активностью и употреблением веществ.

        Собственно любая надпись «наркоман» в первую очередь — реклама наркотиков.


        1. MTyrz
          02.06.2017 23:20

          людей может удивить положительная корреляция между уровнем собственности или социальной активностью и употреблением веществ.
          Так вот почему власти борются с наркоманией!
          Не хотят создавать себе конкуренции, точно. Теперь все сходится.


  1. LazyCrazy
    01.06.2017 10:35

    Конечно, можно представить людей, пьющих «боярышник» и сидящих при этом в фейсбуке, но всё-таки это, скорее всего, не самая большая часть как первой группы, так и второй.
    Так что зачем было приплетать «омыватели стекла» и т.п. к обсуждаемой теме, не совсем понятно. Алкоголик остаётся алкоголиком независимо от стоимости потребляемых им напитков.


  1. mindw0rk23
    02.06.2017 12:57

    Я так понял из этой статьи можно сделать вывод, что у наркоманов и алкоголиков гораздо более развитое чувство вкуса и вообще они гораздо более культурные люди чем все остальные. Иначе как обьяснить то, что они больше остальных слушают выдающихся представителей рок индустрии и стараются смотреть общепризнанные шедевры кино?