Исследователи изучили тексты более 1700 романов и обнаружили, что все их можно отнести к 6 сюжетным типам.


В своей лекции 1995 года американский романист Курт Воннегут рисовал на доске различные сюжетные линии, по ходу повествования иллюстрируя изменение положения главного героя по шкале «хорошо-плохо». Среди сюжетов были «загнанный в угол человек», в рамках которого главный герой попадает в беду и в итоге выбирается из нее, а также «парень добивается девушки», где герой получает нечто чудесное, теряет это и снова находит в конце. «Нет никаких препятствий к тому, чтобы загружать простые формы историй в компьютер, — заметил Воннегут. — Это прекрасные формы».

Благодаря новым технологиям интеллектуального анализа люди решили эту задачу. Профессор Мэтью Джокерс из Университета штата Вашингтон, а позже и исследователи из лаборатории компьютерных историй Вермонтского университета проанализировали тексты тысяч романов и выявили шесть основных типов историй — архетипов, — представляющих собой базовые структурные блоки для построения более сложных сюжетов. Вермонтские исследователи описали эти шесть форм повествования, лежащих в основе 1700 английских романов, следующим образом:

1. «Из грязи в князи» — постепенное улучшение положения от плохого к хорошему.
2. «Из князи в грязи» — падение от хорошего положения к плохому, трагедия.
3. «Икар» — взлет и падение.
4. «Эдип» — падение, взлет и снова падение.
5. «Золушка» — взлет, падение, взлет.
6. «Человек, загнанный в угол» — падение и взлет.

Исследователи применили анализ эмоциональной окраски — статистическую методику, часто используемую маркетологами для оценки публикаций в социальных СМИ. В ее рамках каждому слову на основе краудсорсинговых данных назначают определенные «очки тональности». В зависимости от выбранного лексикона слово попадает в категорию положительных («счастье») или отрицательных («печаль»), или оно может быть ассоциировано с одной из восьми не столь однозначных эмоций, например, страхом, радостью, удивлением или предчувствием.

К примеру, прилагательное «счастливый» имеет положительную окраску и ассоциируется с радостью, доверием и предчувствием, а глагол «искоренять» имеет отрицательную окраску и ассоциируется со злостью.

Примените эмоциональный анализ ко всем словам в романе, поэме или пьесе, отобразите результаты на шкале времени, и вы сможете проследить изменения настроения по ходу текста в виде некой линии — тональности повествования.

Несмотря на несовершенство этого подхода, рассматривающего каждое слово отдельно от контекста, он позволяет получить на удивление интересные результаты при анализе больших объемов текста. Наглядный пример можно найти в блог-посте ученого-информатика, применившего машинный анализ к романам Джейн Остин.

Инструменты для проведения анализа эмоциональной окраски находятся в свободном доступе, а бесплатно распространяемые литературные издания можно скачать из онлайн-репозитория Project Gutenberg. Ниже приведен анализ некоторых горячо любимых читателями произведений из опроса BBC «100 историй, сформировавших наш мир», в которых авторы попытались обнаружить шесть описанных выше типов сюжета.

«Божественная комедия» (Данте Алигьери, 1308–1320)


Тип истории: «из грязи в князи»


График построен Мириам Квик с помощью языка R и пакетов Syuzhet, Tidytext и Gutenbergr. Данные на всех графиках сглажены.

Структурированная и симметричная эпическая поэма Данте показывает его воображаемое путешествие в преисподнюю в компании, как вы думаете, кого? Конечно, поэта Виргилия. Отрицательная тональность произведения усугубляется по мере того, как дуэт проходит один круг ада за другим. В этой ситуации есть некоторая схожесть с типом сюжета «Человек, загнанный в угол».

Пережив ад, герои взбираются на гору Чистилище, где обитают отлученные от церкви, похотливые и ленивые души. Беатриче, умершая возлюбленная Данте, заменяет Виргилия и становится спутником Данте. Восхождение пары в рай в третьей части произведения отмечено нарастающей радостью, связанной с тем, что поэт начинает понимать истинную природу добродетели, а его душа становится едина с «любовью, движущей солнцем и звездами».

«Мадам Бовари» (Гюстав Флобер, 1856)


Тип истории: «из князи в грязи»



В истории Флобера о скучающей и неверной домохозяйке есть момент, когда героиня Эмма Бовари приходит к выводу, что раз уж до сего момента жизнь ее была так плоха, то оставшаяся часть наверняка должна оказаться лучше.

Но на деле все оказывается не так. Ее ждет череда неудачных и отчаянных романов, позволяющих ей лишь ненадолго отвлечься от утомительного бытия супруги самого скучного человека на свете. Она накапливает огромные долги и совершает самоубийство, выпив мышьяк. Скорбящий муж узнает о ее многочисленных изменах и несколько позже умирает. Их осиротевшая дочь отправляется жить со своей бабушкой, которая тоже вскоре отдает господу душу. Далее девочка попадает к своей бедной тете, которая отправляет ее работать на прядильную фабрику.

Это образец хрестоматийной трагедии, развитие событий которой направлено на достижение безжалостной конечной цели тотального падения.

«Ромео и Джульетта» (Уильям Шекспир, 1597)


Тип истории: «Икар»



«Ромео и Джульетту» принято считать трагедией в соответствии с описанием самого Шекспира. Но анализ эмоциональной окраски произведения позволяет отнести его скорее к типу «Икар» (взлет и падение). Ведь сначала молодой человек встречает девушку и влюбляется в нее, а уж только потом им суждено потерять друг друга. Пик романтического настроения приходится примерно на первую четверть длины пьесы — это знаменитая сцена под окном Джульетты, в которой герои клянутся друг другу в любви и верности.

С этого момента начинается стремительное падение. Ромео убивает Тибальта и бежит. Брат Лоренцо планирует помочь Джульетте тайком бежать и этим создает ложный всплеск надежды, однако, как только она выпивает снадобье, трагический финал становится неизбежен.

«Гордость и предубеждение» (Джейн Остин, 1813)


Тип истории: «Человек, загнанный в угол» или «Золушка»



Первая половина романа Остин представляет целую череду балов, веселья (пусть и сдержанного), остроумия и несерьезных предложений руки и сердца из уст героев вроде комичного викария мистера Коллинза. Ситуация становится мрачнее вместе с отъездом Бингли, когда у Элизабет складывается ошибочное плохое впечатление о Дарси. Явно негативным эмоциональный фон романа становится после провального предложения руки и сердца от Дарси. Пик отрицательных эмоций приходится на побег Лидии с неблагонадежным Уикхемом. Это, разумеется, дает Дарси возможность проявить себя. И он достойно и уверенно ей пользуется, покоряя сердце Элизабет. Повествование счастливо завершается, и каждый герой становится чуточку мудрее, чем он был сначала.

«Франкенштейн, или Современный Прометей» (Мэри Шелли, 1818)


Тип истории: «Эдип»



Новаторский роман Шелли — это ужасающая история чудовищного создания Виктора Франкенштейна, рассказанная со слов самого Виктора капитаном Уолтоном в форме переписки со своей сестрой. В один прекрасный момент чудовище берет повествование на себя, превращая роман в связку вложенных друг в друга историй. Эта часть предлагает читателю немного отдохнуть от так хорошо начавшейся, но постоянно ухудшающейся ситуации. Примерно две трети романа спустя наступает переломный момент, когда чудовище предлагает Виктору выход, — создать ему спутницу женского пола. Однако Виктор отказывается, и с этого момента его судьба предрешена. «Запомни, я приду к тебе в твою брачную ночь», — угрожает создание. Так оно и случается.

«Гадкий утенок» (Ханс Кристиан Андерсен, 1843)


Тип истории: комбинированный



Наиболее короткая в выбранной группе историй, знаменитая сказка Ханса Кристиана Андерсена отличается при этом самой сложной структурой. В ней есть два сюжета: «человек (утенок), загнанный в угол», вложенный в общую, более глобальную историю типа «из грязи в князи». Ситуация утенка в ходе повествования постепенно улучшается, но происходит это не линейно, а в рамках череды взлетов и падений. Сначала он вылупляется (взлет), но подвергается травле из-за своей непохожести (падение). Он узнает, что умеет плавать лучше других уток, и испытывает ощущение родства, когда видит группу пролетающих над ним лебедей (взлет), но после чуть не умирает холодной зимой (падение). В конце концов, утенок превращается в лебедя, как и ожидалось с самого начала. В этом, конечно, и была суть рассказа: лебедь остается лебедем, даже если его яйцо высидела утка на ферме. История завершается на самой высокой ноте. Повзрослевший лебедь радостно признается, что «даже и мечтать не мог о таком счастье».

image

Комментарии (34)


  1. Pochemuk
    01.11.2018 16:57
    +3

    Слышал, что все произведения кинематографа сводятся по сюжету к семи сказкам Шарля Перро. Не помню точно к каким, но «Золушка» среди них — наиболее часто встречающаяся.

    Ну иногда еще «Золушок» встречается.


    1. LonerD
      01.11.2018 17:58
      +1


    1. MockBeard
      02.11.2018 12:50

      все истории укладывается в одну структуру, гугли «мономиф»


  1. lair
    01.11.2018 17:36
    +8

    Ай, молодцы: свести сюжет к эмоциям (emotional arcs, если быть точным), и на этом основании сказать, что есть всего шесть сюжетов.


    1. InstaHeat
      01.11.2018 17:40
      +3

      это обычная типология, и достаточно древняя. есть несколько авторов, у которых разное количество сюжетов, вплоть до 36. не пойму вот только почему этот текст оказался на хабре, а не в каком-нибудь паблике контакта или развлекательном сайте


      1. ALF_Zetas
        01.11.2018 22:00
        +1

        ru.wikipedia.org/wiki/Тридцать_шесть_драматических_ситуаций
        но в наше время в связи с компьютерами и космосом еще несколько ситуаций добавилось


      1. Occama
        02.11.2018 16:17

        Ну так корпоративный блог сам себя не заполнит


    1. 0xd34df00d
      01.11.2018 17:58
      +1

      А это скорее к вопросу о том, зачем мы читаем художественную литературу.


      1. lair
        01.11.2018 18:02

        Я сильно подозреваю, что на этот вопрос не будет единого ответа.


      1. jrthwk
        01.11.2018 19:08
        +4

        Для развлечения, естественно.

        зы Сюжетов вообще только три — «про любовь», «про индейцев» и «про новый год».©нар. мудр.


        1. stranger777
          03.11.2018 13:12

          Для развлечения может читаться беллетристика (массовая литература, лёгкое чтиво), а есть т.н. «высокая литература», поднимающая актуальные проблемы общества, заставляющая задуматься, сделать выводы и, возможно, изменить жизнь. Достоевского крайне трудно назвать развлекательным.
          Аналогично с ПО. Есть Pacman, а есть компьютерное зрение, указывающее на возможные локализации опухолей по снимкам.


          1. jrthwk
            03.11.2018 14:44
            -1

            Серьезная, полезная литература, при чтении коей думаешь и делаешь выводы и меняешь жизнь — это учебники, справочники, руководства, инструкции, уставы, кодексы и прочеее подобное, что несет объективно-полезную информацию, может быть проверено, оценено и использовано.

            А худлит, весь, без разделения — это исключительно развлекательная литература. Одни развлекаются читая про попаданцев-нагибаторов, другие развлекаются читая шизу достоевского. Объективно же занятия эти абсолютно равнозначные.

            Популярный же тезис про разницу между «легким читвом» и «высокой литературой» — он не более чем проявление человеческого стремления к статусности. Кто-то понтуется новым айфоном, кто-то знакомством с литературой «недлявсех», и то и другое одинаково благодатно для понтов в силу того что критерии крутости понта задаются самими понтующимися.


            1. Sirion
              03.11.2018 15:11
              +1

              Ну вы же глупости говорите. Думаю, число людей, изменивших свою жизнь благодаря чтению инструкций, если и не равно нулю, то пренебрежительно мало.

              Я почерпнул знания матана из курса лекций Архипова-Садовничего-Чубарикова. Но я не стал бы изучать матан, если бы не «Магистр Рассеянных Наук». Я учился программировать по справочнику «Turbo Pascal 6». Но я не стал бы учиться программированию, если бы не «А я был в компьютерном городе». Физика и химия? Жюль Верн. Биология? Сетон-Томпсон. Если так задуматься, корни моего интереса практически к любой области знаний лежат в художественной литературе.

              Это только первый пришедший мне на ум аргумент. Самый близкий, самый очевидный. Важность художественной литературы не исчерпывается мотивацией к чтению технической. Она в принципе содержит огромный пласт знаний у мире, который упихать в формат справочника, во-первых, проблематично, а во-вторых, никто бы эти справочники не стал читать. И этот пласт в конечном итоге более важен, чем всё, что можно найти в учебниках.

              З.Ы. Разделяю вашу нелюбовь к Достоевскому и фэнтези про попаданцев. Слава Господу Маловероятному, что ими мир художественной литературы не ограничивается.


            1. lair
              04.11.2018 02:01

              А худлит, весь, без разделения — это исключительно развлекательная литература. Одни развлекаются читая про попаданцев-нагибаторов, другие развлекаются читая шизу достоевского. Объективно же занятия эти абсолютно равнозначные.

              Это в том смысле, что вы не знаете, какой объективный критерий найти для измерения "развлекательности" литературы, и поэтому считаете ее одинаковой?


            1. stranger777
              04.11.2018 11:19

              То есть ни одна прочитанная художественная книга на вас никак не повлияла? Ни один стих ни на что не вдохновил? Но даже если и так с Вами, то это не значит, что с остальными так же.
              Писателей, «больших», великих не просто так называют инженерами человеческих душ. Не просто так запрещают «Майн Кампф» (художественных книг это тоже касается, в Китае как-то запретили «Алису в стране Чудес», чтобы «плохо» не влияла на юные китайские умы.)


  1. Bhudh
    01.11.2018 18:03
    +1

    Иногда лучше переводить Гуглом.

    А иногда нет: «1700 English novels» это явно не «1700 английских романов», или я что-то не знаю об авторах первых двух рассмотренных в статье произведений…


  1. PerlPower
    01.11.2018 18:34
    -3

    Битва физиков и лириков снова начинается! Физики прощупывают почву делая изящный ход под себя. Смогут ли ли лирики выдать достойный ответ? Нечто настолько же несуразное, но проистекающее из из еще худшего понимания работы компьютеров чем у физиков? Схватка будет жаркой!


  1. Sirion
    01.11.2018 19:24
    +17

    А если взять цифровую копию романа и применить XOR ко всем её нуликами и единицам, то — о чудо! — обнаружится, что все романы делятся на два фундаментальных типа. Из этого следует масса глубоких выводов, но это не точно.


  1. hdfan2
    01.11.2018 19:42
    +1

    Ну вот, взяли и всю литературу к синусоидам свели.


  1. third112
    01.11.2018 20:20
    +2

    Исследователи применили анализ эмоциональной окраски — статистическую методику, часто используемую маркетологами для оценки публикаций в социальных СМИ. В ее рамках каждому слову на основе краудсорсинговых данных назначают определенные «очки тональности».


    М.б. я чего не понял, но возник вопрос: а если такой анализ к учебнику матана применить, что будет?


    1. dimkss
      01.11.2018 20:41

      Белый, или серый шум?


    1. 0xd34df00d
      01.11.2018 21:23
      +3

      Большая печаль в районе теоремы об обратной функции. Или о неявной.


      1. Sirion
        01.11.2018 21:33
        +7

        О да. Кто не плакал на этом моменте, у того нет сердца.


        1. third112
          02.11.2018 01:58

          О, да, да. И я плякал :)))


      1. third112
        02.11.2018 01:57
        -2

        Спасибо! на +1 не хватает кармы, поэтому тройной смайлик :)))


    1. hdfan2
      02.11.2018 16:13

      М.б. я чего не понял, но возник вопрос: а если такой анализ к учебнику матана применить, что будет?

      image


  1. tushev
    01.11.2018 21:41

    Утверждают что почти все популярные истории, мифы, сказки, легенды, фильмы, книги вообще сводятся в одной и той же сюжетной линии если снять с нее внешнюю оболочку. Причем это не зависит от страны, времени и культуры. Подробнее в Википедии по слову «Мономиф»


  1. FransuaMaryDelone
    02.11.2018 06:56
    +1

    дело видимо не в количестве сюжетов, а в попытке «научить чему-нибудь компьютер». Вся затея выглядит как спекуляция, хотя всем как всегда «плевать», лишь бы выглядело наукообразно.


  1. JuniorNoobie
    02.11.2018 07:11
    +1

    Вообще, похоже на правду. Может сюжетов и не шесть штук, но конечное количество. Разнообразие достигается лишь комбинированием ситуаций. Воображение человека вообще устроено так, что чего-то нового он самостоятельно открыть не может, только скомбинировать уже известные ему факты. Или позаимствовать у природы, предварительно выделив паттерн, который сможет использовать. В современном мире, особенно в литературе, очень сложно удивить читателя.


    1. Katemare
      02.11.2018 14:40
      +1

      Я сторонник эволюционной теории развлечений (по ссылке начинать читать с «Я рассуждаю так»), которая говорит о том, что истории имеют биологически обоснованный гипнотический эффект, потому что через них мы учимся. Таким образом, форматов истории может быть хоть 6, хоть 36, или два, или даже один, как подсказывают выше. Но разнообразие базируется на разнообразии уроков. А уроки у людей могут быть самые разные.

      История про то, что труд приводит к успеху — одна, что хитрость приводит к успеху — другая, а что не в успехе счастье — третья. Это совершенно разные уроки. Истории про то, что соцсети — чудо, подымающее цивилизацию, и что соцсети — ужас, который уничтожит цивилизацию, это две разные истории и обе новые, которые не могли быть рассказаны век назад; даже если у них один формат, то, что в посте назвали «сюжетом».


  1. parotikov
    02.11.2018 09:42
    +1

    Борхес считал, что есть 4 типа сюжетов:
    осада/оборона, дорога, поиски, самоубийство бога


  1. lgorSL
    02.11.2018 10:43
    +3

    А я слышал, что графики уравнений третьей степени и ниже можно отнести к конечному количеству типов.


    • функция монотонная (растёт, убывает или константа)
    • функция убывает, а потом возрастает.
    • функция возрастает, потом убывает.
    • функция возрастает, убывает и снова возрастает
    • функция убывает, возрастает и снова убывает

    Прочие более-менее гладкие функции можно интерполировать кубическим сплайном — т.е., свести к комбинации полиномов третьего порядка.


    Не, ну серьёзно — при взгляде на эти плавные красивые графики возникает ощущение, что их строили по очень малому количеству опорных точек. (Кроме последних двух) Можно сделать какие-то предположения о схожести/различности произведений, но не более того.


    Вдобавок, в книге могут переплетаться несколько сюжетных линий, и эмоциональный окрас каждой может быть своим. Например, один гг скатывается, второй в это время возвышается, про третьго автор вообще на какое-то время забыл. Можно происходящие события описывать не в хронологическом порядке. В этих случаях метод с графиками по пяти-шести точкам окажется довольно бесполезным.


  1. ibakhtin
    02.11.2018 19:04

    Глядя на графики вспоминается:

    Бывает все так классно!
    Так классно прямо все!
    Потом — бабах! — ужасно,
    Ужасно стало все…


  1. VT100
    03.11.2018 18:29

    Ну и, до кучи, можно вспомнить «Указатель сказочных сюжетов по Аарне». Там, ЕМНИП, — несколько десятков.

    А сама статья напоминает известную картинку.

    Правда и Истина
    image