- Скоро Новый год. Устранить или даже отсрочить это буржуазное явление партия не в силах. А значит, состоится пьянка. И произойдет неминуемое чепе. В общем, пей, Фидель, но знай меру...
- Я меру знаю, - сказал Фидель, подтягивая брюки, - кило на рыло, и все дела! Гужу, пока не отключусь..."
Не могу сказать, насколько сам писатель Сергей Довлатов был любитель выпить, да это и не важно. Но в его прозе алкогольная тема всплывает постоянно, по-разному характеризуя персонажей и происходящие с ними события. Выпивает лагерная охрана в цикле новелл "Зона", пьянствуют сотрудники партийной газеты "Советская Эстония" в собрании журналистских анекдотов "Компромисс". Похоже ведут себя герои других произведений писателя. Эмигранты, заключенные, писатели и поэты иногда напиваются и порой хулиганят. При этом у Довлатова нет очевидно "плохих" персонажей. Можно ли при этом сказать, что с помощью алкогольной темы писатель как-то романтизирует своих героев? Мне стало интересно провести лексико-семантический анализ прозы Довлатова с помощью Python и вычислить, как меняется реальность в рассказах писателя после рюмки-другой. Становится ли мир мягче, тише или гармоничнее?
Я проанализировал эпизоды с упоминанием алкоголя в полном корпусе Довлатова и сравнил, какие слова используются до и после употребления спиртного.
Я собрал полный корпус произведений Довлатова в один файл. Для работы я использовал razdel, библиотеку от команды Natasha, специально созданную для русского языка. Она корректно разбивает текст на предложения и токены, даже в сложных случаях с многоточиями, кавычками и диалогами. Мне пригодился морфологический анализатор pymorphy3, который позволяет привести любое слово к нормальной форме (лемме), например, "выпил"-"выпить", "ощутил"-"ощутить", так как без лемматизации можно упустить многие формы слов.
pandas, matplotlib, seaborn помогли мне легко сравнивать частоты и строить наглядные графики.
При этом я сознательно отказался от такого удобного средства, как нейросетевые сентимент-анализаторы, например Slovnet. Нейросетевые модели, обученные на прямолинейных текстах (рецензии, соцсети), не распознают иронию как отрицание позитивной тональности. Именно для анализа текстов Довлатова такое решение не подойдет. Цель моего анализа не в том, чтобы определить хорошо герою после рюмки или плохо. Я хочу зафиксировать качественные изменения в восприятии – визуальные, аудиальные и когнитивные. Эти описания часто нейтральны по тональности, но богаты семантикой восприятия. Нейросетевые сентимент-анализаторы работают на уровне предложения или фразы, не устанавливая дискурсивных связей между событиями.
Чтобы проверить свою гипотезу, я нашел все эпизоды, где вообще описывается алкоголь и его принятие. Я задал список ключевых слов "выпил", "водка", "пьяный" и т.д. Через pymorphy3 получил их леммы и искал в каждом предложении. Если лемма найдена — это "алкогольное" предложение.
alcohol_words = ['выпил', 'выпить', 'водка', 'пьяный', 'опохмел', 'запой', 'бутылка']
alcohol_lemmas = {morph.parse(w)[0].normal_form for w in alcohol_words}
Для каждого такого предложения я взял три предложения до и после. Это дало мне "окно восприятия": что герой видел, слышал или чувствовал непосредственно до и после употребления.
def get_context_windows(sentences, condition_func, window=3):
contexts = []
for i, sent in enumerate(sentences):
if condition_func(sent):
before = sentences[max(0, i - window):i]
after = sentences[i + 1:i + 1 + window]
contexts.append((sent, " ".join(before), " ".join(after)))
return contexts
def is_alcohol_sentence(sent):
words = [t.text.lower() for t in tokenize(sent) if t.text.isalpha()]
lemmas = [morph.parse(w)[0].normal_form for w in words]
return any(l in alcohol_lemmas for l in lemmas
Далее я стал искать перцептивные глаголы, то есть глаголы восприятия "увидел", "почувствовал", "услышал". Только в их окрестности я считал описание мира субъективным и значимым. Это исключило случайные совпадения.
Я создал три тематических словаря:
Визуальный: "размытый", "нежный", "тёплый", перечислил, что относится к зрительному образу.
Аудиальный: "гул", "мерный", "тихий", описал звуковую среду.
Эмоциональный: "любовь", "тревога", "гармония", то есть внутреннее состояние.
Каждое слово из этих списков лемматизировал, чтобы ловить все формы.
def extract_percept_descriptions(context_text):
tokens = [t.text.lower() for t in tokenize(context_text) if t.text.isalpha()]
lemmas = [morph.parse(w)[0].normal_form for w in tokens]
percept_positions = [i for i, l in enumerate(lemmas) if l in percept_lemmas]
descriptions = {'visual': [], 'auditory': [], 'emotional': []}
for pos in percept_positions:
start = max(0, pos - 5)
end = min(len(lemmas), pos + 6)
window_lemmas = lemmas[start:end]
for l in window_lemmas:
if l in visual_lemmas:
descriptions['visual'].append(l)
elif l in auditory_lemmas:
descriptions['auditory'].append(l)
elif l in emotional_lemmas:
descriptions['emotional'].append(l)
Что же показал мой анализ?
Я нашел 439 эпизодов, где персонажи выпивают. Однако перцептивные описания оказались крайне редки. Довлатов не использует шаблонные метафоры вроде "мир стал мягким". Его герои скорее действуют, чем рефлексируют.
Тем не менее, я получил два значимых сигнала. Слово "тёплый" появляется только после употребления алкоголя. Это не так удивительно, и может указывать на физическое ощущение тепла, классический эффект этанола. Но если посмотреть на второй вывод анализа, восприятие этого результата изменится.
Слово "любовь" также встречается только в "пьяных" контекстах. Это подтверждает мою догадку - алкоголь у Довлатова это катализатор откровенности и эмоциональной близости.

При этом аудиальных описаний нет вообще. Ни "гула", ни "тишины". Это важный вывод: у Довлатова звуковой фон мира не меняется под действием алкоголя, меняется только внутреннее состояние героя.
С помощью этого анализа я опроверг свою гипотезу о том, что алкоголь у Довлатова романтизирует героев. В прозе этого писателя нет ни праведников, ни негодяев. У Довлатова алкоголь не побег от реальности, а способ её переосмыслить, пусть и на короткое время.
YukiSidorov
Во первых строках сия исследования, автор признается о незнании отношения Довлатова к употреблению алкоголя. А стоило бы! Это был запойный алкоголик, которому врачи уже строго запрещали уходить на недели в запой. Но это его не останавливало, так и помер в собственной блевотине, в машине скорой помощи, когда его пытались спасти в очередной раз. Литературное наследие - так себе, зато в Москве(может ещё где) есть рюмочные "Довлатов".
andrey-orlouv
Да, "а кто не пьёт?! назови! нет, я жду!" (с) Но его книги прочитал все с большим удовольствием, единственное, книги, которые были написаны в Нью-Йорке уже, довольно мрачноваты и пронизаны какой-то тоской и неустроенностью...
YukiSidorov
Да, временами забавное чтиво, умел подбирать слова и строить фразы, дружил с юмором. А вот сюжеты - шлак, высосаны из пальца. Американский период вообще отстой, ничего маломальски интересного не создал, сплошное преклонение перед дядей Сэмом.
akardapolov
Алкоголизм - это болезнь.
Eco_coder Автор
Хорошо, что есть люди, так близко знакомые с недугами писателя, которого нет в живых 35 лет!
YukiSidorov
Трудно не знать о недуге автора, который только об этом и пишет.