Что могут сказать цифровые технологии о литературе? Исследователь литературы — это человек с богатым опытом чтения, чуткий к проявлениям индивидуального авторского стиля и играм с жанровыми конвенциями. Литературовед работает с очень небольшой (относительно всего количества издаваемых книг) выборкой текстов. Цифровые исследования же работают с несравненно бо́льшими массивами текстов. Но не грозит ли это увеличение масштаба опасностью упустить детали и нюансы? Как сочетать филологическую «въедчивость» и широкий охват?
В исследованиях литературной научной фантастики цифровой анализ стал активно применяться в 2010-х годах, однако первые попытки применить компьютерный анализ к этому жанру можно обнаружить ещё в конце 1990-х годов.
В 1998 году учёные Эрик Рабкин и Карл Саймон в Центре по исследованию сложных систем Мичиганского университета запустили «Проект изучения эволюции жанров» (Genre Evolution Project). Целью проекта было создание базы данных научно-фантастических рассказов с 1926 по 1999 год. Она должна была решать сразу несколько задач: во-первых, искать корреляции между литературными текстами и социальным контекстом, и, во-вторых, стать фундаментом для переосмысления всей истории жанра (как минимум, пересмотреть ряд устоявшихся мифов о жанре).
При верно заданных параметрах база позволяла установить взаимосвязь между, например, полом автора и текстовыми характеристиками его произведений. Так, выяснилось, что одно из общих мест в истории жанра, а именно утверждение, что в 1960-е годы произошёл всплеск публикационной активности женщин-фантастов — не более чем миф. Оказалось, что женщины публиковали научную фантастику уже в 1920-х годах. Да, их число увеличивалось, но не резкими скачками, как утверждали историки до этого, а постепенно. В качестве «побочных» результатов анализа зависимости гендера и текста были получены следующие выводы: рассказы женщин в среднем короче, чем рассказы мужчин; у женщин-писательниц главные герои мужчины и женщины появляются с одинаковой частотой, а мужчины пишут в основном только про мужчин.
Возрождение интереса к компьютерным исследованиям научной фантастики произошло в 2010-е годы. В более новых работах акцент делается на составление лингвистического профиля жанра.
В статье «К науке о научной фантастике» («Towards a Science of Science Fiction», 2014) команда учёных (Райан Николс, Джастин Линн и Бенджамин Грант Пуржыцки) решила проверить каноническое определение научной фантастики как литературы «когнитивного остранения», которое было предложено ещё в 1970-е годы канадским учёным Дарко Сувиным.
Учёные работали со сборниками научной фантастики («The Year’s Best Science Fiction», 1999—2007), фэнтези («The Year’s Best Fantasy», 2001—2009) и мистики («The World’s Finest Mystery and Crime Stories», 2000—2003). Тексты из антологий загружались в программу «Linguistic Inquiry and Word Count» (LIWC), которая распределяла лексику по категориям: например, слова, относящиеся к познавательным процессам («думать», «знать»), обозначающие социальные отношения («семья», «дом», «друг»), восприятие («слышать», «видеть») и т.д.
В результате исследования выяснилось, что определение Сувина верно: в научной фантастике используется больше слов, обозначающих когнитивные процессы, чем в мистике и фэнтези.
Может показаться, что учёные обнаружили очевидное, «открыли» то, что всем и так было известно уже последние 40 лет. Но авторы, предугадывая такую критику (к слову, это общий упрёк, который предъявляют почти всем современным цифровым исследованиям литературы), заявляют: на основании точного подсчёта они подтвердили «гипотезу», которую Сувин в своё время сформулировал, руководствуясь лишь интуицией.
В качестве ещё одного упрёка авторам можно указать на очень узкие рамки исследования — и с точки зрения рассматриваемого периода, и с точки зрения материала. Коль скоро новые технологии позволяют работать с большими объёмами информации, то временной охват мог бы быть больше восьми лет, и текстов — не только по трём сборникам.
Интереснее и по предлагаемой гипотезе, и по подходу, и по материалу исследование 2016 года учёного из Иллинойского университета Теда Андервуда. Результаты работы были опубликованы в статье «Жизненные циклы жанров» («The Life Cycles of Genres», 2016).
В отличие от предыдущей группы учёных, Тед Андервуд отталкивался от идеи, что жанр — это не только и не столько лингвистическое явление, сколько социальное, а значит, у жанра нет одного «правильного» определения, к одному жанру в разных контекстах (временных и культурных) могут относится разные тексты. Таким образом, задача, которую перед собой ставил учёный, заключалась в том, чтобы создать прогнозирующую модель, которая воспроизводила бы, как научная фантастика опознаётся различными «историческими наблюдателями» (писателями, читателями, критиками, составителями антологий и т.д.). Иными словами, Андервуд создал программу, которая на основании лингвистических характеристик загружённых в неё текстов (которые в библиотечных описаниях и библиографических списках помечены как «science fiction») определяет, с какой степенью вероятности проверяемый текст может быть опознан как научно-фантастический.
Всего Андервуд проанализировал около двухсот томов произведений, датируемых с 1771 по 1989 годы:
По скоплению красных точек в периоде с 1900 по 1950-е годы видно, что тексты именно из этого временного промежутка опознаются программой как научно-фантастические с наибольшей вероятностью. Анализ показал, что с точки зрения языка научная фантастика — стабильный жанр. «Франкенштейн» Мери Шелли, романы Жюля Верна и современные научно-фантастические романы, безусловно, сильно отличаются по стилю и содержанию, но, как показало исследование, они схожи по лексическому составу: в них используются слова, обозначающие большие размеры («обширный», «громадный» и др.), большие числа («тысячи»), слова «человек» и «существо» часто используются вместе, часто употребление притяжательного местоимения «its» и т.д.
Таким образом, события, которые историки жанра обычно выделяют как значимые «рубежи» (написание «Франкенштейна», «Машины времени», появление специализированных журналов и т.д.), как выяснилось, не оказывали заметного влияния на лингвистический профиль жанра. А это значит, что всю историографию научной фантастики необходимо пересмотреть.
Последнее обобщение, по-видимому, самому Андервуду показалось слишком смелым, и в конце статьи он осторожно добавляет: может быть, конечно, модель и неверна, но очевидно, что применение новых цифровых технологий заставляет нас по-новому взглянуть на привычные утверждения и их переосмыслить.
Научный и эвристический потенциал цифровых подходов в научной фантастике очевиден, но — по крайней мере, пока — результаты компьютерного анализа нуждаются в культурологическом и филологическом комментарии. Да, точные подсчёты разрушают миф, скажем, о месте женщин-писательниц в истории жанра, но это только повод перечитать их произведения с учётом нового понимания контекста. Однако совершенно очевидна прикладная ценность таких исследований: программа распознавания жанра, несомненно, полезна при составлении библиотечных каталогов и библиографических списков, основанных на чётких критериях отбора.