Главстраница / Софт / Всамделишний гипертекст
ТОСТЕР
КТО МЫ?Написать письмо

Всамделишний гипертекст

Д. К.

«Анализировать художественные произведения — дело не для примитивных компьютерных мозгов», — уверен, наверное, каждый наш читатель. Тот, кто недавно поступал в высшее учебное заведение, впрочем, может резонно возразить: написание вступительного сочинения на отлично — задача вполне алгоритмизуемая и относительно примитивная. Так-то оно так, но мы говорим о настоящем анализе художественного текста, который ничуть не легче, чем собственно его написание. Тут уже компьютеру делать нечего.

Что ж, тем приятнее видеть разработку, которая, хоть сочинений и не пишет, но крайне удачно использует возможности ЭВМ для анализа текстов. Программа называется TextArc, и с ее автором — дизайнером и программистом Брэдфордом Пэйли (Bradford Paley) — мы уже однажды неявно встречались. Он написал один из апплетов, представленных на CODeDOC'е — тот, который подсвечивал свой собственный текст по мере выполнения.

TextArc использует тот же подход. Апплет берет какую-нибудь книгу и для начала выводит весь текст целиком по кругу буквами высотой в один пиксель. Читать его в таком виде, разумеется, невозможно, но это и не требуется. Затем TextArc составляет полный список употребленных в тексте слов и выводит их все внутри получившегося круга, располагая каждое слово так, как будто оно привязано на «пружинках» к местам своего появления в книге. Таким образом, слова, встречающиеся только однажды, расположатся по концентрическому внутреннему кругу, а имя главного героя, надо полагать, попадет в самый центр. Наконец, чем больше раз употреблено слово, тем сильнее оно подсвечивается.

«Алиса в стране чудес», выделено слово «грифон».

Апплет требует огромного количества вычислительных ресурсов и на медленных компьютерах будет работать плохо. Тем не менее, не упустите случая поиграть с ним, например, на примере «Алисы в стране чудес» или «Гамлета» (тексты, кстати, берутся из известного проекта «Гутенберг») — это невероятно занимательно. При нажатии на любое слово TextArc отображает все упомянутые «пружинки», которые связывают его с упоминаниями в тексте. Есть и другие возможности: можно увеличивать отдельные строчки текста или изучать связи между словами по тому, насколько часто они идут друг за другом.

Кроме всего прочего, в TextArc'е получаются очень красивые картинки. На сайте можно скачать pdf с огромным изображением, в котором при достаточном увеличении можно даже читать основной текст, расположенный по кругу. Настоящие ценители могут заказать постер за 50 долларов или же здоровый плакат, отпечатанный с максимальным качеством, на котором, вооружившись лупой, тоже можно различить основной текст, — но уже за несколько тысяч.

«Алиса в стране чудес», выделено слово «Алиса».

Сам Пэйли называет свое творение «игрушкой». Игрушка эта, однако, иногда позволяет делать какие-то выводы о рассматриваемой книге, причем порой весьма нетривиальные. Во-первых, она сохраняет графическую форму текста — стихотворение в виде мышиного хвоста, например, различимо даже на приведенном здесь сильно уменьшенном изображении. Во-вторых, одного взгляда на диаграмму достаточно, чтобы понять, какие слова играют центральную роль в повествовании: на втором месте у Кэролла (после очевидного слова «Alice») идет «know» — что уже любопытно. Чеширские коты, Шолтаи-Болтаи и прочие второстепенные персонажи, хоть и подсвечены довольно ярко, но расположены вдали от центра.

В интервью New York Times Пэйли рассказал, что сравнил как-то в TextArc'е «Дракулу» Стокера и «Франкенштейна» Шелли. В первой книге несколько ключевых слов расположились в самом центре; во второй — несколько дюжин самых ярких слов образовали окружность приличного радиуса. «Я не читал ни тот, ни другой роман, — заявил Пэйли, — но сразу понял, что «Франкенштейн» намного глубже и метафоричнее». Мы тоже не читали, но знающие люди утверждают то же самое.

Редакция «Тостера» играет с TextArc'ом уже полдня и находится в полном восхищении. К сожалению, система пока не позволяет работать с книгами на русском языке, а то было бы еще интереснее. Мы бы, например, очень хотели взглянуть на диаграмму, полученную из «Николая Николаевича». Даже, может быть, заказали бы постер.


Читать комментарии
Всего комментариев: 5, непрочитанных: 5
Copyright  ©  2001—2004 «Тостер»