Анатолий Анисимов - Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык

Скачивание начинается... Если скачивание не началось автоматически, пожалуйста нажмите на эту ссылку.
Жалоба
Напишите нам, и мы в срочном порядке примем меры.
Описание книги "Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык"
Описание и краткое содержание "Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык" читать бесплатно онлайн.
На основе алгоритмического анализа исследуются литературное творчество, структуры естественного языка и мышление человека. Системный подход применяется для анализа мифов, лингвистических схем, снов, предложений и систем искусственного интеллекта. Особое внимание уделяется рекурсии как специальному алгоритмическому способу организации сложных систем. Рассматриваются примеры рекурсии в литературе, языке, в формировании психической деятельности человека.
Для широкого круга читателей, интересующихся современными достижениями информатики, лингвистики и искусственного интеллекта.
Таким образом, управляющее пространство предложения строится как система вложенных структур, состоящих из точек с а — р-связями между ними и содержащих внутри себя части предложений, образующих определения или линейные конструкции. Структура управляющих пространств отражает фундаментальное свойство языка порождать отношения и распространять их на соответствующие элементы.
Управляющие связи деревьев подчинения автоматически восстанавливаются из структуры а — (J-связей. Структура управляющего пространства дает более тонкую классификацию управляющим связям.
В предложениях без нарушений свойства проективности (т. е. без пересечения определений разных элементов) элементы, вложенные в точку, образуют систему составляющих. В этом смысле структура управляющее пространство одновременно обобщает и деревья подчинения, и системы составляющих. Также ясно, что управляющее пространство учитывает разрывные словосочетания, а слова, входящие в одну точку, образуют синтаксическую группу в смысле Гладкого.
Управляющее пространство предложения не связано с его последовательным порядком записи и отражает только семантику порождения и передачи отношений. Значит, структура управляющего пространства не зависит от конкретного языка и только ее трансляция в линейную запись определяется синтаксисом конкретного языка. Поэтому управляющие пространства являются хорошим кандидатом на промежуточную форму представления в системах автоматического перевода.
Заметим, что рассмотрение линейных конструкций и определений для представления синтаксических структур традиционно в лингвистических исследованиях. В том или ином ограниченном виде они часто встречаются в литературе: предикаты и синтагмы в классической лингвистике, управление и примыкание, актантное и атрибутивное отношения, отношения в ПРОЛОГ-системах обработки естественного языка. Выразительные средства модели управляющих пространств дают новую наглядную характеристику этим отношениям, учитывают управляющие и иерархические связи между группами словосочетаний и, кроме того, ориентированы иа конкретную технологию рекурсивно-параллельного программирования.
При обработке синтаксических структур естественного языка возникают две основные задачи — анализ и синтез. Задача анализа — по линейной записи текста построить соответствующее управляющее пространство, задача синтеза — по управляющему пространству построить соответствующую линейную последовательность связного текста. Вторая задача, вообще говоря, проще. При отображении линейной зависимости в текст алгоритм синтеза следует последовательности а — р-связей. При синтезе текста из определений алгоритм сначала решает вопрос, что выдается раньше — определяемый объект или его уточнение. Затем происходит выдача текста из соответствующих конструкций, образующих определение. В алгоритме анализа идет многократная свертка определений и выделение линейных зависимостей.
В программной реализации модели управляющих пространств предложений а — (J-связи реализуются как каналы в ПАРУС-системе программирования. В точках размещаются алгоритмические модули, задающие слова, их характеристики и связь с семантическими базами. По а — (J-каналам осуществляется необходимый обмен информацией для выбора необходимой синтаксически правильной формы частей речи. Разрабатывается экспериментальная версия генерации и анализа предложений русского языка. Отметим, что ПАРУС-технология ориентирована на применение в высокопроизводительных параллельных вычислительных комплексах. Поэтому предлагаемый подход допускает эффективную параллельную реализацию.
Интересна реализация управляющих пространств человеческим мозгом. Нейроны легко соединяются в переплетенные ансамбли, образуя сложные иерархические комплексы. В такой структуре нервное возбуждение может передаваться однонаправленно. Это соответствует реализации линейных а — (J-связей. Нейроны также способны образовывать замкнутые кольцевые реверберирующие цепи, в которых может долго, без затухания циркулировать электрический сигнал. На этом принципе основана кратковременная память. Как раз циклические цепи и нужны для образования замкнутых а — р-циклов. Таким образом, мозг может топологически, один к одному, моделировать управляющие пространства и строить причудливые картины мысли.
В мозге есть две особые речевые зоны — Брока и Вернике. У большинства людей обе они расположены в левом полушарии. Зона Вернике отвечает за сопоставление слов образам. Она работает с семантическими сетями памяти и отвечает за построение управляющего пространства, что соответствует пониманию речи. Зона Вернике связана дугообразным пучком волокон с зоной Брока. Последняя отвечает за анализ и синтез грамматических схем. В зоне Брока управляющее пространство транслируется в линейные последовательности речевых предложений. Эти принципы могут лечь в основу схемы нейрокомпьютера, понимающего речь.
Управляющие пространства можно использовать для получения стилистических характеристик отдельных текстов и авторов. Например, в предложении можно просчитывать количество циклических а — р-цепей, линейных соединений, глубину вложенности определений, вложенность по линейным конструкциям, другие особенности строения управляющего пространства предложений. Интересные функциональные характеристики стиля дает линейная конфигурация текста, построенная по VII. В этом случае текст графически изображается колебательной структурой, отражающей иерархию подчиненных предложений.
В отличие от классической стилеметрии, где ведется статистический учет только линейных параметров текста — частота появления тех или иных частиц, слов, междометий и т. д., в рассматриваемом случае учитывается топология мысли, ярко выражающая индивидуальные особенности мышления. Вот несколько характерных предложений В. Набокова из автобиографической прозы «Другие берега».
1. «Снег — настоящий на ощупь; и когда наклоняюсь, чтобы набрать его в горсть, полвека жизни рассыпается морозной пылью у меня между пальцев».
2. «От морского ветра губы становились солеными: пляж трепетал как цветник, и безумно быстро через него проносилась залетная бабочка, оранжевая с черной каймой».
3. «Люди неумные, с большими способностями к математике, лихо добираются до тайных сил природы, которые кроткие, в ореоле седин, и тоже не очень далекие физики предсказали (к тайному своему удивлению)».
4. «В чистоте и пустоте незнакомого часа тени лежали с непривычной стороны, получалась полная перестановка, не лишенная некоторого изящества, вроде того, как отражается в зеркале у парикмахера отрезок панели с бесконечными прохожими, уходящими в отвлеченный мир, — который вдруг перестает быть забавным и обдает душу волною ужаса».[117]
Это характерный набоковский стиль — раскрашенные стеклянные шарики на рождественской елке в далеком детстве (рис. 23, 24). Этот стиль можно выразить в числах. У Набокова велика частота простых уточняемых словосочетаний. Он мастер составления расцвеченных текстов. Интересно, как сам он охарактеризовал модель своей жизни: «Цветная спираль в стеклянном шарике — вот модель моей жизни».[118]
Разворачивание управляющего пространства в линейную последовательность текста в разных языках может выполняться по разным критериям. В английском консервативный прямой порядок слов, в японском текст читается справа налево, вначале сказуемое, затем подлежащее и дополнение, в русском, наиболее свободном, допустимы перестановки.
Управляющее пространство — универсальный способ представления языка. В любой среде обитания разума, где есть неделимые действия и уточнения понятий, возникает такое пространство представления языка. Даже язык инопланетян должен иметь подобную графическую структуру.
Язык, появившийся когда-то как слабая прозрачная оболочка вещей, как неясная тень вечных движений, завершил полный цикл развития и вступил в сферу самостоятельного бытия. Сбылось то, что предсказывали мудрецы. Новые космические смерчи рекурсии, зарождающиеся в недрах языка, потрясают мир. Язык раскрывает свои универсальные схемы, и электронные существа уже примеривают эти структуры к своему бытию. Искусственный интеллект из далекой мечты превращается в неизбежную реальность. И может быть, человек — только разрыв в порядке вещей, только переходный этап на пути к возникновению этой новой реальности.
Рис. 23. Управляющее пространство предложения 1
Рис. 24. Управляющее пространство предложения 4
«Разумеется, вера в превосходство человека является традиционной. Когда-то наша Земля считалась центром Вселенной, сегодня это всего лишь одна из планет. Когда-то нам приписывалось божественное происхождение, сегодня ряд людей считает, что это результат удачного стечения обстоятельств в развитии приматов. Когда-то наш разум был вне конкуренции, но, возможно, придет день, когда вычислительные машины будут смеяться над ними и задавать вопрос о том, могут ли биологические информационные процессоры быть достаточно разумными. Осторожно относитесь к тем, кто думает, что этого никогда не случится. Предки этих людей преследовали Галилея и высмеивали Дарвина».[119]
Подписывайтесь на наши страницы в социальных сетях.
Будьте в курсе последних книжных новинок, комментируйте, обсуждайте. Мы ждём Вас!
Похожие книги на "Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык"
Книги похожие на "Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык" читать онлайн или скачать бесплатно полные версии.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.
Отзывы о "Анатолий Анисимов - Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык"
Отзывы читателей о книге "Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык", комментарии и мнения людей о произведении.