Естественный язык

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 18:08, 6 декабря 2016.

Естественный язык - это часть культурной среды. С точки зрения программиста естественный язык может быть интересен как минимум в следубщих случаях:

  • как язык постановки задачи для компьютера;
  • как язык ведения диалога с программой;
  • как язык культурной среды программы с минимальными естественноязыковыми возможностями - для выдачи сообщений.

Предпосылки возникновения систем понимания естественного языка

Мало кто знает, как человек общался с первыми вычислительными машинами. Происходило это так: оператор, используя провода с разъемами на концах, соединял между собой триггеры (из которых, собственно, и состояла машина) таким образом, чтобы при запуске выполнялась нужная последовательность команд. Внешне это очень напоминало манипуляции телефонных АТС начала века, а по сути - было очень квалифицированной работой. Можно сказать, программирование тогда осуществлялось даже не в машинных командах, а на аппаратном уровне.Потом задача упростилась:последовательность нужных команд стали записывать непосредственно в память машины. Для ввода информации стали применяться более производительные устройства. Сначала это были группы тумблеров, переключая которые, оператор (или программист - тогда эти понятия означали одно и то же) мог набрать нужную команду и ввести ее в память машины. Затем появились перфокарты. Следом - перфоленты. Скорость общения с машиной возросла, число ошибок, возникающих при вводе, резко уменьшилось. Но сущность этого общения, его характер - не изменились. Возможность впервые пообщаться напрямую появилась на так называемых малых машинах. Неизгладимы впечатления от знакомства с диалоговым интерфейсом. Это было чудовищное порождение советской промышленности под поэтическим названием "Наири". Тогда диковинная возможность отстучать на клавиатуре адресованную непосредственно машине команду и получить осмысленный отклик казалась чудом. Особенно если до тех пор весь процесс общения с машиной заключался в передаче в руки лаборанта колоды перфокарт. С тем чтобы через пару дней получить назад эту колоду с комментарием: "У вас тут ошибка, программа не пошла".Измученным такого рода пользователям скудный диалоговый режим командной строки казался верхом совершенства. Именно ему сначала малые ЭВМ, а потом и персоналки во многом обязаны своим триумфальным шествием. Любой потребитель компьютерных услуг мог, не вдаваясь в технические трудности и выучив всего пару десятков команд операционной системы, общаться с компьютером без посредников. Тогда впервые возникло такое понятие, как "юзер", и именно появлению диалогового режима история приписывает взлет и расцвет многих компьютерных компаний, таких, например, как DEC.А потом появился его величество интерфейс графический: отпала нужда в знании вообще каких-либо команд, и юзер стал общаться со своим железным другом на интуитивно понятном языке жестов. На горизонте замаячил призрак звукового интерфейса.Особенности естественного языка, языка математики и формализованных языков накладывают отпечаток на построение и восприятие информационных моделей, созданных с использованием этих языков.

Особенности естественного языка с точки зрения моделирования

Информационная модель – это описание объекта на каком-либо языке. Чаще всего такое описание осуществляется на естественном языке. Естественный язык имеет целый ряд своеобразных черт, например: -многие слова имеют не одно, а несколько значений; -значения отдельных слов и выражений зависят от их окружения (контекста); -распространены синонимы (разные слова – одинаковый смысл) и омонимы (одинаковые слова – разный смысл); -многие соглашения относительно употребления слов не формулируются явно, а только предполагаются, и для каждого правила есть исключения и т.д. В информатике общепринято, что компьютер – это формальный исполнитель. Кажется, что используемый в компьютере в качестве основного язык двоичного кодирования и работа любого программного средства в соответствии с заранее заданным строго формализованным алгоритмом делают довольно сложным использование естественного языка. Однако в настоящее время компьютер это не столько машина для вычислений, сколько именно «языковая машина», основа могущества которых, по мнению известного современного лингвиста Т. Винограда, «заключается в способности манипулировать лингвистическими знаками – символами, которым приписан некоторый смысл». Он подчеркивает также, что «естественный язык... занимает фактически центральное место в информатике». Действительно, многие перспективные направления развития программного и аппаратного обеспечения компьютера связаны с предоставлением пользователю все больших возможностей по использованию естественного языка при работе за компьютером: системы речевого ввода команд (речевой интерфейс), лингвокорректоры, системы контекстного поиска информации в компьютерных сетях и пр.

Основные функции естественного языка с точки зрения моделирования

Основными функциями естественного языка являются:

  • коммуникативная (функция общения);
  • когнитивная (познавательная функция);
  • эмоциональная (функция формирования личности);
  • директивная (функция воздействия).

С точки зрения использования компьютера наибольший интерес для нас представляют коммуникативная и директивная функции языка. Достаточно долго, вплоть до появления графического интерфейса, общение с компьютером сводилось к некоторой системе команд, ключевые слова для которых выбирались из английского языка: Delete (удалить), Edit (редактировать), MakeDirectory (создать каталог), Rename (переименовать) и т.п. То же самое справедливо и для большинства процедурных языков программирования. Конечно же, языки программирования – строго формализованные языки, но в качестве элементов их конструкций используются слова и словосочетания обычных разговорных языков.

Особенности информационного моделирования в форме словесного описания на естественном языке

Естественный язык теснейшим образом связан с культурой народа – носителя языка. Языковые образы могут многое сказать о характерных чертах, мировосприятии и истории народа. Основой языка являются языковые знаки. (В главе, посвященной формализации, мы уже рассматривали это понятие, но в более узком смысле.) Точное определение языкового знака, способы его образования, формы применения подробно рассматриваются в лингвистике. В качестве языкового знака могут выступать: в устной речи – звук; слово или словосочетание, обозначающее предмет, событие, эмоцию, чувство, явление; фраза; текст (последовательность связанных по смыслу фраз) и пр.; в письменной речи – буква; слово; предложение; текст и пр. Строго говоря, изучать языковые знаки имеет смысл только в рамках некоторой знаковой системы. В конкретной знаковой ситуации знак условен, но в рамках знаковой системы можно обнаружить регулярность употребления знаков[1].

Аспекты изучения и использования знаковой системы естественного языка

Выделятся три аспекта изучения и использования любой знаковой системы, в том числе естественного языка: синтаксис, семантика, прагматика. С этой триадой мы уже сталкивались, изучая различные аспекты информации.

Синтаксис

Среди всех возможных в данном языке слов, предложений, текстов выделяются правильные слова, предложения, тексты. Синтаксис языка фиксирует способы образования правильных (с точки зрения данного языка) языковых конструкций. Заметим, что большинство компьютерных текстовых редакторов и автоматических переводчиков содержат модули автоматической проверки синтаксической правильности текста, работа которых основана на законах, открытых в лингвистике.

Семантика

Семантика знака (слова, предложения, текста) – это смысл, который содержится в этих языковых конструкциях. С точки зрения информатики особый интерес представляют: преобразование текста, сохраняющее его смысл как в рамках одной знаковой системы, так и с переходом в другую знаковую систему – перевод текста (автоперевод); преобразование текста, сохраняющее «главную» часть смысла – реферирование (автореферирование), контекстный поиск. Что же касается естественного языка во всей его полноте, то он является главным хранителем интеллектуальных и духовных ресурсов общества, причем тех, о которых люди часто и не подозревают. Разъединение слова (знака) от вещи и скрытого в вещи смысла подрывает язык, а с ним и всю человеческую жизнь. Знаменитый русский языковед и собиратель сказок А.Н. Афанасьев говорил: «Забвение корня в сознании народном отнимает у образовавшихся от него слов их естественную основу, лишает их почвы, а без этого память уже бессильна удержать все обилие словосочетаний вместе с тем связь отдельных представлений, державшихся на родстве корней становится недоступной».

Прагматика

Прагматика отражает особенности восприятия знака адресатом, т.е. тем, для кого этот знак предназначался его автором. Один и тот же знак может восприниматься по-разному в зависимости от установки адресата. Современная лингвистика, находясь в русле западноевропейской научной мысли, провозглашает автономию знака от обозначаемого объекта. При этом лингвистика понимает произвольность знака не так будто, он свободно может выбираться говорящим или пишущим. Произвольность языкового знака означает, что между знаком и означаемым нет никакой естественной связи. Однако это всего лишь первый шаг, ведущий к основному тезису формализации, т.е. утверждению о том, что человек может создавать языковые знаки по своему усмотрению и наделять их необходимым ему смыслом.

Примечание

  1. Естественный язык как язык информационного моделирования [Электронный ресурс] : Коллекция : — Режим доступа: http://school-collection.lyceum62.ru/ecor/storage/dda73f24-9061-4f61-8077-7a37faa28cff/