WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 | 3 | 4 | 5 |   ...   | 6 |
ОНТОЛОГИИ КАК СИСТЕМЫ ХРАНЕНИЯ ЗНАНИЙ Н.С. Константинова, О.А. Митрофанова Санкт-Петербургский государственный университет, Факультет филологии и искусств, Кафедра математической лингвистики 199034, г. Санкт-Петербург, Университетская наб., д. 11 Аннотация. Обзор представляет исследовательские результаты, достигнутые в новой области науки, связанной с построением и применением онтологий. В рамках работы освещены различные точки зрения на понятие онтологии, используемого в современных информационных технологиях, дано определение этого термина, а также рассмотрены различные классификации онтологий.

Приводится общая характеристика автоматических методов построения онтологий, в том числе методов автоматического выявления аксиом и слияния различных онтологий. Описаны основные языки представления онтологий и наиболее значимые существующие онтологические ресурсы. В обзоре сделана попытка представить в общих чертах методологию построения онтологий, рассмотреть проблемы, сопровождающие создание онтологий, и их возможные решения. Также в данном обзоре упоминаются возможные области применения онтологий в информационных системах.

Annotation. The review presents research results achieved in a new field of knowledge dealing with the development and application of ontologies. The paper describes different approaches to the notion of ontology and discusses various classifications of ontologies. The review gives a general description of automatic techniques of ontology development, in particular, of automatic extraction of axioms and of ontology merging. The principal ontology languages and the most significant contemporary ontological resources. The paper presents an attempt to give a general outline of ontology development techniques, to discuss the problems of ontology 1 development and their possible solutions. The review also deals with the possible applications of ontologies in informational systems.

Введение Развитие наукоемких областей человеческой деятельности в современном обществе сопровождается возрастанием роли компьютерных технологий. Сейчас значительно увеличивается поток информации, появилась необходимость поиска новых способов ее хранения, представления, формализации и систематизации, а также автоматической обработки. Таким образом, растет интерес к всеобъемлющим базам знаний, которые возможно использовать для различных практических целей. Огромный интерес вызывают системы, способные без участия человека извлечь какие-либо сведения из текста. Как результат, на фоне вновь возникающих потребностей развиваются новые технологии, призванные решить заявленные проблемы. Наряду с World Wide Web появляется его расширение, Semantic Web, в котором гипертекстовые страницы снабжаются дополнительной разметкой, несущей сведения о семантике включаемых в страницы элементов. Неотъемлемым компонентом Semantic Web является понятие онтологии, описывающее смысл семантической разметки.

В общих чертах под онтологией понимается система понятий некоторой предметной области, которая представляется как набор сущностей, соединенных различными отношениями (подробнее см. раздел 1.1). Онтологии используются для формальной спецификации понятий и отношений, которые характеризуют определенную область знаний. Преимуществом онтологий в качестве способа представления знаний является их формальная структура, которая упрощает их компьютерную обработку.

Можно говорить о неявном применении онтологий в качестве систем понятий в естественных науках (биология, медицина, геология и другие), где они служат своего рода фундаментом для построения теорий. Поскольку классификационная структура (таксономия) является неотъемлемой частью любой онтологии, можно говорить о присутствии элементов онтологий в специальных классификациях и системах индексации (например, в библиотечных классификационных кодах).

В явном виде онтологии используются как источники данных для многих компьютерных приложений (для информационного поиска, анализа текстов, извлечения знаний и в других информационных технологиях), позволяя более эффективно обрабатывать сложную и разнообразную информацию. Этот способ представления знаний позволяет приложениям распознавать те семантические отличия, которые являются само собой разумеющимися для людей, но не известны компьютеру.

Само понятие онтологии известно давно, но, будучи переосмысленным, оно стало применяться в компьютерных технологиях лишь недавно. Полноценная разработка онтологий в новом смысле этого термина началось лишь в конце 90-х. Это достаточно новая и мало разработанная отрасль прикладной лингвистики. Большинство работ по созданию и использованию онтологий проводится за рубежом, однако и в России существует ряд исследователей, работающих в этой области, см. также работы по онтологиям, опубликованные в России ([1], [3], [4], [6] и др.). Уже на данном этапе создан ряд обширных онтологий, включающих несколько тысяч понятий: OMEGA, SUMO, DOLCE и другие.

Онтологии широко используются во всех областях, занимающихся обработкой данных на естественном языке. В связи с использованием онтологий в различных приложениях возникла необходимость создания стандартизированных способов их представления. Началось развитие разнообразных языков, которые могли бы применяться повсеместно во всех системах, самыми известными являются RDF и OWL.

Возникло также большое количество редакторов для создания, пополнения и изменения онтологий. Каждое из этих средств обычно направлено на работу с определенным форматом данных и обладает своими особенностями.

1.1. Определение понятия «онтология» Термин «онтология» используется в нескольких областях знания и имеет два различных значения [3]:



«Философская дисциплина, которая изучает наиболее общие характеристики бытия и сущностей» «Онтология – артефакт, структура, описывающая значения элементов некоторой системы» Термин «онтология» имеет долгую историю в философии, где он еще со времен Аристотеля обозначал науку о бытии. Предметом онтологии выступало само по себе сущее, в рамках этого раздела философии выделялись базовые категории и общие свойства, типы сущностей. Как упоминают С. Ниренбург и В. Раскин [26], в качестве синонима термина «онтология» в его философском понимании часто используется термин «метафизика».

Понятие онтологии в инженерной области знания рождает большое количество дискуссий, в которых каждый автор стремится предложить свое определение. Отчасти это можно объяснить новизной области исследования, с другой стороны, – разнообразием практических задач, решаемых с использованием онтологий.

В основу нашего обзора определений легла работа Н.Гуарино [18], где определения онтологии рассматриваются с разных точек зрения. В современных информационных технологиях наиболее часто упоминается и используется определение онтологии, сформулированное Н.Грубером: «Онтология – это спецификация концептуализации» [17]. Эта дефиниция является своеобразным обобщением, формальной интерпретацией многих других определений. Центральным в нем является понятие «концептуализация», которое было введено в работе [16].

Основная сложность заключаются в том, что термин «концептуализация» имеет разнообразные контексты употребления, поэтому данный термин вызывает разногласия.

Как поясняет Н.Гуарино, этот термин в общих чертах интуитивно понятен, и его четкая формулировка не дается при обсуждении понятия «онтология». Стоит пояснить, что под «концептуализацией» понимается строгое описание системы понятий, объектов и других сущностей и отношений, связывающих их друг с другом. Можно сказать, что концептуализация – это абстрактное, упрощенное видение мира, который мы хотим представить для каких-то целей. Таким образом, концептуализация расчленяет какуюлибо область знаний, существующую в целостном виде, выделяет из этой области отдельные объекты, а затем формулирует отношения, свойственные для данной области. Основная часть формально представленного знания базируется на концептуализации, каждая база знаний или система, основанная на знаниях, явно или неявно связывается с какой-то концептуализацией.

Однако существует две различные трактовки природы концептуализации, их можно охарактеризовать, как интенсиональную и экстенсиональную.

Экстенсиональная трактовка, которой придерживаются авторы работы [16], подразумевает, что каждое понятие и отношение может исчерпывающе описываться перечислением индивидуальных сущностей, к которым оно применимо. Н.Гуарино же считает эту точку зрения узкой и обобщает ее, развивая интенсиональный подход. Он предлагает идентифицировать понятия не через их перечисление, то есть экстенсионал, а через их внутренние свойства и характеристики, так называемое «предполагаемое содержание». Этот универсальный подход дает специалисту возможность подводить под одну и ту же концептуализацию разные положения вещей. Таким образом, концептуализация становится относительно независимой от индивидуальных сущностей, необходимым является лишь сохранение заданных типов отношений.

Важно внутреннее содержание понятий, а не перечисление соответствующих конкретных индивидов.

Однако приведенное ранее определение, связанное с понятием «концептуализации», является далеко не единственным. В литературе можно также найти определение онтологии как «теории того, какие сущности могут существовать в уме хорошо осведомленного (knowledgeable) агента» [35]. Данное определение выявляет другой подход к этому понятию. Эта формулировка позволяет включать в онтологию набор понятий, но не дает возможность задавать их структуру. Этот пробел в определении особенно значим, так как в рамках искусственного интеллекта в качестве синонима онтологии часто используется понятие «терминология», а в ней структура безусловно содержится.

Объединением выше упомянутых дефиниций становится определение из работы [34], вводящее «онтологию», как «спецификация концептуализации на уровне эксплицитных знаний, зависящее от предметной области или задачи, для которой она предназначена». Таким образом, онтология зависит от определенной точки зрения, однако, как упоминает Н.Гуарино, как раз степень этой зависимости является определяющим фактором для возможности ее многократного использования. А ведь именно в возможности многократного использования онтологий видится их значимость и ценность.

В других определениях, приводимых Н.Гуарино, делается упор на иной аспект онтологий, и они определяются как соглашения о совместно используемых концептуализациях. При этом поясняется, что эти совместные концептуализации включают в себя понятийные структуры для моделирования знания какой-то предметной области. Это своего рода соглашение, какие схемы и теории использовать при описании предметной области. Таким образом, здесь проводится разграничение понятий «онтология» и «концептуализация». Об онтологии говорится уже не как о спецификации концептуализации, а лишь как о соглашении о концептуализации.

Однако степень детализации этого соглашения будет напрямую зависеть от предназначения конкретной онтологии и целей, поставленных перед исследователем.

Н. Гуарино упоминает еще один подход к определению «онтологии»:





«Онтология – это конкретный артефакт, созданный для выражения значений, подразумеваемых у совместно используемой лексики». Здесь упоминается, что онтология предоставляет средства для передачи подразумеваемого значения.

Н.Гуарино предлагает также определять онтологию, как «логическую теорию, которая ограничивает подразумеваемые модели логического языка». Таким образом, под онтологией понимается нечто большее, чем просто детализированный набор понятий и отношений. В онтологию включаются и ограничения, накладываемые на отношения в рамках данной области. Это некоторый набор аксиом, который строится на базе понятий и отношений между ними. Таким образом, например, в рамках искусственного интеллекта можно описать онтологию программы, определив множество объектов и связав их с описаниями, а также введя формальные аксиомы, которые ограничивают интерпретацию и совместное употребление этих терминов.

Формально онтологию можно назвать формулировкой логической теории, некого исчисления со своими правилами. Эта теория позволяет систематизировать категории действительности и/или выражаемые в языке значения. Следовательно, такое определение онтологии можно считать более широким взглядом на данное понятие, нежели предыдущие.

В качестве рабочего определения, наиболее приспособленного для целей компьютерной лингвистики, можно взять дефиницию, предложенную Эдвардом Хови [20]: «Онтология – это структура данных с заданными в ней символами, позволяющими представлять концептуализации для обработки компьютерными программами».

Рассмотрев оба понимая значения термина «онтология», вводимые в философии и в инженерной области знания, можно обнаружить такое соотношение двух значений, как «процесс-результат». В философии «онтология» - это наука, изучающая бытие, а «онтология» в инженерии – это отображение бытия в формализованном виде. Однако С. Ниренбург и В. Раскин [26] указывают на то, что предмет описания формальной онтологии соотносится внутри философии скорее не с наукой о бытии (онтологией, или метафизикой), а с наукой о познании («гносеологией»). Для формальной онтологии важны не столько сами понятия, сколько использование их людьми, знания людей о данных понятиях. В связи с этим не встает, например, вопрос, правомерно ли включать в формальные онтологии несуществующие сущности (например, вымышленные существа). Метафизика будет утверждать, что в бытии такого не существует, однако, обратившись к гносеологии, мы обнаружим, что это существует в умах людей и на данном основании может включаться в онтологию.

Таким образом, следует заключить, что четкой взаимообусловленности между двумя значениями термина «онтология» – в философии и в инженерии знаний – не прослеживается. Связь между ними носит скорее произвольный ассоциативный характер и не будет обсуждаться далее в нашем исследовании.

1.2. Структура онтологии Рассмотрев возможные содержательные интерпретации понятия «онтология», остановимся подробнее на структуре онтологии, ее составляющих. В общем виде структура онтологии представляет собой набор элементов четырех категорий:

понятия;

отношения;

аксиомы;

отдельные экземпляры;

Понятия рассматриваются как концептуализации класса всех представителей некой сущности или явления (например, Животное, Чувство). Классы (или понятия) являются общими категориями, которые могут быть упорядочены иерархически.

Каждый класс описывает группу индивидуальных сущностей, которые объединены на основании наличия общих свойств.

Понятия могут быть связаны различного рода отношениями (например, Длина, Местоположение), которые связывают воедино классы и описывают их. Самым распространенным типом отношений, использующимся во всех онтологиях, является отношение категоризации, то есть отнесение к определенной категории. Этот тип отношений имеет ряд других названий [3], встречающийся в различных исследованиях:

таксономическое отношение;

отношение IS-A;

класс – подкласс;

лингвистика: гипоним – гипероним;

родовидовое отношение;

отношение a-kind-of.

Аксиомы задают условия соотнесения категорий и отношений, они выражают очевидные утверждения, связывающие понятия и отношения. Под аксиомой можно понимать утверждение, вводимое в онтологию в готовом виде, из которого могут быть выведены другие утверждения. Они позволяют выразить ту информацию, которая не может быть отражена в онтологии посредством построения иерархии понятий и установки различных отношений между понятиями. В качестве примера аксиомы можно привести следующее высказывание: «Если Х смертен, то Х когда-нибудь умрет». Аксиомы позволяют в дальнейшем осуществлять умозаключения в рамках онтологии. Они могут снабжать исследователей информацией о правилах, позволяющих автоматически добавлять информацию. Аксиомы могут также представлять собой ограничения, накладываемые на какие-либо отношения, делающие возможным выведение умозаключений. Приведем несколько примеров таких ограничений. Понятийные ограничения указывают на то, какой тип понятий может выражать данное отношение (например, свойство Цвет может выражаться только понятиями категории Цвет). Примером числовых ограничений является утверждение того, что для Человека количество биологических родителей равно 2. Количество и степень детализации аксиом обычно зависят от типа онтологии, о чем будет подробнее сказано далее.

Наряду с указанными элементами онтологии в нее также входят так называемые «экземпляры». В литературе они могут выступать также под названиями:

конкретные экземпляры;

Pages:     || 2 | 3 | 4 | 5 |   ...   | 6 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.